Skąd się biorą dane historyczne? Jeśli ich istnienie nie wynika bezpośrednio z przyjętej architektury danych, to pojawiają się zwykle w czasie kolejnych reorganizacji procesów biznesowych. Tak czy inaczej pojawią się i przy okazji kolejnych audytów lub innych ważnych powodów trzeba będzie je udostępnić. Istnieje kilka sposobów zapewnienia dostępu do danych historycznych:
Najbardziej naturalne jest przechowywanie historycznych kopii bazy danych. Każda kopia reprezentuje wybrany punkt w czasie. Użytkownicy, w razie potrzeby, mają dostęp do różnych wersji danych i mogą porównać zmiany. Struktura kolejnych kopii nie musi być identyczna. Wadą takiego rozwiązania jest konieczność zapewnienia odpowiednich zasobów do przechowywania kolejnych kopii baz danych. Może to się wiązać z utrzymywaniem wielu róznych połączeń do fizycznych baz danych.
Inne wyjście to utworzenie specjalizowanego magazynu danych do którego są sukcesywnie zapisywane kolejne ich zestawy. Metodyka jego tworzenia powinna być tak dobrana by był możliwy dostęp do wszystkich dostępnych danych (np. Data Vault). Pozwoli to bez przeszkód porównywać dane z różnych okresów w ramach jednego obszaru. Wymaga jednak utworzenia dedykowanego środowiska pozwalającego na analizę danych historycznych.
Praktyka pokazuje, że zwykle opróczy samych danych ich istotnym elementem są dane referencyjne z nimi związane. Oprócz informacji na temat sposobów grupowania danych mogą one obejmować różnego rodzaju dane związane z ich przetwarzaniem i parametryzacją, które mają często decydujący wpływ na ostateczny obraz informacji uzyskiwanych przez użytkowników biznesowych.
Jeśli parametryzacja procesów przetwarzania danych oraz raportów będzie elementem danych referencyjnych, to w połączeniu z ich wersjonowaniem może okazać się, że w jednym środowisku możemy mieć dostęp do danych aktualnych oraz danych historycznych. Takie rozwiązanie pozwala na przeglądanie standardowych raportów według stanu na konkretny dzień. Użytkownicy uruchamiając raporty korzystają z danych referencyjnych aktualnych na określony dzień. Jednocześnie możliwe jest prześledzenie zmian parametrów przetwarzania danych w czasie.
Takie rozwiązanie wymaga specjalnego podejścia do budowy procesów przetwarzania danych i generuje dodatkowe koszty w czasie wdrożenia. Ostatecznie przekłada się jednak na znaczną redukcję kosztów zapewnienia dostępu do danych historycznych. Dodatkową zaletą jest możliwość wygodnego śledzenia zmian danych referencyjnych.
Tego typu podejście zostało zrealizowane w ramach projektu zarządzania danymi referencyjnymi hurtowni danych w jednym z banków. Okazało się jednocześnie, że rozwiązanie okazało się odporne na zmiany zachodzące w sektorze finansowym np. przejęcia i konsolidacje.
Uwzglęnienie zarządzania danymi referencyjnymi w architekturze IT organizacji może okazać się kluczowe w obniżeniu kosztów związanych z wypełnieniem regulacji wewnętrznych i zewnętrznych.