W jaki sposób zapisywać historię zmian danych referencyjnych?

Nikt nie ma wątpliwości, że przechowywanie historii zmian danych referencyjnych odpowiada na wiele potrzeb związanych z analizą danych i raportowaniem, a w szczególności jest niezbędne przy audycie. Pytanie brzmi, jak przechowywać tę historię danych referencyjnych?

Jednym ze sprawdzonych rozwiązań jest stosowanie koncepcji wymiarów wolnozmiennych (SCD – Slowly Changing Dimensions) stosowanej w hurtowniach danych. Ta koncepcja pozwala na śledzenie zmian w atrybutach opisujących wymiary analiz. Jest to szczególnie ważne w przypadku analizy danych i raportowania. Dzięki temu możemy np. sprawdzić, jakie były ceny produktów w przeszłości, jakie było zatrudnienie w firmie czy jakie były dane kontaktowe klientów. SCD możemy z powodzeniem stosować do rejestrowania zmian w danych referencyjnych.

Istnieje kilka sposobów zapisywania SCD, każdy z nich ma swoje zalety i wady.

SCD1 to najprostsza sytuacja, w której nowa wartość atrybutu zastępuje starą, a historia zmian jest utracona. W takim przypadku jedynym sposobem dostępu do danych historycznych jest posiadanie kopii danych referencyjnych z interesującego nas okresu.

SCD2 polega na tworzeniu nowego rekordu przy zmianie atrybutu, z nową wartością i datą rozpoczęcia. Stary rekord jest zachowywany z datą zakończenia. Dla każdej zmiany tworzony jest osobny rekord przechowujący dane aktualne dla danego okresu. Zapytania do bazy muszą uwzględniać wybór aktualnych danych w danym czasie.

SCD3 polega na zapisywaniu historii zmian w tym samym rekordzie, ale w osobnym atrybucie. Zaletą tego rozwiązania jest mniejsza redundancja rekordów, ale utrudnia to odczytywanie historii zmian.

SCD4 polega na przechowywaniu historii zmian w oddzielnej tabeli. Podobnie jak w SCD3, pozwala to na lepsze zarządzanie zasobami, ale odczytywanie historii zmian jest bardziej skomplikowane.

Wybór odpowiedniego sposobu przechowywania historii zmian danych referencyjnych zależy od konkretnych potrzeb i wymagań. Ostateczne decyzje projektowe powinny bazować na szacowanej liczbie zmian wprowadzanych do danych referencyjnych oraz intensywności ich wykorzystania w raportowaniu i analizie.

Ta strona używa plików Cookies. Dowiedź się więcej o celu ich używania i możliwości zmiany ustawień Cookies w przeglądarce.

X