Einfache Datenbanken reichen längst nicht mehr aus, um die zunehmende Anzahl unterschiedlichster Datenquellen sowie die damit wachsenden Systemlandschaften zu organisieren. Unternehmen stehen einem rapide steigenden Verwaltungsaufwand gegenüber. Wichtige Datasets müssen identifiziert und die eigene Datenlandschaft katalogisiert werden, um sie anschließend im gesamten Unternehmen bereit zu stellen. Die Data Lineage, also die Datenherkunft, im Auge zu behalten, hilft Business Analysten und IT Professionals, Datensilos zu vermeiden sowie den Überblick über die verfügbaren Datenquellen zu bewahren.
Denn um die alltägliche, reibungslose Nutzung von Daten gewährleisten zu können, müssen relevante Datenquellen erschlossen und orchestriert verfügbar sein. Ein gut aufbereiteter Data Catalog fördert eine produktive Datenkultur und die Entwicklung hin zur Data Driven Organization. Wir helfen Unternehmen dabei, einen Datenkatalog unter Verwendung des geeigneten Tools reibungslos in ihren Data Stack zu integrieren.
Unternehmen stehen vor der Aufgabe, aus einer Vielzahl von Services adäquate Lösungen zu finden, um eine valide Data Lineage zu gewährleisten. Der Data Catalog als Single Point of Entry sollte als vollständig automatisiertes Tool ein Glossar aller Systeme und Prozesse abbilden. Wir greifen auf Data-Lineage-Systeme wie Contiamo oder Azure Purview zurück und unterstützen Unternehmen bei der Auswahl und Implementierung dieser Services.
Data Access ist eine der zentralen Rollen der Data Governance. Welche Personen haben auf welche IT-Systeme Zugriff? Daten sollten hierbei jederzeit, von jeder autorisierten Person und von jedem Ort aus zuverlässig abgerufen, modifiziert, kopiert oder bewegt werden.
Data Discovery beschreibt den Prozess, neue oder unbekannte Datenquellen und Datensätze zu erkunden. Hierbei werden schnell neue Erkenntnisse gewonnen, welche für die nächsten Use Cases genutzt werden können. Möglich wird dies durch den Einsatz von Power BI und Tableau.
Die Entstehungsgeschichte von Daten oder Datensätzen, ihre Herkunft, Verarbeitung und Transformation sowie deren Dokumentation, wird als Data Lineage beschrieben.