Das Datenvolumen und die Häufigkeit von Datenänderungen sind im Rahmen der Digitalisierung exponentiell gestiegen. Dies hat äußerst heterogene Datenlandschaften mit vielen verschiedenen Datenquellen zur Folge. Um die Vorteile von Big Data erfolgreich nutzen zu können, sind vor allem größere Transparenz und ein schneller Datenzugriff erforderlich. In früheren Informationsmanagement-Projekten stellte CAMELOT fest, dass viele datengetriebene Unternehmen Anwendungsfälle ausloten, um die Big Data Governance zu optimieren.

Was ist ein Datenkatalog und wozu dient er?

Ein Datenkatalog (Data Catalog, DC) ist dafür konzipiert, Benutzern das schnelle Auffinden der richtigen Informationen zu ermöglichen. In komplexen Datenumgebungen mit mehreren Quellen ist diese Aufgabe umso wichtiger geworden. Es bedarf der Unterstützung durch ein geeignetes Tool, damit die Benutzer die Informationen innerhalb eines festgelegten Rahmens von Workflows und Regeln gemeinschaftlich nutzen können. Data Liberation („Befreiung“ bzw. Export von Daten) sollte mittels schnellen Zugriffs und einfacher Durchsuchbarkeit gewährleistet werden.

Wer benötigt einen Datenkatalog?

Ein DC-Tool kann über verschiedene Domänen hinweg genutzt werden, darunter Beschaffung, Vertrieb, Finanzen und Supply Chain Management. Datenanalysten, Datenwissenschaftler, Dateneigner und weitere Rollen sind darauf angewiesen, Daten zu finden und zu verstehen. Ein Datenwissenschaftler muss beispielsweise auf verschiedene Datendomänen und -quellen zugreifen können, etwa aus einem ERP- oder CRM-System heraus. Über einen Workflow könnte der Zugriff auf domänenspezifische Tabellen vom Domänenexperten, zum Beispiel einem Dateneigner von ERP-Materialdaten, gewährt werden. Diese Governance ist deshalb wichtig, weil beispielsweise nach DSGVO nicht alle Daten für jeden Benutzer zugänglich sein dürfen. Mit strenger Governance über alle Prozesse und Rollen hinweg sorgt ein DC für Compliance und Datenschutz.

Wie kann ein Datenkatalog genutzt werden?

Es ist wichtig, dass der DC eine Geschäftsbereichsdefinition der Daten enthält und die Informationen entsprechend strukturiert, damit die Benutzer verschiedener Abteilungen unabhängig voneinander mit ihnen arbeiten können. Dies unterscheidet den Datenkatalog klar von einem Datenmodell, da die Anwendergruppe nicht zwangsläufig auf Datennutzer beschränkt ist. Mit seinem breiten Funktionsspektrum kann ein DC Rohdaten aus verschiedenen Quellen in gebrauchsfertige Daten für unterschiedliche Anwender umwandeln. Er bietet gewisse Aspekte der Datenvisualisierung, unter anderem Scorecards, Dashboards zur Datenqualität und Berichte. Daten-Governance ist eine weitere Funktion mit rollenbasierten Darstellungen oder der Möglichkeit zur Nutzung von Workflows. Darüber hinaus können Funktionen in den Bereichen Datenkooperation, Datenanalyse, Datenmodellierung, Datenintegration oder Metadatenmanagement Teil einer DC-Plattform sein Abbildung 1: Der Datenkatalog als Brücke zwischen Datenquellen und Datennutzern

CAMELOT-Experten wissen aus Projekterfahrung, dass es sich bei DCs um Plattformen handelt, die mehrere Trendthemen vereinen. Dies hat eine große Vielfalt von Lösungen mit unterschiedlichen Stärken zur Folge. So bieten manche Lösungen Vorteile im Bereich Datenqualität, andere bei der Datenkooperation. DCs zielen auf explorative Big-Data-Szenarien ab und sorgen so für eine erfolgreiche Governance des Datenanalyse-Teils. Es ist äußerst wichtig, mit unseren Kunden den echten Anwendungsfall zu identifizieren, den sie mit einer potenziellen Tool-Unterstützung bewältigen wollen. Allgemein sieht CAMELOT in DCs ein enormes Potenzial, um Data Liberation, Transparenz und Vertrauen zu erzielen.

Wir danken Sascha Zygar für seinen Beitrag zu diesem Artikel. 

Empfohlene Artikel

Future Value Chain

Wie digitale Trends den stationären Einzelhandel revolutionieren

Die Einzelhandels- und Konsumgüterbranche wird sich in den nächsten 10 Jahren stärker verändern als in den letzten 40 Jahren, …

weiterlesen
Supply Chain Management

Erfolgsfaktoren für die DDMRP-Umsetzung in einem eingeschränkten Produktionsumfeld (II)

In Produktionsumgebungen mit komplexen Planungseinschränkungen reichen DDMRP-Bestandspuffer allein nicht aus, um die Variabilität in der Lieferkette zu reduzieren. Dieser …

weiterlesen
Data & Analytics

Mit vier Informationsarten zum Unternehmenserfolg

Informationen gehören für Unternehmen zweifelsohne zu den heterogensten, allgegenwärtigsten und wohl vielversprechendsten Ressourcen. Doch wie können Sie …

weiterlesen

Denken Sie Ihre Value Chain neu mit uns

Kontaktieren Sie uns