In Zeiten von Big Data und Datenprodukten ist die richtige Datenarchitektur ein absolutes Muss. Ohne eine Datenarchitektur als Basis können Daten nicht wertbringend für Ihr Unternehmen genutzt werden. Doch was ist erforderlich, um eine Datenarchitektur aufzubauen? Datenarchitekturen sollten neben definierten Workflows und einer übergreifenden Governance auch über eine funktionierende technische Grundlage verfügen. In diesem Artikel schildern wir, wie die Datenmodellierung eine Grundlage für eine solche Datenarchitektur bildet.

Was ist Datenmodellierung?

Datenmodellierung ist die Praxis, Daten und Datenflüsse anhand von Wörtern und Symbolen in einer vereinfachten Darstellung eines Softwaresystems und der darin enthaltenen Datenstücke zu repräsentieren. Datenmodelle können als Roadmap für die Erstellung neuer Datenbanken oder für den Umbau bestehender Datenbanken genutzt werden. Zudem sind sie eine wesentliche Grundlage beim Aufbau einer neuen Datenarchitektur. Insgesamt hilft die Datenmodellierung einem Unternehmen dabei, seine Daten erfolgreich zu nutzen, um immer die Informationen zur Verfügung zu haben, die für einen reibungslosen Betrieb erforderlich sind.[1]

Die Datenmodellierung ist ein wichtiger Aspekt des Datenmanagements. Sie hilft, den Informationsbedarf für bestimmte Geschäftsprozesse zu bestimmen, indem sie Datensätze und ihren geschäftlichen Kontext visuell abbildet. Anschließend werden die Daten spezifiziert, die in Applikationen aufgenommen werden sollen, sowie die Datenbank- oder Dateisystemstrukturen festgelegt, die zur Verarbeitung, Speicherung und Verwaltung der Daten erforderlich sind.

Ein Datenmodell kann beispielsweise ein Flussdiagramm sein, das Datenelemente, ihre Eigenschaften und die zwischen ihnen bestehenden Beziehungen darstellt. Noch bevor der erste Code geschrieben und die Architektur konzipiert wird, bietet es dem Datenmanagement- und Analyseteam die Möglichkeit, den Datenbedarf für Applikationen zu dokumentieren und Fehler in den Entwicklungsplänen zu erkennen.

Beispiel für ein Datenmodell
Abbildung 1: Beispiel für ein Datenmodell

Datenmodellierung vs. Architektur

Die Datenmodellierung und die Datenarchitektur können als zwei entscheidende Faktoren des Datenmanagements angesehen werden. Sie unterscheiden sich voneinander, aber ihr Zusammenspiel birgt ein enormes Potenzial für das Datenmanagement.

Inwiefern kann die Datenmodellierung helfen, eine Datenarchitektur zu entwickeln und aufzubauen? Die Datenmodellierung liefert eine Mikroansicht der Daten, während die Datenarchitektur einen Makrofokus auf die Daten hat.

Die Datenmodellierung befasst sich damit, wie Daten wiedergegeben werden. Dabei geht es um Datenkonsistenz und vor allem um Datenqualität. Zudem dient ein Datenmodell dazu, die Realität auf überschaubare Weise zu beschreiben. Es ist die Darstellung einer kleinen Anzahl von Einheiten und ihrer Beziehung untereinander. Das Ziel ist, Geschäftskonzepte, Beziehungen sowie den Wert jeder Einheit zu visualisieren.

Die Datenarchitektur eines Unternehmens wiederum liefert einen konzeptuellen Rahmen für das allgemeine Datenmanagement und ist logisch aufgebaut. Sie deckt Tools und Plattformen ab, die genutzt werden, um Daten zu speichern und zu analysieren. Die Datenarchitektur befasst sich mit der Datensicherheit und der Infrastruktur, die die Daten beherbergt. Sie deckt die Dateninfrastruktur des gesamten Unternehmens ab.

Abschließend kann man sagen, dass Datenmodellierung und Datenarchitektur sich gegenseitig ergänzen – ein gut definiertes Datenmodell bildet die Grundlage für die Konzeption der Datenarchitektur.

Die Datenarchitektur ist ein System und hat eine logische Struktur. Daher sind beim Aufbau und Design die logischen Komponenten zu berücksichtigen. Zudem deckt die Datenarchitektur die Dateninfrastruktur des gesamten Unternehmens ab, so dass eine Darstellung von Geschäft und Architektur bereitgestellt werden muss.

Kategorien der Datenmodellierung

Der Themenbereich der Datenmodellierung kann sehr breit gefasst sein. Unterteilt man diesen breiten Themenbereich in kleinere Teilbereiche, können auch die zu verwendenden Notationen entsprechend unterteilt werden, um die jeweiligen Anforderungen besser zu erfüllen.

Ein Datenmodell ist eine abstrakte Repräsentation der Dinge in der realen Welt, die im geschäftlichen Umfeld eines Unternehmens interagieren. Es repräsentiert Datenentitäten, ihre Eigenschaften und die Beziehungen zwischen ihnen. Datenmodelle können verschiedene Detailstufen abbilden. Sie können entsprechend in vier Kategorien/Prozesslevel eingeteilt werden: holistisch, konzeptuell, logisch und physikalisch. [2]

Holistische Datenmodelle können eine Übersicht über eine gesamte IT-Architektur oder IT-Landschaft liefern, die über den Daten an sich angesiedelt ist. Die holistische Übersicht macht es möglich, die Datennutzung auf unternehmensweiter Ebene zu verstehen und Maßnahmen für strategische Anpassungen oder Daten-Governance abzuleiten.

Konzeptuelle Modelle stellen aus einer übergreifenden Perspektive detaillierter dar, wie Daten in den verschiedenen Business Streams genutzt werden, indem sie eine technische Übersicht über die geschäftlichen oder architektonischen Elemente liefern. Allerdings sind konzeptuelle Datenmodelle nicht an technische Einschränkungen wie die Begrenzung auf eine Datenbank oder eine Applikation gebunden.

Dieses Detail kommt bei der Definition von logischen Datenmodellen ins Spiel. Diese Modelle dienen dazu, die Beziehungen zwischen zwei Datenentitäten zu definieren und Datenstrukturen zu schaffen.  Diese Definitionen sind für die Implementierung des Modells erforderlich, die in einem physikalischen Datenmodell abgebildet wird.

Die meistgenutzten Datenmodelle für die Implementierung und Realisierung der Datenarchitektur sind entweder konzeptuell oder logisch. Innerhalb der Grenzen dieser beiden Modelle kann eine vollständige Datenarchitektur definiert werden.

Bei CAMELOT nutzen wir die Datenmodellierung als Grundlage für den Aufbau Ihrer Datenarchitektur. Die Vorteile von konzeptuellen und logischen Datenmodellen werden so als semantische Datennotationen für Aufbau und Design genutzt. Doch wie geht man am besten vor, wenn es bereits eine funktionierende Grundlage gibt? Erfahren Sie hier mehr über Herausforderungen und Lösungsansätze effektiver Datenarchitekturen.

[1] Data Model Design and Best Practices (Part 2) | Talend

[2] Was ist Datenmodellierung? – Definition von SearchDataManagement (techtarget.com)

Wir danken Geron Keller für seinen wertvollen Beitrag zu diesem Artikel.

DataDrivenLeaders

Die Community für Data Driven Leaders

Die Community für Data Driven Leaders vernetzt Branchenexperten und hält Sie mit exklusiven Einblicken auf dem Laufenden.

Werden Sie Teil der Data Driven Leaders

Empfohlene Artikel

Data & Analytics

Einführung der CIDS – erste Services verfügbar

In unserem vorangehenden Artikel haben wir die CAMELOT Intelligent Data Services (CIDS) vorgestellt – eine Kombination aus Tools, die eine bessere Datenqualitä…

weiterlesen
MDG

Datenschutzverletzungen verhindern mit SAP Enterprise Threat Detection (ETD)

Moderne Systemlandschaften sind meist heterogen und hochgradig vernetzt und auch die Zahl der mobilen und Cloud-basierten Anwendung nimmt stetig zu. Angesichts …

weiterlesen
CRM

Konsumgüterindustrie: Außendienst-Termine effizienter gestalten

Ist es eine der wichtigsten Aufgaben Ihrer Vertriebsmitarbeiter, die Produkte vor Ort im Markt zu erheben und deren Platzierungen zu kontrollieren? …

weiterlesen

Denken Sie Ihre Value Chain neu mit uns

Kontaktieren Sie uns