Geschäftsregeln sind ein grundlegendes Element der Datenverwaltung eines Unternehmens. Eine Festlegung dieser Regeln ermöglicht einem Unternehmen, Datenbeschränkungen und -richtlinien zu definieren sowie Einblicke in die Datenstruktur und eine Grundlage für verschiedene Anwendungen zu erhalten. In diesem Blogeintrag erklären wir, was genau Geschäftsregeln sind, wie Sie diese erhalten und für welche Anwendungsfälle Ihr Unternehmen diese nutzen kann.

Geschäftsregeln sind Beschränkungen oder Richtlinien für die Daten eines Unternehmens. Sie beschreiben die Unternehmensstruktur und regulieren und beschränken die Aktivitäten des Unternehmens. Die Erfassung der Geschäftsregeln eines Unternehmens wird üblicherweise manuell durchgeführt, was zeitaufwendig und umständlich ist. Durch die Möglichkeiten von Association-Rule-Mining-Algorithmen können Unternehmen diese Geschäftsregeln automatisch aus ihren Daten ableiten. Diese Algorithmen sind für die Ausführung auf Computerclustern vorgesehen, sodass zahlreiche Regeln mit hoher Komplexität aufgedeckt werden können.

Was ist Association Rule Mining?

Association Rule Mining ist eine einfache aber leistungsstarke Technik, die genutzt wird, um versteckte Muster zwischen Attributen in großen Datensätzen zu entdecken. Die Methoden des Association Rule Minings werden üblicherweise für Warenkorb-Analysen verwendet. Für das Shopping-Verhalten der Kunden identifiziert der Algorithmus Produkte, die oft zusammen gekauft werden und übersetzt diese häufigen Zusammenstellungen von Artikeln in Regeln. Diese Information kann genutzt werden, um Produkte nebeneinander zu platzieren, wenn diese oft zusammen gekauft werden. Ein weiteres Beispiel ist die Liste der Produkte, die Online-Käufern beim Anzeigen eines Produkts vorgeschlagen werden. Es gibt viele weitere Schritte im Datenmanagement eines Unternehmens, bei denen Rule Mining einen Mehrwert bietet, wie die Untersuchung der Datenstruktur, die Unterstützung der Population von Formularfeldern mit Vorhersagen und die Überprüfung der Einhaltung von Regeln über mehrere Datenquellen hinweg.

Der Rule-Mining-Algorithmus leitet Assoziationsregeln aus beliebigen relationalen Daten ab. Die gewonnenen Regeln stellen die Wahrscheinlichkeit eines bestimmten Werts anhand des bekannten Vorhandenseins anderer Werte dar. Diese Regeln haben die Form von WENN-DANN-Aussagen (auch bekannt als Antezedens-Konsequens). Jede der abgeleiteten Regeln kann durch zwei essentielle Kennzahlen quantifiziert werden:

  • Support – zeigt die Häufigkeit einer Regel in einem gegebenen Datensatz an;
  • Confidence – gibt die Wahrscheinlichkeit an, auf den Wert B zu treffen, wenn wir bereits den Wert A haben.

Abbildung 1: Formeln für die Berechnung der Kennzahlen für Support und Confidence

Die abgeleiteten Regeln haben die folgende Struktur: A ⇒ B (Support: 50 %, Confidence: 90 %)

Diese Regel informiert uns auf Basis der vorliegenden Daten: Wenn der Wert A in einem Dateneintrag gefunden wird, gibt es eine Chance von 90 %, dass B im gleichen Dateneintrag gefunden wird, wobei diese Kombination in 50 % aller Dateneinträge im gesamten Datensatz auftritt.

Beispiel Warenkorbanalyse

Zur Veranschaulichung des Association-Rule-Mining-Konzepts verwenden wir das klassische Beispiel Warenkorbanalyse. Wir haben einen Shop, der sechs Artikel verkauft: Wein, Birnen, Hamburger, Käse, Eiscreme und Kirschen. Wir haben fünf Transaktionen, die den Warenkorb von fünf verschiedenen Kunden darstellen. Der erste Kunde kaufte [Hamburger, Käse], der zweite Kunde kaufte [Hamburger, Kirschen, Wein, Eiscreme] und so weiter. Mit den oben vorgestellten Formeln extrahieren wir einen Satz von Beispielregeln.

Abbildung 2 & 3: Beispiel Warenkorbanalyse mit gewonnenen Regeln

Wie in der Tabelle oben zu sehen besagt die erste Regel, dass 75 % der Kunden, die einen Hamburger gekauft haben, auch Käse gekauft haben, wobei diese Kombination in 60 % der Daten zu finden ist. Die zweite Regel sagt aus, dass 100 % der Kunden, die eine Birne gekauft haben, ebenfalls Käse gekauft haben, wobei diese Kombination in 40 % der Daten zu finden ist. Die dritte Regel ist komplexer und besagt, dass 67 % der Kunden, die Hamburger und Käse gekauft haben, auch noch Kirschen gekauft haben, wobei diese Kombination in 60 % der Daten zu finden ist.

Mit diesem einfachen Beispiel erhalten wir einen Einblick in den Prozess des Association Rule Minings. In der Praxis sind solche Algorithmen stark optimiert und können in wenigen Sekunden große Datensätze für sehr viele Regeln verarbeiten. Tatsächlich können kleine Cluster von 10 Rechnern in weniger als einer Minute eine Million Regeln gewinnen.

Rule Mining in der Stammdatenverwaltung

Der Rule-Mining-Algorithmus kann die Muster und Relationen von Werten über mehrere Attribute erfassen. Die entsprechenden Regeln haben die oben vorgestellte Struktur:

WENN Spalte A den Wert X hat, dann hat Spalte B den Wert Y mit berechneten Werten für Support und Confidence.

Zum Beispiel können wir eine Regel von den Stammdaten ableiten, dass, wenn der Branchensektor (MARA-MBRSH) Arzneimittel (P) ist und der Materialtyp (MARA-MTART) ein fertiges Produkt (FERT) ist, DANN ist die Basismaßeinheit (MARA-MEINS) beides.

Das einfache Hinzufügen der Attribut-Wertpaar-Regeln eröffnet neue Möglichkeiten und Anwendungsfälle.

Datenanalysen und Erkenntnisse

Der Algorithmus, der automatisch alle Regeln in einem bestimmten Datensatz abgeleitet hat, gibt dem Benutzer auch einen detaillierten Überblick über die Assoziationsregeln in seinen Daten. Mit Hilfe eines Regel-Explorers kann der Benutzer mit den extrahierten Regeln interagieren und interessante Datenbereiche filtern und untersuchen. Dadurch kann der Benutzer nützliche Muster erkennen und diese als Regeln speichern, die dann in der Stammdaten-Anwendung oder anderer Software angewendet werden können, die die Regeln für Dateneinträge durchsetzt.

Vorhersage für Wert-Population

Bei der Erstellung neuer Dateneinträge kann der abgeleitete Regelsatz den Benutzer anleiten, indem die wahrscheinlichsten Werte vorgeschlagen werden. Statt jeden Wert manuell einzutragen, wird dem Benutzer eine Liste möglicher Werteinträge zusammen mit der errechneten Wahrscheinlichkeit aus den analysierten Daten vorgeschlagen Mit jedem durch den Benutzer eingetragenen Wert aktualisiert der Algorithmus seine Wahrscheinlichkeiten für die verbleibenden leeren Felder.

Überprüfung der Regel-Compliance

Die in diesem Prozess gewonnenen Regelsätze können später für die Kompatibilitäts-Überprüfungen verwendet werden. Jede Zeile in einem ungesichteten Datensatz kann in Bezug auf die Einhaltung der Regeln untersucht werden. Reihen, die sich nicht an die Regeln halten, werden für eine weitere Untersuchung markiert. Der Algorithmus hebt die nicht-regelkonformen Daten hervor, schlägt dem Benutzer geeignete Alternativen vor und ermöglicht Korrekturen direkt innerhalb der Anwendung.

Weitere Anwendungsfälle für Rule Mining sind zum Beispiel Migrationen oder die Verbindung verschiedener Datenquellen. Der Algorithmus erkennt automatisch Abweichungen und Regelverstöße zwischen den Quellen.

Die schnellste Möglichkeit, Informationen in Ihren Daten zu nutzen

Wie unten dargestellt, dient Rule Mining in der Stammdatenverwaltung verschiedenen Zwecken. Eine passende Lösung wie Intelligent Rule Mining führt schnell zu einem umfassenden Überblick über Muster und Regeln in Ihren bestehenden Daten. Im Vergleich zu der manuellen Erfassung von Regeln findet ein Rule-Mining-Ansatz auch unerwartete Regeln und identifiziert auch komplexere Beziehungen. Für einen vereinfachten Workflow können Geschäftsregeln direkt in Ihre Anwendung für die Stammdatenverwaltung eingefügt werden und neue Dateneinträge auf Compliance überprüft werden. Dies führt auf lange Sicht zu einer verbesserten Datenqualität.

Intelligent Rule Mining ist eine Lösung von CAMELOT Intelligent Data Services (CIDS) und wird von mehreren unserer Kunden erfolgreich eingesetzt.

Um mehr über CAMELOT Intelligent Data Services zu erfahren, folgen Sie diesem Link.

DataDrivenLeaders

Die Community für Data Driven Leaders

Die Community für Data Driven Leaders vernetzt Branchenexperten und hält Sie mit exklusiven Einblicken auf dem Laufenden.

Werden Sie Teil der Data Driven Leaders

Empfohlene Artikel

New Now in Organizations

Warum jetzt der richtige Zeitpunkt für lokales CSR-Engagement ist

Wir erleben derzeit nie dagewesene Zeiten. Der Ausbruch von COVID-19 verändert den Alltag von Unternehmen und deren Mitarbeitern grundlegend. Inmitten …

weiterlesen
New Now in Organizations

Digitale Transformation – Was tut sich im Lieferantenmanagement II

Digitale Transformation ist derzeit eines der größten Schlagwörter in der Wirtschaft, das alle Unternehmensbereiche betrifft. Doch wie verändert …

weiterlesen
CRM

Integration von Business-Netzwerken in die SAP Sales Cloud

In unserem letzten Blogbeitrag haben wir von der Integration von Social-Media-Kanälen wie Twitter in SAP C/4HANA gesprochen. In diesem …

weiterlesen

Denken Sie Ihre Value Chain neu mit uns

Kontaktieren Sie uns