Geschäftsregeln sind ein grundlegendes Element der Datenverwaltung eines Unternehmens. Eine Festlegung dieser Regeln ermöglicht einem Unternehmen, Datenbeschränkungen und -richtlinien zu definieren sowie Einblicke in die Datenstruktur und eine Grundlage für verschiedene Anwendungen zu erhalten. In diesem Blogeintrag erklären wir, was genau Geschäftsregeln sind, wie Sie diese erhalten und für welche Anwendungsfälle Ihr Unternehmen diese nutzen kann.

Geschäftsregeln sind Beschränkungen oder Richtlinien für die Daten eines Unternehmens. Sie beschreiben die Unternehmensstruktur und regulieren und beschränken die Aktivitäten des Unternehmens. Die Erfassung der Geschäftsregeln eines Unternehmens wird üblicherweise manuell durchgeführt, was zeitaufwendig und umständlich ist. Durch die Möglichkeiten von Association-Rule-Mining-Algorithmen können Unternehmen diese Geschäftsregeln automatisch aus ihren Daten ableiten. Diese Algorithmen sind für die Ausführung auf Computerclustern vorgesehen, sodass zahlreiche Regeln mit hoher Komplexität aufgedeckt werden können.

Was ist Association Rule Mining?

Association Rule Mining ist eine einfache aber leistungsstarke Technik, die genutzt wird, um versteckte Muster zwischen Attributen in großen Datensätzen zu entdecken. Die Methoden des Association Rule Minings werden üblicherweise für Warenkorb-Analysen verwendet. Für das Shopping-Verhalten der Kunden identifiziert der Algorithmus Produkte, die oft zusammen gekauft werden und übersetzt diese häufigen Zusammenstellungen von Artikeln in Regeln. Diese Information kann genutzt werden, um Produkte nebeneinander zu platzieren, wenn diese oft zusammen gekauft werden. Ein weiteres Beispiel ist die Liste der Produkte, die Online-Käufern beim Anzeigen eines Produkts vorgeschlagen werden. Es gibt viele weitere Schritte im Datenmanagement eines Unternehmens, bei denen Rule Mining einen Mehrwert bietet, wie die Untersuchung der Datenstruktur, die Unterstützung der Population von Formularfeldern mit Vorhersagen und die Überprüfung der Einhaltung von Regeln über mehrere Datenquellen hinweg.

Der Rule-Mining-Algorithmus leitet Assoziationsregeln aus beliebigen relationalen Daten ab. Die gewonnenen Regeln stellen die Wahrscheinlichkeit eines bestimmten Werts anhand des bekannten Vorhandenseins anderer Werte dar. Diese Regeln haben die Form von WENN-DANN-Aussagen (auch bekannt als Antezedens-Konsequens). Jede der abgeleiteten Regeln kann durch zwei essentielle Kennzahlen quantifiziert werden:

  • Support – zeigt die Häufigkeit einer Regel in einem gegebenen Datensatz an;
  • Confidence – gibt die Wahrscheinlichkeit an, auf den Wert B zu treffen, wenn wir bereits den Wert A haben.

Abbildung 1: Formeln für die Berechnung der Kennzahlen für Support und Confidence

Die abgeleiteten Regeln haben die folgende Struktur: A ⇒ B (Support: 50 %, Confidence: 90 %)

Diese Regel informiert uns auf Basis der vorliegenden Daten: Wenn der Wert A in einem Dateneintrag gefunden wird, gibt es eine Chance von 90 %, dass B im gleichen Dateneintrag gefunden wird, wobei diese Kombination in 50 % aller Dateneinträge im gesamten Datensatz auftritt.

Beispiel Warenkorbanalyse

Zur Veranschaulichung des Association-Rule-Mining-Konzepts verwenden wir das klassische Beispiel Warenkorbanalyse. Wir haben einen Shop, der sechs Artikel verkauft: Wein, Birnen, Hamburger, Käse, Eiscreme und Kirschen. Wir haben fünf Transaktionen, die den Warenkorb von fünf verschiedenen Kunden darstellen. Der erste Kunde kaufte [Hamburger, Käse], der zweite Kunde kaufte [Hamburger, Kirschen, Wein, Eiscreme] und so weiter. Mit den oben vorgestellten Formeln extrahieren wir einen Satz von Beispielregeln.

association rule mining: Warenkorbanalyse mit gewonnenen Regeln als Beispiel

association rule mining: Beispiel Warenkorbanalyse mit gewonnenen Regeln
Abbildung 2 & 3: Beispiel Warenkorbanalyse mit gewonnenen Regeln

Wie in der Tabelle oben zu sehen besagt die erste Regel, dass 75 % der Kunden, die einen Hamburger gekauft haben, auch Käse gekauft haben, wobei diese Kombination in 60 % der Daten zu finden ist. Die zweite Regel sagt aus, dass 100 % der Kunden, die eine Birne gekauft haben, ebenfalls Käse gekauft haben, wobei diese Kombination in 40 % der Daten zu finden ist. Die dritte Regel ist komplexer und besagt, dass 67 % der Kunden, die Hamburger und Käse gekauft haben, auch noch Kirschen gekauft haben, wobei diese Kombination in 60 % der Daten zu finden ist.

Mit diesem einfachen Beispiel erhalten wir einen Einblick in den Prozess des Association Rule Minings. In der Praxis sind solche Algorithmen stark optimiert und können in wenigen Sekunden große Datensätze für sehr viele Regeln verarbeiten. Tatsächlich können kleine Cluster von 10 Rechnern in weniger als einer Minute eine Million Regeln gewinnen.

Rule Mining in der Stammdatenverwaltung

Der Rule-Mining-Algorithmus kann die Muster und Relationen von Werten über mehrere Attribute erfassen. Die entsprechenden Regeln haben die oben vorgestellte Struktur:

WENN Spalte A den Wert X hat, dann hat Spalte B den Wert Y mit berechneten Werten für Support und Confidence.

Zum Beispiel können wir eine Regel von den Stammdaten ableiten, dass, wenn der Branchensektor (MARA-MBRSH) Arzneimittel (P) ist und der Materialtyp (MARA-MTART) ein fertiges Produkt (FERT) ist, DANN ist die Basismaßeinheit (MARA-MEINS) beides.

Das einfache Hinzufügen der Attribut-Wertpaar-Regeln eröffnet neue Möglichkeiten und Anwendungsfälle.

Datenanalysen und Erkenntnisse

Der Algorithmus, der automatisch alle Regeln in einem bestimmten Datensatz abgeleitet hat, gibt dem Benutzer auch einen detaillierten Überblick über die Assoziationsregeln in seinen Daten. Mit Hilfe eines Regel-Explorers kann der Benutzer mit den extrahierten Regeln interagieren und interessante Datenbereiche filtern und untersuchen. Dadurch kann der Benutzer nützliche Muster erkennen und diese als Regeln speichern, die dann in der Stammdaten-Anwendung oder anderer Software angewendet werden können, die die Regeln für Dateneinträge durchsetzt.

Vorhersage für Wert-Population

Bei der Erstellung neuer Dateneinträge kann der abgeleitete Regelsatz den Benutzer anleiten, indem die wahrscheinlichsten Werte vorgeschlagen werden. Statt jeden Wert manuell einzutragen, wird dem Benutzer eine Liste möglicher Werteinträge zusammen mit der errechneten Wahrscheinlichkeit aus den analysierten Daten vorgeschlagen Mit jedem durch den Benutzer eingetragenen Wert aktualisiert der Algorithmus seine Wahrscheinlichkeiten für die verbleibenden leeren Felder.

Überprüfung der Regel-Compliance

Die in diesem Prozess gewonnenen Regelsätze können später für die Kompatibilitäts-Überprüfungen verwendet werden. Jede Zeile in einem ungesichteten Datensatz kann in Bezug auf die Einhaltung der Regeln untersucht werden. Reihen, die sich nicht an die Regeln halten, werden für eine weitere Untersuchung markiert. Der Algorithmus hebt die nicht-regelkonformen Daten hervor, schlägt dem Benutzer geeignete Alternativen vor und ermöglicht Korrekturen direkt innerhalb der Anwendung.

Weitere Anwendungsfälle für Rule Mining sind zum Beispiel Migrationen oder die Verbindung verschiedener Datenquellen. Der Algorithmus erkennt automatisch Abweichungen und Regelverstöße zwischen den Quellen.

Die schnellste Möglichkeit, Informationen in Ihren Daten zu nutzen

Wie unten dargestellt, dient Rule Mining in der Stammdatenverwaltung verschiedenen Zwecken. Eine passende Lösung wie Intelligent Rule Mining führt schnell zu einem umfassenden Überblick über Muster und Regeln in Ihren bestehenden Daten. Im Vergleich zu der manuellen Erfassung von Regeln findet ein Rule-Mining-Ansatz auch unerwartete Regeln und identifiziert auch komplexere Beziehungen. Für einen vereinfachten Workflow können Geschäftsregeln direkt in Ihre Anwendung für die Stammdatenverwaltung eingefügt werden und neue Dateneinträge auf Compliance überprüft werden. Dies führt auf lange Sicht zu einer verbesserten Datenqualität.

Intelligent Rule Mining ist eine Lösung von CAMELOT Intelligent Data Services (CIDS) und wird von mehreren unserer Kunden erfolgreich eingesetzt.

Um mehr über CAMELOT Intelligent Data Services zu erfahren, folgen Sie diesem Link.

DataDrivenLeaders

Die Community für Data Driven Leaders

Die Community für Data Driven Leaders vernetzt Branchenexperten und hält Sie mit exklusiven Einblicken auf dem Laufenden.

Werden Sie Teil der Data Driven Leaders

Empfohlene Artikel

Logistics

Harmonisierte Logistikprozesse mit SAP S/4HANA „Advanced Shipping & Receiving“

SAP hat eine neue strategische Integrationsarchitektur für die Logistik, „Advanced Shipping & Receiving“ (ASR) bereitgestellt, welche Warenwirtschaft, Lager und Transport integriert …

weiterlesen
MDG

Stammdatenpflege wird mobil – Mobile Freigaben für SAP MDG

Die Nutzung innovativer Technologien zur Digitalisierung von Prozessabläufen im Unternehmen ist ein wichtiger Schritt im Reifegradmodell der Digitalen Transformation. Um …

weiterlesen
Future Value Chain

S&OP – Vier Schlüsselfaktoren für die kontinuierliche Verbesserung

Die Einführung eines neuen Sales- & Operations-Planning (S&OP)-Prozesses liefert in vielen Fällen nicht den angestrebten Mehrwert …

weiterlesen

Denken Sie Ihre Value Chain neu mit uns

Kontaktieren Sie uns