Der Beruf des Data Scientist zählt zu den gefragtesten Berufen des letzten Jahrzehnts. Die Erwartungen, die Arbeitgeber haben, unterscheiden sich jedoch nicht selten vom Berufsbild der Arbeitnehmer. Was Arbeitgeber häufig brauchen, geht in der Regel über die Fähigkeiten eines einzelnen Data Scientist hinaus und umschließt Fähigkeiten einer Gruppe Experten, etwa Data Engineers, Softwareentwickler, Menschen mit akademischen Herangehensweisen, Spezialisten für maschinelles Lernen und Stakeholder aus den Fachbereichen. Die Einstellung eines solchen Teams ist durchaus kostenintensiv und lohnt sich eher auf lange Sicht.

Aber … sind Datenwissenschaftler nicht die attraktivsten Arbeitnehmer?

Ja, , das ist das, was Sie überall gelesen haben werden. Und auch Informationen wie diese: Investoren investieren mehr in Unternehmen, die Data Scientists in ihren Teams haben. Data Scientists finden Korrelationen in Ihren Daten, die Ihrem Unternehmen Wert und strategische Vorteile bringen … Es tut mir leid, ich werde Ihnen diese Illusion nehmen. Wollen Sie auf Ihrem Weg ins #ageofdata wirklich erfolgreich sein? Dann stellen Sie sich am besten zuerst ein paar Fragen.

Was ist ein Data Scientist?

Wenn Sie einen Data Scientist einstellen möchten, sollten Sie wissen, wonach genau Sie suchen. Die Definition von „Data Science“ hat sich im Laufe der Jahre geändert. Vor fünf Jahren waren Data Scientists Menschen mit solidem Grundwissen in Statistik, guten Programmierfähigkeiten und Kenntnissen zu einer bestimmten Domäne oder Branche. Danach suchten viele Unternehmen jedoch nach breiter aufgestellten Data Scientists, die keine bestimmten Domainkenntnisse mehr hatten, sondern in der Lage sind, jede Art von Fragen mit Daten zu lösen. Natürlich sollte er auch Korrelationen in den Daten finden, die dem Unternehmen Wert und strategische Vorteile einbringen würden.

Üblicherweise kommen Datenwissenschaftler mit folgenden Kenntnissen in ein Unternehmen: Statistik, maschinelles Lernen, Python, R und die Fähigkeit, komplexe Ergebnisse gegenüber dem Management zu erklären. Oft erwerben Data Scientists ihre Fähigkeiten online: Sie absolvieren Online-Kurse und lernen, wie man ausgefallene Algorithmen für maschinelles Lernen anwendet. Sie können Daten klassifizieren, gruppieren, Korrelationen finden, die mit bloßem Auge nicht zu erkennen sind, und diese Informationen verwenden, um mit Code in R oder Python wertsteigernde Erkenntnisse zu gewinnen. Das ist etwas das Bild, das viele Data Scientists von ihrem Beruf haben.

Was erwarten Unternehmen von Datenwissenschaftlern?

Dieser Aspekt wird durch die Erwartungen definiert, die das einstellende Unternehmen an Datenwissenschaftler hat. Nehmen wir an, Unternehmen wollen ihren Kunden den besten Service bieten – unabhängig davon, ob es sich um interne, externe Unternehmen oder Einzelpersonen handelt. Dann müssen wir fragen, was Kunden von der Arbeit eines Datenwissenschaftlers erwarten.

Im Zeitalter der Daten (#ageofdata), der Automatisierung und KI wollen Kunden genau das: Die besten Produkte und Dienstleistungen, die eigenständig Entscheidungen treffen können (außer wenn es den DSGVO-Beschwerden widerspricht). Dies hat einen tiefgreifenden Einfluss darauf, was Unternehmen von Datenwissenschaftlern erwarten.

Der Datenwissenschaftler muss in diesem Szenario in der Lage sein:

  1. die anstehende Aufgabe zu verstehen, die benötigten Daten zu identifizieren und zu sammeln
  2. die beteiligten Geschäftsprozesse zu verstehen. Ansonsten kann kein Mehrwert generiert werden.
  3. die Daten zu bereinigen und zu verstehen
  4. Erkenntnisse über die Daten zu generieren
  5. mithilfe von BI-Lösungen für das Management automatisch aktualisierte Daten-Dashboards zu generieren
  6. eine Anwendung zu erstellen, die aus den erzielten Ergebnissen einen Mehrwert generieren kann

Was sagen uns diese sechs Punkte über den Beruf des Datenwissenschaftlers?

Abbildung 1: Venn-Diagramm. Wird herkömmlicherweise zur Darstellung der Fähigkeiten verwendet, die ein erfolgreicher Data Scientist haben sollte.

Aufgabenverständnis, Datenerfassung, Geschäftsprozesse und SAP

In erster Linie geht es in Unternehmen um reale Datenszenarien. Data Scientists leben jedoch in einer utopischen Welt. Sie lernen, Flat-Files zu lesen, Excel-ähnliche, gut strukturierte Tabellen mit perfekten Daten. Leider verfügen Unternehmen nicht über diese idealen Daten, sondern eher über Daten aus Unternehmenssoftware wie SAP oder Oracle mit qualitativ eher schlechten Daten.

Data Scientists müssen wissen, wie man Daten in SAP identifiziert und sammelt. Ganze Karrieren werden diesem Thema gewidmet. Wenn die Daten erst einmal gefunden sind, ist die Aufgabe noch nicht beendet. Damit R und Python als Haupt-Werkzeuge funktionieren, müssen Sie wissen, wie Sie die Daten aus SAP extrahieren. Ein weiterer Karriereweg, der sich abzeichnet.

Außerdem geht es um Geschäftsprozesse. Schauen wir uns dazu ein Beispiel an: Stellen Sie sich vor, Sie haben einen erstklassigen Algorithmus für maschinelles Lernen generiert. Er besagt, dass der beste Weg zur Optimierung Ihrer Produktion die Herstellung von 873,23 Mobiltelefonen pro Woche ist. Das Unternehmen, bei dem Sie arbeiten, kann diese Artikel jedoch nur in Chargen von 5.000 Geräten herstellen. Was bedeutet Ihr Ergebnis nun? Es bedeutet gar nichts, denn es ist Müll. Data Scientists müssen verstehen, dass Mobiltelefone nur in Chargen von 5.000 Geräten hergestellt werden können. Das bedeutet, dass Data Scientists unternehmensweit auf Geschäftsprozesse zugreifen und diese verstehen müssen – ebenfalls eine eigene Spezialisierung.

Herkömmliche Data Science: Daten bereinigen, verstehen und Erkenntnisse gewinnen

Data Science als Daten bereinigen, verstehen und Erkenntnisse gewinnen ist in der Tat die Aufgabe eines Datenwissenschaftlers, die am ehesten auf die herkömmliche Rollendefinition passt. Komischerweise verbringen viele Data Scientists im gesamten Projekt am wenigsten Zeit mit diesen Aufgaben. Gleichzeitig liegt der Kern der Wertschöpfung und der strategischen Vorteile genau in dieser Tätigkeit.

Lassen Sie dies sacken. Denn es bedeutet, dass Data Scientists am wenigsten Zeit (im Durchschnitt weniger als 20 Prozent) mit den Aktivitäten verbringen, die Erkenntnisse generieren und dadurch Wert für Ihr Unternehmen schaffen.

Ergebnisse liefern: BI-Dashboards und -Anwendungen

Als PowerPoint-Folien die Geschäftswelt beherrschten, konnten Beratungsunternehmen nach einer Präsentation vom Kunden wohlverdientes Honorar verlangen. Diese Zeiten sind vorbei. Die Entscheider in Unternehmen wollen Automatisierung. Möchten Sie lieber eine Lösung verwenden, die Ihnen sagt, wie viele Mobiltelefone Sie pro Woche herstellen müssen und die eine 99-prozentige Genauigkeit der Ergebnisse bietet, dafür aber voraussetzt, dass erst einmal zehn verschiedene Aufgaben in Ihren Geschäftsprozessen aktualisiert werden müssen? Oder möchten Sie lieber eine Angabe mit 90-prozentiger Genauigkeit von einer Anwendung, die alles allein macht und Sie auf dem Laufenden hält, ohne dass Sie selbst Aufgaben erfüllen müssen?

Ich vermute, dass Sie wie ich die zweite Option wählen würden. Nicht selten beruht eine solche Lösung auf Automatisierung und KI, und hier liegt der zentrale Wert von #ageofdata und Data Science. Letztlich benötigen Sie dafür Software, was auch bedeutet: Neben den bisher skizzierten Spezialisierungen erwarten Unternehmen von Data Scientists, dass sie Software entwickeln können. Wieder ein eigener Karriereweg.

Eine Person für mehrere Spezialisierungen?

Alle bisher skizzierten Aufgaben erfordern, dass Data Scientists das Know-how verschiedener Berufswege in einer Person vereinen. Darüber hinaus wachsen Wissen und Tool ins jeder dieser Spezialisierungen ständig weiter. Das führt zu einer nahezu unendlichen Liste von Fähigkeiten, die lebenslanger beherrschen und auf dem neuesten Stand halten müssen, um qualitativ hochwertige Arbeit zu liefern.

  • Code Sprachen: R, Python, Java, JavaScript, C++, Scala
  • Frameworks und Sprachen für Webanwendungen: Bootstrap, HTML, CSS, Angular, Node.js
  • Entwicklungstools, Frameworks: Git, DevOps, Docker, Kubernetes
  • Maschinelles Lernen: scikit-learn, TensorFlow
  • Geschäftsprozesse und Unternehmenssoftware
  • Big-Data-Frameworks: Hadoop, Spark
  • Statistik
  • Kommunikation: Soft Skills + PowerPoint
  • Cloud-Bereitstellung: Microsoft Azure, AWS
  • BI-Tools: Power BI, Tableau, Qliq, SAP Analytics Cloud

Meiner Meinung nach – und diese Meinung teile ich mit vielen Data-Science-Experten – ist eine Person, die alle diese Kenntnisse vereinigt, eine Wunschvorstellung. Sie existiert nicht.

Abbildung 2: Tatsächliche Fähigkeiten, die von Data Scientist verlangt werden

Analytics-Zentrum vereint Expertise

Nach dem bisher Gesagten ziehe ich folgenden Schluss: Wenn Sie einen einzelnen Data Scientist einstellen, wird das Ihre Anliegen nicht lösen. Setzen Sie stattdessen auf ein Team von Experten, das Data Science so beherrscht, dass echter Wert entsteht. Unabhängig davon, ob Sie das Team intern aufbauen oder auslagern möchten, empfehlen wir Ihnen ein Team mit mindestens vier Personen, das die in Abbildung 3 gezeigten Fähigkeiten vereint.

Die Investition in ein ganzes Team kann für Ihr Unternehmen sowohl finanziell als auch hinsichtlich der Markteinführungszeit teuer werden. Oder Sie können von der Zusammenarbeit mit einem externen Team profitieren, vor allem, wenn Sie schnell ein Team aufbauen müssen, Ihre Data-Science-Initiative schnell abstecken wollen oder ein erfahrenes Team zur Ergänzung Ihrer internen Ressourcen benötigen.

Abbildung 3: Struktur für Data-Science-Projekte nach unserem Modell eines Analytics-Zentrum im Unternehmen

Kontaktieren Sie uns, um gemeinsam Ihren Weg in die Industrie 4.0 zu gestalten und sich Ihren strategischen Vorteil für das kommende #ageofdata zu sichern.

Die Community für Data Driven Leaders

Die Community für Data Driven Leaders vernetzt Branchenexperten und hält Sie mit exklusiven Einblicken auf dem Laufenden.

Werden Sie Teil der Data Driven Leaders

Empfohlene Artikel

CRM

SAP Cloud Platform: Portale erfolgreich in Ihr CRM integrieren

Kennen Sie das, Sie würden gerne direkter mit Ihren Geschäftspartnern in Kontakt treten um Leads und Opportunitys zu teilen …

weiterlesen
CRM

Vertriebserfolg mit SAP C/4HANA bei WEINMANN Emergency Medical Technology

Spezifische Anforderungen Die WEINMANN Emergency Medical Technology GmbH ist ein international aufgestellter Anbieter für mobile medizinische Notfallgeräte. Die Kunden …

weiterlesen
Data & Analytics

„End-of-Data“ im Information Lifecycle Management (ILM)

Früher war eine umfassende Datenmanagementstrategie, die auf eine Senkung der Gesamtbetriebskosten (Total Cost of Ownership, TCO) und die Kontrolle des …

weiterlesen

Denken Sie Ihre Value Chain neu mit uns

Kontaktieren Sie uns