Im bereits zweiten Interview mit Sarah Stemmler, welches Jonas Rashedi im Rahmen seines Podcasts „My Data is better than Yours“ führt, klären die beiden, was einen Data Scientist ausmacht und welche Skills benötigt werden, um in diesem stark zukunftsorientierten Berufsbild durchstarten zu können.
Sarah Stemmler ist Data Coach bei Coady und ist somit eine Branchenkennerin, die weiß, worauf es in diesem Tätigkeitsfeld ankommt. Zu Beginn des Podcasts klären Sarah und Jonas, was einen Data Scientist ausmacht. Seit Beginn des Brancheneinstiegs 2015 stellt sich Sarah die äußerst schwierige Frage, wie der Beruf des Data Scientists definiert werden kann. Ihr ist es wichtig hervorzuheben, dass damit gleichermaßen Frauen als auch Männer gemeint sind und sie klärt somit darüber auf, dass die Berufsbezeichnung nicht genderspezifisch ist. Die Zeit ihres Einstiegs in die Welt der Data Science war jene des Endes des Statistik-Beraters. Am Anfang wurde der Beruf auf Deutsch definiert und bezeichnete somit jene Tätigkeit, in der ein starkes Statistikverständnis wichtig war.
Das Feld der Data Science vereint drei Bereiche: Die Analyse von Daten, die Anwendung von statistischen Methoden auf die Daten sowie das „Erkennen von Mustern aus der Vergangenheit und die Projektion dieser auf die Zukunft“, so Sarah. Beim letztgenannten Bereich spielen wissenschaftliche, statistische und Machine Learning Methoden eine große Rolle. Jonas weist im Zuge dieser Ausführungen darauf hin, dass die Menge der aus Unternehmen zur Verfügung stehenden Daten dazu führt, dass strategische Themen wissenschaftlicher angegangen werden müssen. Aus dieser Notwendigkeit heraus entsteht der Bedarf an Data Scientists. Diese werden ab und an dafür eingesetzt, zuvor gebildete Meinungen von Unternehmen mit Daten zu untermauern. Es geht aber vielmehr darum, wissenschaftlich über Verfahren analytisch an Fragestellungen des Business heranzutreten. Auch Jonas betont hier die nicht vorhandene Gender-Spezifität.
Es ist nicht unbedingt notwendig, hochskalierbare Software schreiben zu können. Vielmehr geht es darum, Programmierung als ein Tool zu verstehen um Daten analysieren zu können. Weiters ist Domain Verständnis von höchster Wichtigkeit. Wie aus typischen Fragestellungen Datenfragestellungen zu formulieren sind um dann mit der Analyse einen Wertbeitrag stiften zu können, ist von großem Interesse. Der Job eines Data Scientists ist vielversprechend und facettenreich. Doch wie wird man eigentlich ein Data Scientist? Was muss man dafür können? Sarah und Jonas gehen auch dieser Frage nach. Zuallererst werden die benötigten Hard Skills näher behandelt. Ausreichende Statistik-Kenntnisse sind ein Muss. Dazu gehören Themen wie statische Metriken, Kennzahlen oder auch Verteilung. Natürlich muss man auch im IT-Feld, beispielsweise im Bereich der Programmierung, fit sein. Heutzutage wird viel mit Python gearbeitet, früher spielte die Programmiersprache R eine große Rolle. Es ist nicht unbedingt notwendig, hochskalierbare Software schreiben zu können. Vielmehr geht es darum, Programmierung als ein Tool zu verstehen um Daten analysieren zu können. Weiters ist Domain Verständnis von höchster Wichtigkeit. Wie aus typischen Fragestellungen Datenfragestellungen zu formulieren sind um dann mit der Analyse einen Wertbeitrag stiften zu können, ist von großem Interesse.
Es gilt, ein Grundlagenverständnis eines jeden Bereiches sowie einen genaueren Eindruck eines Fachbereiches zu gewinnen. Sarah vermutet, dass sich das Berufsbild Data Science über kurz oder lang maßgeblich ändern wird. Aktuell spricht man noch von Data Scientists, in Zukunft wird die Bezeichnung dafür spezifischer (Marketing Data Scientist oder beispielsweise Finance Data Scientist). In diesem Zusammenhang stellt Jonas klar, dass es oftmals dauert, bis ein Thema den notwendigen Fokus hat.
Die Datenaufbereitung, eine Vorstufe vor der Analyse, nimmt viel Arbeit in Anspruch. Auch das muss Interessentinnen und Interessenten klar sein. Laut Jonas wird in diese Themen häufig zu wenig investiert. Auch die Wichtigkeit von Data Engineers ist nicht immer klar. Datengrundlagen werden durch sie geschaffen, für einen sinnvollen Umgang mit Daten sind sie unverzichtbar. „Ein Haus kann nicht ohne Fundament gebaut werden“, so Jonas. Diese Analogie zeigt klar auf, wie wichtig das Schaffen einer geeigneten Datenbasis ist. Jonas rät Data Scientists, den Zustand zu überprüfen und sich bewusst zu sein, dass es durchaus mühselig sein kann, ohne vorhergehende Arbeit der Data Engineers etwas aufzubauen. Eine Person, die die Arbeit mit Daten vorantreibt, reicht nicht aus. Es ist nicht möglich, gleichzeitig Generalist und Expertin oder Experte in jedem Spezialfeld zu sein. Deshalb ein Appell von Sarah: Geht es um die Planung einer Data Science Abteilung, spielt Teamarbeit eine maßgebliche Rolle. Unterschiedliche Kompetenzen müssen vereint werden, dadurch können die Erfolgschancen deutlich erhöht werden.
Sarah und Jonas sprechen auch über wichtige Soft Skills, die für die Arbeit als Data Scientists notwendig sind. Analytisches Verständnis und eine hohe Problemlösungsaffinität spielen eine große Rolle. Jonas prüft diese Kompetenzen durch sogenannte Brain Teaser. Einfache, scheinbar triviale Fragen an die Bewerberinnen und Bewerber lassen auf diese zwei wichtigen Skills schließen (beispielsweise: Wie viele Bäcker hat Düsseldorf?) Für die Beantwortung von Fragen wie dieser dürfen keine Hilfsmittel wie Google verwendet werden. Sarah berichtet außerdem über die Wichtigkeit, eigene Ergebnisse und Daten zu hinterfragen. Ebenso spielen Neugier, Wissensdurst und Ausdauer eine große Rolle. Sie vergleicht die Arbeit mit Daten mit Detektivarbeit. Oft weiß man zu Beginn nicht, was eigentlich gesucht wird. Man muss strategisch an die Sache herangehen und ein Gespür dafür besitzen, an welchem Punkt man beginnt. Es gilt, sich mit dem Geschäftsmodell zu identifizieren: Nur methodisches Interesse reicht nicht aus. Sarah betont auch die Wichtigkeit von Teamkompetenz. Einzelkämpferinnen und Einzelkämpfer sind nicht gefragt. Auch die Rolle der Kommunikation darf nicht unterschätzt werden. Sarah kann sich durchaus vorstellen, dass es zu einer Art Abspaltung kommt und es in Zukunft einen Translator zur Übersetzung geben wird bzw. die Kommunikation und Visualisierung von einer Expertin bzw. einem Experten übernommen werden wird. Arbeitet jemand über Wochen mit Daten, ist auch die Kommunikation verzerrt. Eigene Schwachstellen in Analysen werden gefunden, eigene Ergebnisse sind schwer zu präsentieren. Deshalb ist es oft sinnvoller, wenn die Kommunikation von jemandem übernommen wird, der unvoreingenommen an die Sache herangehen kann.
Data Scientist wird man entweder durch den Abschluss einer klassischen Ausbildung wie eines Studiums oder durch die Umschulung während des Jobs. Jonas sieht in der Unterstützung bei Weiterbildungen auch eine wichtige Aufgabe seines Unternehmens. Mitarbeiterinnen und Mitarbeiter selbst auszubilden, ist mehr als sinnvoll. Wenn jemand Data Scientist werden möchte, kann die Grundlage durch ein großes Angebot an Kursen (beispielsweise über Udemy) geschaffen werden. Mitarbeiterinnen und Mitarbeiter mit Berufserfahrung sind sowieso immer sehr begehrt. Sie bringen Domänenverständnis mit. Hat man Freude am analytischen Arbeiten, sind die Grundvoraussetzungen schon vorhanden. Bekommt man dann auch noch Hilfestellungen vom Unternehmen, steht einer Weiterentwicklung nichts mehr im Wege.
Ehrgeiz und Motivation spielen sowieso eine große Rolle. Sarah rät, sich nicht zu sehr an Stellenausschreibungen zu orientieren. Oft wird eine Ausbildung in MINT-Fächern gefordert, häufig wird auch gleich ein PHd verlangt. Davon soll man sich aber nicht abschrecken lassen, viel Ambition kann auch in diesem Sektor Berge versetzen.