So, you are planning to establish a Data Science Center of Excellence?

Fritz Lechnitz, Corporate Training Manager

Sie planen also ein Data Science Competence Center aufzubauen?

Wenn man sich in der Community im Allgemeinen, sowie im Data Science Team von Lucient im speziellen umhört, stößt man immer wieder auf folgende zentrale Fragestellungen:

  • Was sind die wichtigsten Leitlinien, wenn man ein Data Science Competence Center einrichten will?
  • Welche wichtigen Rollen sollten besetzt sein?
  • Was unterscheidet gute von richtig guten Data Scientists?

Sie haben bereits in eine vernünftige Cloud Infrastruktur investiert. Ein Team von Data Engineers ist auch schon an Bord. Eventuell haben Sie sich auch schon ein paar forschungsleitende Fragen überlegt. Dann kann es ja losgehen. Aber wie? Gehen wir einmal davon aus, dass das zentrale Ziel von Data Science es ist, mittels der richtigen Algorithmen aus den richtigen Daten Informationen zu generieren und diese richtigen Informationen an die richtigen Leute zu liefern. Also zum Beispiel etwas konkreter: Schneller Fehler und Anomalien zu erkennen und auf diese Weise Geschäftsentscheidungen mittels Daten abzusichern, anstatt auf die eigene Intuition zu vertrauen.

Die wichtigsten Leitlinien

Worauf sollte man zu Beginn achten, wenn man ein Data Science Competence Center aufbauen möchte? Vier Punkte werden in der Literatur, in der Community und nicht zuletzt vom Lucient Data Science Team genannt.

1. Bevorzugen Sie Generalisten gegenüber Spezialisten

Gerade am Anfang ist es ganz normal, dass man nicht genau weiß, was man wirklich will und in welche Richtung es exakt gehen soll. In diesem Umfeld tun sich Generalisten deutlich leichter. Es mag sein, dass ein Generalist zu Beginn etwas länger braucht, dafür ist er aber meist flexibler. Oft ist auch so, dass Generalisten darin geübter sind, mit Stakeholdern zu kommunizieren, was gerade in der Anfangsphase ein enorm wichtiges Asset darstellt.

Es mag sein, dass ein Generalist zu Beginn etwas länger braucht, dafür ist er aber meist flexibler.

Es ist nicht dabei nicht empfehlenswert, das „Einhorn“ zu suchen, das „alles“ kann. Man darf kein detailliertes Wissen in absolut jedem Bereich erwarten. Ein ehrliches „das weiß ich nicht“ zeigt, dass ein Bewusstsein über Wissenslücken vorhanden ist. Auf der anderen Seite sollte unser Generalist sich zumindest irgendwo genauer auskennen, bzw. über eine gewisse Erfahrung verfügen.

2. Schaffen Sie ein autonomes Team

Selbstverständlich sind eine Menge Fragen abzuklären, bevor unser Data Science Team loslegen kann. (Mit welchen Daten können wir arbeiten? Welche Projekte sollen angegangen werden? Unterstützung für Geschäftsentscheidungen oder Software für die Produktion? …) Sobald all das beantwortet ist, sollte das Team autonom agieren können, vor allem weil Abhängigkeiten jeden Projektablauf unnötig blockieren.

Damit das funktioniert, braucht es allerdings ein breites Skill-Set im Team, sonst muss wegen jeder Kleinigkeit irgendwo nachgefragt werden. Die wichtigsten Rollen sind (es wird weiter unten noch genauer darauf eingegangen):

  • Data Scientists fokussieren auf Datenanalyse und Statistik.
  • Software Engineers sorgen für effizientes und leicht zu wartendes Coding
  • Data Engineers managen Datenbanken und skalierbare Infrastrukturen.
  • Product Managersspezifizieren Anforderungen und stimmen sich mit anderen Teams ab.

Bewusst sprechen wir hier von Rollen und nicht Positionen. Die Fähigkeiten werden im Team durchaus überschneidend sein und die Teammitglieder imstande voneinander täglich zu lernen. Wichtig ist auch, dass das Team eigenständig die Tools auswählt, mit denen es arbeitet. Das gibt mehr Flexibilität und zwingt ein Framework, nicht für etwas herhalten zu müssen, wofür es nicht geschaffen ist.

3. Pflücken Sie niedrig hängende Früchte

Ziehen Sie ein einfaches überschaubares Projekt einem überambitionierten vor! Vielleicht werden die Stakeholder nicht übertrieben beeindruckt sein. Fraud Detection ist beispielsweise leichter zu bewerkstelligen als die Frage „was macht unsere Kunden glücklich?“ Dabei hat das Team die Chance, Abläufe und Prozesse zu lernen. Kaum vermeidbare Kinderkrankheiten wirken sich nicht so schlimm aus.

Data science -pick the low hanging fruit

Wichtig ist es auch, so banal es klingt, tatsächlich zu einem Ende zu kommen, das Projekt wirklich abzuschließen. Data Scientists neigen dazu, sich in Details zu verbeißen und immer wieder finetunen zu wollen. Hier ist ein Product Manager mit Übersicht und Entscheidungskompetenz gefragt. Je früher wir ein Projekt abschließen, desto eher wissen wir, was wir verbessern müssen.

Wenn es ein großes Projekt sein muss, ist es empfehlenswert, es in Unterprojekte zu teilen. Wenn es zu kompliziert wird, suchen wir Zwischenlösungen. Hier kann Machine Learning als Unterstützung zur Entscheidungsfindung dienen.

4. Setzen Sie die richtigen Erwartungen!

Es ist keine Neuigkeit, dass Unternehmen und Organisationen immer digitaler werden und immer größere Mengen von Daten ansammeln. Einerseits ist das natürlich günstig, weil man die Chance hat aus diesen Daten zu lernen Andererseits ist es möglich, von der schieren Datenmenge überwältigt zu werden. Hier kommt Data Science ins Spiel, Prognosen für Optimierungen und Automatisierungen zu geben. Oft müssen es zu Beginn noch nicht high-end Machine Learning Algorithmen sein. Meist reichen schon relativ einfache statistische Methoden.
Data Science Projekte sind schwer zu planen. Vieles passiert auf der Basis von Versuch und Irrtum. Aber je früher man anfängt, desto schneller reifen die Abläufe und Prozesse. Desto größer ist die Chance tatsächlich eine data-driven Organisation zu werden.

Oft müssen es zu Beginn noch nicht high-end Machine Learning Algorithmen sein. Meist reichen schon relativ einfache statistische Methoden

Data Science Projekte sind schwer zu planen. Vieles passiert auf der Basis von Versuch und Irrtum. Aber je früher man anfängt, desto schneller reifen die Abläufe und Prozesse. Desto größer ist die Chance tatsächlich eine data-driven Organisation zu werden.

In jedem Fall sollten so viele Stakeholder wie möglich eingebunden werden, um zu erläutern, was mit Data Science in der Praxis erreicht werden kann. Wir versuchen mit allen Beteiligten (Marketers, Manager, Ingenieure, …) in deren Sprache zu sprechen. Es mag sein, dass etwas dauert, bis eine funktionierende Dateninfrastruktur aufgebaut ist und man Resultate sieht. Da ist eine funktionierende Kommunikation Gold wert.

Rollen im Data Science Team

Wir haben bereits ein paar Rollen in einem funktionierenden Data Science Competence Center besprochen. Nun möchten wir nochmals genauer darauf eingehen. Im Gespräch mit den erfahrenen Spezialisten von Lucient und bei nach Lektüre einschlägiger Literatur kristallisieren sich folgende wichtigen Typen heraus. Es sei an der Stelle betont, dass es sich hier nicht um Positionen handelt, die von einzelnen Personen besetzt werden müssen. In der Praxis ist es üblich, dass sich diese Kompetenzen auf unterschiedliche Köpfe verteilen. Auch wenn hier ausschließlich die grammatikalisch männliche Form benutzt wird, können diese Rollen selbstverständlich auch von Frauen besetzt werden, wie es in der Tat auch schon immer öfter der Fall ist.

  • Der Chief Analytics Officer/Chief Data Officerist derTechnical Lead. Er bildet die Brücke zu den Fachabteilungen. Er kann als Visionär gelten.
  • Der Data Analyst stellt sicher, dass die richtigen Daten richtig interpretiert und analysiert werden.
  • Der Business Analyst hat die nötige fachliche Expertise, die er in die Datenanalyse einbringt.
  • Der Data Scientist löst Business Pröbleme mittels Machine Learning und Data Mining Technologien.
  • Der Machine Learning Engineerkonzentriert sich auf den praktischen / Software-(Architecture) Teil des Models.
  • Der Data Journalist schafft es die gewonnen Daten zu kommunizieren, eine Geschichte zu erzählen.
  • Der Data Architect entwirft eine geeignete Dateninfrastruktur. Sein Schwerpunkt liegt auf Cloud-Knowhow.
  • Der Data Engineer hält die Infrastruktur am Laufen.

Was unterscheidet Data Scientists von richtig guten Data Scientists?

Nachdem wir die wichtigsten Leitlinien beim Aufbau eines Data Science Competence Centers kurz beleuchtet haben, möchten wir uns nun der Frage zuwenden, was Data Scientists von richtig guten Data Scientists unterscheidet.

Lernbereitschaft

Die Entwicklung im Bereich Machine Learning und KI geht rasant voran. Gerade, wenn man ein Team von Data Scientist führt, ist es enorm wichtig am Puls der Zeit zu sein, um neue Technologien früh umsetzen zu können

Fokus auf den Business Impact

Data Science ist nicht l’art pour l’art. Wir betreiben sie, um einen Mehrwert für das Unternehmen zu erreichen. Richtig gute Data Scientists denken unternehmerisch, gehen ökonomisch mit Ressourcen um und verzetteln sich nicht unnötig auf Nebenschauplätzen.

Solide Software Engineering Skills

Richtig gute Data Scientists denken auch wie Entwickler und achten auf praktisch anwendbaren Code

Erwartungsmanagement

Richtig gute Data Scientist wissen um die unterschiedlichen Zugänge unterschiedlicher Stakeholder und wissen mit diese zu kommunizieren.

Daheim in der Cloud

Am eigenen Notebook offline kommt man nicht weit. Richtig gute Data Scientist bewegen sich selbstverständlich gewandt auf Plattformen wie Azure, AWS oder Google Cloud.

Data-Science-Projekte sind schwer zu planen. Vieles geschieht auf Basis von Versuch und Irrtum. Aber je früher man beginnt, desto schneller reifen die Abläufe und Prozesse. Desto größer die Chance, eine datengetriebene Organisation zu werden.

Lucient hat die nötige Erfahrung und das Know-how, ein Data Science Competence Center aufzubauen und mittels Trainings und Projektwissen voranzutreiben, sowie die Vision für zukünftige Aufgaben und Lösungen zu entwickeln. Wir verstehen es mit allen Stakeholdern zu kommunizieren und bleiben als aktive Mitglieder der Community und in engen Kontakt mit den Herstellern am Puls der Zeit. Gleichzeitig haben wir ökonomische Notwendigkeiten im Blick. Wir freuen uns darauf, gemeinsam mit Ihnen Daten in Wissen zu verwandeln.