Der Essentialismus einer Datenstrategie.

Warum essenzielle Anwendungsfälle oft mehr Nutzen bringen.

Tizian Kronsbein
6 min readJan 15, 2019

Michael Porter, der berüchtigte Ökonom und strategische Vordenker, hat einmal gesagt: „Die Essenz der Strategie besteht darin, zu entscheiden, was nicht zu tun ist.“ Wir leben jedoch in einer Welt mit Millionen von Alternativen. Selbst wenn Sie also wissen, dass 99% nicht funktionieren, haben Sie immer noch eine Vielzahl an strategische Optionen. Wie entwickelt man dann eine passende Strategie?

Ein besonders interessanter Bereich ist die Entwicklung der richtigen Datenstrategie. Hier sehen wir eine Unmenge an Architekturlösungen, Data Warehouse-Strategien, KI- und ML-anwendungen und vieles mehr. Um zu verstehen wie sie funktionieren, ist es wichtig, die Risiken zu bestimmen, da viele Produkte nicht gerade günstig daher kommen.

©Timo Elliot at https://timoelliott.com/blog/cartoons/more-analytics-cartoons

Häufig besteht die Hauptstrategie darin, alle Datenbestände intern zu zentralisieren. Unternehmen beginnen, einen zentralen Ort für all ihre Datenbanken aufzubauen und alles in einen Data Lake (Übersetzung: Datensee) zu werfen. Während Data Lakes die Analyse großer Mengen strukturierter, halbstrukturierter und unstrukturierter Daten ermöglichen und möglicherweise langfristig Wert schaffen, besteht das Risiko, dass diese strategische Entscheidung keinen schönen See erzeugt, sondern in einen Sumpf (ein sog. Data Swamp). Dieser Data Swamp kann mit Blick auf die Personalressourcen eine Unmenge kosten. Der Grund für das Scheitern dieser Strategie, liegt häufig an den Hauptcharakteristika von Data Lakes. In Data Lakes können Sie alles speichern! Es spielt keine Rolle, ob Sie die Daten tatsächlich verwenden oder nicht. Wie Adam Wray, CEO von Basho, zu Forbes sagte: „Alles wird alles aufgesaugt. Dies führt jedoch zu Problemen. […] [Data Lakes] sind böse, weil sie widerspenstig sind, unglaublich teuer sind und die Wertschöpfung im Vergleich zu dem versprochenen Wert unendlich ist. “

Die zentrale Frage ist nun, wie man Wert generiert und diese Daten nutzbar macht. Mit anderen Worten, was ist für die Strategie wirklich essenziell?

Was is Essentialismus?

Vor kurzem bin ich auf Greg McKeowns Konzept des Essentialismusgestoßen. In einer Tim-Ferriss-Podcast-Episodespricht McKeown über seinen Kurs in der d.school von Stanford, der dieses Konzept mit Design Thinking kombiniert.

McKeown zufolge, ist die beste Definition für den Essentialismus, “weniger, aber besser”. Es beginnt also mit der Frage, was wirklich wichtig ist für das, was ich erreichen möchte. Im Allgemeinen, ist dies ein disziplinierter, systematischer Ansatz, bei dem man zunächst Felder definitiver, die wichtig sind, aber von denen man weiß, dass man momentan zu wenig investiert. Anschließen konzentriert man sich auf die Dinge, die den höchsten Einfluss haben können und baut für diese entsprechende Lösungen.

McKeowns Kurs für Essentialismus umfasst viele Techniken vom Design Thinking, z. B. das Definieren des Problemraums und das Entwickeln von Lösungen, die anschließend mit kleinen Prototypen getestet werden. Diese Methode kann auch auf das Entwickeln einer Datenstrategie angewendet werden, wie es auch bei Data Thinking Workshops oder Data Sprints gemacht wird.

Mit Anwedungsfällen anfangen

Wenn es um die Datenstrategie eines Unternehmens geht, ist es sinnvoll, zunächst sinnvolle Anwendungsfälle für Ihre Unternehmensstrategie zu identifizieren. Oft ist es viel schlanker, zuerst gute Anwendungsfälle zu entwickeln und dann zu entscheiden, wie die Architektur aussieht. Dies bedeutet nicht, dass Sie keine Data-Lake-Strategie entwickeln können, aber Ihr wichtigster Faktor ist die Zeit, und es ist ratsam, frühzeitig mit sinnvollen Lernergebnissen zu beginnen. Eine wertvolle Denkweise, die dazu beiträgt, ist z.B Data Thinking.

Daher können einige Prinzipien vom Essentialismus auch auf Data Thinking und Ihre gesamte Datenstrategie angewendet werden. Durch eine Methode wie Data Thinking Workshops, werden die wertvollen Anwendungsfälle generiert, priorisiert (entscheidet, welche essenziell sind) und anschließend zu Prototypen weiterentwickelt. Einige Grundsätze des Essentialismus- Das disziplinierte Streben nach weniger, kann direkt für diese Art von Arbeit angewendet werden.

Hausaufgaben machen!

Es gibt ein weit verbreitetes Missverständnis, dass künstliche Intelligenz (auch AI) und Maschinelles Lernen (abgekürzt als ML) oft bereits als Plug-and-Play-Lösungen zu finden sind. Als Grundlage für den Einsatz solcher Technologien, sind häufig ziemlich große Datenmengen erforderlich. Meistens verfügen die Unternehmen, die ML und AI einsetzen wollen, nicht über die erforderlichen Daten. Daher ist zunächst eine Strategie zum Sammeln und Speichern erforderlich. Während der Data Sprints verbringen wir oft viel Zeit damit, Anwendungsfälle zu untersuchen, die für das Unternehmen sinnvoll sind, und entscheiden, wie wir die benötigten Daten tatsächlich erhalten, wenn sie nicht bereits vorhanden sind.

Man hat immer eine Wahl!

Wie bei allem im Leben, ist es auch hier wichtig, zu wissen, dass Sie die Wahl haben. Nur weil die Großen beschließen, alle ihre Datenbanken in einem Data Lake zu zentralisieren und die entsprechende Tech-Architektur zu kaufen, bedeutet dies nicht, dass dies die richtige Konfiguration für Sie ist. Am Ende haben Sie immer die Wahl.

Konzentrieren Sie sich auf die “Low hanging fruits”

In Data Thinking Workshops, sammeln wir zunächst so viele verschiedene Anwendungsfälle wie möglich. Eine der entscheidenen Fragen ist es jedoch, wie man diejenigen bestimmt, die essenziell sind? Eine effiziente Methode dafür, ist die Impact-Effort-Matrix. Hier platziert man alle Anwendungsfälle auf eine 4x4-Matrix und bestimmt jeweils den Grad an Nutzen (Impact) und Aufwand (Effort).

Am Anfang konzentriert man sich auf die Anwendungsfällen in der oberen rechten Ecke, da diese einen hohen Nutzen und weniger Aufwand bedeuten. Sie werden auch oft als “low hanging fruits” bezeichnet.

Repeat the process

Zu einem Profi wird man nur, wenn man es immer und immer wieder wiederholt. Auch Design Thinking und Data Science sind iterative Disziplinen. Sie müssen ständig weiter lernen und ihre Lösungen verbessern. Dat Tran von Idealo hat einen fantastischen Artikel darüber geschrieben, was ein Minimum Viable Data Product ist. Er schreibt: „A possible approach to solve this classification problem would be to take a neural network with one hidden layer. We would next train and evaluate the model. Then depending on the results, we might want to keep improving our model. We then would add another hidden layer and then do the same modelling exercise again. Then depending on the results again we might add more and more hidden layers.“ Dies zeigt den iterativen Ansatz. Man fängt mit dem einfachsten an und fügt, nach genügen Lernerfahrungen, Komplexität hinzu.

Zusammenfassung

Es bleibt festzuhalten, dass die Datenstrategie ein untrennbarer Bestandteil der Produkte und Dienstleistungen ist und dies erfordert ständiges Lernen, Testen und Verbessern.

Zum Abschluss möchte ich einige der Fragen, die man sich bei der persönlichen Anwendung des Essentialismus stellen kann, anpassen, und sie mit den Fragen kombinieren, die wir in Data Thinking-Workshops und Data Sprints stellen.

  • Stellen Sie sich die drei Fragen: Wofür steht unsere Marke / Produkt / Firma? In was sind wir besonders gut? Was entspricht einem erheblichen Bedarf für unsere Kunden?
  • Wenn Sie nur eine Sache mit den zur Verfügung stehenden Daten machen könnten, was würden Sie tun?
  • Was meine Datenstrategie angeht, ist dies das Allerwichtigste, was ich jetzt mit meiner Zeit und meinen Ressourcen tun sollte?
  • Was ist jetzt wichtig? Können wir es mit den Daten lösen, die wir haben?

Hat Ihnen dieser Artikel geholfen? Haben Sie Fragen oder Kommentare? Schreiben Sie sie gerne unter den Artikel.

Quellen

Kowalski, Kyle (2017). 10 Life hacks form ‘Essentialism’ (Book Summary) URL: https://www.sloww.co/essentialism-book/

Knowledgent (2014). How to design a successful data lake URL: https://knowledgent.com/whitepaper/design-successful-data-lake/

Tran, Dat (2018). What is Minimum Viable Data Product? On Medium URL: https://medium.com/idealo-tech-blog/what-is-minimum-viable-data-product-49269e338d85

Wood, Dan (2016). Why Data Lakes are evil. Forbes URL: https://www.forbes.com/sites/danwoods/2016/08/26/why-data-lakes-are-evil/#b4f61be4f736

--

--

Tizian Kronsbein

🎯Data Strategist & Founder @dlighted_de, Enthusiast and passionate about Tech & Borussia Dortmund