Blog

Data Storytelling

Eine Sechs-Wort-Geschichte:

„For sale:
baby shoes,
never worn.“

Ein sehr krasses und extrem gutes Beispiel für eine Geschichte, die in Erinnerung bleibt. Sie wird Hemingway zugeschrieben. Was können wir im Bereich Data Science davon lernen? Data Storytelling heißt das Zauberwort.

Data Science wird professionell…

Data Science in Unternehmen erlebt in den letzten Jahren eine Professionalisierung. Aus einzelnen Inseln analytischen Wissens im Unternehmen werden Data-Science-Abteilungen. Es gibt an Unis und FHs spezielle Masterstudiengänge mit dem Titel Data Science. Auch die Infrastruktur wird professioneller: analytische Plattformen werden entwickelt und das Deployment von Modellen gleicht meist auch keinem Abenteuer mehr.

Ein Bereich, der aber bisher von der Professionalisierung weitestgehend ‚verschont‘ blieb, ist das Data Storytelling. Gerade weil viele Datenprodukte technischer Natur sind, sind das verpasste Chancen. Für das Business relevante Erkenntnisse könnten deutlich besser kommuniziert werden.

…Data Storytelling ist es noch nicht

Aber warum sollten wir uns bemühen, gut und idealerweise in guten Geschichten zu kommunizieren? Geschichten ermöglichen uns:

  • eine gemeinsame Sprache zwischen Data Science, Fachabteilung und Management zu finden.
  • Begeisterung beim Zuhörer für Themen erzeugen.
  • konkret zu werden.
  • einen Zugang zum häufig abstrakten Datenthema zu schaffen.

Eine Aufzählung ohne Anspruch auf Vollständigkeit!
Im Toolbereich gibt es hier bereits vielversprechende Ansätze, das Storytelling zu unterstützen: Notebook-Apps wie Jupyter oder ausgefallene Präsentationsansichten in Reportingtools wie Tableau und Co. All diese Tools können eine gute Geschichte unterstützen, aber nicht kreieren. Da muss jeder Einzelne schon selbst ran!

Bei jeder Modellierung und Analyseaufgabe fallen Erkenntnisse an — dagegen kann man sich gar nicht wehren! Warum sie also nicht nutzen?

Aber wie mache ich das konkret?

Drei Beispiele, die sicher nicht trennscharf sind: Als Spielwiese nutzen wir ein hypothetisches B2C-Unternehmen. Es ist gerade dabei, seinen Kündigungsaffinitätsscore für das Direktmarketing zu rekalibrieren. Es betrachtet dabei sehr detailliert Kündigungsstatistiken.

Verkürzen und weglassen, um zuzuspitzen

Häufig hilft es, sich einen Aspekt auszusuchen und diesen bei maximaler Verknappung als Aufhänger zu nutzen. So lässt sich in unserem Unternehmen erkennen, dass die Neukunden aus dem Zeitraum 12/2012 bis 12/2013 eine überdurchschnittliche Kündigungsrate haben. Nun geht es um Verkürzung: ‚Kunden, die wir 2013 akquiriert haben, sind die Kunden mit den am Abstand höchsten Kündigungsquoten.‘ Oder vielleicht noch knapper: ‚2013‘-Kunden sind treulose Tomaten.‘ Dies ist ein Bild, das sich festsetzt. Nun habe ich mein Publikum gefesselt, um weitere Details zu präsentieren.

Veranschaulichen

Es gibt in den Weiten des Internets ganz großartige Beispiele — oft aus dem Umfeld des Datenjournalismus — wie man Geschichten veranschaulicht. In unserem fiktiven Unternehmen gäbe es nun sicher eine klassische Folie, auf der die folgende Erkenntnis auftaucht: „0.2 % decline y.o.y. in customer base“. Ein Rückgang der Kundenanzahl von nur 0,2%  hört sich erst mal nicht sehr dramatisch an. Geht man aber von 10 Mio. Kunden aus, füllen diese weggegangenen Kunden (immerhin 20.000) leicht das Stadion eines Zweitligisten!

Zahlen in Beziehung setzen

Den genau anderen Weg geht die Relativierung. Ohne Bezugsgröße kann der Mensch sich unter großen Zahlen wenig vorstellen. Jedes Jahr mit einem Kundenweggang in der Größe eines kompletten Stadionpublikums konfrontiert zu sein, ist sicher nicht wenig. Aber ist es relevant? Eine simple Möglichkeit, um abzuschätzen ob die 20.000 also viel oder wenig sind: Man sucht sich eine Bezugsgröße –  idealerweise keine Bestandsgröße (wie die gesamte customer base), sondern auch eine Flussgröße. Setzt man diese Zahl also in Beziehung zu den Neukunden, wird daraus plötzlich ein Schuh. Gab es im letzten Jahr also zum Beispiel 10.000 Neukunden, lässt sich ableiten: Für jeden Neukunden verlieren wir zwei Bestandskunden. Die Dramatik der Situation ist spätestens da jedem klar.

Neugierig gemacht? Als Inspirationsquelle sehr zu empfehlen:

Über den Autor

Simon ist bei Holisticon als Senior Berater im Bereich Smart Data unterwegs. Dabei baut er entweder selbst prädiktive Modelle, versucht diese zu verbessern (durch ganz viel Erklären!) oder schafft eine Infrastruktur und Umgebung, damit prädiktive Modelle den meisten Nutzen bringen können.

Antwort hinterlassen