Blog

Management Summary ;-) Predictive Analytics World Industry 4.0 in München

Dieses Jahr fand in München Anfang Mai wieder die kleine Schwester der Predictive Analytics World, die PAW Industry 4.0 statt. Das Konzept der Konferenzen ist ähnlich, in diesem Fall ging es jedoch mehr um spezifische Industrie-4.0-Use-Cases. Ich war für Holisticon und den Smart Data Workstream vor Ort. Gemeinsam mit Frank Pörschmann, Idigema, hielten wir zudem einen Vortrag über Ansätze im Bereich Smart Farming.

Zu unserem Thema „Happy Cow – happy Farmer“ finden sich am Ende noch einige Worte, gern würde ich aber diesen Blogpost nutzen, um so etwas wie die Executive Summary zu geben. Ein paar Highlights und Ideen sind auch nach einigen Wochen hängengeblieben und die würde ich gern teilen.

  • Das Setup von Data Science Teams ist wieder ein Thema. Konkret hat sich mittlerweile ein Hub-Spoke-Ansatz als meist am besten herausgestellt. Konkret bedeutet das eine zentrale Data-Science-Abteilung/-Unit und in den Fachbereichen weitere Data Scientists, die sich aber eng mit der Zentralabteilung abstimmen und austauschen.
  • Analytische Partnerschaften: Nachdem es eine zeitlang opportun war, alle Data-Science-Entwicklung inhouse zu gestalten und bewusst auf externe Unterstützung zu verzichten, geht der Trend hin zu analytischen Partnerschaften mit Beratungshäusern, die auf Langfristigkeit ausgelegt sind.
  • Trust: Ganz häufig war von „Trustbuilding“ die Rede, konkret also davon, dass Anwender den Algorithmen auch vertrauen müssen und dass es eine immer größere Skepsis gegenüber Blackbox-Lösungen gibt. Immer mehr Projektaufwand und -budget geht also in die Kommunikation mit Domäneexperten.
  • Natural language processing macht gigantische Fortschritte. fastText lautet momentan der Goldstandard bei Lernen von Worteinbettungen und zur Klassifizierung von Texten. Zu den Unterschieden zu word2vec und glove findet sich hier eine gute Diskussion.
  • Labeled Data ist das neue Öl: Genügend Daten zum Training von Modellen sind vorhanden. Die Herausforderung besteht darin, auch genügend Daten zu haben, die gelabelt sind.
  • (Model) Data Governance: Je mehr Data-Science-Anwendungen industrialisiert werden und in Produktion gehen, desto wichtiger ist es, dass man den Überblick behält – und dies sowohl über die ganze End-to-End Journey inklusive Daten als auch über den Zoo der sich entwickelnden Modelle.
  • Automated Machine Learning: Auto ML macht Data Science nicht überflüssig, sondern kann diese ergänzen. So lässt sich schnell eine erste Abschätzung geben, wie gut ein Modell etwa werden kann.

In unserem Vortrag „Happy Cow – happy Farmer“, sprachen wir über die methodische Herangehensweise bei einem Smart-Farming-Projekt.

Hier ging es nicht nur um die konkrete Umsetzung, sondern vor allem auch um Lessons learned im Bezug auf Best Practices in den Bereichen: Code-Struktur, Einsatz von ML Flow und unsere Erfahrungen im Arbeiten mit verteilten Data-Science-Teammitgliedern.

Persönlich empfand ich die PAW Industrie 4.0 extrem bereichernd, weil sie neben einem großen Klassentreffen vor allem einen wertvollen Austausch auf operativer Ebene ermöglicht. Absoluter Konferenztipp!

Über den Autor

Avatar

Simon ist bei Holisticon als Senior Berater im Bereich Smart Data unterwegs. Dabei baut er entweder selbst prädiktive Modelle, versucht diese zu verbessern (durch ganz viel Erklären!) oder schafft eine Infrastruktur und Umgebung, damit prädiktive Modelle den meisten Nutzen bringen können.

Antwort hinterlassen