Kürzlich war das Data Science Meetup Hamburg zu Gast bei uns (nähere Infos zum Meetup hier). Ich fand es schon erstaunlich, wie stark das Thema Data Science abgeht. Knapp 50 Menschen fanden sich abends zum Networking ein. Die großzügig kalkulierten Mengen an belegten Brötchen reichten genau auf den Punkt.
Obwohl das Thema „Distributed Streaming Classification“ ja nun wirklich ziemlich technisch klingt, fand ich die Bandbreite erstaunlich. Eine lose Schüttung vom Nerd über Data-Analysten bis zum Manager flutete die Räume und das mit verschiedenen Nationalitäten. Viele waren das erste Mal dabei. Auch die Offenheit der Teilnehmenden fand ich bemerkenswert. „Hey, I’am XY. Who are you and what is your interest in Data Science?“
Nach einer guten Stunde Networking ging es dann los. Albert Bifet aus Paris wurde über Google Hangout als Speaker dazugeschaltet und sprach über Apache SAMOA. Das Akronym steht für Scalable Advanced Massive Online Analysis und ist ein Machine Learning Framework. Damit kann man Machine-Learning-Algorithmen von verteilten Data Stream Engines wie Apache Storm, Flink oder Samza abstrahieren. Es ist besonders gut geeignet für Prozesse mit Verzögerungsraten unter einer Sekunde.
Ein bisschen ärgerlich war, dass die Verbindung doch merklich stockte. Lesson learned: do not use Google Hangout. Das hat der guten Stimmung nach der Session aber gar nicht geschadet. Dabei ging es keineswegs um technische Details zum vorgestellten Framework, sondern vielmehr um ganz allgemein um die Bedeutung von Data Science, Machine Learning und Datenströmen. Die thematische Bandbreite der verschiedenen Projekte, in denen die Teilnehmenden unterwegs sind, fand ich schon beachtlich.
Ich jedenfalls freue mich auf’s nächste Mal.