Data Science im Zeitalter von GenAI

Interview mit Dr. Timo Klerx

"GenAI macht KI greifbarer.
Aber echte Data Science beginnt dort,
wo aus Daten bessere Entscheidungen werden."

Timo Klerx, Co-Founder & Chief Data Scientist

Fünf Fragen aus der Praxis an Timo Klerx

Kaum ein Thema wird derzeit so intensiv diskutiert wie Künstliche Intelligenz. Mit dem Aufstieg von GenAI ist das Interesse an Data Science, Machine Learning und datengetriebenen Anwendungen noch einmal deutlich gestiegen. Gleichzeitig entstehen neue Erwartungen, neue Missverständnisse und viele praktische Fragen aus dem Unternehmensalltag.

Wir haben mit Dr. Timo Klerx, Co-Founder und Chief Data Scientist, gesprochen, der sich seit Jahren mit Data Science Projekten in der Praxis beschäftigt. Im Interview erklärt er, was Data Science heute wirklich bedeutet, warum GenAI vieles verändert, aber nicht alles ersetzt, und woran KI-Projekte in Unternehmen häufig scheitern.

Was versteht man heute eigentlich unter Data Science?

Data Science bedeutet, aus Daten nutzbares Wissen zu gewinnen und bessere Entscheidungen abzuleiten. Dazu gehören das Sammeln, Bereinigen, Analysieren und Modellieren von Daten mit verschiedensten Methoden – von einfachen Regelsystemen über Machine Learning bis zu GenAI – sowie das Integrieren der Ergebnisse in reale Systeme & Prozesse.

Ein Beispiel: Ein Retailer nutzt Data Science mit unserer Forecasting Platform prognotix, um die Nachfrage präziser vorherzusagen. Dadurch können Lagerbestände besser geplant, Überbestände reduziert und Out-of-Stock-Situationen vermieden werden. Der Mehrwert entsteht also nicht nur durch eine genauere Prognose, sondern vor allem durch bessere operative Entscheidungen.

Wird Data Science durch GenAI ersetzt oder neu definiert?

Weder noch. GenAI macht eher sichtbarer, was Data Science eigentlich schon immer war.

Es gab lange das Missverständnis, dass Data Science hauptsächlich daraus besteht, Modelle zu bauen. Gemeint ist damit oft der technische Teil: also Algorithmen auswählen, Machine-Learning-Modelle trainieren, testen und optimieren. In der Praxis ist das aber nur ein Teil der Arbeit.

Der grössere Teil ist Datenverständnis: Welche Daten liegen vor? Sind sie vollständig? Welche Muster sind relevant? Welche Fragestellung soll überhaupt beantwortet werden? Dazu kommen Domänenwissen, kritisches Denken und die Fähigkeit, Ergebnisse richtig einzuordnen.

Was sich durch GenAI wirklich verändert: KI wird anfassbarer. Viele Menschen in Unternehmen haben zum ersten Mal selbst erlebt, was KI leisten kann, zum Beispiel durch ChatGPT, generierte Texte oder Unterstützung beim Programmieren. Dadurch ist die Berührungsangst deutlich geringer geworden. Gleichzeitig steigt aber auch die Erwartungshaltung enorm.

Kunden fragen oft: “Wenn KI so toll Texte schreiben und sogar komplexe Programme coden kann — warum kann die dann nicht auch Predictive Maintenance machen?”

Die Frage ist absolut nachvollziehbar. KI kann Predictive Maintenance unterstützen und in vielen Fällen auch ermöglichen. Aber sie funktioniert dort anders als bei Texten oder Code.

Ein Large Language Model arbeitet vor allem mit Sprache, also mit Mustern, die in riesigen Mengen von z.B. Text und Audio verfügbar sind. Predictive Maintenance basiert dagegen auf sehr spezifischen (meist tabellarischen) Maschinen-, Sensor- und Prozessdaten. Jede Anlage hat eigene Betriebsbedingungen, eigene Datenstrukturen und eigene Muster, wenn es um Verschleiss oder Ausfälle geht.

Dafür braucht man saubere historische Daten, wie Sensordaten, Domänenwissen und ein Verständnis für Ausfallmuster. Nichts davon löst sich durch einen cleveren Prompt. GenAI kann dabei unterstützen, zum Beispiel bei der Auswertung von Dokumentationen, bei der Code-Erstellung oder bei der Erklärung von Modellergebnissen. Aber die eigentliche Arbeit bleibt Data Science: Daten verstehen, Signale erkennen, Modelle entwickeln, validieren und in reale Wartungsprozesse integrieren.

Warum schaffen es viele KI-Projekte nicht in die Produktion?

Oft scheitert es schon vor dem ersten Modell. Viele Unternehmen kommen mit einer konkreten KI-Idee, aber das eigentliche Business-Problem ist noch nicht sauber definiert. Manchmal wird nach A gefragt, obwohl B dahintersteht und im ersten Schritt vielleicht sogar C den grösseren Mehrwert bringen würde. Genau hier beginnt gute Data Science: nicht mit dem Modell, sondern mit der richtigen Fragestellung. Welche Entscheidung soll verbessert werden? Welche Daten stehen dafür zur Verfügung? Welche Qualität haben diese Daten? Und wie wird der Erfolg später gemessen?

Der zweite typische Fehler: Das Projekt bleibt zu lange ein Data-Science-Experiment. Das Modell funktioniert im Notebook auf einem einmaligen Datenexport, aber es ist nicht geklärt, wie es regelmässig mit neuen Daten versorgt wird, wer die Ergebnisse nutzt und an welcher Stelle sie in einen echten Geschäftsprozess einfliessen. Genau daran scheitert oft der Schritt in die Produktion. Ein Modell allein ist noch keine Lösung. Es braucht stabile Datenpipelines, Schnittstellen zu bestehenden Systemen, Monitoring, klare Verantwortlichkeiten und Menschen, die mit den Ergebnissen arbeiten können. Wenn diese Dinge nicht von Anfang an mitgedacht werden, bleibt aus einem guten Prototyp am Ende nur eine Demo.

Und dann gibt es noch einen Punkt, der oft unterschätzt wird: die IT. Wenn die IT-Abteilung erst am Ende dazugeholt wird, hat sie das Projekt weder mitgestaltet noch Vertrauen darin aufgebaut. Gleichzeitig braucht es Management-Commitment, damit aus einem Prototyp auch eine priorisierte, produktive Lösung werden kann. Data Science muss deshalb früh mit relevanten Fachbereichen, der IT und dem Management zusammen gedacht werden, damit fachlicher Bedarf, technische Umsetzbarkeit und strategische Verantwortung von Anfang an zusammenkommen.

Was rätst du Unternehmen, die mit KI starten wollen?

Nicht zu lange planen, sondern anfangen, aber mit einem klaren Problem. Wir Deutschen neigen zum Over-Engineering: die perfekte Architektur, die perfekte Datenbasis, der perfekte Use Case. Aber in der Realität lernt man am meisten, wenn man mit einem konkreten, überschaubaren Use Case startet und daraus Schritt für Schritt eine belastbare Lösung entwickelt.

Wichtig ist: Nicht gleich mit dem grössten und komplexesten Case beginnen. Der verspricht zwar oft den höchsten Mehrwert, bringt aber auch die meisten Unsicherheiten mit sich, fachlich, technisch und organisatorisch. Besser ist ein Use Case, der sich rechnet, aber schnell validierbar ist.

Aus Data-Science-Sicht heisst das: klein starten, Datenqualität prüfen, ein erstes Modell bauen, Ergebnisse mit den Fachbereichen validieren und früh überlegen, wie die Lösung später produktiv genutzt wird. So entsteht nicht nur ein Proof of Concept, sondern Vertrauen in Daten, Modelle und Prozesse. Denn der erste Case muss sitzen. Wenn er scheitert, heisst es schnell: „War doch klar, dass das mit KI nicht funktioniert.“ Wenn er gelingt, schafft er die Basis für grössere und komplexere Projekte.

Fazit

GenAI hat die Sicht auf KI verändert. Vieles ist greifbarer geworden, vieles zugänglicher. Gleichzeitig zeigt sich gerade jetzt, wie wichtig saubere Data Science Arbeit bleibt.

Denn zwischen einer beeindruckenden Demo und einer produktiven, belastbaren Lösung liegen meist genau die Schritte, die in der öffentlichen Diskussion oft übersehen werden: Datenverständnis, Domänenwissen, Integration in Prozesse und die richtige Priorisierung.

Wer mit KI echten Mehrwert schaffen will, braucht deshalb nicht nur technologische Möglichkeiten, sondern vor allem einen klaren Blick auf das konkrete Problem. Genau dort beginnt gute Data Science.