Direkt zum Inhalt

Berichte aus dem Maschinenraum

Der Datenwissenschaftler Holger Aust gewährt Einblicke in seinen Beruf.

Big Data, Machine Learning, KI – in der Digitalisierungsdebatte geht es begrifflich zuweilen munter durcheinander. Nicht alles, was als KI bezeichnet wird, ist auch KI, und nicht alles, was smart ist, ist wirklich intelligent. Der Datenwissenschaftler Holger Aust versucht in seinem Buch »Das Zeitalter der Daten« Ordnung in dieses Wirrwarr zu bringen. In sieben Kapiteln erklärt er, wie Maschinen lernen, wie neuronale Netze funktionieren und was die typischen Aufgaben eines Datenwissenschaftlers sind.

Kundenbindung dank KI

Zum Beispiel berechnet ein solcher die Wahrscheinlichkeit, mit der ein Kunde ein Abo kündigt, etwa einen Strom- oder Handyvertrag. Idealerweise weiß das Unternehmen schon vorher, dass ein Kunde kündigen will, denn dann kann es durch entsprechende Angebote gegensteuern – je nachdem, wie wertvoll der Kunde ist. Hier kommen Datenwissenschaftler ins Spiel: »Als Erstes benötigen wir einen Algorithmus, der für jeden Kunden vorhersagt, wie wahrscheinlich die Abo-Kündigung ist«, erklärt Aust. »Zweitens müssen wir überlegen, wie wir gegensteuern können. Soll der Kundenservice Nachricht erhalten, damit er dem Kunden doch etwas anbietet, um zu bleiben? Oder erfolgt das Angebot sogar vollautomatisch per E-Mail?« Das Angebot müsse so an die Person angepasst werden, »dass die Wahrscheinlichkeit des Bleibens maximiert wird und gleichzeitig die Kosten möglichst gering bleiben«, erläutert der Autor.

Data Science, das wird bei der Lektüre schnell klar, ist keine Raketenwissenschaft, sondern viel Mathematik. Mit Regressionsanalysen lässt sich etwa herausfinden, welchen Einfluss Variablen wie Geschlecht, Vertragslaufzeit oder Monatsgebühr auf die Kündigung haben. Nicht nur bei Abo-Kündigungen können explorative Datenanalysen wichtige Erkenntnisse liefern, sondern auch in der Logistik oder im Online-Handel.

Jeder kennt die Empfehlungssysteme, die bestimmte Produkte anpreisen (»Kunden, die diesen Artikel angesehen haben, kauften auch«). Für den Händler gebe es dabei verschiedene Optimierungsmöglichkeiten, so Aust: Man könne Artikel anzeigen, die eine hohe Konversionsrate (der Anteil der Kaufabschlüsse gemessen an den Anzeigen) versprechen, aber auch solche, die nicht oft gekauft werden, doch dafür mehr Umsatz bringen.

Rund ein Drittel der Amazon-Käufe sind unmittelbar auf Empfehlungen des Algorithmus zurückzuführen. Je besser die Maschine funktioniert, desto mehr Umsatz kann der Online-Riese generieren. Verlässliche Prognosen bedeuten also bares Geld.

Auch Supermärkte müssen ihre Abverkaufsmengen prognostizieren, um die richtigen Mengen zu bestellen. Bei saisonalen Produkten wie Erdbeeren ist das schwieriger als bei nichtsaisonalen Gütern wie Nudeln, die ganzjährig gekauft werden. Die Datenwissenschaftler berücksichtigen dabei verschiedene Faktoren wie Wettervorhersage oder Feiertage. Die Werte aus dem Vorjahr heranzuziehen, helfe leider nicht viel weiter, weil sich die Saisonalität von Jahr zu Jahr unterscheide und damit die Modelle zu früh oder zu spät reagieren, so der Autor.

Das war das Problem im ersten Lockdown 2020: Statt wie sonst Handy-Hüllen oder Ladegeräte wollten die Verbraucher plötzlich Toilettenpapier und Desinfektionsmittel. Produkte, die sonst kaum nachgefragt wurden, waren plötzlich begehrt wie nie. Das irritierte die algorithmischen Preisbildungssysteme derart, dass sie plötzlich Mondpreise aufriefen. So kostete bei Amazon ein Päckchen Reis zeitweise über 60 Dollar. Auch die Staumelder und Verkehrsprognosen gerieten durcheinander, weil die Menschen die meiste Zeit zu Hause saßen und keine brauchbaren Standortdaten lieferten.

Modelle basieren auf der Annahme, dass die Welt von morgen auch die Welt von gestern sein wird. Doch für eine Pandemie gab es keine historischen Daten. Die Datenwissenschaftler mussten ihre Modelle nachjustieren, etwa indem sie Daten anders gewichteten. Auf diese Problematik geht der Autor an der Stelle leider nicht ein. Allgemeine Aussagen wie »In der Vergangenheit liegt die Zukunft« wirken darum im Licht der Aktualität etwas erratisch. Trotz dieser kleineren Mängel liest man das Buch mit Gewinn, denn mit seiner Expertise vermag der Autor den technischen Fortschritt einzuordnen: »Der Aufwand, eine Aufgabe zu 100 Prozent zu automatisieren, ist wesentlich größer, als sie nur zu 90 Prozent zu automatisieren, wobei etwas menschliches Zutun notwendig bleibt«, so sein Fazit.

Holger Aust hat ein instruktives Werk vorgelegt, das fundiertes Hintergrundwissen vermittelt und anhand vieler Beispiele Einblicke in das Berufsbild des Datenwissenschaftlers gibt. Wer in der Digitaldebatte mitreden will, sollte dieses Buch lesen.

Kennen Sie schon …

Spektrum Kompakt – Kryptografie - Sicher kommunizieren

Sichere Passwörter, sichere Messenger, sichere Datenübertragung - in Zeiten digitaler Kommunikation spielt der Schutz der übermittelten Inhalte eine große Rolle. Wie gelingt er?

Gehirn&Geist – 1/2022

»Gehirn&Geist« berichtet über den Genuss-Faktor - Lustvoll zu mehr Selbstdisziplin. Außerdem im Heft: Hirnkartierung - Was haben die Megaprojekte bisher gebracht?, Alltagsmasken und visuelle Kommunikation, Genesung bei Borderline-Persönlichkeitsstörung, Aura - Rätselhafter Vorbote der Migräne.

Spektrum Kompakt – Schule 2.0 - Aufbruch in die Zukunft des Lernens

Die vergangenen Monate haben Schule und Unterricht auf den Kopf gestellt und so manche Kritikpunkte zum Beispiel im Bereich Digitalisierung noch stärker ins Bewusstsein gerückt. Wohin kann, wohin wird sich das Lehren und Lernen entwickeln?

Lesermeinung

Beitrag schreiben

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Leserzuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Leserzuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmer sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Lesermeinungen können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

Partnerinhalte