Direkt zum Inhalt

»Sprachmodelle verstehen«: Wenn aus Daten Sprache wird

Hinter Anwendungen künstlicher Intelligenz stecken oft Sprachmodelle. Wie diese funktionieren und welche Tücken sie mit sich bringen, erläutert Hans-Peter Stricker.
Person tippt auf Smartphone, Icons symbolisieren Austausch zwischen KI und Mensch

Spätestens seit 2023 und der Einführung von ChatGPT-4 ist der Einsatz künstlicher Intelligenz zum Massenphänomen geworden. Speziell dieses Sprachmodell stammt vom Softwareunternehmen OpenAI, hinter dem inzwischen Microsoft als sein größter Investor steht. Es lässt sich mit anderen Sprachmodellen vergleichen, wie sie etwa auch Google entwickelt. In seinem Buch erklärt der Physiker und Philosoph Hans-Peter Stricker Sprachmodelle primär anhand von ChatGPT-4.

GPT steht für »Generative Pre-Trained Transformer«: Das Modell wandelt Daten in Sprache um. Nach diesem Prinzip beantwortet es Anfragen, kann etwa sehr gut Bücher zusammenfassen und mit dem Fragesteller kommunizieren, soll aber ebenso dazu beitragen, Probleme aller Art zu lösen. Diesen Aufgaben entsprechend wurde es entwickelt, in der Fachsprache: »trainiert«.

Sprachmodelle wie diese zählen zu den vielen Systemen der künstlichen Intelligenz, die ansonsten etwa in bildgebenden Verfahren, bei der Gesichtserkennung oder dem autonomen Fahren zum Einsatz kommt. Um 1950 hatte der Vordenker der Kybernetik Alan Turing die Vision, dass Maschinen mit Menschen so kommunizieren können, dass diese jene ebenfalls für einen Menschen halten. Erst gegen Ende des letzten Jahrhunderts konnte man sich langsam an die Entwicklung solcher Systeme wagen.

Ihre Grundlage bilden künstliche Neuronen, nämlich Programme, die Funktionen mit Ein- und Ausgängen simulieren und sich dabei mit unendlich vielen weiteren Neuronen vernetzen, um Daten auszutauschen. Vorbild für diese Prozesse waren die Vorgänge im Gehirn, daher der Begriff »Neuronen«. Wie diese Vernetzungen beim Austausch von Daten genau funktionieren, lässt sich nicht eindeutig bestimmen. Stricker schreibt: »Natürlich verstehen die Erfinder und Entwickler der Sprachmodelle diese besser und tiefer, als ein Laie es vermöchte, aber doch nur bis zu einem gewissen Punkt.« Die hohen Ansprüche, die sich aus solchen Vorgängen an die Rechenleistungen von Computern ergeben, führten zur Entwicklung einer an diese angepassten Generation von Chips.

Wie »menschlich« sind die Sprachmodelle?

Auch was Sprachmodelle selbst »verstehen«, ist fraglich und hängt davon ab, wie man »Verstehen« bestimmt. Denn sie erfassen Worte nicht inhaltlich, sondern nur gemäß ihrer Umgebung, also abhängig von den Worten in ihrer Nachbarschaft und damit davon, wie sie in Sätzen und Texten vorkommen. Dazu benötigen Sprachmodelle umfängliches Datenmaterial, das so erst durch die Entwicklung des Internets zugänglich wurde, was die großen Fortschritte der KI in den letzten zwei Jahrzehnten ermöglichte. Zu Beginn der KI-Entwicklung ließ man noch unendlich viele Bilder mühsam beschriften, um zu gewährleisten, dass das System einen Löwen von einem Elefanten unterscheiden kann – etwas, was Kinder nach ein, zwei Beispielen können.

Nur große Rechenzentren, die freilich Unmengen von Energie verbrauchen, können die riesigen Datenmengen verarbeiten, die effektive Anwendungen künstlicher Intelligenz benötigen. Durch das neuronale Netzwerk können komplexe Algorithmen – also Softwareprogramme, die bestimmte Aufgaben ausführen – Daten verarbeiten. Dafür brauchen die Programme immer neue Daten; manchmal suchen sie diese auch selbst im Internet oder arbeiten mit Verweisen auf Google-Suchergebnisse.

Bis das Sprachmodell »ordentliche« Antworten liefert, muss es intensiv überprüft werden. Diese sehr aufwändige Arbeit übernehmen teilweise Techniker und Programmierer. Daher gibt man den Algorithmen auch Überprüfungsprogramme vor, mit deren Hilfe die Modelle automatisch kontrolliert werden. Beides nennt man »Trainieren«, was aber einer sprachlichen Vermenschlichung der KI gleichkommt, die weit verbreitet ist. Das Grundproblem all dieser Prozesse ist, dass man das Geschehen im neuronalen Netzwerk nicht direkt steuern kann, sondern nur indirekt, indem man die Antworten des Algorithmus steuert.

Schließlich soll ChatGPT-4 kurz, verständlich, sachgerecht und richtig antworten. Faktentreue ist dabei dessen Sache nicht unbedingt, und dies umso weniger, je aktueller eine Frage ist. Manchmal fragt der Chatbot zurück, manchmal weicht er aus, manchmal erfindet er Sachverhalte. Ihm ist qua Programmierung vorgeschrieben, nicht unmoralisch zu antworten. So behauptet er doch glatt auf die Frage, was das Bild von Max Ernst »Die Jungfrau züchtigt das Jesuskind vor drei Zeugen« – das 1926 in Paris einen Skandal verursachte – zeige: Das Kind schläft friedlich.

Stricker erläutert sehr detailliert, wie ein Sprachmodell der KI funktioniert. Trotzdem ist sein Buch verständlich und insgesamt sehr empfehlenswert.

Kennen Sie schon …

Gehirn&Geist – Wer entscheidet? Wie das Gehirn unseren freien Willen beeinflusst

Was bedeutet es, ein Bewusstsein zu haben? Haben wir einen freien Willen? Diese Fragen beschäftigt Neurowissenschaft, Philosophie und Theologie gleichermaßen. Der erste Artikel zum Titelthema zeichnet die Entwicklung der neurowissenschaftlichen Forschung nach und zeigt, wie das Gehirn das subjektive Erleben formt. Anschließend geht es im Interview mit dem Neurophilosophen Michael Plauen um die Frage, ob wir frei und selbstbestimmt handeln, oder nur Marionetten unseres Gehirns sind. Die Antwort hat Konsequenzen für unser Selbstbild, die Rechtsprechung und unseren Umgang mit KI. Daneben berichten wir, wie virtuelle Szenarien die traditionelle Psychotherapie erfolgreich ergänzen und vor allem Angststörungen und Posttraumatische Belastungsstörungen lindern können. Ein weiterer Artikel beleuchtet neue Therapieansätze bei Suchterkrankungen, die die Traumata, die viele Suchterkrankte in ihrer Kindheit und Jugend erfahren haben, berücksichtigen. Zudem beschäftigen wir uns mit der Theorienkrise in der Psychologie: Der Risikoforscher Gerd Gigerenzer erklärt, warum die Psychologie dringend wieder lernen muss, ihre Theorien zu präzisieren.

Spektrum der Wissenschaft – Dunkle Energie - ein Trugbild?

Eine geheimnisvolle Kraft treibt alles im Universum immer schneller auseinander. Doch niemand weiß, was hinter dieser Dunklen Energie steckt, und neue Messdaten mehren grundsätzliche Zweifel am kosmologischen Standardmodell. Bieten alternative Ansätze eine Erklärung? Außerdem: Neue Verfahren erlauben es, Immunzellen direkt in unserem Körper so zu verändern, dass sie Krebszellen attackieren – bisher mussten sie Patienten dafür entnommen und wieder zurückgeführt werden. Quantentheorie und allgemeine Relativitätstheorie beruhen auf unvereinbaren Weltbildern. Neue Experimente an der Schnittstelle zwischen Quantenphänomenen und Gravitation sollen helfen, diesen Widerspruch zu überwinden. In der Pangenomik wird das Erbgut zahlreicher Individuen verglichen – mit weitreichenden Folgen für Forschung und Züchtung von Nutzpflanzen. Und wie immer in der Dezemberausgabe berichten wir vertieft über die Nobelpreise des Jahres für Physiologie oder Medizin, Physik und Chemie, ergänzt durch einen kritischen Blick darauf, welche Verantwortung mit großen Entdeckungen einhergeht.

Spektrum - Die Woche – Alzheimer-Biomarker bei Neugeborenen entdeckt

In dieser »Woche« geht es um überraschende Befunde aus der Alzheimerforschung: Warum Neugeborene auffallend hohe Konzentrationen eines bekannten Biomarkers im Blut tragen – und was das über die Plastizität des Gehirns verrät. Außerdem: Müssen wir dank KI bald nur noch halb so viel arbeiten?

Schreiben Sie uns!

Beitrag schreiben

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Zuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Zuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmende sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Zuschriften können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

Partnerinhalte

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.