Künstliche Intelligenz: KI ist kreativer als der Durchschnittsmensch

Können KI-Systeme wie ChatGPT kreativ sein? Oder ahmen sie nur das nach, was Menschen zuvor erdacht haben? Ein interdisziplinäres Forschungsteam um den Informatiker Yoshua Bengio von der Universität Montreal hat die Kreativität mehrerer großer Sprachmodelle erstmals systematisch mit der von Menschen verglichen. Das überraschende Ergebnis: Sprachmodelle erreichen inzwischen das durchschnittliche menschliche Kreativitätsniveau und übertreffen es bisweilen sogar. An die kreativsten Köpfe kommen sie allerdings nicht heran, berichten die Fachleute in der Fachzeitschrift »Scientific Reports«.
In der groß angelegten Studie wurden mehr als 100 000 menschliche Teilnehmerinnen und Teilnehmer mit neun KI-Modellen verglichen, darunter verschiedene Versionen von GPT, Claude und Gemini. Als Maß für Kreativität diente der DAT oder Divergent Association Task, der in der Psychologie genutzt wird. Zunächst sollten die Probanden zehn Wörter aufschreiben, die semantisch möglichst wenig miteinander zu tun haben, etwa Galaxie, Heidelbeere, Bewusstsein und so weiter. So zeigt sich die Fähigkeit, ungewöhnliche, originelle Assoziationen zu bilden – ein Kernelement kreativen Denkens.
Dabei schnitten einige KI-Modelle überraschend gut ab. Zum Beispiel erzielte GPT-4 im Schnitt höhere Kreativitätswerte als die Probanden. Aber die kreative Elite blieb klar menschlich. Die kreativsten 50 Prozent der Studienteilnehmer lagen im Durchschnitt über allen getesteten KI-Systemen – und bei den kreativsten zehn Prozent war der Abstand zu den Maschinen noch mal deutlich größer. »Die höchsten Ebenen der Kreativität sind nach wie vor dem Menschen vorbehalten«, sagt der Neuro- und Kognitionswissenschaftler Karim Jerbi von der Universität Montreal, Hauptautor der vorliegenden Studie.
Um zu prüfen, ob sich diese Befunde auch auf komplexere, realitätsnähere Aufgaben übertragbar sind, ließ das Team Menschen und Maschinen unter anderem Haikus schreiben, Kurzgeschichten verfassen und Filmhandlungen entwerfen. Hier zeigte sich wieder: Die KI-Systeme lieferten solide, teils originelle Ergebnisse – doch wirklich herausragende Ideen entstanden dabei kaum.
Interessanterweise ließ sich die Kreativität der KI-Modelle gezielt steuern: Ein technischer Parameter namens »Temperatur« stellt ein, wie vorhersehbar oder risikofreudig ein Modell antwortet. Höhere Temperaturen führen zu ungewöhnlicheren Ideen, allerdings auch zu mehr Unsinn. Zudem beeinflusst der Prompt das Ergebnis stark. Fordert man die KI etwa auf, über Wortherkünfte nachzudenken, erhält man kreativere Antworten.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.