Künstliche Intelligenz: Sprachmodell AlphaEvolve macht mathematische Entdeckungen – und mehr

Es ist das erste Mal, dass ein Sprachmodell ein konkretes mathematisches Problem nennenswert voranbringt. Und die neue KI namens AlphaEvolve ist offenbar nicht nur ein Mathetalent, sondern eine regelrechte Allzweckwaffe: Unter anderem hat sie den Stromverbrauch von Google gesenkt, das Chipdesign verbessert und KI-Trainingsprozesse verkürzt. Die beeindruckenden Ergebnisse hat Google in einem White Paper Mitte Mai 2025 veröffentlicht.
Mathematische Aufgaben gelten als notorisch schwere Herausforderung für KI-Programme. Denn das Fach ist auf Präzision ausgelegt: Ein Argument oder eine Berechnung muss den strengen Regeln der Logik folgen, sonst entstehen Fehler. In den vergangenen Jahren haben Fachleute daher auf KI-Modelle zurückgegriffen, um mathematische Muster in großen Datensammlungen zu identifizieren oder neue Vermutungen zu äußern – aber ein richtiger Durchbruch blieb aus. Das scheint sich mit dem neuen Sprachmodell AlphaEvolve zu ändern, das die Google-Tochterfirma DeepMind präsentiert hat.
Wie die Forschenden berichten, erzielten sie Fortschritte bei der so genannten Kusszahl. Diese hat mit der einfach anmutenden Frage zu tun: Wie viele Kugeln können eine gleich große andere berühren? Bricht man das Problem auf zwei Dimensionen mit Kreisen herunter, dann wird schnell ersichtlich, dass die Kusszahl sechs ist: Höchstens sechs Kreise können einen in der Mitte befindlichen Kreis gleichzeitig berühren. In drei Dimensionen ist die Aufgabe schon kniffliger – lange war unklar, ob die Kusszahl 12 oder 13 beträgt. Erst im Jahr 1956 wurde bewiesen, dass 12 die richtige Lösung ist. Auch für vier Dimensionen mit vierdimensionalen Verallgemeinerungen von Kugeln ist inzwischen die Kusszahl bekannt: 24. Für alle höheren Dimensionen kann die Fachwelt bislang nur grobe Schätzungen äußern.
So ging man bisher davon aus, dass in elf Dimensionen die Kusszahl mindestens 592 beträgt. AlphaEvolve korrigierte diese Schätzung nach oben. Das Programm fand eine Anordnung elfdimensionaler Kugeln, bei denen 593 Stück eine elfdimensionale Kugel berühren. Damit ist nun klar: Die Kusszahl in elf Dimensionen ist mindestens 593.
»AlphaEvolve ist die erste erfolgreiche Demonstration neuer Entdeckungen auf der Grundlage von Allzweck-Sprachmodellen«Mario Krenn, KI-Forscher
Auch andere mathematische Aufgaben löste das neue Programm mit Bravour: Das Team von DeepMind ließ die KI auf 50 offene Probleme aus Bereichen der Analysis, Geometrie und Zahlentheorie los. In drei Viertel der Fälle lieferte sie die beste bislang bekannte Lösung, bei etwa 20 Prozent konnte sie bestehende Ergebnisse verbessern. Bei den restlichen fünf Prozent der Aufgaben fand die KI schlechtere Lösungen als die bisher bekannten. »Ich denke, AlphaEvolve ist die erste erfolgreiche Demonstration neuer Entdeckungen auf der Grundlage von Allzweck-Sprachmodellen«, sagte der Forscher Mario Krenn vom Max-Planck-Institut für die Physik des Lichts in Erlangen zu »Nature«. »Die neue Arbeit ist ziemlich spektakulär.«
Dennoch gibt es Einschränkungen. Das Programm lässt sich lediglich auf mathematische Aufgaben anwenden, die man durch einen Programmcode ausdrücken kann – das ist insbesondere bei Optimierungsaufgaben der Fall, die in zahlreichen Anwendungen eine wichtige Rolle spielen.
Eine neue Allzweckwaffe
AlphaEvolve gehört zur gleichen Familie von Programmen wie Claude von Anthropic oder GPT von OpenAI. Das neue Programm nutzt die Struktur von Gemini, dem Sprachmodell von Google. Damit AlphaEvolve eine Aufgabe löst, muss man eine Frage formulieren sowie Kriterien für die Bewertung und einen Lösungsvorschlag des Problems übergeben. Das Sprachmodell liefert dann etliche Änderungsvorschläge, die durch einen Algorithmus bewertet werden. Anschließend folgen einige »Evolutionsschritte«, bei denen das Sprachmodelle neue Ideen erzeugt, um die Lösungen nach und nach zu verbessern. Letzteres unterscheidet sich von herkömmlichen Programmen, die stattdessen meist einen Schritt namens Reinforcement Learning durchlaufen. Hier stimmen häufig Menschen die Funktionsweise der KI fein ab.
Damit ist AlphaEvolve – im Gegensatz zu den bisherigen KI-Modellen, die auf mathematische Probleme angesetzt wurden – vielseitig einsetzbar. Es wurde nicht speziell auf das Lösen mathematischer Aufgaben zugeschnitten. Um das zu demonstrieren, hat DeepMind die KI in verschiedenen Anwendungsbereichen getestet – mit erstaunlichem Erfolg.
Zunächst sollte sich AlphaEvolve der Google-Systemsoftware Borg widmen, welche die Rechenzentren der US-Firma koordiniert. Das KI-Programm fand bislang unentdeckte Möglichkeiten, um die Zentren effizienter zu betreiben. Nachdem Google die Vorschläge ein Jahr lang umgesetzt hatte, konnte die Firma offenbar 0,7 Prozent der benötigten Rechenleistung einsparen – die Menge ist bei so einem großen Unternehmen nicht zu unterschätzen. Darüber hinaus konnte das Team von DeepMind dank AlphaEvolve den Aufbau spezialisierter Computerchips verbessern, so genannter Tensor Processing Units (kurz TPUs).
Eine weitere Neuerung brachte AlphaEvolve im Bereich der KI selbst. Das Programm fand eine Möglichkeit, mathematische Objekte namens Matrizen (eine Art Tabelle), die eine wichtige Rolle bei der Entwicklung von KI-Modellen spielen, schneller miteinander zu multiplizieren. Damit ließ sich die Trainingszeit für den Google-Chatbot Gemini um ein Prozent verkürzen, berichten die Fachleute.
DeepMind möchte künftig die Fähigkeiten von AlphaEvolve weiter verbessern, vor allem bei der Erzeugung von Programmcode. Aktuell will das Unternehmen möglichst vielen Forschungseinrichtungen das KI-Modell zur Verfügung stellen, um auch Fortschritte in Bereichen außerhalb der Softwareentwicklung und der Mathematik zu erzielen.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.