Direkt zum Inhalt

Wettlauf gegen die Zeit für KI: Verschlüsselte Mathematik-Beweise fordern KI heraus

Bis zum 13. Februar 2026 haben KI-Systeme Zeit, zehn aktuelle Forschungsaufgaben aus verschiedenen Bereichen der Mathematik zu knacken. Damit präsentieren Fachleute einen neuen Härtetest für Maschinen.
Ein leeres Klassenzimmer mit mehreren Reihen von blauen Stühlen und Tischen. Im Hintergrund befindet sich eine grüne Tafel, die mit komplexen mathematischen Formeln und Diagrammen beschrieben ist. An der Wand neben der Tafel hängen Korktafeln mit Notizen und Zeichnungen. Der Raum ist gut beleuchtet, und auf einigen Tischen liegen gestapelte Bücher.
Mathematiker haben erstmals aktuelle, bisher unveröffentlichte Forschungsfragen für KI-Modelle aufbereitet.

Genau sieben Tage. So lange haben KI-Systeme Zeit, um insgesamt zehn Aufgaben aus verschiedenen mathematischen Gebieten zu lösen. Diese haben elf namhafte Fachleute erarbeitet, darunter etwa Martin Hairer, der 2014 mit der Fields-Medaille ausgezeichnet wurde. »Jede Frage ergab sich auf natürliche Weise im Forschungsprozess der Autoren«, schreiben die Forscher auf der Website des »First Proof« genannten Projekts. Am Freitag, den 13. Februar 2026, werden sie die Lösungen veröffentlichen und dabei die Errungenschaften – oder die Misserfolge – der KI-Systeme diskutieren.

Es ist nicht das erste Mal, dass sich Mathematiker zusammentun, um bisher unveröffentlichte Aufgaben zu entwickeln, die KI-Systeme knacken sollen. Im Sommer des Jahres 2025 isolierten sich beispielsweise einige Fachleute, um gemeinsam schwierige Probleme zu erarbeiten und durch Sprachmodelle lösen zu lassen. Doch der Ansatz von First Proof ist ein leicht anderer: »Die meisten mathematischen Benchmarks bewerten die Leistung von KI-Systemen anhand von Fragen aus Mathematikwettbewerben, einem künstlichen Bereich, der nicht den kreativen Prozess von Forschern widerspiegelt«, schreiben die elf Autoren in einer bei »ArXiv« veröffentlichten Arbeit. Stattdessen haben die Mathematiker nun Fragen formuliert, die sich im Lauf ihrer eigenen Forschungsarbeit ergaben. Diese haben sie gelöst, aber die Ergebnisse noch nicht publiziert.

Die zehn veröffentlichten Probleme stammen aus verschiedenen Bereichen der Mathematik, etwa der algebraischen Kombinatorik, der algebraischen Topologie, der Graphentheorie oder der Darstellungstheorie. Die Aufgaben entsprechen dabei Zwischenergebnissen von größeren Resultaten, erklären die Fachleute, und würden für eine eigene Publikation in der Regel nicht ausreichen. Jeweils rund fünf Seiten umfassen die Lösungen, was durchaus im Bereich des Machbaren für aktuelle KI-Systeme liegen sollte. »Die Aufgaben sind so technisch, dass es für einen Nichtexperten schwierig wäre, die von KI generierten Ergebnisse zu diesen Problemen zu überprüfen«, erklärt der Mathematiker Terence Tao, der bisher nicht an dem Projekt beteiligt ist, auf Mastodon. »Daher erscheint es ziemlich schwierig, solche Probleme von Nichtexperten lösen zu lassen – aber man kann ja immer überrascht werden.«

Neue Benchmarks für die KI

Die elf Forscher erklären, dass dieses erste Experiment noch nicht geeignet ist, um die Mathematikfähigkeiten von KI zu bewerten. Dafür seien es schlicht zu wenige Aufgaben. Zudem haben sie noch keine Strategie erarbeitet, wie die maschinengenerierten Lösungen zu werten sind. Die Mathematiker sind stattdessen in dieser ersten Phase daran interessiert, wichtige Fragen zu klären, die für die Entwicklung eines Benchmarktests bedeutsam sind. Deshalb sind erst einmal andere gefragt: Welche Prompts haben sich besonders gut zur Bearbeitung der Fragen geeignet? Haben sie irgendwelche Details übersehen? Vielleicht sind ja Teile der Aufgaben schon irgendwo online aufgetaucht.

Und schließlich ermutigen sie die Community, sich an First Proof zu beteiligen: Im Lauf eines Jahres erbringen Forschende in der Regel mehrmals solche Zwischenergebnisse – diese können sie einreichen, um weitere Aufgaben für die KI-Modelle zu sammeln. Die elf Initiatoren des Projekts arbeiten bereits an weiteren Fragestellungen für die zweite Phase.

Die Lösungen zu den zehn Aufgaben haben die elf Fachleute übrigens bereits veröffentlicht – aber in verschlüsselter Form. Es wäre besonders witzig, wenn die KI-Systeme die Verschlüsselung knacken und so die Probleme lösen würden. Vielleicht probiert ja jemand diesen Ansatz aus – und sorgt so für eine etwas andere Überraschung in der Community.

WEITERLESEN MIT »SPEKTRUM +«

Im Abo erhalten Sie exklusiven Zugang zu allen Premiumartikeln von »spektrum.de« sowie »Spektrum - Die Woche« als PDF- und App-Ausgabe. Testen Sie 30 Tage uneingeschränkten Zugang zu »Spektrum+« gratis:

Jetzt testen

(Sie müssen Javascript erlauben, um nach der Anmeldung auf diesen Artikel zugreifen zu können)

  • Quellen
Abouzaid, M. et al., arXiv 10.48550/arXiv.2602.05192, 2026

Schreiben Sie uns!

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

Partnerinhalte

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.