ChatGPT: KI löst erstmals eigenständig ein jahrzehntealtes Matheproblem

Was Silicon-Valley-Firmen seit Monaten versprechen, ist nun eingetreten. KI-Modelle haben erstmals eigenständig ein relevantes Mathematikproblem gelöst: das 1975 von Paul Erdős und drei weiteren Fachleuten aufgestellte »Problem Nummer 728«, das sich um die Teiler von Binomialkoeffizienten dreht. Der renommierte Mathematiker und Fields-Medaillist Terence Tao beschrieb dies auf der Social-Media-Plattform »Mastodon« als Meilenstein. Dabei sei nicht unbedingt das Ergebnis an sich beeindruckend, sondern der Prozess, der es hervorgebracht hat. ChatGPT erzeugte eine Lösung, die eine andere KI überarbeitete und in einen effizienten Computercode übersetzte, damit ein Beweisprüfer sie verifizieren konnte. Anschließend wandelte ChatGPT das Ergebnis in einen Fachaufsatz um, der nun auf der Preprint-Plattform »ArXiv« erschienen ist.
In den vergangenen Monaten gab es bereits mehrere Bemühungen, Erdős-Probleme mithilfe von KI-Modellen zu lösen. Allerdings erwiesen sich die damaligen Ergebnisse bei genauerem Hinsehen als wenig spektakulär. Die Algorithmen hatten unbekannte Beweise im Internet gefunden und bloß reproduziert. Das scheint jetzt anders: Für das Problem 728 konnte bisher keine Lösung ausgemacht werden.
1975 untersuchte Erdős Binomialkoeffizienten, die häufig in der Wahrscheinlichkeitstheorie auftreten – etwa wenn man die Chancen auf einen Gewinn beim Lotto berechnen möchte. Aber Erdős war weniger an konkreten Ergebnissen wie diesem interessiert; viel spannender erschien ihm eine tiefere mathematische Struktur der Zahlen. Zum Beispiel wollte er mehr über die Primfaktoren von Binomialkoeffizienten erfahren. Sprich: Wie lässt sich ein Bruch in seine Primteiler zerlegen? Zusammen mit seinen Kollegen äußerte er zahlreiche Vermutungen, die mit dieser Frage zusammenhängen, unter anderem das Problem Nummer 728:
Gibt es unendlich viele Zahlen a, b und n, für die das Produkt a!b! durch n!(a + b – n)! teilbar ist, wenn a + b > n + C log(n) ist, wobei C eine Konstante ist?
Das Problem blieb 50 Jahre lang ungelöst, bis schließlich KI-Entwickler ihre Aufmerksamkeit darauf richteten. Ein Team von Google DeepMind fand mithilfe der KI AlphaProof heraus, dass die Aufgabe mehrere naheliegende Lösungen besitzt, wenn a und b deutlich größer ausfallen als n. Da dies höchstwahrscheinlich nicht im Sinne der Aufgabensteller war, wurde das Problem leicht umformuliert mit der Einschränkung, dass a und b von der gleichen Größenordnung wie n sind – was das Problem deutlich komplizierter macht.
Am 4. Januar 2026 ließ sich mit ChatGPT beweisen, dass es tatsächlich unendlich viele solcher Zahlen a, b und n gibt. Allerdings galt die Lösung nur für kleine Werte der Konstanten C, was Erdős und seine Kollegen in ihrer Originalarbeit, in der sie die Aufgabe vorstellten, bereits belegt hatten. Daher waren die Mathematiker nur an Fällen mit großen C interessiert. Daraufhin wurde der Prompt von ChatGPT abgeändert, mit dem Auftrag, auch eine Lösung für große C zu liefern. Die Antwort des Chatbots wurde anschließend an eine KI namens Aristotle übergeben, welche die Ausgabe überarbeitete, einige Lücken füllte, kleinere Fehler ausbesserte und in die Programmiersprache Lean umwandelte, damit ein Beweisprüfer das Ergebnis verifizieren konnte. Das Resultat erwies sich als richtig.
Unterdessen nutzte der Mathematiker Nat Sothanaphan Aristotle, um die vorhandene Lean-Version weiter zu vereinfachen und zu kürzen und anschließend mithilfe von ChatGPT in einen verständlichen Fachaufsatz umzuwandeln, der nun auf »arXiv« zur Verfügung steht. »Ich schätze, dass das Niveau des Schreibstils in etwa dem akzeptablen Standard für eine Forschungsarbeit entspricht«, schreibt Tao, »auch wenn es noch Raum für Verbesserungen gibt.«
Der renommierte Mathematiker hebt vor allem den Prozess hervor, wie das Ergebnis zustande kam: »Für mich ist die interessanteste Fähigkeit, die sich aus diesen Ereignissen ergibt, die Möglichkeit, neue Versionen eines Textes nach Bedarf schnell zu schreiben und umzuschreiben, auch wenn man nicht der ursprüngliche Verfasser des Arguments war«, schreibt Tao. Inzwischen führt er ein Protokoll über die Fortschritte von KI-Modellen bei Erdős-Problemen, von denen es mehr 1000 gibt und die gut dokumentiert sind.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.