Es war am Morgen des 17. Juli 2014. Thomas Royen, emeritierter Professor für Statistik, putzte sich gerade die Zähne, als ihm eine Erleuchtung kam: Er sah plötzlich den Beweis für eine berühmte mathematische Vermutung an der Schnittstelle von Geometrie, Wahrscheinlichkeitstheorie und Statistik vor sich. Jahrzehntelang hatten sich Experten ihre Zähne daran ausgebissen. Diese Vermutung über mehrdimensionale Normalverteilungen – im englischen Sprachraum "Gaussian correlation inequality" genannt – geht bereits zurück auf die 1950er Jahre. Im Jahr 1972 wurde sie dann in eine elegantere Form gebracht und hielt seither die Mathematiker in ihrem Bann. "Ich kenne Leute, die 40 Jahre daran gearbeitet haben", sagt der Statistiker Donald Richards von der Pennsylvania State University, "und auch ich habe mich 30 Jahre damit beschäftigt."

Royen dagegen hatte noch nicht allzu viele Gedanken an die Normalverteilungsvermutung verschwendet, als ihm, während er sich über das Waschbecken beugte, die "grobe Idee" für ihren Beweis durch den Kopf schoss. Nach seiner Promotion an der Universität Dortmund war Royen zunächst als Biometriker, später als Dozent für Mathematik und Statistik für die Hoechst AG tätig. Im Jahr 1985 wechselte er an die FH Bingen; als Professor hatte er endlich Zeit, die statistischen Formeln zu verbessern, mit denen die Industriestatistiker bei Medikamententests gewonnene Daten auswerten. Bereits im Ruhestand, stieß er im Juli 2014 bei seiner Arbeit an diesen Formeln darauf, dass sich die Vermutung über mehrdimensionale Normalverteilungen in eine Aussage über allgemeinere statistische Verteilungen – multivariate Chi-Quadrat-und Gamma-Verteilungen – erweitern ließ, auf die er sich spezialisiert hatte. Am Morgen jenes 17. Juli erkannte Royen, wie er eine wichtige Größe dieser erweiterten Vermutung berechnen und als Schlüssel für den gesuchten Beweis nutzen konnte. "Bereits am Abend dieses Tages hatte ich einen ersten Entwurf des Beweises niedergeschrieben", erinnert er sich.

Als ich draufschaute, wusste ich sofort, dass der Beweis gefunden war"
(Donald Richards)

Unvertraut mit LaTeX, einem in der Mathematik bevorzugten Textverarbeitungsprogramm, verfasste Royen seine Berechnungen etwas umständlich mit Hilfe von Microsoft Word und MathType. Im August 2014 veröffentlichte er seinen Beweis dann auf dem akademischen Vorabdruck-Server "arxiv.org". Er schickte auch eine Kopie an Richards, der drei Jahre zuvor einen eigenen, allerdings gescheiterten Versuch, die Vermutung zu beweisen, in Umlauf gebracht hatte. "Ich erhielt den Artikel von ihm per E-Mail", erinnert sich Richards, "und als ich draufschaute, wusste ich sofort, dass der Beweis gefunden war." Richards hätte sich am liebsten selbst geohrfeigt, als er Royens Beweis sah. Jahrzehntelang hatten er und andere Experten versucht, der Vermutung mit immer ausgefeilteren mathematischen Methoden auf den Leib zu rücken. Sie waren sich sicher, dass kühne Ideen auf den Gebieten der konvexen Geometrie, der Wahrscheinlichkeitstheorie oder der Analysis nötig sein würden, um die Vermutung zu beweisen.

Nachdem sie sich jahrelang vergeblich geplagt hatten, äußerten einige Mathematiker gar den Verdacht, die Vermutung könnte falsch sein. Und dann präsentierte Royen einen Beweis, der nicht nur kurz und einfach war – er passte auf wenige Seiten –, sondern zudem nur klassische Methoden nutzte. Richards war geradezu schockiert darüber, dass er und andere diese Möglichkeit übersehen hatten. "Aber andererseits, das muss ich zugeben, war ich auch erleichtert", sagt er. "Ich erinnere mich noch, dass ich dachte: Was für ein Glück, diesen Beweis vor meinem Tod gesehen zu haben." Er lacht. "Ich war wirklich so glücklich, ihn zu sehen."

Richards informierte ein paar Kollegen über den Beweis und half Royen sogar, sein Manuskript in LaTeX zu formatieren, damit es professioneller aussah. Doch die von Richards und Royen kontaktierten Experten schienen dem Beweis eher ablehnend gegenüber zu stehen. Falsche Beweise der Vermutung über mehrdimensionale Normalverteilungen tauchten seit Jahrzehnten immer mal wieder auf, nach 2010 waren zwei weitere auf arXiv publiziert worden. Bo'az Klartag vom Weizmann Institute of Science und der Universität Tel Aviv erinnert sich, dass er 2015 von einem Kollegen per E-Mail gleich drei angebliche Beweise zugeschickt bekam – darunter auch den von Royen. Nachdem er einen davon überprüft und einen Fehler gefunden hatte, legte er die anderen aus Zeitmangel beiseite. Einer der Gründe, warum Royens Erfolg weitgehend unbekannt blieb.

Der Peer-Review-Prozess war ihm zu langsam und zu anstrengend

Es kommt durchaus vor, dass Beweise wenig bekannter Forscher zunächst unbeachtet bleiben – aber gewöhnlich nicht für lange Zeit. Eine wichtige Arbeit wie jene von Royen würde normalerweise bei einem angesehenen Fachblatt wie den "Annals of Statistics" eingereicht und veröffentlicht werden. Und damit würde jeder Experte auf diesem Gebiet darüber Bescheid wissen. Doch Royen hatte keine Karriere mehr voranzutreiben und entschied sich daher, den bei Top-Journals üblichen, oft langsamen und anstrengenden Prozess der Begutachtung, das "Peer Review", zu umgehen. Er wählte eine schnelle Veröffentlichung im "Far East Journal of Theoretical Statistics", einer in Indien erscheinenden Fachzeitschrift, die unter Experten wenig bekannt ist. Schlimmer noch: Ein Jahr zuvor hatte er zugestimmt, dem redaktionellen Beirat der Zeitschrift anzugehören. Und das machte seine Veröffentlichung in den Augen vieler Experten nur umso verdächtiger.

Die Normalverteilungsvermutung
© Lucy Reading-Ikkanda / Quanta Magazine; Bearbeitung: Spektrum der Wissenschaft
(Ausschnitt)
 Bild vergrößernDie Normalverteilungsvermutung
In zwei Dimensionen lässt sich der Inhalt der Vermutung anschaulich nachvollziehen. Schwieriger sind die mehrdimensionalen Fälle.

All das führte dazu, dass der Beweis weithin ignoriert wurde. Erst im Dezember 2015 schrieben der polnische Mathematiker Rafał Latała und sein Student Dariusz Matlak eine Veröffentlichung, in der sie Royens Beweis anpriesen. Sie formulierten den Beweis dazu so um, dass er für andere leichter zu erfassen war. Seither spricht sich der Beweis langsam herum. Tilmann Gneiting, Leiter der Arbeitsgruppe Computational Statistics am Heidelberger Institut für Theoretische Studien – Heidelberg ist gerade einmal 85 Kilometer von Bingen entfernt! – und Professor für Computational Statistics am Karlsruher Institut für Technologie, war nach eigener Aussage geradezu schockiert, als er im Juli 2016 erfuhr, dass die Vermutung bereits vor zwei Jahren bewiesen worden war. Und als die Autorin im Februar 2017 den Statistiker Alan Izenman von der Temple University in Philadelphia dazu befragte, hatte er von dem Beweis noch immer nichts gehört.

Niemand versteht wirklich, wieso sich im 21. Jahrhundert die Nachricht von Royens Beweis so langsam um die Welt bewegen konnte. "Es ist offensichtlich ein Fehlen von Kommunikation – in einem Zeitalter, in dem es doch so leicht ist, zu kommunizieren", stellt Klartag fest. "Aber ganz egal, endlich haben wir den Beweis gefunden. Und er ist wunderschön." In der bekanntesten, 1972 formulierten Form stellt die Vermutung eine Verbindung zwischen Wahrscheinlichkeiten und Geometrie her. Sie liefert beispielsweise eine untere Grenze für die Chancen eines Dart-Spielers, zwei sich teilweise überlagernde Zielscheiben gleichzeitig zu treffen – und das nicht nur für zwei-, sondern auch für höherdimensionale Zielscheiben.

Die Konvexgeometrie befasst sich mit konvexen Mengen. Darunter verstehen Mathematiker allgemein Teilmengen n-dimensionaler Räume, die zu je zwei Punkten auch alle dazwischenliegenden Punkte enthalten. Anschaulich formuliert besitzen solche Teilmengen keine Einbuchtungen. Stellen wir uns jetzt zwei beliebige zweidimensionale konvexe Bereiche vor, etwa ein Rechteck und einen Kreis, die beide in ein und demselben Punkt zentriert sind, dem Ziel. Auf dieses Ziel geworfene Pfeile treffen mit einer Wahrscheinlichkeit um den Zielpunkt herum auf, die durch eine Normalverteilung beschrieben wird. Die Vermutung über mehrdimensionale Normalverteilungen besagt nun, dass die Wahrscheinlichkeit dafür, dass der Pfeil sowohl das Rechteck als auch den Kreis trifft, stets größer ist als das Produkt der individuellen Wahrscheinlichkeiten dafür, dass der Pfeil das Rechteck oder den Kreis trifft. Einfacher formuliert: Da die beiden Flächen sich überlappen, erhöht ein Treffer der einen Fläche die Wahrscheinlichkeit dafür, auch die andere Fläche zu treffen. Die Ungleichung, so die Vermutung, sollte für alle konvexen zentralsymmetrischen Bereiche in beliebig vielen Dimensionen gelten, solange die Bereiche in ein und demselben Punkt zentriert sind.

50 Jahre erfolglose Suche nach einer Lösung

Es gelang, einige Spezialfälle dieser Vermutung zu beweisen. So lieferte Loren Pitt von der University of Virginia einen Beweis für zwei Dimensionen. Doch ein Beweis für den allgemeinen Fall gelang den Mathematikern nicht. Pitt hatte sich seit 1973 daran versucht, als er beim Mittagessen mit Kollegen während einer Fachtagung in Albuquerque im US-Bundesstaat New Mexico erstmals von der Vermutung hörte. "Als arroganter junger Mathematiker war ich schockiert darüber, dass erwachsene Männer, die sich für respektable Mathematiker und Forscher hielten, keine Lösung für dieses Problem hatten", erinnert er sich. Er schloss sich in seinem Motelzimmer ein und war sich sicher, dass er den Raum schon bald mit einer Lösung in der Hand verlassen würde. "Fast 50 Jahre später hatte ich sie immer noch nicht gefunden." Hunderte von Seiten voller Berechnungen hatten nirgendwo hingeführt. Trotzdem waren sich Pitt und andere Mathematiker sicher – und sie nahmen den Beweis in zwei Dimensionen als Beleg dafür –, dass die konvexe Geometrie den Rahmen für einen allgemeinen Beweis der Vermutung liefern müsse. "Ich hatte eine bestimmte konzeptionelle Art entwickelt, darüber nachzudenken, und war vermutlich zu sehr darin verwurzelt", gesteht Pitt. "Und was Royen gemacht hat, war vollkommen entgegengesetzt zu dem, was ich im Sinn hatte."

Royens Beweis wurzelte in seiner früheren Arbeit in der Pharmaindustrie – und basierte außerdem auf der ursprünglichen Form der Vermutung. Denn bevor die Vermutung zu einer Aussage über konvexe Formen geworden war, hatte die amerikanische Statistikerin Olive Dunn sie zur Berechnung "simultaner Erwartungsbereiche" eingeführt, also von Bereichen, in die mehrere Variablen gleichzeitig fallen. Nehmen wir an, wir wollen den Bereich des Körpergewichts und der Körpergröße angeben, in den 95 Prozent einer gegebenen Bevölkerungsgruppe fallen. Trägt man die Datenpaare für alle erfassten Personen in ein x-y-Diagramm ein, so verteilen sich die Körpergewichte in Form einer Normalverteilung entlang der x-Achse und die Körpergrößen in Form einer Normalverteilung entlang der y-Achse. Zusammen folgen die Datenpunkte einer zweidimensionalen Normalverteilung. Was sind nun die Bereiche –w <  y < w für das Gewicht und –h < x < h für die Größe, die 95 Prozent der Bevölkerungsgruppe enthalten?

Wären Gewicht und Größe unabhängig voneinander, so könnten wir jeweils die Wahrscheinlichkeiten für beide Bereiche berechnen und miteinander multiplizieren, um die Wahrscheinlichkeit dafür zu erhalten, dass beides gleichzeitig zutrifft. Doch die beiden Messgrößen sind nicht unabhängig voneinander: Größere Menschen sind zumeist auch schwerer. Ähnlich wie bei den Dart-Pfeilen gilt also auch hier: Wenn das Gewicht einer Person im Normalbereich liegt, dann gilt dies mit erhöhter Wahrscheinlichkeit auch für ihre Größe. Dunn verallgemeinerte deshalb eine drei Jahre zuvor aufgestellte Vermutung: Die Wahrscheinlichkeit, dass zwei normalverteilte Variablen gleichzeitig in eine rechteckige Region fallen, ist stets größer oder gleich dem Produkt der individuellen Wahrscheinlichkeiten der Variablen, in ihre jeweils dazugehörigen Bereiche zu fallen. Wenn die Variablen unabhängig voneinander sind, dann ergibt sich die kombinierte Wahrscheinlichkeit gerade aus dem Produkt der individuellen Wahrscheinlichkeiten. Doch jede Korrelation zwischen den Variablen führt dazu, dass die kombinierte Wahrscheinlichkeit anwächst. Diese Ungleichung lässt sich auf zwei Gruppen mit beliebig vielen Variablen und zwei entsprechende Bereiche beliebig hoher Dimension verallgemeinern. Die kombinierte Wahrscheinlichkeit, dass die beiden Variablengruppen gleichzeitig in Ihren zugehörigen Bereichen liegen ist dann stets mindestens so groß wie das Produkt der zwei Wahrscheinlichkeiten, dass die beiden Variablengruppen in ihrem jeweiligen Bereich liegen.

Die Gleichungen für Royens Zaubertrick

Royen stieß darauf, dass sich diese Vermutung über Normalverteilungen auf Zufallsgrößen verallgemeinern ließ, die Chi-Quadrat- oder Gamma-Verteilungen folgen und bei speziellen statistischen Untersuchungen Anwendung finden. "In der Mathematik ist es nicht ungewöhnlich, dass sich ein scheinbar schwieriges Problem dadurch lösen lässt, dass man zunächst eine allgemeiner formulierte Frage beantwortet." Er führte dazu einen "Dämpfungsfaktor" t ein, mit dem er die Korrelationen zwischen den beiden Variablengruppen multiplizierte: Für t = 1 erhält er so die ursprüngliche Korrelation der Daten, für t = 0 verschwinden diese Korrelationen vollständig und die beiden Variablengruppen sind unabhängig voneinander. So erhält er eine zwischen den beiden Seiten der Ungleichung interpolierende Funktion, die für t = 0 gleich dem Produkt der beiden Wahrscheinlichkeiten für die beiden Variablengruppen ist und für t = 1 die kombinierte Wahrscheinlichkeit liefert. Um zu beweisen, dass diese kombinierte Wahrscheinlichkeit stets größer ist als das Produkt der beiden Wahrscheinlichkeiten für die beiden Variablengruppen, musste Royen nun zeigen, dass die interpolierende Funktion mit t anwächst, ihre Steigung also stets positiv ist.

Es war Royens Vertrautheit mit Chi-Quadrat- und Gamma-Verteilungen, die zu seiner Erleuchtung über dem Waschbecken führte. Sein entscheidender Einfall war, die Ableitung der Laplace-Transformierten der interpolierenden Funktion in eine geeignete Form zu bringen, von der aus sich leicht auf die Positivität der Steigung schließen ließ. Und damit war die ursprüngliche Vermutung bewiesen. "Royen hatte Gleichungen, mit denen er seinen Zaubertrick anwenden konnte", sagt Pitt, "und ich hatte diese Gleichungen nicht." Experten sagen, jeder fortgeschrittene Student der Statistik könne Royens Argumenten folgen. Und Royen selbst hofft, dass "dieser überraschend einfache Beweis … junge Studenten ermutigt, ihre eigene Kreativität zu nutzen, um neue mathematische Theoreme zu finden", denn dafür sei "nicht immer ein hohes theoretisches Niveau nötig". Eine nach eigenen Angaben bessere Version des Beweises hat Royen zwischenzeitlich in einem weiteren Aufsatz auf dem arXiv-Server hinterlegt.

Doch manche Forscher wünschen sich immer noch einen geometrischen Beweis der Vermutung, um damit einige seltsame neue Fakten der Konvexgeometrie zu erklären, die sich aus Royens analytischem Beweis lediglich implizit ergeben. Insbesondere, so Pitt, führt die Vermutung auf einen interessanten Zusammenhang zwischen Vektoren auf den Oberflächen sich überlappender konvexer Formen, aus dem sich ein völlig neuer Teilbereich der Konvexgeometrie entwickeln könnte. "Immerhin wissen wir jetzt endlich, dass auch dieser Zusammenhang korrekt ist", sagt er. "Wenn aber jemand eine Lösung innerhalb dieser Geometrie findet, dann könnten wir eine ganze Klasse von Problemen auf eine neue Art und Weise verstehen." Richards wiederum sieht die Möglichkeit, mit Hilfe von Varianten der Ungleichung bessere statistische Vorhersagen der Schwankungen von Aktienkursen zu ermöglichen. In der Wahrscheinlichkeitstheorie ermöglicht der Beweis der Vermutung jetzt die genaue Berechnung von Größen, die mit Wahrscheinlichkeiten "kleiner Kugeln" (englisch: "small ball probabilities") in Zusammenhang stehen, wie etwa bei der Zufallsbewegung von Teilchen in einer Flüssigkeit, der brownschen Bewegung. Richards hat eine Reihe weiterer Ungleichungen aufgestellt, welche die ursprüngliche Vermutung für Normalverteilungen erweitern, und die er nun versuchen will mit Royens Verfahren zu beweisen.

Royens Hauptinteresse liegt darin, Verbesserungen für die Anwendung statistischer Tests zu entwickeln. Ein Beispiel wäre eine Untersuchung, ob ein Medikament Müdigkeit verursacht, basierend auf Messungen verschiedener Variablen wie der Reaktionszeit des Patienten und seiner Körperbewegungen. Royen sagt, seine erweiterte Formulierung der Vermutung habe bereits "die alten Werkzeuge" seines Fachgebiets geschärft – und einige seiner neueren Arbeiten zu dem Thema liefern weitere Verbesserungen. Bezogen auf die eher gedämpfte Reaktion auf seinen Beweis zeigt sich Royen weder sonderlich enttäuscht noch überrascht. "Ich bin daran gewöhnt, von den Wissenschaftlern an deutschen Universitäten ignoriert zu werden", schreibt er in einer E-Mail an die Autorin. "Ich bin nicht sonderlich talentiert, was Networking und Kontaktpflege angeht. Ich benötige das alles nicht für meine Lebensqualität." Das "Gefühl tiefer Freude und Dankbarkeit" angesichts der Entdeckung eines wichtigen Beweises sei ihm Belohnung genug. "Es ist eine Art Gnade", sagt er. "Wir können lange an einem Problem arbeiten, und plötzlich erscheint ein Engel – der hier sinnbildlich für die Geheimnisse unserer Neurone steht – und schenkt uns eine gute Idee."

Logo Quanta Magazine

Von "Spektrum der Wissenschaft" übersetzte und redigierte Fassung des Artikels "A Long-Sought Proof, Found and Almost Lost" aus "Quanta Magazine", einem inhaltlich unabhängigen Magazin der Simons Foundation, die sich die Verbreitung von Forschungsergebnissen aus Mathematik und den Naturwissenschaften zum Ziel gesetzt hat.