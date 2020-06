Computer rechnen wie Menschen

Um es einem neuronalen Netz zu ermöglichen, die Symbole wie ein Mathematiker zu verarbeiten, begannen Charton und Lample damit, mathematische Ausdrücke in Formen zu übersetzen, die dabei helfen. Sie interpretierten sie schließlich als Baum – ein Format, das dem Prinzip eines schematisierten Satzes ähnelt. Mathematische Operatoren wie Addition, Subtraktion, Multiplikation und Division wurden zu Verzweigungen des Baumes. Das Gleiche gilt für Operationen wie Potenzieren oder trigonometrische Funktionen. Variablen und Zahlen wurden zu Blättern. Die Baumstruktur erfasste bis auf sehr wenige Ausnahmen die Art und Weise, wie mathematische Operationen in längeren Ausdrücken verschachtelt werden können.

»Wenn wir eine große Funktion sehen, können wir sehen, dass sie aus kleineren Funktionen zusammengesetzt ist, und wir haben eine gewisse Intuition, was die Lösung sein kann«, sagt Lample. »Wir denken, dass das Modell versucht, in den Symbolen Anhaltspunkte dafür zu finden, was die Lösung sein kann.« Dieser Prozess verlaufe ähnlich, wie Menschen Integrale – und eigentlich alle mathematischen Probleme – lösen: indem sie sie auf erkennbare Unterprobleme reduzieren, die sie schon einmal gelöst haben.

Laden... © 5W Infographics für Quanta Magazine; dt. Bearbeitung: Spektrum der Wissenschaft (Ausschnitt) Mathematik in Baumform | Indem sie mathematische Ausdrücke als verzweigte Struktur aus Beziehungen umschrieben, entwickelten Fachleute neuronale Netze, die symbolische Mathematik verarbeiten können. Dabei werden Operationen wie Additionen und trigonometrische Funktionen zu Verzweigungspunkten, während Zahlen und Variablen zu den Blättern des Baumes werden. Das erlaubt es den neuronalen Netzen, eine Art Intuition zu entwickeln, wie die Lösung aussehen könnte.

Nachdem die beiden Forscher diese Architektur entwickelt hatten, benutzten sie eine Datenbank mit Elementarfunktionen, um mehrere Trainingsdatensätze mit insgesamt etwa 200 Millionen (baumförmigen) Gleichungen und Lösungen zu generieren. Mit solche Daten »fütterten« sie dann das neuronale Netz, damit jenes lernen konnte, wie Lösungen für diese Probleme aussehen.

Nach dem Training wollten die Forscher sehen, was das Netz leisten konnte. Sie gaben ihm einen Testsatz von 5000 Gleichungen, diesmal ohne die dazugehörigen Antworten (keines der Testprobleme war als »unlösbar« eingestuft). Das neuronale Netz bestand mit Bravour: Es schaffte es, für die große Mehrheit der Probleme die richtigen Lösungen zu finden. Insbesondere bei der Integration war es hervorragend und löste fast alle Testprobleme, während es bei gewöhnlichen Differenzialgleichungen nicht ganz so erfolgreich war.

Für fast jedes Problem benötigte das Programm weniger als eine Sekunde, um die korrekte Lösung zu generieren. Und bei den Integrationsproblemen übertraf es in Bezug auf Geschwindigkeit und Genauigkeit einige bekannte Matheprogramme wie Mathematica und Matlab. Laut den Forschern hat das neuronale Netz Lösungen für Probleme gefunden, die keines dieser kommerziellen Programme lösen konnte.

In die Black Box

Der Mathematiker Roger Germundsson erhebt allerdings Einwände gegen den Vergleich. Er leitet die Forschung und Entwicklung bei Wolfram, dem Hersteller von Mathematica, und sagt, dass die Facebook-Forscher ihre Methode mit nur wenigen Funktionen von Mathematica verglichen haben – nämlich »integrate« für Integrale und »DSolve« für Differenzialgleichungen –, aber Mathematica-Nutzer können auf Hunderte von anderen Lösungswerkzeugen zugreifen.

Germundsson merkt auch an, dass der Trainingsdatensatz trotz seiner enormen Größe nur Gleichungen mit einer Variablen enthielt und nur solche, die auf elementaren Funktionen basierten. »Das ist bloß ein sehr kleiner Anteil möglicher Ausdrücke«, sagt er. Das neuronale Netz wurde nicht an jenen unübersichtlicheren Funktionen getestet, wie sie häufig in der Physik und im Finanzwesen verwendet werden, wie Fehlerfunktionen oder Bessel-Funktionen. Die Facebook-Forscher sagen, sie könnten das mit sehr einfachen Veränderungen in zukünftigen Versionen ermöglichen.

Und Frédéric Gibou, ein Mathematiker an der University of California in Santa Barbara, der untersucht hat, wie neuronale Netze zur Lösung partieller Differenzialgleichungen verwendet werden können, ist nicht davon überzeugt, dass das neuronale Netz der Facebook-Forscher in allen Fällen funktioniert. »Sie müssen sicher sein, dass es die ganze Zeit funktioniert, und nicht nur bei einigen ausgewählten Problemen«, sagt er, »und das ist hier nicht der Fall.« Andere Kritiker merken an, dass das neuronale Netz der Facebook-Gruppe die Mathematik nicht wirklich versteht; es ist eher ein außergewöhnlich guter Rater.

Das Netz rät – aber liegt es immer richtig?

Dennoch sind sie sich einig, dass der neue Ansatz sinnvoll ist. Germundsson und Gibou glauben, dass neuronale Netze in der nächsten Generation symbolischer Matheprogramme eine große Rolle spielen werden – neben vielen anderen.

Schließlich geht es nicht nur um die Lösung jenes speziellen Problems der symbolischen Mathematik. Die Arbeit der Facebook-Forscher ist ein ermutigender Beleg für das Potenzial eines solchen Ansatzes. »Mathematiker werden im Allgemeinen sehr beeindruckt sein, wenn diese Techniken es ihnen ermöglichen, Probleme zu lösen, die Menschen vorher nicht lösen konnten«, sagt Anders Hansen, Mathematiker an der University of Cambridge.

Ein solches neuronales Netz könnte möglicherweise auch automatisch neue Theoreme entwickeln. Mathematiker untersuchen zunehmend Möglichkeiten, KI zur Generierung neuer Beweise zu nutzen, obwohl »der Stand der Technik noch nicht sehr weit fortgeschritten ist«, sagt Lample. »Es ist etwas, das wir im Auge haben.«

KI als Assistent des Mathematikers

Charton fallen auf Anhieb mindestens zwei Möglichkeiten ein, wie ihr Ansatz das Finden von KI-Theoremen voranbringen könnte. Erstens könnte eine KI als eine Art Assistent des Mathematikers fungieren, die Hilfe bei bestehenden Problemen anbietet, indem sie Muster in bekannten Annahmen identifiziert. Zweitens könnte die Maschine eine Liste potenziell beweisbarer Ergebnisse erzeugen, die den Mathematikern entgangen sind. »Wir glauben, dass man, wenn man integrieren kann, auch Beweise erbringen kann«, sagt er.

Unterstützung für Beweise anzubieten, könnte letztendlich die entscheidende Anwendung sein, sogar über das hinaus, was das Facebook-Team beschrieben hat. Ein üblicher Weg, ein Theorem zu widerlegen, besteht nämlich darin, sich ein Gegenbeispiel auszudenken. Und das ist eine Aufgabe, für die diese Art von neuronalen Netzen eines Tages sehr gut geeignet sein könnte.

Ein weiteres ungelöstes Problem ist gleichzeitig einer der beunruhigendsten Aspekte neuronaler Netze: Niemand versteht wirklich, wie sie funktionieren. An einem Ende werden Trainingsbits eingespeist, und am anderen Ende kommen Vorhersagebits heraus. Aber was dazwischen passiert – der genaue Prozess –, bleibt eine entscheidende offene Frage.

»Indem wir spezifische mathematische Probleme als Test verwenden, können wir lernen, wie neuronale Netze funktionieren« (François Charton)

Die symbolische Mathematik hingegen ist entschieden weniger mysteriös. »Wir wissen, wie Mathematik funktioniert«, sagt Charton. »Indem wir spezifische mathematische Probleme als Test verwenden, um herauszufinden, wo Maschinen erfolgreich sind und wo sie versagen, können wir lernen, wie neuronale Netze funktionieren.«

Er und Lample wollen mathematische Ausdrücke in ihre Netzwerke einspeisen und beobachten, wie das Programm auf kleine Änderungen in den Ausdrücken reagiert. Wie Änderungen in der Eingabe zu Änderungen in der Ausgabe führen, könnte dazu beitragen, die Funktionsweise der neuronalen Netze zu verstehen.

Zaremba sieht diese Art des Verstehens als einen möglichen Schritt, neuronalen Netzen Vernunft beizubringen und die Antworten, die sie geben, tatsächlich zu verstehen. »In der Mathematik ist es einfach, die Nadel zu bewegen und zu sehen, wie gut [das neuronale Netz] funktioniert, wenn sich die Eingaben verändern. Vielleicht lernen wir wirklich, wie sie auf die Antworten kommen.«