Aus Russells Sicht wird die heutige zielorientierte KI irgendwann an ihre Grenzen stoßen – trotz aller Erfolge bei Spezialaufgaben, sei es Jeopardy!, Go oder die Verarbeitung von Bildern, Sprache oder Tönen. Egal, worum es im Einzelfall gehe, argumentiert der Berkeley-Forscher, sobald sich eine Maschine an einer vorgegebenen Beschreibung ihrer Ziele orientieren müsse, erhalte man über kurz oder lang eine fehlgeleitete KI. Denn es sei unmöglich, alle Ziele, Unterziele, Ausnahmen und Vorbehalte in diese so genannte Belohnungsfunktion einzupreisen oder auch nur zu wissen, was die richtigen sind. Einem autonomen Roboter konkrete Ziele vorzugeben, bringe uns unweigerlich in Schwierigkeiten, und zwar in umso größere, je intelligenter er ist. Ganz einfach, weil Roboter ihre Belohnungsfunktion rücksichtslos verfolgen. Im Zweifel, indem sie uns daran hindern, sie daran zu hindern.

Russells drei neue Robotergesetze

Kernpunkt des neuen Ansatzes ist folgende Überlegung: Statt Maschinen ihre eigenen Ziele verfolgen zu lassen, sollten sie ausschließlich das Ziel haben, mehr über die Wünsche der Menschen herauszufinden und diese zu befriedigen. Dass die Maschinen nie mit 100-prozentiger Gewissheit sagen können, was ihre Erbauer eigentlich wollen, nehme ihnen auf Dauer ihre Gefährlichkeit, davon ist Russell überzeugt. In seinem kürzlich erschienenen Buch »Human Compatible« legt Russell seine These in Form von drei »Prinzipien nützlicher Maschinen« dar. Er greift dazu die drei Gesetze der Robotik von Isaac Asimov aus dem Jahr 1942 wieder auf, allerdings mit weniger Naivität als der Sciencefiction-Autor. In Russells Version heißt es:

Das einzige Ziel der Maschine ist es, menschliche Präferenzen so gut wie möglich in die Tat umzusetzen. Die Maschine weiß zu Beginn nicht, was diese Präferenzen sind. Die ultimative Informationsquelle über diese Präferenzen ist das Verhalten der Menschen.

Im Verlauf der vergangenen Jahre haben Russell und sein Team in Berkeley sowie Gleichgesinnte in Stanford, Texas und dem Rest der Welt innovative Verfahren entwickelt, mit denen man dem Computer vermitteln kann, was wir von ihm wollen, ohne ihm alles auszubuchstabieren – und manchmal sogar, ohne dass wir es selbst wissen müssten.

In diesen Labors lernen Roboter, indem sie beispielsweise Menschen bei einer Tätigkeit zuschauen. Dazu müssen diese Demonstrationen nicht einmal perfekt sein. Der Computer lernt trotzdem. Mitunter erfindet die KI sogar gänzlich neue Verhaltensweisen. So haben die selbstfahrenden Autos einer der Forschungsgruppen an unbeschilderten Kreuzungen die Gewohnheit entwickelt, ein Stück zurückzufahren, um anderen Autofahrern zu signalisieren, dass sie ihnen die Vorfahrt lassen. Solche Ergebnisse legen nahe, dass die KI überraschend gut darin sein kann, unsere Denkweisen und Präferenzen abzuleiten, sogar wenn wir selbst nur eine vage Vorstellung davon haben.