Direkt zum Inhalt
Login erforderlich
Dieser Artikel ist Abonnenten mit Zugriffsrechten für diese Ausgabe frei zugänglich.

Informatik: Spielend Lernen

Die neuesten Versionen künstlicher Intelligenz wachsen ohne einprogrammiertes Vorwissen innerhalb weniger Stunden zu Weltklassespielern heran. Nun versuchen Forscher diese Systeme über das Spielbrett hinaus auf Probleme in Alltag und Wissenschaft anzuwenden – was nach wie vor knifflig ist.
Roboter spielt Schach

Als Maschinen erstmals die talentiertesten Meister übertrafen, mussten sie dazu noch von Menschen erlangtes Wissen nutzen. Beispielsweise hatten Ingenieure von IBM ihren Computer Deep Blue, der 1997 den ehemaligen Schachweltmeister Garri Kasparow schlug, zuvor mit jahrhundertelanger Schacherfahrung gespeist. Auch AlphaGo, das Googles Tochterunternehmen DeepMind entwickelt hat, verfügte über Millionen verschiedener Züge aus Zehntausenden von Menschen gespielten Go-Partien, als es den koreanischen Profi Lee Sedol besiegte.

Doch nun überdenken Informatiker die Art und Weise, wie Programme das vorhandene menschliche Wissen einsetzen sollen. Der aktuelle Trend lautet, es schlicht zu ignorieren.

Im Oktober 2017 veröffentlichte das DeepMind-Team ein neues Go-System, AlphaGo Zero, das überhaupt keine menschlichen Spiele mehr studierte. Stattdessen lernte es lediglich die Regeln und trat gegen sich selbst in den Kampf. Die ersten Züge des Bots erfolgten dabei völlig zufällig. Nach jedem Spiel lernte die Maschine aber, was einen Sieg begünstigt und was nicht. Am Ende des Trainings stieg AlphaGo Zero gegen seinen Vorläufer AlphaGo in den Ring. Die selbstlernende Maschine gewann das Turnier mit dem sensationellen Ergebnis von 100 zu 0.

Das Team entwickelte daraufhin AlphaGo Zero weiter, um erneut einen autodidaktischen Meisterspieler zu konstruieren, den sie der Einfachheit halber nur noch AlphaZero nannten. Und auch diese Version übertraf ihren Vorgänger – sie schlug den Bot, der den Bot schlug, der die besten Go-Spieler der Welt schlug. Anders als seine Vorgänger ist AlphaZero nicht nur auf Go spezialisiert. Als es die Regeln für Schach oder die japanische Schachvariante Shogi erhielt, besiegte das Programm innerhalb kürzester Zeit die dafür maßgeschneiderten Top-Level-Algorithmen. Experten staunten über den aggressiven und ungewöhnlichen Stil des Programms. »Ich habe mich immer gefragt, wie es wäre, wenn eine überlegene Spezies auf die Erde käme und uns zeigen würde, wie sie Schach spielt«, sagte der dänische Großmeister Peter Heine Nielsen in einem BBC-Interview. »Jetzt weiß ich es.« ...

Kennen Sie schon …

Spektrum Kompakt – Quantencomputer - Neue Erkenntnisse und Verfahren

Diskutiert und selten gesehen: der Quantencomputer verspricht Fortschritt von Technik bis Medizin - doch stecken seine Berechnungen noch in den Kinderschuhen. Wie funktionieren die futuristischen Rechner und weshalb genügt der heimische PC ihren Zwecken teilweise nicht?

Spektrum - Die Woche – Wo Bäume mehr schaden als nützen

Drei Milliarden neue Bäume in der EU, zehn Milliarden in den USA, 70 Milliarden in China. Doch die ambitionierten Ziele für Aufforstungen könnten lokale Ökosysteme und Tierbestände gefährden. Außerdem in der aktuellen »Woche«: wieso der Hype um ultradünne Halbleitermaterialien berechtigt ist.

Spektrum der Wissenschaft – Das Geheimnis der Dunklen Energie

Seit ihrer Entdeckung ist der Ursprung der Dunklen Energie rätselhaft. Neue Teleskope und Theorien sollen Antworten geben. Außerdem: Mit DNA-Spuren aus Luft oder Wasser lässt sich die Verbreitung verschiedenster Arten störungsfrei erfassen. Lassen sich riesigen Süßwasservorkommen, die unter mancherorts unter dem Meeresboden liegen, als Reserven nutzen? RNA-Ringe sind deutlich stabiler als lineare RNA-Moleküle und punkten daher als Arzneimittel der nächsten Generation. Ein Mathematiker ergründete auf Vanuatu, wie die Sandzeichnungen der Bewohner mit mathematischen Graphen zusammenhängen.

Schreiben Sie uns!

Beitrag schreiben

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Zuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Zuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmende sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Zuschriften können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

  • Quellen

Byron, S.: Carnegie Mellon Artificial Intelligence Beats Top Poker Pros. In: CMU/News, 2017

Mnih, V. et al.: Playing Atari with Deep Reinforcement Learning. In: ArXiv 1312.5602, 2013

Silver, D. et al.: Mastering the Game of Go without Human Knowledge. In: Nature 550, S. 354-359, 2017

Silver, D. et al.: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm. In: ArXiv 1712.01815, 2017

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.