Direkt zum Inhalt
Login erforderlich
Dieser Artikel ist Abonnenten von Spektrum der Wissenschaft frei zugänglich.

Informatik: Spielend Lernen

Die neuesten Versionen künstlicher Intelligenz wachsen ohne einprogrammiertes Vorwissen innerhalb weniger Stunden zu Weltklassespielern heran. Nun versuchen Forscher diese Systeme über das Spielbrett hinaus auf Probleme in Alltag und Wissenschaft anzuwenden – was nach wie vor knifflig ist.
Roboter spielt Schach

Als Maschinen erstmals die talentiertesten Meister übertrafen, mussten sie dazu noch von Menschen erlangtes Wissen nutzen. Beispielsweise hatten Ingenieure von IBM ihren Computer Deep Blue, der 1997 den ehemaligen Schachweltmeister Garri Kasparow schlug, zuvor mit jahrhundertelanger Schacherfahrung gespeist. Auch AlphaGo, das Googles Tochterunternehmen DeepMind entwickelt hat, verfügte über Millionen verschiedener Züge aus Zehntausenden von Menschen gespielten Go-Partien, als es den koreanischen Profi Lee Sedol besiegte.

Doch nun überdenken Informatiker die Art und Weise, wie Programme das vorhandene menschliche Wissen einsetzen sollen. Der aktuelle Trend lautet, es schlicht zu ignorieren.

Im Oktober 2017 veröffentlichte das DeepMind-Team ein neues Go-System, AlphaGo Zero, das überhaupt keine menschlichen Spiele mehr studierte. Stattdessen lernte es lediglich die Regeln und trat gegen sich selbst in den Kampf. Die ersten Züge des Bots erfolgten dabei völlig zufällig. Nach jedem Spiel lernte die Maschine aber, was einen Sieg begünstigt und was nicht. Am Ende des Trainings stieg AlphaGo Zero gegen seinen Vorläufer AlphaGo in den Ring. Die selbstlernende Maschine gewann das Turnier mit dem sensationellen Ergebnis von 100 zu 0.

Das Team entwickelte daraufhin AlphaGo Zero weiter, um erneut einen autodidaktischen Meisterspieler zu konstruieren, den sie der Einfachheit halber nur noch AlphaZero nannten. Und auch diese Version übertraf ihren Vorgänger – sie schlug den Bot, der den Bot schlug, der die besten Go-Spieler der Welt schlug. Anders als seine Vorgänger ist AlphaZero nicht nur auf Go spezialisiert. Als es die Regeln für Schach oder die japanische Schachvariante Shogi erhielt, besiegte das Programm innerhalb kürzester Zeit die dafür maßgeschneiderten Top-Level-Algorithmen. Experten staunten über den aggressiven und ungewöhnlichen Stil des Programms. »Ich habe mich immer gefragt, wie es wäre, wenn eine überlegene Spezies auf die Erde käme und uns zeigen würde, wie sie Schach spielt«, sagte der dänische Großmeister Peter Heine Nielsen in einem BBC-Interview. »Jetzt weiß ich es.« …

November 2018

Dieser Artikel ist enthalten in Spektrum der Wissenschaft November 2018

Kennen Sie schon …

45/2018

Spektrum - Die Woche – 45/2018

In dieser Ausgabe widmen wir uns Flüssen, der Teilchenphysik und den Pflanzen.

Künstliche Intelligenz - Wie Maschinen lernen lernen

Spektrum Kompakt – Künstliche Intelligenz - Wie Maschinen lernen lernen

Es ist schon lange keine Sciencefiction mehr: Maschinen lernen, teils komplett auf sich selbst gestellt, Dinge oder Prozesse, die bislang nur Menschen beherrschten. Doch wie funktioniert das? Was steckt hinter Begriffen wie maschinelles Lernen, deep learning und neuronale Netze?

Spezial Physik - Mathematik - Technik 3/2018

Spektrum der Wissenschaft – Spezial Physik - Mathematik - Technik 3/2018: Technik für morgen

Elektromobilität • Künstliche Intelligenz • Bitcoin • Autonomes Fahren • Quantencomputer • Blockchain • Neuronale Netze

Lesermeinung

Beitrag schreiben

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Leserzuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Leserzuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmer sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Lesermeinungen können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

  • Quellen

Byron, S.: Carnegie Mellon Artificial Intelligence Beats Top Poker Pros. In: CMU/News, 2017

Mnih, V. et al.: Playing Atari with Deep Reinforcement Learning. In: ArXiv 1312.5602, 2013

Silver, D. et al.: Mastering the Game of Go without Human Knowledge. In: Nature 550, S. 354-359, 2017

Silver, D. et al.: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm. In: ArXiv 1712.01815, 2017