Informatik: Spielend Lernen

Dieser Artikel ist Abonnenten mit Zugriffsrechten für diese Ausgabe frei zugänglich.

Informatik: Spielend Lernen

Die neuesten Versionen künstlicher Intelligenz wachsen ohne einprogrammiertes Vorwissen innerhalb weniger Stunden zu Weltklassespielern heran. Nun versuchen Forscher diese Systeme über das Spielbrett hinaus auf Probleme in Alltag und Wissenschaft anzuwenden – was nach wie vor knifflig ist.

Joshua Sokol

Roboter spielt Schach — © LightFieldStudios / Getty Images / iStock (Ausschnitt)

Als Maschinen erstmals die talentiertesten Meister übertrafen, mussten sie dazu noch von Menschen erlangtes Wissen nutzen. Beispielsweise hatten Ingenieure von IBM ihren Computer Deep Blue, der 1997 den ehemaligen Schachweltmeister Garri Kasparow schlug, zuvor mit jahrhundertelanger Schacherfahrung gespeist. Auch AlphaGo, das Googles Tochterunternehmen DeepMind entwickelt hat, verfügte über Millionen verschiedener Züge aus Zehntausenden von Menschen gespielten Go-Partien, als es den koreanischen Profi Lee Sedol besiegte.

Doch nun überdenken Informatiker die Art und Weise, wie Programme das vorhandene menschliche Wissen einsetzen sollen. Der aktuelle Trend lautet, es schlicht zu ignorieren.

Im Oktober 2017 veröffentlichte das DeepMind-Team ein neues Go-System, AlphaGo Zero, das überhaupt keine menschlichen Spiele mehr studierte. Stattdessen lernte es lediglich die Regeln und trat gegen sich selbst in den Kampf. Die ersten Züge des Bots erfolgten dabei völlig zufällig. Nach jedem Spiel lernte die Maschine aber, was einen Sieg begünstigt und was nicht. Am Ende des Trainings stieg AlphaGo Zero gegen seinen Vorläufer AlphaGo in den Ring. Die selbstlernende Maschine gewann das Turnier mit dem sensationellen Ergebnis von 100 zu 0.

Das Team entwickelte daraufhin AlphaGo Zero weiter, um erneut einen autodidaktischen Meisterspieler zu konstruieren, den sie der Einfachheit halber nur noch AlphaZero nannten. Und auch diese Version übertraf ihren Vorgänger – sie schlug den Bot, der den Bot schlug, der die besten Go-Spieler der Welt schlug. Anders als seine Vorgänger ist AlphaZero nicht nur auf Go spezialisiert. Als es die Regeln für Schach oder die japanische Schachvariante Shogi erhielt, besiegte das Programm innerhalb kürzester Zeit die dafür maßgeschneiderten Top-Level-Algorithmen. Experten staunten über den aggressiven und ungewöhnlichen Stil des Programms. »Ich habe mich immer gefragt, wie es wäre, wenn eine überlegene Spezies auf die Erde käme und uns zeigen würde, wie sie Schach spielt«, sagte der dänische Großmeister Peter Heine Nielsen in einem BBC-Interview. »Jetzt weiß ich es.« ...

Download (Abo)

Kennen Sie schon …

Spektrum Kompakt – KI-Sprachmodelle

Mit ChatGPT, Claude oder Gemini lässt es sich gut reden: Sie wirken menschlich und scheinen uns zu verstehen. Manche Menschen bauen sogar eine romantische Beziehung zum Chatbot auf. Doch die ständige Bestätigung macht uns auch anfällig für Manipulation und kann sogar wahnhaftes Denken verursachen.

Spektrum MINT – Photovoltaik der Zukunft

Solarstrom erobert Balkone, Dächer und die Welt. Doch während Photovoltaik immer günstiger wird und für mehr Unabhängigkeit sorgt, warnt die Forschung. Für ein nachhaltiges Wachstum muss schon heute an eventuelle Ressourcenprobleme, neue Materialien und Recycling gedacht werden.

Spektrum der Wissenschaft – Wird KI uns überflügeln?

Künstliche Intelligenz ist bereits in vielen Bereichen im Einsatz und kann dabei viel Gutes bewirken. Ihre rasante Entwicklung schürt jedoch auch Ängste. Im Interview erläutert die Sozioinformatikerin Katharina Zweig die Grenzen der Technologie – und erklärt, warum KI den Menschen nicht ersetzt. Mit diesem Beitrag starten wir die Serie »Intelligenz aus zwei Welten«, die sich den facettenreichen Aspekten künstlicher Intelligenz widmet. Darüber hinaus enthält diese Ausgabe Beiträge zu mRNA-basierten Krebsimpfstoffen, die gegenwärtig in die klinische Anwendung kommen, zu Georg Cantors bedeutendstem mathematischen Werk, das sich als Plagiat erwiesen hat, sowie zu den Bemühungen des Artenschutzes um die letzten Orcas der Salish Sea.

Quellen
Links im Netz

Byron, S.: Carnegie Mellon Artificial Intelligence Beats Top Poker Pros. In: CMU/News, 2017

Mnih, V. et al.: Playing Atari with Deep Reinforcement Learning. In: ArXiv 1312.5602, 2013

Silver, D. et al.: Mastering the Game of Go without Human Knowledge. In: Nature 550, S. 354-359, 2017

Silver, D. et al.: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm. In: ArXiv 1712.01815, 2017

DeepMind (Kooperation von DeepMind und Blizzard Entertainment)
Vice (Microsoft Chatbot)
DeepMind (Verstärkendes Lernen)
OpenAI (Dota-2 Bot von OpenAI)
OpenAI (Verstärkendes Lernen und OpenAI)
STAT (IBM Watson in der Krebsforschung)
Folding@Home (Proteine Falten )
Foldit (Proteine falten als Spiel)

Schreiben Sie uns!

Beitrag schreiben

Beitrag darf veröffentlicht werden

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Zuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Zuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmende sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Zuschriften können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

Artikel zum Thema

Künstliche Intelligenz: AlphaGo – Computer lernen Intuition

Wie eine künstliche Intelligenz den Weltmeister im Go-Spiel besiegte - eine Errungenschaft mit weit reichenden Konsequenzen.