Altruismus mit Kündigungsmöglichkeit

Das iterierte Gefangenendilemma zeigt eine unerwartet große Vielfalt von Phänomenen, wenn man neue Varianten einführt und gezielt nach dem Chaos sucht.

Jean-Paul Delahaye und Philippe Mathieu

Sei nett, reaktionsfreudig, nicht nachtragend und vor allem einfach. Dann wird es dir und deinen Kindern und Kindeskindern wohlergehen ... ...nein, nicht auf Erden. Die Menschen und ihre Beziehungen sind viel zu kompliziert, als daß ein so einfaches Rezept allgemeingültig sein könnte. Es geht um künstliche Akteure in einer aufs äußerste vereinfachten Umwelt. Das ganze Leben spielt sich in einem Computer ab.

Jeder Akteur begegnet jedem anderen, bei welcher Gelegenheit er ihn gut oder schlecht behandeln kann. Der Betroffene merkt das erst hinterher; aber er kann seinen Partner wiedererkennen und sich bei der nächsten Begegnung gemäß den bisherigen Erfahrungen verhalten.

Wenn beide einander gut behandeln, zieht jeder aus der Begegnung einen Gewinn von drei Punkten. Kooperieren ist gut, erfolgreich Betrügen ist besser: Wer den anderen schlecht behandelt, selbst aber gut behandelt wird, streicht fünf Punkte ein, während der andere leer ausgeht. Wenn allerdings beide einander schlecht behandeln, ernten sie nur je einen Punkt.

Das sind die Regeln eines Spiels, das unter dem Namen "Gefangenendilemma" intensiv erforscht wurde. Die Bezeichnung spielt auf eine ziemlich exotische Situation an (und verschleiert dadurch die Realitätsnähe des Spiels): Zwei Kriminelle sind festgenommen worden und müssen sich, ohne sich verständigen zu können, überlegen, ob sie das gemeinsam begangene Verbrechen verschweigen (kooperieren) oder – mit der Aussicht auf Strafmilderung – gestehen (einander betrügen) sollen. Die Punkte werden vom Richter vergeben und bedeuten Jahre in Freiheit, abzuziehen von den fünf Jahren Gefängnis, die sie eigentlich beide verdient haben.

Die Situation ist so konstruiert, daß das Dilemma möglichst rein zutage tritt. Beide Spieler können sich überlegen: Einerlei, was der andere tut, Betrügen ist für mich vorteilhafter. Also betrügen beide, um ihren eigenen Nutzen zu maximieren – und erreichen dadurch das genaue Gegenteil, denn jedem bleibt nur ein Punkt, während er bei beiderseitiger Kooperation drei hätte haben können.

Soweit das Dilemma. Man betrachtet es im Rahmen der Spieltheorie; Kooperieren und Betrügen sind unpassende – aber eingebürgerte – Bezeichnungen für Handlungsweisen, hinter denen man sich nichts weiter vorstellen muß als ihre Folgen in Form von mehr oder weniger Punkten. Absichten, Berechnung, Vertrauen, Gaunerehre – all dies bleibt ausgeblendet. In der strengen Form ist das Dilemma schlicht unlösbar, und wesentlich mehr gibt es dazu nicht zu sagen.

Anders ist es, wenn man nicht nur einmal im Leben, sondern immer wieder in eine solche Situation gerät; dann heißt das Spiel "iteriertes Gefangenendilemma". Ihr neuer Nachbar beschallt seine (und Ihre) Wohnung nach 22 Uhr mit Hard Rock. Daraufhin drehen Sie Ihre Stereoanlage auch auf, aber mit Ihren Lieblings-Opern. Weil ihm Sopranarien so zuwider sind wie Ihnen die stampfenden Bässe, läßt er am nächsten Abend wieder seine Rockmusik dröhnen, und Sie fühlen sich dadurch gezwungen, abermals mit Opern gegenzuhalten.

Die Situation ist nicht hoffnungslos, denn abgesehen von der Musikrichtung haben Sie beide durchaus ähnliche Interessen. Am schönsten (fünf Punkte) ist es, wenn man seine Lieblingsmusik ungestört mit voller Lautstärke genießen kann. Das zweifelhafte Vergnügen, eigene mit fremder Musik untermischt zu hören, wäre mit einem Punkt zu bewerten und die Qual, nichts als den Lärm des anderen zu vernehmen, mit null Punkten. Aber Sie beide können einem ruhigen Abend durchaus etwas abgewinnen: drei Punkte auf einer gedachten Vergnügensskala. Es müßte halt nur einer von Ihnen anfangen mit Stillhalten und hoffen, daß der andere das honoriert; denn aus irgendwelchen Gründen spricht man nicht miteinander. Die einzige Kommunikation besteht über das bisherige Verhalten.

Es gibt zahlreiche weitere Beispiele. Sollen zwei Nachbarländer Zölle auf die Produkte des jeweils anderen erheben? Sollen zwei Firmen, die dasselbe Produkt herstellen, sich den Markt durch Absprachen aufteilen oder einander bis zum eigenen Ruin unterbieten? Sollen zwei Tierarten auf demselben Territorium friedlich nebeneinander leben oder sich die knappen Ressourcen streitig machen? Das Dilemma ist von so allgemeiner Bedeutung, weil es selbst dann fortbesteht, wenn die Rollen der beiden Beteiligten unsymmetrisch oder ihre Profite nicht vergleichbar sind. Es kommt nur darauf an, daß der Gewinn aus erfolgreichem Betrügen höher ist als der Lohn der Kooperation (aber nicht mehr als doppelt so hoch), daß beiderseitiges Betrügen weniger einbringt als Kooperieren und Sich-Betrügen-Lassen noch weniger.

Die Akteure müssen auch nicht besonders denkfähig sein. Es genügt, wenn sie einer Strategie in einem sehr abstrakten Sinne folgen: einer Handlungsanweisung, die aus der Vergangenheit (und möglicherweise mit Hilfe des Zufalls) bestimmt, ob der Akteur kooperieren oder betrügen soll. Das kann auch ein Computerprogramm sein. Beide Partner treffen ihre Entscheidung für den aktuellen Spielzug gleichzeitig und ohne Verständigung; es handelt sich um ein Spiel mit einer großen, aber den Beteiligten unbekannten Anzahl von Zügen (sonst ergäben sich neue Paradoxien, vergleiche Spektrum der Wissenschaft, Februar 1991, Seite 19). Bild 1 zeigt eine Auswahl von zwölf unter unendlich vielen denkbaren Strategien.

Gibt es eine optimale Strategie? Es kommt darauf an, was man darunter versteht. Wenn es eine sein soll, die keinem Gegner in der direkten Konfrontation unterlegen ist, dann ist die Antwort ja: BÖSE (stets betrügen) gewinnt (oder verliert zumindest nicht) jedes Spiel. Aber um welchen Preis! Verglichen mit den anderen Strategien, erzielt sie ziemlich klägliche Punktzahlen (Tabelle in Bild 1).

Gibt es eine optimale Strategie in dem Sinne, daß sie gegen jede andere das bestmögliche Ergebnis erzielt? Nein. Sie müßte im ersten Zug (wenn sie noch nichts über ihren Gegner weiß) betrügen, sonst geriete sie gegenüber BÖSE in einen nicht aufholbaren Rückstand. Mit dieser Wahl fährt sie jedoch gegen GRIMMIG schlecht, viel schlechter als die naive Strategie LIEB, denn GRIMMIG vergibt nie.

Jede Strategie ist unvermeidlich stark gegen eine andere und schwach gegen eine dritte. Es gibt sogar drei Strategien mit der Eigenschaft A schlägt B, B schlägt C und C schlägt A: PERIODISCH ZIEMLICH BÖSE, PERIODISCH ZIEMLICH LIEB und MEHRHEITSENTSCHEID MILD. Solche Ringe aus Strategien, die jede ihrer linken Nachbarin über- und der rechten unterlegen sind, findet man nicht nur für drei, sondern für beliebige Anzahlen von Strategien.

Es gibt zwar keine beste Strategie, aber deswegen sind sie noch lange nicht alle gleich gut. Manche sind offensichtlich zu lieb, manche zu nachtragend, andere zu wenig empfindsam und so weiter. Nur kommt es entscheidend auf die Umwelt an, in der eine Strategie sich zu bewähren hat (Bild 2). In einem vielbeachteten Computerexperiment hat der Politologe Robert Axelrod von der Universität von Michigan in Ann Arbor Anfang der achtziger Jahre ein Turnier unter vielen Programmen veranstaltet, die von Kollegen eingereicht worden waren (Spektrum der Wissenschaft, August 1983, Seite 8). Als eindeutiger Sieger ging daraus die einfache Strategie TIT FOR TAT ("Wie du mir, so ich dir") hervor, die von dem Psychologen Anatol Rapoport aus Toronto stammte: Kooperiere beim ersten Mal und tue dann genau das, was der Gegner beim letzten Mal getan hat. Unsere eigenen Rechnungen mit den zwölf Beispielprogrammen haben das bestätigt (Bilder 1 und 2). Eine genauere Analyse ergibt:

- Es ist besser, nett zu sein als böse. Dabei nennen wir jetzt und im folgenden eine Strategie böse, wenn sie die Initiative beim Betrügen ergreift. Es zahlt sich auf die Dauer mehr aus, das Risiko der Kooperation einzugehen, als das Vertrauen des anderen auszunutzen.

- Man muß reaktiv sein. Wer einen Betrugsakt seines Partners ignoriert, ermuntert ihn nur, es noch einmal zu versuchen.

- Man muß rasch vergeben. Wer wie GRIMMIG den ersten Fehltritt ewig nachträgt, vergibt sich viele Chancen zu gedeihlicher Kooperation.

- List und Tücke bringen nichts. Eine stabile, beiderseits einträgliche Beziehung etabliert sich am ehesten durch klares, berechenbares Verhalten.

Weitere Analysen zeigen, daß sich nichts Wesentliches ändert, wenn man die Zahl der Züge oder die Höhe des Lohns für kooperatives oder betrügerisches Verhalten variiert – solange die Rangfolge der Punktwerte gewahrt bleibt und erfolgreiches Betrügen nicht mehr als doppelt so viel einbringt wie erfolgreiche Kooperation.

Kündigen

Ende 1992 haben wir ein ähnliches Turnier wie Axelrod ausgeschrieben, allerdings mit Regeln, die das Ganze noch etwas realitätsnäher machen sollen: Wenn ich mit meinem Einbrecherkomplizen, meinem lärmenden Nachbarn, meinem Lieferanten oder meinem Chef auf die Dauer auf keinen grünen Zweig komme, werde ich mich von ihm trennen. Das kostet mich große Mühe, ist aber immer noch besser, als unablässig seinen Betrugsattacken ausgesetzt zu sein. Entsprechend haben unsere Strategien in jedem Zug außer der Wahl zwischen Kooperieren und Betrügen die Option, die Beziehung überhaupt aufzukündigen. Man spielt nicht mehr miteinander. Das bringt in der Zukunft beiden Beteiligten zwei Punkte pro Spielzug: weniger als Kooperieren, mehr als beiderseitiges Betrügen und immer noch weniger als abwechselnd erfolgreich zu betrügen und sich betrügen zu lassen, denn das bringt im Mittel zweieinhalb Punkte pro Zug. Der Anreiz zu kündigen ist also nicht gerade übermächtig.

Eine einmal ausgesprochene Kündigung ist unwiderruflich. Wenn im Verlauf eines Spiels einer der Partner kündigt, bekommt jeder von ihnen für jeden noch nicht ausgeführten Zug zwei Punkte gutgeschrieben, und das Spiel ist aus.

Eine Strategie für das ursprüngliche Spiel ist auch eine für die erweiterte Fassung – man muß die Kündigungsmöglichkeit ja nicht nutzen. Drei Varianten, die das tun, lohnt es näher zu betrachten:

- BRUTAL. Ich betrüge, solange mein Partner kooperiert. Sobald er betrügt, kündige ich.

- VIERMAL PROBIEREN. Die ersten vier Züge spiele ich Kooperieren, Kooperieren, Betrügen, Betrügen. Wenn in diesen vier Zügen der Gegner drei- oder viermal betrogen hat, kündige ich; sonst kooperiere ich fortan bedingungslos.

- TIT FOR TAT MIT SCHMERZGRENZE. Ich spiele TIT FOR TAT; aber alle fünf Züge zähle ich meine Punkte zusammen, und wenn das bisherige Spiel weniger als zwei Punkte pro Zug eingebracht hat, kündige ich.

Wenn man diese drei Strategien 1000 Züge gegeneinander spielen läßt (Bild 3), bestätigen sich die Ergebnisse aus der klassischen Version des Spiels: Die Variante von TIT FOR TAT rangiert an der Spitze mit 7994 Punkten, dicht gefolgt (mit 7988 Punkten) von der Abmilderung der Strategie PROBIEREN; weit abgeschlagen landet mit 6006 Punkten BRUTAL, die Verschärfung von BÖSE.

Damit liegt BRUTAL nur sehr geringfügig über der Eremitenstrategie: Kündigen im ersten Zug. Die sammelt in jedem Spiel sichere 2000 Punkte ein – aber wie langweilig ist solch ein Leben!

Auf unsere Ausschreibung gingen 95 programmierte oder in Worten beschriebene Strategien ein, dazu neun, die unvollständig beschrieben waren oder die wir trotz aller Mühe nicht verstanden haben. Wir haben jede gegen jede (einschließlich sich selbst) 1000 Züge spielen lassen und die Ergebnisse ausgezählt.

Etliche Leser vertraten die Ansicht, die neue Option werde insgesamt ihrem Anwender nichts einbringen; also würden die Programme, die sie nicht nutzen, die ersten Plätze belegen, und das Turnier werde auf eine Neuauflage des klassischen von Axelrod hinauslaufen. Diese Vermutung hat sich nicht bestätigt. Gegen einen Partner, der stets betrügt, ist Kündigen zweifellos nützlich. Wer sich früh aus einer Beziehung zurückzieht, in der beide nur aufeinander herumhacken, steht hinterher um fast 1000 Punkte besser da. Tatsächlich wurde TIT FOR TAT MIT SCHMERZGRENZE Sieger in einem Turnier gegen die zwölf eingangs genannten Strategien, und in dem großen Turnier der 95 Programme landete das beste unter denen, die auf die Kündigungsmöglichkeit verzichten, nur auf Platz 16.

Manchen mißfiel auch die Unwiderruflichkeit der Kündigung. Zweifellos ist diese Regel vereinfachend, aber dadurch wird das Spiel erst interessant. Wenn ein Widerruf zugelassen wird, hat man in jedem Zug – auch nach einer Kündigung – drei Optionen. Warum nicht vier oder noch mehr? Die Erfahrung zeigt, daß bei Spielen mit zu vielen Möglichkeiten wenig Erhellendes herauskommt. Wir haben die neue Option mit Bedacht anders als die anderen gewählt. Es sollte eine leichte Verallgemeinerung werden, so daß die Grundstruktur des Spiels gewahrt bliebe, sich aber gleichwohl Interessantes ergäbe – eine Erwartung, die sich bestätigt hat.

Zahlreiche Leser haben sich Gedanken zur Psychologie des Spiels gemacht. Man sollte sich überlegen, welche Strategien die anderen einsenden, denn die sind es ja, gegen welche die eigene bestehen muß, und mit Blick darauf sein eigenes Programm schreiben. Das ist zwar einleuchtend, nur hat sich herausgestellt, daß die bestplazierten Programm robust sind: Sie schlagen sich gut auch in einer veränderten Umwelt. Entgegen dem Anschein ist das Spiel also eher logischer als psychologischer Natur.

Allzuviel Psychologie kann sogar arg in die Irre führen. Viele haben sich etwa folgendes gedacht: "In der Ausschreibung stand bereits, es sei besser, nett zu sein als böse. Also werden viele Konkurrenten nette Programme einsenden, folglich schreibe ich ein eher böses, um die vielen netten auszunehmen." Weit gefehlt! Erstens haben viele Einsender diesen Gedanken gehabt, mit der Folge, daß mehr als ein Drittel der Programme böse war. Zweitens gilt nach wie vor, daß Bosheit sich nicht auszahlt: Mit einer Ausnahme landeten die bösen Programme in der unteren Hälfte der Rangliste.

Manche Leser haben Theorien eingesandt, zum Teil mit seitenlangen Erklärungen voller Berechnungen und Tabellen, um zu beweisen, daß ihre Strategie die beste sei. Bei der Auswertung der Ergebnisse ergab sich als allgemeiner Trend: Je länger die Theorie, desto schlechter das Abschneiden. Ein häufiger Fehler war der Einbau von Annahmen aus der Wahrscheinlichkeitstheorie. Die sind hier fehl am Platze, denn es gibt keinen Grund anzunehmen, die Handlungen des Gegners folgten einem Wahrscheinlichkeitsgesetz, etwa daß er im Durchschnitt in jedem zweiten Zug kooperiere. Mit gesundem Menschenverstand kommt man offenbar weiter als mit raffinierten Überlegungen und Anleihen bei anderen Quellen.

Die Strategie eines Lesers, dessen Theorie wir nicht kennen, verwendet die Zahl des Goldenen Schnitts: Platz 14. Ein Einsender begründete die Strategie "Stets kooperieren" mit einem Bibelzitat: Platz 65. Ein dritter schlug eine Strategie namens "Jesus" vor: Ich kooperiere stets; wenn ich einmal betrogen werde, kooperiere ich immer noch – ich halte die andere Backe hin; erst beim zweiten Betrug kündige ich. Platz 48.

Ungefähr zehn Strategien schienen es darauf anzulegen, daß der Gegner kündigt, indem sie in den ersten Zügen mehrfach betrogen. Sie landeten sämtlich auf den letzten Plätzen. Das war auch vorherzusehen, denn wer am Anfang mehrfach betrügt, ruiniert jede Chance zum Aufbau eines stabilen Vertrauensverhältnisses. Nur in einer Umgebung von gutmütigen Trotteln kann eine solche Strategie Erfolg haben.

Wir haben uns sogar gefragt, ob da mehrere Einsender auf raffinierte Weise konspiriert haben, indem diese kaum nachvollziehbaren Strategien eine andere begünstigen und ihr dadurch zum Sieg verhelfen. Zumindest dafür hat es nicht gereicht: Der Sieger bleibt Sieger, selbst wenn man diese suspekten Programme vom Turnier ausschließt.

Wir glauben auch nicht, daß jemand gemogelt hat. Aber die theoretische Möglichkeit besteht: Wir haben versuchsweise den 95 Turnierteilnehmern eine Strategie namens MEISTER hinzugefügt sowie neun Exemplare einer Strategie SKLAVE, deren Zweck darin besteht, den Meister zu begünstigen und alle anderen durch frühes Betrügen zu verekeln.

MEISTER: Ich spiele TIT FOR TAT, es sei denn, der Gegner spielt nacheinander einmal Kooperieren, fünfzigmal Betrügen und einmal Kooperieren. In diesem Falle schalte ich auf bedingungsloses Betrügen.

SKLAVE: Ich spiele der Reihe nach einmal Kooperieren, fünfzigmal Betrügen und dann nur noch Kooperieren.

Die meisten Strategien kündigen vor dem fünfzigsten Zug die Beziehung zu SKLAVE auf und verschaffen damit sich und dem Sklaven annähernd die 2000 Eremitenpunkte. Der Meister aber erkennt gewissermaßen den Sklaven an seinem Verhaltensmuster und verschafft sich dadurch 3+0+49?1+949?5=4797 Punkte – genug Vorsprung, um das ganze Turnier zu gewinnen, während die sich aufopfernden Sklaven auf Platz 92 von 105 landen. Dabei ist die Strategie MEISTER an sich nicht besonders intelligent – sie kündigt zum Beispiel nie. Ohne ihre Sklaven würde sie lediglich Platz 50 erreichen.

Die drei Sieger

Nun zu den Gewinnern des Turniers. Wir beschreiben die drei Bestplazierten, denn sie liegen im Ergebnis dicht beieinander und enthalten interessante Ideen.

- DIE ERSTE: Ich kooperiere im ersten Zug und solange der andere kooperiert. Alle 20 Züge bestimme ich meine Gesamtpunktzahl und kündige, wenn mein Durchschnittsgewinn pro Zug unter 1,5 liegt. Wenn mein Gegner betrügt, eröffne ich eine Vergeltungsserie; wenn ich mich schon in einer solchen befinde, eröffne ich keine neue. Die erste Vergeltungsserie besteht aus einmal Betrügen plus zweimal Kooperieren, einerlei, was der andere tut. Jede folgende Vergeltungsserie ist länger als die vorige; die nte besteht aus n(n+1)/2 mal Betrügen und zweimal Kooperieren.

Diese Strategie vereinigt mehrere elementare Prinzipien: Sie ist nett, denn sie betrügt nie als erste. Sie kündigt, wenn sie zu schlechte Geschäfte macht. Sie ist reaktiv ähnlich wie TIT FOR TAT, denn sie übt Vergeltung, wenn sie aus heiterem Himmel betrogen wird. Sie wird zunehmend strenger gegen vorbestrafte Rückfalltäter, denn sie vergilt den ersten Betrug mit einmal Betrügen, den zweiten mit dreimal, den dritten mit sechsmal und so weiter. Nach einer Vergeltungsserie versucht sie den Übeltäter zu resozialisieren, indem sie Vertrauensvorschuß gewährt (zweimal kooperiert). Und sie ist verständnisvoll: Sie nimmt es dem Gegner nicht übel, wenn er während einer Vergeltungsserie zurückschlägt. Letzteres ist allerdings eher eine Schwäche als eine Stärke.

- DIE ZWEITE: Ich spiele nacheinander je fünf Züge von TIT FOR TAT, LIEB, GRIMMIG und PERIODISCH ZIEMLICH LIEB. Ich berechne die mittlere Punktzahl pro Zug für die letzten vier Züge jeder Serie. (*) Wenn der beste unter diesen Mittelwerten unter 1,5 liegt, kündige ich. Ansonsten spiele ich zwölf Züge der bisher besten Strategie. Aus den Ergebnissen dieser zwölf Züge berechne ich eine neue mittlere Punktzahl für die gespielte Strategie. Zurück nach (*).

Diese Strategie ist zwar böse, denn sie betrügt unprovoziert innerhalb ihrer Periodischziemlichlieb-Phase. Aber das Risiko, das sie damit eingeht, wird offensichtlich aufgewogen durch die raffinierte Kombination von Test und Entscheidung, die sie praktiziert.

- DIE DRITTE: Am Anfang bin ich im Zustand "friedlich". In diesem Zustand spiele ich TIT FOR TAT; aber wenn mein Partner mich betrügt, werde ich sauer. Wenn ich im Zustand "sauer" bin und er kooperiert, werde ich wieder friedlich und kooperiere ebenfalls; aber wenn er mich betrügt, gerate ich in den Zustand "wütend". Wenn ich wütend bin, betrüge ich stets; wenn mein Gegner zwölfmal hintereinander betrogen hat, schaue ich nach, ob er bisher öfter betrogen als kooperiert hat. Wenn das der Fall ist, kündige ich; ansonsten nehme ich die Kooperation wieder auf und bin nur noch sauer.

Diese Strategie ist nicht einfach zu verstehen. Immerhin ist sie nett und reaktiv – sogar sehr, denn sie gerät schnell in Wut; wenn sie wütend ist, versucht sie ihren Gegner auszubeuten, indem sie permanent betrügt; wenn er das nicht mit sich machen läßt – wovon sie ausgeht, nachdem er zwölfmal hintereinander betrogen hat –, gibt sie ihm eine letzte Chance, wenn er bis jetzt nicht zu böse war; wenn doch, gibt sie es auf.

Welche allgemeinen Schlüsse kann man ziehen? Komplizierte Strategien sind zwar nicht hilfreich: Die mit dem längsten Programmtext erreichte nur Platz 64. Aber insgesamt hat sich das Ergebnis von Axelrods Turnier "Je einfacher, desto besser" nicht bestätigt. Auf den vorderen Plätzen fand sich keine Strategie, die ähnlich einfach war wie TIT FOR TAT. Insbesondere scheint diese klassische Strategie in komplizierteren Umwelten verbesserungswürdig zu sein.

Die erfolgreichsten Strategien sind zwar nicht gerade einfach; aber ihre Grundprinzipien sind einleuchtend und greifen nur auf den gesunden Menschenverstand zurück. Außerdem sind sie recht verschieden untereinander: Wie im richtigen Leben gibt es sehr unterschiedliche Wege zum Erfolg.

Man kann den Vergleich mit dem echten Leben noch weiter treiben. Gewisse Fähigkeiten sind unentbehrlich: Ein Lebewesen muß Energie aus seiner Umwelt aufnehmen und sich reproduzieren können; eine Strategie in unserer künstlichen Umwelt muß fähig sein, auf Attacken ihrer Gegner zu reagieren und die Interaktion überhaupt einzustellen. Unter den vierzig besten Strategien sind nur zwei (Plätze 16 und 37), die auf die Kündigungsoption verzichten. TIT FOR TAT hat Rang 50. Läßt man die zwölf eingangs genannten Strategien (die sämtlich nicht kündigen) mitspielen, kommt die beste unter ihnen – in diesem Falle GRIMMIG – auf Platz 45; ansonsten ändert sich nicht viel.

Gewisse Eigenschaften sind unter allen Umweltbedingungen schädlich: übermäßige, ungehemmte Aggressivität für Tiere, böse sein oder zu früh kündigen für die Strategien. Eine einzige unter den vierzig besten Strategien ist böse (Platz 2). Manche plausiblen Eigenschaften passen gut zusammen, manche überhaupt nicht, und ohne Experimente ist darüber keine Klarheit zu erlangen. Das Prinzip der Schmerzschwelle und das Prinzip Tit for Tat haben jedes für sich ihren Trägern nicht auf einen der ersten vierzig Ränge geholfen; ihre Kombination, die von vielen Einsendern programmiert wurde, kam je nach Wahl der Parameter auf einen Rang zwischen 7 und 47.

Die Verbesserungsmöglichkeiten scheinen unbegrenzt. Das nachzuweisen dürfte schwierig sein, aber wir haben immerhin versucht, Strategien zu ersinnen, die gewonnen hätten, wenn sie an dem Turnier teilgenommen hätten.

- NOCH BESSER A: Ich spiele wie DIE ERSTE, aber ich rechne meinem Gegner jeden Betrugsakt an, nicht nur die außerhalb der Vergeltungsserien.

- NOCH BESSER B: Ich spiele wie DIE ZWEITE, aber ich beginne die Testserie erst, wenn ich erstmals betrogen werde.

- NOCH-BESSER C: Ich spiele wie DIE DRITTE, werde aber nicht schon beim ersten, sondern erst beim zweiten unfreundlichen Akt sauer.

Das korrigiert Schwächen der drei Siegerstrategien: Es erweist sich als ungünstig, daß DIE ERSTE die Fußtritte dessen ignoriert, dem sie gerade eine Tracht Prügel verabreicht; der größte Fehler von DIE ZWEITE ist es, böse zu sein; und DIE DRITTE ist einfach zu aufbrausend.

Von der Komplexität zur Intelligenz ist es nur ein Schritt. Ein Leser hat zweifellos recht mit der Bemerkung, daß ein echter Mensch sich in einem solchen Turnier besser schlagen würde als jede programmierte Strategie (wenngleich es ihm schwerfallen dürfte, 95 Spiele zu je 1000 Zügen physisch durchzuhalten).

Evolution

Die richtige Tragweite gewinnt das iterierte Gefangenendilemma erst als Modell einer biologischen Evolution. Ein Turnier ist der Kampf verschiedener Individuen ums Überleben; die dabei erreichte Punktzahl (fitness) entspricht der Zahl der Nachkommen, und es muß zu einer Strategie nicht nur einen Vertreter geben. In der nächsten Generation sind die erfolgreichen Stategien stärker vertreten. Durch den Spielablauf ändert sich also die Umwelt, in der die gedachten Individuen zu bestehen haben.

Derartige Simulationen sind in großer Anzahl durchgeführt worden. Es stellt sich regelmäßig heraus, daß die bösen Strategien aussterben (das gilt sogar für den zweiten Sieger unseres Turniers) und die netten überhandnehmen, wenn sie nur in der ursprünglichen Population in einer gewissen Mindestanzahl vertreten sind. Nach ausreichend vielen Generationen kann man auf den ersten Blick gar nicht mehr sehen, welche Strategien in dem simulierten Ökosystem leben, denn es sind einfach alle nur nett zueinander. Es ist die Idylle der totalen Kooperation. Optimistische Interpreten haben daraus den Schluß gezogen, daß kooperatives Verhalten ("reziproker Altruismus") sich ohne äußeren Zwang, ohne moralischen Druck, ja ohne allzuviel Intelligenz (TIT FOR TAT ist nicht gerade geistreich) allein durch die biologische Selektion etablieren könne.

Nun ist die Welt offensichtlich alles andere als idyllisch. Wo ist der wesentliche Mangel der vereinfachten Modelle?

In ihrem Artikel "Das Einmaleins des Miteinander" (Spektrum der Wissenschaft, August 1995, Seite 46) haben Martin A. Nowak, Robert M. May und Karl Sigmund eine Teilantwort gegeben: Die Idylle begünstigt die Vermehrung wehrloser (nichtreaktiver) Strategien; denn sie gedeihen ebenso gut wie TIT FOR TAT. Dann aber können sich böse Strategien, die von außen einwandern oder durch Mutation spontan entstehen, an ihnen hemmungslos sattfressen.

Es könnte auch sein, daß die bisherigen Modelle immer noch zu schlicht sind. Ist ein Kampf zwischen einfachen Strategien in einem einfachen Ökosystem wirklich realitätsnah? Läßt sich die beobachtete Konvergenz gegen die Idylle verallgemeinern? Man müßte größere Simulationen mit Tausenden komplexer Strategien durchführen – und sich dabei vergewissern, daß man keine wesentliche Möglichkeit übersehen hat. Was kann dabei herauskommen?

Die ernüchternde Antwort ist: so ziemlich alles, und das bereits bei mäßiger Komplexität. Es genügt, drei verschiedene Strategien in gewissen Anzahlen in dem gedachten Ökosystem auszusetzen und sich selbst zu überlassen. Ein Kampf mit nur zwei Strategien hingegen endet fast immer mit einer stabilen Situation. Es ist wie in der Himmelsmechanik (oder im Eheleben): Zwei Körper allein – wie Erde und Mond – umrunden einander auf ewig in stabilen Bahnen. Erst wenn ein dritter Körper dazukommt, bricht das Chaos aus.

Nach längerer computergestützter Suche haben wir die auftretenden Phänomene in fünf Klassen eingeteilt:

- In der großen Mehrzahl der Fälle, aber eben nicht immer, ergibt sich monotone Konvergenz. In einer Übergangsphase entwickeln sich die Populationszahlen im wesentlichen in einer Richtung – nur aufwärts oder nur abwärts – und bleiben dann auf ewig konstant (Bilder 4 und 5).

- Die zweite Klasse enthält gedämpfte Schwingungen. Die Populationszahlen schwanken auf und ab, aber immer weniger, so daß sich schließlich doch – wenngleich erheblich später – ein Gleichgewicht einstellt (Bild 6).

- Die dritte Klasse besteht aus periodischen (ungedämpften) Schwingungen. Nach einer Anfangsphase entwickeln sich die Populationszahlen zyklisch. Sie reproduzieren sich exakt nach einer gewissen Generationenzahl, wie in den Räuber-Beute-Modellen der mathematischen Ökologie (Spektrum der Wissenschaft, November 1994, Seite 14), ohne daß es je zum Gleichgewicht käme.

- Wenn die Schwingung weder gedämpft noch periodisch ist, schaukelt sie sich auf bis zum Zusammenbruch, vergleichbar der Resonanzkatastrophe bei einer Brücke, die im Rhythmus ihrer Eigenschwingungen belastet wird. Das ist der vierte Fall (Bild 8).

- In der fünften Klasse fassen wir alle Fälle zusammen, die in keine der anderen passen. Die Bewegung scheint vollkommen regellos zu sein (Bild 9). Nach unserer Erfahrung hält die Unordnung jedoch nicht lange vor; wir zögern deshalb, von Chaos zu sprechen.

Dagegen ist ein anderes Merkmal des Chaos zweifelsfrei vorhanden: empfindliche Abhängigkeit von den Anfangsbedingungen. Ein wenig mehr von einer Strategiesorte, und aus einer gedämpften Schwingung wird eine Revolution; noch eine kleine Änderung, und eine andere Strategie geht daraus als Sieger hervor. Zuweilen ist das auch eine böse. Anscheinend profitieren finstere Gestalten besonders von Zeiten des Umbruchs, während die Kooperativen zu leiden haben. Der Vergleich mit der menschlichen Gesellschaft drängt sich förmlich auf.

Ebenso empfindlich abhängig ist der Ausgang des Spiels von der Änderung anderer Parameter wie Punktzahlen und Anzahl der Züge pro Spiel. Selbst numerische Rundungsfehler wirken sich aus.

Wir haben zwar die chaotischen Fälle nur mit computergestützter Suche gefunden. Aber wenn man zu komplizierteren und damit realistischeren Simulationen übergeht, könnte es durchaus sein, daß der bisherige Regelfall – die Konvergenz zur stabilen Idylle – zur Ausnahme wird. Die Welt der sozialen Beziehungen wäre demnach von Natur aus instabil, und die unvermeidlichen Umbrüche würden die aggressiven Strategien begünstigen.

Eine solche Vision, die eine Computersimulation niemals endgültig bestätigen kann, ist für uns faszinierend, beunruhigend und – geben wir es zu – vor allem amüsant.

Literaturhinweise

The Further Evolution of Cooperation. Von R. Axelrod und D. Dion in: Science, Band 242, Seiten 1385 bis 1390, 9. Dezember 1988.

Complex Strategies in the Iterated Prisoner's Dilemma. Von Jean-Paul Delahaye und Philippe Mathieu in: Proceedings of the International Interdisciplinary Conference about Complex System Theory and the Social Sciences, University of Hull, Canada. Herausgegeben von A. Albert. IOS Press, Amsterdam 1995, Seiten 283 bis 292.

Our Meeting with Gradual: A Good Strategy for the Iterated Prisoner's Dilemma. Von Bruno Beaufils, Jean-Paul Delahaye und Philippe Mathieu in: Proceedings of the International Conference on Artificial Life V (ALIFE V), 16. bis 18. Mai 1996, Nara (Japan), Seiten 159 bis 165.

Weitere Einzelheiten zu den Experimenten sowie Programme und Artikel zum (iterierten) Gefangenendilemma findet man im WWW unter http://www.lifl.fr/~mathieu/ipd.

Aus: Spektrum der Wissenschaft 2 / 1998, Seite 8
© Spektrum der Wissenschaft Verlagsgesellschaft mbH

Download (Abo)

Kennen Sie schon …

Spektrum - Die Woche – Ist alles im Universum vorbestimmt?

Spektrum - Die Woche – Schlank gespritzt

Eine Pille fürs Abnehmen? Nicht ganz, aber ein neues Medikament hilft tatsächlich Adipösen beim Gewichtsverlust. Außerdem in dieser »Woche«: ein Aufruf zum Sammeln und ein Statusbericht zum Insektensterben. (€)

Spektrum der Wissenschaft – Mathematische Spiele und Strategien: Mathematische Spiele und Strategien

Ziegenproblem: Ist hinter der nächsten Tür eine Ziege oder das Auto? • Gefangenendilemma: Kooperieren, betrügen oder ganz aussteigen? • Strategien der besten Wahl: Wie lange soll die Prinzessin auf den Traumprinzen warten?

Schreiben Sie uns!

Beitrag schreiben

Beitrag darf veröffentlicht werden

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Zuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Zuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmende sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Zuschriften können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

Kennen Sie schon …

Spektrum - Die Woche – Ist alles im Universum vorbestimmt?

Spektrum - Die Woche – Schlank gespritzt

Spektrum der Wissenschaft – Mathematische Spiele und Strategien: Mathematische Spiele und Strategien

Schreiben Sie uns!

Altruismus

Spieltheorie

Fossilien