Es war genau das Richtige, um Wissenschaft und Glücksspiel zu verbinden, erzählt Anna Dreber von den Anfängen ihrer Arbeiten zu Prognosemärkten. Damals, vor etwa vier Jahren, hatte gerade eine internationale Gruppe von Psychologen ein Projekt zur Reproduzierbarkeit von Studien begonnen und dutzende Experimente wiederholt. "Zu Beginn fanden wir es einfach nur super, auf die Ergebnisse zu wetten", erinnert sich die Leiterin der Arbeitsgruppe zum Wirtschaftsverhalten von der Stockholm School of Economics.

Die Wissenschaftler waren aber eigentlich daran interessiert, ob die Forschung einen Nutzen aus den Vorhersagen ziehen könnte. Bei Prognosemärkten handelt es sich im Prinzip um die Wall Street im Miniaturformat, wo die Teilnehmer Anteile oder Wertpapiere von zukünftigen Ereignissen kaufen und verkaufen. Deren Preis reflektiert dabei das kollektive Wissen über die Wahrscheinlichkeit, mit der das Ereignis eintritt. Dreber wollte nun untersuchen, ob sich die Reproduzierbarkeit von Studien vorhersagen ließ. Zunächst bat sie einige Psychologen, für sich allein einzuschätzen, wie gut reproduzierbar das Ergebnis bestimmter wissenschaftlicher Studien sei. Anschließend richtete sie für jede dieser Studien einen Prognosemarkt ein und bat die Psychologen, die jedem bereitgestellten 100 US-Dollar zu investieren.

Bei weniger als der Hälfte der untersuchten Studien waren die Daten im zweiten Durchlauf überhaupt reproduzierbar. Daraufhin wertete Dreber die Vorhersagen der Psychologen aus. Dabei waren deren Schätzungen über die Reproduzierbarkeit der Studien nicht besser als der reine Zufall; wenn die Teilnehmer aber kollektiv am Prognosemarkt agierten, ließ sich das richtige Ergebnis in 71 Prozent der Studien vorhersagen.

Solche Experimente zeigen das Potenzial der Prognosemärkte, bei denen anhand der Einschätzungen von Einzelnen erstaunlich genaue Gesamtprognosen erreicht werden. Dieser verblüffende Effekt führt dazu, dass bei jeder Wahl eines US-Präsidenten die Wähler begierig das Ranking ihres bevorzugten Kandidaten in den Vorhersagen von Betfair oder den Iowa Electronic Markets (IEM) verfolgen. Solche Märkte breiten sich immer mehr aus und sagen inzwischen alles Mögliche vorher, von Ergebnissen bei Sportwettkämpfen bis hin zu Geschäftsentscheidungen. Laut den Befürwortern lassen sich auf diese Weise Informationen sammeln, die nicht durch die bei traditionellen Umfragen und Expertenmeinungen auftretenden Verfälschungen belastet sind.

"Sobald wir hören, dass es mit 80- oder 90-prozentiger Wahrscheinlichkeit regnen wird, nehmen wir doch einen Regenschirm mit"
Anthony Aguirre

Auch für die Forschung gibt es Anwendungsmöglichkeiten von Prognosen. So ließen sich beispielsweise die aussichtsreichsten und damit förderungswürdigsten Forschungsprojekte ermitteln, in der Klimaforschung die Konsensfindung beschleunigen oder, wie Dreber zeigte, schon vorab die Reproduzierbarkeit von Studien abschätzen.

Natürlich können Vorhersagebörsen auch danebenliegen, was die Skeptiker gerne betonen. "Manche Leute meinen, ein irgendwann einmal eingerichteter Prognosemarkt läge immer richtig, egal was passiert", sagt der Wirtschaftswissenschaftler Eric Zitzewitz vom Dartmouth College in Hanover in New Hampshire. Doch das stimme eben nicht, und nach wie vor werde erforscht, wie ein guter Vorhersagemarkt überhaupt auszusehen hat.

Auch nicht ganz perfekte Prognosen könnten in den Augen der Verfechter hilfreich sein. "Denn wenn wir hören, dass es mit 80- oder 90-prozentiger Wahrscheinlichkeit regnen wird, nehmen wir einen Schirm mit", erklärt der Physiker Anthony Aguirre von der University of California in Santa Cruz. "Die Zukunft ist einfach schwer vorherzusagen, und darüber sollte man sich nicht aufregen."

US-Wahl exakt vorhergesagt

Wetten auf die Zukunft gibt es schon solange die Menschheit sich für Sport und Pferderennen begeistern. In der zweiten Hälfte des 19. Jahrhunderts wurde das etwas unübersichtliche Geschäft mit Wettquoten anhand von Angebot und Nachfrage dann an der Wall Street gebündelt. Dort nutzten seit 1868 die reichen Geschäftsleute und Entertainer aus New York City die informellen Märkte, um auf den Ausgang der Präsidentschaftswahlen zu wetten. Die Wettpools über politische Fragen gab es noch bis in die 1930er Jahre. Dann fielen sie schließlich strengeren Gesetzen und den aufkommenden professionellen Umfragen zum Opfer. Trotzdem waren die informellen Märkte stets ausgesprochen erfolgreich gewesen: 11 von 15 Präsidenten wurden richtig vorhergesagt, und bei den übrigen vier Wahlen hatten sie einen extrem knappen Ausgang korrekt prophezeit.

Prognosemärkte
© Nature, nach: IEM; dt. Bearbeitung: Spektrum der Wissenschaft; Mann, A.: Market forecasts. In: Nature 538, S. 308-310, 2016
(Ausschnitt)
 Bild vergrößernGrafik Prognosemärkte

Mit der Ausbreitung des Internets bekam der Prognosemarkt wieder Rückenwind, nicht zuletzt weil nun die Teilnahme an und das Einrichten von Vorhersagen wesentlich einfacher wurden. Seit 1988 betreibt das Tippie College of Business der University of Iowa den Non-Profit-Prognosemarkt IEM als netzwerkbasiertes Ausbildungs- und Forschungstool. Schon lange vor der diesjährigen US-Präsidentschaftswahl am 8. November 2016 wurden hier Vorhersagen darüber gemacht, welcher Kandidat wie viele Stimmen erhalten wird. Sobald die Händler neue Informationen aus Umfragen, Wirtschaft und bestimmten Ereignissen mit einbezogen, änderten sich die Prognosen, und zwar fast täglich. So wurde beispielsweise am Vorabend der US-Wahl 1989 verkündet, der Kandidat der Republikaner George H. W. Bush würde mit 53,2 Prozent der Stimmen gewinnen – was dem endgültigen Ergebnis genau entsprach. Laut einer Analyse aus dem Jahr 2008 waren die Vorhersagen des IEM in 74 Prozent der Vorhersagen bei fünf Präsidentschaftswahlen genauer als andere Prognosen.

Angesichts der Erfolgsgeschichte des IEM entstanden Dutzende weiterer solcher Märkte. So startete 1996 der Hollywood Stock Exchange mit Vorhersagen im Bereich des Films, seien es die Kasseneinnahmen an den Startwochenenden oder die Prognose, dass der Film "Hamlet" ein Flop und "Jerry Maguire" ein Hit wird. Anfang 2000 beteiligten sich auch die Mitarbeiter des IT-Unternehmens Hewlett-Packard an Vorhersagen. Dabei schätzten sie in 75 Prozent der Fälle die vierteljährlichen Verkaufszahlen von Druckern besser ein, als die Prognosen der Firma vermuten ließen. Und auch die Wettorganisation TradeSports.com mit Sitz in Dublin machte sich einen Namen, als sie im September 2002, also schon sechs Monate vor der US-geführten Invasion des Irak, eine Prognose darüber startete, wann der irakische Diktator Saddam Hussein abgesetzt würde. Als der Krieg im März 2003 begann, wurde mit 90-prozentiger Sicherheit auf April und mit 95-prozentiger Sicherheit auf Mai oder Juni gewettet. Im April kam es dann auch tatsächlich dazu.

Wie entstehen Fehlschläge wie der nicht vorhergesagte Brexit?

Vorhersagemärkte hatten aber auch sehr prominente Fehlschläge – ganz aktuell am 23. Juni 2016, als bei einem Referendum über den Verbleib des Vereinigten Königreichs in der Europäischen Union abgestimmt wurde. An diesem Tag wurde für den Brexit ein "stay-vote" von 85 Prozent vorhergesagt; in Wirklichkeit stimmten die UK-Bürger knapp für den Austritt aus der EU. Ein anderes aktuelles Beispiel ist die Wahl des US-Präsidenten. Hier sagten die Prognosemärkte erst wesentlich später als die klassischen Umfragen voraus, dass Donald Trump als Kandidat der Republikaner antreten würde.

All diese Beispiele haben das Interesse der Forschung geweckt. Wieso funktionieren Prognosemärkte überhaupt? Was können sie wirklich leisten, und warum stimmen ihre Vorhersagen manchmal recht genau und manchmal überhaupt nicht? Weshalb sie funktionieren, hat der österreichische Ökonom Friedrich Hayek im Prinzip schon 1945 erklärt. Seiner Meinung nach sind Märkte im Grunde Mechanismen, die große Mengen an Informationen von Einzelnen sammeln und in eine nützliche Gesamtinformation verarbeiten – nämlich den Preis, den die Leute für Güter und Dienstleistungen zu zahlen bereit sind.

Laut gängigen Wirtschaftstheorien sammeln Vorhersagemärkte diese Informationen auf zwei Arten. Erstens durch die so genannte "Weisheit der Vielen", wie es der Wirtschaftsjournalist James Surowiecki in seinem gleichnamigen Buch nannte (Originaltitel: Wisdom of Crowds, Doubleday, 2004). Diesem liegt die Idee zu Grunde, dass eine Gruppe von Leuten mit ausreichend breit gefächerten Meinungen im Kollektiv bessere Ergebnisse erzielt als der Einzelne. In diesem Zusammenhang wird oft ein Experiment zitiert, bei dem die Teilnehmer die Anzahl von "jelly beans" (Fruchtgummis) in einem Glas schätzen sollten. Auch wenn die Schätzungen der einzelnen Teilnehmer mit hoher Wahrscheinlichkeit nicht richtig waren, bildeten ihre Meinungen zusammengenommen doch eine Glockenkurve, deren Peak nahe am realen Wert lag. Als der Investor Jack Treynor dieses Experiment im Jahr 1987 mit 56 Studenten durchführte, betrug die durchschnittlich geschätzte Zahl bei 871 – und damit näher an der richtigen Antwort von 850 Fruchtgummis, als alle bis auf einen Teilnehmer geschätzt hatten.

Einer kann auch etwas ausrichten
© iStock / Axel Kores
(Ausschnitt)
 Bild vergrößernEiner kann auch etwas ausrichten
Einzelne können die Schwarmintelligenz der Märkte korrigieren, wenn sie schiefliegt: Laut der Marginal-Trader-Hypothese gibt es – zumindest theoretisch – immer einzelne Personen, die genau dort agieren, wo sich die Masse verschätzt. Diese Außenseiter kaufen unterbewertete und verkaufen überbewertete Kontrakte, wodurch die Preise wieder auf ein sinnvolles Niveau zurückgebracht werden.

Doch nicht nur Surowiecki betont, dass die Vorhersage der Masse nur dann gut ist, wenn ausreichend unterschiedliche Meinungen vorhanden sind. Wenn das nicht der Fall ist und die unabhängige Urteilskraft durch Druck, Panik oder vielleicht einen charismatischen Redner in eine bestimmte Richtung gedrängt wird, kann das Wissen vieler einem kollektiven Versagen zum Opfer fallen. Ein gutes Beispiel hierfür ist die Immobilienblase Mitte 2000, die wesentlich zum Finanzcrash in den Jahren 2007/08 beigetragen hat. Hier kommt dann noch ein zweiter Marktmechanismus ins Spiel, der auch Marginal-Trader-Hypothese genannt wird. Laut dieser gibt es – zumindest theoretisch – immer einzelne Personen, die genau dort agieren, wo die Masse falschliegt. Diese Außenseiter kaufen unterbewertete und verkaufen überbewertete Kontrakte und bringen dadurch die Preise wieder auf ein sinnvolles Niveau. Der 2015 erschienene Film "The Big Short" zeigt ein reales Beispiel: Ein Hedgefonds wettet gegen den irrationalen Höhenflug des amerikanischen Immobilienmarkts und profitiert am Ende deutlich vom Immobiliencrash.

Feldversuche über die Zukunft

Die theoretischen Hypothesen, etwa zur Frage, wie schnell Vorhersagemärkte unter bestimmten Bedingungen Informationen sammeln, wurden darüber hinaus im Kontext experimenteller Forschungsarbeiten getestet. Hierzu stellte man 2009 die gängigen Forschungs- und Publikationspraktiken der Wissenschaft nach, um in drei Vorhersagemärkten abschätzen zu lassen, welche Hypothese über fiktive biochemische Mechanismen wahr sein könnte.

In einem dieser Märkte hatten alle Teilnehmer dieselben wichtigen Informationen über den betreffenden Mechanismus, und alle Teilnehmer waren auch schnell derselben, richtigen Meinung. In einem zweiten Markt, analog einer firmeneigenen Forschungseinrichtung, waren die wichtigen Informationen nur Einzelnen bekannt – eine Situation, in der es schwierig war, einen Konsens unter den Teilnehmern zu finden. Im dritten Markt wurde nachgestellt, wie Ergebnisse parallel in verschiedenen Labors erzielt und publiziert werden: In dieser sehr realen Situation wurden die Informationen der Einzelnen natürlich bis zur Veröffentlichung erst einmal geheim gehalten. Auch hier fand der Prognosemarkt letztendlich die richtige Antwort. Allerdings konnten jene Teilnehmer, die nützliche Informationen als Erstes entdeckten, diese auch zuerst für sich zur Vorhersage der Marktentwicklung nutzen und so ein kleines bisschen Profit daraus ziehen.

Einer der ersten Prognosemärkte, der sich rein wissenschaftlichen Fragen widmete, entstand aus einem 2011 initiierten Projekt des Ökonomen Robin Hanson von der George Mason University in Fairfax im Bundesstaat Virginia. Das als SciCast bekannte Projekt betrieb eine Website, auf der die Teilnehmer auf bestimmte Ergebnisse wetten konnten, beispielsweise: "Wird es einen im Labor bestätigten Fall einer MERS-Infektion (Middle East Respiratory Syndrome, MERS oder MERS-COV) mit einem bis zum 1. Juni 2014 identifizierten Stamm geben?" Ja, es gab ihn. Die Prognosen der SciCast waren dabei in 85 Prozent der Fälle genauer als die eines anderen Vorhersagemodells.

Die Plattform SciCast wurde 2015 geschlossen, weil die Finanzierung auslief. Doch sie hatte immerhin noch den Anstoß für den Start von Metaculus im November 2015 gegeben. Dieser Markt stammt von dem Physiker Anthony Aguirre und seinem Kollegen, dem Astrophysiker Greg Laughlin, der inzwischen an der Yale University in New Haven in Connecticut forscht. Aguirre wollte eigentlich "Supervorhersager" finden, die besonders gut die Wahrscheinlichkeit von Ereignissen einschätzen konnten. Auf Metaculus finden sich dabei Fragen wie "Wird bis Ende 2017 eine klinische Studie mit CRISPR zur genetischen Modifizierung im Menschen gestartet?" oder "Wird die National Ignition Facility (NIF) die Zündung der Kernfusion bis Anfang 2017 bekannt geben?".

Motivation: Geldgewinn oder auch nur Prestige

Wie schon bei SciCast wetten auch die Teilnehmer bei Metaculus nicht wirklich um Geld. Sie bestimmen nur anhand eines Schiebebalkens, wie hoch ihrer Meinung nach die Wahrscheinlichkeit einer bestimmten Antwort ist, und erhalten Rückmeldung, wenn sie richtigliegen. Laut Aguirre wird hauptsächlich aus Gründen der Machbarkeit nicht um Geld gewettet. "Bei der Frage 'Wird Hillary die US-Wahl gewinnen?' würden zig Millionen Leute mitmachen; für die Frage 'Wird dieses eine neue Paper in arXiv mehr als zehnmal zitiert werden?' lassen sich nicht genügend Teilnehmer finden, die mit echtem Geld darauf setzen." Geld ist für den Erfolg eines Prognosemarkts aber auch nicht unbedingt nötig. Denn wie mehrere Studien zeigten (und hier), reicht als Motivation allein das Prestige, richtigzuliegen.

Wirtschaft
© fotolia / jamdesign
(Ausschnitt)
 Bild vergrößernBörsenkurse
Schwarmintelligenz kann auch zum Börsencrash führen – wenn nicht ausreichend unabhängige Meinungen vorhanden sind oder wenn die unabhängige Urteilskraft durch Druck, Panik oder vielleicht einen charismatischen Redner in eine bestimmte Richtung gedrängt wird. Dann kann das Wissen vieler einem kollektiven Versagen zum Opfer fallen – wie bei der Immobilienblase, die wesentlich zum Finanzcrash in den Jahren 2007/08 beigetragen hat.

Derzeit hat Metaculus etwa 2000 aktive User; seine Macher hoffen auf mindestens 10 000. Aber schon jetzt ist klar, dass man erfolgreiches Vorhersagen erlernen kann. Die besten Spieler suchen nämlich immer nach dem optimalen Zeitpunkt für die Anpassung ihres Tipps nach oben oder unten und kommen so dem wahren Ergebnis nach und nach näher. In den Augen von Laughlin und Aguirre könnte Metaculus auch für Journalisten und andere Leute von Nutzen sein, die an brandneuen Wissenschaftsthemen interessiert sind. Finanzgeber könnten an den Prognosen ebenfalls Interesse haben und "mit Hilfe der Ergebnisse aus solide geführten Prognosemärkten zur Entscheidung über förderungswürdige Projekte kommen", erklärt Laughlin.

Prognosen im Bereich der Politik und Wirtschaft sind schon fest etabliert. Das liegt sicherlich unter anderem daran, dass es hier relativ kurzfristig klare Antworten gibt. In der Wissenschaft ist dagegen Geduld gefragt, den Vorhersagen zu wissenschaftlichen Themen fehlt es noch etwas an Zugkraft. Nur wenige Wettbegeisterte haben die Ruhe, jahrzehntelang auf die Ergebnisse experimenteller Arbeiten zu warten.

"Irgendwie schaffen es die neuen Märkte immer wieder, dass die Leute selbst nachts um 2 Uhr noch beim Nachhausekommen ihre Antwort den neuen Gegebenheiten anpassen"
David Rothschild

Das Problem besteht natürlich nicht nur für die Prognosemärkte. "Kurzfristige Vorhersagen sind immer einfacher als langfristige", bemerkt Aguirre. Solange die Plattformen die Möglichkeit bieten, die eigene Vorhersage den neuesten Informationen sofort anzupassen, werden sie natürlich bessere Ergebnisse erzielen als andere Methoden. Prognosen in der Wissenschaft leiden auch mehr als die in der Politik oder Wirtschaft unter vagen Ergebnissen. Bei einer Wahl steht in der Regel am Ende der Gewinner fest – in der Wissenschaft sind die Daten nur selten so klar. Den Befürwortern der Prognosemärkte bereitet das aber keine Kopfschmerzen: "Wenn eine neue Wette vorgeschlagen wird, klärt sich sehr schnell, worum es genau geht", sagt Robin Hanson. Und Aguirre und Laughlin geben sich alle Mühe, klar definierte und leicht verständliche Fragen zu stellen.

Ob Prognosen in der Wissenschaft überhaupt funktionieren können, muss sich noch zeigen. Als Drebers Team für die Analysen 18 wissenschaftliche Experimente wiederholen ließ, wurde die Wahrscheinlichkeit der Reproduzierbarkeit sowohl im Prognosemarkt wie auch von den einzelnen Psychologen überbewertet. Dreber weiß noch nicht, aus welchen Gründen das so war. Wie sie betont, waren die Psychologen der ersten Studie alle an der Wiederholung interessiert, während die Wirtschaftler der zweiten Studie gar nicht im Projekt zur Reproduzierbarkeit involviert waren – vielleicht wäre in diesem Fall die Gesamtheit der Leute beim Abschätzen der Reproduzierbarkeit erfolgreicher gewesen.

Alle Vorhersagemärkte haben noch mit etlichen Herausforderungen zu kämpfen. Dazu gehört sowohl die Einschränkung der Manipulationsmöglichkeiten als auch die Begrenzung des vielschichtigen Bias, sprich der Verzerrung durch etliche Faktoren. Doch die klassische repräsentative Umfrage, die auf Anrufen am Festnetz-Telefon beruht, leidet immer mehr unter der Ausbreitung von Mobiltelefonen und Nachrichtendiensten im Internet. Und weil die Prognosemärkte mindestens genauso gut – wenn nicht sogar besser – sind als klassische Umfragemethoden, könnten sie nach Meinung des Wirtschaftswissenschaftlers David Rothschild von Microsoft Research in New York City diese auch ablösen. "Ich kann schon Umfragen erstellen, die alle Features des Prognosemarkts haben", sagt er. "Aber irgendwie schaffen es die neuen Märkte immer wieder, dass die Leute selbst nachts um 2 Uhr noch beim Nachhausekommen ihre Antwort den neuen Gegebenheiten anpassen."

Dieser Artikel erschien unter dem Titel "The power of prediction markets" bei "Nature".