Können diese Statistiken lügen?
Statistiken begegnen uns überall, denn um Daten zu erheben, zu analysieren, zu interpretieren und darzustellen, sind statistische Methoden unverzichtbar. Umso bemerkenswerter ist die verbreitete Skepsis dieser Disziplin gegenüber, die sich in dem Bonmot "Traue keiner Statistik, die du nicht selbst gefälscht hast" äußert. Was ist die Ursache für dieses Misstrauen?
Andreas Quatember, Professor für Statistik an der Johannes-Kepler-Universität Linz, sieht das Problem zum Teil in der einschlägigen Inkompetenz vieler Medienvertreter. Seit geraumer Zeit sammelt er Beispiele für statistischen Unsinn und hat sie im vorliegenden Buch zusammengefasst. Das Werk gibt einen systematischen Überblick über typische Fehler, bespricht sie ausführlich und erklärt die mathematischen Zusammenhänge dahinter. Quatember widmet sich Print- und Online-Artikeln, überwiegend aus österreichischen Medien, wobei seine Analysen stets unterhaltsam sind und keinerlei mathematisches Vorwissen erfordern. Fachbegriffe erläutert er in Infoboxen.
Fahren können ist nicht gleich Fahren
Zunächst präsentiert der Autor diverse Fälle problematischer Prozentangaben. Es ist peinlich, "jeder Vierte" mit "40 Prozent" zu verwechseln, als Hotelbuchungsportal "101 Prozent" zufriedene Kunden auszuweisen oder bei statistischen Vergleichen auf falsche Grundgesamtheiten Bezug zu nehmen. Wenn etwa der Anteil der Frauen mit Führerschein ungefähr 40 Prozent beträgt, aber nur 35 Prozent der personenschädigenden Verkehrsunfälle von Frauen verursacht werden, dann heißt das nicht, dass Frauen sicherer Auto fahren als Männer. Denn die Quote der weiblichen Unfallverursachenden darf nicht mit jener der weiblichen Führerscheinbesitzenden verglichen werden, "sondern natürlich nur mit dem weiblichen Anteil an den [aktiven] Fahrern oder sogar Fahrten". In vielen Familien sitzt überwiegend der Mann am Steuer, obwohl auch die Frau einen Führerschein hat.
Grafische Darstellungen, etwa Diagramme, sind ebenfalls oft fehlerbehaftet. Dafür liefert Quatember eindrückliche Beispiele. Ob sie auf Einzelfehler, statistische Unkenntnis oder bewusste Manipulation zurückgehen, lässt sich oft nicht entscheiden. Jedenfalls lernt der Leser Kriterien kennen, anhand derer er die Qualität von Darstellungen beurteilen kann. Häufige Manipulationen bestehen darin, die Orientierung der Achsen zu vertauschen oder deren Einteilung nicht bei Null beginnen zu lassen, was Unterschiede überbetont. Eine Anzeige des Bundesministeriums für Bildung und Forschung beispielsweise präsentierte Studienanfängerquoten in einem Säulendiagramm. Diese lagen im Zeitraum 2005 bis 2010 zwischen 35,7 und 46,1 Prozent. Die Einteilung der vertikalen Achse begann bei 30 Prozent, was suggerierte, die Quote habe sich verdreifacht; tatsächlich war sie auf das 1,3-fache gestiegen.
Fehler im Umgang mit Mittelwerten, schreibt der Autor, entstehen meist durch unzutreffende Interpretation. So kam eine Studie zu dem Schluss, Frühpensionierte würden im Durchschnitt zeitiger sterben: "Wer sich mit 55 Jahren aus der Firma verabschiedete, wurde demnach durchschnittlich 72 Jahre alt. Die bis zum Alter von 60 Jahren Beschäftigen starben dagegen erst mit 76. Und wer bis 65 im Unternehmen blieb, wurde sogar 80 Jahre alt." Auf den ersten Blick wirkt das wie eine wasserdichte Aussage. Doch nach einigem Nachdenken wird klar: Wer mit 65 in Rente geht, kann nicht vorher gestorben sein. In die mittlere Lebenszeit der mit 65 Berenteten fließen also nur Zahlen ab 65 aufwärts ein, während es bei den Frührentnern Zahlen ab 55 sind. Daraus ergibt sich der möglicherweise völlig unzutreffende Eindruck, wer über das 55. Lebensjahr hinaus arbeite, werde im Durchschnitt älter als seine frühpensionierten Altersgenossen.
Je mehr Eis gegessen wird, umso mehr Sonnenbrände gibt es
Oft interessiert der statistische Zusammenhang zweier Merkmale, die so genannte Korrelation, wobei man durch Kenntnis des einen Merkmals, etwa des Geschlechts, auch Informationen über das andere erhält, beispielsweise die Parteipräferenz. Dabei ist es wichtig zu verstehen, dass zwischen korrelierten Merkmalen keine kausale Beziehung bestehen muss. Wenn sich etwa der Pro-Kopf-Schokoladenverbrauch eines Landes angeblich direkt auf die Zahl seiner Nobelpreisträger auswirkt, dann hat jemand unzulässig von einem statistischen auf einen kausalen Zusammenhang geschlossen. Manchmal ist es in solchen Fällen sinnvoll, nach einem zu Grunde liegenden, gemeinsamen Einflussfaktor zu suchen. Bei der Schokolade und den Nobelpreisträgern könnte das der Wohlstand eines Landes sein.
Das Buch sensibilisiert gegenüber statistischen Sachverhalten und Manipulationsversuchen und macht die Leser damit zu mündigeren Mediennutzern. Trotz aller Aufklärung gelingt es dem Autor, nicht belehrend oder überheblich zu wirken. Allerdings werden sich Leser mit Vorkenntnissen angesichts seiner vielen Beispiele und ausführlichen Erklärungen wohl irgendwann langweilen. Man kann in diesem Fall problemlos einige Seiten überspringen. Zudem kommen tiefer Interessierte ab Kapitel 5 mehr auf ihre Kosten. Dort geht der Autor unter anderem auf die Logik des statistischen Signifikanztests und Konfidenzintervalle ein.
Schreiben Sie uns!
Beitrag schreiben