Dunning-Kruger-Effekt: Wer inkompetent ist, überschätzt sich gern – nur warum?

Manchmal bemerkt man die eigene Fehleinschätzung erst, wenn sie einem direkt vor Augen geführt wird: Beim Strategiespiel landet man unerwartet auf dem letzten Platz, beim Kopfrechnen an der Supermarkt-Kasse wird man eines Besseren belehrt, beim Führerscheintest ist eine zweite Runde angesagt – bisweilen ist man ratlos, wie Selbsteinschätzung und harte Wirklichkeit nur so weit auseinanderklaffen konnten.
Laut dem Dunning-Kruger-Effekt kommen wir vor allem dann in entsprechende Situationen, wenn wir wenig vom Thema, auf das es ankommt, wissen. Die Erklärung dafür ist einleuchtend: Wer von einer Sache nicht viel Ahnung hat, weiß nicht, was und wie viel er nicht weiß – ihm fehlt das nötige »metakognitive Wissen«. Die Folge: Man überschätzt sich eher. Das Phänomen bekam seinen Namen im Jahr 1999: Der Psychologe David Dunning, damals Professor an der Cornell University im US-Bundesstaat New York, und sein Doktorand Justin Kruger beschrieben es erstmals in der Fachzeitschrift »Journal of Personality and Social Psychology«. Doch so populär der Effekt in den Jahrzehnten danach wurde, immer wieder haben Wissenschaftler Zweifel daran angemeldet, dass er wirklich eine psychologische Erklärung hat. Ihr Verdacht ist, dass es sich hier lediglich um ein statistisches Artefakt handelt.
In ihrer Studienreihe von 1999 hatten Dunning und Kruger verschiedene Tests durchgeführt: Die Versuchspersonen sollten ihre Leistung zunächst unter Beweis stellen, beispielsweise bei einem Logiktest. Im Anschluss schätzten sie ihre eigene Kompetenz im logischen Denken sowie ihre Testleistung im Vergleich zu anderen ein. Antwort gaben die Probandinnen und Probanden auf einer Prozentrangskala von 0 bis 100, wobei eine 50 bedeutete: »Ich bin genau durchschnittlich.« Außerdem sollten die Teilnehmenden abschätzen, wie viele der Testaufgaben sie wohl richtig beantwortet hatten.
Anschließend sortierten die Wissenschaftler ihre Versuchspersonen nach der objektiven Testleistung und teilten sie in vier Kompetenzgruppen auf. Die 25 Prozent mit der schlechtesten Leistung fanden sich in der niedrigsten Kompetenzgruppe wieder – dem ersten Quartil –, und die besten 25 Prozent wurden in der Gruppe höchster Kompetenz verortet – im vierten Quartil. Dabei zeigte sich: Wer viel von Logikaufgaben verstand, wer also dem vierten Quartil angehörte, war in der Selbsteinschätzung eher zurückhaltend. Dagegen überschätzte sich die Gruppe mit der niedrigsten Kompetenz am stärksten.
In einer neueren Erhebung von Dunning und Kruger im Jahr 2008 bekamen Teilnehmende bis zu 100 Dollar als Anreiz für eine möglichst zutreffende Selbsteinschätzung, doch auch hier überschätzen sich die eher inkompetenten Personen im ersten Quartil am stärksten: Sie überflügelten mit ihrer Leistung durchschnittlich lediglich 15 Prozent der gesamten Stichprobe, hielten sich selbst aber für besser als knapp 60 Prozent – und waren damit von allen Gruppen am wenigsten präzise (siehe Grafik).
In ihrer Originalarbeit beobachteten Dunning und Kruger diese Tendenz auch für die Bereiche Grammatik und Humor. Um den Humor der Teilnehmenden dabei objektiv zu erfassen, verglichen sie, wie stark die Bewertungen von gängigen Witzen mit den Urteilen professioneller Comedians übereinstimmten. Andere Forschergruppen fanden den Effekt unter anderem bei Debattierturnieren, Psychologieklausuren, Politikkenntnissen von Schülerinnen und Schülern, Patientengesprächen von Assistenzärzten, beim Wiedererkennen von Gesichtern oder auch beim Wissen von Sportschützen über Schusswaffen.
Was löst den Dunning-Kruger-Effekt aus?
Damit hat der Effekt vielen anderen psychologischen Phänomenen etwas voraus: Er zeigt sich sehr zuverlässig in ganz unterschiedlichen Bereichen; Experten rechnen ihn zu den Befunden der Sozialpsychologie, die sich am besten reproduzieren lassen. Und trotzdem sind sich Psychologen bis heute uneinig, was genau den Effekt verursacht.
Dunning und Kruger erklärten das Phänomen so: Wer von einem Bereich wenig Ahnung hat, kann genau deshalb auch schlechter bewerten, ob ein bestimmter Lösungsansatz, etwa der eigene, richtig oder falsch ist. Den weniger Kompetenten fehlt auf dem betrachteten Fachgebiet also eine metakognitive Fähigkeit: Sie können eigene Gedankengänge und Lösungen schlechter beurteilen. Zugespitzt formuliert: Wer auf einem Gebiet inkompetent ist, ist oft noch nicht einmal in der Lage, die eigene Unfähigkeit zu erkennen. Besonders kompetente Personen dagegen können besser abschätzen, ob sie richtig- oder falschliegen. Allerdings können sie sich nicht vorstellen, dass andere weniger wissen, und unterschätzen die eigene Kompetenz daher im sozialen Vergleich.
Vor allem diese Erklärung ist es, die wissenschaftlich kritisiert wurde: Fehlt wenig Kompetenten wirklich die notwendige Einsicht in die eigenen Gedanken? Dass die beobachteten Muster der Selbstüberschätzung auch anders entstehen können, verdeutlichten Wissenschaftler zunächst mit Hilfe von zwei Argumenten: Erstens sind Menschen durch die Bank optimistisch, was ihre eigenen Fähigkeiten angeht. Egal ob beim Autofahren oder bei Intelligenztests – die Mehrheit hält sich stets für überdurchschnittlich, in der Psychologie auch bekannt als »Better-than-Average-Effekt«.
Und zweitens ist es auch aus statistischer Sicht erst einmal nicht verwunderlich, dass sich Leistungsschwache tendenziell überschätzen, während sich Leistungsstarke unterschätzen. Das liegt an der Regression zur Mitte, auch Regressionseffekt genannt. Er tritt immer dann auf, wenn zwei untersuchte Merkmale nicht perfekt miteinander korrelieren. Blickt man beispielsweise auf Personen mit einer objektiv schwachen Kompetenz, dann findet man auf der anderen Variable – etwa bei der Selbsteinschätzung – zwar auch eher unterdurchschnittliche Werte, aber diese nähern sich tendenziell dem Durchschnitt an. Damit resultiert allein aus statistischen Gründen ein etwas höherer Wert auf der Selbsteinschätzungsskala, also augenscheinlich eine Selbstüberschätzung. Entsprechend könnte man auch erklären, warum sich die Kompetentesten tendenziell unterschätzen.
Mit Hilfe simulierter Daten zeigten Forschungsteams, dass die Kombination aus Regression zur Mitte und Better-than-Average-Effekt im Stande ist, das typische Dunning-Kruger-Muster zu erzeugen. Andere Forscher halten dem entgegen, der Better-than-Average-Effekt umschreibe das beobachtete Phänomen nur, anstatt es zu erklären, und komme dabei auch nicht ohne psychologische Prozesse aus.
Auch das zweite Problem, die Regression zur Mitte, war Dunning und Kruger bereits bekannt. In einer Studienreihe versuchten sie, den Regressionseffekt statistisch zu kontrollieren, also »herauszurechnen« – und tatsächlich blieb bei ihnen der eigentliche Effekt weiterhin nachweisbar. Laut dem Psychologen Constantin Meyer-Grant von der Albert-Ludwigs-Universität Freiburg griff der verwendete Ansatz jedoch zu kurz: Der Regressionseffekt sei eine Folge der imperfekten Beziehung zweier Variablen – der objektiven Leistung und der Selbsteinschätzung. Die Studien berücksichtigten aber lediglich die Genauigkeit, mit der die objektive Leistung gemessen wurde. Höhere Messgenauigkeit könne den Zusammenhang der beiden Variablen zwar stärken, doch selbst eine fehlerfreie Messung garantiere noch keinen perfekten Zusammenhang. Damit reduziere die angewandte Maßnahme den Einfluss von Alternativerklärungen wie dem Regressionseffekt zwar, schließe sie aber nicht zuverlässig aus, sagt Meyer-Grant.
Der Dunning-Kruger Effekt
Nicht umsonst zählt der Dunning-Kruger-Effekt zu den bekanntesten Phänomenen der Sozialpsychologie. Er trifft den Kern einer Frage, die uns Menschen umtreibt: Wie realistisch ist der Blick auf die eigene Person und die eigenen Fähigkeiten? Und wann entfernt sich unser subjektives Urteil am weitesten von unseren objektiven Leistungen? Im Interview erläutert der Psychologe und Konamensgeber des Effekts David Dunning, welche Gefahren Wissenslücken für unsere Selbsteinschätzungen bergen – und wie wir mit unserer Unwissenheit umgehen können.
»Selbstüberschätzung ist unvermeidlich«Die Ökonomen Jan Magnus von der Freien Universität Amsterdam und Anatoly Peresetsky von der Higher School of Economics in Moskau gingen mit ihrer Kritik noch einen Schritt weiter: Der Dunning-Kruger-Effekt sei ein reines statistisches Artefakt. Sie bemängelten, dass die Selbsteinschätzungen üblicherweise weniger stark streuen als die objektiven Leistungen. Denn Letztere erstrecken sich auf der Prozentrangskala zwangsläufig stets von 0 bis 100 – innerhalb einer Stichprobe gibt es immer eine Person, die den niedrigsten Rang belegt, und eine, die den höchsten einnimmt. Bei den Selbsteinschätzungen kommt es dagegen selten vor, dass Testpersonen sich auf Rang 0 oder 100 einordnen, sich also gar keine oder maximale Kompetenz attestieren. Und das bedeutet: Allein deshalb werden sich die Unbegabtesten im Mittel eher überschätzen und die Begabtesten unterschätzen. Diese Einflüsse berücksichtigten Magnus und Peresetsky in einem statistischen Modell und konnten die Selbsteinschätzungen von mehr als 650 Studierenden in Statistikklausuren nahezu perfekt vorhersagen – ohne psychologische Variablen in das Modell einzubeziehen.
Sollte sich die Wissenschaft also besser von einer psychologischen Erklärung des Dunning-Kruger-Effekts verabschieden? Nach der Einschätzung von Meyer-Grant können die Unterschiede in den Messskalen das Dunning-Kruger-Phänomen durchaus statistisch mitverursachen oder verstärken – aber: Man könne trotzdem noch nicht ausschließen, dass metakognitive Prozesse für den Effekt eine Rolle spielen. Mit einem rein statistischen Modell, in das genug Freiheiten eingebaut sind, könne man Daten immer nahezu perfekt erklären. Daraus folge aber nicht zwangsläufig, dass das Modell auch eine »theoretisch valide Erklärung« liefere.
»Der Dunning-Kruger-Effekt scheint zumindest kein Regelfall zu sein«Gabriela Hofer, Psychologin
Der Persönlichkeitspsychologin Gabriela Hofer von der Universität Graz fiel noch etwas anderes ins Auge, als sie sich im Rahmen ihrer Dissertation mit dem Thema beschäftigte: die ungewöhnliche Methodik vieler Studien zum Dunning-Kruger-Effekt. »Es gibt selten einen Grund, eine Stichprobe in Untergruppen aufzuteilen, man verliert dabei viel Information«, erläutert sie. Zusammen mit einem Team aus Psychologinnen und Psychologen verwendete sie daher neuere statistische Methoden, die den Zusammenhang von Intelligenz und Selbsteinschätzungen über das gesamte Kompetenzspektrum hinweg analysieren. Die Tests sollen im Wesentlichen erfassen, ob die Selbsteinschätzungen bei zunehmender objektiver Leistung stärker mit dieser korrelieren. Hofers Team unterschied in den Studien zwischen allgemeiner Intelligenz und ihren spezifischen Facetten: numerische, verbale und räumliche Intelligenz. Dunning-Kruger-Effekte fanden sie nur, wenn sie auf die herkömmliche Weise auswerteten, die neuen Methoden konnten den Dunning-Kruger-Effekt seltener belegen – und wenn, dann waren die Befunde nicht besonders robust. Daraus schließt Hofer: »Der Dunning-Kruger-Effekt scheint zumindest kein Regelfall zu sein.« Man könne nicht sagen: Wenn jemand in einer Intelligenzfacette unterdurchschnittlich abschneidet, wird sich diese Person wahrscheinlich genau da überschätzen. Doch weisen die neueren Tests auch Lücken auf, denn sie prüfen nur, ob sich Personen mit zunehmender Kompetenz präziser einschätzen, und lassen außer Acht, ob sie sich dabei systematisch über- oder unterschätzen. Damit beleuchteten sie nur eine Seite der Medaille, meint Meyer-Grant.
Selbsteinschätzung unter der psychologischen Lupe
Eine weitere Möglichkeit, sich dem Rätsel um den Dunning-Kruger-Effekt anzunähern, besteht darin, das Verhalten der Versuchspersonen von vornherein feinkörniger zu untersuchen. Auf Basis dieser Überlegung entwickelten Wissenschaftler Studien, die sich entgegen bisheriger Forschung nicht auf eine Gesamteinschätzung nach Abschluss des Tests verließen, sondern Selbsteinschätzungen der Testpersonen nach jeder einzelnen Aufgabe einforderten.
Auf dieser Ebene anzusetzen, sei eine echt smarte Idee, findet Meyer-Grant, denn in diesem Kontext habe die Psychologie sehr ausgeklügelte Messmodelle entwickelt. Konkret lässt sich dann jede beantwortete Aufgabe durch ein Vier-Felder-Schema darstellen: Teilnehmende können die Aufgabe falsch oder richtig gelöst haben und sich dabei jeweils korrekt oder inkorrekt eingeschätzt haben (siehe Tabelle). Mit Hilfe mathematischer Modelle auf Grundlage der Signal-Entdeckungs-Theorie kann man auf zwei metakognitive Prozesse schließen: Wie präzise kann eine Person zwischen richtigen und falschen Antworten unterscheiden – hier spricht man von Sensitivität. Und welche allgemeine Antworttendenz hat sie – ist sie beispielsweise allgemein eher zurückhaltend oder voreilig mit ihren Einschätzungen.
Ein schottisches Forschungsteam wandte diese Methodik in verschiedenen Studien auf motorische Tests und Logikaufgaben an, wobei ein weiterer Kniff in der Zweiteilung ihrer Studien lag: Ein erster Aufgabenblock diente dazu herauszufinden, wie gut Testpersonen objektiv in den Aufgaben waren; erst in einem zweiten Block mussten sich die Versuchspersonen nach jeder bearbeiteten Aufgabe selbst einschätzen. Eine zentrale Erkenntnis der Schotten: Metakognitive Unterschiede zwischen High- und Low-Performern scheint es tatsächlich zu geben, allerdings sind diese nicht unbedingt Treiber des Effekts. Sehr leistungsstarke Personen wiesen demnach eine höhere metakognitive Sensitivität auf, sie konnten also metakognitiv auf mehr Informationen zurückgreifen. Abseits dieses Informationsüberschusses waren ihre metakognitiven Prozesse aber nicht effizienter verglichen mit Low-Performern.
Und die Selbsteinschätzungen der Versuchspersonen hingen in erster Linie von etwas anderem ab: nämlich davon, ob sie im zweiten Studienteil – also während sie sich bereits selbst einschätzen sollten – gute oder schlechte Leistungen erbrachten. Das Team spricht daher von einem Leistungsartefakt, das eine gewisse Nähe zu der Kritik von Magnus und Peresetsky hat: Allein durch die Stelle auf dem Leistungsspektrum, an der Personen verortet werden, ergeben sich für sie unterschiedliche Voraussetzungen.
Auf der Ebene einzelner Aufgaben kann man sich das so vorstellen: Hat man eine Aufgabe falsch beantwortet, dann kann man sich nur in eine Richtung falsch einschätzen – indem man behauptet, man hätte sie richtig beantwortet. Hat man die Aufgabe dagegen richtig beantwortet, dann kann man sich nur durch die Behauptung, man hätte sie falsch beantwortet, fehlerhaft einschätzen. Fehler geben also Gelegenheit zur Überschätzung, richtige Antworten Gelegenheit zur Unterschätzung. Selbst wenn zwei Personen ähnlich oft mit ihren Einschätzungen danebenliegen, hätte eine Person, die mehr Fehler macht, damit mehr Gelegenheiten, sich zu überschätzen.
Hinweise darauf, dass metakognitive Faktoren für den Dunning-Kruger-Effekt doch eine Rolle spielen könnten, fanden Forschende um Rachel Jansen von der University of California in Berkeley im Jahr 2021, ebenfalls unter Verwendung elaborierter mathematischer Modelle. Ihnen gelang es, parallel zu dem von Dunning und Kruger formulierten Mechanismus auch eine Form des Better-than-Average-Effekts zu modellieren – doch mit weitaus präziseren Annahmen: Demzufolge haben Menschen vor dem Ablegen eines Tests insgesamt optimistische Erwartungen hinsichtlich ihrer eigenen Fähigkeiten; außerdem unterliegt eine Selbsteinschätzung immer einer gewissen Unsicherheit.
Daher wäre es rational, nicht gänzlich von der ursprünglichen Erwartung abzuweichen, sondern nur teilweise. Das führt wiederum zu unterschiedlichen Voraussetzungen für Low- und High-Performer, denn um sich korrekt einzuschätzen, müssten Personen mit einer schlechten Testleistung stärker von einer eingangs optimistischen Erwartung abweichen als Leistungsstarke. Die Forscherinnen und Forscher legten ihren Teilnehmern dieselben Logikaufgaben vor wie ehemals Dunning und Kruger und fanden heraus: Selbst nach der Berücksichtigung von optimistischen Erwartungen zeigte sich noch ein Einfluss von metakognitiven Unterschieden im Sinn von Dunning und Kruger.
Meyer-Grant neigt deshalb zu der vorsichtigen Einschätzung, dass metakognitive Unterschiede zum Dunning-Kruger-Effekt beitragen können, ohne ihn vermutlich in Gänze zu erklären. Dem Psychologen zufolge spricht viel dafür, dass »psychologische und statistisch-strukturelle Mechanismen gemeinsam zum beobachteten Muster führen«, doch künftige wissenschaftliche Erkenntnisse könnten diese Einschätzung auch noch grundlegend relativieren. Etwas abgeklärter klingt die Psychologin Hofer, die in Diskussionen mit Kollegen immer häufiger die Rückmeldung bekommt, es wäre auch nett, wenn sich das Feld weiterbewegen würde: »Sollte es den Dunning-Kruger-Effekt nicht geben, wie können wir stattdessen vorhersagen, wer sich unterschätzt und wer sich überschätzt?«
Dass Menschen gerade dann besonders selbstbewusst auftreten, wenn sie sich gar nicht so gut auskennen, gilt aller Wahrscheinlichkeit nach also auch weiterhin. Doch kann die wissenschaftliche Kritik vielleicht eines zeigen: Die Gründe dafür liegen wohl nicht ausschließlich in uns selbst.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.