Direkt zum Inhalt

Psychologie: Tests mit kleinen Fehlern

"Projektive Verfahren" wie der Rorschach-Test gehören zum Standardrepertoire der Psychologen. Ob damit die Persönlichkeit der Befragten wirklich zuverlässig zu beurteilen ist, gilt immer mehr als fraglich.


Ein Bild sagt mehr als tausend Worte, geht eine Redensart, doch manche Bilder sollen gerade Worte hervorbringen. Ein Psychologe zeigt einer Person einen Tintenklecks und ermuntert sie, darin Bilder zu sehen und zu beschreiben. Vielleicht zeigt er ihr auch die Darstellung eines Mannes, der sein Gesicht von einer Frau abwendet, die ihn am Arm packt. Derartige Tests gehören zum Standardrepertoire von Persönlichkeitstests, denn viele Psychologen glauben, die Befragten würden sich bei ihrer Antwort von Gefühlen, Erfahrungen, Erinnerungen und Vorstellungen leiten lassen, sich also selbst in die Deutungen projizieren. Geschulte Auswerter seien, so die These, demgemäß in der Lage, aus den Antworten auf Persönlichkeitsmerkmale, unbewusste Bedürfnisse und psychische Gesundheit zu schließen.

Aber treffen diese Schlussfolgerungen wirklich zu? Immerhin haben die Beurteilungen oft erhebliche Konsequenzen. Projektive Verfahren dienen beispielsweise dazu, psychische Störungen zu diagnostizieren oder vorherzusagen, ob Straftäter nach einer Haftentlassung wieder gewalttätig werden. Mit diesen Techniken wird die psychische Stabilität von Eltern beurteilt, die sich um das Sorgerecht für ihre Kinder streiten, und eruiert, ob Kinder sexuell belästigt wurden.

Vor kurzem sichtete unser Team eine Vielzahl von Forschungsarbeiten zur Güte projektiver Verfahren. Im Mittelpunkt standen drei der am häufigsten eingesetzten und am besten untersuchten Verfahren. Die Ergebnisse dabei waren schlichtweg Besorgnis erregend.

Der bekannte Rorschach-Test – bei dem die Probanden beschreiben sollen, was sie auf zehn aufeinander folgenden Tintenklecks-Tafeln erkennen – ist unter allen projektiven Verfahren das populärste. Der in den zwanziger Jahren von dem Schweizer Psychiater Hermann Rorschach (1884-1922) eingeführte Test geriet bereits in den fünfziger und sechziger Jahren in das Kreuzfeuer der Kritik, unter anderem deshalb, weil er nicht standardisiert war und keine Normwerte aufführte. Eine Standardisierung ist aber erforderlich, denn selbst scheinbar geringfügige Unterschiede in der Anwendung eines Verfahrens beeinflussen die Reaktionen von Probanden. Normwerte, das heißt Durchschnittswerte der Allgemeinbevölkerung, sind gleichfalls von großer Bedeutung, denn sie liefern den Bezugsrahmen einer Beurteilung: Liegt die Reaktion des Befragten noch innerhalb oder schon außerhalb einer akzeptablen Bandbreite?

Diese Probleme des frühen Rorschach-Tests korrigierte der damals an der Universität von Long Island tätige Psychologe John E. Exner in den siebziger Jahren durch das Rorschach Comprehensive System. Es enthält detaillierte Regeln für die Anwendung des Tintenklecks-Tests und für die Interpretation der Antworten sowie Normwerte für Kinder und Erwachsene.

Trotz seiner Popularität weist aber auch das Exner-System in zwei entscheidenden Punkten Mängel auf, an denen auch schon der ursprüngliche Test krankte: Es mangelt an Zuverlässigkeit und Gültigkeit (fachlich "Reliabilität" beziehungsweise "Validität"). Ein zuverlässiges Verfahren führt unabhängig davon, wer es anwendet und die Antworten auswertet, zu vergleichbaren Ergebnissen; ein gültiges Verfahren misst, was es messen soll. Nur unter diesen Bedingungen lässt sich anhand von Testergebnissen etwa das Verhalten einer Person – wie die Bereitschaft zu erneuter Gewalttätigkeit – seriös vorhersagen.

Die Ergebnisse eines Rorschach-Tests sind aber sehr stark vom jeweiligen Psychologen abhängig. Der beurteilt zunächst alle Antworten anhand von mehr als hundert Merkmalen oder Variablen. Er hält zum Beispiel fest, ob der Proband das gesamte Tintenklecks-Muster oder nur Teile davon ansah, ob die Bilder, die er entdeckte, im Vergleich zu den Deutungen der meisten getesteten Personen üblich oder unüblich waren, und ob Form oder eher Farbe bestimmte, was der Proband sah.

Anschließend werden diese Testergebnisse interpretiert und zu einem psychologischen Profil des Probanden zusammengestellt. Dabei kann der Beurteiler beispielsweise zu dem Schluss kommen, dass die Konzentration auf winzige Details wie verstreute Kleckse statt auf ganze Bilder Zwanghaftigkeit signalisiere, und dass das Erkennen von Objekten in den weißen Flecken innerhalb der größeren Tintenkleckse auf eine negative, widerspenstige Ader hindeute.

Eine hohe Reliabilität in der Bewertung einer Variablen setzt voraus, dass zwei verschiedene Auswerter mit hoher Wahrscheinlichkeit zu vergleichbaren Ergebnissen gelangen, wenn sie die Antworten derselben Person untersuchen. Neuere Studien zeigen jedoch, dass das nur bei etwa der Hälfte der untersuchten Merkmale zutrifft; bei den übrigen können die Auswerter zu ganz unterschiedlichen Ergebnissen kommen.

Analysen der Validität des Rorschach-Tests deuten zudem darauf hin, dass er sich nicht besonders gut zur Diagnose der meisten psychiatrischen Krankheitsbilder eignet. Entgegen den Behauptungen einiger Befürworter gelingt es unseres Erachtens mit diesem Verfahren nicht, Depression, Angststörungen oder eine durch Unehrlichkeit, Gefühllosigkeit und mangelndes Schuldbewusstsein gekennzeichnete psychopathische Persönlichkeit sicher zu diagnostizieren. Es gibt aber auch Ausnahmen von der Regel: Gut geeignet ist der Test wohl für Schizophrenie sowie andere durch Störungen des Denkens gekennzeichnete Krankheitsbilder, zum Beispiel bipolare Störungen wie die manische Depression.

Häufig soll der Rorschach-Test eine Neigung zu Gewalttätigkeit, kriminellem Verhalten und Störungen der Impulskontrolle beurteilen; doch die meisten Forschungsarbeiten deuten darauf hin, dass auch hier die Gültigkeit gering ist. Ebenso wenig gelang bisher der Nachweis, dass der Test geeignet sei, den sexuellen Missbrauch von Kindern festzustellen.

Inzwischen zeigen sich weitere problematische Seiten des Verfahrens. Es deutet viel darauf hin, dass die verwendeten Normwerte für psychische Gesundheit beziehungsweise Störungen die amerikanische Bevölkerung nicht repräsentativ wiedergeben, und dass viele Erwachsene und Kinder dementsprechend zu Unrecht als fehlangepasst beurteilt worden sind. Beispielsweise gelangte im Jahr 1999 eine Studie mit 123 erwachsenen Freiwilligen in einer kalifornischen Blutbank zu nicht akzeptablen Ergebnissen: Bei jedem sechsten Teilnehmer deuteten die Variablen auf eine Persönlichkeitsstörung hin.

Insbesondere bei Minderheiten dürften die Tintenklecks-Tests oft irren. Untersuchungen haben gezeigt, dass Afro-Amerikaner, Amerikaner indianischer Abstammung, solche aus Alaska, Hispano-Amerikaner sowie Mittel- und Südamerikaner deutlich anders auf die Bilder reagieren, als der Norm ent-spricht – die offensichtlich eher das Verhalten einer weißen Mehrheit spiegelt. Solche Studien lassen erhebliche Zweifel daran aufkommen, ob Rorschach-Tests in der psychotherapeutischen Praxis und bei Gericht verwendet werden sollten.

Ein weiteres projektives, nicht weniger problematisches Verfahren ist der thematische Apperzeptionstest (TAT). Dort werden die Probanden aufgefordert, zu insgesamt 31 Bildtafeln, auf denen mehrdeutige Szenen dargestellt sind, Geschichten zu erfinden. Zu den Motiven gehört ein Junge, der eine Geige betrachtet, eine aufgeregte Frau, die eine Tür zuschlägt und die eingangs erwähnte Darstellung eines Mannes und einer Frau; eine Karte ist als Inbegriff von Mehrdeutigkeit ganz leer.

Der TAT wurde auch schon als "Freude des Klinikers und Frust des Statistikers" bezeichnet, weil auch er kaum standardisiert ist: Jeder Kliniker legt seinen Probanden eine andere Anzahl und Auswahl von Bildern vor. Außerdem deuten die meisten von ihnen die Geschichten intuitiv, anstatt Regeln anzuwenden. Eine jüngere Studie zum TAT-Gebrauch an nordamerikanischen Jugend- und Familiengerichten, an der fast hundert Psychologen teilnahmen, ergab, dass nur drei Prozent von ihnen mit einem standardisierten Auswertungsverfahren arbeiten. Das ist sehr bedenklich, denn es deutet einiges darauf hin, dass bei intuitiver Interpretation vorschnell psychische Störungen diagnostiziert werden.

Aber auch standardisierte Regelwerke für die Auswertung sind alles andere als unbedenklich, denn einige weit verbreitete erwiesen sich bereits als wenig verlässlich: Oft unterscheiden sich ihre Ergebnisse von einer Sitzung zur nächsten. Auch die Validität dieser Verfahren bewerten einige Studien nicht sonderlich positiv.

Einige wenige der genormten Methoden gelten als Kandidaten, um zumindest Aspekte einer Persönlichkeit auseinander zu halten – insbesondere die Leistungsmotivation und die Wahrnehmung anderer Personen (eine Eigenschaft, die als "Objektbezug" bezeichnet wird). Häufig jedoch schneiden Personen, denen solch ein TAT eine hohe Leistungsmotivation bescheinigt, in echten Leistungstests schlecht ab. Offensichtlich erlaubt der TAT derzeit nur begrenzt, Verhalten vorherzusagen. Im Übrigen fehlen den Verfahren Normwerte, daher sind sie für den Einsatz außerhalb der Forschung ohnehin noch nicht geeignet.

Anders als beim Rorschach-Test und beim TAT, die fertige Bilder verwenden, sollen die Probanden bei einem dritten projektiven Ansatz diese selbst malen – Menschen, Häuser oder Bäume. Kliniker deuten dann in der Regel spezifische "Kennzeichen" wie Merkmale des Körpers oder der Kleidung einer Zeichnung als Ausdruck bestimmter Facetten der Persönlichkeit oder gar psychischer Störungen. Große Augen assoziieren sie beispielsweise mit Paranoia, lange Krawatten mit sexueller Aggression, Gesichter ohne Augen, Nase oder Mund als Hinweis auf eine Depression.

Auch hier besteht Anlass zu erheblichen Bedenken. Einigen Studien zufolge stimmen die Bewertungen weit gehend überein, andere kommen zum gegenteiligen Schluss. Schlimmer noch, es gibt keinen eindeutigen Beleg für die Gültigkeit der kennzeichengestützten Interpretation; mit anderen Worten, die Kliniker haben keinerlei Begründung für ihre Schlussfolgerungen und Diagnosen. Zum Beispiel fehlen widerspruchsfreie Belege für die Annahme, Darstellungen von Zungen oder Genitalien in Kinderbildern lieferten einen Hinweis auf sexuellen Missbrauch. Nachweisbar scheint lediglich, dass Personen, die Menschen nur sehr schlecht zu zeichnen vermögen, eine etwas erhöhte Rate an psychischen Störungen aufweisen. Aber auch dieses Ergebnis ist sehr kritisch zu bewerten, denn es gibt schlichtweg auch gesunde, aber künstlerisch nicht besonders begabte Menschen, die dann zu Unrecht in ein falsches Licht geraten.

Manche Befürworter argumentieren, es bedürfe eben praktischer Erfahrung, um solche Mal-Tests auszuwerten, doch auch zu diesem Votum gibt es eine kritische Untersuchung: Bei diesem Versuch gelang es Studenten besser, psychische Normalität von Anormalität anhand eines "Zeichne-einen-Menschen"-Tests zu un-terscheiden, als so genannten Experten.

Bessere Ergebnisse liefern Auswertungsverfahren, die nicht ein einzelnes Kennzeichen einer Zeichnung mit einem isolierten Persönlichkeitsmerkmal in Bezug setzen, sondern viele Aspekte zu einem allgemeinen Eindruck der Anpassungsfähigkeit der Persönlichkeit kombinieren. Mit einem solchen globalen Ansatz vermochten Psychologen beispielsweise in einer Untersuchung von 52 Kindern die normalen von solchen mit affektiven Störungen oder Angststörungen zu unterscheiden. In einer anderen Studie gelang es, normale Kinder und Heranwachsende von aggressiven oder extrem aufsässigen Altersgenossen abzugrenzen.

Unsere Metastudie unterstützt also den Vorwurf, Rorschach-Test, TAT und Zeichen-Test, so wie sie normalerweise angewandt werden, seien nur sehr eingeschränkt sinnvoll. Dasselbe gilt für viele andere projektive Verfahren, die wir hier nicht besprochen haben (siehe dazu den Kasten auf Seite 75). Wir fanden außerdem, dass die Verfahren, selbst wenn sie tatsächlich messen, was sie zu messen beanspruchen, kaum mehr Informationen liefern als kostengünstigere, eher praktisch orientierte Tests. So lassen sich durch klar umrissene Fragen wie "Ich denke oft daran, mich selbst zu verletzen – ja oder nein?" Diagnosen ebenso sicher, dafür aber schneller treffen.

Einige Fachleute widersprechen allerdings unseren Schlussfolgerungen. Sie argumentieren, projektive Verfahren hätten eine lange Erfolgsgeschichte und könnten, bei richtiger Anwendung, über die Selbstberichte der Probanden hinaus ein Bild ihres innersten Denkens und Fühlens vermitteln. Andere Kritiker bemängeln, wir hätten negative Ergebnisse überbetont sowie die positiven ausgelassen.

Dennoch vertrauen wir auf unsere Schlussfolgerungen, die unseres Erachtens sogar noch ein zu rosiges Bild zeichnen: Wissenschaftliche Zeitschriften veröffentlichen nämlich bekanntermaßen eher Berichte, in denen nachgewiesen wird, dass ein Verfahren funktioniert. Infolgedessen bleiben negative Daten und Studien mit nicht-signifikanten Ergebnissen eher in der Schublade.

Wir halten es deshalb für bedenklich, dass Psychologen projektive Verfahren oft bei Fragestellungen einsetzen, in denen ihr Wert nicht wissenschaftlich belegt ist. Allzu viel Schaden entsteht, wenn falsche Diagnosen Therapiepläne, Sorgerechtsentscheidungen oder Strafgerichtsurteile beeinflussen.

Literaturhinweise


The Scientific Status of Projective Techniques. Von Scott O. Lilienfeld, James M. Wood und Howard N. Garb. Verfügbar auf der Website: www.psychologicalscience.org/

Projective Measures of Personality and Psychopathology: How Well Do They Work? Von Scott O. Lilienfeld in: Skeptical Inquirer, Bd. 23, Nr. 5, Seite 32; September/Oktober 1999.

Evocative Images: The Thematic Apperception Test and the Art of Projection. Von Lon Gieser und Morris I. Stein (Hg.). American Psychological Association, 1999.


Vergeudete Tinte?


Es sieht aus wie zwei Dinosaurier mit riesigen Köpfen und winzigen Körpern. Sie bewegen sich voneinander weg, schauen aber rückwärts. Der schwarze Klecks in der Mitte erinnert mich an ein Raumschiff."

Der Rorschach-Tintenklecks-Test liefert "Röntgenbilder des Fühlens und Denkens", so der frühe Glaube. Auch heute noch ist er das berühmteste projektive psychologische Verfahren. Ein Untersucher zeigt einem Betrachter nacheinander zehn symmetrische Tintenklecks-Bilder in einer festgelegten Reihenfolge, und der Betrachter beschreibt jeweils seinen Eindruck. Fünf Tintenkleckse sind farbig, fünf sind schwarz und grau. Der Betrachter kann die Bilder drehen. Bei der Abbildung rechts handelt es sich übrigens um die gedrehte Wiedergabe eines Gemäldes von Andy Warhol; die "echten" Rorschach-Bilder werden nicht veröffentlicht (allerdings kursieren im Internet angeblich Abbildungen der Originale mit Vorschlägen für die Deutung).

Die Reaktionen auf die Tintenkleckse lassen nach Meinung der Befürworter verschiedene Aspekte der Persönlichkeit erkennen und geben Auskunft über die psychische Gesundheit des Probanden. So soll ein Erkennen sich bewegender Tiere – wie der genannten Dinosaurier – oft auf Impulsivität deuten, während Hinweise auf die "Schwärze" eines Kleckses – wie bei dem Raumschiff – eine Depression anzeigen könne.

Der Schweizer Psychiater Hermann Rorschach erhielt die Anregung für den Tintenklecks-Test wahrscheinlich durch ein europäisches Gesellschaftsspiel. Der Test erschien 1921 und war in der Zeit um 1945 weithin anerkannt. In den fünfziger Jahren wurde er sehr stark kritisiert, da Wissenschaftler feststellten, dass Psychologen dieselben Antworten oft unterschiedlich interpretierten, und dass bestimmte Antworten schlecht mit spezifischen psychischen Störungen oder Persönlichkeitsmerkmalen korrelierten.

Heutzutage wird zur Auswertung häufig das Rorschach Comprehensive System nach Exner eingesetzt, das diese Schwächen des Tests ausgleichen soll. Doch es wird aus denselben Gründen kritisiert wie der Test selbst. Außerdem deuten verschiedene neuere Ergebnisse darauf hin, dass das Exner-System viele Probanden zu Unrecht als pathologisch etikettiert.


Für manche Anwendungen geeignet


Der Rosenzweig P-F Test

Eine Comic-Figur äußert sich einer anderen gegenüber provozierend. Der Betrachter entscheidet, wie die zweite Person reagieren soll. Dieses Verfahren, das auch in dem Film Clockwork Orange zu sehen war, sagt Aggression bei Kindern zuverlässig voraus.

Die Satzergänzung

Die Probanden ergänzen einen Satz wie "Wenn ich könnte, würde ich ...". Die meisten Versionen sind nicht gut untersucht. Der von Jane Loevinger von der Universität Washington entwickelte Test misst jedoch zuverlässig bestimmte Aspekte der Ich-Entwicklung, wie Moralempfinden und Empathie.

 

Fragwürdige Verfahren

Der Foto-Hand-Test

Die Probanden geben an, was in unterschiedlichen Positionen dargestellte Hände ihrer Ansicht nach tun. Mit diesem Verfahren werden Aggressivität, Angst und andere Persönlichkeitsmerkmale erfasst. Es ist bisher allerdings noch nicht gut untersucht.

Die Handschriftenanalyse (Grafologie)

Die Bewerter orientieren sich bei der Beurteilung der Persönlichkeit des Schreibenden an bestimmten "Merkmalen" der Schrift. Das Verfahren ist zwar unbrauchbar, wird aber insbesondere zur Beurteilung von Stellenbewerbern immer noch verwendet.

Der Lüscher Farb-Test

Die Probanden ordnen farbige Karten nach ihrer Präferenz und geben dadurch angeblich ihre Persönlichkeitsmerkmale zu erkennen. Die meisten Studien beurteilen das Verfahren als wertlos.

Das Spiel mit anatomisch korrekten Puppen

Angeblich spielen sexuell missbrauchte Kinder oft mit den Genitalien von Puppen. Dieses Verhalten besitzt jedoch keine diagnostische Aussagekraft – viele nicht missbrauchte Kinder spielen ebenso.

Der Szonditest

Der Betrachter wählt aus Fotografien von Patienten mit verschiedenen psychiatrischen Störungen diejenigen aus, die ihm am besten und am wenigsten gefallen. Angeblich sagt die Auswahl der Bilder etwas über die Bedürfnisse des Probanden aus, diese Annahme wurde aber widerlegt.

Aus: Spektrum der Wissenschaft 1 / 2002, Seite 72
© Spektrum der Wissenschaft Verlagsgesellschaft mbH

Kennen Sie schon …

Spektrum - Die Woche – Welche Psychotherapie passt zu mir?

Studien zufolge erkrankt jeder fünfte bis sechste Erwachsene mindestens einmal in seinem Leben an einer Depression. Doch wie finden Betroffene eine Therapie, die zu ihnen passt? Außerdem in dieser Ausgabe: Kolumbiens kolossales Problem, der Umgang mit Polykrisen und die Übermacht der Eins.

Spektrum Kompakt – KI im Einsatz - Gekommen, um zu bleiben

Künstliche Intelligenz beantwortet längst nicht nur Fragen im Chat. Durch stetiges Lernen berechnet sie das Risiko zukünftiger Naturkatastrophen, entschlüsselt tierische Kommunikation und unterstützt die medizinische Diagnostik.

Spektrum - Die Woche – Gegen die Regeln

Dass das Standardmodell der Teilchenphysik Lücken aufweist, ist in der Fachwelt mittlerweile kein Geheimnis mehr, die Gründe für die häufigen Messabweichungen aber schon. Ursache könnten noch unbekannte Teilchen und Kräfte sein. Außerdem in der »Woche«: Bald schon Wasserstoffantrieb für Flugzeuge?

Schreiben Sie uns!

Beitrag schreiben

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Zuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Zuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmende sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Zuschriften können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

  • Infos
Psychological Science in the Public Interest -> www.psychologicalscience.org
Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.