90 000 Stunden Video, 140 000 Stunden Audio, 200 Terabyte Daten: Das sind die technischen Eckdaten einer der außergewöhnlichsten Studien zum Spracherwerb eines Kinds. Drei Jahre lang zeichnete Deb Roy vom MIT Media Lab alles auf, was in den Räumen seines eigenen Zuhauses vor sich ging. Nichts entging den an der Decke fest installierten Kameras und Mikrophonen. Ziel des Unternehmens: genau zu erfassen, welche Ausdrücke sein Sohn in welchen Situationen hörte – und welche Wörter er daraufhin erlernte.

Nun hat das Team um Roy erste Schlüsse aus den Aufzeichnungen gezogen. Sie klopften zahlreiche Faktoren darauf ab, ob sie den Erwerb eines gegebenen Worts wahrscheinlicher machen oder nicht. Viele davon waren offensichtlich, beispielsweise erlernte das Kind (komplexe) längere Wörter im Schnitt später als kurze. Drei Faktoren stachen allerdings besonders heraus. Die Forscher bezeichnen sie als "Distinktivität": Je ausgeprägter ein Wort an eine bestimmte Situation gebunden war, desto früher tauchte es im Wortschatz des Kinds auf.

Ein typisches Beispiel für ein solches Wort ist "Ball", das beim Ballspielen häufig verwendet wird, sonst aber eher selten. Das Wort "mit" hingegen erscheint zwar insgesamt viel häufiger, ist aber nicht an eine eigene Situation gebunden.

Roy und Kollegen sehen darum eine bereits länger bekannte Lerntheorie bestätigt, der zufolge ein Kind in vorhersehbaren und häufig wiederkehrenden Situationen wesentlich leichter auf die Bedeutung eines Ausdrucks schließen kann. Die enorme Datenmenge, die Roy ansammelte, macht es erstmals möglich, solche Überlegungen genau zu überprüfen.

In 15 Monaten lernte das Kind 679 Wörter

Sie konzentrierten sich dazu auf die Zeit zwischen dem neunten Monat und dem zweiten Geburtstag des Kinds und pickten sich alle Situationen heraus, in denen es wach und zu Hause war. Alle Äußerungen, die Kind und Erwachsene währenddessen tätigten, wurden anschließend von einer Mannschaft von 70 Hilfskräften transkribiert – zwar mit Unterstützung eines Computers, doch im Wesentlichen per Hand. Insgesamt zwei Millionen einzelne Äußerungen umfasst die dabei entstandene Datenbank.

Gleichzeitig analysierte eine Software die Bewegungen der abgefilmten Personen und identifizierte "Aktivitätshotspots", in denen Personen miteinander agierten. Für jedes einzelne der 679 Wörter, die Roys Sohn im Lauf der Studie lernte und benutzte, können die Forscher angeben, wann, wo und unter welchen Umständen er es zum ersten Mal verwendete; und mehr noch: Auch wie oft und in welchem Zusammenhang es unter den gleichen Umständen früher bereits gefallen ist, verrät die Datensammlung.

Die "Distinktivität" eines Worts kalkulierten sie räumlich, zeitlich und sprachlich. Für Letzteres fragten sie, ob ein Ausdruck bevorzugt im Zusammenhang mit einem bestimmten Thema auftaucht. Alle drei Faktoren statistisch kombiniert sagten das erste Auftauchen eines Worts besser voraus als weniger spezifische Merkmale, wie etwa dessen reine Häufigkeit in der Sprache der Eltern.

Die Wissenschaftler haben ihre Rohdaten in Teilen öffentlich gemacht und ermutigen nun auch andere, nach besseren statistischen Analysen zu suchen. Unter "wordbirths.stanford.edu" kann man die Berechnungen und Ergebnisse genauer in Augenschein nehmen und sich zum Beispiel nach Wortarten aufschlüsseln lassen.

Übertragbar auf andere Kinder?

Freilich ist den Wissenschaftlern bewusst, dass sich aus der Untersuchung eines einzelnen Kinds nur begrenzt verallgemeinerbare Aussagen gewinnen lassen. Da die einfachen Zusammenhänge, die sie beobachteten, jedoch bei allen Wörtern relativ deutlich zu Tage getreten seien, sind sie zuversichtlich, dass die Ergebnisse im Wesentlichen auf andere Kinder übertragbar sind. Ohnehin werden sich wohl in absehbarer Zeit nicht sehr viele weitere Eltern finden, die mit dem großen Lauschangriff auf ihren Nachwuchs einverstanden sind – zumal die Auswertung derzeit nur mit erheblichem finanziellen Einsatz zu stemmen ist. Wie Roy in einem interessanten "TED-Talk" erklärt, sollen die Analysetechniken jedoch auch auf andere sprachliche (und mediale) Phänomene anwendbar sein, etwa die Verwendung bestimmter Ausdrücke im US-amerikanischen Fernsehen.

Seine Studie am eigenen Sohn lässt zudem einen wesentlichen Aspekt unberücksichtigt, wie die Wissenschaftler selbst einräumen: Die erste Verwendung eines Worts muss nicht einmal annähernd mit dem Zeitpunkt zusammenfallen, ab dem das Kind den entsprechenden Ausdruck verstehen kann und gelernt hat. In aller Regel verfügen Kinder schon wesentlich früher über ein passives Sprachverständnis und setzen dies erst allmählich in aktiven Sprachgebrauch um. Dennoch stehen die Chancen gut, dass dieser so außergewöhnliche Datenschatz der Spracherwerbsforschung einzigartige Einsichten ermöglichen wird.