Viel sagen mit wenig Worten

News: Viel sagen mit wenig Worten

Vor gut fünfzig Jahren vermutete ein Linguist, dass die Häufigkeiten, mit denen Worte in der Sprache auftauchen, geprägt sind von einem Kompromiss zwischen Zuhörer und Sprecher. Nun machten sich zwei Forscher daran, diesen statistischen Zusammenhang zu beweisen.

Thorsten Krome

Die beliebtesten Wörter einer Sprache sind kurz. Im Deutschen führen so laut des Instituts für Deutsche Sprache in Mannheim die Begriffe "der", "die", "und", "in" und "den" die Top 30 000 der meist genutzten Wortformen an. Erst auf Platz 20 steht mit "eine" das erste mehrsilbige Wort. Und während sich die "Uhr" als erstes Substantiv immerhin noch auf Rang 56 retten kann, findet sich ein langes, umständliches Wortgebilde wie beispielsweise "Koalitionsverhandlungen" erst weit abgeschlagen auf Listenplatz 12 413.

Solch aufwändige Begriffe werden im Vergleich zu den Tabellenführern kaum noch benutzt. Während das kleine "der" immerhin gut drei Prozent eines Texts ausmacht, handelt es sich statistisch gesehen noch nicht einmal bei jedem 163 000. Wort um "Koalitionsverhandlungen". Das heißt also, wenige Wörter machen den Großteil eines Textes aus. 15 Prozent decken etwa die ersten zehn Platzierungen der deutschen Rangliste ab.

Bereits in den dreißiger Jahren beschäftigte sich der Linguist George Kingsley Zipf mit diesen sprachlichen Quantitäten und fand dabei eine in allen Sprachen geltende Gesetzmäßigkeit heraus, die in ihrer ursprünglichen Form etwa wie folgt lautet: Das Produkt aus Worthäufigkeit und Rang ist konstant.

Obwohl Zipf sein Gesetz schon früh entdeckte, blieb die Ursache dieser universellen Beziehung doch lange im Dunkeln. Zwar vermutete er, dass ein Prinzip der Aufwandsminimierung für Sprecher und Hörer dahinter stecken könnte, einen mathematischen Beweis blieb er jedoch schuldig.

Nun wandelten zwei Physiker von der Universitat Pompeu Fabra in Barcelona auf Zipfs Spuren. Ramon Ferrer i Cancho und Ricard Solé stellten im Rahmen der Informationstheorie eine so genannte Kostenfunktion auf, die den sprachlichen Aufwand sowohl des Sprechers als auch des Hörers berücksichtigte. Von dieser Funktion galt es, das Minimum zu suchen. Wenn Zipfs Vermutung richtig ist, müssten sich Sprecher und Hörer den Aufwand für die Kommunikation teilen und eine Zipf'sche Wortverteilung wie von selbst ergeben.

Aber was heißt überhaupt sprachlicher Aufwand? Nun, ein Zuhörer wird es schätzen, wenn der Redner vor allem Wörter mit klarer, spezifischer Bedeutung benutzt, die leicht voneinander zu unterscheiden sind. Mehrdeutige Begriffe erschweren hingegen das Verständnis. Für den Redner ist es jedoch deutlich einfacher, sich auf einen kleinen, überschaubaren Wortschatz aus unbestimmten, mehrdeutigen Begriffen zu beschränken. Außerdem wird er – wenn möglich – an Silben sparen, schließlich sinkt damit der Aufwand für die Artikulation. Die Interessen der Person, die etwas mitzuteilen hat, und des Zuhörers sind also sehr gegensätzlich. Doch inwieweit kommen sich die beiden Parteien entgegen?

Tatsächlich scheint Zipfs frühe Hypothese vom Prinzip der Minimalisierung des Aufwandes richtig zu sein, zumindest deutet das Modell von Ferrer i Cancho und Solé auf eine halbwegs gerechte Aufwandsverteilung bei der menschlichen Kommunikation hin. Und auch die Zipf'sche Verteilung ergibt sich direkt aus dem Modell. Sie kann somit als universelles Kennzeichnen menschlicher Sprache gelten und zeigt einmal mehr deren Sonderstellung gegenüber künstlichen Sprachen oder tierischen Kommunikationsformen.