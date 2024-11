In den 1930er Jahren stolperte der Linguist George Kingsley Zipf über einen unerwarteten Zusammenhang. Er untersuchte, wie häufig welche Wörter in verschiedenen Texten vorkommen – und fand dabei stets das gleiche Muster vor. Einfache, kurze Wörter wie »die«, »der« oder »und« tauchen doppelt so häufig auf wie etwas längere Begriffe wie »aber«, »doch« und »kann«. Dieses Potenzgesetz ist inzwischen als Zipfsches Gesetz bekannt und lässt sich in allerlei verschiedenen Sprachen beobachten. So macht im Englischen der Artikel »the« etwa sieben Prozent eines langen Textes aus, während das zweithäufigste Wort »of« ungefähr halb so oft vorkommt. Nun haben Forscher um Andrei Constantin von der University of Oxford das Zipfsche Gesetz auch bei mathematischen Symbolen in physikalischen Formeln gefunden. Ihre Ergebnisse haben sie im August 2024 in einer noch nicht begutachteten Arbeit veröffentlicht.

Constantin und sein Team haben dafür Formeln aus drei verschiedenen Quellen untersucht: »The Feynman Lectures on Physics«, einer Lehrbuchreihe des US-amerkanischen Physikers Richard Feynman aus den 1960er Jahren; der Wikipedia-Seite »List of scientific equations named after people« und der »Encyclopaedia Inflationaris«, einem Übersichtsartikel über das Gebiet der Inflation in der Kosmologie. Diese drei Quellen unterscheiden sich stark voneinander. Die Vorlesungen von Feynman decken ein breites Feld der Physik ab – von klassischer Mechanik und Elektrodynamik bis hin zu Quantenphysik – und enthält mehr als 100 Gleichungen, während die Wikipedia-Sammlung teilweise sehr spezifische und nicht allzu verbreitete Formeln beschreibt. Die »Encyclopaedia Inflationaris« stellt wiederum 71 verschiedene Potenziale vor, die unser Universum kurz nach dem Urknall auseinandergetrieben haben könnten.

Indem sie jedes mathematische Symbol und jede physikalische Größe einer Formel wie einzelne Wörter innerhalb eines Textes behandelten, haben die Forscher eine Form des Zipfschen Gesetzes vorgefunden. Dabei haben sie jedoch nur Formeln berücksichtigt, die keine Ableitungsoperatoren oder Integrale enthalten. Ihrer Analyse zufolge ist die Häufigkeit N der einzelnen Symbole in den ersten beiden Datensätzen proportional zu e-r/3 ≈ 0,72r, wobei r die dazugehörige Rangfolge beschreibt. Das heißt, das häufigste Symbol taucht etwa 1,4-mal öfter auf als das zweithäufigste und knapp doppelt so häufig wie das dritthäufigste. Die »Encyclopaedia Inflationaris« weist eine leicht unterschiedliche Gesetzmäßigkeit vor: Dort skaliert die Häufigkeit N mit e-r/4 ≈ 0,79r.