Freistetters Formelwelt: Der Fluch der Dimensionalität

Alle Folgen seiner wöchentlichen Kolumne, die immer sonntags erscheint, finden Sie hier.
Den Begriff »Dimension« verbinden wir abseits der höheren Mathematik vermutlich vor allem mit den drei Dimensionen des physikalischen Raums: Länge, Breite und Tiefe. Eine eindimensionale Linie hat nur Länge, aber keine Breite und Tiefe. Zweidimensionale Objekte haben Länge und Breite, und erst eine dreidimensionale Struktur dehnt sich in alle Raumdimensionen aus.
Daran ist vorerst noch nichts weiter bemerkenswert und auch nichts, was die Bezeichnung »Fluch« verdient. Das Phänomen, dessen Name der US-amerikanische Mathematiker Richard Bellman geprägt hat, kann man durch diese Formel illustrieren:
Um sie zu verstehen, kann man sich eine Menge an Punkten vorstellen, die sich an verschiedenen Orten in einem Raum der Dimension d befinden. amax und amin sind der größte beziehungsweise kleinste Abstand, den man zwischen den Punkten finden kann. Vereinfacht gesagt bedeutet die Formel: Erhöht man die Anzahl der Dimensionen, dann verschwindet irgendwann der (relative) Unterschied zwischen der längsten und der kürzesten Distanz.
Das Phänomen ist bei niedrigen Dimensionen noch leicht nachzuvollziehen. Angenommen, wir wollen eine eindimensionale Linie gleichmäßig unterteilen und machen das mit 100 Markierungen: Wie viele Markierungen bräuchten wir, um eine Fläche mit der gleichen Genauigkeit zu unterteilen? Wenn die Fläche ein Quadrat ist, dessen Seitenlänge der Länge der Linie entspricht, benötigen wir 100 mal 100 Markierungen. Und bei einem entsprechend großen Würfel wären es 100 mal 100 mal 100. In der Mathematik (und auch bei vielen naturwissenschaftlichen Anwendungen) kann ein Raum aber auch problemlos mehr als drei Dimensionen haben. Einen zehndimensionalen Hyperwürfel müssten wir dann schon mit 10010 (= 1020) Markierungen unterteilen.
Probleme auch bei alltäglichen Untersuchungen
»Ja, und?«, könnte man sich jetzt fragen. So ist das eben mit den Dimensionen. Aber genau aus dieser Eigenschaft folgen mehrere »verfluchte« Phänomene. Die abstrakten Räume, mit denen man es bei vielen Anwendungen zu tun hat, haben oft erstaunlich viele Dimensionen. Will man zum Beispiel das Verhalten eines Systems aus 100 Teilchen (Atome eines Gases, Sterne in einem Haufen und so weiter) erforschen, dann braucht man ganz allgemein drei Zahlen, um ihre Position im Raum anzugeben, und drei weitere, um auch die Geschwindigkeiten zu beschreiben. Der Zustand des gesamten Systems entspricht also einem Punkt in einem 600-dimensionalen Raum – und seine zeitliche Entwicklung ist eine Kurve darin. Oder anders gesagt: Der abstrakte Raum ist riesig, und die konkreten Datenpunkte darin sind so dünn verteilt, dass sie quasi verschwinden.
Maschinelles Lernen arbeitet ebenfalls mit gigantischen Räumen. Ein Objekt (ein Bild, ein Text oder ein Messsignal) wird dort durch seine unterschiedlichen Eigenschaften beschrieben. Die Anzahl dieser Merkmale spannt einen entsprechend hochdimensionalen »Feature-Space«, in dem ein Lernalgorithmus arbeitet. Wenn dann zum Beispiel statistische Methoden angewendet werden, die darauf basieren, Zusammenballungen von Datenpunkten oder Ausreißer zu erkennen, schlägt der »Fluch der Dimensionalität« zu. Die üblichen Techniken erkennen dann schlicht nichts mehr. Angesichts der riesigen Ausmaße des Raums verliert jede Struktur in den Daten ihre Aussagekraft. Natürlich hat die Wissenschaft Möglichkeiten entwickelt, um mit diesen verfluchten Problemen umgehen zu können. Aber man muss sich des Fluchs dennoch immer bewusst sein.
Wir sind an unseren Alltag in drei Dimensionen gewöhnt. Aber in der Mathematik kann die Zahl der Dimensionen sehr schnell darüber hinausschießen, was wir uns noch anschaulich vorstellen können – und dort erwartet uns der »Fluch der Dimensionalität«.
Schreiben Sie uns!
Beitrag schreiben