Direkt zum Inhalt

Maschinelle Synthese neuer Ansichten eines Gesichts

Damit ein Computer ein Gesicht unter verschiedenen Blickwinkeln zeigen kann, muß er keineswegs dessen komplette dreidimensionale Struktur gespeichert haben; im Prinzip genügt schon eine einzige Photographie als Vorlage.

Wir Menschen können eine Person zum Beispiel anhand eines Paßbildes identifizieren, auch wenn wir ihr Gesicht unter einem anderen Blickwinkel sehen. Dies ist keineswegs selbstverständlich, weil die Richtungsänderung neue Bereiche sichtbar macht, während andere Regionen verdeckt werden. Soll ein Computer eine neue Ansicht eines Gesichtes synthetisieren, muß er also nicht nur die unter beiden Blickwinkeln sichtbaren Bereiche an die neue Position rücken, sondern auch vorher verborgene Abschnitte ergänzen. Da er darüber keinerlei direkte Informationen hat, muß er die fehlenden Teile aus Kenntnissen über die allgemeine Struktur von menschlichen Gesichtern erschließen.

Man kann einem Computer dieses Vorwissen beibringen, indem man ihm viele Aufnahmen von Gesichtern unter verschiedenen Blickwinkeln vorlegt und ihn so programmiert, daß er daraus gewissermaßen die zugrundeliegende Struktur extrahiert. Inwieweit ihm dies gelungen ist erweist sich daran, ob er anschließend selbst realistische Darstellungen von Gesichtern zu erzeugen vermag.

Bilder werden von Computern in einzelne Punkte (Pixel) aufgelöst. Damit der Rechner ein neues Gesicht synthetisieren kann, muß er die Pixel von vorhandenen Aufnahmen in bestimmter Weise miteinander verknüpfen. Einfaches Überlagern genügt dabei nicht: Meist liegen in verschiedenen Gesichtern Mund, Augen oder Nase nicht exakt an derselben Stelle, so daß bei einer bloßen Mittelung der Grauwerte an jedem Bildpunkt die Gesichtsteile doppelt erscheinen (Bild 1). Zunächst müssen die Bilder deshalb durch Verzerren geometrisch aneinander angeglichen werden. Ein gängiges, Morphing genanntes Verfahren besteht darin, korrespondierende Bildpunkte wie Nasenspitzen und Mundwinkel aufzusuchen und dann aufeinander abzubilden.

Solche markanten Punkte zu identifizieren und einander zuzuordnen ist für Computer nach wie vor eine äußerst schwierige Aufgabe. In den letzten Jahren konnten jedoch – vor allem durch den enormen Geschwindigkeitszuwachs bei der Hardware – bedeutende Fortschritte erzielt werden. Neue Verfahren zur Bildverarbeitung erlauben es unter bestimmten Bedingungen sogar schon, für jeden einzelnen Bildpunkt die Entsprechung im anderen Photo zu finden. Unter Aufrechterhaltung von Nachbarschaftsbeziehungen werden die Bilder dabei so lange verzerrt und deformiert, bis eine größtmögliche Ähnlichkeit zwischen ihnen erreicht ist.

Für Gesichter, die unter vergleichbaren Beleuchtungsverhältnissen aufgenommen wurden, läßt sich so eine korrekte Korrespondenz berechnen; allerdings dürfen keine kategorischen Unterschiede vorliegen – wie ein Bart in nur einem der beiden Gesichter. Ist erst einmal die Korrespondenz bestimmt, kann man kontinuierlich sämtliche Mischgesichter erzeugen. Wie natürlich sie wirken hängt nur von der Qualität der berechneten Korrespondenz ab.

Korreliert man auf diese Weise nicht nur zwei, sondern viele Gesichter miteinander, kann man sie auf alle möglichen Weisen kombinieren und so eine Unzahl neuer Varianten erzeugen. Im Prinzip läßt sich damit sogar jedes beliebige Gesicht darstellen, sofern die verwendeten Basisgesichter vielfältig genug sind; in welchem Ausmaß sie jeweils zu dem neuen Gesicht beitragen wird durch Gewichtsfaktoren festgelegt. Sind diese Faktoren bekannt und die entsprechenden Basisgesichter im Computer gespeichert, kann man das zugehörige Bild daraus jederzeit rekonstruieren.

Die Gewichtsfaktoren stellen mithin eine einfache Codierung des fraglichen Gesichtes dar. Wie Experimente von meinen Kollegen und mir am Max-Planck-Institut für biologische Kybernetik in Tübingen ergaben, genügen bereits 100 Basisgesichter, um ein beliebiges Gesicht zu codieren, sofern man sich auf den zentralen Bereich ohne Haare beschränkt (Bild 2).

Diese Art der Gesichtssynthese eröffnet nun auch eine einfache Möglichkeit, zu einem gegebenen Beispielgesicht eine neue Ansicht zu erzeugen. Nimmt man vereinfachend an, daß die Gewichtsfaktoren unabhängig von der Blickrichtung sind, kann man sie für das vorliegende Bild ermitteln und anschließend dazu verwenden, dieses Gesicht in einer neuen Orientierung zu synthetisieren. Dies setzt lediglich voraus, daß Bilder der Basisgesichter in beiden Orientierungen gespeichert sind.

Selbst spezifische Merkmale wie ein Muttermal, die in keinem der Basisgesichter vorhanden und somit nicht codierbar sind, können erhalten bleiben. Dazu benötigt man nur ein dreidimensionales Modell eines einzigen Basiskopfes. Wird das Korrespondenzproblem zu diesem Kopf gelöst, findet man zwar immer noch keine Entsprechung für das Muttermal, kann aber genau abschätzen, wo es zu liegen käme. Seine Position in der rotierten Ansicht läßt sich dann durch rein geometrische Berechnungen approximieren.

Die Synthese neuer Ansichten aus einem einzigen Photo ist nicht nur für das Anfertigen von Fahndungsbildern interessant, sondern hat auch große Bedeutung für die Filmindustrie. Mit dieser Morphingtechnik lassen sich aus einzelnen Aufnahmen komplette bewegte Filmsequenzen erstellen. Je breiter dabei das Spektrum der vorhandenen Basisgesichter, desto größer die Vielfalt der erzeugbaren Überlagerungen. Sollen Gesichter einer anderen Altersgruppe oder Rasse generiert werden, müssen selbstverständlich auch Beispiele dieser Personengruppe vorhanden sein.

Diese Einschränkung ist uns Menschen übrigens aus der eigenen Wahrnehmung wohlbekannt. So wirken Gesichter einer anderen Rasse – zum Beispiel Asiaten für Westeuropäer – einander oft sehr ähnlich und sind dadurch schwer unterscheidbar.


Aus: Spektrum der Wissenschaft 9 / 1996, Seite 25
© Spektrum der Wissenschaft Verlagsgesellschaft mbH

Schreiben Sie uns!

Beitrag schreiben

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Zuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Zuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmende sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Zuschriften können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.