Direkt zum Inhalt

Das Auffinden von Bildern


Das geradezu explosiv wachsende Interesse am Internet weckten erst das World Wide Web und sein immenses Angebot an multimedialen Elementen, die von reproduzierten Kunstwerken bis zu pornographischen Photos das Spektrum menschlichen kreativen Schaffens abdecken. Um eine Datei im Internet zu finden, sind aber immer noch Zeichen in Suchmasken einzugeben.

So läßt sich mit den Worten "französische Flagge" die Darstellung der Trikolore nur finden, wenn eine Kennung der Datei oder der Web-Seite, in die sie aufgenommen ist, auch diese Wörter enthält. Wie ließe sich aber eine blau-weiß-rote Fahne suchen, ohne näheres zu wissen?

Im Idealfall sollte es dann möglich sein, ein Rechteck mit einem blauen, einem weißen und einem roten Feld zu zeichnen oder zu scannen und einer Suchmaschine zu übergeben, die daraufhin Web-Seiten mit dazu passenden Bildern anzeigt. In den vergangenen fünf Jahren haben neue Verfahren, die Schlüsselwort-Indizierung und Bildanalyse kombinieren, derartige Werkzeuge vorbereitet.

Das Programm WebSEEK der New Yorker Columbia-Universität illustriert die Vorgehensweise. Wie jeder Web-Crawler stöbert es im Internet nach Dateien und analysiert sie. So sucht es nach Hinweisen, daß es sich um Bilddaten handelt, insbesondere um Kennungen, die Graphik- beziehungsweise Videoformate bezeichnen. Auch wird der Dateiname daraufhin geprüft, ob er Hinweise auf den dargestellten Inhalt enthält. Eine detaillierte Untersuchung ermittelt, welche Farben wo in einem Bild vorkommen. Damit lassen sich bereits Photographien, Graphiken und Schwarzweiß- beziehungsweise Graubilder unterscheiden. Jedem so indizierten Bild wird zudem eine auf Symbolgröße verkleinerte Replik zugeordnet, die sich in einer Übersicht anzeigen läßt. Aus Videosequenzen extrahiert das Programm Einzelbilder.

Eine Suche läßt sich demgemäß nicht mit frei gewählten Schlüsselwörtern starten, sondern nur anhand einer vorgegebenen Liste. Wird aus diesem Menü beispielsweise der Begriff Katze gewählt, bietet das Programm eine Symbolsammlung für diese Kategorie an. Sind nur schwarze Katzen interessant, kann der Benutzer auf ein entsprechendes Bildsymbol klicken und so die Suche einengen. Anhand der zugehörigen Analyse werden nun Bilder mit ähnlichem Farbprofil ermittelt, und die nächste Symbolauswahl zeigt im wesentlichen schwarze Katzen; möglicherweise ergaben aber auch andersfarbige auf einem schwarzen Kissen eine in Frage kommende Farbverteilung. Der Benutzer kann die Suche nun weiter verfeinern, indem er bestimmte Farben ausschließt oder hinzufügt.

Bislang hat WebSEEK mehr als 650000 Bilder von Zehntausenden Web-Sites indiziert. Vergleichbare Projekte laufen beispielsweise an der Universität Chicago, der Universität von Kalifornien in San Diego, der Carnegie-Mellon-Universität in Pittsburgh (Pennsylvania), dem Massachusetts Institute of Technology in Cambridge und der Universität von Kalifornien in Berkeley.

Auch Unternehmen der Computerbranche wie IBM entwickeln Software zum Durchsuchen von Unternehmensnetzwerken oder Datenbanken nach Abbildungen. Von IBM stammt eine der ältesten Bildsuchmaschinen, Query by Image Content (QBIC). Sie liefert bessere Übereinstimmungen als beispielsweise WebSEEK und erkennt nicht nur Farben, sondern beurteilt auch die Struktur nach mehreren Kriterien wie Kontrast (etwa das Schwarzweiß von Zebrastreifen), Körnigkeit (Kieselsteine/Sand) und Ausrichtung (parallele Zaunlatten/rotationssymmetrische Blütenblätter). QBIC kann sogar einfache Formen erkennen. Setzt man einen rosafarbenen Punkt vor einen grünen Hintergrund, werden Photos von Blüten und anderen ähnlichen Formen mit diesen Farben angezeigt (Bild). Anwendungsmöglichkeiten reichen von der Auswahl von Tapetenmustern bis zur polizeilichen Identifizierung gesuchter Personen nach der Beschreibung ihrer Kleidung. Von den Firmen Excalibur und Interpixs stammt eine Bildsuch-Software für die Internet-Dienste Yahoo und Infoseek.

Alle diese Programme beruhen ausschließlich auf dem Vergleich visueller Merkmale. Sie benötigen immer noch einen menschlichen Begutachter – oder einen Begleittext – für die Entscheidung, ob es sich bei einem Bildelement um eine Katze oder um ein Kissen handelt. Seit mehr als zehn Jahren versuchen Forscher auf dem Gebiet der künstlichen Intelligenz, Computern diese Fertigkeit zu vermitteln. Dazu werden beispielsweise die Formen in einem Bild mit geometrischen Modellen realer Objekte in Verbindung gebracht. Aufgrund dieser Information soll das System dann erkennen, daß ein rosafarbener, zylindrischer Bildteil einen menschlichen Arm darstellen könnte.

Margaret M. Fleck von der Universität von Iowa in Iowa City und David A. Forsyth von der Universität von Kalifornien in Berkeley entwickelten ein solches Programm, das in digitalen Bildern von Menschen mit recht hoher Treffsicherheit unbekleidete erkennt. Dazu wird zunächst nach hautfarbenen Flächen gesucht und bei positivem Befund dann geprüft, ob sie zylindrischen Formen von Armen oder Beinen entsprechen könnten. Zur Bestätigung dafür, daß es sich um Extremitäten handelt, sucht der Algorithmus schließlich nach weiteren solchen Formen in bestimmten Winkeln zu den bereits identifizierten. Bei einem Test im vergangenen Herbst gelang es, in 4854 Testbildern 43 Prozent der Nackten auszumachen – ein ziemlich gutes Ergebnis für eine so komplexe Bildanalyse. Der Gegentest verlief ebenfalls erfolgreich: Auf 4289 Bildern ausschließlich bekleideter Personen wurden nur vier Prozent fälschlich als nackt gewertet. Die Aktaufnahmen stammten aus dem Web, die anderen aus einer kommerziellen Datenbank.

Dieses Beispiel zeigt freilich auch positive und negative Aspekte des Internet und der Suchmaschinen auf. Mit derartigen Werkzeugen ließe sich beispielsweise gezielt nach pornographischem Material forschen – sei es, um deren Anbieter dingfest zu machen, sei es, um diese Angebote zu nutzen.

Stix ist Mitglied der Redaktion von Scientific American.


Aus: Spektrum der Wissenschaft 5 / 1997, Seite 93
© Spektrum der Wissenschaft Verlagsgesellschaft mbH

Kennen Sie schon …

Spektrum der Wissenschaft – 10/2021

»Spektrum der Wissenschaft« berichtet über die neue Vermessung des Weltalls, die Fragen zur kosmische Expansion klären könnte. Außerdem im Heft: Biodiversität - Artenvielfalt, Mumien aus dem Salzbergwerk, Proteinfaltung - Durchbruch dank künstlicher Intelligenz.

Spektrum der Wissenschaft – Spezial Physik - Mathematik - Technik 3/2021: Algorithmen für die Zukunft

Algorithmen für die Zukunft - Beweisführung: Mathematiker aus Silizium • Arzneimittel: Automatisiert zu neuen Medikamenten • Neuronale Netze: Der gesunde Maschinenverstand

Spektrum Kompakt – Algorithmen im Alltag

Sie unterstützen bei der ärztlichen Diagnose, bringen Filmstars ins Kino, die nie am Set waren, steuern im Hintergrund, was wir als Empfehlungen auf unseren Monitoren sehen, und vieles mehr: Algorithmen, klar formulierte Abfolgen einzelner Schritte in Programmen, stecken überall in unserem Alltag.

Lesermeinung

Beitrag schreiben

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Leserzuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Leserzuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmer sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Lesermeinungen können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!