Direkt zum Inhalt

News: Haben die Spürhunde im Datendschungel die Fährte verloren?

Das World Wide Web - für viele eine unerschöpfliche Quelle von Informationen. Um sich in dem Datendschungel zurechtzufinden, setzen die 'Surfer' Suchmaschinen ein, mit denen sie gezielt bestimmte Begriffe, Bilder und vieles andere abfragen können. Doch diese wichtigen Helfer können mit der rasenden Entwicklung des Webs nicht mithalten: Schon jetzt deckt die größte Suchmaschine unter zwanzig Prozent des Informationsangebotes ab.
Das World Wide Web (WWW), einer der Dienste des Internets, bietet eine unüberschaubare Menge an Informationen. Steve Lawrence und C. Lee Giles vom NEC Research Institute in Princeton schätzen in der Nature-Ausgabe vom 8. Juli 1999, daß heutzutage auf drei Millionen Servern ungefähr 800 Millionen Webseiten liegen – das ist mehr als das Doppelte ihrer Schätzung von 1997. Zu dieser Zahl gelangten die Forscher, indem sie zufällig 3,6 Millionen IP-Nummern – die eindeutigen "Adressen" der Webseiten – auswählten und sich ansahen, was sich so alles dahinter verbirgt. Diese Datenmenge belegt 15 Terabytes, wovon aber nur ein Drittel wirklich textlicher Inhalt ist. Außerdem finden sich im Web um die 180 Millionen Bilder.

Das Angebot im WWW besteht vorwiegend aus kommerziellen Informationen, nur sechs Prozent der Webseiten bieten wissenschaftliche oder bildungsorientierte Inhalte. Erstaunlicherweise zeigen nur 1,5 Prozent Pornographie – obwohl gerade diese Seiten häufig abgefragt werden, wie man aus anderen Untersuchungen weiß.

Angesichts dieser Zahlen wird klar, warum man so oft langwierig oder sogar vergeblich nach einer bestimmten Information sucht. Suchmaschinen wie Northern Light oder AltaVista sollen die "Surfer" dabei unterstützen. Lawrence und Giles nahmen in ihrer Untersuchung elf große Suchmaschinen genauer unter die Lupe. Sie starteten 1050 Abfragen vorwiegend im wissenschaftlichen Bereich, und wiederholten die Suchanfragen täglich über mehrere Wochen hinweg. Die Ergebnisse sind enttäuschend: Selbst Northern Light, welche die meisten Treffer erbrachte, erfaßte nur schätzungsweise 16 Prozent des gesamten Webs. Die anderen Suchmaschinen folgten mit 15,5 bis hinunter zu 2,2 Prozent. Auf neue oder überprüfte Webseiten muß man oft mehrere Monate warten. Dieser Zustand wird nach Meinung der beiden Forscher jedoch nicht lange anhalten. "Je mehr Information im Web verfügbar ist, desto langsamer wird es wachsen, und dann können die Suchmaschinen aufholen", sagt Lawrence.

Prozentualer Anteil am
gesamten Informationsangebot
Anzahl der Tage bis zum
Erscheinen eines neuen Dokuments
Northern Light16,0141
Snap15,5240
AltaVista15,5166
HotBot11,3192
Microsoft8,5194
Infoseek8,0148
Google7,8keine Angabe
Yahoo!7,4235
Excite5,6206
Lycos2,5174
EuroSeek2,2keine Angabe

Ergebnisse der Untersuchung von Lawrence und Giles, nach Nature, verändert

Faßt man alle Suchmaschinen zusammen, so decken sie immerhin über vierzig Prozent der Inhalte im WWW ab. Das spricht für den Einsatz von sogenannten Metasuchmaschinen wie MetaCrawler oder MetaGer, die gleichzeitig mehrere Suchmaschinen nutzen. Doch Quantität ist nicht unbedingt gleich Qualität: erhält man zuviele Treffer, folgt ein mühsames Auswählen der relevanten Information. Auch der Bekanntheitsgrad und die Art der Darstellung spielen bei der Auswahl der Suchmaschine eine Rolle. So ist Yahoo!, die nur den viertletzten Platz belegt, immer noch die beliebteste Suchmaschine im Web.

Siehe auch

Schreiben Sie uns!

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

Partnerinhalte

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.