Direkt zum Inhalt

News: Gleich und gleich gesellt sich gern

Das Internet entwickelt einen Gemeinschaftssinn. Denn thematisch ähnliche Seiten verweisen aufeinander und geben dem Netz damit eine spontan selbst organisierte Struktur. Die Kenntnis dieser Communities könnte helfen, anstößige Inhalte herauszufiltern oder Suchanfragen zu optimieren.
Idealvorstellung zweier Gemeinschaften im Internet
Über vier Milliarden Seiten gibt es mittlerweile im Internet und längst hat sich ein Großteil von ihnen zu Gemeinschaften zusammengefunden - ohne es jedoch je so definiert zu haben.

Ihre gemeinschaftlichen Bande haben sie durch so genannte "Hyperlinks" geknüpft. Mit diesen Verweisen machen sie aufeinander aufmerksam, meist weil sie ähnliche oder weiterführende Inhalte bieten.

Der geübte Internet-Surfer stößt daher immer wieder auf solche Gemeinschaften und weiß sie zu nutzen. So dienen ihm Suchmaschinen wie Google und Yahoo! bei der Suche nach Informationen oft nur als Einstieg. Hat er dort einmal eine passende Seite gefunden, folgt er nicht selten lieber deren Links - denn wer eine gutes Internet-Angebot erstellt, der wird höchstwahrscheinlich auch wieder auf qualitativ wertvolle Seiten verweisen.

Gary Flake und seine Kollegen vom NEC Research Institute in Princeton haben nun einen Algorithmus entwickelt, der solche Gemeinschaften erkennt. Die Suchfunktion konzentriert sich dabei im Gegensatz zu anderen Suchmaschinen lediglich auf die Links und nicht direkt auf den textlichen Inhalt.

Sie definierten dabei, dass eine Community aus Internet-Seiten besteht, die mehr Links auf Seiten innerhalb der Gemeinschaft als auf Seiten außerhalb haben.

In ihren Testläufen wählten die Forscher als Anfangspunkte die Homepages dreier weltberühmter Wissenschaftler - des Biologen Francis Crick, des Astrophysikers Stephen Hawking und des Informatikers Ronald Rivest. Nach der Suche verglichen sie die Inhalte der Seiten, die nun zu den jeweiligen Gemeinschaften gerechnet wurden, und stellten überaus sinnvolle Zusammenhänge fest. So fanden sich beispielsweise in der Gemeinschaft um Francis Crick Verweise auf Pioniere der Genforschung, also Wegbereiter und Wegbegleiter des Nobelpreisträgers.

Als nächstes will das Team um Gary Flake nun Gemeinschaften im Netz finden und eingrenzen, ohne den Fokus schon vorher durch eine bewusst gewählte Startseite vorzugeben. Nur so können sie auch unerwartete Gemeinschaften erkennen und ihr Ziel erreichen, das gesamte Internet in Gruppen zusammenzufassen.

Sind diese Communities erst einmal eingegrenzt und abgegrenzt, lassen sie sich auch besser ausgrenzen. Bislang durchsuchen Filter das Netz lediglich nach bestimmten Reizwörtern, um pornografische oder andere anstößige und nicht jugendfreie Internet-Seiten zu erkennen. Dadurch sind sie aber noch leicht auszutricksen.

Außerdem erhoffen sich die Forscher innerhalb klar abgesteckter Bereiche eine effektivere Themensuche. Auf ihrer eigenen Homepage geben sie dafür auch schon ein passendes Beispiel. Ihr Algorithmus hat einer Gemeinschaft mit Themen zum 11. September insgesamt 6257 Internetseiten zugeordnet. Will man sich nun beispielsweise über Osama Bin Laden informieren, stünde man bei einer normalen Suchmaschine vor dem Problem, dass es noch einige andere Schreibweisen gibt: Oussama Bin Ladin oder Usama Bin Laden beispielsweise.

Innerhalb der Community zeigt eine Suchanfrage "Bin" nun fast ausschließlich Material zu dem gesuchten Terroristenführer - und zwar ohne störende deutschsprachige Seiten, auf denen irgendwo "ich bin" steht, oder englischsprachige, die irgend etwas mit Behältern, Kästen oder Bunkern zu tun haben. Und wer sich an die Schreibweise des BKA "Usama Ben Ladin" hält, wird hier wohl auch keine Seiten über "Ben Becker" oder "Uncle Ben" antreffen.

Flake betont, dass die neue Suchfunktion keine Konkurrenz für die herkömmlichen Suchmaschinen darstellen wird, sie jedoch durchaus sinnvoll ergänzen könnte. Sie könne vor allem helfen, Leute mit gemeinsamen Interessen noch näher zusammen zu bringen.

Schreiben Sie uns!

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

Partnerinhalte

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.