Arvind Narayanan und Vitaly Shmatikov von der University of Texas in Austin haben einen Algorithmus entwickelt, der anonymisierte Datensätze über die Benutzer sozialer Online-Netzwerke, wie beispielsweise Facebook, Twitter und MySpace, abgleicht und Anwender "re-identifiziert". Letztere geben also womöglich mehr von sich preis, als ihnen bewusst ist.

Damit der Algorithmus erfolgreich sein kann, müssen zunächst einige Dutzend Profile sowohl in dem zu attackierenden Netzwerk als auch in einem zweitem, dem "Hilfsnetzwerk" aufgespürt werden, die jeweils beide einer Person gehören. Realisieren ließe sich der erste Schritt durch Hacker relativ leicht mit Hilfe von speziellen Programmen. Noch simpler sei es, eigene Profile im Netzwerk zu verankern und entsprechend zu analysieren. Die erhaltenen Beziehungen können grafisch dargestellt und in den Algorithmus eingefüttert werden.

Soziales Netzwerk
© Zinken
(Ausschnitt)
 Bild vergrößernSoziales Netzwerk
Nur auf Grundlage der Netzwerkstruktur durchforstet dieser dann die anonymen Daten einer Plattform mittels eines Hilfsdatensatzes, der von einer anderen Plattform stammt, nach übereinstimmenden Mustern und erweitert die anfängliche Karte der Verknüpfungen. Da bei mehreren Plattformen angemeldete Nutzer auf ihren Profilen in der Regel zumindest teilweise auf dieselben Personen verlinken, kann das Programm herausfinden, welche Konten vermutlich von ein und derselben Person betrieben werden. Als Grundlage dienten hierfür vermeintlich anonymisierte Datensätze, welche die Betreiber der sozialen Netzwerke an Werbefirmen verkaufen.

Narayanan und Shmatikov testeten ihren Algorithmus konkret bei Anwendern, die sowohl Twitter als auch Flickr nutzen. Immerhin rund 30 Prozent der auf beiden Netzwerken vertretenen Benutzer konnten sie aus anonymisierten Datensätzen von Twitter wieder identifizieren; nur 12 Prozent stimmten fälschlicherweise überein. Bei größeren Netzwerken erwarten die beiden Wissenschaftler noch bessere Ausbeuten.

Für Werbetreibende, aber auch für Regierungsbehörden könnten derartige erfolgreiche Datensammlungen von großem Interesse sein, spekulieren Narayanan und Shmatikov und fordern, dass die Anbieter solcher Netzwerke ihre Geschäftspraktiken überdenken und dem Anwender bessere Möglichkeiten bieten, seine Privatsphäre zu schützen. (mp)