Direkt zum Inhalt

Wissenschaftliches Publizieren: Zitationsindizes für die Massen!

Wohl und Wehe von Forschern hängen oft von ihrer publizistischen Wirkung auf andere ab. Doch um zu erfahren, wer wen zitiert, mussten Institute bislang viel Geld zahlen. Google und Microsoft ändern das nun. Aber stimmen ihre Daten?
Der Co-author Path Graph von Microsoft Academic SearchLaden...
Die internationale Forschungslandschaft könnte sich bald leichter kartieren lassen als je zuvor – dank kostenloser Software von Google und Microsoft. Sie soll Struktur in den Wust neuer Veröffentlichungen bringen. Wer zitiert wen wie oft? Wo arbeiten Gruppen an den gleichen Themen? Und welche Trends in der Welt der Wissenschaft sind gerade besonders angesagt?

Solche für Forscher und Geldgeber gleichermaßen eminent wichtigen Informationen lieferten bislang nur zwei Anbieter: das Web of Knowledge von Thomson Reuters und die Scopus-Datenbank von Elsevier. Und das auch nur gegen Bezahlung. Der neue Service richtet sich daher an all diejenigen, die nicht willens – oder schlicht nicht in der Lage – sind, für die bereits existierenden Angebote Geld zu zahlen.

Google hat im vergangenen Monat seinem akademischen Recherchetool "Google Scholar" den Dienst "Google Scholar Citations" (GSC) hinzugefügt. Mit ihm können Wissenschaftstreibende ein persönliches Profil anlegen, das all ihre Veröffentlichungen aufzählt. Darüber hinaus zeigt es an, wie oft die einzelnen Aufsätze im Laufe der Zeit von anderen zitiert wurden, und enthält andere gebräuchliche Indikatoren wie etwa den verbreiteten h-Index. Er bemisst sowohl die Produktivität eines Autors als auch seinen Einfluss auf andere. Derzeit läuft Googles Service noch in einer Beta-Phase, an der nur eingeladene Teilnehmer mitwirken dürfen. Demnächst soll die Software aber jedermann zur Verfügung stehen.

Der Co-author Path Graph von Microsoft Academic SearchLaden...
Ein "Citation Path Graph" von Microsoft Academic Search | Albert Einstein und Richard Feynman verbindet die indirekte Koautorenschaft über Niels Bohr, der sowohl mit Einstein publizierte als auch mit John C. Wheeler, der wiederum eine Arbeit mit Feynman veröffentlichte. Hier der Pfad zum Nachschauen.
Bereits schon etwas länger – seit dem Jahr 2009 – arbeitet Microsoft Academic Search (MAS), das in seiner Grundausstattung nach einem ähnlichen Prinzip wie GSC funktioniert. In den letzten Monaten spendierte Microsoft seinem Angebot jedoch noch eine Reihe raffinierter Zusatzfunktionen. Wer wen zitiert wird zum Beispiel als Netzwerk visualisiert, darüber hinaus gibt es eine Übersicht über thematische Trends und Ranglisten der führenden Forscherpersönlichkeiten in einem Feld.

Dünne Datenlage

Damit hat zwar Microsoft die schöneren Features, aber ob die Firma seinen Mitbewerber aussticht ist fraglich. Denn Google verfügt über die weitaus größere Datenbank, was nach Meinung von Experten alle Indizes genauer und verlässlicher macht. Google Scholar hat seit seinem Start im Jahr 2004 deutlich mehr Bücher und akademische Texte katalogisiert als Microsoft und sogar als das Web of Knowledge und Scopus. MAS liefert daher bei manchen Anfragen nur einen Bruchteil der tatsächlichen Veröffentlichungen eines Forschers, was immer wieder zu "absurd niedrigen" Maßzahlen führe, wie Péter Jacsó von der University of Hawaii in Honolulu beklagt.

"Microsoft Academic Search steckt noch in den Kinderschuhen", sagt auch Lee Dirks, Leiter der Abteilung für Bildung und wissenschaftliche Kommunikation bei Microsoft Research Connections, einem Zweig von Microsoft Research. Allerdings sei ihr Datenvolumen zwischen März und Juni dieses Jahres von 15,7 Millionen katalogisierten Veröffentlichungen auf 27,1 Millionen emporgeschnellt – und in diesem Tempo werde es laut Dirks auch weitergehen. Anne-Wil Harzing, die an der University of Melbourne Softwaretools entwickelt, mit denen sich verschiedene Zitationsindizes aus Google Scholar extrahieren lassen, bescheinigt Microsofts Dienst ein "großes Potenzial".

Andere Wissenschaftler sind skeptischer und zweifeln an der Philosophie beider Anwendungen. Sowohl Google als auch Microsoft überlassen dem Computer die Sammlung der bibliografischen Daten und deren Auswertung. Wirklich verlässliche Resultate erhalte nur, wer Menschen anschließend die Fehler ausmerzen und die Daten bereinigen lasse, meint etwa Jacsó. Die Textanalyseprogramme beider Anbieter seien erwiesenermaßen anfällig dafür, falsche bibliografische Daten auszuspucken [1]. Namen und Institutszugehörigkeiten seien mehrfach falsch interpretiert worden.

Laut Anurag Acharya, dem verantwortlichen Ingenieur hinter Scholar und der neuen Zitationsanalyse, seien diese Probleme jedoch seit Längerem gelöst. Überdies stehe eine Reihe kleinerer Anpassungen an, die das System "nach und nach immer besser" machen würden. Und Harzing ergänzt, Kritiker würden sich nur allzu gern auf krasse bibliografische Fehler stürzen. Ihren Schätzungen zufolge bewege sich die Fehlerrate in Wirklichkeit auf einem so niedrigen Niveau, dass einzelne Schnitzer bei fehlertoleranten Indizes wie dem h-Index nicht ins Gewicht fallen würden.

Mehr als nur Zeitschriften

Ein weiterer Vorteil von Google Scholar ist, dass es als einziges System neben Zeitschriftenartikeln sowohl Bücher als auch Konferenzbeiträge großflächig abdeckt. Gerade in den sozial- und geisteswissenschaftlichen Disziplinen gehören Bücher noch immer zu den wichtigsten Kommunikationsmitteln. Tagungsbände dagegen spielen vor allem in der Informatik und den Ingenieurswissenschaften eine Hauptrolle. Fehlten diese Publikationsformen, seien in den entsprechenden Feldern exakte Zitationsanalysen unmöglich, sagt Ton van Raan, Bibliometrieexeperte vom Zentrum für naturwissenschaftliche und technische Studien an der Universität Leiden. Hier könnte das Web of Knowledge bald nachziehen. Laut Joel Hammond, dem Leiter der Produktentwicklung bei Thomson Reuters, werden Tagungsbände bereits seit einiger Zeit katalogisiert. Ein Bücherindex soll noch in diesem Herbst folgen. Ähnliche Pläne verfolgt auch Scopus.

Bei all dem sehen sich weder GSC noch MAS als direkte Konkurrenten zu den etablierten Systemen. "Hier geht es nicht um Wettbewerb, sondern um eine offene Plattform für akademische Forschung", sagt Dirks. Der aus Indien stammende Acharya fügt hinzu, er verfolge ein humanitäres Ziel: Was zuvor nur Forschungseinrichtungen mit gut gefülltem Geldbeutel in Anspruch nehmen konnten, sollte nach Möglichkeit allen zur Verfügung gestellt werden. Er empfinde es als "befriedigend", dass laut den Serverprotokollen vor allem aus ärmeren Ländern auf Google Scholar zugegriffen werde, wo man sich kommerzielle Anbieter vielfach nicht leisten könne.

Laut Hammond sei Thomson Reuters allerdings sehr viel strenger als die freien Angebote bei der Auswahl der Publikationen, die katalogisiert werden. Aus diesem Grund seien auch die daraus errechneten Indizes verlässlicher. Eine ähnliche Vorgehensweise vertritt Scopus. Andere hingegen gehen davon aus, dass GSM und MAS über kurz oder lang Ergebnisse produzieren werden, die für die Bedürfnisse der meisten Benutzer ausreichen. "Ihr großer Vorteil ist, dass sie kostenlos zugänglich sind. Sofern die Entwicklung weitergeht, denke ich, dass sie das Potenzial haben werden, den kommerziellen Anbietern ernsthaft die Stirn zu bieten", meint Carl Bergstrom. Der Biologe von der University of Washington in Seattle arbeitet sowohl mit Microsoft Research als auch mit Thomson Reuters an der Auswertung von Zitationsdaten.

Van Raan stimmt dem zu: "Selbstverständlich werden die kommerziellen Anbieter den kostenlosen Diensten immer mehr ihren Rang streitig machen."
31. KW 2011

Dieser Artikel ist enthalten in Spektrum - Die Woche, 31. KW 2011

Lesermeinung

Beitrag schreiben

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Leserzuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Leserzuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmer sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Lesermeinungen können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

  • Quellen
[1] Jacsó, P.: Metadata mega mess in Google Scholar. In: Online Information Review 34, S. 175–191, 2010

Partnervideos