Wissenschaftliches Publizieren: Zitationsindizes für die Massen!
Wohl und Wehe von Forschern hängen oft von ihrer publizistischen Wirkung auf andere ab. Doch um zu erfahren, wer wen zitiert, mussten Institute bislang viel Geld zahlen. Google und Microsoft ändern das nun. Aber stimmen ihre Daten?
Die internationale Forschungslandschaft könnte sich bald leichter kartieren lassen als je zuvor – dank kostenloser Software von Google und Microsoft. Sie soll Struktur in den Wust neuer Veröffentlichungen bringen. Wer zitiert wen wie oft? Wo arbeiten Gruppen an den gleichen Themen? Und welche Trends in der Welt der Wissenschaft sind gerade besonders angesagt?
Solche für Forscher und Geldgeber gleichermaßen eminent wichtigen Informationen lieferten bislang nur zwei Anbieter: das Web of Knowledge von Thomson Reuters und die Scopus-Datenbank von Elsevier. Und das auch nur gegen Bezahlung. Der neue Service richtet sich daher an all diejenigen, die nicht willens – oder schlicht nicht in der Lage – sind, für die bereits existierenden Angebote Geld zu zahlen.
Google hat im vergangenen Monat seinem akademischen Recherchetool "Google Scholar" den Dienst "Google Scholar Citations" (GSC) hinzugefügt. Mit ihm können Wissenschaftstreibende ein persönliches Profil anlegen, das all ihre Veröffentlichungen aufzählt. Darüber hinaus zeigt es an, wie oft die einzelnen Aufsätze im Laufe der Zeit von anderen zitiert wurden, und enthält andere gebräuchliche Indikatoren wie etwa den verbreiteten h-Index. Er bemisst sowohl die Produktivität eines Autors als auch seinen Einfluss auf andere. Derzeit läuft Googles Service noch in einer Beta-Phase, an der nur eingeladene Teilnehmer mitwirken dürfen. Demnächst soll die Software aber jedermann zur Verfügung stehen.
Dünne Datenlage
Damit hat zwar Microsoft die schöneren Features, aber ob die Firma seinen Mitbewerber aussticht ist fraglich. Denn Google verfügt über die weitaus größere Datenbank, was nach Meinung von Experten alle Indizes genauer und verlässlicher macht. Google Scholar hat seit seinem Start im Jahr 2004 deutlich mehr Bücher und akademische Texte katalogisiert als Microsoft und sogar als das Web of Knowledge und Scopus. MAS liefert daher bei manchen Anfragen nur einen Bruchteil der tatsächlichen Veröffentlichungen eines Forschers, was immer wieder zu "absurd niedrigen" Maßzahlen führe, wie Péter Jacsó von der University of Hawaii in Honolulu beklagt.
"Microsoft Academic Search steckt noch in den Kinderschuhen", sagt auch Lee Dirks, Leiter der Abteilung für Bildung und wissenschaftliche Kommunikation bei Microsoft Research Connections, einem Zweig von Microsoft Research. Allerdings sei ihr Datenvolumen zwischen März und Juni dieses Jahres von 15,7 Millionen katalogisierten Veröffentlichungen auf 27,1 Millionen emporgeschnellt – und in diesem Tempo werde es laut Dirks auch weitergehen. Anne-Wil Harzing, die an der University of Melbourne Softwaretools entwickelt, mit denen sich verschiedene Zitationsindizes aus Google Scholar extrahieren lassen, bescheinigt Microsofts Dienst ein "großes Potenzial".
Andere Wissenschaftler sind skeptischer und zweifeln an der Philosophie beider Anwendungen. Sowohl Google als auch Microsoft überlassen dem Computer die Sammlung der bibliografischen Daten und deren Auswertung. Wirklich verlässliche Resultate erhalte nur, wer Menschen anschließend die Fehler ausmerzen und die Daten bereinigen lasse, meint etwa Jacsó. Die Textanalyseprogramme beider Anbieter seien erwiesenermaßen anfällig dafür, falsche bibliografische Daten auszuspucken [1]. Namen und Institutszugehörigkeiten seien mehrfach falsch interpretiert worden.
Laut Anurag Acharya, dem verantwortlichen Ingenieur hinter Scholar und der neuen Zitationsanalyse, seien diese Probleme jedoch seit Längerem gelöst. Überdies stehe eine Reihe kleinerer Anpassungen an, die das System "nach und nach immer besser" machen würden. Und Harzing ergänzt, Kritiker würden sich nur allzu gern auf krasse bibliografische Fehler stürzen. Ihren Schätzungen zufolge bewege sich die Fehlerrate in Wirklichkeit auf einem so niedrigen Niveau, dass einzelne Schnitzer bei fehlertoleranten Indizes wie dem h-Index nicht ins Gewicht fallen würden.
Mehr als nur Zeitschriften
Ein weiterer Vorteil von Google Scholar ist, dass es als einziges System neben Zeitschriftenartikeln sowohl Bücher als auch Konferenzbeiträge großflächig abdeckt. Gerade in den sozial- und geisteswissenschaftlichen Disziplinen gehören Bücher noch immer zu den wichtigsten Kommunikationsmitteln. Tagungsbände dagegen spielen vor allem in der Informatik und den Ingenieurswissenschaften eine Hauptrolle. Fehlten diese Publikationsformen, seien in den entsprechenden Feldern exakte Zitationsanalysen unmöglich, sagt Ton van Raan, Bibliometrieexeperte vom Zentrum für naturwissenschaftliche und technische Studien an der Universität Leiden. Hier könnte das Web of Knowledge bald nachziehen. Laut Joel Hammond, dem Leiter der Produktentwicklung bei Thomson Reuters, werden Tagungsbände bereits seit einiger Zeit katalogisiert. Ein Bücherindex soll noch in diesem Herbst folgen. Ähnliche Pläne verfolgt auch Scopus.
Bei all dem sehen sich weder GSC noch MAS als direkte Konkurrenten zu den etablierten Systemen. "Hier geht es nicht um Wettbewerb, sondern um eine offene Plattform für akademische Forschung", sagt Dirks. Der aus Indien stammende Acharya fügt hinzu, er verfolge ein humanitäres Ziel: Was zuvor nur Forschungseinrichtungen mit gut gefülltem Geldbeutel in Anspruch nehmen konnten, sollte nach Möglichkeit allen zur Verfügung gestellt werden. Er empfinde es als "befriedigend", dass laut den Serverprotokollen vor allem aus ärmeren Ländern auf Google Scholar zugegriffen werde, wo man sich kommerzielle Anbieter vielfach nicht leisten könne.
Laut Hammond sei Thomson Reuters allerdings sehr viel strenger als die freien Angebote bei der Auswahl der Publikationen, die katalogisiert werden. Aus diesem Grund seien auch die daraus errechneten Indizes verlässlicher. Eine ähnliche Vorgehensweise vertritt Scopus. Andere hingegen gehen davon aus, dass GSM und MAS über kurz oder lang Ergebnisse produzieren werden, die für die Bedürfnisse der meisten Benutzer ausreichen. "Ihr großer Vorteil ist, dass sie kostenlos zugänglich sind. Sofern die Entwicklung weitergeht, denke ich, dass sie das Potenzial haben werden, den kommerziellen Anbietern ernsthaft die Stirn zu bieten", meint Carl Bergstrom. Der Biologe von der University of Washington in Seattle arbeitet sowohl mit Microsoft Research als auch mit Thomson Reuters an der Auswertung von Zitationsdaten.
Van Raan stimmt dem zu: "Selbstverständlich werden die kommerziellen Anbieter den kostenlosen Diensten immer mehr ihren Rang streitig machen."
Solche für Forscher und Geldgeber gleichermaßen eminent wichtigen Informationen lieferten bislang nur zwei Anbieter: das Web of Knowledge von Thomson Reuters und die Scopus-Datenbank von Elsevier. Und das auch nur gegen Bezahlung. Der neue Service richtet sich daher an all diejenigen, die nicht willens – oder schlicht nicht in der Lage – sind, für die bereits existierenden Angebote Geld zu zahlen.
Google hat im vergangenen Monat seinem akademischen Recherchetool "Google Scholar" den Dienst "Google Scholar Citations" (GSC) hinzugefügt. Mit ihm können Wissenschaftstreibende ein persönliches Profil anlegen, das all ihre Veröffentlichungen aufzählt. Darüber hinaus zeigt es an, wie oft die einzelnen Aufsätze im Laufe der Zeit von anderen zitiert wurden, und enthält andere gebräuchliche Indikatoren wie etwa den verbreiteten h-Index. Er bemisst sowohl die Produktivität eines Autors als auch seinen Einfluss auf andere. Derzeit läuft Googles Service noch in einer Beta-Phase, an der nur eingeladene Teilnehmer mitwirken dürfen. Demnächst soll die Software aber jedermann zur Verfügung stehen.
Bereits schon etwas länger – seit dem Jahr 2009 – arbeitet Microsoft Academic Search (MAS), das in seiner Grundausstattung nach einem ähnlichen Prinzip wie GSC funktioniert. In den letzten Monaten spendierte Microsoft seinem Angebot jedoch noch eine Reihe raffinierter Zusatzfunktionen. Wer wen zitiert wird zum Beispiel als Netzwerk visualisiert, darüber hinaus gibt es eine Übersicht über thematische Trends und Ranglisten der führenden Forscherpersönlichkeiten in einem Feld.
Dünne Datenlage
Damit hat zwar Microsoft die schöneren Features, aber ob die Firma seinen Mitbewerber aussticht ist fraglich. Denn Google verfügt über die weitaus größere Datenbank, was nach Meinung von Experten alle Indizes genauer und verlässlicher macht. Google Scholar hat seit seinem Start im Jahr 2004 deutlich mehr Bücher und akademische Texte katalogisiert als Microsoft und sogar als das Web of Knowledge und Scopus. MAS liefert daher bei manchen Anfragen nur einen Bruchteil der tatsächlichen Veröffentlichungen eines Forschers, was immer wieder zu "absurd niedrigen" Maßzahlen führe, wie Péter Jacsó von der University of Hawaii in Honolulu beklagt.
"Microsoft Academic Search steckt noch in den Kinderschuhen", sagt auch Lee Dirks, Leiter der Abteilung für Bildung und wissenschaftliche Kommunikation bei Microsoft Research Connections, einem Zweig von Microsoft Research. Allerdings sei ihr Datenvolumen zwischen März und Juni dieses Jahres von 15,7 Millionen katalogisierten Veröffentlichungen auf 27,1 Millionen emporgeschnellt – und in diesem Tempo werde es laut Dirks auch weitergehen. Anne-Wil Harzing, die an der University of Melbourne Softwaretools entwickelt, mit denen sich verschiedene Zitationsindizes aus Google Scholar extrahieren lassen, bescheinigt Microsofts Dienst ein "großes Potenzial".
Andere Wissenschaftler sind skeptischer und zweifeln an der Philosophie beider Anwendungen. Sowohl Google als auch Microsoft überlassen dem Computer die Sammlung der bibliografischen Daten und deren Auswertung. Wirklich verlässliche Resultate erhalte nur, wer Menschen anschließend die Fehler ausmerzen und die Daten bereinigen lasse, meint etwa Jacsó. Die Textanalyseprogramme beider Anbieter seien erwiesenermaßen anfällig dafür, falsche bibliografische Daten auszuspucken [1]. Namen und Institutszugehörigkeiten seien mehrfach falsch interpretiert worden.
Laut Anurag Acharya, dem verantwortlichen Ingenieur hinter Scholar und der neuen Zitationsanalyse, seien diese Probleme jedoch seit Längerem gelöst. Überdies stehe eine Reihe kleinerer Anpassungen an, die das System "nach und nach immer besser" machen würden. Und Harzing ergänzt, Kritiker würden sich nur allzu gern auf krasse bibliografische Fehler stürzen. Ihren Schätzungen zufolge bewege sich die Fehlerrate in Wirklichkeit auf einem so niedrigen Niveau, dass einzelne Schnitzer bei fehlertoleranten Indizes wie dem h-Index nicht ins Gewicht fallen würden.
Mehr als nur Zeitschriften
Ein weiterer Vorteil von Google Scholar ist, dass es als einziges System neben Zeitschriftenartikeln sowohl Bücher als auch Konferenzbeiträge großflächig abdeckt. Gerade in den sozial- und geisteswissenschaftlichen Disziplinen gehören Bücher noch immer zu den wichtigsten Kommunikationsmitteln. Tagungsbände dagegen spielen vor allem in der Informatik und den Ingenieurswissenschaften eine Hauptrolle. Fehlten diese Publikationsformen, seien in den entsprechenden Feldern exakte Zitationsanalysen unmöglich, sagt Ton van Raan, Bibliometrieexeperte vom Zentrum für naturwissenschaftliche und technische Studien an der Universität Leiden. Hier könnte das Web of Knowledge bald nachziehen. Laut Joel Hammond, dem Leiter der Produktentwicklung bei Thomson Reuters, werden Tagungsbände bereits seit einiger Zeit katalogisiert. Ein Bücherindex soll noch in diesem Herbst folgen. Ähnliche Pläne verfolgt auch Scopus.
Bei all dem sehen sich weder GSC noch MAS als direkte Konkurrenten zu den etablierten Systemen. "Hier geht es nicht um Wettbewerb, sondern um eine offene Plattform für akademische Forschung", sagt Dirks. Der aus Indien stammende Acharya fügt hinzu, er verfolge ein humanitäres Ziel: Was zuvor nur Forschungseinrichtungen mit gut gefülltem Geldbeutel in Anspruch nehmen konnten, sollte nach Möglichkeit allen zur Verfügung gestellt werden. Er empfinde es als "befriedigend", dass laut den Serverprotokollen vor allem aus ärmeren Ländern auf Google Scholar zugegriffen werde, wo man sich kommerzielle Anbieter vielfach nicht leisten könne.
Laut Hammond sei Thomson Reuters allerdings sehr viel strenger als die freien Angebote bei der Auswahl der Publikationen, die katalogisiert werden. Aus diesem Grund seien auch die daraus errechneten Indizes verlässlicher. Eine ähnliche Vorgehensweise vertritt Scopus. Andere hingegen gehen davon aus, dass GSM und MAS über kurz oder lang Ergebnisse produzieren werden, die für die Bedürfnisse der meisten Benutzer ausreichen. "Ihr großer Vorteil ist, dass sie kostenlos zugänglich sind. Sofern die Entwicklung weitergeht, denke ich, dass sie das Potenzial haben werden, den kommerziellen Anbietern ernsthaft die Stirn zu bieten", meint Carl Bergstrom. Der Biologe von der University of Washington in Seattle arbeitet sowohl mit Microsoft Research als auch mit Thomson Reuters an der Auswertung von Zitationsdaten.
Van Raan stimmt dem zu: "Selbstverständlich werden die kommerziellen Anbieter den kostenlosen Diensten immer mehr ihren Rang streitig machen."
Schreiben Sie uns!
Beitrag schreiben