‹Open Citation Data› und ‹Reference Linking›

‹Open Citation Data› und ‹Reference Linking›

Read this post in English

Zitate sind in der Wissenschaft von zentraler Bedeutung, sei es in der Methodik, der Wissenschaftsevaluation oder schlicht für die Informationsbeschaffung. Open-Science-Initiativen ist es in den letzten Jahren gelungen, Zitationsdaten für die allgemeine Nutzung zu öffnen. – Was sind offene Zitationsdaten? Wie werden sie zur Verfügung gestellt? Und wie kommen sie zur Anwendung?

Zitate sind ein zentrales Element der wissenschaftlichen Arbeit. Mit Referenzen auf Literatur, Quellen oder Daten knüpfen Forschende an den Erkenntnisstand an, sie belegen ihre Argumentation, ermöglichen deren Überprüfung und verankern ihre Forschung wissenschaftsgeschichtlich.

In der Szientometrie sind Zitate die Variablen bibliometrischer Analysen. Auf ihrer Basis wird der im Publikationswesen und der Wissenschaftsevaluation wirkmächtige Impact-Faktor berechnet.

Selbstredend sind bibliografische Referenzen auch für die Informationsbeschaffung wichtige Ressourcen. Die zitierte Literatur in einschlägigen Texten nachzuverfolgen, ist eine der effektivsten Recherchestrategien, die im Kontext von ‹Linked (Open) Data› zusätzlich an Effizienz gewinnt. (Klein 2017, S. 127–128; Baykoucheva 2022, S. 12–15)

Vor diesem Hintergrund kommt den Zitationen auch unter dem Paradigma der ‹Open Science› grosse Bedeutung zu. So wurden in den letzten Jahren vielseitige Anstrengungen unternommen, Zitationsdaten möglichst umfassend und schrankenlos zugänglich zu machen – mit Erfolg.

I4OC etabliert offene Zitationen

Bis vor Kurzem waren es im Wesentlichen zwei kostenpflichtige Dienste, die über verlässliche und auswertbare Daten zu Zitationen in Zeitschriftenartikeln verfügten: das ‹Web of Science› der Firma Clarivate und ‹Scopus› von Elsevier. Die beiden Datenbanken sind für viele Disziplinen wichtige Rechercheplattformen und sind über viele Jahre die Basis zur Berechnung der bekanntesten bibliometrischen Kennzahlen gewesen. (Schiermeier 2017)

Die Universitätsbibliothek Zürich und die Zentralbibliothek Zürich lizenzieren die Dienste Web of Science und Scopus für die Angehörigen der Universität Zürich.

Das ‹Web of Science› und dessen Vorgängerdienste leisteten Pionierarbeit in der Vernetzung und Analyse von Zitationsdaten. Doch das teure Subskriptions-Modell schliesst viele Universitäten und Forschende davon aus, die Daten für wissenschaftliche Innovation zu nutzen und Metriken zu berechnen und zu verifizieren. Zu Gunsten der Reproduzierbarkeit von Wissenschaft und einer nachvollziehbaren szientometrischen Bewertung von Forschung wuchs im Zuge einer zunehmend offenen Wissenschaftskultur die Überzeugung, dass ein gleichberechtigter Zugang zu bibliografischen Zitationsdaten geboten ist. Deshalb haben inzwischen verschiedene Akteur:innen ihre Zitationsdaten frei zugänglich gemacht.

Ein wichtiger Impuls dafür ging von der Non-Profit-Organisation ‹OpenCitations› aus. Diese stellt ein Datenmodell und Infrastrukturen – namentlich Indizes – für offene Zitationsdaten zur Verfügung. ‹OpenCitations› ist überdies zusammen mit ‹Wikidata› und weiteren Initiantinnen Gründerin der 2017 gestarteten ‹Initiative for Open Citations› (I4OC). Mit dieser Initiative gelang es binnen weniger Jahre, die grossen Wissenschaftsverlage zu überzeugen, die Referenzdaten ihrer Publikationen freizugeben. Inzwischen verzeichnet ‹OpenCitations› wichtigster Zitationsindex, COCI, bereits weit über eine Milliarde Zitationsdatensätze. (Shotton 2018)

Die Universitätsbibliothek Zürich, die Zentralbibliothek Zürich und weitere Schweizer Hochschulbibliotheken unterstützen ‹OpenCitations› im Rahmen des Crowdsourcings der ‹Global Sustainability Coalition for Open Science Services› (SCOSS).

Was ist ein offenes Zitat?

In den Indizes von ‹OpenCitations› werden die Zitationen nicht nur als Links registriert, sondern als eigenständige Dateneinheiten mit beschreibenden Eigenschaften. Dazu gehören etwa die digitalen Identifikatoren der zitierenden und der zitierten Literatur, das Erstellungsdatum der Zitation, sowie die Angabe, ob es sich um ein Selbstzitat handelt. (Baykoucheva 2022, S. 52; Heibi, Peroni, Shotton 2019, S. 1216; Peroni, Shotton 2020, S. 436)

Als ‹offen› gilt ein Zitat, wenn die Zitationsdaten maschinenlesbar sind, wenn sie eigenständig sind – also unabhängig vom Zugriff auf die zitierenden und zitierten Ressourcen –, und wenn sie ohne Einschränkungen abrufbar und verwendbar sind – idealerweise gemeinfrei. (Peroni, Shotton 2018, [S. 3–4])

Der Daten-Hub Crossref

Eine zentrale Rolle in der Verknüpfung von Referenzen (‹reference distribution›, vgl. Bilder 2016) spielt ‹Crossref›. ‹Crossref› ist eine non-profit Gesellschaft, die von zahlreichen Mitgliedsverlagen und -organisationen getragen wird. ‹Crossref› agiert als Registrierungsagentur für ‹Digital Object Identifiers› (DOIs) und gewährleistet die Verlinkung zwischen Publikationen aus unterschiedlichen Verlagshäusern. Die beteiligten Verlage verpflichten sich, DOIs in ihren Literaturverzeichnissen anzugeben. Dieser Vorgang wird als ‹Reference Linking› bezeichnet.

Darüber hinaus steht es den Verlagen offen, in die Metadaten, die sie bei ‹Crossref› für registrierte Publikationen hinterlegen (‹registering references›), auch die darin zitierte Literatur einzuschliessen. So erhalten sie Zugriff auf den ‹Cited-by› Service, der eine wechselseitige Verbindung zwischen zitierter und zitierender Literatur herstellt und somit auch die Information zurückspielt, wie häufig und wo ein wissenschaftlicher Text zitiert wird. (Tolwinska 2018)

Anwendung: OA-Publikationen und Literaturrecherche

Die Dienste von ‹Crossref› werden täglich in Anwendungen an der Universität Zürich genutzt:

Die Open-Access-Zeitschriftenplattform HOPE bietet ihren Journals die Möglichkeit, die Literaturliste publizierter Artikel mit den Artikelmetadaten zusammen zu registrieren. ‹Crossref› reichert die Bibliografie dann automatisch mit DOIs an. Die Zitationsdaten stehen in der Folge für bibliometrische Auswertungen zur Verfügung und gleichzeitig sind die auf HOPE publizierten Artikel in die entsprechenden Datennetzwerke eingebunden.

Daneben finden die offenen und verknüpften Zitationen in der Literaturrecherche Anwendung. Mit verlinkter Referenzliteratur erschliesst sich eine Rechercheebene, die die bibliografischen Metadaten bisher nicht abdecken. (Lauscher et al. 2018, S. 109) Das Bibliotheks-Rechercheportal swisscovery bietet die Funktion ‹Citation Trails› innerhalb der Bestände des ‹Central Discovery Index› (CDI), wo zitierende und zitierte Literatur direkt miteinander verknüpft sind:

Suchfunktion in swisscovery mit CDI und Citation Trails eines aufgerufenen Artikels
Verknüpfte Zitationsdaten im swisscovery-Suchbereich des ‹Central Discovery Index› (CDI)

Lücken und Ausblick

Die kritische Masse an verfügbaren, gemeinfreien Zitationsdaten ist inzwischen erreicht und die Praxis, Zitationsdaten offen zur Verfügung zu stellen, etabliert. 2021 hat sich mit Elsevier auch der letzte der grossen Wissenschaftsverlage der I4OC-Initiative angeschlossen. (Martin-Martin 2021; Hutchins 2021)

Allerdings decken die vorhandenen offenen Daten das wissenschaftliche Fächerspektrum erst einseitig ab und weisen insgesamt und insbesondere retrospektiv grosse Lücken auf. Verschiedene Projekte versuchen diese Lücken zu schliessen:

‹OpenCitations› hat beispielsweise einen zusätzlichen Zitationsindex geschaffen, der noch unzugängliche Referenzlisten durch Crowdsourcing erschliesst. Namentlich sind Forschende, Editor*innen oder Verlage aufgefordert, noch nicht abrufbare Zitationsdaten einzuspeisen. Die rechtlichen Hürden dafür sind gering. (Heibi, Peroni, Shotton 2019)

Auch über einen möglichen Beitrag von Bibliotheken zur Katalogisierung offener Zitationsdaten wird nachgedacht. Das Projekt ‹Linked Open Citation Database› (LOC-DB) hat einen Arbeitsprozess entworfen, nach dem Bibliotheken bibliografische Referenzen halbautomatisiert in die Metadaten aufnehmen und verknüpfen könnten. Dabei rücken auch Bestände in den Blick, die nicht in elektronischer Form vorhanden sind. (Lauscher et al. 2018, S. 110)

Samuel Nussbaum, Team Open Science Services