Fünf Erkenntnisse zu Open Data

Fünf Erkenntnisse zu Open Data

Im Rahmen des Weiterbildungsstudiengangs MAS ALIS (Archiv-, Bibliotheks- und Informationswissenschaft) der Universitäten Bern und Lausanne absolvierte ich im März/April 2022 in der Abteilung Open Science Services (OSS) der Universitätsbibliothek Zürich ein fünfwöchiges Praktikum. Mein Vorwissen im Bereich Forschungsdatenmanagement beschränkte sich dabei auf theoretisches Hintergrundwissen aus dem Studiengang und meiner Arbeitserfahrung im Staatsarchiv Zürich (hinsichtlich Fragen der Datenqualität und der langfristigen Speicherung/Sicherung). Aus der intensiven fünfwöchigen Auseinandersetzung mit dem Thema nehme ich nun fünf Erkenntnisse mit.

Forschungsdaten können, müssen aber nicht digital sein

Je nach wissenschaftlichem oder fachspezifischem Kontext kann die Definition von Forschungsdaten variieren. Es können Messdaten, Tabellen, Digitalisierungen, Text, Grafiken, Videos sein oder grundsätzlich «alle Daten, die während [des] Forschungsprozesses entstehen». In der Regel sind digitale Daten gemeint, die «gemanagt» werden müssen. Hier kommt die Abteilung Open Science Services der Unibibliothek ins Spiel, z.B. mit dem Angebot, Datenmanagementpläne zu prüfen und Forschende beim Erstellen der Pläne zu beraten.

Daten müssen dokumentiert werden (mit Metadaten)

Metadaten, die oft als «Daten über Daten» definiert werden, sind diejenigen Daten, welche die Forschungsdaten beschreiben. Dazu gehören Identifizierungsinformationen, wie z.B. persistent identifiers, oder auch Format- oder Informationen zum Inhalt (z.B. Variablennamen). Gute Metadaten enthalten also diejenigen Informationen, die Menschen und Maschinen benötigen, um Daten finden, auswählen, darstellen und interpretieren zu können.

Die Daten mit den Metadaten gemeinsam zu speichern und zu dokumentieren, ist daher von grosser Bedeutung. Informationen dazu wie Daten formatiert und beschrieben werden sollen, finden sich im Tutorial Wie mache in Daten FAIR und im Webinar der Open Science Summer School 2020.

Nicht alle Daten müssen geteilt werden

Das Konzept der Open Data, der offenen Daten, geht davon aus, dass Forschungsdaten, wenn die Forschung durch öffentliche Gelder mitfinanziert wird, öffentlich zugänglich sein sollen, um sie nutzen, wiederverwenden, aber auch überprüfen zu können. Offene Daten sind nicht automatisch auffindbar, zugänglich, maschinenlesbar und wiederverwendbar. Die sogenannten FAIR-Prinzipien fördern diesbezüglich die Qualität der Daten. Dabei gibt es auch disziplin-spezifische Unterschiede in der Art und Weise, wie Daten geteilt werden. Gerade bei Personendaten ist der Datenschutz wichtiger: Nur wenn personenbezogene oder sensible Informationen anonymisiert werden, können die Daten offen geteilt werden.

Es braucht Infrastruktur und Kooperationen…

Open Data ist ein massgeblicher Teil des umfassenden Konzepts Open Science, das neben den offenen Daten z.B. auch Open Access bis hin zu Citizen-Science-Projekten umfasst. Open Science beschreibt aktuell nicht den grundsätzlichen Zustand der Wissenschaft, sondern den Anspruch, die Forschungsprozesse transparent und nachvollziehbar zu gestalten, um der Wissenschaft zu mehr Vertrauenswürdigkeit zu verhelfen – innerhalb der Wissenschaft, aber auch gesellschaftlich. Bestehende Daten können in neuen Kontexten wiederverwendet werden, was die Innovationskraft erhöht und zur Verbesserung der Untersuchungsmethoden beitragen kann.

Um dieses Ziel zu erreichen, sind unter anderem Infrastrukturen wie auch institutionenübergreifende, nationale oder sogar internationale Kooperationen nötig –  zwei Arbeitsschwerpunkte der UB-Abteilung OSS: Im Bereich der Infrastrukturen ist die Abteilung zum einen in die Entwicklung eines Zentrums für digitale Editionen involviert. Zum andern ist sie im am Aufbau von SWISSUbase beteiligt. Kooperationen finden mit unterschiedlichsten Partnern statt, an der Universität z.B. mit LiRI (Linguistic Research Infrastructure) und S3IT (Science IT), national mit FORS, der Universität Lausanne und SWITCH sowie im Bereich der Linguistik auch international z.B. mit CLARIN.

… und Schulungen

Eine andere Kernfunktion der Abteilung betrifft Dienstleistungen im Bereich Open Science. Mit einem breiten Angebot an Informationsmaterial, Tutorials z.B. in Form von Lernvideos, aber auch mit Kursen und Veranstaltungen wie Lunch&Learn Open Science werden Angehörige der Universität im Umgang mit den digitalen Daten, die während des Forschungsprozesses entstehen, unterstützt.

Die Abteilung bietet zudem Schulungen für Studierende (inkl. Doktorierende) an, in denen im interaktiven Austausch auch Unterschiede in den Fachdisziplinen zur Sprache kommen. Die Kurse bieten die Möglichkeit, über das eigene wissenschaftliche Arbeiten zu reflektieren, nicht nur im Umgang mit den eigenen Forschungsdaten, sondern durchaus auch in einem weiteren Rahmen: Was sind die Konsequenzen einer geschlossenen Wissenschaft? Welche Rolle spielen die Verlage?

Fehlendes Wissen um Möglichkeiten und Grenzen von Open Science ist eine der Herausforderungen von Forschenden: Nicht nur dieser Herausforderung wirkt die Abteilung Open Science Services der UB mit ihren Angeboten tatkräftig entgegen.

Florian Christen, Praktikant Open Science Services