Linguistische Forschungsdaten publizieren mit LaRS

Linguistische Forschungsdaten publizieren mit LaRS

Read this post in English

Seit September 2022 ist das «Language Repository of Switzerland» – kurz «LaRS» – online. Forschende der Linguistik können ihre Forschungsdaten ab sofort kostenlos mit LaRS archivieren und publizieren. Wie das geht? Ganz einfach:

Loslegen mit einer SWITCH edu-ID

Als Forschende der Linguistik, deren Universität im CLARIN CH Konsortium vertreten ist, können Sie sich mit ihrer SWITCH edu-ID auf SWISSUbase einloggen. Beim Erstellen des Projekts wählen Sie den Fachbereich «Linguistik» aus.

«Fast Data Deposit» mit FAIRen Metadaten

Um Ansprüchen der Forschungsförderer zu genügen, unterstützt LaRS Forschende, Daten gemäss FAIR-Prinzipien (findable, accessable, interoperable und re-usable) zu publizieren. Auf SWISSUbase sind zwei verschiedene Publikations-Workflows implementiert:

  • Fast Data Deposit: Sie können in 6 einfachen Schritten Datensätze laden, unter Angabe der minimal erforderlichen Projekt- und Datensatz-Metadaten auf SWISSUbase. So können auch Daten einem bereits existierenden Projekt hinzugefügt werden. Vor Abschluss des Deposits können Sie zusätzliche Metadaten einfügen (empfohlen), damit sie die Sichtbarkeit und Auffindbarkeit im Katalog erhöhen, – oder die Datensätze gleich mit den minimalen Angaben einreichen.
     
  • Create New Study: Hier arbeiten Sie mit der Standard-Oberfläche. Füllen Sie Projekt-Metadaten aus und fügen Sie Ihrem Projekt Datensätze hinzu. Im zweistufigen Deposit-Prozess können Sie zuerst ein Projekt publizieren und erst dann weitere Datensätze hinzufügen – oder beides gleichzeitig erledigen.

FAIRe Metadaten sind disziplinspezifische Metadaten. Um dieses Kriterium zu erfüllen, fügen Sie mindestens einen obligatorischen Metadaten-Block «Language» hinzu. Folgende Metadatenblocks bietet Ihnen LaRS an:

  • Language: Metadaten über die Sprache und zur Sprache selbst. Dazu gehört der Sprachname mit ISO-Code oder auch der Lingualitätstyp.
  • Annotation: Metadaten über das angewandte Annotationsvefahren, also beispielsweise der Annotationstyp und kontrollierte Vokabulare.
  • Auch Text-, Audio-, Video- und Bild-Daten können Sie mit jeweils einem eigenen Metadatenblock verzeichnen.
  • Mit dem «Tools»-Block können Sie bekannt machen, welche Software und Applikationen zum Einsatz kamen, um die Daten zu generieren, prozessieren und annotieren.

Daten publizieren, aber für wen?

«Sharing is caring», aber nicht immer ist es möglich, alles mit jedem zu teilen. Daher können Sie Ihre Daten auf verschiedene Arten publizieren:

  • CC Lizenzen: Sie können aus allen verfügbaren Creative Commons Lizenzen auswählen. Interessierte können Ihre Daten so uneingeschränkt von SWISSUbase herunterladen.
  • «Closed contract without prior agreement»: In manchen Fällen wollen Sie die Daten nicht frei zum Download zur Verfügung stellen. Dies kann der Fall sein, wenn personenbezogene bzw. sensitive Daten im Spiel sind. Oder wenn Daten nur explizit für wissenschaftliche und/oder schulische Zwecke genutzt werden dürfen. Diese Option bedingt, dass sich Interessierte zuerst auf SWISSUbase einloggen müssen. Erst nach Angabe eines Grunds und der Annahme des «Closed contracts» können sie die Daten herunterladen.
  • «Closed contract with prior agreement»: Zusätzlich können Sie einstellen, dass Sie Ihre Daten nur auf Anfrage freigeben. Sie entscheiden in jedem Fall, ob Sie die Daten einem spezifischen User zum Download anbieten – oder nicht.

Oft fordern Journals eine vorzeitige Einsicht in die Daten. SWISSUbase hat dafür eigens die Funktion «Share by URL» entwickelt, damit Dritte die Daten im Lesemodus einsehen können, noch bevor Sie diese publiziert haben. Dabei bestimmen Sie selbst, wie lange der Link gültig bleibt.

Ihre Daten: kuratiert, adressiert, publiziert.

Sobald Sie Ihre Datensätze bei LaRS einreichen, kümmert sich ein Team von Datenkurator*innen um die Plausibilität der eingetragenen Metadaten. Stichprobenartig werden die eingereichten Daten auf Lesbarkeit geprüft. Die Datenkurator*innen unterbreiten Ihnen ggf. eine Aufstellung mit Änderungsvorschlägen. Kleine Änderungen indes nehmen die Datenkurator*innen auch ohne Rücksprache vor.

Um wissenschaftlichen Ansprüchen und den FAIR-Prinzipien zu entsprechen, erhält jeder Datensatz einen persistenten Identifikator (DOI), den Sie zwecks Zitierung des Datensatzes benutzen können.

Ihre Metadaten sind nach Abschluss der Datenkuration im Katalog von SWISSUbase auffindbar und ausschliesslich in der Schweiz abgespeichert. In Zukunft (ab ca. Mitte 2023) werden Ihre Datensätze auch im europäischen Katalog des linguistischen Forschungsnetzwerk CLARIN mit Metadaten sichtbar gemacht.

Weitere Informationen erhalten

Weitere Informationen finden Sie auf unserer Website sowie auf SWISSUbase. Natürlich können Sie uns bei Fragen, Anregungen und Interesse an der Nutzung von LaRS und SWISSUbase auf swissubase@ub.uzh.ch schreiben.

Florian Steurer, Team Open Science Services