Bericht von Raisa Barthauer, SUB Göttingen
(Zwischenüberschriften und Hervorhebungen sind redaktionelle Überarbeitungen)

Bedarfe & Hindernisse für ein nachhaltiges Datenmanagement

Dank des Teilnahmestipendiums von EcoDM war ich dieses Jahr zum ersten Mal auf der RDA DE Tagung, die in Potsdam stattfand.

Im Project Track, an dem ich teilgenommen habe, wurden mehrere Projekte zum Thema Data Management vorgestellt, unter anderem RDMO, GovData, Movebank und HIDA. Die Vorstellung verschiedener Projekte gab einen guten Überblick über die unterschiedliche Arbeit und die Anwendungsmöglichkeiten im Data Management. Der Track hat mir außerdem verdeutlicht, dass unabhängig von den jeweiligen Fachgebieten die aktuellen Fragestellungen, Ziele und die zu bewältigenden Herausforderungen im Data Management sehr ähnlich, wenn nicht sogar gleich sind. Als aktuelle Themen haben sich vor allem die Anerkennung der Wichtigkeit von Datenmanagement, die Bereitstellung von Open Data und die Möglichkeit von Open Science sowie die Implementierung der FAIR-Prinzipien herausgestellt.

Standards für Interoperabilität

Zwar sind die FAIR-Prinzipien mittlerweile im Bezug auf Forschungsdatenmanagement vergleichsweise etabliert, trotzdem, so wurde in den Vorträgen angemerkt, erfährt insbesondere die Interoperabilität (also das „I“ von FAIR) wenig Umsetzung. Ein Grund wurde vor allem darin gesehen, dass es bisher keine einheitlichen Lösungen oder Standards gibt, an denen sich projekt- und fächerübergreifend bei der Umsetzung der Interoperabilität orientiert werden könnte.

Gleichzeitig wurde aber auch die Frage aufgeworfen, ob eine allgemeine und grundsätzliche Vereinheitlichung sinnvoll wäre. Eine Standardisierung, die sich lediglich auf einzelne Fach- oder Interessensgebiete beschränkt und sich an den sich daraus ergebenden Anforderungen orientiert, könnte sinnvoller sein.

Lizenzierung

Im Bezug auf Open Data, der Bereitstellung von Daten, die maschinenlesbar, frei zugänglich und mit Lizenzen versehen sind, wurde insbesondere die Lizenzierung von vielen TeilnehmerInnen als schwierig und unklarer Faktor angesprochen.

Die rechtliche Grundlage und die Besitzverhältnisse von Daten müssen bei Open Data eindeutig geklärt sein, um Lizenzen korrekt und angemessen vergeben zu können. Schwierig wird beides in Projekten und Forschungsbereichen, die mit sensiblen Daten arbeiten. In medizinischen Projekten beispielsweise müssen Patientendaten geschützt werden, im Fall der vorgestellten MOVEBANK dürfen die Daten stark bedrohter Tierarten nicht zugänglich gemacht werden.

Auch die Rechte am geistigen Eigentum, an persönlichen Daten und Betriebsgeheimnisse müssen gewahrt bleiben. Diese Daten können gegebenenfalls nicht frei lizenziert und zugänglich gemacht werden, es ergeben sich Grenzen für Open Data. Als Ziel wurde in diesem Punkt genannt, das bereits bestehende Open Data Gesetz des Bundes, das derzeit noch nicht für Forschungsdaten gilt, fortzuschreiben, um es auf Forschungsdaten auszuweiten und die Datenstrategie des Bundes anzuwenden.

Veröffentlichungskultur

Lizenzen und fehlende Standards sind aber nicht der einzige Stolperstein, den ForscherInnen auf dem Weg zu Open Data und Open Science genannt haben. Ein wichtiger Faktor ist die momentane Veröffentlichungskultur in der Wissenschaft.

Veröffentlichungen in angesehenen Verlagen und Zeitschriften sind immer noch ausschlaggebend für die eigene wissenschaftliche Reputation, während Open Science-Veröffentlichungen nicht honoriert werden.

Es wurde daher auf die Dringlichkeit der Frage verwiesen, wie wissenschaftliche Publikationen in Zukunft aussehen sollen: In welchen Formen und auf welche Arten soll und kann publiziert werden, um Open Science zu ermöglichen, ohne dass die veröffentlichenden ForscherInnen auf die Reputation und Honorierung ihrer Arbeit verzichten müssen.

Da das aktuelle System nicht Open Science und Reputation gleichzeitig ermöglicht, ist ein Kulturwandel in der Wissenschaft notwendig. Da es sich bei einem Kulturwandel immer um einen Prozess handelt, kann auch auf der RDA DE Tagung nicht abschließend beantwortet werden, wie der Kulturwandel gestaltet werden muss. Festgehalten wurde aber, dass Anreize im Sinne der Open Data und Open Science geschaffen werden müssen, damit Daten und Veröffentlichungen offen und FAIR zugänglich gemacht werden, zumal davon ausgegangen wird, dass derzeit circa 75% aller Forschungsdaten gar nicht veröffentlicht werden.

Infrastrukturen

Auch die bisher bereitgestellten Infrastrukturen für Open Data wurden sehr divers diskutiert. Auf der einen Seite wurde von TeilnehmerInnen bemängelt, dass teilweise fachspezifische Repositorien fehlten und mehr Räume geschafft werden müssten, die die Möglichkeit bieten, Daten zu veröffentlichen. Von anderer Seite wurde aufgeführt, dass es bereits eine Vielzahl von Angeboten gebe, die mehr genutzt werden müssten, statt immer weitere Infrastrukturen zu schaffen.

Das Problem der Infrastrukturen sei ebenfalls vielmehr eine fehlende Standardisierung. So gebe es allein in Deutschland eine große Anzahl diverser Anbieter und Portale für die Bereitstellung von Open Data, wie zum Beispiel kommunale Portale oder Landesportale und spezifische Fachportale, die jedoch sehr unterschiedlich verbreitet sind und mit unterschiedlicher Geschwindigkeit arbeiten. Um eine Vernetzung der Portale untereinander zu gewährleisten, müsste sich nicht nur in Deutschland, sondern in ganz Europa ein einheitlicher Standard für den Datenaustausch durchsetzen.

Projektlaufzeiten

Eine Schwierigkeit bei der Etablierung bestehender Infrastrukturen und einheitlicher Standards ist aber das Fehlen fester Strukturen in der Wissenschaft, da häufig nur von Projekt zu Projekt gearbeitet werden kann. Die im Project Track vorgestellten Strategien der Helmholtz-Gemeinschaft setzen hier an, um Nachhaltigkeitskonzepte fest in der Wissenschaftscommunity zu verankern und somit Open Data und Data Management nachhaltig zu etablieren.

Datenmanagementplan

Für eine nachhaltige Etablierung von Data Management fehlt noch ein weiterer Punkt, der auf der Konferenz immer wieder zur Sprache kam: Die Anerkennung der Wichtigkeit von Datenmanagement und eine Stärkung der Verbindung zwischen WissenschaftlerInnen und DatenmanagerInnen. Bisher werde in den meisten Projekten circa zwei bis drei Prozent des Budgets für Datenmanagement ausgegeben, notwendig seien dagegen circa 20–30%. Finanzielle Mittel müssten zu einem größeren Anteil für Datenmanagement bereitgestellt werden, unter anderem auch um die personelle Besetzung zu gewährleisten. Data ManagerInnen müssten selbstverständlicher Teil der Forschungsprojekte werden.

Auch hier wurde die Frage gestellt, wie Forschende dazu motiviert werden können, Forschungsdatenmanagement weniger stiefmütterlich zu behandeln. Als eine Möglichkeit wurde die stärkere Einbindung des wissenschaftlichen Nachwuchses vorgeschlagen, der sich nach Möglichkeit bereits in einer sehr frühen Phase der wissenschaftlichen Laufbahn mit Datenmanagement vertraut machen soll. Häufig wird erst Doktoranden das „Handwerkszeug“ für Forschungsdatenmanagement geboten, sinnvoller wäre es aber, bereits Master- oder sogar Bachelorstudierende ins Datenmanagement einzuführen und sie damit arbeiten zu lassen um die Praxis von Anfang an und damit langfristig zu etablieren.

Data Management und Data Science sollen nicht mehr als zu technisch/mathematisch und zu informatiklastig angesehen werden und damit als Buch mit sieben Siegeln gelten, sondern selbstverständlicher Teil einer guten wissenschaftlichen Praxis werden.