EcoDM Stipendiat*innen berichten von der RDA DE Tagung zum Stand des digitalen Datenmanagements: Merten Dahlkemper
Bericht von Merten Dahlkemper, Universität Göttingen
(Zwischenüberschriften, Hervorhebungen und Verlinkungen sind redaktionelle Überarbeitungen)
Vom 25. bis zum 27. Februar 2020 fand am GeoFrorschungsZentrum Potsdam die RDA Deutschland Tagung 2020 statt. Bei dieser wurden aktuelle Themen rund um das Thema Forschungsdatenmanagement besprochen.
Die Tagung bestand aus einem Workshopprogramm am 25. und 26. Februar sowie der eigentlichen Tagung vom 26. bis zum 27. Februar.
Project Track RDMO
Das Workshopprogramm gliederte sich in verschiedene “Tracks”, von denen ich den Project Track besuchte. Im Project Track wurden verschiedene Ansätze vorgestellt, mit denen die Konzepte FAIR und Open Data gefördert werden können.
Dieser Track begann mit der Vorstellung des Tools RDMOrganiser: Ein Tool, welches anhand eines Fragebogens Forschende dabei unterstützt, ihre Forschungsdatenmanagement zu organisieren. Insbesondere hilft das Tool bei der Erstellung von Datenmangementplänen, jedoch unterstützt es auch aktives Datenmanagement, indem auf geänderte Umstände während eines Forschungsprojekts dynamisch reagiert werden kann. Die große Herausforderung bei diesem Projekt ist die Erstellung der Fragebögen. Für diese gibt es zwar Vorgaben seitens der Forschungsförderorganisationen, jedoch unterscheiden sie sich je nach Fachdisziplin. Hier stellt sich die Frage, wer für die Erstellung solcher Fragebögen zuständig ist, wenn das Tool zentral an der Forschungseinrichtung, z.B. an der Bibliothek oder dem Rechenzentrum der Universität gehostet und gepflegt wird.
Mein Fazit aus diesem Slot ist, dass ein Tool wie RDMO zwar den Forschenden behilflich sein kann, es jedoch nicht die ganze Antwort ist auf die Frage “Wie organisiere ich mein Forschungsdatenmanagement?”. Dafür braucht es auch individuelle, vor allem fachspezifische, Beratung. Jedoch ist das auch gar nicht der Anspruch des Tools, die ganze Antwort zu geben.
Best Practices bei Open Data – Projekte stellen sich vor
Zum Thema Open Data wurde das Portal GovData, das Datenportal für Deutschland, vorgestellt. Dieses bündelt Verwaltungsdaten aus verschiedenen offenen Datenquellen und stellt standardisierte Metadaten zu diesen Datensets zur Verfügung. Die große Herausforderung dieses Datenportals ist die Vereinheitlichung von Metadaten aus den unterschiedlichsten Quellen von kommunaler bis zur Bundesebene. Es gab im Anschluss an die Vorstellung eine Diskussion über die Vor- und Nachteile von Open Data. Insbesondere gibt es Grenzen von Open Data, etwa bei personenbezogenen Daten oder Betriebs- und Geschäftsgeheimnissen. Aber häufig fehlt von Seiten der Datenanbieter auch die Zeit, die Datensätze hinreichend zu dokumentieren, sodass sie für die Öffentlichkeit überhaupt nutzbar wären. Hier muss es konkrete Incentives geben, die Daten frei zur Verfügung zu stellen.
Ein weiteres “Best Practice”-Beispiel mit einem etwas anderen Schwerpunkt war die Tierbewegungsdatenbank movebank. Diese ist ein Beispiel für ein möglichst niedrigschwelliges Angebot für Open Data. (Meta)datenqualität ist selbstverständlich auch bei dieser Datenbank ein wichtiges Thema, welches über kontrollierte Vokabulare und Tools zur Datenkonversion addressiert wird.
Anschließend stellte sich die Helmholtz Information & Data Science Academy (HIDA) vor. Die HIDA ist eine Einrichtung der Helmholtz-Gemeinschaft, die Aus- und Weiterbildung im Bereich Information & Data Science für Promovierende und Postdocs anbietet. Konkret bietet sie einerseits Graduiertenschulen für Promovierende in diesem Bereich an, außerdem Weiterbildungsangebote in Form von Kursen, Konferenzen etc. und baut ein Netzwerk über Trainee- und Fellowship-Programme und internationalen Austausch auf.
Im Anschluss an die Vorstellung gab es eine Diskussion zum Thema “Dos und Don’ts im Forschungsdatenmangement”. Als Dos wurden hier Dinge wie ein Kulturwandel, der Wunsch nach langfristiger Finanzierung oder Community Building genannt. Als Don’ts wurde der Wunsch geäußert, dass nicht ständig neue Policies und neue “Buzzwords” geschaffen werden sollten, sondern man sich nun zunächst auf das konzentriert, was schon da ist und es ggf. verbessert.
Im Anschluss an den Project Track wurde eine Einführung in die Arbeitsweise der RDA gegeben, bevor die eigentliche Tagung begann.
Die NFDI und Domänenspezifik im Forschungsdatenmanagement
Das übergreifende Thema der Tagung war selbstverständlich die im Aufbau befindliche Nationale Forschungsdateninfrastruktur (NFDI) sowie die European Open Science Cloud (EOSC). Diese Infrastrukturensollen die Forschungsdaten in Deutschland und der EU systematisch erschließen und für die Nachwelt nutzbar machen.
Dabei wird die zentrale Herausforderung sichtbar, die sich durch die gesamte Tagung zog: Wie domänenspezifisch muss Forschungsdatenmangement sein und wie sehr können domänenübergreifende Projekte überhaupt helfen?
Besonders deutlich wurde diese Herausforderung in den Diskussionen im Anschluss an die Vorstellungsrunden von FDM-Initiativen einzelner Bundesländer einerseits und von verschieden FAIRification-Initiativen andererseits.
Zu den Länderinitiativen, die sehr unterschiedliche Ansätze von einer kohärenten Infrastruktur bis zu einer losen Sammlung einzelner Projekte verfolgen, wurde kritisch nachgefragt, was – gerade im Hinblick auf die NFDI – deren Rolle sei. Die Antwort lautete, dass durch diese Initiativen mehr Bewusstsein für das Thema in der Fläche geschaffen wird, insbesondere auch in Fachgebieten, die nicht durch die im Rahmen der NFDI geförderten Konsortien abgedeckt werden. Außerdem wird über diese Initiativen Know-How in Form von Schulungen weitergegeben. Hier wurde der Wunsch geäußert, dass die entsprechenden Schulungsangebote möglichst flächendeckend nachnutzbar sein sollten.
Auch an die Vertreter*innen der FAIRification-Initiativen wurde die Frage gestellt, wie mit unterschiedlichen Ansichten zu den einzelnen “Buchstaben von FAIR” in den verschiedenen Communities umgegangen wird. Das Problem wurde wahrgenommen, ein konkreter Lösungsansatz steht hier vor allem beim Thema Interoperabilität zwischen verschiedenen Domänen noch aus.
Keynotes und Abschluss
Das Tagungsprogramm wurde abgerundet durch zwei Keynotes zu aktuellen Themen aus der Wissenschaft, bei denen Forschungsdatenmanagement eine entscheidende Rolle spielt. In der ersten Keynote ging es um die MOSAiC-Mission, der größten Arktis-Expedition der Geschichte. Hier war es sehr interessant zu erfahren, dass es im Rahmen der Mission keine explizit für das Forschungsdatenmanagement ausgewiesenen Finanzmittel gibt.
In der zweiten Keynote ging es um die Erforschung der Ausbreitung von Pandemien. Gerade vor dem Hintergrund der zum Zeitpunkt der Tagung gerade beginnenden Covid-19-Pandemie war dieser Vortrag hochinteressant, da er verdeutlicht hat, wie komplex die Vorhersage der Ausbreitung von Pandemien ist, geichzeitg aber auch Wege aufgezeigt hat, wie mittels Verknüpfung verschiedener Daten (Fluggastdaten, Bewegungsprofile von Smartphones etc.) zumindest eine Erklärung vergangener Ausbreitungen und damit bis zu einem gewissen Grad auch eine Vorhersage möglich ist.
Zusammenfassend lässt sich sagen, dass die Tagung eine sehr bereichernde Erfahrung für mich war. Ich habe viele interessante Einblicke gewonnen in die “Metaebene der Wissenschaft”.
Danken möchte ich dem Projekt EcoDM, welches mir diese Teilnahme ermöglicht hat.