Wie erstelle ich einen Datenmanagementplan?§
Ein Datenmanagementplan ist heutzutage oft schon bei der Antragstellung oder spätestens bei Projektbeginn gefordert. Schließlich erleichtert die frühe Auseinandersetzung mit dem Thema Forschungsdatenmanagement später viele Abläufe im Projekt. Im Plan legen Sie fest, wie Sie Daten erheben, speichern, archivieren und übergeben. Dies ist gerade bei zeitlich begrenzten Projekten wichtig, wenn das Projekt endet und an einer Institution nachhaltig gesichert oder weiterbetrieben werden soll, aber auch wenn Mitarbeiter/innen die Dienststelle wechseln oder neue hinzukommen Es empfiehlt sich, dafür frühzeitig die Weichen zu stellen und den DMP ggf. im Projektverlauf anzupassen.
Manche Institutionen wie die DFG oder die EU haben recht klare Vorgaben, und es existieren zahlreiche Vorlagen auf Webseiten und Publikationen.
Wir haben eine Webseite mit Empfehlungen zum Forschungsdatenmanagement erstellt.
Der folgende Leitfaden ist in praktischer Zusammenarbeit mit Kolleg/innen aus verschiedenen Forschungsprojekten entstanden und soll eine knappe Checkliste mit Tipps und Tricks darstellen, wie Sie schnell zu einem DMP gelangen können, ohne wichtige Aspekte aus den Augen zu lassen.
Generell besteht ein DMP in der Regel aus folgenden Punkten:
- Administrative Angaben (Projektname + kurze Beschreibung, Fördernummer, Datenurheber, Mitwirkende, Kontakt, Förderprogramm usw.)
- Beschreibung der Daten + Datenerhebung (Art, Format und Erstellung)
- Angaben zu Metadaten und Dokumentation (Art und Format der Metadaten und Dokumentation; Verwendung von Normdaten oder Vokabularen)
- Ethische und rechtliche Aspekte (Datenschutz, Copyright)
- Datenhaltung und Verarbeitung: Speicherung, Archivierung und Sicherung der Daten (Welche Daten werden wo und wie lange verfügbar sein? Reichen vorhandene Ressourcen?)
- Datenverfügbarkeit und Publikation (Auffindbarkeit, Zugriffsbeschränkungen)
- Verantwortlichkeiten (Wer ist für den DMP verantwortlich, wer für Einzelaspekte des FDM?)
- Kostenfragen (Welche Ressourcen – personell und materiell – sind für die Maßnahmen nötig?)
Schritt 1: Vorgaben Prüfen§
Hat mein Fördergeber gesonderte Vorgaben, vielleicht sogar einen Muster-DMP? Beispiele wären:
- Leitlinien zum Umgang mit Forschungsdaten der DFG
- Programme Guidelines on FAIR Data Management in Horizon 2020 der Europäischen Kommission
- Hat meine Institution eine Forschungsdatenrichtlinie? Die Akademienunion beispielsweise bietet dies momentan nicht, aber das wird sich ändern. Habe ich Projektpartner an anderen Institutionen (DFG, EU, Leibniz etc.), wo Vorgaben existieren?
- Schreibe ich meinen DMP auf Deutsch, auf Englisch (was üblich ist) oder in einer anderen Sprache?
Schritt 2: Gliederung / Tool auswählen§
Möchten Sie ein DMP-Dokument selbst erstellen z. B. in Word oder kollaborativ in einer Cloudlösung? Hilfreich ist in diesem Fall die Verwendung einer Gliederungsvorlage, um alles Nötige im Blick zu behalten. Übernehmen Sie gerne die von uns vorgeschlagenen Punkte und gehen Sie diese in Ruhe durch:
oder wählen Sie eine alternative Gliederung z.B.:
- Leitfaden der Leibniz Universität Hannover
- Checkliste der HU Berlin
- Oder möchten Sie sich einen DMP lieber auf einer Webseite zusammenbauen? Im zweiten Fall empfehlen wir das DMP Tool. Dort können Sie sich Stück für Stück durch die Erstellung klicken und dann den fertigen DMP herunterladen. Auch späteres Editieren ist jederzeit möglich.
- Hier können Sie sich mit dem DMP Tool erstellte Vorlagen anschauen.
- Um das DMP Tool verwenden zu können, müssen Sie sich einen persönlichen Account anlegen, da keine der im Netzwerk beteiligten Institutionen einen direkten Zugang besitzt.
Schritt 3: Inhalt des DMP:§
Administrative Angaben§
- Tragen Sie Informationen wie Projektname + kurze Beschreibung, Fördernummer, Datenurheber, Mitwirkende, Kontakt, Förderprogramm usw. zusammen
- Eventuell sind zunächst einige dieser Punkte noch unbestimmt. Füllen Sie also zunächst aus, was schon bekannt ist und ergänzen Sie später.
Beschreibung der Daten und Datenerhebung (Art, Format und Erstellung)§
- Mit welcher Art Forschungsdaten arbeiten Sie im Projekt? Dies betrifft sowohl existierende Daten, die Sie verwenden, vielleicht als Grundlage Ihrer Forschungen, aber auch jene Forschungsdaten, die erst im Rahmen des Projekts entstehen.
- Beschreiben Sie, in welchem Format Sie planen, Ihre Daten abzulegen. Behalten Sie bei der Wahl frühzeitig die Nachnutzung im Blick und verwenden Sie möglichst etablierte und offene Standards. Dies gilt auch für die Nutzung von Normdaten oder fachspezifischen Vokabularen (siehe Dokumentation).
- Die Erstellung selbst erstellter bzw. zusammengestellter Daten sollte ebenfalls dargelegt werden. Welche Verfahren setzen Sie ein? Wie steht es um die Qualität? Was sind die Quellen? Aus diesen Fragen können sich wichtige Aspekte rund um Copyright, Persönlichkeitsrechte oder ähnliche Themen ergeben.
Dokumentation und Metadaten§
Geben Sie Auskunft über Art und Format der Metadaten und Dokumentation: Eine ausführliche Dokumentation Ihrer Forschungsdaten hilft, eine Nachnutzung zu ermöglichen. Hierzu sollten die Daten dokumentiert und mit (standardisierten) Metadaten versehen werden.
Metadaten§
- Sie sind ein Teil der nötigen Dokumentation und helfen (unter anderem) die Auffindbarkeit Ihrer Daten zu erhöhen, da aus ihnen Informationen automatisch extrahiert werden können.
- Um dies zu ermöglichen, sollten etablierte Metadatenstandards genutzt werden.
- Eine Möglichkeit bieten zwei vom KompetenzwerkD erstellte Schemata - eines für die Projektmetadaten, eines für die Metadaten von Forschungsdaten. Sie enthalten grundlegende Angaben unter Verwendung etablierter Vokabulare wie “Dublin Core”.
- Anmerkung: Diese Schemata sind sehr allgemein gehalten und können vermutlich nicht alle Anforderungen abdecken, die bezüglich bestimmter Datensätze auftreten. In diesem Fall sollten im Projekt Ressourcen für die Erstellung eigener Schemata eingeplant werden.
- Hilfreiche Ressourcen können sein:
Normdaten und Vokabulare§
- Gehen Sie auf die Verwendung von Normdaten oder (fachspezifischen) Vokabularen ein: Diese können helfen, Ihre Daten strukturiert und nachvollziehbar zu beschreiben.
- Normdaten helfen bei der eindeutigen Identifikation von Entitäten. Sie werden beispielsweise für Personen, Orte oder Institutionen vergeben. Beispiele sind die Gemeinsame Normdatei (GND) oder die Open Researcher and Contributor ID (ORCID).
- Kontrollierte Vokabulare können zur Beschreibung von Objekten/Daten verwendet werden. Sie erhöhen die Nutzbarkeit Ihrer Metadaten deutlich. Beispiele sind Library of Congress Classification, Universal Decimal Classification oder SKOS UNESCO Nomenclature.
- Eine Unterstützung beim Finden existierender Ressourcen bietet das Basel Register of Thesauri, Ontologies & Classifications
Allgemeine Dokumentation§
- Die Dokumentation besteht aus mehr als nur den nötigen (meist beschränkten) Metadaten.
- Um eine vollständige und langfristige Interpretierbarkeit der Daten zu gewährleisten, sollte eine ausführliche Beschreibung angelegt werden.
- Diese Beschreibung kann beispielsweise als separate Datei einem Datensatz beigelegt und mit archiviert werden.
- Frage: Wann erfolgt die Dokumentation?
Ethische und rechtliche Aspekte (Datenschutz, Copyright)§
- Welche Maßnahmen zum Datenschutz sind falls nötig im Projekt vorgesehen? (Sensible Daten nach Bundesdatenschutzgesetz (BDSG) §3: Personenbezogene Daten, insbesondere Herkunft, politische Meinung, Religion, Gesundheit und Sexualleben)
- Welche Maßnahmen zum Schutz von Urheber- und Persönlichkeitsrechten sind im Projekt vorgesehen? Wie werden die Rechte an geistigem Eigentum für die Daten dokumentiert?
- Definieren Sie, welche Daten intern gespeichert werden und welche Sie der Öffentlichkeit (Fachcommunity, interessierte Bürger*innen) zur Verfügung stellen. Wer hat jeweils Zugang? Dies ist insbesondere bei Daten wichtig, die Persönlichkeitsrechte und Copyrights involvieren (Interviews, Publikationen Dritter etc.).
- Rechte: In Abhängigkeit von verwendeten Ausgangsdaten bzw. Datenquellen involviert die relevante deutsche Rechtslage zahlreiche Gesetze. Halten Sie hier gegebenenfalls Rücksprache mit Ihrer Administration oder Ihrem Justiziariat. Natürlich ist auch ihr KompetenzwerkD bemüht, Hilfestellung zu geben oder Kompetenz zu vermitteln. Als Einstieg gibt es beispielsweise hier weitere Informationen: Forschungsdaten - Rechte und gute wissenschaftliche Praxis (ab Folie 19)
- Die Frage der Lizenzen ist immer auch an die Frage der Rechte geknüpft. Wenn Sie keine Urheber- und ähnliche Rechte berühren, könnten Sie die Lizenz “CC0” verwenden, also Gemeinfreiheit.
- Wichtiger Hinweis: Gemeinfreiheit und die Lizenzen bedeuten unter Umständen in verschiedenen Ländern etwas anderes. Wenn Sie also mit Projekten und Daten (Publikationen, Bilder etc.) aus anderen Ländern kooperieren, ist die Rechtlage verschieden. Wichtig hier: Setzen Sie eine Kooperationsvereinbarung mit den Justiziariaten aller beteiligten Institutionen auf und sprechen Sie diese Themen vorab an.
- Hier finden Sie eine Übersicht zu den Creative Commons Lizenzen
Datenhaltung und Verarbeitung: Speicherung, Archivierung und Sicherung der Daten§
Datenspeicherung:§
- Wie bzw. wo werden Daten im Projekt vorgehalten (Arbeitsplatzrechner, Server, Cloudlösungen o.ä.)?
- Wie erfolgt der Zugriff und welche typischen Arbeitsabläufe rund um die Daten gibt es? Welche Software wird zur Datenverarbeitung eingesetzt?
- Werden Dateidienste, Datenbanken, Wissensgraphen oder ähnliche Technologien zur Datenablage eingesetzt?
- Ist kollaboratives Arbeiten an Ressourcen im Projekt von Bedeutung? Wie stellen Sie es sicher?
- Welche Daten sollen oder müssen aufbewahrt werden, welche Daten sollen oder können gelöscht werden?
Sicherung:§
- Es sollte eine Strategie bezüglich Datenbackups entwickelt werden: Wie stellen Sie sicher, dass der Ausfall einzelner Rechner (zur Projektlaufzeit) nicht zum Datenverlust führt?
- Beispiel: Nutzung Instituts-interner Server für wöchentliche Backups oder Nutzung einer internen Cloudlösung, z. B. SAW Cloud (Daten liegen dann parallel auf Arbeitsplatzrechnern und auf einem Server des Instituts)
- Beziehen Sie evtl. vorhandene Backup-Strategien der Rechner/Server Ihres Instituts ein.
- Idealerweise existieren stets mind. 3 Kopien aller Dateien, mind. eine Kopie davon an einem anderen Ort.
Archivierung:§
- Welche Daten werden im Anschluss wo (welches Repositorium oder Archiv) und wie lange verfügbar sein? Definieren Sie, welche Daten extern, öffentlich und langfristig gespeichert werden, idealerweise mindestens zehn Jahre.
- Möglich und oft sogar empfehlenswert ist auch die institutsinterne Langzeitarchivierung, welche durch eine zugängliche Publikation in einem Forschungsdatenrepositorium ergänzt wird.
- Selektieren Sie: Was müssen Sie aufheben, um Ihre Forschung nachvollziehbar oder nachprüfbar zu machen? (Metadaten, Anleitungen/Dokumentation)
- Bei welchen Daten besteht ein “Recht auf Vergessen”?
- Legen Sie dar, inwieweit die Wahl der Datenformate eine langfristige Nutzung ermöglicht.
- In der Regel bietet sich die Zusammenarbeit mit einem externen Forschungsdatenrepositorium oder einem Archiv an, insofern Ihr Institut keine eigenen Lösungen anbietet. Nutzen Sie gegebenenfalls die Repositoriensuche in der Registry of Research Data Repositories zum Aufspüren fachspezifischer Repositorien und nehmen Sie frühzeitig Kontakt auf
- Die Übergabe der Forschungsdaten (häufig zu Projektende/Dienstende) sollte im DMP von Beginn an genau festgelegt werden, um eine gute Lösung für alle Beteiligten zu finden.
- Sie müssen keine Pläne für Daten aus Archiven, mit denen Sie arbeiten, erstellen, sondern nur für Ihre im Projekt erstellten Forschungsdaten.
- Eine niederschwellige Variante für Langzeitdatenarchivierung ist die Publikation der Daten im Repositorium “Zenodo” des CERN in der Schweiz. Unsere Empfehlung: Speichern Sie Ihre Daten in möglichst “einfachen” Formaten - beispielsweise Datenbank-Daten in CSV-Dateien -, erstellen Sie strukturierte Metadaten dazu und schreiben Sie ein Dokument (“readme”-Datei) mit weiteren Informationen, die für eine korrekte Interpretation und Nachnutzung wichtig sind. Sie können alles in einem ZIP-Archiv sozusagen “pur” in Zenodo ablegen (dies erfüllt auch Open Access-Anforderungen). Für größere Datenmengen (z. B. umfangreiches Bild- und Videomaterial) werden andere Lösungen zur Langzeitdatenarchivierung benötigt. Hier könnte in Sachsen die SLUB mögliche Lösungen bieten.
Datenverfügbarkeit und Publikation (Auffindbarkeit, Zugriffsbeschränkungen)§
- Wie wird sichergestellt, dass wichtige Projektdaten nicht nur nachhaltig aufbewahrt werden sondern auch auffindbar sind? Dies ist eine wichtige Voraussetzung, um eine möglichst breite Nachnutzung zu ermöglichen.
- Häufig bieten Forschungsdatenrepositorien / Archive nicht nur eigene Suchmöglichkeiten in den (begrenzten) Datenbeständen sondern integrieren sich in größere Verbünde, welche eine gemeinsame zentrale (oft fachspezifische) Suchfunktionalität anbieten (beispielsweise das CLARIN Virtual Language Observatory). Geben Sie dies gegebenenfalls an.
- Werden die Daten frei verfügbar sein oder sind Zugriffsbeschränkungen nötig (Bezug zu Persönlichkeitsrechten / Copyright gegebenenfalls sinnvoll)? Wie werden diese umgesetzt?
Verantwortlichkeiten§
- Klären Sie, wer für Erstellung und Pflege des DMP verantwortlich ist! Auch ist festzuhalten, wer (im Projekt, am Institut) die Einzelaspekte des FDM umsetzen soll.
- Garantieren der Projektträger, ein Projektpartner oder extern Beteiligte die Verfügbarkeit von Daten, Diensten oder Webauftritten nach Projektende?
Kostenfragen§
- Welche Ressourcen – personell und materiell – sind für die Maßnahmen nötig?
- Themen, die dabei abgesprochen werden sollten: Eventuell benötigte Rechentechnik, Kosten eines externen Backups, Kosten für eine langfristige Verfügbarkeit von Daten und Diensten, technischer Support auch über das Projektende hinaus (Plattform, Sicherheit, regelmäßige Updates), Hosting, externe Beratungsleistungen.
Schritt 4: Erstellen des DMP§
Füllen Sie ihr Dokument entsprechend der gewählten Gliederung mit den relevanten Angaben zu Projekt- und Forschungsdaten. Halten Sie bei unerwartet auftretenden Unklarheiten am besten Rücksprache.
Allgemein gilt: Forschung ist nicht immer (vollständig) planbar! Nicht alles müssen Sie sofort festlegen - manches kann im Projektverlauf ergänzt werden.
Schritt 5: Die oben genannten Leitfäden decken nicht alle Ihre Bedarfe ab und Sie haben Fragen?§
Es gibt zahlreiche Handbücher und Checklisten, die viele Fragestellungen abdecken. Wir empfehlen:
- den FDMentor der HU Berlin (PDF, 32 S.)
- den Leitfaden vom WissGrid-Projekt der Uni Göttingen (PDF, 122 S.)
- Empfehlungen der Universität Hannover zum Umgang mit Forschungsdaten
- Besuchen Sie einen Workshop oder gehen Sie zu einer Beratung - dann haben Sie alle Infos auf einen Blick.
Wir unterstützen Sie gerne: KompetenzwerkD@saw-leipzig.de
Schritt 6: Finalisieren Sie Ihren DMP.§
- Korrekturlesen
- Unterschreiben
- im Projekt und an der Institution ablegen