FAQ zur Richtlinie zum Umgang mit Forschungsdaten an der LUH

Eine leuchtende Glühbirne Eine leuchtende Glühbirne Eine leuchtende Glühbirne © Sergei Akulich | Pixabay

Richtlinie zum Umgang mit Forschungsdaten

Forschungsdaten haben eine große Bedeutung im wissenschaftlichen Erkenntnisprozess. Daher gibt es eine Reihe von nationalen und internationalen Vorgaben und Policies. An der LUH gibt die Richtlinie zum Umgang mit Forschungsdaten über die in ihr formulierten Grundsätze einen Überblick in die Anforderungen und Verantwortlichkeiten beim FDM an der LUH. Auf dieser Seite haben wir ergänzende Erklärungen und Informationen zu verschiedenen Aspekten des Datenmanagements für Sie zusammengestellt.

Datenbeschreibung und -dokumentation

  • Was sind Forschungsdaten?

    Forschungsdaten sind Daten, die im Verlauf eines wissenschaftlichen Arbeitsprozesses erzeugt und verarbeitet werden. Sie bilden die Grundlage von Forschungsergebnissen. Dabei kann es sich um sehr unterschiedliche Arten von Daten handeln, z.B. um Messergebnisse, Sekundäranalysen, Visualisierungen, Modelle oder die Resultate von Umfragen und Erhebungen. Ebenso vielfältig sind die möglichen Datei-Formate, um Zahlen, Text, Programmcode oder Grafik zu speichern. Mitunter werden sogar physische Proben wie Mineralien oder Gewebe als "Daten" definiert.

  • Welche Dateiformate entsprechen den Anforderungen der Richtlinie?

    Das Management von Daten beginnt bereits mit ihrer Erhebung. Daten werden mit vielfältigen Methoden gesammelt und erzeugt, z.B. durch Messungen, Simulationen, Umfragen oder Textanalysen. Sie liegen als Tabellen, CAD-Daten, Bild- und Rasterdaten, Transkripte, Programmcodes und vieles mehr vor und können in unterschiedlichen Dateiformaten gespeichert werden. Von der gewählten Methodik, der Art der Daten und ihren Dateiformaten hängt ab, ob und wie sie automatisch weiterverarbeitet werden können, wie kompatibel sie mit anderen Hard- und Softwaresystemen sind und ob sie langfristig lesbar bleiben.

    Die Art Ihrer Daten bestimmt ihre Form. So lassen sich beispielsweise Umfragedaten besser tabellarisch als in Form eines Textes strukturiert ablegen. Komplexe Datenerhebungen dürften besser in einer Datenbank aufgehoben sein als in einem Excel-Sheet.

    Wichtig ist die Wahl des Dateiformats. Einige Geräte und viele Anwendungsprogramme speichern Daten in einem Hersteller-spezifischen Format, das mit anderer Software selten lesbar ist. Prüfen Sie die Möglichkeit die Daten in ein offenes Format abzuspeichern oder zu konvertieren, um den Datenaustausch zu erleichtern.

    Empfehlungen zu Datenformaten finden Sie unter anderem auf der  Homepage der Landesinitiative Langzeitverfügbarkeit des Landes Nordrhein-Westfalen

  • Was ist mit Dokumentation von Daten gemeint? Was sind Metadaten?

    Strukturierte Informationen zur Dokumentation und Beschreibung von Forschungsdaten gehören zu den sogenannten sogenannte Metadaten. Dazu gehören zum Beispiel Angaben zum Kontext und zu technische Eigenschaften. Forschungsdaten sollten immer zusammen mit ihren Metadaten abgelegt werden. In einem öffentlichen Repositorium geschieht dies i.d.R. automatisch und verpflichtend. Im Projektverlauf können Metadaten auf unterschiedliche Weise gesammelt werden, z.B.

    • in einer Datenbank
    • in Tabellen (z.B. Excel)
    • in Readme-Dateien (Text, PDF)
    • in einer strukturierten XML-Datei
    • integriert in den Daten-Dateien (z.B. im Fileheader)

    Durch eine gute Dokumentation werden die Daten...

    • besser auffindbar (auch maschinell, z. B. durch Suchmaschinen)
    • besser oder überhaupt erst nachnutzbar
    • zitierfähig und damit dem Ersteller der Daten zuordbar
    • wertvoller für die Wissenschaft, da Inhalte, Qualität und Bearbeitungsstand besser eingeschätzt werden können

    Grundlegende deskriptive Metadaten

    • Eindeutiger Identifier (z.B. ein doi)
    • Titel
    • Ersteller (hauptverantwortlich Forschende)
    • Erhebungsdatum (auch Versionen)
    • Format (ggf. benötigte Software)
    • Fachgebiet
    • Beschreibung der Daten / Abstract
    • Erfassung der Daten (räumlich / zeitlich)
    • Organisation
    • Rechte / Lizenzbestimmungen
    • Beziehung zu anderen Objekten (Daten, Texte...)

    Weiterführende Links

    Informationen auf forschungsdaten.info

    Allgemeine Metadatenschemata:

  • Wie sieht eine gute Dateibenennung und Ordnerstruktur aus?

    Ordner- und Dateinamen sollten aus Elementen bestehen, die eine schnelle Einordnung des Inhalts erlauben. Sie können beispielsweise Auskunft über das Erstellungsdatum, die Dateiversion und die bearbeitende Person geben. Diese Elemente sollten ein einheitliches Format haben und in gleichbleibender Reihenfolge verkettet werden. Achten Sie darauf, dass Benennungskonventionen im Vorfeld vereinbart, schriftlich fixiert und während des Forschungsprozesses eingehalten werden.

    Je mehr Informationen Dateinamen enthalten desto länger können sie werden. Da einige Programme sehr lange Dateinamen nicht verarbeiten können, bietet es sich an, die Teile der Information, die für alle Dateien in einem Ordner gleich sind, stattdessen im Ordnernamen abzubilden.

    Tipps für die Dateibenennung

    • Datumsangaben im Format JJMMTT, also z.B. 150828 für den 28. August 2015
    • Personenangaben verkürzen, z.B. auf Initialen
    • Nutzen Sie nur folgende Zeichen für Dateinamen: A-Z a-z 0-9 _ (Unterstrich)
    • Verwenden Sie keine Umlaute, Leerzeichen oder Sonderzeichen, denn viele Programme erkennen diese Zeichen niht als Teil des Dateinamens oder stellen sie nicht korrekt dar
  • Wie ist ein Datenmanagementplan strukturiert?

    Die Planungen zum Umgang mit Forschungsdaten sollten in einem Datenmanagementplan (DMP) festgehalten werden. Inhalt eines DMP ist:

    • Überblick über das Projekt
    • Welche Daten werden in meinem Projekt verwendet? (Selber generierte Daten, bereits existierende Daten)
    • Wie werden die Daten verwaltet? (Dateinamen, Speicherort (intern / extern), Backups)
    • Wie werden die Daten aufbereitet?
    • Welche rechtlichen Aspekte müssen beachtet werden? (Datenschutz, Lizenzen, wie verbreite ich meine Daten?)
    • Datenaustausch und Publikation
    • Wer macht was mit den Daten (Rollen und Verantwortlichkeiten)?
    • Welche Ressourcen stehen mir zur Verfügung? (Geld, Material, Personal)

    Generell sollten Sie für den projektinternen Gebrauch die Datenmanagementpläne möglichst ausführlich formulieren. Weicht der Forschungsprozess von der ursprünglichen Planung ab oder sollen bestimmte Aspekte konkretisiert werden, wird der Datenmanagementplan angepasst.

    Online Tools für die Erstellung von DMP

    DMPonline
    freies, englischsprachiges Online-Tool für die Erstellung von Datenmanagementplänen des Digital Curation Centre (DCC)

    RDMO
    freies DMP-Tool für die institutionelle Nutzung mit eigenen Instanzen

    Weiterführende Informationen

    LUH-Template zum Erstellen von Datenmanagementplänen

    Forschungsdaten.info

    How to Develop a Data Management and Sharing Plan, Sarah Jones (DCC)

    Checkliste zum Data Management Plan des DCC

  • Welche rechtlichen Aspekte sind zu beachten?

    Bevor Sie wissenschaftliche Daten erheben, verarbeiten und veröffentlichen, sollten Sie die rechtlichen Rahmenbedingungen und Vorgaben für den Umgang mit Forschungsdaten prüfen. Personenbezogene Daten unterliegen zum Beispiel den Datenschutzgesetzen. Dazu können Sie sich als Beschäftigte der LUH ausführlich durch die Stabsstelle Datenschutz beraten lassen. Wenn Sie Daten verarbeiten, die von anderen Personen oder Institutionen erhoben wurden, prüfen Sie im Vorfeld, ob und unter welchen Bedingungen deren Nutzung erlaubt ist. Wurden die Daten vielleicht unter speziellen Lizenzen veröffentlicht? Klären Sie außerdem mit Ihrem Arbeitgeber, welche Verwertungsrechte Sie an den von Ihnen erhobenen Daten haben. Wenn Sie gemeinsam mit anderen Daten erzeugen, treffen Sie am besten vorab gemeinsam schriftliche Vereinbarungen dazu, wer welche Daten in welcher Form nutzen darf. 

    Gesetze

     
    Weiterführende Links

Speichern, Archivieren und Publizieren

  • Wo können Daten sicher gespeichert werden?

    Der Verlust Ihrer unter erheblichem Kosten-, Zeit- und Arbeitsaufwand erhobenen Daten und der darauf aufbauenden Analysen kann erhebliche negative Folgen für Ihre Forschung haben. Wer Forschungsdaten digital erzeugt und auswertet, muss daher sicherstellen, dass nichts verloren geht und die Ergebnisse für lange Zeit sicher aufbewahrt werden. Folgende Grundsätze sollten Sie beachten:

    • Regelmäßige Datensicherung der zum Forschungsprojekt gehörenden Dateien auf geeignete Medien oder Nutzung von Backup-Diensten.

    • Die Sicherungsintervalle bestimmen die im Fehlerfall mögliche Verlustquote - je häufiger Sie speichern, desto geringer ist der mögliche Datenverlust.

    • Jedes Backup ist nur so gut, wie die Datenwiederherstellung: Testen Sie die Wiederherstellung auf ihren Computer, bevor ein Notfall eintritt.
       

    Backup & Restore am LUIS

    Nutzen Sie für die Datenablage nach Möglichkeit Institutsserver, deren Daten regelmäßig vom LUIS gesichert werden. Mit dem Dienst Backup & Restore erstellen Institute und zentrale Einrichtungen automatisch täglich Sicherungskopien von Serverdaten, die sich regelmäßig ändern oder die zu aktuellen Projekten gehören. Alternativ steht der "Sync & Share"-Dienst Seafile als Teil des zentralen Dateiservices bereit, der ebenfalls automatisch ausgewählte Daten auf einen LUIS-Server kopieren kann. Zusätzlich lassen sich diese Daten damit auch auf weitere Geräte verteilen.

    Backup-Programme

    Die Daten auf ihrem PC-Arbeitsplatz lassen sich auch mit den eingebauten Mechanismen Ihres Betriebssystems (ab Windows Vista etwa Backup&Restore) oder mit Spezial-Software auf externe Medien (USB-Speicher, DVD, Bänder) sichern. Eine Liste solcher Programme finden Sie bei Wikipedia.

    Weiterführende Links

  • Wie speichere ich zugriffsbeschränkte Daten?

    Überlegen Sie sorgfältig, wo und wie Sie Ihre Daten ablegen und sichern. Arbeiten Sie mit schutzwürdigen Daten, sollten Sie den Zugang sowie die Lese- und Schreibberechtigungen auf den unmittelbaren Mitarbeiterkreis einschränken. Solche Beschränkungen lassen sich zum Beispiel über Gruppenrichtlinien auf Dateisystem-Ebene oder entsprechende Einstellmöglichkeiten von Dateidiensten wie dem vom LUIS angebotenen Seafile festlegen. Beim Umgang mit personenbezogenen Forschungsdaten, lassen Sie sich bitte auch von der Stabsstelle Datenschutz beraten, ob Ihre technischen und organisatorischen Sicherheitsmaßnahmen ausreichend sind.

    Kostenlose Cloud-Speicherdienste und unverschlüsselte USB-Medien sind kein geeigneter Platz für schützenswerte Daten. Personenbezogene Forschungsdaten müssen Sie aus Gründen des Datenschutzes grundsätzlich verschlüsselt speichern. Sie können ganze Dateisysteme von Massenspeichern wie Festplatten und tragbaren USB-Medien verschlüsseln, so dass Unbefugte sie nicht auslesen können (Datenträgerverschlüsselung). Die meisten Betriebssysteme wie macOS, Windows und Linux bringen dazu bereits Software mit (FileFault, Bitlocker, dm-crypt). Eine gute Alternative ist das quelloffene Programm VeraCrypt. Damit können Sie neben ganzen Laufwerken und Partitionen auch einzelne Ordner und Dateien direkt verschlüsseln. Letzteres funktioniert auch mit etlichen Archivmanagern (z.B. 7-Zip).

    Weitere Informationen

  • Wo können Daten entsprechend der FAIR-Prinzipien publiziert werden?

    Die Archivierung und Publikation von Daten in einem speziellen Datenrepositorium ist eine Möglichkeit um Daten langfristig verfügbar und zitierfähig zu machen. Die meisten Repositorien haben spezielle Anforderungen an die zu hostenden Daten, die bestenfalls bereits vor der Datenerstellung bedacht und berücksichtigt werden sollten. Üblicherweise sind das einige oder alle der folgenden Anforderungen:

    • Verwendung offener Datenformate, die die langfristige Archivierung und den Zugriff erleichtern
    • Pflicht-Metadaten zur Dokumentation, um Auffindbarkeit und Nutzbarkeit zu erhöhen
    • Versicherung des Datengebers, dass Archivierung und Zugriff auf die Daten nicht gegen das Urheberrecht oder den Datenschutz verstoßen.
    • Nutzung von Lizenzen oder Vereinbarungen, welche die Nachnutzung erleichtern (z.B. Open Access, Open Access nach einer Embargofrist)

     

    Worauf Sie bei der Wahl eines Repositoriums achten sollten

    • Garantierte Datenaufbewahrung für mindestens 10 Jahre

    • Bezahlbare Gebühren für die langfristige Datenaufbewahrung (Diese können auch in einem Projektantrag direkt mit beantragt werden.)

    • Erfassung von Metadaten zu jedem Datensatz, die mindestens den Standards DataCite oder Dublin Core entsprechen

    • Vergibt für jeden Datensatz eindeutige, langfristig gültige Identifier, wie z.B. einen DOI

     

    Repositorien

    re3data.org
    Index allgemeiner und fachspezifischer Repositorien

    RIsources
    Portal der DFG für Forschungsinfrastrukturen

    Leibniz Universität Hannover

    RADAR
    Generisches Daten-Repositorium betrieben von FIZ Karlsruhe und TIB

    ZENODO
    Generisches Repositorium, finanziert von der Europäischen Union und betrieben am CERN.

  • Welche Daten sollen publiziert werden?

    Viele Förderer, Universitäten und Wissenschaftsorganisationen verlangen oder empfehlen, Forschungsdaten frei zugänglich zu machen. Dadurch sind einerseits die publizierten Auswertungen besser überprüfbar. Andererseits wird eine Nachnutzung durch Dritte ermöglicht.

    In der Regel ist es jedoch weder möglich noch sinnvoll, sämtliche im Forschungsprozess entstandene Daten zu publizieren. Ein wichtiger Schritt ist daher die Auswahl der publikationswürdigen Daten, die der/die Forschende selbst trifft. Wir empfehlen die Publikation aller Daten, die mindestens eines der folgenden Kriterien erfüllen:

    • Einzigartigkeit: Es sind keine Dubletten der Daten bereits an anderer Stelle veröffentlicht.

    • Stark eingeschränkte Reproduzierbarkeit: Die Daten könnten nicht oder nur unter sehr großem Aufwand erneut generiert werden.

    • hohe fachliche Relevanz: Die Daten sind für Ihre Fachcommunity oder sogar fachübergreifend von besonderem Interesse.

    • Grundlage von Textpublikationen: Sie haben Bücher oder Artikel veröffentlicht, die auf der Auswertung dieser Daten basieren.

    Damit Ihre Daten auch tatsächlich nachgenutzt werden können, beachten Sie bitte Folgendes:

    • Adäquate Dokumentation: Stellen Sie ausreichend beschreibende Metadaten bereit, damit der Datensatz verständlich ist und gezielt in einer Datenbank (z.B. eines Repositoriums) gesucht werden kann.

    • Lesbarkeit: Speichern Sie die Daten nach Möglichkeit in offenen, weit verbreiteten Formaten, die plattformunabhängig geöffnet werden können und keine spezielle (evtl. nicht dauerhaft verfügbare) Hard- und Software benötigt.

    • Rechte: Prüfen Sie, ob ggf. Rechte Dritter einer Veröffentlichung entgegenstehen (z.B. Urheber-, Datenschutz- oder Persönlichkeitsrechte). Falls das der Fall ist, versuchen Sie, sich alle notwendigen Rechte von den Betroffenen schriftlich einräumen zu lassen. Versehen Sie Ihre Daten mit einer offenen Lizenz (z.B. CC0), damit sie von jedermann uneingeschränkt nachgenutzt werden dürfen.

  • Welche Lizenzen werden empfohlen?

    Bevor Daten mit Dritten geteilt werden, sollten die Voraussetzungen für die Nachnutzung geklärt werden. Forschenden an der LUH wird empfohlen, offene Lizenzen für Datenpublikationen zu verwenden. Mit der Vergabe einer offenen Lizenz räumt der Urheber anderen Personen das Recht ein, die Daten uneingeschränkt zu verwenden, zu verändern und weiterzuverbreiten. Es gibt auch Lizenzen, die diese Rechte einschränken. Diese gelten dann aber nicht mehr als "offen". Die Vergabe einer standardisierten Lizenz ist in der Regel eine Voraussetzung für die Publikation in Repositorien.

    Lizenzen

Richtlinien und Projektplanung

  • Wie erstelle ich eine instituts- und/oder projektinterne Richtlinie?

    Das Service-Team Forschungsdaten hat zur Unterstützung bei der Erstellung einer internen Richtlinie zum Umgang mit Forschungsdaten eine Handreichung bereitgestellt. Diese gibt einen Überblick in die erforderlichen Schritte von den Vorüberlegungen bis zur Umsetzung und Evaluation einer Richtlinie. Sie enthält auch eine Übersicht von möglichen inhaltlichen Grundsätzen.

    Eine weitere, sehr ausführliche Anleitung der Technischen Universität Berlin für das Teilvorhaben „Forschungsdaten-Policies für Forschungsprojekte“ im DFG-Verbundprojekt „FDNext“ finden Sie hier.

    Der Sonderforschungsbereich 1464 TerraQ hat eine Richtlinie zum Forschungsdatenmanagement erstellt und veröffentlicht, welche ein gutes Beispiel ist.

    Das Service-Team Forschungsdaten begleitet Institute und Projekte gerne bei der Erstellung einer Richtlinie zum Umgang mit Forschungsdaten in persönlichen Beratungsgesprächen.

  • Welche Kosten fallen für das Forschungsdatenmanagement an?

    In welchem Maße Kosten für Maßnahmen zum Forschungsdatenmanagement entstehen, ist in jedem Projekt unterschiedlich. Drei Beispielkalkulationen finden Sie hier. Wichtige Einflussfaktoren sind das anfallende Datenvolumen, die Anzahl der Dateien und der Grad ihrer Homogenität. Je mehr manuelle Arbeit erforderlich ist, desto höher ist der Personalaufwand und damit die Kosten. Die Datenpublikation ist in vielen Repositorien gratis möglich. Allerdings können bei größeren Datenvolumina oder der Inanspruchnahme zusätzlicher Dienstleistungen (z.B. Datenaufbereitung und -kuratierung) Kosten entstehen.

Einbindung von FDM-Themen in die Lehre