Kurz erklärt
Glossar

Glossar

Erläuterungen zu wichtigen Fachbegriffen

Dieses Glossar basiert auf dem Glossar des RADAR-Projekts und auf Artikeln des Wikis forschungsdaten.org.


  • Bitstream Preservation

    Digitale Daten bestehen aus einer festen Abfolge von Bits (Bitstream), wobei jedes Bit entweder den Wert 1 oder 0 repräsentiert. Bitstream Preservation bedeutet, dass diese Abfolge exakt erhalten bleibt. Bei vielen Speichermedien führen Alterungsprozesse mit der Zeit zu fehlerhaften Bits. Um dies zu verhindern, ist ein regelmäßiges Umkopieren auf ein neues Medium notwendig. Das gilt auch bei einem Technologiewechsel, wenn also z.B. ein neuartiges Medium zum Einsatz kommt. Bitstream Preservation ist eine Grundvoraussetzung für die digitale Langzeitarchivierung.

  • Creative Commons-Lizenzen

    In manchen Fällen können bei der Erzeugung von Forschungsdaten Urheberrechte an diesen Daten entstehen (z.B. bei oft bei Fotografien und Zeichnungen). Dadurch ist eine (Nach-)Nutzung dieser Daten nur mit der ausdrücklichen Genehmigung der Urheber erlaubt. Das führt häufig zu ungewollten Komplikationen und Unklarheiten, wenn die Daten anderen Personen zur Verfügung gestellt werden sollen. Daher empfiehlt es sich, die Daten mit einer Lizenz zu versehen, in der die Nutzungsbedingungen klar geregelt sind. Besonders bekannt und bewährt sind die Creative Commons (CC) Lizenzen. CC-Lizenzen gibt es in mehreren Varianten, die bestimmte Nutzungsarten ausschließen oder zulassen. Für Forschungsdaten empfiehlt sich meist die Lizenz CC0 (Public Domain), mit der die Urheber auf sämtliche Rechte verzichten. Bei einer Nachnutzung im wissenschaftlichen Kontext ist es im Sinne der guten wissenschaftlichen Praxis dennoch verpflichtend, die Urheber zu nennen.

  • Data-Journal

    Data-Journals publizieren Artikel (sogenannte Data Paper), die die Prozesse der Datenerhebung inklusive der verwendeten Instrumente und Methoden dokumentieren. Diese Beschreibungen sorgen für eine bestmögliche Nachnutzbarkeit der Daten. In einigen Fällen stellen die Journale eigene Repositorien zur Verfügung, in denen die beschriebenen Daten selbst abgelegt werden können. Es ist aber ebenso möglich, die Daten an einem anderen Ort vorzuhalten. In der Regel sollte dieser Ort in dem Data Paper mithilfe eines persistenten Identifikatoren wie einem Digital Object Identifier (doi) referenziert werden.

  • Dateiformat

    Das Dateiformat beeinflusst ganz wesentlich die langfristige Lesbarkeit digitaler Daten. Dateiformate sind unterschiedlich weit verbreitet und unterschiedlich gut dokumentiert. Einige sind „offen“, das heißt, die genauen Spezifikationen sind öffentlich. Andere sind proprietär, also Hersteller-abhängig. In diesen Fällen sind die Spezifikationen oft nicht öffentlich. Je seltener ein Format und je unbekannter seine genauen Spezifikationen desto größer ist die Wahrscheinlichkeit, dass es schon in wenigen Jahren keine aktuelle Software mehr geben wird, mit der die Dateien geöffnet und gelesen werden können. Wenn Sie Daten langfristig archivieren wollen, versuchen Sie, die Dateien in offene, weit verbreitete Standart-Formate zu konvertieren. Eine Übersicht über solche Formate bietet das RADAR-Projekt.

  • Datenarchiv

    Ein Datenarchiv ist eine Einrichtung, die digitale Daten für einen längeren Zeitraum in ihrem Original-Zustand aufbewahrt (Bitstream Preservation). Das schließt Backup-Kopien und einen regelmäßigen Austausch der Datenträger ein. Werden zusätzlich Dienste wie die Migration in neuere Dateiformate oder die online-Publikation angeboten, handelt es sich nicht mehr um ein reines Archiv, sondern um ein Repositorium.

  • Datenbankschutzrecht

    Das Datenbankschutzrecht ist ein dem Urheberrecht verwandtes Leistungsschutzrecht. Es sichert denjenigen, die den Aufbau einer Datenbank finanziert haben, für 15 Jahre die Nutzungs- und Verwertungsrechte. Das Datenbankschutzrecht schützt nicht die Inhalte der Datenbank (die allerdings dem Urheberrecht unterliegen können), sondern deren Zusammenstellung. Voraussetzung ist, dass für die Erstellung der Datenbank eine "wesentliche Investition" von Geld, Zeit, Arbeitskraft usw. notwendig war, um die erforderliche "geistigen Schöpfungshöhe" zu erreichen. Grundlage des Datenbankschutzrechts ist die Richtlinie 96/9/EG des Europäischen Parlaments und des Rates vom 11. März 1996 über den rechtlichen Schutz von Datenbanken.

  • Datenmanagementplan (DMP)

    Ein Datenmanagementplan (DMP) ist ein Instrument zur Planung und Strukturierung von Forschungsprojekten. Darin werden u. a. Art und Umfang der Projektdaten beschrieben, um Anforderungen zum Umgang mit Forschungsdaten abzuleiten. Ein DMP wird im Idealfall vor Beginn eines Forschungsprojektes erstellt, ist aber ein dynamisches Dokument, das sich im weiteren Verlauf des Projektes verändert.

  • Datenschutz

    Unter Datenschutz werden technische und organisatorische Maßnahmen gegen den Verlust, unbefugten Zugriff und Missbrauch von personenbezogenen Daten verstanden. Personenbezogene Daten sind alle Daten, über die sich eine Person mittelbar oder unmittelbar identifizieren lässt (z.B. Name, Anschrift, IP-Adresse, E-Mail-Adresse). Das Sammeln personenbezogener Daten ist grundsätzlich nur mit ausdrücklicher Zustimmung der Betroffenen erlaubt, wobei es Einschränkungen und Ausnahmen gibt (z.B. für bestimmte Behörden oder Verwendungszwecke).

    In der Forschung fallen personenbezogene Daten insbesondere in medizinischen und sozialwissenschaftlichen Studien an. Die Verschlüsselung und Aufbewahrung an besonders gesicherten Orten ist hier zwingend erforderlich. Durch nachträgliche Pseudonymisierung oder Anonymisierung kann der Personenbezug aber soweit aufgehoben werden, dass sogar eine Publikation dieser Daten rechtlich möglich wir.

    Seit dem 25. Mai 2018 ist die europäische Datenschutzgrundverordnung als unmittelbar geltendes Recht in Kraft. Das Bundesdatenschutzgesetz und das Niedersächsische Datenschutzgesetz wurden entsprechend den Vorgaben dieser Verordnung neu gefasst. Weitere Informationen finden Sie auf der Webseite des behördlichen Datenschutzbeauftragten der LUH.

  • Datensicherung

    Datensicherung ist die temporäre Duplizierung von Daten zur Vermeidung von Datenverlust aufgrund technischer Störungen. Die Datensicherung umfasst in der Regel die Synchronisation der aktuell verwendeten Arbeitsumgebung. Für bestmögliche Sicherheit sollten mindestens zwei Kopien an jeweils unterschiedlichen Orten existieren. Daten auf Servern des Rechenzentrums der Leibniz Universität Hannover werden auomatisch mehrfach gesichert.

  • Digital Object Identifier (DOI)

    Ein Digital Object Identifier (DOI) ist ein persistenter Identifier, der zur Zitierung und Verlinkung von Objekten verwendet wird. Er identifiziert das Objekt eindeutig und permanent in digitalen Umgebungen. Ein DOI besteht aus einer zweigliedrigen Struktur - einem Präfix und Suffix, (z.B. DOI: 10.1000/123456). Weitere Informationen zur DOI-Registrierung von Forschungsdaten finden Sie beim DOI-Service der Technischen Informationsbibliothek.

  • Embargo

    Ein (zeitliches) Embargo definiert einen Zeitraum, in welchem nur die Beschreibung (Metadaten) der Forschungsdaten öffentlich zugänglich sind, die zugehörige Daten aber noch nicht. Ein Embargo kann verwendet werden, wenn Forschungsdaten (z.B. im Rahmen eines Peer-Review-Prozesses) zeitverzögert publiziert werden sollen.

  • Enhanced Publication

    Der Begriff 'Enhanced Publication' beschreibt die elektronische Publikation eines wissenschaftlichen Artikels, welche mit den dazugehörigen öffentlich zugänglichen digitalen Forschungsdaten verknüpft ist.

  • Forschungsdaten

    Als Forschungsdaten werden alle Daten bezeichnet, die im Zuge wissenschaftlichen Arbeitens anfallen. Sie bilden die Grundlage aktueller und potentiell zukünftiger wissenschaftlicher Erkenntnisse.

  • Forschungsdatenmanagement

    Forschungsdatenmanagement beinhaltet die Organisation und Verwaltung digitaler Daten, die während eines Forschungsprozesses entstehen. Das schließt alle Tätigkeiten zur Planung von Forschungsaktivitäten, Erzeugung, Dokumentation, Analyse, Speicherung, Archivierung und Publikation digitaler Daten ein.

  • Gute wissenschaftliche Praxis

    Die Regeln der guten wissenschaftlichen Praxis dienen als Orientierung im Rahmen wissenschaftlicher Arbeitsprozesse. In Deutschland sind diese Regeln z.B. in den Empfehlungen der Deuschen Forschungsgemeinschaft (DFG) zur Sicherung guter wissenschaftlicher Praxis zu finden. Empfehlung 7 beinhaltet dabei, dass "Primärdaten als Grundlagen für Veröffentlichungen auf haltbaren und gesicherten Trägern in der Institution, wo sie entstanden sind, zehn Jahre lang aufbewahrt werden" sollen. Damit soll gewährleistet sein, dass Forschungsergebnisse überprüfbar werden. Eine Publikation der Daten fördert zudem die Nachnutzbarkeit der Forschungsdaten.

  • Harvesting (Metadaten)

    Bezeichnet das systematische und automatisierte Sammeln und Aufbereiten von Metadaten aus Datenbanken, Repositorien sowie anderen digitalen Quellen. Die Sichtbarkeit, Auffindbarkeit und Nachnutzbarkeit der publizierten Forschungsdaten kann damit erhöht werden.

  • Langzeitarchivierung, funktionale

    Die Langzeitarchivierung von Forschungsdaten ist ein Verfahren, das Daten für einen unbestimmten Zeitraum, über technologische und soziokulturelle Veränderungen hinaus, verfügbar und interpretierbar hält. Im Unterschied zur Datensicherung, müssen die Daten bei der Langzeitarchivierung jederzeit decodierbar und lesbar erhalten werden, und beispielsweise in andere Dateiformate migriert werden.

  • Metadaten

    Metadaten werden oft als 'Daten über Daten' bezeichnet und dienen dazu, die unterschiedlichen Informationen zu digitalen Objekten zu kategorisieren und zu charakterisieren: Technische Metadaten beinhalten z.B. Angaben zu Datenvolumen und Datenformat und sind für eine nachhaltige Datenspeicherung von zentraler Bedeutung. Deskriptive Metadaten (auch beschreibende oder Content-Metadaten genannt) geben Auskunft über die in digitalen Objekten enthaltenen (z.B. wissenschaftlichen) Informationen und entscheiden damit über deren Auffindbarkeit, Referenzierung und Nachnutzbarkeit.

  • Persistent Identifier

    Ein persistent Identifier ist ein permanenter Bezeichner einer digitalen Ressource. Er identifiziert die digitale Ressource dauerhaft und eindeutig und zeichnet sich durch eine strikte Trennung von Ressource und Standortreferenz der Ressource aus. Ein Digital Object Identifier (DOI) ist ein sogenannter persistent Identifier.

  • Primärdaten

    Primärdaten werden oft synonym zu Forschungsdaten verwendet (siehe Forschungsdaten). In manchen Fällen bezieht sich der Begriff allerdings lediglich auf Rohdaten und nicht unbedingt auf bearbeitete Forschungsdaten.

  • Publikation von Daten

    Um Daten zu publizieren, müssen sie in einem geeigneten Repositorium abgelegt werden und dort über das Internet öffentlich abrufbar sein. Viele Repositorien bieten auch die Möglichkeit der Beschränkung des Zugangs auf bestimmte Personengruppen (z.B. nur Wissenschaftler) und der Zugänglichmachung auf Antrag und nur mit ausdrücklicher Zustimmung des Urhebers der Daten. Um publizierte Daten langfristig zitierbar zu machen, sollten sie über einen permanenten Link abrufbar sein. Dies wird durch die Vergabe eines persistenten Identifiers, z.B. eines DOI (Digital Object Identifiers) gewährleistet.

  • Repositorium

    Als Repositorium wird ein Dokumentenserver bezeichnet, der digitale wissenschaftliche Objekte (z.B. Zeitschriftenpublikationen oder Forschungsdaten) über einen unbegrenzten Zeitraum aufbewahrt, pflegt und zusätzlich die Möglichkeit bietet, sie für die weltweite (Fach-)Öffentlichkeit online verfügbar, zitierbar und nachnutzbar zu machen. Es gibt institutionelle Repositorien, in denen Mitglieder der jeweiligen Institution publizieren können. Disziplinäre Repositorien bieten Wissenschaftlern einer Fachdisziplin Publikationsmöglichkeiten.

  • Urheberrecht

    Bestimmte Arten von Forschungsdaten, z.B. viele Zeichnungen und Fotografien, können als „Werk“ unter das Urheberrecht fallen. Dafür müssen sie die notwendige „geistige Schöpfungshöhe“, also ein Mindestmaß an Kreativität und Originalität, aufweisen. Auf rein maschinell erzeugte (Mess-)Daten trifft das meistens nicht zu. Fallen Daten unter das Urheberrecht, liegen die ausschließlichen Nutzungs-, Verwertungs- und Vervielfältigungsrechte zunächst bei denjenigen, die die Daten erzeugt haben, sofern keine anderweitigen vertraglichen Regelungen getroffen wurden (z.B. Arbeitsvertrag, Kooperationsvertrag oder Vertrag zu einer Auftragsforschung). Die Urheber können diese Rechte jedoch abtreten, um anderen eine Nutzung ihrer Werke zu ermöglichen.

    Im Falle öffentlich finanzierter Forschung erwarten insbesondere viele Drittmittelgeber, dass alle Daten, bei denen das rechtlich möglich ist, für jedermann kostenlos zugänglich gemacht werden. Eine Nachnutzung soll möglichst uneingeschränkt gestattet sein. Zu diesem Zweck ist es sinnvoll, (möglicherweise) urheberrechtsgeschützte Forschungsdaten mit einer entsprechenden Lizenz zu versehen. Besonders bekannt und bewährt sind z.B. die Creative Commons-Lizenzen CC0 (keinerlei Bedingungen) oder CC-By (Nennung der Urheber ist obligatorisch).

  • Zertifizierung

    In Bezug auf Forschungsdaten bezieht sich dieser Begriff in der Regel auf Repositorien. Durch Einhaltung bestimmter Standards können Repositorien ein sogenanntes Zertifikat erhalten. Dadurch kann sowohl Qualität als auch Vertrauenswürdigkeit der Repositorien gesichert werden.

  • Zitierrichtlinien

    Je nach Fachbereich und Forschungsdisziplin ist das Zitieren wissenschaftlicher Datenpublikationen unterschiedlich weit verbreitet. Das Thema der Zitation von Forschungsdaten wird derzeit von verschiedenen wissenschaftlichen Gruppierungen bearbeitet, so dass (noch) kein einheitlicher Standard existiert.