Zugang

Daten zugänglich machen

In der heutigen Forschungslandschaft spielt die Möglichkeit, anderen Forschenden den Zugriff auf Daten zu ermöglichen, eine zentrale Rolle. Daten sind längst nicht mehr ausschließlich für die eigene Forschung von Bedeutung, sondern haben eine breitere Relevanz erlangt. Die Konzeption von Datenpublikationen als eigenständige, zitierbare und dauerhafte Veröffentlichungen von digitalen Forschungsdaten gewinnt dabei an Bedeutung. Insbesondere Förderinstitutionen legen verstärkten Fokus auf die Publikation von Daten, um deren Nachnutzung zu fördern und die Transparenz wissenschaftlicher Erkenntnisse zu steigern. Dieser Trend unterstreicht die wachsende Bedeutung der offenen Verfügbarkeit von Forschungsdaten für die gesamte wissenschaftliche Gemeinschaft.

  • Anderen Forschenden den Zugriff auf Daten ermöglichen, damit diese nachgenutzt werden können

  • Daten sind längst nicht mehr nur für die eigene Forschung relevant

  • Datenpublikationen sind eigenständige, zitierbare und dauerhafte Veröffentlichungen von digitalen Forschungsdaten

  • Förderer fordern vermehrt die Publikation von Daten

Benefit zugänglich gemachter Daten

Die Bereitstellung von Daten zur Wiederverwendung eröffnet eine Vielzahl von Vorteilen. Zum einen verhindert sie potenzielle Duplikationen, da bereits vorhandene Daten genutzt werden können. Dies trägt nicht nur zur Effizienz bei, sondern spart auch Ressourcen, die für wiederholte Datenerhebungen eingesetzt werden könnten.

Ein weiterer positiver Effekt ist die Steigerung der Zitierungen. Daten können ebenso wie wissenschaftliche Artikel zitiert werden, was die Anerkennung und Sichtbarkeit von Forschungsdaten erhöht.

Durch die Etablierung von Datenpublikationen wird auch die wissenschaftliche Integrität gestärkt. Die Veröffentlichung von Daten führt zu größerer Transparenz und ermöglicht eine bessere Nachvollziehbarkeit von Forschungsergebnissen. Dies trägt zur Vertrauensbildung innerhalb der wissenschaftlichen Gemeinschaft bei.

Schließlich fördert die Zugänglichkeit und Nachnutzung von bereitgestellten Daten die Weiterentwicklung der Forschung. Andere Forschende können die Daten verwenden, um neue Erkenntnisse zu generieren, innovative Ansätze zu verfolgen und somit den wissenschaftlichen Fortschritt insgesamt zu beschleunigen.

  • Wiederverwendung von Daten kann Duplikationen vermeiden

  • Steigerung der Zitierungen

  • Wissenschaftliche Integrität wird gestärkt

  • Nachnutzung zugänglich gemachter Daten

Aktivitäten Daten zugänglich zu machen

Die Veröffentlichung von Forschungsdaten erfordert eine sorgfältige Planung und Entscheidungsfindung in mehreren Aspekten. Zunächst einmal ist die Auswahl der Daten, die veröffentlicht werden sollen, von entscheidender Bedeutung. Hierbei gilt es, relevante und repräsentative Informationen auszuwählen, um einen Mehrwert für die Forschungsgemeinschaft zu bieten.

Ein weiterer wichtiger Schritt ist die Festlegung von Urheberrechten und Lizenzen für die veröffentlichten Daten. Diese Schritte sind essenziell, um die Rechte der Datenersteller zu schützen und gleichzeitig eine angemessene Nutzung durch Dritte zu ermöglichen.

Die Wahl der Zugangsplattform ist ebenfalls von Bedeutung. Je nach Fachgebiet und Zielgruppe kann die Auswahl der Plattform variieren, wobei offene und leicht zugängliche Plattformen oft bevorzugt werden, um die Reichweite der Daten zu maximieren.

Die Verwendung von Metadaten ist ein weiterer kritischer Aspekt. Metadaten bieten Kontext und zusätzliche Informationen zu den veröffentlichten Daten. Sie helfen dabei, die Daten in den richtigen Zusammenhang zu setzen und ermöglichen anderen Forschenden eine bessere Interpretation und Nutzung der Informationen.

Um die Daten angemessen zu präsentieren, ist es wichtig, sie in einen Kontext zu setzen. Das bedeutet, die zugrundeliegenden Prozesse und Methoden zu beschreiben, die zur Erzeugung der Daten geführt haben. Zusätzlich können Verlinkungen zu weiteren Materialien und Ressourcen den Forschenden helfen, ein umfassenderes Verständnis der Daten zu entwickeln und möglicherweise neue Forschungsrichtungen zu erkennen.

  • Auswahl der zu veröffentlichenden Daten

  • Urheberrechten und Lizenzen bestimmen

  • Zugangsplattform bestimmen

  • Verwendung von Metadaten

  • Daten in einen Kontext setzen

Trainingsmaterialien: Daten teilen und publizieren [1]

Reifestufen

Level

Reifestufe

Charakteristik

Level 1

Einstieg

Daten werden ad hoc und

reaktiv zugänglich gemacht.

Es sind keine festgeschriebenen Arbeitsabläufe

für das Zugänglichmachen von Daten auf

Projektebene beschrieben.

Es sind keine Werkzeuge und Software, die im

Rahmen des FDM für Zugänglichmachen von Daten

eingesetzt werden, festgelegt.

Level 2

Geführt

Es werden auf Projektebene die datenmanagementbezogenen

Inhalte für das Zugänglichmachen von Daten

festgelegt und durchgeführt.

Es werden auf Projektebene notwendige Ressourcen

für das FDM für das Zugänglichmachen von Daten

definiert und eingesetzt.

Forschende wissen, wie das Zugänglichmachen

von Daten durchgeführt werden soll und es stehen

notwendige Ressourcen zur Verfügung.

Level 3

Definiert

Die datenmanagementbezogenen Inhalte für das

das Zugänglichmachen von Daten werden nach

domänenspezifischen Standards und Richtlinien ausgelegt.

Es werden in der Domäne etablierte Tools und Werkzeuge

für das FDM im Rahmen des Zugänglichmachen von Daten

identifiziert und angewendet.

Forschende orientieren das Zugänglichmachen von Daten

an domänenspezifischen Standards und etablieren

diese in der Umsetzung im Rahmen des Projektes.

Level 4

Quantitativ geführt

Es werden Qualitätskriterien für das Zugänglichmachen

von Daten definiert und etabliert.

Die datenmanagementbezogenen Inhalte für das

Zugänglichmachen von Daten werden auf Basis

der definierten Qualitätskriterien hin gesichert.

Forschende sichern auf Datenmanagementebene die

Umsetzung des Zugänglichmachen von Daten hinsichtlich

definierter Qualitätskriterien.

Level 5

Optimierend

Auf Datenmanagementebene wird die Umsetzung des

Zugänglichmachen von Daten proaktiv optimiert und

kontinuierlich verbessert (inhaltlich und technisch).

Es werden Best Practices und Verbesserungen für

das Zugänglichmachen von Datenentwickelt und mit der

domänenspezifischen Community geteilt.

Level 1

  • Auf der Reifestufe 1 gibt es keine definierten Ziele, da das Zugänglichmachen von Daten intuitiv abläuft

  • Daten werden reaktiv auf Nachfrage zugänglich gemacht

  • Keine definierte Plattform, um Daten zugänglich zu machen

  • Die Ausführung ist dabei abhängig von der Motivation der/des Forschenden

Level 2

Ziele

Praktiken

Empfehlungen/weitere Materialien

5.2.1 (methodisch)

Ich bereite bis um Beginn der Veröffentlichung den

Veröffentlichungsprozess für die Forschungsdaten vor.

Ich identifiziere eine Zugangsplattform und Ressourcen

für die Veröffentlichung der Forschungsdaten.

Ich definiere eine Veröffentlichungsstrategie für die

Forschungsdaten (inklusive Metadaten, Lizenzen, Rechte,

Formate).

Ich definiere Verantwortlichkeiten für den

Veröffentlichungsprozess (Selektion, Dokumentation,

Organisation).

5.2.2 (methodisch)

Ich bereite bis zum Beginn der Veröffentlichung meine

Forschungsdaten für den Zugang vor (Selektion,

Dokumentation, Organisation).

Ich identifiziere und selektiere die Daten, die basierend

auf Kriterien hinsichtlich der Veröffentlichung relevant

sind (spezifische Nachfrage, Nachnutzbarkeit, Relevanz,

Replizierbarkeit, rechtliche, ethische und politische

Anforderungen sowie Barrieren; Form der

Veröffentlichung).

Ich erstelle möglichst maschinenlesbare Metadaten für die

Veröffentlichung (bibliographische, administrative,

deskriptive).

Ich weise persistente Identifikatoren zu (Datensatz,

Person, Institutionen).

Ich wandle den Datensatz in ein möglichst offenes Format

um.

Ich wähle geeignete Nutzungslizenzen für die

Veröffentlichung der Daten. (projektabhängig)

Ich strukturiere und ordne den selektierten Datensatz

nach den Vorgaben der Zugangsplattform.

5.2.3 (technisch)

Ich veröffentliche den strukturierten

Forschungsdatensatz mit ausgewählten Werkzeugen und

Ressourcen im Rahmen des Projekts.

Ich veröffentliche den Datensatz in einer ausgewählten

Zugangsplattform (Repositorium, Datenarchiv, Datencenter,

digitale Bibliothek).

Ich nutze für die Zugangsplattform eine ausgewählte

Software.

Level 3

Ziele

Praktiken

Empfehlungen/weitere Materialien

5.3.1 (methodisch)

Ich bereite bis um Beginn der Veröffentlichung den

Veröffentlichungsprozess für die Forschungsdaten nach

domänen- oder communityspezifischen Standards vor.

Ich identifiziere eine in der Domäne oder Community

etablierte Zugangsplattform und Ressourcen für die

Veröffentlichung der Forschungsdaten.

Ich definiere die Veröffentlichungsstrategie für die

Forschungsdaten nach domänen- oder communityspezifischen

Standards (inklusive Metadaten, Lizenzen, Rechte,

Formate).

5.3.2 (methodisch)

Ich bereite bis zum Beginn der Veröffentlichung meine

Forschungsdaten für den Zugang nach domänen- oder

communityspezifischen Standards vor (Selektion,

Dokumentation, Organisation).

Ich identifiziere und selektiere die Daten, die basierend

auf Kriterien aus der Domäne oder Community (spezifische

Nachfrage, Nachnutzbarkeit, Relevanz, Replizierbarkeit,

rechtliche, ethische und politische Anforderungen sowie

Barrieren; Form der Veröffentlichung).

Ich erstelle standardisierte und maschinenlesbare

Metadaten für die Veröffentlichung (Metadatenstandard,

Fachvokabular, Ontologien).

Ich erstelle maschinenlesbare Metadaten für die

Veröffentlichung, die domänen- oder communityspezifische

Standards einbeziehen.

Ich weise persistente Identifikatoren zu, die in der

Domäne oder Community etabliert sind (Datensatz, Person,

Institutionen).

Ich wandle den Datensatz in ein möglichst offenes und

standardisiertes Format um.

Ich strukturiere und ordne den selektierten Datensatz

nach den Vorgaben der Domäne oder Community.

5.3.3 (technisch)

Ich veröffentliche den strukturierten

Forschungsdatensatz mit in der Domäne oder Community

etablierten Werkzeugen und Ressourcen.

Ich veröffentliche den Datensatz in einer

Zugangsplattform die in der Domäne oder Community

etabliert ist (Repositorium, Datenarchiv, Datencenter,

digitale Bibliothek).

Level 4

Ziele

Praktiken

Empfehlungen/weitere Materialien

5.4.1 (methodisch)

Ich kenne bis zu der Veröffentlichung Ziele und

Kriterien der Domäne oder Community, mit denen der

Veröffentlichungsprozess und (Meta-)Daten

kontinuierlich gemessen und verbessert werden.

Ich identifiziere quantifizierbare Kriterien für die

Qualitätsmessung.

Ich definiere Verantwortlichkeiten für die

Qualitätsprüfung des Veröffentlichungsprozesses und

zugehöriger Daten.

5.4.2 (methodisch)

Ich prüfe ab dem Beginn der Veröffentlichung die

Datenvorbereitung nach definierten Kriterien

(kontextuelle Qualität, representationale Qualität).

Ich überprüfe die Selektion der Daten abhängig von

definierten Kriterien (Vollständigkeit, Relevanz,

rechtliche Aspekte).

Ich überprüfe verfasste Metadaten nach definierten

Kriterien (Vollständigkeit, Interpretierbarkeit,

Konsistenz, Genauigkeit).

Ich lasse meine Daten(-sätze) vor der Veröffentlichung

durch Experten begutachten (Peer-Review, Datenkuratoren).

5.4.3 (methodisch)

Ich prüfe ab dem Beginn der Veröffentlichung meine

veröffentlichten Daten nach definierten Kriterien.

Ich prüfe veröffentlichte Daten(-Sätze) und Metadaten auf

Vollständigkeit, Aktualität und Rechtskonformität sowie

Zitierbarkeit.

Ich prüfe veröffentlichte Daten(-Sätze) basierend auf

alternativen Metriken (Alt-Metriken; Downloads,

Speicherungen, Ansichten, Zitationen).

5.4.4 (technisch)

Ich führe die Qualitätsprüfung des

Veröffentlichungsprozesses mit ausgewählten Werkzeugen

durch.

Ich nutze ein ausgewähltes Werkzeug für die

Qualitätsprüfung (Hardware, Software).

Level 5

Ziele

Praktiken

Empfehlungen/weitere Materialien

5.5.1 (methodisch)

Ich trage zur (Weiter-)Entwicklung von

Veröffentlichungsstrategien, Best-Practices und

Standards sowie Werkzeugen und Ressourcen in der

Domäne oder Community bei.

Ich beteilige mich an der (Weiter-)Entwicklung und

Optimierung von Zugangsplattformen und zugehöriger

Software (Hardware, Software; Veröffentlichungsmodelle).

Ich wirke bei dem Austausch und der Entwicklung neuer

Standards und Best-Practices im Rahmen der

Veröffentlichung in der Community mit

(Validierungs-Strategien, Metadaten, Maschinenlesbarkeit,

Vernetzung von Veröffentlichungen, persistente

Identifikatoren, Zitationsstile).

5.5.2 (methodisch)

Ich stehe im Austausch mit der Community und

verbessere kontinuierlich Ressourcen und Funktionen im

Bereich des Zugangs.

Ich nutze alle mir zur Verfügung stehenden Kompetenzen

und Ressourcen in der Domäne oder Community, um meine

Veröffentlichung von Daten zu verbessern und zu

optimieren (neue Zugangssysteme, Strategien, Standards,

Lizenzen).

Ich teile neue Erkenntnisse und Methoden sowie Techniken

und Ressourcen für die Veröffentlichung von Daten in der

Domäne oder Community und setze mich für Open-Science

ein.

Checkliste

Weiterführende Materialien

Auf der Internetseite Forschungsdaten.info sind weiterführende Informationen zu finden.

DataWiz (2017): Best Practices of Data Publication. Version Draft 0.2.

GO-FAIR

Referenzen

[1] Diese Trainingmaterialien sind entstanden im Rahmen der NFDI4Ing Special Interest Group RDM Training & Education.