Archivierung

Die Datenarchivierung

Archivierung bezeichnet die langfristige Speicherung von gesammelten Daten und den dazugehörigen Metadaten. Durch diese Praxis werden die Daten vor ungewolltem Verlust oder Schäden geschützt. Die Archivierung wird aufgeteilt in drei Ebenen: Gewährleistung der Integrität, der Authentizität und der Interpretierbarkeit der Daten. Dies sichert nicht nur die Erhaltung der Daten selbst, sondern auch ihre korrekte Bedeutung und Einordnung über die Zeit hinweg.

  • Langzeitspeicherung erhobener Daten und Metadaten

  • Daten werden vor ungewolltem Verlust und Beschädigung geschützt

  • Drei Ebenen der Archivierung: Erhalt von Integrität, Authentizität und Interpretierbarkeit der Daten

Zweck der Archivierung

Die Archivierung dient verschiedenen Zwecken, um die Sicherheit und Bedeutung von Forschungsdaten langfristig zu gewährleisten. Unsachgemäße Archivierung birgt das Risiko von Beschädigung oder Verlust von Daten. Ein gut durchgeführter Archivierungsprozess ermöglicht die Interoperabilität, Langzeitarchivierung und effiziente Datenanalyse, während unzureichende Archivierung dazu führen kann, dass Daten aufgrund veralteter Speichermedien unbrauchbar werden. Die Bewahrung der Authentizität und Integrität von Daten ist von zentraler Bedeutung, wofür vertrauenswürdige Repositorien eine entscheidende Rolle spielen. Durch die Einhaltung solcher Archivierungsprinzipien können Forschende sicherstellen, dass ihre Daten auch langfristig relevant und verlässlich bleiben.

  • Daten können bei unsachgemäßer Speicherung beschädigt werden oder verloren gehen

  • Interoperabilität, Langzeitarchivierung und effiziente Datenanalyse wird durch gut durchgeführte Archivierungsprozesse gewährleistet

  • Speichermedien können veralten und Daten unbrauchbar werden bei unzureichend geführter Archivierung

  • Die Authentizität und Integrität von Daten muss bewahrt werden, dabei hilft ein vertrauenswürdiges Repositorium

Aktivitäten für die Archivierung

Die Archivierung von Daten beinhaltet eine Reihe von wichtigen Aktivitäten. Dazu gehört die Übertragung oder Transkription der Daten in die gewünschte Schriftform. Es ist empfehlenswert, normierte und offene Dateiformate zu nutzen und diese regelmäßig auf ihre Aktualität hin zu überprüfen.

Je nach Fachgebiet sollte eine geeignete Plattform oder ein geeignetes Repositorium für die Archivierung der Daten gewählt werden. Dies stellt sicher, dass die Daten in einem Kontext abgelegt werden, der den Anforderungen der jeweiligen Wissenschaftsdisziplin entspricht.

Zusätzliches Material, wie beispielsweise genutzte Fragebögen oder Variablenbeschriftungen, sollte den archivierten Daten beigefügt werden. Dies ermöglicht es anderen Forschenden, die Daten besser zu verstehen und zu nutzen.

Ein weiterer essentieller Schritt ist die regelmäßige Durchführung von Backups. Dadurch wird sichergestellt, dass die Daten im Falle eines unerwarteten Verlusts oder technischer Probleme wiederhergestellt werden können. Diese Aktivitäten tragen dazu bei, dass die Archivierung der Daten effektiv und nachhaltig erfolgt.

  • Daten in die gewünschte Schriftform übertragen bzw. transkribieren

  • Bestenfalls Nutzung von normierten und offenen Dateiformaten und regelmäßige Prüfung auf Aktualität der genutzten Formate

  • Die Daten je nach Wissenschaftsdisziplin einem geeigneten Repositorium archivieren

  • Beifügen von zusätzlichem Material wie z.B. genutzten Fragebögen, Variablenbeschriftungen etc.

  • Regelmäßige Back Ups durchführen

Trainingsmaterialien: Daten archivieren [1]

Reifestufen

Level

Reifestufe

Charakteristik

Level 1

Einstieg

Daten werden ad hoc und

reaktiv archiviert.

Es sind keine festgeschriebenen Arbeitsabläufe

für das Archivieren von Daten auf

Projektebene beschrieben.

Es sind keine Werkzeuge und Software, die im

Rahmen des FDM für Archivieren von Daten

eingesetzt werden,festgelegt.

Level 2

Geführt

Es werden auf Projektebene die datenmanagementbezogenen

Inhalte das Archivieren von Daten

festgelegt und durchgeführt.

Es werden auf Projektebene notwendige Ressourcen

für das FDM das Archivieren von Daten definiert und

eingesetzt.

Forschende wissen, wie das Archivieren von Daten

durchgeführt werden soll und es stehen

notwendige Ressourcen zur Verfügung.

Level 3

Definiert

Die datenmanagementbezogenen Inhalte für das

Archivieren von Daten werden nach domänenspezifischen

Standards und Richtlinien ausgelegt.

Es werden in der Domäne etablierte Tools und Werkzeuge

für das FDM im Rahmen des Archivierens von Daten

identifiziert und angewendet.

Forschende orientieren das Archivieren von Daten

an domänenspezifischen Standards und

etablieren diese in der Umsetzung im Rahmen des

Projektes.

Level 4

Quantitativ geführt

Es werden Qualitätskriterien für das Archivieren

von Daten definiert und etabliert.

Die datenmanagementbezogenen Inhalte für das

Archivieren von Daten werden auf Basis der definierten

Qualitätskriterien hin gesichert.

Forschende sichern auf Datenmanagementebene die

Umsetzung des Archivierens von Daten hinsichtlich

definierter Qualitätskriterien.

Level 5

Optimierend

Auf Datenmanagementebene wird die Umsetzung des

Archivierens von Daten proaktiv optimiert und

kontinuierlich verbessert (inhaltlich und technisch).

Es werden Best Practices und Verbesserungen für

für das Archivieren von Daten entwickelt und mit der

domänenspezifischen Community geteilt.

Level 1

  • Auf der Reifestufe 1 gibt es keine definierten Ziele, da die Archivierung von Daten intuitiv abläuft

  • Archivierung von Daten hängt von der Motivation der Forschenden ab

  • Keine definierte Art und Weise Daten zu archivieren

Level 2

Ziele

Praktiken

Empfehlungen/weitere Materialien

4.2.1.: Entwickeln Sie auf Projekt- oder

Organisationsebene klare Richtlinien und Verfahren

für die Organisation und Definition

der zu archivierenden Daten.

Festlegen, wie erhobene Daten gespeichert und

archiviert werden sollen

Dies sind zumeist schon Inhalte, die in einem DMP für ein Forschungsprojekt geplant und definiert werden

Festlegen, welche Daten gespeichert werden sollen

Festlegen, für welchen Zeitraum die Daten archiviert

werden sollen

Festlegen, wer nach Projektende für die archivierten Daten verantwortlich ist

4.2.2.: Definieren Sie auf Projekt- oder

Organisationsebene das Archivierungssystem der zu

archiviernden Daten so, dass die Langzeitarchivierung

ermöglicht wird.

Anforderungen an die projektinterne Nutzung

eines Archivierungssystems ermitteln und definieren

Ein Archivierungssystems bestimmen und auswählen

4.2.3.: Erhalten Sie die Integrität, Authentizität

und Interpretierbarkeit der archiverten Daten

auf Projektebene.

Die Daten in dem Archivierungssystem organisieren

Physischer Erhalt und Speicherung der Daten

Verknüpfen der Daten mit zugehörigen Metadaten aus der Erhebungsphase

Migration von Dateiformaten bei veraltenten Formaten

Die Daten mittels Metadaten inhaltlich beschreiben

Level 3

Ziele

Praktiken

Empfehlungen/weitere Materialien

4.3.1.: Richten Sie das Management der Archivierung

nach fachspezifischen Communitystandards aus, um eine

effektive und konsistente Archivierung

zu gewährleisten.

Fachspezifische Regelungen und Standards

(Best Practices) identifizieren und einbeziehen

Open Archival Information System (OAIS)

4.3.2.: Passen Sie die Archivierung der Daten an einen

fachspezifischen Kontext an, um die Komaptibilität

und Nachnutzbarkeit der Daten sicherzustellen

Spezifische Metadaten für die Archivierung

einbeziehen und deren Verknüpfung mit den Daten

Metadaten der Archivierung Zusätzliche Angabe von Administrativen Metadaten Hier muss sichergestellt werden, dass bereits in der Erehbungsphase Metadatenstandards verwendet wurden, um die Verständlichkeit zu sichern

Domänenspezifischen Metadaten für die

Interpretierbarkeit der Daten einbeziehen

Empfohlenen Dateiformaten (offene) für eine digitale

Langzeitarchivierung verwenden und/oder Migration

der Dateiformate, sowie Emulation der ursprünglichen

Systemumgebung (bei proprietären Dateiformaten)

  • Dateiformate erhalten

  • Daten dürfen nicht untrennbar mit einem Datenträger oder Auslesegerät verbunden sein, da sie nur so auf Systeme und Träger migriert werden können

  • Emulation der Systemumgebung, der Imitation der alten Software-Umgebung auf neuere Hardware und Systemumgebung, schaffen

4.3.3: Überprüfen Sie, ob das Archivierungssystem

die definierten Standards und Anforderungen

der Fachcommunity erfüllt.

Entwickeln oder Auswahl eines Archivierungssystems,

das die Anforderungen der Standards erfüllt

Regelmäßiger Austausch von Daten & redundante Speicherung

Den physischen Erhalt der Daten durch das

Archvierungssystem sichern

Level 4

Ziele

Praktiken

Empfehlungen/weitere Materialien

4.4.1.: Identifizieren und etablieren Sie

klare und messbare Qualitätsziele, um die Effizienz

und Effektivität des Archivierungsprozesses

zu verbessern und zu überwachen.

Relevante Qualitätsziele identifizieren und definieren

(bspw. Vollständigkeit, Bearbeitbarkeit, …) (hier)

Etablieren von quantitative Qualitätszielen

4.4.2.: Implementieren Sie Mechanismen zur

Sicherstellung der Datenqualität der archivierten

Daten, um sicherzustellen, dass die Daten korrekt,

vollständig und konsistent sind.

Überprüfen der Ausführung im Hinblick auf definierte

relevante Merkmale

Einführen von regelmäßiger Überprüfung zur Datenqualität

und Umsetzung

Level 5

Ziele

Praktiken

Empfehlungen/weitere Materialien

4.5.1.: Etablieren Sie einen kontinuierlichen

Verbesserungsprozess für die definierten

Archivierungsprozesse, um deren Effektivität und

Effizienz kontinuierlich zu optimieren.

Verbessern und anpassen des Managements der

Archivierung auf Grundlage von neuen Standards des

Fachbereichs

4.5.2.: Bewerten Sie regelmäßig die Technologien,

die für die Datenarchivierung verwendet werden,

und setzen Sie Verbesserungen um, um sicherzustellen,

dass die Daten langfristig zugänglich, sicher und in

einem angemessenen Format archiviert werden.

Entwickeln und nutzen neuer technischer Standards

Austausch und Entwickelung technischer Systeme in der

fachspezifischen Community

Checkliste

Weiterführende Materialien

Auf der Internetseite Forschungsdaten.info sind weiterführende Informationen, sowie Beispiele für vertrauenswürdige Repositorien zu finden.

UK Data Archive

Publisso - Digitale Langzeitarchivierung

Referenzen

[1] Diese Trainingmaterialien sind entstanden im Rahmen der NFDI4Ing Special Interest Group RDM Training & Education.