Archivierung
Die Datenarchivierung
Archivierung bezeichnet die langfristige Speicherung von gesammelten Daten und den dazugehörigen Metadaten. Durch diese Praxis werden die Daten vor ungewolltem Verlust oder Schäden geschützt. Die Archivierung wird aufgeteilt in drei Ebenen: Gewährleistung der Integrität, der Authentizität und der Interpretierbarkeit der Daten. Dies sichert nicht nur die Erhaltung der Daten selbst, sondern auch ihre korrekte Bedeutung und Einordnung über die Zeit hinweg.
Langzeitspeicherung erhobener Daten und Metadaten
Daten werden vor ungewolltem Verlust und Beschädigung geschützt
Drei Ebenen der Archivierung: Erhalt von Integrität, Authentizität und Interpretierbarkeit der Daten
Zweck der Archivierung
Die Archivierung dient verschiedenen Zwecken, um die Sicherheit und Bedeutung von Forschungsdaten langfristig zu gewährleisten. Unsachgemäße Archivierung birgt das Risiko von Beschädigung oder Verlust von Daten. Ein gut durchgeführter Archivierungsprozess ermöglicht die Interoperabilität, Langzeitarchivierung und effiziente Datenanalyse, während unzureichende Archivierung dazu führen kann, dass Daten aufgrund veralteter Speichermedien unbrauchbar werden. Die Bewahrung der Authentizität und Integrität von Daten ist von zentraler Bedeutung, wofür vertrauenswürdige Repositorien eine entscheidende Rolle spielen. Durch die Einhaltung solcher Archivierungsprinzipien können Forschende sicherstellen, dass ihre Daten auch langfristig relevant und verlässlich bleiben.
Daten können bei unsachgemäßer Speicherung beschädigt werden oder verloren gehen
Interoperabilität, Langzeitarchivierung und effiziente Datenanalyse wird durch gut durchgeführte Archivierungsprozesse gewährleistet
Speichermedien können veralten und Daten unbrauchbar werden bei unzureichend geführter Archivierung
Die Authentizität und Integrität von Daten muss bewahrt werden, dabei hilft ein vertrauenswürdiges Repositorium
Aktivitäten für die Archivierung
Die Archivierung von Daten beinhaltet eine Reihe von wichtigen Aktivitäten. Dazu gehört die Übertragung oder Transkription der Daten in die gewünschte Schriftform. Es ist empfehlenswert, normierte und offene Dateiformate zu nutzen und diese regelmäßig auf ihre Aktualität hin zu überprüfen.
Je nach Fachgebiet sollte eine geeignete Plattform oder ein geeignetes Repositorium für die Archivierung der Daten gewählt werden. Dies stellt sicher, dass die Daten in einem Kontext abgelegt werden, der den Anforderungen der jeweiligen Wissenschaftsdisziplin entspricht.
Zusätzliches Material, wie beispielsweise genutzte Fragebögen oder Variablenbeschriftungen, sollte den archivierten Daten beigefügt werden. Dies ermöglicht es anderen Forschenden, die Daten besser zu verstehen und zu nutzen.
Ein weiterer essentieller Schritt ist die regelmäßige Durchführung von Backups. Dadurch wird sichergestellt, dass die Daten im Falle eines unerwarteten Verlusts oder technischer Probleme wiederhergestellt werden können. Diese Aktivitäten tragen dazu bei, dass die Archivierung der Daten effektiv und nachhaltig erfolgt.
Daten in die gewünschte Schriftform übertragen bzw. transkribieren
Bestenfalls Nutzung von normierten und offenen Dateiformaten und regelmäßige Prüfung auf Aktualität der genutzten Formate
Die Daten je nach Wissenschaftsdisziplin einem geeigneten Repositorium archivieren
Beifügen von zusätzlichem Material wie z.B. genutzten Fragebögen, Variablenbeschriftungen etc.
Regelmäßige Back Ups durchführen
Trainingsmaterialien: Daten archivieren [1]
Reifestufen
Level |
Reifestufe |
Charakteristik |
---|---|---|
Level 1 |
Einstieg |
Daten werden ad hoc und reaktiv archiviert. |
Es sind keine festgeschriebenen Arbeitsabläufe für das Archivieren von Daten auf Projektebene beschrieben. |
||
Es sind keine Werkzeuge und Software, die im Rahmen des FDM für Archivieren von Daten eingesetzt werden,festgelegt. |
||
Level 2 |
Geführt |
Es werden auf Projektebene die datenmanagementbezogenen Inhalte das Archivieren von Daten festgelegt und durchgeführt. |
Es werden auf Projektebene notwendige Ressourcen für das FDM das Archivieren von Daten definiert und eingesetzt. |
||
Forschende wissen, wie das Archivieren von Daten durchgeführt werden soll und es stehen notwendige Ressourcen zur Verfügung. |
||
Level 3 |
Definiert |
Die datenmanagementbezogenen Inhalte für das Archivieren von Daten werden nach domänenspezifischen Standards und Richtlinien ausgelegt. |
Es werden in der Domäne etablierte Tools und Werkzeuge für das FDM im Rahmen des Archivierens von Daten identifiziert und angewendet. |
||
Forschende orientieren das Archivieren von Daten an domänenspezifischen Standards und etablieren diese in der Umsetzung im Rahmen des Projektes. |
||
Level 4 |
Quantitativ geführt |
Es werden Qualitätskriterien für das Archivieren von Daten definiert und etabliert. |
Die datenmanagementbezogenen Inhalte für das Archivieren von Daten werden auf Basis der definierten Qualitätskriterien hin gesichert. |
||
Forschende sichern auf Datenmanagementebene die Umsetzung des Archivierens von Daten hinsichtlich definierter Qualitätskriterien. |
||
Level 5 |
Optimierend |
Auf Datenmanagementebene wird die Umsetzung des Archivierens von Daten proaktiv optimiert und kontinuierlich verbessert (inhaltlich und technisch). |
Es werden Best Practices und Verbesserungen für für das Archivieren von Daten entwickelt und mit der domänenspezifischen Community geteilt. |
Level 1
Auf der Reifestufe 1 gibt es keine definierten Ziele, da die Archivierung von Daten intuitiv abläuft
Archivierung von Daten hängt von der Motivation der Forschenden ab
Keine definierte Art und Weise Daten zu archivieren
Level 2
Ziele |
Praktiken |
Empfehlungen/weitere Materialien |
---|---|---|
4.2.1.: Entwickeln Sie auf Projekt- oder Organisationsebene klare Richtlinien und Verfahren für die Organisation und Definition der zu archivierenden Daten. |
Festlegen, wie erhobene Daten gespeichert und archiviert werden sollen |
Dies sind zumeist schon Inhalte, die in einem DMP für ein Forschungsprojekt geplant und definiert werden |
Festlegen, welche Daten gespeichert werden sollen |
||
Festlegen, für welchen Zeitraum die Daten archiviert werden sollen |
||
Festlegen, wer nach Projektende für die archivierten Daten verantwortlich ist |
||
4.2.2.: Definieren Sie auf Projekt- oder Organisationsebene das Archivierungssystem der zu archiviernden Daten so, dass die Langzeitarchivierung ermöglicht wird. |
Anforderungen an die projektinterne Nutzung eines Archivierungssystems ermitteln und definieren |
|
Ein Archivierungssystems bestimmen und auswählen |
||
4.2.3.: Erhalten Sie die Integrität, Authentizität und Interpretierbarkeit der archiverten Daten auf Projektebene. |
Die Daten in dem Archivierungssystem organisieren |
Physischer Erhalt und Speicherung der Daten Verknüpfen der Daten mit zugehörigen Metadaten aus der Erhebungsphase |
Migration von Dateiformaten bei veraltenten Formaten |
||
Die Daten mittels Metadaten inhaltlich beschreiben |
Level 3
Ziele |
Praktiken |
Empfehlungen/weitere Materialien |
---|---|---|
4.3.1.: Richten Sie das Management der Archivierung nach fachspezifischen Communitystandards aus, um eine effektive und konsistente Archivierung zu gewährleisten. |
Fachspezifische Regelungen und Standards (Best Practices) identifizieren und einbeziehen |
|
4.3.2.: Passen Sie die Archivierung der Daten an einen fachspezifischen Kontext an, um die Komaptibilität und Nachnutzbarkeit der Daten sicherzustellen |
Spezifische Metadaten für die Archivierung einbeziehen und deren Verknüpfung mit den Daten |
Metadaten der Archivierung Zusätzliche Angabe von Administrativen Metadaten Hier muss sichergestellt werden, dass bereits in der Erehbungsphase Metadatenstandards verwendet wurden, um die Verständlichkeit zu sichern |
Domänenspezifischen Metadaten für die Interpretierbarkeit der Daten einbeziehen |
||
Empfohlenen Dateiformaten (offene) für eine digitale Langzeitarchivierung verwenden und/oder Migration der Dateiformate, sowie Emulation der ursprünglichen Systemumgebung (bei proprietären Dateiformaten) |
|
|
4.3.3: Überprüfen Sie, ob das Archivierungssystem die definierten Standards und Anforderungen der Fachcommunity erfüllt. |
Entwickeln oder Auswahl eines Archivierungssystems, das die Anforderungen der Standards erfüllt |
Regelmäßiger Austausch von Daten & redundante Speicherung |
Den physischen Erhalt der Daten durch das Archvierungssystem sichern |
Level 4
Ziele |
Praktiken |
Empfehlungen/weitere Materialien |
---|---|---|
4.4.1.: Identifizieren und etablieren Sie klare und messbare Qualitätsziele, um die Effizienz und Effektivität des Archivierungsprozesses zu verbessern und zu überwachen. |
(bspw. Vollständigkeit, Bearbeitbarkeit, …) (hier) |
|
Etablieren von quantitative Qualitätszielen |
||
4.4.2.: Implementieren Sie Mechanismen zur Sicherstellung der Datenqualität der archivierten Daten, um sicherzustellen, dass die Daten korrekt, vollständig und konsistent sind. |
Überprüfen der Ausführung im Hinblick auf definierte relevante Merkmale |
|
Einführen von regelmäßiger Überprüfung zur Datenqualität und Umsetzung |
Level 5
Ziele |
Praktiken |
Empfehlungen/weitere Materialien |
---|---|---|
4.5.1.: Etablieren Sie einen kontinuierlichen Verbesserungsprozess für die definierten Archivierungsprozesse, um deren Effektivität und Effizienz kontinuierlich zu optimieren. |
Verbessern und anpassen des Managements der Archivierung auf Grundlage von neuen Standards des Fachbereichs |
|
4.5.2.: Bewerten Sie regelmäßig die Technologien, die für die Datenarchivierung verwendet werden, und setzen Sie Verbesserungen um, um sicherzustellen, dass die Daten langfristig zugänglich, sicher und in einem angemessenen Format archiviert werden. |
Entwickeln und nutzen neuer technischer Standards |
|
Austausch und Entwickelung technischer Systeme in der fachspezifischen Community |
Checkliste
Weiterführende Materialien
Auf der Internetseite Forschungsdaten.info sind weiterführende Informationen, sowie Beispiele für vertrauenswürdige Repositorien zu finden.
Publisso - Digitale Langzeitarchivierung
Referenzen
[1] Diese Trainingmaterialien sind entstanden im Rahmen der NFDI4Ing Special Interest Group RDM Training & Education.