Erhebung
Die Datenerhebung
In der Phase der Erhebung spielen zwei Hauptkomponenten eine zentrale Rolle. Zum einen sind dies die verschiedenen Verfahren, die zur Datenerzeugung angewandt werden, sei es durch Experimente, Instrumente oder Datenbanken. Diese Verfahren dienen dazu, Daten zu generieren oder zu sammeln, um sie später für weitere Zwecke nutzen zu können. Zum anderen umfasst die Methodik die unterschiedlichen Prozesse, Praktiken und Prozeduren, die in der wissenschaftlichen Forschung angewandt werden, wie beispielsweise Umfragen, Fallstudien, Simulationen oder die Analyse bereits bestehender Daten.
Während der Erhebung spielen im Kontext des Forschungsdatenmanagements (FDM) zwei Hauptkomponenten eine wichtige Rolle. Die Datenerfassung stellt den Prozess dar, durch den Daten aktiv erzeugt oder gesammelt werden, um sie als Grundlage für zukünftige Analysen und Nachnutzungen zu verwenden. Parallel dazu ist die Datendokumentation von entscheidender Bedeutung, da sie eine ausführliche Beschreibung der Datenerzeugung beinhaltet. Dies umfasst Informationen zu den Randbedingungen, verwendeten Parametern, Datenformaten und anderen relevanten Aspekten, die eine bessere Verständlichkeit und Nachvollziehbarkeit der erzeugten Daten ermöglichen.
Insgesamt ermöglicht ein “erfolgreiches” Vorgehen bei der Datenerfassung von Forschungsdaten eine spätere Analyse und Nachnutzung der Daten auf effektive Weise. Dabei spielt die klare Dokumentation der Datenerzeugung eine entscheidende Rolle, um Transparenz und Verständnis für die Daten zu gewährleisten.
- Zwei Hauptkomponenten im Prozess der Datenerhebung
Verfahren, die Art und Weise der Datenerzeugung (Experimente, Instrumente, Datenbanken, …)
Methodik, die Prozesse, Praktiken und Prozeduren der wissenschaftlichen Forschung
- Zwei Hauptkomponenten für das FDM während der Datenerhebung
Datenerfassung, der Prozess der Datenerhebung für die nachfolgende Analyse (generieren, sammeln)
Datendokumentation, die erstellte Beschreibung der Datenerzeugung (Randbedingungen, Parameter, Formate, …)
Feldexperimente (GOLO)
Feldexperimente im Kontext von GOLO umfassen die praktische Durchführung von Untersuchungen in natürlichen Umgebungen, um empirische Daten zu erfassen. Diese Experimente umfassen die Aufnahme einer breiten Palette von Daten direkt im Feld, was zur Erfassung verschiedenster Datentypen führt. Dabei werden Felddaten aus dem realen oder experimentellen Betrieb eines cyberphysischen Systems gesammelt. Die Besonderheit eines Feldexperiments liegt in der Einbeziehung von Designvariablen, wobei gleichzeitig höchstmögliche Natürlichkeit und Praxisnähe gewährleistet werden.
Durchführung einer Untersuchung in einem natürlichen Umfeld zur Erhebung empirischer Daten
Aufnahme von Daten in einem Feld
Sammlung von Felddaten aus dem tatsächlichen oder experimentellen Betrieb eines cyberphysikalischen Systems
Ein Feldexperiment setzt die Designvariablen unter größtmögliche Natürlichkeit
Aktivitäten von Feldexperimenten
Feldexperimente beinhalten eine Reihe von Aktivitäten, die sich auf Datenerfassung und Felddokumentation konzentrieren:
Datenerfassung: Dies umfasst die Sammlung und Aufnahme von Beobachtungen spezifischer Eigenschaften in einem Feld. Die Vorbereitung des Feldexperiments ist ein erster Schritt, der die Auswahl eines geeigneten technischen Systems (Messinstruments) und Aufnahmeverfahrens einschließt. Dabei werden auch der Zeitraum und der Umfang des Feldexperiments festgelegt. Während der Durchführung des Feldexperiments erfolgt die eigentliche Datenerhebung durch die Aufnahme von Daten im Feld.
Felddokumentation: Diese Aktivität bezieht sich auf die Dokumentation der Gegebenheiten im Feld während des festgelegten Zeitraums der Datenerhebung. Hierbei wird bestimmt, welche Feldgegebenheiten dokumentiert werden sollen, einschließlich Rahmenbedingungen und Unsicherheiten. Die Art der Dokumentation wird ebenfalls festgelegt, ob es sich um manuelle oder digitale Dokumentation handelt.
Durch die klare Strukturierung dieser Aktivitäten werden Feldexperimente effizient durchgeführt und liefern verlässliche Daten und dokumentierte Informationen über die Umstände, unter denen die Daten erfasst wurden.
- Datenerfassung, Sammlung und Aufnahme von Beobachtungen definierter Eigenschaften in einem Feld
Vorbereitung des Feldexperiments
Bestimmung eines technischen Systems (Messinstruments) und Aufnahmeverfahren
Zeitraum und Umfang des Feldexperiments bestimmen
Durchführung des Feldexperiments
Aufnahme von Daten in einem Feld
- Felddokumentation, Dokumentation der Feldgegebenheiten im definierten Zeitraum während der Datenerhebung
- Bestimmung der zu dokumentierenden Feldgegebenheiten (Was?)
Rahmenbedingungen, Unsicherheiten,…
- Art der Dokumentation bestimmen (Wie?)
Händisch, digital,…
Trainingsmaterialien: Daten erheben [1]
Reifestufen
Level |
Reifestufe |
Charakteristik |
|---|---|---|
Level 1 |
Einstieg |
Das FDM im Rahmen der Erhebung wird intuitiv und ad hoc ausgeführt. |
Es sind keine festgeschriebenen Arbeitsabläufe für das FDM im Rahmen der Erhebung auf Projektebene beschrieben. |
||
Es sind keine Werkzeuge und Software, die im Rahmen des FDM für die Erhebung eingesetzt werden, festgelegt. |
||
Level 2 |
Geführt |
Es werden auf Projektebene die datenmanagementbezogenen Inhalte der Erhebung festgelegt und durchgeführt. |
Es werden auf Projektebene notwendige Ressourcen für das FDM im Rahmen der Erhebung definiert und eingesetzt. |
||
Forschende wissen, wie die datenmanagementbezogene Erhebung durchgeführt werden soll und es stehen notwendige Ressourcen zur Verfügung. |
||
Level 3 |
Definiert |
Die datenmanagementbezogenen Inhalte der Erhebung werden nach domänenspezifischen Standards und Richtlinien ausgelegt. |
Es werden in der Domäne etablierte Tools und Werkzeuge für das FDM im Rahmen der Erhebung identifiziert und angewendet. |
||
Forschende orientieren die datenmanagementbezogene Erhebung an domänenspezifischen Standards und etablieren diese in der Umsetzung im Rahmen des Projektes. |
||
Level 4 |
Quantitativ geführt |
Es werden Qualitätskriterien für die Erhebung definiert und etabliert. |
Die datenmanagementbezogenen Inhalte der Erhebung werden auf Basis der definierten Qualitätskriterien hin gesichert. |
||
Forschende sichern auf Datenmanagementebene die Umsetzung der Erhebung hinsichtlich definierter Qualitätskriterien. |
||
Level 5 |
Optimierend |
Auf Datenmanagementebene wird die Umsetzung der Erhebung proaktiv optimiert und kontinuierlich verbessert (inhaltlich und technisch). |
Es werden Best Practices und Verbesserungen für das FDM in der Erhebung entwickelt und mit der domänenspezifischen Community geteilt. |
Level 1
Auf der Reifestufe 1 gibt es keine definierten Ziele, da das Feldexperiment intuitiv und ad hoc geplant und durchgeführt wird
Feldverhalten wird unstrukturiert aufgenommen
Messinstrument und Aufnahmeverfahren werden intuitiv gewählt
Datendokumentation läuft intuitiv ab.
Keine vorgegebenen Standards und Templates
Die Ausführung ist dabei Abhängig von der Motivation der/des Forschenden
Level 2
Ziele |
Praktiken |
Empfehlungen/weitere Materialien |
|---|---|---|
2.2.1 (methodisch) Ich plane und definiere bis zum Start der Erhebung den Umfang meiner Dokumentation für die Erhebungsmethode hinsichtlich der zu erhebenden Daten im Arbeitspaket. |
Ich identifiziere für das Forschungsziel relevante Daten(-parameter), die es zu dokumentieren gilt (inklusive Abweichungen und Einflüsse). |
|
Ich definiere Metadaten (deskriptive, administrative, strukturelle, technische, rechtliche und bestandsführungsbezogene; Nur projektbezogen). |
||
Ich definiere in meinem Projekt für meine Metadaten ein kontrolliertes Vokabular. |
||
Ich identifiziere und definiere Verantwortlichkeiten und ihre Aufgaben sowie Ressourcen für das Erfassen von (Meta-)Daten in den Erhebungsmethoden und in dem Arbeitspaket. |
||
2.2.2 (methodisch) Ich plane und richte bis zum Start der Erhebung meine Erhebungsmethode(n) und -vorgehen hinsichtlich meines aktuellen Forschungsziels im Arbeitspaket aus. |
Ich identifiziere und definiere die Erhebungsmethode(n) und -vorgehen, die im Rahmen meines Arbeitspakets zur Erreichung des Forschungsziels benötigt werden (abhängig von Typ und Art der Erhobenen Daten sowie Forschungsziel). |
|
Ich identifiziere die Datenarten und -typen sowie -formate und -mengen, die im Rahmen der Erhebung zur Erreichung des Forschungsziels voraussichtlich anfallen. |
||
Ich identifiziere und definiere ein Speichermedium für die Speicherung meiner (Meta-)Daten. |
||
Ich identifiziere und definiere Verantwortlichkeiten und Ressourcen, die für die Erhebungsmethode(n) in dem Arbeitspaket benötigt werden (Instrumente, Soft-/Hardware, Personal etc.). |
||
2.2.3 (technisch) Ich führe ab dem Start der Erhebung, die Dokumentation des Erhebungsprozesses mit ausgewählten Werkzeugen durch (abhängig von den Methoden und Zielen; inklusive Metadaten(-schema)). |
Ich erstelle die Dokumentation mit einem definierten Werkzeug (Dokumentationsmittel (elektronisches) Laborbuch/sonstige Ressource; Dokumentationsform analog/digital). |
|
Ich erstelle eine Dokumentationsvorlage, in einer von der Forschungsmethode abhängigen Form, um eine strukturierte Beschreibung meiner Erhebungsmethode festzuhalten (Ablauf, verwendete Materialien und Instrumente, gemachte Beobachtungen, Metadaten, Beschreibungen der Daten sowie Schlussfolgerungen). |
||
Ich definiere ein maschinenlesbares Format für die Metadaten. |
||
2.2.4 (technisch) Ich führe die Erhebung von Beginn an, mit speziell ausgewählten Werkzeugen und Ressourcen durch (abhängig vom Forschungsziel und Erhebungsmethode(n) im Arbeitspaket). |
Ich nutze für die Datenerhebung in meinem Projekt definierte Ressourcen und Werkzeuge (basierend auf Erhebungsmethode(n); Erstellung, Bearbeitung und Verwaltung der (Meta-)Daten). |
|
Ich nutze für die Speicherung der erhobenen (Meta-)Daten ein von mir ausgewähltes Speichermedium (Einbezug der Datensicherheit und -erhaltung; offline/online; räumliche/organisatorische Verteilung). |
Level 3
Ziele |
Praktiken |
Empfehlungen/weitere Materialien |
|---|---|---|
2.3.1 (methodisch) Ich plane und definiere bis zum Start der Erhebung, den Umfang meiner Dokumentation hinsichtlich der zu erhebenden Daten im Arbeitspaket nach domänen- oder communityspezifischen Standards. |
Ich identifiziere die domänen- und communityspezifischen Standards hinsichtlich der Dokumentation von (Meta-)Daten für mein Projekt (bezogen auf Dokumentation, zu erstellende (Meta-)Daten). |
|
Ich identifiziere relevante Daten(-parameter), die es nach domänen- oder communityspezifischen Standards zu dokumentieren gilt (hinsichtlich des Forschungsziels). |
||
Ich nutze Metadatenstandards, die in der Domäne oder Community angewendet werden (unter Verwendung der zugehörigen Formate und Vokabulare). |
||
Ich nutze für meine Daten deskriptive, administrative, strukturelle, technische, rechtliche und bestandsführungsbezogene Metadaten, die domänen- und communityspezifische Standards einbeziehen. |
||
Ich definiere ein kontrolliertes Vokabular, das domänen- oder communityspezifische Standards einbezieht. |
||
2.3.2 (methodisch) Ich plane und richte bis zum Start der Erhebung meine Erhebungsmethode(n) und -vorgehen im Arbeitspaket nach domänen- oder communityspezifischen Standards aus. |
Ich identifiziere die domänen- und communityspezifischen Standards hinsichtlich der Erhebung für mein Projekt (bezogen auf Erhebungsmethode(n) und zu erhebende Daten). |
|
Ich identifiziere und definiere die Erhebungsmethode(n), die im Rahmen meines Arbeitspakets zur Erreichung des Forschungsziels in der Domäne oder Community verwendet werden (abhängig von Typ und Art der Erhobenen Daten). |
||
Ich identifiziere die Datenarten und -typen sowie -formate und -mengen, die im Rahmen der Erhebung in der Domäne oder Community von Bedeutung sind. |
||
2.3.3 (technisch) Ich führe ab dem Start der Erhebung, die Dokumentation des Erhebungsprozesses mit in der Domäne oder Community etablierten Werkzeugen und Ressourcen durch (inklusive Metadaten(-standard)). |
Ich erstelle die Dokumentation mit einem in der Domäne oder Community etablierten Werkzeug (Dokumentationsmittel (elektronisches) Laborbuch/sonstige Ressource; Dokumentationsform analog/digital). |
|
Ich erstelle die Dokumentationsvorlage, in einer von domänen- oder communityspezifischen Standards abhängigen Form, um eine strukturierte Beschreibung meiner Erhebungsmethode(n) festzuhalten (Ablauf, verwendete Materialien und Instrumente, gemachte Beobachtungen, Metadaten, Beschreibungen der Daten sowie Schlussfolgerungen) |
||
Ich identifiziere und nutze ein in der Domäne oder Community etablierten Metadatenstandard mit standardisierten, maschinenlesbaren Formaten. |
||
Ich definiere ein Metadatenschema mit maschinenlesbaren Formaten, das domänen- und communityspezifische Standards einbezieht (falls kein etablierter Standard existiert). |
||
2.3.4 (technisch) Ich führe die Erhebung von Beginn an, mit in der Domäne oder Community etablierten Werkzeugen und Ressourcen durch (abhängig von Forschungsmethode(n)). |
Ich wähle die Instrumente, die ich für die Datenerhebung in meinem Projekt nutze nach domänen- oder communityspezifischen Standards. |
|
Ich nutze für die Erstellung, Bearbeitung und Verwaltung der Daten in der Domäne oder Community verwendete Ressourcen und Werkzeuge (Personal, Instrumente). |
||
Ich nutze für die Speicherung der erhobenen (Meta-)Daten ein in der Domäne oder Community etabliertes Speichermedium. |
Level 4
Ziele |
Praktiken |
Empfehlungen/weitere Materialien |
|---|---|---|
2.4.1 (methodisch) Ich kenne bis zum Start der Erhebung definierte Kriterien der Domäne oder Community, für die Qualitätsmessung von Forschungsdaten und digitalen Objekten in meinem Projekt (Bezug zu Erhebung; intrinsische und kontextuelle Qualität). |
Ich identifiziere die in der Domäne oder Community etablierten Qualitätsdimensionen und -metriken sowie Best-Practices für die Qualitätssicherung der Forschungsdaten und digitalen Objekte (Genauigkeit, Vollständigkeit, Objektivität). |
|
Ich definiere Maßnahmen zur Qualitätskontrolle der Daten hinsichtlich der Glaubwürdigkeit und Genauigkeit (Kalibrierung, wiederholte Messungen, standardisierte Datenerfassung, Validierung, Peer-Review). |
||
Ich überarbeite oder gestalte Erhebungsmethoden nach Bedarf neu, um eine genaue, aktuelle und vollständige Datenerfassung zu ermöglichen. |
||
Ich definiere Verantwortlichkeiten für die Qualitätsprüfung der erhobenen Daten und digitalen Objekte. |
||
2.4.2 (methodisch) Ich kenne bis zum Start der Erhebung definierte Kriterien der Domäne oder Community, für die Qualitätsmessung von Metadaten in meinem Projekt (Bezug zu Dokumentation, representationale Qualität). |
Ich definiere quantitative Kriterien für die Qualitätsmessung der Dokumentation (Dokumentationsaufwand und -effizienz auf verschiedenen Ebenen (allgemein, domänenspezifisch, national)). |
|
Ich definiere quantitative Kriterien für die Qualitätsmessung der Metadaten, um Konsistenz, Prägnanz und Interpretationsfähigkeit zu gewährleisten (Syntaxfehler, Semantikfehler, Konsistenz, Prägnanz, Vollständigkeit, Vokabular, Format). |
||
Ich lasse die Dokumentation von einem Experten hinsichtlich ihrer argumentativen Stringenz und Eindeutigkeit prüfen (Gegenlesen durch Fachkollegen; internes Peer-Review). |
||
Ich definiere Verantwortlichkeiten für die Qualitätskontrolle der dokumentierten Metadaten. |
||
2.4.3 (technisch) Ich führe die Qualitätskontrolle der Forschungsdaten und digitalen Objekte mit ausgewählten Werkzeugen durch, um sie kontinuierlich zu validieren und anzupassen. |
Ich verfasse regelmäßige Berichte zur Qualität von Verfahren und Daten, die Fehlerquellen und Verzögerungen identifizieren, die die Genauigkeit und Aktualität der Daten einschränken (Protokollabweichungen, fehlerhafte Kalibrierung von Instrumenten, unvollständige Daten etc.). |
|
Ich implementiere einen Prozess für die Überprüfung und Verwaltung von Projektdetails (unter Anderem im Laborbuch). |
||
Ich dokumentiere den Qualitätssicherungsprozess hinsichtlich angewendeter Metriken und Kriterien. |
||
Ich nutze für die Überprüfung und Qualitätssicherung der Forschungsdaten und digitalen Objekte ein in der Domäne oder Community etabliertes Werkzeug (Hardware/Software). |
||
2.4.4 (technisch) Ich führe die Qualitätskontrolle der Metadaten mit ausgewählten Werkzeugen durch, um sie kontinuierlich zu validieren und anzupassen. |
Ich prüfe mit einer Checkliste empfohlene und akzeptierte Kriterien zu Metadaten (Formate, Vokabular, Struktur etc.). |
|
Ich verwende für die Verwaltung und Prüfung der Metadaten, in der Domäne oder Community etablierte Werkzeuge. |
Level 5
Ziele |
Praktiken |
Empfehlungen/weitere Materialien |
|---|---|---|
2.5.1 (methodisch) Ich trage aktiv zur Verbesserung von Methoden, Verfahren in der Domäne oder Community bei und tausche mich mit dieser aus. |
Ich veröffentliche Informationen zu genutzten Geräten, Produkten und zugehörigen Benchmarking-Prozessen sowie entwickelten Verfahren und Best-Practices (Methoden, Qualitätsmetriken etc.). |
|
Ich arbeite mit Infrastruktureinrichtungen und Experten zusammen, um meinen Kompetenzauf- und ausbau und eine nachhaltige Entwicklung sowie Aufbau lokaler Infrastruktur zu gewährleisten (inklusive Personal und Werkzeuge etc.). |
||
2.5.2 (methodisch) Ich entwickle und teile neue Ergebnisse zu Standards und Best-Practices. |
Ich beteilige mich an der Entwicklung von Standards und Best-Practices in der Domäne oder Community (Metadatenstandards, kontrollierte Vokabulare, standardisierte und offene Formate). |
|
Ich verwende in meinen Forschungsprojekten, die in der Community neuesten und aktuellsten Standards und Best-Practices. |
Checkliste
Hier finden Sie eine Checkliste zum individuellen überprüfen der Ziele und Praktiken der verschiedenen Reifestufen im eigenen Projekt:
Weiterführende Materialien
Auf der Internetseite Forschungsdaten.info sind weiterführende Informationen zur Datendokumentation zu finden.
UK Data Service UK Data Service Checkliste
Referenzen
[1] Diese Trainingmaterialien sind entstanden im Rahmen der NFDI4Ing Special Interest Group RDM Training & Education.