Erhebung

Die Datenerhebung

In der Phase der Erhebung spielen zwei Hauptkomponenten eine zentrale Rolle. Zum einen sind dies die verschiedenen Verfahren, die zur Datenerzeugung angewandt werden, sei es durch Experimente, Instrumente oder Datenbanken. Diese Verfahren dienen dazu, Daten zu generieren oder zu sammeln, um sie später für weitere Zwecke nutzen zu können. Zum anderen umfasst die Methodik die unterschiedlichen Prozesse, Praktiken und Prozeduren, die in der wissenschaftlichen Forschung angewandt werden, wie beispielsweise Umfragen, Fallstudien, Simulationen oder die Analyse bereits bestehender Daten.

Während der Erhebung spielen im Kontext des Forschungsdatenmanagements (FDM) zwei Hauptkomponenten eine wichtige Rolle. Die Datenerfassung stellt den Prozess dar, durch den Daten aktiv erzeugt oder gesammelt werden, um sie als Grundlage für zukünftige Analysen und Nachnutzungen zu verwenden. Parallel dazu ist die Datendokumentation von entscheidender Bedeutung, da sie eine ausführliche Beschreibung der Datenerzeugung beinhaltet. Dies umfasst Informationen zu den Randbedingungen, verwendeten Parametern, Datenformaten und anderen relevanten Aspekten, die eine bessere Verständlichkeit und Nachvollziehbarkeit der erzeugten Daten ermöglichen.

Insgesamt ermöglicht ein “erfolgreiches” Vorgehen bei der Datenerfassung von Forschungsdaten eine spätere Analyse und Nachnutzung der Daten auf effektive Weise. Dabei spielt die klare Dokumentation der Datenerzeugung eine entscheidende Rolle, um Transparenz und Verständnis für die Daten zu gewährleisten.

Zwei Hauptkomponenten im Prozess der Datenerhebung
  • Verfahren, die Art und Weise der Datenerzeugung (Experimente, Instrumente, Datenbanken, …)

  • Methodik, die Prozesse, Praktiken und Prozeduren der wissenschaftlichen Forschung

Zwei Hauptkomponenten für das FDM während der Datenerhebung
  • Datenerfassung, der Prozess der Datenerhebung für die nachfolgende Analyse (generieren, sammeln)

  • Datendokumentation, die erstellte Beschreibung der Datenerzeugung (Randbedingungen, Parameter, Formate, …)

Feldexperimente (GOLO)

Feldexperimente im Kontext von GOLO umfassen die praktische Durchführung von Untersuchungen in natürlichen Umgebungen, um empirische Daten zu erfassen. Diese Experimente umfassen die Aufnahme einer breiten Palette von Daten direkt im Feld, was zur Erfassung verschiedenster Datentypen führt. Dabei werden Felddaten aus dem realen oder experimentellen Betrieb eines cyberphysischen Systems gesammelt. Die Besonderheit eines Feldexperiments liegt in der Einbeziehung von Designvariablen, wobei gleichzeitig höchstmögliche Natürlichkeit und Praxisnähe gewährleistet werden.

  • Durchführung einer Untersuchung in einem natürlichen Umfeld zur Erhebung empirischer Daten

  • Aufnahme von Daten in einem Feld

  • Sammlung von Felddaten aus dem tatsächlichen oder experimentellen Betrieb eines cyberphysikalischen Systems

  • Ein Feldexperiment setzt die Designvariablen unter größtmögliche Natürlichkeit

Aktivitäten von Feldexperimenten

Feldexperimente beinhalten eine Reihe von Aktivitäten, die sich auf Datenerfassung und Felddokumentation konzentrieren:

Datenerfassung: Dies umfasst die Sammlung und Aufnahme von Beobachtungen spezifischer Eigenschaften in einem Feld. Die Vorbereitung des Feldexperiments ist ein erster Schritt, der die Auswahl eines geeigneten technischen Systems (Messinstruments) und Aufnahmeverfahrens einschließt. Dabei werden auch der Zeitraum und der Umfang des Feldexperiments festgelegt. Während der Durchführung des Feldexperiments erfolgt die eigentliche Datenerhebung durch die Aufnahme von Daten im Feld.

Felddokumentation: Diese Aktivität bezieht sich auf die Dokumentation der Gegebenheiten im Feld während des festgelegten Zeitraums der Datenerhebung. Hierbei wird bestimmt, welche Feldgegebenheiten dokumentiert werden sollen, einschließlich Rahmenbedingungen und Unsicherheiten. Die Art der Dokumentation wird ebenfalls festgelegt, ob es sich um manuelle oder digitale Dokumentation handelt.

Durch die klare Strukturierung dieser Aktivitäten werden Feldexperimente effizient durchgeführt und liefern verlässliche Daten und dokumentierte Informationen über die Umstände, unter denen die Daten erfasst wurden.

Datenerfassung, Sammlung und Aufnahme von Beobachtungen definierter Eigenschaften in einem Feld
  • Vorbereitung des Feldexperiments

  • Bestimmung eines technischen Systems (Messinstruments) und Aufnahmeverfahren

  • Zeitraum und Umfang des Feldexperiments bestimmen

  • Durchführung des Feldexperiments

  • Aufnahme von Daten in einem Feld

Felddokumentation, Dokumentation der Feldgegebenheiten im definierten Zeitraum während der Datenerhebung
  • Bestimmung der zu dokumentierenden Feldgegebenheiten (Was?)
    • Rahmenbedingungen, Unsicherheiten,…

  • Art der Dokumentation bestimmen (Wie?)
    • Händisch, digital,…

Trainingsmaterialien: Daten erheben [1]

Reifestufen

Level

Reifestufe

Charakteristik

Level 1

Einstieg

Das FDM im Rahmen der Erhebung wird

intuitiv und ad hoc ausgeführt.

Es sind keine festgeschriebenen Arbeitsabläufe

für das FDM im Rahmen der Erhebung auf

Projektebene beschrieben.

Es sind keine Werkzeuge und Software, die im

Rahmen des FDM für die Erhebung eingesetzt werden,

festgelegt.

Level 2

Geführt

Es werden auf Projektebene die datenmanagementbezogenen

Inhalte der Erhebung festgelegt und durchgeführt.

Es werden auf Projektebene notwendige Ressourcen

für das FDM im Rahmen der Erhebung definiert und

eingesetzt.

Forschende wissen, wie die datenmanagementbezogene

Erhebung durchgeführt werden soll und es stehen

notwendige Ressourcen zur Verfügung.

Level 3

Definiert

Die datenmanagementbezogenen Inhalte der

Erhebung werden nach domänenspezifischen

Standards und Richtlinien ausgelegt.

Es werden in der Domäne etablierte Tools und Werkzeuge

für das FDM im Rahmen der Erhebung identifiziert und

angewendet.

Forschende orientieren die datenmanagementbezogene

Erhebung an domänenspezifischen Standards und

etablieren diese in der Umsetzung im Rahmen des

Projektes.

Level 4

Quantitativ geführt

Es werden Qualitätskriterien für die Erhebung definiert

und etabliert.

Die datenmanagementbezogenen Inhalte der

Erhebung werden auf Basis der definierten

Qualitätskriterien hin gesichert.

Forschende sichern auf Datenmanagementebene die

Umsetzung der Erhebung hinsichtlich definierter

Qualitätskriterien.

Level 5

Optimierend

Auf Datenmanagementebene wird die Umsetzung der

Erhebung proaktiv optimiert und kontinuierlich

verbessert (inhaltlich und technisch).

Es werden Best Practices und Verbesserungen für

das FDM in der Erhebung entwickelt und mit der

domänenspezifischen Community geteilt.

Level 1

  • Auf der Reifestufe 1 gibt es keine definierten Ziele, da das Feldexperiment intuitiv und ad hoc geplant und durchgeführt wird

  • Feldverhalten wird unstrukturiert aufgenommen

  • Messinstrument und Aufnahmeverfahren werden intuitiv gewählt

  • Datendokumentation läuft intuitiv ab.

  • Keine vorgegebenen Standards und Templates

  • Die Ausführung ist dabei Abhängig von der Motivation der/des Forschenden

Level 2

Ziele

Praktiken

Empfehlungen/weitere Materialien

2.2.1 (methodisch)

Ich plane und definiere bis zum Start der Erhebung den

Umfang meiner Dokumentation für die Erhebungsmethode

hinsichtlich der zu erhebenden Daten im Arbeitspaket.

Ich identifiziere für das Forschungsziel relevante

Daten(-parameter), die es zu dokumentieren gilt

(inklusive Abweichungen und Einflüsse).

Ich definiere Metadaten (deskriptive, administrative,

strukturelle, technische, rechtliche und

bestandsführungsbezogene; Nur projektbezogen).

Ich definiere in meinem Projekt für meine Metadaten ein

kontrolliertes Vokabular.

Ich identifiziere und definiere Verantwortlichkeiten und

ihre Aufgaben sowie Ressourcen für das Erfassen von

(Meta-)Daten in den Erhebungsmethoden und in dem

Arbeitspaket.

2.2.2 (methodisch)

Ich plane und richte bis zum Start der Erhebung meine

Erhebungsmethode(n) und -vorgehen hinsichtlich meines

aktuellen Forschungsziels im Arbeitspaket aus.

Ich identifiziere und definiere die Erhebungsmethode(n)

und -vorgehen, die im Rahmen meines Arbeitspakets zur

Erreichung des Forschungsziels benötigt werden (abhängig

von Typ und Art der Erhobenen Daten sowie

Forschungsziel).

Ich identifiziere die Datenarten und -typen sowie

-formate und -mengen, die im Rahmen der Erhebung zur

Erreichung des Forschungsziels voraussichtlich anfallen.

Ich identifiziere und definiere ein Speichermedium für

die Speicherung meiner (Meta-)Daten.

Ich identifiziere und definiere Verantwortlichkeiten und

Ressourcen, die für die Erhebungsmethode(n) in dem

Arbeitspaket benötigt werden (Instrumente,

Soft-/Hardware, Personal etc.).

2.2.3 (technisch)

Ich führe ab dem Start der Erhebung, die Dokumentation

des Erhebungsprozesses mit ausgewählten Werkzeugen

durch (abhängig von den Methoden und Zielen; inklusive

Metadaten(-schema)).

Ich erstelle die Dokumentation mit einem definierten

Werkzeug (Dokumentationsmittel (elektronisches)

Laborbuch/sonstige Ressource; Dokumentationsform

analog/digital).

Ich erstelle eine Dokumentationsvorlage, in einer von der

Forschungsmethode abhängigen Form, um eine strukturierte

Beschreibung meiner Erhebungsmethode festzuhalten

(Ablauf, verwendete Materialien und Instrumente, gemachte

Beobachtungen, Metadaten, Beschreibungen der Daten sowie

Schlussfolgerungen).

Ich definiere ein maschinenlesbares Format für die

Metadaten.

2.2.4 (technisch)

Ich führe die Erhebung von Beginn an, mit speziell

ausgewählten Werkzeugen und Ressourcen durch (abhängig

vom Forschungsziel und Erhebungsmethode(n) im

Arbeitspaket).

Ich nutze für die Datenerhebung in meinem Projekt

definierte Ressourcen und Werkzeuge (basierend auf

Erhebungsmethode(n); Erstellung, Bearbeitung und

Verwaltung der (Meta-)Daten).

Ich nutze für die Speicherung der erhobenen (Meta-)Daten

ein von mir ausgewähltes Speichermedium (Einbezug der

Datensicherheit und -erhaltung; offline/online;

räumliche/organisatorische Verteilung).

Level 3

Ziele

Praktiken

Empfehlungen/weitere Materialien

2.3.1 (methodisch)

Ich plane und definiere bis zum Start der Erhebung,

den Umfang meiner Dokumentation hinsichtlich der zu

erhebenden Daten im Arbeitspaket nach domänen- oder

communityspezifischen Standards.

Ich identifiziere die domänen- und communityspezifischen

Standards hinsichtlich der Dokumentation von (Meta-)Daten

für mein Projekt (bezogen auf Dokumentation, zu

erstellende (Meta-)Daten).

Ich identifiziere relevante Daten(-parameter), die es

nach domänen- oder communityspezifischen Standards zu

dokumentieren gilt (hinsichtlich des Forschungsziels).

Ich nutze Metadatenstandards, die in der Domäne oder

Community angewendet werden (unter Verwendung der

zugehörigen Formate und Vokabulare).

Ich nutze für meine Daten deskriptive, administrative,

strukturelle, technische, rechtliche und

bestandsführungsbezogene Metadaten, die domänen- und

communityspezifische Standards einbeziehen.

Ich definiere ein kontrolliertes Vokabular, das domänen-

oder communityspezifische Standards einbezieht.

2.3.2 (methodisch)

Ich plane und richte bis zum Start der Erhebung meine

Erhebungsmethode(n) und -vorgehen im Arbeitspaket nach

domänen- oder communityspezifischen Standards aus.

Ich identifiziere die domänen- und communityspezifischen

Standards hinsichtlich der Erhebung für mein Projekt

(bezogen auf Erhebungsmethode(n) und zu erhebende Daten).

Ich identifiziere und definiere die Erhebungsmethode(n),

die im Rahmen meines Arbeitspakets zur Erreichung des

Forschungsziels in der Domäne oder Community verwendet

werden (abhängig von Typ und Art der Erhobenen Daten).

Ich identifiziere die Datenarten und -typen sowie

-formate und -mengen, die im Rahmen der Erhebung in der

Domäne oder Community von Bedeutung sind.

2.3.3 (technisch)

Ich führe ab dem Start der Erhebung, die Dokumentation

des Erhebungsprozesses mit in der Domäne oder

Community etablierten Werkzeugen und Ressourcen durch

(inklusive Metadaten(-standard)).

Ich erstelle die Dokumentation mit einem in der Domäne

oder Community etablierten Werkzeug (Dokumentationsmittel

(elektronisches) Laborbuch/sonstige Ressource;

Dokumentationsform analog/digital).

Ich erstelle die Dokumentationsvorlage, in einer von

domänen- oder communityspezifischen Standards abhängigen

Form, um eine strukturierte Beschreibung meiner

Erhebungsmethode(n) festzuhalten (Ablauf, verwendete

Materialien und Instrumente, gemachte Beobachtungen,

Metadaten, Beschreibungen der Daten sowie

Schlussfolgerungen)

Ich identifiziere und nutze ein in der Domäne oder

Community etablierten Metadatenstandard mit

standardisierten, maschinenlesbaren Formaten.

Ich definiere ein Metadatenschema mit maschinenlesbaren

Formaten, das domänen- und communityspezifische Standards

einbezieht (falls kein etablierter Standard existiert).

2.3.4 (technisch)

Ich führe die Erhebung von Beginn an, mit in der

Domäne oder Community etablierten Werkzeugen und

Ressourcen durch (abhängig von Forschungsmethode(n)).

Ich wähle die Instrumente, die ich für die Datenerhebung

in meinem Projekt nutze nach domänen- oder

communityspezifischen Standards.

Ich nutze für die Erstellung, Bearbeitung und Verwaltung

der Daten in der Domäne oder Community verwendete

Ressourcen und Werkzeuge (Personal, Instrumente).

Ich nutze für die Speicherung der erhobenen (Meta-)Daten

ein in der Domäne oder Community etabliertes

Speichermedium.

Level 4

Ziele

Praktiken

Empfehlungen/weitere Materialien

2.4.1 (methodisch)

Ich kenne bis zum Start der Erhebung definierte

Kriterien der Domäne oder Community, für die

Qualitätsmessung von Forschungsdaten und digitalen

Objekten in meinem Projekt (Bezug zu Erhebung;

intrinsische und kontextuelle Qualität).

Ich identifiziere die in der Domäne oder Community

etablierten Qualitätsdimensionen und -metriken sowie

Best-Practices für die Qualitätssicherung der

Forschungsdaten und digitalen Objekte (Genauigkeit,

Vollständigkeit, Objektivität).

Ich definiere Maßnahmen zur Qualitätskontrolle der Daten

hinsichtlich der Glaubwürdigkeit und Genauigkeit

(Kalibrierung, wiederholte Messungen, standardisierte

Datenerfassung, Validierung, Peer-Review).

Ich überarbeite oder gestalte Erhebungsmethoden nach

Bedarf neu, um eine genaue, aktuelle und vollständige

Datenerfassung zu ermöglichen.

Ich definiere Verantwortlichkeiten für die

Qualitätsprüfung der erhobenen Daten und digitalen

Objekte.

2.4.2 (methodisch)

Ich kenne bis zum Start der Erhebung definierte

Kriterien der Domäne oder Community, für die

Qualitätsmessung von Metadaten in meinem Projekt

(Bezug zu Dokumentation, representationale Qualität).

Ich definiere quantitative Kriterien für die

Qualitätsmessung der Dokumentation (Dokumentationsaufwand

und -effizienz auf verschiedenen Ebenen (allgemein,

domänenspezifisch, national)).

Ich definiere quantitative Kriterien für die

Qualitätsmessung der Metadaten, um Konsistenz, Prägnanz

und Interpretationsfähigkeit zu gewährleisten

(Syntaxfehler, Semantikfehler, Konsistenz, Prägnanz,

Vollständigkeit, Vokabular, Format).

Ich lasse die Dokumentation von einem Experten

hinsichtlich ihrer argumentativen Stringenz und

Eindeutigkeit prüfen (Gegenlesen durch Fachkollegen;

internes Peer-Review).

Ich definiere Verantwortlichkeiten für die

Qualitätskontrolle der dokumentierten Metadaten.

2.4.3 (technisch)

Ich führe die Qualitätskontrolle der Forschungsdaten

und digitalen Objekte mit ausgewählten Werkzeugen

durch, um sie kontinuierlich zu validieren und

anzupassen.

Ich verfasse regelmäßige Berichte zur Qualität von

Verfahren und Daten, die Fehlerquellen und Verzögerungen

identifizieren, die die Genauigkeit und Aktualität der

Daten einschränken (Protokollabweichungen, fehlerhafte

Kalibrierung von Instrumenten, unvollständige Daten

etc.).

Ich implementiere einen Prozess für die Überprüfung und

Verwaltung von Projektdetails (unter Anderem im

Laborbuch).

Ich dokumentiere den Qualitätssicherungsprozess

hinsichtlich angewendeter Metriken und Kriterien.

Ich nutze für die Überprüfung und Qualitätssicherung der

Forschungsdaten und digitalen Objekte ein in der Domäne

oder Community etabliertes Werkzeug (Hardware/Software).

2.4.4 (technisch)

Ich führe die Qualitätskontrolle der Metadaten mit

ausgewählten Werkzeugen durch, um sie kontinuierlich

zu validieren und anzupassen.

Ich prüfe mit einer Checkliste empfohlene und akzeptierte

Kriterien zu Metadaten (Formate, Vokabular, Struktur

etc.).

Ich verwende für die Verwaltung und Prüfung der

Metadaten, in der Domäne oder Community etablierte

Werkzeuge.

Level 5

Ziele

Praktiken

Empfehlungen/weitere Materialien

2.5.1 (methodisch)

Ich trage aktiv zur Verbesserung von Methoden,

Verfahren in der Domäne oder Community bei und tausche

mich mit dieser aus.

Ich veröffentliche Informationen zu genutzten Geräten,

Produkten und zugehörigen Benchmarking-Prozessen sowie

entwickelten Verfahren und Best-Practices (Methoden,

Qualitätsmetriken etc.).

Ich arbeite mit Infrastruktureinrichtungen und Experten

zusammen, um meinen Kompetenzauf- und ausbau und eine

nachhaltige Entwicklung sowie Aufbau lokaler

Infrastruktur zu gewährleisten (inklusive Personal und

Werkzeuge etc.).

2.5.2 (methodisch)

Ich entwickle und teile neue Ergebnisse zu Standards

und Best-Practices.

Ich beteilige mich an der Entwicklung von Standards und

Best-Practices in der Domäne oder Community

(Metadatenstandards, kontrollierte Vokabulare,

standardisierte und offene Formate).

Ich verwende in meinen Forschungsprojekten, die in der

Community neuesten und aktuellsten Standards und

Best-Practices.

Checkliste

Hier finden Sie eine Checkliste zum individuellen überprüfen der Ziele und Praktiken der verschiedenen Reifestufen im eigenen Projekt:

Weiterführende Materialien

Auf der Internetseite Forschungsdaten.info sind weiterführende Informationen zur Datendokumentation zu finden.

NFDI4Ing GOLO

Data Quality Metrics

UK Data Service UK Data Service Checkliste

Referenzen

[1] Diese Trainingmaterialien sind entstanden im Rahmen der NFDI4Ing Special Interest Group RDM Training & Education.