Erhebung

Die Datenerhebung

In der Phase der Erhebung spielen zwei Hauptkomponenten eine zentrale Rolle. Zum einen sind dies die verschiedenen Verfahren, die zur Datenerzeugung angewandt werden, sei es durch Experimente, Instrumente oder Datenbanken. Diese Verfahren dienen dazu, Daten zu generieren oder zu sammeln, um sie später für weitere Zwecke nutzen zu können. Zum anderen umfasst die Methodik die unterschiedlichen Prozesse, Praktiken und Prozeduren, die in der wissenschaftlichen Forschung angewandt werden, wie beispielsweise Umfragen, Fallstudien, Simulationen oder die Analyse bereits bestehender Daten.

Während der Erhebung spielen im Kontext des Forschungsdatenmanagements (FDM) zwei Hauptkomponenten eine wichtige Rolle. Die Datenerfassung stellt den Prozess dar, durch den Daten aktiv erzeugt oder gesammelt werden, um sie als Grundlage für zukünftige Analysen und Nachnutzungen zu verwenden. Parallel dazu ist die Datendokumentation von entscheidender Bedeutung, da sie eine ausführliche Beschreibung der Datenerzeugung beinhaltet. Dies umfasst Informationen zu den Randbedingungen, verwendeten Parametern, Datenformaten und anderen relevanten Aspekten, die eine bessere Verständlichkeit und Nachvollziehbarkeit der erzeugten Daten ermöglichen.

Insgesamt ermöglicht ein “erfolgreiches” Vorgehen bei der Datenerfassung von Forschungsdaten eine spätere Analyse und Nachnutzung der Daten auf effektive Weise. Dabei spielt die klare Dokumentation der Datenerzeugung eine entscheidende Rolle, um Transparenz und Verständnis für die Daten zu gewährleisten.

Zwei Hauptkomponenten im Prozess der Datenerhebung
  • Verfahren, die Art und Weise der Datenerzeugung (Experimente, Instrumente, Datenbanken, …)

  • Methodik, die Prozesse, Praktiken und Prozeduren der wissenschaftlichen Forschung

Zwei Hauptkomponenten für das FDM während der Datenerhebung
  • Datenerfassung, der Prozess der Datenerhebung für die nachfolgende Analyse (generieren, sammeln)

  • Datendokumentation, die erstellte Beschreibung der Datenerzeugung (Randbedingungen, Parameter, Formate, …)

Feldexperimente (GOLO)

Feldexperimente im Kontext von GOLO umfassen die praktische Durchführung von Untersuchungen in natürlichen Umgebungen, um empirische Daten zu erfassen. Diese Experimente umfassen die Aufnahme einer breiten Palette von Daten direkt im Feld, was zur Erfassung verschiedenster Datentypen führt. Dabei werden Felddaten aus dem realen oder experimentellen Betrieb eines cyberphysischen Systems gesammelt. Die Besonderheit eines Feldexperiments liegt in der Einbeziehung von Designvariablen, wobei gleichzeitig höchstmögliche Natürlichkeit und Praxisnähe gewährleistet werden.

  • Durchführung einer Untersuchung in einem natürlichen Umfeld zur Erhebung empirischer Daten

  • Aufnahme von Daten in einem Feld

  • Sammlung von Felddaten aus dem tatsächlichen oder experimentellen Betrieb eines cyberphysikalischen Systems

  • Ein Feldexperiment setzt die Designvariablen unter größtmögliche Natürlichkeit

Aktivitäten von Feldexperimenten

Feldexperimente beinhalten eine Reihe von Aktivitäten, die sich auf Datenerfassung und Felddokumentation konzentrieren:

Datenerfassung: Dies umfasst die Sammlung und Aufnahme von Beobachtungen spezifischer Eigenschaften in einem Feld. Die Vorbereitung des Feldexperiments ist ein erster Schritt, der die Auswahl eines geeigneten technischen Systems (Messinstruments) und Aufnahmeverfahrens einschließt. Dabei werden auch der Zeitraum und der Umfang des Feldexperiments festgelegt. Während der Durchführung des Feldexperiments erfolgt die eigentliche Datenerhebung durch die Aufnahme von Daten im Feld.

Felddokumentation: Diese Aktivität bezieht sich auf die Dokumentation der Gegebenheiten im Feld während des festgelegten Zeitraums der Datenerhebung. Hierbei wird bestimmt, welche Feldgegebenheiten dokumentiert werden sollen, einschließlich Rahmenbedingungen und Unsicherheiten. Die Art der Dokumentation wird ebenfalls festgelegt, ob es sich um manuelle oder digitale Dokumentation handelt.

Durch die klare Strukturierung dieser Aktivitäten werden Feldexperimente effizient durchgeführt und liefern verlässliche Daten und dokumentierte Informationen über die Umstände, unter denen die Daten erfasst wurden.

Datenerfassung, Sammlung und Aufnahme von Beobachtungen definierter Eigenschaften in einem Feld
  • Vorbereitung des Feldexperiments

  • Bestimmung eines technischen Systems (Messinstruments) und Aufnahmeverfahren

  • Zeitraum und Umfang des Feldexperiments bestimmen

  • Durchführung des Feldexperiments

  • Aufnahme von Daten in einem Feld

Felddokumentation, Dokumentation der Feldgegebenheiten im definierten Zeitraum während der Datenerhebung
  • Bestimmung der zu dokumentierenden Feldgegebenheiten (Was?)
    • Rahmenbedingungen, Unsicherheiten,…

  • Art der Dokumentation bestimmen (Wie?)
    • Händisch, digital,…

Trainingsmaterialien: Daten erheben [1]

Reifestufen

Level

Reifestufe

Charakteristik

Level 1

Einstieg

Das FDM im Rahmen der Erhebung wird

intuitiv und ad hoc ausgeführt.

Es sind keine festgeschriebenen Arbeitsabläufe

für das FDM im Rahmen der Erhebung auf

Projektebene beschrieben.

Es sind keine Werkzeuge und Software, die im

Rahmen des FDM für die Erhebung eingesetzt werden,

festgelegt.

Level 2

Geführt

Es werden auf Projektebene die datenmanagementbezogenen

Inhalte der Erhebung festgelegt und durchgeführt.

Es werden auf Projektebene notwendige Ressourcen

für das FDM im Rahmen der Erhebung definiert und

eingesetzt.

Forschende wissen, wie die datenmanagementbezogene

Erhebung durchgeführt werden soll und es stehen

notwendige Ressourcen zur Verfügung.

Level 3

Definiert

Die datenmanagementbezogenen Inhalte der

Erhebung werden nach domänenspezifischen

Standards und Richtlinien ausgelegt.

Es werden in der Domäne etablierte Tools und Werkzeuge

für das FDM im Rahmen der Erhebung identifiziert und

angewendet.

Forschende orientieren die datenmanagementbezogene

Erhebung an domänenspezifischen Standards und

etablieren diese in der Umsetzung im Rahmen des

Projektes.

Level 4

Quantitativ geführt

Es werden Qualitätskriterien für die Erhebung definiert

und etabliert.

Die datenmanagementbezogenen Inhalte der

Erhebung werden auf Basis der definierten

Qualitätskriterien hin gesichert.

Forschende sichern auf Datenmanagementebene die

Umsetzung der Erhebung hinsichtlich definierter

Qualitätskriterien.

Level 5

Optimierend

Auf Datenmanagementebene wird die Umsetzung der

Erhebung proaktiv optimiert und kontinuierlich

verbessert (inhaltlich und technisch).

Es werden Best Practices und Verbesserungen für

das FDM in der Erhebung entwickelt und mit der

domänenspezifischen Community geteilt.

Level 1

  • Auf der Reifestufe 1 gibt es keine definierten Ziele, da das Feldexperiment intuitiv und ad hoc geplant und durchgeführt wird

  • Feldverhalten wird unstrukturiert aufgenommen

  • Messinstrument und Aufnahmeverfahren werden intuitiv gewählt

  • Datendokumentation läuft intuitiv ab.

  • Keine vorgegebenen Standards und Templates

  • Die Ausführung ist dabei Abhängig von der Motivation der/des Forschenden

Level 2

Ziele

Praktiken

2.2.1: Messungen repräsentieren die zugrunde gelegten

theoretischen Konstrukte hinreichend für das Projekt

(Planung und Durchführung der Datenerhebung -

Grundlagen)

Bestimmung der zu erhebenden Beobachtungseinheiten und

Eigenschaften - Zielgrößendefinition (Messdaten mit

direkten Bezug zur Ziel-Messgröße)

Bestimmung des zu verwendenden Messinstruments

Definition der adäquaten Operationalisierung im Feld

Definition möglicher reaktiver Einflüsse des Feldes

Entwicklung eines Experimentplans auf projektdefinierte

Weise (experimenteinzigartig)

2.2.2: Felddokumentation des Experiments (auf

projektorientierte, nicht standardisierte Weise)

Bestimmung zu dokumentierender Feldgegebenheiten

(allgemein und feldspezifisch) und zugehöriger

Eigenschaften für die Felddokumentation

Entwicklung und Anwendung einer Dokumentationsstruktur

ohne Standards

Bestimmung der Dokumentationsart

Level 3

Ziele

Praktiken

2.3.1: Datenerhebung und technische Systeme

entsprechen domänenspezifischer

syntaktischer Standards

Identifizierung und Anwendung standardisierter

Erhebungsprozesse innerhalb der Domäne (Best Practices)

Identifizierung weiterer zu erhebende

Beobachtungseinheiten und Eigenschaften (Zweckdaten

und Nebendaten) mit Relevanz für eine

communityorientierte Nachnutzung

Verwendung standardisierter technischer Systemen

in der Domäne

2.3.2: Felddokumentation an domänen- und

experimentspezifischen Standards ausrichten

Recherchebasierte Auswahl eines

Dokumentationsinstruments angelehnt an

domänenspezifische Standards

Identifizierung von Standards für die Terminologie und

Schemata der zu dokumentierenden Feldgegebenheiten

2.3.3: Redundanz zwischen Felddokumentation und

Datenerfassung minieren

Verknüpfung zwischen Felddokumentation und

technischem System

Level 4

Ziele

Praktiken

2.4.1: Es werden quantitative Qualitätsziele für die

Datenerhebung und Datenqualität definiert und

etabliert

Bestimmung zu überprüfender Qualitätsaspekte bei der

Datenerhebung

Identifizieren und einbeziehen relevanter

Qualitätsmetriken

2.4.2: Kontrolle der Datenqualität während und nach

der Datenerhebung (Analyse der Daten hinsichtlich der

Datenqualität -> keine inhaltliche Analyse zur

Beantwortung der Forschungsfrage)

Überprüfen der Datenqualität im Hinblick auf definierte

Merkmale (bspw. Korrektheit, Vollständigkeit,…)

Anwendung identifizierter Qualitätsmetriken

Dokumentation kontextueller (Meta-)Daten im

Zusammenhang mit der Datenqualität

2.4.3: Reaktive Experimentanpassungen bei der

Datenerhebung definiert und etabliert

Identifizieren möglicher Fehlerquellen

Bereitstellen von Ersatz beim Ausfall und Fehlern

Überprüfen der Messinstrumente vor und während der

Datenerhebung

Maßnahmen bei detektierten Ausfällen und Fehlern

inline ergreifen

Level 5

Ziele

Praktiken

2.5.1: Die Feldexperimente werden kontinuierlich und

proaktiv verbessert und angepasst

Verbessern und anpassen der Feldexperimente auf

Grundlage von Feedback und neuen Standards in der

fachspezifischen Community

2.5.2: Inhalte im Zusammenhang mit Strukturen oder

Versuchsplanungen, Versuchsdurchführungen,

werden entwickelt und proaktiv, kontinuierlich

angepasst und verbessert

Einsatz und Weiterentwicklung von bewährten Verfahren

und Standards

Partizipieren in der Community zur Umsetzung und

Entwicklung neuer Standards

2.5.3: Die Technologien, die die Datenerhebung

ermöglichen, werden regelmäßig bewertet und

Verbesserungen werden umgesetzt

Entwickeln und nutzen neuer technischer Standards

Austausch und entwickeln technischer Systeme in der

fachspezifischen Community

Checkliste

Hier finden Sie eine Checkliste zum individuellen überprüfen der Ziele und Praktiken der verschiedenen Reifestufen im eigenen Projekt:

Weiterführende Materialien

Auf der Internetseite Forschungsdaten.info sind weiterführende Informationen zur Datendokumentation zu finden.

NFDI4Ing GOLO

Data Quality Metrics

UK Data Service UK Data Service Checkliste

Referenzen

[1] Diese Trainingmaterialien sind entstanden im Rahmen der NFDI4Ing Special Interest Group RDM Training & Education.