Erhebung
Die Datenerhebung
In der Phase der Erhebung spielen zwei Hauptkomponenten eine zentrale Rolle. Zum einen sind dies die verschiedenen Verfahren, die zur Datenerzeugung angewandt werden, sei es durch Experimente, Instrumente oder Datenbanken. Diese Verfahren dienen dazu, Daten zu generieren oder zu sammeln, um sie später für weitere Zwecke nutzen zu können. Zum anderen umfasst die Methodik die unterschiedlichen Prozesse, Praktiken und Prozeduren, die in der wissenschaftlichen Forschung angewandt werden, wie beispielsweise Umfragen, Fallstudien, Simulationen oder die Analyse bereits bestehender Daten.
Während der Erhebung spielen im Kontext des Forschungsdatenmanagements (FDM) zwei Hauptkomponenten eine wichtige Rolle. Die Datenerfassung stellt den Prozess dar, durch den Daten aktiv erzeugt oder gesammelt werden, um sie als Grundlage für zukünftige Analysen und Nachnutzungen zu verwenden. Parallel dazu ist die Datendokumentation von entscheidender Bedeutung, da sie eine ausführliche Beschreibung der Datenerzeugung beinhaltet. Dies umfasst Informationen zu den Randbedingungen, verwendeten Parametern, Datenformaten und anderen relevanten Aspekten, die eine bessere Verständlichkeit und Nachvollziehbarkeit der erzeugten Daten ermöglichen.
Insgesamt ermöglicht ein “erfolgreiches” Vorgehen bei der Datenerfassung von Forschungsdaten eine spätere Analyse und Nachnutzung der Daten auf effektive Weise. Dabei spielt die klare Dokumentation der Datenerzeugung eine entscheidende Rolle, um Transparenz und Verständnis für die Daten zu gewährleisten.
- Zwei Hauptkomponenten im Prozess der Datenerhebung
Verfahren, die Art und Weise der Datenerzeugung (Experimente, Instrumente, Datenbanken, …)
Methodik, die Prozesse, Praktiken und Prozeduren der wissenschaftlichen Forschung
- Zwei Hauptkomponenten für das FDM während der Datenerhebung
Datenerfassung, der Prozess der Datenerhebung für die nachfolgende Analyse (generieren, sammeln)
Datendokumentation, die erstellte Beschreibung der Datenerzeugung (Randbedingungen, Parameter, Formate, …)
Feldexperimente (GOLO)
Feldexperimente im Kontext von GOLO umfassen die praktische Durchführung von Untersuchungen in natürlichen Umgebungen, um empirische Daten zu erfassen. Diese Experimente umfassen die Aufnahme einer breiten Palette von Daten direkt im Feld, was zur Erfassung verschiedenster Datentypen führt. Dabei werden Felddaten aus dem realen oder experimentellen Betrieb eines cyberphysischen Systems gesammelt. Die Besonderheit eines Feldexperiments liegt in der Einbeziehung von Designvariablen, wobei gleichzeitig höchstmögliche Natürlichkeit und Praxisnähe gewährleistet werden.
Durchführung einer Untersuchung in einem natürlichen Umfeld zur Erhebung empirischer Daten
Aufnahme von Daten in einem Feld
Sammlung von Felddaten aus dem tatsächlichen oder experimentellen Betrieb eines cyberphysikalischen Systems
Ein Feldexperiment setzt die Designvariablen unter größtmögliche Natürlichkeit
Aktivitäten von Feldexperimenten
Feldexperimente beinhalten eine Reihe von Aktivitäten, die sich auf Datenerfassung und Felddokumentation konzentrieren:
Datenerfassung: Dies umfasst die Sammlung und Aufnahme von Beobachtungen spezifischer Eigenschaften in einem Feld. Die Vorbereitung des Feldexperiments ist ein erster Schritt, der die Auswahl eines geeigneten technischen Systems (Messinstruments) und Aufnahmeverfahrens einschließt. Dabei werden auch der Zeitraum und der Umfang des Feldexperiments festgelegt. Während der Durchführung des Feldexperiments erfolgt die eigentliche Datenerhebung durch die Aufnahme von Daten im Feld.
Felddokumentation: Diese Aktivität bezieht sich auf die Dokumentation der Gegebenheiten im Feld während des festgelegten Zeitraums der Datenerhebung. Hierbei wird bestimmt, welche Feldgegebenheiten dokumentiert werden sollen, einschließlich Rahmenbedingungen und Unsicherheiten. Die Art der Dokumentation wird ebenfalls festgelegt, ob es sich um manuelle oder digitale Dokumentation handelt.
Durch die klare Strukturierung dieser Aktivitäten werden Feldexperimente effizient durchgeführt und liefern verlässliche Daten und dokumentierte Informationen über die Umstände, unter denen die Daten erfasst wurden.
- Datenerfassung, Sammlung und Aufnahme von Beobachtungen definierter Eigenschaften in einem Feld
Vorbereitung des Feldexperiments
Bestimmung eines technischen Systems (Messinstruments) und Aufnahmeverfahren
Zeitraum und Umfang des Feldexperiments bestimmen
Durchführung des Feldexperiments
Aufnahme von Daten in einem Feld
- Felddokumentation, Dokumentation der Feldgegebenheiten im definierten Zeitraum während der Datenerhebung
- Bestimmung der zu dokumentierenden Feldgegebenheiten (Was?)
Rahmenbedingungen, Unsicherheiten,…
- Art der Dokumentation bestimmen (Wie?)
Händisch, digital,…
Trainingsmaterialien: Daten erheben [1]
Reifestufen
Level |
Reifestufe |
Charakteristik |
---|---|---|
Level 1 |
Einstieg |
Das FDM im Rahmen der Erhebung wird intuitiv und ad hoc ausgeführt. |
Es sind keine festgeschriebenen Arbeitsabläufe für das FDM im Rahmen der Erhebung auf Projektebene beschrieben. |
||
Es sind keine Werkzeuge und Software, die im Rahmen des FDM für die Erhebung eingesetzt werden, festgelegt. |
||
Level 2 |
Geführt |
Es werden auf Projektebene die datenmanagementbezogenen Inhalte der Erhebung festgelegt und durchgeführt. |
Es werden auf Projektebene notwendige Ressourcen für das FDM im Rahmen der Erhebung definiert und eingesetzt. |
||
Forschende wissen, wie die datenmanagementbezogene Erhebung durchgeführt werden soll und es stehen notwendige Ressourcen zur Verfügung. |
||
Level 3 |
Definiert |
Die datenmanagementbezogenen Inhalte der Erhebung werden nach domänenspezifischen Standards und Richtlinien ausgelegt. |
Es werden in der Domäne etablierte Tools und Werkzeuge für das FDM im Rahmen der Erhebung identifiziert und angewendet. |
||
Forschende orientieren die datenmanagementbezogene Erhebung an domänenspezifischen Standards und etablieren diese in der Umsetzung im Rahmen des Projektes. |
||
Level 4 |
Quantitativ geführt |
Es werden Qualitätskriterien für die Erhebung definiert und etabliert. |
Die datenmanagementbezogenen Inhalte der Erhebung werden auf Basis der definierten Qualitätskriterien hin gesichert. |
||
Forschende sichern auf Datenmanagementebene die Umsetzung der Erhebung hinsichtlich definierter Qualitätskriterien. |
||
Level 5 |
Optimierend |
Auf Datenmanagementebene wird die Umsetzung der Erhebung proaktiv optimiert und kontinuierlich verbessert (inhaltlich und technisch). |
Es werden Best Practices und Verbesserungen für das FDM in der Erhebung entwickelt und mit der domänenspezifischen Community geteilt. |
Level 1
Auf der Reifestufe 1 gibt es keine definierten Ziele, da das Feldexperiment intuitiv und ad hoc geplant und durchgeführt wird
Feldverhalten wird unstrukturiert aufgenommen
Messinstrument und Aufnahmeverfahren werden intuitiv gewählt
Datendokumentation läuft intuitiv ab.
Keine vorgegebenen Standards und Templates
Die Ausführung ist dabei Abhängig von der Motivation der/des Forschenden
Level 2
Ziele |
Praktiken |
---|---|
2.2.1: Messungen repräsentieren die zugrunde gelegten theoretischen Konstrukte hinreichend für das Projekt (Planung und Durchführung der Datenerhebung - Grundlagen) |
Bestimmung der zu erhebenden Beobachtungseinheiten und Eigenschaften - Zielgrößendefinition (Messdaten mit direkten Bezug zur Ziel-Messgröße) |
Bestimmung des zu verwendenden Messinstruments |
|
Definition der adäquaten Operationalisierung im Feld |
|
Definition möglicher reaktiver Einflüsse des Feldes |
|
Entwicklung eines Experimentplans auf projektdefinierte Weise (experimenteinzigartig) |
|
2.2.2: Felddokumentation des Experiments (auf projektorientierte, nicht standardisierte Weise) |
Bestimmung zu dokumentierender Feldgegebenheiten (allgemein und feldspezifisch) und zugehöriger Eigenschaften für die Felddokumentation |
Entwicklung und Anwendung einer Dokumentationsstruktur ohne Standards |
|
Bestimmung der Dokumentationsart |
Level 3
Ziele |
Praktiken |
---|---|
2.3.1: Datenerhebung und technische Systeme entsprechen domänenspezifischer syntaktischer Standards |
Identifizierung und Anwendung standardisierter Erhebungsprozesse innerhalb der Domäne (Best Practices) |
Identifizierung weiterer zu erhebende Beobachtungseinheiten und Eigenschaften (Zweckdaten und Nebendaten) mit Relevanz für eine communityorientierte Nachnutzung |
|
Verwendung standardisierter technischer Systemen in der Domäne |
|
2.3.2: Felddokumentation an domänen- und experimentspezifischen Standards ausrichten |
Recherchebasierte Auswahl eines Dokumentationsinstruments angelehnt an domänenspezifische Standards |
Identifizierung von Standards für die Terminologie und Schemata der zu dokumentierenden Feldgegebenheiten |
|
2.3.3: Redundanz zwischen Felddokumentation und Datenerfassung minieren |
Verknüpfung zwischen Felddokumentation und technischem System |
Level 4
Ziele |
Praktiken |
---|---|
2.4.1: Es werden quantitative Qualitätsziele für die Datenerhebung und Datenqualität definiert und etabliert |
Bestimmung zu überprüfender Qualitätsaspekte bei der Datenerhebung |
Identifizieren und einbeziehen relevanter Qualitätsmetriken |
|
2.4.2: Kontrolle der Datenqualität während und nach der Datenerhebung (Analyse der Daten hinsichtlich der Datenqualität -> keine inhaltliche Analyse zur Beantwortung der Forschungsfrage) |
Überprüfen der Datenqualität im Hinblick auf definierte Merkmale (bspw. Korrektheit, Vollständigkeit,…) |
Anwendung identifizierter Qualitätsmetriken |
|
Dokumentation kontextueller (Meta-)Daten im Zusammenhang mit der Datenqualität |
|
2.4.3: Reaktive Experimentanpassungen bei der Datenerhebung definiert und etabliert |
Identifizieren möglicher Fehlerquellen |
Bereitstellen von Ersatz beim Ausfall und Fehlern |
|
Überprüfen der Messinstrumente vor und während der Datenerhebung |
|
Maßnahmen bei detektierten Ausfällen und Fehlern inline ergreifen |
Level 5
Ziele |
Praktiken |
---|---|
2.5.1: Die Feldexperimente werden kontinuierlich und proaktiv verbessert und angepasst |
Verbessern und anpassen der Feldexperimente auf Grundlage von Feedback und neuen Standards in der fachspezifischen Community |
2.5.2: Inhalte im Zusammenhang mit Strukturen oder Versuchsplanungen, Versuchsdurchführungen, werden entwickelt und proaktiv, kontinuierlich angepasst und verbessert |
Einsatz und Weiterentwicklung von bewährten Verfahren und Standards |
Partizipieren in der Community zur Umsetzung und Entwicklung neuer Standards |
|
2.5.3: Die Technologien, die die Datenerhebung ermöglichen, werden regelmäßig bewertet und Verbesserungen werden umgesetzt |
Entwickeln und nutzen neuer technischer Standards |
Austausch und entwickeln technischer Systeme in der fachspezifischen Community |
Checkliste
Hier finden Sie eine Checkliste zum individuellen überprüfen der Ziele und Praktiken der verschiedenen Reifestufen im eigenen Projekt:
Weiterführende Materialien
Auf der Internetseite Forschungsdaten.info sind weiterführende Informationen zur Datendokumentation zu finden.
UK Data Service UK Data Service Checkliste
Referenzen
[1] Diese Trainingmaterialien sind entstanden im Rahmen der NFDI4Ing Special Interest Group RDM Training & Education.