Entwurf und Implementierung eines Boden-Sediment-Datenbanksystems für komplexe geowissenschaftliche und räumliche Daten
Durch den Fortschritt in Experimentaltechnologien, Sensortechnik und computergestützten Methoden werden in den Geowissenschaften immer umfangreichere und komplexere Datensätze generiert, die wiederum aus einer zunehmenden Anzahl an Quellen und Methoden stammen. Um den steigenden Anforderungen an das Forschungsdatenmanagement gerecht zu werden, untersuchte das Projekt „Design and Implementation of a Soil-Sediment Database System for Complex Geoscientific and Spatial Data“ die spezifischen Bedürfnisse und Anforderungen an ein Forschungsdatenmanagementsystem, das die komplexe geomorphologische und geochronologische Datensätze effektiv verwalten kann.
Um ein solches umzusetzen, wurde zunächst eine ausführliche, auf verschiedenen Komponenten basierende Anforderungsanalyse durchgeführt. Neben partizipativen Beobachtungen und semi-strukturierten Experteninterviews, bei denen direkte Einblicke in die Arbeitsprozesse im Labor und in der Feldarbeit gewonnen wurden, spielte auch die Analyse bestehender Datensätze eine zentrale Rolle. Es wurden sowohl Dokumentationen, Rohdaten als auch prozessierte Daten aus verschiedenen Studien und Arbeitsgruppen systematisch untersucht, um die Struktur, den Umfang und die Komplexität unterschiedlicher Forschungsdatensätze zu verstehen. Diese Analyse war entscheidend, um festzustellen, welche Datenarten und -formate in das System integriert werden müssen, welche Prozesse zur Verarbeitung und Verknüpfung der Daten notwendig sind und wie eine effiziente Speicherung und Abfrage der Daten umgesetzt werden. kann.
Im nächsten Schritt wurde ein geeignetes Datenmodell entwickelt, um die komplexen geomorphologischen und geochronologischen Datensätze effizient zu organisieren, sodass eine präzise Abbildung der verschiedenen Datentypen, deren Verknüpfungen und räumliche Positionierung ermöglicht wird.
Abschließend erfolgte die Implementierung des Datenbanksystems,bei der die Systemarchitektur und das Datenmodell mittels des Python-Frameworks Django und einer PostgreSQL-Datenbank (PostGIS) umgesetzt wurden. Ein besonderes Augenmerk wurde hier auf die Benutzerfreundlichkeit des Systems gelegt, um die Einstiegshürde für neue Nutzende gering zu halten.
Diese strukturierte Vorgehensweise ermöglichte die Digitalisierung von Teilen des Forschungsdatenmanagements, die den steigenden Anforderungen in den Geowissenschaften gerecht wird. Dennoch bedarf das System einer kontinuierlichen Weiterentwicklung, um sich den sich ständig wandelnden Anforderungen in der Forschung anzupassen.
Geschrieben und entwickelt von M.Sc. Dennis Handy.
Auf den Bildern sind verschiedene Screenshots aus dem Gebrauch mit der Datenbank abgebildet.
1) Die Eingabe von Messdaten ist benutzerfreundlich gestaltet. Als mögliche Datenarten existieren die, die von den befragten und beteiligten Arbeitsgruppen gewünscht wurden, allerdings ist die Liste prinzipiell erweiterbar. Mit Hilfe einer filterbaren Anzeige bleiben die Listen der Profile, der Campagnen, allgemein der Messungen übersichtlich.
2) Neben der Anzeige der Datenbanktabellen können auch ausgewählte Daten und berechnete Daten dargestellt werden. Anhand eines Sedimentprofils werden hier die Korngröße, der Anteil von Strontium und Titan sowie das Verhältnis beider Elemente graphisch präsentiert. In die Datenbank eingegeben hat der Nutzer nur die Messwerte von Strontium und Titan jeweils in mg/kg. Das Berechnen der Korngrößen und des Verhältnisses sowie das Plotten wird innerhalb des Datenbanksystems durchgeführt.
3) Innerhalb des Datenbanksystems können Publikationen verwaltet werden, d.h. eingegeben, gefiltert durchsucht und angezeigt.
4) Die Weboberfläche beinhaltet ein grundlegendes WebGIS, um die Felddokumentation und Messungen direkt in ihrem räumlichen Kontext zu visualisieren.
5) Die Datenbank unterstützt die Nutzenden bei der explorativen Datenanalyse, indem sie Zusammenhänge in den Datensätzen sichtbar macht, beispielsweise durch Clustering-Algorithmen basierend auf den Messdaten.