Mithilfe des Forschungsdaten-Konnektoms wird die Wiederverwendung von Daten in den Geistes- und Sozialwissenschaften gefördert und beschleunigt. Um mehr über die aktuellen Praktiken bei der Datenrecherche von Forschenden dieser Fachrichtungen zu erfahren, haben wir das SWITCH Innovation Lab «Repositories & Data Quality» in Auftrag gegeben. Heute sprechen wir mit Nicolai Hauf und Martin Jaekel von der ZHAW über die Ergebnisse ihrer Forschung und möchten dabei auch erfahren, welche Auswirkungen diese für die nächsten Schritte beim Aufbau des Forschungsdaten-Konnektoms haben können.
SWITCH: Was war das Ziel des SWITCH Innovation Lab?
Nicolai Hauf: Wir wollten die Wiederverwendung von bereits vorhandenen Forschungsdaten in den verschiedenen Fachrichtungen der Geistes- und Sozialwissenschaften untersuchen. Das Hauptziel dabei war die Ermittlung der relevanten Datenquellen für Forschende in der Schweiz. Zu diesem Zweck haben wir eine Umfrage erstellt, mit der wir den Aufbewahrungsort wertvoller bereits vorhandener Daten ermitteln sowie den Zweck der Wiederverwendung dieses Materials und die Kriterien der Forschenden bei der Auswahl der Daten für ihre eigene Verwendung genauer erforschen wollten.
SWITCH: Welche Datenanbieter werden am häufigsten genannt?
Nicolai Hauf: Viele Teilnehmende erwähnten FORSbase, die virtuelle Plattform für Zugang zu Forschungsdaten und -informationen für sozialwissenschaftliche Projekte in der Schweiz. Das Bundesamt für Statistik (BFS) ist eine weitere wichtige Quelle für Daten zu vielen unterschiedlichen Forschungsgebieten. Weitere nennenswerte Namen sind der European Social Survey (ESS) und das GESIS-Datenarchiv. Interessant war auch die breite Palette der kleinen Datenanbieter, die genannt wurden.
SWITCH: Warum ist die Wiederverwendung von Forschungsdaten in den Geistes- und Sozialwissenschaften wichtig für die zukünftige Forschung?
Nicolai Hauf: Die Verfügbarkeit von wiederverwendbaren Daten kann die zukünftige Forschung auf verschiedene Arten unterstützen. Zum einen können vorhandene Daten in neue Forschungsprojekte einbezogen werden, was dabei hilft, Ressourcen für eine zweite Datenerhebung zu sparen. Einblicke in Datensätze können auch zu neuen Forschungsfragen führen und die Anpassung von Forschungsmethoden anregen. Und zu guter Letzt ermöglicht die Wiederverwendbarkeit von Daten die Replikation von Studien und Ergebnissen.
Das Forschungsdaten-Konnektom bietet hilfreiche Rahmenbedingungen für Überlegungen hinsichtlich zukünftiger vernetzter Daten. Als Grundlage dazu dienen die hochwertigen Daten und die Unterstützung von verschiedenen Forschenden aus unterschiedlichen Fachgebieten.
Martin Jaekel
SWITCH: Was sind die Hauptkriterien bei der Auswahl der Daten zur Wiederverwendung?
Nicolai Hauf: Der Hauptaspekt ist Vertrauen in die Datenquelle, aber auch in die Daten selbst und in die Verfasser. Datenanbieter müssen das Vertrauen der Forschenden in ihre Dienste und in die Qualität der von ihnen bereitgestellten Daten sicherstellen. Darüber hinaus ist eine detaillierte Beschreibung der bereitgestellten Daten und zusätzliche Materialien wie Dokumentationen und Methodologien ein wesentliches Kriterium für das Verständnis und die Beurteilung der Daten. Die Verfügbarkeit von Rohdaten einerseits und bereinigten Daten andererseits ist auch sehr wichtig.
SWITCH: Was sind gemäss euren Erkenntnissen die grössten Herausforderungen, denen sich Forschende der Geistes- und Sozialwissenschaften bei der Wahl von geeigneten Daten zur Wiederverwendung stellen?
Nicolai Hauf: Daten müssen in erster Linie leicht auffindbar und verfügbar sein. Es kommt vor, dass die gewünschten Daten einfach nicht verfügbar sind und manchmal sind der Umfang, die Ausführlichkeit oder die Qualität, die man für eine Wiederverwendung der Daten für andere Zwecke benötigen würde, nicht ausreichend. Der Zugriff darf nicht zu einem hohen bürokratischen Aufwand führen und die eigentliche Wiederverwendung sollte über freizügige Lizenzen erlaubt sein. Qualitative Forschung ist häufig stark vom Kontext abhängig. Rechtliche Anforderungen zwingen die Forschenden, die Daten vor der Veröffentlichung zu anonymisieren. Diese unverzichtbaren Informationen gehen so verloren und eine Wiederverwendung ist nicht mehr möglich.
SWITCH: Auf welche Weise könnte das Forschungsdaten-Konnektom basierend auf deiner eigenen Forschung und von deinem Standpunkt als Forschender einige dieser Probleme lösen, Martin?
Martin Jaekel: Das Forschungsdaten-Konnektom kann dabei helfen, dass bewährte Praktiken von einem Fachgebiet in andere übernommen werden. Dies führt allgemein zu einer besseren Qualität der Daten. Im Rahmen dieses Prozesses werden die Vertreter von unterschiedlichen Fachrichtungen der Sozial- und Geisteswissenschaften gemeinsame Interessen, Datenbeschreibungen, Infrastrukturen, Dienstleistungen usw. überdenken, was eine Basis für die Einbindung von Datensets aus unterschiedlichen Quellen schaffen wird. Daher bietet das Forschungsdaten-Konnektom hilfreiche Rahmenbedingungen für Überlegungen hinsichtlich zukünftiger vernetzter Daten. Als Grundlage dazu dienen die hochwertigen Daten und die Unterstützung von verschiedenen Forschenden aus unterschiedlichen Fachgebieten.
SWITCH: Welche nächsten Schritte schlagt ihr auf Grundlage eurer Ergebnisse zur Entwicklung kundenorientierter Dienstleistungen im Ökosystem des Forschungsdaten-Konnektoms vor?
Nicolai Hauf: Das Allerwichtigste ist der Kontakt zu unserem Zielpublikum und dessen Forschungspraktiken. Deshalb sollten in einem nächsten Schritt diese relevanten Datenquellen auf Grundlage spezifischer Anwendungsfälle für das Konnektom beurteilt werden.
Wissenschaftler aus unterschiedlichsten Fachgebieten generieren im Zuge ihrer täglichen Forschungsarbeit immer mehr wertvolle Daten. Diese wissenschaftlichen Daten wiederverwerten oder gar kombinieren zu können, würde den Weg für zahlreiche spannende Anwendungsfälle ebnen. Bisher wurden Forschungsdaten isoliert in den einzelnen Bereichen oder Einrichtungen gesammelt und waren schwierig zu verknüpfen.
Das Forschungsdaten-Konnektom verbindet und verwaltet (offen zugängliche) wissenschaftliche (Meta-)Daten nachhaltig und fachbereichsübergreifend, um sicherzustellen, dass diese weithin zugänglich, nützlich und interoperabel sind. Der Konnektom-Prototyp wird gemeinsam von DaSCH, FORS, EPFL Blue Brain, eXascale Infolab, SATW, SAGW und SWITCH entwickelt.
Um einen nutzerzentrierten Einsatz des Ökosystems zu ermöglichen, richten wir zurzeit Fokusgruppen ein, die sich speziell den Geistes- und Sozialwissenschaften widmen. Das Ziel dabei ist, die Bedürfnisse unterschiedlicher Forschender zu ermitteln und weitere Anwendungsfälle aus spezifischen Fachgebieten zu beschreiben, die bis Ende des Jahres in der Minimalversion unseres Ökosystems umgesetzt werden.