Home Wie geht bedarfsorientiertes Forschungsdatenmanagement?
Article Open Access

Wie geht bedarfsorientiertes Forschungsdatenmanagement?

Durchführung, Protokollierung und Analyse von Beratungsvorgängen im geisteswissenschaftlichen Forschungsdatenmanagement am Beispiel des Data Center for the Humanities (DCH)
  • Patrick Helling

    Patrick Helling

    ORCID logo EMAIL logo
Published/Copyright: November 9, 2022
Become an author with De Gruyter Brill

Zusammenfassung

Das Management digitaler Forschungsdaten ist ein zentraler Aspekt im Wissenschaftsbetrieb. Bereits lange unterstützen Datenzentren und Servicestellen Forschende bei Fragen zum Forschungsdatenmanagement (FDM). Dabei sollten sich die Organisation und inhaltliche Ausgestaltung dieser Servicestrukturen an den täglichen FDM-Bedarfen der Forschenden orientieren. Mit diesem Beitrag soll ein entsprechender Ansatz für ein bedarfsorientiertes FDM in den Geisteswissenschaften vorgestellt und diskutiert werden. Im Fokus stehen dabei die Beratungs- und Protokollierungspraxis des Data Center for the Humanities (DCH) an der Universität zu Köln sowie konkrete Methoden zur Identifizierung und Modellierung von FDM-Bedarfskategorien und -workflows zur formalen Beschreibung von geisteswissenschaftlichem FDM.

Abstract

Research Data Management (RDM) is a core aspect of scientific work. Data centers and service points have long supported researchers in questions about RDM. This paper will illustrate and discuss an approach for organizing RDM in the humanities, focusing in particular on the daily requirements of researchers as far as RDM is concerned. It will present two main topics: on the one hand, the RDM-counseling and documentation processes of the Data Center for the Humanities (DCH) at the University of Cologne; on the other, concrete methods for identifying and modeling RDM-requirement categories and -workflows.

1 Einleitung

Forschungsdaten sind ein zentraler Motor wissenschaftlichen Fortschritts.[1] Als Ergebnisse und Ausgangspunkte wissenschaftlicher Forschungsprozesse stellen sie die grundlegende Basis für den allgemeinen Erkenntnisgewinn und die Entwicklung neuer wissenschaftlicher Fragestellungen dar. Ihre langfristige Sicherung, Verfügbarmachung und Nachnutzbarkeit im Sinne der FAIR-Prinzipien[2] sind zentrale Aspekte guter wissenschaftlicher Praxis.[3]

Die Entwicklungen hin zu einer Nationalen Forschungsdateninfrastruktur (NFDI)[4] befördern auf nationaler Ebene die Etablierung domänenspezifischer Praktiken für den Umgang mit Forschungsdaten.[5] Auf europäischer Ebene unterstützen Initiativen wie GO FAIR den adäquaten Umgang mit Forschungsdaten.[6] Gleichzeitig bilden europäische Infrastrukturprojekte wie OpenAIRE,[7] die European Open Science Cloud (EOSC)[8] oder Gaia-X[9] umfassend aufgestellte technische Infrastrukturen für die Ablage von Forschungsdaten.

Neben diesen nationalen und internationalen Entwicklungen haben sich in den vergangenen Jahren an vielen Universitäten und außeruniversitären Forschungseinrichtungen zusätzlich Kompetenzstellen für Forschungsdatenmanagement (FDM), generische und fachspezifische Datenzentren sowie Beratungsstellen etabliert, die Forschende bei Fragen rund um das Management von Forschungsdaten aktiv unterstützen.[10]

Für die Bereitstellung von Forschungsdatenmanagement-Services orientiert sich die organisatorische Ausgestaltung dieser FDM-Kompetenzstellen und Datenzentren sowie ihrer Servicestrukturen i. d. R. an unterschiedlichsten hochschulpolitischen top-down Handreichungen und Empfehlungen[11] sowie quantitativen Bedarfserfassungen.[12] Zusätzlich gibt es formale Modelle, um FDM-Servicestrukturen zu beschreiben bzw. zu evaluieren.[13] Während solche top-down Empfehlungen häufig auf einer wissenschaftspolitischen Agenda beruhen und jene formalen Modelle, die an der anbietenden Perspektive orientiert sind, häufig nicht die tatsächlichen FDM-Bedarfe der Forschungscommunities berücksichtigen, sind insbesondere quantitative Erhebungen von FDM-Bedarfen von Forschenden i. d. R. fehleranfällig und dienen lediglich als grober Orientierungsrahmen für den Aufbau und die Etablierung von FDM-Servicestrukturen.

Allerdings sollte Forschungsdatenmanagement für die passgenaue Bedienung spezifischer FDM-Bedarfe explizit an den tatsächlichen Herausforderungen und Problemen der Forschenden selbst orientiert sein. Ein formales Modell zur Beschreibung von Strukturen, Prozessen und Bedingungen im Forschungsdatenmanagement, welches sowohl die Perspektive der Forschenden als auch die jeweilige Situierung von FDM-Kompetenzstellen und Datenzentren berücksichtigt, scheint noch nicht zu existieren. Umso mehr sollte unser Verständnis von Forschungsdatenmanagement stärker strukturiert und formalisiert werden, um qualitatives Management von Forschungsdaten in der Breite gewährleisten zu können.

Dieser Beitrag beleuchtet die Forschungsdatenmanagement-Praxis des Data Center for the Humanities (DCH) an der Universität zu Köln und illustriert insbesondere die Notwendigkeit einer standardisierten Protokollierung von FDM-Beratungsvorgängen. Dabei soll herausgearbeitet werden, welche Potentiale FDM-Beratungsprotokolle für die Analyse, Formalisierung und Professionalisierung von Forschungsdatenmanagement haben und wie diese dabei helfen können, FDM-Servicestrukturen an tatsächlichen FDM-Bedarfen einer Forschungscommunity auszurichten.

Im Fokus stehen in diesem Zusammenhang auch bisherige Ergebnisse, die im Rahmen des laufenden Promotionsvorhabens des Autors dieses Beitrags erreicht werden konnten, dessen Ziel es ist ein formales Beschreibungsmodell für FDM-Bedarfe[14] und -Workflows[15] zu entwickeln. Zu diesem Zweck wurde ein Korpus aus insgesamt 90 anonymisierten FDM-Beratungsprotokollen zusammengestellt, welches mit Hilfe einer qualitativen Inhaltsanalyse nach Mayring[16] ausgewertet wird. Durch induktive und deduktive Kategorienbildung werden dabei sowohl formale Beschreibungsmodelle für spezifische FDM-Bedarfe als auch prototypische Workflows zur Bedienung selbiger entwickelt. Die hier gewonnenen Ergebnisse bewegen sich entsprechend nah an den tatsächlichen FDM-Bedarfen von Forschenden, zu denen Beratung und Unterstützung benötigt wird (siehe Abschnitt 4.2).

2 Das Data Center for the Humanities (DCH) an der Universität zu Köln

2.1 Institutionelle Einbettung

Das Data Center for the Humanities (DCH) ist ein fachspezifisches Datenzentrum für die Geisteswissenschaften.[17] Es ist eine zentrale Einrichtung der Philosophischen Fakultät[18] an der Universität zu Köln[19] und seit seiner Gründung im Jahr 2012 für die Unterstützung der Forschenden an der Fakultät und darüber hinaus bei Fragen zum Management von Forschungsdaten zuständig.[20]

Das DCH verfügt über eine Leitungsebene, die aus drei Mitgliedern besteht. Zusätzlich gibt es zwei ½ VZÄ-Stellen, weitere Projektmitarbeiterinnen und -mitarbeiter sowie Hilfskräfte, die in Forschungsprojekten des Kölner Datenzentrums tätig sind. Seit 2018 verfügt das DCH über eine eigene Satzung,[21] in der sein Auftrag und seine Tätigkeitsbereiche konkret definiert sind und durch die das Kölner Datenzentrum institutionell an der Fakultät verankert ist.

Neben seiner grundsätzlich institutionellen Ausrichtung ist das Kölner Datenzentrum zusätzlich eng mit lokalen, regionalen sowie nationalen und internationalen FDM-Netzwerken, Partnerinstitutionen und Kompetenzzentren verknüpft.[22] Hierbei sind nicht nur Aktivitäten in allen vier geisteswissenschaftlichen NFDI-Konsortien NFDI4Culture,[23] Text+,[24] NFDI4Memory[25] und NFDI4Objects,[26] sondern insbesondere auch Beteiligungen an Netzwerken wie GO FAIR oder Aktivitäten in Fachverbänden wie dem Verband Digital Humanities im deutschsprachigen Raum e. V.[27] sowie Mitgliedschaften in den Vereinen Deutsche Initiative für Netzwerkinformationen e. V. (DINI)[28] und der Research Data Alliance Deutschland e. V.[29] zu nennen. Lokale Zusammenarbeit findet zusätzlich mit zentralen Infrastruktureinrichtungen wie dem Regionalen Rechenzentrum (RRZK),[30] der Universitäts- und Stadtbibliothek (USB)[31] und dem Cologne Competence Center for Research Data Management (C3RDM)[32] sowie fachnahen Einrichtungen wie dem Cologne Center for eHumanities (CCeH)[33] und dem Institut für Digital Humanities (IDH)[34] statt.

Vor dem Hintergrund der starken Heterogenität von Anforderungen und Bedarfen im geisteswissenschaftlichen Forschungsdatenmanagement[35] ermöglichen diese Kooperationen und Netzwerkeinbindungen dem DCH die Adressierung und Bedienung eines breiten Spektrums an FDM-Herausforderungen.

2.2 Das grundsätzliche Serviceportfolio des DCH

Das Kerngeschäft des DCH bilden die Beratung und Unterstützung geisteswissenschaftlicher Forschender an der Philosophischen Fakultät und darüber hinaus.[36] Entsprechend liegt der Fokus des Serviceportfolios am Kölner Datenzentrum auf der (1) allgemeinen FDM-Beratung, der (2) Antragsunterstützung, dem (3) begleitenden Forschungsdatenmanagement sowie der (4) Ressourcenbetreuung und der (5) aktiven Archivierung von Forschungsdaten.

Zusätzlich arbeitet das DCH daran, (6) FDM-Kompetenzen und -Awareness an der Philosophischen Fakultät auszubauen. Neben Gastvorträgen in universitären Lehrveranstaltungen zu einzelnen Aspekten des Forschungsdatenmanagements bietet das Data Center for the Humanities regelmäßig fachspezifische FDM-Workshops für Nachwuchswissenschaftlerinnen und -wissenschaftler an der a.r.t.e.s. Graduate School for the Humanities Cologne[37] und Übungen in den Masterstudiengängen[38] Informationsverarbeitung, Medieninformatik und Linguistik an der Philosophischen Fakultät an. Mit der „Daten & Datteln“-Reihe[39] werden zusätzlich zentrale FDM-Themenkomplexe in kleinen Sammelkarten aufbereitet und den Forschenden der Fakultät sowie der breiteren Öffentlichkeit über den Twitter-Kanal[40] des DCH zur Verfügung gestellt.

Das Kölner Datenzentrum verfügt über (7) ausgewiesene Kompetenzen im Umgang mit audiovisuellen Sprachdaten, ist Teil des CLARIN Knowledge-Centre for Linguistic Diversity and Language Documentation (CKLD)[41] und wird als CLARIN C-Centre geführt. Mit den BMBF-Verbundprojekten „KA3 – Kölner Zentrum Analyse und Archivierung von AV-Daten“[42] und „QUEST: Quality-Established: Erprobung und Anwendung von Kurationskriterien und Qualitätsstandards für audiovisuelle, annotierte Sprachdaten“[43] wurden und werden am DCH aktuelle Herausforderungen im Umgang mit AV-Daten adressiert und erforscht. In diesem Zusammenhang zählt, neben dem Angebot verschiedener Audio-Services, auch der Betrieb des (8) Language Archive Cologne (LAC),[44] einem fach- und datenspezifischen Forschungsdatenrepositoriums für audiovisuelle Sprachdaten zum Kölner Serviceportfolio. Zuletzt unterstützt das DCH Forschende noch mit (9) gut dokumentierten Programmierschnittstellen bei der Publikation von Forschungsdaten.

Im Folgenden soll nun der Fokus auf die Beratungspraxis des Kölner Datenzentrums sowie die Dokumentation und Auswertung von Beratungsvorgängen und -gesprächen zur Strukturierung von Forschungsdatenmanagement, der verbesserten Identifizierung von FDM-Bedarfskategorien sowie der grundsätzlichen Professionalisierung der Beratung und Unterstützung von Forschenden bei Fragen des Forschungsdatenmanagements gelegt werden.

3 Die Dokumentationspraxis des DCH

Das Kölner Datenzentrum führt regelmäßig Beratungsgespräche mit Forscherinnen und Forschern der Philosophischen Fakultät und darüber hinaus durch, die Unterstützung bei Fragen zum Forschungsdatenmanagement benötigen. Beratungsgespräche werden dabei einem übergeordneten Beratungsvorgang zugeordnet. Ein Beratungsvorgang besteht entsprechend i. d. R. aus mehreren Beratungsgesprächen, die über mehrere Jahre verteilt stattfinden können. Beratungsvorgänge können zu unterschiedlichen Zeitpunkten einer Projektlaufzeit beginnen. Zur umfassenden Umsetzung von Forschungsdatenmanagement, bspw. in einem Projektkontext, sollten Beratungsvorgänge jedoch idealerweise noch vor Projektbeginn bzw. während der Antragsphase beginnen.

Typischerweise finden Beratungsgespräche persönlich mit den Forschenden statt. Das Gespräch wird von mindestens zwei Mitarbeitenden des Datenzentrums geführt, wobei i. d. R. eine Person aktiv durch das Gespräch führt und eine zweite Person das Gespräch protokolliert, was ein zentraler Bestandteil in der Bedienung von FDM-Bedarfen darstellt (siehe Abschnitt 3.1). In seltenen Fällen können Beratungsgespräche auch via Telefon oder E-Mail geführt werden. Erfahrungen zeigen allerdings, dass ein persönliches Gespräch einen besser geeigneten Rahmen darstellt, um möglichst alle relevanten Informationen bezüglich eines FDM-Bedarfs zu erfassen und passgenaues Forschungsdatenmanagement anbieten zu können.

3.1 Protokollierung von FDM-Beratungsgesprächen

Zur Dokumentation und Erfassung aller relevanten Informationen und Rahmenbedingungen werden Beratungsgespräche am DCH mit Hilfe eines historisch gewachsenen Protokoll-Templates dokumentiert. Bei dem Protokoll-Template handelt es sich um ein strukturiertes Text-Dokument, welches bereits während der Durchführung eines Beratungsgesprächs befüllt und anschließend noch einmal inhaltlich bereinigt wird. Für jeden Beratungsvorgang wird eine Protokoll-Datei erstellt, in der ein oder mehrere Beratungsgespräche dokumentiert werden. Somit handelt es sich hierbei um ein dynamisch wachsendes Dokument.

Die Protokolle bilden einerseits die informationelle Basis für die Durchführung praktischer FDM-Maßnahmen durch das Kölner Datenzentrum sowie die Forschenden. Andererseits dienen sie auch als Ausgangspunkt für die Analyse der FDM-Bedarfslandschaft an der Philosophischen Fakultät, zur Identifikation von Bedarfsmustern und Ableitung von Best Practices für die Bedienung bestimmter FDM-Bedarfe sowie ganz allgemein zur Formalisierung von FDM-Prozessen (siehe Abschnitt 4).

Nach Fertigstellung eines Protokolls wird dieses in seiner Textform an alle Mitarbeitenden des Beratungsteams sowie die Leitungsebene verschickt. Dies dient einerseits allgemeinen Informationszwecken für das Team, andererseits bietet es die Möglichkeit für Kolleginnen und Kollegen sowie insbesondere auch für die Leitungsebene, Beratungsvorgänge zu kommentieren und mitzudiskutieren. Gleichzeitig wird das Protokoll in einen internen Wiki-Eintrag überführt. Dies bietet die Möglichkeit, einen Beratungsvorgang und seine Protokolle einfach und systemunabhängig abzurufen und einzusehen. Zusätzlich wird in einer selbst-betriebenen NextCloud-Instanz ein Ordner für den Beratungsvorgang angelegt. Hier werden sowohl das Protokoll in seiner Textform als auch weitere Materialien zum Vorgang, wie bspw. Service Level Agreements, Depositor Agreements, verwendete Textbausteine für Förderanträge und Datenmanagementpläne sowie relevante E-Mails zentral abgelegt.

3.1.1 Die drei Abschnitte des Protokoll-Templates

Insgesamt lässt sich das Protokoll-Template in drei Abschnitte aufteilen: (1) generelle Meta-Informationen zum Beratungsvorgang, (2) Beschreibung und Dokumentation des konkreten Beratungsgesprächs sowie (3) ausgesprochene Empfehlungen und definierte Aufgabenpakete (siehe Anhang 1).

3.1.1.1 Generelle Meta-Informationen zum Beratungsvorgang

Im ersten Abschnitt des Protokoll-Templates werden generelle Angaben und Rahmenbedingungen zum gesamten Beratungsvorgang gesammelt. Diese umfassen, neben einem individuell gewählten Kurztitel des Vorgangs und Angaben zur Institution oder Fachrichtung, aus der die/der anfragende Forschende stammt, auch Kontaktinformationen (i. d. R. der Name der/des anfragenden Forschenden und E-Mail-Adressen). Die allermeisten Beratungsvorgänge entstammen aus einem Projektkontext. Entsprechend werden auch Grundinformationen zum betroffenen Forschungsprojekt erfasst, d. h. die grobe Projektphase zum Zeitpunkt der ersten Kontaktaufnahme („ab ovo“ – vor Projektbeginn bzw. in der Antragsphase, „in vita“ – in laufender Projektphase, „post mortem“ – kurz vor Ende der Projektphase bzw. nach der Projektphase), Namen der Principal Investigator(s), Förderinstitution, Laufzeit des Projekts und weitere beteiligte Mitarbeiter*innen (sofern diese nicht mit der/dem anfragenden Forschenden identisch sind). Aufgrund der bereits beschriebenen parallelen Nutzung eines internen Wiki-Systems und einer selbst-betriebenen NextCloud-Instanz, verfügen alle Beratungsprotokolle über einen Link zum entsprechenden NextCloud-Ordner zum Beratungsvorgang, in dem das Beratungsprotokoll als Word-Datei sowie ggf. weitere Materialien abgelegt sind.

3.1.1.2 Beschreibung und Dokumentation des konkreten Beratungsgesprächs

Der zweite Abschnitt des Protokoll-Templates dokumentiert ein einzelnes Beratungsgespräch eines Beratungsvorgangs inhaltlich. Wichtige Informationen sind hier zunächst der Zeitpunkt des einzelnen Beratungsgesprächs sowie die Namen der Teilnehmenden des Datenzentrums. Darüber hinaus wird erfasst, welche weiteren Personen an dem Beratungsgespräch teilgenommen haben. Diese können bspw. Kolleg*innen der/des anfragenden Forschenden sein, die allerdings nur an dem einzelnen Beratungsgespräch teilnehmen, oder Expert*innen, die vom Datenzentrum zu einem Beratungsgespräch eingeladen wurden.

Schließlich wird der FDM-Bedarf der/des anfragenden Forschenden gleichzeitig präzise und knapp beschrieben. In diesem Zusammenhang gilt es zu beachten, dass der tatsächliche FDM-Bedarf zu Beginn eines Beratungsgesprächs noch nicht zwangsläufig definiert ist, sondern sich erst im Laufe des eigentlichen Gesprächs herauskristallisiert. Darüber hinaus werden in diesem Protokoll-Abschnitt das grundsätzliche Forschungsvorhaben sowie der Kontext des FDM-Bedarfs beschrieben. Dieser als Fließtext strukturierte Teil des Protokoll-Templates kann inhaltlich sehr variabel gestaltet werden. I.d.R. werden bei einem Projektkontext hier Informationen zum Projekt, zur Fragestellung, zu Untersuchungsgegenständen, Methoden und grundsätzlichen Rahmenbedingungen wie bspw. Kooperationen, Feldforschungsvorhaben oder Anforderungen an eine Forschungsdatenpublikation, bspw. restriktive Zugriffsregelungen oder bestimmte Lizenzmodelle, erfasst. Ziel ist es, in diesem Abschnitt möglichst viele Kontextinformationen zu einem FDM-Bedarf zu dokumentieren, um insbesondere auch potenzielle Einflussfaktoren auf den FDM-Bedarf selbst sowie seine Bedienung frühzeitig zu identifizieren.

Sofern bereits vorhanden, werden in diesem Protokoll-Abschnitt zusätzlich Informationen über die erzeugten bzw. noch zu erzeugenden Forschungsdaten gesammelt. Konkret umfasst dies Angaben zu (erwarteten) Datentypen und -formaten sowie qualitative Angaben zum Datenumfang, bspw. um wie viele Einzeldateien oder Datenbankeinträge es geht bzw. ob Forschungsdaten im Mega-, Giga- oder Terabytebereich erzeugt werden. Einige Projektvorhaben produzieren als zusätzlichen Output auch lebende Systeme wie bspw. Projektwebsites, Präsentationswebsites als Zugangsschichten zu Forschungsergebnissen, Tools zur Analyse und Visualisierung oder dynamische Datenbanken und Anwendungen. Auch diese Produkte gilt es im Rahmen eines Beratungsvorgangs mit zu adressieren. Relevante Informationen, die in diesem Zusammenhang erfasst werden, sind, um was für einen Systemtyp es sich handelt, welche Funktion das lebende System erfüllt bzw. erfüllen soll, welche Technologiestacks zugrunde liegen sowie in welchen technischen Umgebungen das System entwickelt bzw. betrieben werden soll/muss.

3.1.1.3 Ausgesprochene Empfehlungen und definierte Aufgabenpakete

Im dritten Abschnitt des Protokoll-Templates werden schließlich zunächst Einschätzungen und Empfehlungen des Datenzentrums für die Forschende oder den Forschenden dokumentiert, welche zuvor im Beratungsgespräch ausgesprochen wurden. Zusätzlich werden potenzielle Arbeitspakete, auf die sich im Rahmen des protokollierten Beratungsgesprächs mit der/dem anfragenden Forschenden verständigt wurde, dokumentiert. Dabei wird in Arbeitspakete der/des anfragenden Forschenden und des Datenzentrums unterschieden. Idealerweise werden die unterschiedlichen Tasks der Arbeitspakete im Laufe des Beratungsvorgangs mit einem Vermerk, wann ein spezifischer Task abgearbeitet wurde, markiert.

4 Analysepotentiale der FDM-Beratungsdokumentation

Aus der standardisierten Dokumentation der Beratungsvorgänge am DCH ergeben sich grundsätzliche Möglichkeiten zur Analyse und Auswertung von Beratungen einerseits sowie zur Identifikation von FDM-Bedarfskategorien und Mustern, bzw. Best Practices und typischen Workflows zur Bedienung von FDM-Bedarfen andererseits.

Im Folgenden sollen mit der (1) allgemeinen FDM-Beratung, der (2) Antragsberatung/-beteiligung, dem (3) begleitenden Forschungsdatenmanagement sowie der (4) Hilfestellung bei endenden bzw. abgeschlossenen Projekten zunächst vier allgemeine Phasen-Profile von Beratungsvorgängen beschrieben werden. Eine genauere Analyse der Beratungsvorgänge soll schließlich im Anschluss beispielhaft beschrieben werden.

4.1 Allgemeine Phasen-Profile von Beratungsvorgängen

Die Protokollierung von Beratungsgesprächen und -vorgängen ermöglicht es zunächst, das Anfrageaufkommen am Kölner Datenzentrum, orientiert an der Projektphase zum Zeitpunkt der ersten Kontaktaufnahme, in vier verschiedene Profile zu unterteilen. Diese Einteilung hilft bereits dabei, den Umfang eines Beratungsvorgangs sowie die grundsätzlich erforderlichen Maßnahmen zur Bedienung eines FDM-Bedarfs einzuschätzen.

4.1.1 Allgemeine FDM-Beratungen

In Vorgängen dieses Profils werden i. d. R. einzelne Aspekte des Forschungsdatenmanagements bedarfs- und projektorientiert an das Datenzentrum herangetragen, ohne dass weitere Phasen der Projektdurchführung davon berührt werden. Typische Beispiele hierfür sind

  • Fragen zur organisatorischen oder technischen Umsetzung einer Projektwebsite,

  • Unterstützung bei der praktischen Umsetzung des Datentransfers zwischen Forschenden, insbesondere über EU-Grenzen hinweg, oder

  • die Evaluation von bestimmten Analyse- oder Projektmanagementtools sowie virtueller Arbeitsumgebungen.

In solchen Fällen berät das DCH zielgerichtet bezüglich des entsprechenden Bedarfs, spricht Empfehlungen aus oder konsultiert Expert*innen im eigenen Umfeld für eine gemeinsame Beratung.

4.1.2 Antragsberatungen/-beteiligungen („ab ovo“)

Häufig wird das Kölner Datenzentrum bereits während einer Antragsphase durch Forschende kontaktiert. Dies lässt sich unter anderem darauf zurückführen, dass immer mehr Drittmittelgeber im Rahmen einer Mittelbeantragung erwarten, dass Antragsstellende sich zum Umgang mit Forschungsdaten in ihrem geplanten Projekt positionieren.

Typischerweise werden bei Beratungsvorgängen in diesem Profil zentrale Aspekte des Forschungsdatenmanagements für ein Projekt besprochen und entsprechende Textabschnitte für den Förderantrag durch das Datenzentrum formuliert. Sofern die Forschenden selbst bereits einen Textabschnitt zum Forschungsdatenmanagement verfasst haben, findet eine Experteneinschätzung durch das DCH sowie ggf. eine Überarbeitung statt.

Immer wieder werden im Rahmen von Projektbeantragungen auch konkrete Services des DCH von der/dem anfragenden Forschenden benötigt, welche dann mit in den Antragstext bzw. den Datenmanagementplan aufgenommen werden können. Während regelmäßige Konsultationen des Datenzentrums einen Teil des grundlegenden Serviceportfolios darstellen, bedarf es für konkretere Tasks Teilfinanzierungen, welche im Rahmen der Beantragung mit eingepreist werden müssen, bspw. für aktive Kurationsaufgaben, Schulungs- und Lehrangebote für Projekte und Forschungsverbünde sowie umfangreiche Archivierungsaufgaben.

4.1.3 Begleitendes Forschungsdatenmanagement („in vita“)

Neben der allgemeinen FDM-Beratung (s. o.) bietet das DCH auch projektbegleitendes Forschungsdatenmanagement an. Vorgänge innerhalb dieses Profils beinhalten i. d. R. wiederkehrende Beratungsgespräche über die gesamte Projektlaufzeit hinweg und zu verschiedensten Aspekten des Forschungsdatenmanagements. Ein Beispiel für einen solchen Prozess stellt die Zusammenarbeit mit INF-Projekten in Sonderforschungsbereichen oder mit FDM-Projekten in Schwerpunktprogrammen dar.[45] Solchen und vergleichbaren Projektorganisationsstrukturen steht das DCH aktiv zur Seite und berät und unterstützt die Kolleginnen und Kollegen über die gesamte Projektlaufzeit hinweg und in allen Phasen des Forschungsdatenlebenszyklus. Zentral sind in solchen Szenarien häufig die gemeinsame Entwicklung und Umsetzung einer passgenauen und umfassenden Datenstrategie für das gesamte Projekt bzw. den gesamten Projektverbund.

Insbesondere in Forschungsverbünden für Nachwuchswissenschaftlerinnen und -wissenschaftler wie bspw. in Graduiertenkollegs liegt der Fokus des begleitenden Forschungsdatenmanagements hingegen deutlich stärker auf der Aus- und Weiterbildung. Neben individuellen und projektspezifischen Beratungsgesprächen mit Nachwuchswissenschaftlerinnen und -wissenschaftlern werden in diesem Zusammenhang i. d. R. auch spezifische FDM-Workshops angeboten, welche an den verschiedenen Phasen sowie den einzelnen Desiderata der individuellen Projekte orientiert sind.[46] Voraussetzung für ein solches begleitendes Forschungsdatenmanagement ist typischerweise eine entsprechende Kooperationsvereinbarung mit dem Kölner Datenzentrum sowie ggf. eine Einpreisung des Angebots im Rahmen der Antragsstellung.

4.1.4 Hilfestellung bei endenden bzw. abgeschlossenen Projekten („post mortem“)

Wenngleich viele Forschende bereits während einer Antragsphase das Kölner Datenzentrum für die Planung des Managements ihrer Forschungsdaten kontaktieren, gibt es auch immer wieder Projekte, die kurz vor Ende ihrer Förderphase oder sogar erst nach Auslaufen der eigenen Förderung Unterstützung beim Forschungsdatenmanagement anfragen. Häufige Bedarfe in diesem Profil sind neben der Archivierung und Publikation von Forschungsdaten und Ergebnissen auch der Umgang mit lebenden Systemen über die Projekt- und Förderlaufzeit hinaus. Während eine Archivierung von Forschungsdaten durch das DCH im Rahmen des eigenen institutionellen Auftrags und der personellen Ausstattung i. d. R. auch noch zu diesem späten Zeitpunkt rudimentär gewährleistet werden kann, geht der Umgang mit lebenden Systemen meist nicht über eine persistente Publikation eines finalen Zustands oder die Statisierung und basale Ablage von Websites und Anwendungen hinaus.

4.2 Inhaltliche Bedarfskategorien in der FDM-Beratung

Die fünf verschiedenen Phasen-Profile eignen sich, um FDM-Beratungsvorgänge am DCH grob zu strukturieren und zu bearbeiten. Genauer betrachtet können innerhalb dieser Phasen-Profile jedoch sehr unterschiedliche FDM-Bedarfe durch Forschende adressiert werden. Einige dieser FDM-Bedarfe werden häufiger an das Kölner Datenzentrum herangetragen als andere. Für einige wiederkehrende Bedarfe existieren bereits generelle Best Practices und etablierte Lösungsstrategien im Bereich Forschungsdatenmanagement, wenngleich sich die Rahmenbedingungen, bspw. der Fachbereich, das Förderformat oder individuelle Bedingungen der Forschenden selbst, zwischen Beratungsvorgängen mit ähnlichen/gleichen FDM-Bedarfen häufig unterscheiden.

Mit Hilfe einer qualitativen Inhaltsanalyse sowie einer induktiven/deduktiven Kategorienbildung nach Mayring[47] von insgesamt 90 Beratungsprotokollen, die am DCH im Rahmen von durchgeführten Beratungsgesprächen angefertigt wurden, werden im Rahmen des Promotionsvorhabens des Autors dieses Beitrags konkrete FDM-Bedarfskategorien identifiziert und analysiert. Die Beratungsprotokolle werden dabei anhand der identifizierten FDM-Bedarfskategorien in Cluster aufgeteilt, um schließlich durch weiterführende inhaltliche Analysen Selbige zu beschreiben. Im Fokus stehen dabei

  1. die Identifikation und Formalisierung von relevanten Informationen zur Definition der FDM-Bedarfskategorien,

  2. die Entwicklung eines formalen Beschreibungsmodells für die verschiedenen FDM-Bedarfskategorien,

  3. die Identifikation und Formalisierung von in den Beratungsprotokollen dokumentierten Workflows und Lösungsstrategien sowie

  4. das Mapping von unterschiedlichen Workflows und Lösungsstrategien innerhalb der Cluster zur Definition prototypischer Service-Maßnahmen.

Im Rahmen dieser Analysen konnten insgesamt 48 unterschiedliche inhaltliche FDM-Bedarfskategorien identifiziert werden, die an das Kölner Datenzentrum herangetragen wurden (siehe Tab. 1).

Im Folgenden sollen nun die weiterführenden Analysen der FDM-Bedarfskategorien anhand zweier Beispielsszenarien beschrieben werden. Insbesondere sollen auf diese Weise die Potentiale einer solchen Analyse für die bedarfsorientierte Vermessung einer FDM-Bedarfslandschaft sowie die Definition von Workflows und Best Practices zur Bedienung eben jener FDM-Bedarfe verdeutlicht werden.

4.2.1 FDM-Bedarfskategorie „Antrag“

In insgesamt 27 von 90 Beratungsprotokollen wurde von Forschenden Unterstützung durch das DCH angefragt, während sie an einem Förderantrag für ein Drittmittelprojekt arbeiteten. Konkret gab es innerhalb dieser Beratungsvorgänge Bedarfe bei der Planung und Beschreibung des Forschungsdatenmanagements für das jeweils geplante Projekt innerhalb des Projektantrags. Die FDM-Bedarfskategorie „Antrag“ konnte im Rahmen der Analysen in zwei Sub-Bedarfskategorien unterteilt werden: (1) Entweder die Forschenden hatten bereits selbst einen Abschnitt zum Umgang mit Forschungsdaten verfasst und benötigten ein konkretes Feedback zum Text („Review eines Textabschnitts“), oder (2) das Datenzentrum formulierte auf der Basis eines umfassenden Beratungsgesprächs selbst einen passenden Textabschnitt für den Projektantrag („Verfassen eines Textabschnitts“).

Tab. 1:

Anzahl der Bedarfskategorien, die am DCH identifiziert werden konnten.

Gesamtanzahl identifizierter FDM-Bedarfskategorien

Bedarfskategorie

Anzahl

Bedarfskategorie

Anzahl

Antrag

27

Visualisierung

3

Archivierung

25

Zugänglichkeit

3

Website

17

interner Zugang

2

Datenbank

16

Lizenzen

2

Sicherung

13

Tools

2

Allgemeine Beratung

9

Datenübernahme

2

DMP

9

Umfragen

2

generisches FDM

9

Vermittlung

2

Kooperation

9

Verstetigung

2

Software

8

Analyse

1

Metadaten

7

Begleitung/Unterstützung

1

Datenpublikation

7

FDM-Support während Projektlaufzeit

1

Backup

5

Betrieb von Software

1

Digitalisierung

5

Data Handling

1

Policies

5

Longtail Daten

1

Rechtliche Fragestellungen

5

Nachhaltigkeitskonzepte

1

Forschungsdateninfrastruktur

4

Nachnutzbarkeit

1

Sicherung während Projektlaufzeit

4

Open Character Recognition

1

Publikation (sonstige Ergebnisse)

3

Projektmanagement

1

Datensammlung

3

Projektunterstützung

1

Datenpräsentation

3

Training/Weiterbildung

1

Standards

3

Snapshots

1

technischer Support

3

Letter of Intent

1

Verfügbarkeit

3

virtuelle Forschungsumgebungen

1

Im Fall der Sub-Bedarfskategorie „Review eines Textabschnitts“ konnte festgestellt werden, dass die adressierten und diskutierten Aspekte im Rahmen eines Beratungsvorgangs sehr heterogen waren (siehe Abb. 1). Unterschiedliche Bereiche des Forschungsdatenmanagements wurden entweder von den Anfragenden in ihrem selbst verfassten Textabschnitt zum FDM bereits thematisiert oder während eines Beratungsgesprächs besprochen.

Wenn hingegen Vertreterinnen und Vertreter des Datenzentrums selbst einen Textabschnitt für einen Projektantrag auf der Basis der Informationen, die im Rahmen eines Beratungsgesprächs gesammelt wurden, formuliert haben, wurden deutlich weniger unterschiedliche Aspekte des Forschungsdatenmanagements tatsächlich besprochen (siehe Abb. 2).

Dies lässt sich darauf zurückführen, dass das Verfassen eines Textabschnitts durch das Datenzentrum selbst durch die Erfahrungen und Expertise der Mitarbeitenden deutlich zielorientierter umsetzbar ist. Anfragende Forschende verfügen hingegen häufig noch über weniger Erfahrungen im Bereich Forschungsdatenmanagement und adressieren in selbst verfassten Textabschnitten auch FDM-Aspekte, die ggf. in anderen Abschnitten eines Förderantrags beschrieben werden sollten, oder im Rahmen einer Antragsstellung zunächst irrelevant sind. Sie müssen in einem Beratungsvorgang entsprechend mehr angeleitet werden.

Abb. 1: Aspekte des FDM, die beim Review eines Textabschnitts besprochen wurden
Abb. 1:

Aspekte des FDM, die beim Review eines Textabschnitts besprochen wurden

Abb. 2: Aspekte des FDM, die für die Verfassung eines Textabschnitts durch das Datenzentrum besprochen wurden
Abb. 2:

Aspekte des FDM, die für die Verfassung eines Textabschnitts durch das Datenzentrum besprochen wurden

Trotz der thematischen Unterschiede bezüglich der FDM-Themen und -Aspekte, die in beiden Sub-Bedarfskategorien besprochen werden, wird deutlich, dass in beiden Szenarien insbesondere die Archivierung von Forschungsdaten ein zentrales Thema ist (siehe Abb. 3 und Abb. 4). Aus der Verteilung sowie aus der Häufigkeit der Themen und Aspekte, die bei Beratungsvorgängen der FDM-Bedarfskategorie „Antrag“ eine Rolle spielen, lassen sich entsprechende Rückschlüsse ziehen, welche inhaltlichen Kompetenzen notwendig sind, um eine Antragsberatung und -unterstützung aus einer FDM-Perspektive durchzuführen, bspw. die Identifikation von geeigneten Repositorien-Lösungen, die Planung von Speicherroutinen während einer Projektlaufzeit sowie die Definition von passgenauen Kooperationen.

Zusätzlich zur formalen Beschreibung der Sub-Bedarfskategorien „Review eines Textabschnitts“ und „Verfassen eines Textabschnitts“ konnten jeweils zwei individuelle, prototypische Workflows zur Bedienung des FDM-Bedarfs „Antrag“ ausgearbeitet werden. Beide Workflows beginnen mit einem initialen Beratungsgespräch zwischen Forschenden und Datenzentrum. Im Szenario, dass die/der Forschende bereits einen Textabschnitt zum Forschungsdatenmanagement verfasst hat, wird dieser schließlich dem Datenzentrum zugeschickt, welches dann eine Kommentierung vornimmt (siehe Anhang Abb. 1). Sofern das Datenzentrum selbst einen Textabschnitt zum Forschungsdatenmanagement für die Forschende oder den Forschenden verfasst, geschieht dies i. d. R. auf der Basis der gesammelten Informationen aus dem Beratungsgespräch sowie des bisher verfassten Antragstextes (siehe Anhang Abb. 2).

4.2.2 FDM-Bedarfskategorie „Archivierung“

In 25 von 90 Beratungsprotokollen wurde die FDM-Bedarfskategorie „Archivierung“ von Forschungsdaten identifiziert. Innerhalb dieser Beratungsvorgänge konnten viele verschiedene Informationen und Aspekte identifiziert werden, die einen Einfluss auf die Bedienung des Bedarfs „Archivierung“ haben, bzw. diesen beschreiben (siehe Abb. 5)

Neben grundsätzlichen Informationen wie bspw. Angaben zu den zu archivierenden Datentypen und -formaten, Einheitsangaben, also Informationen zur Speicher- und Mengengröße von Forschungsdaten sowie diskutierte Archivierungs- und Speicherorte, sind vor allem auch die Bedingungen, die bei einem Archivierungsprozess berücksichtigt werden sollen, von zentraler Bedeutung. Diese werden i. d. R. von den Forschenden selbst formuliert und umfassen neben rechtlichen Rahmenbedingungen bspw. auch Zugriffsregelungen und Nutzungsbedingungen.

Abb. 3: Häufigkeit von FDM-Aspekten bei der Sub-Bedarfskategorie „Review eines Textabschnitts“
Abb. 3:

Häufigkeit von FDM-Aspekten bei der Sub-Bedarfskategorie „Review eines Textabschnitts“

Abb. 4: Häufigkeit von FDM-Aspekten bei der Sub-Bedarfskategorie „Verfassen eines Textabschnitts“
Abb. 4:

Häufigkeit von FDM-Aspekten bei der Sub-Bedarfskategorie „Verfassen eines Textabschnitts“

Abb. 5: Aspekte, die einen Einfluss auf die Bedienung des FDM-Bedarfs „Archivierung“ haben
Abb. 5:

Aspekte, die einen Einfluss auf die Bedienung des FDM-Bedarfs „Archivierung“ haben

Abb. 6: Beschreibungsmodell für die Bedarfskategorie „Archivierung“ in Bezug auf den Datentyp Audiodaten_Sprache
Abb. 6:

Beschreibungsmodell für die Bedarfskategorie „Archivierung“ in Bezug auf den Datentyp Audiodaten_Sprache

Darüber hinaus konnten verschiedene Maßnahmen identifiziert werden, die vorbereitend entweder durch die Forschenden selbst oder das Datenzentrum durchgeführt werden mussten, um einen Archivierungsprozess umzusetzen. Während Maßnahmen der Forschenden in diesem Zusammenhang insbesondere auch Aspekte der Datenvorbereitung umfassen, übernimmt das Datenzentrum, neben der aktiven Archivierung von Forschungsdaten, vor allem auch Einschätzungen vor und spricht Empfehlungen bezüglich einer Archivierungsstrategie aus.

In allen Beratungsvorgängen, in denen die Bedarfskategorie „Archivierung“ identifiziert wurde, konnte mindestens eine Angabe zu Datentypen, welche archiviert werden sollten, festgestellt werden. Entsprechend wurden die Beratungsprotokolle der Bedarfskategorie „Archivierung“ nach den verschiedenen Datentypen geordnet. Die relevanten Informationen und Aspekte, die die Bedarfskategorie beschreiben, wurden schließlich auf die jeweils genannten Datentypen gemappt. Auf diese Weise konnte für jeden zu archivierenden Datentyp ein individuelles Beschreibungsmodell entwickelt werden.

So konnte bspw. neben generellen Informationen bezüglich der zu archivierenden Datenformate sowie des Archivierungsortes und Maßnahmen des/der Forschenden und des Datenzentrums u. a. sichtbar gemacht werden, dass bei der Archivierung von Audiodaten, welche zum Zweck der Sprachdokumentation aufgenommen wurden (Audiodaten_Sprache), insbesondere auch restriktive Zugangskontrollen zu den Forschungsdaten eine zentrale Bedingung darstellen (siehe Abb. 6).

Neben der Entwicklung eines formalen Beschreibungsmodells für die Bedarfskategorie „Archivierung“ konnte auch hier ein erster prototypischer Workflow zur Bedienung des Bedarfs entwickelt werden (siehe Anhang Abb. 3): Nach einem ersten, initialen Beratungsgespräch evaluiert das Datenzentrum i. d. R., welches Repositorium für die Archivierung und Ablage der Forschungsdaten geeignet ist. Dabei wird zunächst nach einer fachspezifischen Lösung gesucht; sollte es allerdings kein entsprechendes Angebot in der Versorgungslandschaft geben, werden generische Lösungen gesucht. In diesem Zusammenhang wird im gegebenen Workflow unterschieden, ob die entsprechende Infrastruktur vom beratenden Datenzentrum selbst oder einer externen Institution betrieben wird. Im ersteren Fall übernimmt schlussendlich das Datenzentrum die Archivierung, im letzteren Fall werden die Forschungsdaten entweder an die externe Institution übergeben oder durch self-archiving durch die Forschenden selbst archiviert.

5 Fazit

Die einheitliche Protokollierung von FDM-Beratungsgesprächen und -vorgängen bietet grundsätzliche Möglichkeiten zur Auswertung von FDM-Bedarfen. Durch die in diesem Beitrag beispielhaft illustrierte, qualitative Analyse von Beratungsprotokollen können nicht nur FDM-Bedarfskategorien sichtbar gemacht, sondern auch inhaltlich beschrieben werden. Auf diese Weise kann einerseits eine FDM-Bedarfslandschaft orientiert an den tatsächlichen Bedarfen von Forschenden formal beschrieben werden, andererseits ist es auch möglich, bedarfsorientierte, spezifische Kompetenzprofile und Workflows für die Bedienung einzelner FDM-Bedarfe und die passgenauere Ausrichtung von FDM-Services auf dieselben abzuleiten. Die damit einhergehende Messbarkeit von Forschungsdatenmanagement erlaubt es zusätzlich, FDM-Servicestrukturen auf ihre Sinnhaftigkeit hin zu überprüfen. Darüber hinaus kann eine solche Messbarkeit zu Berichtszwecken und zur Begründung der Arbeit eines Datenzentrums oder einer FDM-Kompetenzstelle gegenüber Universitäten und Forschungseinrichtungen herangezogen werden.

Autoreninformationen

Anhang

Anhang 1: Beispielhaft protokollierter Beratungsvorgang

Generelle Metainformationen zum Beratungsvorgang

Kurztitel

Hanna Hoffmann, BeispielProjekt

Institut/Fachrichtung

Institut für Linguistik, UzK

Aktenzeichen

2019-01-04_Hoffmann_Institut-für-Linguistik_Antrag_Metadatenschema

Kontakt/Ansprechpartner*in

Hanna Hoffmann,

Eckdaten

Projektphase: (ab ovo, in vita, post mortem)

PI(s): Prof.‘in Dr. Erika Musterfrau

Laufzeit: 3 Jahre

Förderung: DFG

Beteiligte Mitarbeiter*innen: Hanna Hoffmann (WMA), 2x SHK

Beschreibung und Dokumentation eines konkreten Beratungsgesprächs

Beratungsgespräch, 04. Januar 2019

Protokoll

(PH, JB, BM), 07.04.2019

Weitere Teilnehmende

/

Anfrage

Antragsunterstützung DFG

Metadatenschema audio-visuelle Sprachdaten

Vorhaben und Anfrage:

Im BeispielProjekt sollen im Rahmen von Feldforschung alltägliche Gespräche auf Schwäbisch aufgenommen und in Bezug auf Prominenzrelationen untersucht werden.

Das Projekt befindet sich in der Antragsphase und benötigt Unterstützung bei der Planung und Beschreibung des FDM im Antrag.

Für einen professionellen Umgang mit den gesammelten Daten bedarf es eines entsprechenden Metadatenstandards.

#optional#

Daten

(erwartete) Arten: *.wav, *.pdf, *.txt

(erwartete) Quantität: ca. 60 GB

Sonstiges: /

System

Typ: /

Ausgesprochene Empfehlungen und definierte Arbeitspakete

Ausgesprochene Empfehlungen durch das DCH

Geeigneter Metadatenstandard CMDI Verweis auf CMDI-Maker (http://cmdi-maker.uni-koeln.de/)

Arbeitspakte

Anfragende*r:

  • Übersendung der entsprechenden Abschnitte des Antrags ans DCH (erfolgt 07. Jan. 2019)

  • CMDI-Maker testen

DCH:

  • Entwicklung und Formulierung einer Strategie zum Umgang mit FD im Projekt (erfolgt 24. Jan. 2019)

Feedbackschleife: 01. Februar 2019

Abbildungserläuterungen (nicht Teil des Beitrags)

Anhang Abbildung 1: Prototypischer Workflow zur Sub-Bedarfskateogorie „Review eines Textabschnitts“

Anhang Abbildung 2: Prototypischer Workflow zur Sub-Bedarfskateogorie „Verfassen eines Textabschnitts“

Anhang Abbildung 3: Prototypischer Workflow zur Bedarfskateogorie „Archivierung“

About the author

Patrick Helling

Patrick Helling

Published Online: 2022-11-09
Published in Print: 2022-11-08

© 2022 bei dem Autor, publiziert von De Gruyter.

Dieses Werk ist lizensiert unter einer Creative Commons Namensnennung 4.0 International Lizenz.

Downloaded on 24.9.2025 from https://www.degruyterbrill.com/document/doi/10.1515/abitech-2022-0044/html
Scroll to top button