Home Repositorien als Tools für ein umfassendes Forschungsdatenmanagement
Article Open Access

Repositorien als Tools für ein umfassendes Forschungsdatenmanagement

Am Beispiel von PHAIDRA an der Universitätsbibliothek Wien
  • Susanne Blumesberger

    Leitung Abteilung Repositorienmanagement PHAIDRA-Services, Bibliotheks- und Archivwesen, Universitäts-bibliothek, Universitätsring 1, A-1010 Wien, Österreich

    EMAIL logo
Published/Copyright: December 8, 2020

Zusammenfassung

Der Beitrag soll zeigen, inwieweit Repositorien eine Rolle beim Forschungsdatenmanagement spielen und welche Möglichkeiten und Herausforderungen damit verbunden sind. Der Umgang mit Daten hat sich in den letzten Jahren aufgrund der technischen und gesellschaftspolitischen Bedingungen geändert. Das hat Einfluss darauf, wie Repositorien gesehen und verwendet werden. Am Beispiel des Repositoriums PHAIDRA der Universität Wien kann diese Entwicklung von einem reinen Datenspeicher bis zu einem gut integrierten Tool in einer forschungsunterstützenden Umgebung nachvollzogen und beschrieben werden.

Abstract

This article is intended to show the extent to which repositories play a role in research data management, and what opportunities and challenges associated with it. In recent years, the handling of data has changed due to technical but also socio-political conditions. This has an influence on how repositories are seen and used. Using the example of the repository of the University of Vienna, PHAIDRA, this development from pure data storage to a well-integrated tool in a research supporting environment can be understood and described.

1 Einleitung

Die Krise um Covid-19 hat gezeigt, dass es sehr rasch zu einer nicht plan- und vorhersehbaren Änderung des täglichen Lebens kommen kann. Universitäten stellen auf Notbetrieb um, Bibliotheken schließen landesweit und es kommt plötzlich zu einer Reduktion der Informationsversorgung mit analogen Medien. In dieser Situation ist es hilfreich auf digitale Medien, die sicher archiviert, rasch und möglichst kostenlos verfügbar sind, zugreifen zu können. Repositorien wurden und werden genau zu diesem Zweck aufgebaut. Dort sind im besten Fall Daten aller Art wie Bücher, Texte, Video- und Audiofiles, Lehr- und Lernressourcen sicher gespeichert und mit entsprechenden Lizenzen versehen, damit andere Personen sie auch rechtskonform weiterverwenden und nachnutzen können. Abgesehen von diesen grundsätzlichen Anforderungen, sind Repositorien auch ein wichtiges Werkzeug im Forschungsdatenmanagement. Dafür benötigt man mehr als einfach ein funktionierendes technisches System, wichtig ist auch eine umfassende Unterstützung beim Datenmanagement für Forschende, passende Lösungen für unterschiedliche Anforderungen bei der Speicherung, Archivierung und Visualisierung anzubieten und als Schnittstelle zu anderen Bibliotheksbereichen zu fungieren, beispielsweise zu Forschungsinformationssystemen damit die Daten nicht mehrmals eingegeben werden müssen. Der Beitrag soll vor allem anhand des Repositoriums PHAIDRA[1] der Universität Wien zeigen, wie dies gelingen kann, aber auch, wo es Grenzen und Hürden gibt.

2 PHAIDRA, das Repositorium der Universität Wien

Als 2007 an der Universitätsbibliothek Wien ein Projekt startete, das sich zum Ziel gesetzt hatte, ein Repositorium mit Langzeitarchivierungsfunktionen für die gesamte Universität aufzubauen, war nicht abschätzbar, welche Tätigkeitsfelder sich daraus in Zukunft entwickeln würden. Nachdem für die technische Umsetzung die Entscheidung für das Open-Source-Produkt „Fedora“ gefallen war, folgte ein Jahr Planung der Universitätsbibliothek gemeinsam mit dem Zentralen Informatikdienst der Universität Wien. Gemeinsam erfolgte eine intensive Recherche nach Anforderungen, es wurden möglichst viele Universitätsmitarbeiter*innen aus unterschiedlichen Fachdisziplinen eingebunden und die Software an die Bedürfnisse der Universität Wien, die mit ca. 100 000 Angehörigen – davon knapp 90 000 Studierende –, nicht nur sehr groß, sondern auch fachspezifisch sehr heterogen ist, angepasst. Genau ein Jahr nach Projektstart, am 16.4.2008, ging das Repositorium[2] PHAIDRA online. Von Anfang an gab es zwei klare Richtlinien:

  1. PHAIDRA sollte allen Angehörigen der Universität Wien, also auch allen Studierenden offen stehen, alle durften Objekte, die für sie archivierungswürdig waren und für die sie die Rechte hatten, hochladen und

  2. es durfte nichts mehr gelöscht werden.

Die Metadaten, die Beschreibungen, die die Forscher*innen selbst eintragen bzw. bei einem Bulk-Upload hochladen lassen, können jedoch von den Eigentümer*innen der Daten, d. h. von der Person, die das Objekt hochgeladen hat, immer wieder verändert und ergänzt werden. Bei Bedarf erhalten die Forscher*innen Unterstützung beim Eintragen der Metadaten, die immer im Netz auffindbar bleiben, auch wenn die Objekte gesperrt sind.

Die Entscheidung, PHAIDRA auch für Studierende zu öffnen war zwar recht mutig und ungewöhnlich, stellte sich aber als praktikabel und richtig heraus, da bis heute keine missbräuchliche Verwendung des Repositoriums zu beobachten ist. Die zweite Richtlinie, die die Nichtlöschbarkeit eines Objekts betrifft, wird, wie weiter unten beschrieben, zurzeit überdacht.

Kurze Zeit später folgte die Möglichkeit, Zweitveröffentlichungen von Publikationen über eine spezielle Eingabemaske hochzuladen, es entstand das Institutionelle Repositorium u:scholar,[3] das technisch gesehen, ein Teil von PHAIDRA ist, und das ebenfalls sämtlichen Angehörigen der Universität Wien zur Verfügung steht. Die vergebenen Lizenzen werden bei u:scholar vor der endgültigen Archivierung von Bibliotheksmitarbeiter*innen einzeln geprüft und mit den Vorgaben der Verlage verglichen. So werden Rechtsverletzungen ausgeschlossen.

Die Erwartungen der Betreiber*innen waren nach dem Go-Live von PHAIDRA entsprechend groß, wurden jedoch zum Teil zunächst enttäuscht. Weder Forscher*innen noch Lehrveranstaltungsleiter*innen nutzten das neue System vorerst sehr intensiv. Es dauerte eine Weile bis nach zahlreichen Schulungen, Präsentationen und Roadshows sowie durch Mundpropaganda PHAIDRA und u:scholar bekannter geworden waren. Erst nach einiger Zeit sahen die Forscher*innen die Vorteile, die man mit einem Repositorium hat, das die eigenen Daten und Publikation mit einer permanenten Signatur versieht und sicher speichert. Nun war es plötzlich möglich, den eigenen Forschungsoutput und den der anderen jederzeit aufzurufen und zu zitieren, digitalisierte Objekte, Texte, Videos, Audiofiles, Bilder und Daten jeglicher Herkunft und Art zusammenzufügen und auch anderen – wenn gewünscht weltweit – zur Verfügung zu stellen. Im August 2020 sind in PHAIDRA mehr als 53 500 Bilder gespeichert, über 9 600 Bücher, mehr als 6 400 Artikel und über 7 300 Textdokumente. Die 1 800 Videos und 660 Audiofiles wurden vermehrt in den letzten Jahren hochgeladen, und auch die bisher archivierten 1 260 Forschungsdatensätze kamen erst in der letzten Zeit hinzu.

So heterogen die Universität Wien fachlich ist, so unterschiedlich haben auch die Wissenschaftler*innen aufgrund ihrer speziellen Forschungsmethoden in den jeweiligen Disziplinen PHAIDRA in die Forschungsprozesse integriert. Stark genutzt wurde das Repositorium zunächst vor allem von der Universitätsbibliothek Wien selbst. Durch das Projekt EOD,[4] E-Books on Demand, war eine beachtliche Anzahl an wertvollen historischen Büchern bereits gescannt worden und konnte in einem eigens dafür kreierten Bookviewer,[5] der in PHAIDRA für hochgeladene Bücher angeboten wird, der Öffentlichkeit Open Access präsentiert werden. Nach einer intensiven Bewerbungswelle von PHAIDRA begannen einige Forschungsprojekte, das Repositorium rege zu nutzen, um einen großen Bestand an neu digitalisierten Objekten, wie etwa Glasplattendias, die bereits vom Verfall bedroht waren, langfristig zu sichern. Auch an anderen Institutionen Österreichs und im Ausland, allen voran an der Universität Padua, war man auf PHAIDRA aufmerksam geworden und bat um einen Kooperationsvertrag.[6] Daraus entwickelte sich sukzessive ein derzeit 20 Institutionen umfassendes Netzwerk.[7] Langsam erkannten die Wissenschaftler*innen die Vorteile von PHAIDRA, das von Beginn an als Forschungsdatenrepositorium konzipiert war und es wurden im Laufe der Zeit vermehrt Forschungsdaten archiviert. Vor allem die erhöhte Sichtbarkeit und Sicherheit des eigenen Forschungsoutputs boten einen großen Anreiz, die Ergebnisse in PHAIDRA zu stellen.

Das System folgt der 2014 verabschiedeten Open Access Policy[8] der Universität Wien, jedes hochgeladene Objekt ist per Default sichtbar, kann aber sofort auf unterschiedliche Benutzer*innenkreise eingeschränkt werden. Wenn zum Beispiel aus rechtlichen Gründen Open Access nicht in Frage kommt, können die Uploader*innen jederzeit den Zugriff auf das Objekt auf die gesamte Universität, auf Institute, Personengruppen oder Einzelpersonen einschränken und auch wieder öffnen. Dann bleiben lediglich die Beschreibungen der Objekte, die Metadaten, weltweit offen und sichtbar. Wichtig war von Anfang an, dass PHAIDRA eine den heutigen FAIR-Prinzipien entsprechende Forschung ermöglicht. Danach müssen die Daten findable (auffindbar), accessible (zugänglich), interoperable (austauschbar) und reusable (wiederverwendbar) sein.[9] Um Daten wiederverwenden zu können, ist es unverzichtbar, sie mit Lizenzen zu versehen, die die Möglichkeiten der Nachnutzung eindeutig bestimmen. Derzeit wird in PHAIDRA neben den Creative-Common-Lizenzen – ab CCBY 2.0-Lizenz auch die Public-Domain-Marke und die GNU-Lizenz für Computerprogramme angeboten.[10] Die Nutzer*innen wählen die geeignete freie Lizenz aus, können sie aus juristischen Gründen im Nachhinein nicht mehr verändern. Es gibt aber die Möglichkeit, „keine Lizenz“ auszuwählen, was bedeutet, dass das hochgeladene Objekt im Rahmen des Urheberrechts verwertet werden darf. Dieser Prozess der Lizenzierung wird regelmäßig in Schulungen und bei Einzelbesprechungen erklärt, bei speziellen Fragestellungen kann juristische Expertise herangezogen werden.

Im Nachhinein war es eine gute Entscheidung, für das Repositorium eine Open-Source Software zu nutzen und nach Anforderungsanalysen das Repositorium darauf aufzubauen, denn Änderungen wie die derzeitige Umgestaltung der Eingabemaske können schnell und unabhängig von kommerziellen Anbietern umgesetzt werden. Die Erfahrung beim Aufbau des Systems und die Software selbst, die Open Source zur Verfügung steht, werden bereitwillig mit Interessent*innen geteilt.

3 PHAIDRA als Teil des Forschungsdatenmanagements an der Universität Wien

Das Bibliotheksteam und die Kolleg*innen vom Zentralen Informatikdienst haben früh begonnen, auf PHAIDRA aufbauende Services zu entwickeln. Diese umfassen Hilfestellungen beim Hochladen von Objekten, z. B. über ein dem Projekt angepasstes Bulk-Upload-Tool, Unterstützung beim gesamten Datenmanagement inklusive der sonstigen Angebote am ZID der Universität Wien für das Speichern und Teilen von Dokumenten, wie Shares und die Beratung beim Ausfüllen von Datenmanagementplänen. Dennoch war es nicht einfach, diese Angebote schnell und flächendeckend zu kommunizieren. Die Größe und die Heterogenität der Universität Wien[11] erschweren eine rasche und direkte Kommunikation mit jenen Zielgruppen, die das System auf unterschiedliche Art und Weise nutzen. Man kann grob zwischen den Anwender*innen aus der Verwaltung, der Lehre und der Forschung unterscheiden, wobei eine genaue Differenzierung nötig ist. Zu den Daten aus der Verwaltung zählen beispielsweise historische Studierendenakte oder Bestände aus dem Universitätsarchiv wie Senatsakten oder Studienkataloge, beispielsweise Informationen über promovierte Frauen vor 1923, die offen und frei zugänglich archiviert werden können.[12] Verwaltungsdokumente können jedoch Informationen enthalten, die nur für den internen Gebrauch gedacht sind, da sie personenbezogene oder sensible Daten beinhalten und deshalb gesperrt werden müssen. In vielen Fällen dürfen die Beschreibungen der jeweiligen Objekte nicht sichtbar sein, sämtliche Metadaten müssen ausgeblendet werden, eine Forderung, die außerhalb von PHAIDRA in einem internen System realisiert werden musste.

Bei manchen Objekten, zum Beispiel bei Daten aus einem laufenden Forschungsprojekt ist es wichtig, eine Embargofrist anzugeben, das heißt, dass Objekte aus rechtlichen Gründen für eine bestimmte Zeit für die Öffentlichkeit gesperrt werden müssen, danach aber frei zugänglich sind. Dies wurde in PHAIDRA von Anfang an mitbedacht, jedes Objekt kann von der Person, die es hochgeladen hat (Owner), jederzeit mit einer Frist versehen werden. Nach Ablauf dieser Frist sind sie automatisch frei verfügbar.

Daten, die während des Forschungsprozesses entstehen und/oder für die Forschung benötigt werden, bedürfen einer genaueren Betrachtung. Grundsätzlich können als Forschungsdaten alle Objekttypen wie beispielsweise Bilder, Texte, Bücher, Videos, Audiofiles, 3D-Objekte usw. gelten. Dabei lassen sich digitalisierte Objekte und Born-digital-Objekte unterscheiden, die mit unterschiedlichen Metadaten versehen werden können. Dies hat wiederum Auswirkungen auf die Wahl des jeweiligen Metadatenschemas in den Repositorien. Für PHAIDRA wurde entschieden, Dublin Core, Datacite oai_dc[13] oai_openaire[14] und das LOM-Schema zu verwenden. Für den Metadatenaustausch mit OpenAIRE,[15] Europeana[16] und dem Kulturpool[17] werden die Pflichtmetadatenfelder aus Dublin Core herangezogen (dc:title, Titel des Objekts; dc:description, Beschreibung; dc:language, Sprache des Objekts; dc:contributor, Rolle/n; dc:rights, Lizenz). Eine offen zugängliche API-Schnittstelle erlaubt den Austausch von Metadaten mit nationalen und internationalen Datenbanken. Technisch gesehen sind Forschungsdaten differenziert zu betrachten. Bei Born-digital-Objekten gibt es eine große Bandbreite an Formaten, die nur zum Teil für die langfristige Verfügbarkeit geeignet sind. Werden Objekte wie etwa Karten, Briefe, Bücher oder Videoaufnahmen digitalisiert, ist es möglich, mehr Einfluss auf das empfohlene Format für die digitale Langzeitarchivierung zu nehmen und als Repositorienbetreiber*in schon im Vorfeld der Digitalisierung Unterstützung bei der Formatauswahl anzubieten. Eine technische Herausforderung stellen Speicherung und das Verfügbarhalten sehr großer Dateien im Repositorium dar, das Verwalten einer Vielzahl an kleinen Einheiten auch. Für diese Fälle und die langfristige Verfügbarkeit von Datenbanken wird an Lösungen gearbeitet.

Anfänglich nahmen Studierende das Angebot PHAIDRA meist nur zögerlich an, das ändert sich jedoch, sobald sie in ein Forschungsprojekt eingebunden werden bzw. ihre Abschlussarbeit schreiben. Deshalb werden verstärkt Schulungen im Bereich Datenmanagement für Studierende angeboten.

3.1 Differenziertes Forschungsdatenmanagement

Für Forschende ist die nachhaltige Nutzung ihrer Daten sehr wichtig geworden, nicht zuletzt aufgrund der Fördergeber, die die finanziellen Mittel, die aus Steuergeldern stammen, sparsam einsetzen müssen und deshalb darauf achten, dass einmal erhobene Forschungsdaten nachgenutzt werden und nicht neu erhoben werden müssen. Dafür wird die passende Infrastruktur benötigt. Repositorien sind ein Teil davon. Neben technischen, rechtlichen und ethischen Fragen, die sich bei jedem Projekt, das forschungsrelevante Daten archivieren möchte, stets neu stellen, ist auf gesellschaftliche Entwicklungen, auf Veränderungen in Lehre und Forschung, bei den Fördergebern, im Umgang mit den Medien usw. zu achten. Die Erfahrungen haben gezeigt, dass eine gut funktionierende Kommunikation und Interaktion zwischen den Bibliotheksmitarbeiter*innen, den Techniker*innen und den Anwender*innen hinsichtlich des Forschungsdatenmanagements unerlässlich ist. Dazu benötigen sie nicht nur technisches Basiswissen, sondern auch einen Einblick in den aktuellen Wissenschaftsbetrieb. Hier kommt das Konzept von Datastewards und Datachampions zum Tragen, das an manchen Universitäten bereits umgesetzt wird und das an der Universität Wien derzeit konzipiert wird.[18]

3.2 Rechtliche und ethische Fragen im Forschungsdatenmanagement

Vor allem bei aktuellen Forschungsdaten gibt es hinsichtlich der rechtlichen Bestimmungen ein breites Spektrum, wie und wem sie zur Verfügung gestellt werden dürfen. Bei Messdaten, bei denen es im juristischen Sinn keine Urheber*innen gibt, bestehen in den seltensten Fällen rechtliche Bedenken gegen einen offenen und freien Zugang. Anders sieht es jedoch aus, wenn man beispielsweise Bilder frei über Repositorien anbieten möchte. Hier muss nicht nur darauf geachtet werden, dass die Rechte der Fotograf*innen berücksichtigt werden, sondern auch die der abgebildeten Personen. Bei Texten müssen Rechte bei den Urheber*innen bzw. bei den Nachlassverwalter*innen oder beim Verlag eingeholt werden. Bei Ton- und Videoaufnahmen kann es noch schwieriger werden, da meist mehrere Personen am Entstehen des Werkes beteiligt waren. Nicht immer lassen sich diese rechtlichen Fragen eindeutig lösen, deshalb kann es vorkommen, dass Forschende ihre Objekte nicht frei zugänglich machen. Umfrageergebnisse enthalten sensible Daten und sind deshalb mit der nötigen Umsicht zu behandeln, es müssen Einverständniserklärungen eingeholt, die Daten vor der Publikation pseudonymisiert bzw. anonymisiert werden. Da die Policy[19] von PHAIDRA erlaubt, Objekte auf einen definierten Benutzer*innenkreis einzuschränken, – wenn nötig mit einer Embargofrist – steht einer Archivierung in PHAIDRA in den meisten Fällen nichts entgegen.

Zu den rechtlichen Bestimmungen kommen zum Teil ethische Fragen hinzu. Wie geht man beispielsweise mit Interviews um, die vor 30 Jahren geführt wurden und für die man damals die Einverständniserklärung eingeholt hat – in einer Zeit ohne weltweite Verbreitungsmöglichkeit durch das Internet? Damals waren die Folgen der technischen Weiterentwicklung weder für den oder die Interviewer*in noch für den oder die Interviewpartner*in absehbar. Ist diese Person heute nicht mehr erreichbar, stellt sich die Frage, ob es ethisch vertretbar ist, das Interview frei ins Netz zu stellen. Informationen, die andere Menschen aufgrund ihrer politischen Einstellung, ihrer ethischen Zugehörigkeit, ihrer Vergangenheit usw. gefährden würden, müssen mit Vorsicht behandelt werden. Diskussionen gibt es bei der Archivierung von Bildern, die menschliche Überreste zeigen. Vor allem im Umgang mit sensiblen Daten und bei rechtlichen Fragen ist in den letzten Jahren ein deutliches Mehr an Reflexion zu erkennen. In Schulungen und Beratungsgesprächen bieten wir Hilfe an. Allerdings steht eine allgemeingültige Lösung noch aus. Der enge Kontakt mit den Forschenden und das Kennenlernen ihrer Bedürfnisse haben dazu geführt, dass es bei PHAIDRA ein Weiterdenken bezüglich der technischen Angebote für das Forschungsdatenmanagement gab, in Form der Bereitstellung von Speicherplatz oder das Nutzen von GitLab, einer Webanwendung zur Versionsverwaltung für (Software-)projekte etwa. Diese zusätzlichen Angebote sollen mit den Anforderungen der Projekte mitwachsen, denn nahezu jedes Projekt hat einen anderen Bedarf und daher ist Flexibilität gefragt.

3.3 Repositorien für die Lehre und für Hochschulschriften

Daten, die in der Lehre verwendet werden, können aus unterschiedlichen Zeiten, Fachgebieten und Kontexten stammen. Sie werden entweder mit freien Lizenzen und für alle nutzbar zur Verfügung gestellt oder müssen den Studierenden in einem geschlossenen System angeboten werden. Universitäten wie die Universität Wien fördern die Erstellung und Archivierung von Open Education Resources, die in PHAIDRA zur Verfügung gestellt werden. Wenn diese Offenheit aufgrund rechtlicher Bestimmungen nicht möglich ist, stehen den Studierenden die E-Learning Plattform Moodle oder eine interne Datenbank namens UNIDAM zur Verfügung. UNIDAM basiert auf der Software easydb der Firma Programmfabrik und wird vom PHAIDRA-Team mitbetreut. Die Datenbank wird vor allem für Bilddaten verwendet, die mittels eines eigens vergebenen Accounts Lehrenden und Studierenden für Lehrzwecke bereitsteht.

Hochschulschriften, die in Repositorien langfristig abrufbar sein sollen, bedürfen einer besonderen Aufmerksamkeit. Hier sind Universitätsgesetze zu beachten, die genau regeln, wie die Arbeiten archiviert werden dürfen, welche Schritte die Urheber*innen und welche die Betreiber*innen der Systeme unternehmen müssen. Abschlussarbeiten durchlaufen vor der Archivierung meist einen Plagiatsprüfungsprozess, der in den Gesamtworkflow der Archivierung miteingebunden ist. Eventuell muss es den Urheber*innen ermöglicht werden, Abstracts und andere Metadaten zu verstecken und die Arbeiten zu sperren. Die Gründe können vielfältiger Natur sein: eine später geplante Publikation der Arbeit, Verträge mit Firmen oder mit der Abschlussarbeit verbundene Patente. Der Ablauf ist an österreichischen Universitäten unterschiedlich, an der Universität Wien wird derzeit die Migration der Hochschulschriften von einem externen Server auf PHAIDRA durchgeführt, eine Arbeitsgruppe, die sich aus Expert*innen aus dem Bibliotheks- und IT-Bereich zusammensetzt, begleitet diesen Prozess.

4 Neue Forschungsfelder – neue Herausforderungen für das Forschungsdatenmanagement

Doch nicht nur die Datenmanagementpläne sensibilisieren für den Umgang mit Daten, sondern auch andere Faktoren, wie die technische Weiterentwicklung und die veränderte Arbeitsweise der Forschenden. Das Bearbeiten neuer Themen und damit die Produktion neuartiger Daten zählen dazu. Die rasante Entwicklung des Smartphones zu einem vollwertigen Computer, den man ständig mit sich trägt, macht das Filmen und Fotografieren einfacher und weniger aufwändig. Ob die Formate, in denen Bilder und Filme dann gespeichert werden, immer für die Langzeitarchivierung günstig sind, ist jedoch fraglich. Neue Forschungsfelder entstanden etwa in der Germanistik und in der Kommunikationswissenschaft, rund um diverse soziale Netzwerke. Für eine geplante Langzeitarchivierung diverser Postings sind technische Fragen relevant: Welches Datenformat wählt man, vor allem aber rechtliche und ethische Fragestellungen. Das Mediennutzungsverhalten von Kindern und Jugendlichen wird derzeit häufig untersucht.[20] Will man diese Daten nachnutzbar machen, muss man während der Vorbereitung der Studien einige Vorkehrungen treffen. All diese Entwicklungen haben einen signifikanten Einfluss auf die Angebote der forschungsunterstützenden Services, auch auf Repositorien.

5 Unterschiedliche Anforderungen – verschiedene Lösungen

Bei medizinischen Forschungen müssen Daten nach einem gewissen Zeitraum wieder gelöscht werden, das heißt PHAIDRA ist dafür nicht das geeignete System. Um weiterhin für alle Forschungsrichtungen attraktiv zu sein, wurde der Beschluss gefasst, PHAIDRA in Zukunft zweistufig zu betreiben und vor der endgültigen Langzeitarchivierung, bei der ein permanenter Link vergeben wird, eine Löschfunktion anzubieten.

Die Art und Weise, wie Daten archiviert werden, hat sich verändert bzw. beschleunigt. Ursprünglich war PHAIDRA für den Einzelupload von Objekten gedacht. Dies entspricht heute nicht mehr dem gewohnten Umgang mit Daten, die im Drag-and-Drop-Verfahren in Systeme hochgeladen werden können. Auch hier musste sich PHAIDRA weiterentwickeln. Den Forschenden stehen derzeit mehrere Möglichkeiten des Uploads zur Verfügung. Personen oder Forschergruppen, die eine große Anzahl von Objekten in PHAIDRA laden möchten, erhalten maßgeschneiderte technische Unterstützung, wie z. B. einen Bulk-Upload, die derzeit von Angehörigen der Universität Wien kostenlos in Anspruch genommen werden kann.

Um eine möglichst hohe Sichtbarkeit des Forschungsoutputs zu erreichen, sind die Metadaten immer öffentlich sichtbar, selbst wenn die Objekte gesperrt sind. Diese Vorgehensweise entspricht den FAIR-Prinzipien. In einigen Fällen ist diese Vorgehensweise jedoch kontraproduktiv – vor allem wenn es sich um hochkompetitive Forschungsfelder handelt, oder wenn vertrauliche Daten archiviert wurden. In diesen Fällen werden den Anwender*innen andere Speichermöglichkeiten, z. B. Server, die vom Zentralen Informatikdienst der Universität Wien (ZID) betreut werden, empfohlen. Die Erfahrung mit Repositorien hat gezeigt, dass nicht, wie anfangs fälschlicherweise angenommen, ein einziges Repositorium für alle Fälle ausreicht. Für Lehrzwecke wird zuzüglich zu Moodle und UNIDAM die Software GitLab angeboten. Für die Speicherung von Daten während eines Forschungsprozesses stehen universitätsinterne und den jeweiligen Bedürfnissen angepasste Cloudlösungen sowie Shares zur Verfügung. Sozialwissenschaftliche Daten sind bei AUSSDA[21] (Austrian Social Science Data Archive) gut aufgehoben. Im Unterschied zu PHAIDRA wird dort kein Selfarchiving angeboten, die Daten werden kuratiert.

Permanente Identifikatoren haben in den letzten Jahren an Bedeutung gewonnen. Forschende benötigen für ihre Publikationen und nicht zuletzt für ihre Karriere und die Fördergeber Digital Object Identifier (z. B. DOI). Neben den automatisch vergebenen PHAIDRA- und Handle-Links[22] können User vor oder nach der Archivierung der Objekte in PHAIDRA einen DOI beantragen.[23] Aus mehreren Gründen, unter anderem weil Objekte, die in PHAIDRA hochgeladen werden, bereits einen DOI haben können, werden diese (noch) nicht automatisch vergeben.

Die Verwendung von ORCID setzt sich ebenfalls durch. Für den österreichischen Wissenschaftsfonds FWF ist eine ORCID-ID für Antragsteller*innen seit 2016 verpflichtend.[24] Mithilfe von PHAIDRA wurde die Möglichkeit geschaffen, diesen Identifier einzutragen und den Eintrag mit dem ORCID-Profil zu verlinken, eine automatische Datenübernahme von und nach ORCID ist geplant.

6 Zukünftige Herausforderungen

Die spezifischen Bedürfnisse jener, die die Daten zur Verfügung stellen bzw. nutzen, führen zum Teil zu großen Herausforderungen bei den Repositorienbetreiber*innen. Der Datenmanagementplan, der seit einiger Zeit von einigen Fördergebern verpflichtend eingeführt wurde, der EU beispielsweise, hat dazu geführt, dass sich die Forschenden intensive Gedanken darüber machen, wie sie mit ihren Daten während und nach Abschluss der Forschungsprojekte umgehen. Konkrete Fragen nach Zuständigkeiten, rechtlicher Klärung, ethischen Fragen, aber auch nach technischen Anforderungen oder ob überhaupt für alle Daten eine langfristige Sicherung erforderlich oder erlaubt ist, helfen den Betreiber*innen der Repositorien. Diese erfahren im besten Fall früh, welche Art von Daten und Metadaten in welchen Formaten und nach welchen Standards gespeichert werden sollen, wie groß die Dateien sind, um welches Datenvolumen es sich handelt, wer zuständig für die Daten ist, ob es technischer Adaptierungen bedarf usw.

Je eher die Repositorienbetreiber*innen von den Forschungsvorhaben und den detaillierten Plänen für die Daten erfahren, desto besser können sie sich auf die Anforderungen einstellen und Vorbereitungen treffen. Die Aufgaben, die ein universitäres Repositorium heute erfüllen muss, erweitern sich ständig und müssen immer wieder an neue Vorgaben von außen, an Bedürfnisse der Forschenden oder andere Systeme angepasst werden.

Eine Herausforderung wird in Zukunft der Umgang mit der Datenflut sein, denn durch die fortlaufende Digitalisierung sind mehr Daten im Netz verfügbar. Wir alle, ob Nutzer*innen, Anbieter*innen von Daten oder Bibliothekar*innen werden Wege finden müssen, uns in diesem großen Pool an Informationen zurechtzufinden. Suchmaschinen bzw. Metasuchmaschinen über mehrere Repositorien hinweg werden dabei immer wichtiger und sind für PHAIDRA geplant. Daten müssen rasch aufgefunden werden, das verlangt neben einer guten technischen Basis hochqualitative und maschinenlesbare Beschreibungen der Daten.

Für die Umsetzung der FAIR-Data-Prinzipien, werden mehrere Komponenten benötigt, unter anderem die Maschinenlesbarkeit der Daten und Beratung im Bereich der Metadaten, beispielsweise bei der Auswahl von geeigneten Metadatenschemata. Viele, die selbst Daten anbieten, unterschätzen den Wert der Metadaten, die für die Visualisierung der Daten bzw. für den Austausch mit anderen Systemen, unverzichtbar sind. Die von den Fördergebern zum Teil bereits vorgeschriebenen Datenmanagementpläne werden von den Forschenden oft als Hürde gesehen, erweisen sich in der Praxis meist als wirksames Instrument, um sich den eigenen Forschungsprozess zu verdeutlichen und sich Strategien für das Datenmanagement zu überlegen. Die Sensibilität gegenüber der Frage, was man wie veröffentlichen darf bzw. worauf man achten sollte, ist glücklicherweise gewachsen, es besteht eine gesteigerte Nachfrage nach Unterstützung, z. B. bei Fragen nach Pseudonymisierung oder Anonymisierung. Die Forschenden sind mehr denn je daran interessiert, ihre Daten mit anderen auszutauschen, dabei wird Unterstützung angeboten.

7 Mögliche Strategien für ein effektives Forschungsdatenmanagement

Um fit für ein umfangreiches Forschungsdatenmanagement zu bleiben, bedarf es einiger Überlegungen. Netzwerkbildungen erleichtern den Austausch bei Herausforderungen. Das Netzwerk für Repositorienmanager*innen (RepManNet) hat sich beim Lösen von Problemen bzw. Gestalten von Workflows als hilfreich erwiesen.[25] Netzwerke, die gemeinsam mit Forschenden aufgebaut wurden, erweisen sich als nützlich. So hat das Netzwerk „Nachhaltige Softwareentwicklung code4research“[26] an der Universität Wien dazu geführt, dass sich Forschende aus unterschiedlichen Fachbereichen, vor allem aus den Digital Humanities regelmäßig treffen und gemeinsam Strategien überlegen, wie man beispielsweise Datenbanken auf lange Sicht archivieren und zugänglich machen kann. Durch die insgesamt 20 Partnerinstitutionen von PHAIDRA[27] ist durch viele gemeinsame Erfahrungen neues Wissen entstanden. Durch internationale Projekte wie Europeana und nationale wie „e-infrastructures austria“[28] und „e-infrastructures austria plus“[29] wurde eine Expertise aufgebaut und mit anderen geteilt. Der kontinuierliche Kontakt mit den Fördergebern lässt frühzeitig Trends erkennen und ermöglicht es, rasch auf Veränderungen bei den Vergaberichtlinien zu reagieren. Hervorgehoben werden muss der enge Kontakt zu den Forschenden, denn durch sie gewinnen wir Einblick in ihre Arbeit und können unsere Angebote danach richten. Absolut grundlegend ist natürlich die kontinuierliche Zusammenarbeit mit der IT. Nur so können Projekte rasch und effektiv umgesetzt und das Repositorium weiterentwickelt werden.

Zusammenfassend lässt sich sagen, dass Repositorien ein wichtiges Werkzeug für effizientes Datenmanagement sind. Sie müssen, ebenfalls wie die zugehörigen Services, mit den Bedürfnissen der Forschenden mitwachsen und sich entwickeln. Genau hier liegen die Herausforderungen. Was zeigen also unsere Erfahrungen?

  1. Zusammenarbeit: Eine kontinuierliche Zusammenarbeit von Forschenden mit Techniker*innen und Bibliothekar*innen ist wichtig. Forscher*innen müssen aktiv in Überlegungen rund um das Forschungsdatenmanagement und den Aufbau von Repositorien miteinbezogen werden.

  2. Ressourcen: Es müssen genügend Personal – und finanzielle Ressourcen zur Verfügung stehen, um ein stabiles und du umfassendes Forschungsdatenmanagement garantieren zu können.

  3. Flexibilität: Eine hohe Flexibilität der vorhandenen Systeme wie der Repositorien ist nötig. Diese müssen bei Bedarf immer wieder angepasst werden können. Das betrifft die Technik und die Metadatenschemata.

  4. Diversität: Für unterschiedliche Anforderungen müssen verschiedene technische Lösungen bereitgestellt werden, neben der Langzeitarchivierung sollten Löschmöglichkeiten oder ausreichend Speicherplatz für Forschende vorhanden sein.

  5. Rahmenbedingungen: Es müssen zusätzlich geeignete Rahmenbedingungen geschaffen werden, beispielsweise Policies, die Abläufe regeln.

  6. Anpassung: Das Repositorium und die angebotenen Services müssen in die bereits vorhandene Systemlandschaft eingebettet werden.

  7. Kommunikation: Vor allem in großen und heterogenen Institutionen ist es wichtig, die Services entsprechend zu bewerben.

  8. Offenheit: Offen zugängliche Schnittstellen ermöglichen den raschen Austausch mit anderen Systemen.

  9. Netzwerke: Die Zusammenarbeit mit Forschungsdatenmanager*innen aus anderen Intuitionen ermöglicht gemeinsame Aktivitäten und einen regen Austausch.

  10. Usability: Nicht zuletzt entscheidet die Usability, ob das Repositorium angenommen wird oder nicht. Das heißt, dass die Repositorienbetreiber*innen bzgl. der technischen und gesellschaftlichen Entwicklungen auf dem Laufenden bleiben müssen.

  11. User*innenorientierung: Es ist wichtig zu wissen, was die User*innen an Technik und an Services benötigen.

  12. Neugierde: Interesse an den Forschungen in den jeweiligen Fachdisziplinen, an den neueren technischen und gesellschaftspolitischen Entwicklungen haben, um passende Services anzubieten.

  13. Bodenhaftung: Man sollte einschätzen können, was wann mit welchen Mitteln umgesetzt werden kann, denn leere Versprechungen verärgern die User*innen.

Über den Autor / die Autorin

Dr. Susanne Blumesberger , MSc

Leitung Abteilung Repositorienmanagement PHAIDRA-Services, Bibliotheks- und Archivwesen, Universitäts-bibliothek, Universitätsring 1, A-1010 Wien, Österreich

Literatur

Blumesberger, Susanne (2017): „Herausforderungen für Repositorien!?“ Tagung anlässlich 10 Jahre Phaidra an der Universität Wien. In: Mitteilungen der VÖB, 70 (3/4), 373–76. Verfügbar unter https://doi.org/10.31263/voebm.v70i3.1960.Search in Google Scholar

Blumesberger, Susanne (2018): Bibliothek und Digitalität am Beispiel der Universitätsbibliothek Wien. In: Germanistik digital. Digital Humanities in der Sprach- und Literaturwissenschaft, hg. v. Ingo Börner, Wolfgang Straub und Christian Zolles. Wien: Facultas, 199–211.Search in Google Scholar

Blumesberger, Susanne (2018): Neue Anforderungen – viele offene Fragen. Zu den vielfältigen Rollen von Repositorien am Beispiel der UB Wien. In: Repositorien in Österreich – Status quo und (zukünftige) Herausforderungen, hg. v. Susanne Blumesberger, Andreas Ferus, Christian Kaier und Gertraud Novotny. VÖB Mitteilungen, 71 (1), 149–61. Verfügbar unter https://doi.org/10.31263/voebm.v71i1.Search in Google Scholar

Blumesberger, Susanne (2019): „Druckt ihr eh alles aus was in PHAIDRA ist?“ Die Abteilung Repositorienmanagement PHAIDRA-Services – ein Paradigmenwechsel. In: Menschen im Aufbruch. Universitätsbibliothek und Archiv der Universität Wien im Selbstverständnis ihrer Mitarbeiter_innen. Festschrift für Maria Seissl, hg. v. Stefan Alker-Windbichler, Claudia Feigl, Christina Köstner-Pemsel, Thomas Maisel, Wolfgang Nikolaus Rappert, Pamela Stückler und Markus Stumpf. Göttingen: Vandenhoeck & Ruprecht, 269–72. Verfügbar unter https://doi.org/10.14220/9783737010986. Search in Google Scholar

Blumesberger, Susanne (2019): Das RepManNet – das österreichische Netzwerk für RepositorienmanagerInnen. In: Mitteilungen der VÖB, 72 (1), 16063. Verfügbar unter https://doi.org/10.31263/voebm.v72i1.2291.Search in Google Scholar

Blumesberger, Susanne; Ganguly, Raman (2019): Der Umgang mit heterogenen (Forschungs-)daten an einer wissenschaftlichen Bibliothek – Use Cases und Erfahrungen aus technischer und nicht technischer Sicht an der Universität Wien. In: Forschungsdaten – Sammeln, sichern, strukturieren. 8. Konferenz der Zentralbibliothek, Forschungszentrum Jülich, WissKom 2019, Jülich, Germany, 4 Jun – 6 Jun 2019, 193–200. Verfügbar unter http://hdl.handle.net/2128/22274.Search in Google Scholar

Eberhard, Igor; Kraus, Wolfgang (2018): Der Elefant im Raum. Ethnographisches Forschungsdatenmanagement als Herausforderung für Repositorien. In: Mitteilungen der VÖB, 71 (1), 41–52. Verfügbar unter https://doi.org/10.31263/voebm.v71i1.2018.Search in Google Scholar

Ganguly, Raman (2018): Nachhaltige Softwareentwicklung: code4research. In Mitteilungen der VÖB, 71 (1), 171–80. Verfügbar unter https://doi.org/10.31263/voebm.v71i1.2019.Search in Google Scholar

Hagmann, Dominik (2018): Überlegungen zur Nutzung von PHAIDRA als Repositorium für digitale archäologische Daten. In: Mitteilungen der VÖB, 71 (1), 53–69. Verfügbar unter https://doi.org/10.31263/voebm.v71i1.1974.Search in Google Scholar

Torggler, Andrea; Andrae, Magdalena (2018): Aus dem Leben einer/s Repman – ein Bericht aus dem österreichischen „Netzwerk für RepositorienmanagerInnen“. In: Mitteilungen der VÖB, 71 (1), 107–24. Verfügbar unter https://doi.org/10.31263/voebm.v71i1.1986.Search in Google Scholar

Online erschienen: 2020-12-08
Erschienen im Druck: 2020-11-30

© 2020 Susanne Blumesberger, publiziert von Walter de Gruyter GmbH, Berlin/Boston

Dieses Werk ist lizensiert unter einer Creative Commons Namensnennung 4.0 International Lizenz.

Articles in the same Issue

  1. Frontmatter
  2. Frontmatter
  3. Inhaltsfahne
  4. Schwerpunkt Videostreaming
  5. Themenschwerpunkt Video-Streaming – Editorial
  6. I. Video-Streaming in Bibliotheken und Zugang zum audiovisuellen Erbe
  7. Herausforderung Video-Streaming: Trends und Perspektiven für Öffentliche und wissenschaftliche Bibliotheken
  8. Checkliste für die Evaluierung von Video-Streaming-Angeboten in Bibliotheken
  9. Die Stadtbibliothek als Filmparadies
  10. Sicherung des audiovisuellen Erbes in Sachsen
  11. Memobase – Das Portal zum audiovisuellen Erbe der Schweiz
  12. II. Kooperation mit externen Anbietern von Video-Streaming-Dienstleistungen für Bibliotheken
  13. Video-Streaming in Bibliotheken: Herausforderungen und Chancen aus Anbietersicht
  14. AVA – europäische und internationale Arthouse- und Festivalfilme
  15. Perspektiven einer innovativen, kulturellen Filmarbeit
  16. nanoo.tv – Die Schweizer Filmplattform und Online-Mediathek für Bildung
  17. III. Filmarchive und Zugang zum Filmerbe
  18. Ein Filmarchiv im digitalen Wandel – Die Cinémathèque suisse
  19. Bilder neu bewegen – Streaming als Baustein einer ganzheitlichen Strategie zur Zugänglichmachung des filmischen Erbes im DFF – Deutsches Filminstitut & Filmmuseum
  20. Eine lohnende Mammutaufgabe – Rahmenbedingungen der digitalen Filmbenutzung im Bundesarchiv
  21. IV. Mediatheken öffentlich-rechtlicher Fernsehanstalten und Archivöffnung
  22. Die ARTE-Mediathek – Perspektiven der Zusammenarbeit im Bereich Film
  23. Ost- und West-Fernsehen der 1950er- und 1960er-Jahre in der ARD Mediathek
  24. Die zeit- und kulturhistorischen Videoarchive der ORF-TVthek
  25. Die Archivöffnung beim Schweizer Radio und Fernsehen SRF – Hintergründe, Metadaten, Strategie
  26. V. Video-Streaming in Lehre, Forschung und Entwicklung
  27. Videomining in historischem Material – ein Praxisbericht
  28. Improving the User Experience with Audiovisual Content: The Project “Europeana Media”
  29. Digitalisierung und filmwissenschaftliche Forschung
  30. Streaming für Forschende
  31. Streams are my reality. Der Online-Zugang zu Filmen aus Sicht der Filmwissenschaft
  32. Bibliothek des Jahres
  33. Die TIB: Mehr als eine Bibliothek
  34. Zukunftsgestalter 2020 (2)
  35. Data Literacy for Libraries – A Local Perspective on Library Carpentry
  36. Strategien
  37. Fixstern – Fokus – Vorsorge: Zielsetzungen und Grundelemente von Strategieprozessen in Bibliotheken
  38. Repositorien als Tools für ein umfassendes Forschungsdatenmanagement
  39. BOOKS FOR FUTURE: Die Zukunft gestalten – nachhaltig!
  40. Textmining
  41. Improving Access to Scientific Literature with Knowledge Graphs
  42. Bibliotheksbau
  43. Die Sanierung des Südflügels der Universitätsbibliothek Heidelberg (2016–2019)
  44. Weitere Beiträge
  45. Imperiales Erbe und Nationale Identität. Das Werden der Nationalbibliothek der Republik Österreich
  46. Digitalisierungsprojekt Bibliografie der Wiedergeburt Bulgariens in Sofia
  47. Meinung
  48. Öffentliche Bibliotheken als dritte Orte und Bildungsgerechtigkeit in Zeiten von Covid-19
  49. Jahresinhaltsverzeichnis 2020
Downloaded on 29.9.2025 from https://www.degruyterbrill.com/document/doi/10.1515/bfp-2020-2026/html
Scroll to top button