Zusammenfassung
Der Beitrag beschreibt den Zwischenstand und die Planungen des DFG- Projekts Hybrid Open Access Dashboards (HOAD), das seit Ende 2019 an der SUB Göttingen datenanalytische Hilfestellungen zur Kostentransparenz des Erwerbungsmodells für Bibliotheken und Informationseinrichtungen erarbeitet. Im Mittelpunkt stehen Anwendungen, mit denen Bibliotheken die Abdeckung und Qualität von Verlagsmetadaten und den Open-Access-Anteil von Zeitschriftenportfolios analysieren können. Dadurch entsteht eine Workflowunterstützung, bei der ausschließlich offene Metadaten verwendet werden, um ihrer Bedeutung beim Auffinden und Monitoring des Open Access gerecht zu werden.
Abstract
The article presents the DFG-funded project Hybrid Open Access Dashboards (HOAD). Based at the SUB Göttingen, it develops data analytics services targeted at monitoring the transparency of transformative agreements. The focus is on applications that allow libraries to analyze the coverage and quality of publisher metadata and the open access coverage of journal portfolios using open metadata and tools.
1 Einleitung
Mit der zunehmenden Verbreitung von Open-Access-Transformationsverträgen in Deutschland, bei denen Subskriptionsausgaben zugunsten von Publikationskosten umgewidmet werden, entstehen neue Bedarfe, um die Wirksamkeit des Erwerbungsmodells zu bewerten. Während es in Deutschland mit dem „Open Access Monitor“ des Forschungszentrums Jülich[1] mittlerweile ein frei zugängliches Instrument gibt, mit dem sich eine Steigerung des Open-Access-Anteils in Deutschland insbesondere aufgrund des Open-Access-Publizierens in hybriden Journalen beobachten lässt,[2] fehlt es nach wie vor an belastbaren Daten über den Stand der Open-Access-Transformation auf der Ebene von Journalen und Verlagsportfolios. Angesichts der gegenwärtigen komplexen Finanzierungsströme für wissenschaftliche Zeitschriften und des weiterhin exponentiellen Wachstums wissenschaftlicher Literatur[3] bleibt ohne eine solche Gesamtsicht unklar, inwiefern bundesweite Transformationsverträge zur Umgestaltung des Geschäftsmodells wissenschaftlicher Subskriptionszeitschriften in den Open Access beitragen.
Neben der finanziellen Dimension ist die Auffindbarkeit von Open-Access-Artikeln eine Herausforderung für die Kostentransparenz von Open-Access-Transformationsverträgen.[4] Dank solcher Rahmenverträge haben Bibliotheken und Informationseinrichtungen mittlerweile einen Hebel, um umfangreiche Metadatenanforderungen verlagsseitig einzufordern.[5] Damit lässt sich nicht nur sicherstellen, dass die institutionell geförderten Open-Access-Artikel als solche auffindbar und nachnutzbar sind. Vielmehr ermöglichen offene Metadaten über wissenschaftliche Informationsprozesse Alternativen zu kommerziellen Bibliometriedatenbanken und verlagsseitigen Data-Analytics-Services, welche die derzeitige Open-Access-Monitoringlandschaft prägen.[6]
Im Beitrag berichten wir über den Zwischenstand und die Planungen des DFG-Projekts Hybrid Open Access Dashboards (HOAD), das seit Ende 2019 als Workflow- und Fondsprojekt im Rahmen der Ausschreibung „Open Access Transformationsverträge“ des Förderprogramms „Überregionale Lizenzierung“[7] an der Niedersächsischen Staats- und Universitätsbibliothek Göttingen (SUB Göttingen) datenanalytische Hilfestellungen zur Kostentransparenz des Erwerbungsmodells für Bibliotheken und Informationseinrichtungen erarbeitet. Der Fokus des Vorhabens liegt dabei auf zwei miteinander verbundenen Monitoringaspekten, die laut einschlägigen Handlungsempfehlungen zwar wesentlich sind, auf die an den Einrichtungen jedoch häufig zugunsten institutioneller Publikations- und Kostenanalysen verzichtet wird: die Bemessung des Anteils wissenschaftlicher Artikel bezogen auf ein Verlagsportfolio und die Überprüfung verlagsseitiger Publikationsmetadaten hinsichtlich Vollständigkeit und Qualität. Die Besonderheit des Vorhabens ist es, dass ausschließlich offene Daten verwendet werden, um der wachsenden Bedeutung offener Metadaten beim Monitoring des Open Access Rechnung zu tragen.
2 Hintergrund: Open-Access-Transformationsverträge und Offene Metadaten
In den letzten Jahren haben insbesondere nationale Konsortien in Europa nationale Open-Access-Transformationsverträge mit Verlagen verhandelt, welche hauptsächlich hybride Journale umfassen.[8] Zwar haben sich dank der Verträge Abläufe bezüglich der Bezahlung der Open-Access-Publikation verbessert, doch sind interne Analysen nach wie vor herausfordernd, da transparente und vergleichbare Daten weitgehend fehlen.[9] Derartige Informationen sind nur spärlich vorhanden, weil Verlage und Einrichtungen solche Daten nicht systematisch erheben oder aber aufgrund von Vertraulichkeitsklauseln zurückhalten.[10]
Konsortien haben daher im Rahmen der ESAC-Initiative (Efficiency and Standards for Article Charges) und von Knowledge Exchange zusammengearbeitet, um die Anforderungen an Metadaten verlagsübergreifend zu standardisieren und auf eine Öffnung der Daten im Sinne einer verbesserten Auffindbarkeit und Nachnutzung von Open-Access-Artikeln hinzuwirken.[11] Insbesondere die DOI-Registrierungsagentur Crossref steht mittlerweile im Zentrum einschlägiger Standardisierungsanstrengungen, die nicht nur auf Open-Access-Transformationsverträge beschränkt bleiben. Prominente Beispiele sind The Initiative for Open Citations (I4OC)[12] und The Initiative for Open Abstracts (I4OA),[13] die offene Verlagsmetadaten unabhängig von der Art und Weise des Zugangs zu einem Artikel fordern.
Auch in Deutschland finden sich in nationalen Open-Access-Transformationsverträgen vermehrt Metadatenanforderungen, welche verlagsseitig zu erfüllen sind. Ein prominentes Beispiel sind die DEAL-Verträge zur bundesweiten Lizenzierung von Angeboten der großen Wissenschaftsverlage Wiley und Springer Nature.[14] Im Mittelpunkt steht Crossref, über deren Metadatenprofil die Verlage Wiley und Springer Nature Rechteinformationen zum Zugang und der Nachnutzung der Artikel in Form von Creative-Commons-Lizenzen sowie Autoren- und Förderinformationen je Artikel offen verfügbar machen sollen. Insbesondere Metadatenanforderungen bezüglich verlagsseitiger Versionen zum Text und Data Mining verdeutlichen, dass Konsortien mittels Open-Access-Transformationsverträgen zunehmend auf eine umfassende Nachnutzung von Open-Access-Artikeln hinwirken, welche auch die automatisierte Auswertung wissenschaftlicher Artikel umfasst.
3 Zwischenergebnisse und Befunde
3.1 Bestandsaufnahme und Anforderungsanalyse
Zu Beginn des Projekts wurden zehn Handlungsempfehlungen und Richtlinien sowie die beiden öffentlich zugänglichen DEAL-Verträge systematisiert. Insgesamt wurden 72 verschiedene Merkmale identifiziert. Am häufigsten genannt wurden die Lizenzierung von Open-Access-Artikeln unter der Creative-Commons-Variante CC BY sowie die öffentliche Einsehbarkeit der Verträge. Ein besonderes Augenmerk soll hier auf die Kostenstruktur mit ihrem Preismodell und die allgemeinen Vertragskonditionen gelegt werden. Darüber hinaus bestätigte sich die Forderung nach umfangreichen Metadaten, die der Verlag über Crossref bereitstellen soll, sowie die Verlinkung zwischen Artikeln und der ORCID.
Die Inhaltsanalyse haben wir ergänzt durch semi-strukturierte Interviews mit Konsortialführungspersonen aus der Arbeitsgemeinschaft Deutscher, Österreichischer und Schweizer Konsortien (GASCO). Ihnen wurde zu diesem Zwecke ein voll funktionaler Pilot eines interaktiven Dashboards präsentiert, welches das Aufkommen und die Entwicklung des hybriden Open Access für rund 5 000 Journale datenanalytisch aufbereitet (HOAD-Prototyp).[15] Es hat sich gezeigt, dass die Konsortialführungskräfte vor dem Verhandlungstermin mit den Verlagen das Dashboard für eine Übersicht des Publikationsaufkommens und der verschiedenen Lizenztypen eines Verlages nutzen würden. Hierbei ist die Intensität ihrer Nutzung von der Qualität der Informationen abhängig, die sie bereits von den Verlagen erhalten und auf anderen Plattformen wie Web of Science und dem Open Access Monitor eingesehen haben. Die Konsortialführungskräfte sind besonders an einer Darstellung der prozentualen Steigerung des hybriden Publizierens interessiert. Weitere Kennzahlen, die der Analysedienst nach Meinung der Interviewpartnerinnen und -partner darstellen sollte, sind der Transformationsgrad, das Publikationsaufkommen und das Umsatzvolumen. Schlussendlich waren sich die Konsortialführungskräfte darin einig, dass für die Gestaltung der Dashboard-Oberfläche eine transparente und einfache Sprache eingesetzt werden soll, um die Nutzung des Dashboards möglichst niedrigschwellig und attraktiv zu gestalten.
Im Sinne einer partizipativen Entwicklungsstrategie wurde während der virtuellen Open Access Tage 2020 ein Hands-On-Lab zur Unterstützung der Anforderungsanalyse durchgeführt. Hierbei wurde deutlich, dass die Überprüfung von Verlagsmetadaten durch Bibliotheken und Konsortien ein aufwendiger manueller Prozess ist und die Empfehlungen zum Verlagsreporting im Rahmen von Transformationsverträgen hingegen nur generisch gehalten sind. In der Konsequenz überprüfen nur wenige Einrichtungen die verlagsseitigen Metadaten der von ihnen geförderten Open-Access-Artikel.[16] Als Ergebnis des Hands-On-Lab entstand die Anforderung an ein Werkzeug, mit dem sich die Vollständigkeit und Qualität von Metadaten automatisch überprüfen lassen. Weil belastbare Metadaten über institutionell geförderte Open-Access-Artikel wesentlich sind, haben wir diese Anforderung im Projektverlauf aufgegriffen. Damit arbeitet das Projekt an zwei komplementären Datenanalysediensten, deren Entwicklungsstand wir nachfolgend beschreiben:
Open-Access-Metadatenschnelltest
Zeitschriftenportfolio-spezifische Dashboards über den Transformationsgrad hybrider Journale
3.2 Open-Access-Metadatenschnelltest

Screenshot E-Mail-Bericht Open-Access-Metadatenschnelltest
Beim Open-Access-Metadatenschnelltest[17] handelt es sich um einen datenanalytischen Webdienst, mit dem Bibliotheken und Konsortien automatisch die Metadatenabdeckung und -qualität überprüfen können. Der Open-Access-Metadatenschnelltest erlaubt die Überprüfung von bis zu 1 000 DOIs pro Session, welche über ein Webformular eingereicht werden. Das Werkzeug liefert ein Untersuchungsergebnis innerhalb von 30 Minuten per E-Mail (siehe Abbildung 1). Im Anhang der Ergebnis-E-Mail befindet sich zudem eine umfassende Datenanalyse als Exceltabelle, die je Artikel die ausgewerteten Metadaten beinhaltet.
Konkret ausgewertet werden die Metadaten der DOI-Registrierungsagentur Crossref, und zwar bezüglich
Creative-Commons-Lizenzierung bezogen auf die Verlagsversion,
Verweis auf verlagsseitige Angebote für das Text und Data Mining,
Förderinformationen,
ORCID,
offener Zitationsdaten und Abstracts.
Eine umfassende Vorabprüfung untersucht Aspekte bezogen auf die Registrierung der DOI und Metadaten sowie mögliche Duplikate bei der Einreichung.
Im Kontext von Antragstellungen im Rahmen des DFG-Förderprogramms „Open-Access-Publikationskosten“ wurden deutsche Bibliotheken und Informationseinrichtungen über Webinare eingeladen, den Open-Access-Metadatenschnelltest zu testen und in ihre Workflowüberlegungen einzubeziehen. Insgesamt haben bis Mai 2021 über 150 Bibliotheken und Informationseinrichtungen aus Deutschland, der Schweiz und Österreich den Schnelltest mindestens einmal verwendet. Aus der Testphase haben sich technische und funktionale Anforderungen ergeben, welche im Zuge der Vorbereitung eines internationalen Releases im November 2021 aufgegriffen wurden. Implementiert als quelloffenes R-Paket wird der Open-Access-Metadatenschnelltest über Clouddienste automatisch bereitgestellt. Als Datenquelle wird die REST-API von Crossref genutzt. Ein Rahmenvertrag als Teil des kostenpflichtigen Angebots Crossref Metadata Plus[18] sichert einen hochperformanten Zugang zur Webschnittstelle. Der E-Mail-Bericht wird aus einem parametrisierten R Markdown Notebook heraus generiert.
3.3 Zeitschriftenportfolio-spezifische Dashboards
Ziel des Projekts ist es, das prototypische Dashboard zugunsten spezifischer Dashboards für konsortiale Open-Access-Transformationsverträge in Deutschland weiterzuentwickeln. Seit Beantragung des Projekts 2018 hat sich die diesbezügliche Datenbasis verbessert, was zu einem umfassenden Re-Design des Prototypen hinsichtlich im folgenden ausgeführten Aspekte geführt hat.
3.3.1 Daten über Zeitschriftenportfolios
Während der Prototyp den Datensatz der Open APC Initiative nutzte, um hybride Journale zu identifizieren, kann die Projektentwicklung nun auf Zeitschriftenlisten spezifischer Open-Access-Transformationsverträge zurückgreifen. Ein Beispiel ist der offene Datensatz der im Open Access Monitor hinterlegten Journale, die einem Transformationsvertrag in Deutschland zugehörig sind (Pollack et al. 2021). International ist der offene Datensatz des Journal Checker Tools,[19] welches die Plan S Implementierung unterstützt, einschlägig. Dieser Datensatz stellt zudem eine Verlinkung zu den Daten des ESAC Registry her. Ergänzend zu Open APC wurden im Projektverlauf beide Datensätze hinsichtlich hybrider Journale je Zeitschriftenportfolio aufbereitet. Ein Schwerpunkt lag neben der Anreicherung um ISSN-Varianten auf der Identifikation sogenannter journal flips, also der Umstellung von hybriden Journalen in reine Open-Access-Zeitschriften bzw. von reverse flips, bei denen reine Open-Access-Zeitschriften ins hybride Modell überführt wurden.[20]
3.3.2 Publikationsdaten
Zur Ermittlung des Publikationsaufkommens nutzte bereits der HOAD-Prototyp Crossref-Metadaten. Aus Sicht des Datenmanagements hat sich allerdings das Retrieval über die Crossref API als wenig zielführend erwiesen. Gründe sind zum einen die wechselhafte Performance, zum anderen fehlende Abfrageparameter. Um diese Hindernisse zu umgehen, hat die SUB Göttingen den Crossref Metadata Plus Service abonniert. Es besteht dadurch Zugriff auf monatlich aktualisierte Dumps, die wir in ein cloud-basiertes Data Warehouse auf Grundlage von Google BigQuery überführt haben. Diese hochperformante Analyseumgebung wurde an der SUB Göttingen bereits für die Datenanalyse von Unpaywall-Daten genutzt,[21] welche damit ebenso als Datengrundlage zur Bemessung des Publikationsaufkommens in hybriden Journalen zur Verfügung stehen.

Designstudie HOAD Dashboard. Dargestellt wird das Publikationsaufkommen bundesweiter Open-Access-Transformationsverträge
3.3.3 Implementierung
Die Dashboards werden mittels der statistischen Programmiersprache R implementiert. Im Gegensatz zur Pilotentwicklung, die als Shiny-App entwickelt wurde, welche das Deployment über einen spezielle Webserver notwendig macht, sollen die Dashboards als statische Webseiten implementiert werden. Mittels parametrisierter R Markdown Notebooks werden portfolio- und zeitschriftenspezifische Sichten automatisch generiert. Interaktive Auswertungsmöglichkeiten werden durch die Einbindung von Javascript-Funktionalitäten gewährleistet. Der Vorteil des Ansatzes ist, dass das Deployment der Dashboards etwa über GitHub Pages und damit ohne den Betrieb eines Servers möglich ist.
3.4 Transformationsverträge
Mittlerweile liegt eine Designstudie auf Grundlage der Daten über Zeitschriftenportfolios des Open-Access-Monitors vor. Abbildung 2 zeigt eine Gesamtsicht auf 18 Portfolios nationaler Open-Access-Transformationverträge in Deutschland mit hybriden Journalen. Die Gesamtsicht illustriert neben der Anzahl der Journale je Portfolio auch die Anzahl der Artikel, die die Journale insgesamt veröffentlicht haben. Im Drei-Jahreszeitraum 2018–2020 publizierten die Journale rund 1,9 Millionen Artikel, wobei rund 10 % der Artikel im hybriden Open Access verfügbar gemacht wurden. Rund 11 % der Artikel sind ausschließlich über Open-Access-Repositorien (Green OA) frei zugänglich. Eine solche zeitschriftenbezogene Sicht auf das Open-Access-Publikationsaufkommen ergänzt damit institutionell angelegte Monitoringansätze, welche auf den Open Access-Anteil einer Einrichtung abzielen.
4 Diskussion und Ausblick
Bis zum Ende des HOAD-Projekts im November 2022 ist die Finalisierung und das Ausrollen der vertragsspezifischen Dashboards angedacht. Es ist beabsichtigt, dass die Abdeckungs- und Qualitätsmetriken des Schnelltests in die Dashboards einfließen. Dadurch ergänzen sich die beiden Anwendungen. Wir beobachten zudem mit großem Interesse vielfältige Aktivitäten im Kontext Offener Metadaten, welche seit der Ankündigung der Einstellung von Microsoft Academic[22] an Dynamik gewonnen haben. Im Fokus als zusätzliche Datenquelle zum Monitoring der Kostentransparenz von Open-Access-Transformationsverträgen stehen dabei insbesondere die Arbeiten von Our Research[23] und auf europäischer Ebene der OpenAIRE Research Graph.[24] Zudem gibt es erste Verlage, die neben Publikationsmetadaten auch artikelbezogene Informationen zur Rechnungslegung im Hinblick auf Open-Access-Artikel veröffentlichen.[25]
Die datenanalytischen Arbeiten werden im Projektverlauf durch die Entwicklung eines Geschäftsmodells zum Betrieb der Anwendungen ergänzt. Dadurch wird eine belastbare Entscheidungsgrundlage darüber geschaffen, unter welchen Voraussetzungen sich Projektarbeiten nach Ende der Förderung fortsetzen lassen.
© 2022 Najko Jahn, Maximilian Held, Henrieke Walter, Nick Haupka, Kristine Hillenkötter, publiziert von De Gruyter.
Dieses Werk ist lizensiert unter einer Creative Commons Namensnennung 4.0 International Lizenz.
Articles in the same Issue
- Titelseiten
- Editorial
- Fachbeiträge
- Nationalbibliothek Luxemburg – ein ambitioniertes Bauprojekt
- Die Erweiterung der Unithèque in Lausanne – eine Vision
- Die neue Stadtbibliothek Dornbirn – ein öffentliches Wohnzimmer als Wissens- und Ideenraum
- #JLUoffline. Der Cyber-Angriff auf die Justus-Liebig-Universität Gießen im Dezember 2019
- Die Verwaltung elektronischer Ressourcen mit Open Source Systemen – neue Möglichkeiten und Herausforderungen
- HOAD: Data Analytics für mehr Transparenz bei Open-Access-Transformationsverträgen
- Informationsmanagerin gesucht – Die Rolle wissenschaftlicher Bibliotheken in der Forschungsberichterstattung in Deutschland
- Tagungsbericht
- Databases for 2080 – Preserving database content for the long term
- Nachrichten
- Nachrichten
- Produktinformationen
- Produktinformation
- ABI Technik-Frage
- Wie kann ich Daten aus einem Digitalisierungsprojekt mit Normdaten anreichern?
- Rezensionen
- Giles Clark, Angus Phillips: Inside book publishing. Sixth Edition. London/Abingdon,Oxon/New York, NY: Routledge, 2019. – XXI, 396 S., Ill. – ISBN 978-1-138-57438-0. £ 96,00; 978-1-138-57791-6. £ 27,99; 978-1-351-26572-0 E-Book: £ 27,99
- Veranstaltungskalender
- Veranstaltungskalender
Articles in the same Issue
- Titelseiten
- Editorial
- Fachbeiträge
- Nationalbibliothek Luxemburg – ein ambitioniertes Bauprojekt
- Die Erweiterung der Unithèque in Lausanne – eine Vision
- Die neue Stadtbibliothek Dornbirn – ein öffentliches Wohnzimmer als Wissens- und Ideenraum
- #JLUoffline. Der Cyber-Angriff auf die Justus-Liebig-Universität Gießen im Dezember 2019
- Die Verwaltung elektronischer Ressourcen mit Open Source Systemen – neue Möglichkeiten und Herausforderungen
- HOAD: Data Analytics für mehr Transparenz bei Open-Access-Transformationsverträgen
- Informationsmanagerin gesucht – Die Rolle wissenschaftlicher Bibliotheken in der Forschungsberichterstattung in Deutschland
- Tagungsbericht
- Databases for 2080 – Preserving database content for the long term
- Nachrichten
- Nachrichten
- Produktinformationen
- Produktinformation
- ABI Technik-Frage
- Wie kann ich Daten aus einem Digitalisierungsprojekt mit Normdaten anreichern?
- Rezensionen
- Giles Clark, Angus Phillips: Inside book publishing. Sixth Edition. London/Abingdon,Oxon/New York, NY: Routledge, 2019. – XXI, 396 S., Ill. – ISBN 978-1-138-57438-0. £ 96,00; 978-1-138-57791-6. £ 27,99; 978-1-351-26572-0 E-Book: £ 27,99
- Veranstaltungskalender
- Veranstaltungskalender