Home Digitalisierung und Digitale Bibliotheken – 25 Jahre Digitalisierung im Kontext der Deutschen Universitätsbibliotheken
Article Open Access

Digitalisierung und Digitale Bibliotheken – 25 Jahre Digitalisierung im Kontext der Deutschen Universitätsbibliotheken

  • Frank Klaproth

    Georg-August-Universität Göttingen, Niedersächsische Staats- und Universitätsbibliothek, Platz der Göttinger Sieben 1, D-37073 Göttingen

    ORCID logo EMAIL logo
Published/Copyright: July 6, 2022

Zusammenfassung

Dieser Beitrag liefert einen Einblick in die Entwicklungsphasen der Digitalisierung deutscher Universitätsbibliotheken und stellt dabei auch die Einflüsse primär technischer Disziplinen auf die Gestaltung von Digitalen Bibliotheken dar.

Abstract

This article provides an insight into the development phases of the digitization of German university libraries and presents the influence of primarily technical disciplines on the design of digital libraries.

1 Einleitung

Mitte der 1990er-Jahre hatten die deutschen Universitätsbibliotheken bereits eine sehr gute Digitalisierungsreife in ihrem Kernbereich der Informationserfassung, Recherche und Bereitstellung inkl. der Softwarelösungen für Bibliotheksnutzer erreicht. Zu der Zeit lag der Schwerpunkt der Digitalisierung in der Unterstützung der manuellen Erfassung von bibliografischen Metadaten analoger Materialien und Medien inkl. Verschlagwortungen und Klassifizierung sowie deren Austausch zwischen Standorten der Bibliotheken. Datenträger wie Schallplatten, Videotapes, Disketten und CD-ROMs waren Bestandteil der Medien. Die Metadatenhaltung erfolgte typischerweise in Lokalen und/oder zentralen Bibliothekssystemen, deren Erfassungsoberfläche den Katalogisierungsrichtlinien folgte. Der Datenaustausch wurde bereits seit längerem organisiert in Bibliotheksverbundstrukturen. Indexierungen von Daten bezogen sich auf bibliografische Metadaten und die Bereitstellung der Ergebnisse erfolgte über Katalogrechercheterminals für den Bibliotheksnutzer vor Ort sowie über den Online Public Access Catalogue (OPAC) zunächst noch per Telnet-Protokoll dann ab ca. 1995 per HTTP-Protokoll[1] und Webbrowser. Ein Wandel mit der Einfachheit des Ausbaus des World Wide Web im Internet zeichnete sich ab. Dieser Wandel erfasste auch die Universitätsbibliotheken.

2 Digitalisierungserkenntnis in Schritten

Mit Beginn und Ausbau von fachdisziplinspezifischen Webservern (ab Beginn 1994), noch auf Basis von NCSA HTTPd[2] und den dort vorgehaltenen primären digitalen Objekten (zunächst HTML-codierte Seiten, häufig mit GIF-Images), begann eine Diskussion und Entwicklung von vereinfachten Metadatenschemata zur Beschreibung und Kategorisierung für elektronische Onlineressourcen. Diese mündete 1994 in die Gründung der Dublin Core Metadata Initiative (DCMI)[3]. Eine international wegweisende Entwicklung, die sich im Weiteren auch auf die Aktivitätsfelder der deutschen Universitätsbibliotheken auswirkte. Der bisher vergebliche Versuch, ausgewählte Online-Ressourcen in den Katalogen der Bibliotheken mit Katalogisierungsrichtlinien in Einklang zu bringen, wurde nun, auch mithilfe von Mapping-tools oder Crosswalks zwischen dublin.core-Elementen und den klassischen Bibliotheksstandards, möglich. Es schlossen sich allerdings Fragen der schnell wachsenden Anzahl von digitalen Formaten und deren Beschreibungen sowie eindeutiger Identifikation von entweder leicht flüchtigen oder veränderbaren digitalen Online-Objekten an. Die reine Menge an neuen frei zugänglichen Onlineressourcen und dem gleichzeitigen Wunsch in den Bibliotheken das Wissen um diese Ressourcen strukturiert und möglichst klassifiziert an die Nutzer zu kommunizieren führte zu einer gänzlich neuen Diskussion. Mit der Erkenntnis hier ggf. selektiv vorgehen zu müssen und gekoppelt mit dem zeitgleich skizzierten Bild einer verteilten und komplett digitalen Bibliothek nach Tim Berners-Lee, begann eine Profilsuche der Universitätsbibliotheken. Hinzu kamen die sich schnell entwickelnden Suchmaschinentechnologien (damals noch AltaVista [4]1995, Inktomi [5]1996) basierend auf Metatag-Suchen, semistrukturierten Inhalten und dem Ziel vollautomatisiert große Teile des WWW zu indexieren und mit wenigen Schritten den Suchenden vermeintlich vollständige Trefferlisten anzuzeigen.

Auf der anderen Seite gab und gibt es in den Beständen der Universitätsbibliotheken z. T. große Mengen an analoger Information, die im Rahmen des deutschen Urheberrechts digitalisiert und zur Nutzung frei verfügbar gemacht werden können. Allerdings fehlte die Methodik und Prozesse für die Digitalisierung (vor allem für die Massendigitalisierung) sowie für die Bereitstellung der Daten.

Als Folge aus den obigen Situationen ergaben sich seitdem neue Herausforderungen und Chancen, für die Bibliotheken auch entlang neuer Technologien den Teil der Digitalen Bibliotheken zu erkunden und auszubauen.

3 Ausbildung von Komponenten der Digitalen Bibliotheken

3.1 Portale für die Wissenschaft

Mithilfe von Fördermitteln der Deutschen Forschungsgemeinschaft wurden bereits seit 1995 die Entwicklung von Portaltechnologien (mit Webis[6] zunächst basierend auf Apache httpd) gefördert, die thematische Online Fach Guides (SSGFIs[7], 1997) zum Ziel hatten. Diese zunächst händisch und intellektuell gepflegten sowie von wissenschaftlichen Fachpersonal mithilfe einer Fachcommunity kommentierten Guides basierten auf Linklisten und boten den WissenschaftlerInnen einen Einstieg in die Online-Fachressourcen. Ein weiterer Schritt, die jeweilige Fachcommunity mit Informationen zu versorgen, waren Portale der Virtuellen Fachbibliotheken (ViFas). Hierbei wurden z. B. Recherchen und Ergebnislisten aus den thematischen OPAC-Suchen und den Online Fachguides verschnitten. Zudem wurden Facettierungen wie z. B. Erscheinungsdatum und Materialart (gedruckt, online ...) mithilfe der technischen Schnittstellenanbindung einer verteilten Suche über mehrere Quellen (z. B. lokales Bibliothekssystem, Dokumentenrepository) hinweg ermöglicht, bspw. auf Basis der Retrievalprotokolle Z39.50[8] und SRU[9]. In den ViFas kommen Informationen zu verfügbaren Lizenzen und Allgemeine Informationen zu Veranstaltungen, Blogs o. ä. hinzu. Dafür werden häufig WebCMS-Systene wie z. B. TYPO3[10] oder Drupal[11] usw. genutzt.

Ab 2016 ist aufgrund der Einführung sogenannter Fachinformationsdienste (FID[12]) ein weiterer Wandel in den thematischen Portalzuschnitten, aber auch in der Ergänzung der Qualität der Services erfolgt. WissenschaftlerInnen und Fachcommunities erhalten mit Authentifizierungs- und Autorisierungsverfahren z. B. über Virtuelle Homeorganisationen per Single Sign On (SSO) und Shibboleth[13]-Verfahren deutschlandweit direkten Zugriff auf lizenzpflichtige Forschungsquellen. Dabei müssen sowohl die Universitätsinfrastrukturen (hier z. B. Verzeichnisdienste wie LDAP[14]) als auch die Angebots- und Dienststrukturen der Bibliotheken aufeinander abgestimmt bzw. automatisiert werden.

3.2 RetroDigitalisate für die Wissenschaft

Im Jahr 1997 schloss sich ein umfangreiches Programm zur Gestaltung und Aufbau einer Verteilten Digitalen Forschungsbibliothek in Deutschland an. Dabei wurden u. a. zwei Kompetenzzentren für die Retrodigitalisierung (MDZ[15] an der Bayrischen Staatsbibliothek in München und das GDZ[16] an der Niedersächsischen Staats- und Universitätsbibliothek in Göttingen) gefördert.

Bei der Digitalisierung der unterschiedlichen Materialien konnte auf Erfahrungen der amerikanischen Bibliotheken an den Universitäten Cornell, Harvard, Virginia sowie an der Library of Congress in Washington zurückgegriffen werden.

Eine Vielzahl von Retrodigitalisierungsvorhaben wurde über die Bibliotheksbestände hinweg durchgeführt, die sich der weiterentwickelten Digitalisierungsstandards (z. B. TIFF-Formate mit Metadaten, bestehend aus technischen Bilddaten als auch bibliografischen Metadaten, basierend auf XML/RDF[17]) der Zentren bedienten, um sowohl zeitliche Lücken (z. B. 15. oder 18. Jahrhundert) als auch thematische Lücken (z. B. Mathematica oder Zoologica) der digitalen Bestände zu schließen. Diese sind in einem Zentralen Verzeichnis digitalisierter Drucke (ZVDD[17]) gelistet.

Für die Verwaltung und Anzeige der wachsenden digitalen Dokumentensammlungen wurden erfahrene KooperationspartnerInnen auch aus dem privatwirtschaftlichen Sektor gesucht.

Es entwickelten sich somit Lösungen wie z. B. Agora oder Miless (später MyCore[18]), die bereits Java basierte Servlet-Technologien für die Präsentationschichten der Rechercheergebnisse einsetzten.

Der zunehmende Digitalisierungsanteil und Know-how-Anwuchs in den Bibliotheken führte bei gleichzeitiger Mittelstagnation bzw. Reduktion und breiterer Verfügbarkeit von Open-Source-Softwarekomponenten zu einer stufenweisen Lösung von möglichen Anbieterabhängigkeiten (vendor lock-in).

Es entstanden gepflegte Open-Source-Lösungen wie z. B. Goobi[19] (2004) und zuletzt kitodo[20] (2016) für die Abbildung und Steuerung eines kompletten Retrodigitalisierungsworkflows mit modernsten Softwaretechnologiestacks.

3.3 Suchmaschinen für die Wissenschaft

Mit Aufkommen der Webcrawler und Suchmaschinen, die einen hohen Grad der Integration in die Webbrowserfunktionalitäten und das Potential der Indexierung vieler digitaler Objekttypen besitzen, nahm das Bild einer globalen Digitalen Bibliothek Konturen an. Das Ziel, mit einer Suchanfrage in „allen“ verfügbaren Informationsquellen eine relevante Treffermenge als Antwort zu erhalten, klingt verlockend. Neben den Fragen der Relevanz, des Rankings, der Suchtiefe, der Menge, der Zeichensätze, der Semantiken ist dies oft nur domainspezifisch zu beantworten und somit auch in naher Zukunft nicht realistisch. Allerdings bietet die Technologie für Bibliotheken in Kopplung mit Erfahrungen von bibliografischen Indexsystemen eine sehr performante und gute Möglichkeit die Metadaten der digitalen Objekte zu indexieren. Und je nach Qualität der Metadaten auch Facettierungen und Browsing anzubieten, so dass Treffermengen qualifiziert eingegrenzt werden können. Ein sehr gutes Beispiel stellt die Entwicklung des 2004 gelaunchten Service Bielefeld Academic Search Engine (BASE[21]) dar. Der Service wird ständig mit Inhalten und tlw. Funktionen erweitert und bietet Zugriff auf Inhalte aus Repositorien, die nicht von den kommerziellen Suchmaschinen indexiert werden.

Aber auch Angebote wie Google Scholar[22] (2004 gelauncht) bietet mithilfe der Suchmaschinentechnologie und den zur Verfügung gestellten Metadaten und Volltexten sehr gute, sogar disziplinübergreifende Suchergebnisse.

3.4 Repositorien für die Wissenschaft

Mit wachsender Zahl an digitalen Publikationen und der Erzeugung von Forschungsdaten entstanden neben den Angeboten der Verlage, Initiativen aus den Fachdisziplinen und Bibliotheken heraus, diese Objekte in Online-Repositorien zu erfassen, zu klassifizieren und der Community und der Öffentlichkeit zugänglich zu machen. Die eingesetzten Softwareumgebungen basieren u. a. auf DSpace[23], EPrints[24], OPUS[25], PURE[26] usw. Eine gute Übersicht der weltweit betriebenen Repositorien findet sich im OpenDOAR[27] (gelaunched 2005) Verzeichnis. So sind laut OpenDOAR für Deutschland z. Z. 284 qualifizierte Repositorien gelistet. Die Repositorien bieten Schnittstellen, mit denen in Form des Open Access auf die Inhalte zugegriffen werden kann, entweder mithilfe einer eigenen Portalseite oder über die Integration in andere Portale und Suchmaschinen.

3.5 Virtuelle Forschungsumgebungen für die Wissenschaft

Um primär digitale Arbeitsergebnisse von WissenschaftlerInnen auch in einer kollaborativen digitalen Umgebung abzubilden, wurden virtuelle Forschungsumgebungen geschaffen. Bereits 2005 wurden dazu drei JISC geförderte Projekte von Michael Fraser[28] vorgestellt, die die Idee eines Virtual Research Environment (VRE) prototypisch umsetzen sollte. Dies wurde möglich, da sich die Web-Technologien und die Webstandards dergestalt weiterentwickelten, dass sich komplexe Aufgaben und Programmabläufe in einer Webbrowser Umgebung abbilden ließen. Andererseits erfordert dies auf der Serverseite entsprechend ausreichende Ressourcen wie z. B. Hauptspeicher, Plattenplatz und Bandbreite für den Netzwerkverkehr. Da sich auch diese Komponenten dynamisch weiterentwickelten, konnte z. B. 2011 ein Angebot in einen Forschungsverbund TextGrid[29] für die Geistes- und Kulturwissenschaften initialisiert werden. VREs nutzen mithilfe der Kombination bereits vorhandener technischer Lösungen sowie mithilfe von Datenschnittstellen Datenobjekte, die geändert, kommentiert oder gar neu geschaffen werden. Es werden unter Einsatz von Bearbeitungs- und Analysewerkzeugen auch Digitale Editionen gänzlich neu geschaffen. Universitätsbibliotheken erarbeiten dafür die passenden Softwarelösungen im Team mit den WissenschaftlerInnen.

3.6 Weitere Komponenten für die Wissenschaft

Hier ist vor allem die Archivierung (Langzeitarchivierung – LZA) der digitalen Daten zu nennen. Ein internationales Vorangehen im Bereich der Bibliotheken, insbesondere der Nationalbibliotheken mit ihren Sammlungsaufträgen führte 2004 in Deutschland zu einem BMBF geförderten Projekt „kopal“[30]. In einer Kooperation von Nationalbibliothek, Universitätsbibliothek, Universitätsrechenzentrum und Industriepartner wurde eine Lösung auf international basierenden LZA-Standards (Open Archival Information System – OAIS[31]) entwickelt. In der Nachfolge schlossen sich mehrere LZA-Projekte an. Zudem entwickelten sich weitere LZA-Lösungen sowohl kommerzieller Art Closed Source als auch Open Source basiert.

Eine weitere wichtige Kernkomponente stellt die Identifikation der digitalen Objekte dar.

Hier haben sich verschiedene Persistent-Identifier-(PID)-Systeme auf Basis der handle-Technologie und unter Einsatz von URN-Resolver etabliert, z. B. ePIC[32], DOI[33], DNB-URN Service[34]. So werden auf unterschiedliche Granularitätsebene von Objekten oder ganzen Sammlungen die PIDs vergeben. Die Stabilität und die langfristige Verfügbarkeit der PID-Services sind von entscheidender Bedeutung, weshalb sich auch Konsortien und Rechenzentren dafür zusammengeschlossen haben.

Volltexterzeugung, auch aus den digitalisierten analogen Vorlagen (Handschriften, Briefe, aber auch z. T. gedruckte Vorlagen), beschäftigt die Bibliotheken und Dienstleister schon seit den späten 1990er-Jahren. Nicht alle Materialien können zufriedenstellend automatisiert Volltext erfasst werden. Jedoch bietet ein Teil der Volltexte zusammen mit den anwachsenden originär digital verfügbaren Daten inzwischen ein Fundus an Forschungsmaterial. Hier müssen noch die Angebote für die Wissenschaft deutlicher über die Bibliotheken hinweg herausgearbeitet und im Dialog kommuniziert werden.

Es sei erwähnt, dass eine Professionalisierung im Bereich der Softwareentwicklung und Softwarebereitstellung an den Universitätsbibliotheken über die letzten Jahre stark zugenommen hat. Dies gelingt u. a. durch Kooperationen mit Unternehmen, in Community-Konsortien, aber auch durch konkrete Anwendung von gängigen Standards (z. B. ITIL[35]) und Methoden (z. B. SCRUM[36]), wie z. B. Nutzung von Softwarerepositorien (Github, Gitlab ...). Zudem nutzen Entwicklungen im Bereich der Digitalen Bibliotheken internationale Frameworks wie z. B. Fedora[37].

4 Fazit und Ausblick

Die Universitätsbibliotheken haben sich innerhalb der letzten 25 Jahre einem steten und zuletzt intensiveren und anhaltenden Wandel gestellt, aus einer Situation als Anbieter von Information (Beschaffung, Recherche, physikalischer Ausleihe, Rücknahme) kommend sind sie nun aktive Mitgestalter für Informationsstrukturen, sind nahe am Wissenschaftsprozess positioniert und haben sich als Entwickler von Softwarelösungen für Digitale Bibliotheken etabliert. Letzteres erfolgt tlw. vor und bei der Erzeugung von wissenschaftlichen Ergebnissen oder auch deren Zwischenprodukten. So kann z. B. die Rolle des Data Steward für die Einhaltung der Qualität der Daten und Metadaten anteilig oder ganz aus der Bibliothek heraus beigesteuert werden. Eine Softwareentwicklung und der Einsatz von agilen Entwicklungsmethoden sowie die Konzertierung von Hard- und Softwareumgebungen ist Teil der projektorientierten Vorgangsmodelle geworden. Die breitere und tiefergreifende Digitalisierung der Services für die Wissenschaft sowie stets neue Technologien im Bereich der Hard- und Software stellen Herausforderungen, aber auch neue Lösungsmöglichkeiten dar. Die Zahl der Komponenten für den Betrieb und Funktionserweiterung Digitaler Bibliotheken wächst stetig. Hier gilt es, den Serviceaspekt und die Nachhaltigkeit abgestimmt zusammen mit Partnern in den Fokus zu rücken. Dabei ist das Zusammenspiel von digitalen Infrastrukturanbietern, wie z. B. lokal, aber auch überregional agierenden Rechenzentren, Verbundzentralen, Medienzentren und Bibliotheken weiterhin der Schlüssel für die passende Gestaltung der Wissensinfrastrukturlandschaft.

Die Universitätsbibliotheken sind gut gerüstet, denn der angenommene Wandel wird als steter Prozess, die ersten Bibliotheken als aktiver Partner der Wissensinfrastruktur wahrgenommen und die Zukunft ganz im Sinne „Stets die NutzerIn, den Nutzen und den Service der Bibliothek im Blick“ gelebt.

Über den Autor / die Autorin

Frank Klaproth

Georg-August-Universität Göttingen, Niedersächsische Staats- und Universitätsbibliothek, Platz der Göttinger Sieben 1, D-37073 Göttingen

Literaturverzeichnis

Ahlers, T.; Enderle, W. (1997): Die DFG-Projekte WEBIS (SUB Hamburg) und SSG-Fachinformationen (SUB Göttingen. In: Bibliotheksdienst, 31(2). Verfügbar unter https://files.dnb.de/EDBI/deposit.ddb.de/ep/netpub/89/96/96/967969689/_data_stat/www.dbi-berlin.de/dbi_pub/bd_art/97_02_05.html.10.1515/bd.1997.31.2.216Search in Google Scholar

Godby, Carol Jean; Young, Jeffrey A.; Childress, Eric (2004): A Repository of Metadata Crosswalks. In: D-Lib Magazine, 10(12). Verfügbar unter https://dlib.org/dlib/december04/godby/12godby.html.10.1045/december2004-godbySearch in Google Scholar

Miller, James S. (1996): W3C and Digital Libraries. In: D-Lib Magazine, 2(11). Verfügbar unter https://www.dlib.org/dlib/november96/11miller.html.10.1045/november96-millerSearch in Google Scholar

Summann, F.; Lossau, N. (2004): Search engine technology and digital libraries – Moving from theory to practice. In: D-Lib Magazine, 10(9). Verfügbar unter https://doi.org/10.1045/september2004-lossau.Search in Google Scholar

Online erschienen: 2022-07-06
Erschienen im Druck: 2022-07-31

© 2022 Frank Klaproth, publiziert von Walter de Gruyter GmbH, Berlin/Boston

Dieses Werk ist lizensiert unter einer Creative Commons Namensnennung 4.0 International Lizenz.

Articles in the same Issue

  1. Frontmatter
  2. Frontmatter
  3. Inhaltsfahne
  4. Editorial
  5. Editorial
  6. Schwerpunkt: Bibliothekstechnologie
  7. Digitalisierung, Prozessorientierung und strategische Ausrichtung von zentralen Betriebseinheiten – Die Entwicklung von Bibliothek und Rechenzentrum am Beispiel von zwei konkreten Einrichtungen
  8. Library Technology – Between Local Tools and Global Solutions
  9. Repository Networks: Past, Present and Future
  10. Stand und Perspektiven bibliometriegestützter Open-Access-Services an Universitäten in Deutschland
  11. Repositorien und Forschungsinformationssysteme bilden keine Dichotomie
  12. Digitalisierung und Digitale Bibliotheken – 25 Jahre Digitalisierung im Kontext der Deutschen Universitätsbibliotheken
  13. IT-Organisation in Hochschulen und ihren Bibliotheken
  14. Inkubator für Demokratie
  15. Politische Bildung in Bibliotheken: Herausforderungen und Potenziale
  16. Urbanes Laboratorium Dokk1 in Århus – Kultur- und Demokratieförderung als Standortfaktoren
  17. Rezensionen
  18. Dahlkild, Nan; Larsen, Steen Bille (Hrsg.): Dansk Bibliotekshistorie. Band 1–2. Aarhus: Aarhus Universitetsforlag, 2021. Fest geb. Abb. ISBN 978-87-7184-513-6. 499,905 DKK/67,21 €. 1. Band: Biblioteker for de få. Tiden før 1920. 374 S. 2. Band: Biblioteker for alle. Tiden efter 1920. 416 S.
  19. Schlechter, Armin (Hrsg.): Gesammelt – zerstreut – bewahrt? Klosterbibliotheken im deutschsprachigen Südwesten. Stuttgart: Kohlhammer, 2021 (Veröffentlichungen der Kommission für geschichtliche Landeskunde in Baden-Württemberg. Reihe B: Forschungen: Bd. 226). VIII, 307 S., Farbtafeln, Schwarzweißabbildungen. ISBN 978-3-17-037425-6, 28,- €
  20. Hiller von Gaertringen, Julia; Probst, Veit; Stello, Annika; Syré, Ludger (Hrsg.): 250 Jahre ÖFFENTLICH. Die Badische Landesbibliothek 1771–2021. Karlsruhe, Bretten: Lindemanns, 2021. 240 S., Broschur, 61 Abb., ISBN 978-3-96308-134-7, 24,90 €
  21. Fürst zu Stolberg-Wernigerode, Philipp: Die Fürst zu Stolberg-Wernigerodesche Bibliothek. Zur Geschichte einer adeligen Büchersammlung, ihrer Zerschlagung und ihrer Wiedereröffnung. Frankfurt a. M.: Vittorio Klostermann, 2022. 160 und 50 ungezählte S., 89 €, ISBN 9783465045243
  22. Browndorf, Megan; Pappas, Erin; Arrays, Anna (ed.): The Collector and the Collected. Decolonizing Area Studies Librarianship. Sacramento, CA: Library Juice Press, 2021. 316 S.
Downloaded on 15.9.2025 from https://www.degruyterbrill.com/document/doi/10.1515/bfp-2022-0014/html
Scroll to top button