Zusammenfassung
VD 16, VD 17 und VD 18 erfassen als retrospektive Nationalbibliographie die Drucke des deutschen Sprachraums von 1500 bis 1800 und sind wichtige Werkzeuge für die Erforschung der europäischen Kulturgeschichte. Mit über 730.000 katalogisierten und rund 587.000 digitalisierten Titeln bieten sie großes Potenzial für Distant-Reading-Ansätze. Der Beitrag beschreibt die Herausforderungen und Perspektiven der Weiterentwicklung der drei VD mit ihren gewachsenen Datenbeständen. Die Zukunft der VD liegt im Aufbau eines zentralen Index und der Verbesserung der Daten und Beteiligungsstrukturen für eine forschungsfreundliche Nationalbibliographie der frühen Neuzeit.
Abstract
As retrospective national bibliography, VD 16, VD 17, and VD 18 all document printed works of German-speaking countries and regions between 1500–1800, and they have developed into vital tools for research on European cultural history. More than 730,000 catalogued and almost 587,000 digitalized titles are collected in these bibliographies, which also offer a huge potential for distant-reading approaches. In the paper, we outline challenges and prospects for the further development of these VD bibliographies and their historically collected data. The way forward for VD is the future development of a central index and enhancement of data quality and participation structures to create a research-friendly national bibliography for the Early Modern period.
1 Einleitung
Für viele Forschungsfragen in Bezug auf die europäische Kulturgeschichte sind die Druckerzeugnisse aus dem deutschsprachigen Gebiet die mit Abstand wichtigste Quelle. Bis 1700 wurden nicht weniger als ein Drittel aller Drucke in Europa im deutschsprachigen Gebiet produziert.[1] Ihre Verzeichnung in den drei VD-Bibliographien VD 16, VD 17 und VD 18 gehört zu den Großtaten der deutschen Altbestandsbibliotheken, die sich in jahrzehntelanger Arbeit einer deutschen Nationalbibliographie der frühen Neuzeit annähern und inzwischen über 730.000 Titel autoptisch erfasst haben, zu etwa 75 Prozent mit Volldigitalisaten verknüpft. Sowohl die Katalogisierung als auch die Digitalisierung im Rahmen der VD erfuhren eine umfangreiche Förderung durch die Deutsche Forschungsgemeinschaft.
Umfang der VD, Stand August 2024.
|
|
Titel gesamt (Schätzung) |
Titel aktuell |
Titel mit Digitalisat |
|
VD 16 |
120.000 |
108.311 |
71.994 |
|
VD 17 |
460.000[2] |
313.486 |
222.915[3] |
|
VD 18 |
600.000[4] |
314.937 |
291.754 |
Die VD sind zum unverzichtbaren Arbeitsmittel aller mit der frühen Neuzeit befassten Wissenschaften geworden. Das eigentliche Potenzial für die Forschung liegt jedoch nicht im „close reading“ der einzelnen bibliographischen Einträge und Digitalisate, sondern im „distant reading“ der noch vor Kurzem für die Forschung kaum vorstellbaren Menge an strukturierten Daten zum gedruckten Kulturerbe. Die VD-Nummern repräsentieren dabei Normdaten für die jeweiligen Titel oder – in der Modellierung von FRBR und RDA[5] – Manifestationen.
Dieser Beitrag versucht eine Bestandsaufnahme des Status Quo, eine Analyse der Desiderate und entwirft eine Roadmap für einen systematischen, forschungsorientierten Ausbau der VD, der auch mit Blick auf die anstehende Vervolltextung dringlich ist.[6]
Nach drei Entwicklungsphasen kann OCR-D eine OCR-Softwareumgebung für die Prozessierung der Bilddigitalisate bereitstellen. Die umfassende Vervolltextung der VD über die bereits vorliegenden Google-Volltexte hinaus sowie die Bereitstellung von Volltexten hunderttausender historischer Drucke birgt enorme Chancen für die Forschung, die aber nur in der Verbindung mit komplexen bibliographischen Daten voll valorisiert werden können.
2 Zuschnitt und „blinde Flecken“ der VD
Eine zentrale Herausforderung bei der Nutzung als Forschungsdaten über die Jahrhundertgrenzen hinweg stellt der uneinheitliche regionale und sprachliche Zuschnitt und die heterogene Abdeckung der VD dar. Die VD wurden als separate Projekte konzipiert, die sich entlang der Jahrhundertgrenzen ablösen und jeweils eigene, für den jeweiligen Fall plausible Abgrenzungsentscheidungen getroffen haben. Darüber hinaus erzeugen Hürden bei der Beteiligung an den VD sowie besondere Schwierigkeiten bei der Erfassung etwa von Hebraica zusätzliche „blinde Flecken“. Gerade wenn man die VD nicht als Einzelprojekte betrachtet, sondern als eine deutsche Nationalbibliographie der frühen Neuzeit versteht, sind diese Differenzen – so verständlich sie in ihrer Entstehung auch sind – problematisch.
2.1 Handpressenzeit
Die Erfassung der Handpressenzeit ist mit dem Endpunkt 1800 nicht abgeschlossen. Eine Ausdehnung der VD bis 1820 wäre deshalb langfristig sehr erstrebenswert, da bis um 1820 mit den Handpressen noch weiter produziert wurde.
Schwerer wiegt aktuell das Fehlen eines VD 15. Zwar sind Inkunabeln mit dem Gesamtkatalog der Wiegendrucke (GW) und dem Incunabula Short Title Catalogue (ISTC) bibliographisch herausragend erfasst, doch fehlt in beiden Bibliographien häufig ein belastbarer Exemplarnachweis[7]. Ein aus den bestehenden Katalogdaten abzuleitendes VD 15 würde die Datengrundlage für den Buchdruck der Handpressenzeit entscheidend vervollständigen, ohne neue Erschließungsarbeit nötig zu machen.
2.2 Geographischer Zuschnitt
Der geographische Zuschnitt der drei VD-Unternehmen ist heterogener, als die gemeinsame Abkürzung VD suggeriert. VD 16 orientiert sich an Josef Benzings „deutschem Sprachbereich“ und schließt wichtige deutschsprachige Druckzentren wie „Amsterdam, Prag und Kopenhagen“ aus[8]. VD 17 und VD 18 beziehen sich auf den „deutschen Sprachraum“ und erfassen zusätzlich deutschsprachige Drucke aus dem Ausland, lassen aber Drucke in anderen Sprachen aus den gleichen Offizinen unberücksichtigt.
![Abb. 1: Druckorte des VD 16 (roter Kreis), VD 17 (blauer Kreis), VD 18 (Kreuz), Stand August 2024.Die Grafik basiert für VD 16 auf der Liste der Druckorte des VD 16. URL: https://www.bsb-muenchen.de/fileadmin/pdf/historische_drucke/vd16_druckorte.pdf [Zugriff: 01.09.2024]; für VD 17 auf Beyer, Hartmut: VD17-Dump. URL: https://git.hab.de/beyer/vd17-dump [Zugriff: 01.09.2024], vom VD 18 auf einem Vollabzug vom Dezember 2023, für den die Autoren Dr. Christian Fieseler freundlich danken. Der Kartenausschnitt schließt einige entferntere VD 18-Druckorte aus. Das Skript zur Erstellung der Grafik ist zur weiteren Nutzung auf GitHub unter https://github.com/NWeichselbaumer/VD_Visualisation [Zugriff: 02.09.2024] verfügbar.](/document/doi/10.1515/bd-2024-0076/asset/graphic/j_bd-2024-0076_fig_001.jpg)
Druckorte des VD 16 (roter Kreis), VD 17 (blauer Kreis), VD 18 (Kreuz), Stand August 2024.[9]
Die Referenzregion der Nationalbibliographien durch die vorherrschende Volkssprache zu bestimmen, erscheint fragwürdig. Jürgen Beyer verdeutlicht am Beispiel von Lübeck und Riga, dass gesprochene Sprache und Druckproduktion nicht zwingend korrelieren.[10]
Ein Grund für die wechselnde Definition von „Deutsch“ liegt in der historischen Ausdehnung des Sprachraums, der über die heutigen Grenzen Deutschlands hinausging. Der Wunsch, Drucke nicht kolonialistisch einer deutschen Bibliographie zuzuordnen, führte dazu, dass Teile der deutschsprachigen Druckgeschichte unberücksichtigt blieben. Bereits vor 20 Jahren wurde deutschsprachiges Schrifttum aus Böhmen, Mähren, Siebenbürgen und dem Baltikum als Fehlstelle benannt.[11] Durch die geänderten Förderbedingungen der DFG kann nun ein umfassendes Projekt zur Integration relevanter polnischer Bestände in die VD angegangen werden und dabei auch über eine Ausweitung der relevanten Druckorte nachgedacht werden.
Die unterschiedlichen Definitionen erschweren den Vergleich der VD-Daten und die internationale Zusammenarbeit mit anderen Nationalbibliographien. Für die langfristige Erfassung des europäischen Kulturerbes sind stabile und klar definierte Referenzregionen entscheidend, um die Daten wissenschaftlich nutzbar zu machen.
2.3 Systematischer Zuschnitt
Die VD unterscheiden sich nicht nur in ihrer Definition dessen, was als Deutsch gilt, sondern auch in der Frage, welche Drucke sie berücksichtigen. Um die immense Aufgabe der Erfassung bewältigbar zu halten, hat VD 16 unter anderem Einblattdrucke, Periodika, Musikdrucke sowie Atlanten und Karten ausgeschlossen. VD 17 inkludiert Einblattdrucke und Atlanten, schließt jedoch weiterhin Karten und Musica practica aus. VD 18 erfasst grundsätzlich Einblattdrucke, jedoch keine Theaterzettel, Plakate oder Atlanten und Karten.
Die Einbeziehung dieser Medien ist nicht nur gerechtfertigt, sondern auch dringend geboten. Mit der zunehmenden Bedeutung georeferenzierter Forschung[12] wird eine systematische Erschließung von Karten aus dem VD-Berichtszeitraum zu einem wesentlichen Desiderat. Auch die Erfassung von Musikdrucken wäre eine wertvolle Ergänzung zum eher auf Handschriften spezialisierten Répertoire International des Sources Musicales (RISM), da gedruckte Musikwerke eine breitere Rezeption und Verbreitung dokumentieren. Bereits 2010 betonte Claudia Fabian, dass „eine gezielte Erweiterung um diese Erscheinungsform anzustreben“ sei.[13]
Besonders schwerwiegend ist jedoch das Fehlen der Einblattdrucke des 16. Jahrhunderts, die in letzter Zeit immer mehr Beachtung von der nationalen und internationalen Forschung erlangten.[14] Gerade im Jahrhundert der Reformation auf die Erfassung der Drucke zu verzichten, welche die Bewegung maßgeblich begleitet und deren Entwicklung beeinflusst haben, wird in der Wissenschaft häufig kritisiert. So spricht Odenbreit von einem „wissenschaftlichen Sündenfall“[15], Kaufmann von einer „bibliographisch extrem schwierigen Situation“[16] und Beyer erklärt die Entscheidung für „somewhat odd“[17]. Schließlich ist derzeit das Zentraldokument der Reformation, der Plakatdruck der 95 Thesen, nicht in der deutschen Nationalbibliographie erfasst. Zwar haben in der Vergangenheit sowohl die Bayerische Staatsbibliothek, die Staatsbibliothek zu Berlin als auch die Universitätsbibliotheken Frankfurt am Main sowie Erlangen-Nürnberg ihre Einblattdrucke digitalisiert, wodurch bereits mehrere tausend Einblattdrucke bekannt sind. Allerdings ist dies nur die Spitze des Eisberges, denn für das 17. Jahrhundert sind bereits über 20.000 Einblattdrucke im VD 17 nachgewiesen und dies ohne größere Berücksichtigung der reichen Museums- und Archivbestände. Für das 16. Jahrhundert werden über 10.000 Ausgaben zu veranschlagen sein. Das Schließen dieser signifikanten Forschungslücke bildet daher mit vollem Recht ein dringendes Desiderat, welches zukünftig Gegenstand eines in der Antragsphase befindlichen Komplementärprojekts (VE16) in Göttingen adressiert werden soll.
Erst für das 18. Jahrhundert wurde die Erschließung von Periodika über die Zeitschriftendatenbank (ZDB) für entsprechende VD 18-Drucke eingeführt.[18] Liedflugschriften mit einem spezifischen Erschließungsmodell für die enthaltenen Lieder werden seit 2015 in dem jahrhundertübergreifenden Komplementärprojekt VD Lied erfasst[19]. Obwohl durch den VD-Zuschnitt nicht ausgeschlossen, wurden hebräische Drucke aufgrund der Sprachhürden in der Praxis bisher nur in Ausnahmefällen erfasst.
Der Ausschluss wichtiger Teile der Druckproduktion war ein notwendiger Kompromiss, um die einzelnen VD-Unternehmen überhaupt realisierbar zu machen. Mittelfristig führen diese Auslassungen jedoch zu Parallelstrukturen, die ökonomisch ineffizient sind und in der Regel Ergebnisse produzieren, die mit den VD-Daten nicht ohne Weiteres kompatibel sind.
2.4 Beteiligungsdefizite
Als nationalbibliographische Verzeichnisse streben die VD eine vollständige Erfassung aller relevanten Druckausgaben an und verzeichnen darüber hinaus auch vorhandene Exemplare. Ein großer Teil der Einträge basiert jedoch auf der systematischen Verzeichnung der Bestände einer begrenzten Anzahl großer Altbestandsbibliotheken mit entsprechenden Personalkapazitäten. Diese Konzentration auf wenige, vorwiegend große Bibliotheken führt dazu, dass Drucke je nach ihrer regionalen oder institutionellen Präsenz in den VD-Datenbanken unterrepräsentiert sind. Bei weitem nicht alle Drucke fanden allgemeine Verbreitung. Dünnhaupt nimmt beispielsweise an, dass der Distributionsradius für Barockdrucke meist nur 100 km betrug.[20]
Insbesondere Ausgaben, die hauptsächlich in Bibliotheken im Südwesten, in Hessen, am Mittel- und Niederrhein sowie in Norddeutschland überliefert sind, finden bisher zu wenig Beachtung. Ähnliches gilt für Bestände aus dem Elsass, der deutschsprachigen Schweiz und Südtirol.[21] Diese regionalen Lücken stellen eine erhebliche Schwachstelle in der derzeitigen Erfassung dar.
Darüber hinaus sind Bestände aus Archiven und Museen sowie aus kirchlichen und privaten Bibliotheken in den VD bisher wenig nachgewiesen, und dies gilt über die Jahrhundertgrenzen hinweg. Die Unterschiede in der Erschließungspraxis zwischen verschiedenen GLAM-Institutionen (Galerien, Bibliotheken, Archive, Museen) haben sich als bedeutende Hürde erwiesen. Diese Vernachlässigung sogenannter „neglected orphans“ führt zu beträchtlichen Lücken in den VD. Beyer schätzt, dass im VD 17 etwa 17 Prozent der überlieferten Drucke Amtsdrucksachen sind, während nur 4 Prozent dieser Art von Drucken tatsächlich nachgewiesen werden.[22] Diese Diskrepanz verdeutlicht das Defizit. Auch bei Gelegenheitsschriften und Einblattdrucken, die häufig verloren gegangen sind oder nur als Unikate existieren, liegt in bei den (noch) nicht an den VD teilnehmenden Institutionen ein unerschlossener Schatz verborgen. Für das 16. Jahrhundert konnten allein für die Reichsstadt Köln fast 400 bibliographisch nicht verzeichnete Drucke nachgewiesen werden, die überwiegend in Archiven und Museen überliefert sind.[23]
Seitdem die DFG auch die Erschließung von Beständen fördert, die nicht in öffentlichem Besitz sind, hat die systematische Erfassung dieser Bestände an Dynamik gewonnen. Gerade die Evangelische Kirche Mitteldeutschlands bemüht sich sehr um den Nachweis ihrer z. T. noch völlig unerschlossenen historischen Bestände. Entscheidend für das Schließen von Lücken und die Integration „vd-ferner“ Bestände werden jedoch niederschwellige Beteiligungsstrukturen und adäquate Fördermöglichkeiten ebenso wie ein Fokuswechsel von der reinen Jagd nach neuen Titeln (VD-Nova) hin zur ganzheitlichen Betrachtung historisch gewachsener Sammlungen sein.
3 VD-Daten – Desiderate bei Erfassung und Nutzung
3.1 Erfassungssysteme
Heute sind alle drei VD als digitale Datenbanken verfügbar und werden von den Nutzern über die Jahrhundertgrenzen hinweg mit ähnlichen Erwartungen genutzt. Angesichts dieser Nutzungspraxis ist die Umsetzung einheitlicher Erfassungsstandards von zentraler Bedeutung. Konsequent zu Ende gedacht bedeutet das: Ein zentrales Erfassungssystem für alle VD ist unerlässlich. Die derzeit historisch gewachsene Struktur mit drei parallelen Lösungen ist ineffizient, kostspielig und führt zu Inkohärenzen in der Datenerfassung und -nutzung. Diese fragmentierte Vorgehensweise belastet die Ressourcen und schafft Inkonsistenzen, die die Forschung behindern. Eine Zentralisierung würde es ermöglichen, die verfügbaren Ressourcen effektiver in die Vereinheitlichung und Optimierung der Datenflüsse zu investieren.
Ein wesentliches Hindernis bei der Umsetzung dieser Lösung ist die Sorge der VD-Trägerbibliotheken, bei einer Zentralisierung an Einfluss zu verlieren. Weitere Bedenken knüpfen sich gerade beim VD 18 an die Affinität der teilnehmenden Bibliotheken zum eigenen Verbundsystem. Ein Überwinden dieser Hindernisse und Bedenken im Sinne des wissenschaftlichen Fortschritts ist jedoch für die Zukunftsfähigkeit der VD unabdingbar.
3.2 Suchqualität
Trotz des hohen Standards der autoptischen Erschließung weisen die VD-Datenbanken Defizite auf, die vor allem in ihrer Uneinheitlichkeit begründet liegen. Ein zentrales Problem ist die mangelnde Durchsuchbarkeit der VD-Bibliographien als Gesamtheit. Gegenwärtig können VD 16, VD 17 und VD 18 nur über die im Karlsruher Virtuellen Katalog (KVK) vorgesehenen Felder gemeinsam durchsucht werden. Da Forschungsfragen oft über Jahrhundertgrenzen hinweggehen, ist die Möglichkeit, mehrere VD gleichzeitig und vollständig zu durchsuchen, im wissenschaftlichen Alltag unverzichtbar.
Das dringendste Desiderat ist die Entwicklung eines gemeinsamen Index, der eine schnelle und umfassende Suche über alle VD ermöglicht. Ein solcher Index würde nicht nur die effiziente Recherche über mehrere Jahrhunderte hinweg sicherstellen, sondern auch den Download von umfangreichen Treffersets erleichtern. Derzeit müssen Forschende ihre Suchergebnisse oft mühsam manuell zusammenstellen, was zeitaufwändig ist und die Gefahr von Fehlern birgt. Services wie Push-Benachrichtigungen für neue Treffer zu bereits heruntergeladenen Suchanfragen könnten dann die Effizienz der Forschung erheblich steigern.
Die Schaffung eines solchen gemeinsamen Index erfordert nicht nur technische, sondern auch inhaltliche Anpassungen, um die Daten der verschiedenen VD zusammenzuführen und zu harmonisieren. Es muss sichergestellt werden, dass der gemeinsame Index mindestens die gleiche Informationsdichte bietet wie die einzelnen VD-Datenbanken. Ein integrativer Ansatz, der alle verfügbaren Informationen aufnimmt und konsistent zugänglich macht, ist daher unerlässlich.
3.3 Forschungsdaten und Normdaten
Quantitative Methoden, insbesondere Distant-Reading-Ansätze, spielen in der modernen Buchwissenschaft eine zentrale Rolle. Anstatt einzelne Texte im Detail zu analysieren, ermöglichen Distant-Reading-Methoden die Auswertung großer Textmengen, um kulturhistorische Entwicklungen und Muster zu identifizieren. Ein Beispiel für die Anwendung von Distant Reading ist die Dark-Matter-Forschung. Diese untersucht die Lücken in der historischen Überlieferung, indem sie verloren gegangene oder nicht erhaltene Drucke schätzt. Arbeiten wie die von Harris[24], Green, McIntyre und Needham[25] sowie aus dem Tagungsband zu „Lost Books“[26] zeigen, wie wichtig eine umfassende und strukturierte Datenbasis für solche Studien ist. Die VD-Daten können nicht nur für traditionelle bibliographische Arbeiten genutzt werden, sondern auch für innovative Methoden der Datenanalyse und -visualisierung.[27] Dies macht sie zu einer unverzichtbaren Ressource für die geisteswissenschaftliche Forschung.
Ein zentrales Problem ist hier die uneinheitliche Erfassungspraxis. Die unterschiedlichen Standards in VD 16, VD 17 und VD 18 erschweren die Vergleichbarkeit und Zusammenführung der Daten.[28] Diese Inkompatibilitäten behindern die effektive Nutzung der VD-Daten als kohärente Forschungsressource. Um das volle Potenzial der VD-Daten als Forschungsressource zu entfalten, sind gezielte Verbesserungen notwendig. Dazu gehören neben der Vereinheitlichung der Erfassungsstandards die Optimierung der Datenzugänglichkeit und eine klare Dokumentation der Datenbanken. Regelmäßige, versionierte Datensätze und transparente Lizenzmodelle würden die Nutzung und Weiterverarbeitung der VD-Daten erheblich erleichtern und ihre Rolle als Grundlage für geisteswissenschaftliche Forschung stärken.
Distant-Reading-Ansätze, die auf bibliographische Daten zurückgreifen, profitieren erheblich vom Einsatz von Normdaten. Die Verwendung von Normdaten erleichtert die Arbeit von Forschenden, da sie die Notwendigkeit reduziert, Namen von Druckern oder Autoren vor der Auswertung selbst zu normalisieren. Zudem sorgt die Zuordnung zu Normdaten, die nach etablierten Standards erfolgt, für eine höhere Qualität, insbesondere im Umgang mit Namensgleichheiten und Pseudonymen. Der Einsatz von Normdaten ermöglicht es außerdem, Werkzeuge, Datensätze und Forschungsergebnisse miteinander zu verknüpfen und anschlussfähig zu machen.
Bedauerlicherweise werden Normdaten wie auch das normierte Vokabular der Gattungsbegriffe in den VD nicht einheitlich und im gleichen Ausmaß verwendet, was die Nutzbarkeit einschränkt. Besonders das VD 16 weist hier aktuell Defizite auf.[29] Nur durch die konsequente Integration von Normdaten kann das volle Potenzial der VD-Daten ausgeschöpft und wichtige Informationen wie etwa Geokoordinaten eingebunden werden. Die Einführung von Werknormdaten im VD 18 hat sich als besonders vorteilhaft erwiesen. Sie erleichtert die Recherche und die Verknüpfung von Übersetzungen und Adaptionen, was für Distant-Reading-Ansätze von großem Nutzen ist. Eine Übertragung dieses Ansatzes auf das 16. und 17. Jahrhundert wäre anzustreben.
Schließlich sollten die VD-Daten selbst als Normdaten für Manifestationen anerkannt und in den Bibliotheksverbünden flächendeckend eingesetzt werden. Dies würde nicht nur die Erschließung erleichtern und Doppelaufnahmen vermeiden, sondern auch eine direkte Verknüpfung von Digitalisaten und Volltexten ermöglichen.
3.4 Exemplardaten
In den letzten Jahren hat die Forschung im Rahmen des Material Turn einen deutlichen Paradigmenwechsel von einer ausgabenzentrierten hin zu einer exemplarorientierten Perspektive vollzogen.[30] Dabei gewinnen Provenienzdaten zunehmend an Bedeutung, insbesondere für die virtuelle Rekonstruktion historischer Sammlungen und die Analyse von Annotationen, die Aufschluss über den Gebrauch und die zeitgenössische Rezeption von Texten geben. Selbst die scheinbar einfache Information über die Anzahl und den Standort der überlieferten Exemplare kann wichtige Erkenntnisse liefern, etwa zur Produktivität von Druckereien und zur geografischen Verbreitung von Druckorten.
Derzeit bieten die VD-Datenbanken jedoch keine belastbare Grundlage für eine solche exemplarorientierte Analyse. VD 16 und VD 17 verzeichnen zwar Exemplarnachweise über das Exemplar hinaus, das der Ausgabenbeschreibung zugrunde liegt, erwecken dabei jedoch oft den Eindruck, alle bekannten Exemplare abzubilden. In Wirklichkeit sind die erfassten Exemplare jedoch bei weitem nicht vollständig. Ein anschauliches Beispiel bietet die Basler Ausgabe von Kopernikus’ De revolutionibus orbium coelestium von 1566. Während im VD 16[31] nur 11 Exemplare verzeichnet sind, listet der Gemeinsame Verbündeindex (GVI) 26 Exemplare, und weltweit sind sogar 324 Exemplare bekannt.[32] Eine Ursache für diese unvollständigen Nachweise liegt darin, dass Exemplarnachweise manuell in die VD eingepflegt werden, anstatt unter Verwendung der VD-Nummer als Identifikator aus den Verbundsystemen integriert zu werden. Die exemplarspezifischen Informationen in den VD bleiben selbst im VD 17, das umfangreiche Provenienzinformationen enthält, hinter den heute etablierten Standards der strukturierten Provenienzerfassung zurück.
Die Implementierung des neuen MARC-Feldes 361 „Structured Ownership and Custodial History“ im Juni 2023[33] eröffnet zusammen mit dem GVI neue Perspektiven für alle Verbundsysteme. Diese Entwicklungen schaffen hervorragende Voraussetzungen, um relevante exemplarspezifische Daten besser und vollständiger mit den VD zu verknüpfen. Voraussetzung dafür ist neben der Nutzung der VD-Nummern als Identifikatoren, dass die Masteraufnahmen aus den VD in den Verbundsystemen genutzt werden und eine abgestufte Sicherheit der Zuordnung von Exemplaren zu den VD-Aufnahmen abgebildet werden kann.
3.5 Bilddigitalisate und Volltexte
Bilddigitalisate spielen eine zentrale Rolle in der Erforschung des gedruckten Kulturerbes. Sie ermöglichen es Forschenden, auf Materialien zuzugreifen, ohne dass physische Bibliotheksreisen erforderlich sind, und erlauben zudem den Vergleich von Exemplaren, die an verschiedenen Standorten aufbewahrt werden. Durch die digitale Erfassung können diese Werke in großer Zahl analysiert werden, etwa mittels Mustererkennung, um Erkenntnisse über Layout, Schriftarten oder Ornamente zu gewinnen.
Trotz dieser Fortschritte sind noch nicht alle relevanten Digitalisate in den VD-Datenbanken verzeichnet. Initiativen wie die des VD 17-Masterplans bieten einen wertvollen Rahmen, um die Digitalisierung effizient voranzutreiben und die Ergebnisse zugänglich zu machen.[34] Allerdings bestehen Herausforderungen bei künftigen Projekten. Einheitliche Kostenmodelle, wie sie beim VD 18 angewandt wurden, haben gezeigt, dass eine starre Preisstruktur die Digitalisierung komplexerer Bestände erschwert.[35] Ein flexibler Ansatz, der die spezifischen Anforderungen unterschiedlicher Materialien berücksichtigt, wäre wünschenswert, um eine umfassende Digitalisierung sicherzustellen. Die Trennung von Katalogisierung, Digitalisierung und Volltextprozessierung[36] könnte dazu beitragen, diesen Anforderungen besser gerecht zu werden.
Für die Nutzung von Bilddigitalisaten als Forschungsdaten ist es essentiell, dass sie unter freien Lizenzen verfügbar sind und über gut dokumentierte Schnittstellen heruntergeladen werden können. Der Einsatz des IIIF-Standards hat sich hierbei bewährt und sollte im Kontext der VD flächendeckend implementiert werden, um eine einfache und flexible Nutzung der Digitalisate zu ermöglichen.
Die Fortschritte in der OCR haben die Erstellung maschinenlesbarer Volltexte selbst aus anspruchsvollen historischen Druckwerken ermöglicht. Mit Technologien, die von Projekten wie OCR-D entwickelt wurden, können heute auch komplexe Dokumente wie Inkunabeln mit hoher Genauigkeit in Textform gebracht werden. Dies eröffnet nun die Perspektive einer systematischen Volltexttransformation der VD-Daten, wie von der wissenschaftlichen Gemeinschaft intensiv gefordert.[37]
Der Wert von Volltexten geht über die Möglichkeit zur Volltextsuche hinaus. Sie dienen als Grundlage für die Anreicherung von Metadaten, wie der Identifizierung und Zuordnung von Gattungen. Mit Techniken wie der Named Entity Recognition (NER) lassen sich darüber hinaus spezifische Entitäten innerhalb der Texte identifizieren, was eine vertiefte inhaltliche Erschließung ermöglicht.[38] Ein nahezu vollständiges Korpus der gedruckten Werke des deutschsprachigen Raums der frühen Neuzeit würde zudem bedeutende Fortschritte in der Korpuslinguistik ermöglichen, beispielsweise bei der Untersuchung der historischen Graphematik des Deutschen. Distant-Reading-Ansätze profitieren besonders von umfangreichen Volltextressourcen. Sie erlauben es, Textmengen quantitativ zu analysieren und Muster zu erkennen, wie dies bei Studien zu juristischen Dissertationen des 17. Jahrhunderts bereits gezeigt wurde. Solche Analysen erweitern unser Verständnis historischer Texte und kultureller Entwicklungen.
Eine vollständige und abgestimmte OCR-Prozessierung der Bilddigitalisate mit Sicherstellung von Qualitätsstandards ist der nun anzugehende Schritt. Ein zentrales Repository würde die Verwaltung, Versionierung und rechtliche Klärung der OCR-Daten vereinfachen. Die von Google erstellten OCR-Daten, die derzeit aufgrund unklarer Lizenzbedingungen nur eingeschränkt nutzbar sind, stellen ein gutes Beispiel für den Bedarf an klaren Rahmenbedingungen dar. Diese Daten sind wertvoll, jedoch nur nutzbar, wenn ihre Nutzung gesichert ist.
Die Zitierbarkeit und Versionierung von Volltexten ist entscheidend, da diese nicht nur als Hilfsmittel, sondern als eigenständige Forschungsdaten genutzt werden. Fortschritte in der OCR-Technologie werden wiederholt neue Textversionen hervorbringen. Um die wissenschaftliche Nachvollziehbarkeit zu gewährleisten, müssen sowohl alte als auch neue Textversionen zugänglich bleiben. Dies stellt sicher, dass die Datenbasis für Forschungsergebnisse jederzeit überprüfbar bleibt.
4 Zukunft der VD – eine Vision

Roadmap VD Zukunft, Stand April 2024.
4.1 Zentraler Index
Ein gemeinsamer Index integriert alle VD-Daten. Dieser Index ermöglicht eine einheitliche und effiziente Durchsuchbarkeit und führt alle relevanten VD-Daten zusammen. Moderne Schnittstellen wie SRU/OAI werden genutzt, um die tagesaktuelle Integration der vollständigen bibliographischen Daten, zusätzlicher Exemplardaten sowie der IIIF-Manifeste der Bilddigitalisate mit ihren Strukturdaten und der Volltexte sicherzustellen.
4.2 Harmonisierung und Augmentierung der VD-Daten
Moderne Technologien, einschließlich maschinellem Lernen und KI werden zur Augmentierung der VD-Daten eingesetzt, etwa zur automatisierten Zuweisung von Gattungsbegriffen oder zur Erkennung von Mustern in Digitalisaten. Maschinell ergänzte Daten sind klar gekennzeichnet, um Transparenz und wissenschaftliche Nachvollziehbarkeit zu gewährleisten. Im besten Fall gelingt eine Zusammenführung der Erfassungssysteme, die entscheidend zur Datenharmonisierung beitragen wird.
4.3 Vervollständigung der VD
Zur Schließung bestehender Lücken werden Projekte zur Digitalisierung und Erschließung VD-relevanter Bestände initiiert. Durch die Möglichkeit, Projekte sammlungsorientiert und in Kooperation mit erfahrenen VD-Bibliotheken zu konzipieren und durchzuführen, gelingt die Beteiligung bisher „vd-ferner“ Institutionen und Regionen. Die Erfassung von Einblattdrucken, Amtsdrucksachen und anderen speziellen Druckformen wird vorangetrieben. Die Vervolltextung der VD wird systematisch geplant und ein zentrales Repositorium für die Volltexte geschaffen.
4.4 Modularität und Einbindung von Forschungswerkzeugen
Ein modularer Aufbau der VD-Infrastruktur ist essenziell, um flexibel auf zukünftige technologische Entwicklungen reagieren zu können. Die Integration spezialisierter Forschungswerkzeuge über standardisierte Schnittstellen (API) wird gefördert. Solche Werkzeuge können zu Bildsuche, Typenerkennung oder Analyse von Netzwerken zwischen Druckern, Autoren und Verlegern dienen. Ziel ist es, Digital Humanities-Methoden zur Selbstverständlichkeit im Umgang mit den VD-Daten zu machen.
4.5 Stärkung der VD-Community
Die Erfolge der VD sind maßgeblich der Beteiligung zahlreicher Bibliotheken und Gedächtnisinstitutionen zu verdanken. Diese breite Basis an Expertise und Engagement muss auch in Zukunft eine zentrale Rolle spielen. Die VD-Community muss weiter aktiv in die Weiterentwicklung einbezogen sein, um sicherzustellen, dass die spezifischen Bedürfnisse und Erfahrungen der verschiedenen Akteure berücksichtigt werden.
4.6 Fokus auf Interoperabilität und Forschung
Ein Hauptaugenmerk der zukünftigen Entwicklung liegt auf der Interoperabilität der VD-Daten. Dies umfasst sowohl die Vereinheitlichung der Erfassungsstandards als auch die Einführung eines gemeinsamen Berichtsraumes. Die Nutzung gut dokumentierter Schnittstellen und forschungsfreundlicher Exportformate wie JSON oder XML stellt die Anschlussfähigkeit der VD-Daten an andere Forschungsprojekte und -initiativen sicher. Durch diese Maßnahmen werden die VD-Daten nicht nur zu einem leistungsfähigen Werkzeug für die geisteswissenschaftliche Forschung, sondern auch zu einem integralen Bestandteil der internationalen Forschungslandschaft.
5 Fazit
Die Zukunft der VD liegt in ihrer Weiterentwicklung zu einer umfassenden, forschungsfreundlichen Plattform, die das gedruckte Kulturerbe des deutschsprachigen Raums in seiner ganzen Vielfalt abbildet. Die Umsetzung dieser Roadmap wird entscheidend dazu beitragen, die VD-Daten als zentrale Ressource für die Geisteswissenschaften zu etablieren und ihre Bedeutung für die Erforschung der europäischen Kulturgeschichte weiter auszubauen.
© 2024 bei den Autoren, publiziert von Walter de Gruyter GmbH, Berlin/Boston
Dieses Werk ist lizensiert unter einer Creative Commons Namensnennung 4.0 International Lizenz.
Artikel in diesem Heft
- Frontmatter
- Editorial
- Aus den Verbänden
- „Gemeinsam Digital!“ – Bibliotheksverband vergibt Fördermittel für digitale Leseförderung
- Die Bibliotheken des Jahres 2024 stehen fest!
- In Bibliotheken als öffentliche Räume des Gemeinwesens investieren
- Die Zentral- und Landesbibliothek Berlin braucht ein neues Bibliotheksgebäude
- Bibliothek & Information Deutschland (BID) – Bundesvereinigung Deutscher Bibliotheksverbände e.V.
- Jahresbericht des IFLA-Nationalkomitees Deutschland 2024
- Die Universitätsbibliothek Heidelberg wählt OCLCs WorldShare Management Services als neue Plattform für Bibliotheksservices
- OCLC gewinnt Stadtbibliothek Essen als neuen BIBLIOTHECAnext-Kunden
- Themen
- Entwicklung eines OER-Repositoriums für die Hochschullandschaft der Schweiz
- MINTspace – Ein interaktiver Experimentierraum in der Bibliothek
- Zukunft der VD – Vision einer forschungsadäquaten Nationalbibliographie der frühen Neuzeit
- Notizen und Kurzbeiträge
- Notizen und Kurzbeiträge
- Termine
- Termine
Artikel in diesem Heft
- Frontmatter
- Editorial
- Aus den Verbänden
- „Gemeinsam Digital!“ – Bibliotheksverband vergibt Fördermittel für digitale Leseförderung
- Die Bibliotheken des Jahres 2024 stehen fest!
- In Bibliotheken als öffentliche Räume des Gemeinwesens investieren
- Die Zentral- und Landesbibliothek Berlin braucht ein neues Bibliotheksgebäude
- Bibliothek & Information Deutschland (BID) – Bundesvereinigung Deutscher Bibliotheksverbände e.V.
- Jahresbericht des IFLA-Nationalkomitees Deutschland 2024
- Die Universitätsbibliothek Heidelberg wählt OCLCs WorldShare Management Services als neue Plattform für Bibliotheksservices
- OCLC gewinnt Stadtbibliothek Essen als neuen BIBLIOTHECAnext-Kunden
- Themen
- Entwicklung eines OER-Repositoriums für die Hochschullandschaft der Schweiz
- MINTspace – Ein interaktiver Experimentierraum in der Bibliothek
- Zukunft der VD – Vision einer forschungsadäquaten Nationalbibliographie der frühen Neuzeit
- Notizen und Kurzbeiträge
- Notizen und Kurzbeiträge
- Termine
- Termine