Kollaboration und Web 2.0
Zusammenfassung
Die Digitale Landesbibliothek Oberösterreich (DLOÖ)1 ist heute viel mehr als nur ein einfaches Retrodigitalisierungsprojekt. Mittlerweile umfasst das Angebot Web-2.0-Werkzeug Möglichkeiten zur Erstellung für Anmerkungen, zum Anlegen eigener Sammlungen oder zur Speicherung von Suchen. Mit einem eigenen Crowdsourcing-Modul können Volltexte verbessert, Annotationen in Bildern oder Transkriptionen von Handschriften durchgeführt werden. Nur exklusive bearbeitbare Datenfelder zur wissenschaftlichen Beschreibung von Handschriften durch Wissenschaftler runden das Angebot ab.
Abstract
The Digital National Library of Austria (DLOÖ) is much more than just a simple retro-digitization project. We now include the possibility to work with the Web 2.0 tool for notes, or to help you create your own collections or for storing your searches. With an own crowdsourcing engine full text, can be improved, annotations in images or transcriptions of manuscripts are possible. Exclusively this programme gives access to editable data fields which can help to clarify scientific descriptions of manuscripts by scholars and scientists.
1 Vorwort
Die „Digitale Landesbibliothek Oberösterreich“ ist ein Digitalisierungsprojekt das ursprünglich zur Retrodigitalisierung urheberrechtsfreier Bücher entwickelt wurde. Heute beinhaltet dieses neben der Digitalisierung urheberrechtsfreier Bücher und der Verwaltung elektronischer Pflichtexemplare eine Fülle an Services und Angeboten, die sich an den interessierten Laien genauso wie an Wissenschaft und Forschung richten.
Die Oberösterreichische Landesbibliothek hat ganz bewusst einen Schwerpunkt auf die Entwicklung neuer Werkzeuge der DLOÖ im Bereich Datenvernetzung und -anreicherung gesetzt, da wir uns davon eine spürbare Verbesserung der Qualität unserer Metadaten erwarten. Um derartige Projekte gut managen zu können, ist es wichtig zu verstehen, dass sich ständig verändernde Prozesse systemimmanente Kennzeichen von Web-2.0-Projekten sind. So gesehen stellt dieser Erfahrungsbericht eine Momentaufnahme in der Entwicklung der DLOÖ dar. Unser vorrangiges Ziel war und ist die Verbesserungen von Usability und Qualität der Metadaten. Durch den Einsatz neuerer technischer Möglichkeiten (z. B. Crowdsourcing, Linked Open Data,[2] named-entity recognition[3]) wollen wir diese Kriterien bestmöglich vorantreiben.
In diesem Artikel gebe ich Einblicke in die wichtigsten Entwicklungen der DLOÖ im Bereich Kollaboration/Web 2.0.
2 Das Crowdsourcing-Modul der DLOÖ
Die Software für das Crowdsourcing[4]-Modul basiert im Kern auf einer Erstentwicklung der Landesbibliothek Berlin, ist plattformunabhängig und in JAVA[5] programmiert.
Im Januar 2014 startete die Entwicklung gemeinsam mit unserer Betreuungsfirma (Intranda), dabei wurden einerseits bereits vorhandenen Funktionen radikal verändert, andererseits neue Features in einem relativ rasanten Feedbackprozess entwickelt. Insbesondere die Bedienoberfläche (GUI[6]) wurde vollständig runderneuert. Unsere Anforderungen an Funktionalitäten und Usability wichen erheblich von denen der Landesbibliothek Berlin ab, sodass man angesichts der großen Umwälzungen eher von einer Neuentwicklung sprechen darf.
Ursprünglich wurde die Software zur Verbesserung des maschinengelesenen OCR[7]-Textes der Adressbücher Berlins entwickelt. Die schlechte Qualität der Vorlagen und die Vielzahl verschachtelter Tabellen bedingten besondere Anforderungen und spezielle Funktionalitäten.
Die Oberösterreichische Landesbibliothek hatte aufgrund der vorhandenen Materialheterogenität diametrale Anforderungen und Ziele. Wir hatten die Anforderung, dass Monographien, Bandserien, Zeitschriften, Zeitungen, alte Drucke, Karten, Inkunabeln und Handschriften mit Metadaten angereichert und Volltexte verbessert werden können und wollten Wortkoordinaten für korrektes Highlighting[8] bei der Volltextsuche realisieren. Anders gesagt, wir suchten ein Werkzeug das viel breiter aufgestellt und in unterschiedlichsten Einsatzszenarien verwendbar wäre. Trotz unseres international bescheidenen Bestandes (ca. 4500 Werke online; Stand Mai 2016) war uns rasch klar, dass auch wir diese Aufgabe hausintern nicht leisten werden können.
Schon heute haben wir durch die Crowd bei einzelnen Werken einen deutlich verbesserten Volltext, da Benutzer den Volltext von sich aus nachbearbeitet haben.[9]

Oberfläche Crowdsourcing-Modul
In der neuen graphischen Oberfläche kann man Bildanzeige und Volltexte nebeneinander legen. Bewegt man den Mauszeiger über den Volltext, wird in der Bildanzeige um das zughörige Wort ein roter Rahmen eingeblendet. So kann man größere Textmengen relativ rasch auf ihre Korrektheit überprüfen. Klickt man mit der Maus nun auf ein Wort, wird ein Eingabewerkzeug auf der Volltextseite eingeblendet. Mit diesem kann man ein Wort editieren, löschen (Symbol Mülltonne) oder mit den Pfeiltasten ein weiteres Wort davor/danach oder eine Zeile oberhalb/unterhalb einfügen.
Zusammenhängende sinnlose Zeichenabfolgen, wie sie immer wieder bei maschinengelesenem Volltext vorkommen, können nun komfortabel mit einem eigens entwickelten „Löschenmodus“ entfernt werden.

Löschenmodus
Das Löschen ganzer Seiten ist ebenfalls möglich, wurde allerdings bewusst eingeschränkt und bedarf spezieller Rechte.
Vom Volltext eines Werkes werden neben der ursprünglichen OCR-Datei alle weiteren Versionen des Volltextes als einzelne ALTO[10]-Dateien (XML-Format) gespeichert, sodass bei Bedarf jederzeit auf den ursprünglichen Volltext zurückgesetzt werden kann. Die spätere Nachnutzung in Fremdsystemen ist dadurch ebenfalls garantiert. Unsere OAI-PMH[11]-Schnittstelle bietet dazu einen maschinenlesbaren Zugang in vielen verschiedenen Dateiformaten (dc, ese, mets, marcxml, epicur und lido) an.[12] Zusätzlich werden alle diese Dateiversionen regelmäßig archiviert, mit einem Zeitstempel und einer ID versehen, was die Zuordnung zu den Bilddateien der Bücher innerhalb des Dateisystems enorm erleichtert. Neben der Verbesserung von Volltexten besteht bei uns zusätzliche die Möglichkeit, Inhalte zu bearbeiten.

Annotationstool
Annotationen können derzeit zu den Bereichen Person, Einrichtung, Adresse und Kommentar erfasst werden. Jeder Annotationstyp wird mit einem roten Rahmen und einem eigenen Symbol kenntlich gemacht, sodass den Benutzern sofort der Zusammenhang zwischen der jeweiligen Textstelle (dieser befindet sich unterhalb des Bildes), der Art der Annotation und dem zugehörigem Bildbereich klar wird.
In den Metadatenfeldern der einzelnen Annotationsarten können derzeit persistente Identifier, GND[13]-Daten, Namen, Geodaten, Orte, Straßen, Länder und Anmerkungen erfasst werden. Das Entwicklungspotential für diese Felder scheint enorm und kann heute noch gar nicht abgeschätzt werden. Man denke da z. B. nur an die Georeferenzierung von Karten.
Dass sich mittlerweile auch die Albertina in Wien im Zusammenhang mit Bildklebebänden für dieses Modul interessiert, spricht für das Potential dieses Werkzeuges.

Transkribiermodus
Eine weitere wichtige Funktionalität stellt der Transkribiermodus dar. Bei Werken die über keinen Volltext (insbesondere Handschriften) verfügen, wird optional ein Transkribiermodus angeboten. In diesem werden keine Wortkoordinaten vergeben, stattdessen kann man in einem WYSIWYG-Editor Fließtext eingeben.
Da die wissenschaftliche Transkription per se schon eine enorme Herausforderung darstellt, wollten wir keine zusätzlichen Hürden einbauen, indem jedes einzelne Wort als Wortkoordinate erfasst werden muss, auch wenn dies optional möglich wäre.
Seit einiger Zeit entdecken immer mehr Benutzer dieses Werkzeug, und wenn dann Handschriften auf hohem Niveau bearbeitet werden, freut man sich als Betreiber umso mehr.[14] Um die Zugangshürden zu unseren Werkzeugen so gering wie möglich zu halten, genügt schon ein OpenID[15]-Account, man kann sich allerdings auch ganz klassisch mit E-Mail und Passwort über ein Webformular anmelden.[16]
Im Januar 2015 wurde der Probebetrieb aufgenommen und seit März des Jahres wird das Crowdsourcing-Modul zur Datenanreicherung im Vollbetrieb geführt.
3 Weitere Web-2.0-Werkzeuge
Der Zugang zu den nun folgenden Funktionalitäten erfordert die Registrierung via Anmeldeformular oder einen OpenID-Account.
3.1 Kommentarfunktion
Im Jahr 2014 entwickelten wir die Möglichkeit, plain text in einem Feld unterhalb jedes Bildes einzutragen. Manche Nutzer können uns mit diesem Werkzeug[17] z. B. auf Fehler aufmerksam machen, andere wiederum generieren Mehrwerte[18] für alle Beteiligten.
3.2 Bücherregalfunktion
Mit dieser Funktion können Benutzer eigene virtuelle Bücherregale erstellen und benennen, um diesen dann Bücher zuzuweisen. So können „Lieblingsbücher“ oder thematisch ähnliche Büchersammlungen rasch auffindbar gemacht werden. Man kann sich eine eigene kleine virtuelle Bibliothek schaffen. Optional können diese auch der Allgemeinheit zugänglich gemacht werden (öffentliche Bücherregale).
3.3 Suchanfragen speichern
Auch das Abspeichern von Suchen ist mit der Anmeldung möglich. Komplizierte und aufwändige Suchanfragen können dann jederzeit wieder rasch aufgerufen werden, ohne die zuvor verwendete Syntax erneut eingeben zu müssen.
3.4 GND-Einbindung
Als weitere externe Quelle zur Datenanreicherung wird seit mehr als eineinhalb Jahren die GND-Anbindung genutzt, die uns zusätzliche lokale Suchmöglichkeiten nach unterschiedlichen Schreibweisen ermöglicht, da der gesamte Datensatz der GND von unserem Solr-Indexer indexiert wird. Demonstrieren lässt sich das z. B. an folgendem GND-Datensatz[19] von Herder, indem man per copy and paste eine der asiatischen Schreibweisen seines Namens (约翰·哥特弗里特·赫尔德) in den Suchschlitz eingibt und fündig wird. Zu finden sind die GND-Einträge, sofern vorhanden, im Menüpunkt Bibliographischen Daten.
3.5 Übersichtsseite
Als Ergänzung zum Crowdsourcing-Modul haben wir eine optionale (wird nach Bedarf generiert) Übersichtsseite für unsere Handschriften entwickelt. Diese setzt sich aus einem Literatur- und einem Beschreibungsfeld sowie verschiedenen bibliographischen Daten zusammen.
Die Übersichtsseite dient der wissenschaftlichen Tiefenerfassung von Handschriften und kann nur mit Sonderrechten (Benutzer müssen sich auf der Webseite anmelden und erhalten danach von uns die notwendigen Rechte zugewiesen) bearbeitet werden, einerseits um neueste wissenschaftliche Erkenntnisse zu Handschriften direkt neben den Digitalisaten zur Verfügung[20] zu stellen, andererseits um weitere Quellen (Literaturangaben, Links zu anderen Webseiten[21]) und Informationen besser einbinden und vernetzen zu können.
In den nächsten Monaten werden wir Daten eines Projektes der Österreichischen Akademie der Wissenschaften zur Buchmalerei spätgotischer Handschriften der Oberösterreichischen Landesbibliothek unter der Federführung von Frau Dr. Katharina Hranitzky sukzessive in unser Portal einarbeiten.

Übersichtsseite
Im Beschreibungsfeld steht ein WYSIWYG-Editor[22] zur Verfügung, so kann der eingegebene Text strukturiert und formatiert werden. So können innerhalb eines Fließtextes Links auf besondere Buchmalereien gesetzt werden. Das System wurde so konfiguriert, dass diese Links sich in einem Popup-Fenster öffnen, um die beschriebenen Initialen in Ruhe betrachten, das Popup danach schließen und anschließend im Fließtext der Hauptseite weiterlesen zu können.
Die Übersichtsseite beinhaltet zusätzlich ein Feld Literatur. In dieses können einschlägige Quellen zu einer bestimmten Handschrift angegeben werden. Unterhalb des Beschreibungsfeldes wird ein automatisch generiertes Logfile angezeigt. Durch dieses wird sofort ersichtlich, wer, wann, welche Beiträge zu einer bestimmten Handschrift geleistet hat.
Somit entwickelt sich im Laufe der Zeit eine Bearbeitungs-Chronologie, was aus wissenschaftlicher Sicht wünschenswert und notwendig ist.
4 Was die nähere Zukunft bringt?
In den nächsten Wochen werden wir eine neue Version unseres Viewers installieren. Mit dieser erhalten wir ein völlig neues Bildermanagement, welches große Bilder rasch in sehr guter Auflösung zur Verfügung stellt und sich gleichzeitig an den Standard International Image Interoperability Framework (IIIF) hält. Die IIIF-Gemeinschaft dient der Normierung der Datenbereitstellung, führt zur Verbesserung der Usability, vereinfacht den Datenaustausch und die internationale Zusammenarbeit in der Forschung.
Named-entity recognition wird ebenfalls mit der neuen Version in Grundzügen realisiert und in Zukunft können E-Pubs[23] aus unseren Volltexten hergestellt werden, so müssen nur geringe Datenmengen von Benutzern heruntergeladen werden, wenn es vorrangig um den Text eines Buches geht.
Im Laufe des Herbsts planen wir die Implementierung der automatisationsunterstützten Handschriftenerkennung aus dem EU-Projekt Transkribus[24] um Dr. Günther Mühlberger in die DLOÖ. Von diesem Werkzeug erwarten wird uns einen weiteren Schub in der wissenschaftlichen Tiefenerfassung von Handschriften.
© 2016 Walter de Gruyter GmbH, Berlin/Boston
Articles in the same Issue
- Titelseiten
- Inhaltsfahne
- Next Generation Library Systems
- Next Generation Library Systems
- Renewing the Library System Environment in Finland – What We Have and What We Need
- Libraries of French Higher Education
- Transitioning from a Self-developed and Self-hosted ILS to a Cloud-based Library Services Platform for the BIBSYS Library System Consortium in Norway
- Austrian Library Network and Next Generation Library System: Alma
- Zukunftsgestalter in Bibliotheken 2016: Sieger
- Mehr Spielräume: Methoden der partizipativen Lernraumgestaltung
- Ein JuWel ist entstanden
- Zukunftsgestalter in Bibliotheken 2016: Weitere innovative Projekte
- Schreibzentrumsarbeit als integriertes Tätigkeitsfeld einer Hochschulbibliothek
- MusikNetz Hagen: Eine Musikbücherei auf dem Weg zu einer Informations-Tauschbörse
- Schülerwettbewerb zu ökonomischen Fragen bringt Jugendlichen Informations- und Medienkompetenz näher
- Open-Access-Publizieren und -Beraten: Mit Fokus auf die PUBLISSO – Publikationsplattform von ZB MED
- Kollaboration und Web 2.0
- Wo bin ich? iBeacons im Einsatz in der Bibliothek der TH Wildau
- Stadtliebe.ch – Ein Erinnerungsblog für Winterthur
- Bibliothekspolitik
- „Bibliothekspolitik“ – Prätention, Praxis und Perspektiven
- Wissenschaftliche Information: Zugang, Verarbeitung und Speicherung
- Bibliotheksbau
- Die neue Universitätsbibliothek Freiburg – gebaut für eine digitale Zukunft
- „Bis morgen in der Bibliothek!“ – Entwicklungen für Lernorte an der SUB Göttingen
- An der Zukunft bauen: Die Norderweiterung der Universitätsbibliothek Heidelberg und ihre aktuellen Innovationsfelder
- Bibliothek als Ort, Bibliothek als Organisation, Bibliothek im Wandel
- Die Bibliothèque nationale et universitaire de Strasbourg (BNU) nach der Wiedereröffnung: Modernisierte Organisationsform in einem neuen „alten“ Bibliotheksbau
- Neue Entwicklungen
- Aktuelle Entwicklungen an den österreichischen Bibliotheken 2015
- Rezensionen
- Graham Jefcoate: Deutsche Drucker und Buchhändler in London 1680–1811. Strukturen und Bedeutungen des deutschen Anteils am englischen Buchhandel (Archiv für Geschichte des Buchwesens, Studien; 12), Berlin: De Gruyter, 2015. 611 S., 139,95 €
- The German book in Wolfenbüttel and abroad: studies presented to Ulrich Kopp in his retirement. Ed. by William A. Kelly and Jürgen Beyer. (Studies in reading and book culture; 1) Tartu: University of Tartu Press, 2014. 344 S., Ill. ISBN 978-9949-32-494-1, $ 44,00
- Holger Böning; Iwan-Michelangelo D’Aprile; Hanno Schmitt; Reinhart Siegert (Hg.): Selbstlesen – Selbstdenken – Selbstschreiben. Prozesse der Selbstbildung von „Autodidakten“ unter dem Einfluss von Aufklärung und Volksaufklärung vom 17. bis zum 19. Jahrhundert. Mit 600 Kurzbiographien von Autodidakten im deutschen Sprachraum bis 1850 und Verzeichnissen von Bauernbibliotheken. Bremen: edition lumière, 2015. (Philanthropismus und populäre Aufklärung. Studien und Dokumente; Bd. 10). 552 S., s/w. Abb., Fest geb. ISBN 978-3-943245-35-6. € 44,80
- Vermarktungsstrategien für das Buch im multimedialen Raum. Eine interdisziplinäre Untersuchung. Hrsg. von Vincent Kaufmann. Wiesbaden: Harrassowitz, 2015. 238 S., 11 Abb., 22 Diagr., 19 Tab., br. (Buchwissenschaftliche Beiträge; 90 ) ISBN 978-3-447-10355-8 € 52,–
- „Der ganze Verlag ist einfach eine Bonbonniere“. Ullstein in der ersten Hälfte des 20. Jahrhunderts. Hg. von David Oels und Ute Schneider. Berlin, München, Boston: De Gruyter, 2015. 433 S., s./w. Abb. (Archiv für Geschichte des Buchwesens – Studien; 10). Fest geb. – ISBN 978-3-11-033708-2, e-ISBN (PDF) 978-3-11-033721-1, e-ISBN (EPUB) 978-3-11-038397-1, ISSN 2197-0351. € 119,95
- Jahresinhaltsverzeichnis 2016
- Jahresinhaltsverzeichnis 2016
Articles in the same Issue
- Titelseiten
- Inhaltsfahne
- Next Generation Library Systems
- Next Generation Library Systems
- Renewing the Library System Environment in Finland – What We Have and What We Need
- Libraries of French Higher Education
- Transitioning from a Self-developed and Self-hosted ILS to a Cloud-based Library Services Platform for the BIBSYS Library System Consortium in Norway
- Austrian Library Network and Next Generation Library System: Alma
- Zukunftsgestalter in Bibliotheken 2016: Sieger
- Mehr Spielräume: Methoden der partizipativen Lernraumgestaltung
- Ein JuWel ist entstanden
- Zukunftsgestalter in Bibliotheken 2016: Weitere innovative Projekte
- Schreibzentrumsarbeit als integriertes Tätigkeitsfeld einer Hochschulbibliothek
- MusikNetz Hagen: Eine Musikbücherei auf dem Weg zu einer Informations-Tauschbörse
- Schülerwettbewerb zu ökonomischen Fragen bringt Jugendlichen Informations- und Medienkompetenz näher
- Open-Access-Publizieren und -Beraten: Mit Fokus auf die PUBLISSO – Publikationsplattform von ZB MED
- Kollaboration und Web 2.0
- Wo bin ich? iBeacons im Einsatz in der Bibliothek der TH Wildau
- Stadtliebe.ch – Ein Erinnerungsblog für Winterthur
- Bibliothekspolitik
- „Bibliothekspolitik“ – Prätention, Praxis und Perspektiven
- Wissenschaftliche Information: Zugang, Verarbeitung und Speicherung
- Bibliotheksbau
- Die neue Universitätsbibliothek Freiburg – gebaut für eine digitale Zukunft
- „Bis morgen in der Bibliothek!“ – Entwicklungen für Lernorte an der SUB Göttingen
- An der Zukunft bauen: Die Norderweiterung der Universitätsbibliothek Heidelberg und ihre aktuellen Innovationsfelder
- Bibliothek als Ort, Bibliothek als Organisation, Bibliothek im Wandel
- Die Bibliothèque nationale et universitaire de Strasbourg (BNU) nach der Wiedereröffnung: Modernisierte Organisationsform in einem neuen „alten“ Bibliotheksbau
- Neue Entwicklungen
- Aktuelle Entwicklungen an den österreichischen Bibliotheken 2015
- Rezensionen
- Graham Jefcoate: Deutsche Drucker und Buchhändler in London 1680–1811. Strukturen und Bedeutungen des deutschen Anteils am englischen Buchhandel (Archiv für Geschichte des Buchwesens, Studien; 12), Berlin: De Gruyter, 2015. 611 S., 139,95 €
- The German book in Wolfenbüttel and abroad: studies presented to Ulrich Kopp in his retirement. Ed. by William A. Kelly and Jürgen Beyer. (Studies in reading and book culture; 1) Tartu: University of Tartu Press, 2014. 344 S., Ill. ISBN 978-9949-32-494-1, $ 44,00
- Holger Böning; Iwan-Michelangelo D’Aprile; Hanno Schmitt; Reinhart Siegert (Hg.): Selbstlesen – Selbstdenken – Selbstschreiben. Prozesse der Selbstbildung von „Autodidakten“ unter dem Einfluss von Aufklärung und Volksaufklärung vom 17. bis zum 19. Jahrhundert. Mit 600 Kurzbiographien von Autodidakten im deutschen Sprachraum bis 1850 und Verzeichnissen von Bauernbibliotheken. Bremen: edition lumière, 2015. (Philanthropismus und populäre Aufklärung. Studien und Dokumente; Bd. 10). 552 S., s/w. Abb., Fest geb. ISBN 978-3-943245-35-6. € 44,80
- Vermarktungsstrategien für das Buch im multimedialen Raum. Eine interdisziplinäre Untersuchung. Hrsg. von Vincent Kaufmann. Wiesbaden: Harrassowitz, 2015. 238 S., 11 Abb., 22 Diagr., 19 Tab., br. (Buchwissenschaftliche Beiträge; 90 ) ISBN 978-3-447-10355-8 € 52,–
- „Der ganze Verlag ist einfach eine Bonbonniere“. Ullstein in der ersten Hälfte des 20. Jahrhunderts. Hg. von David Oels und Ute Schneider. Berlin, München, Boston: De Gruyter, 2015. 433 S., s./w. Abb. (Archiv für Geschichte des Buchwesens – Studien; 10). Fest geb. – ISBN 978-3-11-033708-2, e-ISBN (PDF) 978-3-11-033721-1, e-ISBN (EPUB) 978-3-11-038397-1, ISSN 2197-0351. € 119,95
- Jahresinhaltsverzeichnis 2016
- Jahresinhaltsverzeichnis 2016