Martin Scholz ist Informatiker an der Universitätsbibliothek Erlangen-Nürnberg. Als Leiter der dortigen Gruppe Digitale Entwicklung und Datenmanagement beschäftigt er sich viel mit Webtechniken und Datentransformation. Er setzt sich mit der aktuellen ABI-Techik-Frage auseinander: Wie können Daten im Web mit JSON nachgenutzt werden?

Auch wenn man auf Webseiten und Datenportalen eher selten JSON-Dateien zum Download angeboten bekommt, ist dieses Datenformat im Internet mittlerweile omnipräsent. Denn der Datenaustausch hinter den Kulissen zwischen Servern, Webanwendungen und Apps wird häufig darüber abgewickelt. Mit diesem Wissen und einigen grundlegenden Web-Kenntnissen steht damit ein riesiger Datenschatz zur eigenen Verwertung offen: Die Anfragen, die eine App oder Webseite im Hintergrund an einen Server stellt, laufen in der Regel über generische Protokolle und können auch ohne diese Programme abgesetzt werden. Nicht wenige Datenanbieter öffnen mittlerweile auch offiziell diese Schnittstellen für interessierte Endanwender*innen, mitsamt Dokumentation. Beispiele sind Twitter, Facebook, aber auch Kulturinstitutionen wie MoMA, Rijksmuseum oder auch das Biodiversitätsportal GBIF. Ebenso sind die großen modernen Bibliothekssysteme vertreten.[1]
JSON ist wie XML ein hierarchisches Format, das Daten ausgehend von einem Wurzelelement verschachtelt organisiert. Da JSON textbasiert ist, braucht es prinzipiell keine speziellen Programme zur Verarbeitung. Mit einem modernen Browser – insbesondere seinen „Entwickler-Tools“ – und einem Texteditor wie Notepad++[2] hat man eigentlich alles, was es zum gelegentlichen Aufstöbern, Abgreifen, Betrachten, Erstellen und Verarbeiten von JSON-Dateien braucht. Für das effiziente Arbeiten gibt es je nach Einsatzszenario zahlreiche Tools mit JSON-Unterstützung. So können API-Test-Programme wie Postman[3] komplexe Schnittstellenanfragen verwalten und wiederholt ausführen sowie die Ergebnisse darstellen. OpenRefine[4] bietet vielfältige Möglichkeiten, JSON-Daten in eine tabellarische Form umzuwandeln oder darin einzubetten. Programmiererfahrene wiederum schöpfen aus einem reichen Fundus an Libraries. Wer häufiger JSON-Daten weiterverarbeitet, zusammenführt oder erstellt, für den ist die Linux-Kommandozeile mit ihren vielen kleinen Programmen wie curl, sed und grep eine unverzichtbare Hilfe. Sie macht Aufgaben und Auswertungen skriptbar und automatisierbar.
Hervorzuheben ist hierbei das Kommandozeilenprogramm jq.[5] Es kann als Pendant zu XPath und XQuery aus der XML-Welt verstanden werden. jq benutzt das Konzept der Pipe, bei dem kleine, einfache Befehle nacheinander auf Ausgangsdaten angewandt werden. Damit lassen sich komplexe Transformationen konstruieren. Zudem stehen Befehle bereit, die die Daten in Zielformate wie CSV ausgeben, die wiederum leicht in Programmen wie Excel nachnutzbar sind. Wer sich mit der Kommandozeile schwertut, kann mit jqplay[6] auf eine einfache, webbasierte Oberfläche mit weitgehend identischem Funktionsumfang zurückgreifen.
Die Liste ließe sich fortsetzen, doch würde das dem Format nicht gerecht: JSON ist aus pragmatischen Überlegungen hervorgegangen, und so sollte man ihm begegnen.
About the author

Martin Scholz
© 2023 bei den Autoren, publiziert von De Gruyter.
Dieses Werk ist lizensiert unter einer Creative Commons Namensnennung 4.0 International Lizenz.
Articles in the same Issue
- Titelseiten
- Editorial
- Fachbeiträge
- Sources Online: Eine nachhaltige Infrastruktur für digitale wissenschaftliche Texteditionen auf der Grundlage von TEI Publisher und IIIF
- Towards Research Software-ready Libraries
- Modernes Archiv in historischem Gebäude – 10 Jahre Erfahrungen
- Die 365-Tage-Bibliothek von Uster (Schweiz)
- Klimawandel und Schädlinge in Bibliotheken und Archiven
- ABI Technik-Preis
- Orte des Austauschs
- Tagungsbericht
- 7th Kuopio Conference „Review and Renew: Changing Strategies in Collection Management“ (Wien, 2022): Bewährtes behalten und Neues umsetzen
- Nachrichten
- Nachrichten
- Produktinformation
- Produktinformationen
- ABI Technik-Frage
- Wie können Daten im Web mit JSON nachgenutzt werden?
- Rezension
- Klaus Gantert, Margrit Lauber-Reymann: Informationsressourcen: Ein Handbuch für Bibliothekare und Informationsspezialisten. 3., vollständig aktualisierte und erweiterte Auflage. Berlin, Boston: De Gruyter Saur, 2023. (Bibliotheks- und Informationspraxis; 72). XIV, 718 S., Ill. – Print und eBook (Open Access), ISBN 978-3-11-067321-0 (Taschenbuch), e-ISBN (PDF) 978-3-11-067327-2, e-ISBN (EPUB) 978-3-11-067332-6. Taschenbuch € 84,95
- Veranstaltungskalender
- Veranstaltungskalender
Articles in the same Issue
- Titelseiten
- Editorial
- Fachbeiträge
- Sources Online: Eine nachhaltige Infrastruktur für digitale wissenschaftliche Texteditionen auf der Grundlage von TEI Publisher und IIIF
- Towards Research Software-ready Libraries
- Modernes Archiv in historischem Gebäude – 10 Jahre Erfahrungen
- Die 365-Tage-Bibliothek von Uster (Schweiz)
- Klimawandel und Schädlinge in Bibliotheken und Archiven
- ABI Technik-Preis
- Orte des Austauschs
- Tagungsbericht
- 7th Kuopio Conference „Review and Renew: Changing Strategies in Collection Management“ (Wien, 2022): Bewährtes behalten und Neues umsetzen
- Nachrichten
- Nachrichten
- Produktinformation
- Produktinformationen
- ABI Technik-Frage
- Wie können Daten im Web mit JSON nachgenutzt werden?
- Rezension
- Klaus Gantert, Margrit Lauber-Reymann: Informationsressourcen: Ein Handbuch für Bibliothekare und Informationsspezialisten. 3., vollständig aktualisierte und erweiterte Auflage. Berlin, Boston: De Gruyter Saur, 2023. (Bibliotheks- und Informationspraxis; 72). XIV, 718 S., Ill. – Print und eBook (Open Access), ISBN 978-3-11-067321-0 (Taschenbuch), e-ISBN (PDF) 978-3-11-067327-2, e-ISBN (EPUB) 978-3-11-067332-6. Taschenbuch € 84,95
- Veranstaltungskalender
- Veranstaltungskalender