Zu ihrer 19. Jahrestagung lud die European Society for Textual Scholarship (ESTS) im Herbst 2024 in die ungarische Hauptstadt, um Editionen im Zeitalter künstlicher Intelligenz zu diskutieren. Organisiert wurde die Tagung an der Eötvös Loránd Universiy vom Department of Digital Humanities (ELTE-DH), dem Institute of Hungarian Literature and Cultural Studies (ELTE-MIKTI) sowie der Research Group in Stylistics (ELTE-DiAGram).
Von zentraler Frage war in Budapest, wie stark KI die editionswissenschaftliche Arbeit in Theorie und Praxis in der dritten Dekade des 21. Jahrhunderts prägen könne bzw. werde. Es ging gleichermaßen um Chancen wie Risiken des Einsatzes von KI-Tools; neben theoretischen Ausführungen waren vor allem Erfahrungsberichte und die Beschreibung von Workflows in vergleichender Perspektive von besonderem Interesse, um Möglichkeiten und Grenzen des Einsatzes von KI in und für Editionen aufzuzeigen und zu diskutieren. Fragen zur (digitalen) Forschungsinfrastruktur spielten dabei ebenso mit hinein wie die Rolle von Korpora und korpuslinguistischen Methoden in den Geisteswissenschaften, etwa für die Annotation oder Kommentierung von Texten sowie für computergestützte Analysen. Das Thema bot den Teilnehmenden die Möglichkeit, grundsätzliche Fragen des Edierens (Für wen edieren wir?) und der Medialität (digital versus Print) zu diskutieren und sich zu fragen, welchen Nutzen die Editionswissenschaft aus KI-gestützten sogenannten ‚intelligenten Editionen‘ ziehen könne, auch für die einzelnen Philologien. So fand das durchaus heterogene Publikum mit spezialisierten Communities aus IT über DH bis zu ‚traditionell‘ ausgerichteten Editionswissenschaftlerinnen und Editionswissenschaftlern in genau diesen Fragen zueinander, sodass sich die sehr unterschiedlichen Positionen und Expertisen gut ergänzten und ein breites Spektrum an editionswissenschaftlichen Themen boten.[1] Im Folgenden sollen drei Beiträge der Konferenz stellvertretend für diese Themenvielfalt der Vorträge kurz zusammengefasst werden.
KI und Edition aus theoretischer Perspektive: Georg Vogeler (Graz) hielt eine der Keynotes zum Thema Talking to Machines. Scholarly Editing as an AI Engineering Task? Den Prozess des ‘Prompt Engineering’ deutete Vogeler als einen Erkenntnisprozess im durchaus hermeneutischen Sinn. In Anlehnung an Paul Ricœur und Hans-Georg Gadamer versuchte Vogeler mittels der Unterscheidung zwischen “Hermeneutics of Faith” versus “Hermeneutics of Suspicion” die Chancen und Risiken des Einsatzes generativer KI in der editorischen Praxis herauszustellen. Während Vogeler die Risiken wie etwa die Gefahr der Modellverzerrung (“bias of the model”) lediglich benannte, fanden die Vorteile ausführlichere Beachtung, darunter das Erzielen brauchbarer Ergebnisse aus LLM für die Erzeugung von Code, für die semantische Annotation oder für semantische Strukturanalysen.
Notwendige Infrastrukturen und Workflows: Zsófia Fellegi (Budapest) stellte in ihrem Vortrag Transitioning from Analogue to Born-Digital: Methodological Shifts in Publishing Medieval and Early Modern Central European Texts das vom Institute for Literary Studies seit 2014 bereitgestellte und seither kontinuierlich weiterentwickelte Portal DigiPhil (Digital Philology Project) vor, das verschiedene Features für Editionen und editionswissenschaftliche Belange anbietet und fortlaufend neue literaturwissenschaftliche Editionsprojekte integriert.[2] Die wichtigste Aufgabe des Portals bestehe darin, kritische Editionen in einer auf Wikibase basierenden Datenbank (ITIdata) zu generieren.[3] Neben der Bearbeitung gedruckter Editionen werden kritische ‘Born-digital’-Editionen mit einer virtuellen Forschungsumgebung erstellt. Fellegi stellte auch einen ‘Semantic Data Space’ vor: Aus einem semantischen Wissensgraphen werden die kritischen Editionen im Portal mit biographischen, bibliographischen und philologischen Daten angereichert. Ein semi-automatisch arbeitendes Open-Source-Tool namens Larex wird für die Layoutanalyse früher Buchdrucke entwickelt.
Methoden(-kritik) und Anwendungsszenarien: Relativ häufig in Vorträgen thematisiert wurde das Verfahren der ‘Handwritten Text Recognition’ (HTR). Während Tools zur (semi-)automatisierten Texterkennung handschriftlicher Texte für große Mengen von Texten aus einer (Schreiber-)Hand sehr zuverlässige Ergebnisse liefern, stellt der Einsatz von HTR-Tools für Einzelhandschriften und/oder in geringen Mengen überlieferte Kurztexte die Forschenden wesentlich stärker vor methodische und interpretatorische Herausforderungen. Ein solches Beispiel illustrierte Albrecht Hofheinz (Oslo) in seinem Beitrag Unlocking Arabic Manscripts. Imperfect HTR as a Stepping Stone for AI-Powered Analysis. Hofheinz schilderte anhand eines praktischen Beispiels von unter Zeitdruck und schwierigen Erhebungsbedingungen zu sichernden Handschriften in Timbuktu (“to work in the first place”) die Herausforderungen für zeiteffiziente, schnelle Lösungen der Texterkennung, die nicht der exakten Erfassung der Zeichen dienen, sondern vorrangig als Entzifferungshilfe zwecks eines schnellen Überblicks (“to get an idea what is the content of the manuscript”) zum Einsatz kommen. Hofheinz verglich verschiedene auf dem Markt befindliche Tools hinsichtlich ihrer Fehlerquote und der Adaptionsfähigkeit der Ergebnisse und kam dabei zu dem Ergebnis, dass manche der Tools quasi genre-sensibel arbeiten. Das bedeutet, dass diese Tools Texte ‚erkannten‘ und Bedeutung generierten, die so nicht auf den Überlieferungsträgern zu finden waren, aber im Genre (z. B. in der Hagiographie) allgemein vorkommen. Man könnte hier auch von Topoi sprechen. Er fand zudem heraus, dass LLMs trotz mangelhafter HTR-Ergebnisse doch verhältnismäßig gut performten. Gründe sah Hofheinz darin, dass in diesen Prozessen die Konzentration auf bekannte Wörter erfolge und sie nach Wahrscheinlichkeit verknüpft würden; weiterhin darin, dass Nicht-Wörter und “gibberish” ignoriert würden, sowie in der Fähigkeit, diagonal zu lesen, um das Wesentliche zu verstehen. Hofheinz stellte schließlich einen eigens entwickelten – in der folgenden Beschreibung stark verkürzten – Workflow von den Bilddaten über R-Analysen zu Textdaten hin zu LLM vor, das ohne Training der Texterkennung auskommen muss, da die von ihm untersuchten Handschriften nicht sehr umfangreich waren (oft nur eine Textseite) und von verschiedenen Schreibern stammten.
Für den vorliegenden Bericht wurden bewusst drei Beispiele an Vorträgen ausgewählt, die eng am Tagungsthema orientiert waren. Bemerkenswert war jedoch auch der – gemessen am Konferenzthema – hohe Anteil an Konferenzbeiträgen, die sich nicht explizit mit KI beschäftigten. Dies ist m. E. nicht als Statement gegen KI im Editionskontext zu bewerten (sonst wären die alternativen Themen sicher gar nicht erst auf einer Konferenz mit diesem Schwerpunkt eingereicht worden), sondern es dürfte vielfältige Gründe und Hintergründe haben. Einerseits handelt es sich beim Einsatz von KI in/für Editionen um ein relativ junges, sich aber vergleichsweise rasant entwickelndes Wissensfeld. Andererseits sollte man sich vor Augen halten, dass es nicht darum geht, bisher gängige Ansätze und Methoden zu ersetzen. Vielmehr spielt Methodenpluralität auch im Editionsbereich eine zunehmend gewichtige Rolle und erfährt durch die Entwicklungen im KI-Bereich eine besonders nachdrückliche (erneute) Legitimierung. In Budapest gelang der ausgesprochen schwierige Spagat, KI-skeptische wie KI-begeisterte Forschende an einen Tisch zu bringen.
© 2025 the author(s), published by Walter de Gruyter GmbH, Berlin/Boston
This work is licensed under the Creative Commons Attribution 4.0 International License.
Artikel in diesem Heft
- Titelseiten
- Was, wie und für wen wollen wir in Zukunft (noch) edieren?
- Einmal alles, bitte!
- Unfeste Buchstaben
- Was ist ein philosophischer Kommentar?
- Über Transformationen bei der Edition von Musik des 18. Jahrhunderts am Beispiel der Telemann-Edition
- Integration als Aufgabe der Goethe-Edition
- Die HKA als Wissensspeicher: Von der analogen zur digitalen Marburger Büchner-Ausgabe – Ausblick und Rückblick
- Mikrogenese in der digitalen Edition
- Edition ohne Transkription, oder: Wie wollen wir künftig große Briefkorpora erschließen?
- Kommentierung als Aufgabe der digitalen Briefedition
- Von der Forschung zur Vermittlung: Die digitale Franz und Franziska Jägerstätter Edition
- Kants Anteil an der Drucklegung der ‚Streitschrift gegen Eberhard‘ (1790, 1791)
- Berichte
- Textual Scholarship, Artificial Intelligence, Corpora and Intelligent Editions (ESTS 2024). Tagung an der Eötvös Loránd University, Budapest, 2.–4. Oktober 2024
- Textkritik, Metrik und Paläographie im Leben und Werk von Paul Maas. Tagung an der Georg-August-Universität Göttingen, 19. November 2024
- Editionen frühneuzeitlicher Texte im 21. Jahrhundert – Herausforderungen und Möglichkeiten. Workshop an der Universität Heidelberg, 20./21. Februar 2025
- Der wissenschaftliche Ort des Editorischen. Disziplinäre, interdisziplinäre und transdisziplinäre Perspektiven auf die Editionswissenschaft(en). Tagung an der Bergischen Universität Wuppertal, 25.–27. Februar 2025
- Lücken-Texte. Editorische Erschließung verschollener Briefe. Internationale Tagung am Brenner-Archiv der Universität Innsbruck, 19.–21. März 2025
- Digitale Quelleneditionen und KI: Aktuelle Tendenzen, Herausforderungen und Probleme. Workshop an der Herzog August Bibliothek Wolfenbüttel, 10./11. April 2025
- Rezensionen
- Sophia Victoria Krebs: Briefe lesen. Semiotik, Materialität und Praxeologie im deutschen Brief von Mitte des 18. bis Mitte des 19. Jahrhunderts. Göttingen: Wallstein 2024, 588 S.
- Provenienz. Materialgeschichte(n) der Literatur. Hrsg. von Sarah Gaber, Stefan Höppner und Stefanie Hundehege. Göttingen: Wallstein 2024 (Kulturen des Sammelns. Akteure – Objekte – Medien. 9), 375 S., auch digital im ‘open access’ zugänglich: https://doi.org/10.15499/kds-009.
- Andreas Gerards: Dichten und Denken – Der „Gang“ ins Wirkliche. Studien zur Poetologie von Ernst Meisters Metapoesie. Baden-Baden: Rombach 2023, 553 S.
- Anschriften
- Anschriften
- Formblatt zur Einrichtung satzfertiger Manuskripte
- Formblatt zur Einrichtung satzfertiger Manuskripte
Artikel in diesem Heft
- Titelseiten
- Was, wie und für wen wollen wir in Zukunft (noch) edieren?
- Einmal alles, bitte!
- Unfeste Buchstaben
- Was ist ein philosophischer Kommentar?
- Über Transformationen bei der Edition von Musik des 18. Jahrhunderts am Beispiel der Telemann-Edition
- Integration als Aufgabe der Goethe-Edition
- Die HKA als Wissensspeicher: Von der analogen zur digitalen Marburger Büchner-Ausgabe – Ausblick und Rückblick
- Mikrogenese in der digitalen Edition
- Edition ohne Transkription, oder: Wie wollen wir künftig große Briefkorpora erschließen?
- Kommentierung als Aufgabe der digitalen Briefedition
- Von der Forschung zur Vermittlung: Die digitale Franz und Franziska Jägerstätter Edition
- Kants Anteil an der Drucklegung der ‚Streitschrift gegen Eberhard‘ (1790, 1791)
- Berichte
- Textual Scholarship, Artificial Intelligence, Corpora and Intelligent Editions (ESTS 2024). Tagung an der Eötvös Loránd University, Budapest, 2.–4. Oktober 2024
- Textkritik, Metrik und Paläographie im Leben und Werk von Paul Maas. Tagung an der Georg-August-Universität Göttingen, 19. November 2024
- Editionen frühneuzeitlicher Texte im 21. Jahrhundert – Herausforderungen und Möglichkeiten. Workshop an der Universität Heidelberg, 20./21. Februar 2025
- Der wissenschaftliche Ort des Editorischen. Disziplinäre, interdisziplinäre und transdisziplinäre Perspektiven auf die Editionswissenschaft(en). Tagung an der Bergischen Universität Wuppertal, 25.–27. Februar 2025
- Lücken-Texte. Editorische Erschließung verschollener Briefe. Internationale Tagung am Brenner-Archiv der Universität Innsbruck, 19.–21. März 2025
- Digitale Quelleneditionen und KI: Aktuelle Tendenzen, Herausforderungen und Probleme. Workshop an der Herzog August Bibliothek Wolfenbüttel, 10./11. April 2025
- Rezensionen
- Sophia Victoria Krebs: Briefe lesen. Semiotik, Materialität und Praxeologie im deutschen Brief von Mitte des 18. bis Mitte des 19. Jahrhunderts. Göttingen: Wallstein 2024, 588 S.
- Provenienz. Materialgeschichte(n) der Literatur. Hrsg. von Sarah Gaber, Stefan Höppner und Stefanie Hundehege. Göttingen: Wallstein 2024 (Kulturen des Sammelns. Akteure – Objekte – Medien. 9), 375 S., auch digital im ‘open access’ zugänglich: https://doi.org/10.15499/kds-009.
- Andreas Gerards: Dichten und Denken – Der „Gang“ ins Wirkliche. Studien zur Poetologie von Ernst Meisters Metapoesie. Baden-Baden: Rombach 2023, 553 S.
- Anschriften
- Anschriften
- Formblatt zur Einrichtung satzfertiger Manuskripte
- Formblatt zur Einrichtung satzfertiger Manuskripte