Home Social Sciences „Ich habe 5 geeignete Belege zum Lemma ‚Cholera‘ aus der historischen Korpusdatei ausgewählt.“ – Experimentelle Untersuchung zur KI-gestützten Belegextraktion für die digitale Lexikografie
Article
Licensed
Unlicensed Requires Authentication

„Ich habe 5 geeignete Belege zum Lemma ‚Cholera‘ aus der historischen Korpusdatei ausgewählt.“ – Experimentelle Untersuchung zur KI-gestützten Belegextraktion für die digitale Lexikografie

  • Susanne Kabatnik

    Professur für Digitale Lexikografie

    EMAIL logo
    and Rukiye Smilla Burkart EMAIL logo
Published/Copyright: November 20, 2025
Become an author with De Gruyter Brill

Abstract

The curation of authentic usage examples is a key component of lexicographical practice, traditionally performed manually. With growing access to AI applications, especially LLMs like ChatGPT, new opportunities for automating this process have emerged. This study investigates the suitability of AI-supported methods for selecting dictionary examples by conducting an experiment using cholera-related corpus data from the Pandemictionary (University of Trier). The experiment involved prompting ChatGPT with definitions and corpus examples and comparing its selections to those of a trained human assistant. Results show that ChatGPT currently identifies significantly fewer suitable examples. Selected items are often redundant, semantically inaccurate, stylistically flawed, or syntactically complex. Some examples even contain hallucinations. These findings highlight the limitations of current LLMs and underscore the need for human oversight. They also suggest improvements for prompt engineering and system training, including more specific instructions, feedback loops, and integration of lexical background knowledge to enhance semantic precision.

Über den Autor / die Autorin

Prof. Dr. Susanne Kabatnik

Professur für Digitale Lexikografie

Online erschienen: 2025-11-20
Erschienen im Druck: 2025-11-18

© 2025 Walter de Gruyter GmbH, Berlin/Boston

Articles in the same Issue

  1. Titelei
  2. Thematic Part: Beispiel, Beleg, Quelle Exemplifizieren, Dokumentieren und Verifizieren im Wörterbuch
  3. Beleg und Beispiel im Wörterbuch
  4. Vollstes Verständnis? Lateinisch-volkssprachige Glossen als Belegzitate im Althochdeutschen Wörterbuch*
  5. Zum Zusammenspiel von Beleginterpretation und Bedeutungshypothese(n) im Frühneuhochdeutschen Wörterbuch (FWB) – Beobachtungen anhand des Artikels schwarz
  6. Die Qual der Wahl – unterliegt strengen Regeln: Zu Belegauswahl und Belegaufnahme beim Deutschen Rechtswörterbuch
  7. Vom Quellentext über das Belegarchiv ins Autorenwörterbuch: der lexikografische Weg der Goethe-Belege
  8. Aufgaben literarischer Korpora und literarischer Belege für die Lexikographie. Grundlagen und Beispiele zum neueren Deutsch
  9. „Choleraausbruch zwang zur Rückkehr“ – die Auswahl von Beispielen für das Pandemictionary-Projekt als lexikografisches Linked Open Data-Netzwerk
  10. Ein regelbasierter Ansatz für eine Type-Token-Zuordnung in historischen Wörterbuchbelegen
  11. „Ich habe 5 geeignete Belege zum Lemma ‚Cholera‘ aus der historischen Korpusdatei ausgewählt.“ – Experimentelle Untersuchung zur KI-gestützten Belegextraktion für die digitale Lexikografie
  12. Non-thematic Part
  13. Elwyn’s Glossary of Supposed Americanisms (1859): its lexicographical practice reconsidered
  14. Das „Uigurische Wörterbuch“ (UW): Alttürkische Lexik an der Seidenstraße
  15. Defining relationships in the constructional network: A Semantic Web ontology for Construction Grammar
  16. Reviews
  17. Mittelhochdeutsches Wörterbuch, vol. 1: a–êvrouwe, 2224 Spalten (2006–2013), edd. Kurt Gärtner/Klaus Grubmüller/Karl Stackmann, vol. 2: êvüegerin–iruele, 1988 Spalten (2013–2021), vol. 3/1: irzen–kochlêhen, Spalten 1–414 (2021), vol. 3/2: kochman–lancbeiten, Spalten 415–850 (2023), vol. 3/3: lancbeitic–lônen, Spalten 851–1250 (2024), edd. Kurt Gärtner/Klaus Grubmüller/Jens Haustein. Stuttgart: Hirzel, 2006–2024.
  18. Reports
  19. Interdisziplinäre Lexikografie – Lexikografie in und für die Gesellschaft
  20. Lexicography in Higher Education
  21. European Master in Lexicography: The power of linguistic and cultural diversity
Downloaded on 13.12.2025 from https://www.degruyterbrill.com/document/doi/10.1515/lex-2025-0009/html
Scroll to top button