Home Redewiedergabe – Schritte zur automatischen Erkennung
Article
Licensed
Unlicensed Requires Authentication

Redewiedergabe – Schritte zur automatischen Erkennung

  • Annelen Brunner EMAIL logo
Published/Copyright: April 10, 2019

Abstract

This contribution presents a quantitative approach to speech, thought and writing representation (ST&WR) and steps towards its automatic detection. Automatic detection is necessary for studying ST&WR in a large number of texts and thus identifying developments in form and usage over time and in different types of texts. The contribution summarizes results of a pilot study: First, it describes the manual annotation of a corpus of short narrative texts in relation to linguistic descriptions of ST&WR. Then, two different techniques of automatic detection – a rule-based and a machine learning approach – are described and compared. Evaluation of the results shows success with automatic detection, especially for direct and indirect ST&WR.

Literatur

Breiman, Leo (2001): Random Forests. Machine Learning 45(1), 5–32.10.1023/A:1010933404324Search in Google Scholar

Breiman, Leo & Adele Cutler (o. J.): Random Forests. https://www.stat.berkeley.edu/~breiman/RandomForests (6.12.2018).Search in Google Scholar

Brunner, Annelen (2015): Automatische Erkennung von Redewiedergabe. Ein Beitrag zur quantitativen Narratologie (Narratologia 47). Berlin u. a.: De Gruyter.10.1515/9783110417425Search in Google Scholar

Brunner, Annelen, Stefan Engelberg, Fotis Jannidis, Ngoc Duyen Tanja Tu & Lukas Weimer (2018): Projektvorstellung: Redewiedergabe. Eine literatur- und sprachwissenschaftliche Korpusanalyse. Konferenzabstracts der DHd 2018. Kritik der digitalen Vernunft, 458–460. Köln. http://dhd2018.uni-koeln.de/wp-content/uploads/boa-DHd2018-web-ISBN.pdf (6.12.2018).Search in Google Scholar

Chiticariu, Laura, Yunyao Li & Frederick R Reiss (2013): Rule-Based Information Extraction is Dead! Long Live Rule-Based Information Extraction Systems! Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing, 827–832. Seattle. http://www.aclweb.org/anthology/D13-1079 (6.12.2018).Search in Google Scholar

Chollet, François (2018): Deep Learning with Python. Shelter Island: Manning.Search in Google Scholar

Cunningham, Hamish, Valentin Tablan, Angus Roberts & Kalina Bontcheva (2013): Getting More Out of Biomedical Documents with GATE’s Full Lifecycle Open Source Text Analytics. PLoS Computational Biology 9(2). https://doi.org/10.1371/journal.pcbi.1002854 (6.12.2018).10.1371/journal.pcbi.1002854Search in Google Scholar

Eisenberg, Peter (2013): Grundriss der deutschen Grammatik. Bd. 2: Der Satz / unter Mitarb. von Rolf Thieroff. 4. aktualisierte und überarb. Aufl. Stuttgart, Weimar: Metzler.10.1007/978-3-476-00743-8Search in Google Scholar

Estabrooks, Andrew, Taeho Jo & Nathalie Japkowicz (2004): A Multiple Resampling Method for Learning from Imbalanced Data Sets. Computational Intelligence 20(1). 18–36. https://doi.org/10.1111/j.0824-7935.2004.t01-1-00228.x (6.12.2018).10.1111/j.0824-7935.2004.t01-1-00228.xSearch in Google Scholar

Fabricius-Hansen, Cathrine (2001): Wessen Redehintergrund? Reportive Modalität aus textorientierter kontrastiver Sicht (Deutsch – Norwegisch – Englisch). Reports of the project Languages in Contrast (Språk in kontrast) 14. 1–27.Search in Google Scholar

Fludernik, Monika (1993): The fictions of language and the languages of fiction. The linguisitic representation of speech and consciousness. London, New York: Routledge.Search in Google Scholar

Genette, Gérard (2010): Die Erzählung (UTB 8083). 3., durchges. und korrigierte Aufl. Paderborn: Fink.10.36198/9783838580838Search in Google Scholar

Gius, Evelyn & Janina Jacke (2016): Zur Annotation narratologischer Kategorien der Zeit. Guidelines zur Nutzung des CATMA-Tagsets (Version 2.0). Hamburg. http://heureclea.de/wp-content/uploads/2016/11/guidelinesV2.pdf (6.12.2018).Search in Google Scholar

Harras, Gisela, Edeltraud Winkler, Sabine Erb & Kristel Proost (2004): Handbuch deutscher Kommunikationsverben. Teil 1: Wörterbuch. Berlin u. a.: De Gruyter.10.1515/9783110201659Search in Google Scholar

Helbig, Gerhard & Joachim Buscha (2011): Deutsche Grammatik. Ein Handbuch für den Ausländerunterricht. Berlin u. a.: Langenscheidt.Search in Google Scholar

Hirschmann, Hagen (2015): Modifikatoren im Deutschen. Ihre Klassifizierung und varietätenspezifische Verwendung (Studien Zur Deutschen Grammatik 89). Tübingen: Stauffenburg.Search in Google Scholar

Ide, Nancy & James Pustejovsky (Hrsg.) (2017): Handbook of Linguistic Annotation. Vol. 1. Dodrecht: Springer.10.1007/978-94-024-0881-2Search in Google Scholar

Jannidis, Fotis, Leonard Konle, Albin Zehe, Andreas Hotho & Markus Krug (2018): Analysing Direct Speech in German Novels. Konferenzabstracts der DHd 2018. Kritik der Digitalen Vernunft, 114–118. Köln. http://dhd2018.uni-koeln.de/wp-content/uploads/boa-DHd2018-web-ISBN.pdf (6.12.2018).Search in Google Scholar

Jockers, Mattew (2013): Macroanalysis. Digital Methods and Literary History. Champaign: University of Illinois Press.10.5406/illinois/9780252037528.001.0001Search in Google Scholar

Kaufmann, Gerhard (1976): Die indirekte Rede und mit ihr konkurrierende Formen der Redeerwähnung (Heutiges Deutsch. Reihe III: Linguistisch-didaktische Untersuchungen des Goethe-Instituts 1). München: Hueber.Search in Google Scholar

Leech, Geoffrey & Mick Short (2013): Style in fiction. A linguistic introduction to English fictional prose. 2. Aufl. London u. a.: Routledge.10.2307/1772012Search in Google Scholar

Liaw, Andy & Matthew Wiener (2002): Classification and Regression by randomForest. R News 2/3. 18–22. https://www.researchgate.net/publication/228451484_Classification_and_Regression_by_RandomForest (6.12.2018).Search in Google Scholar

Manning, Christopher D., Prabhakar Raghavan & Hinrich Schütze (2008): Introduction to Information Retrieval. New York: Cambridge University Press.10.1017/CBO9780511809071Search in Google Scholar

Martínez, Matías & Michael Scheffel (2016): Einführung in die Erzähltheorie (C. H. Beck Studium). 10. Aufl. München: C. H. Beck.10.17104/9783406705243Search in Google Scholar

Moretti, Franco (2005): Graphs, Maps, Trees. Abstract Models for a Literary History. London: Verso.Search in Google Scholar

Schiller, Anne, Simone Teufel, Christine Stöckert & Christine Thielen (1999): Guidelines für das Tagging deutscher Textkorpora mit STTS (Kleines und großes Tagset). Institut für Maschinelle Sprachverarbeitung (Universität Stuttgart) / Seminar für Sprachwissenschaft (Universität Tübingen). http://www.ims.uni-stuttgart.de/projekte/corplex/TagSets/stts-1999.pdf (6.12.2018).Search in Google Scholar

Schmid, Helmut (1994): Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing. Manchester, UK. http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/tree-tagger1.pdf (6.12.2018)Search in Google Scholar

Schmid, Helmut (1995): Improvements on Part-of-Speech Tagging with an Application to German. Proceedings of the ACL SIGDAT-Workshop. Dublin, Ireland. http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/tree-tagger2.pdf (6.12.2018)10.1007/978-94-017-2390-9_2Search in Google Scholar

Schmid, Helmut & Florian Laws (2008): Estimation of Conditional Probabilities With Decision Trees and an Application to Fine-Grained POS Tagging. COLING 2008. Manchester, UK. http://www.cis.uni-muenchen.de/~schmid/papers/Schmid-Laws.pdf (6.12.2018)10.3115/1599081.1599179Search in Google Scholar

Schöch, Christof, Daniel Schlör, Stefanie Popp, Annelen Brunner & José Calvo Tello (2016): Straight talk! Automatic Recognition of Direct Speech in Nineteenth-century French Novels. Digital Humanities 2016, 346–353. Jagiellonian University & Pedagogical University, Kraków. http://dh2016.adho.org/static/data/132.html (6.12.2018).Search in Google Scholar

Semino, Elena & Mick Short (2004): Corpus stylistics. Speech, writing and thought presentation in a corpus of English writing. London, New York: Routledge.10.4324/9780203494073-7Search in Google Scholar

Stanzel, Franz K. 2008. Theorie des Erzählens (UTB 904). 8. Aufl. Göttingen: Vandenhoeck & Ruprecht.Search in Google Scholar

Steen, Gerard J., Aletta G. Dorst, J. Berenike Herrmann, Anna A. Kaal, Tina Krennmayr & Trijntja Pasma (2010): A Method for Linguistic Metaphor Identification. Amsterdam, Philadelphia: John Benjamins.10.1075/celcr.14Search in Google Scholar

Strecker, Bruno (2009): Er sagte, dass er aus Ulm kommt, komme, käme oder kommen würde? – Mit dass eingeleitete indirekte Redewiedergabe (Teil 1). https://grammis.ids-mannheim.de/fragen/160 (6.12.2018).Search in Google Scholar

Wehde, Susanne (2000): Typographische Kultur: eine zeichentheoretische und kulturgeschichtliche Studie zur Typographie und ihrer Entwicklung (Studien und Texte zur Sozialgeschichte der Literatur 69). Tübingen: Niemeyer.10.1515/9783110945799Search in Google Scholar

Weinrich, Harald (2005): Textgrammatik. 3. Aufl. Hildesheim u. a.: Olms.Search in Google Scholar

Witten, Ian A., Eibe Frank & Mark A. Hall. 2011. Data Mining. Practical Machine Learning Tools and Techniques. 3. Aufl. Amsterdam u. a.: Morgan Kaufmann.10.1016/B978-0-12-374856-0.00001-8Search in Google Scholar

Wöllstein, Angelika & Dudenredaktion (Hrsg.) (2016): Duden. Die Grammatik. 9. Aufl. Bd. 4. Berlin: Dudenverlag.Search in Google Scholar

Zifonun, Gisela, Ludger Hoffmann & Bruno Strecker (1997): Grammatik der deutschen Sprache (Schriften des Instituts für Deutsche Sprache 7). Bd. 3. Berlin u. a.: De Gruyter.Search in Google Scholar

Published Online: 2019-04-10
Published in Print: 2019-04-08

© 2019 Walter de Gruyter GmbH, Berlin/Boston

Downloaded on 9.9.2025 from https://www.degruyterbrill.com/document/doi/10.1515/zgl-2019-0007/pdf
Scroll to top button