Spracherkennungssysteme im Übersetzungsprozess: Möglichkeiten und Grenzen
Abstract
This paper examines the potential of modern speech recognition systems, inter alia if and to what extent the use of speech recognition software has an impact on text production efficiency, translation efficiency and translation quality. Eight experiments were conducted, using the market-leading software Dragon NaturallySpeaking 12. It was shown that dictating text is considerably faster than typing, and that there is no significant quality difference between dictated and typed translations. Although, from an objective point of view, speech recognition does increase productivity, the majority of the test persons felt uncomfortable with it because of the enormous mental strain of formulating sentences in formal standard language.
Abkürzungen
- DNS
Dragon NaturallySpeaking
- HMM, Pl. HMMs
Hidden-Markov-Modell
- IPA
International Phonetic Association
- DARPA
Defense Advanced Research Projects Agency
Quellenverzeichnis
Literaturverzeichnis
Amazon (2013): „Bestseller in Spracherkennung und Sprachsteuerung.“ http://www.amazon.de/gp/bestsellers/software/12760531/ref=pd_zg_hrsr_sw_3_4_last (5.7.2013)Suche in Google Scholar
Apple: „Weitere Infos zu Siri.“ http://www.apple.com/de/ios/siri/siri-faq/ (25.6.2013)Suche in Google Scholar
ASKA Spracherkennungssysteme GmbH [1]: „ASKA SmartVoice.“ http://www.aska.de/spracherkennung/industrie/ (14.7.2013)Suche in Google Scholar
ASKA Spracherkennungssysteme GmbH [2]: „Dragon NaturallySpeaking. Von gesprochener Sprache zum getippten Text.“ http://www.mikrofone24.de/Spracherkennung/Dragon-NaturallySpeaking?sPage=1&sPerPage=48 (14.7.2013)Suche in Google Scholar
Augst, Gerhard (1975): Untersuchungen zum Morpheminventar der deutschen Gegenwartssprache. Forschungsberichte des Instituts für deutsche Sprache 25. Tübingen: Narr.Suche in Google Scholar
Aust, Harald / Oerder, Martin / Seide, Frank / Steinbiss, Volker (1995): „The Philips automatic train timetable information system.“ Speech Communication 17 (1995), 249–262.Suche in Google Scholar
Best, Karl-Heinz (2004/2005): „Laut- und Phonemhäufigkeiten im Deutschen.“ Göttinger Beiträge zur Sprachwissenschaft Heft 10/11. Göttingen: Peust & Gutschmidt, 21–32.Suche in Google Scholar
Blanding, Michael (2012): „Speechless.“ Tufts Magazine Fall 2012. http://www.tufts.edu/alumni/magazine/fall2012/features/speechless.html (20.5.2013)Suche in Google Scholar
Carstensen, Kai-Uwe (2012): „Sprachtechnologie. Ein Überblick.“ http://www.kai-uwe-carstensen.de/Publikationen/Sprachtechnologie.pdf (20.5.2013)Suche in Google Scholar
Carstensen, Kai-Uwe et al. (Hrsg.) (2004): Computerlinguistik und Sprachtechnologie. Eine Einführung. München: Elsevier, Spektrum Akademischer Verlag.Suche in Google Scholar
Chomsky, Noam (1956): „Three models for the description of language.“ IRE Transactions on Information Theory 2, 113–124.10.1109/TIT.1956.1056813Suche in Google Scholar
Coleman, John (2005): Introducing Speech and Language Processing. Cambridge: Cambridge University Press.Suche in Google Scholar
Datatronic Beka Technologies GmbH (2009): „High Speech – das Digitale Diktat – einfach optimal!“ http://www.digitales-diktat.de/images/stories/public_downloads/high-speech_allgemein.pdf (14.7.2013)Suche in Google Scholar
de Korte, Elsbeth M. / van Lingen, Piet (2006): „The effect of speech recognition on working postures, productivity and the perception of user friendliness.“ Applied Ergonomics 37 (2006), 341–347.Suche in Google Scholar
Diktierportal: „Spracherkennung.“ http://www.diktierportal.de/alle-Diktiergeraete/Spracherkennung:58_53.html?gclid=CPOMpfvfmLgCFbQetAodGEAA5w (4.8.2013)Suche in Google Scholar
Draxler, Christoph (2004): „Sprachdatenbanken.“ Carstensen, Kai-Uwe et al. (Hrsg.) (2004): 440–447.Suche in Google Scholar
Duden (200022): Duden. Die deutsche Rechtschreibung. Mannheim, Leipzig, Wien, Zürich: Dudenverlag.Suche in Google Scholar
Duden (200423): Duden. Die deutsche Rechtschreibung. Mannheim, Leipzig, Wien, Zürich: Dudenverlag.Suche in Google Scholar
Duden (200624): Duden. Die deutsche Rechtschreibung. Mannheim, Leipzig, Wien, Zürich: Dudenverlag.Suche in Google Scholar
Duden (200925): Duden. Die deutsche Rechtschreibung. Mannheim, Wien, Zürich: Dudenverlag.Suche in Google Scholar
Duden (201326): Duden. Die deutsche Rechtschreibung. Berlin: Dudenverlag.Suche in Google Scholar
Duden: „Die Verteilung der Wortarten im Rechtschreibduden.“ http://www.duden.de/sprachwissen/sprachratgeber/die-verteilung-der-wortarten-im-rechtschreibduden (19.6.2013)Suche in Google Scholar
Eibner, Chantal (2012): Integratives Übersetzungsmanagement mit Translation Memory Systemen. Hamburg: Diplomica.Suche in Google Scholar
Frötschl, Bernhard/Lindstrot, Wolf (2004): „Wahrscheinlichkeitstheorie und Hidden-Markov-Modelle.“ Carstensen, Kai-Uwe et al. (Hrsg.) (2004): 111–137.Suche in Google Scholar
Furui, Sadaoki (2008): „History and Development of Speech Recognition.“ Chen, Fang / Jokinen, Kristiina (Hrsg.) (2008): Speech Technology. Theory and Applications. New York: Springer, 1–18Suche in Google Scholar
Gates, Bill (1995): The Road ahead. London: Viking.Suche in Google Scholar
Grant, David / McLarty Robert (2001): Business Basics. Oxford: Oxford University Press.Suche in Google Scholar
Haiber, Udo (2004): „Spracherkennungssysteme.“ Carstensen, Kai-Uwe et al. (Hrsg.) (2004): 524–531.Suche in Google Scholar
Hall, Alan T. (2011): Phonologie. Eine Einführung. Berlin, New York: De Gruyter.10.1515/9783110215885Suche in Google Scholar
Hansen, Gerd (2000) (Hrsg.): Spracherkennung in der Sonderpädagogik. Abschlussbericht eines Modellversuchs. Schulversuche und Bildungsforschung: Berichte und Materialien 88. Mainz: v. Hase & Köhler.Suche in Google Scholar
Haxer, Marc J. / Guinn, Leslie W. / Hogikyan, Norman D. (2001): „Use of Speech Recognition Software: A Vocal Endurance Test for the New Millennium?“ Journal of Voice Vol. 15 No. 2, 231–236.Suche in Google Scholar
Health Tech Wire (2011): „Uneingeschränkt verfügbar: Spracherkennung in der Wolke“ http://www.healthtechwire.de/nuance-communications/uneingeschraenkt-verfuegbar-spracherkennung-in-der-wolke-2700/ (5.7.2013)Suche in Google Scholar
Heyers, Peter et al. (2010): Erfolgreich starten als Rechtsanwalt. E-Book. Deutscher Anwaltverlag.Suche in Google Scholar
Hübener, Kai (1997): Akustische Segmentierung zur Erkennung gesprochener Sprache. Dissertation zur Erlangung des Doktorgrades am Fachbereich Informatik der Universität Hamburg.Suche in Google Scholar
International Phonetic Association (IPA): „The International Phonetic Alphabet (revised to 2005).“ http://www.langsci.ucl.ac.uk/ipa/IPA_chart_ %28C %292005.pdf (21.4.2013)Suche in Google Scholar
Intersteno (2013): „Regulations for the INTERSTENO competitions. 49th Intersteno Congress Ghent (Belgium) – 2013.“ http://www.intersteno.org/ (28.7.2013)Suche in Google Scholar
Jurafsky, Daniel / Martin, H. James (2000): Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Upper Saddle River, NJ: Prentice Hall.Suche in Google Scholar
Kämmerer, Bernhard R. (1990): Sprecherunabhängigkeit und Sprecheradaptation. Lösungsansätze für das Problem des Sprecherwechsels bei der automatischen Spracherkennung. Informatik-Fachberichte 244. Berlin et al.: Springer.10.1007/978-3-642-75832-4_2Suche in Google Scholar
Klabunde, Ralf (2004): „Automatentheorie und Formale Sprachen.“ Carstensen, Kai-Uwe et al. (Hrsg.) (2004): 63–90.Suche in Google Scholar
Köpcke, Klaus-Michael (1998): „Prototypische starke und schwache Verben der deutschen Gegenwartssprache.“ Forschungszentrum Deutscher Sprachatlas (1998) (Hrsg.): Germanistische Linguistik 141–142. Hildesheim, Zürich, New York: Olms, 45–60.Suche in Google Scholar
Kürschner, Wilfried (2008): Grammatisches Kompendium. Systematisches Verzeichnis grammatischer Grundbegriffe. UTB 1526. Tübingen, Basel: A. Francke.Suche in Google Scholar
Langer, Hagen (2004): „Syntax und Parsing.“ Carstensen, Kai-Uwe et al. (Hrsg.) (2004): 232–275.Suche in Google Scholar
Lewandowski, Theodor (1990): Linguistisches Wörterbuch. UTB 1518. Heidelberg, Wiesbaden: Quelle und Meyer.Suche in Google Scholar
LinguaConsult: „Shop für Dragon Spracherkennung.“ www.online-shop.linguaconsult.de/index.html?http://www.online-shop.linguaconsult.de/xaranshop_k001003s001_1.html (4.8.2013)Suche in Google Scholar
Linguatec (2006): „IBM und Linguatec entwickeln Spracherkennung weiter.“ http://www.linguatec.de/press/reports/voice_pro_11 (5.7.2013)Suche in Google Scholar
Linguatec [1]: „Systemanforderungen Voice Pro 12.“ http://www.linguatec.de/products/stt/voice_pro/sys_req (5.7.2013)Suche in Google Scholar
Linguatec [2]: „Voice Pro 12. Die professionelle Spracherkennung für alle Aufgaben.“ http://www.linguatec.de/products/stt/voice_pro (5.7.2013)Suche in Google Scholar
Linguatec [3]: „Voice Pro 12: Versionen im Vergleich.“ http://www.linguatec.de/products/stt/voice_pro/vp12_versions (14.7.2013)Suche in Google Scholar
Linguatec [4]: „Voice Pro Enterprise.“ http://www.linguatec.de/products/stt/vpe (29.7.2013)Suche in Google Scholar
Lübke, Diethard (2001): Lernwortschatz Deutsch. Imparare le parole tedesche. Deutsch-Italienisch. Ismaning: Hueber.Suche in Google Scholar
MediaInterface: „Firmenportrait.“ http://www.mediainterface.de/C1257A31002998AE/0586A6011DE09C26C1257A5D00404283/$FILE/Backgrounder.pdf (14.7.2013)Suche in Google Scholar
Meier, Helmut (1967): Deutsche Sprachstatistik. Zweiter Band. Hildesheim: Olms.Suche in Google Scholar
Meisenburg, Trudel / Selig, Maria (1998): Phonetik und Phonologie des Französischen. Stuttgart, Düsseldorf, Leipzig: Klett.Suche in Google Scholar
Menzerath, Paul (1954): Die Architektonik des deutschen Wortschatzes. Mit 14 Abbildungen und 24 Tabellen. Phonetische Studien 3. Bonn, Hannover, Stuttgart: Dümmler.Suche in Google Scholar
Mertin, Elvira (2006): Prozessorientiertes Qualitätsmanagement im Dienstleistungsbereich Übersetzen. Leipziger Studien zur angewandten Linguistik und Translatologie 2. Frankfurt a. M. et al.: Lang.Suche in Google Scholar
Newell, Allen (1978): „Harpy, production systems and human cognition.“ Carnegie Mellon University, Computer Science Department. Paper 2319. http://repository.cmu.edu/cgi/viewcontent.cgi?article=3352&context=compsci (22.6.2013)Suche in Google Scholar
Nuance Communications [1]: „360 I SpeechMagic SDK.“ http://www.nuance.de/products/speechmagic/index.htm (5.7.2013)Suche in Google Scholar
Nuance Communications [10]: „Produkte für den Mac.“ http://shop.nuance.de/DRHM/store?Action=DisplayCategoryProductListPage&SiteID=nuanceeu&Locale=de_DE&ThemeID=26429600&Env=BASE&categoryID=14068700 (14.7.2013)Suche in Google Scholar
Nuance Communications [2]: „Datenblätter und White Paper.“ http://www.nuance.de/for-business/by-product/dragon/product-resources/datasheets-whitepapers/index.htm (5.7.2013)Suche in Google Scholar
Nuance Communications [3]: „Diktieren / Spracherkennung.“ http://shop.nuance.de/DRHM/store?Action=DisplayCategoryProductListPage&SiteID=nuanceeu&Locale=de_DE&ThemeID=26429600&Env=BASE&categoryID=13534600 (5.7.2013)Suche in Google Scholar
Nuance Communications [4]: „Dragon NaturallySpeaking 12 Premium.“ http://shop.nuance.de/store/nuanceeu/de_DE/pd/ThemeID.26429600/productID.253365700Suche in Google Scholar
Nuance Communications [5]: „Dragon NaturallySpeaking 12. Funktionsmatrix. Funktionsvergleich nach Version.“ http://www.nuance.de/ucmprod/groups/dragon/@web-de/documents/collateral/nc_026622.pdf (5.7.2013)Suche in Google Scholar
Nuance Communications [6]: „Dragon NaturallySpeaking Premium.“ http://netherlands.nuance.com/consumenten/product/dragon-voor-pc/premium/index.htm (28.7.2013)Suche in Google Scholar
Nuance Communications [7]: „Kaufberechtigung für Einzelplatzlizenzen. Verifizierung der Kaufberechtigung.“ http://www.nuance.de/for-business/by-industry/education/education-validation/index.htm (5.7.2013)Suche in Google Scholar
Nuance Communications [8]: „Lösungen nach Branche.“ http://www.nuance.de/for-business/index.htm#!ind_sol_list (25.6.2013)Suche in Google Scholar
Nuance Communications [9]: „Nuance Certified Solutions Partner.“ http://www.nuance.de/sales/partners/solutions.asp (5.7.2013)Suche in Google Scholar
Ottmann, Angelika (2004): Translation-Memory-Systeme. Nutzen, Risiken, erfolgreiche Anwendung. Schenkenzell: GFT Verlag.Suche in Google Scholar
Posur, Winfried (2000): „Erfahrungen mit einem aktuellen Spracherkennungssystem bei der Erstellung von kardiologischen Arztbriefen.“ Herz 25 (2000/Nr. 6), 627–632.10.1007/PL00001976Suche in Google Scholar
Rauscher, Christoph (2000): Grundlagen der Spektrumanalyse. München: Rohde & Schwarz.Suche in Google Scholar
Ruske, Günther (1994): Automatische Spracherkennung. Methoden der Klassifikation und Merkmalsextraktion. München, Wien: Oldenbourg.10.1524/itit.1994.36.2.31Suche in Google Scholar
Sail Labs Technology AG (2010): „ SAIL LABS releases Media Mining Indexer version MMI 5.4.“ http://www.sail-labs.com/news-events/press-releases.html?tx_clpresse_pi1[showUid]=106 (14.7.2013)Suche in Google Scholar
Sail Labs Technology AG: „Media Mining Indexer.“ http://www.sail-labs.com/products/commercial-products/media-mining-indexer.html (14.7.2013)Suche in Google Scholar
Schank, Gerd / Schoenthal, Gisela (1983): Gesprochene Sprache. Eine Einführung in Forschungsansätze und Analysemethoden. Germanistische Arbeitshefte 18. Tübingen: Niemeyer.Suche in Google Scholar
Schmitt, Peter A. (2002): „Evaluierung von Translationsleistungen. Merkblatt zu den Klausur-Korrekturen/Anmerkungen.“ http://www.uni-leipzig.de/~ialt/merkblaetter/mrk-qkriterien.pdf (28.8.2013)Suche in Google Scholar
Schmitz, Ulrich (1992): Computerlinguistik. Eine Einführung. Opladen: Westdeutscher Verlag.10.1007/978-3-322-92483-4Suche in Google Scholar
Schukat-Talamazzini, Ernst Günter (1995): Automatische Spracherkennung. Grundlagen, statistische Modelle und effiziente Algorithmen. Braunschweig, Wiesbaden: Vieweg.Suche in Google Scholar
Seer, Marcel (2012): „Wie Blinde dank Siri das iPhone 4S nutzen können.“ http://t3n.de/news/blinde-dank-siri-iphone-4s-nutzen-382982/ (25.6.2013)Suche in Google Scholar
SIL International: „ISO 639 Code Tables.“ http://www-01.sil.org/iso639-3/codes.asp (18.5.2013)Suche in Google Scholar
Silverman, Daniel (2006): A Critical Introduction to Phonology. Of Sound, Mind, and Body. London, New York: Continuum.Suche in Google Scholar
Theobald, Elke (1992): Sprachwandel bei deutschen Verben. Flexionsklassenschwankungen starker und schwacher Verben. Tübingen: Narr.Suche in Google Scholar
Thumann P. / Topf S. / Feser A. / Erfurt C. / Schuler G. / Mahler V. (2008): „Digitale Spracherkennung in der Dermatologie. Eine Pilotuntersuchung unter medizinisch-ökonomischen Gesichtspunkten.“ Der Hautarzt 59 (2008/Nr. 2), 131–134.10.1007/s00105-007-1450-6Suche in Google Scholar
Turing, Alan M. (1950): „Computing Machinery and Intelligence.“ Mind Vol. 59 Issue 236, 433–460.Suche in Google Scholar
Universität Bonn (2004a): „Das Prinzip der Kurzzeitanalyse“ http://storage.sk.uni-bonn.de/Milca/ssv/content/ssv_s220.xhtml (5.6.2013)Suche in Google Scholar
Universität Bonn (2004b): „Definition, spektrale Auflösung, Transformationsintervall“ http://storage.sk.uni-bonn.de/Milca/ssv/content/ssv_s331.xhtml (4.8.2013)Suche in Google Scholar
Universität Bonn (2004c): „Glossar ‚Gesprochene Sprache‘“ http://storage.sk.uni-bonn.de/Milca/ssv/content/a3_glossar.xhtml#ssv_g313 (4.8.2013)Suche in Google Scholar
Warren, Richard M. / Sherman, Gary L. (1974): „Phonemic restorations based on subsequent context.“ Perception & Psychophysics Vol. 16 No. 1, 150–156.Suche in Google Scholar
Weinzierl, Stefan: „Einführung in die digitale Signalverarbeitung. Musterlösung 11. Aufgabenblatt. Fensterfunktionen.“ http://www.ak.tu-berlin.de/fileadmin/a0135/Unterrichtsmaterial/EDS_WS1213/Musterloesung_11_Aufgabenblatt_ws201213.pdfSuche in Google Scholar
Wiese, Richard (2011): Phonetik und Phonologie. UTB 3354. Paderborn: Fink.10.36198/9783838533544Suche in Google Scholar
Wikipedia (2013): „Dragon Naturally Speaking.“ http://de.wikipedia.org/wiki/Dragon_NaturallySpeaking (3.7.2013)Suche in Google Scholar
Windows [1]: „Einrichten der Spracherkennung.“ http://windows.microsoft.com/de-de/windows-vista/set-up-speech-recognition (14.7.2013)Suche in Google Scholar
Windows [2]: „Verwenden der Spracherkennung.“ http://windows.microsoft.com/de-DE/windows-8/using-speech-recognition (14.7.2013)Suche in Google Scholar
Winograd, Terry (1989): „Software für Sprachverarbeitung.“ Johannsen, Gerhard et al. (1989): Computer-Anwendungen. Heidelberg: Spektrum der Wissenschaft, 86–98.Suche in Google Scholar
Zue, Victor / Cole, Ron / Ward, Wayne (2010): „Speech Recognition.“ Cole et al. (2010): Survey of the State of the Art in Human Language Technology. Cambridge: Cambridge University Press, 3–9.Suche in Google Scholar
Abbildungsquellenverzeichnis
Abb. 1: eigene Grafik
Abb. 2: Hall 2011:7
Abb. 3: International Phonetic Association (IPA)
Abb. 4: Hübener 1997:10
Abb. 5: Jurafsky/Martin 2000:147
Abb. 6: Schukat-Talamazzini 1995:46
Abb. 7: Coleman 2005:75
Abb. 8: Universität Bonn 2004a
Abb. 9: Rauscher 2000:14
Abb. 10: eigene Grafik, nach Frötschl/Lindstrot 2004:125
Abb. 11–13: eigene Screenshots
Tabellenquellenverzeichnis
Tabellen 1–3 und 8–14: eigene Tabellen
Tabelle 4: eigene Tabelle, Quellen:
– Diktierportal
– LinguaConsult
– Linguatec [2]
– Linguatec [4]
– Nuance Communications [3]
– Nuance Communications [10]
Tabelle 5: eigene Tabelle, Quellen:
– MediaInterface
– Sail Labs Technology AG
– Sail Labs Technology AG 2010
Tabelle 6: eigene Tabelle, nach Hall 2011:19–21
Tabelle 7: eigene Tabelle, nach Hall 2011:6–8
© 2014 Walter de Gruyter GmbH, Berlin/Boston
Artikel in diesem Heft
- Titelseiten
- Titelseiten
- Artikel
- Spracherkennungssysteme im Übersetzungsprozess: Möglichkeiten und Grenzen
- The translator as an Intercultural Mediator. Translation and Cultural Influences
- Die Übersetzungen aus dem Deutschen durch die spanischen Klarissen
- Specialised Translation Assessment: Uncommon Senses and Other Stories
- Las Lettres d’une Péruvienne de Mme de Grafigny y sus traducciones españolas (1792, 1823, 1836)
- Compatibility of Specialized Bilingual English-Persian Dictionaries with Fundamental Lexicography Criteria
- Rezension
- Gerzymisch, Heidrun (Hg.) (2013): Translation als Sinngebung. MitSprache: Translatorische Forschungsbeiträge. Münster: LIT Verlag, 232 S., ISBN 978-3-643-11864-6, 29,90 Euro.
Artikel in diesem Heft
- Titelseiten
- Titelseiten
- Artikel
- Spracherkennungssysteme im Übersetzungsprozess: Möglichkeiten und Grenzen
- The translator as an Intercultural Mediator. Translation and Cultural Influences
- Die Übersetzungen aus dem Deutschen durch die spanischen Klarissen
- Specialised Translation Assessment: Uncommon Senses and Other Stories
- Las Lettres d’une Péruvienne de Mme de Grafigny y sus traducciones españolas (1792, 1823, 1836)
- Compatibility of Specialized Bilingual English-Persian Dictionaries with Fundamental Lexicography Criteria
- Rezension
- Gerzymisch, Heidrun (Hg.) (2013): Translation als Sinngebung. MitSprache: Translatorische Forschungsbeiträge. Münster: LIT Verlag, 232 S., ISBN 978-3-643-11864-6, 29,90 Euro.