Startseite Spracherkennungssysteme im Übersetzungsprozess: Möglichkeiten und Grenzen
Artikel
Lizenziert
Nicht lizenziert Erfordert eine Authentifizierung

Spracherkennungssysteme im Übersetzungsprozess: Möglichkeiten und Grenzen

Eine Untersuchung am Beispiel von Dragon NaturallySpeaking[1]
  • Alexandra Wartig EMAIL logo
Veröffentlicht/Copyright: 16. April 2014
Veröffentlichen auch Sie bei De Gruyter Brill

Abstract

This paper examines the potential of modern speech recognition systems, inter alia if and to what extent the use of speech recognition software has an impact on text production efficiency, translation efficiency and translation quality. Eight experiments were conducted, using the market-leading software Dragon NaturallySpeaking 12. It was shown that dictating text is considerably faster than typing, and that there is no significant quality difference between dictated and typed translations. Although, from an objective point of view, speech recognition does increase productivity, the majority of the test persons felt uncomfortable with it because of the enormous mental strain of formulating sentences in formal standard language.

Abkürzungen

DNS

Dragon NaturallySpeaking

HMM, Pl. HMMs

Hidden-Markov-Modell

IPA

International Phonetic Association

DARPA

Defense Advanced Research Projects Agency

Quellenverzeichnis

Literaturverzeichnis

Amazon (2013): „Bestseller in Spracherkennung und Sprachsteuerung.“ http://www.amazon.de/gp/bestsellers/software/12760531/ref=pd_zg_hrsr_sw_3_4_last (5.7.2013)Suche in Google Scholar

Apple: „Weitere Infos zu Siri.“ http://www.apple.com/de/ios/siri/siri-faq/ (25.6.2013)Suche in Google Scholar

ASKA Spracherkennungssysteme GmbH [1]: „ASKA SmartVoice.“ http://www.aska.de/spracherkennung/industrie/ (14.7.2013)Suche in Google Scholar

ASKA Spracherkennungssysteme GmbH [2]: „Dragon NaturallySpeaking. Von gesprochener Sprache zum getippten Text.“ http://www.mikrofone24.de/Spracherkennung/Dragon-NaturallySpeaking?sPage=1&sPerPage=48 (14.7.2013)Suche in Google Scholar

Augst, Gerhard (1975): Untersuchungen zum Morpheminventar der deutschen Gegenwartssprache. Forschungsberichte des Instituts für deutsche Sprache 25. Tübingen: Narr.Suche in Google Scholar

Aust, Harald / Oerder, Martin / Seide, Frank / Steinbiss, Volker (1995): „The Philips automatic train timetable information system.“ Speech Communication 17 (1995), 249–262.Suche in Google Scholar

Best, Karl-Heinz (2004/2005): „Laut- und Phonemhäufigkeiten im Deutschen.“ Göttinger Beiträge zur Sprachwissenschaft Heft 10/11. Göttingen: Peust & Gutschmidt, 21–32.Suche in Google Scholar

Blanding, Michael (2012): „Speechless.“ Tufts Magazine Fall 2012. http://www.tufts.edu/alumni/magazine/fall2012/features/speechless.html (20.5.2013)Suche in Google Scholar

Carstensen, Kai-Uwe (2012): „Sprachtechnologie. Ein Überblick.“ http://www.kai-uwe-carstensen.de/Publikationen/Sprachtechnologie.pdf (20.5.2013)Suche in Google Scholar

Carstensen, Kai-Uwe et al. (Hrsg.) (2004): Computerlinguistik und Sprachtechnologie. Eine Einführung. München: Elsevier, Spektrum Akademischer Verlag.Suche in Google Scholar

Chomsky, Noam (1956): „Three models for the description of language.“ IRE Transactions on Information Theory 2, 113–124.10.1109/TIT.1956.1056813Suche in Google Scholar

Coleman, John (2005): Introducing Speech and Language Processing. Cambridge: Cambridge University Press.Suche in Google Scholar

Datatronic Beka Technologies GmbH (2009): „High Speech – das Digitale Diktat – einfach optimal!“ http://www.digitales-diktat.de/images/stories/public_downloads/high-speech_allgemein.pdf (14.7.2013)Suche in Google Scholar

de Korte, Elsbeth M. / van Lingen, Piet (2006): „The effect of speech recognition on working postures, productivity and the perception of user friendliness.“ Applied Ergonomics 37 (2006), 341–347.Suche in Google Scholar

Diktierportal: „Spracherkennung.“ http://www.diktierportal.de/alle-Diktiergeraete/Spracherkennung:58_53.html?gclid=CPOMpfvfmLgCFbQetAodGEAA5w (4.8.2013)Suche in Google Scholar

Draxler, Christoph (2004): „Sprachdatenbanken.“ Carstensen, Kai-Uwe et al. (Hrsg.) (2004): 440–447.Suche in Google Scholar

Duden (200022): Duden. Die deutsche Rechtschreibung. Mannheim, Leipzig, Wien, Zürich: Dudenverlag.Suche in Google Scholar

Duden (200423): Duden. Die deutsche Rechtschreibung. Mannheim, Leipzig, Wien, Zürich: Dudenverlag.Suche in Google Scholar

Duden (200624): Duden. Die deutsche Rechtschreibung. Mannheim, Leipzig, Wien, Zürich: Dudenverlag.Suche in Google Scholar

Duden (200925): Duden. Die deutsche Rechtschreibung. Mannheim, Wien, Zürich: Dudenverlag.Suche in Google Scholar

Duden (201326): Duden. Die deutsche Rechtschreibung. Berlin: Dudenverlag.Suche in Google Scholar

Duden: „Die Verteilung der Wortarten im Rechtschreibduden.“ http://www.duden.de/sprachwissen/sprachratgeber/die-verteilung-der-wortarten-im-rechtschreibduden (19.6.2013)Suche in Google Scholar

Eibner, Chantal (2012): Integratives Übersetzungsmanagement mit Translation Memory Systemen. Hamburg: Diplomica.Suche in Google Scholar

Frötschl, Bernhard/Lindstrot, Wolf (2004): „Wahrscheinlichkeitstheorie und Hidden-Markov-Modelle.“ Carstensen, Kai-Uwe et al. (Hrsg.) (2004): 111–137.Suche in Google Scholar

Furui, Sadaoki (2008): „History and Development of Speech Recognition.“ Chen, Fang / Jokinen, Kristiina (Hrsg.) (2008): Speech Technology. Theory and Applications. New York: Springer, 1–18Suche in Google Scholar

Gates, Bill (1995): The Road ahead. London: Viking.Suche in Google Scholar

Grant, David / McLarty Robert (2001): Business Basics. Oxford: Oxford University Press.Suche in Google Scholar

Haiber, Udo (2004): „Spracherkennungssysteme.“ Carstensen, Kai-Uwe et al. (Hrsg.) (2004): 524–531.Suche in Google Scholar

Hall, Alan T. (2011): Phonologie. Eine Einführung. Berlin, New York: De Gruyter.10.1515/9783110215885Suche in Google Scholar

Hansen, Gerd (2000) (Hrsg.): Spracherkennung in der Sonderpädagogik. Abschlussbericht eines Modellversuchs. Schulversuche und Bildungsforschung: Berichte und Materialien 88. Mainz: v. Hase & Köhler.Suche in Google Scholar

Haxer, Marc J. / Guinn, Leslie W. / Hogikyan, Norman D. (2001): „Use of Speech Recognition Software: A Vocal Endurance Test for the New Millennium?“ Journal of Voice Vol. 15 No. 2, 231–236.Suche in Google Scholar

Health Tech Wire (2011): „Uneingeschränkt verfügbar: Spracherkennung in der Wolke“ http://www.healthtechwire.de/nuance-communications/uneingeschraenkt-verfuegbar-spracherkennung-in-der-wolke-2700/ (5.7.2013)Suche in Google Scholar

Heyers, Peter et al. (2010): Erfolgreich starten als Rechtsanwalt. E-Book. Deutscher Anwaltverlag.Suche in Google Scholar

Hübener, Kai (1997): Akustische Segmentierung zur Erkennung gesprochener Sprache. Dissertation zur Erlangung des Doktorgrades am Fachbereich Informatik der Universität Hamburg.Suche in Google Scholar

International Phonetic Association (IPA): „The International Phonetic Alphabet (revised to 2005).“ http://www.langsci.ucl.ac.uk/ipa/IPA_chart_ %28C %292005.pdf (21.4.2013)Suche in Google Scholar

Intersteno (2013): „Regulations for the INTERSTENO competitions. 49th Intersteno Congress Ghent (Belgium) – 2013.“ http://www.intersteno.org/ (28.7.2013)Suche in Google Scholar

Jurafsky, Daniel / Martin, H. James (2000): Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Upper Saddle River, NJ: Prentice Hall.Suche in Google Scholar

Kämmerer, Bernhard R. (1990): Sprecherunabhängigkeit und Sprecheradaptation. Lösungsansätze für das Problem des Sprecherwechsels bei der automatischen Spracherkennung. Informatik-Fachberichte 244. Berlin et al.: Springer.10.1007/978-3-642-75832-4_2Suche in Google Scholar

Klabunde, Ralf (2004): „Automatentheorie und Formale Sprachen.“ Carstensen, Kai-Uwe et al. (Hrsg.) (2004): 63–90.Suche in Google Scholar

Köpcke, Klaus-Michael (1998): „Prototypische starke und schwache Verben der deutschen Gegenwartssprache.“ Forschungszentrum Deutscher Sprachatlas (1998) (Hrsg.): Germanistische Linguistik 141–142. Hildesheim, Zürich, New York: Olms, 45–60.Suche in Google Scholar

Kürschner, Wilfried (2008): Grammatisches Kompendium. Systematisches Verzeichnis grammatischer Grundbegriffe. UTB 1526. Tübingen, Basel: A. Francke.Suche in Google Scholar

Langer, Hagen (2004): „Syntax und Parsing.“ Carstensen, Kai-Uwe et al. (Hrsg.) (2004): 232–275.Suche in Google Scholar

Lewandowski, Theodor (1990): Linguistisches Wörterbuch. UTB 1518. Heidelberg, Wiesbaden: Quelle und Meyer.Suche in Google Scholar

LinguaConsult: „Shop für Dragon Spracherkennung.“ www.online-shop.linguaconsult.de/index.html?http://www.online-shop.linguaconsult.de/xaranshop_k001003s001_1.html (4.8.2013)Suche in Google Scholar

Linguatec (2006): „IBM und Linguatec entwickeln Spracherkennung weiter.“ http://www.linguatec.de/press/reports/voice_pro_11 (5.7.2013)Suche in Google Scholar

Linguatec [1]: „Systemanforderungen Voice Pro 12.“ http://www.linguatec.de/products/stt/voice_pro/sys_req (5.7.2013)Suche in Google Scholar

Linguatec [2]: „Voice Pro 12. Die professionelle Spracherkennung für alle Aufgaben.“ http://www.linguatec.de/products/stt/voice_pro (5.7.2013)Suche in Google Scholar

Linguatec [3]: „Voice Pro 12: Versionen im Vergleich.“ http://www.linguatec.de/products/stt/voice_pro/vp12_versions (14.7.2013)Suche in Google Scholar

Linguatec [4]: „Voice Pro Enterprise.“ http://www.linguatec.de/products/stt/vpe (29.7.2013)Suche in Google Scholar

Lübke, Diethard (2001): Lernwortschatz Deutsch. Imparare le parole tedesche. Deutsch-Italienisch. Ismaning: Hueber.Suche in Google Scholar

MediaInterface: „Firmenportrait.“ http://www.mediainterface.de/C1257A31002998AE/0586A6011DE09C26C1257A5D00404283/$FILE/Backgrounder.pdf (14.7.2013)Suche in Google Scholar

Meier, Helmut (1967): Deutsche Sprachstatistik. Zweiter Band. Hildesheim: Olms.Suche in Google Scholar

Meisenburg, Trudel / Selig, Maria (1998): Phonetik und Phonologie des Französischen. Stuttgart, Düsseldorf, Leipzig: Klett.Suche in Google Scholar

Menzerath, Paul (1954): Die Architektonik des deutschen Wortschatzes. Mit 14 Abbildungen und 24 Tabellen. Phonetische Studien 3. Bonn, Hannover, Stuttgart: Dümmler.Suche in Google Scholar

Mertin, Elvira (2006): Prozessorientiertes Qualitätsmanagement im Dienstleistungsbereich Übersetzen. Leipziger Studien zur angewandten Linguistik und Translatologie 2. Frankfurt a. M. et al.: Lang.Suche in Google Scholar

Newell, Allen (1978): „Harpy, production systems and human cognition.“ Carnegie Mellon University, Computer Science Department. Paper 2319. http://repository.cmu.edu/cgi/viewcontent.cgi?article=3352&context=compsci (22.6.2013)Suche in Google Scholar

Nuance Communications [1]: „360 I SpeechMagic SDK.“ http://www.nuance.de/products/speechmagic/index.htm (5.7.2013)Suche in Google Scholar

Nuance Communications [10]: „Produkte für den Mac.“ http://shop.nuance.de/DRHM/store?Action=DisplayCategoryProductListPage&SiteID=nuanceeu&Locale=de_DE&ThemeID=26429600&Env=BASE&categoryID=14068700 (14.7.2013)Suche in Google Scholar

Nuance Communications [2]: „Datenblätter und White Paper.“ http://www.nuance.de/for-business/by-product/dragon/product-resources/datasheets-whitepapers/index.htm (5.7.2013)Suche in Google Scholar

Nuance Communications [3]: „Diktieren / Spracherkennung.“ http://shop.nuance.de/DRHM/store?Action=DisplayCategoryProductListPage&SiteID=nuanceeu&Locale=de_DE&ThemeID=26429600&Env=BASE&categoryID=13534600 (5.7.2013)Suche in Google Scholar

Nuance Communications [4]: „Dragon NaturallySpeaking 12 Premium.“ http://shop.nuance.de/store/nuanceeu/de_DE/pd/ThemeID.26429600/productID.253365700Suche in Google Scholar

Nuance Communications [5]: „Dragon NaturallySpeaking 12. Funktionsmatrix. Funktionsvergleich nach Version.“ http://www.nuance.de/ucmprod/groups/dragon/@web-de/documents/collateral/nc_026622.pdf (5.7.2013)Suche in Google Scholar

Nuance Communications [6]: „Dragon NaturallySpeaking Premium.“ http://netherlands.nuance.com/consumenten/product/dragon-voor-pc/premium/index.htm (28.7.2013)Suche in Google Scholar

Nuance Communications [7]: „Kaufberechtigung für Einzelplatzlizenzen. Verifizierung der Kaufberechtigung.“ http://www.nuance.de/for-business/by-industry/education/education-validation/index.htm (5.7.2013)Suche in Google Scholar

Nuance Communications [8]: „Lösungen nach Branche.“ http://www.nuance.de/for-business/index.htm#!ind_sol_list (25.6.2013)Suche in Google Scholar

Nuance Communications [9]: „Nuance Certified Solutions Partner.“ http://www.nuance.de/sales/partners/solutions.asp (5.7.2013)Suche in Google Scholar

Ottmann, Angelika (2004): Translation-Memory-Systeme. Nutzen, Risiken, erfolgreiche Anwendung. Schenkenzell: GFT Verlag.Suche in Google Scholar

Posur, Winfried (2000): „Erfahrungen mit einem aktuellen Spracherkennungssystem bei der Erstellung von kardiologischen Arztbriefen.“ Herz 25 (2000/Nr. 6), 627–632.10.1007/PL00001976Suche in Google Scholar

Rauscher, Christoph (2000): Grundlagen der Spektrumanalyse. München: Rohde & Schwarz.Suche in Google Scholar

Ruske, Günther (1994): Automatische Spracherkennung. Methoden der Klassifikation und Merkmalsextraktion. München, Wien: Oldenbourg.10.1524/itit.1994.36.2.31Suche in Google Scholar

Sail Labs Technology AG (2010): „ SAIL LABS releases Media Mining Indexer version MMI 5.4.“ http://www.sail-labs.com/news-events/press-releases.html?tx_clpresse_pi1[showUid]=106 (14.7.2013)Suche in Google Scholar

Sail Labs Technology AG: „Media Mining Indexer.“ http://www.sail-labs.com/products/commercial-products/media-mining-indexer.html (14.7.2013)Suche in Google Scholar

Schank, Gerd / Schoenthal, Gisela (1983): Gesprochene Sprache. Eine Einführung in Forschungsansätze und Analysemethoden. Germanistische Arbeitshefte 18. Tübingen: Niemeyer.Suche in Google Scholar

Schmitt, Peter A. (2002): „Evaluierung von Translationsleistungen. Merkblatt zu den Klausur-Korrekturen/Anmerkungen.“ http://www.uni-leipzig.de/~ialt/merkblaetter/mrk-qkriterien.pdf (28.8.2013)Suche in Google Scholar

Schmitz, Ulrich (1992): Computerlinguistik. Eine Einführung. Opladen: Westdeutscher Verlag.10.1007/978-3-322-92483-4Suche in Google Scholar

Schukat-Talamazzini, Ernst Günter (1995): Automatische Spracherkennung. Grundlagen, statistische Modelle und effiziente Algorithmen. Braunschweig, Wiesbaden: Vieweg.Suche in Google Scholar

Seer, Marcel (2012): „Wie Blinde dank Siri das iPhone 4S nutzen können.“ http://t3n.de/news/blinde-dank-siri-iphone-4s-nutzen-382982/ (25.6.2013)Suche in Google Scholar

SIL International: „ISO 639 Code Tables.“ http://www-01.sil.org/iso639-3/codes.asp (18.5.2013)Suche in Google Scholar

Silverman, Daniel (2006): A Critical Introduction to Phonology. Of Sound, Mind, and Body. London, New York: Continuum.Suche in Google Scholar

Theobald, Elke (1992): Sprachwandel bei deutschen Verben. Flexionsklassenschwankungen starker und schwacher Verben. Tübingen: Narr.Suche in Google Scholar

Thumann P. / Topf S. / Feser A. / Erfurt C. / Schuler G. / Mahler V. (2008): „Digitale Spracherkennung in der Dermatologie. Eine Pilotuntersuchung unter medizinisch-ökonomischen Gesichtspunkten.“ Der Hautarzt 59 (2008/Nr. 2), 131–134.10.1007/s00105-007-1450-6Suche in Google Scholar

Turing, Alan M. (1950): „Computing Machinery and Intelligence.“ Mind Vol. 59 Issue 236, 433–460.Suche in Google Scholar

Universität Bonn (2004a): „Das Prinzip der Kurzzeitanalyse“ http://storage.sk.uni-bonn.de/Milca/ssv/content/ssv_s220.xhtml (5.6.2013)Suche in Google Scholar

Universität Bonn (2004b): „Definition, spektrale Auflösung, Transformationsintervall“ http://storage.sk.uni-bonn.de/Milca/ssv/content/ssv_s331.xhtml (4.8.2013)Suche in Google Scholar

Universität Bonn (2004c): „Glossar ‚Gesprochene Sprache‘“ http://storage.sk.uni-bonn.de/Milca/ssv/content/a3_glossar.xhtml#ssv_g313 (4.8.2013)Suche in Google Scholar

Warren, Richard M. / Sherman, Gary L. (1974): „Phonemic restorations based on subsequent context.“ Perception & Psychophysics Vol. 16 No. 1, 150–156.Suche in Google Scholar

Weinzierl, Stefan: „Einführung in die digitale Signalverarbeitung. Musterlösung 11. Aufgabenblatt. Fensterfunktionen.“ http://www.ak.tu-berlin.de/fileadmin/a0135/Unterrichtsmaterial/EDS_WS1213/Musterloesung_11_Aufgabenblatt_ws201213.pdfSuche in Google Scholar

Wiese, Richard (2011): Phonetik und Phonologie. UTB 3354. Paderborn: Fink.10.36198/9783838533544Suche in Google Scholar

Wikipedia (2013): „Dragon Naturally Speaking.“ http://de.wikipedia.org/wiki/Dragon_NaturallySpeaking (3.7.2013)Suche in Google Scholar

Windows [1]: „Einrichten der Spracherkennung.“ http://windows.microsoft.com/de-de/windows-vista/set-up-speech-recognition (14.7.2013)Suche in Google Scholar

Windows [2]: „Verwenden der Spracherkennung.“ http://windows.microsoft.com/de-DE/windows-8/using-speech-recognition (14.7.2013)Suche in Google Scholar

Winograd, Terry (1989): „Software für Sprachverarbeitung.“ Johannsen, Gerhard et al. (1989): Computer-Anwendungen. Heidelberg: Spektrum der Wissenschaft, 86–98.Suche in Google Scholar

Zue, Victor / Cole, Ron / Ward, Wayne (2010): „Speech Recognition.“ Cole et al. (2010): Survey of the State of the Art in Human Language Technology. Cambridge: Cambridge University Press, 3–9.Suche in Google Scholar

Abbildungsquellenverzeichnis

Abb. 1: eigene Grafik

Abb. 2: Hall 2011:7

Abb. 3: International Phonetic Association (IPA)

Abb. 4: Hübener 1997:10

Abb. 5: Jurafsky/Martin 2000:147

Abb. 6: Schukat-Talamazzini 1995:46

Abb. 7: Coleman 2005:75

Abb. 8: Universität Bonn 2004a

Abb. 9: Rauscher 2000:14

Abb. 10: eigene Grafik, nach Frötschl/Lindstrot 2004:125

Abb. 11–13: eigene Screenshots

Tabellenquellenverzeichnis

Tabellen 1–3 und 8–14: eigene Tabellen

Tabelle 4: eigene Tabelle, Quellen:

– Diktierportal

– LinguaConsult

– Linguatec [2]

– Linguatec [4]

– Nuance Communications [3]

– Nuance Communications [10]

Tabelle 5: eigene Tabelle, Quellen:

– MediaInterface

– Sail Labs Technology AG

– Sail Labs Technology AG 2010

Tabelle 6: eigene Tabelle, nach Hall 2011:19–21

Tabelle 7: eigene Tabelle, nach Hall 2011:6–8

Online erschienen: 2014-4-16
Erschienen im Druck: 2014-5-1

© 2014 Walter de Gruyter GmbH, Berlin/Boston

Heruntergeladen am 7.10.2025 von https://www.degruyterbrill.com/document/doi/10.1515/les-2014-0001/html?lang=de&srsltid=AfmBOoqR_cLp301YvTgKMOtz1cS-CBM8sN6GZL7EnlseGuxGSucUKrqz
Button zum nach oben scrollen