Skip to main content
Article
Licensed
Unlicensed Requires Authentication

Automatische Extraktion von Fachterminologie aus Volltexten

Automatic extraction of technical terms from full texts
  • EMAIL logo and
Published/Copyright: April 24, 2014
Become an author with De Gruyter Brill

Zusammenfassung

Fachterminologie in wissenschaftlichen Texten liegt häufig in Form von Phrasen oder Mehrwortgruppen vor. Vorgestellt wird ein algorithmisches Verfahren zur Identifikation und Extraktion fachtermi­nologischer Mehrwortgruppen. Besonderer Schwerpunkt ist die Einbindung von Funktionswörtern der deutschen Sprache, um die Extraktion komplexer Mehrwortkonstruktionen zu ermöglichen. Eingesetzt wurde das automatische Indexierungssystem Lingo. Die Ergebnisse für eine Extraktion kunsthistorischer Fachterminologie aus dem Reallexikon zur Deutschen Kunstgeschichte belegen die Tauglichkeit des Verfahrens.

Abstract

Technical terminology can often be found in scientific texts as phrases or multi-word groups. We present an algorithmic method for detecting and extracting technical multi-word groups. A special focus lies on function words of the German language in order to allow the extraction of complex multi-word constructions. For the study Lingo, an automatic indexing system, was used. The potential of the method is shown by the results of an extraction of art-historical terminology from the Reallexikon zur Deutschen Kunstgeschichte.

Published Online: 2014-4-24
Published in Print: 2014-4-1

© 2014 by Walter de Gruyter Berlin Boston

Downloaded on 21.4.2026 from https://www.degruyterbrill.com/document/doi/10.1515/abitech-2014-0002/html
Scroll to top button