Startseite Semantische Wissensnetze – vertrauenswürdige KI für innovative Businessanwendungen
Artikel Öffentlich zugänglich

Semantische Wissensnetze – vertrauenswürdige KI für innovative Businessanwendungen

  • Katharina Munk

    Katharina Munk ist Mitgründerin der Klarso GmbH. Das Softwareunternehmen entstand 2017 in Berlin und entwickelt basierend auf Wissensnetzen und KI innovative Softwarelösungen für Kunden mit komplexen Inhalten und Produktinformationen in der Verlagsbranche und Industrie. Klarso’s Hauptprodukt ist die klar:suite. Sie kommt mit ihrer flexiblen Software-Architektur als CMS mit semantischer Modellierungskomponente für Redaktion und PIM-Daten zur Anwendung. Katharina Munks berufliche Schwerpunkte sind Content-Anreicherung und Wissensmodellierung mit Hilfe von Indexing, Thesauri und semantischen Wissensnetzen.

    EMAIL logo
Veröffentlicht/Copyright: 8. April 2022
Veröffentlichen auch Sie bei De Gruyter Brill

Zusammenfassung

Semantische Software-Technologien verwandeln große Mengen strukturierter und unstrukturierter Daten zu computerlesbaren und computerverwertbaren Wissensnetzen. Aufbau und Pflege der Wissensnetze gelingen im agilen Zusammenspiel zwischen Mensch und Computer. Mit angepassten Editoren, Natural Language Processing, semantischer Klassifikation und selbstlernenden Prozessen reifen sukzessive und zunehmend Kontext- und Textverständnis.

Solche Wissensnetze liefern erklärbare und nachvollziehbare Resultate. Sie sind für Forschung und Unternehmen jeder Branche von großem Wert und öffnen die Tür für innovative Anwendungen sowohl unternehmensintern als auch für Kunden: Beispiele sind Redaktionssysteme und Produktinformationssysteme mit inhaltlicher und formaler Unterstützung für neue digitale Informationsdienste sowie -Produkte, 360°-Input für Business-Entscheidungen und Suche und dynamische Aggregation semantischer Zusammenhänge im Bestandscontent.

Abstract

Semantic software technologies transform large quantities of structured and unstructured data into computer-readable and computer-usable knowledge networks. The creation and maintenance of knowledge networks are achieved through agile interaction between humans and computers. With customized editors, Natural Language Processing, semantic classification and self-learning processes, context and text understanding gradually and increasingly mature.

Such knowledge networks deliver explainable and comprehensible results. They are of great value for research and companies in every industry and open the door to innovative applications both within companies and for customers: Examples include editorial systems and product information systems with content and formal support for new digital information services and products, 360° input for business decisions and search and aggregation of semantic connections in existing content.

Résumé

Les technologies logicielles sémantiques transforment de grandes quantités de données structurées et non structurées en réseaux de connaissances lisibles et utilisables par ordinateur. La création et la maintenance des réseaux de connaissances sont réalisées par une interaction agile entre les humains et les ordinateurs. Grâce à des éditeurs adaptés, au traitement automatique des langues, à la classification sémantique et aux processus d’auto-apprentissage, la compréhension du contexte et du texte devient de plus en plus mature.

De tels réseaux de connaissances donnent des résultats explicables et compréhensibles. Ils sont d’une grande valeur pour la recherche et les entreprises de tous les secteurs et ouvrent la voie à des applications innovantes tant au sein des entreprises que pour les clients: Parmi les exemples, citons les systèmes d’information éditoriale et sur les produits avec support de contenu et de forme pour les nouveaux services et produits d’information numériques, la saisie à 360° pour la prise de décision commerciale, ainsi que la recherche et l’agrégation dynamique de relations sémantiques dans le contenu des stocks.

In unserer digitalen Gesellschaft ist Wissen eine der entscheidenden Ressourcen und zunehmend bedeutender Wirtschaftsfaktor. Für uns alle ist die schnelle Veränderlichkeit und die rasante Zunahme des verfügbaren Wissens bereits eine Selbstverständlichkeit.

In vielen Unternehmen liegt neben den strukturierten Daten ein Großteil des Wissens als unstrukturierte Daten in Form von Texten vor: in Betriebsanleitungen, Service-Handbüchern, Marketing-Dokumenten, wissenschaftlichen Veröffentlichungen, Patenten, Konferenzbeiträgen – oft auch in vielen Sprachen. Dazu werden die Produktzyklen immer kürzer und die Zeitspanne für Innovationen knapper. Bei dieser Datenflut und gleichzeitig veränderlichen Anforderungen die relevante Information im richtigen Kontext bedarfsgemäß einem Kunden und unternehmensintern für die jeweiligen Entwicklungs-, Fach- und Serviceabteilungen zugänglich zu machen, ist für viele Unternehmen ausschlaggebender Erfolgsfaktor und zugleich eine enorme Herausforderung.

Große Datenmengen müssen dazu „verstanden“ und erschlossen und zu computer-lesbaren und computer-verwertbaren Wissensbeständen aufbereitet werden, und das möglichst zeit- und arbeitsökonomisch. Das gelingt nur mithilfe von intelligenten Assistenzsystemen. Mit Computern lassen sich Daten in exorbitanter Geschwindigkeit und fehlerfrei durchsuchen, Muster erkennen, sammeln, korrelieren und kombinieren. Allerdings ist der Computer initial nicht in der Lage, die Daten inhaltlich zu deuten und zu bewerten. Dies sollen Technologien aus dem Bereich der Künstlichen Intelligenz zukünftig vermehrt übernehmen.

So aufbereitetes Unternehmenswissen ist nicht nur unternehmensintern von großem Wert. Inzwischen erbringen auch Produkte und Dienstleistungen, die auf dem Einsatz von KI basieren, einen wachsenden Anteil am Gesamtumsatz der Unternehmen. Für Deutschland wird im Jahr 2025 ein Anteil von 13 Prozent am Bruttoinlandsprodukt erwartet[1].

Künstliche-Intelligenz-Verfahren und ihre Einsatzbereiche

Zum Einsatz kommen verschiedene KI-Verfahren. Statistische und mathematische Verfahren sind bei der Analyse sehr großer Datenmengen erfolgreich. In Deutschland, aber auch in vielen anderen Ländern, bestehen Wirtschaft und Gesellschaft mehrheitlich aus kleinen und mittleren Unternehmen und Organisationen[2]. Sie erzeugen selten ausreichend große Datenmengen, die zum Trainieren der KI-Systeme benötigt werden, um statistisch belastbare Ergebnisse zu erzeugen. Häufig reicht es auch nicht aus, wenn eine Technologie „oft genug“ funktioniert, um nützlich zu sein[3].

Im privaten Bereich mag es in Ordnung sein, wenn Google oder Amazon nur zu 90 Prozent zuverlässig eine richtige Produktempfehlung ausgeben. Für viele „Real-World“-Anwendungen braucht es zuverlässigere Ergebnisse und flexiblere KI-Systeme, die nur ein oder einige wenige Beispiele benötigen, um daraus zu lernen und erklärbare und nachvollziehbare Entscheidungen zu treffen. Die Erklärbarkeit von KI-Produkten ist für viele Nutzende Voraussetzung für die Akzeptanz. Sie gehört, zumindest im europäischen Umfeld, zu den wichtigen Faktoren für den Markterfolg[4].

Für diese Anwendungen werden KI-Technologien gebraucht, die auf linguistischen und semantischen Verfahren beruhen. Sie basieren auf natürlicher Sprache. Zu den linguistischen Verfahren gehören morphologische und syntaktische Textanalysen (Natural Language Processing, NLP), mit denen Computer automatisiert grammatische Informationen und formal-strukturelle Beziehungen innerhalb von Sätzen rekonstruieren können. Die eigentliche inhaltliche Bedeutung wird durch semantische Verknüpfungen in die Daten eingebracht, in Form von Begriffen und Relationen, die die Beziehungen und Kontextinformationen möglichst reich abbilden. Ein solches semantisches Wissensnetz mit typisierten Relationen und Begriffen, in einer „formalen“ Sprache, kann vom Computer verarbeitet werden. Da es auf natürlicher Sprache basiert, ermöglicht es gleichzeitig, die Kommunikation zwischen Mensch und Computer bzw. zwischen Programmen untereinander, ohne dass die Anwender Fachkenntnisse im Bereich der Datenwissenschaften oder Programmierung besitzen müssen.

Daten zu Wissen – der Kontext macht‘s

Mit Daten alleine lässt sich wenig anfangen. Eine Zahl alleine ist bedeutungslos und erlaubt noch keine Entscheidung. Der Wert einer solchen Wissensrepräsentation lässt sich schnell erkennen: Erst wenn ausreichend Kontext- und Hintergrundinformation bekannt ist, Erfahrung und Fachkenntnisse vorhanden sind, kann beispielsweise ein Abteilungsleiter fundiert entscheiden, ob in ein neues Produktionsgerät investiert werden soll oder nicht. Ein Unternehmens-Wissensnetz, in dem die strukturierten und unstrukturierten Daten aus allen relevanten Unternehmensquellen semantisch aufbereitet zur Verfügung stehen, liefert die für die Entscheidung wichtigen Informationen und das mit der Genauigkeit und Geschwindigkeit eines Computers. Das senkt die Gefahr, dass wesentliche Informationen übersehen werden.

Semantische Datenmodellierung

Semantische Software-Technologie der nächsten Generation ist in der Lage, solche Unternehmenswissensnetze aufzubauen. Ähnlich wie der Erfahrungsschatz und das Gedächtnis des Menschen muss auch der Computer dabei nach und nach lernen, die Daten zu „verstehen“. Die verwendeten Datenmodelle der Wissensnetze sind sehr unterschiedlich gestaltet. Im Wissenskonzept der Klarso GmbH, das in der Software-Plattform klar:suite umgesetzt ist, werden Daten und Information als Entitäten oder Elemente zusammen mit ihren Merkmalen und Beziehungen im semantischen Netz abgelegt. Die in den Daten abgebildete Inhaltsstruktur (integrierte Ontologie) ist dabei möglichst natürlich aufgebaut, sodass die Elemente und Beziehungen direkte Entsprechungen in der realen Welt haben.

Entsprechend flexibel muss die Datenrepräsentation und -architektur sein. Beispielsweise ist die Größe der im Wissensnetz abgebildeten Entitäten frei: Entitäten sind Begriffe, Textfragmente oder auch vollständige Dateien. Gegebenenfalls werden die Daten nur flach, gemäß ihrer Datenstruktur abgelegt, „semantisch agnostisch“ z. B. als Reihenfolge von Wörtern in einem Textabsatz. Um diese Daten vollständig zu erfassen, gilt es bei Bedarf sukzessive die benötigte Information zu extrahieren. Sätze werden in ihre Bestandteile wie Verben und Substantive zerlegt und ihren Bestandteilen einzeln und in Kombination Bedeutung zugewiesen – im Kontext des Satzes und mit dem entsprechenden Hintergrundwissen.

Extrem flexibel sind auch die im Wissensnetz abbildbaren Beziehungen. Beziehungen als typisierte Relationen sind innerhalb einer Abstraktionsebene und auch zwischen allen Abstraktionsebenen möglich. Sie können vielstellig sein und verknüpfen Begriffe und Benennungen, Merkmale sowie auch Beziehungen selbst und ihre Typen. Relationen sind ebenso möglich auf Workflow- und Rechteebene wie auf Strukturebene. Strukturinformationen z. B. über Quellen oder Zusammengehörigkeit der Daten sind im Wissensnetz mit integriert. Dieses direkt in den Daten abgelegte Wissen über die eigene Struktur sorgt für eine lokale Selbstverwaltung der Daten („smarte Daten“) und macht die Handhabung umfangreicher derartig frei strukturierter Daten möglich.

Das Wissensnetz, in dem inhaltliche und formale Ebenen nicht getrennt, sondern in ein gemeinsames Netz zusammengeführt sind, stellt eine natürliche Wissensrepräsentation dar. Ähnlich wie in unserem Gehirn, in dem lokale Netzwerke aus den sensorischen, motorischen und Gedächtnis-relevanten Assoziationsarealen verknüpft und nur im Zusammenspiel sinnvolle Ergebnisse liefern.

Abbildung 1 
Im Gehirn sind Wahrnehmungen, Gedanken und Handlungen verteilte neuronale Prozesse, die untereinander vernetzt sind und orchestriert zusammenspielen.
Abbildung 1

Im Gehirn sind Wahrnehmungen, Gedanken und Handlungen verteilte neuronale Prozesse, die untereinander vernetzt sind und orchestriert zusammenspielen.

Über die Ebenen hinweg können so z. B. Quellen, Bearbeiter, Zielgruppen-, Länder- und Produkt-spezifische Informationseinheiten verknüpft und dynamisch zusammengestellt und ausgegeben werden.

Die reiche Vernetzung, in der ein Eintrag schnell mit bis zu 20.000 weiteren Einträgen verknüpft sein kann, sorgt zusammen mit möglichst feingranulierten Informationseinheiten für optimale Flexibilität. Zusammenhänge können so auch aus anderen neuen Kontexten heraus abgefragt werden – mit der Möglichkeit einer 360°-Sicht auf die Daten. Das Netz wächst und passt sich entlang der Anforderungen an – das ist die beste Basis, um nachhaltig reagieren zu können.

Demokratisierung zum Wissenstransfer

Aufbau, Erweiterungen und Aktualisierungen eines Wissensnetzes sollten möglichst automatisiert erfolgen. Dabei verwenden lassen sich jedwede in den importierten Quelldokumenten vorhandenen Auszeichnungen (XML-Tags, Überschriftenebenen, sonstige Metadaten), NLP, kontextspezifische Heuristiken, externe und unternehmensinterne Terminologien und Klassifikationssysteme sowie sonstige Quellen zu Allerweltwissen und domänenspezifischem Fachwissen.

Abbildung 2 
Beim Aufbau des Wissensnetzes werden nach und nach Daten über semantisches Machine-Learning mit Kontext-Information angereichert.
Abbildung 2

Beim Aufbau des Wissensnetzes werden nach und nach Daten über semantisches Machine-Learning mit Kontext-Information angereichert.

Die eigentliche Wissensarbeit sollte dabei „demokratisiert“ werden. Aufgabenteilung ist zum einen sinnvoll, wenn es darum geht, schnell neue oder sich permanent ändernde Wissensgebiete zu modellieren. Zum anderen denke man an die Erfahrung und das Wissen in den Köpfen der vielen Spezialisten und Fachleute, die es in einem Unternehmen gibt und die unternehmensweit (und möglichst dauerhaft) zugänglich sein sollten: Entwickler, Wissenschaftler, Redakteure, Terminologen sowie Service- und Support-Mitarbeitende, die alle detaillierte Kenntnisse hinsichtlich der von ihnen betreuten Daten haben. Sie sind am besten geeignet, aus erster Hand Kontext- und Hintergrundinformation zu Daten/Content zu hinterlegen oder Terminologien und Klassifikationssysteme zu erstellen.

Daten und Resultate, denen man trauen kann

Durch effiziente Kontrollmöglichkeiten mit kontinuierlichen menschlichen Feedbackschleifen („Human in the loop”) werden die Daten schrittweise validiert und ein semantisch belastbares (Unternehmens-)Wissen aufgebaut. Die klar:suite mit ihrer neuartigen Verknüpfung von Datenhaltung, Logik, Funktionalität und User Interface bietet die passende Umgebung dafür. Sie führt Daten aus unterschiedlichen Unternehmensbereichen und Quellen zusammen, wobei die Quellreferenzen mitgeführt werden. Editoren erlauben effizient ein nachfolgendes Kuratieren des Netzes, weisen auf Duplikate und Inkonsistenzen hin und erleichtern beim Import das Mapping von Informationen aus verschiedenen Datenquellen.

Damit die Nutzenden einer Anwendung trauen können, müssen die Resultate und Aussagen, die der Computer liefert, vollständig nachvollziehbar sein. Im semantischen Netz der klar:suite sind sämtliche angewendeten Regeln hinterlegt und Implikationen zusammen mit ihren Voraussetzungen und den Schlussfolgerungen gespeichert. Es ist dadurch jederzeit im Netz nachvollziehbar und erklärbar, woher implizite Aussagen kommen.

Modulare Anwendungsumgebung und agile Entwicklung

Voraussetzung für die Verwendbarkeit in unterschiedlichen Anwendungen ist, dass mit dem Wissensnetz flexibel über intuitive Nutzeroberflächen interagiert werden kann. Das semantische Netz der klar:suite ist nicht nur eine Datenbank, sondern eingebettet in ein modulares Software-System. Speziell designte Komponenten machen das semantische Netz zugänglich und für Anwendungen produktiv. Hinzu kommen anwendungsspezifische maßgeschneiderte Editoren und Ansichten zur Navigation und Exploration des Wissensnetzes, reiche semantische Suchmöglichkeiten sowie die leistungsfähige Unterstützung bei Datenerstellung und -bearbeitung. Beim Datenexport unterstützen weitere Werkzeuge die Umwandlung auf andere Datenstrukturen und Austauschformate.

Die nötige Anpassungsfähigkeit der Software wird erreicht über ein generisches Framework und Toolkit, das mit enger Anknüpfung zum Wissensnetz die Weiterentwicklung der Software flexibel und unkompliziert ermöglicht. Die Software-Komponenten sind als Skripte selbst in der Datenbank eingebettet. Die Datenbank synchronisiert sich für Backups, Versionierungen und dezentrale Bearbeitung. Damit stehen skriptbasierte neue Funktionen und Erweiterungen sofort allen Nutzenden zur Verfügung. Auch die Benutzeroberfläche lässt sich so einfach agil anpassen im live coding oder „Programmieren on-the-fly“[5].

Use-Cases und weitere innovative Anwendungen

Ein semantisches Wissensnetz ist für Forschung und Unternehmen jeder Branche von großem Wert. Einige Einsatzbeispiele zeigen einen kleinen Bereich aus dem Spektrum der innovativen Anwendungsmöglichkeiten semantischer Software-Lösungen. Allen gemeinsam sind komplexe Daten, die für flexible Anwendungen verstanden und gehandhabt werden müssen.

Die klar:suite wird als Produkt-Information Management (PIM)-System zur redundanzfreien, zentralen Pflege und Ausgabe komplexer Vertriebskataloge und Preislisten genutzt[6]. Deren Komplexität entsteht z. B. durch Spezialkonfigurationen der Produkte, Abhängigkeiten der Preise von den jeweiligen Serien, verschachtelte Optionen, Merkmale und erlaubte Bestellkombinationen. Durch Export-Skripte und Editoren lässt sich die Ausgabe der Preislisten flexibel kunden- und marktspezifisch anpassen.

Im Großhandel ist die schnelle und effiziente Übernahme und Datenharmonisierung von Produktinformationen unterschiedlicher Lieferanten in die eigene Inhalts- und Katalogstruktur eine Herausforderung. In der klar:suite bilden intelligente lernende Mapping-Editoren verschiedene Datenmodelle und Klassifikationssysteme ab. Zum weitestgehend automatisierten und dennoch robusten Abgleich werden nicht nur die Metadaten verwendet, sondern auch der Dateninhalt, wie zum Beispiel die Produktbeschreibungen.

Content-Anbieter nutzen das System als Redaktionssystem. Damit lassen sich komplexe Inhalte, z. B. aus der Wissensdomäne Medizin, Wirtschaft oder Jura, pflegen, bearbeiten und kontextabhängig sowie präzise kundenspezifisch bereitstellen oder in einem Portal auf eine Such-Anfrage hin dynamisch ausgeben. In einem Markt, in dem Informationen heutzutage über viele Quellen erhältlich sind, bieten Content-Anbieter ihren zahlenden Kunden so einen Mehrwert.

Schnell an die benötigte Information zu kommen, ist für Feldmitarbeitende im Einsatz wichtig, um bei der Kundschaft lange Ausfall- und Servicezeiten zu vermeiden. Das Knowledge Warehouse liefert mit einer intelligenten Suche die Antworten aus dem zentralen Informationspool. Über eine intuitive Eingabemaske kann effizient Fehlendes festgehalten und selber Informationen ergänzt werden. So lernt und wächst der Informationspool mit jedem Einsatz.

Die Suche in der klar:suite ist kontextabhängig und lässt sich optional erweitern entlang von Vererbungen und Abhängigkeiten, Mehrwort-Synonymen und Systematiken. Zwei Beispiele verdeutlichen die Vorteile gegenüber einer herkömmlichen Suchanwendung:

  1. Wird beispielsweise ein Stoffwechselprodukt eingegeben, so werden nicht nur Textstellen als Treffer angezeigt, in denen das Stoffwechselprodukt genannt sind, sondern auch jene, die Abbauprodukte oder die entsprechenden Enzyme beinhalten.

  2. Ein Unfallbericht einer Versicherungsgesellschaft enthält eine ganze Reihe von Datumsausdrücken. Aber welcher davon ist das Unfalldatum und nicht etwa das Datum des Inkrafttretens des Vertrages oder der Unterzeichnung des Unfallberichts? Diese Unterscheidung lässt sich nur machen, wenn der Kontext in die Suche mit einbezogen wird.

Ein großes Einsatzgebiet für semantische Netze ist die Informationsbereitstellung. In vielen Unternehmen gilt es neue Lösungen zu finden, um zeitaufwendige Suchen und redundante Arbeit zu vermeiden. Ein semantisches Wissensnetz als intelligente Unternehmens-Informationszentrale[7], in dem Daten aus den verschiedenen Abteilungen und Systemen, z. B. Warenwirtschaftssystem, Ersatzteilmanagementsystem, Entwicklungs- und Marketingabteilung und unternehmensspezifisches Fachwissen integriert sind, bietet eine solche Lösung. Es versorgt Mitarbeitende und Kunden kontextabhängig und bedarfsgerecht mit der relevanten Information, vollständig und bei Bedarf mit einer 360°-Sicht auf die Daten z. B. zur Unterstützung bei Businessentscheidungen.[8] Zusammen mit anpassbaren Analyse-Editoren ist ein solches System ein intelligentes Business Intelligence Werkzeug.

Über den Autor / die Autorin

Katharina Munk

Katharina Munk ist Mitgründerin der Klarso GmbH. Das Softwareunternehmen entstand 2017 in Berlin und entwickelt basierend auf Wissensnetzen und KI innovative Softwarelösungen für Kunden mit komplexen Inhalten und Produktinformationen in der Verlagsbranche und Industrie. Klarso’s Hauptprodukt ist die klar:suite. Sie kommt mit ihrer flexiblen Software-Architektur als CMS mit semantischer Modellierungskomponente für Redaktion und PIM-Daten zur Anwendung. Katharina Munks berufliche Schwerpunkte sind Content-Anreicherung und Wissensmodellierung mit Hilfe von Indexing, Thesauri und semantischen Wissensnetzen.

Literatur

Marcus, Gary; Davis, Ernest (2019). Rebooting AI. Knopf Doubleday Publishing Group. Kindle-Version.Suche in Google Scholar

Drewer, P.; Massion, F.; Pulitano, D. (2017): Was haben Wissensmodellierung, Wissensstruktur, künstliche Intelligenz und Terminologie miteinander zu tun? DIT (Deutsches Institut für Terminologie e.V.).Suche in Google Scholar

Munk, Katharina (2020). Business-Anwendungen in der Industrie basierend auf Wissensnetzen. DTT-Tagungsband 2020-2021.Suche in Google Scholar

Munk, Katharina (2019). Wissen veredeln. Technische Kommunikation 06/19.Suche in Google Scholar

https://www.digitale-technologien.de/DT/Redaktion/DE/Downloads/Publikation/KI-Inno/2021/Studie_Erklaerbare_KI.html [25.10.2021].Suche in Google Scholar

https://digitusmagazin.de/2020/04/die-geschichte-hinter-den-zahlen-die-zukunft-gehoert-der-ki-assistenz-warum-insight-engines-praedestiniert-sind-fuer-diese-aufgabe/[25.10.2021].Suche in Google Scholar

https://www.tekom.de/die-tekom/publikationen/fachbuecher/detail/effizientes-informationsmanagement-durch-komponenten-basierte-content-management-systeme-ccms [25.10.2021].Suche in Google Scholar

Online erschienen: 2022-04-08
Erschienen im Druck: 2022-04-06

© 2022 Walter de Gruyter GmbH, Berlin/Boston

Heruntergeladen am 27.9.2025 von https://www.degruyterbrill.com/document/doi/10.1515/iwp-2021-2194/html
Button zum nach oben scrollen