Startseite Bibliotheks- & Informationswissenschaft, Buchwissenschaft Von der Theorie in die Praxis: Wie Wissensgraphen und Sprachmodelle schon heute helfen, die wissenschaftlichen Fragen von morgen zu beantworten
Artikel
Lizenziert
Nicht lizenziert Erfordert eine Authentifizierung

Von der Theorie in die Praxis: Wie Wissensgraphen und Sprachmodelle schon heute helfen, die wissenschaftlichen Fragen von morgen zu beantworten

  • Oliver Karras

    Dr. Oliver Karras ist Forscher und Data Scientist an der TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften und Universitätsbibliothek in der Forschungsgruppe Data Science & Digital Libraries. Er promovierte in Informatik an der Leibniz Universität Hannover und forscht schwerpunktmäßig im Bereich wissenschaftlicher Wissensgraphen, insbesondere im Open Research Knowledge Graph (ORKG) und in der Nationalen Forschungsdateninfrastruktur. Seine Arbeit konzentriert sich auf die Produktion, Kuratierung und Wiederverwendung von FAIR wissenschaftlichen Wissens zur Verbesserung der Verfügbarkeit und Zugänglichkeit methodischen Wissens. Als Mitglied der Gesellschaft für Informatik e.V. und Sprecher der Fachgruppe Requirements Engineering ist er zudem in verschiedenen wissenschaftlichen Gremien aktiv.

    EMAIL logo
Veröffentlicht/Copyright: 15. Januar 2025
Veröffentlichen auch Sie bei De Gruyter Brill

Zusammenfassung

Während die digitale Transformation in vielen Lebensbereichen bereits weit fortgeschritten ist, hat die Wissenschaft das volle Potenzial der Digitalisierung bisher nicht ausgeschöpft. Es besteht ein dringender Bedarf, diese voranzutreiben. Für diesen Zweck ist es erforderlich, über die traditionelle, dokumentenbasierte Darstellung von Daten und Wissen hinauszugehen, um sowohl dem Menschen als auch der Maschine die effiziente Nutzung dieser Informationen zur Beantwortung wissenschaftlicher Fragen zu ermöglichen. In diesem Kontext sind Wissensgraphen und Sprachmodelle vielversprechende Technologien. Der vorliegende Artikel betrachtet theoretisch und anhand von Praxisbeispielen, wie Wissensgraphen und Sprachmodelle jeweils einzeln als auch kombiniert zur Beantwortung wissenschaftlicher Fragen beitragen. Wissensgraphen bieten eine strukturierte und vernetzte Darstellung von Daten und Wissen, die eine Kontextualisierung und umfassende Analyse der Informationen ermöglichen. Sprachmodelle hingegen erleichtern die Interaktion mit großen allgemeinen Wissensbeständen durch natürliche Sprache. Der größte Mehrwert bei der Beantwortung wissenschaftlicher Fragen lässt sich aber durch die Kombination beider Technologien erreichen. Die Synergien, die durch die Kombination von Wissensgraphen und Sprachmodellen entstehen, vereinen die Stärken beider Ansätze und ermöglichen eine präzisere und umfassende Beantwortung wissenschaftlicher Fragen. Zukünftige Forschung muss sich darauf konzentrieren, diese Kombination weiter zu optimieren und neue Anwendungsmöglichkeiten zu erschließen, um das volle Potenzial beider Technologien auszuschöpfen.

Abstract

While digital transformation is already well advanced in many areas of life, science has not yet realised the full potential of digitalisation. There is an urgent need to advance it. To this end, it is necessary to go beyond the traditional, document-based representation of data and knowledge in order to enable both humans and machines to use this information efficiently to answer scientific questions. In this context, knowledge graphs and language models are promising technologies. This article considers, both theoretically and with reference to practical examples, how knowledge graphs and language models contribute to answering scientific questions, both individually and in combination. Knowledge graphs provide a structured and networked representation of data and knowledge that enables contextualisation and comprehensive analysis of the information. Language models, on the other hand, facilitate interaction with large general knowledge bases through natural language. However, the greatest added value in answering scientific questions can be achieved by combining both technologies. The synergies that arise from the combination of knowledge graphs and language models combine the strengths of both approaches and enable more precise and comprehensive answers to scientific questions. Future research must focus on further optimising this combination and developing new applications to exploit the full potential of both technologies.

Résumé

Alors que la transformation numérique est déjà bien avancée dans de nombreux domaines de la vie, la science n’a pas encore exploité tout le potentiel de la numérisation. Il existe un besoin urgent de faire progresser celle-ci. À cette fin, il est nécessaire d’aller au-delà de la représentation traditionnelle des données et des connaissances basée sur des documents, afin de permettre à l’homme comme à la machine d’utiliser efficacement ces informations pour répondre à des questions scientifiques. Dans ce contexte, les graphes de connaissances et les modèles linguistiques sont des technologies prometteuses. Le présent article examine, de manière théorique et à l’aide d’exemples pratiques, comment les graphes de connaissances et les modèles de langage contribuent, individuellement et en combinaison, à répondre aux questions scientifiques. Les graphes de connaissances offrent une représentation structurée et interconnectée des données et des connaissances, permettant une contextualisation et une analyse complète des informations. Les modèles linguistiques, quant à eux, facilitent l’interaction avec de grandes bases de connaissances générales par le biais du langage naturel. Mais c’est en combinant les deux technologies que l’on obtient la plus grande valeur ajoutée pour répondre aux questions scientifiques. Les synergies créées par la combinaison des graphes de connaissances et des modèles linguistiques réunissent les points forts des deux approches et permettent de répondre de manière plus précise et complète aux questions scientifiques. Les recherches futures doivent se concentrer sur l’optimisation de cette combinaison et sur l’ouverture de nouvelles possibilités d’application afin d’exploiter pleinement le potentiel des deux technologies.

Über den Autor / die Autorin

Dr. Oliver Karras

Dr. Oliver Karras ist Forscher und Data Scientist an der TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften und Universitätsbibliothek in der Forschungsgruppe Data Science & Digital Libraries. Er promovierte in Informatik an der Leibniz Universität Hannover und forscht schwerpunktmäßig im Bereich wissenschaftlicher Wissensgraphen, insbesondere im Open Research Knowledge Graph (ORKG) und in der Nationalen Forschungsdateninfrastruktur. Seine Arbeit konzentriert sich auf die Produktion, Kuratierung und Wiederverwendung von FAIR wissenschaftlichen Wissens zur Verbesserung der Verfügbarkeit und Zugänglichkeit methodischen Wissens. Als Mitglied der Gesellschaft für Informatik e.V. und Sprecher der Fachgruppe Requirements Engineering ist er zudem in verschiedenen wissenschaftlichen Gremien aktiv.

Literatur

[1] O. Dziemba und E. Wenzel: # wir: Wie die Digitalisierung unseren Alltag verändert. Redline Wirtschaft, 2014.Suche in Google Scholar

[2] S. Auer, V. Kovtun, M. Prinz, A. Kasprzik, M. Stocker und andere: Towards a Knowledge Graph for Science. In: Proceedings of the 8th International Conference on Web Intelligence, Mining and Semantics, 2018, DOI: 10.1145/3227609.3227689.10.1145/3227609.3227689Suche in Google Scholar

[3] O. Karras, A. Lorenz und S. Auer: KI, ChatGPT, Wissensgraphen und die Beantwortung wissenschaftlicher Fragen. In: b.i.t. online, Vol. 2024, Nr. 03, 2024, URL: https://b-i-t-online.de/heft/2024-03-fachbeitrag-karras.pdf.Suche in Google Scholar

[4] S. Auer, A. Oelen, M. Haris, M. Stocker, J. D’Souza und andere: Improving Access to Scientific Literature with Knowledge Graphs, Bibliothek Forschung und Praxis, Vol. 44, Nr. 3, 2020, DOI: 10.1515/bfp-2020-2042.10.1515/bfp-2020-2042Suche in Google Scholar

[5] O. Karras, F. Wernlein, J. Klünder und S. Auer: Divide and Conquer the EmpiRE: A Community-Maintainable Knowledge Graph of Empirical Research in Requirements Engineering. In: ACM/IEEE International Symposium on Empirical Software Engineering and Measurement (ESEM), IEEE, 2023, DOI: 10.1109/ESEM56168.2023.10304795.Suche in Google Scholar

[6] H. van de Sompel und C. Lagoze: All Aboard: Toward a Machine-Friendly Scholarly Communication System, In: The Fourth Paradigm, 2009.Suche in Google Scholar

[7] O. Karras, E. C. Groen, J. A. Khan und S. Auer: Researcher or Crowd Member? Why not both! The Open Research Knowledge Graph for Applying and Communicating CrowdRE Research. In: 2021 IEEE 29th International Requirements Engineering Conference Workshops (REW), IEEE, 2021, DOI: 10.1109/REW53955.2021.00056.10.1109/REW53955.2021.00056Suche in Google Scholar

[8] S. Auer, D. A. C. Barone, C. Bartz, E. G. Cortes, M. Y. Jaradeh und andere: The SciQA Scientific Question Answering Benchmark for Scholarly Knowledge. Nature Scientific Reports 13, 7240, 2023, DOI: 10.1038/s41598-023-33607-z.10.1038/s41598-023-33607-zSuche in Google Scholar

[9] M. Y. Jaradeh, M. Stocker und S. Auer: Question Answering on Scholarly Knowledge Graphs. In: International Conference on Theory and Practice of Digital Libraries, Springer, 2020, DOI: 10.1007/978-3-030-54956-5_2.10.1007/978-3-030-54956-5_2Suche in Google Scholar

[10] A. Oelen, M. Y. Jaradeh und S. Auer: ORKG ASK: A Neuro-symbolic Scholarly Search and Exploration System. In: Joint Proceedings of Posters, Demos, Workshops, and Tutorials of the 20th International Conference on Semantic Systems, CEUR, 2024, URL: https://ceur-ws.org/Vol-3759/paper7.pdf.Suche in Google Scholar

[11] O. Karras: KG-EmpiRE: A Community-Maintainable Knowledge Graph for a Sustainable Literature Review on the State and Evolution of Empirical Research in Requirements Engineering. In: IEEE 32nd International Requirements Engineering Conference (RE), 2024, DOI: 10.1109/RE59067.2024.00063.10.1109/RE59067.2024.00063Suche in Google Scholar

[12] O. Karras, F. Wernlein, J. Klünder und S. Auer: KG-EmpiRE: A Community-Maintainable Knowledge Graph of Empirical Research in Requirements Engineering. In: Software Engineering 2024, Gesellschaft für Informatik eV, 2024, DOI: 10.18420/sw2024_11.10.1109/ESEM56168.2023.10304795Suche in Google Scholar

[13] H. Hussein, A. Oelen, O. Karras und S. Auer: KGMM – A Maturity Model for Scholarly Knowledge Graphs Based on Intertwined Human-Machine Collaboration. In: From Born-Physical to Born-Virtual: Augmenting Intelligence in Digital Libraries: 24th International Conference on Asian Digital Libraries, Springer, 2022, DOI: 10.1007/978-3-031-21756-2_21.10.1007/978-3-031-21756-2_21Suche in Google Scholar

[14] S. Auer, M. Stocker, O. Karras, A. Oelen, J. D’Souza und andere: Organizing Scholarly Knowledge in the Open Research Knowledge Graph: An Open-Science Platform for FAIR Scholarly Knowledge. In: Proceedings of the Conference on Research Data Infrastructure, 2023, DOI: 10.52825/cordi.v1i.272.10.52825/cordi.v1i.272Suche in Google Scholar

[15] M. Stocker, T. Heger, A. Schweidtmann, H. Ćwiek-Kupczyńska, Lyubimir Penev und andere: SKG4EOSC – Scholarly Knowledge Graphs for EOSC: Establishing a Backbone of Knowledge Graphs for FAIR Scholarly Information in EOSC.In: Research Ideas and Outcomes 8:e83789, 2022, DOI: 10.3897/rio.8.e83789.10.3897/rio.8.e83789Suche in Google Scholar

[16] O. Karras, A. Lorenz und S. Auer: Präzisere Antworten: Sprachmodelle und Wissensgraphen für KI-gestützte Wissenschaft. In: Forschung & Lehre, Vol. 24, Nr. 9, 2024, URL: https://www.forschung-und-lehre.de/forschung/chancen-einer-ki-gestuetzten-wissenschaft-6667.Suche in Google Scholar

[17] S. Pan, L. Luo, Y. Wang, C. Chen, J. Wang und andere: Unifying Large Language Models and Knowledge Graphs: A Roadmap. In: IEEE Transactions on Knowledge and Data Engineering, IEEE, 2024, DOI: 10.1109/TKDE.2024.3352100.10.1109/TKDE.2024.3352100Suche in Google Scholar

[18] A. Hogan, C. Gutiérrez, M. Cochez, G. Melo, S. Kirrane und andere: Knowledge Graphs. Spinger, 2022, DOI: 10.1007/978-3-031-01918-0.10.1007/978-3-031-01918-0_2Suche in Google Scholar

[19] M. Stocker, A. Oelen, M. Y. Jaradeh, M. Haris, O. A. Oghli und andere: FAIR Scientific Information with the Open Research Knowledge Graph. In: FAIR Connect, Vol. 1, Nr. 1, 2023, DOI: 10.3233/FC-221513.10.3233/FC-221513Suche in Google Scholar

[20] J. D’Souza, H. Hussein, J. Evans, L. Vogt, O. Karras und andere: Quality Assessment of Research Comparisons in the Open Research Knowledge Graph: A Case Study. In: JLIS.it, Vol. 15, Nr. 1, 2024, DOI: 10.36253/jlis.it-547.10.36253/jlis.it-547Suche in Google Scholar

[21] L. Budde, K. Biester, P. Merkel, M. Lammers, M. Kriwall und andere: Investigation of the material combination 20MnCr5 and X45CrSi9-3 in the Tailored Forming of Shafts with Bearing Seats. In: Production Engineering, Vol. 16, Nr. 5, 2022, DOI: 10.1007/s11740-022-01119-w.10.1007/s11740-022-01119-wSuche in Google Scholar

[22] O. Karras, L. Budde und P. Merkel: Tailored Forming Process Chain for the Manufacturing of Hybrid Components with Bearing Raceways Using Different Material Combinations. Open Research Knowledge Graph, 2023, DOI: 10.48366/r187049.Suche in Google Scholar

[23] A. Seaborne und S. Harris: SPARQL 1.1 Query Language. W3C, W3C Recommendation, 2013, URL: https://www.w3.org/TR/2013/REC-sparql11-query-20130321/.Suche in Google Scholar

[24] M. Kejriwal: Knowledge Graphs: A Practical Review of the Research Landscape. In: Information, Vol. 13, Nr. 4, MDPI, 2022, DOI: 10.3390/info13040161.10.3390/info13040161Suche in Google Scholar

[25] C. Peng, F. Xia, M. Naseriparsa und F. Osborne: Knowledge Graphs: Opportunities and Challenges. In: Artificial Intelligence Review, Vol. 56, 2023, DOI: 10.1007/s10462-023-10465-9.10.1007/s10462-023-10465-9Suche in Google Scholar

[26] L. Jiang, X. Yan und R. Usbeck: A Structure and Content Prompt-based Method for Knowledge Graph Question Answering over Scholarly Data. In: Scholarly-QALD-23: Scholarly QALD Challenge at 22nd International Semantic Web Conference, 2023, URL: https://ceur-ws.org/Vol-3592/paper3.pdf.Suche in Google Scholar

[27] T. A. Taffa und R. Usbeck: Leveraging LLMs in Scholarly Knowledge Graph Question Answering. In: Scholarly-QALD-23: Scholarly QALD Challenge at 22nd International Semantic Web Conference, 2023, URL: https://ceur-ws.org/Vol-3592/paper5.pdf.Suche in Google Scholar

[28] D. Pliukhin, D. Radyush, L. Kovriguina, und D. Mouromtsev: Improving Subgraph Extraction Algorihtms for One-Shot SPARQL Query Generation with Large Language Models. In: Scholarly-QALD-23: Scholarly QALD Challenge at 22nd International Semantic Web Conference, 2023, URL: https://ceur-ws.org/Vol-3592/paper6.pdf.Suche in Google Scholar

[29] J. Lehmann, A. Meloni, E. Motta, F. Osborne, D. R. Recupero, A. A. Salatino, und S. Vahdati: Large Language Models for Scientific Question Answering: An Extensive Analysis of the SciQA Benchmark. In: European Semantic Web Conference, Springer Nature, 2024, DOI: 10.1007/978-3-031-60626-7_11.10.1007/978-3-031-60626-7_11Suche in Google Scholar

[30] P. Knoth, D. Herrmannova, M. Cancellieri, L. Anastasiou, N. Pontika, S. Pearce, B. Gyawali und D. Pride: CORE: A Global Aggregation Service for Open Access Papers. In: Nature Scientific Data 10, 366, 2023, DOI: 10.1038/s41597-023-02208-w.10.1038/s41597-023-02208-wSuche in Google Scholar

Online erschienen: 2025-01-15
Erschienen im Druck: 2025-01-14

© 2024 Walter de Gruyter GmbH, Berlin/Boston

Heruntergeladen am 5.2.2026 von https://www.degruyterbrill.com/document/doi/10.1515/iwp-2024-2052/pdf
Button zum nach oben scrollen