1 Einleitung
Sprachliches Handeln im Feld der Wissenschaft wird seit den 1980er Jahren unter der Bezeichnung Wissenschaftsspracheforschung untersucht (vgl. Kretzenbacher/Weinrich 1995). Diese vor dem Hintergrund der Fachsprachenforschung entstandene Forschungsrichtung beschreibt ihren Gegenstandsbereich ausgehend vom Handlungsfeld der Wissenschaft „als Gesamtheit der Phänomene sprachlicher Tätigkeit […], die im kulturellen Handlungsfeld der Wissenschaften auftreten und die zugleich dieses als theoriebildende und -verarbeitende Kommunikationsgemeinschaft sowie als gesellschaftliche Institution entscheidend konstituieren.“ (Kretzenbacher 1998: 134). In einem weiteren Sinne wird unter der Bezeichnung Wissenschaftskommunikation sprachliches Handeln, das eine Bezugnahme auf wissenschaftliches Wissen oder wissenschaftliche Tätigkeit beinhaltet, betrachtet. Dieses kann von Institutionen oder Individuen ausgehen, es kann im Wissenschaftsfeld tätige Personen oder die Öffentlichkeit adressieren, seine Ziele können im Informieren, Beeinflussen, Aufklären oder im Streiten über bzw. Aushandeln von wissenschaftsbezogenen Themen liegen (Leßmöllmann/Gloning 2020: XI). Für beide Zugänge ist jeweils wesentlich, dass Sprache bzw. Kommunikation konstitutiv ist für wissenschaftliches Wissen, wissenschaftliche Tätigkeit und deren Einbindung in andere gesellschaftliche Handlungsfelder (z. B. Wirtschaft, Kultur, Bildung, ebd.: XIII). So ist Kommunikation durch Sprache einerseits grundlegend im Wissenschaftsprozess selbst, für Theoriebildung, Forschungsprozess und Mitteilung von Forschungsergebnissen an die Wissenschaftsgemeinschaft (Kretzenbacher 1998). In diesem als interne Wissenschaftskommunikation umrissenen Bereich kommen insbesondere die epistemische Funktion, die systematische Produktion und Überprüfung von Wissen im Wissenschaftssystem sowie die Formen des Sprachgebrauchs (z. B. in Lexik, Ausdrucksroutinen, Handlungsformen, Textsorten), die sich für diese Zwecke herausgebildet haben und die sich mit technisch-medialen Entwicklungen verändern und erweitern, in den Blick (Leßmöllmann/Gloning 2020: XII f.). Mit dem als externe Wissenschaftskommunikation umrissenen Bereich wird die Kommunikation von wissenschaftlichem Wissen und wissenschaftlicher Tätigkeit an die weitere Öffentlichkeit untersucht, wobei die Unterscheidung intern – extern keine klare Grenzziehung erlaubt und sich im Zuge der Medialisierung wandelt. So ist v. a. für die externe Wissenschaftskommunikation die Entwicklung zu einer Vielfältigkeit der Formate, aber auch der beteiligten Akteure und Institutionen zu beobachten (ebd.: XIV). Perspektiven auf sprachliches Handeln im Feld der Wissenschaft kommen neben Teildisziplinen der Linguistik aus Kommunikations- und Medienwissenschaft sowie weiteren Fachbereichen (vgl. die Beiträge in Leßmöllmann/Gloning 2020). Die Erforschung des Sprachgebrauchs in der Wissenschaft hat starke Impulse aus der Perspektive der angewandten Forschung für die Wissenschaftssprachevermittlung erfahren (vgl. Jaworska 2015), insbesondere vor dem Hintergrund der Internationalisierung des akademischen Bereichs (vgl. Fandrych 2018). In Bezug auf das Englische als Wissenschaftssprache besteht mit dem Journal of English for Academic Purposes (JEAP) eine auf Wissenschaftssprache spezialisierte Fachzeitschrift, deren Gegenstand die „linguistic, sociolinguistic, and psycholinguistic description of English as it is used for the purposes of academic study and scholarly exchange“ ist[1] und die linguistische, angewandt-linguistische und bildungsbezogene Themen der Wissenschaftsspracheforschung abdeckt.
Für die empirische linguistische Forschung in allen genannten Feldern bilden Gebrauchsdaten, die sprachliches Handeln im Feld der Wissenschaft abbilden, eine wichtige Arbeitsgrundlage. Im vorliegenden Beitrag sollen verfügbare Ressourcen für Sprachdaten dieser Art vorgestellt werden. Um den Bereich für die Darstellung einzugrenzen, wird der Fokus auf Ressourcen für eine korpuslinguistisch arbeitende synchrone Wissenschaftsspracheforschung zum Deutschen gelegt. Unter Korpora werden hier nach bestimmten Kriterien zusammengestellte größere Sammlungen von Sprachgebrauchsdaten verstanden, die strukturiert in einem digitalen Format vorliegen und mit Hilfe von Korpusanalysesoftware abgefragt und quantitativ ausgewertet werden können. Der Beitrag folgt in seiner Gliederung einer korpusmethodischen Perspektive: Er geht zunächst auf Ressourcen für die Auswahl und Beurteilung von Sprachdaten(angeboten) für die korpuslinguistische Erforschung von Wissenschaftssprache ein (Abschnitt 2), stellt dann die über bestehende Korpora bzw. Korpusplattformen verfügbaren Datenangebote zur Wissenschaftssprache vor (Abschnitt 3) und ergänzt dies durch einen Blick auf Quellen für die Erhebung von Sprachgebrauchsdaten aus dem Handlungsfeld der Wissenschaft zur Erstellung eigener Korpora (Abschnitt 4).
2 Ressourcen zur Beurteilung der Repräsentativität von Sprachdaten aus dem Feld Wissenschaft
Die Korpuslinguistik stellt einen spezifischen Zugang der Sprachanalyse dar: „[T]he distinctive characteristic of corpus linguistics is the claim that it is possible to actually ‘represent’ a domain of language use with a corpus of texts, and possible to empirically describe linguistic patterns of use through analysis of that corpus.“ (Biber/Reppen 2015: 1) Unabhängig davon, ob mit (einer Datenauswahl aus) verfügbaren Korpora oder selbst erstellten Korpora gearbeitet wird, steht daher am Beginn zunächst die Frage nach der Abbildung des wissenschaftsbezogenen Sprachbereichs, d. h. die Frage, wie sich die Repräsentativität von möglichen Datengrundlagen einschätzen lässt. Dies umfasst die Bestimmung des realweltlichen Sprachverwendungsbereiches, über den etwas ausgesagt werden soll, und die Einschätzung seiner Abbildung durch ein Korpus (vgl. Egbert/Biber/Gray 2022: 70). Hierfür ist Referenzwissen zu Umfang und interner Variation des Sprachverwendungsbereichs notwendig (Hinweise dazu, wie dieses prinzipiell recherchiert werden kann, geben Egbert/Biber/Gray 2022: Kap. 4).
Die Wissenschaftsspracheforschung kann bezüglich der Gliederung des Gegenstandsbereichs auf umfangreiche Arbeiten der Fachsprachenforschung zurückgreifen, die aus übergeordneten Modellen entwickelte Kriterien bzw. Typologien der Gliederung anbieten (horizontal nach verschiedenen Disziplinen, vertikal nach verschiedenen Abstraktionsebenen bzw. Typen der Kommunikation zwischen Personen mit unterschiedlichen Graden an Professionswissen sowie nach Textsorten, vgl. Roelcke 2024). In Bezug auf die horizontale Gliederung können etwa institutionell bestehende Fächereinteilungen herangezogen werden (etwa jene von Forschungsförderinstitutionen (z. B. DFG (2024), SNF (2016)) oder Statistikbehörden (z. B. Statistisches Bundesamt (2024), Statistik Austria).[2]
Die Einschätzung der Repräsentativität ist in Bezug auf Qualifikationsarbeiten besonders gut möglich, da sich hier Informationen zur Grundgesamtheit recherchieren lassen. So kann mit Hilfe von Bibliotheken und Publikationsdiensten die Menge vorliegender wissenschaftlicher Qualifikationsarbeiten in Erfahrung gebracht werden. Die Deutsche Nationalbibliothek (DNB) erfasst ihrem Dokumentationsauftrag entsprechend alle in Deutschland oder in deutscher Sprache erschienenen Publikationen.[3] Anhand des Metadatenelements Hochschulschriftenvermerk sind Dissertationen und Habilitationen (anhand der Werte diss* oder habil*) im Katalog identifizierbar und mit Hilfe der Sachgruppen nach der Dewey Dezimalklassifikation (DCC)[4] in Wissensgebiete unterscheidbar (z. B. 400 Sprache, Linguistik, 610 Medizin, Gesundheit).[5] Über das DNB-Lab können die Metadaten des gesamten Bestandes durchsucht werden.[6] In Österreich erschienene Hochschulschriften einschließlich Bachelor, Master- und Diplomarbeiten sind über die Suchmaschine des österreichischen Bibliotheksverbundes recherchierbar.[7] Um die Menge online veröffentlichter Hochschulschriften einschätzen zu können, kann ebenfalls auf die DNB zurückgegriffen werden, die alle in Promotionsordnungen von Universitäten festgelegten Online-Veröffentlichungen von Dissertationen erfasst.[8] Weltweit kann über Networked Digital Library of Theses and Dissertations (NDLTD) recherchiert werden.[9] In Bezug auf online veröffentlichte Qualifikationsarbeiten (Bachelor-, Master-, Diplomarbeiten) lässt sich über die Deutsche Initiative für Netzwerkinformation recherchieren, die eine Liste der Repositorien und Publikationsdienste (wie z. B. Publikationsserver von Universitätsbibliotheken) verlinkt.[10]
3 Datenangebote zur Wissenschaftssprache in bestehenden Korpora bzw. Korpusplattformen
Bestehende Korpora bzw. Korpusplattformen bieten Quellen für Sprachdaten aus verschiedenen Konstellationen des Spektrums interner und externer deutschsprachiger Wissenschaftskommunikation. Die Daten liegen hier bereits zu einem Korpus aufbereitet, linguistisch annotiert und strukturiert abfragbar vor. Datenangebote zur schriftlichen Wissenschaftssprache/-kommunikation gibt es im Deutschen Referenzkorpus DeReKo (zur Anlage des Korpus und Recherchemöglichkeiten vgl. Lüngen 2017), in den Korpora des Digitalen Wörterbuchs der deutschen Sprache (DWDS, zu Recherchemöglichkeiten vgl. Geyken et al. 2017) sowie im Austrian Media Corpus (AMC), welches die gesamte Printmedienproduktion Österreichs (seit den späten 1980er Jahren) abbildet (zur Anlage des Korpus vgl. Ransmayr/Pirker 2023, zu Recherchemöglichkeiten Pirker 2024). Datenangebote zur mündlichen Wissenschaftssprache/-kommunikation enthält die Datenbank für gesprochenes Deutsch (DGD) (zur korpuslinguistischen Aufbereitung gesprochener Sprache und Recherchemöglichkeiten in der DGD vgl. Schmidt 2017, zu aktuellen Erweiterungen der Recherchemöglichkeiten vgl. Frick/Helmer/Wallner 2023 und Schmidt/Schwendemann/Wallner 2023). Je nach Korpusplattform werden verschiedene korpuslinguistische Analyseverfahren unterstützt (im Wesentlichen Konkordanzsuchen mit verschieden Filter- und Sortiermöglichkeiten sowie (in unterschiedlichem Umfang) Zugang zum weiteren Belegkontext, statistische Auswertungen zu Suchanfragen, Kookkurrenzberechnungen, Möglichkeiten zum Export von Belegen). Für DeReKo werden Schnittstellen für die Abfrage und Auswertung über die Programmiersprachen R und Python bereitgestellt (vgl. Kupietz/Lüngen/Diewald 2023: 19–22). Neben Korpusressourcen zur Wissenschaftssprache, die in diesen Korpusportalen bzw. Korpora enthalten sind, bietet die CLARIN-Ressourcenfamilie Corpora of Academic Texts[11] eine Zusammenstellung von verfügbaren Korpora wissenschaftlicher Texte verschiedener europäischer Sprachen. CLARIN (Common Language Resources and Technology Infrastructure)[12] ist eine europäische Infrastruktur, die Zugang zu Daten, Werkzeugen und Services zur Unterstützung von Forschung, die mit Sprachdaten arbeitet bzw. auf diesen basiert, bietet. Unter der Bezeichnung der Ressourcenfamilien werden kuratierte Sammlungen bereitgestellt, u. a. Korpusressourcen zu bestimmten Themen.[13] Diese umfassen zum Teil Korpora, die in Korpusplattformen eingebunden sind, zum Teil auch solche, die als Datensatz vorliegen. In der Zeitschrift Korpora Deutsch als Fremdsprache (KorDaF)[14] stellt die Rubrik Korpora regelmäßig Korpusressourcen zum Deutschen vor, darunter auch Korpora zur Wissenschaftssprache (vgl. Portmann 2022, Ho 2023, Wallner 2023).
Im Folgenden werden die in den genannten Quellen aktuell recherchierbaren Korpusressourcen zur Wissenschaftssprache/-kommunikation aufgeführt. Für diesen Überblick erfolgt eine Gruppierung nach 1) Korpusressourcen zur internen Wissenschaftskommunikation unter fachlichen Expert:innen, 2) Korpusressourcen, welche die Vermittlung an Noviz:innen des Wissenschaftsbetriebs bzw. den Erwerb wissenschaftssprachlicher Kompetenzen auf unterschiedlichen Qualifikationsstufen abbilden und 3) Korpusressourcen zur externen Wissenschaftskommunikation (v. a. der journalistischen Berichterstattung über wissenschaftliches Wissen und wissenschaftliche Tätigkeit). Diese Gruppierung stellt eine Vereinfachung dar, da nicht immer eine klare Grenzziehung möglich ist. Inwieweit eine Zuordnung zu eher interner, eher vermittlungsbezogener oder eher externer Wissenschaftskommunikation angemessen ist, muss z. T. für einzelne Datensätze der Korpusressourcen individuell bewertet werden und steht in Abhängigkeit zur verfolgten Forschungsfrage.
3.1 Wissenschaftskommunikation unter fachlichen Expert:innen
Korpusressourcen zur schriftlichen Kommunikation unter fachlichen Expert:innen bietet DeReKo mit Ausgaben von Fachzeitschriften und Fachmagazinen bzw. -zeitungen. Diese stammen v. a. aus angewandten Disziplinen. Neben wissenschaftlichen Artikeln enthalten sie zum Teil auch andere Textsorten. Beispielhaft genannt werden können etwa aus dem Bereich Medizin/Gesundheitswesen das Deutsche Ärzteblatt (2017–2023, 9 311 990 Token), die Ärztezeitung (2017–2023, 13 599 982 Token) oder Das Krankenhaus (2017–2023, 282 370 Token), aus dem Bereich Recht die Europäische Zeitschrift für Wirtschaftsrecht (2017–2023, 3 988 185 Token), MDR – Monatsschrift für Deutsches Recht (2017–2023, 5 769 074 Token), aus dem Bereich Ingenieurwissenschaften unter anderem die Automobiltechnische Zeitschrift ATZ (2007–2016 2 051 144 Token), die Motortechnische Zeitschrift MTZ (2007–2016, 2 191 273 Token),[15] KEM Konstruktion|Automation (2020–2023, 899 762 Token) oder aus dem Bereich Betriebswirtschaft Der Betrieb (2017–2023, 14 917 116 Token).[16] Das DWDS-Kernkorpus bietet eine einem übergeordneten Korpusdesign folgende Quelle für wissenschaftliche Fachpublikationen. Dem DWDS-Kernkorpus liegt das Ziel zugrunde, „ein lexikografisches Korpus zusammenzustellen, das als ausgewogen und hinreichend groß in Bezug auf den Forschungsgegenstand „deutscher Wortschatz des 20. Jahrhunderts bewertet werden kann.“[17] Es umfasst für das 20. Jahrhundert für jede Dekade 10 Mio. Textwörter, die sich zu etwa je einem Viertel auf die Textklassen Belletristik, Zeitung, Gebrauchstexte und die Textklasse Wissenschaft verteilen. Eine Fortsetzung für das 21. Jahrhundert wird erarbeitet.[18] Für das Teilkorpus Wissenschaft werden Texte aus dem gesamten Disziplinenspektrum, Monographien, Aufsätze aber auch Lexika ausgewählt. Der Korpusinhalt ist recherchierbar über die bibliographische Datenbank zum Korpus.[19] Ergänzt werden kann hier zudem eine Quelle aus der CLARIN-Ressourcenfamilie zu Korpora wissenschaftlicher Texte (die insgesamt v. a. Korpora anderer Sprachen umfasst). Deutschsprachige Daten enthält das aus einem computerlinguistischen Projekt stammende MuchMore Springer Bilingual Corpus, ein englisch-deutsches Parallelkorpus (d. h. Übersetzungen) medizinischer Abstracts, das je Sprache 1 Mio. Token an Abstracts aus 41 Fachzeitschriften für Teilgebiete der Medizin umfasst. Die Datensätze des deutschen und des englischen Teilkorpus (datiert 2002) werden in einer Plain-Text Version und einer (nach Wortarten, Morphologie, Chunks, semantischen Klassen und Relationen) annotierten Version im XML-Format zur Verfügung gestellt.[20]
Korpusressourcen zur mündlichen Kommunikation unter fachlichen Expert:innen bietet das Korpus Gesprochene Wissenschaftssprache kontrastiv (GeWiss, vgl. Fandrych/Meißner/Slavcheva 2014, Fandrych/Meißner/Wallner 2017), das u. a. als Teil der DGD zugänglich ist (dort GWSS). GeWiss ist für die Forschung und Anwendung in der Sprachvermittlung entstanden als Vergleichskorpus, das analoge Diskursarten aus dem Fachbereich der Philologie in verschiedenen Sprachen umfasst. Hierzu zählen auch Konferenzvorträge (einschließlich Anschlussdiskussionen) im Deutschen (L1 und L2, insgesamt 33 Sprechereignisse, 166 639 Token) sowie im Polnischen, Englischen und Italienischen.[21] Die Daten sind aussprachenah den GAT 2 Konventionen folgend transkribiert und verfügen über tokenbasierte Annotationen zu orthographisch normalisierter Form, Lemma und Wortart. Darüber hinaus sind für deutschsprachige Expertenvorträge (L1) als tokenübergreifende Annotationen Diskurskommentierungen sowie Verweise und Zitate annotiert, für deutschsprachige Expertenvorträge (L2) Sprachwechsel. Über den Zugang ZuRecht (vgl. Frick/Helmer/Wallner 2023) ist das Korpus mit tokenbasierten und tokenübergreifenden Annotationen sowie den nicht-deutschsprachigen Daten recherchierbar (vgl. zur Zugänglichkeit Wallner 2023). Das Forschungs- und Lehrkorpus Gesprochenes Deutsch FOLK in der DGD folgt in seinem Aufbau einem Stratifikationskonzept (Kaiser 2018), das auf der obersten Ebene öffentliche, institutionelle und private Interaktionsdomänen unterscheidet. Gespräche der öffentlichen Domäne, d. h. solche, die bei öffentlich zugänglichen bzw. massenmedial vermittelten Anlässen und meist mit Publikum stattfinden (Kaiser 2018: 521), werden nach gesellschaftlichen Handlungsbereichen (Lebensbereichen) weiter differenziert, zu denen auch der Bereich „Wissenschaft“ gehört. Aktuell enthält das FOLK-Korpus aus diesem Bereich ein Sprechereignis einer Podiumsdiskussion, die im Rahmen einer wissenschaftlichen Tagung stattgefunden hat (FOLK_E_00361, 1:26 h, 12 129 Token, ebenfalls aussprachenah nach GAT 2 transkribiert, Annotationen zu orthographisch normalisierter Form, Lemma und Wortart). Bei einer Erweiterung von FOLK wären dem Stratifikationskonzept folgend hier auch Sprechereignisse zu erwarten, die sich eher dem Bereich der externen Wissenschaftskommunikation zuordnen ließen.
3.2 Vermittlung und Kompetenzerwerb
Verfügbare Korpusressourcen zur Vermittlung an Noviz:innen des Wissenschaftsbetriebs bzw. Korpusressourcen, die den Erwerb wissenschaftssprachlicher Kompetenzen durch Noviz:innen abbilden, bietet das über die DGD zugängliche Korpus Mitschreiben in Vorlesungen: Ein multimodales Lehr-Lernkorpus (MIKO), das im Rahmen des Projekts Sprache und Studienerfolg (Wisniewski et al. 2022) aufgebaut wurde. Es umfasst insgesamt 12 Audioaufnahmen von Vorlesungen aus den Fächern Medizin, Deutsch als Fremdsprache und Wirtschaftswissenschaften, für 9 liegen ebenfalls Videoaufnahmen vor, 8 sind nach den Konventionen der Halbinterpretativen Arbeitstranskription (HIAT) transkribiert und um Lemma und Wortart annotiert recherchierbar (insgesamt 81 929 Token). Zusätzlich liegen anonymisierte Mitschriften von Studierenden (L1/L2) sowie Metadaten vor, die über das Archiv für Gesprochenes Deutsch (AGD) angefragt werden können. Weiterhin bietet das GWSS-Korpus in der DGD studentische Referate (mit anschließender Diskussion) des Fachbereichs Deutsche Philologie aus dem deutschen, polnischen, britischen sowie bulgarischen und finnischen[22] akademischen Kontext (Deutsch als L1/L2, insgesamt 106 Sprechereignisse, 240 935 Token). Über den Zugang ZuRecht sind ebenfalls die studentischen Referate der polnisch- und englischsprachigen Teilkorpora sowie die für das Teilkorpus des deutschen akademischen Kontextes annotierten Verweise und Zitate recherchierbar. GWSS umfasst daneben Prüfungsgespräche des Fachbereichs Deutsche Philologie aus dem deutschen, polnischen und britischen akademischen Kontext (Deutsch als L1/L2, insgesamt 137 Sprechereignisse, 334 800 Token). Auch hier sind über den Zugang ZuRecht die Prüfungsgespräche der polnisch- und englischsprachigen Teilkorpora recherchierbar.
Für das Feld der schriftlichen Qualifikationsarbeiten ist ein Korpus der über die DNB gesammelten Online-Dissertationen im Aufbau, welches mit Hilfe einer Instanz der Korpusanalyseplattform KorAP über die DNB abfragbar gemacht wird (DeFaKo; vgl. Kupietz/Leinen/Diewald 2024). In einer ersten zum Ende des Jahres 2024 geplanten Version soll das Korpus 10 000 Dissertationen umfassen und nach Sachgruppen der DDC sowie nach Publikationsjahr stratifiziert sein.[23] Über die CLARIN-Ressourcenfamilien sind zwei schriftsprachliche Korpora auffindbar, die den Erwerb der Wissenschaftssprache abbilden. So listet die Ressourcenfamilie zu Korpora wissenschaftlicher Texte UH’s German E-thesis corpus, das deutschsprachige Master- und Doktorarbeiten umfasst, die in elektronischer Form zwischen 2009 und 2016 an der Universität Helsinki eingereicht wurden. Das Korpus ist nicht annotiert und als Teil der Language Bank of Finland recherchierbar über das Konkordanzwerkzeug KORP.[24] Die CLARIN-Ressourcenfamilie L2 Learner Corpora führt zudem das Kommentierte Lernendenkorpus akademisches Schreiben (Kolas) auf (vgl. Knorr/Andresen 2017).[25] Dieses enthält 853 Texte, die an der Universität Hamburg von Studierenden mit verschiedenen Herkunftssprachen sowie aus unterschiedlichen Studiengängen im Rahmen des Studiums als Prüfungsleistungen geschrieben wurden. Die Texte wurden in individueller Schreibberatung an der Schreibwerkstatt Mehrsprachigkeit besprochen und umfassen z. T. Kommentierungen von Tutor:innen und Versionen aus dem Schreibprozess. Das Korpus ist als Datensatz zugänglich.[26] Das in der KorDaF-Rubrik Korpora vorgestellte Vietnamesische Lernerkorpus (VieLKo) umfasst Vorträge in Fachseminaren, Haus-, Bachelor- und Masterarbeiten von Studierenden an zwei Hochschulen in Vietnam (Ho 2023). Zudem ist mit dem studentischen Exposé-Korpus (ExpoKo) ein mehrebenenannotiertes Korpus mit Exposés von Studierenden mit Deutsch als L1 und L2 im Entstehen.[27]
3.3 Externe Wissenschaftskommunikation
Verfügbare Korpusressourcen der externen Wissenschaftskommunikation betreffen die journalistische Berichterstattung über Wissenschaft und wissenschaftliches Wissen. So sind in DeReKo Ausgaben verschiedener populärwissenschaftlicher Zeitschriften abfragbar (spektrumdirekt 1997–2012, 6 806 704 Token, Zeit Wissen 2009–2023 2 588 822 Token, Hörzu Wissen 2018–2023, 56 618 Token, GEO 2009–2023, 5 382 675 Token).[28] Daneben ermöglicht die Recherche in DeReKo über Cosmas 2 die Gruppierung von Treffern in Zeitungstexten (und anderen Textquellen) nach einer Themen-Ansicht. Diese basiert auf einer durch einen Naive-Bayes-Klassifikator automatisch bestimmten wahrscheinlichsten Themenkategorie für jeden Text, worunter auch eine thematische Haupt- und Unterkategorie Wissenschaft: Populärwissenschaft fällt (vgl. Weiß 2005).[29] Mit Hilfe der Themenansicht lassen sich Treffer herausfiltern, die aus Texten stammen, welche in der automatischen Klassifikation thematisch dem Gebiet Wissenschaft zugeordnet wurden. Zum Beispiel ergibt eine Suche nach Begriff im Korpus bmp – Berliner Morgenpost, 1997–2023 insgesamt 13 926 Treffer in 12 415 Dokumenten und es lassen sich in der Trefferansicht nach Themen 647 Treffer in 572 Dokumenten, die der Themen-Kategorie Wissenschaft: Populärwissenschaft zugeordnet sind, finden. Der Blick in die Belege zeigt, dass die so thematisch klassifizierten Texte in der Zeitung unterschiedliche Originalressortangaben aufweisen können (z. B. Hochschule, Politik, Gesundheit oder auch keine Ressortbenennung). Für die DWDS-Zeitungskorpora können mit Hilfe des Metadatums zur Textklasse Texte aus wissens- oder wissenschaftsbezogenen Ressorts ausgewählt werden. Durch COUNT-Abfragen können die vorhandenen Textklassen-Bezeichnungen für ein Korpus recherchiert werden.[30] So gibt es etwa im Korpus Tagesspiegel (1996–2004) 5 266 Dokumente mit der Textklasse Zeitung:Wissen & Forschen oder im Korpus Die ZEIT (1946–2023) 28 734 Texte der Textklasse Zeitung:Wissen. Entsprechend können Abfragen auf diese Textklassen eingeschränkt werden (so ergibt z. B. eine Suche nach dem Wort Begriff im Korpus Die ZEIT (1946–2023) mit dem Suchausdruck Begriff #HAS[textClass,/Zeitung:Wissen/] 2 844 Treffer). Im AMC ist mit Hilfe der Metadaten zur Ressortzuordnung (Metadatenschlüssel doc ressort2) eine Recherche journalistischer Berichterstattung zum Themengebiet Wissenschaft in Österreich möglich. Die Metadaten basieren dabei auf den Ressortangaben der Originaldokumente und einer darauf aufbauenden Teilkuration, die unterschiedliche Bezeichnungen auf eine kanonische Ressortbezeichnung zurückführt.[31] Über den Wert „Wissenschaft“ für den Metadatenschlüssel ressort2 können so entsprechend Dokumente für die Analyse herausgefiltert werden, welche die Ressortzuordnung Wissenschaft enthalten. In der ohne Registrierung zugänglichen Demoversion des Korpus sind dies bspw. Agenturmeldungen mit Wertekombinationen für doc ressort2 wie „inland wissenschaft“ (z. B. die APA-Meldung „Wissenschaftsministerin setzt auf mehr Sponsoring und Studiengebühren“) oder „ausland chronik wissenschaft“ (z. B. die APA-Meldung „Astronomen spürten Schwarzes Loch in Rekorddistanz auf“) (vgl. zur Abfrage des AMC Pirker 2024).
Des Weiteren sind Korpusressourcen zu nennen, die durch digitale Medien ermöglichte Formen der Wissenschaftskommunikation abbilden. Für eine kollaborative Wissensproduktion, an der Expert:innen und Laien beteiligt sind, steht hierbei die Wikipedia (vgl. Bucher 2020: 64). Sie wird sowohl in externer wie interner Wissenschaftskommunikation als Quelle zur Orientierung genutzt (Leßmöllmann 2020: 676). Die Artikel und Diskussionen der deutschsprachigen Wikipedia bis 2019, die in ihrer Gesamtheit Teil von DeReKo sind und nach Artikeln und Diskussionen getrennt abgefragt werden können, bilden damit ebenfalls eine für die Forschung zur Wissenschaftskommunikation relevante Korpusressource (vgl. zur Wikipediaforschung Gredel/Storrer/Herzberg 2018).
4 Quellen für die Erhebung von Sprachdaten aus dem Handlungsfeld der Wissenschaft
Die Open-Access-Bewegung hat dazu geführt, dass sprachliche Produkte, in denen wissenschaftliches Wissen kommuniziert wird, in zunehmendem Umfang zugänglich sind. Somit stehen für die Wissenschaftsspracheforschung neben verfügbaren aufbereiteten Datenbeständen in Korpora viele Quellen zur Recherche von Open-Access-Veröffentlichungen zur Verfügung. Diese umfassen zum einen den Bestand von Repositorien, d. h. Dokumentenservern, die von Universitäten oder Forschungsinstitutionen betrieben werden, um wissenschaftliche Materialien zu archivieren und zugänglich zu machen,[32] daneben Open-Access-Zeitschriften und Open-Access-Bücher sowie Open Educational Resources (OER), die sich an Studierende sowie auch die breite Öffentlichkeit richten können. Open-Access-Materialien bieten damit mögliche Datenquellen sowohl für Untersuchungen zur internen wie zur externen Wissenschaftskommunikation. Für die Recherche nach Datenquellen zur Wissenschaftssprache in diesem weiten Feld bietet das Open Access Network[33] eine Ressource. Dieses aktuell vom Bundesministerium für Bildung und Forschung (BMBF) geförderte Projekt zielt u. a. darauf ab, Informationen zum Thema Open Access zur Verfügung zu stellen. Es bündelt Informationen und Links zu Repositorien, OA-Zeitschriften und -Büchern sowie OER, mit deren Hilfe Quellen für die Untersuchung von Wissenschaftssprache erschlossen werden können.
Es sollen hier Zugangswege genannt werden, über die OA-Daten für die Erstellung eigener Korpora recherchiert werden können. So ist OpenDOAR ein globales Verzeichnis von Open-Access-Repositorien, das eine Suche nach verschiedenen Inhaltstypen (z. B. Journal Articles, Conference and Workshop Papers, Theses and Dissertations, Reports and Working Papers, Datasets) erlaubt. Auch eine länderspezifische Suche nach Repositorien ist möglich.[34] Repositorien können übergreifend mit Hilfe von Suchmaschinen abgefragt werden. Eine Suchmaschine für wissenschaftliche Web-Dokumente ist BASE (Bielefeld Academic Search Engine).[35] BASE erlaubt neben der Recherche mit Hilfe von Suchbegriffen ein Browsing von Dokumenten, welches die Kriterien Dewey-Dezimal-Klassifikation (DDC) von Wissensgebieten, Dokumentart (z. B. Abschlussarbeit, Masterarbeit, Dissertation, Artikel), Lizenz und Zugang kombinieren kann. Bspw. ergibt eine Suche nach der Dokumentart Bachelorarbeit gefiltert nach der Sprache Deutsch und dem Erscheinungsjahr 2021 für Sozialwissenschaften, Soziologie 135 Treffer, für Medizin und Gesundheit 92, für Deutsche und verwandte Literaturen 50 (wobei die Zuordnung zu Wissensgebieten z. T. von Datenlieferanten stammt, teils automatisch nachklassifiziert wurde). Das Open Access Network bietet zudem zusammengestellt nach Fachdisziplinen Informationen zur fachspezifischen Akzeptanz von OA, zu verfügbaren fachspezifischen Repositorien sowie zu OA-Fachzeitschriften und -Büchern.[36] Über DOAJ (Directory of Open Access Journals)[37] können OA-Zeitschriften für alle Fächer und Sprachen weltweit recherchiert werden, über DOAB (Directory of Open Access Books)[38] können peer reviewte OA-Monographien recherchiert werden, eine Suche nach deutschsprachigen Werken ergab aktuell 12 912 Treffer. Im OA-Kontext stellen Korpora Forschungsdaten dar, die in Forschungsdatenrepositorien zugänglich gemacht werden können. Repositorien für Forschungsdaten können über das Registry of Research Data Repositories[39] recherchiert werden. Eine Suche nach corpora und German als Forschungsdaten ergibt aktuell z. B. 12 Repositorien (z. B. das IDS-Repositorium).[40] OER-Materialien können Quellen für verschiedene Formen der Vermittlung wissenschaftlichen Wissens bieten, etwa für Vorlesungen in der wissenschaftlichen Lehre oder für Vorträge auf Tagungen, die für die akademische Lehre bzw. die Öffentlichkeit angeboten werden. Über OERSI, den Suchindex für Open Educational Resources in der Hochschullehre[41] können verfügbare Materialien etwa nach Fachgebiet (z. B. Ingenieurwissenschaften, Mathematik/Naturwissenschaften, Geisteswissenschaften), Materialtyp (z. B. Video, Lehrbuch, Übung, Kurs), Autor:in, Institution (z. B. ETH Zürich, Universität Hamburg) und Lizenz gefiltert werden. So gibt es z. B. aktuell für die Filter Geisteswissenschaften, Fachbereich Geschichte, Video, Universität Hamburg 13 Treffer. Über OpenLearnWare[42] stellt z. B. die TU Darmstadt Vorlesungsaufzeichnungen verschiedener Fächer zur Verfügung und bildet damit eine Quelle für Sprachdaten, die die Vermittlung an Noviz:innen in der Hochschullehre abbilden. Über die Hamburg open University[43] stellt der Verbund der Hamburger Hochschulen Lernangebote zu verschiedenen Themenbereichen bereit, die eine breite Öffentlichkeit adressieren. Dies stellt somit eine Quelle für Sprachdaten dar, die Formen der externen Wissenschaftskommunikation abbilden. Auf der Basis von OA-Quellen können so eigene Korpora für Fragen der Wissenschaftsspracheforschung erstellt werden. Eine Quelle für die Recherche von Software zur Analyse selbst erstellter Korpora bietet die CLARIN-Ressourcenfamilie zu Corpus Query Tools.[44]
Beispiele, die Entscheidungen zur Korpuserstellung und -aufbereitung auf der Basis von online zugänglichen Sprachdaten sowie mit Daten der Online-Wissenschaftskommunikation involvieren, geben etwa folgende Arbeiten: Die Nutzung von online veröffentlichten Dissertationen als Datengrundlage für den Aufbau eines Korpus zur Ermittlung fachübergreifender Lexik geisteswissenschaftlicher Disziplinen zeigt die Arbeit von Meißner/Wallner (2019). Die Nutzung der Plattform Youtube als Datenquelle für den Aufbau eines Korpus von Vorlesungen für eine Fragestellung der Registeranalyse zeigt die Dissertation von Keller (2021). Die Nutzung das Blogportals Scilogs zum Aufbau eines Korpus zeigt ein aktuelles Forschungsprojekt zu Expertise-Aushandlung und Verständigungspraktiken in der Online-Wissenschaftskommunikation (vgl. Bender/Bubenhofer/Janich 2024). Die Nutzung der Webseiten von Universitäten und Forschungseinrichtungen zum Aufbau eines Korpus, welches mit diskurslinguistischem Interesse öffentliche Diskurse und die in diesen sprechenden Akteure bzw. Akteursgruppen abbildet, zeigt die Plattform Swiss-AL mit dem Korpus SWISS-AL Base (vgl. Dreesen/Krasselt 2023).
5 Fazit und Ausblick
Der Beitrag hat Sprachdatenressourcen für die Wissenschaftsspracheforschung vorgestellt und hierbei den Fokus auf Korpora und Fragen der Korpusauswahl gelegt. Sprachgebrauch im Handlungsfeld der Wissenschaft findet sich angesichts der medialen Möglichkeiten in neuen und veränderten Formen der internen und externen Wissenschaftskommunikation (vgl. Leßmöllmann 2020).[45] Diese sind noch kaum in Form von Korpora erschlossen. Um Sprachgebrauch in diesen Formaten für die korpuslinguistische Analyse zugänglich zu machen, müssen deren kommunikativ relevante Spezifika in Korpora abgebildet werden (vgl. etwa zur Abbildung der Struktur von Wissenschaftsblogs Grumt-Suarez/Karlova-Bourbonus/Lobin 2016, Bender/Bubenhofer/Janich 2024). Bezüglich der Einschätzung der Repräsentativität ist Referenzwissen zu Umfang und Variation der Sprachverwendung in diesen Formaten nötig, was mit der Frage nach deren dauerhafter Zugänglichkeit verbunden ist. Dass dieses Referenzwissen im Entstehen ist, zeigt etwa aktuell ein Forschungsprojekt, das die bibliothekarische Erschließung von Wissenschaftsblogs zum Gegenstand hat (vgl. Pampel/Rothfritz 2024).[46]
Literatur
Bender, Michael; Bubenhofer, Noah; Janich, Nina (2024): Die öffentliche Aushandlung von Expertise: Wissenschaftsblogs als Ort eristischer Verständigung? Exploratorischer Einstieg in ein Forschungsprojekt. In: Zeitschrift für germanistische Linguistik 52 (1), S. 183–211. DOI: 10.1515/zgl-2024-2008.10.1515/zgl-2024-2008Suche in Google Scholar
Biber, Douglas; Reppen, Randi (2015): Introduction. In: Douglas Biber und Randi Reppen (Hg.): The Cambridge handbook of English corpus linguistics. Cambridge: Cambridge University Press (Cambridge handbooks in language and linguistics), S. 1–8.10.1017/CBO9781139764377.001Suche in Google Scholar
Bucher, Hans-Jürgen (2020): The contribution of media studies to the understanding of science communication. In: Annette Leßmöllmann, Marcelo Dascal und Thomas Gloning (Hg.): Science communication. Boston, Berlin: De Gruyter Mouton (Handbooks of Communication Science/HoCS], 17), S. 51–76.Suche in Google Scholar
Deutsche Forschungsgemeinschaft (DGF) (2024): Systematik der Fächer und Fachkollegien der DFG für die Amtsperiode 2024–2028. Online verfügbar unter https://www.dfg.de/resource/blob/331944/33422f091e941592cdc355038a865e03/fachsystematik-2024-2028-de-data.pdf (15.12.2024).Suche in Google Scholar
Dreesen, Philipp; Krasselt, Julia (2023): Swiss-AL: Plattform für Sprachdaten zur Analyse öffentlicher Kommunikation in der Schweiz. In: Publizistik 68 (2–3), S. 291–303. DOI: 10.1007/s11616-023-00785-9.10.1007/s11616-023-00785-9Suche in Google Scholar
Egbert, Jesse; Biber, Douglas; Gray, Bethany (Hg.) (2022): Designing and evaluating language corpora. A practical framework for corpus representativeness. Cambridge: Cambridge University Press.10.1017/9781316584880Suche in Google Scholar
Fandrych, Christian (2018): Wissenschaftskommunikation. In: Arnulf Deppermann und Silke Reineke (Hg.): Sprache im kommunikativen, interaktiven und kulturellen Kontext. Berlin, Boston: De Gruyter (Germanistische Sprachwissenschaft um 2020, 3), S. 143–168.10.1515/9783110538601-007Suche in Google Scholar
Fandrych, Christian; Meißner, Cordula; Slavcheva, Adriana (Hg.) (2014): Gesprochene Wissenschaftssprache: Korpusmethodische Fragen und empirische Analysen. Heidelberg: Synchron.Suche in Google Scholar
Fandrych, Christian; Meißner, Cordula; Wallner, Franziska (Hg.) (2017): Gesprochene Wissenschaftssprache – digital. Verfahren zur Annotation und Analyse mündlicher Korpora. Tübingen: Stauffenburg.Suche in Google Scholar
Frick, Elena; Helmer, Henrike; Wallner, Franziska (2023): ZURECHT: Neue Recherchemöglichkeiten in Korpora gesprochener Sprache für Gesprächsanalyse und Deutsch als Fremd- und Zweitsprache. In: Korpora Deutsch als Fremdsprache 3 (1), S. 44–71. DOI: 10.48694/kordaf.3730.Suche in Google Scholar
Geyken, Alexander; Barbaresi, Adrien; Didakowski, Jörg; Jurish, Bryan; Wiegand, Frank; Lemnitzer, Lothar (2017): Die Korpusplattform des „Digitalen Wörterbuchs der deutschen Sprache“ (DWDS). In: Zeitschrift für germanistische Linguistik 45 (2), S. 327–344. DOI: 10.1515/zgl-2017-0017.10.1515/zgl-2017-0017Suche in Google Scholar
Gredel, Eva; Herzberg, Laura; Storrer, Angelika (2018): Linguistische Wikipedistik. In: Zeitschrift für germanistische Linguistik 46 (3), S. 480–493. DOI: 10.1515/zgl-2018-0029.10.1515/zgl-2018-0029Suche in Google Scholar
Grumt-Suarez, Holger; Karlova-Bourbonus, Natali; Lobin, Henning (2016): A Discourse-structured Blog Corpus for German: Challenges of Compilation and Annotation. In: Michael Beißwenger, Michael Wojatzki und Torsten Zesch (Hg.): NLP4CMC III: 3rd Workshop on Natural Language Processing for Computer-Mediated Communication. 22 September 2016: Ruhr-Universität Bochum, Sprachwissenschaftliches Institut (Bochumer Linguistische Arbeitsberichte, 17), S. 1–5. Online verfügbar unter https://ids-pub.bsz-bw.de/frontdoor/index/index/year/2018/docId/7581 (15.12.2024).Suche in Google Scholar
Ho, Thi Bao Van (2023): VieLKo – Vietnamesisches Lernerkorpus. In: Korpora Deutsch als Fremdsprache Volume 3 (1), S. 152–158. DOI: 10.48694/KORDAF.3739.Suche in Google Scholar
Jaworska, Sylvia (2015): Review of recent research (1998–2012) in German for Academic Purposes (GAP) in comparison with English for Academic Purposes (EAP): cross-influences, synergies and implications for further research. In: Language Teaching 48 (2), S. 163–197. DOI: 10.1017/S026144481400038X.10.1017/S026144481400038XSuche in Google Scholar
Kaiser, Julia (2018): Zur Stratifikation des FOLK-Korpus: Konzeption und Strategien. In: Gesprächsforschung 19, S. 515–552. Online verfügbar unter http://www.gespraechsforschung-online.de/fileadmin/dateien/heft2018/px-kaiser.pdf (15.12.2024).Suche in Google Scholar
Keller, Daniel (2021): Register representation and processing. Doctoral thesis, Northern Arizona University. Online verfügbar unter https://openknowledge.nau.edu/id/eprint/5779/ (15.12.2024).Suche in Google Scholar
Knorr, Dagmar; Andresen, Melanie (2017): Commented Learner Corpus Academic Writing; Kommentiertes Lernendenkorpus akademisches Schreiben (Version 2.1) [Data set]. http://doi.org/10.25592/uhhfdm.8326 (15.12.2024).Suche in Google Scholar
Kretzenbacher, Heinz (1998): Fachsprache als Wissenschaftssprache. In: Lothar Hoffmann, Hartwig Kalverkämper und Herbert Ernst Wiegand (Hg.): Fachsprachen. Ein internationales Handbuch zur Fachsprachenforschung und Terminologiewissenschaft, Bd. 1. 2 Bände. Berlin, New York: De Gruyter (Handbücher zur Sprach- und Kommunikationswissenschaft, 14.1), S. 133–142.Suche in Google Scholar
Kretzenbacher, Heinz; Weinrich, Harald (Hg.) (1995): Linguistik der Wissenschaftssprache. Berlin, New York: De Gruyter (Akademie der Wissenschaften zu Berlin. Forschungsberichte, 10).Suche in Google Scholar
Kupietz, Marc; Leinen, Peter; Diewald, Nils (2024): Towards a very large German academic corpus - Step 1: building and making available a corpus of 10,000 doctoral dissertations. Presentation held at the Workshop on Comparable and Interoperable Corpora of Academic Texts @CLARIN2024, 17 October 2024. Barcelona, Spain. Online verfügbar unter https://www.clarin.eu/sites/default/files/Kupietz%20%20-%20Corpora%20workshop.pdf (15.12.2024).Suche in Google Scholar
Kupietz, Marc; Lüngen, Harald; Diewald, Nils (2023): Das Gesamtkonzept des Deutschen Referenzkorpus DEREKO. Vom Design bis zur Verwendung und darüber hinaus. In: Arnulf Deppermann, Christian Fandrych, Marc Kupietz und Thomas Schmidt (Hg.): Korpora in der germanistischen Sprachwissenschaft. Mündlich, schriftlich, multimedial. Berlin, Boston: De Gruyter (Jahrbuch des Instituts für Deutsche Sprache, 2022), S. 14–45.10.1515/9783111085708-002Suche in Google Scholar
Leßmöllmann, Annette (2020): Current trends and future visions of (research on) science communication. In: Annette Leßmöllmann, Marcelo Dascal und Thomas Gloning (Hg.): Science communication. Boston, Berlin: De Gruyter Mouton (Handbooks of Communication Science/HoCS], 17), S. 657–688.10.1515/9783110255522-031Suche in Google Scholar
Leßmöllmann, Annette; Gloning, Thomas (2020): Introduction to the volume. In: Annette Leßmöllmann, Marcelo Dascal und Thomas Gloning (Hg.): Science communication. Boston, Berlin: De Gruyter Mouton (Handbooks of Communication Science/HoCS], 17), S. XI–XIX.10.1515/9783110255522Suche in Google Scholar
Lüngen, Harald (2017): DeReKo – Das Deutsche Referenzkorpus. In: Zeitschrift für germanistische Linguistik 45 (1), S. 161–170. DOI: 10.1515/zgl-2017-0008.10.1515/zgl-2017-0008Suche in Google Scholar
Meißner, Cordula; Wallner, Franziska (2019): Das gemeinsame sprachliche Inventar der Geisteswissenschaften. Lexikalische Grundlagen für die wissenschaftspropädeutische Sprachvermittlung. Berlin: Erich Schmidt Verlag (Studien Deutsch als Fremd- und Zweitsprache, Band 6).10.37307/b.978-3-503-18171-1Suche in Google Scholar
Pampel, Heinz; Rothfritz, Laura (2024): Kooperative Informationsinfrastruktur für wissenschaftliche Blogs (Infra Wiss Blogs). Zenodo. https://doi.org/10.5281/zenodo.13234482.Suche in Google Scholar
Pirker, Hannes (2024): Corpus Query Language im Austrian Media Corpus. Version 1.0.0. Edited by Elisabeth Königshofer. DARIAH-Campus. [Training module]. Online verfügbar unter https://campus.dariah.eu/resource/posts/corpus-query-language-im-austrian--media-corpus (15.12.2024).Suche in Google Scholar
Portmann, Annette (2022): GINGKO: Geschriebenes ingenieurwissenschaftliches Korpus. In: Korpora Deutsch als Fremdsprache 2 (1), S. 128–133. DOI: 10.48694/kordaf-3495.Suche in Google Scholar
Ransmayr, Jutta; Pirker, Hannes (2023): Das Austrian Media Corpus (AMC): Inhalte, Zugang und Möglichkeiten. In: Zeitschrift für germanistische Linguistik 51 (1), S. 203–212. DOI: 10.1515/zgl-2023-2007.10.1515/zgl-2023-2007Suche in Google Scholar
Roelcke, Thorsten (2024): Binnen- und mehrsprachliche Fachsprachengliederungen. In: Michael Szurawitzki und Patrick Wolf-Farré (Hg.): Handbuch Deutsch als Fach- und Fremdsprache. Ein aktuelles Handbuch zeitgenössischer Forschung. Berlin, Boston: De Gruyter (De Gruyter Reference), S. 23–38.10.1515/9783110690279-003Suche in Google Scholar
Salzmann, Katharina (2017): Expansionen in der deutschen und italienischen Wissenschaftssprache. Berlin: Erich Schmidt Verlag (Studien Deutsch als Fremd- und Zweitsprache, Band 3).10.37307/b.978-3-503-17420-1Suche in Google Scholar
Schirrmeister, Lars; Rummel, Marlene; Heine, Antje; Suppus, Nina; Mendoza Sánchez, Bárbara (2021): Gingko – ein Korpus der ingenieurwissenschaftlichen Sprache. In: Deutsch als Fremdsprache 58 (4), S. 214–224. DOI: 10.37307/j.2198-2430.2021.04.04.10.37307/j.2198-2430.2021.04.04Suche in Google Scholar
Schmidt, Thomas; Schwendemann, Matthias; Wallner, Franziska (2023): ZUVIEL: Transkriptvisualisierung und Arbeiten mit Transkripten. In: Korpora Deutsch als Fremdsprache 3 (1), S. 72–91. DOI: 10.48694/kordaf.3723.Suche in Google Scholar
Schweizer Nationalfonds (SNF) (2016): Forschungsgebiete und Disziplinen. Online verfügbar unter https://www.snf.ch/media/en/Ii1WiTqVDFTDp5ts/allg_disziplinenliste.pdf (15.12.2024).Suche in Google Scholar
Statistisches Bundesamt (2024): Bildung und Kultur. Studierende an Hochschulen – Fächersystematik – 2022. Online verfügbar unter https://www.destatis.de/DE/Methoden/Klassifikationen/Bildung/studenten-pruefungsstatistik.pdf?__blob=publicationFile (15.12.2024).Suche in Google Scholar
Wallner, Franziska (2023): GeWiss – Ein Korpus der gesprochenen Wissenschaftssprache. In: Korpora Deutsch als Fremdsprache 3 (1), S. 159–165. DOI: 10.48694/kordaf.3738.Suche in Google Scholar
Weiß, Christian (2005): Die thematische Erschließung von Sprachkorpora: Institut für Deutsche Sprache (OPAL – Online publizierte Arbeiten zur Linguistik (2005,1)). Online verfügbar unter https://ids-pub.bsz-bw.de/frontdoor/index/index/year/2012/docId/71 (15.12.2024).Suche in Google Scholar
Wisniewski, Katrin; Lenhard, Wolfgang; Möhring, Jupp; Spiegel, Leonore (Hg.) (2022): Sprache und Studienerfolg bei Bildungsausländerinnen und Bildungsausländern. Münster, New York: Waxmann.10.1007/978-3-658-32892-4_9Suche in Google Scholar
© 2025 bei den Autoren, publiziert von Walter de Gruyter GmbH, Berlin/Boston
Dieses Werk ist lizensiert unter einer Creative Commons Namensnennung 4.0 International Lizenz.
Artikel in diesem Heft
- Titelseiten
- Aufsätze
- Syntaktische Negation in Verschwörungstheorien: Eine diskursgrammatische Untersuchung der Inexistenz-Konstruktion [es gibt kein X]
- Sympathische synthetische Stimmen: Herausforderungen und Nutzen für die Mensch-Maschine-Interaktion
- Gebrauchsstandard in der deutschen Alltagssprache: Eine integrative Modellierung räumlicher und sozialer Variation
- Funktionsverbgefüge unter Druck: Ein Vorschlag zur Typologisierung verbonominaler Konstruktionen des Deutschen
- „Step away from the Computer!“
- Die Dativalternation im Deutschen vom Standpunkt der einzelsprachlich-funktionellen Syntax: Synchronie und Diachronie
- Bericht
- Bericht zur Tagung Grammatik des Neuhochdeutschen zwischen Gegenwart und Geschichte, Rauischholzhausen 23.–25. Mai 2024
- „Streit als Chance? Kommunikative Praktiken des Streits als Vehikel sozialer Aushandlung“. Tagungsbericht zur 3. Konferenz der ThemaTalkers (14.–15. Juni 2024, hybrid)
- Ressourcen
- Korpora und Sprachdatenressourcen für die Wissenschaftsspracheforschung
- Zeitschriftenschau
Artikel in diesem Heft
- Titelseiten
- Aufsätze
- Syntaktische Negation in Verschwörungstheorien: Eine diskursgrammatische Untersuchung der Inexistenz-Konstruktion [es gibt kein X]
- Sympathische synthetische Stimmen: Herausforderungen und Nutzen für die Mensch-Maschine-Interaktion
- Gebrauchsstandard in der deutschen Alltagssprache: Eine integrative Modellierung räumlicher und sozialer Variation
- Funktionsverbgefüge unter Druck: Ein Vorschlag zur Typologisierung verbonominaler Konstruktionen des Deutschen
- „Step away from the Computer!“
- Die Dativalternation im Deutschen vom Standpunkt der einzelsprachlich-funktionellen Syntax: Synchronie und Diachronie
- Bericht
- Bericht zur Tagung Grammatik des Neuhochdeutschen zwischen Gegenwart und Geschichte, Rauischholzhausen 23.–25. Mai 2024
- „Streit als Chance? Kommunikative Praktiken des Streits als Vehikel sozialer Aushandlung“. Tagungsbericht zur 3. Konferenz der ThemaTalkers (14.–15. Juni 2024, hybrid)
- Ressourcen
- Korpora und Sprachdatenressourcen für die Wissenschaftsspracheforschung
- Zeitschriftenschau