Home Erfassung von Sprachkompetenzen im Deutschen von Schülerinnen und Schülern mittels C-Tests im Arbeitsfeld Sprach-bildung: Fragen der Validität revisited
Article Publicly Available

Erfassung von Sprachkompetenzen im Deutschen von Schülerinnen und Schülern mittels C-Tests im Arbeitsfeld Sprach-bildung: Fragen der Validität revisited

  • Mirka Mainzer-Murrenhoff

    studierte Sprachlehrforschung, Geschichte und Orientalistik an der Ruhr-Universität Bochum. Seit 2014 arbeitet sie als wissenschaftliche Mitarbeiterin in der Lehramtsausbildung im Bereich Deutsch als Zweitsprache und Sprachbildung. Derzeit ist sie im Arbeitsbereich Sprachbildung und Mehrsprachigkeit an der Ruhr-Universität Bochum tätig. Sie forscht unter anderem zur Messung alltags- und schulbezogener Sprachkompetenzen mittels C-Test-Format sowie zur Diagnose und Förderung des Schreibens im Fachunterricht.

    EMAIL logo
    and Anastasia Drackert

    ist seit Januar 2022 wissenschaftliche Direktorin der Gesellschaft für Akademische Studienvorbereitung und Testentwicklung e.V. (g.a.s.t.). Gleichzeitig ist sie Professorin an der Fakultät für Philologie der Ruhr-Universität Bochum. Ihre Forschungsschwerpunkte sind das Testen sprachlicher Kompetenzen, digitales und aufgabenbasiertes Lernen von Fremdsprachen sowie Mehrsprachigkeit. Ihren PhD hat sie an der Georgetown Universität in Washington DC für ihre Arbeit zur Validierung von Sprachtests in der Sprachlehrforschung erhalten.

Published/Copyright: October 19, 2022

Zusammenfassung

Das Arbeitsfeld Sprachbildung birgt auf der Ebene der Zielgruppe, des Testgebrauchs sowie der zu messenden Sprachkompetenzen Rahmenbedingungen für den Einsatz von C-Tests, die Grundlagenforschung zum Verfahren notwendig machen. Insbesondere Fragen zur Validität des Verfahrens werden neu aufgeworfen. Der Beitrag skizziert die Anforderungen im Arbeitsfeld Sprachbildung und formuliert zu bearbeitende Desiderate, um das C-Test-Verfahren für Forschungs- und Praxisanliegen in diesem Anwendungskontext optimal nutzen zu können. Neben der Formulierung einer Forschungsagenda für die Sprachtestforschung hilft der Beitrag ganz konkret auch Anwenderinnen und Anwendern im schulischen Kontext (Forschenden, Testadministratorinnen bzw. -administratoren, Lehrkräften), C-Tests reflektiert zu konzipieren und/oder einzusetzen.

Abstract

The field of language education presents a number of requirements for the use of C-tests regarding the target group, test use as well as test construct which necessitate fundamental research on the C-Test format. In particular, questions about the validity of the test format are raised anew. The article outlines the requirements in the field of language education and formulates desiderata to be worked on for the C-Test format to be used optimally for research and educational purposes. In addition to formulating a research agenda for language testing research, the article also helps users in the school context (researchers, test administrators, and teachers) to design and/or use C-tests in a reflective way.

1 Einleitung

Der C-Test ist ein Verfahren, das zur Erfassung von allgemeinen Fremdsprachenkenntnissen erwachsener Lernender im Hochschulkontext fest etabliert ist und dort intensiv angewendet und erforscht wurde (für einen aktuellen Überblick Grotjahn 2019). Als short cut measure wird das Testprinzip vornehmlich für Einstufungsentscheidungen in Sprachkurse, für ein schnelles Screening vor dem Einsatz aufwendigerer Sprachtestverfahren oder für die Erhebung des Sprachstandes in (Fremd-)Sprachenerwerbsuntersuchungen vor allem mit jungen Erwachsenen genutzt. Für den besagten Kontext, dort adressierte Zielgruppen und Testzwecke besitzt das Verfahren nachweislich eine hohe teststatistische Güte (Validität und Reliabilität) sowie Durchführungs- und Auswertungsökonomie (einen Studienüberblick bietet die C-Test-Bibliografie von Grotjahn/Drackert 2020). Aufgrund dieser Qualitätsmerkmale hat das Verfahren auch Eingang in andere Anwendungskontexte gefunden. Zu diesen zählt auch das Arbeitsfeld Sprachbildung.

Sprachbildung hat sich als eigenes Arbeitsfeld im schulischen Kontext in Abgrenzung zu Deutsch als Zweitsprache entwickelt (zur Genese Becker-Mrotzek/Roth 2017: 16–18) und behandelt „alle durch das Bildungssystem systematisch angeregten Sprachentwicklungsprozesse“ (ebd.: 17) für alle Schülerinnen und Schüler, folglich für Kinder und Jugendliche mit ganz unterschiedlichen sprachlichen Kompetenz- und Erwerbsprofilen (z. B. simultaner Erstspracherwerb, simultaner Zweitspracherwerb, einsprachig deutsch mit wenig/viel Literalitätserfahrung). In diesem Arbeitsfeld nehmen praxis- und forschungsbezogene Aktivitäten ein breites Spektrum an. Zu den forschungsbezogenen Aktivitäten gehören beispielsweise die Untersuchung des Einflusses bildungs- und fachsprachlicher Kompetenz auf den Bildungserfolg (Prediger et al. 2015), sowie der Wirkung von sprachsensiblen Unterrichtsaktivitäten auf das fachliche und sprachliche Lernen (Boubakri et al. 2017) oder auch die Untersuchung der Bedeutung herkunftssprachlichen Unterrichts auf die Sprachentwicklung mehrsprachiger Schülerinnen und Schüler (Roll et al. 2019). Praxisbezogene Aktivitäten umfassen zum Beispiel die Diagnose sprachlicher Kompetenzen für die unterrichtliche Binnendifferenzierung oder die Feststellung spezifischer Förderbedarfe (Lengyel et al. 2009; Redder/Neumann/Tracy 2015), die Gestaltung sprachsensiblen Fachunterrichts oder die systematische Einbindung der herkunftsbedingten Mehrsprachigkeit der Schülerinnen und Schüler (Vollmer/Thürmann 2013). Für viele der Aktivitäten und Anliegen im Feld sind zuverlässige und valide Aussagen zu den Sprachkompetenzen von Schülerinnen und Schülern im Deutschen unabdingbar. Das C-Test-Format kommt vor diesem Hintergrund für Forschungszwecke in Studien zum Einsatz oder es soll als Instrument für unterrichtsbezogene Entscheidungen genutzt werden (Dürrstein 2013; Eckhardt 2008; Höttecke et al. 2017; Kniffka/Linnemann 2016; Roll et al. 2019).

Mit der Zielgruppe, den thematischen Gegenständen und den Erkenntnisinteressen des Arbeitsfeldes sowie daraus resultierenden Zwecken der Sprachkompetenzmessung wird das C-Test-Format mit neuen Rahmenbedingungen konfrontiert. Zur Erinnerung: Unser Wissen über die Validität von C-Tests und seine Verlässlichkeit stammt primär aus Untersuchungen zu erwachsenen Fremdsprachenlernenden und dem Gebrauch der Testergebnisse als Screening allgemeiner Sprachkompetenzen, vor allem interpretiert in Anlehnung an den Gemeinsamen Europäischen Referenzrahmen für Sprachen (Europarat 2001). Konsens und Standard in der Sprachtestforschung ist es, einer Auffassung von Validität und Validierung zu folgen, die sich auf die Interpretation der Testergebnisse bezieht. Ein Test oder Testformat wird nicht als valide oder nicht valide betrachtet, sondern es muss vielmehr nachgewiesen werden, dass ein Test für den Anwendungskontext, das heißt den Verwendungszweck und den Adressatenkreis, valide ist (Chapelle/Voss 2021; Drackert 2015; Drackert/Timukova 2020; Kane 2013). Folglich sind für den Anwendungskontext Sprachbildung, die dortigen Adressatenkreise, Testzwecke und zu messenden Sprachkompetenzen Fragen der Validität zum Verfahren auch neu zu stellen. Konkrete Fragestellungen sind: Was ist das Neue bzw. Abweichende im Arbeitsfeld Sprachbildung von bisher validierten Verwendungskontexten des C-Test-Formats? Inwiefern gibt es zu den dortigen Rahmenbedingungen schon Validierungsbemühungen (d. h. sind C-Tests bereits validiert für einen bestimmten Testzweck und Adressatenkreis)? Für welche Szenarien müssen C-Tests noch validiert werden und sind folglich als Forschungsdesiderate an die Sprachtestforschung zu adressieren? Wie können Anwenderinnen und Anwender, das heißt sowohl Forschende als auch Testadministratorinnen bzw. -administratoren und Lehrkräfte, das Testformat trotz fehlender Grundlagenforschung nutzen?

Der Beitrag verfolgt das Ziel, diese Fragen aufzuarbeiten, um das C-Test-Verfahren für Forschungs- und Praxisanliegen im Arbeitsfeld Sprachbildung optimal einsetzen zu können. Wir beginnen mit einer allgemeinen Einführung zum C-Test-Format (u. a. zum Konstrukt, Konstruktionsprinzip) und einem Überblick über bisher validierte Verwendungsszenarien. Darauf aufbauend werden die davon abweichenden Rahmenbedingungen für den Einsatz von C-Tests im Arbeitsfeld Sprachbildung skizziert; nämlich der sprach- und bildungsbezogen heterogene sowie junge Adressatenkreis, das Anliegen, die Testergebnisse für diagnostische Zielsetzungen zu nutzen, das Fehlen eines Referenzrahmens, um die Ergebnisse über die Bezugsgruppe hinaus zu generalisieren und zu interpretieren, sowie der Bedarf nach der Messung spezifischer Sprachkompetenzen (fach- und bildungssprachlicher Kompetenzen) mittels C-Tests. Zur Beantwortung der Frage, welche dieser anders gelagerten Rahmenbedingungen bereits in Validierungsbemühungen adressiert wurden, wird die bisherige Anwendungspraxis zum C-Test im Arbeitsfeld Sprachbildung aufgearbeitet. Der Beitrag bietet somit Leserinnen und Lesern auch einen State of the Art zum Einsatz des Verfahrens. Wir schließen die Ausführungen mit der näheren Einkreisung von Forschungsdesideraten in Bezug auf die Validierung des C-Test-Formats sowie mit Empfehlungen für alle Akteurinnen und Akteure, die C-Tests im Arbeitsfeld für forschungs- oder praxisbezogene Anliegen konzipieren oder nutzen wollen. Der Beitrag bietet daher im Sinne von assessment literacy (Harding/Kremmel 2016) auch eine Orientierung für den konkreten Gebrauch des Verfahrens.

2 Der C-Test: Was, wie, wofür und vor allem woher?

Zunächst muss klar sein: Bei C-Tests handelt es sich um ein sprach- und kontextunspezifisches allgemeines Testprinzip (Grotjahn 2019: 587) und nicht um einen Test, der für unterschiedliche Zwecke, Kontexte und Adressaten valide ist. Seit seiner Einführung zu Beginn der 80er-Jahre hat sich jedoch eine Form dieses allgemeinen Testprinzips etabliert, die als klassischer oder kanonischer C-Test in die Literatur eingegangen ist. Ein klassischer oder kanonischer C-Test besteht meist aus vier bis fünf kurzen Texten zu verschiedenen populärwissenschaftlichen Themen. Beginnend ab dem zweiten Satz wird die zweite Hälfte jedes zweiten Wortes mechanisch getilgt (rule of two), sodass 20 bis 25 Lücken entstehen. Aufgabe der Testkandidatinnen und -kandidaten ist es, die Texte unter Einsatz ihrer lexikalischen und grammatikalischen Kenntnisse sowie Textverarbeitungsfähigkeiten zu rekonstruieren. Für jede orthografisch, grammatikalisch und semantisch rekonstruierte Lücke wird ein Punkt vergeben (dichotome Auswertung). Da die Lücken nicht unabhängig voneinander sind, wird ein Text als ein Item ausgewertet. So konstruiert, wird argumentiert, dass das Verfahren integrativ allgemeine Sprachkompetenz im Sinne eines eindimensionalen Konstruktes erfasst. Je höher die Sprachkompetenz der Lernenden, desto mehr Lücken können sie ausfüllen. Theoretisch wird dies durch das Prinzip der reduzierten Redundanz begründet (Klein-Braley 1983: 218), das auf Ansätzen der Gestaltpsychologie und Informationstheorie beruht (Zimmermann 2019: 25) sowie auf gebrauchsbasierten Ansätzen des Spracherwerbs (Mainzer-Murrenhoff 2021). Die zugrunde liegende Annahme ist unter anderem, dass Menschen dazu in der Lage sind, aus unvollständigen oder veränderten Informationen ein bekanntes Muster wiederzuerkennen. Diese Muster haben sie durch mehrfachen bedeutungsvollen Gebrauch in verschiedenen Verwendungskontexten erworben (Ambridge/Lieven 2011; Ellis/O’Donnell/Römer 2013). Da natürliche Sprachen auf allen sprachlichen Ebenen redundant sind, das heißt Mehrfachkodierungen vorliegen, ist es möglich, auch unvollständige, aber bekannte Muster zu rekonstruieren. Dieses Prinzip macht sich der C-Test zu eigen, indem die Redundanz durch die mechanische Tilgung von Worthälften reduziert wird.

Validierungsforschung zur klassischen Operationalisierung des Testprinzips wurde in erster Linie umfänglich für einen bestimmten Adressatenkreis und Verwendungszweck betrieben, nämlich mit jungen erwachsenen Fremdsprachenlernenden in institutionellen Kontexten (z. B. Universitäten, Sprachenschulen) mit dem Ziel, den allgemeinen Sprachstand in der Fremdsprache abzubilden, um Einstufungen, Rangordnungen und Gruppenvergleiche vorzunehmen. So verweisen Eckes und Grotjahn (2006) in ihrer Zusammenschau von Erkenntnissen zur Konstruktvalidität von C-Tests beispielsweise ausnahmslos auf Untersuchungen, die im hochschulbezogenen Fremdsprachenkontext verortet sind (ähnliche Auflistung auch bei Sigott 2004: 61–63). Aussagen, wie beispielsweise bei Gürsoy (2016: 104) oder bei Baur, Chlosta und Goggin (2012: 14), dass C-Tests ein reliables und valides Verfahren darstellen und Zusammenhänge mit weitaus aufwendigeren Testverfahren aufweisen, gelten somit in erster Linie für die globale Erfassung fremdsprachlicher Kompetenz von Studierenden und die Verwendung der Testergebnisse für die Einstufung in Sprachkurse. Trotz der umfangreichen Forschung zum Format unter anderem in Form von introspektiven, korrelationsstatistischen und faktoranalytischen Studien (aktueller Überblick bei Norris 2018: 13–15) ist dieses damit nicht per se valide. Zum einen, weil es sich, wie bereits erwähnt, um ein Format und keinen Test im engeren Sinne handelt (Grotjahn 2019: 586). Zum anderen, weil die Annahmen und die Schlussfolgerungen, die aus den Testergebnissen gezogen werden, und die Entscheidungen, die darauf basieren, stets erst validiert werden müssen (Kecker 2011: 20). Oder wie es die Standards for Educational and Psychological Testing (AERA/APA/NCME 2014: 13) formulieren:

„Validity refers to the degree to which evidence and theory support the interpretations of test scores for proposed uses of tests. The process of validation involves accumulating relevant evidence to provide a sound scientific basis for the proposed score interpretations. It is the interpretations of test scores for proposed uses that are evaluated, not the test itself.“

Was sind nun die abweichenden Rahmenbedingungen im Arbeitsfeld Sprachbildung, die zu neuen Annahmen hinsichtlich der Verwendung von C-Test-Ergebnissen führen und für die erst noch Beweise in Form von Untersuchungen zu liefern sind?

3 Rahmenbedingungen im Arbeitsfeld Sprachbildung

Im Folgenden werden die von bisherigen Anwendungskontexten des C-Tests abweichenden Rahmenbedingungen im Arbeitsfeld Sprachbildung skizziert. Dabei handelt es sich um Aspekte, bei denen unseres Erachtens fehlende Validierungsforschung zum C-Test-Format am deutlichsten zutage tritt. Die Beschreibung der Rahmenbedingungen setzt voraus, dass eine Übersicht existiert, die die bisherige Anwendungspraxis des C-Tests im Arbeitsfeld dokumentiert. Diese Übersicht legen wir mit Tabelle 1 im Anhang vor.[1] Sie dient auch zur Beantwortung der assoziierten Frage, inwiefern es zu den dortigen Rahmenbedingungen schon Validierungsbemühungen gibt. Darüber hinaus stellen wir in den Ausführungen Beziehungen zur Forschung aus anderen Anwendungskontexten her und fragen danach, welche Erkenntnisse gegebenenfalls übertragbar sind.

3.1 Zielgruppe: An welche Schülerinnen und Schüler sind C-Tests adressiert?

Die zu testendende Zielgruppe im Arbeitsfeld Sprachbildung könnte heterogener nicht sein: sowohl im Hinblick auf ihre Spracherwerbsverläufe und die Literalitätserfahrung als auch Altersstruktur. So gehören sowohl Schülerinnen und Schüler mit einem simultanen Erstspracherwerb oder sukzessiven Zweitspracherwerb als auch monolingual Sprechende des Deutschen und spätbilinguale Kinder zum Adressatenkreis (Müller/Schutz/Tracy 2018). Ebenso können Grundschülerinnen und -schüler den Adressatenkreis darstellen oder Jugendliche am Ende der Sekundarstufe II. Anders als bei erwachsenen Lernenden, die eine Fremdsprache im institutionellen Kontext erlernen, streut die erwartbare Sprachkompetenz des Adressatenkreises daher viel stärker und die Zielgruppe weist ein eher unbalanciertes Sprachprofil im Hinblick auf bestimmte Kompetenzbereiche auf (z. B. schriftlich vs. mündlich, alltags- vs. schulbezogene Sprachkompetenzen). Wird das Verfahren im Bereich Sprachbildung eingesetzt, dann richtet es sich mehrheitlich an alle Schülerinnen und Schüler einer Regelklasse in einer bestimmten Altersstufe (Dürrstein 2013; Leiss et al. 2017; Schlager 2020), folglich sowohl an einsprachige als auch an mehrsprachige, an sprachlich starke und sprachlich schwächere Schülerinnen und Schüler. Mittels eines C-Tests werden also Sprachkenntnisse in der Erst- und Zweitsprache Deutsch erfasst. Die Zielgruppe im Bereich Sprachbildung erfordert daher unter anderem, dass der verwendete C-Test für sprachlich starke wie auch sprachlich schwächere Schülerinnen und Schüler geeignet ist, innerhalb dieser beiden Gruppen differenzieren kann und bei allen Kandidatinnen und Kandidaten auch das Gleiche misst.

Für einzelne dieser Gruppen liegen zwar aus anderen Anwendungskontexten und Fragestellungen heraus Daten (für Schülerinnen und Schüler mit Deutsch als Zweitsprache Kniffka/Linnemann 2014 und Süßmilch 1985; für monolinguale Kinder und Jugendliche des Deutschen Wockenfuß 2009 und Meißner-Stiffel/Raatz 1996) und zudem einige Validierungsstudien vor (Raatz/Klein-Braley 1992 zum Schulleistungstest CT-D 4 für sehr junge Schülerinnen und Schüler). Es gibt jedoch bislang keine Forschung zu der Frage, inwiefern C-Tests dazu geeignet sind, alle Gruppen gleichermaßen zu adressieren (z. B. inwiefern der C-Test für alle Lernenden ein guter Prädiktor für allgemeine Sprachkompetenz ist). Bisherige Erkenntnisse zum Einsatz des Formats zu den einzelnen Gruppen weisen unter anderem darauf hin, dass Formatmodifikationen notwendig sind, um das Sprachniveau der im Fokus stehenden Zielgruppe zu adressieren und eine bessere Passung zwischen Sprachkompetenz und Schwierigkeit des Tests zu erzielen. Im Arbeitsfeld Sprachbildung finden sich daher in Anlehnung an diese Ergebnisse unter anderem folgende Formatmodifikationen: Reduzierung der Tilgungsrate zur Vereinfachung des Tests (z. B. Tilgung jedes dritten Wortes für Schülerinnen und Schüler der Primar- und unteren Sekundarstufe oder für neu zugewanderte Jugendliche) und zeitlimitierte Bearbeitung des Tests zur Erhöhung der Schwierigkeit des Verfahrens (z. B. für einsprachig deutsch aufgewachsene Kinder und Jugendliche oder mehrsprachige Sprecherinnen bzw. Sprecher mit simultanem Erstspracherwerb) (Baur/Chlosta/Goggin 2012; Mainzer-Murrenhoff in Vorb.; Terrasi-Haufe et al. 2012). Die meisten Änderungen erweisen sich im Echteinsatz als ausreichend zuverlässig, das heißt, sie resultieren in teststatistisch akzeptablen Kennwerten (z. B. Reliabilität, Trennschärfe, Schwierigkeit). Maßnahmen zur Anpassung der Schwierigkeit sind allerdings nicht unproblematisch, da sie Einfluss auf das Testkonstrukt des Instruments ausüben können. So liegt beispielsweise die Erkenntnis vor, dass eine drastische Reduktion der Bearbeitungszeit (speeded C-Tests), um eine angemessene Schwierigkeit für einsprachige Schülerinnen und Schüler zu erzielen, dazu führt, dass mittels C-Test nicht nur allgemeine Sprachkompetenz, sondern auch verbale Intelligenz erfasst wird (Wockenfuß 2009; Wockenfuß/Raatz 2014). Diese Überlegungen sind nicht nur bei der Konzeption neuer Tests zu berücksichtigen, sondern auch beim Einsatz bereits erstellter Tests zu bedenken. So ist zum Beispiel der Einsatz von C-Tests für monolinguale Schülerinnen und Schüler, die ursprünglich für DaZ-Lernende konzipiert wurden, zu validieren (z. B. C-Test von Daller 1996 in der Studie von Wessel/Prediger 2018 und Schüler-Meyer et al. 2019). Die Frage danach, inwiefern Formatmodifikationen für alle Schülerinnen und Schüler zur Messung des gleichen Konstrukts führen und inwiefern Tests auf andere Zielgruppen übertragbar sind, ist für viele Verwendungsszenarien im Arbeitsfeld noch zu beantworten. Forschungsergebnisse zu dieser Frage bei Fremd- und Herkunftssprachensprechenden des Russischen deuten darauf hin, dass das C-Test-Format bei diesen beiden Gruppen partiell unterschiedliche sprachliche Fähigkeiten erfasst (Drackert/Timukova 2020).

3.2 Zweck des Verfahrens: Wofür wird das C-Test-Format gebraucht?

C-Tests im Arbeitsfeld Sprachbildung werden primär für Zielsetzungen genutzt, die auch in anderen Anwendungskontexten im Mittelpunkt stehen, nämlich in wissenschaftlichen Untersuchungen, um Probandinnen bzw. Probanden nach Leistungsgruppen einzuteilen, Sprachkompetenz als Kontrollvariable zu erfassen oder die Sprachkompetenzen von Schülerinnen und Schülern mit unterschiedlichen Erwerbsprofilen zu vergleichen (Eckhardt 2008; Schlager 2020; Stephany 2018). In unterrichtlichen Zusammenhängen wird das Format für ein Screening der globalen sprachlichen Leistung genutzt, um Einstufungs- oder Förderentscheidungen vorzunehmen (Dürrstein 2013; Linnemann 2010). Es liegen jedoch auch zwei neue Rahmenbedingungen für den Einsatz des Formats vor. Zum einen lässt sich der Bedarf an förderdiagnostischen Instrumenten für die Praxis feststellen, die eine Identifizierung von sprachlichen Stärken und Schwächen für didaktische Entscheidungen ermöglichen (Becker-Mrotzek/Roth 2017: 24). Die zweite abweichende Rahmenbedingung im Vergleich zu anderen Verwendungskontexten des C-Tests liegt im Arbeitsfeld Sprachbildung in der Tatsache begründet, dass hier kein Referenzrahmen für sprachliche Kompetenzen vorliegt, der eine Generalisierung von C-Test-Ergebnissen erlaubt, und dies bestimmte Nutzungen der Testergebnisse erschwert.

Die Zielsetzung, das Format zur Identifizierung bestimmter sprachlicher Stärken und Schwächen zu nutzen, ist vor dem Anliegen zu sehen, Schülerinnen und Schüler möglichst individuell zu fördern und ihre sprachliche Entwicklung zu begleiten (Lengyel et al. 2009). Aus dem Arbeitsfeld entwickelt, liegen mit dem Cornelsen C-Test (Baur/Chlosta/Goggin 2012), dem C-Test von Dürrstein (2013) sowie dem Forschungsprojekt von Thiede (2018) hierfür C-Tests für die 5./6. Klassen sowie die Sekundarstufe II vor. Realisiert wird die förderdiagnostische Zielsetzung durch die Modifikation der Auswertungsmethode; anstatt einer dichotomen Auswertung werden differenzierte Lösungskategorien vorgeschlagen. Eine breit rezipierte Modifikation ist die Auswertung nach Worterkennungswert (WE) und Richtig/Falsch-Wert (RF) (Baur/Spettmann 2010). Der WE-Wert gibt die Zahl der korrekt erkannten Wörter unter Vernachlässigung von orthografischen und grammatikalischen Fehlern wieder, der RF-Wert hingegen die Zahl der semantisch, orthografisch wie auch grammatikalisch korrekt ergänzten Lücken. Die Autorinnen und Autoren nehmen an, dass sich je nach Auswertungsmethode der Fokus des Testkonstrukts auf rezeptive oder produktive Sprachkompetenzen verschiebt (ebd.). So sollen zum Beispiel diagnostische Aussagen zu den sprachlichen Fähigkeiten im Bereich Lexik und Textverstehen in Abgrenzung zum formalsprachlichen Bereich (z. B. Orthografie) möglich werden. Die Erfassung unterschiedlicher Kompetenzbereiche durch die Auswertungsmethode ist zwar plausibel, allerdings nicht empirisch validiert (Kniffka/Linnemann 2016: 170; Grotjahn 2019: 598), zum Beispiel durch Korrelationsanalysen mit Wortschatztests oder Leseverstehenstests oder mit Ergebnissen aus linguistischen Analysen authentischer Sprachdaten von Schülerinnen und Schülern. Für andere Anwendungskontexte kommt van den Bulck (1996) zu dem Schluss, dass das Format für förderdiagnostische Zielsetzungen kaum geeignet ist (ähnlich auch Grotjahn 2019: 604).

Mit C-Tests lassen sich Kandidatinnen und Kandidaten im Arbeitsfeld Sprachbildung bisher (nur) in eine Rangfolge bringen; das heißt, die Testergebnisse können bezugsgruppenorientiert interpretiert werden. Während für den fremdsprachlichen Kontext eine Orientierung am Gemeinsamen Europäischen Referenzrahmen (GER) möglich ist (z. B. onSET, der für den GER kalibriert wurde[2]), fehlt es im Bereich Sprachbildung an einer Rahmung, an der die Punkte skaliert werden können. Für forschungs- und praxisbezogene Anliegen bedeutet dies, dass sich sowohl Forschende als auch Lehrkräfte immer fragen müssen, wie die C-Test-Ergebnisse, also die tatsächlichen Werte, konkret interpretiert werden können. Bestimmte Zielsetzungen oder Schlussfolgerungen auf Grundlage der Ergebnisse sind damit nicht möglich, wie beispielsweise die, dass eine Schülerin bzw. ein Schüler nach X Jahren ein bestimmtes Sprachniveau erreicht hat.

3.3 Konstrukt: Was soll mittels C-Test erfasst werden?

In vielen Fällen wollen Forschende mittels C-Test im Arbeitsfeld Sprachbildung allgemeine Sprachkompetenz erfassen (Roll et al. 2019; Stephany 2018; Wessel 2015). Da jedoch eine zentrale Forschungsfrage ist, inwiefern sprachliches Können und Bildungserfolg zusammenhängen, haben alle Akteure im Feld einen sehr differenzierten Blick auf Sprachkompetenz. Die Sprache bzw. die sprachlichen Kompetenzen, die für schulischen Erfolg relevant sind, werden als Bildungssprache oder Schulsprache im Feld verhandelt (Feilke 2013; Gogolin 2009; Kobayashi/Zappa-Hollman/Duff 2017; Morek/Heller 2012). Aber auch die Bedeutung fachsprachlicher Fähigkeiten für den schulischen Erfolg ist hier ein Forschungsthema. So sind in den letzten Jahren aus dem Arbeitsfeld Sprachbildung heraus einige C-Tests entwickelt worden, die eine partielle Verschiebung des Testkonstrukts anstreben und versuchen, das C-Test-Format für die Erfassung allgemeiner schulbezogener Sprachkompetenzen oder fachsprachlicher Kompetenzen zu nutzen (Adamik et al. 2011; Bochnik/Ufer 2017; Eckhardt 2008; Höttecke et al. 2017; Mainzer-Murrenhoff 2021). Unter diesen Vorschlägen sind auch eine Handvoll Studien, die Untersuchungen zur Konstruktvalidität vorlegen (Eckhardt 2008; Höttecke et al. 2017; Mainzer-Murrenhoff in Vorb.). Die C-Tests, die Sprachkompetenzen für bestimmte Verwendungskontexte ansteuern, gehen alle mit verschiedenen Modifikationen des Testprinzips einher. Sie schlagen also unterschiedliche Wege der Operationalisierung der intendierten Fähigkeiten ein. So wird unter anderem die Wahl der Texte an bestimmte Themen oder linguistische Merkmale geknüpft (Daller 1996; Eckhardt 2008), die Tilgung bestimmter (fachsprachlicher) Strukturen und Wörter vorgeschlagen (Höttecke et al. 2017; Özcan 2012) oder aber auch die Tilgung auf den Wortanfang verlegt (Mainzer-Murrenhoff 2021).

Die Auswahl von Texten zu spezifischen Themen oder spezifischen linguistischen Merkmalen (z. B. fachsprachliche Lexik, bildungssprachliche Syntax) findet sich am häufigsten (Daller 1996; Adamik et al. 2011). Texte, die typisch für einen bestimmten Verwendungskontext und Adressatenkreis sind (z. B. repräsentativ für die Fachsprache in Physik der 8. Klasse), werden zum Beispiel von Expertinnen und Experten ausgewählt. Während diese Modifikation im Sinne der Inhaltsvalidität nachvollziehbar ist, ist bislang empirisch nicht eindeutig nachgewiesen, dass über den Inhalt oder die Textsorte spezifische sprachliche Kompetenzen angesteuert werden können. In der Studie von Eckhardt (2008) zeigen sich jedenfalls kaum Leistungsunterschiede hinsichtlich der Bearbeitung alltags- und schulbezogener C-Test-Texte. Ebenso weisen die Texte ähnliche Korrelationen mit Außenkriterien für alltags- und schulbezogene Kompetenzen auf. Erkenntnisse aus Untersuchungen zu dieser Modifikation aus anderen Anwendungskontexten lassen sich nur bedingt übertragen. Entweder, weil die Konstruktvalidität von diskursspezifischen C-Tests nicht empirisch überprüft wird, wie beispielsweise bei Schlak, Zimmermann und Molnàr (2010), die einen C-Test für die Erfassung fachsprachlicher Kompetenzen in der Domäne Wirtschaft konzipierten. Oder, weil man zwar Unterschiede in der internen Struktur von C-Tests mit unterschiedlicher Textgrundlage feststellen konnte (Daller/Grotjahn 1999), aber nicht weiter untersuchte, ob diese auch als Prädiktor für das jeweilige sprachliche Handeln im Zielbereich (test use domain) fungieren.

Eine weitere Modifikation des Konstruktionsprinzips ist die Verschiebung der Tilgung vom Wortende zum Wortanfang. Die Wortanfangstilgung findet sich, ebenso wie die Textauswahl, in Vorschlägen zur Erfassung allgemeiner schulbezogener Sprachkompetenz und fachsprachlicher Kompetenz (Höttecke et al. 2017; Mainzer-Murrenhoff 2021; Thiede 2018). Es wird angenommen, dass die Rekonstruktion der Lücken zum einen stärker lexikalisch-semantische Kenntnisse erfordert (Wortschatzbreite) und zum anderen makrostrukturelle Verarbeitungsprozesse notwendig sind (z. B. Anwendung von Strategien zur Sinnkonstruktion). Damit sind für die Rekonstruktion der Lücken Fähigkeiten von Bedeutung, die zum Beispiel mit schulbezogenen Sprachkompetenzen assoziiert sind. Erste empirische Nachweise dazu, ob diese Fähigkeiten tatsächlich besser mit dieser Modifikation angesteuert werden können, bestätigen diese Vermutung für Untersuchungen mit Schülerinnen und Schülern am Ende der Sekundarstufe I (Höttecke et al. 2017; Mainzer-Murrenhoff in Vorb.). Auch Untersuchungen dieser Modifikation für andere Adressantenkreise (für Studienänfängerinnen und -anfänger Mashkovskaya 2013) oder aus dem fremdsprachlichen Anwendungskontext (Beinborn 2016) weisen darauf hin, dass mit der Modifikation stärker textbezogene und makrostrukturelle Verarbeitungsprozesse – gerade bei leistungsstärkeren Kandidatinnen und Kandidaten – getriggert werden können.

In erster Linie zur Ansteuerung fachsprachlicher Kompetenzen nutzen einige Autorinnen und Autoren auch eine bereichsspezifische Tilgung bestimmter fachsprachlicher Wörter und Strukturen (Höttecke et al. 2017; Özcan 2012). Die Tilgung wird also nicht mechanisch vorgenommen, sondern ist inhaltlich begründet. Die sprachlichen Phänomene müssen dann zum einen in ausreichender Zahl im Text vorhanden sein und zum anderen die konkreten sprachlichen Merkmale zunächst definiert werden. Das heißt, es muss geklärt werden, was gute Prädiktoren für die Abbildung fachsprachlicher Kompetenzen sind. Die bereichsspezifische Tilgung wird von einigen Autorinnen und Autoren gar nicht mehr als C-Test-Format eingestuft, da dem theoretischen Unterbau des Konstruktionsprinzips nur noch bedingt gefolgt wird (Grotjahn 2019: 592). Inwiefern damit fachsprachliche Kompetenzen global erfasst werden können oder ob es sich eher um eine Erfassung von Teilfertigkeiten handelt (z. B. fachsprachliche Lexik), ist bislang wenig untersucht. Wird das Verfahren durch die Modifikation eher zum Teilfertigkeitstest, dann muss unseres Erachtens ebenfalls geklärt werden, warum der C-Test als Format im Vergleich zu anderen Testformaten zu bevorzugen ist, das heißt, es müssen Schlussfolgerungen in Bezug auf die Nutzung validiert werden. Aufgrund seiner Konstruktion und der damit einhergehenden geringen Unabhängigkeit der Lücken voneinander hat das Verfahren im Vergleich zu anderen Tests im Hinblick auf die Messung bestimmter Phänomene einen entscheidenden Nachteil, nämlich, dass die Wahrscheinlichkeit der Lösung einer Lücke in vielen Fällen von der Lösung weiterer Lücken im selben Text abhängig ist. Die Daten aus der einzigen Validierungsstudie (Höttecke et al. 2017) weisen zwar darauf hin, dass die Leistung im fachsprachlichen C-Test partiell mit der Leistung in einem Fachwissenstest und der Fachnote in Zusammenhang steht. Fachsprachlich relevante Kompetenzen werden aber in Form von anderen Tests oder authentischem Sprachhandeln im Fachunterricht nicht zur Erklärung herangezogen.

4 Neue und alte Fragen zur Validität des C-Tests

Die Darstellung der neuen Rahmenbedingungen und bisherigen Aktivitäten zur Validierung haben gezeigt, dass neue bzw. alte Fragen rund um die Validität von C-Tests an die Sprachtestforschung zu adressieren sind. Für viele Verwendungsszenarien im Arbeitsfeld Sprachbildung wurde die Validität des Formats noch nicht hinreichend untersucht. Außerdem sind viele Fragen bezüglich des Einflusses verschiedener Modifikationen auf das Konstrukt des Verfahrens offen. Welchen Desideraten muss die Sprachtestforschung nachgehen, um eine optimale Anwendung des Verfahrens zu schaffen? Im Folgenden werden unseres Erachtens wichtige Desiderate näher eingekreist:

  1. In Bezug auf die Erfassung allgemeiner Sprachkompetenz fehlt es an altersspezifischen C-Test-Sets mit geeigneten erprobten Texten (zu verschiedenen Themen und Textsorten) sowie an einer größeren repräsentativen Stichprobe ein- und mehrsprachiger Schülerinnen und Schüler verschiedener Schulformen. Erst mit diesen Referenzwerten wird es möglich sein, aussagekräftige Interpretationen sowohl für forschungs- als auch für unterrichtsbezogene Zielsetzungen vorzunehmen. Ebenso ist es vor dem Hintergrund des heterogenen Adressatenkreises notwendig, die Schlussfolgerung zu validieren, dass C-Tests bei allen Schülerinnen und Schülern einer Regelklasse allgemeine Sprachkompetenz messen. Dazu sind ähnliche Forschungsdesigns zur Konstruktvalidierung wie bei Drackert und Timukova (2020) notwendig.

  2. Aussagen zur allgemeinen bildungsbezogenen oder schulbezogenen Sprachkompetenz machen zu können, ist ein Anliegen im Arbeitsfeld. Die Vorschläge, wie dies mittels des Verfahrens erreicht werden soll, weichen dabei stark voneinander ab (s. Abschnitt 2.3). Gleichzeitig werden die angestrebten Konstrukte nur in wenigen Fällen validiert. Es fehlen daher explizit Untersuchungen zur Konstruktvalidität, die danach fragen, ob sich mittels C-Test schulbezogene Sprachkompetenz überhaupt erfassen lässt (ggf. auch in Abgrenzung zu allgemeiner Sprachkompetenz) und welche Modifikation oder Kombination aus Modifikationen (für bestimmte Altersstufen) am besten geeignet wäre, um diese anzusteuern.

  3. Mit Blick auf die Erfassung fachsprachlicher Kompetenzen mittels C-Test hat sich gezeigt, dass die meisten Operationalisierungen dazu führen, dass der C-Test zu einem Teilfertigkeitstest wird. Hier sind unseres Erachtens primär Untersuchungen notwendig, die auf die Nützlichkeit eines solchen Teilfertigkeitstests im Vergleich zu anderen Testformaten eingehen: Ist der C-Test ein besserer/schlechterer Prädiktor für fachbezogene Sprachkompetenz als zum Beispiel ein fachsprachlicher Wortschatztest? Hier sind in Anlehnung an die Forschung zur prädikativen Validität des C-Test-Formats (Harsch/Hartig 2016) in anderen Anwendungskontexten ähnliche Untersuchungen notwendig.

  4. Um den C-Test im Rahmen von förderdiagnostischen Zielsetzungen auch für die individuelle Förderung von Schülerinnen und Schülern zu nutzen, fehlt es bislang an empirischen Studien. Inwiefern ist der WE-Wert ein besserer Prädiktor für Textkompetenz oder Leseverstehen als der RF-Wert? Inwiefern ist ein C-Test als Teilfertigkeitstest zu einem grammatikalischen Phänomen ein Mehrwert zu einem Grammatiktest? Die vornehmlich theoretisch begründeten Vorschläge müssen unseres Erachtens empirisch überprüft werden, aber auch Argumente im Rahmen einer ganzheitlichen Validierung des Einsatzes von C-Tests für diesen Zweck erbracht werden. Erst dann kann diese Zielsetzung empfohlen werden.

5 Was können Forschende und Lehrende bei der Konzeption und dem Einsatz des Verfahrens bereits beachten?

Trotz fehlender Grundlagenforschung wollen in der Forschungs- und Unterrichtspraxis verschiedenste Akteurinnen und Akteure C-Tests weiter für Anliegen im Arbeitsfeld Sprachbildung einsetzen. Was können sie beim Einsatz beachten?

Für unterrichtliche Zielsetzungen scheint es sinnvoll, sich noch einmal die Grenzen des Formats vor Augen zu führen; so lassen sich C-Tests primär als Screening nutzen und liefern Ergebnisse für eine globale Messung von Sprachkompetenzen. Die integrative Form, mit der sprachliche Fähigkeiten erfasst werden, macht das C-Test-Format für eine erste Einschätzung sprachlichen Könnens brauchbar. Je nach Erkenntnisinteresse (z. B. grammatikalische Fähigkeiten, diskursive Kompetenzen, mündliche Sprachfähigkeiten) braucht es jedoch weitere Tests, die explizit auf bestimmte sprachliche Teilaspekte abzielen.

Die verbreitete Nutzung des C-Test-Formats als Forschungsinstrument im Arbeitsfeld macht deutlich, dass Forschende Sprachkompetenz möglichst direkt (anstatt indirekt z. B. über die Deutschnote) und objektiv (anstatt weniger objektiv z. B. über Selbsteinschätzungen) erfassen wollen. Dies ist selbst in Forschungsfeldern, in denen Sprache der genuine Untersuchungsgegenstand ist, nicht selbstverständlich, wie beispielsweise Metastudien zur Erhebung von Sprachkompetenzen in der Fremdsprachenforschung zeigen (Thomas 1994; Thomas 2006, Tremblay 2011; Hulstijn 2012; Norris/Ortega 2012; Park et al. 2022). Mit C-Tests können Forschende Aussagen zur Verteilung der Population machen. Bei der Interpretation der Testergebnisse ist jedoch zu berücksichtigen, dass die Stichprobe stärker oder schwächer sein kann und bei der Generalisierung der Ergebnisdarstellung berücksichtigt werden muss. Abschwächen lässt sich die Problematik dadurch, dass die Testergebnisse nicht nur nach klassischer, sondern auch nach probalistischer Testtheorie ausgewertet werden. Werden die Daten Rasch-skaliert, so kann die Wahrscheinlichkeit, mit der ein bestimmtes Item von einer Probandin bzw. einem Probanden gelöst wird, abgebildet werden. Dadurch lässt sich die Schwierigkeit der Items unabhängig von den Probandinnen und Probanden beurteilen. Zur Rasch-Skalierung von C-Test-Daten liegen für Forschende eine Vielzahl von praktischen Hinweisen vor (Eckes 2007; Wilbert/Linnemann 2011; Norris 2018). Insbesondere dann, wenn ein C-Test in verschiedenen Untersuchungen Anwendung finden soll (z. B. in Replikationsstudien), sind die Ergebnisse auf dieser Grundlage vergleichbarer.

Und generell gilt natürlich: Beim C-Test handelt es sich um ein allgemeines Konstruktionsprinzip. Dieses Verständnis wird im Arbeitsfeld Sprachbildung besonders deutlich, wo das Verfahren in großer Diversität eingesetzt wird (vgl. Tabelle 1 im Anhang). Diese Vielfalt macht es jedoch auch notwendig, die zur Anwendung kommenden C-Tests stärker als bisher zu thematisieren und ihren Einsatz zu rechtfertigen. Angaben zur Zielsetzung, zum Adressatenkreis, zum Konstrukt, zum Design sowie zur teststatistischen Güte müssen daher unseres Erachtens stets von den Anwenderinnen und Anwendern aufgeführt werden. Erst dann wird die Anwendungspraxis für alle Akteurinnen und Akteure transparent und die Ergebnisse werden vergleich- und reproduzierbar. Zu einer transparenteren Anwendungspraxis gehört dabei auch die Bereitstellung der C-Test-Sets. Nur ein Bruchteil der erstellten C-Tests ist zum jetzigen Zeitpunkt publiziert und zugänglich. Wünschenswert wäre perspektivisch darüber hinaus eine frei zugängliche Datenbank, die unter anderem Informationen zur Stichprobe, Schwierigkeit und Reliabilität bereitstellt (z. B. IRIS-DATAbase[3]).

About the authors

Mirka Mainzer-Murrenhoff

studierte Sprachlehrforschung, Geschichte und Orientalistik an der Ruhr-Universität Bochum. Seit 2014 arbeitet sie als wissenschaftliche Mitarbeiterin in der Lehramtsausbildung im Bereich Deutsch als Zweitsprache und Sprachbildung. Derzeit ist sie im Arbeitsbereich Sprachbildung und Mehrsprachigkeit an der Ruhr-Universität Bochum tätig. Sie forscht unter anderem zur Messung alltags- und schulbezogener Sprachkompetenzen mittels C-Test-Format sowie zur Diagnose und Förderung des Schreibens im Fachunterricht.

Anastasia Drackert

ist seit Januar 2022 wissenschaftliche Direktorin der Gesellschaft für Akademische Studienvorbereitung und Testentwicklung e.V. (g.a.s.t.). Gleichzeitig ist sie Professorin an der Fakultät für Philologie der Ruhr-Universität Bochum. Ihre Forschungsschwerpunkte sind das Testen sprachlicher Kompetenzen, digitales und aufgabenbasiertes Lernen von Fremdsprachen sowie Mehrsprachigkeit. Ihren PhD hat sie an der Georgetown Universität in Washington DC für ihre Arbeit zur Validierung von Sprachtests in der Sprachlehrforschung erhalten.

Literaturverzeichnis

Ambridge, Ben; Lieven, Elena V. M. (Hrsg.) (2011): Child Language Acquisition: Contrasting theoretical approaches. Cambridge: University Press.10.1017/CBO9780511975073Search in Google Scholar

Adamik, Franziska; Bolte, Claus; N’Sir, Imene; Pastille, Reinhard (2011): „Diagnose naturwissenschaftsbezogener sprachlicher Kompetenzen“. In: Höttecke, Dietmar (Hrsg.): Naturwissenschaftliche Bildung als Beitrag zur Gestaltung partizipativer Demokratie. Gesellschaft der Didaktik für Chemie und Physik. Jahrestagung in Potsdam 2010. Berlin: Lit Verlag, 143–145.Search in Google Scholar

AERA/APA/NCME – American Education Research Association/American Psychological Association/The National Council on Measurement in Education (2014): Standards for educational and psychological testing. American Education Research Association.Search in Google Scholar

Baur, Rupprecht; Spettmann, Melanie (2010): „Der C-Test als Instrument der Sprachdiagnose und Sprachförderung“. In: Lengyel, Drorit; Reich, Hans H.; Roth, Hans-Joachim; Döll, Marion (Hrsg.): Von der Sprachdiagnose zur Sprachförderung. Münster: Waxmann, 115–127.Search in Google Scholar

Baur, Rupprecht; Chlosta, Christoph; Goggin, Melanie (2012): Doppel-Klick: Der Cornelsen C-Test. Berlin: Cornelsen.Search in Google Scholar

Becker-Mrotzek, Michael; Roth, Hans-Joachm (2017): „Sprachliche Bildung – Grundlegende Begriffe und Konzepte“. In: Becker-Mrotzek, Michael; Roth, Hans-Joachim (Hrsg.): Sprachliche Bildung – Grundlagen und Handlungsfelder. Münster: Waxmann, 11–36.10.31244/9783830983897Search in Google Scholar

Beinborn, Lisa (2016): Predicting and manipulating the difficulty of text-completion exercise for language learning. Dissertation am Fachbereich Informatik. Technische Universität Darmstadt.Search in Google Scholar

Bochnik, Katrin; Ufer, Stefan (2017): „Fachsprachliche Kompetenzen im sprachsensiblen Mathematikunterricht der Grundschule: Implikationen einer Studie zur sprachbezogenen Analyse mathematischer Leistungsunterschiede zwischen Lernenden mit deutscher und nicht-deutscher Familiensprache“. In: Leiss, Dominik; Neumann, Astrid; Schwippert, Knut (Hrsg.): Sprachförderung im Fach Mathematik – Forschungsstand und Herausforderungen im Verlauf der Schulzeit. Münster: Waxmann, 81–98.Search in Google Scholar

Boubakri, Christine; Beese, Melanie; Krabbe, Heiko; Fischer, Hans; Roll, Heike (2017): „Sprachsensibler Fachunterricht“. In: Becker-Mrotzek, Michael; Roth, Hans-Joachim; Bredthauer, Stefanie; Lahmann, Cornelia (Hrsg.): Sprachliche Bildung – Grundlagen und Handlungsfelder. Münster: Waxmann, 335–350.Search in Google Scholar

Caprez-Krompàk, Edina (2010): Entwicklung der Erst- und Zweitsprache im interkulturellen Kontext: Eine empirische Untersuchung über den Einfluss des Unterrichts in heimatlicher Sprache und Kultur (HSK) auf die Sprachentwicklung. Münster: Waxmann.Search in Google Scholar

Chapelle, Carol, A.; Voss, Eric (Hrsg.) (2021): Validity Argument in Language Testing: Case Studies of Validation Research. Cambridge: University Press (Cambridge Applied Linguistics).10.1017/9781108669849Search in Google Scholar

Daller, Helmut (1996): Migration und Mehrsprachigkeit: Der Sprachstand türkischer Rückkehrer aus Deutschland. Dissertation. Universität Utrecht.Search in Google Scholar

Daller, Helmut; Grotjahn, Rüdiger (1999): „The language proficiency of turkish returnees from Germany: an empirical investigation of academic and everyday language proficiency“. In: Language, culture and curriculum 12 (2), 156–172.10.1080/07908319908666575Search in Google Scholar

Drackert, Anastasia (2015). Validating language proficiency assessments in second language acquisition research: Applying an argument-based approach. Frankfurt am Main: Lang.10.3726/978-3-653-06280-9Search in Google Scholar

Drackert, Anastasia; Timukova, Anna (2020): „Welche Sprachkompetenz misst der C-Test bei HerkunftsprecherInnen: allgemeine oder doch bildungssprachliche?“. In: Drackert, Anastasia; Mainzer-Murrenhoff, Mirka; Soltyska, Anna; Timukova, Anna (Hrsg.): Testen bildungssprachlicher Kompetenzen und akademischer Sprachkompetenzen: Zugänge für Schule und Hochschule. Berlin: Lang, 159–186.10.3726/b17088Search in Google Scholar

Dürrstein, Birgit (2013): „Konzeption eines C-Tests als Screening“. In: Jeuk, Stefan (Hrsg.): Sprachförderung und Förderdiagnostik in der Sekundarstufe I, 53–71.10.7767/dedo.2013.53.3-4.465Search in Google Scholar

Eckes, Thomas (2007): „Konstruktion und Analyse von C-Tests mit Ratingskalen-Rasch-Modellen“. In: Diagnostica 53 (2), 68–82. DOI: https://doi.org/10.1026/0012–1924.53.2.6810.1026/0012-1924.53.2.68Search in Google Scholar

Eckes, Thomas; Grotjahn, Rüdiger (2006): „A closer look at the construct validity of C-tests“. In: Language Testing 23 (3), 290–325. DOI: https://doi.org/10.1191/0265532206lt330oaSearch in Google Scholar

Eckhardt, Andrea G. (2008): Sprache als Barriere für schulischen Erfolg: Potentielle Schwierigkeiten beim Erwerb schulbezogener Sprache für Kinder mit Migrationshintergrund. Münster: Waxmann.Search in Google Scholar

Ellis, Nick C.; O‘Donnell, Matthew Brook; Römer, Ute (2013): „Usage-Based Language: Investigating the Latent Structures that Underpin Acquisition“. In: Language Learning 63 (1), 25–51. DOI: https://doi.org/10.1111/j.1467–9922.2012.00736.x10.1111/j.1467-9922.2012.00736.xSearch in Google Scholar

Europarat (Hrsg.) (2001): Gemeinsamer Europäischer Referenzrahmen für Sprachen: lernen, lehren und beurteilen. Berlin: Langenscheidt.Search in Google Scholar

Feilke, Helmut (2013). „Bildungssprache und Schulsprache am Beispiel literal-argumentativer Kompetenzen“. In: Becker-Mrotzek, Michael; Schramm, Karen; Thürmann, Eike; Vollmer, Helmut Johannes (Hrsg.): Sprache im Fach: Sprachlichkeit und fachliches Lernen. Münster: Waxmann, 113–130.Search in Google Scholar

Gogolin, Ingrid (2009): „Zweisprachigkeit und die Entwicklung bildungssprachlicher Fähigkeiten“. In: Gogolin, Ingrid; Neumann, Ursula (Hrsg.): Streitfall Zweisprachigkeit – The Bilingualism Controversy. Wiesbaden: VS, 263–280.10.1007/978-3-531-91596-8_15Search in Google Scholar

Grotjahn, Rüdiger (2019): „C-Tests“. In: Jeuk, Stefan; Settinieri, Julia (Hrsg.): Sprachdiagnostik Deutsch als Zweitsprache: ein Handbuch. Berlin: De Gruyter, 585–609.10.1515/9783110418712-024Search in Google Scholar

Grotjahn, Rüdiger; Drackert, Anastasia (2020): The electronic C-Test bibliography: version October 2020. Online: https://www.ruhrunibochum.de/sprachetesten/index.html.de (08.08.2022).Search in Google Scholar

Gürsoy, Erkan (2016): Kohäsion und Kohärenz in mathematischen Prüfungstexten türkisch-deutschsprachiger Schülerinnen und Schüler: Eine multiperspektivische Untersuchung. Münster: Waxmann.Search in Google Scholar

Harding, Luke; Kremmel, Benjamin (2016): „25. Teacher assessment literacy and professional development“. In: Tsagari, Dina; Banerjee, Jayanti (Hrsg.): Handbook of second language assessment. Berlin: De Gruyter, 413–428.10.1515/9781614513827-027Search in Google Scholar

Harsch, Claudia; Hartig, Johannes (2016): „Comparing C-tests and Yes/No vocabulary size tests as predictors of receptive language skills“. In: Language Testing 33 (4), 555–575. DOI: https://doi.org/10.1177/026553221559464210.1177/0265532215594642Search in Google Scholar

Höttecke, Dietmar; Ehmke, Timo; Krieger, Caroline; Kulik, Marta A. (2017): „Vergleichende Messung fachsprachlicher Fähigkeiten in den Domänen Physik und Sport“. In: Zeitschrift für Didaktik der Naturwissenschaften (ZfDN) 23, 53–69.10.1007/s40573-017-0055-6Search in Google Scholar

Hulstijn, Jan H. (2012): „The construct of language proficiency in the study of bilingualism from a cognitive perspective“. In: Bilingualism: Language and Cognition 15 (2), 422–433. DOI: https://doi.org/10.1017/S136672891100067810.1017/S1366728911000678Search in Google Scholar

Institut für Bildungsmonitoring und Qualitätsentwicklung (o. J.): DCLL+3. Hamburg.Search in Google Scholar

Kane, Michael T. (2013): „Validating the Interpretations and Uses of Test Scores“. In: Journal of Educational Measurement 50, 1–73.10.1111/jedm.12000Search in Google Scholar

Kecker, Gabriele (2011): Validierung von Sprachprüfungen: Die Zuordnung des TestDaF zum Gemeinsamen europäischen Referenzrahmen für Sprachen. Frankfurt am Main: Peter Lang. Search in Google Scholar

Klein-Braley, Christine (1983): „A Cloze is a Cloze is a Question“. In: Oller, John W. (Hrsg.): Issues in Language Testing. Rowley: Newbury House Publishers, 218–228.Search in Google Scholar

Kniffka, Gabriele; Linnemann, Markus (2014): „A German C-test for migrant children“. In: Grotjahn, Rüdiger (Hrsg.): Der C-Test: Aktuelle Tendenzen/The C-Test: Current trends. Frankfurt am Main: Lang, 241–261.Search in Google Scholar

Kniffka, Gabriele; Linnemann, Markus (2016): „Zur Ermittlung der Schwierigkeit (fach-)sprachlicher Strukturen mittels fachlicher C-Tests – Eine explorative Studie“. In: Tschirner, Erwin; Bärenfänger, Olaf; Möhring, Jupp (Hrsg.): Deutsch als fremde Bildungssprache: Das Spannungsfeld zwischen Fachwissen, sprachlicher Kompetenz, Diagnostik und Didaktik. Tübingen: Stauffenberg, 163–178.Search in Google Scholar

Kobayashi, Masaki; Zappa-Hollman, Sandra; Duff, Patricia A. (2017). „Academic discourse socialization“. In: Language Socialization 8, 239–254. DOI: https://doi.org/10.1007/978-3-319-02327-4_18-110.1007/978-3-319-02255-0_18Search in Google Scholar

Leiss, Dominik; Domenech, Madeleine; Ehmke, Timo; Schwippert, Knut (2017): „Schwer – schwierig – diffizil: Zum Einfluss sprachlicher Komplexität von Aufgaben auf fachliche Leistungen in der Sekundarstufe I“. In: Leiss, Dominik; Neumann, Astrid; Schwippert, Knut (Hrsg.): Sprachförderung im Fach Mathematik – Forschungsstand und Herausforderungen im Verlauf der Schulzeit. Münster: Waxmann, 99–125.Search in Google Scholar

Lengyel, Drorit; Reich, Hans H.; Roth, Hans-Joachim; Döll, Marion (Hrsg.) (2009): Von der Sprachdiagnose zur Sprachförderung. Münster: Waxmann.Search in Google Scholar

Linnemann, Markus (2010): „C-Tests in der Ferienschule: Entwicklung, Einsatz, Nutzen und Grenzen“. In: Stiftung Mercator (Hrsg.): Der Mercator-Förderunterricht: Sprachförderung für Schüler mit Migrationshintergrund durch Studierende. Münster: Waxmann, 195–214.Search in Google Scholar

Mainzer-Murrenhoff, Mirka (2021): „Sprachtheorien – Grundlage für die Entwicklung von Instrumenten zur Erfassung bildungssprachlicher Kompetenz“. In: Mainzer-Murrenhoff, Mirka; Drumm, Sandra; Heine, Lena (Hrsg.): Sprachtheorien in der Zweit- und Fremdsprachenforschung: Eine Basis für empirisches Arbeiten zwischen Fach- und Sprachlernen. Baltmannsweiler: Schneider, 173–199.Search in Google Scholar

Mainzer-Murrenhoff, Mirka (in Vorbereitung). Erfassung alltags- und schulbezogener Sprachkompetenzen mittels C-Test. Dissertation. Ruhr-Universität Bochum.Search in Google Scholar

Mashkovskaya, Anna (2013): Der C-Test als Lesetest bei Muttersprachlern. Dissertation. Universität Duisburg-Essen. Online: http://duepublico.uni-duisburg-essen.de/servlets/DocumentServlet?id=32859 (18.08.2020).Search in Google Scholar

Meißner-Stiffel, Marion; Raatz, Ulrich (1996): „_____ oder _ _ _ _ ? Zwei Grundlagenuntersuchungen zum C-Prinzip bei L1-Lernern“. In: Grotjahn, Rüdiger (Hrsg.): Der C-Test: Theoretische Grundlagen und praktische Anwendungen. Band 3. Bochum: Brockmeyer, 173–181.Search in Google Scholar

Morek, Miriam; Heller, Vivien (2012): „Bildungssprache – Kommunikative, epistemische, soziale und interaktive Aspekte ihres Gebrauchs“. In: Zeitschrift für Angewandte Linguistik (ZfAL) 57 (1), 67–101. DOI: https://doi.org/10.1515/zfal-2012-0011.10.1515/zfal-2012-0011Search in Google Scholar

Müller, Anja; Schutz, Petra; Tracy, Rosemarie (2018): „Spracherwerb“. In: Titz, Cora; Geyer, Sabrina; Ropeter, Anna; Wagner, Hanna; Weber, Susanne (Hrsg.): BiSS-Basics Band I: Entwicklung von Konzepten zur Sprach- und Schriftsprachförderung. Stuttgart: Kohlhammer, 53–68.Search in Google Scholar

Norris, John M. (2018): „Developing and investigating C-tests in eight languages: Measuring proficiency for research purposes“. In: Norris, John M. (Hrsg.): Developing C-tests for estimating proficiency in foreign language research. Frankfurt am Main: Lang, 7–33.10.3726/b13235Search in Google Scholar

Norris, John M.; Ortega, Lourdes (2012): „Assessing learner knowledge“. In: Gass, Susan M.; Mackey, Alison (Hrsg.): The Routledge handbook of second language acquisition. New York: Routledge, 573–589.Search in Google Scholar

Özcan, Nermin (2012): Zum Einfluss der Fachsprache auf die Leistung im Fach Chemie: Eine Förderstudie zur Fachsprache im Chemieunterricht. Dissertation an der Fakultät für Chemie. Universität Duisburg-Essen.Search in Google Scholar

Park, Hae In; Solon, Megan; Dehghan‐Chaleshtori, Marzieh; Ghanbar, Hessameddin (2022): „Proficiency reporting practices in research on second language acquisition: Have we made any progress?“. In: Language Learning 72 (1), 198–236. DOI: https://doi.org/10.1111/lang.1247510.1111/lang.12475Search in Google Scholar

Prediger, Susanne; Neugebauer, Philipp (2021): „Can students with different language backgrounds profit equally from a language-responsive instructional approach for percentages? Differential effectiveness in a field trial“. In: Mathematical Thinking and Learning, 1–21. DOI: 10.1080/10986065.2021.191981710.1080/10986065.2021.1919817Search in Google Scholar

Prediger, Susanne; Wilhelm, Nadine; Büchter, Andreas; Gürsoy, Erkan; Benholz, Claudia (2015): „Sprachkompetenz und Mathematikleistung – Empirische Untersuchung sprachlich bedingter Hürden in den Zentralen Prüfungen 10“. In: Journal für Mathematikdidaktik 36, 77–104.10.1007/s13138-015-0074-0Search in Google Scholar

Raatz, Ulrich; Klein-Braley, Christine (1992): Schulleistungstest Deutsch für vierte Klassen (CT-D 4): Beiheft mit Anleitung und Normentabellen. Weinheim: Beltz.Search in Google Scholar

Redder, Angelika; Neumann, Johannes; Tracy, Rosemarie (Hrsg.) (2015): Forschungsinitiative Sprachdiagnostik und Sprachförderung – Ergebnisse. Münster: Waxmann.Search in Google Scholar

Roll, Heike; Bernhardt, Markus; Enzenbach, Christine; Fischer, Hans E.; Gürsoy, Erkan; Krabbe, Heiko; Lang, Martin; Manzel, Sabine; Uluçam-Wegmann, Işıl (Hrsg.) (2019): Schreiben im Fachunterricht der Sekundarstufe I unter Einbeziehung des Türkischen: Empirische Befunde aus den Fächern Geschichte, Physik, Technik, Politik, Deutsch und Türkisch. Münster: Waxmann.Search in Google Scholar

Schaller, Pascale (2018): Zur Konstruktion von Sprache und Sprachwissen: Eine empirische Studie zur Schriftsprachaneignung sprachstarker und sprachschwacher Kinder. Berlin: De Gruyter. 10.1515/9783110555165Search in Google Scholar

Schlager, Sabine (2020): Zur Erforschung des Zusammenhangs zwischen Sprachkompetenz und Mathematikleistung: Oberflächlichkeit als potenzieller Mediator. Wiesbaden: Springer Spectrum.10.1007/978-3-658-31871-0Search in Google Scholar

Schlak, Torsten; Zimmermann, Kerstin; Molnár, Heike (2010): „Zur Entwicklung eines ,C-Tests Wirtschaftsdeutsch‘: Hinweise und Erfahrungen aus der Praxis“. In: Berndt, Annette; Kleppin, Karin (Hrsg.): Sprachlehrforschung: Theorie und Empirie. Festschrift für Rüdiger Grotjahn. Frankfurt am Main: Lang, 13–22.Search in Google Scholar

Schründer-Lenzen, Agi; Mücke, Stephan (2005): „Mit oder ohne Fibel – was ist der Königsweg für die multilinguale Klasse?“. In: Schründer-Lenzen, Agi (Hrsg.): Aktuelle Publikationen aus dem Projekt BeLesen. Potsdam: Universität Potsdam, 1–13.Search in Google Scholar

Schüler-Meyer, Alexander; Prediger, Susanne; Kuzu, Taha; Wessel, Lena; Redder, Angelika (2019): „Is Formal language proficiency in the home language required to profit from a bilingual teaching intervention in Mathematics? A mixed methods study on fostering multilingual students‘ conceptual understanding“. In: International Journal of Science and Mathematics Education 17 (2), 317–339.10.1007/s10763-017-9857-8Search in Google Scholar

Sigott, Günther (2004): Towards identifying the C-Test construct. Frankfurt am Main: Lang.Search in Google Scholar

Stephany, Sabine (2018): Sprache und mathematische Textaufgaben: Eine empirische Untersuchung zu leser- und textseitigen sprachlichen Einflussfaktoren auf den Lösungsprozess. Münster: Waxmann.Search in Google Scholar

Süßmilch, Edgar (1985): „C-Tests für ausländische Schüler: Sprachdiagnose im Unterricht Deutsch als Zweitsprache“. In: Fremdsprachen und Hochschule 13/14, 72–82.Search in Google Scholar

Terrasi-Haufe, Elisabetta; Semyonova, Anastassiya; Kallfell, Tobias; Lebedeva, Elena; Schmidt, Julia (2012): „Die Untersuchung von Wechselwirkungen zwischen interkultureller Interaktion und Integration in der InterMig-Studie“. In: Arhrenholz, Bernt (Hrsg.): Einblicke in die Zweitspracherwerbsforschung und ihre methodischen Verfahren. Berlin: De Gruyter, 349–369.10.1515/9783110267822.349Search in Google Scholar

Thiede, E. (2018): „Abstract: Schriftsprachliche Kompetenzen in der Sekundarstufe II“. In: Göbel, Kerstin; Lewandowska, Zuzanna M. (Hrsg.): Interdisziplinäre Forschungsperspektiven auf Zuwanderung und Akkulturation im Kontext Schule. Reader zur wissenschaftlichen Tagung. Universität Duisburg-Essen, 52–53.Search in Google Scholar

Thomas, Margaret (1994): „Assessment of L2 proficiency in second language acquisition research“. In: Language Learning 44, 307–336. DOI: https://doi.org/10.1111/j.1467–1770.1994.tb01104.x10.1111/j.1467-1770.1994.tb01104.xSearch in Google Scholar

Thomas, Margaret (2006): „Research synthesis and historiography: The case of assessment of second language proficiency“. In: Norris, John M.; Ortega, Lourdes (Hrsg.): Synthesizing Research on Language Learning and Teaching. Amsterdam: John Benjamins, 279–298.10.1075/lllt.13.13thoSearch in Google Scholar

Tremblay, Annie (2011): „Proficiency assessment standards in second language acquisition research: ,Clozing‘ the gap“. In: Studies in Second Language Acquisition 33 (3), 339–372. DOI: https://doi.org/10.1017/S027226311100001510.1017/S0272263111000015Search in Google Scholar

van den Bulck, Wendy (1996): The C-test: An exploration of the diagnostic scope of a test format. Dissertation an der Fakulteit Letteren. Katholieke Universiteit Leuven, Belgium.Search in Google Scholar

Vollmer, Helmut Johannes; Thürmann, Eike (2013): „Sprachbildung und Bildungssprache als Aufgabe aller Fächer der Regelschule“. In: Becker-Mrotzek, Michael; Schramm, Karen; Thürmann, Eike; Vollmer, Helmut Johannes (Hrsg.): Sprache im Fach: Sprachlichkeit und fachliches Lernen. Münster: Waxmann, 41–57.Search in Google Scholar

Wessel, Lena (2015). Fach- und sprachintegrierte Förderung durch Darstellungsvernetzung und Scaffolding: Ein Entwicklungsforschungsprojekt zum Anteilbegriff. Wiesbaden: Springer Spectrum. 10.1007/978-3-658-07063-2Search in Google Scholar

Wessel, Lena; Prediger, Susanne (2018): „Differentielle Förderbedarfe je nach Sprachhintergrund? Analysen zu Unterschieden und Gemeinsamkeiten zwischen sprachlich starken und schwachen, einsprachigen und mehrsprachigen Lernenden“. In: Leiss, Dominik; Neumann, Astrid; Schwippert, Knut (Hrsg.): Sprachförderung im Fach Mathematik – Forschungsstand und Herausforderungen im Verlauf der Schulzeit. Münster: Waxmann, 165–187.Search in Google Scholar

Wilbert, Jürgen; Linnemann, Markus (2011): „Kriterien zur Analyse eines Tests zur Lernverlaufsdiagnostik“. In: Empirische Sonderpädagogik 3, 225–242. Online: http://www.psychologie-aktuell.com/fileadmin/download/esp/3- 2011_20111130/wilbert.pdf (18.08.2020).Search in Google Scholar

Wockenfuß, Verena (2009): Diagnostik von Sprache und Intelligenz bei Jugendlichen und jungen Erwachsenen. Aachen: Shaker.Search in Google Scholar

Wockenfuß, Verena; Raatz, Ulrich (2014): „Zur Validität von muttersprachlichen C-Tests: Bedeutung von verbaler Intelligenz und Informationsverarbeitungsgeschwindigkeit unter Berücksichtigung des Lebensalters“. In: Grotjahn, Rüdiger (Hrsg.): Der C-Test: Aktuelle Tendenzen/The C-Test: Current trends. Frankfurt am Main: Lang, 191–224.Search in Google Scholar

Zimmermann, Kerstin (2019): Keine Zeit für den C-Test? Eine empirische Untersuchung zum Einfluss einer Geschwindigkeitskomponente auf das Konstrukt des C-Tests/No time for a C-test? An empirical study on the influence of the speed factor on the construct of the C-test. Berlin: Universitätsverlag der TU Berlin.Search in Google Scholar

Anhang

Tabelle 1 
						Übersicht der zur Anwendung kommenden C-Tests im Arbeitsfeld Sprachbildung
Tabelle 1

Übersicht der zur Anwendung kommenden C-Tests im Arbeitsfeld Sprachbildung

Published Online: 2022-10-19
Published in Print: 2022-10-04

© 2022 Walter de Gruyter GmbH, Berlin/Boston

Downloaded on 25.10.2025 from https://www.degruyterbrill.com/document/doi/10.1515/infodaf-2022-0067/html
Scroll to top button