Home Effizienz und soziale Ungleichheit in strikt leistungsdifferenzierenden Bildungssystemen. Eine kritische Betrachtung des Model of Ability Tracking (MoAbiT)
Article Open Access

Effizienz und soziale Ungleichheit in strikt leistungsdifferenzierenden Bildungssystemen. Eine kritische Betrachtung des Model of Ability Tracking (MoAbiT)

  • Georg Lorenz

    Georg Lorenz, geb. 1982 in Leipzig. Studium der Soziologie in Leipzig. Promotion (Dr. rer. pol.) an der Otto-Friedrich-Universität Bamberg. Derzeit Leitung der Nachwuchsforschungsgruppe „Multidimensionale Heterogenität im Klassenzimmer: Messung, Effekte, Mechanismen (MuHiK)“ an der Universität Potsdam. Seit 2022 zusätzlich Leitung des DFG-Projekts „Social Embeddedness in Social Networks and the Reproduction of Socioeconomic Inequality in Educational Attainments (SERIOUS)“ an der Universität Leipzig.

    Forschungsschwerpunkte: Ungleichheit, Bildung, soziale Netzwerke, sozialer Zusammenhalt, ethnische Minderheiten, Diskriminierung, Diversität.

    Wichtigste Publikationen: Ethnic Diversity Fosters the Social Integration of Refugee Students (mit Z. Boda, M. Jansen, P. Stanat & A. Edele), in: Nature Human Behaviour 7, 2023: 881–889; The Link between Social and Structural Integration: Co- and Interethnic Friendship Selection and Friend Influence within Adolescent Social Networks (mit Z. Salikutluk, Z. Boda, M. Jansen & M. Hewstone), in: Sociological Science 8, 2021: 371–396; Stereotype bei Lehrkräften? Eine Untersuchung systematisch verzerrter Lehrererwartungen (mit S. Gentrup, C. Kristen, P. Stanat & I. Kogan), in: Kölner Zeitschrift für Soziologie und Sozialpsychologie 68, 2016: 89–111.

    EMAIL logo
    , Sarah Lenz

    Sarah Lenz, geb. 1990 in Berlin. Studium der Mathematik und Wirtschaftsmathematik in Berlin und Würzburg. Promotion (Dr. phil.) an der Freien Universität Berlin. Von 2017–2021 wissenschaftliche Mitarbeiterin am Institut zur Qualitätsentwicklung im Bildungswesen (IQB) an der Humboldt-Universität zu Berlin.

    Forschungsschwerpunkte: Schulische Segregation, Gliederung des Schulsystems, Bildungsungleichheit.

    Wichtigste Publikationen: Schulische Segregation und ihre Veränderung im Zuge von Schulstrukturreformen in Berlin, Bremen und Hamburg (mit C. Rjosk & P. Stanat), in: Zeitschrift für Soziologie der Erziehung und Sozialisation 42, 2022: 54–72; Ethnische Segregation zwischen Schularten in mehrgliedrigen Schulsystemen und im „Zwei-Wege-Modell“ – Analysen im Kontext von schulstrukturellen Reformmaßnahmen in Berlin, Bremen und Hamburg (mit C. Rjosk, G. Lorenz & P. Stanat), in: Kölner Zeitschrift für Soziologie und Sozialpsychologie 73, 2021: 59–84; Soziokulturelle Segregation an weiterführenden Schulen – Analysen zur Rolle der Gliederung des deutschen Schulsystems und schulstruktureller Reformmaßnahmen (mit M. Holtmann, C. Rjosk & P. Stanat), in: Zeitschrift für Erziehungswissenschaft 22, 2019: 1333–1358.

    and Camilla Rjosk

    Camilla Rjosk, geb. 1982 in Berlin. Studium der Psychologie sowie Promotion in Berlin. Von 2010–2021 wissenschaftliche Mitarbeiterin und von 2021–2023 Leitung der Nachwuchsforschungsgruppe „Multidimensionale Heterogenität im Klassenzimmer: Messung, Effekte, Mechanismen“ am Institut zur Qualitätsentwicklung im Bildungswesen (IQB) an der Humboldt-Universität zu Berlin. Seit 2023 Professur für Schulentwicklung an der Universität Potsdam.

    Forschungsschwerpunkte: Heterogenität der Schüler:innenschaft, Kompositionseffekte, leistungsbezogene und psychosoziale Entwicklung von Schüler:innen, Diagnostische Fähigkeiten von Lehrkräften und Erwartungseffekte, Merkmale von Unterrichtsqualität.

    Wichtigste Publikationen: Dispersion of Student Achievement and Classroom Composition, S. 1399–1431 in: T. Nilsen, A. Stancel-Piątak & J.-E. Gustafsson (Hrsg.), International Handbook of Comparative Large-Scale Studies in Education. Perspectives, Methods and Findings, Cham 2023; Ethnic Composition and Heterogeneity in the Classroom–Their Measurement and Relationship with Student Outcomes (mit D. Richter, O. Lüdtke & J.S. Eccles), in: Journal of Educational Psychology 109, 2017: 1188–1204; IQB-Bildungstrend 2016. Kompetenzen in den Fächern Deutsch und Mathematik am Ende der 4. Jahrgangsstufe im zweiten Ländervergleich (mit S. Schipolowski, C. Rjosk, S. Weirich & N. Haag), Münster 2017.

Published/Copyright: November 2, 2023
Become an author with De Gruyter Brill

Zusammenfassung

Inwieweit Leistungsdifferenzierung (bzw. ability tracking) Bildungsungleichheit beeinflusst, wird kontrovers diskutiert. Die vorliegende Studie untersucht, wie die Stringenz von Leistungsdifferenzierung (z. B. erzeugt durch verbindliche Übergangsempfehlungen) mit der Effizienz von Lernprozessen und sozialer Ungleichheit in der Sekundarstufe zusammenhängt. Den theoretischen Ausgangspunkt bildet eine kritische Betrachtung des „Model of Ability Tracking“ (MoAbiT) von Hartmut Esser. Empirische Analysen von Daten aus zwei IQB-Bildungstrendstudien stellen folgende Hauptannahmen des MoAbiT in Frage: Erstens, dass Sekundarschulklassen bei strikter Leistungsdifferenzierung kognitiv homogener zusammengesetzt sind und zweitens, dass kognitive Homogenität mit höheren schulischen Kompetenzen assoziiert ist. In Bezug auf die Auswirkungen von Leistungsdifferenzierung auf soziale Disparitäten zeichnet die vorliegende Arbeit ein gemischtes Bild. Ob strikte Leistungsdifferenzierung – wie im MoAbiT postuliert – Lernprozesse erleichtert und Bildungsungleichheit reduziert, bleibt angesichts der Befunde fraglich.

Abstract

How ability tracking affects student achievement and educational inequality is a key question in the sociology of education. This study examines how the strictness of ability tracking (e. g., created through binding teacher recommendations) relates to students’ scholastic performance and socioeconomic achievement gaps. The starting point is a critical reflection on Hartmut Esser’s ‘Model of Ability Tracking‘ (MoAbiT). Analyses of two IQB Trends in Student Achievement studies question the following fundamental assumptions proposed by the MoAbiT: first, that strict ability tracking fosters cognitive homogeneity among students within school classes and, second, that cognitive homogeneity associates positively with scholastic performance. The present study’s results concerning the effects of strict ability tracking on socioeconomic achievement gaps are mixed. These findings challenge the MoAbiT’s key premise, which suggests that ability tracking is an effective measure to improve student achievement and reduce educational inequality.

1 Einleitung

Welche Rolle die institutionelle Ausgestaltung des Bildungssystems für die Effizienz von Bildungssystemen und die Reproduktion von sozialer Ungleichheit spielt, ist eine zentrale soziologische Fragestellung. Ein besonders umstrittenes institutionelles Merkmal ist die Leistungsdifferenzierung (auch ability tracking genannt), also die Aufteilung der Schülerschaft auf verschiedene Schulklassen oder fachspezifische Lerngruppen (within-school ability tracking) bzw. Sekundarschularten (between-school ability tracking) gemäß ihrer in der Primarstufe erbrachten Leistungen. Fürsprecher von Leistungsdifferenzierung argumentieren, dass die Homogenisierung der Schülerleistungen in Bildungssystemen mit ability tracking die individuelle Förderung aller Schüler*innen erleichtert und soziale Ungleichheit im Bildungserwerb abfedert (vgl. Hallinan 1994; Sørensen 1970). Gleichzeitig liegt eine Reihe von Arbeiten vor, die verschiedene Wege aufweist, über die ability tracking schulische Leistungen im Mittel eher reduziert und zur Verfestigung von Bildungsungleichheiten beiträgt (z. B. Gamoran 2009; Matthewes 2021).

In Deutschland hat die Aufteilung der Schülerschaft auf unterschiedlich anspruchsvolle Schularten eine lange Tradition. In den letzten Jahrzehnten wurde die traditionelle Dreigliedrigkeit (Hauptschule, Realschule und Gymnasium) jedoch infolge einer Reihe von Schulstrukturreformen verändert. Zum einen wurden tradierte Schularten abgeschafft und neue eingerichtet. Zum anderen fand in einigen Bundesländern eine Liberalisierung der Übergangsverfahren statt. Mittlerweile variieren die Schulsysteme der Bundesländer in zahlreichen institutionellen Merkmalen, die zusammen die Stringenz der Leistungsdifferenzierung beeinflussen. Zu diesen Merkmalen zählen in erster Linie die Verbindlichkeit von Übergangsempfehlungen und die Kontrolle von schulischen Abläufen (z. B. über Bewertungsstandards und regelmäßige Evaluationen). Die enge Verknüpfung von Übergängen an die Noten in der Grundschule (z. B. in Bayern und Sachsen) trägt zu einer strikten Leistungsdifferenzierung bei. Das Abschaffen bindender Übergangsempfehlungen zugunsten einer freien Wahl der weiterführenden Schulart durch die Eltern, zuletzt vollzogen zum Schuljahr 2012/13 in Baden-Württemberg, ist dagegen ein Schritt hin zu einer liberaleren Leistungsdifferenzierung.

Den möglichen Auswirkungen der Stringenz von Leistungsdifferenzierung auf die Effizienz und soziale Ungleichheit im Erwerb schulischer Kompetenzen hat sich eine in Band 49 (Heft 5–6) dieser Zeitschrift veröffentlichte Studie von Esser und Seuring (2020) angenommen. Der Studie liegt das „Model of Ability Tracking“ (MoAbiT) von Hartmut Esser (2022; 2016) zugrunde. Dem Modell zufolge sind die Übergänge von der Primar- in die Sekundarstufe bei strikter Leistungsdifferenzierung stärker an das in der Grundschule erworbene Wissen und die kognitiven Fähigkeiten geknüpft als bei liberalerer Leistungsdifferenzierung. Dies habe signifikante Folgen für die Zusammensetzung von Schulklassen: Sie sollten in strikt leistungsdifferenzierenden Systemen kognitiv homogener zusammengesetzt sein als in liberalen Systemen. In Bezug auf die Auswirkungen von kognitiver Homogenität in Schulklassen postuliert das MoAbiT positive Effekte auf Lernerfolge, weil kognitive Homogenität eine Anpassung von Curricula und Unterricht an die Fähigkeiten der Schüler*innen erlaubt. Insgesamt sollten die Leistungen in strikt leistungsdifferenzierenden Bildungssystemen dadurch im Schnitt höher ausfallen als in liberaleren Systemen (Effizienz).

Zusätzlich lässt das MoAbiT erwarten, dass strikte Leistungsdifferenzierung soziale Ungleichheit abfedert, weil Bildungsübergänge in strikt leistungsdifferenzierenden Systemen stärker an die kognitiven Fähigkeiten und weniger stark an die soziale Herkunft geknüpft sind. Durch die Sortierung entlang der kognitiven Fähigkeiten und unabhängig von der sozialen Herkunft würden alle Schüler*innen unabhängig von ihren individuellen Merkmalen gleichermaßen gefördert. Folglich sollte der Zusammenhang zwischen Sozialstatus und dem Erwerb schulischer Kompetenzen bei strikter Leistungsdifferenzierung abnehmen.

Analysen von Daten zu Siebtklässler*innen (Jahrgangsstufe 2012/13) aus der National Educational Panel Study (NEPS) scheinen die Annahmen des MoAbiT zu bestätigen. So zeigen Esser und Seuring (2020), dass Leistungen im Lesen und in Mathematik in strikt leistungsdifferenzierenden Bundesländern höher ausfallen als in den übrigen Bundesländern. Dieser Vorteil scheint teilweise über das Ausmaß an kognitiver Homogenität in den Schulklassen vermittelt zu sein. Zusätzlich fällt der positive Effekt von kognitiver Homogenität in den strikt leistungsdifferenzierenden Schulsystemen sogar noch größer aus als in den liberaleren Systemen. Der Zusammenhang zwischen der sozialen Herkunft und dem Erwerb schulischer Kompetenzen unterscheidet sich den Analysen zufolge nicht zwischen den Systemen. Die Autoren sehen in ihren Befunden ein klares Argument für eine Re-Orientierung an strikter Leistungsdifferenzierung, während die Liberalisierung der Bildungssysteme die Effizienz verringere und soziale Ungleichheit potentiell erhöhe (Esser & Seuring 2020: 297).

Das MoAbiT und die sich daraus ergebenden analytischen Möglichkeiten bilden einen wichtigen Beitrag zu der auch international kontrovers geführten Debatte um die Folgen von ability tracking für schulisches Lernen und Bildungsungleichheit. Die Annahmen des Modells orientieren sich an der Kernidee des ability tracking, nämlich dass eine kognitive Homogenisierung der Schülerschaft Lernprozesse effizienter macht. Mögliche nicht-intendierte Nebenerscheinungen von kognitiver Homogenität, wie etwa eine soziale Homogenisierung der Schülerschaft oder auch verschiedene Arten von Peer-Effekten, werden im MoAbiT aber außer Acht gelassen. Vor diesem Hintergrund besteht das Anliegen der vorliegenden Arbeit darin, die theoretischen Argumente des MoAbiT einer kritischen Prüfung zu unterziehen. Im Zentrum der Kritik stehen folgende Kernannahmen des MoAbiT: 1) Strikte Leistungsdifferenzierung führt zu einer kognitiven Homogenisierung bei gleichzeitig zunehmender sozialer Heterogenität der Schülerschaft innerhalb von Schulklassen. 2) Kognitive Homogenität in Schulklassen erhöht die Effizienz des Lernens und dadurch den Kompetenzerwerb. 3) Strikte Leistungsdifferenzierung reduziert soziale Ungleichheit im Kompetenzerwerb. Die theoretische Auseinandersetzung beinhaltet eine Darstellung des bisherigen Forschungsstandes. An die theoretischen Argumente schließen sich eigene empirische Analysen an, die auf den Daten der IQB-Bildungstrendstudien 2015 und 2018 beruhen und teilweise methodische Kritikpunkte an der Studie von Esser und Seuring (2020) von anderer Stelle berücksichtigen (Heisig & Matthewes 2022). Ziel ist es, die Kernaussage des MoAbiT zu überprüfen: Führt die mit strikter Leistungsdifferenzierung verknüpfte kognitive Homogenisierung der Schülerschaft zu höheren Schulleistungen, ohne dabei Bildungsungleichheit zu verstärken?

2 Theorie und Forschungsstand

2.1 Strikte Leistungsdifferenzierung und die Zusammensetzung von Schulklassen

Eine Grundannahme des MoAbiT (Esser 2016; 2022) lautet, dass Schulkassen in strikt leistungsdifferenzierenden Schulsystemen kognitiv homogener zusammengesetzt sind als in liberaleren Systemen, weil die Zuteilung auf die Schularten enger an die kognitiven Fähigkeiten geknüpft ist. Empirische Befunde, die die Komposition von Schulklassen zwischen Schulsystemen vergleichen, liegen bislang jedoch nicht vor. Da die Annahme kognitiver Homogenität allen potenziellen Vorteilen der strikten Leistungsdifferenzierung zugrunde liegt, sollte sie dringend empirisch überprüft werden.

Des Weiteren geht das MoAbiT von schwachen Korrelationen zwischen der sozialen Herkunft und der Verteilung von Schüler*innen auf die verschiedenen Schularten in strikt differenzierenden Systemen aus, weil Eltern in diesen Systemen aufgrund von verbindlichen Übergangsempfehlungen wenig (bzw. keinen) Einfluss auf den Bildungsübergang ihrer Kinder haben sollten (geringerer sekundärer Herkunftseffekt, vgl. Boudon 1974). Sekundäre Effekte der sozialen Herkunft sollten in liberaleren Schulsystemen dagegen deutlich stärker ausfallen. In strikt leistungsdifferenzierenden Schulsystemen würden dementsprechend auch die am wenigsten anspruchsvollen Schularten (bei traditioneller Dreigliedrigkeit die Hauptschule) von Heranwachsenden aus allen sozialen Schichten besucht und die Schulklassen sozial heterogener zusammengesetzt sein als in liberaleren Schulsystemen. Dieses Szenario ist in Anlehnung an Esser und Seuring (2020: 284) schematisch in Abb. 1a dargestellt.

 Abb. 1: Mögliche kognitive und soziale Kompositionen von mehr („GYM“) und weniger („HRS“) anspruchsvollen Schularten in strikt leistungsdifferenzierenden Schulsystemen. Darstellung in Anlehnung an Esser und Seuring (2020).

Abb. 1: Mögliche kognitive und soziale Kompositionen von mehr („GYM“) und weniger („HRS“) anspruchsvollen Schularten in strikt leistungsdifferenzierenden Schulsystemen. Darstellung in Anlehnung an Esser und Seuring (2020).

Gegen diese Grundannahme des MoAbiT zur Zusammensetzung von Schulklassen spricht jedoch, dass Bildungsübergänge auch in strikt leistungsdifferenzierenden Schulsystemen nicht nach den kognitiven Fähigkeiten, sondern nach den in der Grundschule erbrachten Schulleistungen gestaltet werden. Letztere wiederum sind bereits zum Zeitpunkt des Übergangs in die Sekundarstufe stark sozial stratifiziert, weil Schulleistungen schon zu Beginn und noch stärker am Ende der Grundschulzeit mit der sozialen Herkunft korrelieren, und zwar auch unabhängig von den kognitiven Fähigkeiten (z. B. Helbling et al. 2019; Jackson 2013; vgl. auch Esser 2022: S. 292 ff.).[1] Hierbei handelt es sich um das empirisch vielfach belegte Phänomen der primären Herkunftseffekte (vgl. Boudon 1974). Esser und Seuring (2020) deuten dieses Szenario, wie in Abb. 1b dargestellt, an. Hier wird die Sortierung entlang der kognitiven Fähigkeiten und der sozialen Herkunft ersichtlich.

Abb. 1b lässt jedoch unberücksichtigt, dass auch die kognitiven Fähigkeiten aufgrund von primären Effekten nicht über die verschiedenen sozialen Herkünfte hinweg gleichverteilt sind. Vielmehr sollte bereits zum Zeitpunkt des Übergangs eine starke soziale Stratifizierung der kognitiven Fähigkeiten vorliegen. Dieses Szenario ist schematisch in Abb. 1c abgetragen. Die Darstellung legt nahe, dass kognitive Homogenität infolge von strikter Leistungsdifferenzierung faktisch auch immer mit sozialer Segregation zwischen den verschiedenen Schularten bzw. sozialer Homogenität innerhalb von Schularten verbunden ist (vgl. auch Jenkins et al. 2008; Lenz et al. 2019; Strello et al. 2022). Diese Überlegungen stellen nicht die Annahme in Frage, dass die kognitive Zusammensetzung von Schulen und Schulklassen in liberaleren Schulsystemen ebenfalls stark mit der sozialen Zusammensetzung korreliert (vgl. Abb. 2 in Esser & Seuring 2020:284). Entscheidend ist jedoch, dass diese Korrelation, wie in Abb. 1c dargestellt, analog auch in strikt leistungsdifferenzierenden Systemen vorliegen kann. Dieser Aspekt bleibt im MoAbiT unberücksichtigt, obwohl er nicht zuletzt für die Frage nach sozialen Ungleichheiten im Kompetenzerwerb bedeutsam ist (vgl. Abschnitt 2.3).

2.2 Effizienz: Effekte kognitiver Homogenität auf schulischen Bildungserfolg

Leistungsdifferenzierung wurde in internationalen Bildungssystemen mit der Intention eingeführt, über die Ausrichtung von Curricula und Unterricht an die Fähigkeiten der Schüler*innen eine möglichst gute individuelle Förderung zu gewährleisten (Hallinan 1994; Sørensen 1970). Auf curricularer Ebene werden Lerninhalte und Anspruchsniveau auf die homogenen Ausgangsfähigkeiten und Lernstände der Schüler*innen hin ausgerichtet. Auf der Unterrichtsebene sollten u. a. Anpassungen im Unterrichtstempo und in den Unterrichtsmethoden in besonders effizienten Lehr- und Lernprozessen resultieren (Hanushek & Wößmann 2006; LeTendre et al. 2003). Diese Argumente werden in Ökonomie und Psychologie auch als positive Folgen von customized instructions diskutiert (z. B. Chiu et al. 2017; Matthewes 2021). Das MoAbiT leitet aus der Idee der customized instructions die Annahme ab, dass strikte Leistungsdifferenzierung und die aus ihr (wahrscheinlich) resultierende kognitive Homogenität in Schulklassen positiv auf den schulischen Bildungserfolg wirkt (Effizienz). Das Modell nimmt somit an, dass das Ausmaß kognitiver Homogenität Leistungsunterschiede zwischen Schulsystemen mit unterschiedlich strikter Leistungsdifferenzierung vermittelt (Mediation). Dagegen sollte kognitive Heterogenität customized instructions erschweren und die Effizienz von Lernprozessen senken.

In der Bildungssoziologie, der Ökonomie und der Psychologie wird jedoch eine Reihe weiterer Mechanismen diskutiert, die den positiven Effekten kognitiver Homogenität (wie sie auf curricularer und unterrichtlicher Ebene zu erwarten sind) entgegenstehen können. Zu nennen sind hier insbesondere Peer-Effekte, also die Wirkung von sozialem Lernen, sozialem Einfluss und sozialen Normen auf die Einstellungen und das Verhalten von Schüler*innen (vgl. Lomi et al. 2011; Lorenz et al. 2020). Positive Effekte von kognitiver Heterogenität könnten sich insbesondere daraus ergeben, dass leistungsschwächere Schüler*innen von ihren leistungsstärkeren Mitschüler*innen Unterstützung und Hilfestellungen erhalten (Rjosk 2022). Gegenseitige Unterstützung könnte dabei nicht nur für die leistungsschwächeren Schüler*innen nützlich sein. Das Erklären von Inhalten und die Reorganisation und Reflexion von Wissen können sich auch positiv auf die Leistungen der Helfenden auswirken (Chiu et al. 2017; Dronkers & van der Velden 2013). In kognitiv homogenen Schulklassen sollten dagegen weniger Opportunitäten für das Erbringen und den Empfang von Hilfestellungen vorliegen (Wilkinson & Fung 2002). Dieser Mechanismus könnte der Effizienz des Lernens in kognitiv homogenen Klassen entgegenstehen (Duflo et al. 2011).

Im Zusammenhang mit der leistungsbezogenen Heterogenität von Schulklassen wird zudem immer wieder die positive Wirkung von Rollenvorbildern diskutiert. In heterogeneren Klassen sind Schüler*innen mit geringeren Fähigkeiten häufiger von positiven Vorbildern umgeben (Matthewes 2021). Motivierte und kompetente Peers senken die wahrgenommenen Kosten, ähnliche Einstellungen und Verhaltensweisen ebenfalls an den Tag zu legen. Je erfolgreicher die Rollenvorbilder in der Schule sind, desto stärker sollte der Zusammenhang sein (DiMaggio & Garip 2012). Kognitiv homogene Kontexte wären für die akademischen Einstellungen von Schüler*innen mit geringeren Fähigkeiten aufgrund von fehlenden positiven Rollenvorbildern dagegen ungünstiger (vgl. auch Chiu et al. 2017). Ferner wird davon ausgegangen, kognitive Heterogenität helfe dabei, Unterschiedlichkeit zu akzeptieren bzw. zu legitimieren und darüber als Gruppe effektiver zusammenzuarbeiten und neue Ideen zu entwickeln (Ben-Ari & Kedem-Friedrich 2000; Kuzmina & Ivanova 2018; Paulus & Brown 2003). Insgesamt würden kognitiv heterogene Klassen über derartige Peer-Effekte Vorteile für die Kompetenzentwicklung mit sich bringen, die in kognitiv homogenen Klassen nicht zu erwarten sind.

Ein verwandtes Argument knüpft an kognitive Referenzpunkte an (Tribushinina 2008). Größere Unterschiede in Leistungen und leistungsbezogenen Einstellungen in Schulklassen (die sich bei kognitiver Heterogenität ergeben) könnten es Schüler*innen erleichtern, bestimmte Verhaltensweisen und Einstellungen ihrer Peers kognitiv mit entsprechenden Schulleistungen zu verknüpfen (Chiu et al. 2017). Diese Form des sozialen Lernens könnte Lernprozesse in kognitiv heterogeneren Kontexten effektiver und effizienter machen als in homogeneren Kontexten.

Ein Mechanismus, der positiven Effekten von kognitiver Heterogenität auf Lernerfolge entgegenstehen könnte, ist Homophilie, also die Tendenz mit Akteuren zu interagieren, die ähnliche Eigenschaften aufweisen (McPherson et al. 2001). Homophilie kann in heterogenen Kontexten die Bildung von Subgruppen oder Cliquen hervorrufen, die sich hinsichtlich ihrer bildungsbezogenen sozialen Normen unterscheiden. Schüler*innen mit ähnlichen schulischen Leistungen und motivationalen Merkmalen interagieren dadurch häufiger miteinander als Schüler*innen mit weniger Ähnlichkeiten (Lorenz et al. 2020). Dies könnte dem positiven Effekt gegenseitiger Hilfestellungen in heterogenen Kontexten entgegenstehen (Chiu et al. 2017). Dennoch sollte eine positive Wirkung von Heterogenität auch bei starker Homophilie bestehen bleiben, weil Rollenvorbilder im alltäglichen Unterricht und in Gruppenarbeiten auch ohne engere soziale Beziehungen und direkte Interaktionen eine Wirkung entfalten (vgl. Jansen et al. 2022).

Vor dem Hintergrund dieser gegensätzlich wirkenden Mechanismen erscheint eine Re-Analyse der Effekte von kognitiver Homogenität auf den schulischen Bildungserfolg bedeutsam. Ein weiterer Aspekt verkompliziert die Debatte zusätzlich und unterstreicht die Bedeutung von Re-Analysen: Verschiedene Studien deuten an, dass die leistungsbezogene Zusammensetzung von Schulklassen für Schüler*innen mit unterschiedlichen Fähigkeiten differenziell wirken kann (vgl. Rjosk 2022). Zum einen könnten Schüler*innen mit höheren kognitiven Fähigkeiten von den genannten positiven Effekten kognitiver Homogenität ggf. stärker profitieren als Schüler*innen mit geringeren kognitiven Fähigkeiten (Matthäus-Effekt; vgl. Chiu et al. 2017; Merton 1968). Zum anderen könnten Schüler*innen mit geringeren kognitiven Fähigkeiten stärker unter den negativen Folgen von kognitiver Homogenität leiden, weil ihr Kompetenzerwerb sensitiver auf Änderungen in der Klassenkomposition reagiert (Huang 2009; Imberman et al. 2012; Kiss 2013; Lavy et al. 2012; Zimmer & Toma 2000). Empirische Analysen sollten demnach auch mögliche Unterschiede in der Wirkung kognitiver Homogenität zwischen Schüler*innen mit unterschiedlichen individuellen kognitiven Fähigkeiten berücksichtigen.

2.3 Strikte Leistungsdifferenzierung und soziale Ungleichheit im Kompetenzerwerb

In Abschnitt 2.1 wurde beschrieben, dass strikte Leistungsdifferenzierung entgegen den Annahmen des MoAbiT mit sozialer Homogenität in Schulklassen einhergehen könnte. Ob strikte Leistungsdifferenzierung soziale Ungleichheit im Kompetenzerwerb verschärft oder nicht, hängt eng mit dieser Annahme zusammen. Weitgehende Unabhängigkeit zwischen der kognitiven und sozialen Klassenkomposition, wie im MoAbit postuliert und in Abb. 1a dargestellt, ließe keine Verschärfung von sozialer Ungleichheit durch kognitive Homogenität in Schulsystemen mit strikter Leistungsdifferenzierung erwarten, weil Schüler*innen unabhängig von ihrem sozialen Hintergrund in Klassen mit vergleichbarer kognitiver Homogenität lernen. Eine Konfundierung von kognitiver und sozialer Homogenität, wie in Abb. 1c dargestellt, könnte soziale Ungleichheit in Schulsystemen mit strikter Leistungsdifferenzierung dagegen verschärfen. Dies wäre insbesondere der Fall, wenn differenzielle Effekte kognitiver Homogenität für leistungsschwächere im Vergleich zu leistungsstärkeren Schüler*innen aufträten (vgl. Abschnitt 2.2). Schüler*innen mit niedrigem sozialem Status, die häufig leistungsschwächer sind, blieben dann gerade die Vorteile des Lernens in heterogenen Klassen verwehrt, während Schüler*innen mit hohem sozialem Status, die häufig leistungsstärker sind, von der kognitiven Homogenität profitieren würden. Dies könnte insgesamt zu einer Verschärfung sozialer Ungleichheit im Kompetenzerwerb führen. Auch in liberal leistungsdifferenzierenden Systemen ist ein Zusammenhang zwischen der kognitiven und sozialen Komposition von Schulklassen zu erwarten (s. Abschnitt 2.1), sodass möglicherweise keine Unterschiede in der sozialen Ungleichheit zwischen liberaleren und strikten Systemen bestehen. Letztlich handelt es sich hierbei um empirisch zu beantwortende Fragen.

Ergänzend sei angemerkt, dass die bisherigen Ausführungen in erster Linie auf die Wirkung kognitiver Homogenität fokussieren und die Bedeutung des mittleren Leistungsniveaus und der besuchten Schulart für den Kompetenzerwerb unberücksichtigt lassen. Die Forschung weist jedoch darauf hin, dass Schüler*innen höhere Kompetenzen erwerben, wenn sie in einer Schulklasse mit höherem Leistungsniveau lernen (Becker et al. 2021; Dumont et al. 2013; Rjosk 2022) und wenn sie Gymnasien im Vergleich zu nicht-gymnasialen Schularten besuchen (z. B. Becker et al. 2006; Köller et al. 2013). Begründet werden positive Effekte des Gymnasialbesuchs und eines hohen Leistungsniveaus der Klasse u. a. mit einer aktivierenden und anspruchsvollen Unterrichtsgestaltung, lernförderlichen Werten und Normen unter den Heranwachsenden, Schulressourcen wie eine höhere Qualifikation von Lehrkräften sowie höheren curricularen Ansprüchen (vgl. z. B. Rjosk, 2022). Die in Abb. 1c dargestellte Konfundierung von kognitiver und sozialer Komposition würde dazu führen, dass Schüler*innen mit niedrigem sozialem Status bei strikter Leistungsdifferenzierung eher in Schulklassen mit einem niedrigen Leistungsniveau und an nicht-gymnasialen Schularten lernen. Daher könnten die Effekte der Schulart und des mittleren Leistungsniveaus die soziale Ungleichheit in strikt leistungsdifferenzierenden Bildungssystemen verschärfen.

2.4 Zusammenfassung der Annahmen

Die theoretischen Ausführungen zeigen, wie komplex die Zusammenhänge zwischen der kognitiven und sozialen Zusammensetzung von Schulklassen und den Schulleistungen sowie der sozialen Ungleichheit im Kompetenzerwerb sind. Die kritische Auseinandersetzung mit dem MoAbiT verdeutlicht, dass zusätzlich zu den postulierten positiven Effekten strikter Leistungsdifferenzierung verschiedene Mechanismen, insbesondere Peer-Prozesse und die soziale Homogenisierung der Schülerschaft, so wirken könnten, dass strikte Leistungsdifferenzierung gegenüber einer weniger strikten Sortierung bezüglich der Effizienz und sozialen Bildungsungleichheit nicht vorteilhaft ist.

Ein abschließendes Urteil zur Wirkung kognitiver Homogenität in Schulklassen erfordert differenzierte Kausalanalysen zu den einzelnen, teilweise wohl gegensätzlich wirkenden Mechanismen. Längsschnittlich erhobene Datensätze, die Informationen zu Curricula, Unterrichts- und Peer-Prozessen sowie ausreichend hohe Fallzahlen auf der Ebene von Schulklassen oder Schulen enthalten, um die kognitive Zusammensetzung von Schulklassen und deren Effekte adäquat zu messen, liegen für den deutschen Kontext bislang aber nicht vor.[2] Allerdings kann die empirische Untersuchung allgemeiner Zusammenhänge zwischen der kognitiven Homogenität in Schulklassen und schulischen Outcomes mittels alternativer Datenquellen einen Eindruck über die Validität der im MoAbiT postulierten und durch die Ergebnisse von Esser und Seuring (2020) suggerierten Effizienz der strikten Leistungsdifferenzierung im Sekundarschulsystem vermitteln. Und auch bereits in Hinblick auf die wenig komplexen Grundannahmen zur Wirkung der Stringenz von Leistungsdifferenzierung auf die Komposition von Schulkassen herrscht Unklarheit. Sind Schulklassen in strikt leistungsdifferenzierenden Systemen tatsächlich kognitiv homogener und sozial heterogener zusammengesetzt als in liberaleren Systemen? Die Beantwortung dieser Frage würde einen wichtigen Beitrag zur Debatte um die Effizienz von Bildungssystemen und sozialer Ungleichheit im Kompetenzerwerb leisten.

Vor diesem Hintergrund prüft die vorliegende Studie erstens die Grundannahmen des MoAbiT. Das Modell postuliert einen geringen Zusammenhang zwischen kognitiver und sozialer Homogenität und insbesondere, dass Schulklassen bei strikter Leistungsdifferenzierung im Schnitt kognitiv homogener und sozial heterogener zusammengesetzt sind als in liberaleren Schulsystemen.

Zweitens wird versucht, den von Esser und Seuring (2020) berichteten positiven Effekt von kognitiver Homogenität auf den schulischen Kompetenzerwerb zu replizieren. Da sich kognitive Homogenität über verschiedene, gegensätzlich wirkende Mechanismen auf das schulische Lernen auswirken kann (vgl. Abschnitt 2.2), wird keine Erwartung bzgl. der Stärke oder Richtung des Effekts getroffen. Die verschiedenen Mechanismen können prinzipiell dazu führen, dass der Effekt im Mittel bei null liegt. Im Rahmen der Analysen wird auch geprüft, ob kognitive Homogenität in Schulklassen differenziell wirkt. Hier geht es insbesondere darum zu prüfen, ob Schüler*innen mit geringeren kognitiven Fähigkeiten von kognitiver Homogenität beeinträchtigt sind, z. B. weil ihnen positive Vorbilder und die Möglichkeiten zur Zusammenarbeit mit leistungsstärkeren Mitschüler*innen fehlen. Schließlich wird auch eine Mediation möglicher Unterschiede in den mittleren Kompetenzen zwischen Schüler*innen in unterschiedlich strikt leistungsdifferenzierenden Bildungssystemen durch das Ausmaß kognitiver Homogenität geprüft.

Drittens wird der Vermutung nachgegangen, dass soziale Ungleichheit im schulischen Kompetenzerwerb in strikt leistungsdifferenzierenden Systemen geringer ausfällt als in liberaleren Systemen. Das MoAbiT nimmt an, eine meritokratische Verteilung von Schüler*innen mit unterschiedlichen sozioökonomischen Hintergründen führe dazu, dass soziale Ungleichheit mit zunehmender Stringenz von Leistungsdifferenzierung sinkt oder zumindest nicht ansteigt. Die hier dargelegten Ausführungen zeigen aber, die soziale Ungleichheit in strikt leistungsdifferenzierenden Systemen (gegenüber liberaleren Systemen) nur dann abgefedert werden kann, wenn Schulklassen aufgrund der engen Kopplung von Sozialstatus, Leistungen und Bildungsübergängen nicht auch sozial homogener werden. Außerdem hängt der Effekt der Stringenz auf soziale Ungleichheit davon ab, ob Effekte kognitiver Homogenität alle Schüler*innen unabhängig von ihren individuellen Fähigkeiten gleichermaßen betreffen.

3 Daten und Methode

Die Analysen basieren auf Daten der IQB-Bildungstrendstudien. Diese querschnittlich angelegten Schulleistungsstudien erheben alternierend alle drei Jahre sprachliche bzw. mathematisch-naturwissenschaftliche Kompetenzen von Schüler*innen der 9. Jahrgangsstufe in Stichproben für alle 16 Bundesländer. Daten aus dem Jahr 2015 ermöglichen die Analyse sprachlicher Kompetenzen, Daten aus dem Jahr 2018 die Analyse mathematisch-naturwissenschaftlicher Kompetenzen (Stanat et al. 2018, 2019). Esser und Seuring (2020) untersuchten Schüler*innen, die im Schuljahr 2010/11 die 5. Jahrgangsstufe besuchten; die am IQB-Bildungstrend 2015 teilnehmenden Jugendlichen stammten also aus derselben Schülerkohorte.

In beiden Bildungstrendstudien bildeten allgemeinbildende Schulen die Grundgesamtheit, aus der für jedes Bundesland eine randomisierte Schulstichprobe gezogen wurde. An jeder Schule der Schulstichprobe nahmen jeweils eine (Gymnasium) oder zwei (übrige Schularten) zufällig ausgewählte Schulklasse(n) der 9. Jahrgangsstufe an den Erhebungen teil. Dieses Vorgehen bei der Stichprobenziehung sowie die Bereitstellung von Fallgewichten durch das IQB stellen sicher, dass die Stichproben die Population aller Schüler*innen der 9. Jahrgangsstufe an allgemeinbildenden Schulen (jeweils für die Jahre 2015 und 2018) abbilden (für eine ausführliche Beschreibung der Stichprobenziehung und Generierung von Fallgewichten vgl. Stanat et al. 2019, 2016). Die gewichtete Teilnahmequote auf der Schülerebene lag 2015 bei 93,3 % und 2018 bei 92,4 %. Diese Datengrundlage gewährleistet, dass zentrale Merkmale der Schulklassen, die sich aus aggregierten Informationen der Schüler*innen ergeben (insbesondere die kognitive Homogenität pro Klasse), reliabel geschätzt werden können (siehe die durchschnittliche Schüleranzahl pro Schulklasse im Abschnitt 3.1).

Die Erhebung zum Ende der Sekundarstufe I sollte dazu führen, dass Zusammenhänge zwischen der Stringenz der Leistungsdifferenzierung und schulischen Outcomes sowie Effekte der Klassenzusammensetzung sich deutlicher zeigen als in der Untersuchung von Esser und Seuring (2020), da sich die unterschiedlich günstigen Bedingungen in den Schulklassen eine längere Zeit auf Lehr- und Lernprozesse auswirken konnten. Nachteilig ist dagegen, dass die kognitiven Fähigkeiten aufgrund der querschnittlichen Anlage der Bildungstrendstudien ebenfalls erst in der 9. Jahrgangsstufe erfasst wurden. Davon ausgehend, dass sich die lernrelevanten institutionellen Eigenschaften der Schularten, Schulen und Schulklassen nicht nur auf die Kompetenzentwicklung, sondern auch auf die Entwicklung der kognitiven Fähigkeiten auswirken (Becker et al. 2012), sollten anfängliche Fähigkeitsunterschiede zwischen den Klassen bis zum Ende der Sekundarstufe I noch etwas zugenommen haben und stärker mit den zeitgleich erhobenen Kompetenzen korrelieren. Effekte der Klassenzusammensetzung werden dadurch ggf. verzerrt geschätzt. Es finden sich aber auch Hinweise darauf, dass die in Schulleistungsstudien verwendeten Messwerte für kognitive Fähigkeiten von inhaltlichen Lernprozessen relativ unabhängig und damit weitgehend zeitstabil sind (vgl. Weinert 2001). So zeigen Baumert, Stanat und Watermann (2006), dass die Verwendung eines kognitiven Fähigkeitsmaßes zur Modellierung der Leistungskomposition ein vertretbares Vorgehen ist, jedoch damit eine leichte Überschätzung von Kompositionseffekten verbunden ist. Zudem ist durch die querschnittliche Anlage der Studie zu berücksichtigen, dass die berichteten Unterschiede in der kognitiven Homogenität (sowie auch deren Effekte) nicht nur eine Ursache von Leistungsdifferenzierung sein müssen. Teilweise könnte sie auch die Folge von verschiedenen, wiederholten Sortierprozessen im Verlauf der Sekundarstufe I sein. Hier kommen u. a. Klassenwiederholungen oder die Aufteilung von Klassen nach Fächerschwerpunkten in Frage.

3.1 Stichproben

Nach Ausschluss von Förderschulen umfassen die Stichproben 31.350 Schüler*innen in 1.425 Klassen (IQB-Bildungstrend 2015) bzw. 43.179 Schüler*innen in 2.009 Klassen (IQB-Bildungstrend 2018). Anhand dieser Daten wurden verschiedene Kompositionsmerkmale geschätzt, die auf Informationen zu durchschnittlich 22 (2015) bzw. 21,5 Schüler*innen (2018) pro Schulkasse basieren. Da in verschiedenen Kompetenzbereichen jeweils nur ein Teil der Stichprobe getestet und Schüler*innen mit fehlenden Angaben zum Migrationshintergrund und zum Geschlecht ausgeschlossen wurden[3], gingen in die regressionsanalytische Modellierung Daten zu 28.034 Schüler*innen in 1.406 Klassen aus dem IQB-Bildungstrend 2015 bzw. Daten zu 20.772 Schüler*innen in 1.953 Klassen aus dem IQB-Bildungstrend 2018 ein.

3.2 Variablen

Als Indikatoren für schulische Leistungen in der Sekundarstufe dienen Kompetenzwerte für das Leseverstehen im Fach Englisch und für eine domänenübergreifende Kompetenz im Fach Mathematik („Globalskala“), die im Rahmen der IQB-Bildungstrendstudien basierend auf den Ergebnissen standardisierter Testungen als 15 Plausible Values geschätzt wurden (vgl. Stanat et al. 2016: 515 ff., 2019: 419 ff.).[4] Die Plausible Values ermöglichen verlässliche Schätzungen von Kompetenzverteilungen in Populationen und Subpopulationen sowie von Zusammenhängen zwischen Kompetenzwerten und weiteren Merkmalen der Schüler*innen. Die Leistungsindikatoren wurden z-standardisiert (M = 0, SD = 1).

Der soziale Hintergrund (SES) ist über den jeweils höchsten Wert des International Socio-Economic Index of Occupational Status der Eltern operationalisiert (HISEI; Ganzeboom et al. 1992). Die HISEI-Werte wurden im Rahmen der IQB-Bildungstrendstudien aus Angaben der Schüler*innen (2015) bzw. aus einer Kombination der Angaben von Schüler*innen und ihrer Eltern (2018) zu den Berufen der Eltern abgeleitet[5]. Die kognitiven Fähigkeiten (ABL) sind durch einen Untertest zum schlussfolgernden Denken des Berliner Tests zur Erfassung fluider und kristalliner Intelligenz für die 8. bis 10. Jahrgangsstufe gemessen, der aus figuralen (nonverbalen) Aufgaben besteht (BEFKI 8–10; Wilhelm et al. 2014). Fehlende SES- bzw. ABL-Werte werden durch multiple Imputationen ersetzt (Rubin 1987).[6] Das soziale und kognitive Niveau der Schulklassen ist über die ABL- und SES-Mittelwerte abgebildet (NABL bzw. NSES). Die jeweiligen invertierten Standardabweichungen dienen als Indikatoren für die kognitive und soziale Homogenität (HABL bzw. HSES) – höhere Ausprägungen entsprechen einer höheren Homogenität. Die besuchte Schulart geht als Dummy-Variable in die Analysen ein, die zwischen Gymnasien und nicht-gymnasialen Schularten unterscheidet (1 = Gymnasium). Als zusätzliche Kontrollvariablen werden auf Individualebene Dummys für das Geschlecht der Schüler*innen (FEM; 1 = Mädchen) und den Migrationshintergrund (MHG; 1 = mit Migrationshintergrund, d. h. mind. ein Elternteil im Ausland geboren) berücksichtigt.

Für die Stringenz der Leistungsdifferenzierung des Schulsystems wird in Anlehnung an Esser und Seuring (2020) auf Ebene der Bundesländer eine Variable mit drei Ausprägungen gebildet. Die Einstufung geht auf Überlegungen von Helbig und Nikolai (2015) zurück und berücksichtigt die Verbindlichkeit von Übergangsempfehlungen und das Ausmaß der Kontrolle von schulischen Abläufen innerhalb der Schulsysteme der Bundesländer. Die Referenzgruppe „liberale Differenzierung“ (keine Verbindlichkeit, wenig Kontrolle) umfasst Berlin, Bremen, Hessen, Mecklenburg-Vorpommern, Nordrhein-Westfalen, Rheinland-Pfalz und Schleswig-Holstein. Eine „moderate Differenzierung“ (entweder Verbindlichkeit oder stärkere Kontrolle) gibt es in Brandenburg, Hamburg, Niedersachsen, Saarland, Sachsen-Anhalt und Thüringen. In Baden-Württemberg, Bayern und Sachsen ist die Kontrolle schulischer Abläufe vergleichsweise hoch und für die erste Untersuchungskohorte gab es in allen drei Bundesländern verbindliche Übergangsempfehlungen. In den Analysen der Daten des IQB-Bildungstrends 2015 wird diesen Bundesländern die Ausprägung „strikte Differenzierung“ zugeordnet. Da die Verbindlichkeit der Übergangsempfehlung zum Schuljahr 2012/13 in Baden-Württemberg abgeschafft wurde, wird das Land für die Analysen der Daten des IQB-Bildungstrends 2018 als Land mit „moderater Differenzierung“ erfasst.

3.3 Analytisches Vorgehen

Im ersten Schritt werden auf deskriptiver Ebene Mittelwerte und Standardabweichungen der verwendeten Konstrukte berechnet. Um die zentralen Annahmen zu Systemunterschieden in diesen Variablen zu testen, werden die Verteilungsparameter in Abhängigkeit von der Stringenz der Leistungsdifferenzierung für die drei Bundesländergruppen getrennt berichtet und auf statistisch signifikante Unterschiede geprüft (t-Test, < 0,05). Zudem wird sowohl systemübergreifend als auch differenziert die Korrelation zwischen der kognitiven und der sozialen Homogenität der Klassen betrachtet. Die Ergebnisse sind in den Tab. 1 und 2 abgetragen.

Die weiteren Analysen orientieren sich am Vorgehen von Esser und Seuring (2020) und berücksichtigen teilweise methodische Kritikpunkte von Heisig und Matthewes (2022). Das eigene Vorgehen ist dabei unter Berücksichtigung der theoretischen Argumente in Abschnitt 2 dieser Studie angepasst, um auch empirisch Aspekte zu beleuchten, die in den beiden genannten Studien unbeachtet bleiben. Geschätzt werden hierarchische lineare Regressionsmodelle, die die geclusterte Datenstruktur (Schüler*innen in Schulklassen) berücksichtigen und eine verlässliche Beurteilung von Effekten der Klassenkomposition ermöglichen.

Eine erste Modellreihe betrachtet die Effekte auf das Leseverstehen im Fach Englisch und die Mathematikkompetenz systemübergreifend. Unter Kontrolle individueller kognitiver Fähigkeiten, der sozialen Herkunft, des Geschlechts, der Schulart, der sozialen Komposition sowie des kognitiven Niveaus, wird zunächst ein Haupteffekt der kognitiven Homogenität untersucht. Im Anschluss wird in einem Modell mit Interaktionseffekten systemübergreifend die Annahme einer differenziellen Wirkung der kognitiven Homogenität für Schüler*innen auf unterschiedlichen individuellen kognitiven Fähigkeitsniveaus überprüft. Die Ergebnisse sind in Tab. 3 zu finden.

Eine zweite Modellreihe untersucht, inwieweit die von Esser und Seuring (2020) berichteten Systemeffekte, d. h. die (möglicherweise bestehenden) Unterschiede in den schulischen Kompetenzen zwischen den Bundesländern mit einer unterschiedlichen Stringenz der Leistungsdifferenzierung sowie ihre Mediation durch die kognitive Homogenität in Schulkassen, anhand der Daten der IQB-Bildungstrendstudien replizierbar sind. Die Ergebnisse für den Kompetenzbereich Englisch-Leseverstehen finden sich in Tab. 4 und diejenigen für die mathematischen Kompetenzen in Tab. 5.

Eine dritte Modellreihe prüft abschließend, ob je nach Stringenz der Leistungsdifferenzierung differenzielle Effekte der kognitiven und sozialen Klassenkomposition sowie der individuellen kognitiven Fähigkeiten und insbesondere der sozialen Herkunft nachweisbar sind. Tab. 6 berichtet die entsprechenden Ergebnisse.

Durch die z-Standardisierung der abhängigen Variablen lassen sich die Regressionskoeffizienten als Leistungsunterschiede in Standardabweichungen interpretieren. Da die kontinuierlichen unabhängigen Variablen auf Individual- und Klassenebene zudem auf ein [0;1]-Intervall transformiert wurden, weisen die Regressionskoeffizienten jeweils die maximalen Effekte, d. h. die erwarteten Leistungsunterschiede zwischen Schüler*innen mit der Ausprägung 0 und Schüler*innen mit der Ausprägung 1 in den entsprechenden Variablen aus. Für die Interaktionsterme ist zu beachten, dass die konditionalen Haupteffekte jeweils den Effekt von x1 (z. B. den individuellen kognitiven Fähigkeiten) bei minimaler Ausprägung von x2 (minimale kognitive Homogenität bzw. maximale Heterogenität) repräsentieren und umgekehrt, während die Interaktionseffekte die Veränderung zu den konditionalen Haupteffekten abbilden, wenn x1 bzw. x2 die höchste empirische Ausprägung annehmen.

In alle Analysen gingen die vom IQB zur Verfügung gestellten Fallgewichte auf Individual- und Klassenebene ein (Stanat et al. 2016: 120 f., 2019: 125 f.).

4 Ergebnisse

4.1 Deskriptive Befunde

Die Tab. 1 und 2 bilden die Mittelwerte und Streuungen der analysierten Variablen in den Daten der IQB-Bildungstrends 2015 und 2018 ab. Die Angaben sind sowohl für die Gesamtstichproben als auch in Abhängigkeit von der Stringenz der Leistungsdifferenzierung dargestellt.

Der Anteil von Schüler*innen, die ein Gymnasium besuchen, liegt in den Gesamtstichproben bei 38,3 (2015) bzw. 39,6 % (2018) und damit deutlich unter dem von Esser und Seuring (2020) für die NEPS-Daten berichteten Wert von 58,4 %. Die hohe Aussagekraft der Bildungstrenddaten spiegelt sich außerdem darin wider, dass die Angaben zur Komposition von Schulklassen auf durchschnittlich 22 (2015) bzw. 21,5 Schüler*innen (2018) basieren.[7]

Tab. 1:

Wertebereich, Mittelwerte und Streuungen der verwendeten Konstrukte sowie Korrelation zwischen kognitiver und sozialer Homogenität für die Daten des IQB-Bildungstrends 2015

Konstrukte

Wertebereich

liberal

moderat

strikt

Gesamtstichprobe

MW

(SD)

MW

(SD)

MW

(SD)

MW

(SD)

Engl.-Leseverstehen1,2

[–7,3;3,7]

0,01

(0,97)

–0,05

(0,96)

0,10

(0,95)

0,03

(0,96)

SES

[0;1]

0,51

(0,26)

0,51

(0,25)

0,52

(0,26)

0,51

(0,26)

ABL1,2

[0;1]

0,58

(0,12)

0,58

(0,12)

0,59

(0,12)

0,58

(0,12)

NSES

[0;1]

0,46

(0,18)

0,47

(0,16)

0,47

(0,19)

0,47

(0,18)

HSES

[0;1]

0,37

(0,12)

0,39

(0,12)

0,39

(0,12)

0,38

(0,12)

NABL1,2

[0;1]

0,53

(0,14)

0,54

(0,13)

0,57

(0,14)

0,55

(0,14)

HABL1

[0;1]

0,53

(0,11)

0,55

(0,12)

0,56

(0,10)

0,55

(0,11)

GYM1,2 (in %)

39,6

 

39,3

 

36,0

 

38,3

 

FEM (in %)

 

50,1

49,7

49,6

49,8

MHG1,2,3 (in %)

 

34,5

 

20,0

 

27,6

 

29,0

 

Korr(HABL,HSES)

 

0,05

 

0,05

 

–0,08

 

0,01

 

N Schüler*innen

12929

9949

5156

28034

N Klassen

 

654

497

255

1406

Anmerkungen: 1 signifikanter Unterschied zwischen liberal und strikt, 2 signifikanter Unterschied zwischen moderat und strikt, 3 signifikanter Unterschied zwischen liberal und moderat (p < 0,05). SES = soziale Herkunft, ABL = kognitive Fähigkeiten, NSES = Niveau SES, HSES = Homogenität SES, NABL = Niveau ABL, HABL = Homogenität ABL, GYM = Gymnasium, FEM = Mädchen, MHG = Migrationshintergrund, Korr = Korrelation, N = Fallzahl.

Tab. 2:

Wertebereich, Mittelwerte und Streuungen der verwendeten Konstrukte sowie Korrelation zwischen kognitiver und sozialer Homogenität für die Daten des IQB-Bildungstrends 2018

 

Konstrukte

Wertebereich

liberal

moderat

strikt

Gesamtstichprobe

MW

(SD)

MW

(SD)

MW

(SD)

MW

(SD)

Mathematikkomp.1,2

[–3,7;3,9]

0,07

(0,99)

0,11

(0,94)

0,47

(0,96)

0,16

(0,98)

SES1,2

[0;1]

0,52

(0,27)

0,51

(0,26)

0,55

(0,26)

0,52

(0,26)

ABL1,2

[0;1]

0,59

(0,12)

0,59

(0,12)

0,61

(0,12)

0,59

(0,12)

NSES1,2

[0;1]

0,51

(0,20)

0,50

(0,19)

0,54

(0,20)

0,51

(0,20)

HSES

[0;1]

0,50

(0,11)

0,50

(0,10)

0,51

(0,10)

0,50

(0,10)

NABL1,2

[0;1]

0,47

(0,13)

0,48

(0,13)

0,53

(0,14)

0,48

(0,13)

HABL

[0;1]

0,60

(0,13)

0,60

(0,13)

0,61

(0,13)

0,60

(0,13)

GYM1,3 (in %)

41,7

 

38,4

 

37,0

 

39,6

 

FEM3 (in %)

 

51,5

47,9

51,7

50,2

MHG1,2,3 (in %)

 

37,0

 

32,5

 

25,1

 

33,0

 

Korr(HABL,HSES)

 

–0,01

 

–0,07

 

0,07

 

–0,01

 

N Schüler*innen

9656

8362

2754

20772

N Klassen

 

904

785

264

1953

Anmerkungen: 1 signifikanter Unterschied zwischen liberal und strikt, 2 signifikanter Unterschied zwischen moderat und strikt, 3 signifikanter Unterschied zwischen liberal und moderat (p < 0,05). SES = soziale Herkunft, ABL = kognitive Fähigkeiten, NSES = Niveau SES, HSES = Homogenität SES, NABL = Niveau ABL, HABL = Homogenität ABL, GYM = Gymnasium, FEM = Mädchen, MHG = Migrationshintergrund, Korr = Korrelation, N = Fallzahl.

Die deskriptiven Analysen lassen auf die wichtigen Grundannahmen zur Bildungsbeteiligung und Komposition von Schulklassen in mehr oder weniger strikt leistungsdifferenzierenden Schulsystemen schließen. Diese Grundannahmen bestätigen sich nur teilweise. Die kognitive Homogenität (HABL) fällt in der Stichprobe aus dem Jahr 2015 in den strikt leistungsdifferenzierenden Schulsystemen signifikant höher aus als in den liberalen Systemen; allerdings ist der Unterschied klein (d = 0,027; p = 0,008). Für das Jahr 2018 zeigt sich kein entsprechender Systemunterschied. Eine der zentralen Grundannahmen des MoAbiT bestätigt sich damit nur teilweise. Weiterhin unterscheidet sich die soziale Segregation (HSES) nicht systematisch zwischen den Systemen. Schließlich ist die Korrelation zwischen der kognitiven und der sozialen Homogenität von Schulklassen insgesamt klein und statistisch insignifikant; entgegen den Annahmen des MoAbiT besteht diesbezüglich kein systematischer Unterschied zwischen den Systemen.

4.2 Systemübergreifende Befunde: Effizienz durch kognitive Homogenisierung?

Nachdem zumindest für das Jahr 2015 bestätigt werden konnte, dass die Schulklassen in den strikt leistungsdifferenzierenden Schulsystemen kognitiv homogener waren als in den liberalen Systemen, stellt sich die Frage, ob dieser Unterschied tatsächlich mit Systemunterschieden in den Schülerkompetenzen assoziiert ist. Dies entspräche der Annahme des MoAbiT, dass kognitive Homogenität einen effizienteren Unterricht und größere Lernzuwächse ermöglicht als kognitive Heterogenität. Dieser Frage wird zunächst in systemübergreifenden Analysen nachgegangen. Die in Tab. 3 abgetragenen Ergebnisse zeigen, dass das mittlere kognitive Niveau einer Klasse (NABL) deutlich mit höheren individuellen Kompetenzen in Englisch-Leseverstehen und Mathematik einhergeht. Zwischen der kognitiven Homogenität (HABL) und den Kompetenzen der Jugendlichen finden sich dagegen im Allgemeinen keine Zusammenhänge (vgl. Modelle 1 und 3). Eine mögliche Ursache für diesen Befund könnte sein, dass negative Peer-Effekte den positiven Effekten der Anpassung von Unterricht und Curricula entgegenstehen.

Tab. 3

: Systemübergreifende Effekte – Haupteffekt von kognitiver Homogenität und Interaktion mit individuellen kognitiven Fähigkeiten

AV = Englisch-Leseverstehen

 

AV = Mathematikkompetenz

(1)

(2)

(3)

(4)

Kognitive Komposition

 

 

 

 

 

 

 

NABL

2,60

2,12

1,99

1,99

(0,13)

(0,14)

(0,14)

(0,14)

HABL

–0,10

0,05

–0,09

–0,74

(0,11)

(0,30)

(0,07)

(0,30)

ABL*HABL

–0,03

1,15

(0,48)

(0,50)

Soziale Komposition

 

 

NSES

1,16

0,98

0,48

0,90

(0,11)

(0,28)

(0,08)

(0,29)

HSES

–0,04

0,22

0,01

0,36

(0,12)

(0,31)

(0,09)

(0,25)

NSES*HSES

–0,58

–0,71

 

(0,53)

 

(0,45)

Kontrollvariablen

 

 

ABL

1,71

1,72

3,30

2,68

(0,06)

(0,25)

(0,06)

(0,28)

SES

0,13

0,13

0,24

0,24

(0,03)

(0,03)

(0,03)

(0,03)

GYM

Geschlecht

MHG

N Klassen

1406

1953

N Schüler*innen

28034

20772

Anmerkungen: SES = soziale Herkunft, NSES = Niveau SES, HSES = Homogenität SES, ABL = kognitive Fähigkeiten, NABL = Niveau ABL, HABL = Homogenität ABL, GYM = Gymnasium, MHG = Migrationshintergrund, N = Fallzahl; signifikante Koeffizienten (< 0,05) fett hervorgehoben; Standardfehler in Klammern.

Das Modell 4 deutet weiterhin an, dass kognitive Homogenität für den mathematischen Kompetenzerwerb von Schüler*innen mit geringen kognitiven Fähigkeiten sogar ein Nachteil sein kann. Abb. 2 visualisiert die Interaktionseffekte zwischen der kognitiven Homogenität und den individuellen kognitiven Fähigkeiten. Aus Abb. 2b wird ersichtlich, dass für diejenigen Schüler*innen mit den geringsten Fähigkeiten (ABL = 0) durch den Besuch einer maximal homogenen Klasse (HABL = 1) im Schnitt ein Leistungsnachteil von 0,74 Standardabweichungen im Vergleich zum Besuch einer maximal heterogenen Klasse (HABL = 0) zu erwarten ist. Der signifikante Interaktionseffekt (ABL*HABL) impliziert, dass dieser Nachteil durch kognitive Homogenität mit zunehmenden individuellen kognitiven Fähigkeiten abnimmt. Bei mittleren individuellen Fähigkeiten (ABL = 0,5) hat die kognitive Homogenität der Schulklasse keinen nennenswerten Effekt auf die Mathematikleistung. Erst für Schüler*innen mit hohen Fähigkeiten bringt der Besuch einer kognitiv homogenen Klasse den Ergebnissen zufolge nennenswerte Vorteile. Für die fähigsten Schüler*innen (ABL = 1) ist bei maximaler Homogenität (HABL = 1) ein Leistungsvorteil von 1,15–0,74 = 0,41 Standardabweichungen im Vergleich zum Besuch einer maximal heterogenen Klasse (HABL = 0) zu erwarten. Ob die differenzielle Wirkung von kognitiver Homogenität tatsächlich auf Matthäus-Effekte zurückgeht, lässt sich zwar nicht direkt prüfen; das Ergebnis steht jedoch im Kontrast zur Idee eines meritokratischen Sekundarschulsystems einerseits und zur Annahme von allgemein positiven Effekten kognitiver Homogenität andererseits. Die Analyse der Effekte auf Kompetenzen im Bereich Englisch-Leseverstehen (Modell 2) ergab kein entsprechendes Befundmuster (siehe Abb. 2a).

 Abb. 2: Durchschnittliche Effekte von kognitiver Homogenität (HABL) auf Englisch-Leseverstehen und Mathematikkompetenzen für Schüler*innen mit minimalen (ABL = 0), mittleren (ABL = 0,5) und maximalen (ABL = 1) kognitiven Fähigkeiten. Die Ergebnisse stammen aus den Modellen 2 (Abb. 2a) und 4 (Abb. 2b) in Tabelle 3.

Abb. 2: Durchschnittliche Effekte von kognitiver Homogenität (HABL) auf Englisch-Leseverstehen und Mathematikkompetenzen für Schüler*innen mit minimalen (ABL = 0), mittleren (ABL = 0,5) und maximalen (ABL = 1) kognitiven Fähigkeiten. Die Ergebnisse stammen aus den Modellen 2 (Abb. 2a) und 4 (Abb. 2b) in Tabelle 3.

4.3 Mediation von Systemeffekten durch kognitive Homogenisierung?

Für die Kompetenzen in Englisch (IQB-Bildungstrend 2015) und in Mathematik (IQB-Bildungstrend 2018) finden sich unter Kontrolle der kognitiven Fähigkeiten, der sozialen Herkunft, des Geschlechts und des Migrationshintergrunds signifikante Systemeffekte (s. Tab. 4, Modell 2 für Englisch-Leseverstehen und Tab. 5, Modell 2 für Mathematikkompetenzen). In beiden Fällen zeigt sich ein signifikanter Leistungsvorteil der Schüler*innen in strikt leistungsdifferenzierenden Schulsystemen gegenüber denen in liberalen Systemen.

Diese Systemeffekte lassen sich durch die kognitive Komposition der Schulklassen erklären, allerdings nicht – wie im MoAbiT postuliert – durch systematische Unterschiede im Ausmaß der kognitiven Homogenität zwischen den Systemen, sondern anhand der mittleren kognitiven Fähigkeitsniveaus. Der Systemeffekt auf das Englisch-Leseverstehen verschwindet bei Kontrolle des mittleren kognitiven Fähigkeitsniveaus (s. Modell 4 in Tab. 4). Der positive Effekt strikter Leistungsdifferenzierung auf die Mathematikkompetenz bleibt signifikant, nimmt aber deutlich ab (s. Modell 4 in Tab. 5). Sowohl die Kontrolle der kognitiven Homogenität (jeweils Modelle 3, 6 und 10) als auch der Interaktion zwischen dem kognitiven Niveau und der kognitiven Homogenität (jeweils Modell 6) beeinflussen den Systemeffekt dagegen nicht.

Die Modelle 7 und 8 in den Tab. 4 und 5 zeigen weiterhin, dass sich die Systemeffekte unter Kontrolle der sozialen Komposition von Schulklassen kaum verändern. Unter Kontrolle aller Kompositionsmerkmale, also sowohl der kognitiven als auch der sozialen Komposition (jeweils Modelle 9 und 10), bleibt ein Leistungsvorteil von 0,22 Standardabweichungen in strikt differenzierenden gegenüber liberalen Systemen im Fach Mathematik. Dieser Befund steht im Einklang mit den Ergebnissen von Esser und Seuring (2020; S. 292, Tab. 4, Modell 6) – da sich der Effekt aber in derselben Stärke bereits bei alleiniger Kontrolle des mittleren Fähigkeitsniveaus nachweisen ließ, wird deutlich, dass der Systemvorteil nicht durch andere Kompositionsmerkmale mediiert wird.

Die Replikation einer Mediation von Systemeffekten durch positive Effekte von kognitiver Homogenisierung gelingt somit nicht. Vielmehr scheint der Systemeffekt über die im Mittel höheren kognitiven Fähigkeiten auf der Klassenebene in den strikt differenzierenden Schulsystemen vermittelt.

Tab. 4:

Regressionsmodelle zur Prüfung der Mediationshypothese des MoAbiT – Auswirkungen der Stringenz von Leistungsdifferenzierung und kognitiver Homogenität auf das Leseverstehen im Fach Englisch

Grundmodell

 

Kognitive Komposition

 

Soziale Komposition

 

Beide

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)

(9)

(10)

Differenzierung

 

 

 

 

 

 

 

 

 

 

 

 

 

moderat

–0,04

–0,05

–0,06

–0,08

–0,08

–0,08

–0,07

–0,07

–0,08

–0,09

(0,07)

(0,04)

(0,04)

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

strikt

0,08

0,10

0,09

–0,02

–0,02

–0,02

0,08

0,07

–0,01

–0,02

 

(0,07)

(0,04)

 

(0,04)

(0,03)

(0,03)

(0,03)

 

(0,04)

(0,04)

 

(0,03)

(0,03)

Kognitive Komposition

 

 

 

 

 

 

 

 

 

 

 

 

NABL

2,47

2,47

2,00

2,11

1,65

(0,13)

(0,13)

(0,29)

(0,14)

(0,30)

HABL

0,34

0,01

–0,47

0,02

–0,43

(0,13)

(0,11)

(0,32)

(0,10)

(0,33)

NABL*HABL

0,94

0,91

 

 

 

 

 

 

 

(0,55)

 

 

 

 

 

(0,56)

Soziale Komposition

 

 

 

 

 

 

 

 

 

 

 

NSES

1,42

1,79

0,70

1,02

(0,12)

(0,33)

(0,11)

(0,29)

HSES

–0,01

0,34

–0,04

0,25

(0,13)

(0,37)

(0,11)

(0,31)

NSES*HSES

–0,76

–0,64

 

 

 

 

 

 

 

 

 

 

(0,62)

 

 

(0,54)

Kontrollvariablen

ABL

1,83

1,87

1,70

1,70

1,70

1,82

1,82

1,71

1,71

(0,06)

(0,07)

(0,06)

(0,06)

(0,06)

(0,06)

(0,06)

(0,06)

(0,06)

SES

0,16

0,20

0,15

0,15

0,15

0,12

0,12

0,13

0,13

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

GYM

1,01

1,01

0,49

0,49

0,48

0,62

0,61

0,37

0,36

(0,03)

(0,03)

(0,04)

(0,04)

(0,04)

(0,04)

(0,04)

(0,04)

(0,04)

Geschlecht

MHG

N Klassen

1406

N Schüler*innen

28034

Anmerkungen: SES = soziale Herkunft, NSES = Niveau SES, HSES = Homogenität SES, ABL = kognitive Fähigkeiten, NABL = Niveau ABL, HABL = Homogenität ABL, GYM = Gymnasium, MHG = Migrationshintergrund, N = Fallzahl; signifikante Koeffizienten (< 0,05) fett hervorgehoben; Standardfehler in Klammern.

4.4 Soziale Ungleichheit im Kompetenzerwerb

Tab. 6 bildet schließlich die Effekte der Klassenkomposition und der individuellen kognitiven Fähigkeiten sowie der sozialen Herkunft getrennt für die verschiedenen Systeme ab. Die Effekte der sozialen Herkunft (SES) auf das Englisch-Leseverstehen fallen in den strikt und moderat leistungsdifferenzierenden Schulsystemen etwas stärker aus bei liberaler Differenzierung. In Mathematik ist das Bild umgekehrt: Hier sind die Effekte der sozialen Herkunft bei strikter Differenzierung am geringsten. Dies würde der These einer reduzierten sozialen Ungleichheit durch strikte Leistungsdifferenzierung aus dem MoAbiT entsprechen.

4.5 Weiterführende Ergebnisse

Die Ergebnisse einer in Anlehnung an Esser und Seuring (2020) bzw. Heisig und Matthewes (2022) aufgebauten Analyse einer differenziellen Wirkung der kognitiven und sozialen Klassenzusammensetzung zwischen den Systemen ist im Online-Anhang (Tab. A1) abgetragen. Entscheidend sind hier die Interaktionseffekte zwischen der Stringenz von Leistungsdifferenzierung und den verschiedenen Merkmalen der Klassenzusammensetzung (NABL, HABL, NSES und HSES). Hier finden sich keine systematischen Unterschiede in den Effekten des kognitiven Niveaus und der kognitiven Homogenität bei Berücksichtigung aller Kompositionsmerkmale und Kontrollvariablen. Allein im Modell 5 zeigt sich für die strikten Systeme ein signifikant stärkerer positiver Effekt kognitiver Homogenität gegenüber der Referenz (den liberaleren Systemen) und ein signifikant schwächerer Effekt des kognitiven Niveaus in moderaten Systemen auf die Mathematikkompetenzen. Jedoch verschwinden diese Effekte unter Kontrolle möglicher Systemunterschiede in der sozialen Komposition der Schulklassen (Modell 6). Der Effekt der kognitiven Klassenkomposition variiert also nicht zwischen den Systemen. Zudem leistet die kognitive Homogenität auch in den nach System getrennten Modellen (s. Tab. 6) keinen signifikanten Beitrag zur Erklärung von Schülerleistungen. Hier zeigt nur das durchschnittliche kognitive Niveau bedeutsame Effekte (außer in den strikten Systemen für Englisch-Leseverstehen).

Tab. 5:

Regressionsmodelle zum Prüfen der Mediationshypothese des MoAbiT – Auswirkungen der Stringenz von Leistungsdifferenzierung und kognitiver Homogenität auf die Mathematikkompetenz

Grundmodell

 

Kognitive Komposition

 

Soziale Komposition

 

Beide

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)

(9)

(10)

Differenzierung

 

 

 

 

 

 

 

 

 

 

 

 

 

moderat

0,04

0,04

0,03

0,01

0,01

0,01

0,04

0,04

0,01

0,01

(0,05)

(0,02)

(0,02)

(0,02)

(0,02)

(0,02)

(0,02)

(0,02)

(0,02)

(0,02)

strikt

0,35

0,33

0,33

0,22

0,22

0,22

0,30

0,29

0,22

0,22

 

(0,08)

(0,03)

 

(0,03)

(0,02)

(0,03)

(0,03)

 

(0,03)

(0,03)

 

(0,02)

(0,02)

Kognitive Komposition

 

 

 

 

 

 

 

 

 

 

 

 

NABL

2,03

2,05

2,05

1,77

1,84

(0,12)

(0,12)

(0,26)

(0,13)

(0,26)

HABL

0,17

–0,09

–0,09

–0,09

–0,02

(0,09)

(0,07)

(0,22)

(0,07)

(0,22)

NABL*HABL

0,00

–0,15

 

 

 

 

 

 

 

(0,44)

 

 

 

 

 

(0,45)

Soziale Komposition

 

 

 

 

 

 

 

 

 

 

 

 

NSES

0,96

1,24

0,45

0,66

(0,08)

(0,32)

(0,08)

(0,29)

HSES

–0,04

0,19

–0,02

0,16

(0,12)

(0,32)

(0,09)

(0,26)

NSES*HSES

–0,45

–0,34

 

 

 

 

 

 

 

 

 

 

(0,53)

 

 

(0,45)

Kontrollvariablen

ABL

3,51

3,51

3,30

3,30

3,30

3,48

3,48

3,31

3,31

(0,06)

(0,06)

(0,06)

(0,06)

(0,06)

(0,06)

(0,06)

(0,06)

(0,06)

SES

0,30

0,30

0,28

0,28

0,28

0,23

0,23

0,24

0,24

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

GYM

0,88

0,88

0,49

0,49

0,49

0,61

0,60

0,42

0,42

(0,02)

(0,02)

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

(0,03)

Geschlecht

MHG

N Klassen

1953

N Schüler*innen

20772

Anmerkungen: SES = soziale Herkunft, NSES = Niveau SES, HSES = Homogenität SES, ABL = kognitive Fähigkeiten, NABL = Niveau ABL, HABL = Homogenität ABL, GYM = Gymnasium, MHG = Migrationshintergrund, N = Fallzahl; signifikante Koeffizienten (p < 0,05) fett hervorgehoben; Standardfehler in Klammern.

5 Zusammenfassung und Diskussion

Das „Model of Ability Tracking“ von Hartmut Esser (2022; 2016) trifft theoretische Annahmen über Zusammenhänge zwischen der Stringenz von Leistungsdifferenzierung (ability tracking) in Bildungssystemen und strukturellen Eigenschaften von Schulklassen sowie der späteren Kompetenzentwicklung, die weitreichende bildungspolitische Implikationen haben. Die Studie von Esser und Seuring (2020) untermauert diese Annahmen auf der Basis umfangreicher empirischer Analysen. Den Ergebnissen zufolge könnte die – teilweise bereits erfolgte – Abkehr von strikter Leistungsdifferenzierung an weiterführenden Schulen in Deutschland ihren eigentlichen Zielen, nämlich einer erhöhten Effizienz von Lernprozessen und einer Abfederung von sozialer Ungleichheit, entgegenstehen.

Tab. 6:

Systemvergleich von Effekten der Klassenkomposition und Individualmerkmalen

 

AV = Englisch-Leseverstehen

 

AV = Mathematikkompetenz

Differenzierung

liberal

moderat

strikt

liberal

moderat

strikt

Kognitive Komposition

 

 

 

 

NABL

1,71

1,99

1,06

1,95

1,38

2,61

(0,42)

(0,57)

(0,71)

(0,38)

(0,44)

(0,49)

HABL

–0,58

–0,16

–0,74

0,07

–0,35

0,63

(0,51)

(0,59)

(0,82)

(0,30)

(0,40)

(0,45)

NABL*HABL

0,89

0,35

1,77

–0,47

0,43

–0,92

(0,90)

(1,04)

(1,24)

(0,62)

(0,78)

(0,91)

Soziale Komposition

 

 

 

 

NSES

1,12

1,10

1,12

0,62

0,81

0,34

(0,46)

(0,50)

(0,45)

(0,35)

(0,47)

(0,72)

HSES

0,65

0,73

–0,32

0,07

0,18

0,08

(0,47)

(0,55)

(0,40)

(0,29)

(0,42)

(0,65)

NSES*HSES

–1,27

–1,11

0,02

–0,26

–0,58

0,30

(0,82)

(0,97)

(0,72)

(0,52)

(0,73)

(1,15)

Kontrollvariablen

 

 

 

 

ABL

1,83

1,63

1,57

3,39

3,41

3,13

(0,10)

(0,10)

(0,11)

(0,09)

(0,11)

(0,14)

SES

0,09

0,19

0,13

0,30

0,24

0,11

(0,05)

(0,05)

(0,05)

(0,04)

(0,05)

(0,06)

GYM

Geschlecht

MHG

N Klassen

654

497

255

 

904

785

264

N Schüler*innen

12929

9949

5156

 

9656

8362

2754

Anmerkungen: SES = soziale Herkunft, NSES = Niveau SES, HSES = Homogenität SES, ABL = kognitive Fähigkeiten, NABL = Niveau ABL, HABL = Homogenität ABL, GYM = Gymnasium, MHG = Migrationshintergrund, N = Fallzahl; signifikante Koeffizienten (< 0,05) fett hervorgehoben; Standardfehler in Klammern.

Die vorliegende Studie setzte sich kritisch mit dem MoAbiT auseinander. Außerdem wurden die Ergebnisse der empirischen Studie von Esser und Seuring (2020) auf ihre Belastbarkeit überprüft. Deskriptive Analysen der Daten zweier IQB-Bildungstrendstudien aus den Jahren 2015 und 2018 gaben zunächst Aufschluss über die Gültigkeit zentraler Grundannahmen des MoAbiT. Die Ergebnisse zeigten, dass sich die kognitive Homogenität der Schulklassen nur teilweise bedeutsam zwischen strikt leistungsdifferenzierenden und liberalen Schulsystemen unterschied. Für das Jahr 2015 war ein kleiner signifikanter Unterschied festzustellen, im Jahr 2018 variierte die kognitive Homogenität aber nicht systematisch zwischen den Systemen. Insgesamt ist die deskriptive Befundlage also nicht eindeutig genug, um die Grundannahme zu stützen, dass Klassen in strikt leistungsdifferenzierenden Schulsystemen kognitiv homogener zusammengesetzt sind als in liberaleren Schulsystemen.

Widerlegt wurde zudem, dass sich die soziale Segregation systematisch zwischen mehr oder weniger differenzierenden Systemen unterscheidet. Die Annahme einer sozial segregierenden Bildungsbeteiligung, welche die Folge von strikter Leistungsdifferenzierung sein und soziale Ungleichheit potenziell verstärken könnte (von Esser auch als „Standardposition“ bezeichnet), ist daher im Rahmen der vorliegenden Arbeit zurückzuweisen. Dies entspricht den Ergebnissen vorheriger Studien (z. B. Lenz et al. 2019). Allerdings widerspricht dieser Befund auch der Annahme des MoAbiT, dass strikte Leistungsdifferenzierung mit einer sozialen De-Segregation einhergehen kann (vgl. Abschnitt 2.1).

Nachweisbar war zudem ein genereller Leistungsvorteil für Schüler*innen in strikt leistungsdifferenzierenden Schulsystemen – sowohl im Bereich Englisch-Leseverstehen als auch im Fach Mathematik. Hinweise darauf, dass strikte Leistungsdifferenzierung die Ursache für die Leistungsvorteile in den betreffenden Systemen ist (z. B. weil sie einen effizienteren Unterricht ermöglicht), finden sich jedoch nicht. Weder zeigt sich, dass kognitive Homogenität positiv mit Lernerfolgen zusammenhängt, noch finden sich Belege für eine Mediation von Leistungsvorteilen in strikt differenzierenden Systemen durch die kognitive Homogenität in Schulklassen. Eine Erklärung der Leistungsunterschiede zwischen den Systemen schien vielmehr das mittlere kognitive Fähigkeitsniveau in den Schulklassen zu sein, das sich in bisherigen Forschungsarbeiten wiederholt als bedeutsamer Prädiktor für individuelle Schülerleistung erwies (vgl. Abschnitt 2.3).

Weiterführende Analysen der IQB-Bildungstrenddaten wiesen darauf hin, dass eine Homogenisierung gerade bei geringen individuellen kognitiven Fähigkeiten negative Konsequenzen für die Mathematikkompetenz haben kann, während Schüler*innen mit höheren kognitiven Fähigkeiten von einer homogenen Klassenzusammensetzung profitieren können. Dieses Ergebnis deutet an, dass Peer-Effekte den positiven Effekten von customized instructions in homogenen Schulkontexten, wie in Abschnitt 2.2 erläutert, tatsächlich entgegenstehen könnten. Als mögliche zugrundeliegende Mechanismen sind an dieser Stelle insbesondere ein Mangel an Unterstützung und Hilfestellungen sowie positiven Rollenvorbildern für leistungsschwächere Schüler*innen in homogenen Klassen mit einem geringeren kognitiven Niveau zu nennen. Aber auch andere Mechanismen wie ein Mangel an effektiven kognitiven Referenzpunkten oder einer inspirierenden Arbeitsumgebung könnten dafür verantwortlich sein, dass die kognitive Homogenität gerade in leistungsschwächeren Klassen nicht vorteilhaft ist. Für den Kompetenzerwerb im Bereich Englisch-Leseverstehen wurden allerdings keine entsprechenden Interaktionen zwischen den individuellen kognitiven Fähigkeiten und der kognitiven Homogenität ersichtlich.

In Bezug auf die Auswirkungen der Stringenz von Leistungsdifferenzierung auf soziale Ungleichheit im Kompetenzerwerb zeichnet die vorliegende Arbeit ein gemischtes Bild. Ein signifikanter Effekt der sozialen Herkunft auf die Mathematikkompetenz war bei strikter Leistungsdifferenzierung wie vom MoAbiT postuliert nicht nachweisbar. Vielmehr waren soziale Disparitäten in den Mathematikleistungen nur in den liberalen und moderaten Systemen erkennbar. Den Befund als geringere soziale Bildungsungleichheit in strikt leistungsdifferenzierenden Schulsystemen zu deuten, bedarf aber weiterführender Analysen, denn das Ergebnis fiel im Falle des Englisch-Leseverstehens umgekehrt aus: Hier waren es die liberalen Schulsysteme, in denen kein signifikanter Effekt der sozialen Herkunft nachweisbar war. Insgesamt kann also weder auf die sog. „Standardposition“ (Verstärkung sozialer Herkunftseffekte durch strikte Differenzierung), noch auf das im MoAbiT erwartete Gegenteil (Verringerung der Effekte bzw. zumindest keine Verstärkung) geschlossen werden.

5.1 Mögliche Alternativerklärungen für Systemunterschiede

Mit den Daten der IQB-Bildungstrendstudien ließ sich für dieselbe Kohorte, für die Esser und Seuring (2020) einen positiven Effekt strikter Differenzierung auf Deutsch- und Mathematikleistungen beobachten konnten, ein kleiner Systemeffekt auf das Englisch-Leseverstehen replizieren. Der Unterricht in strikt differenzierenden Schulsystemen geht im Schnitt mit einen Leistungsvorteil von 10 % einer Standardabweichung gegenüber liberalen Systemen einher. Für die Schülerkohorte, die drei Jahre später die 9. Jahrgangsstufe besuchte, ließ sich zudem ein Systemunterschied in den Mathematikkompetenzen von 33 % einer Standardabweichung belegen. In den deskriptiven Analysen der IQB-Bildungstrendstudien äußerte sich dieser Befund durch das gute Abschneiden der Schüler*innen in Bayern und Sachsen (sowie Baden-Württemberg im Jahr 2015) im Ländervergleich. In den Analysen der vorliegenden Arbeit wurde deutlich, dass die Schüler*innen in diesen am striktesten nach Leistung differenzierenden Bundesländern allerdings sowohl in homogen als auch in heterogen zusammengesetzten Klassen höhere Leistungen erzielten. Kognitive Homogenität innerhalb von Schulklassen scheint also nicht ursächlich hinter dem sog. Systemeffekt zu stehen. Die Systemunterschiede ließen sich vielmehr auf Unterschiede im mittleren Fähigkeitsniveau der Schulklassen zurückführen.

An dieser Stelle sei auf ein methodisches Problem verwiesen, dem jeder Systemvergleich mit dem Ziel der Identifikation eines Institutions- oder Systemeffekts ausgesetzt ist. Heterogenität zwischen Systemen besteht meistens nicht nur in den interessierenden institutionellen Regelungen, sondern auch in vielen anderen Merkmalen. Im Anwendungsfall könnten nicht nur die Leistungsdifferenzierung systematisch zwischen den Schulsystemen variieren, sondern auch andere Merkmale, wie die Schulausstattung oder die Ausbildung des Lehrpersonals. Auch könnten strukturelle Eigenschaften der Bevölkerung in den verschiedenen Bundesländern, wie die Sozialstruktur oder der ökonomische Wohlstand, Systemunterschiede begründen, weil sie mit Bildungserfolg zusammenhängen. Da solche confounder meistens nicht umfassend kontrolliert werden können, sind entsprechende Vergleichsstudien immer der Gefahr eines omitted variable bias ausgesetzt (vgl. Hanushek & Wößmann 2006; Manski 1993; Wößmann 2016).

Die drei betrachteten Bundesländergruppen mit strikt, moderat und liberal differenzierenden Schulsystemen unterscheiden sich deutlich in ihrer Sozialstruktur und ihrem Bruttoinlandsprodukt (Statistische Ämter des Bundes und der Länder 2023). Derartige Systemunterschiede, die nicht kausal mit Leistungsdifferenzierung zusammenhängen, könnten die Leistungen von Schüler*innen bereits vor dem Übergang in die Sekundarstufe beeinflusst und zu entsprechenden Systemunterschieden in den schulischen Leistungen geführt haben. Somit könnten Systemunterschiede in den Schülerleistungen nicht (nur) auf die im MoAbiT beschriebenen Mechanismen, sondern (auch) auf unbeobachtete Unterschiede zwischen den Bundesländern zurückgehen.

Diesbezüglich lohnt sich ein Blick auf den IQB-Ländervergleich im Jahr 2011. Zum Zeitpunkt dieser Erhebung besuchten die im Rahmen des IQB-Bildungstrends 2018 getesteten Schüler*innen die 2. Jahrgangsstufe. Nimmt man ihre Mitschüler*innen aus der 4. Jahrgangsstufe und vergleicht deren Mathematikkompetenzen zwischen den Bundesländergruppen, so ergibt sich folgendes Bild: In Bayern und Sachsen (sowie Baden-Württemberg), also den Bundesländern mit strikter Leistungsdifferenzierung in der Sekundarstufe, hatten die Grundschüler*innen bereits in der 4. Jahrgangsstufe im Schnitt die höchsten Mathematikkompetenzen (vgl. Stanat et al. 2012: 119). Dagegen lagen die mittleren Kompetenzen von Grundschüler*innen in den Bundesländern mit liberalen Sekundarschulsystemen allesamt unter dem bundesdeutschen Durchschnitt. Der Frage, ob der Systemunterschied in der Primarstufe die Folge einer höheren Kontrolle schulischer Abläufe und der dadurch vergleichsweise geringeren tertiären Herkunftseffekte ist (z. B. durch verzerrte Lehrkrafterwartungen; vgl. Lorenz 2018; Lorenz et al. 2016), sollten sich weiterführende empirische Studien widmen. Auf verbindliche Übergangsempfehlungen und vor allem eine kognitive Homogenisierung der Schülerschaft kann er aber kaum zurückgehen, da sich beides vor allem während des Sekundarschulbesuchs auswirken sollte.[8] Insgesamt liegt die Schlussfolgerung nahe, dass ein Teil der von Esser und Seuring (2020) berichteten Systemeffekte nicht hauptsächlich durch die vermuteten Mechanismen, sondern durch andere, nicht beobachtete Unterschiede zwischen den Bundesländergruppen getrieben wurden. Diese Vermutung wird auch durch den deskriptiven Befund gestützt, dass das soziale Niveau der Klassen in Bundesländern mit strikter Leistungsdifferenzierung im Jahr 2018 signifikant höher ausfiel als in den Bundesländern mit moderater und liberaler Differenzierung (vgl. Tab. 2; NSES).

5.2 Operationalisierung von Leistungsdifferenzierung: Kontrolle und Verbindlichkeit vs. Anzahl der Schularten

Neben diesem allgemeinen Problem der Analyse von Systemeffekten auf Basis von Bundesländergruppen ist auch die Zuordnung der Bundesländer kritisch zu betrachten (vgl. auch Lohmann 2021). In der vorliegenden Studie (sowie im MoAbiT) wurde die Stringenz der Differenzierung entlang der Merkmale „Kontrolle“ und „Verbindlichkeit“ bestimmt. Außer Acht gelassen wurden weitere Merkmale, über die Leistungsdifferenzierung operationalisiert werden kann und die sich auch innerhalb der betrachteten Gruppen teils deutlich zwischen den Bundesländern unterscheiden.

Besonders offensichtlich ist dies für die Anzahl verschiedener Schularten in der Sekundarstufe, die z. B. von Lenz et al. (2019) als Merkmal der Differenzierung berücksichtigt wurde. Dieser Unterscheidung liegt die Annahme zugrunde, dass eine höhere Anzahl an Schularten mit größeren curricularen Unterschieden sowie Unterschieden im Anspruchsniveau und den Abschlusszielen zwischen den Schularten einhergeht und daher eine leistungsbezogene Differenzierung zur Folge haben sollte – auch ohne Kontrolle schulischer Abläufe und verbindliche Übergangsempfehlungen. So gibt es in Hessen, Niedersachsen und Nordrhein-Westfalen wie in Baden-Württemberg und Bayern Hauptschulen, Realschulen und Gymnasien zwischen denen bedeutsame leistungsbezogene Unterschiede bestehen sollten – lediglich die höheren Anteile an Gesamtschulen mit leistungsheterogenen Klassen als Alternative zu den traditionellen Schularten in den drei erstgenannten Bundesländern sprechen für eine geringere Differenzierung. Dagegen gibt es in Sachsen neben Gymnasien mit der Oberschule nur eine weitere Schulart, die sowohl auf den Hauptschulabschluss als auch auf den Mittleren Schulabschluss vorbereitet. Das sog. within-school ability tracking, d. h. die abschlussbezogene Differenzierung innerhalb der Oberschulen, beginnt aber erst in der 7. Jahrgangsstufe. Es ist also fraglich, wie sinnvoll die Auffassung des sächsischen Systems als eines der strikt differenzierenden ist. Für die Studie von Esser und Seuring (2020) gilt dies besonders, da Leistungen in der 7. Jahrgangsstufe als abhängige Variable verwendet wurden, auf die sich Differenzierung bzw. kognitive Homogenisierung im nicht-gymnasialen Bereich erst seit Beginn des Schuljahres auswirken konnte (vgl. auch Matthewes 2021, der Sachsen zu einer Gruppe spät bzw. weniger strikt differenzierender Bundesländer zugeordnet hat).

5.3 Ausblick

Eine zentrale Annahme des MoAbiT lautet, dass die Homogenität der kognitiven Fähigkeiten in Schulklassen eine theoretisch bedeutsame Variable ist, die Kompetenzunterschiede zwischen Systemen mit unterschiedlich strikter Leistungsdifferenzierung (ability tracking) vermittelt. Die erwartete Wirkrichtung der untersuchten Variablen ließ sich in der vorliegenden Untersuchung allerdings nicht nachweisen. Eine Ursache könnte sein, dass konkurrierende Prozesse, die das MoAbiT nicht berücksichtigt, einem positiven Effekt von kognitiver Homogenität entgegenstehen. Dazu zählen u. a. Peer-Effekte, also die Folgen von Interaktionsprozessen zwischen den Schüler*innen. Peer-Effekte haben in homogeneren Kontexten eine geringere Bedeutung als in heterogeneren Kontexten, da letztere eine höhere Varianz in den Eigenschaften der Peers aufweisen und damit auch ein erhöhtes Potential für die Schüler*innen bieten, sich in die eine („nach unten“) oder andere Richtung („nach oben“) anzupassen (vgl. Buchmann & Dalton 2002; Dollmann & Rudolphi 2020; Lorenz et al. 2020).

Bislang nicht direkt untersucht wurde jedoch, ob Peer-Prozesse in kognitiv heterogenen Schulklassen in höheren oder niedrigeren mittleren Kompetenzen der Schülerschaft münden. Angenommen werden kann, dass leistungsschwächere Schüler*innen in heterogeneren Kontexten von positiven Peer-Effekten profitieren. Dieser Vorteil könnte von negativen Peer-Effekten für leistungsstärkere Schüler*innen aber wieder untergraben werden. Auf der Aggregatebene sollten Peer-Effekte dann in heterogeneren Kontexten zu ähnlichen Kompetenzen führen wie in homogenen Kontexten. Nicht geklärt ist außerdem, inwieweit Schüler*innen mit unterschiedlichen Lernständen in heterogenen Kontexten überhaupt miteinander interagieren und ob sich daraus positive Effekte für schulische Kompetenzen ergeben. Homophilie, also die Tendenz sich mit Personen zu umgeben, die ähnliche Eigenschaften aufweisen, könnte derartigen positiven Effekten entgegenstehen (vgl. Lorenz et al. 2021).

Weiterführende Studien sollten diesen Fragen nicht nur empirisch nachgehen, sondern auch die zugrunde liegenden theoretischen Argumente systematisieren. Idealerweise sollten zukünftige Studien verschiedene Aspekte der Stringenz von Leistungsdifferenzierung außerdem separat berücksichtigen (vgl. Domina et al. 2019), da einzelne institutionelle Rahmenbedingungen, wie die Übergangsregelungen von der Primar- in die Sekundarstufe und die Art der leistungsbezogenen Aufteilung von Schüler*innen (z. B. between-school ability tracking im Vergleich zu within-school ability tracking), unterschiedliche Auswirkungen haben können. Darüber hinaus können verschiedene institutionelle Rahmenbedingungen in einem komplexen interagierenden Wirkungszusammenhang stehen (Domina et al. 2019).

Um die mit Systemvergleichen einhergehenden methodischen Probleme zu umgehen (insbesondere die Gefahr unbeobachteter, konfundierter Systemunterschiede), eignen sich längsschnittliche und experimentelle oder quasi-experimentelle Analysedesigns (z. B. Kiss 2013). Über Trendanalysen lassen sich außerdem die Auswirkungen von Schulstrukturreformen als Systemveränderungen untersuchen. Diese können überraschende Ergebnisse hervorbringen, wie einen nicht-intendierten Effekt der Verstärkung sekundärer Effekte der ethnischen Herkunft durch die Reduktion leistungsbezogener Differenzierung (Lenz et al. 2021). Zukünftige Studien sollten außerdem Einstellungen und Erwartungen von Lehrkräften untersuchen und der Annahme nachgehen, dass leistungsverzerrende Einflüsse durch Lehrkräfte bei strikter Leistungsdifferenzierung geringer ausfallen als in liberalen Systemen. Die vorliegende Arbeit und ihre Erweiterung der theoretischen Argumente um die Folgen von Leistungsdifferenzierung sollten hierfür eine wichtige Grundlage liefern.


Bekanntmachung

Wir danken Petra Stanat für wertvolle Hinweise zu einer früheren Version des Manuskripts. Das diesem Beitrag zugrundeliegende Vorhaben wurde mit Mitteln des Bundesministeriums für Bildung und Forschung (BMBF) unter dem Förderkennzeichen 01JG2106A gefördert. Die Verantwortung für den Inhalt dieser Veröffentlichung liegt bei den Autorinnen und Autoren.


About the authors

Georg Lorenz

Georg Lorenz, geb. 1982 in Leipzig. Studium der Soziologie in Leipzig. Promotion (Dr.&#x00A0;rer. pol.) an der Otto-Friedrich-Universität Bamberg. Derzeit Leitung der Nachwuchsforschungsgruppe „Multidimensionale Heterogenität im Klassenzimmer: Messung, Effekte, Mechanismen (MuHiK)“ an der Universität Potsdam. Seit 2022 zusätzlich Leitung des DFG-Projekts „Social Embeddedness in Social Networks and the Reproduction of Socioeconomic Inequality in Educational Attainments (SERIOUS)“ an der Universität Leipzig.

Forschungsschwerpunkte: Ungleichheit, Bildung, soziale Netzwerke, sozialer Zusammenhalt, ethnische Minderheiten, Diskriminierung, Diversität.

Wichtigste Publikationen: Ethnic Diversity Fosters the Social Integration of Refugee Students (mit Z. Boda, M. Jansen, P. Stanat & A. Edele), in: Nature Human Behaviour 7, 2023: 881–889; The Link between Social and Structural Integration: Co- and Interethnic Friendship Selection and Friend Influence within Adolescent Social Networks (mit Z. Salikutluk, Z. Boda, M. Jansen & M. Hewstone), in: Sociological Science 8, 2021: 371–396; Stereotype bei Lehrkräften? Eine Untersuchung systematisch verzerrter Lehrererwartungen (mit S. Gentrup, C. Kristen, P. Stanat & I. Kogan), in: Kölner Zeitschrift für Soziologie und Sozialpsychologie 68, 2016: 89–111.

Sarah Lenz

Sarah Lenz, geb. 1990 in Berlin. Studium der Mathematik und Wirtschaftsmathematik in Berlin und Würzburg. Promotion (Dr.&#x00A0;phil.) an der Freien Universität Berlin. Von 2017–2021 wissenschaftliche Mitarbeiterin am Institut zur Qualitätsentwicklung im Bildungswesen (IQB) an der Humboldt-Universität zu Berlin.

Forschungsschwerpunkte: Schulische Segregation, Gliederung des Schulsystems, Bildungsungleichheit.

Wichtigste Publikationen: Schulische Segregation und ihre Veränderung im Zuge von Schulstrukturreformen in Berlin, Bremen und Hamburg (mit C. Rjosk & P. Stanat), in: Zeitschrift für Soziologie der Erziehung und Sozialisation 42, 2022: 54–72; Ethnische Segregation zwischen Schularten in mehrgliedrigen Schulsystemen und im „Zwei-Wege-Modell“ – Analysen im Kontext von schulstrukturellen Reformmaßnahmen in Berlin, Bremen und Hamburg (mit C. Rjosk, G. Lorenz & P. Stanat), in: Kölner Zeitschrift für Soziologie und Sozialpsychologie 73, 2021: 59–84; Soziokulturelle Segregation an weiterführenden Schulen – Analysen zur Rolle der Gliederung des deutschen Schulsystems und schulstruktureller Reformmaßnahmen (mit M. Holtmann, C. Rjosk & P. Stanat), in: Zeitschrift für Erziehungswissenschaft 22, 2019: 1333–1358.

Camilla Rjosk

Camilla Rjosk, geb. 1982 in Berlin. Studium der Psychologie sowie Promotion in Berlin. Von 2010–2021 wissenschaftliche Mitarbeiterin und von 2021–2023 Leitung der Nachwuchsforschungsgruppe „Multidimensionale Heterogenität im Klassenzimmer: Messung, Effekte, Mechanismen“ am Institut zur Qualitätsentwicklung im Bildungswesen (IQB) an der Humboldt-Universität zu Berlin. Seit 2023 Professur für Schulentwicklung an der Universität Potsdam.

Forschungsschwerpunkte: Heterogenität der Schüler:innenschaft, Kompositionseffekte, leistungsbezogene und psychosoziale Entwicklung von Schüler:innen, Diagnostische Fähigkeiten von Lehrkräften und Erwartungseffekte, Merkmale von Unterrichtsqualität.

Wichtigste Publikationen: Dispersion of Student Achievement and Classroom Composition, S. 1399–1431 in: T. Nilsen, A. Stancel-Piątak & J.-E. Gustafsson (Hrsg.), International Handbook of Comparative Large-Scale Studies in Education. Perspectives, Methods and Findings, Cham 2023; Ethnic Composition and Heterogeneity in the Classroom–Their Measurement and Relationship with Student Outcomes (mit D. Richter, O. Lüdtke & J.S. Eccles), in: Journal of Educational Psychology 109, 2017: 1188–1204; IQB-Bildungstrend 2016. Kompetenzen in den Fächern Deutsch und Mathematik am Ende der 4. Jahrgangsstufe im zweiten Ländervergleich (mit S. Schipolowski, C. Rjosk, S. Weirich & N. Haag), Münster 2017.

Replikationsdatei

R- und MPlus-Syntax zur Replikation der Ergebnisse dieses Aufsatzes finden sich im Datorium von GESIS unter folgendem Titel: „Code/Syntax: Effizienz und soziale Ungleichheit in strikt leistungsdifferenzierenden Bildungssystemen“ (doi: 10.7802/2616). Die zugrundeliegenden Daten sind am Forschungsdatenzentrum des Instituts zur Qualitätsentwicklung im Bildungswesen (IQB) an der Humboldt-Universität zu Berlin verfügbar (https://www.iqb.hu-berlin.de/fdz).

Literatur

Baumert, J., P. Stanat & R. Watermann, 2006: Schulstruktur und die Entstehung differenzieller Lern- und Entwicklungsmilieus. Wiesbaden: Springer.Search in Google Scholar

Becker, M., A. Kocaj, M. Jansen, H. Dumont & O. Lüdtke, 2021: Class-Average Achievement and Individual Achievement Development: Testing Achievement Composition and Peer Spillover Effects Using Five German Longitudinal Studies. Journal of Educational Psychology 114: 177–197.10.1037/edu0000519Search in Google Scholar

Becker, M., O. Lüdtke, U. Trautwein & J. Baumert, 2006: Leistungszuwachs in Mathematik: Evidenz für einen Schereneffekt im mehrgliedrigen Schulsystem? Zeitschrift für pädagogische Psychologie 20: 233–242.10.1024/1010-0652.20.4.233Search in Google Scholar

Becker, M., O. Lüdtke, U. Trautwein, O. Köller & J. Baumert, 2012: The Differential Effects of School Tracking on Psychometric Intelligence: Do Academic-Track Schools Make Students Smarter? Journal of Educational Psychology 104: 682–699.10.1037/a0027608Search in Google Scholar

Ben-Ari, R. & P. Kedem-Friedrich, 2000: Restructuring Heterogeneous Classes for Cognitive Development: Social Interactive Perspective. Instructional Science 28: 153–167.10.1023/A:1003806300757Search in Google Scholar

Boudon, R., 1974: Education, Opportunity, and Social Inequality: Changing Prospects in Western Society. New York: John Wiley & Sons.Search in Google Scholar

Buchmann, C. & B. Dalton, 2002: Interpersonal Influences and Educational Aspirations in 12 Countries: The Importance of Institutional Context. Sociology of Education 75: 99–122.10.2307/3090287Search in Google Scholar

Chiu, M.M., B.W.-Y. Chow & S.W. Joh, 2017: Streaming, Tracking and Reading Achievement: A Multilevel Analysis of Students in 40 Countries. Journal of Educational Psychology 109: 915–934.10.1037/edu0000188Search in Google Scholar

DiMaggio, P. & F. Garip, 2012: Network Effects and Social Inequality. Annual Review of Sociology 38: 93–118.10.1146/annurev.soc.012809.102545Search in Google Scholar

Dollmann, J. & F. Rudolphi, 2020: Classroom Composition and Language Skills: The Role of School Class and Friend Characteristics. British Journal of Sociology of Education 41: 1200–1217.10.1080/01425692.2020.1799754Search in Google Scholar

Domina, T., A. McEachin, P. Hanselman, P. Agarwal, N. Hwang & R.W. Lewis, 2019: Beyond Tracking and Detracking: The Dimensions of Organizational Differentiation in Schools. Sociology of Education 92: 293–322.10.1177/0038040719851879Search in Google Scholar

Dronkers, J. & R. van der Velden, 2013: Positive but Also Negative Effects of Ethnic Diversity in Schools on Educational Performance? An Empirical Test Using PISA Data. S. 71–98 in: M. Windzio (Hrsg.), Integration and Inequality in Educational Institutions. Dordrecht: Springer.10.1007/978-94-007-6119-3_4Search in Google Scholar

Duflo, E., P. Dupas & M. Kremer, 2011: Peer Effects, Teacher Incentives, and the Impact of Tracking: Evidence from a Randomized Evaluation in Kenya. American Economic Review 101: 1739–1774.10.1257/aer.101.5.1739Search in Google Scholar

Dumont, H., M. Neumann, K. Maaz & U. Trautwein, 2013: Die Zusammensetzung der Schülerschaft als Einflussfaktor für Schulleistungen: Internationale und nationale Befunde. Psychologie in Erziehung und Unterricht 60: 163–183.10.2378/peu2013.art14dSearch in Google Scholar

Duncan, O.D., D.L. Featherman & B. Duncan, 1972: Socioeconomic Background and Achievement. New York: Seminar Press.Search in Google Scholar

Ehmke, T. & T. Siegle, 2005: ISEI, ISCED, HOMEPOS, ESCS. Indikatoren der sozialen Herkunft bei der Quantifizierung von sozialen Disparitäten. Zeitschrift für Erziehungswissenschaft 8: 521–539.10.1007/s11618-005-0157-7Search in Google Scholar

Esser, H., 2022: „Wie kaum in einem anderen Land ...“? Die Differenzierung der Bildungswege und ihre Wirkung auf Bildungserfolg, -ungleichheit und -gerechtigkeit. Band 1: Theoretische Grundlagen. Frankfurt am Main: Campus.Search in Google Scholar

Esser, H., 2016: Bildungssysteme und ethnische Bildungsungleichheit. S. 331–396 in: C. Diehl, C. Hunkler & C. Kristen (Hrsg.), Ethnische Ungleichheiten im Bildungsverlauf. Mechanismen, Befunde, Debatten. Wiesbaden: Springer VS.10.1007/978-3-658-04322-3_8Search in Google Scholar

Esser, H. & J. Seuring, 2020: Kognitive Homogenisierung, schulische Leistungen und soziale Bildungsungleichheit: Theoretische Modellierung und empirische Analyse der Effekte einer strikten Differenzierung nach den kognitiven Fähigkeiten auf die Leistungen in der Sekundarstufe und den Einfluss der sozialen Herkunft in den deutschen Bundesländern mit den Daten der „National Educational Panel Study“ (NEPS). Zeitschrift für Soziologie 49: 277–301. 10.1515/zfsoz-2020-0025Search in Google Scholar

Gamoran, A., 2009: Tracking and Inequality: New Directions for Research and Practice. S. 213–228 in: M.W. Apple, S.J. Ball & L.A. Gandin (Hrsg.), The Routledge International Handbook of the Sociology of Education. London: Routledge.Search in Google Scholar

Ganzeboom, H.B.G., P.M. De Graaf & D.J. Treiman, 1992: A Standard International Socio-Economic Index of Occupational Status. Social Science Research 21: 1–56.10.1016/0049-089X(92)90017-BSearch in Google Scholar

Hallinan, M.T., 1994: Tracking: From Theory to Practice. Sociology of Education 67: 79–84.10.2307/2112697Search in Google Scholar

Hanushek, E.A. & L. Wößmann, 2006: Does Educational Tracking Affect Performance and Inequality? Differences-in-Differences Evidence across Countries. The Economic Journal 116: C63–C76.10.1111/j.1468-0297.2006.01076.xSearch in Google Scholar

Heisig, J.P. & S.H. Matthewes, 2022: No Evidence That Strict Educational Tracking Improves Student Performance through Classroom Homogeneity: A Critical Reanalysis of Esser and Seuring (2020). Zeitschrift für Soziologie 51: 99–111.10.1515/zfsoz-2022-0001Search in Google Scholar

Helbig, M. & R. Nikolai, 2015: Die Unvergleichbaren: Der Wandel der Schulsysteme in den deutschen Bundesländern seit 1949. Bad Heilbrunn: Klinkhardt.Search in Google Scholar

Helbling, L.A., M.J. Tomasik & U. Moser, 2019: Long-Term Trajectories of Academic Performance in the Context of Social Disparities: Longitudinal Findings from Switzerland. Journal of Educational Psychology 111: 1284–1299.10.1037/edu0000341Search in Google Scholar

Huang, M.-H., 2009: Classroom Homogeneity and the Distribution of Student Math Performance: A Country-Level Fixed-Effects Analysis. Social Science Research 38: 781–791.10.1016/j.ssresearch.2009.05.001Search in Google Scholar

Imberman, S.A., A.D. Kugler & B.I. Sacerdote, 2012: Katrina’s Children: Evidence on the Structure of Peer Effects from Hurricane Evacuees. American Economic Review 102: 2048–2082.10.1257/aer.102.5.2048Search in Google Scholar

Jackson, M. (Hrsg.), 2013: Determined to Succeed? Performance versus Choice in Educational Attainment. Stanford: Stanford University Press.10.11126/stanford/9780804783026.001.0001Search in Google Scholar

Jansen, M., Z. Boda & G. Lorenz, 2022: Social Comparison Effects on Academic Self-Concepts–Which Peers Matter Most? Developmental Psychology 58: 1541–1556.10.1037/dev0001368Search in Google Scholar

Jenkins, S.P., J. Micklewright & S.V. Schnepf, 2008: Social Segregation in Secondary Schools: How Does England Compare with other Countries? Oxford Review of Education 34: 21–37.10.1080/03054980701542039Search in Google Scholar

Kiss, D., 2013: The Impact of Peer Achievement and Peer Heterogeneity on Own Achievement Growth: Evidence from School Transitions. Economics of Education Review 37: 58–65.10.1016/j.econedurev.2013.08.002Search in Google Scholar

Köller, O., K. Schütte, F. Zimmermann, J. Retelsdorf & M. Leucht, 2013: Starke Klasse, hohe Leistungen? Die Rolle der Leistungsstärke der Klasse für die individuellen Mathematik-und Leseleistungen in der Sekundarstufe I. Psychologie in Erziehung und Unterricht 3: 184–197.10.2378/peu2013.art15dSearch in Google Scholar

Kreuter, F., S. Eckman, K. Maaz & R. Watermann, 2010: Children’s Reports of Parents’ Education Level: Does It Matter Whom You Ask and What You Ask About? Survey Research Methods 4: 127–138.Search in Google Scholar

Kuzmina, Y. & A. Ivanova, 2018: The Effects of Academic Class Composition on Academic Progress in Elementary School for Students with Different Levels of Initial Academic Abilities. Learning and Individual Differences 64: 43–53.10.1016/j.lindif.2018.04.004Search in Google Scholar

Lavy, V., M.D. Paserman & A. Schlosser, 2012: Inside the Black Box of Ability Peer Effects: Evidence from Variation in the Proportion of Low Achievers in the Classroom. The Economic Journal 122: 208–237.10.1111/j.1468-0297.2011.02463.xSearch in Google Scholar

Lenz, S., M. Holtmann, C. Rjosk & P. Stanat, 2019: Soziokulturelle Segregation an weiterführenden Schulen–Analysen zur Rolle der Gliederung des deutschen Schulsystems und schulstruktureller Reformmaßnahmen. Zeitschrift für Erziehungswissenschaft 22: 1333–1358.10.1007/s11618-019-00913-0Search in Google Scholar

Lenz, S., C. Rjosk, G. Lorenz & P. Stanat, 2021: Ethnische Segregation zwischen Schularten in mehrgliedrigen Schulsystemen und im „Zwei-Wege-Modell“. Analysen im Kontext von schulstrukturellen Reformmaßnahmen in Berlin, Bremen und Hamburg. Kölner Zeitschrift für Soziologie und Sozialpsychologie 73: 59–84.10.1007/s11577-021-00739-xSearch in Google Scholar

LeTendre, G.K., B.K. Hofer & H. Shimizu, 2003: What Is Tracking? Cultural Expectations in the United States, Germany, and Japan. American Educational Research Journal 40: 43–89.10.3102/00028312040001043Search in Google Scholar

Lohmann, J., 2021 (20. März): Mit Ignoranz die bildungspolitische Restauration ausrufen. https://www.eine-schule.de/blog/mit-ignoranz-die-bildungspolitische-restauration-ausrufen/.Search in Google Scholar

Lomi, A., T.A.B. Snijders, C.E.G. Steglich & V.J. Torló, 2011: Why Are Some More Peer Than Others? Evidence from a Longitudinal Study of Social Networks and Individual Academic Performance. Social Science Research 40: 1506–1520.10.1016/j.ssresearch.2011.06.010Search in Google Scholar

Lorenz, G., 2018: Selbsterfüllende Prophezeiungen in der Schule: Leistungserwartungen von Lehrkräften und Kompetenzen von Kindern mit Zuwanderungshintergrund. Wiesbaden: Springer VS.10.1007/978-3-658-19881-7Search in Google Scholar

Lorenz, G., Z. Boda & Z. Salikutluk, 2021: Oppositional Culture Revisited. Friendship Dynamics and the Creation of Social Capital among Turkish Minority Adolescents in Germany. Journal of Ethnic and Migration Studies 47: 3986–4005.10.1080/1369183X.2021.1898354Search in Google Scholar

Lorenz, G., Z. Boda, Z. Salikutluk & M. Jansen, 2020: Social Influence or Selection? Peer Effects on the Development of Adolescents’ Educational Expectations in Germany. British Journal of Sociology of Education 41: 643–669.10.1080/01425692.2020.1763163Search in Google Scholar

Lorenz, G., S. Gentrup, C. Kristen, P. Stanat & I. Kogan, 2016: Stereotype bei Lehrkräften? Eine Untersuchung systematisch verzerrter Lehrererwartungen. Kölner Zeitschrift für Soziologie und Sozialpsychologie 68: 89–111.10.1007/s11577-015-0352-3Search in Google Scholar

Manski, C.F., 1993: Identification of Endogenous Social Effects: The Reflection Problem. The Review of Economic Studies 60: 531–542.10.2307/2298123Search in Google Scholar

Matthewes, S.H., 2021: Better Together? Heterogeneous Effects of Tracking on Student Achievement. The Economic Journal 131: 1269–1307.10.1093/ej/ueaa106Search in Google Scholar

McPherson, J.M., L. Smith-Lovin & J.M. Cook, 2001: Birds of a Feather: Homophily in Social Networks. Annual Review of Sociology 27: 415–444.10.1146/annurev.soc.27.1.415Search in Google Scholar

Merton, R.K., 1968: The Matthew Effect in Science: The Reward and Communication Systems of Science Are Considered. Science 159: 606–623.10.1126/science.159.3810.56Search in Google Scholar

Paulus, P.B. & V.R. Brown, 2003: Enhancing Ideational Creativity in Groups. S. 110–136 in: P.B. Paulus & B.A. Nijstad (Hrsg.), Group Creativity: Innovation through Collaboration. New York: Oxford University Press.10.1093/acprof:oso/9780195147308.003.0006Search in Google Scholar

Rjosk, C., 2022: Dispersion of Student Achievement and Classroom Composition. S. 1399–1431 in: T. Nilsen, A. Stancel-Piątak & J.-E. Gustafsson (Hrsg.), International Handbook of Comparative Large-Scale Studies in Education. Perspectives, Methods and Findings. Cham: Springer.10.1007/978-3-030-88178-8_47Search in Google Scholar

Rubin, D.B., 1987: Multiple Imputation for Nonresponse in Surveys. New York: John Wiley & Sons.10.1002/9780470316696Search in Google Scholar

Skopek, J. & G. Passaretta, 2021: Socioeconomic Inequality in Children’s Achievement from Infancy to Adolescence: The Case of Germany. Social Forces 100: 86–112.10.1093/sf/soaa093Search in Google Scholar

Sørensen, A.B., 1970: Organizational differentiation of students and educational opportunity. Sociology of Education 43: 355–376.10.2307/2111838Search in Google Scholar

Stanat, P., K. Böhme, S. Schipolowski & N. Haag, 2016: IQB-Bildungstrend 2015. Sprachliche Kompetenzen am Ende der 9. Jahrgangsstufe im zweiten Ländervergleich. Münster: Waxmann.Search in Google Scholar

Stanat, P., K. Böhme, S. Schipolowski, N. Haag, S. Weirich, K. Sachse, L. Hoffmann & F. Federlein, 2018: IQB-Bildungstrend Sprachen 2015 (IQB-BT 2015) (Version 5) [Datensatz]. Berlin: Institut zur Qualitätsentwicklung im Bildungswesen.Search in Google Scholar

Stanat, P., H.A. Pant, K. Böhme & D. Richter, 2012: Kompetenzen von Schülerinnen und Schülern am Ende der vierten Jahrgangsstufe in den Fächern Deutsch und Mathematik: Ergebnisse des IQB-Ländervergleichs 2011. Münster: Waxmann.Search in Google Scholar

Stanat, P., S. Schipolowski, N. Mahler, S. Weirich & S. Henschel, 2019: IQB-Bildungstrend 2018. Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I im zweiten Ländervergleich. Münster, New York: Waxmann.Search in Google Scholar

Statistische Ämter des Bundes und der Länder, 2023: Bruttoinlandsprodukt (preisbereinigt, verkettet) 1991–2022 nach Bundesländern.Search in Google Scholar

Strello, A., R. Strietholt & I. Steinmann, 2022: Does Tracking Increase Segregation? International Evidence on the Effects of between-School Tracking on Social Segregation across Schools. Research in Social Stratification and Mobility 78: 1–13.10.1016/j.rssm.2022.100689Search in Google Scholar

Tribushinina, E., 2008: Cognitive Reference Points: Semantics Beyond the Prototypes in Adjectives of Space and Colour. Utrecht: Netherlands Graduate School of Linguistics.Search in Google Scholar

van Ewijk, R. & P. Sleegers, 2010: The Effect of Peer Socioeconomic Status on Student Achievement: A Meta-Analysis. Educational Research Review 5: 134–150.10.1016/j.edurev.2010.02.001Search in Google Scholar

Weinert, F.E., 2001: Der Einfluss der Schule auf die kognitive Entwicklung. Beiträge zur Lehrerinnen- und Lehrerbildung 19: 93–102.10.36950/bzl.19.1.2001.10313Search in Google Scholar

Wilhelm, O., U. Schroeders & S. Schipolowski, 2014: Berliner Test zur Erfassung fluider und kristalliner Intelligenz für die 8. bis 10. Jahrgangsstufe (BEFKI 8–10). Göttingen: Hogrefe.Search in Google Scholar

Wilkinson, I.A. & I.Y. Fung, 2002: Small-Group Composition and Peer Effects. International Journal of Educational Research 37: 425–447.10.1016/S0883-0355(03)00014-4Search in Google Scholar

Wößmann, L., 2016: The Importance of School Systems: Evidence from International Differences in Student Achievement. Journal of Economic Perspectives 30: 3–32.10.1257/jep.30.3.3Search in Google Scholar

Zimmer, R.W. & E.F. Toma, 2000: Peer Effects in Private and Public Schools across Countries. Journal of Policy Analysis and Management 19: 75–92.10.1002/(SICI)1520-6688(200024)19:1<75::AID-PAM5>3.0.CO;2-WSearch in Google Scholar

Published Online: 2023-11-02
Published in Print: 2023-11-21

© 2023 bei den Autorinnen und Autoren, publiziert von De Gruyter.

Dieses Werk ist lizensiert unter einer Creative Commons Namensnennung 4.0 International Lizenz.

Downloaded on 3.12.2025 from https://www.degruyterbrill.com/document/doi/10.1515/zfsoz-2023-2028/html
Scroll to top button