Studie 2: Schulformunterschiede

▼ 144 

Wie unterscheiden sich Schüler, die unterschiedliche Schulformen besuchen, hinsichtlich der kognitiven Fähigkeiten mathematischer Schülerleistung? Diese Frage steht im Zentrum der zweiten Forschungsfrage und wird in zwei Teilfragen untergliedert.

Im Rahmen der ersten Teilfrage werden in Abschnitt 8.1 schulformspezifische Niveauunterschiede der kognitiven Fähigkeiten mathematischer Schülerleistung analysiert. Die zweite Teilfrage geht im Rahmen von Abschnitt 8.2 Fragen der Differenzierung der mathematikspezifischen Fähigkeit nach.

Die Abschnitte zu den beiden Teilfragen sind jeweils wie folgt aufgebaut. Zunächst wird die empirische Befundlage knapp zusammengefasst. Vor dem empirischen Hintergrund und auch mit Blick auf die Überlegungen, die im theoretischen Teil der Arbeit referiert wurden, werden dann die Hypothesen abgeleitet. Anschließend wird die Methodik beschrieben. Daran schließen sich die Darstellung der Ergebnisse sowie eine Diskussion an. Abschließend werden die Befunde der zweiten Forschungsfrage in einen weiteren Kontext eingeordnet und diskutiert.

8.1  Niveauunterschiede

8.1.1  Empirische Befundlage und Hypothesen

▼ 145 

Die empirische Befundlage zu schulformspezifischen Niveauunterschieden kognitiver Fähigkeiten ist sehr eindeutig: Mit Blick auf die Mittelwerte ergibt sich folgende Rangfolge: Hauptschule < Realschule < Gymnasium. Diese Rangfolge findet man klassenstufenübergreifend sowohl für die fluide Fähigkeit (siehe Tab. 14; Heller & Perleth, 2000) als auch für die generelle mathematische Fähigkeit (siehe Tab. 15; Blum u.a., 2004; Hosenfeld, Köller & Baumert, 1999; Klieme, Neubrand & Lüdtke, 2001; Köller & Baumert, 2002; Kunter, 2005).

Tabelle 14:Schulformspezifische Mittelwertunterschiede der allgemeinen kognitiven
Fähigkeit in Effektgrößen d

Klassenstufe

Effektgröße d

 

Hauptschule versus Realschule

Hauptschule versus Gymnasium

Realschule versus Gymnasium

5. Klasse

1,23

1,83

0,60

6. Klasse

1,23

1,67

0,44

7. Klasse

1,28

2,05

0,77

8. Klasse

1,30

2,07

0,76

9. Klasse

1,19

2,23

1,04

Die Mittelwertunterschiede basieren auf den Tabellen des KFT-Manuals (Heller & Perleth, 2000, Abschnitt 1.7). Die gepoolte Standardabweichung wurde analog zu Formel 3 (Abschnitt 8.1.3) berechnet. Effektgrößen sind gemittelt über beide Testformen.

 
 

Tabelle 15:Schulformspezifische Mittelwertunterschiede der generellen mathematischen Fähigkeit (indiziert durch die globale Leistung in mathematischen Schülerleistungstests) in Effektgrößen d

Klassenstufe/
Altersgruppe

Effektgröße d

Hauptschule versus Realschule

Hauptschule versus Gymnasium

Realschule versus
Gymnaisum

7. Klasse1

0,30

1,68

1,40

7. Klasse und 8. Klasse2

0,54

1,34

0,80

10. Klasse1

0,80

2,33

1,54

15-Jährige3

0,92

1,75

0,83

15-Jährige4

0,89

1,75

0,86

1 auf Grundlage der BIJU-Daten. Es wurde ein mittleres d berechnet, indem die geschlechterspezifischen Effektgrößen proportional zu den schulformspezifischen Geschlechterverteilungen gewichtet wurden. Die gepoolte Standardabweichung wurde analog zur Formel 3 (Abschnitt 8.1.3) berechnet.Lit167 auf Grundlage der BIJU-Daten. Es wurde ein mittleres d berechnet, indem die geschlechterspezifischen Effektgrößen proportional zu den schulformspezifischen Geschlechterverteilungen gewichtet wurden. Die gepoolte Standardabweichung wurde analog zur Formel 3 (Abschnitt 8.1.3) berechnet.

2 Hosenfeld u.a. (1999, S. 153) auf Grundlage der TIMSS-Daten. d wurde berechnet indem die schulformspezifischen Mittelwertunterschiede durch die Standardabweichung in der Gesamtstichprobe geteilt wurden.

3 Klieme, Neubrand u.a. (2001, S. 180) auf Grundlage der PISA-2000-Daten. d wurde berechnet, indem die schulformspezifischen Mittelwertunterschiede durch die Standardabweichung in der Gesamtstichprobe geteilt wurden.

4 Blum u.a. (2004, S. 68) auf Grundlage der PISA-2003-Daten. Zunächst wurden getrennt für die Arten des mathematischen Arbeitens die schulformspezifischen Mittelwertunterschiede durch die Standardabweichung in der Gesamtstichprobe geteilt. Anschließend wurde ein mittleres d über diese separat berechneten Effektgrößen ermittelt. Dieses d ist in Tabelle 15 eingetragen.

    
    

▼ 146 

Ingesamt gesehen sind die in Tabelle 14 und 15 eingetragenen Schulformunterschiede – von einigen wenigen Ausnahmen abgesehen – sensu Cohen (1992) als „große Effekte“ (mit d größer .80) zu beurteilen. Einschränkend ist bei der Beurteilung der berechneten Effektgrößen aber anzumerken, dass diese nur dann vergleichbar sind, wenn sie in gleicher Weise berechnet wurden. Vergleiche sind möglich für alle Effektgrößen innerhalb von Tabelle 14 und für den Vergleich der Effektgrößen von Tabelle 14 mit den mit „1“ gekennzeichneten Studien in Tabelle 15. Weiterhin können in Tabelle 15 die Effektgrößen der mit „2“ „3“ und „4“ gekennzeichneten Studien miteinander verglichen werden. Der Grund für diese Einschränkung ist, dass in den referierten Arbeiten nicht genügend Informationen enthalten waren, um eine gemeinsame Effektstärkenmetrik zu definieren. Dennoch geben die in Tabelle 14 und 15 dokumentierten schulformspezifischen Mittelwertunterschiede einen Eindruck über die tatsächliche Größe der Unterschiede, der deutlich über eine rein qualitative Beschreibung der schulformspezifischen Niveauunterschiede hinausgeht.

Weiterhin ist bei den Ergebnissen von BIJU, TIMSS und PISA zu beachten, dass diese Schulformunterschiede auf einem Modell mathematischer Schülerleistung basieren, das analog zum Standardmodell spezifiziert wurde. Folgt man den Annahmen des Nested-Faktormodells, spiegeln die dokumentierten Schulformunterschiede Unterschiede der allgemeinen kognitiven Fähigkeit und der mathematikspezifischen Fähigkeit zwischen den Schulformen wider.

Dies hat direkte Implikationen für die zu erwartenden schulformspezifischen Niveauunterschiede der kognitiven Fähigkeiten mathematischer Schülerleistung. Um die Befunde früherer Studien zu replizieren, wird hier einerseits die Konzeptualisierung der kognitiven Fähigkeiten mathematischer Schülerleistung in Form des Standardmodells (siehe Abb. 16, Modell 5a) gewählt. Andererseits wurde auch die Konzeptualisierung in Form des Nested-Faktormodells (siehe Abb. 16, Modell 7a) untersucht, da damit die mathematikspezifische Fähigkeit getrennt von der allgemeinen kognitiven Fähigkeit analysiert werden kann.

▼ 147 

Einschränkend ist vorwegzunehmen, dass stoffgebietsspezifische Fähigkeiten wie auch die Konzeptualisierung in Form des Higher-Order-Modells (siehe Abb. 16, Modell 6a) in den Analysen in dieser Arbeit nicht berücksichtigt wurden. Denn als Analysemethode für die zweite Forschungsfrage empfiehlt sich die konfirmatorische Mehrgruppen-Faktorenanalyse (Carlstedt, 2001; Little, 1997; Lubke, Dolan, Kelderman & Mellenbergh, 2003). Bei Verwendung dieser Methode müssen die Mittelwerte der stoffgebietsspezifischen Residualterme auf Null fixiert werden, um das Modell zu identifizieren. Damit ist es ausgeschlossen, Mittelwertunterschiede der stoffgebietsspezifischen Fähigkeiten zu untersuchen. Darüber hinaus war aufgrund von Identifikationsproblemen das Higher-Order-Faktorenmodell in dieser Arbeit weniger geeignet als das Standardmodell oder das Nested-Faktormodell, da für die residualisierten Faktoren erster Ordnung (z.B. M´HO) keine schulformspezifischen Parameter geschätzt werden konnten.

Trotz dieser Einschränkungen werden die Ergebnisse zu den schulformspezifischen Mittelwertunterschieden helfen, ein detailliertes Bild von Schulformunterschieden zu zeichnen. Zunächst werden hierzu die Hypothesen hinsichtlich der mathematischen Fähigkeiten formuliert:

Hypothese 1a: Hinsichtlich der mittleren generellen mathematischen Fähigkeit ist folgende Rangfolge der Schulformen zu erwarten: Hauptschule < Realschule < Gymnasium (μM, HS < μM, RS M, HS). Für diese Hypothese sprechen zwei Gründe:

▼ 148 

Hypothese 1b: Aufgrund der beiden oben genannten Gründe wird auch angenommen, dass sich die Schulformen hinsichtlich ihrer mittleren mathematikspezifischen Fähigkeit unterscheiden. Folgende Rangfolge der Schulformen ist zu erwarten: Hauptschule < Realschule < Gymnasium (μM´, HS < μM´, RS M´, HS).

Hypothese 1c: Zusätzlich zur mathematikspezifischen Fähigkeit erklärt die allgemeine kognitive Fähigkeit zu großen Teilen interindividuelle Unterschiede bei Maßen mathematischer Schülerleistung. Zwei Aspekte sind hierbei relevant:

▼ 149 

Daher ist folgende Rangfolge der mittleren allgemeinen kognitiven Fähigkeit zu erwarten: Hauptschule < Realschule < Gymnasium (μg, HS < μg, RS g, HS).

Hypothese 1d: Beim Vergleich der schulformspezifischen Mittelwertunterschiede (gemessen durch Effektgröße d) sind größere Unterschiede bei der generellen mathematischen Fähigkeit als bei der mathematikspezifischen Fähigkeit zu erwarten (dM (HS vs. RS) > dM´ (HS vs. RS); dM (HS vs. GY) > dM´ (HS vs. GY);dM (RS vs. GY) > dM´ (RS vs. GY)). Der Grund hierfür ist, dass Unterschiede in der generellen mathematischen Fähigkeit schulformspezifische Unterschiede der allgemeinen kognitiven Fähigkeit und der mathematikspezifischen Fähigkeit widerspiegeln. Schüler höherer Schulformen sollten sowohl höhere Werte bei der allgemeinen kognitiven Fähigkeit als auch bei der mathematikspezifischen kognitiven Fähigkeit erzielen. Folgt man den Annahmen des Nested-Faktormodells, so ist offensichtlich, dass sich schulformspezifische Mittelwertunterschiede in beiden kognitiven Fähigkeiten addieren. Dies ist bei der mathematikspezifischen Fähigkeit nicht der Fall, da sie unabhängig von der allgemeinen kognitiven Fähigkeit ist (beide Faktoren stehen orthogonal zueinander). Daher sind für die mathematikspezifische Fähigkeit auch geringere Schulformunterschiede zu erwarten.

▼ 150 

Hypothese 1e: Aufgrund der postulierten Äquivalenz von fluider Fähigkeit und allgemeiner kognitiver Fähigkeit (Gustafsson, 1984) sollten Schulformunterschiede der beiden kognitiven Fähigkeiten gleich stark ausgeprägt sein (dGf (HS vs. RS) = dg (HS vs. RS); dGf (HS vs. GY) = dg (HS vs. GY);dGf (RS vs. GY) = dg (RS vs. GY)).

8.1.2 Methode

Stichprobe. Zur Prüfung der Hypothesen zu schulformspezifischen Niveauunterschieden wurden Hauptschulen, Realschulen und Gymnasien als Schulformen ausgewählt, da bei diesen Schulformen die institutionelle Trennung mit der Leistungsgruppierung eindeutig einherging. Ausgehend von der Analysestichprobe, die auch der ersten Forschungsfrage zu Grunde lag (siehe Abschnitt 7.1.2 und Tab. 3), wurde eine Substichprobe von Neuntklässlern dieser drei Schulformen gebildet. Insgesamt bestand die verwendete Stichprobe aus 4.491 Hauptschülern, 7.077 Realschülern sowie 8.908 Gymnasiasten.

Manifeste Variablen. Manifeste Variablen waren die WLE-Scores, die bei der ersten Forschungsfrage verwendet wurden: Es standen die vier stoffgebietsspezifischen WLE-Scores als Maße der mathematischen Schülerleistung, die beiden WLE-Scores zur Messung fluider Fähigkeit sowie die drei WLE-Scores zur Messung der verbalen Fähigkeit (indiziert durch die PISA-Lesefähigkeit) zur Verfügung. Die schulformspezifischen deskriptiven Statistiken der manifesten Variablen sind im Anhang dokumentiert.

▼ 151 

Invarianz bei Mehrgruppen-Faktorenanalysen. Wie können die Hypothesen zu Mittelwertunterschieden kognitiver Fähigkeiten statistisch überprüft werden? Die zentrale Anforderung an das statistische Modell ist, dass „Äpfel mit Äpfel und nicht mit Birnen“ (Horn & McArdle, 1992) verglichen werden. So soll zum Beispiel der Faktor, der die mathematikspezifische Fähigkeit von Hauptschülern repräsentiert, vergleichbar sein mit dem Faktor, der die mathematikspezifische Fähigkeit von Gymnasiasten repräsentiert.

Die Zulässigkeit des Vergleichs kann mithilfe konfirmatorischer Meh r gruppen-Faktorenanalysen geprüft werden (Little, 1997; Lubke u.a., 2003). Dabei werden sukzessive Parameterrestriktionen (constraints) der (unstandardisierten) Intercepts μ und der (unstandardisierten) Faktorladungen λ* der manifesten Variablen gesetzt, um diese Parameter über die Gruppen hinweg invar i ant zu setzen.26 Die Zulässigkeit der Vergleiche von Statistiken latenter Variablen ist an bestimmte Parameterrestriktionen geknüpft:

(a) Konfigurale Invarianz (Horn & McArdle, 1992). Bei dieser Form der Invarianz laden über die Gruppen hinweg die manifesten Variablen auf denselben latenten Variablen, und das Muster der Null-Ladungen ist für alle Gruppen gleich. Die Faktorladungen, die Residualvarianzen und die Mittelwerte der manifesten Variablen können (innerhalb und) zwischen den Gruppen variieren, dass heißt, diese Modellparameter werden nicht invariant über die Gruppen gesetzt.

Wenn die Bedingung konfiguraler Invarianz erfüllt ist, ist jedoch der Vergleich von Faktorvarianzen und -kovarianzen sowie von latenten Mittelwerten nicht möglich. Hierfür müssen weitere Bedingungen erfüllt sein.

▼ 152 

(b) Metrische Invarianz (Horn & McArdle, 1992). Bei der metrischen Invarianz sind zusätzlich zu den Bedingungen der konfiguralen Invarianz die unstandardisierten Ladungen der manifesten Variablen invariant über die k Gruppen. Es gilt also:

Wenn die Bedingung der metrischen Invarianz erfüllt ist, ist die Bedeutung eines Faktors (zur Erklärung interindividueller Unterschiede bei den jeweiligen manifesten Variablen) in allen Gruppen gleich. Somit können Faktorvarianzen und -kovarianzen zwischen den Gruppen verglichen werden.

▼ 153 

(c) Skalare Invarianz (Millsap & Kwok, 2004). Möchte man darüber hinaus noch die latenten Mittelwerte miteinander vergleichen, muss zum einen die metrische Invarianzbedingung erfüllt sein. Zum anderen müssen zusätzlich die Intercepts der manifesten Variablen über die Gruppen hinweg invariant sein:

Modellspezifikation. Zur Prüfung der Hypothesen 1a bis 1e wurden das Standardmodell (Abb. 18a) und das Nested-Faktormodell (Abb. 18b) als Mehrgruppen-Faktorenmodell mit den Schulformen Hauptschule, Realschule und Gymnasium als Gruppierungsvariable spezifiziert. Dabei wurden sukzessive die Parameterconstraints zur Prüfung konfiguraler Invarianz, metrischer Invarianz und der skalaren Invarianz gesetzt. Zur Identifikation der Faktoren wurde die unstandardisierte Faktorladung von jeweils einer manifesten Variablen auf 1,0 fixiert (siehe auch Tab. 14). Im Standardmodell wurden zur Identifikation des Faktors Gf darüber hinaus die unstandardisierten Faktorladungen von FA und WA auf 1,0 fixiert. Zur Identifikation der latenten Mittelwerte wurde der Mittelwert der latenten Variablen in der Hauptschule auf Null fixiert.

▼ 154 

Abbildung 18: Modelle zur Analyse von Schulformunterschieden

Schätzen der Modellparameter. Zur Schätzung der Modellparameter wurde der Schätzalgorithmus MLR und das Modul „complex“ verwendet, die in Mplus 3.01 (Muthén & Muthén, 1998–2004b) implementiert sind und simultan das Problem fehlender Werte und einer genesteten Datenstruktur berücksichtigen (vgl. Abschnitt 7.2.2).

Evaluierung des Modell-Fits. Wie auch bei der herkömmlichen konfirmatorischen Faktorenanalyse konnte der Modell-Fit anhand des inferenzstatistischen χ2-Goodness-of-Fit-Tests und deskriptiver Fit-Indizes (z.B. CFI, RMSEA, SRMR) bewertet werden.

▼ 155 

Zur Prüfung, ob die verschiedenen Formen der Invarianzannahmen erfüllt sind, wurden Varianten des Standardmodells und des Nested-Faktormodells miteinander verglichen, in denen sukzessive die jeweiligen Parameterconstraints eingeführt wurden. Hierfür bot sich folgende Reihenfolge an: (1) konfigurale Invarianz, (2) metrische Invarianz und (3) skalare Invarianz (vgl. Little, 1997).

Ob die zusätzlichen Parameterconstraints zu einer signifikanten Verschlechterung des Modell-Fits führten, konnte anhand der Differenzen der χ2-Goodness-of-Fit-Tests ermittelt werden. Allerdings ist hierbei zu bedenken, dass dieser Differenzentest sehr sensitiv gegenüber großen Stichproben und der Anzahl restringierter Parameter ist (Little, 1997). Daher schlägt Little (1997) mehrere zusätzliche Kriterien zur Bewertung der Invarianzannahmen vor. Dazu gehören:

▼ 156 

Inferenzstatistische Prüfung von Hypothesen. Im Gegensatz zur Prüfung der Invarianzannahmen schlägt Little (1997) vor, die Hypothesen zu latenten Mittelwert-, Varianz- und Kovarianzunterschieden zwischen den Gruppen inferenzstatistisch mit χ2-Differenzentests abzusichern. Die Rationale hierfür ist nach Little, dass die Hypothesen zu Gruppenunterschieden theoretisch abgeleitet werden und daher auch infererenzstatistisch geprüft werden sollten.

In der vorliegenden Arbeit wird der Rationale von Little zur Bewertung der Invarianzannahmen sowie zum Prüfen der Hypothesen gefolgt. Bei inferenzstatististischen Hypothesentests wurde ein Signifikanzniveau von p < .05 gesetzt.

8.1.3 Ergebnisse

Evaluierung des Modell-Fits. Unter allen drei Invarianzbedingungen wiesen – gemessen an den Cut-off-Werten zur Bewertung deskriptiver Fit-Indizes (vgl. Abschnitt 7.2.2) – sowohl das Standardmodell wie auch das Nested-Faktormodell guten Modell-Fit auf (Tab. 16).

▼ 157 

Tabelle 16:Globale Modell-Fit-Indizes unter verschiedenen Invarianzbedingungen

Modell

χ2

df

SF

CFI

RMSEA

SRMR

Standardmodell

    

Konfigurale Invarianz

862

77

1.028

0,99

0,04

0,03

Metrische Invarianz

1.411

85

1.003

0,98

0,05

0,04

Skalare Invarianz

2.715

97

1.037

0,95

0,06

0,06

     

Nested-Faktormodell

    

Konfigurale Invarianz

624

60

0.992

0,99

0,04

0,02

Metrische Invarianz

1.392

86

1.013

0,98

0,05

0,04

Skalare Invarianz

2.230

98

1.016

0,96

0,06

0,05

Alle χ2-Goodness-of-Fit-Statistiken waren signifikant (p < .05).

       
       

Zwar führte die Einführung der Parameterconstraints zu signifikanten Verschlechterungen des Modell-Fits (Tab. 17), doch diese Verschlechterungen konnten als eher marginal betrachtet werden. Die stärkste „Verschlechterung“ resultierte (gerundet) mit .03 für den CFI im Standardmodell aus dem Setzen der Mittelwertrestriktionen für die skalare Invarianz (siehe Tab. 16 und Tab. 17). Dennoch war der Modell-Fit des skalar invarianten Standardmodells immer noch als akzeptabel anzusehen.

Tabelle 17:Veränderung der globalen Modell-Fit-Indizes bei Einführung der Parameterconstraints zur Prüfung der Invarianz

Modellvergleich

Δχ2

Δdf

ΔCFI

ΔRMSEA

ΔSRMR

Standa r dmodell

     

Konfigurale Invarianz versus metrische Invarianz

694*

12

0,01

–0,01

–0,01

Metrische Invarianz versus skalare Invarianz

1.096*

12

0,03

–0,02

–0,02

      

Nested-Faktormodell

     

Konfigurale Invarianz versus metrische Invarianz

745*

26

0,02

–0,01

–0,01

Metrische Invarianz versus skalare Invarianz

825*

12

0,01

–0,01

–0,02

* p < .05.

Zur Berechnung der χ2-Differenz wurde die Korrekturformel aus dem technischen Anhang von Mplus verwendet (Muthén & Muthén, 1998–2004a, S. 22).

      
      

▼ 158 

War es zulässig, die latenten Mittelwerte im Rahmen des Standardmodells und des Nested-Faktormodells zu vergleichen? Die Kriterien zur Bewertung des Modell-Fits und die marginale Verschlechterung der deskriptiven Fitindizes (siehe aber auch Cheung & Rensvold, 2002, die aber schon bei einer Differenz des CFI von größer .01 die Invarianzvoraussetzung in Frage stellen) sprachen dafür, die skalarinvarianten „Versionen“ beider Modelle für die weiteren Analysen zu verwenden. Darüber hinaus ermöglicht erst die skalare Invarianz beider Modelle die inhaltlich bedeutsame Analyse von Schulformunterschieden. Damit waren alle drei von Little (1997) genannten Bedingungen erfüllt.

Hypothesenprüfung. Die nachfolgenden Darstellungen beschränken sich nur auf die Modellparameter, die zur Prüfung der Hypothesen relevant waren. Die latenten Mittelwerte der kognitiven Fähigkeiten sind in Tabelle 18 eingetragen. Dabei ist zu beachten, dass bei allen kognitiven Fähigkeiten der Mittelwert der Hauptschüler auf Null fixiert wurde, um die Modelle zu identifizieren. Die latenten Mittelwerte der beiden anderen Schulformen konnten somit als Mittelwertdifferenzen zwischen dem jeweiligen latenten Schulmittelwert und dem latenten Mittelwert der Hauptschüler interpretiert werden. Auf Unterschiede der verbalen Fähigkeiten (V oder V´) wird in dieser Arbeit nicht weiter eingegangen, da diese keinen inkrementellen Beitrag zur Erklärung interindividueller Unterschiede mathematischer Schülerleistung leisten konnten (vgl. Abschnitt 7.2, Modell 7b).

Tabelle 18:Schulformspezifische unstandardisierte latente Mittelwerte (μ), korrespondierende 95%-Konfidenzintervalle [95%-KI]

Schulform

μM [95%-KI]

μGfg [95%-KI]

μ (V)/μ (V´) [95%-KI]

Standardmodell

   

Hauptschule

0,00a

0,00a

0,00a

Realschule

0,93 [0,85; 1,00]

0,75 [0,69; 0,80]

0,87 [0,80; 0,93]

Gymnasium

2,21 [2,15; 2,28]

1,57 [1,53; 1,62]

1,69 [1,63; 1,75]

    

Nested-Fakto r modell

   

Hauptschule

0,00a

0,00a

0,00a

Realschule

0,26 [0,20; 0,33]

0,67 [0,60; 0,74]

0,33 [0,28; 0,38]

Gymnasium

0,88 [0,79; 0,98]

1,45 [1,37; 1,53]

0,55 [0,49; 0,60]

Es ist zu beachten, dass die unstandardisierten Parameter nicht zwischen dem Standardmodell und dem Nested-Faktormodell verglichen werden können.

a Diese Parameter wurden auf Null fixiert, um das Modell zu identifizieren. Daher wurde kein Standardfehler geschätzt und somit konnte kein Konfidenzintervall berechnet werden.

 
 

▼ 159 

Als Effektgröße d wurde eine Effektgröße analog zu Cohens (1992) d berechnet. Die zu Grunde liegende gepoolte Standardabweichung SDpooled wurde folgendermaßen aus den schulformspezifischen Varianzen σ2 berechnet (vgl. Bortz & Döring, 2002, S. 605):

N stellt dabei die Stichprobengröße der jeweiligen Schulformen Hauptschule (HS), Realschule (RS) und Gymnasium (GY) dar.Die resultierenden Effektgrößen sind in Abbildung 19 eingezeichnet.

▼ 160 

Abbildung 19:Effektgrößen der schulformspezifischen Unterschiede in den mathematischen
Fähigkeiten

Auf Grundlage der geschätzten latenten Mittelwerte und der berechneten Effektgrößen konnten die postulierten Hypothesen geprüft werden. Zunächst werden die Hypothesen bezüglich der mathematischen Fähigkeiten untersucht.

Schulformspezifische Unterschiede in den mathematischen Fähigkeiten. Verglich man die latenten Mittelwerte der generellen mathematischen Fähigkeit im Standardmodell, so war ersichtlich, dass Hauptschüler im Mittel geringere Leistungen erzielten als Realschüler (d = 1,12) oder Gymnasiasten (d = 2,68). Auch schnitten Realschüler durchschnittlich schwächer ab als Gymnasiasten (d = 1,56).

▼ 161 

Zur inferenzstatistischen Überprüfung der Mittelwertunterschiede wurden die Mittelwerte von zwei Schulformen auf den gleichen Wert fixiert. Eine statistisch signifikante Differenz der χ2-Goodness-of-Fit-Werte war indikativ für einen überzufälligen Mittelswertsunterschied. Zur Berechnung der χ2-Differenzen wurde die empfohlene Korrekturformel (Muthén & Muthén, 1998–2004a, S. 22) verwendet. Bei der inferenzstatistischen Überprüfung war die mittlere Leistung von Hauptschülern und Gymnasiasten bei der generellen mathematischen Fähigkeit statistisch signifikant verschieden (Tab. 19). Bei den Vergleichen der beiden anderen Schulformvergleiche resultierten zwei χ2-Differenzen kleiner Null, die nicht interpretiert werden konnten. Nach Satorra und Bentler (2001, S. 511) ist dies entweder indikativ dafür, dass die Stichprobe zu klein ist (was in der vorliegenden Arbeit ausgeschlossen werden kann) oder dass das restringiertere Modell zu stark vom weniger restringierten Modell abweicht. Letzteres schien der Fall zu sein, denn der χ2-Goodness-of-Fit-Wert des restringierten Modells verschlechterte sich sehr deutlich im Vergleich zum unrestringierten Modell. Dies zeigte ein deskriptiver Vergleich der Werte für die skalarinvarianten Modelle aus Tabelle 16 und den restringierten Modellen in Tabelle 19. So verschlechterte sich beispielsweise der χ2-Goodness-of-Fit-Wert im Standardmodell von χ2 = 2.715 auf χ2 = 5.127 beim Test für die Gleichheit der Mittelwerte der generellen mathematischen Fähigkeit von Haupt- und Realschülern. Unabhängig von den Problemen mit den χ2-Differenzentests wiesen die Konfidenzintervalle der schulformspezifischen Mittelwerte, die sich nicht überlappten, darauf hin, dass die jeweiligen Mittelwerte erwartungskonform statistisch signifikant voneinander verschieden waren. Ingesamt gesehen wurde Hypothese 1a somit von den empirischen Ergebnissen gestützt.

Tabelle 19:Test auf schulformspezifische Niveauunterschiede der kognitiven Fähigkeiten mathematischer Schülerleistung

Modellvergleich

χ2

df

SF

CFI

RMSEA

SRMR

Δχ2

Standa r dmodell

       

μM(HS) = μM(RS)

5.127

98

1.021

0,91

0,09

0,11

–4.555

μM(HS) = μM(GY)

10.816

98

1.028

0,80

0,13

0,42

53.568

μM(RS) = μM(GY)

8.468

98

0.934

0,84

0,11

0,15

–562

        

Nested-Faktormodell

       

μ(HS) = μ(RS)

2.340

99

1.016

0,96

0,06

0,06

110

μ(HS) = μ(GY)

2.464

99

1.035

0,96

0,06

0,05

98

μ(RS) = μ(GY)

2.514

99

1.023

0,95

0,06

0,06

179

μg(HS) = μg(RS)

4.260

99

1.011

0,92

0,08

0,09

3.916

μg(HS) = μg(GY)

9.064

99

1.021

0,83

0,12

0,28

4.625

μg(RS) = μg(GY)

5.767

99

1.004

0,89

0,09

0,12

–20.486

Die Modell-Fit-Indizes resultierten aus einem Modell, in dem die jeweiligen Mittelwerte auf den gleichen Wert fixiert wurden. Zur Berechnung der χ2-Differenz wurde die Korrekturformel aus dem technischen Anhang von Mplus verwendet (Muthén & Muthén, 1998–2004a, S. 22). Alle χ2-Differenzen werden mit df = 1 getestet. SF = Skalierungsfaktor.

        
        

Auch bei der mathematikspezifischen Fähigkeit im Nested-Faktormodell zeigte sich die erwartete Rangfolge der Schulformen. Die mathematikspezifische Fähigkeit von Hauptschülern lag im Mittel um 0,37 Standardabweichungen unter der durchschnittlichen Leistung von Realschülern und 1,25 Standardabweichungen unter der mittleren Leistung von Gymnasiasten. Im Durchschnitt erzielten Realschüler um 0,88 Standardabweichungen schlechtere Leistungen als Gymnasiasten. Wie zu erwarten, waren alle Mittelwertunterschiede der mathematikspezifischen Fähigkeit statistisch signifikant von Null verschieden (Tab. 19). Die deskriptiven Unterschiede wie auch die inferenzstatistischen Analysen stützten somit Hypothese 1b.

▼ 162 

Zur Prüfung der Frage, ob die Schulformunterschiede stärker bei der generellen mathematischen Fähigkeit oder der mathematikspezifischen Fähigkeit ausgeprägt waren (Hypothese 1d), war es notwendig, die schulformspezifischen Mittelwertunterschiede beider Modelle auf derselben Metrik zu vergleichen. Hierzu wurden die Effektgrößen d verwendet. Beim Vergleich der Effektgrößen war offensichtlich, dass die schulformspezifischen Unterschiede in der generellen mathematischen Fähigkeit deutlich stärker ausgeprägt waren als bei der mathematikspezifischen Fähigkeit. Betrachtete man zum Beispiel den Mittelwertunterschied zwischen der Hauptschule und dem Gymnasium, so betrug dieser 2,68 Standardabweichungen für die generelle mathematische Fähigkeit und 1,25 Standardabweichungen für die mathematikspezifische Fähigkeit (vgl. Abb. 19). Die Differenz der Effektgrößen zwischen den beiden geschätzten Schulformunterschieden betrug also 1,43 Standardabweichungen (2,68–1,25).

Für den Vergleich von Effektgrößen aus einer Einzelstudie gibt es meines Wissens keinen inferenzstatistischen Test. Hypothese 1d wurde somit von den empirischen Ergebnissen gestützt, konnte aber nicht zufallskritisch abgesichert werden.

Zusammenfassend kann man an dieser Stelle festhalten, dass die postulierten Hypothesen hinsichtlich der mathematischen Fähigkeiten von den empirischen Ergebnissen gestützt wurden. Traf dies auch für die Hypothesen zur allgemeinen kognitiven Fähigkeit und der fluiden Fähigkeit zu?

▼ 163 

Schulformspezifische Unterschiede der allgemeinen kognitiven Fähigkeit und der fluiden F ä higkeit. Schüler an der Hauptschule erzielten im Durchschnitt niedrigere Leistungen bei der allgemeinen kognitiven Fähigkeit als Realschüler (d = 1,15) und schnitten durchschnittlich schwächer ab als Gymnasiasten (d = 2,49). Ebenso lag die mittlere Leistung von Realschülern unter der von Gymnasiasten (d = 1,34).

Bei der inferenzstatistischen Überprüfung der Mittelwertunterschiede waren die mittleren Leistungen von Hauptschülern und Realschülern sowie von Hauptschülern und Gymnasiasten statistisch signifikant verschieden. Jedoch resultierte für den Schulformvergleich der Mittelwerte von Realschülern und Gymnasiasten eine χ2-Differenz kleiner als Null. Dieser negative Wert konnte nicht interpretiert werden (siehe oben). Jedoch indizierten die deutlichen Verschlechterungen der χ2-Goodness-of-Fit-Werte wie auch die Konfidenzintervalle der schulformspezifischen Mittelwerte, die sich nicht überlappten, dass diese Mittelwertdifferenz statistisch signifikant von Null verschieden war. Hypothese 1c wurde somit empirisch gestützt.

Die Ergebnisse stützten auch die Annahme von Hypothese 1e, dass die Schulformunterschiede hinsichtlich der allgemeinen kognitiven Fähigkeit und der fluiden Fähigkeit gleich stark ausgeprägt waren. Ein Vergleich der Effektgrößen zeigte, dass unabhängig vom spezifizierten Modell nahezu identische Werte resultierten: Der größte Unterschied zwischen den Effektgrößen betrug .08 Standardabweichungen für den Schulformunterschied der mittleren Leistungen von Hauptschülern und Gymnasiasten. Ob die minimalen Unterschiede statistisch signifikant waren, konnte aufgrund fehlender inferenzstatistischer Tests nicht geprüft werden.

8.1.4 Diskussion

▼ 164 

Die wichtigsten Ergebnisse der vorangegangenen Analysen lassen sich wie folgt zusammenfassen:

Die Hypothesen zu den Niveauunterschieden wurden einerseits auf Grundlage der empirischen Befunde früherer Forschung und andererseits aus Befunden der Unterrichtsforschung abgeleitet. Wie zu erwarten war, waren die Ergebnisse zu schulformspezifischen Niveauunterschieden kognitiver Fähigkeiten sehr eindeutig sowohl bei den mathematischen Fähigkeiten als auch bei der allgemeinen kognitiven Fähigkeit (bzw. fluiden Fähigkeit). Ob diese Unterschiede nun bereits vor dem Übertritt an höhere Schulformen bestanden haben oder ob sie erst durch die unterschiedlichen Unterrichtsmilieus entstanden sind, kann anhand der vorliegenden Daten nicht beantwortet werden. Erst ein längsschnittliches Feldexperiment, in dem eine repräsentative Stichprobe von Schülern zufällig verschiedenen Schulformen zugewiesen wird, könnte hier Klarheit schaffen. Jedoch ist klar, dass dieses Experiment aus ethischen Gründen niemals durchgeführt werden sollte. Wie man dennoch dieses Experiment approximieren kann, wird im Rahmen der Diskussion in Abschnitt 8.3 weiter ausgeführt, wenn methodische Überlegungen zur Analyse von Unterrichtseffekten diskutiert werden.

▼ 165 

Ein davon unabhängiger zentraler Befund der vorliegenden Arbeit zeigt, dass die Schulformunterschiede in der generellen mathematischen Fähigkeit wesentlich deutlicher ausgeprägt waren als in der mathematikspezifischen Fähigkeit. Erklärt wurde dies dadurch, dass in die generelle mathematische Fähigkeit Unterschiede der allgemeinen kognitiven Fähigkeit und der mathematikspezifischen Fähigkeit gemischt eingingen. Vor dem Hintergrund, dass in bisherigen Studien (Blum u.a., 2004; Klieme, Neubrand u.a., 2001; Köller & Baumert, 2002; Kunter, 2005) in der Regel die generelle mathematische Fähigkeit betrachtet wurde, wurden die Unterschiede zwischen den Schulformen mit Blick auf die mathematikspezifische Fähigkeit somit tendenziell überschätzt, bzw. die berichteten Unterschiede bezogen sich auf ein unspezifiziertes „Varianzamalgam“ der allgemeinen kognitiven Fähigkeit und der mathematikspezifischen Fähigkeit. In der vorliegenden Arbeit ist es gelungen, dieses Amalgam zu trennen, um so ein differenzierteres Bild der schulformspezifischen Niveauunterschiede zu zeichnen.

Geht man davon aus, dass die allgemeine kognitive Fähigkeit und die mathematikspezifische Fähigkeit bedeutsame Prädiktoren des Lernerfolgs (vgl. Abschnitt 5.1), aber auch Resultat von Lernprozessen sind (Ceci, 1991; Helmke & Weinert, 1997; Köller & Baumert, 2002), haben diese Befunde auch für die These von Schulformen als differenzielle Entwicklungsmilieus (Baumert, Köller & Schnabel, 2000) Bedeutung. Insbesondere die Interpretation der mathematikspezifischen Fähigkeit ist hierbei interessant: Wenn zwei Schüler die gleiche Leistung bei der allgemeinen kognitiven Fähigkeit erzielten, der eine aber die Realschule und der andere die Hauptschule besuchte, hatte der Realschüler eine um 0,37 Standardabweichungen bessere Leistung als der Hauptschüler in der mathematikspezifischen Fähigkeit. Für den Vergleich eines Hauptschülers mit einem Gymnasiasten (gleicher allgemeiner kognitiver Fähigkeit) betrug der Leistungsvorsprung bei der mathematikspezifischen Fähigkeit sogar 1,25 Standardabweichungen. Unter der Annahme, dass der Lernzugewinn in Mathematik in einem Schuljahr bei etwa 0,3 Standardabweichungen liegt (Baumert & Artelt, 2002; Köller, Baumert & Schnabel, 2003), würden die Leistungsunterschiede zwischen Hauptschülern und Realschülern (Gymnasiasten) gleicher allgemeiner kognitiver Fähigkeit einem Unterschied von etwa einem bzw. vier Schuljahren entsprechen.

Folgt man der Annahme, dass Unterschiede in den Eingangsvoraussetzungen unterschiedliche Entwicklungstrajektorien in den mathematischen Fähigkeiten bedingen, dann sollte die Leistungsschere zwischen den Schulformen mit höheren Klassenstufen zunehmen. Dies impliziert eine Zunahme der Heterogenität der Schülerschaft in der Gesamtpopulation der Schüler wie auch innerhalb der Schulformen (siehe hierzu z.B. Köller & Baumert, 2001; siehe aber auch Schneider & Stefanek, 2004). Erste Hinweise auf dieses Phänomen zeigt ein Vergleich der schulformspezifischen Varianzen der mathematikspezifischen Fähigkeit (Tab. 20): Die Varianz nahm von der Hauptschule über die Realschule hin zum Gymnasium zu.

▼ 166 

Im nächsten Abschnitt wird diese Zunahme der Heterogenität der Schülerschaft zwischen und innerhalb von Schulformen im Rahmen der Analysen zur Differenzierung der mathematikspezifischen Fähigkeit detailliert betrachtet.

Tabelle 20:Schulformspezifische Varianz (σ2) der mathematikspezifischen Fähigkeit (M´) und korrespondierendes 95%-Konfidenzintervall [95%-KI]

Schulform

 

σ2(M´)

[95%-KI]

 

Hauptschule

 

0,05

[–0,04; 0,13]

 

Realschule

 

0,46

[0,31; 0,60]

 

Gymnasium

 

0,75

[0,50; 1,01]

 
  
  

8.2 Differenzierung der mathematikspezifischen Fähigkeit

8.2.1  Empirische Befundlage und Hypothesen

Bei den vorangegangenen Analysen wurden schulformspezifische Unterschiede des Niveaus der kognitiven Fähigkeiten mathematischer Schülerleistung analysiert. Im Unterschied hierzu werden im Rahmen der nächsten beiden Hypothesen einerseits die Heterogenität (in Form der Varianz) und andererseits nur die mathematikspezifische Fähigkeit für Schüler unterschiedlicher Fähigkeitsniveaus sowie unterschiedlicher Schulform untersucht. Diese Analysen fokussieren auf die Differenzierung der mathematikspezifischen Fähigkeit.

▼ 167 

Generelle Differenzierungshypothese (Hypothese 2a). Einige Studien weisen darauf hin, dass Personen mit höherem Niveau allgemeiner kognitiver Fähigkeit eine differenziertere Faktorstruktur aufweisen als Personen mit niedrigerem Fähigkeitsniveau (vgl. Abschnitt 4.3.2; Abad, Colom, Juan-Espinosa & Garcia, 2003; Carlstedt, 2001; Deary u.a., 1996; Detterman & Daniel, 1989; Jensen, 2003). In den Studien, die mathematische Fähigkeiten untersuchten (dies sind alle hier zitierten mit Ausnahme der Studie von Carlstedt), nahm die Varianz der mathematikspezifischen Fähigkeitsfaktoren mit zunehmender allgemeiner kognitiver Fähigkeit zu.

Wie in Abschnitt 4.3.2 ausgeführt wurde, kann dieser empirische Befund der Differenzierung mit Jensen (1998) folgendermaßen erklärt werden: Im Zuge der kognitiven Entwicklung wird die allgemeine kognitive Fähigkeit zunehmend in spezialisiertere Fähigkeiten investiert. Mit zunehmender Übung werden diese spezialisierteren Fähigkeiten mehr und mehr automatisiert. Die automatisierbaren Aspekte dieser Fähigkeiten sind dann von der allgemeinen kognitiven Fähigkeit unabhängig. Folgt man Jensen, dann haben Schüler mit höherer allgemeiner kognitiver Fähigkeit tendenziell die kognitiven Teilprozesse des mathematischen Problemlösens stärker automatisiert. Dies führt (bei einer gleichzeitigen differenziellen Investition in unterschiedliche spezialisierte Fähigkeiten z.B. aufgrund unterschiedlicher fachspezifischer Lernmotivation, siehe hierzu auch Abschnitt 9.6) dazu, dass die Varianz der mathematikspezifischen Fähigkeit in der Gesamtstichprobe der Schüler zunimmt.

Unabhängig von der besuchten Schulform sollte also eine Differenzierung der mathematikspezifischen Fähigkeit zu beobachten sein (vgl. Abb. 20b, Gesamtstichprobe): Je höher das Niveau allgemeiner kognitiver Fähigkeit g ist, desto größer ist die Varianz der mathematikspezifischen Fähigkeit σ2 . Dies bedeutet, dass die Heterogenität der Schülerschaft in der Gesamtstichprobe hinsichtlich der mathematikspezifischen Fähigkeit mit zunehmendem Fähigkeitsniveau zunimmt.

▼ 168 

Abbildung 20: Faktormodell und schematische Darstellung der Differenzierung der
mathematikspezifischen Fähigkeit (M´)

Schulformspezifische Differenzierungshypothese (Hypothese 2b). Eine weitere Erklärung der Differenzierung stammt von Abad und Kollegen (2003). Abad u.a. erklären die Differenzierung spezifischer Fähigkeiten dadurch, dass Personen mit höherem Fähigkeitsniveau Zugang zu besseren Bildungsmöglichkeiten (z.B. höheren Schulformen) haben. Unter der Annahme, dass an höheren Schulformen leistungsförderliche Aspekte des Mathematikunterrichts stärker ausgeprägt sind (vgl. Abschnitt 5.4; siehe Baumert u.a., 2004; Gruehn, 2000; Klieme, Schümer u.a., 2001; Kunter, 2005), finden Schüler an höheren Schulformen bessere Investitionsmöglichkeiten für ihre allgemeine kognitive Fähigkeit vor (vgl. Abschnitt 4.3.2). Daher sollten Schüler gleichen Fähigkeitsniveaus, die aber unterschiedliche Schulformen besuchen, ein unterschiedliches Ausmaß der Differenzierung aufweisen. Bei gleichem Niveau allgemeiner kognitiver Fähigkeit sollte die Differenzierung der mathematikspezifischen Fähigkeit von Schülern der höheren Schulform stärker ausgeprägt sein (dies entspricht in Abb. 20b den schulformspezifischen Funktionsgeraden zum Zusammenhang von g und σ2 ). Bei gleichem Fähigkeitsniveau sollte also die Varianz der mathematikspezifischen Fähigkeit von Schülern am Gymnasium größer sein als die Varianz von Schülern an der Realschule. Ebenso sollte (bei gleichem Fähigkeitsniveau) die Heterogenität in Bezug auf die mathematikspezifische Fähigkeit von Realschülern größer sein als die Heterogenität von Hauptschülern. Diese Hypothese ist meines Wissens bislang noch nicht geprüft worden.

Erste Evidenz für diese Hypothese zeigten die schulformspezifischen Unterschiede in der Varianz der mathematikspezifischen Fähigkeit, die in Tabelle 20 dokumentiert sind. Jedoch ist aus Unterschieden der Heterogenität in Tabelle 20 nicht ersichtlich, ob diese Varianzunterschiede sich gleichmäßig über das gesamte Spektrum der allgemeinen kognitiven Fähigkeit verteilen oder nur für bestimmte Fähigkeitsniveaus zu finden sind. Diese Frage wird in den Analysen zur schulformspezifischen Differenzierungshypothese detailliert untersucht.

8.2.2 Methode

▼ 169 

Bei den Differenzierungshypothesen werden Unterschiede in der Heterogenität der mathematikspezifischen Fähigkeit in Abhängigkeit vom Fähigkeitsniveau (Hypothese 2a) sowie in Abhängigkeit vom Fähigkeitsniveau und der Schulform (Hypothese 2b) untersucht. Für die Analysen zur Differenzierungshypothese existiert keine Standardprozedur. Carlstedt (2001) hat eine elegante vierschrittige Methode vorgeschlagen, die in dieser Arbeit verwendet wurde (für eine alternative Vorgehensweise, die allerdings das Problem der Invarianz der spezifischen Fähigkeit über die Gruppen nicht adressiert, siehe Deary u.a., 1996).

Nachfolgend werden die vier Schritte erklärt. Dabei werden die zu Grunde liegenden Stichproben bei der Darstellung des zweiten Schritts, die verwendeten manifesten Variablen, die spezifizierten Modelle und die inferenzstatistischen Tests bei der Darstellung des dritten Schritts beschrieben.

(1) Schätzung von Faktorscores allgeme i ner kognitiver Fähigkeit. Zunächst wurden für das Nested-Faktormodell (Modell 7a) mit Lisrel 8.51 (Jöreskog, Sörbom, Du Toit & Du Toit, 1999) auf Basis der gesamten Analysestichprobe von 29.386 Schülern Faktorscores für die allgemeine kognitive Fähigkeit geschätzt. Diese Faktorscores hatten gegenüber regressionsanalytisch abgeleiteten Faktorscores den Vorteil, dass die korrelative Struktur (hier die Orthogonalität) der latenten Variablen auch in den Faktorscores erhalten blieb (siehe hierzu auch Grice, 2001).

▼ 170 

Einige wenige Schüler (155 von 29.386, dies entspricht 0,5%, siehe auch Anhang) hatten fehlende Werte bei einer oder mehreren der neun manifesten Variablen zur Messung kognitiver Fähigkeiten. Damit die Analysestichprobe in dieser Arbeit über die Forschungsfragen hinweg konstant blieb, wurden für diese Schüler zunächst mit dem Programm NORM (Schafer, 2000) EM-imputierte Werte als beste Punktschätzer (Graham, Cumsille & Elek-Fisk, 2003) der manifesten WLE-Scores bestimmt. Die Faktorscores dieser Schüler und ihre Zuordnung zu den Fähigkeitsgruppen basierten auf den EM-imputierten Werten. Die Modellparameter (siehe unten) basieren jedoch auf Full Information Maximum Likelihood Schätzungen auf Grundlage der Daten, in denen die Werte nicht imputiert wurden, sondern als fehlend codiert waren.

Diesem Vorgehen wurde gegenüber alternativen Vorgehensweisen zur Behandlung fehlender Werte der Vorzug gegeben:

▼ 171 

(2) Zuordnung der Schüler zu Fähigkeitsgruppen. Auf Grundlage der Daten der gesamten Analysestichprobe (N = 29.386) wurden die Faktorscores allgemeiner kognitiver Fähigkeit dazu verwendet, die Schüler in 8, 16 und 32 gleich große Fähigkeitsgruppen einzuteilen (für die Wahl dieser Gruppenanzahlen siehe Carlstedt, 2001). Anhand der Fähigkeitsgruppen wurde auf Grundlage der Analysestichprobe die generelle Differenzierungshypothese (Hypothese 2a) geprüft.

Für die Analysen zur schulformspezifischen Differenzierungshypothese wurden die Schüler innerhalb einer Fähigkeitsgruppe nochmals entsprechend ihrer Schulformzugehörigkeit eingeteilt. Damit lagen für jede Fähigkeitsgruppe fünf schulformspezifische Untergruppen vor.

Zur Prüfung der schulformspezifischen Differenzierung wurden nur Schüler der Schulformen Hauptschule, Realschule und Gymnasium ausgewählt, weil an diesen Schulformen die institutionelle Trennung eindeutig mit der Leistungsgruppierung einherging. Weiterhin wurden nur schulformspezifische Fähigkeitsgruppen in die Analysen eingeschlossen, die jeweils von mindestens 100 Schülern besetzt waren (vgl. Abb. 21). So wurde sichergestellt, dass die geschätzte schulformspezifische Varianz der mathematikspezifischen Fähigkeiten auf einer ausreichend großen Fallzahl beruhte.

▼ 172 

Abbildung 21: Verteilung der Schüler über die Fähigkeitsgruppen in Abhängigkeit von der Schulform

Insgesamt basierten die Analysen zur schulformspezifischen Differenzierungshypothese auf einer Stichprobe von 4.432 Hauptschülern, 7.077 Realschülern sowie 8.778 Gymnasiasten. Daten von insgesamt 191 Schülern (dies waren Hauptschüler aus den Fähigkeitsgruppen 7 und 8 der Hauptschule und Gymnasiasten der Fähigkeitsgruppen 1 und 2) wurden nicht berücksichtigt. Innerhalb der schulformspezifischen Fähigkeitsgruppen war mit Ausnahme der Extremgruppen das schulformspezifische Niveau der allgemeinen kognitiven Fähigkeit weitestgehend identisch (siehe Anhang).

(3) Konfirmatorische Mehrgruppen-Faktorenanalysen. Zur Analyse der generellen Differenzierungshypothese (Hypothese 2a) wurden konfirmatorische Mehrgruppen-Faktorenanalysen mit 8, 16 und 32 Fähigkeitsgruppen als Gruppierungsvariable durchgeführt (Abb. 22a, in dieser Abbildung ist nur das Modell für 8 Fähigkeitsgruppen dargestellt).

▼ 173 

Die schulformspezifische Differenzierungshypothese konnte nur auf Grundlage von maximal 8 schulformspezifischen Fähigkeitsgruppen geprüft werden (Abb. 22b), da Mplus 3.01 aufgrund einer programmbedingten Beschränkung der Gruppenanzahl keine Differenzierung in 16 oder 32 schulformspezifische Fähigkeitsgruppen zuließ. Die Tatsache, dass einige schulformspezifische Fähigkeitsgruppen von den Analysen ausgeschlossen wurden, ist in Abbildung 22b durch die leeren Felder bei den Fähigkeitsgruppen 7 und 8 bei der Hauptschule und den leeren Felder 1 und 2 für das Gymnasium dargestellt.

Durch die Verwendung der Fähigkeitsgruppen als Gruppierungsvariable wurde die Varianz der allgemeinen kognitiven Fähigkeit (mit Ausnahme der beiden Extremgruppen) weitestgehend konstant gehalten (siehe Anhang). Der Versuch scheiterte, zusätzlich modellbasiert innerhalb der Fähigkeitsgruppen für interindividuelle Unterschiede in der allgemeinen kognitiven Fähigkeit zu kontrollieren: In einem Nested-Faktormodell, in dem nur vier Fähigkeitsgruppen unterschieden wurden, wurden für drei von vier Gruppen negative Faktorvarianzen von allgemeiner kognitiver Fähigkeit geschätzt. Bei einer noch differenzierteren Fähigkeitsgruppierung ist davon auszugehen, dass dieses Problem noch verstärkt auftreten würde (siehe Carlstedt, 2001, S. 597–598, der ein ähnliches Problem beschreibt).

Aus diesem Grund wurde – wie bei Carlstedt – kein vollständiges Nested-Faktormodell spezifiziert. Die Varianz der mathematikspezifischen Fähigkeit wurde auf Grundlage der vier stoffgebietsspezifischen WLE-Scores im Rahmen eines einfaktoriellen Mehrgruppen-Modells mit den Fähigkeitsgruppen als Gruppierungsvariable analysiert (Abb. 22a und 22b).

▼ 174 

Zur inferenzstatistischen Absicherung der beiden Differenzierungshypothesen wurden drei Modellvarianten -a, -b und -c analysiert:

Abbildung 22: Modell zur Prüfung der Differenzierungshypothesen

▼ 175 

Wie bei Carlstedt wurde zunächst Variante -a, dann -b und zuletzt -c geprüft. Da die latenten Mittelwerte der mathematikspezifischen Fähigkeit für die Analyse der Differenzierung nicht von Interesse waren, konnten analog zu Carlstedt (2001) die Intercepts der manifesten Variablen über die Gruppen hinweg in allen drei Modellvarianten variieren.

(4) Simulation von Daten. Als eine zusätzliche Vergleichsmarke zur Absicherung der generellen Differenzierungshypothese wurde eine Stichprobe von 29.386 „Personen“ mit Mplus 3.01 generiert. In der Population, aus der diese Stichprobe stammte, galt das Nested-Faktormodell. Im Simulationsmodell wurde aber keine generelle Differenzierung der mathematikspezifischen Fähigkeit spezifiziert. Zur Simulation der Daten wurden alle Populationsparameter auf die unstandardisierten Modellparameter fixiert, die auf Grundlage der vollständigen Analysestichprobe von 29.386 Schülern für das Nested-Faktormodell (Modell 7a der ersten Forschungsfrage) geschätzt wurden. Auf Basis der simulierten Daten wurden die drei Analyseschritte nach der Methode von Carlstedt durchgeführt.

8.2.3 Ergebnisse

▼ 176 

Zunächst werden die Ergebnisse der generellen Differenzierungshypothese dargestellt. Daran schließen die Ergebnisse zur schulformspezifischen Differenzierungshypothese an.

(1) Generelle Differenzierungshypothese.Zur Prüfung der generellen Differenzierungshypothese war es zunächst notwendig, den Modell-Fit zu evaluieren. Wenn dieser für die Modellvariante -c akzeptabel war, konnte im nächsten Schritt die Varianz der mathematikspezifischen Fähigkeit in Abhängigkeit vom Fähigkeitsniveau analysiert werden.

Modellevaluation. Von den drei Modellvarianten wies – gemessen an den deskriptiven Fit-Indizes – die Modellvariante -c insgesamt den besten Modell-Fit auf (Tab. 21). Dieses Befundmuster zeigte sich für 8, 16 und 32 Fähigkeitsgruppen. Der etwas niedrige Wert des CFI (bei allen drei Fähigkeitsgruppen) konnte dadurch erklärt werden, dass insgesamt gesehen die stoffgebietsspezifischen WLE-Scores nur gering interkorrelierten. Aus den niedrigen Interkorrelationen folgte, dass bereits das Baseline-Modell, in dem die manifesten Variablen nicht interkorrelierten, relativ guten Modell-Fit aufwies. Gleichzeitig konnte nur ein geringer Anteil der Varianz durch den Faktor erklärt werden, der die mathematikspezifische Fähigkeit repräsentierte. Die inkrementelle Verbesserung des Modell-Fits durch die Aufhebung der Restriktion fähigkeitsgruppenübergreifender gleicher Varianzen von M´ war damit in Relation zum Baseline-Modell gering. Dies schlug sich in dem CFI-Wert von .89 nieder (siehe auch Brunner & Süß, 2005 für diese Argumentation). Betrachtete man aber zusätzlich zum CFI noch die absolute Abweichung von modell implizierten und empirischen Daten (gemessen durch den SRMR), so war ersichtlich, dass die Modellvariante -c die empirischen Relationen gut approximierte. Diese Schlussfolgerung wurde auch durch den Wert des RMSEA gestützt.

▼ 177 

Tabelle 21:Generelle Differenzierungshypothese der mathematikspezifischen Fähigkeit: Deskriptive Modell-Fit-Indizes für die Analysestichprobe

Modell

χ2

df

SF

CFI

RMSEA

SRMR

       

8 Fähigkeitsgru p pen

             

Modell -a

1.066

 

72

 

1.117

.65

.06

.08

     

Modell -b

660

 

44

 

1.052

.79

.06

.05

     

Modell -c

357

 

37

 

1.021

.89

.05

.03

     
              

16 Fähigkeitsgru p pen

             

Modell -a

912

 

152

 

1.109

.66

.05

.07

     

Modell -b

478

 

92

 

1.037

.83

.05

.04

     

Modell -c

338

 

77

 

1.017

.88

.04

.03

     
              

32 Fähigkeitsgru p pen

             

Modell -a

1.001

 

312

 

1.107

.66

.05

.07

     

Modell -b

515

 

188

 

1.036

.84

.04

.04

     

Modell -c

398

 

157

 

1.022

.88

.04

.03

     

Alle χ2-Goodness-of-Fit-Statistiken waren signifikant (p < .001). Für eine Beschreibung der Modellspezifikation siehe Abschnitt 8.2.2.

              
             
             

Tabelle 22:Generelle Differenzierungshypothese: Deskriptive Modell-Fit-Indizes für die
simulierten Daten

Modell

χ2

df

CFI

RMSEA

SRMR

8 Fähigkeitsgru p pen

       

Modell -a

404

 

72

 

.89

.04

.05

Modell -b

324

 

44

 

.91

.04

.04

Modell -c

99

 

37

 

.98

.02

.02

        

16 Fähigkeitsgru p pen

       

Modell -a

278

 

152

 

.95

.02

.03

Modell -b

198

 

92

 

.95

.03

.03

Modell -c

121

 

77

 

.98

.02

.02

        

32 Fähigkeitsgru p pen

       

Modell -a

406

 

312

 

.95

.02

.04

Modell -b

249

 

188

 

.97

.02

.03

Modell -c

186

 

157

 

.99

.01

.02

Für eine Beschreibung der Modellspezifikation siehe Abschnitt 8.2.2.

Modellevaluation der simulierten Daten. Auch bei den simulierten Daten stützten die Werte des CFI, des RMSEA und des SRMR Modellvariante -c, die letztlich als beste Approximation betrachtet wurde (Tab. 22).

▼ 178 

Die Evaluation der realen und der simulierten Daten zeigte also, dass jeweils das Modell -c, in dem die Varianzen der mathematikspezifischen Fähigkeit über die Fähigkeitsgruppen hinweg variieren konnten, die realen oder simulierten Daten am besten approximierte. Doch stützten die Ergebnisse auch die generelle Differenzierungshypothese?

Generelle Differenzierung der mathematikspezifischen Fähigkeit. Die deskriptive Zunahme der Faktorvarianz der mathematikspezifischen Fähigkeit mit zunehmendem Fähigkeitsniveau in Abbildung 23 zeigte, dass die Differenzierung der mathematikspezifischen Fähigkeit in der Analysestichprobe vorzufinden war.27 Dieser Befund konnte auch anhand einer Stichprobe repliziert werden, in der sich nur die Daten der Schüler befanden, die zur Prüfung der schulformspezifischen Differenzierungshypothese verwendet wurden (siehe Abb. 25).

Abbildung 23: Generelle Differenzierungshypothese der mathematikspezifischen Fähigkeit (M´)

▼ 179 

Der Graph für die Stichprobe mit den simulierten Daten (Abb. 23, Spalte „simulierte Daten“), zeigte, dass – wie zu erwarten – keine Differenzierung der mathematikspezifischen Fähigkeit vorzufinden war, da diese nicht explizit im Simulationsmodell spezifiziert wurde. Trotz identischer Modellparameter war also die Differenzierung der mathematikspezifischen Fähigkeit mit zunehmendem Fähigkeitsniveau nur in den realen Daten vorzufinden.

Wichtig bei der Analyse von Abbildung 23 ist aber zu beachten, dass die Faktorvarianzen nicht fähigkeitsgruppenübergreifend oder zwischen den realen und simulierten Daten verglichen werden konnten. Der Grund hierfür war, dass die unstandardisierten Faktorladungen sich zwischen den Modellen für die unterschiedliche Fähigkeitsgruppenanzahl bei den realen sowie den simulierten Daten unterschieden. Somit waren die Faktoren, die die mathematikspezifische Fähigkeit repräsentieren, fähigkeitsgruppen- und stichprobenübergreifend nicht metrisch invariant.

Die deskriptive Zunahme der Faktorvarianz von M´ konnte auch inferenzstatistisch durch einen Vergleich der χ2-Differenzen abgesichert werden (Tab. 23): Dies indizierte die signifikante Verbesserung des χ2-Goodness-of-Fit-Tests beim Übergang von Modellvariante -b zu Modellvariante c. Die generelle Differenzierungshypothese (Hypothese 2a) wurde somit deskriptiv und inferenzstatistisch gestützt.

▼ 180 

Tabelle 23:Inferenzstatistische Prüfung der generellen Differenzierungshypothese

Modellvergleich

Δχ2

Δdf

8 Fähigkeitsgruppen

  

Modell -a versus Modell -b

407*

28

Modell -b versus Modell -c

272*

  7

   

16 Fähigkeitsgruppen

  

Modell -a versus Modell -b

423*

60

Modell -b versus Modell -c

134*

15

   

32 Fähigkeitsgruppen

  

Modell -a versus Modell -b

473*

124

Modell -b versus Modell -c

115*

  31

* p < .05.

Zur Berechnung der χ2-Differenz wurde die Korrekturformel aus dem technischen Anhang von Mplus verwendet (Muthén & Muthén, 1998–2004a, S. 22).

 
 

(2) Schulformspezifische Differenzierungshypothese. Wie auch bei der Analyse der generellen Differenzierungshypothese, wurde bei Prüfung der schulformspezifischen Differenzierungshypothese zunächst der Modell-Fit der spezifizierten Modelle evaluiert.

Modellevaluation. Von den drei Modellvarianten wies gemessen an den deskriptiven Fit-Indizes die Modellvariante -c den besten Modell-Fit auf (Tab. 24).

▼ 181 

Tabelle 24:Schulformspezifische Differenzierungshypothese: Deskriptive Modell-Fit-Indizes

Modell

χ2

df

SF

CFI

RMSEA

SRMR

Modell -a

1.145

192

1.120

.57

.07

.10

Modell -b

   706

116

1.036

.74

.07

.06

Modell -c

   396

97

1.007

.87

.06

.04

Für eine Beschreibung der Modellspezifikation siehe Abschnitt 8.2.2. SF = Skalierungsfaktor.

       
       

Der etwas niedrige Wert des CFI konnte – wie auch bei den Analysen zur generellen Differenzierungshypothese (siehe oben) – dadurch erklärt werden, dass insgesamt gesehen die stoffgebietsspezifischen WLE-Scores nur gering interkorrelierten. Dies schlug sich in dem CFI-Wert von .87 nieder. Betrachtete man aber zusätzlich zum CFI noch die absolute Abweichung von modellimplizierten und empirischen Daten (gemessen durch den SRMR), so war ersichtlich, dass die Modellvariante -c die empirischen Relationen gut approximierte. Diese Schlussfolgerung wurde auch durch den Wert des RMSEA gestützt. Da sich der Modell-Fit gemessen durch den CFI, RMSEA und SRMR jeweils von der Modellvariante -a über -b hin zu -c verbesserte (oder zumindest gleich blieb), wurde letztlich Modellvariante -c favorisiert.

Diese Verbesserungen des Modell-Fits waren auch statistisch signifikant. So führte das Aufheben der Restriktion gleicher Residualvarianzen (Modell -a vs. -b) zu einer signifikanten Verbesserung des Modell-Fits (Δχ2 = 329, df = 28, p < .001). Der inferenzstatistische Vergleich der Modelle -b und -c zeigte auch, dass die Varianzen von M´ in den schulformspezifischen Fähigkeitsgruppen nicht gleich groß waren (Δχ2 = 239, df = 7, p < .001). Doch war die Differenzierung im Sinne von Hypothese 2b von der Schulform abhängig?

▼ 182 

Schulformspezifische Differenzierung der mathematikspezifischen Fähigkeit. Abbildung 24 stellt die Ergebnisse zur schulformspezifischen Differenzierung dar. Hierbei ist zu beachten, dass die Abnahme der Varianz von M´ von Fähigkeitsgruppe 1 auf 2 für Realschüler und Hauptschüler sowie die Zunahme der Differenzierung von Fähigkeitsgruppe 7 auf 8 für Realschüler und Gymnasiasten nur eingeschränkt interpretiert werden können, da in die Varianz der mathematikspezifischen Fähigkeit für diese Schülergruppen auch Varianz der allgemeinen kognitiven Fähigkeit einging (vgl. Anhang).

Als globaler inferenzstatistischer Test, ob die Differenzierung der mathematikspezifischen Fähigkeit von der Schulform abhängig war, wurde Modell -c mit einem Modell verglichen, in dem die Varianz von M´ für Schüler gleicher Fähigkeitsgruppen schulformübergreifend auf den gleichen Wert fixiert wurde. Die resultierende χ2-Differenz (Δχ2 = 27, df = 12, p < .01) war statistisch signifikant. Damit konnte auf einer allgemeinen Ebene geschlussfolgert werden, dass Schüler gleicher Fähigkeitsgruppen, aber unterschiedlicher Schulformen nicht die gleiche Differenzierung der mathematikspezifischen Fähigkeit aufwiesen.

Jedoch war – wie die deskriptive Analyse von Abbildung 24 zeigte – die Differenzierung nur für Schüler im jeweils unteren schulformspezifischen Fähigkeitsspektrum unterschiedlich: Die Heterogenität der mathematikspezifischen Fähigkeit von Gymnasiasten war im unteren Fähigkeitsspektrum (Fähigkeitsgruppen 3 und 4) tendenziell größer als bei Schüler der anderen beiden Schulformen. Weiterhin war die mathematikspezifische Varianz von Realschülern in den Fähigkeitsgruppen 1 und 2 größer als bei Hauptschülern. Jedoch verschwanden die Unterschiede in der Differenzierung zwischen der Realschule und der Hauptschule nahezu in den Fähigkeitsgruppen 3 und 4, bzw. Schüler aller drei Schulformen wiesen für Fähigkeitsgruppe 5 und 7 nahezu die gleiche Differenzierung der mathematikspezifischen Fähigkeit auf. Erwartungswidrig kehrte sich die Differenzierung in Fähigkeitsgruppe 6 sogar um: Hier war die Differenzierung bei Hauptschülern etwas stärker als bei Realschülern und Letztere wiederum war etwas stärker als bei Gymnasiasten.

▼ 183 

Abbildung 24: Differenzierung der mathematikspezifischen Fähigkeit in Abhängigkeit des
Fähigkeitsniveaus und der Schulformzugehörigkeit

Zur inferenzstatistischen Prüfung der unterschiedlichen schulformspezifischen Differenzierung (innerhalb einer Fähigkeitsgruppe) wurde Modell -c mit einem Modell verglichen, in dem ein Varianzpaar von zwei Schulformen innerhalb derselben Fähigkeitsgruppe auf den gleichen Wert fixiert wurde. Die Faktorvarianzen von M´ in den restlichen Fähigkeitsgruppen wurden frei geschätzt. Eine signifikante χ2-Differenz indizierte eine ungleiche schulformspezifische Differenzierung der mathematikspezifischen Fähigkeit innerhalb einer Fähigkeitsgruppe.

Von den insgesamt 16 Paarvergleichen waren nur drei statistisch signifikant (Tab. 25). Dies waren die Vergleiche der Faktorvarianzen von M´ zwischen Haupt- und Realschülern in den Fähigkeitsgruppen 1 und 2 sowie der Vergleich von Realschülern und Gymnasiasten in der Fähigkeitsgruppe 4. Für alle anderen Vergleiche der Faktorvarianzen zwischen den Schulformen konnte nicht zufallskritisch geschlussfolgert werden, dass sich die Differenzierung der mathematikspezifischen Fähigkeit signifikant unterschieden hatte.

▼ 184 

Tabelle 25:Inferenzstatistische Prüfung der schulformspezifischen Differenzierungshypothese

Vergleich

χ2

SF

Δχ2

Δdf

Fähigkeitsgruppe 1

    

σ2 (HS) = σ2 (RS)

403

1,010

5,66*

1

     

Fähigkeitsgruppe 2

    

σ2 (HS) = σ2 (RS)

407

1,009

9,32*

1

     

Fähigkeitsgruppe 3

    

σ2 (HS) = σ2 (RS)

396

1,009

0,16

1

σ2 (HS) = σ2 (GY)

396

1,011

1,04

1

σ2 (RS) = σ2 (GY)

396

1,011

0,76

1

     

Fähigkeitsgruppe 4

    

σ2 (HS) = σ2 (RS)

396

1,008

0,10

1

σ2 (HS) = σ2 (GY)

400

1,009

3,39

1

σ2 (RS) = σ2 (GY)

401

1,011

4,57*

1

     

Fähigkeitsgruppe 5

    

σ2 (HS) = σ2 (RS)

397

1,006

0,37

1

σ2 (HS) = σ2 (GY)

397

1,006

0,08

1

σ2 (RS) = σ2 (GY)

396

1,008

0,29

1

     

Fähigkeitsgruppe 6

    

σ2 (HS) = σ2 (RS)

397

1,005

0,11

1

σ2 (HS) = σ2 (GY)

398

1,005

0,95

1

σ2 (RS) = σ2 (GY)

397

1,007

0,93

1

     

Fähigkeitsgruppe 7

    

σ2 (RS) = σ2 (GY)

397

1,007

0,47

1

     

Fähigkeitsgruppe 8

    

σ2 (RS) = σ2 (GY)

398

1,006

0,75

1

* p < .05.

Zur Berechnung der χ2-Differenz wurde die Korrekturformel aus dem technischen Anhang von Mplus verwendet (Muthén & Muthén, 1998–2004a, S. 22). SF = Skalierungsfaktor.

     
     

8.2.4 Diskussion

Die wichtigsten Ergebnisse der Analysen der beiden Differenzierungshypothesen können wie folgt zusammengefasst werden:

▼ 185 

Nachfolgend werden zwei Fragen zu diesen Ergebnissen erörtert:

  1. Wie können die Ergebnisse zur schulformspezifischen Differenzierung erklärt werden?
  2. Wie können die Ergebnisse zur schulformspezifischen und generellen Differenzierung in Einklang gebracht werden?

(1) Schulformspezifische Differenzierungshypothese. Die schulformspezifische Differenzierungshypothese wurde in Anlehnung an Abad und Kollegen (2003) dadurch erklärt, dass Schüler mit höherem Fähigkeitsniveau in der Regel höhere Schulformen besuchen und dort bessere Investitionsmöglichkeiten für ihre allgemeine kognitive Fähigkeit vorfinden (siehe auch Jensen, 1998). Wenn Schüler das gleiche Niveau allgemeiner kognitiver Fähigkeit erreichen, sollten die Schüler an höheren Schulformen eine stärkere Differenzierung der mathematikspezifischen Fähigkeit aufweisen.

▼ 186 

Angesichts der Ergebnisse der vorliegenden Arbeit scheint diese Erklärung nur für die jeweils leistungsschwächeren Schüler (indiziert durch die schulformspezifische Fähigkeitsgruppe) der jeweiligen Schulform zu greifen: Realschüler in den Fähigkeitsgruppen 1 und 2 wiesen eine stärkere Differenzierung auf als Hauptschüler dieser Fähigkeitsgruppen. Gymnasiasten der Fähigkeitsgruppen 3 und 4 wiesen zumindest deskriptiv eine stärkere Differenzierung auf als Realschüler und Hauptschüler. Man kann dieses Befundmuster so interpretieren, dass schulformspezifische Lernangebote insbesondere die schwächeren Schüler an Realschulen und Gymnasien zur Investition ihrer allgemeinen kognitiven Fähigkeit anregen: Schüler dieser Schulformen nutzen diese Lernangebote differenziell in Abhängigkeit von ihrem Niveau allgemeiner kognitiver Fähigkeit.

Ab einschließlich Fähigkeitsgruppe 3 nahm mit zunehmendem Fähigkeitsniveau bei Haupt- und Realschülern sowie ab Fähigkeitsgruppe 6 (wenn auch nur schwach) bei Gymnasiasten die Varianz der mathematikspezifischen Fähigkeit tendenziell zu. Weiterhin war die Differenzierung in diesen Fähigkeitsgruppen schulformübergreifend nahezu in gleicher Weise ausgeprägt. Möglicherweise greift in allen diesen Schulformen die Erklärung, die auch für die generelle Differenzierungshypothese der mathematikspezifischen Fähigkeit gegeben wurde: Mit Jensen (1998) kann man die Differenzierung dadurch erklären, dass Schüler unterschiedlichen Fähigkeitsniveaus (unabhängig von der Schulform) sich darin unterscheiden, inwiefern sie problemlöserelevantes Mathematikwissen prozeduralisiert haben. Dieser Mechanismus ersetzt oder überlagert möglicherweise den Mechanismus unterschiedlicher Investitionsmöglichkeiten in Abhängigkeit von der Schulform.

(2) Schulformspezifische und generelle Differenzierung. Wie können die Ergebnisse zur schulformspezifischen und generellen Differenzierung in Einklang gebracht werden? Ergebnis der Analysen zur generellen Differenzierungshypothese war, dass mit zunehmendem Fähigkeitsniveau die Differenzierung der mathematikspezifischen Fähigkeit zunahm. Betrachtet man hingegen Abbildung 24, so ist diese generelle Differenzierung nicht unmittelbar ersichtlich. Hierbei ist jedoch zu bedenken, dass die schulformspezifischen Fähigkeitsgruppen nicht mit der gleichen Schülerzahl besetzt waren (vgl. Abb. 21). Weiterhin nahm die Differenzierung der mathematikspezifischen Fähigkeit schulformübergreifend in höheren Fähigkeitsgruppen zu. Bei den Analysen zur generellen Differenzierungshypothese überlagerte sich die Differenzierung von M´ der verschiedenen Schulformen: Die Schüler gingen gewichtet entsprechend der schulformspezifischen Fähigkeitsgruppengröße in die Berechnung der Varianz von M´ ein. Diese Gewichtung führte zur generellen Differenzierung.

▼ 187 

Abbildung 25 veranschaulicht dies: In der Abbildung ist zum einen die generelle Differenzierung für 8 Fähigkeitsgruppen eingezeichnet, wie sie für die Stichprobe zur Analyse der schulformspezifischen Differenzierung bestimmt wurde (die Schulformzugehörigkeit wurde also bei den Analysen nicht berücksichtigt). Zum anderen ist eine geschätzte Differenzierung von M´ für diese Stichprobe als gestrichelte Linie eingezeichnet, in der die schulformspezifische Differenzierung von M´ mit der schulformspezifischen Fähigkeitsgruppengröße gewichtet wurde. Man sieht, dass die Kurven nahezu identisch sind. Allerdings ist bei Abbildung 25 zu beachten, dass es nicht möglich ist, die Absolutwerte der Faktorvarianzen von M´ der geschätzten Differenzierung mit der tatsächlichen Differenzierung zu vergleichen. Der Grund hierfür ist, dass die Metrik der mathematikspezifischen Fähigkeit zwischen den beiden Modellen nicht vergleichbar war, da sich die korrespondierenden (unstandardisierten) Faktorladungen zwischen den beiden Modellen unterschieden. Dennoch zeigt der nahezu parallele Verlauf beider Linien den Effekt der Gewichtung der schulformspezifischen Differenzierung der mathematikspezifischen Fähigkeit recht deutlich.

Abbildung 25: Gegenüberstellung der aus dem Modell zur schulformspezifischen Differenzierung der mathematikspezifischen Fähigkeit geschätzten und der tatsächlichen Differenzierung in dieser Stichprobe

Die Annahme, dass sich Unterschiede in der schulformspezifischen Differenzierung bei der generellen Differenzierung überlagern, wurde auch durch die Ergebnisse zum Nested-Faktormodell im Rahmen der Mehrgruppen-Faktorenanalyse in Abschnitt 8.1 gestützt. Es zeigte sich, dass die „mittlere“ Heterogenität der Schüler hinsichtlich ihrer mathematikspezifischen Fähigkeit von der Hauptschule über die Realschule hin zum Gymnasium zunahm. Nun ist zu bedenken, dass der Besuch höherer Schulformen mit einem höheren Niveau allgemeiner kognitiver Fähigkeit einherging (vgl. Abb. 19). Daraus folgte, dass – wenn die Schulform nicht berücksichtigt wurde – mit zunehmendem Fähigkeitsniveau die Differenzierung der mathematikspezifischen Fähigkeit zunahm.

▼ 188 

Insgesamt gesehen kann spekuliert werden, ob die generelle Differenzierung der mathematikspezifischen Fähigkeit durch die Überlagerung von zwei Mechanismen zu Stande kommt:

Die Vermutung einer Überlagerung beider Mechanismen ist wie gesagt spekulativ und bedarf weiterer Forschung und natürlich der Replikation. Einige methodische Überlegungen werden hierzu im Rahmen der Gesamtdiskussion erörtert.

8.3 Zusammenfassende Diskussion zu Schulformunterschieden

▼ 189 

Die zweite Forschungsfrage beschäftigte sich in erster Linie mit Schulformunterschieden bei den kognitiven Fähigkeiten mathematischer Schülerleistung. Im Rahmen der Gesamtdiskussion soll nun die Frage erörtert werden, welche methodischen Anforderungen idealerweise erfüllt sein sollten, um Schulformunterschiede zu analysieren.

In der vorliegenden Arbeit wurden Mittelwertunterschiede der kognitiven Fähigkeiten der mathematischen Schülerleistung sowie Unterschiede in der Heterogenität der mathematikspezifischen Fähigkeit zwischen den Schulformen untersucht. Für diese Analysen und eine eindeutige Interpretation der Ergebnisse müssen einige zentrale Voraussetzungen erfüllt sein. Diese werden nachfolgend weiter erörtert.

Messinvarianz. Die wichtigste Voraussetzung für die Analyse von Schulformunterschieden ist die Invarianzprüfung der verwendeten Strukturmodelle. Erst diese ermöglicht es, Schulformvergleiche auf eine methodisch solide Basis zu stellen. In der bisherigen Forschung zu Schulformvergleichen ist bisher nicht in Frage gestellt worden, ob schulformübergreifend das gleiche Strukturmodell die empirischen Relationen ausreichend gut approximiert. Dies trifft für die methodisch sehr fundierten Analysen aus BIJU, TIMSS und PISA genauso zu wie für Analysen aus den Längsschnittuntersuchungen SCHOLASTIK (z.B. Schneider & Stefanek, 2004) oder LAU (Lehmann, Hunger, Ivanov & Gänsfuß, 2004). Wenn Unterschiede zwischen den Schulformen oder Bildungsgängen untersucht wurden (z.B. Lind & Knoche, 2004), wurden diese im Rahmen von differenziellen Itemfunktionen analysiert (DIF, für einen Überblick siehe z.B. Glöckner-Rist & Hoijtink, 2003; Raju, Laffitte & Byrne, 2002). Bei Verwendung eines eindimensionalen Raschmodells wie in der Arbeit von Knoche und Lind wird aber per se davon ausgegangen, dass alle Items (schulformübergreifend) in gleicher Weise von einer latenten Variablen beeinflusst werden. Die substanzielle Frage (siehe hierzu die Ableitung der Invarianzbedingungen in Abschnitt 7.1.2), ob tatsächlich die Struktur (im Sinne von Faktorladungen oder Itemdiskriminationsparametern) als schulformübergreifend invariant angenommen werden kann, wurde nicht untersucht.

▼ 190 

Dies ist auch eine Einschränkung, die auf die Analysen in dieser Arbeit zutrifft: Alle WLE-Scores wurden unter der Annahme schulformübergreifend geltender IRT-Modelle (Raschmodelle für den PISA-Mathematiktest sowie Birnbaummodelle für die Skalen zur Messung der fluiden Fähigkeit anhand der Aufgaben aus dem KFT) geschätzt oder aus den bisherigen Auswertungen von PISA übernommen (PISA-Lesetest). Trotz methodischer Bedenken sprachen vor allem zwei Gründe dafür:

Die Frage, ob die Niveauunterschiede zwischen den Schulformen für alle Aufgaben des PISA-Mathematiktests bestehen oder nur für einige wenige, ist empirisch gesehen noch offen. Ein zentraler Leitgedanke bei zukünftigen DIF-Analysen sollte sein, die erwarteten Unterschiede in den Itemschwierigkeiten und Itemdiskriminationsparametern a priori aufgrund theoretischer Annahmen zu formulieren (z.B. auf Grundlage der Annahme unterschiedlicher Unterrichtskulturen, siehe Klieme & Baumert, 2001) und konfirmatorisch zu prüfen (für eine elegante Methode siehe z.B. Glöckner-Rist & Hoijtink, 2003).

▼ 191 

Längsschnittliche Studien zur Unterrichtsforschung. In dieser Arbeit wurde ein querschnittlicher Analyseansatz zur Analyse der Differenzierungshypothesen verwendet. In der Diskussion der Ergebnisse in Abschnitt 8.2.4 wurde spekuliert, ob die generelle Differenzierung aufgrund der Überlagerung von zwei „Mechanismen“ zu Stande kommen kann.

Der erste Mechanismus ging von schulformspezifischen Niveauunterschieden der Investitionsmöglichkeiten im Mathematikunterricht aus, die die Schüler zur differenziellen Investition ihrer allgemeinen kognitiven Fähigkeit anregen. Inwiefern dieser Mechanismus greift, sollte im Rahmen von längsschnittlichen Studien analysiert werden, in denen kognitive und motivationale Schülermerkmale sowie Indikatoren des Mathematikunterrichts erhoben werden. Um leistungsförderliche Aspekte des Mathematikunterrichts zu quantifizieren, ist es optimal, diese Aspekte aus verschiedenen Beobachtungsperspektiven zu erfassen, um ein möglichst umfassendes Bild des Unterrichts zu gewinnen und die differenzielle Validität der verschiedenen Perspektiven für unterschiedliche Zielkriterien des Unterrichts zu berücksichtigen (Clausen, 2002).

Für die statistische Auswertung bieten sich dann Mehrebenen-Modelle an (siehe hierzu z.B. Snijders & Bosker, 1999), wie sie beispielsweise mit dem Programm Mplus (Muthén & Muthén, 1998–2004b) spezifiziert werden können. Wenn Niveauunterschiede der Lernangebote im Mathematikunterricht zur differenziellen Nutzung führen, dann sollte (im Kontext von Random-Slope-Modellen) das Gewicht der allgemeinen kognitiven Fähigkeit zur Vorhersage der mathematischen Fähigkeiten mit einer Steigerung des Niveaus lernförderlicher Aspekte des Mathematikunterrichts ebenfalls zunehmen.

▼ 192 

Der zweite Mechanismus zur Erklärung der Differenzierung der mathematikspezifischen Fähigkeit ist eine differenzielle Nutzung der Lernangebote im Mathematikunterricht (unabhängig vom Niveau dieser Lernangebote), die zu einer verstärkten Prozeduralisierung problemlöserelevanten Mathematikwissens führen kann. Indikativ für die differenzielle Nutzung der Lernangebote sind unterschiedliche Regressionsgewichte der Unterrichtsmerkmale zur Vorhersage des Lernzugewinns bei mathematischen Fähigkeiten in Abhängigkeit des Fähigkeitsniveaus der allgemeinen kognitiven Fähigkeit. Als Auswertungsmethode bieten sich Mehrebenen-Mehrgruppenmodelle an, die mit Mplus (Muthén & Muthén, 1998–2004b) analysiert werden können.

Für die Prüfung beider Mechanismen sind zum Beispiel die Daten aus der Längsschnittstudie PISA-I-Plus (Prenzel, Drechsel, Carstensen & Ramm, 2004) und dem daran angedockten COACTIV-Projekt (Krauss u.a., 2004) gut geeignet.

Vor dem Hintergrund der diskutierten methodischen Gesichtspunkte ist klar, dass die Analysen in der vorliegenden Arbeit insbesondere den letzten Punkt „Längsschnittstudien zur Unterrichtsforschung“ nicht erfüllen. Dennoch können diese Analysen die Lehr-Lern-Forschung stimulieren. Insbesondere die möglichen Auswirkungen auf die Heterogenität der Schülerschaft aufgrund einer differenziellen Nutzung der Lernangebote (wie auch die Prüfung von Invarianzannahmen der verwendeten Strukturmodelle) blieben in den bisher methodisch besten Studien (Clausen, 2002; Gruehn, 2000; Kunter, 2005) ausgespart. Im Vordergrund stand der durchschnittliche Effekt von Unterrichtsmerkmalen auf kognitive oder motivationale Zielkriterien des Unterrichts. Die Abhängigkeit der Wirkung des Unterrichts von (motivationalen oder kognitiven) Schülermerkmalen wurde in diesen Studien nicht untersucht. Die Analysen in dieser Arbeit machen unter anderem auf diese Forschungslücke aufmerksam, denn die Annahme der differenziellen Nutzung ist zentral im Rahmen des Angebot-Nutzung-Modells, das in der aktuellen Lehr-Lern-Forschung dominiert (Baumert & Köller, 2000; Baumert u.a., 2004; Helmke, 2003; Schatz Koehler & Grouws, 1992).

▼ 193 

Über den Beitrag zur Lehr-Lern-Forschung hinaus konnte mit den Analysen im Rahmen der zweiten Forschungsfrage ein sehr differenziertes und methodisch fundiertes Bild über Schulformunterschiede hinsichtlich Niveau und Heterogenität der kognitiven Fähigkeiten mathematischer Schülerleistung gezeichnet werden. Bei beiden Teilfragen wurde der Zusammenhang zwischen der besuchten Schulform und den kognitiven Fähigkeiten mathematischer Schülerleistung detailliert untersucht. Damit wurde ein Schritt dahingehend gemacht, mathematische Schülerleistung aus der Perspektive eines psychologischen Konstrukts besser zu verstehen. Dies ist auch das anvisierte Ziel der Validitätsanalysen im nächsten Kapitel.


Fußnoten und Endnoten

25  Individualisierung und Schülerorientierung, wie man sie verstärkt an Hauptschulen findet, haben in der Regel eine positive Wirkung auf motivationale Zielkriterien des Unterrichts und tendenziell keine oder sogar eine negative Wirkung auf kognitive Zielkriterien (Clausen, 2002; Klieme, Schümer & Knoll, 2001; Kunter, 2005).

26  Auf die Restriktion gruppenübergreifender gleicher unstandardisierter Residualvarianzen (siehe zu den damit verbundenen Interpretationsmöglichkeiten z.B. Lubke u.a., 2003) wird an dieser Stelle nicht weiter eingegangen, da diese zur Prüfung der Hypothesen in der vorliegenden Arbeit nicht notwendig war.

27  Die Zunahme der Varianz von M´ in den beiden Extremgruppen (bei den realen und den simulierten Daten) resultierte daher, weil in diesen Gruppen die Varianz der allgemeinen kognitiven Fähigkeit nicht vollständig konstant gehalten werden konnte (siehe Carlstedt, 2001, der mit dem gleichen Problem konfrontiert war).



© Die inhaltliche Zusammenstellung und Aufmachung dieser Publikation sowie die elektronische Verarbeitung sind urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung. Das gilt insbesondere für die Vervielfältigung, die Bearbeitung und Einspeicherung und Verarbeitung in elektronische Systeme.
XDiML DTD Version 4.0Zertifizierter Dokumentenserver
der Humboldt-Universität zu Berlin
HTML-Version erstellt am:
02.08.2006