Bevor die Untersuchung, die als Grundlage für diese Masterarbeit gilt, dargestellt wird, wird zuerst eine Studie beschrieben, durch die die hier dargelegte Untersuchung angeregt und motiviert wurde. Daraufhin folgt die Schilderung und Argumentation für die Untersuchungshypothesen und Fragestellungen, die untersucht bzw. beantwortet werden sollen. Nachdem das Erhebungsinstrument, der Ablauf der Untersuchung und die Auswahl der Untersuchungsteilnehmerinnen und -teilnehmer erläutert und festgelegt wurden, schließt sich die Erläuterung des Versuchsplans und die Darstellung der Ergebnisse an.
Die Untersuchung, die in dieser Arbeit dargestellt wird, orientiert sich an einer Untersuchung von Gerdes und Wilbert aus dem Jahr 2009. Die Autoren gingen der Frage nach, „... welche Bezugsnormen angehende Lehrer des Förderschwerpunktes Lernen bei der Beurteilung von Schülerleistungen einsetzen, und inwiefern sie diese nach Beurteilungszielen und Leistungsniveau der Schüler differenziert anwenden.“ (Gerdes & Wilbert, 2009, S. 122). Hierzu untersuchten sie, wie sich der Bewertungskontext auf die Wahl der Bezugsnormorientierung auswirkt, und ob bei leistungsschwachen und leistungsstarken Schülerinnen und Schülern unterschiedliche Bezugsnormen angewandt werden.
Ihre erste Hypothese lautete, „... dass die Passung zwischen konkreten, situativ vorgegebenen Beurteilungszielen und der Bezugsnorm bestimmt, welche Bezugsnorm bei einer Beurteilung herangezogen wird.“ (S. 125). Da die soziale und die individuelle Bezugsnormorientierung den stärksten Kontrast zueinander aufweisen, fokussierten sich die Autoren auf diese beiden Bezugsnormen und erhoben keine Daten zur sachlichen Bezugsnormorientierung. Gerdes und Wilbert (2009) erwarteten, dass wenn das Ziel der Beurteilung eine zukünftige Förderung der Schülerinnen und Schüler ist, dass die angehenden Lehrkräfte eine individuelle Bezugsnormorientierung anwenden. Soll durch das Beurteilungsziel jedoch eine Selektion oder eine Angleichung von Leistungen an eine Vergleichsgruppe erreicht werden, so sollten die angehenden Lehrkräfte eine soziale Bezugsnorm zur Bewertung heranziehen.
Ihre zweite Hypothese lautete, „... dass unabhängig vom Bewertungsziel die Wahl der Bezugsnorm vom Leistungsstand der Schüler abhängt.“ (Gerdes & Wilbert, 2009, S. 125). Gerdes und Wilbert (2009) nahmen an, dass Studierende der Sonderpädagogik sich auf die Förderung von leistungsschwachen Schülerinnen und Schülern konzentrieren, und dass somit bei leistungsschwachen Schülerinnen und Schülern eine individuelle Bezugsnormorientierung herangezogen wird.
Die Erhebung wurde an der Universität Köln durchgeführt. Es nahmen 230 Studierende der Sonderpädagogik und 53 Studierende der Grundschulpädagogik teil (Gerdes & Wilbert, 2009). Nach einer einleitenden Instruktion folgte ein ergänzender Text, der den Bewertungskontext mit Beurteilungsziel beschrieb. Hierdurch wurde die Bedingung des Bewertungsziels geschaffen, das Einfluss auf die Wahl der Bezugsnorm haben sollte. In der Bedingung, in der die Studierenden zu einer individuellen Bezugsnormorientierung verleitet werden sollten (86 Probanden), wurde beschrieben, dass durch die Bewertung entschieden werden soll, welche Schülerinnen und Schüler an einer Förderung der Leistungsmotivation ausgewählt werden (Gerdes & Wilbert, 2009). Der genaue Text ist Anhang E zu entnehmen. In der Bedingung, in der die Studierenden zu einer sozialen Bezugsnormorientierung verleitet werden sollten (98 Probanden), wurde beschrieben, dass durch die Bewertung entschieden werden soll, welche Schülerinnen und Schüler an einem Trainingsprogramm teilnehmen, das schwächere Schülerinnen und Schüler an den Klassendurchschnitt heranführen würde. Der genaue Text ist Anhang F zu entnehmen. In der Gruppe mit der Kontrollbedingung (104 Probanden) gab es keine ergänzenden Beschreibungen zum Bewertungsziel (Gerdes & Wilbert, 2009). Alle Probanden, also auch die in der Kontrollgruppe, bekamen die Informationen, dass sie sich vorstellen sollen, in drei Klassen Mathematik zu unterrichten, jedes Halbjahr einen Mathematikleistungstest durchführen, dass in diesen Tests maximal 100 Punkte erreicht werden können) und dass sie die folgenden Testergebnisse auf einer neunstufigen Skala, von sehr positiv bis sehr negativ, beurteilen sollen (Gerdes & Wilbert, 2009). Der genaue Text ist Anhang G zu entnehmen. Daraufhin folgte die Darstellung der Testergebnisse zur Erhebung der Bezugsnormorientierung.
Zur Erhebung der Bezugsnormorientierung haben sich Gerdes und Wilbert an der Kleinen Beurteilungsaufgabe von Falko Rheinberg (1980) orientiert. Gerdes und Wilbert (2009) bemängeln an der Kleinen Beurteilungsaufgabe, dass durch die Zusammensetzung der Testergebnisse eine Urteilsverzerrung in Richtung sozialer Vergleiche vorhanden ist, da sich die Ergebnisse auf sozialer Ebene deutlich stärker unterscheiden als auf der individuellen Ebene. Diese Beurteilung hat ihren Ursprung in einem Zensierungsmodell nach Karl Josef Klauer. Klauer (1987) hat für jede Bezugsnorm eine mathematische Formel entwickelt, nach der immer eine eindeutige Note berechnet werden kann. Mit der Berechnung der Standardabweichung kann zusätzlich die Zuverlässigkeit der Notenvergabe berechnet werden. Bei der Kleinen Beurteilungsaufgabe ist die Standardabweichung der Note unter der sozialen Bezugsnorm 1.00 und unter der individuellen Bezugsnorm .40. Zwar bedeutet eine niedrige Standardabweichung, dass das Ergebnis zuverlässiger ist, jedoch führt dieser Umstand bei der Kleinen Beurteilungsaufgabe dazu, dass der Unterschied zwischen den Schülern für die Versuchsperson stärker hervorgehoben wird, als der Unterschied zwischen mehreren Testergebnissen ein und desselben Schülers (Gerdes & Wilbert, 2009). Daher haben Gerdes und Wilbert (2009) „... die Testergebnisse sowohl innerhalb als auch zwischen den Schülern so verändert, dass ein methodisch bedingter starker Urteilsbias in Richtung sozialer Vergleiche … eliminiert wird.“ (S. 126). Um „... den Einfluss des Leistungsniveaus einer Klasse auf die Anwendung der Bezugsnorm durch dir Beurteiler zu untersuchen.“ (Gerdes & Wilbert, 2009, S. 126) haben Gerdes und Wilbert das Erhebungsinstrument auf insgesamt drei Klassen ausgeweitet. Die Klassen unterschieden sich hinsichtlich des durchschnittlichen Leistungsniveaus (hoch, mittel, niedrig). Die Standardabweichung der Notenvergabe beträgt, sowohl unter individueller als auch unter sozialer Bezugsnorm, 1.0. Bei der Erhebung sollten alle Probanden alle drei Klassen in randomisierter Reihenfolge beurteilen Tabelle 2 veranschaulicht die tabellarische Darstellung aller drei Klassen.
Tabelle 2
Die drei Klassen mit den jeweiligen Testpunkten der neun Schülerinnen bzw. Schüler von Gerdes und Wilbert (übernommen von Gerdes & Wilbert, 2009, S. 127)
Gerdes und Wilbert (2009) benennen beide Hypothesen als bestätigt. Unter einem Bewertungsziel, das zum Ziel hat, Schülerinnen und Schüler zukünftig zu fördern, zogen die Studierenden vermehrt eine individuelle Bezugsnorm zur Bewertung heran. Sollten Schülerinnen und Schüler jedoch zukünftig an den Klassendurchschnitt herangeführt werden, so zogen die Studierenden bei der Beurteilung vermehrt eine soziale Bezugsnorm heran. Bei der Klasse mit niedrigem Leistungsniveau wurde zudem vermehrt eine individuelle Bezugsnorm zur Bewertung herangezogen, „... wobei ein gegenläufiger Effekt bei der sozialen Bezugsnorm nicht gefunden wurde.“ (Gerdes & Wilbert, 2009, S. 129). Folglich kamen die Autoren, in Bezug auf ihre entwickelten Hypothesen, auf wünschenswerte Ergebnisse. Allerdings berücksichtigte die Kontrollgruppe die Leistungsveränderungen der Schülerinnen und Schüler mit niedrigem Leistungsrang kaum und neigte dazu, die Schülerinnen und Schüler unter einer sozialen Bezugsnorm zu beurteilen. Gerdes und Wilbert (2009) bewerten dieses Ergebnis „... aus sonderpädagogisch-psychologischer Sicht [als] alarmierend.“ (S. 129), da Schülerinnen und Schüler, die im Vergleich zur Klasse niedrigere Leistungen haben, fortlaufend schlecht bewertet und Leistungsentwicklungen nicht sichtbar gemacht werden. „Eine Folge könnte sein, dass der Schüler seine individuelle Anstrengung nicht mehr mit der Leistungsbewertung in Zusammenhang bringt, was sich negativ auf ... die Leistungsmotivation und somit auf zukünftige Leistungen auswirkt.“ (S.129).
Wilbert und Gerdes (2009) kommen zu dem Schluss, dass die Studierenden, die an der Untersuchung teilgenommen haben, „... den Zusammenhang zwischen individueller Bezugsnorm, Motivationsförderung und deren besondere Bedeutung bei leistungsschwachen Schülern kennen. Allerdings dominiert die Anwendung sozialer Bezugsnormen insbesondere dann, wenn kein explizites Bewertungsziel vorgegeben wurde.“ (S. 129). Diese Schlussfolgerung ist sehr widersprüchlich. Wenn die Studierenden den eben genannten Zusammenhang kennen, sollten sie folglich, wenn sie bezogen auf das Bewertungsziel nicht gebunden sind, motivationsförderlich bewerten. Es stellt sich die Frage, ob die bloße Kenntnis dieses Zusammenhangs die Bewertungspraxis von Studierenden beeinflusst oder nicht? Des Weiteren kann danach gefragt werden, ob andere...