Gerechtigkeitsüberzeugungen bei der Leistungsbeurteilung: Eine Grounded-Theory-Studie mit Lehrkräften im deutsch-schwedischen Vergleich [1. Aufl. 2020] 978-3-658-28274-5, 978-3-658-28275-2

Was verstehen Lehrkräfte unter einer „gerechten Note“? Diese qualitativ-rekonstruktive Studie untersucht - orientiert an

1,686 112 6MB

German Pages XII, 681 [689] Year 2020

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Gerechtigkeitsüberzeugungen bei der Leistungsbeurteilung: Eine Grounded-Theory-Studie mit Lehrkräften im deutsch-schwedischen Vergleich [1. Aufl. 2020]
 978-3-658-28274-5, 978-3-658-28275-2

Table of contents :
Front Matter ....Pages i-xii
Einleitung (Kathleen Falkenberg)....Pages 1-17
Schulische Leistungsbeurteilung und Gerechtigkeit aus Lehrer_innenperspektive – Begriffliche Bestimmungen und sensibilisierende Konzepte der Untersuchung (Kathleen Falkenberg)....Pages 19-52
Methodologischer Rahmen und Forschungsdesign (Kathleen Falkenberg)....Pages 53-86
Konkrete Forschungsschritte (Kathleen Falkenberg)....Pages 87-122
Institutionelle Rahmung schulischer Leistungsbeurteilung in Schweden und Nordrhein-Westfalen (Kathleen Falkenberg)....Pages 123-231
Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen von Lehrkräften und Entwicklung einer gegenstandsverankerten Theorie (Kathleen Falkenberg)....Pages 233-592
Fazit und Ausblick (Kathleen Falkenberg)....Pages 593-617
Back Matter ....Pages 619-681

Citation preview

Kathleen Falkenberg

Gerechtigkeitsüberzeugungen bei der Leistungsbeurteilung Eine Grounded-Theory-Studie mit Lehrkräften im deutsch-schwedischen Vergleich

Gerechtigkeitsüberzeugungen bei der Leistungsbeurteilung

Kathleen Falkenberg

Gerechtigkeitsüberzeugungen bei der Leistungsbeurteilung Eine Grounded-Theory-Studie mit Lehrkräften im deutsch-schwedischen Vergleich

Kathleen Falkenberg Humboldt-Universität zu Berlin Institut für Erziehungswissenschaften Berlin, Deutschland Dissertation an der Humboldt-Universität zu Berlin, Kultur-, Sozial- und Bildungswissenschaftliche Fakultät, 2017 Diese Studie wurde durch die Deutsche Forschungsgemeinschaft finanziell unterstützt (Förderkennzeichen: WA 2889/1-1, Emmy-Noether-Gruppe „Unterschiedliche Welten der Meritokratie? Schulische Leistungsbeurteilung und Verteilungsgerechtigkeit in Deutschland, Schweden und England im Zeitalter der ‚standards-based reform‘“).

ISBN 978-3-658-28274-5 ISBN 978-3-658-28275-2  (eBook) https://doi.org/10.1007/978-3-658-28275-2 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen National­ bibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Springer VS © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informa­ tionen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Springer VS ist ein Imprint der eingetragenen Gesellschaft Springer Fachmedien Wiesbaden GmbH und ist ein Teil von Springer Nature. Die Anschrift der Gesellschaft ist: Abraham-Lincoln-Str. 46, 65189 Wiesbaden, Germany

Danksagung Als ich mit dieser Arbeit begann, war mir nicht klar, wie viele Menschen mich auf diesem Weg begleiten und unterstützen würden. Ihnen allen möchte ich an dieser Stelle danken. Ganz herzlich bedanken möchte ich mich zuallererst bei Prof. Dr. Florian Waldow, der meine Forschung mit viel Offenheit, Neugierde und Wohlwollen begleitet hat. Insbesondere die von ihm gewährten Freiräume für eigenständiges Arbeiten und das Vertrauen in mich und meine Art der Forschung bedeuten mir sehr viel. Frau Prof. Dr. Bettina Fritzsche danke ich für konstruktive Kritik und detaillierte Nachfragen, die meine Arbeit weitergebracht haben. Den Kolleg_innen und Gästen der Abteilung Vergleichende und Internationale Erziehungswissenschaft bin ich für vielerlei Hilfe und Diskussionsmöglichkeiten im Rahmen des Kolloquiums zu Dank verpflichtet. Nadine Bernhard danke ich für die Möglichkeit, sie ständig mit Fragen und Einfällen in ihrer Arbeit zu unterbrechen und gemeinsame Krisenbewältigungen jeglicher Art, Michaele Kahlert für wertvolle Hinweise bei der Endkorrektur der Arbeit. Für zahlreiche fachliche Denkanstöße und emotionalen Beistand danke ich insbesondere Bettina Vogt, Fanny Oehme, Emma Vikström und Franziska Primus. Mein Dank gilt auch allen Interviewpartner_innen in Deutschland und Schweden sowie allen Schulleitungen, die mir den Zugang zu ihrer Schule ermöglicht und meine Forschung unterstützt haben. Ohne sie würde es diese Arbeit nicht geben. Mit der Erstellung der Interviewtranskripte haben Elena Bakels, Jasmin Bokermann, Mona Liljedahl, Franziska Primus, Fabienne Threadgill, Emma Vikström, Bettina Vogt und Stephan Zaune viele Stunden und Tage verbracht. Für ihre Ausdauer, ihr Bemühen um genaue Wiedergabe und alle sonstigen Hinweise zum Transkribieren bin ich ihnen sehr dankbar. Meinen Freund_innen und meiner Familie gebührt außerordentlicher Dank für ihre Geduld und ihr Verständnis für die langen Phasen der Nicht-Anwesenheit. Meiner lieben Freundin Sarah danke ich besonders für unsere regelmäßigen Telefonate, in denen sie alle Höhen und Tiefen des Prozesses begleitet hat. Für seinen unbeirrbaren Optimismus und das Talent zum klaglosen Rückenfreihalten danke ich aus tiefem Herzen meinem Partner Alex. Ich freue mich auf alles, was noch vor uns liegt!

Inhaltsverzeichnis Tabellen- und Abbildungsverzeichnis ..................................................... xi 1 Einleitung ........................................................................................... 1 1.1 Leistungsbeurteilung und Gerechtigkeit. Bisherige Bearbeitungen Bisherige Bearbeitungen des Themas........................................... 4 1.2 Wahl der Vergleichseinheiten Schweden und NRW .................... 11 1.3 Aufbau der Arbeit ...................................................................... 16 2 Schulische Leistungsbeurteilung und Gerechtigkeit aus Lehrer_innenperspektive. Begriffliche Bestimmungen und sensibilisierende Konzepte der Untersuchung............................................. 19 2.1 Leistungsbeurteilung, Leistungsbewertung, Leistungsmessung ... 21 2.2 Funktionen und Bezugsnormen der Leistungsbeurteilung .......... 26 2.3 Leistungsbeurteilung als soziale Konstruktion............................. 32 2.4 Gerechtigkeitsbegriffe der empirischen Sozialforschung............. 37 2.4.1 Formen von Gerechtigkeit ................................................... 38 2.4.2 Gerechtigkeitsprinzipien ...................................................... 41 2.5 Gerechtigkeitsüberzeugungen von Lehrkräften als Bestandteil berufsbezogener Überzeugungen (teacher beliefs) .............. 43 2.5.1 Gegenstandsbereiche berufsbezogener Überzeugungen von Lehrkräften .................................................................. 45 2.5.2 Gerechtigkeitsüberzeugungen als kollektives Wissen........... 47 2.5.3 Gerechtigkeitsüberzeugungen und professionelles Handeln 51 3 Methodologischer Rahmen und Forschungsdesign .......................... 53 3.1 Grounded Theory Methodologie und Vergleichende Erziehungswissenschaft – Zur Kombination zweier Forschungsparadigma .. 58 3.1.1 Entstehungskontext und Kernelemente der Grounded Theory Theory Methodologie ......................................................... 58 3.1.2 Die Operation des Vergleichens ........................................... 69 3.1.3 Constant comparative method und Vergleich als Methode .. 70

viii

Inhaltsverzeichnis

3.1.4 Das tertium comparationis und die Kernkategorie ............... 73 3.1.5 Fallauswahl und Vergleichseinheiten ................................... 78 3.2 Das Episodische Interview als Erhebungsmethode...................... 84 4 Konkrete Forschungsschritte ............................................................ 87 4.1 Theoretical Sampling und Samplingkriterien............................... 87 4.1.1 Systembezogene Samplingkriterien .................................... 88 4.1.2 Personenbezogene Samplingkriterien................................. 90 4.1.3 Feldzugang und konkrete Samplingschritte in NRW und Schweden........................................................................... 91 4.2 Interviewdurchführung ............................................................ 103 4.2.1 Konstruktion und Handhabung des Interviewleitfadens .... 106 4.2.2 Mehrsprachigkeit im Forschungsprozess .......................... 109 4.3 Sukzessive Integration weiterer Daten ..................................... 115 4.4 Datenanalyse und Kodierprozeduren ....................................... 117 4.5 Die zwei Darstellungsebenen der Ergebnisse ............................ 121 5 Institutionelle Rahmung schulischer Leistungsbeurteilung in Schweden und Nordrhein-Westfalen ............................................. 123 5.1 Schulische Leistungsbeurteilung in Schweden .......................... 124 5.1.1 Grundlegende Charakteristika des schwedischen .................... Schulsystems .................................................................... 127 5.1.2 Zentrale Elemente schulischer Leistungsbeurteilung .............. in Schweden ..................................................................... 140 5.1.3 Grundzüge der schwedischen Lehramtsausbildung und der der professionelle Status von Lehrkräften......................... 163 5.2 Schulische Leistungsbeurteilung im Sekundarschulbereich in Nordrhein-Westfalen ............................................................... 174 5.2.1 Grundlegende Charakteristika der Bildungssysteme Deutschlands .................................................................... 177 5.2.2 Schulformen, Abschlussarten und schulische Leistungsbeurteilung in NRW............................................ 191 5.2.3 Lehramtsausbildung in NRW und professioneller Status der Lehrkräfte ........................................................................ 219

Inhaltsverzeichnis

ix

5.3 Zwischenfazit: Institutionelle Rahmung von Leistungsbeurteilung und darin eingelassene Gerechtigkeitsnormen ...... 226 6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen ........... von Lehrkräften und Entwicklung einer gegenstandsverankerten Theorie ........................................................................................... 233 6.1 Entwicklung der Kernkategorie: Gerechte Leistungsbeurteilung als Balanceakt .................................................................. 234 6.2 Weitere zentrale Analysekategorien ........................................ 246 6.3 Gerechtigkeitsüberzeugungen und Beurteilungsstrategien ............ zur Herstellung gerechter Leistungsbeurteilung ....................... 254 6.3.1 Mathematisch-rechnerische Gerechtigkeitsüberzeugung . 258 6.3.1.1 Frau Ehrl – „da kann man noch was drehen“ .............. 261 6.3.1.2 Fallübergreifender Vergleich ...................................... 280 6.3.2 Prozedural-bürokratische Gerechtigkeitsüberzeugung....... 326 6.3.2.1 Fredrik – „einfach ausschneiden und einfügen“ und „objektive Beurteilung“ ............................................... 330 6.3.2.2 Herr Dabert – Beurteilung mit dem „zweiten Gehirn“ 358 6.3.2.3 Fallübergreifender Vergleich ...................................... 394 6.3.3 Diskursiv-interaktive Gerechtigkeitsüberzeugung .............. 436 6.3.3.1 Frau Ahle-Demmerer – „Entscheidungen mit einer Klasse zusammen treffen“ ........................................... 438 6.3.3.2 Barbro (und Christina): Gemeinsam unterrichten und beurteilen.................................................................... 466 6.3.3.3 Fallübergreifender Vergleich ...................................... 485 6.3.4 Kompensatorische Gerechtigkeitsüberzeugung ................. 521 6.3.4.1 Lisbeth – „man kann verschiedene Wege finden“ ...... 524 6.3.4.2 Frau Hollerdieck – „im Zweifel für den Schüler“ und „den pädagogischen Blick haben“ ................................ 545 6.3.4.3 Fallübergreifender Vergleich ...................................... 562

x

Inhaltsverzeichnis

7 Fazit und Ausblick .......................................................................... 593 7.1 Diskussion der gegenstandsverankerten Theorie zum Phänomen gerechter Leistungsbeurteilung................................................ 596 7.2 Vier Muster von Gerechtigkeitsüberzeugungen. Grenzziehungen und Überschneidungsbereiche................................................. 600 7.3 Limitationen dieser Studie, Implikationen und Ausblick auf weiterführende Forschung ....................................................... 613 Literaturverzeichnis .......................................................................... 619 Anhang.............................................................................................. 673 Transkriptionsregeln ...................................................................... 673 Anschreiben und Informationsbrief für Schulleitungen .................. 674 Aushang für das Kollegium ............................................................. 675 Interviewleitfaden auf Deutsch ...................................................... 676 Interviewleitfaden auf Schwedisch ................................................. 677 Überblick über das Sample in NRW ............................................. ....678 Überblick über das Sample in Schweden ........................................ 680

Tabellen- und Abbildungsverzeichnis Tab. 1 Tab. 2

Übersicht Sampling in NRW................................................... 97 Übersicht Sampling in Schweden......................................... 100

Tab. 3

Übersicht Zusammensetzung des Samples .......................... 102

Tab. 4

Generative Fragen............................................................... 117

Abb. 1

Gerechtigkeitsüberzeugungen als Teilbereich berufsbezogener Überzeugungen........................................................... 47 Darstellung des iterativen Forschungsprozesses der GTM ..... 64 Überblick über die Erhebungs- und Auswertungsphasen in Schweden und NRW (2011-2016) .......................................... 94 Struktur des Schulsystems in Schweden .............................. 129 Gegenüberstellung der schwedischen Notenskalen 1994-2010 und seit 2011 .................................................... 152 Auszug aus den Wissensanforderungen Klasse 9 ................. 155 Aufbau des Schulsystems in Nordrhein-Westfalen ............... 192 Notenstufen, Punkte und Notendefinitionen NRW .............. 197 Erste Kategorien und Ideen für eine Theorie zu handlungsleitenden Gerechtigkeitsüberzeugungen von Lehrkräften ... 240 Modell der gegenstandsverankerten Theorie zu Gerechtigkeitsüberzeugungen von Lehrkräften in Bezug auf schulische Leistungsbeurteilung ................................................. 253 Dokumentation mündlicher Noten (Material Frau Amberg). 284 Beurteilungsraster mit Niveaustufen für Schüler_innen (Material Malin) .................................................................. 311 Beurteilungsraster mit Niveaustufen, Teilnoten und Halbjahresnote (Material Malin) ................................................ 313 Ansicht eines Menüpunktes im Beurteilungsprogramm „Planering & Bedömning“ ................................................... 332 Auszug aus einem Beurteilungsraster (Material Barbro). ..... 475 Beurteilungsraster für den Schwedischunterricht Kl. 8 (Material Lisbeth)................................................................ 542

Abb. 2 Abb. 3 Abb. 4 Abb. 5 Abb. 6 Abb. 7 Abb.8 Abb. 9 Abb. 10

Abb. 11 Abb. 12 Abb. 13 Abb. 14 Abb. 15 Abb. 16

xii

Tabellen- und Abbildungsverzeichnis

Abb. 17 Modell der gegenstandsverankerten Theorie zum Phänomen gerechter Leistungsbeurteilung ................................... 598 Abb. 18 Überschneidungsbereiche zwischen verschiedenen Gerechtigkeitsüberzeugungen ............................................ 609 Abb. 19 Länderspezifische Tendenzen hinsichtlich präferierter Gerechtigkeitsüberzeugungen der befragten Lehrkräfte ..... 610

1 Einleitung Die schulische Leistungsbeurteilung gehört zu den zentralen Aufgaben von Lehrkräften: Sie beobachten ihre Schüler_innen im Unterricht, prüfen sie in schriftlichen und mündlichen Leistungskontrollen, vergeben Zensuren und erstellen daraus ein (Abschluss-)Zeugnis (vgl. Terhart, 2011a; Baumert & Kunter, 2006). Diese Zensuren und Zeugnisse entscheiden letztlich über den Zugang zu weiterführenden Bildungseinrichtungen und/oder dem Arbeitsmarkt, sie eröffnen oder verschließen damit Lebenschancen. In meritokratischen Gesellschaften, in denen Bildungs- und Lebenschancen nach individueller Leistung und nicht aufgrund askriptiver Merkmale, wie der sozialen oder ethnischen Herkunft oder des Geschlechts, verteilt werden sollen, kommt den Leistungsbeurteilungen durch Lehrkräfte daher eine Schlüsselrolle in der Reproduktion oder Veränderung gesellschaftlicher Verhältnisse zu (vgl. u.a. Ditton, 2010). Noten und Abschlüsse gelten hier als Äquivalente für Leistung und Leistungsfähigkeit, sie dienen als Entscheidungsgrundlage für die Zuweisung zu verschiedenen Zweigen weiterführender Bildungseinrichtungen oder dem Zugang zum Arbeitsmarkt. Lehrkräfte sind somit „both the gatekeeper for the meritocracy and its standards“ (Yair, 2007, S. 2955).1 Leistungsbeurteilungen und daraus resultierende Schulabschlüsse sind im deutschen Bildungssystem eng an die Entstehung eines Berechtigungswesens gebunden (vgl. Zymek, 2008b). Erst mit der Notwendigkeit der Unterscheidung und Auslese von Schulabgänger_innen wurden Zensuren und Zeugnisse zu dem was sie heute sind: Berechtigungsnachweise für den Erwerb beruflicher und sozialer Positionen; die Institution 1

Die vorliegende Arbeit entstand im Rahmen des DFG-Projekts „Unterschiedliche Welten der Meritokratie? Schulische Leistungsbeurteilung und Verteilungsgerechtigkeit in Deutschland, Schweden und England im Zeitalter der ‚standards-based reform‘“. Viele der einleitenden Gedanken verdanke ich dem intensiven Austausch innerhalb der Forschungsgruppe um Prof. Dr. Florian Waldow.

© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 K. Falkenberg, Gerechtigkeitsüberzeugungen bei der Leistungsbeurteilung, https://doi.org/10.1007/978-3-658-28275-2_1

2

1 Einleitung

Schule wurde zur „zentralen sozialen Dirigierungsstelle“ (Schelsky, 1957, S. 17). Aber auch in Ländern ohne ein so stark ausgeprägtes Berechtigungswesen und einer weniger selektiven Grundstruktur des Bildungswesens, wie beispielsweise in Schweden, werden Zeugnisse und Zensuren als komprimierte Informationen über individuelle Leistungen von Schüler_innen für Übergangsfragen benutzt. Allerdings stellt das meritokratische Prinzip oft nicht mehr als eine „normative Selbstdefinition moderner Gesellschaften für die Begründung und Legitimation sozialer Ungleichheiten“ dar (Solga, 2013, S. 23, Hervorh. i. Orig.). Die Realität zeigt, dass schulischer Erfolg oft zu großen Teilen von außerschulischen Faktoren wie der Beherrschung der Unterrichtssprache, der Lernmotivation, habitualisierten Lerngewohnheiten und der Unterstützung durch die Familie abhängt (vgl. u.a. Bourdieu & Passeron, 1971; Bourdieu, 1982; Baumert & Schümer, 2001), weshalb auch von der „Illusion der meritokratischen Schule“ gesprochen wird (Radtke, 2004, S. 175). Hinzu kommt, dass Lehrer_innen zumeist nur die im Unterricht oder der Testsituation gezeigten Leistungen bewerten können und dürfen, so dass bestehende Herkunftsunterschiede und daraus resultierende Leistungsbeeinträchtigungen notwendigerweise in die Beurteilung einfließen (Solga, 2013, S. 20). Insofern ist die schulische Leistungsbeurteilung aufs engste mit Gerechtigkeitsfragen verbunden. Wie jedoch bereits im Eingangszitat anklingt, wird in dieser Arbeit im Anschluss an sozialkonstruktivistische Positionen (vgl. Berger & Luckmann, 1966) davon ausgegangen, dass Gerechtigkeit ein sozial konstruiertes Phänomen darstellt, das in verschiedenen historischen, soziokulturellen oder nationalen Kontexten unterschiedliche Bedeutungen annehmen kann. Ähnlich verhält es sich mit der Frage nach einer gerechten Leistungsbeurteilung: Dass Lehrkräfte sich um eine gerechte Leistungsbeurteilung bemühen, ist verschiedentlich festgestellt worden (vgl. Brookhart, 1994; Tierney, Simon & Charland, 2011). Deutlich unklarer ist hingegen, was genau Lehrkräfte unter einer gerechten Beurteilung verstehen. Denn das, was als gerechte Beurteilung empfunden wird, kann in unterschiedlichen Kontexten unterschiedlich ausfallen (vgl. Tierney, 2013).

1 Einleitung

3

Die vergleichende Untersuchung der Gerechtigkeitsüberzeugungen von Lehrkräften in zwei verschiedenen kulturellen Kontexten mit unterschiedlichen Bildungssystemen bietet jedoch die Möglichkeit das komplexe Wechselspiel aus institutionell eingeschriebenen Gerechtigkeitsnormen, situativ-kontingenten Handlungsroutinen und individuellen Haltungen gegenüber der schulischen Kernoperation der Leistungsbeurteilung vor dem Hintergrund ihrer zugeschriebenen gesellschaftlichen wie pädagogischen Funktionen zu analysieren. Die vorliegende Studie zielt also darauf ab folgende Forschungsfragen zu beantworten: Erstens, welche Gerechtigkeitsüberzeugungen Lehrkräfte in Bezug auf die schulische Leistungsbewertung haben; zweitens, welche Strategien sie anwenden, um eine in ihren Augen gerechte Leistungsbeurteilung herzustellen und drittens, ob und, wenn ja, inwiefern sich diese Überzeugungen und Strategien zwischen Lehrkräften in verschiedenen Bildungssystemen unterscheiden. Die gewählten Vergleichseinheiten Deutschland und Schweden stellen dabei einen interessanten Kontrast dar, sowohl was die Systemarchitektur der Bildungssysteme als Ganzes angeht, als auch die institutionellen Rahmenbedingungen für die schulische Leistungsbeurteilung sowie darin eingelassene Gerechtigkeitsnormen (vgl. Waldow, 2011a, 2012a). Gleichzeitig obliegt die schulische Leistungsbeurteilung in beiden Ländern fast vollständig den einzelnen Lehrkräften, so dass sich hier auch Ähnlichkeiten bestimmen lassen. In der erziehungswissenschaftlichen und psychologisch-diagnostischen Forschung wurde das Thema Leistungsbeurteilung in der Schule lange Zeit vor allem unter dem Aspekt der diagnostischen Qualität des Lehrkrafturteils untersucht und in diesem Zusammenhang auf deren „Fragwürdigkeit“ hingewiesen (Ingenkamp, 1972). Terhart fasst diesen Strang als evaluativ-normbezogene Forschung zusammen, und konstatiert gleichzeitig einen weiterhin bestehenden Mangel an Forschungen, die sich mit einem eher deskriptiv-analytischen Blick den Fragen zuwenden, „wie Lehrerurteile über Schüler zustande kommen, in welchem Kontext sie stehen, welche Einflussfaktoren sich auswirken, wie sie von den Leh rern (oder von anderen Schulbeteiligten) wahrgenommen werden etc.“ (Terhart, 2011a, S. 703). Hier knüpft nun die vorliegende Dissertation an,

4

1 Einleitung

indem sie danach fragt, was eine gerechte Leistungsbeurteilung aus der Perspektive der beurteilenden Lehrkräfte ausmacht. Dafür wird ein qualitativ-rekonstruktiver Zugang gewählt, der sich an der GroundedTheory-Methodologie (Strauss & Corbin, 1998) orientiert und auf die Entwicklung einer gegenstandsverankerten Theorie zum sozialen Phänomen der Gerechtigkeitsüberzeugungen von Lehrkräften bei der schulischen Leistungsbeurteilung abzielt. Die Arbeit verfolgt damit auch eine methodologisch-methodische Erweiterung der Vergleichenden Erziehungswissenschaft durch den Ansatz der Grounded Theory Methodologie. Im Folgenden werden nun die hier skizzierten Problemfelder vor dem Hintergrund bestehender Forschung beleuchtet, die daraus abgeleiteten Forschungsfragen dieser Studie nachgezeichnet sowie die Auswahl der Vergleichseinheiten für die vorliegende Studie begründet. Das Kapitel endet mit einem Überblick über den Aufbau der vorliegenden Arbeit. 1.1 Leistungsbeurteilung und Gerechtigkeit – Bisherige Bearbeitungen des Themas Gerechtigkeit ist ein normativ hoch aufgeladener Begriff, der in verschiedenen historischen, soziokulturellen oder nationalen Kontexten unterschiedliche Bedeutungen annehmen kann. Im Zusammenhang mit der Institution Schule ist das Schlagwort von der Bildungsgerechtigkeit in den letzten Jahren zu einem „umkämpften Begriff“ (Stojanov, 2011) in der deutschsprachigen erziehungswissenschaftlichen Debatte avanciert (vgl. u.a. Giesinger, 2007; Dietrich, Heinrich & Thieme, 2013). Aber auch im internationalen Diskurs wird um den Zusammenhang von Gerechtigkeit und (schulischer) Bildung in wiederkehrender Regelmäßigkeit gerungen (vgl. für einen aktuellen Forschungsüberblick Resh & Sabbagh, 2016). Im Hinblick auf die schulische Leistungsbeurteilung wird dabei häufig das Bewertungsergebnis in Form von Zeugnissen und Abschlüssen unter gerechtigkeitsbezogenen Fragen beispielsweise anhand des Zusammenhangs von Bildungsabschlüssen und der Reproduktion sozialer Ungleich-

Leistungsbeurteilung und Gerechtigkeit

5

heiten thematisiert (vgl. Bourdieu & Passeron, 1971; Berger & Kahlert, 2013; für Schweden Korp, 2006). Die Rolle der Lehrkräfte als gatekeeper wurde in diesem Zusammenhang ebenfalls thematisiert: So wurde u.a. auf den starken Zusammenhang von schulischer Leistungsbeurteilung und zugeschriebener Leistungsfähigkeit aufgrund der sozialen Herkunft hingewiesen (Lehmann, Peek, Gänsfuß & Husfeldt, 2002), der u.a. auf eine „sozialspezifische Attribution von Begabungen durch die Lehrkräfte“ (Ditton, 2010, S. 266) zurückgeführt wird. Und, so Ditton weiter, „[v]on Bedeutung scheinen eher implizite Persönlichkeits- und Begabungstheorien zu sein, teils in Form stereotyper Erwartungshaltungen, die sich auf die Diagnosekompetenz auswirken und sich in der Notengebung niederschlagen“ (Ditton, 2010, S. 269). Allerdings bleiben dies nur Vermutungen, da im Rahmen dieser Untersuchungen die „micro-politics of selection in school“ (Terhart, 2008) an denen Lehrkräfte durch die alltägliche Beurteilungsarbeit beteiligt sind, nicht ins Auge gefasst werden. Aus pädagogisch-diagnostischer Perspektive liegt wiederum ein umfangreicher Korpus empirischer Forschung zur Frage der Sinnhaftigkeit von Noten (Ingenkamp, 1995), zur mangelhaften diagnostischen Güte von Lehrer_innenurteilen (vgl. Ingenkamp & Lissmann, 2008; Langfeldt & Tent, 1999) sowie der oft unzureichenden Übereinstimmung zwischen Lehrer_innenurteilen und Testergebnissen standardisierter Lernstandserhebungen vor (für einen ausführlichen Überblick vgl. u.a. Schrader, 2008; Terhart, 2011a; Ohle & McElvany, 2015). Auch der prognostische Wert von Schullaufbahnempfehlungen von Lehrkräften, die im deutschen Bildungssystem lange als Weichensteller für Bildungskarrieren galten, wurde wiederholt als gering eingeschätzt (vgl. Heller, Rosemann & Steffens, 1978; Jürgens, 1989). Neuere pädagogisch-psychologische Studien hingegen verweisen auf eine relativ gute diagnostische Kompetenz von Lehrkräften, d.h. eine verhätnismäßig hohe Übereinstimmung von Schulnoten und Testleistungen von Schüler_innen (vgl. u.a. Schrader, 2006; Hochweber, 2010). Daneben wird auf die verschiedenen Bezugssysteme der Bewertungsverfahren abgehoben, d.h. es wird überprüft, ob die Leistungsbeurteilung der Lehrkräfte durch Anlegen einer

6

1 Einleitung

individuellen, sozialen oder kriterialen Bezugsnorm erreicht wurde (zu den Bezugsnormen vgl. Kap. 2.1.4 sowie Rheinberg, 1981). Diese quantitativen Studien richten ihr Augenmerk also vornehmlich auf die Messgenauigkeit des Lehrkrafturteils und konstatieren dementsprechend als ‚Bewertungsfehler‘2 gefasste Abweichungen von den testdiagnostischen Gütekriterien der Objektivität, Reliabilität und Validität. Ähnliches findet sich auch in der schwedischen Beurteilungsforschung, die häufig auf die Abweichungen zwischen den von den Lehrkräften vergebenen Noten und den Testergebnissen der standardisierten Tests unter Gerechtigkeitsaspekten rekurriert (vgl. Klapp Lekholm & Cliffordson, 2008; Hinnerich & Vlachos, 2013). Die pädagogisch-psychologische Gerechtigkeitsforschung wiederum befasst sich mit dem Phänomen gerechter Leistungsbeurteilung insbesondere aus der Perspektive der Schüler_innen und fokussiert auf deren Gerechtigkeitserleben im Zusammenhang mit dem Beurteilungshandeln von Lehrkräften. Unter Berufung auf das Konzept des „Gerechte Welt Glaubens“ (GWG) kommen verschiedene Studien zu dem Schluss, dass die „subjektiv erlebte Gerechtigkeit des Lehrerhandelns“ sich positiv auf das Wohlbefinden von Schüler_innen in der Schule insgesamt auswirkt, eine höhere Motivation und bessere Schulleistungen zur Folge hat (Dalbert, 2011). Daneben finden sich erziehungswissenschaftliche Debatten um den „Sinn und Unsinn des Leistungsprinzips in der Erziehung“ (Klafki, 1974), die eine einseitige Überbetonung der gesellschaftlichen Funktionen der Leistungsbeurteilung (vgl. Kap. 2.1.2) kritisieren und diesen die Forderung nach einem „pädagogischen Leistungsbegriff“ gegenüberstellen (vgl. Jürgens & Sacher, 2008). Damit einher müssten „neue Formen der

2

Hervorhebungen durch die Autorin werden in dieser Arbeit entweder durch einfache Anführungszeichen oder durch Kursivierungen markiert. Zitate werden wie gewöhnlich in doppelten Anführungszeichen aufgeführt.

Leistungsbeurteilung und Gerechtigkeit

7

Leistungsbeurteilung“ (Grunder & Bohl, 2001) 3 gehen, die auch eine „neue Lernkultur“ (Winter, 2012) nach sich ziehen und das Dilemma zwischen einem pädagogischen Förderauftrag und der gesellschaftlichen Auslesefunktion auflösen würden. Diesem Thema widmen sich auch die aus dem DFG-Projekt „Selektionsentscheidungen als Problembereich professionellen Lehrerhandelns“ entstandenen Publikationen (u.a. Terhart, 1999; Lüders, 2001a) sowie die aufschlussreiche Arbeit von Streckeisen, Hänzi und Hungerbühler über Deutungsmuster von schweizerischen Lehrpersonen zum Dilemma von Fördern und Auslesen (Streckeisen, Hänzi & Hungerbühler, 2007, 2009). Erstere behandeln wichtige Fragen zum Verhältnis von Leistungsbeurteilung und Gerechtigkeit aus der Binnenperspektive der handelnden Akteure, konzentrieren sich allerdings auf die Selektionsfunktion des Bildungssystems. Die von Streckeisen et al. (2007) entwickelte Deutungsmustertypologie zeigt wiederum die Bandbreite des Umgangs mit den widersprüchlichen Aufgaben des Lehrberufs und gibt wichtige Hinweise darauf, dass die Herausbildung spezifischer Deutungsmuster und Handlungsweisen von Lehrkräften in Abhängigkeit von der eigenen Berufskarriere, der sozialen Herkunft und der institutionellen Rahmung durch die Schule abhängt. Sie konnten u.a. herausarbeiten, dass einige der befragten Lehrkräfte sich als „‚Vollstrecker’ einer quasi natürlich verlaufenden schulischen Auslese“ verstehen (Streckeisen et al., 2007, S. 289). In beiden Forschungsprojekten wird die schulische Leistungsbeurteilung als grundlegend in widersprüchlichen Anforderungen verstrickte Kernaufgabe von Lehrkräften entworfen. Diese Grundannahme wird auch in der vorliegenden Untersuchung geteilt und die schulische Leistungsbeurteilung als eingebettet in die antinomische Grundstruktur pädagogischen Handelns in Kapitel 2.3 ausführlicher beleuchtet. Die soziologische empirische Gerechtigkeitsforschung befasst sich mehrheitlich mit Verteilungsproblemen in Gesellschaften und Gerechtigkeits3

In der schwedischen Literatur wird diese Forderung nach einem neuen Verständnis von Leistungsbeurteilung unter Rückgriff auf die Konzepte der summativen und formativen Leistungsbeurteilung diskutiert. Ich gehe darauf in Kapitel 2.1 ausführlicher ein.

8

1 Einleitung

ideologien von ganzen Bevölkerungsgruppen (vgl. Liebig & Wegener, 1995; Wegener, 1992). Dabei wird zwischen verschiedenen Gerechtigkeitsformen (Verteilungs-, Verfahrens- und Interaktionsgerechtigkeit) sowie Gerechtigkeitsprinzipien (equality, equity, need) unterschieden (vgl. Kap. 2.4). Die Anwendung dieser Konzepte der empirischen Gerechtigkeitsforschung auf bildungspolitische Fragen wird von den Autor_innen zwar vorgeschlagen, bisher finden sich aber nur wenige Umsetzungen (vgl. für einen Überblick Resh & Sabbagh, 2016; zur schulischen Leistungsbeurteilung Tata, 2005; bezogen auf die wahrgenommene Fairness von Benotungsprozessen im Studium Burger & Groß, 2016). Die aufgeführten Studien eint der quantitative Zugang mit vorab festgelegten Kriterien bzw. Beurteilungssituationen, die als fair bzw. unfair von den Befragten eingeschätzt werden sollen. So präsentierte beispielweise Resh (2009) isrealischen Lehrkräfte fünf Faktoren (Begabung, gezeigte Leistung, Anstrengung, Verhalten im Unterricht und Unterstützungsbedarf der Schüler_innen), deren Bedeutung sie für ihre Beurteilung gewichten sollten und kommt zu dem Schluss, dass die gezeigte Leistung stärker gewichtet wird als Anstrengung und Verhalten im Unterricht (vgl. Resh, 2009). Offenbleiben muss durch die Anlage der Studie hingegen, ob die Lehrkräften über die fünf präsentierten Faktoren hinaus auch weitere Aspekte in die Beurteilung einbezogen hätten, oder aber auch inwiefern diese Faktoren von ihnen als gerechtigkeitsrelevant eingestuft wurden. Qualitative Untersuchungen, die sich auf die analytischen Konzepte beziehen und gleichzeitig den Differenzierungen und Relevanzsetzungen der Befragten mehr Platz einräumen, wären hier eine sinnvolle Ergänzung des Forschungszugangs. Vereinzelte Hinweise auf die Bedeutung von Gerechtigkeitsvorstellungen der Lehrkräfte bei der Beurteilung von Schüler_innenleistungen finden sich auch in Studien, die sich mit der Leistungsbeurteilung als sozialer Praxis bzw. sozialer Konstruktion beschäftigen (vgl. Kap. 2.3; Gellert & Hümmer, 2008; Gellert, 2015; Lamprecht, 2007; auch: Kalthoff, 1996, 2000; Zaborowski, Meier & Breidenstein, 2011). Anders als bei der pädagogisch-diagnostischen Forschung steht hier weniger die Messgenauigkeit des Lehrer_innenurteils im Mittelpunkt, als vielmehr die Betrach-

Leistungsbeurteilung und Gerechtigkeit

9

tung eben dieser Leistungsbeurteilungen als Ergebnisse eines sozialen Interaktions- und Konstruktionsprozesses. Allen diesen Studien gemeinsam sind der Zugang mittels qualitativ-rekonstruktiver Methoden sowie der Fokus auf latente Prozesse und Binnenstrukturen der pädagogischen Praxis. Deutlich wird, dass die schulische Leistungsbeurteilung als situativ-kontingente Praxis Lehrkräfte vor komplexe Entscheidungssituationen stellt, in denen sie unter Rückgriff auf spezifische Beurteilungspraktiken der Unsicherheit des Notengebungsprozesses strukturierend gegenübertreten, um ihre professionelle Handlungsfähigkeit aufrechtzuerhalten. Diese Bewertungspraktiken seien dabei „Ausdruck des Changierens zwischen Gerechtigkeitsanspruch und fehlenden Mitteln, diesen umzusetzen“ (Bräu & Fuhrmann, 2015, S. 57). Was genau dieser Gerechtigkeitsanspruch im Einzelnen sein kann, bleibt allerdings offen. Dietrich und Fricke (2013) nehmen hingegen die schulische Leistungsbeurteilung „als Prozessierung von Bildungs(un)gerechtigkeit“ in den Blick und zeigen anhand von drei exemplarischen Interviewauszügen mit deutschen Lehrkräften, wie diese sich der Thematik der Leistungsbeurteilung einerseits annehmen und dabei gleichzeitig die Gerechtigkeitsthematik ausblenden, indem sie Leistungsbeurteilung lediglich als Messung und Buchführung konzipieren (Dietrich & Fricke, 2013, S. 286–287). Mehrere Untersuchungen zum deutschen Bildungssystem (vgl. Kalthoff, 1996, S. 108; Terhart, Langkau & Lüders, 1999) zeigen zudem, dass es eine stillschweigende Vereinbarung zur Produktion unauffälliger Ergebnisse (d.h. ‚normalverteilter‘ Noten) unter Anwendung der sozialen Bezugsnorm in deutschen Klassenzimmern gibt. „Die gelebte Normalität des Zensierens hat ihren wichtigsten Regulations- und Stabilisierungsmechanismus in der stillschweigenden Orientierung an der Normalverteilung“ (Terhart et al., 1999, S. 289). Klapp Lekholm (2010) spricht ebenfalls davon, dass die „impliziten Beurteilungspraktiken“ der schwedischen Lehrkräfte einerseits einen großen Einfluss auf die Legitimität und „Rechtssicherheit“ ihrer Beurteilung hätten, andererseits aber noch zu wenig erforscht seien (Klapp Lekholm, 2010, S. 137). Allerdings verweist sie dabei auf die Tendenz schwedischer Lehrkräfte mithilfe einer „kompensatorischen“ Beurteilungspraxis insbesondere schwächere

10

1 Einleitung

Fachleistungen durch die Einbeziehung von anderen Faktoren wie Interesse und Motivation der Schüler_innen bei der Notenvergabe auszugleichen, woraus sie ein Gleichwertigkeitsproblem ableitet (Klapp Lekholm, 2010, S. 135–137). Hier deutet sich bereits ein spannender Gegensatz zwischen den impliziten Orientierungen schwedischer und deutscher Lehrkräfte bei der Leistungsbeurteilung an, dem in der vorliegenden Arbeit nachgegangen werden soll. Nach Terhart (2011a) lassen sich die bisherigen Forschungsergebnisse zum Beurteilungsprozess in einem Modell sich erweiternder Kontexte zusammenfassen: Im Kern befindet sich die intrapersonale Ebene, die erfasst wie einzelne Lehrkräfte zu ihren Beurteilungen über bestimmte Schüler_innenleistungen kommen. Dieser Kern wird vom interpersonalen Kontext der Interaktion zwischen Lehrkraft und Schüler_in eingerahmt, der wiederum durch den spezifischen Kontext eines Kollegiums bzw. der Bewertungskultur einer Schule geprägt ist (vgl. Terhart, 2011a, S. 704). Durch den Vergleich der Beurteilungskulturen und damit zusammenhängenden Gerechtigkeitsüberzeugungen von schwedischen und deutschen Lehrkräften könnte dieses Modell um den internationalen Kontext verschiedener Bewertungskulturen in verschiedenen Bildungssystemen ergänzt werden. Von den wenigen qualitativvergleichenden Untersuchungen, die sich dem Themenspektrum der schulischen Leistungsbeurteilung unter gerechtigkeitsrelevanten Fragestellungen widmen, stechen zwei als besonders interessant für die vorliegende Arbeit hervor. Raveaud (2006) untersucht in ihrer ethnografischen Studie in englischen und französischen Grundschulklassen, wie „culturally embedded understandings of equity across two national contexts“ (S. 97) sich in der Beurteilungspraxis von Lehrkräften beider Länder zeigen und kommt zu dem Schluss: „What is ‚fair‘ in a French class is an objective mark on an absolute, universal scale. What is ‚fair’ in an English class is a statement on individual efforts and progress“ (Raveaud, 2006, S. 105). Sie weist daneben auch auf den Vorteil vergleichender Untersuchungen hin, die den Blick nicht nur auf den ‚anderen‘, sondern vor allem auch den ‚eigenen‘ Kontext schärfen und Merkmale, die für selbstverständlich gehalten werden, in ihrer Besonderheit erst

Wahl der Vergleichseinheiten

11

durch den Vergleich deutlich machen (vgl. Raveaud, 2006, S. 11). Dreke (2012) wiederum widmet sich in ihrer Arbeit sozialen Differenzierungen durch Primarschullehrkräfte in Italien und Deutschland und entwickelt in ihrer Analyse vier Deutungsmuster, die sich sowohl bei den italienischen wie auch den deutschen Lehrkräften finden. Gleichzeitig kann sie länderspezifische Unterschiede aufzeigen, die sich auf spezifische bildungspolitische Traditionen und schulische Organisationsstrukturen zurückführen lassen. Beide Studien zeigen, wie eine kontextsensible vergleichende Untersuchung die Verknüpfung von Beurteilungsprozessen auf der Mikroebene mit den „broad cultural patterns“ (Raveaud, 2006, S. 113) eines Bildungssystems ermöglicht, sensibilisieren gleichzeitig aber auch gegenüber zu einfachen kulturalisierenden Erklärungsmustern. An diese und die zuvor genannten Forschungen zur Leistungsbeurteilung als sozialem Konstrukt möchte die vorliegende Arbeit anknüpfen, um den eingangs benannten Forschungsfragen nach den Gerechtigkeitsüberzeugungen von Lehrkräften in Bezug auf die schulische Leistungsbeurteilung im deutsch-schwedischen Vergleich nachzugehen. Um dabei nicht zu stark durch vorab bestimmte Vorstellungen von Gerechtigkeit eingeschränkt zu sein, wird ein qualitativ-rekonstruktiver Zugang gewählt, der den individuellen Relevanzsetzungen der Lehrkräfte mehr Raum lässt. Dass eine Verbindung aus vergleichender Erziehungswissenschaft und Grounded Theory Methodologie sich als fruchtbar erweisen kann, zeigt Drekes (2012) Arbeit dabei wunderbar. Im Folgenden wird nun die Wahl der Vergleichseinheiten Schweden und NordrheinWestfalen ausführlicher beleuchtet. 1.2 Wahl der Vergleichseinheiten Schweden und NRW Für die Beantwortung der Forschungsfrage nach den Gerechtigkeitsüberzeugungen von Lehrkräften in verschiedenen Kontexten wurde ein vergleichendes Design ausgewählt, um, wie einleitend bereits geschildert, von den individuellen Personen abstrahieren zu können und vielmehr das komplexe Wechselspiel aus institutionell verankerten Gerechtigkeitsnormen, situativ-kontingenter Beurteilungspraxis und individuel-

12

1 Einleitung

len Haltungen herausarbeiten zu können. Es handelt sich dabei um einen sogenannten „contextual comparison“, also „an attempt to use comparison as a tool to understand—rather than abstract from—the context“ (Steiner-Khamsi, 2010, S. 326). An dieser Stelle soll dafür zunächst erläutert werden, wieso die Wahl auf die beiden Vergleichseinheiten Schweden und Nordrhein-Westfalen fiel. In Kapitel 3.1.5 werden zudem einige methodologische Überlegungen zur Frage der Fallauswahl in Bezug auf eine an der Grounded Theory Methodologie angelehnte vergleichende Untersuchung ausgeführt und in Kapitel 4.1 der konkrete Samplingprozess für die befragten Lehrkräfte erläutert. Deutschland und Schweden gelten anhand der von Esping-Andersen (1990) entwickelten Typologie verschiedener Wohlfahrtsstaatsregime als klassische Vertreter des konservativ-korporatistischen bzw. sozialdemokratisch-skandinavischen Typus wohlfahrtsstaatlicher Arrangements. Diese Wohlfahrtsregime unterscheiden sich jedoch nicht nur hinsichtlich spezifischer sozialpolitisch-ökonomischer Konstellationen, sondern auch im Hinblick auf grundlegende gesellschaftlich geteilte Vorstellungen darüber, was als gerechte Verteilung von Gütern und Lebenschancen gelten soll (vgl. Mau, 2004). Wie West und Nikolai (2013) zeigen, finden sich auch Parallelen zwischen den von Esping-Andersen beschriebenen Wohlfahrtsregimen und sogenannten „education regimes“, die sich im Hinblick auf institutionelle Charakteristika bezüglich ungleicher Bildungsbeteiligung, der Höhe der Bildungsausgaben und sogenannten „educational outcomes“ (z.B. Bildungsabschlüsse, Kompetenzniveaus, Bildungsabbrüche) ähneln würden. Deutschland wird hier als Vertreter des „kontinentalen“ Bildungsregimes charakterisiert, Schweden wiederum als Vertreter eines „nordischen“ Bildungsregimes beschrieben (West & Nikolai, 2013, S. 12–14). Mit Hopmann (2003) lassen sich Deutschland und Schweden zumindest in Teilen verschiedenen Traditionen von curriculum control zuordnen, d.h. verschiedenen Arten der Steuerung und Kontrolle des Bildungssystems. Traditionell wird hierbei zwischen einer eher auf die Kontrolle pädagogischer Prozesse (process control) und einer an der Überprüfung der Produkte (product control) orientierten Steuerung unterschieden.

Wahl der Vergleichseinheiten

13

Prozessorientierte Steuerung findet etwa mittels detaillierter Lehrpläne oder Vorgaben zur Lehrkräftebildung und –examinierung statt, wobei die Ergebnisevaluation ausschließlich innerhalb der Lehrprofession und nicht durch externe Instrumente stattfindet; produktorientierte Steuerung wiederum fokussiert sich vor allem auf die externe Überprüfung der Schüler_innenleistungen am Ende eines Bildungsabschnittes, weniger jedoch auf die Rahmenbedingungen, unter denen diese entstehen. Nach Waldow (2014) konnten die föderalen deutschen Bildungssysteme lange Zeit ganz klar eher der Tradition der process control zugeordnet werden: gesteuert wurde vor allem über detaillierte Lehrpläne, zentrale Mittelvergaben, föderal regulierte Lehrer_innenbildung inklusive Staatsexamensprüfungen und Referendariat, begleitet von einer starken Lehrprofession. Mit der Einführung von landesweiten Bildungsstandards, externen Evaluationsinstrumenten und zentralen Prüfungen ab den 2000er Jahren verschiebt sich dieser Fokus immer stärker in die Richtung von product control (vgl. hierzu auch Kap. 5.2.1). Das schwedische Bildungssystem wiederum war über lange Jahre geprägt durch eine Mischung beider Steuerungsarten: einerseits existierten Elemente von process control wie zentrale Lehrplan- und Beurteilungsvorgaben, andererseits waren diese seit Mitte des 20. Jahrhunderts gepaart mit einem System standardisierter Leistungstests, deren Entwicklung außerhalb der Lehrprofession lag und eher der Logik von product control entsprachen. Die Lehrkräftebildung war lange wenig reguliert und die Lehrprofession insgesamt vergleichsweise schwach aufgestellt. Mit der Einführung einer kriterien- und zielorientierten Bildungspolitik ab den 1990er Jahren wurde der Einfluss zentraler Prozesskontrolle zurückgefahren und die lokalen Akteure in den Schulen erhielten mehr Gestaltungsspielräume und Verantwortung, gleichzeitig wurde die Anzahl der landesweiten externen Leistungstests sukzessive erhöht (vgl. hierzu auch Kap. 5.1.1). Die verschiedenen Entwicklungslinien der Bildungssysteme liefern in beiden Ländern interessante Anknüpfungspunkte für die Frage nach einer gerechten Beurteilung aus Akteursperspektive und werden ausführlicher im Kapitel 5 dargestellt.

14

1 Einleitung

Aufgrund der föderalen Struktur der Bundesrepublik Deutschland und der Kulturhoheit der Bundesländer bestehen zwischen den Bildungssystemen einzelner Bundesländer mitunter erhebliche Unterschiede – beispielsweise hinsichtlich der bestehenden Schulformen und möglichen Abschlussarten. Gleichzeitig existieren gerade im Hinblick auf die schulische Leistungsbeurteilung einige Vorgaben, die bundeslandübergreifend gelten (z.B. KMK-Richtlinien) und seit 2004/05 auch bundesweit geltende Bildungsstandards. Nicht zuletzt wegen dieser Doppelstruktur ist die Einschränkung auf ein Bundesland – im vorliegenden Fall NordrheinWestfalen – als Vergleichsfall zum schwedischen Bildungssystem dringend notwendig bzw. würde der Versuch der Einbeziehung aller 16 Bundesländer den Rahmen dieser Arbeit sprengen. Auf die Besonderheiten des nordrhein-westfälischen Bildungssystems sowie institutionellen Rahmenbedingungen der schulischen Leistungsbeurteilung wird in Kapitel 5.2 ausführlich eingegangen. Wenn im Folgenden ein wenig unscharf von zwei Ländern gesprochen wird, so sind damit Schweden und das Bundesland Nordrhein-Westfalen gemeint, auch wenn es sich streng genommen um ein Land und ein Bundesland handelt. Sowohl in Schweden als auch in Nordrhein-Westfalen spielen Lehrkräfte und deren Beurteilungen nach wie vor eine zentrale Rolle für die schulische Leistungsbeurteilung, in Schweden werden diese Beurteilungen allerdings noch um zentrale Tests ergänzt, die explizit für eine gleichwertige und damit gerechtere Beurteilung sorgen sollen (Lundahl, 2010). In Deutschland wird das traditionell vor allem in einer starken Lehrprofession und detaillierten Vorgaben abgestützte Beurteilungssystem seit einigen Jahren durch Bildungsstandards und zentrale Lernstandserhebungen erweitert (Altrichter & Maag Merki, 2010). Die Notenskala und Beurteilungsgrundlagen sind in NRW vergleichsweise konstant (vgl. Kap. 5.2.2), wohingegen das schwedische Beurteilungssystem mehrere tiefgreifende Reformen in den vergangenen 25 Jahren durchlaufen hat (vgl. Kap. 5.1.2). Hinsichtlich der Gesamtkonstruktion des Bildungssystems zeichnet sich wiederum das schwedische Gesamtschulsystem durch eine bemerkenswerte Stabilität aus, der eine Reihe von Strukturreformen in NRW (wie in

Wahl der Vergleichseinheiten

15

fast allen deutschen Bundesländern) gegenüberstehen: die Entwicklung hin zu einem inklusiveren Schulsystem, die Zusammenlegung der Hauptund Realschulen sowie die Verlängerung der traditionellen Halbtagsschule auf Ganztagsschulen. All diese Reformbemühungen überlagern sich mit den oben beschriebenen Veränderungen der standards based reform und dürften beispielsweise durch die Reduzierung von Übergangs- und Selektionshürden auch Auswirkungen auf die schulische Leistungsbeurteilung haben (vgl. hierzu Kap. 5.2.1). Mit Blick auf die Lehrpläne und konkreten Beurteilungsvorgaben finden sich ebenfalls interessante Unterschiede: So wurde mit der Reform des schwedischen Bildungs- und Beurteilungssystems im Jahr 2011 beispielsweise die Anzahl der Notenstufen erhöht sowie Lehrpläne mit detaillierten Kriterien für jede Note in jedem Teilbereich eines Faches eingeführt, die ebenfalls zu einer stärkeren Standardisierung und Vereinheitlichung der Beurteilungen führen sollen (vgl. Kap. 5.1.2). Gleichzeitig wird die Bedeutung der individuellen Bezugsnorm und individuellen Förderung einzelner Schüler_innen in allen offiziellen Regularien immer wieder betont. In NRW liegen mit den Kernlehrplänen zwar inhaltlich standardisierende Lehrpläne für jede Schulform vor, diese enthalten aber keine Maßstäbe für die Beurteilung von Lehrinhalten wie die schwedischen. Es werden lediglich formale Rahmenvorgaben, wie die Anzahl der zu schreibenden Klassenarbeiten und die Gewichtung von schriftlichen und mündlichen Anteilen an der Gesamtnote, geregelt. Alles Darüberhinausgehende soll in sogenannten schulinternen „Grundsätzen der Leistungsbewertung“ lokal verabredet werden. Am Ende des Bildungsgangs müssen zentrale Abschlussprüfungen abgelegt werden, deren Anteil an der Gesamtnote jedoch zum Teil stark variiert. Zusammenfassend lässt sich konstatieren, dass die Bildungs- und Beurteilungssysteme Schwedens und Nordrhein-Westfalens einige Gemeinsamkeiten und Unterschiede aufweisen, die einen besonders reizvollen Ausgangspunkt für vergleichende Betrachtungen darstellen. In beiden Ländern verfügen die Lehrkräfte, trotz unterschiedlicher Systemarchitekturen und -logiken, über zum Teil erhebliche Entscheidungs- und Deutungsspielräume, innerhalb derer sie zu einer ‚gerechten‘ Beurteilung

16

1 Einleitung

gelangen sollen. Wie sie diese Aufgabe bewältigen und was eine in ihren Augen gerechte Beurteilung auszeichnet, wird durch die vergleichende Anlage der Studie ebenso beleuchtet werden, wie die Frage danach, inwiefern sich die unterschiedlichen institutionellen Rahmenbedingungen auf die Gerechtigkeitsüberzeugungen der Lehrkräfte auswirken. Durch die Orientierung an der Grounded Theory Methodologie wird zudem versucht einer vorschnellen Fixierung auf Unterschiede zwischen den Lehrkräften entlang der Ländergrenzen vorzubeugen. 1.3 Aufbau der Arbeit Die Arbeit gliedert sich in folgende Kapitel: Zunächst werden in Kapitel 2 zentrale Begriffsbestimmungen vorgenommen und wichtige sensibilisierende Konzepte aus verschiedenen Forschungsrichtungen dargestellt. Zunächst sind dies die in der schulpädagogischen Literatur diskutierten Funktionen von Leistungsbeurteilung sowie verschiedenen Beurteilungsmaßstäbe (Bezugsnormen), die Lehrkräfte zur Beurteilung einer Leistung heranziehen können (Kap. 2.2). Im Anschluss an sozialkonstruktivistische Perspektiven wird sodann die schulische Leistungsbeurteilung als soziale Konstruktion betrachtet (Kap. 2.3) bevor verschiedene Gerechtigkseitsformen und –prinzipien, die in der empirischen Gerechtigkeitsforschung diskutiert werden, auf ihre Anschlussfähigkeit für diese Arbeit geprüft werden (Kap. 2.4). Im letzten Schritt erfolgt die Modellierung des zentralen Begriffs der Gerechtigkeitsüberzeugung als Teil berufsbezogener Überzeugungen von Lehrkräften im Anschluss an die Forschung zu teacher beliefs (Kap. 2.5). Daran anschließend folgt die Erläuterung des methodologischen Rahmens aus Grounded Theory Methodologie und Vergleichender Erziehungswissenschaft sowie die Darstellung des Forschungsdesigns (Kap. 3), um im nächsten Schritt die konkreten Forschungsschritte der vorliegenden Arbeit offenzulegen (Kap. 4). Der empirische Kern der Arbeit wird in einem zweischrittigen Verfahren dargestellt: Zunächst erfolgt die Darstellung und Diskussion der institutionellen Rahmung schulischer Leistungsbeurteilung für den schwedischen (Kap. 5.1) und nordrhein-westfälischen Kontext (Kap. 5.2) sowie ein ers-

Aufbau der Arbeit

17

tes Zwischenfazit zu den jeweiligen institutionellen Gerechtigkeitsnormen (Kap. 5.3). Im zweiten Schritt wird in Kapitel 6 ausgehend von der Beschreibung der Entwicklung der Kernkategorie Gerechte Beurteilung als Balanceakt (Kap. 6.1) und weiterer zentraler Analysekategorien (Kap. 6.2) die in dieser Arbeit entwickelte gegenstandsverankerte Theorie zum Phänomen gerechter Leistungsbeurteilung skizziert. Anschließend werden die aus den Interviews und ergänzenden Materialien rekonstruierten Gerechtigkeitsüberzeugungen von Lehrkräften – mathematischrechnerische, prozedural-bürokratische, diskursiv-interaktive und kompensatorische Gerechtigkeitsüberzeugung – anhand ausgewählter Interviewausschnitte schrittweise entfaltet und unter Rückbindung an die Zwischenergebnisse zum institutionellen Kontext komparativ diskutiert (Kap. 6.3.1 bis 6.3.4). Die entwickelte grounded theory wie auch die vier Muster von Gerechtigkeitsüberzeugungen werden anschließend noch einmal hinsichtlich verschiedener länderspezifischer Besonderheiten diskutiert (Kap. 7) bevor abschließend die Limitationen der vorliegenden Arbeit thematisiert und ein Ausblick auf weitere Forschungsperspektiven gegeben werden.

2 Schulische Leistungsbeurteilung und Gerechtigkeit aus Lehrer_innenperspektive – Begriffliche Bestimmungen und sensibilisierende Konzepte der Untersuchung Mit der Entscheidung für einen an der Grounded Theory Methodologie (GTM)4 orientierten Forschungsprozess geht ein spezifischer Blick auf bestehende theoretische Ansätze, die bisherige Forschungsliteratur und deren Rolle für die Entwicklung einer eigenen Fragstellung einher. Glaser und Strauss (1967), die Gründungsväter der GTM, warnen davor, bestehende Konzepte und Theorien den zu generierenden Daten vorschnell überzustülpen (forcing). Vielmehr gelte es zentrale Kategorien und Konzepte zu einem sozialen Phänomen aus den Daten heraus zu entwickeln (oder im GTM-Duktus: zu ‚emergieren‘ - emerging).5 Dabei können theoretische Begriffe und Konzepte hilfreich sein, sollten aber die Analyse des interessierenden sozialen Phänomens nicht zu stark einschränken. Für diese Gratwanderung prägten Glaser und Strauss den Begriff der „theoretischen Sensibilität“ (theoretical sensitivity), die Forschende auf der Grundlage ihres Vorwissens6 entwickeln und fruchtbar in den Forschungsprozess einbringen sollen (Glaser & Strauss, 1967, S. 46). Anders als in hypothesenprüfenden Verfahren dienen diese bereits bekannten theoretischen Konzepte jedoch nicht nur als Ausgangspunkt des Forschungsprozesses – oder werden als deduktives Kategoriensystem einem Analyseraster gleich auf die Datenquellen gelegt – vielmehr können sie zu unterschiedlichen Zeitpunkten und unterschiedlichen Zwecken im 4

Zur Grounded Theory Methodologie im Allgemeinen und den methodologischmethodischen Grundprämissen der vorliegenden Arbeit vgl. ausführlicher Kapitel 3 und 4. 5 Zur Diskussion um den schwierigen Balanceakt zwischen forcing und emerging in der GTM vgl. Kelle (2011) sowie Kapitel 3.1. 6 Dieses Vorwissen kann dabei sowohl aus der Forschungsliteratur als auch aus persönlichem Erleben oder vorherigen Forschungserfahrungen stammen (vgl. Strauss, 1994, S. 48).

© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 K. Falkenberg, Gerechtigkeitsüberzeugungen bei der Leistungsbeurteilung, https://doi.org/10.1007/978-3-658-28275-2_2

20

2 Begriffe und sensibilisierende Konzepte

Forschungsverlauf ergänzend hinzugezogen werden, gleichzeitig warnen Strauss und Corbin: „Sie können alle Arten von Literatur benutzen, die Ihnen relevant erscheint, aber hüten Sie sich davor, ein Gefangener der Literatur zu werden" (Strauss & Corbin, 1996, S. 38). Um der Gefahr einer vorschnellen (theoretischen) Selbstbeschränkung durch ein vorgegebenes theoretisches Gefängnis, um im Bild von Strauss und Corbin zu bleiben, zu entgehen, werden existierende Forschungen, aber auch andere Daten- und Informationsquellen, als sensibilisierende Konzepte betrachtet, die einerseits in die vorläufige Konstitution der Untersuchung und der Vergleichsgegenstände einfließen, im weiteren Verlauf des Forschungsprozesses jedoch auch immer wieder um neue – auch aus den Daten generierte – Konzepte ergänzt, die dabei helfen, die induktiv aus dem generierten Datenmaterial gewonnenen Kategorien und deren Beziehungen untereinander näher zu bestimmen. Wie Kruse es ausdrückt, erhalten Theorien und konzeptionelle Begriffe damit den Status von ‚Spielbällen‘ für die Daten und deren Analyse (vgl. Kruse, 2014 S. 104), d.h. mit theoretischen Konzepten wird spielerisch ausprobiert, inwiefern sie bei der Analyse der Daten hilfreich sind, neue Perspektive eröffnen oder ein beobachtetes Phänomen treffend beschreiben können – und wo sie verworfen werden müssen und nicht passen. Die so stufenweise und in einem iterativen Forschungsprozess ausprobierten und letztlich in die Analyse einbezogenen theoretischen Bezugspunkte in einer eher linearen Darstellungsweise aufzuzeigen, wie es für klassische Kapitel zum Forschungsstand üblich ist, stellt eine Herausforderung dar. Nichtsdestotrotz wird eben dieses in den nachfolgenden Kapiteln 2.1 bis 2.4 versucht, indem einige begriffliche Bestimmungen vorgenommen und zentrale sensibilisierende Konzepte der vorliegenden Arbeit dargestellt werden, auch wenn diese sich teilweise erst im Laufe des Forschungsprozesses als Bezugspunkte herauskristallisiert haben. Damit folgt die Arbeit einem weiteren berühmten GTM-Diktum von Glaser – „all is data“ (Glaser, 1998) – indem die in der erziehungswissenschaftlichen, pädagogisch-psychologischen und sozialwissenschaftlichen Forschung zum Thema schulischer Leistungsbeurteilung und Gerechtigkeit bereits existierenden Konzepte als Teil des theoretischen Vorwis

Leistungsbeurteilung, Leistungsbewertung, Leistungsmessung

21

sens, aber auch als gleichwertige Datenquelle neben den generierten Interviewtranskripten, offiziellen Regularien und Dokumenten oder im Forschungsprozess erstellten Feldnotizen und Memos behandelt werden. Das vorliegende Kapitel gliedert sich folgendermaßen: Zunächst werden zentrale Begriffe und Konzepte zur schulischen Leistungsbeurteilung vorgestellt (Kap. 2.1) sowie Funktionen und Bezugsnormen der Leistungsbeurteilung skizziert (Kap. 2.2). Anschließend wird der Blick auf die schulische Leistungsbeurteilung als soziale Konstruktion gelenkt (Kap. 2.3). Die Darstellung zentraler Gerechtigkeitskonzepte der empirischen sozialwissenschaftlichen Gerechtigkeitsforschung schließt sich daran an (Kap. 2.4). Im letzten Kapitel dieses Abschnitts wird die Bestimmung der Gerechtigkeitsüberzeugungen von Lehrkräften in Bezug auf schulische Leistungsbeurteilung als Teil ihrer beruflichen Überzeugungen herausgearbeitet (Kap. 2.5). In allen genannten Kapiteln liegt der Fokus weniger auf einer erschöpfenden Zusammenschau aller existierenden Forschung zum jeweiligen Teilausschnitt des interessierenden sozialen Phänomens der schulischen Leistungsbeurteilung im Sinne eines Reviews, als vielmehr auf der Herausarbeitung von für die vorliegende Arbeit zentralen Begriffen und Konzepten. 2.1 Leistungsbeurteilung, Leistungsbewertung, Leistungsmessung In der deutschsprachigen erziehungswissenschaftlichen Literatur zur schulischen Leistungsbeurteilung finden sich die Begriffe Leistungsfeststellung, Leistungsmessung, Leistungsbewertung sowie Leistungsbeurteilung – teilweise werden sie synonym verwandt, teilweise in gegensätzlicher Bedeutung. An dieser Stelle soll für die vorliegende Arbeit eine Definition und Abgrenzung der Begriffe erfolgen sowie die Entscheidung für den Begriff der schulischen Leistungsbeurteilung als geeigneten Oberbegriff für die Fragestellung der vorliegenden Arbeit begründet werden. Unter Leistungsfeststellung verstehen Jürgens und Lissmann (2015) die Beobachtung von Schüler_innen im Rahmen alltäglicher Lernkontrollen, die lediglich auf die Beschreibung eines Verhaltens abzielt ohne diese

22

2 Begriffe und sensibilisierende Konzepte

abschließend zu bewerten (Jürgens & Lissmann, 2015, S. 69). Im Gegensatz dazu steht die Leistungsmessung, die einen höheren methodischen Anspruch als die Leistungsfeststellung habe, und auf die Bewertung eines Leistungsergebnisses abzielt. Die dafür verwendeten Leistungskontrollen sollen dabei testtheoretischen Gütekriterien entsprechen (Jürgens & Lissmann, 2015, S. 69). Für Maier (2015) ist Leistungsmessung „der Prozess der Erfassung von schulischen Leistungen mittels Tests oder anderen (standardisierten) Verfahren. Resultate von Leistungsmessungen sind Testwerte, Punkte oder Beobachtungsdaten“; eine weitergehende Interpretation und Nutzung der auf diese Art gewonnenen Informationen schließt der Begriff der Leistungsmessung nach ihm jedoch aus (Maier, 2015, S. 16). Aus der Perspektive der stärker psychometrisch orientierten pädagogischen Diagnostik werden alltägliche Lehrkrafturteile häufig als defizitäre Beurteilungen beschrieben, die einer Ergänzung durch exaktere Messungen mittels diagnostischer Verfahren bedürften (vgl. Schrader, 2011, S. 694). Bei der Leistungsbeurteilung werden, nach Maier (2015), die oben beschriebenen Leistungsmessungen eingeordnet, interpretiert und bewertet sowie vor dem Hintergrund verschiedener Bezugsmaßstäbe beurteilt.7 Beurteilungen setzen sich demnach in der Regel aus mehreren Bewertungen zusammen, die über einen größeren Zeitabschnitt und unter Verwendung verschiedener Bezugsnormen vorgenommen wurden (Jürgens & Lissmann, 2015, S. 69). Diese Einordnung einer Leistung unter Zuhilfenahme eines Beurteilungsmaßstabes sei im Grunde genommen erst als Bewertung einer Leistung zu verstehen, anders als die (scheinbar) wertfreie Messung von Leistungen im Rahmen von Lernerfolgskontrollen (Jürgens, 2010, S. 55). Winter (2012) ordnet demgegenüber den Begriff der Leistungsbeurteilung einem eher traditionellen Umgang mit Schüler_innenleistungen zu, und schlägt den Begriff der Leistungsbewertung für eher reformorientierte Konzepte vor, die sich am Schlagwort der „neuen Lernkultur“ orientieren. Klein (2009) schließlich unterschei7

Maier (2015) verwendet die Begriffe Leistungsbeurteilung und Leistungsbewertung synonym, in dieser Arbeit wird jedoch der Begriff Leistungsbeurteilung präferiert.

Leistungsbeurteilung, Leistungsbewertung, Leistungsmessung

23

det die Begriffe Leistungsbeurteilung und Leistungsbewertung folgendermaßen: „Unter einer Beurteilung versteht man eine abwägende, komplexe Stellungnahme, bei der verschiedene Sichtweisen und Bezüge zu einer Meinungsbildung führen, ohne dabei zwangsläufig Wertmaßstäbe und Rangskalen aufzustellen. Eine Bewertung dagegen ist eine Beurteilung, die eine eindeutig feststehende Bezugsnorm braucht und einen Werte-Maßstab erfordert, der Zuordnungsmöglichkeiten bietet, wie zum Beispiel die Zensurenskala bei der Leistungsbewertung. […] Einer Leistungsbeurteilung geht die Leistungsbewertung voraus“ (Klein, 2009, S. 19, Hervorh. K.F.). Im Unterrichtsalltag lassen sich die ineinandergreifenden Prozesse der Leistungsfeststellung, -messung und anschließenden –beurteilung jedoch kaum voneinander trennen, so dass die hier vorgenommenen Begriffsbestimmungen lediglich analytischer Natur sind. Um einen möglichst breiten Begriff des interessierenden Phänomens zu verwenden, und sowohl die Beobachtung und Beschreibung von Schüler_innenleistungen im Klassenzimmer, als auch deren Messung in Form von Lernstandsüberprüfungen als auch die daraus resultierende Notengebung oder Zensierung inklusive der Rückmeldung an die Schüler_innen einzuschließen, wird in dieser Arbeit der Begriff der Leistungsbeurteilung als Oberbegriff verwendet. Auch im Hinblick auf die schwedischen Begrifflichkeiten und Diskussionen stellt Leistungsbeurteilung einen passenden, da umfassenderen Oberbegriff dar. Entgegen der Begriffsvielfalt in der deutschsprachigen erziehungswissenschaftlichen Debatte existieren im Schwedischen lediglich zwei Begriffe, mit denen die Beurteilung von Schüler_innenleistungen bezeichnet werden: bedömning und betygssättning. Mit dem Begriff bedömning wird dabei sowohl die Beobachtung und Beschreibung von Schüler_innenleistungen als auch deren Rückmeldung im Verlauf eines Schuljahres bezeichnet. In den Worten der schwedischen Schulbehörde, Skolverket, ausgedrückt: „Mit bedömning bezeichnet man diejenigen Beobachtungen und die Informationsgewinnung, die rund um die Arbeitsleistungen von Schüler_innen passieren, welche wiederum gedeutet werden, um zu Beschlüssen und Konsequenzen zu führen“ (Skolverket, 2011b, S. 6; Übersetzung K.F.). Diese „Beschlüsse

24

2 Begriffe und sensibilisierende Konzepte

und Konsequenzen“ treten auch im schwedischen Schulsystem in Form von Noten und Zeugnissen auf, allerdings soll die Erstellung von Noten sowie die Vergabe der Zeugnisse zeitlich getrennt von den Prozessen der fortlaufenden Beurteilung während des Schuljahres ablaufen. Für den das Schuljahr sowie den Lernprozess abschließenden Akt der Notengebung sowie die Zeugniserstellung wird der Begriff betygssättning verwendet. Das Wort betyg kann dabei sowohl „Zensur“ als auch „Zeugnis“ bedeuten. Betygssättning, also die Zeugnisnotenvergabe, baut dabei auf den durch die fortlaufende Beobachtung, Dokumentation und Rückmeldung der Lernprozesse gewonnenen Informationen auf. Beide Prozesse sind also miteinander verbunden, allerdings gibt es keinen übergreifenden Begriff im Schwedischen, der analog zum deutschen Begriff ‚Leistungsbeurteilung‘ verwendet wird. Darüber hinaus wird das schwedische Wort für ‚Leistung‘ (prestation) im Zusammenhang mit schulischen Lernund Unterrichtsprozessen sowie deren Beurteilung kaum verwendet, üblicher ist das neutrale Wort ‚Beurteilung‘ (bedömning) bzw. wird manchmal auch von „Wissensbeurteilung“ (kunskapsbedömning) gesprochen.

Zensuren und Zeugnisse Trotz verschiedener Reformbemühungen die klassischen Zensuren und Zeugnisse durch Verbalbeurteilungen, Diagnosebögen oder Lernentwicklungsberichte zumindest teilweise zu ersetzen, stellt die Zensur gegenwärtig die am weitesten verbreitete und gängigste Form schulischer Leistungsbeurteilung dar – und dies trotz aller empirisch belegter Kritik (vgl. Ingenkamp, 1972; Brügelmann, 2006; Jachmann, 2003; Valtin, 2002). Mithilfe von Zensuren umschreiben Lehrkräfte ihr Urteil über das

Leistungsbeurteilung, Leistungsbewertung, Leistungsmessung

25

von Schüler_innen gezeigte Verhalten und verdichten dieses in einer kurzen, kommunizierbaren Form (Ziffern, Buchstaben, Adjektive).8 Sowohl die deutsche Notenskala mit den Ziffernzensuren 1-6 als auch die schwedische Skala mit Buchstabennoten von A-F entsprechen dabei einer Rang- bzw. Ordinalskalierung, anhand derer sich lediglich Rangfolgen im Sinne eines Besser-Schlechter-Verhältnisses abbilden lassen. Unbestimmt bleibt demgegenüber, wie groß die Abstände zwischen den mit einer bestimmten Zensur bewerteten Leistungen sind. Daraus folgt, laut Ingenkamp und Lissmann: „Da die Zensurenskala eine Ordinalskala ist, dürfen wir – sofern wir korrekt vorgehen wollen – auch von Zensuren keine arithmetischen Mittelwerte berechnen, d.h. keine Durchschnittsnote angeben, wie dies viele Lehrer dennoch tun und wie dies in den Prüfungsordnungen immer wieder gefordert wird“ (Ingenkamp & Lissmann, 2008, S. 48).9 Dass diese arithmetischen Berechnungen trotzdem in der alltäglichen Beurteilungspraxis durchaus an der Tagesordnung sind, dürfte ein offenes Geheimnis für Schüler_innen und Lehrkräfte sein. Wie in Kapitel 6.3.1 gezeigt wird, können mathematischrechnerische Überlegungen sogar in Bildungssystemen mit Buchstabennoten, wie dem schwedischen, eine Rolle bei der Frage einer als gerecht empfundenen Beurteilung spielen. Eine weitere gängige Kritik an (Ziffern-)Noten bezieht sich auf die Funktionsüberfrachtung bzw. die zahlreichen, teilweise widersprüchlichen Erwartungen, die an die schulische Leistungsbeurteilung formuliert werden. Der folgende Abschnitt wird einen knappen Überblick über die gängigsten Funktionen, die der schulischen Leistungsbeurteilung zugeschrieben werden, geben und anschließend auf das Konzept der Bezugsnormen eingehen. 8

Zur Entstehung und Durchsetzung von psychometrischen Tests und schulischen Noten als quick language im Bildungsbereich, vgl. Lundahl (2008) sowie Lundahl und Waldow (2009). 9

Zu den aus messtheoretischer Perspektive unzulässigen Umrechnungen von Schüler_innenleistungen in Noten und Zeugniszensuren vgl. auch die Ausführungen bei Klein (2009, S. 20-21).

26

2 Begriffe und sensibilisierende Konzepte

2.2 Funktionen und Bezugsnormen der Leistungsbeurteilung Es gibt wohl keinen anderen Bereich schulischer Realität, an dem sich die fundamentalen Spannungsfelder der Institution Schule besser verdeutlichen lassen, als die Leistungsbeurteilung. In ihr vereinen sich zahlreiche gesellschaftliche und pädagogische Anforderungen, die, wenn sie denn alle gleichzeitig und in gleichem Maße berücksichtigt würden, zu einem Kollaps des schulischen Systems führen müssten. Dass dem nicht so ist, liegt vornehmlich an dem hybriden und sich stets im Wandel befindlichen Charakter dieser Anforderungen – und den bei aller Widersprüchlichkeit ebenfalls eingebauten Freiräumen, die Lehrkräften bei der alltäglichen Prozessierung schulischer Leistungsbeurteilung zur Verfügung stehen. Der schulischen Leistungsbeurteilung wird insbesondere von der deutschsprachigen Erziehungswissenschaft eine „funktionale Überfrachtung“ (vgl. Tillmann & Vollstädt, 2009, S. 35; Sacher, 2014, S. 30) attestiert, die über die testtheoretisch begründete Kritik an der „Fragwürdigkeit der Zensurengebung“ (Ingenkamp, 1972) hinausgeht. Der schulischen Leistungsbeurteilung würden demgemäß zu viele10 – und häufig in ihren Anforderungen auch diametral entgegengesetzte – Funktionen zugeschrieben, deren gleichzeitige (und gleichwertige) Erfüllung in der Unterrichtspraxis unmöglich sei. Systematisierend wird häufig eine Aufteilung der vielfältigen Aufgaben in die zwei Bereiche der pädagogischen und der gesellschaftlichen Funktionen vorgenommen (Tillmann & Vollstädt, 2009). Als pädagogische Funktionen der Leistungsbeurteilung werden beispielsweise die Orientierungs- und Rückmeldefunktion gefasst, die sich darauf beziehen, dass den Schüler_innen durch Noten eine Möglichkeit 10

So listet bspw. Klein in einem Ratgeberbuch für Lehrkräfte der Sekundarstufe nicht weniger als zwölf verschiedene Funktionen der schulischen Leistungsbeurteilung auf – diese seien: Selektion/Allokation, Leistungs- und Lernstandskontrolle, Motivation, Rückmeldung/Berichterstattung, Diagnose, Prognose, Klassifizierung, Sozialisierung, Disziplinierung, Chancenausgleich, Selbstdarstellung, Aufsicht/Kontrolle (vgl. Klein, 2009, S. 21).

Funktionen und Bezugsnormen der Leistungsbeurteilung

27

gegeben wird ihren Leistungsstand besser einzuschätzen, Stärken und Schwächen zu erkennen und Rückmeldungen zu ihrem Lernprozess zu erhalten. Damit verbunden ist auch eine Motivationsfunktion, die auf der Annahme fußt gute Noten würden als Belohnung für erfolgreiches Lernen verstanden, schlechte Noten hingegen zu verstärkter Anstrengung motivieren. Zensuren und vor allem Zeugnisse haben darüber hinaus auch eine gewisse Berichtsfunktion gegenüber den Eltern oder anderen Dritten. Unter den gesellschaftlichen Funktionen der schulischen Leistungsbeurteilung sticht insbesondere die Selektions- bzw. Allokationsfunktion hervor, die sich auf die mit schulischen Noten und Zeugnissen verbundene Zuweisung von Bildungs- und Lebenswegen bezieht. Durch die Vermittlung der meritokratischen Idee einer auf individueller Leistung basierenden Verteilung von Lebenschancen erfüllt die schulische Leistungsbeurteilung zudem auch eine Sozialisationsfunktion: Schüler_innen lernen auf diese Weise das meritokratische Prinzip (in Deutschland auch Leistungsprinzip genannt) als ‚gerechten‘ Maßstab für gesellschaftliche Verteilungsprozesse zu akzeptieren. Neben diesen zwei Funktionsbereichen, die der schulischen Leistungsbeurteilung aus schultheoretischer Perspektive zugeschrieben werden, finden sich auch weitere Differenzierungen aus pädagogischdiagnostischer Sicht, die im Folgenden kurz dargestellt werden. Nach Maier (2015) müssen vier verschiedene Ebenen unterschieden werden, wenn es um die Frage der Funktion pädagogischer Diagnostik geht: Individualdiagnostik (einzelne Schüler_innen), Gruppendiagnostik (Klassen, Lerngruppen), Organisationsdiagnostik (Schulen) sowie Bildungsmonitoring bzw. Benchmarking (Schulsysteme, Länder, Schularten) (vgl. Maier, 2015, S. 35). Jede dieser Ebenen erfordere unterschiedliche diagnostische Verfahren, da sie unterschiedliche Zielstellungen verfolgen. In der Praxis dominieren jedoch gruppendiagnostische Verfahren, da sie eher den organisatorischen Rahmenbedingungen von Schule entsprechen und zeitlich weniger aufwendig sind als individualdiagnostische Tests. Auf diese Weise kommt der Lerngruppe als Bezugsrahmen eine dominante Stellung zu, die für die Förderung individueller Schüler_innen

28

2 Begriffe und sensibilisierende Konzepte

jedoch wenig aussagekräftig und zum Teil sogar kontraproduktiv sein kann. Gleiches gilt für die auf der Organisationsebene erfassten Leistungsdaten in Form von Lernstandserhebungen, mit deren Hilfe sich zwar Aussagen über Veränderungen im Vergleich zu den Vorjahren bzw. zu anderen Schulen treffen lassen, die Lernentwicklung einzelner Schüler_innen jedoch nicht ausreichend abgebildet werden kann. Die Ergebnisse von Verfahren des Bildungsmonitorings wiederum liefern Hinweise auf die Lernprozesse ganzer Alterskohorten, die verwendeten Leistungstests sind jedoch naturgemäß „sehr grobkörnig“ und für individualdiagnostische Zwecke ungeeignet (vgl. Maier, 2015, S. 35–38). Maier (2015) zufolge kann auf der Individualebene zwischen Selektionsdiagnostik und Modifikationsdiagnostik bzw. Förderdiagnostik unterschieden werden: zu den selektionsdiagnostischen Verfahren zählen demnach sogenannte Schullaufbahnempfehlungen, die eine Bildungsentscheidung begründen oder den Schüler_innen und deren Eltern als Grundlage für Schulwahlentscheidungen dienen sollen. Aber auch Abschlussnoten, auf deren Grundlage Aussagen über den Lernerfolg von Schüler_innen getroffen werden und die ebenfalls im Zusammenhang mit Schulübergängen, Versetzungen und weiterführenden Bildungsmöglichkeiten stehen zählen zu den selektionsdiagnostischen Instrumenten. Modifikations- bzw. förderdiagnostische Verfahren würden eingesetzt, um individuelle Leistungspotenziale und -schwächen von Schüler_innen zu identifizieren und geeignete Förderstrategien entwickeln zu können. Im Unterschied zur Selektionsdiagnostik ziehen förderdiagnostische Methoden keine Note oder anderweitige Bewertung nach sich, sondern zielen vielmehr auf die Anpassung des Unterrichts auf den Lernstand der Schüler_innen bzw. der Einleitung zusätzlicher Fördermaßnahmen (vgl. Maier, 2015, S. 40–41). In der anglo-amerikanischen Forschungsliteratur haben sich für diese Unterscheidung die Begriffe summative vs. formative assessment etabliert (vgl. u.a. Bloom, Hastings & Madaus, 1975; Black & Williams, 2009; Broadfoot, 2007). Daneben wird auch von summativer Beurteilung als assessment OF learning und formativen Beurteilungen als assessment FOR learning gesprochen, um die beiden Arten von Leistungsbeurteilun-

Funktionen und Bezugsnormen der Leistungsbeurteilung

29

gen zu unterscheiden.11 In der schwedischen Literatur zur schulischen Leistungsbeurteilung werden seit ca. 10 Jahren auch vermehrt die Begriffe formativ respektive summativ bedömning bzw. bedömning för lärande (in Anlehnung an das assessment for learning) genutzt und die entsprechenden Konzepte diskutiert (vgl. Lundahl, 2011, 2012). Weiterhin firmiert die Idee der formativen Leistungsbeurteilung auch unter den Begriffen der „pädagogischen Beurteilung“ (pedagogisk bedömning) (vgl. Lindström, Lindberg & Pettersson, 2013) und einer „Beurteilung des Lernens“ (lärande bedömning) (Jönsson, 2009). Auch in der deutschsprachigen Literatur haben die Konzepte der formativen bzw. summativen Leistungsbeurteilung in den letzten Jahren Einzug gehalten (vgl. Köller, 2005; Klieme et al., 2010; Smit, 2008, 2009; Maier, 2010, 2015). Nach Maier kann „jedes diagnostische Verfahren je nach Kontext und Nutzung summative oder formative Aspekte aufweisen“ (Maier, 2015, S. 41). Als Beispiel führt er den Würzburger Rechtschreibtest von Trolldenier (2008) an, mit dessen Ergebnissen Lehrkräfte einerseits ihre (summative) Notengebung abgleichen können, andererseits aber auch formative Diagnosen im Sinne eines Vorher-Nachher-Tests durchführen können, um den Lernfortschritt der Schüler_innen abzubilden und ihren Unterricht ggf. anzupassen. Leistungsbeurteilungen, die in einem formativen Sinne durchgeführt werden, können dabei auch zu neuen Akteurskonstellationen führen, indem sie die Schüler_innen durch Selbstund Peerbeurteilungen einbeziehen. Idealerweise sollen diese Instrumente vornehmlich für die Rückmeldung des Lernstands und Begleitung des Lernprozesses eingesetzt werden, um die Schüler_innen zu aktiven Lernenden im Sinne eines selbstregulierten Lernens anzuregen. Inwiefern dies der gelebten Praxis im Klassenzimmer entspricht, bleibt jedoch fraglich. Für die Konzeptionalisierung des Phänomens gerechter Leistungsbeurteilung lässt sich aus der Zusammenschau der verschiedenen Funktio11

Diese Begriffe gehen auf die Arbeit der „Assessment Reform Group“ zurück, die 1989 zusammentrat um das englische Beurteilungssystem zu evaluieren, vgl. https://www.aaia.org.uk/blog/2010/06/16/assessment-reform-group/ [17.12.2016].

30

2 Begriffe und sensibilisierende Konzepte

nen, die der schulischen Leistungsbeurteilung zugeschrieben werden, lässt sich ableiten, dass aus diesen Funktionen zum Teil konfligierende normative Erwartungen an die beurteilenden Lehrkräfte formuliert werden, die diese wiederum in ihrer alltäglichen Beurteilungsarbeit (ob bewusst oder unbewusst) beeinflussen dürften.

Bezugsnormen der Leistungsbeurteilung Für die Beurteilung einer Schüler_innenleistung können Lehrkräfte auf verschiedene Maßstäbe zurückgreifen, um zu entscheiden, wann eine Leistung als ‚besser‘ oder ‚schlechter‘ angesehen wird und welche Leistung einer bestimmten Zensur entspricht. Je nach Vergleichsmaßstab kann dabei ein und dieselbe Leistung zu unterschiedlichen Bewertungen durch die Lehrkraft führen. Klassischerweise wird hier zwischen drei verschiedenen Vergleichsmaßstäben, auch Bezugsnormen genannt, unterschieden: der sozialen, der individuellen und der kriterialen Bezugsnorm (Rheinberg, 2002). Bei der sozialen Bezugsnorm steht der Vergleich innerhalb einer sozialen Gruppe, meist einer Schulklasse im Zentrum der Beurteilung. Leistungen werden hier also in ihrer Relation zu den durchschnittlichen Leistungen einer Referenzgruppe bestimmt und die relativen Unterschiede zwischen Schüler_innen betont. Leistungen, die unterhalb des Durchschnittswerts liegen, werden somit negativ bewertet, diejenigen, die über diesem Wert liegen, entsprechend positiv und insgesamt verteilen sich die Leistungen innerhalb einer Bezugsgruppe entsprechend der Normalverteilung. Über den individuellen Lernfortschritt einzelner Schüler_innen wird hierbei ebenso wenig ausgesagt, wie über das Abschneiden hinsichtlich eines absoluten Maßstabs. Auch sind Vergleiche über längere Zeiträume nicht möglich, da sich bei einer veränderten Zusammensetzung der Referenzgruppe auch der Vergleichsmaßstab ändert. Wird die individuelle Bezugsnorm angewandt, erfolgt dieser Vergleich zwischen dem aktuellen Leistungsstand eines Lernenden und dem Leistungsstand zu einem früheren Zeitpunkt. Der Fokus der Beurteilung liegt

Funktionen und Bezugsnormen der Leistungsbeurteilung

31

hier also stärker auf der individuellen Verbesserung oder Verschlechterung gemessen an früheren Leistungen. Im Zeitverlauf ist damit eine Einschätzung der Lernentwicklung möglich, keine Aussagen können hingegen über das Verhältnis der erreichten Leistung zu denen anderer Schüler_innen bzw. im Verhältnis zu einem absoluten Maßstab getroffen werden. So können bspw. individuelle Leistungen, die eine Verbesserung im Vergleich zu einem früheren Zeitpunkt darstellen, positiv bewertet werden. Obwohl sie gemessen an den Leistungen der Klasse unterdurchschnittlich ausfällt. Die kriteriale Bezugsnorm schließlich setzt die gezeigte Leistung ins Verhältnis zu einem vorab definierten absoluten Maßstab, wie beispielsweise konkreten Lernzielen und Notenkriterien. Die Beurteilung zielt dann darauf ab festzuhalten, inwiefern das definierte Lernziel erreicht oder nicht erreicht wurde, unabhängig davon wie viele andere Schüler_innen ebenfalls das Lernziel erreicht haben. Bedingung dafür ist jedoch ein detaillierter Kriterienkatalog, der vor der Beurteilung formuliert wird, da ansonsten die Gefahr einer nachträglichen Anpassung des Bewertungsmaßstabs an die vorgefundenen Leistungen besteht. Der Vorteil liegt in der genauen inhaltlichen Bestimmung dessen, was Schüler_innen, die ein bestimmtes Lernziel erreicht und damit eine bestimmte Note bekommen, können sollten. In der schwedischen Literatur wird interessanterweise häufig nur zwischen Bezugsgruppen- und Lernzielorientierung (normrelaterad vs. målrelaterad betygssättning) bei der Beurteilung von Schüler_innenleistungen unterschieden (vgl. z.B. Gustafsson, Cliffordson & Erickson, 2014, S. 17), die individuelle Bezugsnorm hingegen nicht erwähnt. Dies lässt sich allerdings auf die wechselhafte Entstehungsgeschichte des schwedischen Beurteilungssystems zurückführen, auf die in Kapitel 5.1.2 näher eingegangen wird. Wie in Kapitel 5 ebenfalls deutlich wird, unterscheiden sich die Regularien der beiden Vergleichseinheiten Schweden und NRW dahingehend, dass in den schwedischen Lehrplänen für die Zeugnisnotenerstellung eine klare Orientierung an der kriterialen Bezugsnorm festgelegt wird, gleichzeitig aber auch die individuelle Bezugsnorm für die fortlaufenden Beurteilungen im Schuljahr nahegelegt

32

2 Begriffe und sensibilisierende Konzepte

wird. In den nordrhein-westfälischen Regularien wiederum wird die Bezugsnormorientierung weitgehend offengelassen, gleichwohl sind die Notendefinitionen so formuliert, dass sie den Anforderungen nach, also kriterial, vergeben werden sollen. In der alltäglichen Beurteilungspraxis treten diese Bezugsnormen selten in Reinform aus, wie Terhart et al. (1999) belegen können. Insbesondere Überlegungen zur Einbeziehung von Anstrengung und Bemühen von Schüler_innen in die Beurteilung schriftlicher Arbeiten oder aber die nachträgliche Anpassung von Beurteilungskriterien an die tatsächlichen Leistungen, wenn diese nicht erwartungskonform ausfallen, sind dabei Dauerthemen in der alltäglichen Beurteilungspraxis von Lehrkräften. 12 Sowohl bei den Funktionen der Leistungsbeurteilung als auch den Bezugsnormen wurde bereits deutlich, dass die Beurteilung von Schüler_innenleistungen alles andere als eine einfache Transformation von Leistungen im Sinne ‚tatsächlicher‘ Fakten in eine Zensur darstellen. Im folgenden Abschnitt wird daher der Aspekt der Herstellung von Leistungen in sozialen Interaktionen näher beleuchtet. 2.3 Leistungsbeurteilung als soziale Konstruktion Jürgens und Lissmann definieren in ihrem Grundlagenbuch zur pädagogischen Diagnostik Leistungsbeurteilung folgendermaßen: „Die schulische Leistungsbeurteilung dient der adäquaten Beschreibung und Bewertung einer schulischen Leistung. Sie verfolgt unterschiedliche Zielsetzungen und verwendet unterschiedliche Beurteilungsmethoden. Sie manifestiert sich überwiegend in Form einer Zensur oder im Zeugnis“ (Jürgens & Lissmann, 2015, S. 68–69). In diesem pädagogisch-psychologischen Verständnis existieren Leistungen damit zunächst einmal un12

Aus lernpsychologischer Sicht wurde zudem die lernförderliche und motivationssteigernde Wirkung der individuellen Bezugsnorm nachgewiesen (vgl. Krampen, 1987; Rheinberg, 1980, S. 98), Heckhausen spricht daher auch vom „motivationspsychologische[n] Primat der individuellen Bezugsnorm“ (Heckhausen, 1989, S. 272).

Leistungsbeurteilung als soziale Konstruktion

33

abhängig von Akteur_innen und können mithilfe geeigneter Methoden erfasst und in Zensuren transformiert werden. Für die vorliegende Arbeit möchte ich zunächst jedoch einen Schritt zurücktreten und danach fragen, wie aus einem Unterrichtsverhalten, einem Gespräch oder einer schriftlichen Äußerung überhaupt eine ‚Leistung‘ wird. Ausgangspunkt ist damit die Feststellung, dass es keine Leistung an sich gibt. Das, was als Schüler_innenleistung durch Lehrkräfte beobachtet und beurteilt werden kann, entsteht, wie oben dargestellt, erst durch die Festlegung einer Norm oder eines Maßstabs anhand derer das gezeigte Verhalten als Leistung erkannt und festgehalten werden kann. Sowohl Schüler_innen als auch Lehrkräfte sind damit an einem permanenten Konstruktionsprozess beteiligt, in dem die einen sich bemühen, ein als Leistung anerkanntes Verhalten hervorzubringen und die anderen versuchen, das gezeigte Verhalten in Bezug auf vorab festgelegte Normen zu beurteilen.13 Das Zeigen solcherart Äußerungen durch die Schüler_innen ist damit ein zentraler Bestandteil der Konstruktion von Schüler_innenleistung: aus den vorhandenen Dispositionen, Begabungen, Kompetenzen von Schüler_innen werden erst dann schulische Leistungen, wenn diese auch nach außen getragen und als solche gezeigt werden (sei es in einem Aufsatz oder durch Fragen im Unterricht oder die Bearbeitung von Hausaufgaben). Die Zuschreibung und Anerkennung von Leistungen durch die Lehrkraft als etwas von den einzelnen Schüler_innen Hervorgebrachtes bildet das notwendige Gegenstück zum Zeigen von Leistung – Leistungen müssen als solche von der Lehrkraft auch gesehen werden. Rabenstein, Reh, Ricken und Idel unterscheiden daher auch in ihrer ethnographischen Untersuchung von Schüler_innenleistungen in „Praktiken der Aufführung von Leistung und Praktiken der Wertung von Leistung“ (Rabenstein et al., 2013, S. 677; Hervorh. K.F.). Schäfer bemerkt dazu, dass Leistungen „durch ihre Bewertung überhaupt erst als Leistung her13

Wenn hier von Verhalten die Rede ist, so sind damit verschiedene sprachliche und nonverbale Äußerungen zusammengefasst, die als Ausdruck von Schüler_innenleistungen gelesen werden können.

34

2 Begriffe und sensibilisierende Konzepte

vorgebracht“ werden (Schäfer, 2015, S. 27) und auch Heid definiert Leistung als „Resultat einer Be-Wertung“ (Heid, 1992, S. 92). Was genau von den Beteiligten wie bewertet wird, was also im schulischen Kontext unter einer Leistung verstanden wird, kann sehr unterschiedlich ausfallen, da der Begriff der Leistung nur schwer von Kategorien wie Verhalten, Persönlichkeitsmerkmalen oder dem Charakter einer Person zu trennen ist. Rabenstein, Reh, Steinwand und Breuer (2014) dazu: „Das, was als Leistung gemeinsam in unterrichtlichen Praktiken hergestellt und interpretiert wird, ist ein breites Spektrum an Verhalten sich selbst und den Dingen gegenüber, an Fähigkeiten, Kognition vor allem, aber auch an Einstellungen und Haltungen. Dazu können neben Kommunikativität und Eloquenz z.B. auch Aufmerksamkeit, Disziplin und Arbeitswillen, Gewissenhaftigkeit, Verantwortlichkeit und Verlässlichkeit sowie Schnelligkeit der Aufgabenbewältigung, Kooperativität, Kreativität und Aufgeschlossenheit zählen.“ (Rabenstein et al., 2014, S. 138)

‚Schulische Leistung‘ wird dementsprechend in dieser Arbeit in Abgrenzung zu anderen Begriffen wie Fähigkeiten, Fertigkeiten oder Kompetenzen nicht als Persönlichkeitsmerkmal von Schüler_innen verstanden. Vielmehr wird das, was als schulische Leistung einzelnen Schüler_innen zugeschrieben wird, als erst durch die Bewertung durch Dritte, zumeist Lehrkräfte, Hergestelltes gefasst. Schulische Leistung wird somit als soziales Konstrukt verstanden, das erst durch Zuschreibungen in sozialen Situationen hervorgebracht und anhand kontingenter Kriterien klassifiziert wird (Bräu & Fuhrmann, 2015). Die soziale Konstruktion von Leistung wird damit zu einem weiteren Ausgangspunkt dieser Arbeit und schließt an die wissenssoziologischen Grundannahmen ausgehend von Berger und Luckmann (1966) von der sozialen ‚Gemachtheit‘ von Institutionen an. Demnach wird aus dem Zusammenspiel individueller Erfahrungen, Vorstellungen und Handlungen über Generationen hinweg eine erfahrbare gemeinsame soziale Wirklichkeit hervorgebracht, die wiederum als objektive „soziale Fakten“ (Berger & Luckmann, 1977, S. 64) den Akteuren gegenübertreten. Für die Akteure nehmen diese sozialen Fakten den Charakter von Handlungsregeln an, die darüber entscheiden, welche Handlungen von wem als legitim gelten. Den handelnden Akteuren innerhalb konkreter Orga-

Leistungsbeurteilung als soziale Konstruktion

35

nisationen kommt aus dieser Perspektive eine zentrale Rolle bei der gleichzeitigen Reproduktion intersubjektiv geteilter, aber auch der Hervorbringung neuer Regeln und Normen zu. Dabei zeigt sich insbesondere in der Schule besonders deutlich, wie gesellschaftlich verhandelte Klassifikationen sich als personenunabhängige Strukturen fortsetzen und das Handeln der Akteure (bspw. der Lehrkräfte) beeinflussen. Wenn Leistungen und die schulische Leistungsbeurteilung sozial konstruiert werden, kommt den handelnden Akteuren – hier also den Lehrkräften – eine zentrale Rolle bei der Entscheidung darüber, was als Leistung anerkannt und wie bewertet werden kann. Diese Entscheidungen werden jedoch immer auch im Rahmen institutionell verankerter Deutungsspielräume getroffen, die einen Rahmen dessen, was möglich ist zu denken darstellen. Leistungsbeurteilungen in Form von Zensuren sind demnach „Ergebnisse eines Konstruktionsprozesses, der eben nicht nach einem klaren Algorithmus, sondern erfahrungsfundiert, fallbezogen und unter kontinuierlichem Risiko erfolgt“ (Terhart, 2009, S. 43). Sie sind in dieser Perspektive immer schon Deutungen der schulischen Wirklichkeit – Lehrkräfte nehmen das Unterrichtshandeln ihrer Schüler_innen wahr und leiten daraus ab, über welches Wissen diese verfügen, sie produzieren in diesem Sinne die Leistungen ihrer Schüler_innen (zur Leistungsbeurteilung als Abfolge von Deutungsprozessen vgl. Sadler, 1998; Allal, 2013). Leistungsbeurteilung wird damit zu einem „socially situated interpretative act“ (Butler Shay, 2004). Kalthoff und Dittrich charakterisieren die Leistungsbeurteilung denn auch als „organisatorisches Verfahren“, bei dem durch eine Reihe von Bewertungsstationen aus den Beurteilungen individueller Lehrkräfte kollektive Entscheidungen werden, „welche die Note der Lehrperson als eine schulische Bewertung ratifiziert“ (Kalthoff & Dittrich, 2016, S. 465). Im Sprechen über ihr Beurteilungshandeln wiederum konstruieren Lehrkräfte ein bestimmtes Bild ihres professionellen Handelns, bewerten dieses, betonen jenes, lassen einiges aus und fügen anderes hinzu. In der Analyse dieser Selbstinszenierungen wird eine weitere Konstruktionsebene zugefügt, es erfolgt die Rekonstruktion von Rekonstruktionen. Dieser konstruktivistischen Perspektive auf schulische Leistungsbeurteilung

36

2 Begriffe und sensibilisierende Konzepte

folgend, geht auch diese Arbeit davon aus, dass das was sich in Noten und Zeugnissen ausdrückt nicht das Ergebnis einer reinen Messung von Schüler_innenwissen entspricht, sondern vielmehr in der unterrichtlichen Interaktion zwischen Lehrer_innen und Schüler_innen hergestellt, überprüft und als Leistung konstruiert wird. Insofern wird auch die schulische Leistungsbeurteilung als sozialer Konstruktionsprozess betrachtet. Welche Konsequenzen ergeben sich aus diesen Überlegungen für die methodische Anlage dieser Studie? Die erziehungswissenschaftlichethnographische Forschung fokussiert auf die Praktiken der Hervorbringung von schulischen Leistungen und thematisiert dabei auch Fragen der Reproduktion sozialer Ungleichheiten durch die schulische Leistungsbeurteilung (vgl. Rabenstein et al., 2013). Und obwohl diese Arbeiten wichtige Erkenntnisse hinsichtlich der situativen Konstruiertheit von Leistungen liefern können – und damit die Illusion einer ‚objektiv‘ vorhandenen und damit messbaren Leistung entlarven – handelt es sich doch immer um Zuschreibungen durch die außenstehenden Beobachter_innen. Die den beobachtbaren Handlungen zugrundeliegenden Überzeugungen, mit denen ebenjenes Verhalten von den Handelnden selbst erklärt und gerechtfertigt wird, bleiben außen vor.14 Insofern liegt eine Befragung der handelnden Akteure mittels möglichst offen gehaltener Interviews nahe. Wie in Kapitel 3.2 näher ausgeführt wird, stellen episodische Interviews (Flick, 2011), die an die Theorie sozialer Repräsentationen (Moscovici, 1973) anschließen, einen äußerst fruchtbaren methodischen Zugang zu den hier interessierenden Gerechtigkeitsüberzeugungen von Lehrkräften dar. Im Folgenden soll nun eine begriffliche Annäherung an das Konstrukt der Gerechtigkeit erfolgen, indem gängige Konzepte der sozialwissenschaftlichen empirischen Gerechtigkeitsforschung eingeführt werden.

14

Natürlich handelt es sich bei der Interpretation von Interviewaussagen auch immer um Zuschreibungen von außen durch die Forschenden. Gleichwohl lassen sich mithilfe von Interviews die für die Befragten relevanten handlungsleitenden Überzeugungen, die beobachtbaren Praktiken zugrunde liegen, deutlicher herausarbeiten.

Gerechtigkeitsbegriffe der empirischen Sozialforschung

37

2.4 Gerechtigkeitsbegriffe der empirischen Sozialforschung Der Begriff ‚Gerechtigkeit‘ wurde und wird in verschiedenen wissenschaftlichen Kontexten verhandelt, darunter so unterschiedliche Disziplinen wie die Politische Philosophie, die Organisations- und Sozialpsychologie, die erziehungswissenschaftliche Schul- und Unterrichtsforschung sowie die Vergleichende Politikwissenschaft. Auf die längste Tradition kann dabei sicherlich die Politische Philosophie zurückgreifen, die sich mit der Frage beschäftigt, wie eine gerechte Gesellschaft aussehen könnte - die Frage nach Gerechtigkeit also aus einer normativen Perspektive heraus zu beantworten versucht. Prominentester Vertreter ist sicherlich John Rawls mit seiner 1971 entwickelten Gerechtigkeitstheorie (Rawls, 1971, 1994). In den Sozialwissenschaften, und hier besonders in der empirischen Gerechtigkeitsforschung, liegt der Schwerpunkt jedoch weniger auf dem Versuch einer Definition von ‚wahrer‘ Gerechtigkeit, als vielmehr auf der Frage, unter welchen Umständen Menschen etwas als gerecht bzw. ungerecht wahrnehmen, welche unterschiedlichen Gerechtigkeitsüberzeugungen Menschen haben oder wie Gerechtigkeitsurteile sich in sozialen Kontexten verändern (vgl. Liebig & Sauer, 2016). Die zentrale Position lässt sich mit dem leicht abgewandelten Diktum von Walster, Walster und Berscheid15 (1978), dass Gerechtigkeit im Auge des Betrachters liege, zusammenfassen. Nach Liebig (2002) kann in eine normative und eine empirische Gerechtigkeitsforschung unterschieden werden, die unterschiedlichen Prämissen folgen: Während die normative Gerechtigkeitsforschung Wert darauf lege, dass ein Gerechtigkeitsurteil aus einer unparteiischen Position heraus und in Kenntnis moralisch verpflichtender Regeln heraus formuliert sein müsse, würden für die empirische Gerechtigkeitsforschung alle Äußerungen von Befragten als 15

Genau genommen lautet der Ausspruch: „Equity is in the eyes of the beholder“ (Walster et al., 1978, S. 15), bezieht sich damit also nur auf eine bestimmte Art von Gerechtigkeit. Allerdings ist die Formulierung häufig in der leicht verfremdeten Version „Justice is in the eyes of the beholder“ zitiert worden – zumindest in der deutschsprachigen empirischen Gerechtigkeitsforschung.

38

2 Begriffe und sensibilisierende Konzepte

Gerechtigkeitseinstellungen gewertet, „sofern über die Itemformulierung oder die Bewertungsdimension auf den Begriff Gerechtigkeit hingewiesen wird und dies den Befragten auch verständlich ist“ (Liebig, 2002, S. 77-78). Im Folgenden werden verschiedene Gerechtigkeitsformen und –prinzipien dargestellt, die in der empirischen Gerechtigkeitsforschung zur Anwendung kommen. Einige davon werden später im empirischen Teil wieder aufgegriffen, da sie als sensibilisierende Konzepte in die Analysearbeit einflossen. Insofern erfolgt an dieser Stelle vor allem ein kursorischer Überblick über die wichtigsten Begriffe, die Anwendung auf das soziale Phänomen der schulischen Leistungsbeurteilung findet in Kapitel 6 statt. 2.4.1 Formen von Gerechtigkeit In der empirischen Gerechtigkeitsforschung wird zwischen drei Formen von Gerechtigkeit innerhalb von Organisationen unterschieden: Verteilungsgerechtigkeit, Verfahrensgerechtigkeit und Interaktionsgerechtigkeit.16 Unter Verteilungsgerechtigkeit (distributive justice) wird die gerechte Verteilung von Gütern und Lasten auf eine bestimmte Gruppe von Menschen verstanden. Bezogen auf die schulische Leistungsbeurteilung kann beispielsweise die (ungleiche) Verteilung von Aufmerksamkeit, Zeit sowie Unterstützungsleistungen von Lehrkräften auf die Schüler_innen einer Klasse als Frage von Verteilungsgerechtigkeit betrachtet werden (vgl. Deutsch, 1979; Jasso, Törnblom & Sabbagh, 2016). Elsters Konzept der „local justice“ (Elster, 1992) lässt sich hier ebenfalls zuordnen, das auf die sachliche, räumliche und zeitliche Begrenztheit von Verteilungsprozesse abhebt, die beispielsweise bei der Vergabe von Sozialwohnungen ähnlich wie bei Studienplätzen gegeben sind. Elster verweist auch darauf, dass Entscheidungsträger_innen häufig mehr als nur ein Vertei16

Für einen detaillierten, historischen Überblick über die verschiedenen organisationssoziologischen Ansätze vgl. Colquitt (2005)

Gerechtigkeitsbegriffe der empirischen Sozialforschung

39

lungsprinzip anlegen, wenn sie konkrete Entscheidungen rechtfertigen – er zeigt aber auch, dass Verteilungsentscheidungen, die auf der lokalen Ebene als gerecht empfunden werden, gleichzeitig eine „globale Ungerechtigkeit“17 hervorrufen können (Elster, 1992, S. 132–134). Die Verfahrensgerechtigkeit (procedural justice) legt ihren Schwerpunkt mehr auf die Einhaltung von vorab festgelegten Regeln im Rahmen von Entscheidungsprozessen sowie auf die Sicherstellung eines fairen Verfahrens. Darunter können, wiederum bezogen auf die schulische Leistungsbeurteilung, beispielsweise Fragen der Einhaltung von Prüfungsordnungen bei Abschlussprüfungen oder das korrekte Erstellen einer Zeugnisnote in einem bestimmten Fach fallen (vgl. Vermunt & Steensma, 2016). Leventhal (1980) hat für die empirische Untersuchung von Verfahrensgerechtigkeit sechs „procedural components“ mit Kriterien für einen fairen Verteilungsprozess vorgeschlagen: consistency, bias suppression, accuracy, correctability, representativeness, ethicality (vgl. Leventhal, 1980; Leventhal, Karuza & Fry, 1980). In Waldow (2011a) findet sich eine Anwendung dieser components zur Analyse des Zusammenhangs von Verfahrensgerechtigkeit und Leistungsbeurteilung am Falle Schwedens und Deutschland (vgl. auch Waldow, 2014). Oehme (2015) wiederum wendet die Leventhal’schen Komponenten zur Analyse der Gerechtigkeitskonzeptionen von Schulinspektor_innen in England an. Bei der Interaktionsgerechtigkeit (interactional justice) wiederum stehen weniger das Verfahren oder das Ergebnis eines Verfahrens im Mittelpunkt, zentral ist hier die Frage, ob sich die beteiligten Personen gegenseitig fair behandelt fühlen (Bies & Moag, 1986). Laut der relativen Deprivationstheorie bewerten Menschen Situationen als gerecht bzw. ungerecht immer im Vergleich zu anderen, dies aber vorzugsweise im Vergleich zu kleineren Bezugsgruppen und nicht im gesamtgesellschaftlichen Vergleich (vgl. Stouffer, Suchman, DeVinney, Star & Williams,

17

Global wird hier im doppelten Sinne als weltumspannend, aber auch als gesamtgesellschaftlich einem lokalen Gerechtigkeitskontext gegenübergestellt.

40

2 Begriffe und sensibilisierende Konzepte

194918; Crosby, 1984). Mit Blick auf das Klassenzimmer und die verschiedenen Beurteilungssituationen geht es hierbei also beispielsweise darum, unter welchen Bedingungen Schüler_innen eine Beurteilung als gerecht empfinden bzw. welche Strategien Lehrkräfte entwickeln, um ihre Beurteilungen gegenüber Schüler_innen nachvollziehbar zu gestalten. Daneben finden sich mittlerweile auch weitere Gerechtigkeitskonzepte, wie z.B. „retributive justice“, die am ehesten mit ausgleichender Gerechtigkeit übersetzt werden kann (Wenzel & Okimoto, 2016) und darauf abzielt, inwiefern Sanktionen oder Bestrafungen als gerecht empfunden werden. Im schulischen Kontext wäre dies beispielsweise die Rechtfertigung schlechter Noten bzw. disziplinarischer Maßnahmen gegenüber Schüler_innen. Darüber hinaus findet sich auch der Begriff der Tauschgerechtigkeit (kommutative Gerechtigkeit), mit dem ein Gerechtigkeitsverständnis bezeichnet wird, bei dem Leistung und Gegenleistung in einem ausgewogenen Verhältnis zueinander stehen. Dazu gehört auch, dass die Aufwendungen eines Tauschpartners mit denen des anderen gleich sind und niemand einen Vorteil im Sinne geringerer Aufwendungen oder höhere Erträge habe (vgl. Mikula, 2002; Liebig, 2012). Giesinger schlägt bezogen auf die Diskussion um Bildungsgerechtigkeit das Konzept der Schwellengerechtigkeit vor, nach dem das Bildungssystem „jedes Kind zu einem guten Leben in der Gesellschaft befähigen [soll], und das heißt zu autonomer Lebensgestaltung unter Teilnahme am sozialen, politischen, ökonomischen und kulturellen Leben der Gesellschaft“ (Giesinger, 2007, S. 377). Ziel wäre es demnach, allen Kindern das Erreichen 18

Das Konzept der relativen Deprivation wurde erstmals in einer Studie über USamerikanische Soldaten und ihre Erfahrungen hinsichtlich einer fairen Behandlung durch das US-amerikanische Militär eingeführt (vgl. Stoufferet al., 1949). Stouffer et al. (1949) konnten bspw. zeigen, dass Soldaten ihre Aufstiegschancen als positiv einschätzten, wenn sie im Vergleich zu ihrer peer-group desselben militärischen Zweigs eine Beförderung erhielten, auch wenn diese Beförderung unterhalb des Niveaus anderer militärischer Karrierebereiche lagen. Die Beurteilung der eigenen Situation hing also in stärkerem Maße von der gewählten Vergleichsgruppe ab, als davon, ob das Ergebnis auf einem absoluten Level gesehen positiv oder negativ ausfiel.

Gerechtigkeitsbegriffe der empirischen Sozialforschung

41

einer Mindestschwelle zu erreichen, die dieses „gute Leben“ ermöglich, oberhalb dieser Schwelle wären ungleiche Bildungswege und Lebenschancen „nicht als moralisch anstößig“ zu betrachten (Giesinger, 2007, S. 377). Wie bereits in Kapitel 1.1 ausgeführt, finden sich bislang nur wenige Studien, die eine Anwendung der Konzepte der empirischen Gerechtigkeitsforschung auf den Bildungsbereich anwenden (vgl. für einen Überblick Resh & Sabbagh, 2016). Die meisten konzentrieren sich dabei auf die Konzepte der Verteilungsgerechtigkeit und der Verfahrensgerechtigkeit (Sabbagh & Resh, 2016, S. 5–7). 2.4.2 Gerechtigkeitsprinzipien Die oben dargestellten verschiedenen Formen von Gerechtigkeit beschreiben, welche Situationen oder Interaktionen mit Gerechtigkeitsfragen verknüpft sein können. Um jedoch eine konkrete Situation als gerecht oder ungerecht beurteilen zu können, müssen diese mit bestimmten Gerechtigkeitsprinzipien in Zusammenhang gebracht werden. Die klassischen drei Gerechtigkeitsprinzipien der Verteilungsgerechtigkeit sind dabei das Leistungsprinzip (equity), das Gleichheitsprinzip (equality) und das Bedürfnisprinzip (need).19 Nach dem Gleichheitsprinzip (equality) sollen alle Beteiligten auf die gleiche Weise behandelt werden bzw. haben einen Anspruch darauf, das gleiche Ergebnis zu erzielen. Dieses Prinzip kommt vor allem in kleineren Gruppen mit engen Sozialbeziehungen, die auf dem Solidaritätsprinzip aufbauen, zum Tragen (vgl. Deutsch, 1979, S. 397; Deutsch, 1985). Das Gleichheitsprinzip kann dabei noch weiter aufgeschlüsselt werden: Unter dem Aspekt einer equality of opportunities (auch Chancengleichheit 19

Die Erkenntnis, dass unterschiedliche Verteilungsprozesse verschiedenen allokativen Normen unterliegen können, die das jeweilige Ergebnis als fair oder unfair erscheinen lassen, beruht auf den Arbeiten von Gerald Leventhal (1976) und Morton Deutsch (1975).

42

2 Begriffe und sensibilisierende Konzepte

oder Chancengerechtigkeit genannt) kann beispielsweise die formal gleiche Möglichkeit zur Teilnahme an Bildungsangeboten für alle Schüler_innen im Mittelpunkt bildungspolitischer Bemühungen stehen. Dabei werden jedoch die unterschiedlichen Lernvoraussetzungen und Ausgangslagen von Schüler_innen negiert, die ggf. zu einer unterschiedlichen Nutzung dieser potenziell gleichen Chancen führen (vgl. zur Kritik des Konzepts der Chancengerechtigkeit Giesinger, 2007). Legt man hingegen equality of outcome als Gerechtigkeitskriterium an, zielen die Bemühungen darauf ab, diese unterschiedlichen Startvoraussetzungen durch kompensatorische Maßnahmen auszugleichen, um die Zielerreichung für alle zu ermöglichen. Die daraus entstehende Ungleichbehandlung von ungleichen Schüler_innen kann wiederum als ungerecht verstanden werden, wenn das Gleichheitsprinzip im Sinne von equality of treatment verstanden wird, also die Einhaltung des gleichen Verfahrens für alle Schüler_innen als Gerechtigkeitsmaßstab angelegt wird. Das Leistungsprinzip (equity) hingegen erfordert eine Unterscheidung der Beteiligten hinsichtlich ihres jeweiligen Einsatzes. Gerecht im Sinne des Leistungsprinzips ist eine Entscheidung oder Verteilung dann, wenn jeder und jede so viel erhält, wie er oder sie verdient hat (vgl. Lerner, 1977, 1980). Das Ergebnis eines Verteilungsprozesses richtet sich dabei also nach dem individuell getätigten Aufwand und erfordert deshalb auch keine Gleichbehandlung aller Beteiligten. Nach Deutsch (1979, 1985) wird dieses Prinzip häufig in wirtschaftlichen Zusammenhängen, aber auch im Sport, angewandt. Bezogen auf die schulische Leistungsbeurteilung schließen sich hier Fragen danach an, ob beispielsweise Anstrengung oder Fleiß ebenfalls in die Beurteilung einfließen sollten oder die ‚reine‘ Leistung als Beurteilungskriterium herangezogen wird. Das Bedürfnisprinzip (need) schließlich erfordert ebenfalls eine Unterscheidung der Beteiligten, allerdings liegt die Orientierung hier auf den individuellen Bedürfnissen des Einzelnen und nicht auf den geleisteten Beiträgen. Leitend für dieses Gerechtigkeitsprinzip ist die Orientierung an einem ‚guten Leben‘ für jeden, weshalb dieses Prinzip häufig in Sorgekontexten, wie beispielsweise der Familie, zur Geltung komme (Deutsch 1979, 1985). In einem Forschungsüberblick kommen Stroet,

Gerechtigkeitsüberzeugungen von Lehrkräften

43

Opdenakker und Minnaert zu dem Schluss, dass ein an den Bedürfnissen der Schüler_innen orientierter Unterricht (need supportive teaching) in starkem Zusammenhang zu Schüler_innenmotivation bzw. -engagement steht (vgl. Stroet et al., 2013). An dieser Stelle sei angemerkt, dass es sich sowohl bei den beschriebenen Gerechtigkeitsformen als auch den Gerechtigkeitsprinzipien um analytische Begriffe handelt, die für die Betrachtung empirischer Gerechtigkeitsphänomene hilfreiche heuristische Brillen sein können. Sie dienen insbesondere für die Analyse der Interviewdaten als Vorlage möglicher Fragen, die an das Material gestellt werden können, wie z.B.: Welche Aspekte werden bei der Beurteilung von Schüler_innnenleistungen berücksicht? Spielen Fragen des sozialen Hintergrunds oder von Benachteiligungen eine Rolle bei der Beurteilung? Werden Schüler_innen nach dem Gleichheitsprinzip beurteilt oder spielen kompensatorische Aspekte eine Rolle? Wird der individuelle Lernfortschritt in die Beurteilung einbezogen? Diese und weitere Fragen machen deutlich, dass anzunehmen ist, dass alle genannten Gerechtigkeitsformen und prinzipien für Fragen der Leistungsbeurteilung relevant sein dürften – interessant für die vorliegende Studie ist jedoch in welchen Konstellationen welche Prinzipien von Lehrkräften angewandt werden bzw. ob nicht vielleicht auch über die in der Gerechtigkeitsforschung bekannten Konzepte hinaus auch noch weitere Aspekte relevant für die Frage einer gerechten Leistungsbeurteilung sein können. 2.5 Gerechtigkeitsüberzeugungen von Lehrkräften als Bestandteil berufsbezogener Überzeugungen (teacher beliefs) Schultheoretisch betrachtet, handelt es sich bei der Untersuchung der handlungsleitenden Überzeugungen von Lehrkräften um Prozesse auf der Mikroebene der Schule und des Unterrichts. Mit Fends Mehrebenenmodell des Bildungssystems (vgl. Fend, 2006) lassen sich Lehrkräfte als Akteure in einem komplexen, hierarchisch strukturierten und interdependenten System erkennen, deren Handlungsspielräume durch Entscheidungen auf anderen Ebenen gerahmt werden. Gleichzeitig verfügen

44

2 Begriffe und sensibilisierende Konzepte

sie aber auch über einen eigenständig auszufüllenden Handlungsrahmen, der durch ihre Überzeugungen und ihr professionelles Handeln ausgefüllt wird. Auch aus systemtheoretischer Perspektive sind die handlungsleitenden Überzeugungen von Lehrkräften elementarer Bestandteil erfolgreichen professionellen Handelns. So verwiesen Luhmann und Schorr mit dem Begriff des Technologiedefizits ebenfalls auf die Unmöglichkeit, den praktischen Anforderungen der komplexen Unterrichtssituation allein durch den Rückgriff auf kausales Wissen begegnen zu können (vgl. Luhmann & Schorr, 1982). Auch hier sind es vielmehr die Überzeugungen der jeweiligen Lehrkraft, die pädagogisches Handeln und die Ausgestaltung professioneller Spielräume erst möglich machen. Das hochaktuelle Thema der teacher beliefs findet an der Schnittstelle zwischen psychologischer und erziehungswissenschaftlicher Schul- und Bildungsforschung zunehmend dann Beachtung, wenn es darum geht die Grundlagen des beruflichen Handelns und Seins von Lehrkräften zu erforschen. Auch wenn der Begriff teacher beliefs nach wie vor als „messy construct“ (Pajares, 1992) bezeichnet werden kann, hat er sich in der internationalen Forschung weitgehend durchgesetzt. Auch in der deutschsprachigen Forschung scheint sich der Begriff der Überzeugungen gegenüber anderen Übersetzungen (wie Vorstellungen, Konzeptionen, Einstellungen) zu behaupten, auch wenn diese weiterhin synonym verwendet werden.20 Reusser und Pauli (2014) schlagen den Begriff der berufsbezogenen Überzeugungen als deutsche Übersetzung von teacher beliefs vor. Diese können verstanden werden als „affektiv aufgeladene, eine Bewertungskomponente beinhaltende Vorstellungen […], welche für wahr oder wertvoll gehalten werden und ihrem berufsbezogenen Denken und 20

Reusser und Pauli nennen als Ursache für diese Begriffsvielfalt eine uneinheitliche Übersetzung des englischen Begriffs in der deutschen Forschungslandschaft, aber auch die gleichzeitige Entstehung der „Subjektiven Theorien“ als eigenständigem Forschungsprogramm mit ähnlicher Thematik (Reusser & Pauli, 2014, S. 643). Oser und Blömeke (2012) wiederum sprechen sich eindeutig für die Nutzung des Begriffs der Überzeugungen als passenderer Übersetzung von beliefs in diesem Zusammenhang aus (Oser & Blömeke, 2012, S. 416).

Gerechtigkeitsüberzeugungen von Lehrkräften

45

Handeln Struktur, Halt, Sicherheit und Orientierung geben“ (Reusser & Pauli, 2014, S. 642). Es sind vor allem zwei Merkmale, die das Konzept der berufsbezogenen Überzeugungen so interessant für die vorliegende Arbeit machen: zum einen sind diese Überzeugungen ähnlich wie „Glaubensbestände einer Person“ (Oser & Blömeke, 2012, S. 416) tief verankerte Vorstellungen über die Welt, darüber, wie etwas funktioniert und richtig ist. Diese Vorstellungen sind laut Pajares sehr robust und dauerhaft wirksam: „Beliefs are formed early and tend to self-perpetuate, persevering even against contradictions caused by reason, time, schooling, or experience” (Pajares, 1992, S. 324). Durch ihre oft komplexe Struktur und (Quasi-)Theorieförmigkeit weisen berufsbezogene Überzeugungen eine hohe Stabilität und Resistenz gegenüber neuen Informationen auf, und sichern so die berufliche Identität und Handlungsfähigkeit von Lehrkräften in komplexen und unübersichtlichen beruflichen Situationen – wie beispielsweise bei der schulischen Leistungsbeurteilung. Zum anderen bilden berufsbezogene Überzeugungen durch ihren normativen Charakter das Berufsverständnis einer Profession ab und können als „individuell verinnerlichter kollektiver) Habitus“ (Reusser & Pauli, 2014, S. 644) verstanden werden. Sie weisen damit über die einzelne Lehrkraft hinaus, indem sich in ihnen die kollektiven Regeln und Prinzipien der Profession habitualisiert zeigen. 2.5.1 Gegenstandsbereiche berufsbezogener Überzeugungen von Lehrkräften In der bisherigen Forschung zu teacher beliefs werden drei Gegenstandsbereiche berufsbezogener Überzeugungen unterschieden: epistemologische, personenbezogene und kontextbezogene Überzeugungen (vgl. Hofer & Pintrich, 1997; Reusser, Pauli & Elmer, 2011; Oser & Blömeke, 2012). Epistemologische Überzeugungen umfassen demnach „Inhalte und Prozesse des Wissens, Erkennens, Lehrens und Lernens in einem disziplinär-fachlichen oder fachübergreifenden Sinne“ (Reusser & Pauli, 2014, S. 650). Personenbezogene Überzeugungen beziehen sich auf die an schulischen Interaktionen beteiligten Akteure, vornehmlich

46

2 Begriffe und sensibilisierende Konzepte

Lehrkräfte und Schüler_innen. Dazu gehören die „Selbstwahrnehmung der Lehrkräfte“, „implizite Persönlichkeitstheorien“ von Lehrkräften gegenüber Schüler_innen, aber auch Untersuchungen, „die sich mit Werthaltungen und dem Berufsethos von Lehrpersonen“ beschäftigen, werden zu diesem Bereich gezählt (Reusser & Pauli, 2014, S. 651). Zu den kontextbezogenen Überzeugungen zählen solche beliefs, die grundsätzliche Fragen nach der Rolle von „Kindheit und Jugend, Bildung, Schule und Lehrerberuf in der Gesellschaft“ berühren (Reusser & Pauli, 2014, S. 651). Will man die dem Beurteilungshandeln von Lehrkräften unterliegenden Gerechtigkeitsüberzeugungen ebenfalls als berufsbezogene Überzeugungen verstehen, muss diese Dreiteilung allerdings um eine Ebene ergänzt werden. Die je spezifische Ausgestaltung der Beurteilungspraxis und die dieser Praxis unterliegenden Gerechtigkeitsüberzeugungen sind eng verwoben mit Vorstellungen darüber, was guten Unterricht ausmacht und wie Schüler_innen lernen (epistemologische Überzeugungen); sie hängen aber ebenso eng zusammen mit Überzeugungen darüber, was eine gute Lehrkraft auszeichnet und wie Schüler_innen durch Lehrkräfte wahrgenommen werden (personenbezogene Überzeugungen). Zu guter Letzt stehen Vorstellungen davon, welche Funktionen schulischer Leistungsbeurteilung und Zertifizierung im gesamtgesellschaftlichen Kontext zukommen (kontextbezogene Überzeugungen) ebenfalls in engem Zusammenhang mit Gerechtigkeitsüberzeugungen. In Ergänzung zur klassischen Einteilung in epistemologische, personenbezogene und kontextbezogen Überzeugungen wird in dieser Arbeit vorgeschlagen, die Gerechtigkeitsüberzeugungen von Lehrkräften in Bezug auf die schulische Leistungsbeurteilung als weitere Komponente berufsbezogener Überzeugungen von Lehrkräften zu fassen – allerdings als quer zu den drei genannten Gegenstandsbereichen liegender Gegenstandsbereich berufsbezogener Überzeugungen von Lehrkräften (vgl. Abb. 1).

Gerechtigkeitsüberzeugungen von Lehrkräften

47

Gegenstandsbereiche berufsbezogener Überzeugungen

Personenbezogene Überzeugungen zu Lehrkräften und Schüler_innen

Epistemologische Überzeugungen zu Lehr- und Lernprozessen

Kontextbezogene Überzeugungen zu Schule und Gesellschaft

Gerechtigkeitsüberzeugungen

Abb. 1 – Gerechtigkeitsüberzeugungen als Teilbereich berufsbezogener Überzeugungen (eigene Darstellung in Anlehnung an Reusser & Pauli, 2014, S. 650)

Oser und Blömeke gehen davon aus, dass es unterschiedlich stark verankerte Überzeugungen gibt: sie unterscheiden dabei zwischen tiefer verankerten normativen „beliefs, die auf ein moralisches oder funktionales Muss gerichtet sind“ (Oser & Blömeke, 2012, S. 417) und eher deskriptiven Analysen, die weniger einflussreich für das berufliche Handeln sind. Bezogen auf die Gerechtigkeitsüberzeugungen erscheint diese Unterteilung wenig hilfreich, da sich Gerechtigkeitsüberzeugungen sowohl in Form von normativen Vorstellungen über eine gerechte Leistungsbeurteilung (z.B. „Eine gerechte Beurteilung muss immer von den Lehrplanzielen ausgehen.“), als auch indirekt in deskriptiven Analysen und Situationsbeschreibungen zeigen können. Über die Tiefe dieser Überzeugungen sagt die Unterscheidung in normative und deskriptive Äußerungen allerdings noch relativ wenig aus. 2.5.2 Gerechtigkeitsüberzeugungen als kollektives Wissen Im Zentrum dieser Arbeit stehen die Gerechtigkeitsüberzeugungen von Lehrkräften in ihrer beruflichen Rolle als Lehrkräfte. Die befragten Lehrkräfte werden also als Vertreter_innen ihrer Berufsgruppe, eines berufli-

48

2 Begriffe und sensibilisierende Konzepte

chen Kollektivs, befragt – nicht als Individuen im Sinne von Privatpersonen. Reusser und Pauli sprechen zwar davon, dass Überzeugungen „individueller oder kollektiver Natur“ (Reusser & Pauli, 2014, S. 643) sein können, führen dies allerdings nicht weiter aus. Hier lohnt sich ein Blick in den Ansatz von Michael Baurmann, einem Vertreter der soziologischen Gerechtigkeitsforschung, der „die Entstehung von individuellen Gerechtigkeitsüberzeugungen auf einen kollektiven Interpretations- und Lernprozess bezieht" (Baurmann, 2012, S. 235). Er geht davon aus, „[…] dass Gerechtigkeitsüberzeugungen Bestandteile eines kollektiven Wissens sind – einer Gruppe, einer Klasse, einer Gesellschaft – und der Einzelne seine persönlichen Vorstellungen über Gerechtigkeit erwirbt, indem er auf dem Hintergrund seiner individuellen Erfahrungen und Einstellungen an diesem kollektiven Wissen partizipiert“ (Baurmann, 2012, S. 235). Dieser Ansatz führt die bisherigen Erklärungsansätze der soziologisch-empirischen Gerechtigkeitsforschung logisch fort, indem er die „Reaktionsthese“, nach der Individuen als Reaktion auf bestimmte äußerliche Gegebenheiten spezifische Gerechtigkeitsüberzeugungen ausbilden, und die „Sozialisationsthese“, nach der Individuen in bereits vorhandene gesellschaftliche Vorstellungen einsozialisiert werden, miteinander kombiniert und betont, dass „[d]ie Herausbildung von Überzeugungen […] praktisch immer ein individueller und kollektiver Prozess [ist]“ (Baurmann, 2012, S. 252). Hier finden sich deutliche Parallelen zur Theorie der sozialen Repräsentationen (vgl. Moscovici, 1973; Flick, 1995). Nach Moscovici lassen sich soziale Repräsentationen folgendermaßen definieren: “[A] social representation is a system of values, ideas and practices in a twofold function; first, to establish an order which will enable individuals to orientate themselves in their material and social world and to master it; and secondly to enable communication to take place among the members of a community by providing them with a code for social exchange and a code for naming and classifying unambiguously the various aspects of their world and their individual and group history.” (Moscovici, 1973, S. xiii)

Soziale Repräsentationen dienen also zur Orientierung von Individuen in ihrer sozialen Welt, sie schaffen diese Welt aber auch gleichzeitig durch

Gerechtigkeitsüberzeugungen von Lehrkräften

49

einen Prozess der sozialen Konstruktion von Wirklichkeit. Sie stellen eine „Mischform zwischen individuellem und sozialem Denken und Wissen“ (Flick, 1995, S. 13) dar. Als Forschungsprogramm dienen sie der Identifikation von Konstruktionsprozessen gruppenspezifischen Wissens über bestimmte Phänomene und können die Erfahrungsweisen und das Alltagswissen spezifischer sozialer Gruppen erklären helfen. Wissen wird hierbei verstanden als „soziales Wissen“ (Flick, 1995, S. 13), d.h. von Interesse sind weniger die Art und Weise der Informationsverarbeitung als vielmehr „die Inhalte des jeweiligen Wissens und dessen Bedeutung für die Individuen und Gruppen, die untersucht werden“ (Flick, 1995, S. 13) sowie der Kontext, in dem dieses Wissen entstanden ist. Eine zentrale Annahme der Theorie der sozialen Repräsentation ist die, dass Wissen sozial verteilt ist und es „von der Zugehörigkeit zu sozialen Gruppen abhänge, was Menschen wissen und wie sie es wissen“ (Flick, 1995, S. 14). Ähnlich argumentiert auch Baurmann wenn er schreibt, dass „eine Person ihr individuelles Wissen zum allergrößten Teil nicht aufgrund ihrer eigenen Erfahrungen und Überlegungen erwirbt, sondern als Mitglied einer ‚epistemischen Gemeinschaft‘ mit und von anderen Personen, die gemeinsam über ein bestimmtes kollektives Wissen verfügen“ (Baurmann, 2012, S. 253). Preuße und Zlatkin-Troitschanskaia verwenden das sehr ähnlich gelagerte Konstrukt eines „kollektiv geteilten mentalen Modells“ (Preuße & Zlatkin-Troitschanskaia, 2008). Damit werden interne Abbilder von äußeren Strukturen bezeichnet, die den handelnden Akteuren ermöglichen ihre Umwelt zu verstehen, Entscheidungen zu treffen und deren Konsequenzen abzuschätzen. Ähnlich wie soziale Repräsentationen stellen sie damit eine Abbildung (Repräsentation) der Realität in den Köpfen der handelnden Akteure dar. Übertragen auf die Gruppe der Lehrer_innen bedeutet dies nun, dass ihre Überzeugungen hinsichtlich einer gerechten Leistungsbeurteilung zu einem nicht unerheblichen Teil von ihrer Zugehörigkeit zur Berufsgruppe der Lehrkräfte beeinflusst sind. Folglich ist es möglich von den individuellen Überzeugungen einzelner Lehrkräfte auf gewissermaßen überindividuelle, für die Gruppe der Lehrkräfte typische, kollektive Überzeugungen rückzuschließen.

50

2 Begriffe und sensibilisierende Konzepte

Für das Individuum stellen soziale Repräsentationen „ein Mittel zur Verarbeitung und Einordnung von neuartigen Phänomenen und von Veränderungen bekannter Phänomene“ dar (Flick, 1995, S. 14). Dieses SichVertrautmachen mit dem Unvertrauten geschieht durch zwei Prozesse: Verankerung und Objektivierung. Bei der Objektivierung kommt es zu einem „Übersetzungsprozess vom Abstrakten ins Konkrete“ indem aus einem abstrakten Konzept ein konkretes Bild wird. Von Verankerung spricht man, wenn neue, bisher unbekannte Phänomene in alltägliche, sozial akzeptierte Konzepte integriert werden, wodurch diese sich schrittweise wieder verändern. Nach Billig wird „Verankerung […] als sozialer Prozess verstanden, der das Individuum in seinen sozialen Kontext, die kulturellen Traditionen seiner Gruppe etc. hineinzieht“ (Billig, 1988, S. 6; zitiert nach Flick, 1995, S. 15). Wenn Terhart davon spricht, dass Lehrer_innen in der Berufseingangsphase allmählich in den Lehrberuf eingegliedert werden, passiert genau das: „[D]ie Entwicklung von beruflichen Fähigkeiten […] findet vielfach erst in den ersten Berufsjahren statt, und zwar auf der Basis von individueller Erfahrungsbildung, Eingliederung in die Gewohnheiten der jeweiligen Schule bzw. des jeweiligen Kollegiums und aufgrund von – punktueller – kollegialer Kooperation. Berufliche Sozialisation bedeutet beides: Anpassung an die Gegebenheiten des Berufs und Kompetenzgewinn für den Beruf – man wird Lehrer“. (Terhart, 2011a, S. 713; Hervorh. i.Orig.)

Sowohl bei Baurmann (2012) als auch bei Moscovici (1973) finden sich hier interessante Anschlussmöglichkeiten für die Untersuchung dieses Wechselspiels aus individuellen Erfahrungen und dem Prozess des Einsozialisierens in Wertvorstellungen eines Kollektivs. Forgasz und Leder (2008) konnten in ihrer Untersuchung zu Überzeugungen von Mathematiklehrer_innen allerdings zeigen, dass sich selbst innerhalb derselben Berufsgruppe unterschiedliche Überzeugungen finden lassen und sich beispielsweise Primarschullehrer_innen in ihren Überzeugungen deutlich von Sekundarschullehrer_innen unterschieden, sowie auch Unterschiede zwischen berufstätigen, erfahrenen Lehrkräften und angehenden Lehrer_innen in der Ausbildung bestanden. Dieser Befund wurde bei der Auswahl der zu befragenden Lehrkräfte berücksichtigt (vgl. Kap. 4.1).

Gerechtigkeitsüberzeugungen von Lehrkräften

51

2.5.3 Gerechtigkeitsüberzeugungen und professionelles Handeln Wie die Forschung zu berufsbezogenen Überzeugungen von Lehrkräften zeigt, übernehmen diese eine Brückenfunktion zwischen professionellem pädagogischen Wissen und pädagogischem Handeln in schwierigen oder komplexen Unterrichtssituationen (vgl. König, 2012; Reusser & Pauli, 2014; Reusser et al., 2011). Allerdings liegen bisher nur wenige Untersuchungen zum Zusammenhang von berufsbezogenen Überzeugungen von Lehrkräften und ihrem Beurteilungshandeln im schulischen Alltag vor. Die wenigen Ausnahmen bestätigen jedoch auch hier den handlungsleitenden Charakter pädagogischer Überzeugungen für das tatsächliche Beurteilungshandeln von Lehrkräften (Briscoe, 1994). Berufsbezogene Überzeugungen von Lehrkräften beziehen sich neben fachlich-didaktischen Überzeugungen auch darauf mit welchen „Anschauungen, Weltbildern und Wertorientierungen – mit welchem Professionsideal“ Lehrkräfte sich identifizieren (Reusser & Pauli, 2014, S. 644). Dieses Professionsideal entsteht wie oben bereits beschrieben durch das Einüben in eine vorstrukturierte kollektive Praxis, durch das Verinnerlichen bestimmter Haltungen und Problemlösungen in berufstypischen Situationen, kurz: die Übernahme eines berufsspezifischen Habitus (vgl. Bourdieu, 1987; Oevermann, 1996). Dieser professionelle Habitus wird gestützt durch berufsbezogene Überzeugungen, die gleichsam zur Übernahme eines Habitus führen und die Aufrechterhaltung und Stabilisierung desselben unterstützen. Eben diese maßgebliche Unterstützungsfunktion für das alltägliche professionelle Handeln ist es aber auch, die eine Veränderung von tiefsitzenden Überzeugungen besonders erschwert und das Akzeptieren und Aufnehmen neuer Handlungsroutinen behindert. Dies kann jedoch nur dann zur Veränderung zentraler Überzeugungen von Lehrkräften führen, wenn alternative Handlungsstrategien, Routinen und Hilfsmittel verfügbar gemacht und von Lehrkräften als hilfreich wahrgenommen werden (vgl. Wahl, 2001). Zusammenfassend lässt sich konstatieren, dass sich mit dem konzeptionellen Rahmen der berufsbezogenen Überzeugungen von Lehrkräften, den teacher beliefs, eine fruchtbare Heuristik ergibt, die die Charakteri-

52

2 Begriffe und sensibilisierende Konzepte

sierung der interessierenden Gerechtigkeitsüberzeugungen als Bindeglied zwischen individuellen Vorstellungen und professionellem Handeln als Mitglied einer beruflichen Gruppe zu verstehen hilft. Gleichzeitig wird die Verwobenheit zwischen beruflichem Handeln in konkreten Unterrichtssituationen mit den sie vorstrukturierenden organisatorischinstitutionellen Rahmenbedingungen, die über das Individuum hinausweisen, unterstrichen. Dies wird in Kapitel 6 am konkreten empirischen Material rekonstruiert und in systematisierender Weise dargestellt.

3 Methodologischer Rahmen und Forschungsdesign Im vorangegangenen Kapitel 2 wurde die schulische Leistungsbeurteilung als Kernaufgabe von Lehrkräften charakterisiert, die aufgrund ihrer Bedeutung für die zukünftigen Bildungs- und Lebenschancen von Schüler_innen einerseits eng mit Gerechtigkeitsfragen verknüpft ist, andererseits aufgrund ihres situativ-kontingenten Charakters als soziale Konstruktion in direktem Zusammenhang mit Fragen professionellen Handelns und des professionellen Selbstverständnisses von Lehrkräften steht. In den folgenden Kapiteln 3 bis 6 soll nun die empirische Rekonstruktion der Gerechtigkeitsüberzeugungen von Lehrkräften in den gewählten Vergleichsländern Schweden und Deutschland im Mittelpunkt stehen. Sie stellen damit das Herzstück der vorliegenden Arbeit dar. In Kapitel 3 werden dafür zunächst die methodologisch-methodischen Grundlagen des Forschungsdesigns dargestellt sowie der Forschungsprozess anhand konkreter Forschungsschritte in Kapitel 4 offengelegt. Das anschließende Kapitel 5 enthält die Ergebnisse der Analyse der grundlegenden Strukturen der Bildungssysteme und institutionellen Rahmungen der schulischen Leistungsbeurteilung, die zunächst getrennt für beide Länder dargestellt werden. Im Anschluss daran werden in einem ersten Zwischenfazit die aus der institutionellen Rahmung abgeleiteten Gerechtigkeitsnormen vergleichend zusammengefasst (Kap. 5.3). Die Systembeschreibungen und daraus abgeleiteten Gerechtigkeitsnormen dienen gleichsam als Ausgangspunkt und erklärende Hintergrundfolien für die in Kapitel 6 anschließende Darstellung der empirisch rekonstruierten Gerechtigkeitsüberzeugungen der befragten Lehrkräfte und des daraus abgeleiteten gegenstandsverankerten Theorieentwurfs. Qualitative Forschung wird im Allgemeinen als verstehender Ansatz bezeichnet, mit dem komplexe soziale Zusammenhänge durch die Rekonstruktion der subjektiven Perspektive der Akteure herausgearbeitet und intersubjektiv verstehbar gemacht werden sollen. Dem gegenüber wird quantitative Forschung häufig mit einem erklärenden Ansatz in Verbindung gebracht, der mithilfe standardisierter Erhebungsmethoden darauf © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 K. Falkenberg, Gerechtigkeitsüberzeugungen bei der Leistungsbeurteilung, https://doi.org/10.1007/978-3-658-28275-2_3

54

3 Methodologischer Rahmen und Forschungsdesign

abzielt eine ‚objektive Wirklichkeit‘ abzubilden und zu erklären (vgl. u.a. Flick, 2009; Helfferich, 2011). Auch wenn ich mich mit dieser Art antagonistischer Gegenüberstellungen schwertue und die Kritik an ihr teile21, so gibt es doch einige Grundannahmen, in denen beide Forschungsparadigmen sich diametral gegenüberstehen. Die wichtigsten Grundprinzipien qualitativer Forschung, auf die sich auch diese Arbeit stützt, werden deshalb im Folgenden kurz dargestellt. Dem interpretativen Paradigma qualitativer Sozialforschung (Keller, 2012) folgend, ist eine der Grundannahmen der vorliegenden Studie, dass die die Menschen umgebende Welt keine im Sinne quantitativer Forschung messbare, ‚objektive‘ Realität darstellt, vielmehr wird davon ausgegangen, dass die Wirklichkeit eine subjektive, durch soziale Interaktion und Kommunikation hergestellte Wirklichkeit ist. 22 Eines der Grundprinzipien qualitativ-rekonstruktiver Forschung ist daher die Idee eines „deutenden und sinnverstehenden Zugangs zu der interaktiv ‚hergestellt‘ und in sprachlichen und nicht-sprachlichen Symbolen repräsentiert gedachten sozialen Wirklichkeit“ (Kardorff, 2014, S. 4). Einen möglichen empirischen Zugang stellen Interviews mit zentralen Akteuren eines Feldes dar, in denen durch die kommunikative Interaktion zwischen den Interviewpartner_innen die subjektive Sichtweise auf Phänomene von den Befragten formuliert und der subjektive Sinn des Gesagten (und Nicht-Gesagten) durch anschließende interpretative Rekonstruktion intersubjektiv erfassbar gemacht werden können. Aus diesen Ausführungen wird auch deutlich, dass es qualitativrekonstruktiver Forschung nicht darum geht, theoretische Konzepte und daraus abgeleitete Hypothesen empirisch zu überprüfen, indem diese Konzepte auf die soziale Wirklichkeit angewandt und diese anhand von statistischen Zusammenhängen und Häufigkeitsverteilungen beschrie21

Vgl. hierzu die in Mey und Mruck (2014) dokumentierten Diskussionen auf dem Berliner Methodentreffen zum Stand der qualitativen Sozialforschung und der Notwendigkeit der Annäherung qualitativer und quantitativer Forschungsansätze. 22 Dies geht auf die Annahmen des symbolischen Interaktionismus zurück, die an dieser Stelle nicht weiter ausgeführt werden können (vgl. Blumer, 2004).

Methodologischer Rahmen und Forschungsdesign

55

ben wird (deduktiv-nomothetischer Zugang zu Welt). Vielmehr zielt sie auf die Herausarbeitung der die soziale Wirklichkeit formenden Konzepte aus ihr selbst heraus, d.h. die Rekonstruktion zentraler Konzepte aus der sozialen Wirklichkeit heraus (induktiver Zugang zu Welt). Dies wirkt sich auch auf den Forschungsprozess aus, der nicht linear wie in der quantitativen Forschung üblich, sondern vielmehr als „dynamischoffener, iterativ-zyklischer Forschungsprozess“ verläuft (Kruse, 2014, S. 46; vgl. dazu ausführlicher das folgende Kapitel 3.1). Das Prinzip der Offenheit bestimmt dabei den gesamten Erhebungs- und Auswertungsprozess maßgeblich (Kruse, 2014, S. 70). So werden beispielsweise keine vorab festgelegten Hypothesen oder Kategorien formuliert, die im Verlauf des Forschungsprozesses überprüft werden sollen. Vielmehr werden die relevanten Kategorien, Muster und Zusammenhänge aus dem generierten Datenmaterial heraus rekonstruiert und in fortlaufenden Vergleichsprozessen ausdifferenziert. Auch bei der Konstruktion von Interviewleitfäden wirkt das Prinzip der Offenheit dahingehend, dass möglichst offengehaltene Fragen formuliert werden, die in der Interviewsituation flexibel eingesetzt werden, um den Befragten möglichst viel Raum zu geben ihre eigenen Relevanzsysteme und Deutungsmuster entfalten zu können. Ermöglicht wird dies durch eine möglichst zurückhaltende Kommunikationshaltung der Interviewenden, die eine hohe erzählende Selbstbestimmung und Erzählaktivität der Befragten stimulieren soll. Neben der Grundhaltung der Offenheit strukturieren qualitative Methoden die Kommunikationssituation und ermöglichen somit auch eine Fokussierung auf ausgewählte Phänomenbereiche, so z.B. durch den Einsatz von Interviewleitfäden, die um zentrale Aspekte des interessierenden Phänomens kreisen. Das Prinzip des kontrollierten Fremdverstehens (vgl. u.a. Schütz, 2004, S. 164; Kruse, 2014, S. 60–75; Helfferich, 2011, S. 84–90) umschreibt die Haltung, menschliche Kommunikation grundsätzlich als Leistungen des Fremdverstehens zu betrachten. Einander zu verstehen, bedeutet aus dieser Perspektive immer ein Verstehen von zunächst grundsätzlich Fremden, die sich, basierend auf hermeneutischen Sinndeutungsprozessen, kommunikativ annähern und so ‚erkennen‘ und verstehen können.

56

3 Methodologischer Rahmen und Forschungsdesign

Diese Sinndeutungsprozesse vollziehen sich jedoch immer vor dem Hintergrund der je eigenen subjektiven Relevanzsysteme (vgl. Kruse, 2014, S. 67), d.h. ‚Verstehen‘ erfolgt immer schon bereits eingefärbt durch die jeweiligen Vorerfahrungen, subjektiven Sichtweisen und Relevanzsysteme der an Kommunikation Beteiligten. Die methodische Kontrolliertheit des Fremdverstehens bedeutet dann einerseits eine methodisch kontrollierte Kommunikationssituation (beispielsweise als Interview mit Leitfaden und Tonaufnahme) sowie andererseits die kontrollierte und reflektierte Deutung von auf diese Weise erhobenen kommunikativen Daten in Auswertungsrunden, Forschungswerkstätten und ähnlichem. Diese Vorgehensweisen knüpfen an das oben erwähnte Prinzip der Offenheit an, da erst das Zurückstellen eigener Deutungen und das „Befremden des eigenen Normalitätshorizontes“ (Helfferich & Kruse, 2007, S. 176) durch die Perspektiven Anderer eine reflektierte Deutung und ein kontrolliertes Fremdverstehen ermöglichen. Ein weiteres Prinzip qualitativer Forschung lautet Repräsentation statt Repräsentativität. Gemeint ist damit, dass qualitative Forschungen nicht auf statistische Repräsentativität abzielen, Ziel ist es vielmehr, durch Vergleich und Kontrastierung von einzelnen Fällen generalisierende Aussagen treffen zu können, die über den Einzelfall hinausgehen und in einem theoretischen Konzept gebündelt werden: „Generalisierung soll durch typische Fälle und nicht durch viele zufällige Fälle ermöglicht werden. Dies führt zu einer Typenbildung im Sinne der Repräsentanz, nicht aber zu Repräsentativität im statistischen Sinne“ (Lamnek & Krell, 2016, S. 180) und weiter: „Generalisierung im qualitativen Sinne meint, durch Abstraktion auf das Wesentliche zu kommen und nicht wie in statistischstandardisierter Forschung von Teilen auf das Ganze zu schließen“ (Lamnek & Krell, 2016, S. 180). Ziel einer solchen Forschung ist damit die Beschreibung empirisch vorgefundener Orientierungsmuster, um damit einen Beitrag zum Verständnis dieser Muster zu liefern, kurz gesagt: Repräsentanz darzustellen, nicht aber Repräsentativität im statistischen Sinne. Gerade durch die genuine Fallorientierung wird dabei die Erfassung der Komplexität von Wirklichkeit erst ermöglicht, die bei quantitativ-standardisierten Forschungsansätzen zwangsläufig eingeebnet und

Methodologischer Rahmen und Forschungsdesign

57

bisweilen sogar ausgeblendet werden muss. Die Analyse kontextsensitiver Daten mittels qualitativer Forschungsansätze ermöglicht damit eine Annäherung an die Komplexität sozialer Wirklichkeit sowie deren ‚ganzheitliche‘ Betrachtung. Nach Kruse bestehen die drei Säulen der qualitativen Sozialforschung aus „Fremdverstehen, Indexikalität und Prozessualität“ (Kruse, 2014, S. 59): Die Schwierigkeit des Fremdverstehens liegt – wie oben dargestellt – darin, dass Sinn bzw. Relevanzsysteme anderer immer nur vor dem Hintergrund des jeweils eigenen Denksystems interpretiert und verstanden werden können. Mit Indexikalität wird die Zeichenhaftigkeit von Sprache bezeichnet, die ohne ein Minimalwissen um den kommunikativen Entstehungskontext von Gesprächen, Texten, Tonaufzeichnungen etc. häufig nicht verstanden werden kann. Dies gilt insbesondere für Metaphern und sprachliche Bilder, aber auch sogenannte Deiktika, also Zeit- und Ortsangaben wie „dann“, „hier“ oder „da“. Beide Herausforderungen, Fremdverstehen und Indexikalität, ließen sich vor allem dann methodisch auflösen, wenn der Forschungs- und Erkenntnisprozess dem Prinzip der Prozessualität folge: denn „nur in einem iterativ-zyklischen Erkenntnisprozess ist es möglich, sich fremdem Sinn anzunähern, da nur so das eigene Relevanzsystem erweitert wird“ (Kruse, 2014, S. 93). Wie diesen grundlegenden Prinzipien qualitativer Forschung im Rahmen der vorliegenden Arbeit versucht wurde gerecht zu werden, wird ausführlicher anhand der konkreten Forschungsschritte in Kapitel 4 erläutert. Im Folgenden werden zunächst die methodologischen Grundlagen einer an der GTM orientierten vergleichenden erziehungswissenschaftlichen Forschung diskutiert.

58

3 Methodologischer Rahmen und Forschungsdesign

3.1 Grounded Theory Methodologie23 und Vergleichende Erziehungswissenschaft – Zur Kombination zweier Forschungsparadigma Die vorliegende Arbeit ist als qualitativ-rekonstruktive Untersuchung im Feld der Vergleichenden Erziehungswissenschaft angelegt, die sich an der Grounded Theory Methodologie orientiert. Im Folgenden werden daher einige methodologische Prämissen der Grounded Theory Methodologie dargestellt sowie die Möglichkeiten und Grenzen ihrer Anwendung in vergleichenden Studien erläutert. Besondere Aufmerksamkeit wird der für beide Forschungsparadigmen zentralen Operation des Vergleichens sowie der damit verbundenen Charakterisierung des tertium comparationis respektive der Kernkategorie gewidmet. 3.1.1 Entstehungskontext und Kernelemente der Grounded Theory Methodologie Die Grounded Theory Methodologie wurde in den 1960er Jahren durch den US-amerikanischen Soziologen Anselm Strauss und seinen Mitarbeiter Barney Glaser entwickelt und mit der Veröffentlichung ihres gemeinsamen Werkes „The Discovery of Grounded Theory“ 1967 erstmals publiziert. Ihre Überlegungen für eine gänzlich neue Art der sozialwissenschaftlichen Forschung gründeten auf einem gemeinsamen Forschungsprojekt zum Umgang von Pflegepersonal in Kliniken mit sterbenden Pa23

Für den englischen Begriff der Grounded Theory gibt es im Deutschen verschiedene Übersetzungsversuche, u.a. „in den Daten begründete Theorie“, „gegenstandsverankerte“, „gegenstandsnahe“ oder „empirisch fundierte Theorie“, allerdings hat sich mittlerweile der englische Begriff weitgehend durchgesetzt (vgl. Mey & Mruck, 2011, S. 12; Przyborski & Wohlrab-Sahr, 2010, S. 187). In dieser Arbeit wird sowohl Grounded Theory als auch „gegenstandsverankerte Theorie“ verwendet. Eine weitere begriffliche Unterscheidung ist hier wichtig: Wenn in dieser Arbeit von Grounded Theory (GT) die Rede ist, so ist damit das Ergebnis einer empirischen Studie gemeint. Grounded Theory Methodologie (GTM) dagegen meint einen spezifischen Forschungsstil, der auf die Generierung einer Theorie abzielt. Zentrale Elemente dieses Kapitels finden sich auch in Falkenberg, 2018.

GTM und Vergleichende Erziehungswissenschaft

59

tienten. Innerhalb dieses Projektes entwickelten sie die grundlegenden Gedanken für einen Forschungsstil, der sich explizit vom damals dominanten forschungsmethodischen Mainstream abgrenzen sollte. Sie wendeten sich bewusst gegen die Dominanz von Universaltheorien (sogenannten grand theories), die vor allem auf quantifizierenden sozialwissenschaftlichen Verfahren beruhten, einem hypothetiko-deduktiven Wissenschaftsverständnis folgten und deren Fokus auf der Theorietestung lag. Sie kritisierten die damit einhergehende Entfremdung zwischen Theoriebildung einerseits und empirischer Sozialforschung andererseits, die die Herausbildung von „theoretical capitalists“ und „proletariat testers“ befördere (Glaser & Strauss, 1967, S. 10–11). Sie wandten sich allerdings auch gegen eine damals lediglich an Deskription und Exploration interessierte qualitative Forschung, die ihrer Meinung nach zu wenig Augenmerk auf die methodologische und theoretische Elaborierung ihrer Studien legte. Mit „The Discovery of Grounded Theory“ schlugen Glaser und Strauss ein qualitatives Verfahren der regelgeleiteten, kontrollierten und prüfbaren Theoriegenese vor, dessen Ergebnis eine in der Empirie bzw. den Daten begründete Theorie darstellte. Dem Charakter nach entsprach das „Discovery“-Buch mehr einer Streitschrift und weniger einem Methodenlehrbuch. In seiner „Skizzenhaftigkeit und Überpointiertheit der Darstellung methodischer Grundsätze“ (Strübing, 2013, S. 110) gab es immer wieder Anlass zu Missverständnissen in der Rezeption. Die methodologischen Wurzeln der Grounded Theory Methodologie sind im amerikanischen Pragmatismus und dem symbolischen Interaktionismus in der Tradition der Chicago School of Sociology zu finden. Anselm Strauss, selbst Schüler von Herbert Blumer, promovierte 1945 an der University of Chicago, bevor er sich im Zuge einiger Forschungsprojekte und in Zusammenarbeit mit Barney Glaser der Entwicklung der Grounded Theory Methodologie widmete. Die interaktionistischen und pragmatistischen Einflüsse zeigen sich auf zwei Ebenen: einerseits die sozialtheoretische Rahmung der Untersuchungsgegenstände als prozesshaft, interaktiv hergestellt und perspektivisch gebunden. Andererseits in ihrem Verständnis von Daten als im Forschungsprozess hergestellten Da-

60

3 Methodologischer Rahmen und Forschungsdesign

ten und der Konzeption von Forschung als Prozess, innerhalb dessen Problemlösungen (Theorien) erarbeitet werden, die allerdings nur als vorläufige Lösungen aufgefasst werden können (Verständnis von Theorien als Prozess). Barney Glasers wissenschaftliche Sozialisation an der Columbia School stand hingegen unter dem Einfluss der kritischrationalistischen Soziologie mit einem Schwerpunkt auf quantitativen Forschungsmethoden. Er war Schüler von Robert K. Merton, dem Begründer der „Theorie mittlerer Reichweite“. Doch obwohl sich Glaser mit Strauss in der Kritik soziologischer Großtheorien einig war und ihre gemeinsame Arbeit auf die Entwicklung empirisch begründeter, dafür in ihrer Reichweite eher klein- und mittelräumiger Theorien abzielte, könnte diese unterschiedliche wissenschaftliche Prägung ein Grund dafür sein, warum „The Discovery of Grounded Theory“ die einzige gemeinsame methodologische Publikation der beiden Gründerväter bleiben sollte. Nach dessen Erscheinen begannen beide die gemeinsam entwickelten Ideen getrennt voneinander weiterzuentwickeln und mit einigen Jahren Verzögerung grenzte sich Glaser auch öffentlich immer vehementer gegen die Strauss`sche Variante ab.24 Im deutschsprachigen Raum war und ist vor allem die von Anselm Strauss vertretene und später gemeinsam mit seiner Schülerin Juliet Corbin weiterentwickelte Variante der Grounded Theory Methodologie rezipiert worden. Dies wird hauptsächlich mit der relativ zeitnahen Veröffentlichung der beiden Hauptwerke dieser GTM-Spielart in deutscher Sprache begründet – so wurde der Band „Qualitative Analysis for Social Scientists“ von Anselm Strauss (1987) bereits 1991 auf Deutsch veröffentlicht; das gemeinsame Buch von Anselm Strauss und Juliet Corbin „Basics of Qualitative Research“ (1990) erschien 1996 als übersetzte Fassung auf dem deutschen Markt. Barney Glasers Monographien sind dagegen bis heute nur in englischer Sprache erhältlich und auch das erste gemeinsame Werk, „The Discovery of Grounded Theory“, wurde 24

Für die auf Seiten Barney Glasers zum Teil sehr polemisch geführte Auseinandersetzung mit Anselm Strauss über die sich unterschiedlich entwickelnden GTM-Strömungen vgl. ausführlicher Kelle (1996) sowie Strübing (2008, S. 42-78).

GTM und Vergleichende Erziehungswissenschaft

61

erst 21 Jahre nach der Veröffentlichung 1986 auf Deutsch herausgegeben (vgl. Mey & Mruck, 2011, S. 20). Ein weiterer Grund für die zurückhaltende Rezeption der Glaser`schen GTM-Variante in Deutschland wird mit der strikten Positionierung Glasers im Streit um die Frage nach der Rolle von Vorwissen und Theorie im Kodierprozess gesehen, der von Glaser mit den Schlagworten „Emergence vs. Forcing“ geprägt wurde. Glaser vertritt ab Anfang der 1990er Jahre strenger als Strauss die Position, dass die Kodes und Kategorien aus dem Material „auftauchen“ sollen und nicht durch bereits vorhandene theoretische Kodes und Hypothesen bestimmten Kategorien „aufgezwungen“ werden sollen. Um ein bloßes „Überstülpen“ von Kategorien auf erhobenes Material, und damit ein rein deduktives Vorgehen, zu vermeiden, sollen sich Forschende ohne konkrete Forschungsfragen dem Feld nähern: „[h]e moves in with the abstract wonderment of what is going on that is an issue and how it is handled“ (Glaser, 1992, S. 22) und vor allem auf die Rezeption bestehender Literatur vor dem Feldkontakt verzichten: „[…] there is a need not to review any of the literature in the substantive area under study“ (Glaser, 1992, S. 31). Diese Position bekräftigte er später erneut: „The pre-study literature review […] is a waste of time and a derailing of relevance for the GT study“ (Glaser, 2004, S. Abs. 46). Mit dieser strikten Haltung hat er sich den Vorwurf eingehandelt „einen in der Wissenschaftstheorie längst überwundenen, naiven Induktivismus“ (Strübing, 2013, S. 111) zu vertreten. Für Strauss und Strauss/Corbin hingegen stellen theoretisches Vorwissen aus bereits bekannter Literatur, sowie berufliche und persönliche Vorerfahrungen eine wichtige Quelle theoretischer Sensibilität dar, mit deren Hilfe Forschende das interessierende Forschungsfeld und ihr Material besser verstehen und die Forschungsfrage konzeptuell dicht weiterentwickeln können. Denn damit aus dem reinen Material interessante Daten werden können, damit Rohdaten in Kodes und Kategorien überführt werden können, bedarf es eines aktiven Herstellungsprozesses durch die beteiligten Forschenden. Die Daten sprechen nicht von allein, es gilt sie „aufzubrechen“: „Mit Aufbrechen und Konzeptualisieren meinen wir das Herausgreifen einer Beobachtung, eines Satzes, eines Ab-

62

3 Methodologischer Rahmen und Forschungsdesign

schnittes und das Vergeben von Namen für jeden einzelnen darin enthaltenen Vorfall, jede Idee oder jedes Ereignis – für etwas, das für ein Phänomen steht oder es repräsentiert“ (Strauss & Corbin, 1996, S. 45). Dazu dienen die verschiedenen Kodierprozeduren, wie sie von Glaser bzw. Strauss und Corbin vorgeschlagen und von anderen weiterentwickelt wurden. Dazu gehört aber auch der kreative, kompetente und angemessene Umgang der Forschenden mit ihrem Vorwissen, ihren persönlichen Einstellungen und Erfahrungen privater wie beruflicher Natur (vgl. Strauss & Corbin, 1996, S. 27-28). In der Lesart von Strauss bzw. Strauss und Corbin steht die theoretische Sensibilität der Idee von emergence, also des Auftauchens von Konzepten aus den Daten, insofern nahe, als das Erkennen von Kodes und Kategorien in den Daten erst durch diese „Fähigkeit, Einsichten zu haben, den Daten Bedeutung zu verleihen, die Fähigkeit zu verstehen und das Wichtige vom Unwichtigen zu trennen“ möglich ist (Strauss & Corbin, 1996, S. 25). Neben den beiden von den Gründervätern Glaser und Strauss vorgeschlagenen (und im Falle von Strauss von Juliet Corbin fortgeführten) Varianten der Grounded Theory Methodologie finden sich heute zahlreiche weitere Abwandlungen und Spielarten. Zu den prominenteren gehören insbesondere die konstruktivistische Weiterentwicklung von Kathy Charmaz (2006) und im deutschsprachigen Raum die Arbeit von Breuer, Mey und Mruck, die Charmaz‘ Ansatz stärker auf Fragen der Subjektivität und Selbstreflexivität erweiterten (Breuer, Mey & Mruck, 2011). Die von Adele Clarke (2005) entwickelte „Situationsanalyse“ wiederum führt Elemente der Strauss und Corbin´schen GTM-Variante mit einem postmodernen Interesse an der Analyse von Diskursen zusammen, indem sie sowohl strukturelle als auch diskursive Momente in die Analyse von Handlungssituationen integriert. Sie legt den Fokus dabei weniger stark auf soziale Handlungen (basic social process), wie bei Glaser und Strauss, und integriert den Strauss’schen Ansatz der sozialen Welten indem sie den Blick stärker auf „Schlüsselelemente, Materialitäten, Diskurse, Strukturen und Bedingungen, welche die erforschte Situation charakterisieren“ (Clarke, 2012, S. 24) lenkt. Diesem Verständnis von GTM folgend, wurden auch in der vorliegenden Arbeit die institutionellen Rahmenbe-

GTM und Vergleichende Erziehungswissenschaft

63

dingungen und materiale Ausdrucksformen der schulischen Leistungsbeurteilung in den Analysefokus gerückt. Mey und Mruck (2011) weisen im Hinblick auf die zahlreichen Weiterentwicklungen durch Forschende der „second generation“ darauf hin, dass es mittlerweile angebrachter wäre von Grounded Theory Methodologien im Plural zu sprechen, um „anzuerkennen, dass es eine Vielzahl (nationaler, disziplinärer) Verfahrensvorschläge und Auslegungsversuche gibt“ (Mey & Mruck, 2011, S. 12). Trotz dieser Ausdifferenzierungen und Weiterentwicklungen können aber einige grundlegende Elemente der Grounded Theory Methodologie benannt werden, die diesen Forschungsstil charakterisieren. Denn auch wenn die forschungspraktischen Hinweise und Schritt-für-Schritt-Anleitungen, vor allem in den als Lehrbuch konzipierten Werken von Strauss und Corbin, ein anderes Bild zeichnen, handelt es sich bei der Grounded Theory Methodologie nicht um eine reine Auswertungsmethode für qualitative Daten, sondern um einen spezifischen Forschungsstil: „Methodologisch gesehen ist die Analyse qualitativer Daten nach der Grounded Theory […] keine spezifische Methode oder Technik. Sie ist vielmehr als ein Stil zu verstehen, nach dem man qualitativ analysiert und der auf eine Reihe von charakteristischen Merkmalen hinweist […], um die Entwicklung und Verdichtung von Konzepten sicherzustellen.“ (Strauss, 1994, S. 29-30)

Eine weitere Besonderheit ist der Forschungsprozess selbst, der sich deutlich von der traditionellen Zerlegung in einzelne Phasen abhebt. In der Grounded Theory Methodologie werden die Phasen von Forschungsplanung, Datenerhebung, Datenauswertung und Theoriegenerierung nicht als getrennt voneinander ablaufend betrachtet, sondern in einem iterativen Forschungsprozess miteinander verschränkt bzw. in einem ständigen Wechsel vollzogen (vgl. Abb. 2). Die Datenauswertung beginnt dabei schon sehr früh im Forschungsprozess, direkt nach der ersten Datenerhebung. Die in dieser Phase entwickelten ersten Konzepte und Ideen dienen in ihrer Vorläufigkeit als Hinweise für die weitere Datenerhebung. Sie stellen den Startpunkt der Analyse dar und werden im Verlauf des Forschungsprozesses immer weiter präzisiert und in die kontinuierliche Hypothesen- und Theoriegenerierung eingespeist. Die

64

3 Methodologischer Rahmen und Forschungsdesign

Forschenden wechseln damit ständig zwischen dem Forschungsfeld bzw. der Datenerhebung im Feld und der theoretischen Reflexion über die beobachteten Phänomene des Erhebungsfeldes. Untersuchungsfeld Erhebung

Sampling

Erhebung

Erhebung

Sampling

Auswertung

Kodes/Kategorien

Sampling

Auswertung

Kodes/Kategorien

Auswertung

Kodes/Kategorien

Theorie

Abb. 2 – Darstellung des iterativen Forschungsprozesses der GTM (eigene Darstellung in Anlehnung an Mey & Mruck, 2011, S. 24)

Die Definition dessen, was als „Daten“ in die Analyse einbezogen werden kann, wird bewusst offengehalten: „G[rounded] T[heory] stands alone as a conceptual theory generating methodology. It can use any data, but obviously the favourite data to date is qualitative. While interviews are the most popular GT works with any data – ‘all is data’ – not just one specific data” (Glaser, 2004, Abs. 45).25 Für die vorliegende Arbeit stellen Interviews mit Lehrkräften die Hauptdatenquelle dar, diese werden jedoch ergänzt durch offizielle Dokumente und Regularien bezüglich der 25

Der Ausspruch „all is data“ wurde jedoch auch für seine Vagheit kritisiert (vgl. Bryant, 2003).

GTM und Vergleichende Erziehungswissenschaft

65

schulischen Leistungsbeurteilung sowie Beurteilungsmaterialien der befragten Lehrkräfte. Die Datengenerierung nach der Grounded Theory Methodologie erfolgt nicht wie bei quantitativen Studien üblich anhand eines vorab festgelegten Erhebungsplans, sondern sukzessive nach dem Prinzip des theoretical samplings. Da es für die Generierung einer Theorie über ein bisher unbekanntes Phänomen keine Informationen über die Grundgesamtheit oder die Merkmalsausprägungen oder die Merkmalsverteilung innerhalb der Grundgesamtheit gibt, können vor Beginn der Studie auch keine Stichprobengrößen festgelegt werden. Die Datengenerierung richtet sich allein danach, welche vorläufigen Ergebnisse aus der bisherigen Datenauswertung vorliegen und welche offenen Fragen sich aus dieser Auswertung für die nächste Erhebungsphase ergeben haben. Glaser und Strauss sprechen in diesem Zusammenhang auch von der theoretischen Relevanz von Daten bzw. Vergleichsgruppen: „The basic criterion governing the selection of comparison groups for discovering theory is their theoretical relevance for furthering the development of emerging categories. The researcher chooses any groups that will help to generate, to the fullest extent, as many properties of the categories as possible, and that will help relate categories to each other and to their properties.” (Glaser & Strauss, 1967, S. 49)

Ziel des theoretischen Samplings ist es, die Theoriegenerierung sukzessive auszubauen, indem systematisch nach Minimal- bzw. Maximalkontrasten gesucht wird. Die Erhebung von Kontrastfällen wird als Maximalkontrast bezeichnet und dient der maximalen Entfaltung von differenten Eigenschaften, um die entstehende Theorie systematisch zu erweitern. Mit Hilfe ähnlicher Fälle werden Minimalkontraste erreicht, die bei der Verfestigung und Verfeinerung der bestehenden Kategorien und Kodes helfen. Im Laufe des Kodierprozesses kristallisieren sich so Kernkategorien heraus, die eine Antwort auf die Forschungsfrage liefern. Im Sinne des theoretischen Samplings werden folglich nur solange neue Daten erhoben, bis die entstehende Theorie als theoretisch gesättigt gilt. Als theoretical saturation wird der Zustand bezeichnet, an dem durch Hinzuziehung weiterer Daten keine neuen Einsichten und Erweiterungen der Theorie mehr zu erwarten sind, und es lediglich um die Ver-

66

3 Methodologischer Rahmen und Forschungsdesign

besserung der Konsistenz einer Theorie (bzw. der zentralen Kernkategorie) gehen kann. An diesem Punkt wird die Datenerhebung abgeschlossen und die entwickelte Theorie formuliert.26 Die Frage der theoretischen Sättigung und der Charakter der zu entwickelnden Theorien sind auch heute noch Bestandteil fortlaufender methodologischer Diskussionen. So stellt beispielsweise für Adele Clarke, eine der wichtigsten GTMForscherinnen der sogenannten ‚second generation‘, das Ziel einer GTMorientierten Forschung weniger die Entwicklung einer formalen Theorie im Strauss’schen Sinne dar, sondern vielmehr „die Erzeugung sensibilisierender Konzepte und theoretischer Integration hin zu provokativen, wenn auch provisorischen Analytiken und gegenstandsverankertem Theoretisieren, die nicht das Entwickeln substanzieller und formaler Theorien als das eigentliche Ziel betrachten, sondern als fortdauernder Prozess aufgefasst werden“ (Clarke, 2012, S. 35; Hervorh. i. Orig.). Sie legt den Fokus damit stärker auf die Prozessualität von Forschung und die Vorläufigkeit ihrer Ergebnisse zugunsten eines kontextsensiblen Zugangs und Umgangs mit dem interessierenden Phänomen: „Weiterhin richte ich mein Augenmerk auf die Erklärung von Variationen/Differenz(en)/Heterogenitäten von Positionen und unterstütze die Ansicht, dass sensibilisierende Konzepte und Analytiken für einen frischen Ansatz zum gegenstandsverankerten Theoretisieren völlig ausreichen, anstatt eine hochmodernistische formale Theorie zu entwickeln.“ (Clarke, 2012, S. 40; Hervorh. i. Orig.)

Ein weiteres Kernelement des Forschungsprozesses nach der Grounded Theory Methodologie ist die Methode des permanenten Vergleichens oder constant comparative method. Diese umfasst einerseits die bereits geschilderten Vergleichsprozesse bei der Fallauswahl und Integration neuer Daten in die sich entwickelnde Theorie, und charakterisiert andererseits den Kodier- und Auswertungsprozess. Mit Hilfe der constant 26

Zur Schwierigkeit, den Zeitpunkt der theoretischen Sättigung genau zu bestimmen vgl. Kelle (2003), der diese Frage für ausschließlich forschungspragmatisch beantwortbar hält, also in Abhängigkeit dessen, wie viele Daten innerhalb eines Forschungsprojektes erhoben und ausgewertet können. Das Ergebnis eines solchen Forschungsprozesses könne daher auch ‚nur‘ als vorläufig betrachtet werden (Kelle, 2003, S. 244).

GTM und Vergleichende Erziehungswissenschaft

67

comparative method werden Vergleichsprozeduren auf mehreren Ebenen vollzogen: es werden Textstellen des empirischen Materials mit anderen Textstellen verglichen, aus diesem Material erwachsene Kodes mit bereits bestehenden Kodes, Kodes mit übergeordneten bzw. zusammenfassenden Kategorien und vorhandene Kategorien wiederum mit neu entstandenen Kategorien abgeglichen. Diese Vergleichsprozesse stellen einen wichtigen Schritt auf dem Weg zur Konzeptualisierung des interessierenden Phänomens dar, indem sukzessive die Eigenschaften der Kategorien herausgearbeitet werden und somit Lücken in der entstehenden Theorie sichtbar werden können, die wiederum Hinweise darauf geben in welcher Art das theoretische Sampling fortgeführt werden muss, um diese Lücken zu schließen. Die Generierung einer Theorie beruht auf dem Prozess des Kodierens von Daten, d.h. die Konzepte und Kategorien, die einer Theorie zugrunde liegen, werden am Datenmaterial gewonnen und nicht wie bei hypothesenprüfenden Verfahren die Daten den bereits bekannten Kategorien zugeordnet. Kodieren mit dem Ziel der Theoriegenerierung erfolgt indem das empirische Material in Sinneinheiten zerlegt wird und diesen Sinneinheiten Kodes zugeordnet werden. Diese Kodes gehen allerdings über eine reine Beschreibung des im Material Befindlichen hinaus, sie dienen der Überführung der Sinneinheiten in konzeptuell gehaltvolle Überbegriffe. Diese Kodes können dabei sehr nah am empirischen Material gehalten sein (sogenannte In-vivo-codes), oder aber abstraktere Begriffe sein. Es ist auch möglich Kodes von bereits bekannten theoretischen Konzepten abzuleiten (diese werden dann als sociological oder theoretical codes bezeichnet). Auf die unterschiedlichen Kodierprozeduren von Glaser bzw. Strauss und Corbin wird an dieser Stelle nicht im Detail eingegangen27, da der Fokus auf den zugrundeliegenden methodologischen Überlegungen liegt. Allen Ansätzen gemein ist jedoch, dass das Kodieren am Anfang vor allem dem Aufbrechen des Materials, dem Erkennen von darin enthaltenen Konzepten dient und sehr detailliert, 27

Ausführlicher zu den Unterschieden zwischen den Kodierverfahren nach Glaser bzw. Strauss und Corbin vgl. u.a. Mey und Mruck (2010) sowie Berg und Milmeister (2011).

68

3 Methodologischer Rahmen und Forschungsdesign

teilweise Zeile-für-Zeile, vorgenommen wird. Hierbei helfen sogenannte generative Fragen, die an das Material gestellt werden und bei der Konzeptualisierung helfen sollen. In späteren Phasen, wenn sich bereits wichtige Kategorien herausgebildet haben und die Forschenden auf die Verdichtung und Präzisierung derselben abzielen, kann der Kodierprozess gezielter und selektiver voranschreiten, indem bewusst nach kontrastierendem bzw. bestätigendem Material gesucht wird. Die theoretische Integration der im Kodierprozess entwickelten Kernkategorie und ihrer Subkategorien schließt den Kodierprozess letztlich ab. Um die zahlreichen Entscheidungen während der Erhebungs- und Auswertungsphasen nachvollziehen zu können, aber auch um sich über die Bedeutung von und die Zusammenhänge zwischen Kategorien klar zu werden, empfehlen Glaser und Strauss, das Kodieren regelmäßig zu unterbrechen und die Gedanken in Form von Memos schriftlich festzuhalten: „Stop coding and record a memo on your ideas“ (Glaser & Strauss, 1967, S. 107). Memos dienen dabei aber nicht nur der Selbstreflektion des Forschenden, sondern auch der kontinuierlichen Dokumentation des Forschungsprozesses und stellen damit ein Element der Qualitätssicherung von GTM-Studien dar. In ihnen werden die meist impliziten Interpretations- und Vergleichsprozesse expliziert, aus denen später die Theorie entwickelt wird. Für Strübing geht es bei der systematischen und regelmäßigen Abfassung von Memos neben der Unterstützung des Analyseprozesses auch um „fortgesetzte Ergebnissicherung, Entlastung von Nebengedanken, Erleichterung von Teamarbeit, Theorie als Prozess und Unterstützung von Entscheidungsprozessen in der Theorieentwicklung“ (Strübing, 2013, S. 125). Neben expliziten Analysememos können auch Planungs- und Erhebungsmemos die nächsten Erhebungsschritte zu klären helfen. Vor allem aber für die schriftliche Ausformulierung einer Theorie, und der damit verbundenen Klärung von Begriffen, Zusammenhängen und Beziehungen, sind Memos ein unverzichtbarer Teil des Forschungsprozesses.

GTM und Vergleichende Erziehungswissenschaft

69

3.1.2 Die Operation des Vergleichens Die vergleichende Betrachtung der Welt ist in erster Linie eine alltägliche Praxis, eine Alltagsheuristik, mit der Menschen sich in ihrer Umgebung orientieren, indem sie Neues mit bereits Bekanntem abgleichen, die Unterschiede und Gemeinsamkeiten von Phänomenen abwägen und daraus Schlussfolgerungen für ihr Handeln ziehen. Auf dieses Weise strukturieren Menschen ihren Alltag und sind in der Lage Entscheidungen zu treffen, wie beispielsweise die Auswahl des besten Reisewegs aus einer Vielzahl von möglichen Alternativen. Entscheidend ist es jedoch festzuhalten, dass die Fähigkeit zur Unterscheidung in der beobachtenden und handelnden Person selbst liegt, „[d]ie zu vergleichenden Objekte sind nicht ‚an sich‘ unterschiedlich oder ähnlich […], sondern es bedarf eines Akteurs, der diesen Vergleich auf der Basis seiner Erfahrung und seines Wissens vornimmt und ausgehend von eigenen Relevanzstrukturen die Kriterien des Vergleichs bestimmt“ (Strübing, 2013, S. 114). So wird die Entscheidung für eine Reiseroute beispielsweise davon beeinflusst werden, ob die handelnde Person es vorzieht, schnell am gewünschten Ziel zu sein (Flugreise) oder bereits die Fahrt als Teil des Urlaubs ansieht, den es zu genießen gilt (Reise mit der Bahn oder Fähre); neben dem Zeitfaktor könnten aber auch die Annehmlichkeit und der Komfort des Reisemittels die Wahl der Reiseroute beeinflussen: so fiele die Entscheidung bei Flugangst anders aus als bei der Anfälligkeit für Seekrankheit und wiederum anders bei der Abwägung des ökologischen Fußabdrucks. In der wissenschaftlichen Praxis stellt der Vergleich eine der fundamentalen Methoden des Erkenntnisgewinns dar. Ihre Wurzeln liegen in der vergleichenden Anatomie des 19. Jahrhunderts und fanden von dort aus zunächst Verbreitung in anderen Naturwissenschaften und über die geologischen und geografischen Studien Alexander von Humboldts schließlich ihren Weg in die Kultur- und Sozialwissenschaften, hier vor allem in die vergleichenden Sprachwissenschaften (vgl. Schriewer, 2013, S. 16–18). Aus der heutigen erziehungs- und sozialwissenschaftlichen Forschung ist der Einbezug der vergleichenden Perspektive kaum noch

70

3 Methodologischer Rahmen und Forschungsdesign

wegzudenken. Im Folgenden soll noch einmal vertiefender auf die Besonderheiten des Vergleichens als sozialwissenschaftliche Methode in der Grounded Theory Methodologie und der Vergleichenden Erziehungswissenschaft eingegangen werden. 3.1.3 Constant comparative method und Vergleich als Methode Die grundlegende Operation, die den Kodier- und Analyseprozessen, aber auch der Fallauswahl, nach der Grounded Theory Methodologie zugrunde liegt, ist die „constant comparative method“ oder „Methode des ständigen Vergleichens“. Dieser Begriff wurde bereits 1965 von Barney Glaser geprägt und später in „The Discovery of Grounded Theory“ (Glaser & Strauss, 1967) übernommen. Gemeint sind damit die zahlreichen fortlaufenden Vergleichsprozesse, die ein Forscher oder eine Forscherin zwischen verschiedenen empirischen „Vorkommnissen“ (im engl. incidents) und daraus abgeleiteten Kodes (oder Konzepten) vornimmt, mit dem Ziel die einer Theorie zugrundeliegenden Kategorien zu verfeinern und zu spezifizieren. In diesem Zusammenhang wird oft auf das sogenannte Konzept-Indikator-Modell verwiesen, mit dem Glaser 1978 in „Theoretical Sensitivity“ die bereits in „The Discovery of Grounded Theory“ angelegte Grundidee der Auswertung festhielt. Strauss griff dieses Modell in „Grundlagen qualitativer Sozialforschung“ (Strauss, 1994) ebenfalls auf, um die Idee der Auswertung zu veranschaulichen: die zu einem interessierenden Phänomen erhobenen Daten werden nach empirischen „Vorkommnissen“ (Indikatoren) durchsucht, welchen dann zusammenfassende Begriffe, auch Kodes genannt, zugeordnet werden. Diese Kodes stehen für ein übergreifendes Konzept, für das die konkreten Daten Indikatoren darstellen. Ein Konzept setzt sich dabei meist aus mehreren Indikatoren, also mehreren empirischen Vorkommnissen, zusammen. Ein Indikator kann aber auch gleichzeitig auf mehrere Konzepte verweisen (vgl. hierzu auch Mey & Mruck, 2009, S. 109). Im Zuge der weiteren Kodierarbeit werden die Kodes, und damit die Konzepte, für die sie stehen, weiter verfeinert und verdichtet. Aus den verdichteten Kodes entstehen dann wiederum Kategorien, die mehrere

GTM und Vergleichende Erziehungswissenschaft

71

Kodes zusammenfassen und damit zu einer weiteren Konzeptionalisierung beitragen. In der fortgeschrittenen Auswertungs- und Kodierarbeit kristallisiert sich aus den verschiedenen auf diesem Wege entstandenen Kategorien die eine zentrale Kernkategorie heraus, die zu allen anderen Kategorien in definierender Beziehung steht und das interessierende Phänomen am besten erklärt. So definieren auch Strauss und Corbin Konzepte oder Kodes als „konzeptuelle Bezeichnungen oder Etiketten, die einzelnen Ereignissen, Vorkommnissen oder anderen Beispielen für Phänomene zugeordnet werden“ (Strauss & Corbin, 1996, S. 43). Kategorien hingegen stellen eine „Klassifikation von Konzepten [dar]. Diese Klassifikation wird erstellt, wenn Konzepte miteinander verglichen werden und sich offenbar auf ein ähnliches Phänomen beziehen. So werden die Konzepte unter einem Konzept höherer Ordnung zusammengruppiert – ein abstrakteres Konzept, genannt Kategorie“ (Strauss & Corbin, 1996, S. 43). Das Konzept-Indikator-Modell darf allerdings nicht als statisches Modell verstanden werden, sondern beschreibt einen aktiven Forschungsprozess. Erst durch das systematische Vergleichen von Indikatoren kann die Kontur eines theoretischen Konzeptes entstehen, auf das die Indikatoren verweisen. Die Forschungsfrage dient dabei als Richtschnur dessen, was überhaupt als Indikator für ein empirisches Phänomen erfasst wird und in welcher Weise dieser Indikator mit bestehenden Kategorien in Beziehung zu setzen ist. Denn die „Relevanz ist nicht im Material, sondern sie wird in der Beziehung zwischen Forscherin, Material und Forschungsfrage in kreativer Forschungsarbeit aktiv hergestellt“ (Strübing, 2013, S. 115). Kodes und Kategorien sind damit nicht etwas Gegebenes, sondern das Ergebnis zahlreicher Vergleichsoperationen und Konzeptionalisierungsprozesse. Glaser weist darauf hin, dass Forschungsarbeit im Sinne der Grounded Theory Methodologie immer „conceptual work“ sei, die über eine bloße Beschreibung von Unterschieden und Gemeinsamkeiten hinausgehe (Glaser, 2002). Ähnliches lässt sich auch bei Schriewer (2006) finden, wenn er zwischen einfachen und komplexen Vergleichen unterscheidet. Einfache Vergleiche seien “theoretically under-conceptualized consider-

72

3 Methodologischer Rahmen und Forschungsdesign

ations of concrete structural patterns […] [which] consequently get caught up in mere statements of differences and commonalities; statements in other words, which remain on a basically descriptive level of information” (Schriewer, 2006, S. 310). Komplexe Vergleiche hingegen würden sich dadurch unterscheiden, dass sie den Vergleich vom Modus einer alltäglichen mentalen Operation in den Modus einer systematischen Methode des Vergleichens überführen würden. Diese Methode des Vergleichens zeichnet sich dadurch aus, dass sie nicht die soziokulturellen Phänomene als solche miteinander vergleiche, sondern nach den Beziehungen zwischen verschiedenen Phänomenen sucht und damit den Vergleich auf einem höheren Abstraktionslevel ansiedelt: „The method of comparison […] is aimed at tracing the relationships presumed to exist between different phenomena, aspects of complex sets of interlinked situations and meanings, levels of sociocultural systems, or problems and varying problem solutions. […] [A]s a social-scientific method, comparison does not consist in relating observable facts, but in relating relationships or even patterns of relationships to each other.” (Schriewer, 2006, S. 310)

Auch Glasers Idee der Konzeptionalisierung liegt der Gedanke zugrunde, die Beziehungen zwischen den im empirischen Material identifizierten Konzepten und daraus abgeleiteten Kategorien und deren je spezifische Eigenschaften durch den Vergleich miteinander herauszuarbeiten. Je mehr Konzepte und Kategorien einschließlich ihrer Subkategorien und Ausprägungen durch die Konzeptionalisierung erfasst werden, umso mehr Variation des interessierenden Phänomens kann in die Analyse einbezogen werden. Strauss und Corbin betonen, wie wichtig es für die Erfassung dieser Variation des Phänomens ist, Fragen an das Material und über das interessierende Phänomen zu stellen: „Solche Fragen beschreiben nicht nur, was wir sehen, sondern sie legen in Form von Propositionen (Hypothesen) nahe, wie Phänomene möglicherweise miteinander in Beziehung stehen. Propositionen erlauben Folgerungen, welche wiederum die Datensammlung leiten und zur weiteren Induktion und einem provisorischen Überprüfen der Propositionen führen“ (Strauss & Corbin, 1996, S. 44).

GTM und Vergleichende Erziehungswissenschaft

73

Ein zweiter Aspekt des Verständnisses von Kodierarbeit als „conceptual work“ ist die Hervorbringung von übergreifenden Begriffen, die mehr sind als nur die Zusammenfassung der empirisch beobachtbaren Vorkommnisse. Erst durch die begriffliche Fassung werden die konkreten Ereignisse in theoretische Konzepte überführt, die so über das singuläre Vorkommnis hinausweisen können. Auch hier findet sich eine Parallele zu Schriewers Verständnis des Vergleichs als sozialwissenschaftlicher Methode, wenn er von den Überbrückungsfunktionen des Vergleichs spricht (Schriewer, 2003). Erst der Vergleich ermöglicht in seinen Augen die Überbrückung zwischen „raum-zeitlich (geographisch, regional, national, sozial-kulturell) spezifischen Beobachtungen und raum-zeitenthobenen Hypothesen und Modellen, zwischen den ‚singulären Sätzen‘ der Empirie und den ‚allgemeinen Sätzen‘ der Theorie“ (Schriewer, 2003, S. 21). Vergleichende Untersuchungen ermöglichen es von der Ebene der empirischen Einzelheiten zu abstrahieren und auf einer abstrakteren Ebene zu erkennen, wofür diese lokalen Ausprägungen stehen. Um es mit Glasers Worten auszudrücken, Konzeptualisierung ermöglicht es uns zu erkennen „what is happening in the data“ (Glaser, 1978, S. 55). 3.1.4 Das tertium comparationis und die Kernkategorie Im Folgenden sollen nun zwei zentrale Begriffe der beiden hier interessierenden Forschungsrichtungen näher bestimmt werden: der in der Vergleichenden Erziehungswissenschaft verwendete Begriff des tertium comparationis und der aus der Grounded Theory Methodologie stammende Begriff der Kernkategorie (oder Schlüsselkategorie). Beiden gemeinsam ist ihre zentrale Rolle im Forschungsprozess, wobei es für den Begriff des tertium comparationis zwei widerstreitende Auffassungen hinsichtlich seines grundlegenden Charakters gibt, auf die in den folgenden Abschnitten eingegangen wird. Ein Vergleich zweier Gegenstände, der mehr als nur eine Vergleichsoperation im alltäglichen Sinne sein will, bedarf eines den beiden Vergleichsgegenständen gemeinsamen Dritten – des tertium comparationis. Dieses ‚Dritte des Vergleichs‘ kann verstanden werden als ein gemein-

74

3 Methodologischer Rahmen und Forschungsdesign

samer Maßstab, an dem die beiden Vergleichsobjekte gemessen werden, um zu verhindern, dass lediglich die Merkmale eines der Objekte auf das andere übertragen werden. Insbesondere in international vergleichenden Untersuchungen ist diese Suche nach einem abstrakten Vergleichskriterium ein entscheidendes Element, um über die bloße Bewertung der Unterschiede und Gemeinsamkeiten von Phänomenen in verschiedenen Kontexten auf der Folie der eigenen soziokulturellen Prägungen hinauszugehen. Das klassische Beispiel für den Charakter des tertium comparationis leitet sich von der alltäglichen Feststellung ab, dass ‚Äpfel nicht mit Birnen zu vergleichen‘ wären. Legt man allerdings die Tatsache zugrunde, dass es sich in beiden Fällen um Obst handelt, lassen sich sehr wohl Vergleiche hinsichtlich des Fruchtzuckergehalts und des Säuregrads anstellen. Aber auch Äpfel, Birnen und Feldsteine ließen sich miteinander vergleichen, nämlich hinsichtlich ihrer Materialbeschaffenheit, des Gewichts oder ihrer Qualitäten als Baumaterialien. Entscheidend für die Vergleichbarkeit von Phänomenen ist somit nicht, ob auf den ersten Blick eine ‚Gleichheit‘ oder ‚Ähnlichkeit‘ besteht, sondern ob es gelingt, eine passende übergreifende Kategorie zu finden, anhand derer sich die Merkmale eines Phänomens vergleichen lassen. Denn „Vergleichbarkeit ist kein a priori Merkmal bestimmter Sachverhalte, sondern muss immer in Relation zur Fragestellung und zum jeweiligen Kontext festgestellt werden“ (Rippl & Seipel, 2008, S. 66). Eine interessante Frage hinsichtlich des Charakters des tertium comparationis ist, ob es sich hierbei um eine notwendige Voraussetzung für vergleichende Untersuchungen handelt, oder ob das tertium comparationis erst das Ergebnis einer solchen Forschung sein kann. Wenn man es als dem Vergleich zugrundeliegende Kategorie versteht, wäre es der Ausgangspunkt für vergleichende Untersuchungen. Andererseits kann es aber auch als Zielpunkt des Vergleichsprozesses angesehen werden, als theoretisches Konstrukt, das gerichtete Vergleichsprozesse erst ermöglicht und gleichzeitig ihr Ergebnis darstellt. In der zweiten Auffassung

GTM und Vergleichende Erziehungswissenschaft

75

finden sich Parallelen zum Charakter der Kernkategorie in der Grounded Theory Methodologie28. Sie stellt die zentrale Kategorie einer Grounded Theory dar, auf der sich die gesamte gegenstandsbezogene Theorie aufbaut und die durch zahlreiche Vergleichsprozesse im Verlauf des Forschungsprozesses herausgearbeitet wurde. Schon bei Hilker (1964) finden sich beide Elemente des tertium comparationis als Ausgangspunkt und Ergebnis des Vergleichs gleichzeitig. So definiert er den Vergleich erst folgendermaßen: „Comparison rests on the measuring, weighing, and evaluating of phenomena in order to recognize the common denominator (tertium comparationis) beyond their similarities and differences”, um dann einige Zeilen später zu schreiben: „When, however, qualitative differences are under study, it is necessary to seek to find a common denominator (tertium comparationis), before a decision about the direction of further procedures can be made” (Hilker, 1964, S. 225; Hervorh. i. Orig.). Einerseits wird das tertium comparationis als „common denominator“, als gemeinsamer Nenner, der untersuchten Phänomene beschrieben, welches erst durch den Vergleich entdeckt werden kann und über die einfachen Unterschiede und Gemeinsamkeiten hinausweist. Andererseits wird es als Voraussetzung für die Entscheidung über die nächsten Schritte der Untersuchung benannt. In qualitativ-vergleichenden Forschungen kann das tertium comparationis als gemeinsames Drittes nicht immer von Beginn der Untersuchung an bestimmt werden, es muss – ebenso wie die Kernkategorie der Grounded Theory – erst aus dem Material rekonstruiert und in wiederkehrenden Vergleichsoperationen bestätigt werden. Waterkamp weist 28

So setzt bspw. Strübing in seinem einführenden Lehrbuch zur qualitativen Sozialforschung das tertium comparationis mit der Kernkategorie einer Grounded Theory gleich, wenn er schreibt: „Das T[ertium] C[omparationis] ist dann zugleich in der jeweiligen Analyseperspektive der Oberbegriff, oder die übergeordnete, umfassende Kategorie (z.B. Grounded Theory oder Dokumentarische Methode)“ (Strübing, 2013, S. 197).

76

3 Methodologischer Rahmen und Forschungsdesign

darauf hin, dass der gelegentliche Verweis darauf, das tertium comparationis müsse bereits vor Beginn einer vergleichenden Untersuchung festgelegt sein, die Gefahr eines relativ schematischen Forschungsvorgehens birgt (vgl. Waterkamp, 2006, S. 196). Der wirkliche Verstehensprozess vollziehe sich jedoch erst im Laufe des Vergleichs und die Bestimmung des tertium comparationis als das Gemeinsame zweier unterschiedlicher Vergleichseinheiten könne daher auch „als der eigentliche Zielpunkt des Vergleichs gesehen werden“ (Waterkamp, 2006, S. 196). Hier lohnt es sich allerdings noch ein wenig mehr zwischen den verschiedenen Phasen einer vergleichenden Untersuchung zu unterscheiden: Zu Beginn eines vergleichenden Forschungsprojektes steht die grundsätzliche Entscheidung darüber, den Untersuchungsgenstand zu bestimmen und festzulegen mit Hilfe welcher Vergleichseinheiten die Untersuchung der spezifischen Fragestellung erfolgen soll. Diese Auswahl erfolgt auf der vorläufigen Einschätzung, dass die gewählten Untersuchungseinheiten über hinreichende Gemeinsamkeiten hinsichtlich der interessierenden Fragestellung verfügen – diese Einschätzung erfolgt zunächst auf der Grundlage persönlichen Vorwissens und bereits bestehenden Forschungsergebnissen. Ausgehend von dieser Vergleichsbasis wird dann die möglichst umfassende Erfassung des interessierenden Phänomens angestrebt, um schlussendlich Aussagen darüber treffen zu können, inwiefern sich die Erscheinungsformen des Phänomens in den gewählten Vergleichseinheiten tatsächlich unterscheiden bzw. was die verbindende Gemeinsamkeit ist. Gleichzeitig begründen auch Differenzannahmen die Auswahl der Untersuchungseinheiten, denn „Gemeinsamkeit und Differenz lassen sich nicht unabhängig voneinander bestimmen, sondern müssen gleichermaßen im und durch den Vergleich zweier oder mehrerer empirischer Erscheinungen gewonnen werden“ (Rademacher, 2013, S. 68). Die Auswahl der Vergleichseinheiten ist damit immer als vorläufige Entscheidung zu betrachten, die durch spätere Erkenntnis im Vergleichsprozess auch revidiert werden kann. Für die konkrete Fallauswahl und Materialauswertung in den zu vergleichenden kulturellen Kontexten sollten die oben genannten Vorannah-

GTM und Vergleichende Erziehungswissenschaft

77

men jedoch bewusst ausgeblendet werden bzw. lediglich als sensitizing concepts in die weitere Forschungsarbeit einbezogen werden (vgl. hierzu auch Liebeskind, 2012, S. 335), um dem Material mit ausreichender Offenheit gegenübertreten zu können. Beide Prozesse, die Wahl der Vergleichseinheiten wie auch die konkrete Fallauswahl, sind von der Fragestellung und dem Untersuchungsgegenstand her bestimmt. Als gedachtes Drittes neben den zwei empirischen Vergleichsgegenständen hält das tertium comparationis zwar keinen eigenen empirischen Gehalt, jedoch liegt sein Mehrgewinn für die vergleichende Untersuchung genau darin: als eine theoretische Konstruktion auf einer höheren Abstraktionsebene als es die beiden ursprünglichen Vergleichsgegenstände waren. Die Besonderheiten und Eigenheiten des Einzelnen verweisen damit auf den Charakter eines allgemeinen, darüber liegenden Prinzips. Wenn man das tertium comparationis wie eingangs erläutert, nicht nur als die Fallauswahl und Vergleichsdimensionen bestimmende Kategorie versteht, sondern darin auch ein prozessuales Element erkennt, scheinen die Kernkategorie und das tertium comparationis auf nicht mehr ganz unterschiedlichen theoretischen Ebenen zu liegen. Die Rolle der Kernkategorie für die Generierung einer neuen Theorie wird von Strauss folgendermaßen beschrieben: „Sie ist relevant und funktioniert. Die meisten anderen Kategorien mit ihren Eigenschaften haben einen Bezug zu ihr, so dass sie in starkem Maße der Qualifikation und der Modifikation unterliegt. Darüber hinaus hat sie […] primär die Funktion, die Theorie zu integrieren, zu verdichten und zu sättigen, sobald die Bezüge herausgearbeitet sind.“ (Strauss, 1994, S. 66; Hervorh. i. Orig.)

Ähnliches gilt auch für das tertium comparationis: während des Vergleichsprozesses dient es gleichzeitig als Analysebrille und als vorläufiges Ergebnis des Vergleichs. Seine endgültige Form kann es erst durch die fortlaufenden Vergleichsprozesse und die damit verbundenen Änderungen und Verdichtungen annehmen, bis es letztlich als Ergebnis des Ver-

78

3 Methodologischer Rahmen und Forschungsdesign

gleichs der Unterschiede und Gemeinsamkeiten formuliert werden kann.29 3.1.5 Fallauswahl und Vergleichseinheiten Sowohl in der Vergleichenden Erziehungswissenschaft als auch der Grounded Theory Methodologie kommt der Frage der Fallauswahl eine zentrale Rolle im Forschungsprozess zu. Was sind die Analyseeinheiten der Untersuchung, welche Akteure werden einbezogen, wie wird zwischen verschiedenen Fällen ausgewählt? All diese Fragen können nur im Hinblick auf das konkrete Forschungsinteresse beantwortet werden. In der Grounded Theory Methodologie erfolgt die Auswahl, welcher Fall oder besser, welches Datenmaterial in die Analyse einbezogen wird, nach dem Kriterium der theoretischen Relevanz für die entstehende Grounded Theory. Zur Erinnerung noch einmal die Definition des theoretical samplings von Glaser und Strauss: „Theoretical Sampling is the process of data collection for generating theory whereby the analyst jointly collects, codes and analyzes his data and decides what data to collect next and where to find them, in order to develop his theory as it emerges.” (Glaser & Strauss, 1967, S. 45)

Vom Beginn der ersten Datenerhebung an versucht sich die oder der Forschende in der parallelen Erhebung und Analyse der Daten, mit dem Ziel erste Konzeptualisierungen vornehmen zu können und das Sample nach und nach theoretisch geleitet auszubauen. Mit jeder neuen Datenquelle wird auf eine Erweiterung des Erkenntnisstands abgezielt, indem bewusst nach minimalen und maximalen Kontrasten in den Daten gesucht wird. Auf diese Weise können die vorläufigen Konzepte allmählich zu übergreifenden Kategorien zusammengefasst werden, und deren Eigenschaften und Beziehungen zueinander treten klarer hervor. Wäh29

Ähnliches findet sich auch bei Nohls Überlegungen zum Vergleich und der Typenbildung der Dokumentarischen Methode (vgl. Nohl, 2009).

GTM und Vergleichende Erziehungswissenschaft

79

rend es zu Beginn einer an der Grounded Theory Methodologie orientierten Forschung kaum möglich ist Aussagen über die endgültige Größe des Samples oder die Art der einzubeziehenden Daten zu treffen, erfolgt die Fallauswahl und Generierung von Daten mit zunehmender Konzeptualisierung und voranschreitender Analyse immer gezielter und theoretisch fundierter. Die Frage der Fallauswahl in der Vergleichenden Erziehungswissenschaft kann auf verschiedenen Wegen erfolgen, immer in Abhängigkeit davon welche Art vergleichender Untersuchung vorgenommen werden soll und welches Ziel damit verfolgt wird. Einige der verbreitetsten Ansätze, sowohl für groß angelegte large-scale-Untersuchungen als auch qualitative small-N-Vergleiche gehen auf die Ideen von John Stuart Mill und seine Schrift „A System of Logic“ von 1843 zurück. Darin schlägt er zwei verschiedene Forschungsstrategien vor: die Kongruenzmethode (method of agreement) und die Differenzmethode (method of difference). Differenzmethode meint dabei, dass für die Fallauswahl die Strategie des „most similar systems, different outcomes“ angewandt wird, d.h. es sollen solche Fälle gesucht werden, die in ihren Ausgangsvoraussetzungen möglichst ähnlich sind, bei denen jedoch das interessierende Phänomen in gänzlich unterschiedlicher Form auftritt. Bei der Kongruenzmethode hingegen werden die Fälle nach dem Leitsatz „most different systems, similar outcomes“ ausgewählt, also Fälle deren Ausgangslagen sehr verschieden sind, die jedoch auf ähnlich gelagerte Phänomene hinauslaufen (vgl. dazu Ebbinghaus, 2009, S. 204–205; Berg-Schlosser, 2004). In der Vergleichende Erziehungswissenschaft ist diese Vergleichslogik für die Analyse von Konvergenz- bzw. Divergenzentwicklungen im Bildungsbereich übernommen worden (vgl. u.a. Steiner-Khamsi & Stolpe, 2006, S. 2–5). Auch wenn diese Forschungsstrategien vor allem zur Überprüfung von bestehenden Theorien bzw. zur Testung von Hypothesen über die Zusammenhänge zwischen und Entwicklungen von Bildungssystemen entwickelt wurden, beeinflusst die Logik der Suche nach Ähnlichkeiten und Unterschieden auch die Fallauswahl in qualitativ-vergleichenden Untersuchungen. Denn auch hier erfolgt die Fallauswahl meistens auf der

80

3 Methodologischer Rahmen und Forschungsdesign

Grundlage einer Gleichheitsunterstellung bei gleichzeitiger Differenzbeobachtung. Einerseits werden solche Vergleichseinheiten ausgewählt, die als hinreichend ähnlich wahrgenommen werden, um sie in einem sinnvollen Vergleich gegenüberzustellen. Gleichzeitig wird davon ausgegangen, dass sich die Vergleichseinheiten hinsichtlich spezifischer Merkmalsausprägungen unterscheiden und eine Suche nach diesen Differenzen fruchtbare Erkenntnisse für die interessierende Fragestellung liefern wird. Diese Vorannahmen über Ähnlichkeiten und Differenzen können jedoch nur als vorsichtige Versuche verstanden werden, sich der Komplexität der sozialen Wirklichkeiten zu nähern, ihren Wert als geeignete Vergleichseinheiten hinsichtlich der konkreten Fragestellung können sie erst im Laufe der Untersuchung zeigen. Die Strategie des theoretischen Samplings der Grounded Theory Methodologie arbeitet ebenfalls mit Annahmen über Ähnlichkeiten und Unterschiede der in die Analyse einzubeziehenden Fälle hinsichtlich des interessierenden Phänomens. Auf der Suche nach minimaler und maximaler Kontrastierung werden ausgehend von der bisherigen Analyse die nächsten einzubeziehenden Fälle ausgewählt. Minimale Kontraste werden in ähnlichen Fällen, maximale Kontraste in differenten Fällen vermutet. Während des iterativen Forschungsprozesses werden nach und nach explizit Fälle gesucht und in die Auswertung einbezogen, die entweder dazu dienen bereits bestehende Kategorien und ad-hoc-Hypothesen über deren Verhältnis zueinander zu festigen oder aber solche, die diese Annahmen hinterfragen und widerlegen könnten. Hier liegt ebenfalls eine Auswahl auf dem Prinzip von Ähnlichkeiten und Unterschieden vor, die der Fallauswahl der vergleichenden Forschung zumindest ähnlich ist. Nun könnte man einwenden, dass die Entscheidung, welche Vergleichseinheiten (sprich Länder, Weltregionen, Bildungssysteme etc.) in die Untersuchung einbezogen werden bei der Vergleichenden Erziehungswissenschaft bereits vor der ersten Datenerhebung getroffen wird, und damit dem Grundsatz einer sukzessiven Fallauswahl im Sinne des theoretical samplings diametral gegenübersteht. Denn für die Grounded Theory Methodologie steht fest, dass eine Vorabfestlegung von Vergleichsgruppen oder Stichprobengrößen nicht möglich ist:

GTM und Vergleichende Erziehungswissenschaft

81

„Beyond the decisions concerning initial collection of data, further collection cannot be planned in advance of the emerging theory. Only as the researcher discovers codes and tries to saturate them by theoretical sampling in comparison groups, do the successive requirements for data collection emerge.” (Glaser, 2004, Abs. 51)

Eine Entscheidung über die in den Vergleich einzubeziehenden makrosozialen, geografischen oder kulturellen Einheiten vor Beginn der Untersuchung, wie in den meisten vergleichenden Untersuchungen, scheint damit unvereinbar mit der Idee der sukzessiven Fallauswahl in der Grounded Theory Methodologie. Gegenüber einer standardisierten und quantifizierenden international vergleichenden Forschung, wie z.B. den internationalen Schulleistungsstudien PISA und TIMSS, wäre dieser Einwand sicherlich berechtigt. Hier werden die Gemeinsamkeiten und Unterschiede zwischen den Vergleichseinheiten bereits durch die Operationalisierung der Fragestellung in den Erhebungsinstrumenten gesetzt und nicht erst im Prozess des Vergleiches herausgearbeitet. Qualitativvergleichende Forschungen, die rekonstruktiv und sinnverstehend angelegt sind, sind dagegen offener und damit sensibler für die kontextgebundenen Eigenheiten konzipiert. Zwar werden auch hier auf einer abstrakten Makroebene die sozialräumlichen, geografischen oder kulturellen Einheiten des Vergleichs vorab bestimmt, die Auswahl der konkreten empirischen Fälle (welche Akteure, in welchem Bereich, welche Institutionen), und damit das empirische Fundament der Theoriebildung, kann dann aber wiederum ebenso sukzessiv und theoriegeleitet wie bei der Grounded Theory Methodologie erfolgen. Ein offen gestalteter Zugang zum Untersuchungsfeld, bei dem bewusst auch Raum gelassen wird für bisher Unbekanntes, kann darüber hinaus auch helfen, die oben beschriebenen – bewussten oder unbewussten – Annahmen über Unterschiedlichkeiten und Gemeinsamkeiten zwischen den Vergleichseinheiten zu relativieren. Je offener Forschende einem Phänomen in unterschiedlichen kulturellen Kontexten zu begegnen versuchen, desto klarer können auch andere Erklärungsmuster neben das der kulturellen Verschiedenheit treten. Möglicherweise lassen sich dann vorgefundenen Unterschiede im Umgang mit dem interessierenden Phänomen auf andere Kriterien, wie beispielsweise Geschlecht, Bildungsniveau oder sozia-

82

3 Methodologischer Rahmen und Forschungsdesign

le Rolle, zurückführen. Dafür ist es allerdings notwendig, die Fallauswahl nicht anhand der Zugehörigkeit zu einem spezifischen kulturellen Kontext zu treffen, sondern analog zum Vorgehen des theoretical samplings nach Fällen zu suchen, die das interessierende Phänomen zu verstehen helfen. Diese Fallauswahl kann sich auch über die eigentliche Phase der Feldforschung hinaus erstrecken, wenn im Sinne eines „gestuften Auswahlverfahrens“ (Schittenhelm, 2012, S. 415) in der Phase der Datenauswertung weitere Entscheidungen darüber getroffen werden, welche vorliegenden Fälle in die vertiefende Analyse einbezogen werden. Auch in der Grounded Theory Methodologie ist der Einbezug von zunächst nicht beachteten Daten zu einem späteren Zeitpunkt oder das Ausschließen von Fällen aufgrund zu geringer theoretischer Relevanz in späteren Analyseschritten möglich. Die Fallauswahl bzw. die Suche nach geeigneten Vergleichsgruppen im Sinne des theoretischen Samplings kann auch als eine Suchbewegung vom Besonderen zum Allgemeinen verstanden werden. In „The Discovery of Grounded Theory“ beschreiben Glaser und Strauss (1967) wie sie bei der Suche nach geeigneten Vergleichsgruppen nach und nach die konzeptionelle Ebene ihrer Analyse und damit die Aussagekraft der entstehenden Theorie erweitern. Ein Vergleich zwischen Akteuren der gleichen Ebene bildet dabei den Ausgangspunkt der Analyse, die zur Generierung einer Theorie über diese Akteursgruppe führt. Nun wird die Aussagekraft der entstehenden Theorie stückchenweise erhöht indem nach und nach die einbezogenen Vergleichsgruppen vergrößert werden: vom Vergleich zwischen den Angestellten einer Bank, über den Vergleich zwischen Angestellten verschiedener Banken, zum Vergleich zwischen verschiedenen Banken in einer Region, hin zum Vergleich auf Landesebene bzw. sogar zwischen verschiedenen Ländern. Auch an anderen Stellen findet sich der Hinweis darauf, Phänomene nicht nur lokal, sondern auch im Vergleich zu anderen kulturellen Kontexten zu betrachten. So berichten Glaser und Strauss beispielsweise, wie der vergleichende Blick nach Malaysia ihre Perspektive auf das in den USA erhobene Datenmaterial in ihrer Studie zum Umgang mit sterbenden Patienten in Krankenhäusern bereicherte:

GTM und Vergleichende Erziehungswissenschaft

83

„For example, one of us once noted that in Malayan hospitals families work in caring for dying patients. This observation was interesting because up to this point we had considered the family member, in the United States, as either being treated as another patient (sedated, given rest) or just ignored as a nuisance. Reviewing our American data, though, we discovered that the family is used in several ways for the care of dying patients. We had failed to focus on this not-so-observable occurrence. Thus, we discovered a cross-national uniformity – not a difference – by noting abroad what we had missed in America.” (Glaser & Strauss, 1967, S. 57)

Das hier beschriebene Phänomen, erst aus der Distanz zum Eigenen und in der Konfrontation mit dem Fremden, die Eigenschaften des Bekannten noch mal in verändertem Licht zu sehen und damit nicht nur ein besseres Verständnis des anderen, sondern auch des eigenen Kontextes zu ermöglichen, wird in der vergleichenden Forschung bewusst als methodisch kontrollierte Strategie des Erkenntnisgewinns eingesetzt. Natürlich darf ein solcher Vergleich nicht nur anekdotisch und kursorisch betrieben werden, um wissenschaftlich ernstzunehmende Erkenntnisse zu befördern. Ob der systematische Einbezug der vergleichenden Perspektive jedoch durch die sukzessive Erweiterung der in die Analyse einbezogenen Vergleichsgruppen, wie von Glaser und Strauss vorgeschlagen, erfolgt oder aber von vornherein als erkenntnisleitende Forschungsstrategie gewählt wird, bleibt den Forschenden überlassen. Abschließend soll noch einmal auf den Begriff des Falles gesondert eingegangen werden. In Bezug auf die Grounded Theory Methodologie ist die Rede von Fällen etwas irreführend. Durch das komparative Grunddesign liegt der Analysefokus nämlich nicht auf einem einzelnen Fall (einem Akteur oder einem System) wie bei klassischen Einzelfallanalysen, sondern immer auf der vergleichenden Analyse mehrerer Einzelfälle. Auch weichen die Falldefinition und Fallgrenzen von denen in Einzelfallanalysen ab, da in der Grounded Theory Methodologie auch nur Teile von Daten, beispielsweise einzelne Passagen aus Interviewtranskripten, als Indikatoren für verschiedene Kategorien herangezogen werden können. Auch für die Vergleichende Erziehungswissenschaft zeichnet sich seit längerem eine Veränderung dessen ab, was als Fall bzw. Vergleichseinheit herangezogen werden soll. Gesellschaften, Nationen und Kulturen

84

3 Methodologischer Rahmen und Forschungsdesign

haben als klassische Analyseeinheiten ihre empirische Eindeutigkeit verloren, und treten nach Schriewer (2013) zurück hinter „komplexe Gemengelagen von historisch-kulturellen Entitäten und emergenten WeltZusammenhängen, von konfigurativen Ordnungen und globalen Prozessen zivilisatorischer Interpenetration, von Hybridbildung und kulturellem métissage“ (Schriewer, 2013, S. 36). Umso wichtiger wird es den konkreten Ort des Vergleichs zu bestimmen, d.h. die Ebenen und Dimensionen innerhalb derer spezifische Phänomene vergleichend betrachtet werden sollen eindeutig zu bestimmen. Gleichzeitig muss eine vergleichende Forschung immer auch genügend Raum für das bisher Unbekannte, Neue ermöglichen und ein reines Abarbeiten von Kategorien oder Vergleichsdimensionen zu vermeiden versuchen. Auf die konkrete Fallaus wahl in der vorliegenden Studie wird in Kapitel 4.1 zum Samplingprozess näher eingegangen. 3.2 Das Episodische Interview als Erhebungsmethode Im Zentrum der Untersuchung steht die Exploration und Rekonstruktion handlungsleitender Überzeugungen von Lehrkräften, d.h. nicht die konkrete Handlung selbst (das Beurteilungshandeln im Klassenzimmer), sondern die diesem Handeln unterliegenden Überzeugungen. Das episodische Interview nach Flick (vgl. Flick, 1996, 2006, 2011) wird den erzählgenerierenden Verfahren zugeordnet und wurde ausgehend vom narrativen Interview nach Fritz Schütze (1978) entwickelt. Es stellt den Versuch einer Kombination der Vorteile leitfadengestützter Interviews mit denen des narrativen Interviews dar. Im Zentrum dieser Befragungsform stehen das subjektive Wissen und die Erfahrungen der Befragten hinsichtlich eines bestimmten Gegenstandsbereiches. Es eignet sich unter anderem zur Befragung von „Professionellen bspw. zu ihrem beruflichen Alltag und bestimmten Orientierungen darin“ (Flick, 2011, S. 273), und ist damit sehr gut geeignet, um die Gerechtigkeitsüberzeugungen von Lehrkräften zu untersuchen. Grundlage dieser Interviewform ist die gezielte Anregung der Interviewten zum Erzählen von für sie wichtigen (beruflichen) Situationen, soge-

Das Episodische Interview

85

nannten Episoden, mit deren Hilfe ein Zugang zur Erfahrungswelt der Befragten eröffnet werden soll. Wichtig ist hierbei eine ausgewogene Balance zwischen Offenheit gegenüber den Selbststrukturierungen der Befragten und einer gewissen thematischen Interviewsteuerung durch die Interviewenden. Den Befragten soll Raum gegeben werden, eigene Erzählschwerpunkte zu setzen und aus einer Fülle von Erfahrungen und erlebten Situationen auszuwählen, um die für sie relevanten Episoden zu erzählen. Im Gegensatz zum narrativen Interview wird allerdings nicht die Generierung einer umfassenden Erzählung (bspw. der eigenen Lebensgeschichte) angestrebt, sondern zielgerichtet nach Situationen gefragt, in denen die Erfahrungen des Subjekts hinsichtlich des interessierenden Gegenstandsbereiches zu Tage treten können. Diese Erfahrungen liegen, so Flick, den Befragten in Form von narrativepisodischem und semantischem Wissen vor (Flick, 2009, S. 238–239). Narrativ-episodisches Wissen wird dabei als erfahrungsnah und auf konkrete Situationen und deren Ablauf konzentriertes Wissen verstanden. Semantisches Wissen bezieht sich demgegenüber auf Begriffe und ihre Beziehungen untereinander, also auf eher abstrahierte, verallgemeinerte Aussagen und Zusammenhänge zwischen ihnen. Um beide Formen von Wissen erfassen zu können, entwickelte Flick ein Interviewverfahren, das die Befragten sowohl zu Erzählungen auffordert – und damit narrativ-episodisches Wissen freigibt – als auch durch die Aufforderung zu subjektiven Definitionen und mit konkreten Fragen auf das semantische Wissen der Befragten abzielt. Im Mittelpunkt stehen Episoden und Situationen, in denen die Befragten Erfahrungen gemacht haben, die im direkten Zusammenhang mit dem interessierenden Gegenstandsbereich stehen. Die Auswahl der erzählten Situation und die Ausführlichkeit der Beschreibung erfolgt allein durch die Befragten, beide Aspekte stellen einen wichtigen Ausgangspunkt für die Analyse der generierten Daten dar. Ähnlich dem narrativen Interview wird auf die sogenannten „Zugzwänge des Erzählens“ vertraut, die sich laut Fritz Schütze mehr oder weniger von selbst einstellen: „Der Erzähler von unvorbereiteten Stegreif-Erzählungen eigenerlebter Erfahrungen ist getrieben, auch über Ereignisse und Handlungsorientierungen zu sprechen, über

86

3 Methodologischer Rahmen und Forschungsdesign die er es aus Schuld- bzw. Schambewusstsein oder aufgrund seiner Interessenverflechtung in normalen Gesprächen und konventionellen Interviews vorzieht zu schweigen.“ (Schütze, 1976, S. 225).

Aus den so gewonnenen episodischen Erzählungen können die subjektiven Relevanzstrukturen und Handlungsmöglichkeiten der Befragten rekonstruiert werden. Anders als beim Erzählen der Lebensgeschichte im narrativen Interview, werden durch die wiederkehrende Frage nach Situationen auch Routinen und Alltäglichkeiten sichtbar gemacht, die gerade auch für das Verstehen beruflichen Handelns und damit verbundener Gerechtigkeitsüberzeugungen aufschlussreich sein können. Einschränkend sei jedoch darauf hingewiesen, dass ein Rückschluss auf tatsächliches Handeln in Beurteilungssituationen natürlich nicht möglich ist. Dies wäre Aufgabe eines weiteren, stärker ethnographisch angelegten Forschungsprojektes.

4 Konkrete Forschungsschritte Nachdem die methodologischen Grundlagen im vorangegangen Kapitel dargelegt wurden, werden im Folgenden nun die konkret für diese Arbeit vorgenommenen Forschungsschritte nachgezeichnet, um damit dem Anspruch der intersubjektiven Nachvollziehbarkeit gerecht zu werden. Die transparente Dokumentation des Forschungsprozesses stellt dafür gerade bei einem komplexen iterativ-zyklischen Forschungsprozess wie dem vorliegenden eine grundlegende Notwendigkeit dar (vgl. Kruse, 2014). 4.1 Theoretical Sampling und Samplingkriterien Wie in Kapitel 3.1 bereits dargestellt, kommt der Auswahl von Interviewpartner_innen oder zu analysierenden Materialien, sprich der Datengenerierung, in einer an der Grounded Theory Methodologie orientierten Forschung eine zentrale Rolle zu. Anders als in quantitativen Erhebungen liegt der konkreten Fallauswahl kein vorab festgelegter Stichprobenplan zugrunde, vielmehr soll die Generierung neuer Daten und der Einbezug ergänzender Materialien sukzessive der Entwicklung der theoretischen Kategorien und Hypothesen im Laufe des Forschungsprozesses folgen – wie dies in den beiden Untersuchungskontexten umgesetzt werden konnte, wird im Folgenden dargestellt. Mit der konzeptionellen Rahmung von Gerechtigkeitsüberzeugungen als handlungsleitenden Bestandteilen der berufsbezogenen Überzeugungen von Lehrkräften und einem Verständnis von schulischer Leistungsbeurteilung als beruflicher Aufgabe und Anforderung einerseits und als hochgradig kontingenter, situativ-individueller Praxis andererseits, bestand von Beginn des Forschungsprojekts an ein Interesse an einem möglichst breiten und in sich kontrastivem Sample. Für die Auswahl der Interviewpartner_innen für diese Studie wurden deshalb zunächst verschiedene Samplingkriterien aus dem in Kapitel 2 dargestellten konzeptuellen © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 K. Falkenberg, Gerechtigkeitsüberzeugungen bei der Leistungsbeurteilung, https://doi.org/10.1007/978-3-658-28275-2_4

88

4 Konkrete Forschungsschritte

Rahmen der Arbeit abgeleitet, die im Folgenden kurz ausgeführt werden. Diese lassen sich nach systembezogenen, d.h. aus der Systemarchitektur der Schul- und Beurteilungssysteme Schwedens und NRWs abgeleitete Kriterien, und personenbezogenen Samplingkriterien, die auf der Ebene der individuellen Lehrkräfte zu suchen sind, unterscheiden. Diese vorläufigen Kriterien wurden im Verlauf des Forschungsprozesses um weitere Aspekte ergänzt bzw. wurden Kriterien wieder verworfen nachdem die mit ihnen verbundenen vorläufigen Hypothesen sich im Forschungsverlauf nicht bestätigten. Insofern wurden nicht alle im Folgenden aufgeführten Kriterien für alle Interviews gleichermaßen und zum gleichen Zeitpunkt angewandt, sondern entwickelten sich im Laufe des Forschungsprozesses. 4.1.1 Systembezogene Samplingkriterien Als erstes systembezogenes Samplingkriterium wurde zunächst eine Konzentration auf Lehrkräfte, die in einem der beiden Kernfächer Mathematik oder Deutsch bzw. Schwedisch unterrichten, bestimmt. Diese Fächer gelten in beiden Ländern als Kernfächer, in denen zentrale Kulturtechniken vermittelt werden. Zudem sind sie in beiden Ländern selektionsrelevante Fächer, die über zukünftige Bildungswege entscheiden und sich insofern für Gerechtigkeitsfragen bei der Leistungsbeurteilung anbieten. Zudem wurden hier Unterschiede hinsichtlich der Beurteilungskulturen und –praxen entlang der disziplinären Trennlinien des mathematisch-naturwissenschaftlichen und sprachlichgeisteswissenschaftlichen Unterrichts vermutet. Wie sich im Laufe des Forschungsprozesses herausstellte, können diese unterschiedlichen Beurteilungskulturen auch für weitere Fächer vermutet werden. Aus forschungspragmatischen Gründen erfolgte an dieser Stelle aber keine sys-

Theoretical Sampling und Samplingkriterien

89

tematische Erweiterung des Samples um sogenannte Nebenfächer.30 Dies wäre aber eine interessante erweiternde Perspektive für Folgeuntersuchungen (vgl. dazu Kap. 7 mit einem Ausblick auf weiterführende Forschungsfragen). Das Unterrichten am Ende der Sekundarstufe I stellte ein weiteres Auswahlkriterium für zu befragende Lehrkräfte dar, da sich hier in beiden Ländern eine wichtige Gelenkstelle für den weiteren Bildungs- und Lebensweg der Schüler_innen befindet. Zudem werden in beiden Ländern die alltäglichen Beurteilungen der Lehrkräfte durch zentrale Tests bzw. Abschlussprüfungen am Ende der Sekundarstufe I ergänzt, wodurch ein weiteres Instrument schulischer Leistungsbeurteilung in die Untersuchung einbezogen werden konnte. Für den länderübergreifenden Vergleich spielte hier vor allem die sehr unterschiedliche Tradition beider Länder in Bezug auf zentral vorgegebene, standardisierte Tests einen interessanten Kontrastpunkt dar (ausführlicher dazu vgl. Kap. 5.3). Im Verlauf der Erhebungen und Analyse der Interviews stellte sich zudem die Wichtigkeit der verschiedenen Schulformen als weiteres systembezogenes Samplingkriterium heraus. Insbesondere im mehrgliedrigen Schulsystem Nordrhein-Westfalens konnte relativ schnell eine unterschiedliche Thematisierung von Abschlüssen, Übergangsmöglichkeiten und damit verbundenen Lebenschancen herausgearbeitet werden, die von den Lehrkräften verschiedener Schulformen im Zusammenhang mit Gerechtigkeitsfragen thematisiert wurden. Im schwedischen Fall stellte sich diese Frage aufgrund der anders gelagerten Systemstruktur als Gesamtschulsystem zunächst nicht. Allerdings wurden im späteren Verlauf neben den ursprünglich anvisierten Lehrkräften der neunjährigen Grundschule auch Lehrer_innen der weiterführenden Schulform ins schwedische Sample aufgenommen, um der auffälligen NichtThematisierung von Übergangs- und Selektionsproblematiken systematisch nachzugehen (mehr dazu vgl. Kap. 6.4). 30

Diese Nebenfächer werden in NRW häufig auch als ‚mündliche Fächer‘ bezeichnet, da sie nicht versetzungsrelevant sind und in ihnen keine Klassenarbeiten vorgeschrieben sind (z.B. Religionslehre, Musik, Sport).

90

4 Konkrete Forschungsschritte

Die sozialräumliche Lage der Schule spielte lediglich zu Beginn der Untersuchung eine Rolle, konnte aber im Verlauf des Forschungsprozesses als wenig relevant für die Gerechtigkeitsüberzeugungen der Lehrkräfte ausgeschlossen werden. Die Konzentration auf den eher ländlich geprägten Regierungsbezirk rund um die Universitätsstadt Münster erfolgte zunächst aus der räumlichen Nähe zum damaligen Sitz der Forschungsgruppe, wurde dann aber bewusst nicht auf größere Ballungsgebiete, wie in den Regierungsbezirken Düsseldorf oder Köln, ausgeweitet, um eine grundlegende sozialräumliche Ähnlichkeit zum schwedischen Erhebungsgebiet im ebenfalls eher ländlich-kleinstädtischen Süden Schwedens zu erhalten. 4.1.2 Personenbezogene Samplingkriterien Neben den strukturellen Unterschieden aufgrund der unterschiedlichen Bildungssysteme wurden auch personenbezogene Samplingkriterien in die sukzessive Generierung des Interviewsamples einbezogen. Zunächst waren dies vor allem die Kategorien Alter und damit zusammenhängend die Berufserfahrung, sowie die Kategorie Geschlecht. Aus den zahlreichen Untersuchungen zur unterschiedlichen Bewältigung von professionellen Entwicklungsaufgaben im Zuge der Berufsbiografie von Lehrkräften (vgl. Hericks, 2006; Terhart, 1996) wurde hier ein möglicher Zusammenhang zwischen den berufsbezogenen Überzeugungen und der Berufserfahrung vermutet, dem in den Interviews nachgegangen wurde. Im Sinne größtmöglicher Kontraste sollten so auch die Überzeugungen und Perspektiven von erfahrenen Lehrkräften denen von Novizen gegenübergestellt werden können. Die Bedeutung der Kategorie Geschlecht bei der Leistungsbeurteilung wurde bisher vor allem mit Blick auf die unterschiedlichen Beurteilungsergebnisse in Form von Zeugnissen und erreichten Abschlüssen von Schüler_innen untersucht (Lübke, 1996), nur wenige Studien richteten ihren Blick auf die beurteilenden Akteure und deren Rolle bei der (Re)Produktion geschlechtsspezifischer Beurteilungen (vgl. z.B. Budde, Scholand & Faulstich-Wieland, 2008). Diese Studien legen allerdings den

Theoretical Sampling und Samplingkriterien

91

Schluss nahe, dass auch die Leistungsbeurteilung bzw. die damit verbundenen Überzeugungen der Lehrkräfte eine geschlechtsspezifische Komponente haben. Im Verlauf der Interviews zeigte sich für beide Länder, dass die schulinternen Funktionen und damit einhergehende Berufsrollen einen Einfluss auf die Gerechtigkeitsüberzeugungen zu haben scheinen, so dass auch dieses Kriterium vermehrt in den Samplingprozess einbezogen wurde. Im Verlauf des Forschungsprozesses konnten so neben ‚einfachen‘ Fachlehrkräften beispielsweise Vertrauenslehrer_innen, eine Schulleiterin, pädagogische Leiter_innen und Oberstufenkoordinator_innen sowie Fachbereichsleiter_innen in die Untersuchung integriert werden. 4.1.3 Feldzugang und konkrete Samplingschritte in NRW und Schweden Die Gewinnung von Lehrkräften als Interviewpartner_innen war in NRW vor allem durch zwei Dinge geprägt: einerseits ein gewisser zeitlicher Druck, da die Interviews im laufenden Schuljahr, aber außerhalb der Ferienzeiten und nicht während der zentral vorgegebenen Prüfungszeiten stattfinden sollten, um die zusätzliche Belastung für die Lehrkräfte in einem vertretbaren Rahmen zu halten. Andererseits konnten potenzielle Interviewpartner_innen nicht direkt angesprochen werden, sondern mussten über den offiziellen Weg über die Schulleitung kontaktiert werden. Eine Befragung von Lehrkräften im Bundesland NordrheinWestfalen bedarf zwar grundsätzlich keiner zentralen Genehmigung durch das Kultusministerium, wie in anderen Bundesländern üblich, über die Teilnahme an wissenschaftlichen Untersuchungen entscheiden aber die jeweiligen Schulleitungen selbstständig (vgl. MSW, 2015c, §§120121). Im ersten Schritt mussten also zunächst Schulleitungen gefunden werden, die als sogenannte gatekeeper fungierten und grundsätzlich bereit zur Teilnahme an der Untersuchung und Weiterleitung der bereitgestellten Informationen an ihr Kollegium waren. Erst im zweiten Schritt konnten dann die Lehrkräfte kontaktiert werden. Für die Kontaktaufnahme wurde zunächst ein offizielles Anschreiben an die Schulleitungen und ein Aushang für potentiell interessierte Lehrkräfte verschickt, in

92

4 Konkrete Forschungsschritte

dem die Verortung der Studie im größeren Forschungsprojekt und das geplante Vorgehen für die Interviewdurchführung beschrieben wurden.31 Dem Anschreiben an die Schulleitungen folgte ca. eine Woche nach Versenden des Briefes ein Telefonat, um die Bereitschaft der Schule zur Teilnahme abzufragen und ggf. Termine für Interviews abzusprechen. Die Schulen reagierten sehr unterschiedlich auf das Anschreiben und die darin vorgeschlagene Vorgehensweise: Manche Schulleitungen informierten das gesamte Kollegium auf der zentralen Schulkonferenz und baten interessierte Lehrer_innen darum sich selbstständig bei mir zu melden, andere sprachen gezielt nur die Fachkollegien Mathematik und Deutsch an, wiederum andere stimmten lediglich dem Aushang eines an die Lehrkräfte adressierten Briefes im Lehrer_innenzimmer zu, auf den sich die Lehrkräfte dann selbstständig melden konnten. Durch den erschwerten Feldzugang wurden insgesamt für eine qualitative Studie verhältnismäßig viele Schulen angeschrieben (für einen Überblick vgl. Tabellen 1-3), der Großteil der angeschriebenen Schulen lehnte jedoch eine Teilnahme ab. Dabei wurden neben einer allgemeinen Überlastung und zeitlichen sowie personellen Engpässen auch eine fehlende inhaltliche Passung des Untersuchungsthemas als Ablehnungsgrund aufgeführt. Mehrfach wurde die Absage damit begründet, dass eine Studie zum Thema „Inklusive Schule“ auf großes Interesse auf Seiten der Schulen stoßen würde, die geplante Untersuchung jedoch zu wenig Nähe zu den alltäglichen Problemen der Schulen aufweisen würde. Ein Zusammenhang zwischen der Entwicklung hin zu einer inklusiven Schule und Fragen gerechter Leistungsbeurteilung wurde von diesen Schulen nicht gesehen. Diese bürokratische Hürde erschwerte eine gezielte oder persönliche Ansprache von potentiellen Interviewpartner_innen in NRW und wirkte sich sicherlich auch auf die Zusammensetzung des realisierten Samples aus. Andererseits führte der sehr unterschiedliche Umgang von Schullei31

Das Informationsschreiben an die Schulen sowie ein Aushang für die Lehrkräfte finden sich im Anhang.

Theoretical Sampling und Samplingkriterien

93

tungen mit der Interviewanfrage dazu, dass sich das Sample sowohl aus Lehrkräften zusammensetzt, die freiwillig und aus einem intrinsischen Interesse an der Interviewthematik teilnahmen, solchen, die zwar von den Schulleitungen gezielt angesprochen bzw. ausgesucht wurden, aber ein inhaltliches Interesse am Interview hatten, als auch solchen, die quasi ‚per Dienstverpflichtung‘ zum Gespräch kamen und zunächst weniger Interesse und Motivation am Thema zu haben schienen. Die Motive zur Teilnahme an den Interviews waren damit sehr verschieden, sodass nicht unbedingt von einer positiv vorsortierten homogenen Gruppe ausgegangen werden kann. Wie sich herausstellte, war die Interviewthematik für alle Befragten (unabhängig davon, ob sie mehr oder weniger freiwillig teilnahmen) relevant, was sich auch in der durchschnittlichen Interviewlänge von rund 62 Minuten zeigte. Mehrfach drückten die befragten Lehrkräfte während des Interviews oder im Anschluss daran aus, dass sie das Gespräch als bereichernd und hilfreich für die Reflektion ihres professionellen Handelns empfanden – und sich viel mehr solcher Gelegenheiten im Berufsalltag wünschen würden. Trotz der geschilderten bürokratischen Hindernisse gelang es insgesamt ein sehr vielfältiges Interviewsample für den Untersuchungsfall NRW zu generieren. Das konkrete Sampling und die Erhebung der Interviews in NRW erfolgten in mehreren Wellen von September 2012 bis Juli 2013, die Erhebungen in Schweden fanden zwischen Oktober 2012 und März 2015 statt (vgl. Abb. 3). 32

32

Ursprünglich war im DFG-Forschungsprojekt das Bundesland Bayern als Vergleichsfall vorgesehen. Nachdem das zuständige Kultusministerium auch nach mehrfachen Erklärungen des qualitativen Vorgehens der geplanten Studie keine Genehmigung für die Durchführung der Lehrkräfteinterviews erteilen wollte, musste dieses Vorhaben verworfen werden. Allerdings wurden von April bis Oktober 2011 acht informelle Probeinterviews mit bayerischen Lehrkräften aus dem persönlichen Bekanntenkreis der Projektgruppe durchgeführt, um sich einerseits mit der Erhebungsmethode des episodischen Interviews vertraut zu machen und andererseits auch erste Ideen des Interviewleitfadens auszuprobieren. Diese Interviews wurden transkribiert und teilweise thematisch kodiert, konnten allerdings nicht in die spätere Analyse einbezogen werden.

94

4 Konkrete Forschungsschritte Untersuchungsfeld Erhebung

Erhebung

Sampling

Sampling

Auswertung

Sampling

2012

Schweden NRW

Auswertung

Auswertung

Kodes/Kategorien

Kodes/Kategorien 2011

Erhebung

2013

2014

Kodes/Kategorien 2015

2016

Theorie

Abb. 3 – Überblick über die Erhebungs- und Auswertungsphasen in Schweden und NRW (2011-2016)

Die erste Erhebung in NRW fand im September 2012 statt. Dafür wurden sieben Schulen (jeweils zwei Hauptschulen, Realschulen und Gymnasien sowie eine Gesamtschule) in einer größeren Universitätsstadt angeschrieben und um Teilnahme an der Untersuchung gebeten. Die Auswahl der Schulen erfolgte auf Empfehlung eines erfahrenen Kollegen, der teilweise persönliche Kontakte zu den Schulleitungen hatte. Allerdings lehnten die meisten Schulen eine Teilnahme ab und es konnte nur ein Interview an einem Gymnasium realisiert werden.33 Ernüchtert durch den ersten Erhebungsversuch in NRW wurde die Kontaktstrategie im Sinne eines „systematischen Samplings“ (Truschkat, Kaiser-Belz & Volk33

Die genannten Ablehnungsgründe waren wie oben bereits geschildert u.a. zeitliche Überlastung und fehlende personelle Ressourcen durch die zu der Zeit stattfindende Zusammenlegung der Haupt- und Realschulen, schulinterne Umstrukturierungen und fehlendes Interesse an der Fragestellung des Projekts.

Theoretical Sampling und Samplingkriterien

95

mann, 2011) sukzessive um die Schulen verschiedener Städte und Landkreise erweitert. In einer zweiten Erhebungsrunde von Oktober bis Dezember 2012 konnten so weitere fünf Schulen (zwei Hauptschulen, eine Realschule, zwei Gymnasien) für eine Teilnahme gewonnen und neun Interviews mit Lehrkräften realisiert werden. Diese ersten Interviews wurden parallel zur weiteren Erhebung transkribiert, gesichtet und mit der offenen Kodierung begonnen. Dabei kristallisierte sich bereits eine schulformspezifische Thematisierung der Bedeutung von Noten und Abschlüssen und interessante Unterschiede zwischen jüngeren und älteren Lehrkräften mit unterschiedlich langer Berufserfahrung heraus, so dass für die darauffolgende dritte Erhebungswelle vermehrt Realschulen und Gesamtschulen angeschrieben wurden und die Schulleitungen um die Möglichkeit der Befragung von insbesondere sehr erfahrenen Kolleg_innen und Berufsanfänger_innen gebeten wurden. Parallel zu den Vorbereitungen für die zweite Erhebungswelle in NRW wurde ein erstes Probeinterview mit zwei Lehrkräften in Schweden durchgeführt (September 2012). Dieses Interview kam durch private Kontakte einer Kollegin im DFG-Projekt zustande und wurde, mangels noch nicht ausreichender schwedischer Sprachkenntnisse meinerseits, in einer Mischung aus Schwedisch und Englisch durchgeführt. Dieses Interview war einerseits geprägt durch die hohe Motivation und Mitteilungsfreude der beiden Lehrkräfte (das Interview fand als sogenanntes Triadengespräch mit beiden Lehrkräften gleichzeitig statt), stieß aber immer wieder aus sprachlichen Gründen an seine Grenzen (vgl. ausführlicher zum Thema Mehrsprachigkeit im Forschungsprozess Kap. 4.2.3). Im Nachgang zu diesem ersten Interview und der Erfahrung der sprachlichen Eingeschränktheit entschied ich mich für die Durchführung der Interviews in der Muttersprache der zu Interviewenden – also auf Schwedisch. Mit dieser Entscheidung verbunden, war die Hoffnung, den befragten Lehrkräften damit zu einer verbesserten Ausdrucksfähigkeit, einem besseren Erzählfluss und elaborierteren Stehgreiferzählungen zu verhelfen. Allerdings bedeutete diese Entscheidung auch eine Verzögerung in der Erhebung weiterer Interviews im schwedischen Kontext, da ich zunächst meine eigenen Schwedischkenntnisse verbessern musste.

96

4 Konkrete Forschungsschritte

Die dritte Erhebungsrunde in NRW fand unterdessen von April bis Juli 2013 statt, wobei das systematische Sampling wie oben beschrieben fortgeführt und auf eher ländliche Regionen ausgeweitet wurde. Unerwarteter Weise war das Interesse zur Teilnahme in der dritten Erhebungsrunde deutlich höher als in den ersten beiden Runden, so dass deutlich mehr Interviewzusagen gemacht wurden als ursprünglich anvisiert waren. Von 43 angeschriebenen Schulen sagten neun ihre Teilnahme zu, woraus letztlich 18 Interviews innerhalb eines relativ kurzen Zeitraums entstanden. Diese entsprachen dann allerdings nicht unbedingt den gewünschten Samplingkriterien, beispielsweise konnte nur ein Interview mit einem Lehrer an einer Gesamtschule realisiert werden, dafür waren mehrere Interviews an Gymnasien und Realschulen möglich. Insgesamt wurden 28 Interviews mit Lehrkräften unterschiedlicher Schulformen in Nordrhein-Westfalen durchgeführt. Die Anzahl der angeschriebenen Schulen und der daraus entstandenen Zusagen und realisierten Interviews findet sich in Tabelle 1; ein tabellarischer Überblick über das gesamte Sample findet sich im Anhang.34 Das für eine GTMStudie vergleichsweise große Sample entstand demnach bedingt durch die geschilderten bürokratischen Hürden und die damit zusammenhängende begrenzte Steuerungsmöglichkeit des Samplingprozesses innerhalb eines relativ kurzen Zeitfensters. Um das bis dahin generierte Material systematisch auswerten und weitere theoretische Konzepte entwickeln zu können, bevor die Erhebung der Interviews im schwedischen Kontext fortgesetzt wurde, wurde zunächst eine längere Phase der Datenanalyse der deutschen Interviews angeschlossen. Die Kodierarbeit verlief dabei zunächst chronologisch mit dem Entstehen der Interviewtranskripte, wurde dann aber zunehmend durch die Strategie des „Samplings im Sample“ (vgl. Truschkat et al., 2011) abgelöst, sodass gezielt nach Interviewpartner_innen aus dem bereits erhobenen Material gesucht wurde, wenn sich eine Kategorie als besonders interessant im 34

Auf eine Einzelauflistung der befragten Lehrkräfte in der Form sogenannter Fallvignetten wird an dieser Stelle aufgrund des Umfangs des Gesamtsamples verzichtet. Eine tabellarische Übersicht findet sich im Anhang.

Theoretical Sampling und Samplingkriterien

97

Kodierprozess herausstellte. Parallel dazu wurden sukzessive weitere Datenquellen in die Analyse einbezogen (dazu weiter ausführlich in Kap. 4.3). Tab. 1 – Übersicht Sampling in NRW Zeitraum

Angeschriebene Schulen (alle Schulformen) Direktkontakt

Zusagen

Realisierte Interviews

Probeinterviews

Apr – Okt 2011

Erste Erhebungsphase Zweite Erhebungsphase Dritte Erhebungsphase

Sept 2012

Stadt A – 7 Schulen

1 Schule

1 Interview

Okt – Dez 2012

Stadt A – 30 Schulen Stadt B – 21 Schulen Stadt C – 11 Schulen

2 Schulen 1 Schule 2 Schulen

4 Interviews 2 Interviews 3 Interviews

Apr – Jul 2013

Landkreis A – 25 Schulen Landkreis B – 18 Schulen

7 Schulen 2 Schulen

13 Interviews 5 Interviews

15 Schulen

(8 Probeinterviews) 28 Interviews

Anzahl

105 Schulen

8 Interviews

Der Feldzugang in Schweden gestaltete sich im Vergleich zum deutschen Sample deutlich unbürokratischer und das Sampling war stärker durch die vorangegangene analytische Arbeit an den deutschen Interviews geprägt. Die zeitliche Verzögerung durch die Entscheidung für das Schwedische als Erhebungssprache hatte allerdings auch den positiven Nebeneffekt, dass die Interviews ebenfalls zeitversetzt zu einer größeren Bildungsreform stattfanden, die im Schuljahr 2010/2011 begann und unter anderem auch das Benotungssystem betraf (vgl. dazu Kap. 5.1). Durch den Beginn der Interviews im November 2013 hatten die Lehrkräfte mehr Zeit sich mit dieser Reform auseinandersetzen, so dass die

98

4 Konkrete Forschungsschritte

Interviews weniger stark durch einen allgemeinen ‚Reformschock‘ überlagert waren. Gleichwohl finden sich natürlich Bezugnahmen der Befragten zu den Reformen von 2010/11 in den Interviews, teilweise wurden sie auch direkt auf mögliche Veränderungen durch die Reformen angesprochen. Als ‚von außen‘ kommende Forscherin war ich im schwedischen Kontext noch deutlicher als in NRW auf die Unterstützung durch gatekeeper bei der Gewinnung von Interviewpartner_innen angewiesen, so dass die Kontaktaufnahme zu Schulen und Lehrkräften mit Hilfe der Kolleg_innen der schwedischen Partneruniversität (Linnéuniversitet, Växjö) stattfand. Die ersten drei Interviews im November 2013 kamen ebenfalls über ein Anschreiben an die Schulleitungen zustande. Zunächst habe ich alle grundskolor mit högstadiet (Klassen 7-9)35 in Växjö per Email angeschrieben, von denen zwei Schulen zur Teilnahme bereit waren und insgesamt drei Interviews mit Lehrkräften vermittelt haben. Insbesondere das erste dieser Interviews war geprägt durch vielerlei sprachlich bedingte Irritationen, die allerdings durch die Anwesenheit einer zweisprachigen Kollegin aus dem DFG-Projekt, Bettina Vogt, größtenteils ausgeräumt werden konnten. Im Nachgespräch zu diesem Interview stellten wir außerdem fest, dass die sprachlichen Irritationen zum größten Teil zu einer ausführlicheren Narration auf Seiten der Lehrerin geführt hatten, da diese sich darum bemühte bestmöglich verstanden zu werden. Auch diese drei Interviews wurden zunächst transkribiert und in die fortlaufende Datenanalyse integriert, wobei erste bedeutende Unterschiede in der Thematisierung von Gerechtigkeitsfragen zwischen den deutschen und schwedischen Interviews auftraten. Für die zweite schwedische Erhebungswelle wurde die Kontaktaufnahme mit einem weiteren Teilprojekt des DFG-Projekts kombiniert und hauptsächlich von Bettina Vogt durchgeführt. Wir verfassten ein gemeinsames Anschreiben an potentielle Schulen, in dem unsere Forschungsprojekte jeweils kurz erläutert und um die Möglichkeit der Befragung von Lehr35

Dies entspricht als funktionales Äquivalent der Sekundarstufe I der Haupt-, Real-, Gesamtschulen und Gymnasien in NRW.

Theoretical Sampling und Samplingkriterien

99

kräften und Schüler_innen (Teilprojekt B. Vogt) gebeten wurde. Im Anschluss an die per Email versandten Anschreiben wurde die Teilnahmebereitschaft der Schulen telefonisch durch Bettina Vogt erfragt und das weitere Vorgehen abgesprochen. Aus diesen Telefonaten gingen zum Teil direkte Zusagen mit den Kontaktdaten von interessierten Lehrkräften hervor oder aber die Bereitschaft, die Informationen den Lehrkräften der jeweiligen Schule zugängig zu machen. Auf diese Weise konnten insgesamt fünf Schulen zur Teilnahme bewegt werden, von denen zunächst an drei Schulen im August 2014 sieben Interviews realisiert werden konnten. Bei den verbliebenen zwei Schulen, die zwar grundsätzlich zur Teilnahme bereit waren, kam es aus terminlichen Schwierigkeiten nicht zum Interview. Von diesen sieben Interviews kamen drei durch den schon bestehenden Kontakt zu der Lehrerin statt, mit der das zweisprachige Probeinterview im Herbst 2012 durchgeführt wurde. Sie und zwei weitere Lehrer derselben Schule nahmen nun an dieser zweiten Erhebungswelle teil. Im Anschluss an die zweite Welle in Schweden kristallisierte sich in der Analyse eine Besonderheit des schwedischen Samples hinsichtlich der Rolle von Noten und Zeugnissen für die Fragen von Bildungsübergängen und der Selektionsfunktion von Noten und Zeugnissen heraus, die die weitere Datengenerierung maßgeblich beeinflusste. Während die Frage der Gerechtigkeit schulischer Leistungsbeurteilungen im deutschen Sample zu großen Teilen um eben diese Fragen des Zugangs oder eben nicht Zugangs zu bestimmten Bildungswegen und dem oftmals schwierigen Verhältnis von Selektionsfunktion und pädagogischem Förderauftrag kreiste, wurden diese Aspekte von den schwedischen Lehrkräften weniger angesprochen und teilweise, auf meine Nachfragen hin, mit deutlicher Irritation beantwortet. Die vorläufige Erklärung für diese Irritationen – dass die Frage nach der selektierenden Funktion von Noten in einem gesamtschulischen und auf Inklusion ausgerichteten Schulsystem von Grundschullehrkräften kaum beantwortbar sein könnte – führte dazu, dass in der dritten und letzten Erhebungsrunde im schwedischen Kontext neben den Grundschullehrkräften auch Lehrer_innen der weiterführenden Schulform (gymnasieskola) ins Sample aufgenommen

100

4 Konkrete Forschungsschritte

wurden. Dafür wurden wiederum gezielt Schulen angeschrieben bzw. Kontakte aus den vorhergehenden Erhebungsrunden aktiviert und im März 2015 weitere sechs Interviews (drei davon mit gymnasieLehrkräften) durchgeführt. Zusätzlich wurden auch zwei Schulen in einem Vorort einer südschwedischen Großstadt angeschrieben, zu der durch weitere schwedische Kolleg_innen Kontakte bestanden, die die Wahrscheinlichkeit einer Beteiligung erhöhten. Mit dieser auch räumlichen Erweiterung konnten somit auch im schwedischen Sample Lehrkräfte von unterschiedlichen Schulen aus verschiedenen sozialräumlichen Kontexten, ähnlich wie im Sample von NRW, aufgenommen werden. Tabelle 2 zeigt die angeschriebenen Schulen und daraus resultierenden Interviews im schwedischen Kontext. Tab. 2 – Übersicht Sampling in Schweden

Probeinterview Erste Erhebungsphase Zweite Erhebungsphase Dritte Erhebungsphase Anzahl

Zeitraum

Angeschriebene Schulen (alle Schulformen)

Zusagen

Realisierte Interviews

Sep 2012

Direktkontakt

1 Schule

Nov 2013

Kommune A – 7 Schulen

2 Schulen

1 Interview (2 LK) 3 Interviews

Aug 2014

Kommune A – 7 Schulen Kommune B – 4 Schulen Kommune C – 2 Schulen Kommune C – 2 Schulen Kommune D – 3 Schulen Stadt A – 2 Schulen

3 Schulen

7 Interviews

4 Schulen

6 Interviews

27 Schulen

9 Schulen

(1 Probeinterview) 16 Interviews

März 2015

Die oben genannten Samplingkriterien erwiesen sich auch im schwedischen Kontext als hilfreiche Parameter zur Generierung eines möglichst diversen Gesamtsamples. Insbesondere die Konzentration auf die beiden

Theoretical Sampling und Samplingkriterien

101

Kernfächer, aber auch eine gewisse Streuung in der Länge der Berufserfahrung, waren hier wichtige Orientierungspunkte. Die schulinternen Funktionen nehmen im schwedischen Kontext eine besondere Stellung ein, da die interne Organisationsstruktur sich als deutlich weniger hierarchisch entpuppte als in den deutschen Kollegien. Gleichzeitig wurden mit der Reform von 2011 zwei sogenannte ‚Karrierepfade‘ für Lehrkräfte eingeführt – förstelärare und lektor 36– die eben solchen Funktionsstellen am ehesten entsprechen. Insofern wurden in das Sample auch zwei förstelärare integriert. Da die Beratung von Schüler_innen über zukünftige Bildungswege und daran anschließende Studien- oder Berufswahl von speziellen Fachkräften (studie- och yrkesvägledare) durchgeführt wird, fallen auch diese Aufgaben aus dem Zuständigkeitsbereich von Lehrkräften heraus. Da diese Fachkräfte wiederum nicht unterrichten und beurteilen, wurden sie vom Sample ausgeschlossen. Schulleitungen wiederum sind im schwedischen Bildungswesen mehr für Fragen der Organisation, Finanzierung, Personalpolitik sowie andere Managementaufgaben zuständig (und unterrichten nicht wie im deutschen Fall selbst), aus diesem Grund sind auch sie nicht ins Sample einbezogen worden. In Bezug auf die Freiwilligkeit und Motivation der schwedischen Befragten stellt sich die Situation ähnlich wie in NRW dar: Zum Teil wurden die Lehrkräfte quasi von der Schulleitung zum Interview ‚geschickt‘, andere wurden zufällig auf den Aushang aufmerksam und haben sich daraufhin zum Interview gemeldet; einige signalisierten großes Interesse an der Fragestellung, andere wiederum hatten generell einer Befragung zugestimmt ohne sich mit dem Thema der Untersuchung vor dem Interview auseinandergesetzt zu haben. Tabelle 3 zeigt noch einmal eine Übersicht zur Zusammensetzung der befragten Lehrkräfte in beiden Ländern.

36

Zur schwedischen Lehrprofession sowie den Ausbildungs- und Arbeitsbedingungen schwedischer Lehrkräfte vgl. ausführlicher Kap. 5.1.3

102

4 Konkrete Forschungsschritte

Tab. 3 – Übersicht Zusammensetzung des Samples NRW 15 Schulen (6 Gymnasien, 5 Realschulen, 3 Hauptschulen, 1 Gesamtschule)

Schweden 9 Schulen (7 grundskolor, 2 gymnasieskolor)

Männer

Frauen



Mathematik

6

4

10

Deutsch

3

12

15

Beide Fächer Andere Fächer ∑

1

1

2

1

-

1

11

17

28

Alter: 25 – 61 Jahre Im Schuldienst: 0,5 – 35 Jahre

Männer

Frauen



Mathematik

3

1

4

Schwedisch

2

10

12



5

11

16

Alter: 26 – 57 Jahre Im Schuldienst: 0 - 32 Jahre

Die enge Kooperation mit einer zweisprachigen Kollegin sowie deren institutionelle Anbindung an eine schwedische Universität waren in jedem Fall entscheidend für die erfolgreiche Kontaktaufnahme zu den schwedischen Schulen wie auch Lehrer_innen. Wie wir durch zahlreiche Gespräche vor und nach den Interviews erfuhren, wirkte der Name der schwedischen Universität einerseits als Türöffner und legitimierte gleichzeitig die Befragung durch eine aus Deutschland stammende Wissenschaftlerin. Für die Gesprächssituation selbst hatte dies den produktiven Nebeneffekt, dass die befragten Lehrkräfte zu teilweise sehr detailreichen Narrationen animiert waren, um mir als ‚außenstehender‘ Forscherin ihr eigenes System zu erklären. Ausführlicher wird dieser Aspekt im nachfolgenden Kapitel 4.2 behandelt.

Interviewdurchführung

103

4.2 Interviewdurchführung Alle Interviews wurden im jeweiligen Schulgebäude durchgeführt, häufig in den Klassenräumen der Lehrkräfte, teilweise aber auch in separaten Besprechungszimmern oder gemeinschaftlich genutzten Räumen wie der Teeküche. Der Interviewort ‚Schule‘ wurde bewusst gewählt, um möglichst vielen Assoziationen und spontanen Ideen Raum zu geben, die durch die mit Leistungsbeurteilung verknüpften Räumlichkeiten (Klassenraum, Lehrer_innenzimmer) oder bestimmte Materialien (Klassenbuch, korrigierte Arbeiten, Unterrichtsmaterialien, etc.) angeregt werden konnten. Auch die Einflechtung der Interviews in den Arbeitsalltag – zumeist während Freistunden oder am Ende des Schultages – sollte durch die zeitliche Nähe zur eigenen Unterrichts- und Beurteilungspraxis das Erzählen von Beispielen und konkreten Situationen erleichtern. Die Lehrkräfte wurden somit bewusst in ihrer Funktion als Lehrer_in adressiert, um auf die berufsbezogenen Gerechtigkeitsüberzeugungen im Zusammenhang mit schulischer Leistungsbeurteilung abzuheben. Inwiefern sich hier auch persönliche, in gewisser Weise private, Überzeugungen mit den auf ihr berufliches Tun bezogenen Überzeugungen vermischten bzw. ob diese überhaupt getrennt betrachtet werden können oder sollten, kann an dieser Stelle nicht abschließend beantwortet werden. Die Interviews wurden bewusst als Einzelgespräche (und nicht etwa als Gruppendiskussionen) angelegt und darauf geachtet, dass die Gespräche in vertraulicher Ungestörtheit geführt werden konnten, um den Lehrkräften die Möglichkeit zu geben möglichst offen (auch über Kolleg_innen bzw. die eigene Schule) zu sprechen. Auf diese Weise war es in beiden Kontexten leichter eine gewisse Vertrautheit in der Gesprächsatmosphäre aufzubauen, die es den Lehrkräften erleichterte auch über eher tabuisierte Themen zu sprechen oder aber von Negativbeispielen zu berichten. Interessanter Weise bezogen sich aber die Erzählungen über ungerechte Beurteilungen häufig auf die Praxis anderer Kolleg_innen oder Hörensagen, nicht jedoch auf das eigene professionelle Tun. Hier zeigte sich wieder die Subjektivität gerechter Leistungsbeurtei-

104

4 Konkrete Forschungsschritte

lung im Sinne des „justice is in the eyes of the beholder“-Diktums (vgl. Fußnote 15). Um die Erzählungen der Befragten möglichst wenig einzuschränken bzw. durch die Interviewführung zu stark zu lenken, wurden sowohl im Anschreiben als auch im Vorgespräch der Interviews möglichst offen gehaltene Erklärungen zum Thema verwendet und vor allem technischorganisatorische Fragen geklärt. Die Begriffe „Gerechtigkeit“, „gerechte Noten“ und „gerechte Leistungsbeurteilung“ (sowie deren schwedische Entsprechung) wurden so auch nicht vorab definiert, um möglichst vielfältige und wenig gesteuerte Deutungen der Befragten zu evozieren. Alle Lehrkräfte erhielten vor der Interviewdurchführung ein Informationsblatt zum datenschutzrechtlichen Umgang mit den erhobenen Daten. Sie wurden über das Interviewverfahren umfassend aufgeklärt und ihre Zustimmung zur digitalen Aufnahme des Interviews eingeholt. Eine entsprechende schriftliche Einverständniserklärung zur Tonaufnahme und anschließenden Verschriftlichung der Interviews liegt für alle Interviews vor. Wie bereits im Kapitel 4.1 zum Samplingprozess beschrieben, stellte sich die Motivlage zur Teilnahme am Interview sehr unterschiedlich dar. Insbesondere die Frage der Freiwilligkeit der Teilnahme hatte Auswirkungen auf die Gestaltung des Vorgesprächs zum Interview. Insbesondere bei denjenigen Lehrkräften, die augenscheinlich eher zu einem Gespräch durch die Schulleitung verpflichtet wurden, war der Aufbau einer vertrauensvollen Gesprächsatmosphäre und die Bereitschaft, sich auf die jeweilige Lehrperson einzustellen, ausschlaggebend. Dass dies in den meisten Fällen gelungen ist, zeigen die bei allen befragten Lehrkräften zu findenden ausführlichen Erzählungen, die teilweise nur durch wenige Nachfragen meinerseits aufrechterhalten werden mussten. Ein zunächst sehr reserviert wirkender Lehrer an einer Realschule öffnete sich beispielweise im Verlauf des Gesprächs immer mehr, überzog letztlich seine für das Interview geplante Freistunde und ließ die ankommenden Schüler_innen mit einer Stillarbeit zunächst im Nachbarraum weiterarbeiten, um das Interview in der ihm angenehmen Ausführlichkeit zu Ende bringen zu können. Mehrfach wurde ich auch von Lehrkräften zur teilneh-

Interviewdurchführung

105

menden Beobachtung in ihren Unterricht eingeladen, um mir ein Bild von ihrer Praxis machen zu können. Auch wurden die Interviews im Nachhinein von einigen der Befragten als wertvolle Reflexionsmöglichkeit bezeichnet, für die sich im schulischen Normalbetrieb selten die Gelegenheit bietet. Bei den Interviews in NRW waren teilweise neben mir als Interviewerin auch andere Beteiligte (studentische Hilfskräfte, Projektleitung, Mitarbeiterin) des DFG-Projektes zugegen, die sich zwar nicht am eigentlichen Interviewgespräch beteiligten, aber als ‚stille Zuhörer_innen‘ Beobachtungen und für sie auffällige Besonderheiten in einem Interviewprotokoll festhielten. Die daraus resultierenden Auswertungsgespräche stellten häufig die Basis für analyseleitende weiterführende Fragen dar, die in zahlreichen Memos festgehalten wurden. Bei den schwedischen Interviews konnte aus organisatorischen Gründen keine zweite Person aus dem Projektkontext anwesend sein, mit Ausnahme der oben benannten zwei Interviews, die zusammen mit Bettina Vogt durchgeführt wurden. Zum Ausgleich für die fehlende zweite Perspektive wurden zehn der Interviews im Anschluss an die Transkription detailliert mit einer weiteren Projektmitarbeiterin besprochen, die ebenfalls schwedische Muttersprachlerin ist (ausführlicheres zur Problematik von mehrsprachiger Forschungsarbeit und den gewählten Strategien im Umgang damit findet sich in Kap. 4.2.2). Die Erhebungen in Schweden waren neben dem inhaltlichen Interesse auch von einer grundsätzlichen Neugier der Lehrkräfte gegenüber mir als Forscherin aus Deutschland geprägt. Teilweise wurde ich im Anschluss an das Interview noch zu informellen Kaffeerunden gebeten oder der Schulleitung bzw. anderen Kolleg_innen vorgestellt, wodurch die Besonderheit des Interviews für die befragten Lehrkräfte noch einmal betont wurde. Ähnlich wie in NRW waren es vor allem die Schulen im eher ländlichen Raum, in denen ich sehr herzlich und mit großem Interesse empfangen wurde. So betonte beispielsweise ein Rektor mir gegenüber, wie geehrt er sich fühle, „dass seine Schule ausgewählt wurde“ an der Untersuchung teilzunehmen. Die ‚Überforschung‘ der Schulen in Universitätsstädten und umliegenden Landkreisen dürfte sowohl in NRW als auch in Schweden zu diesem Effekt beitra-

106

4 Konkrete Forschungsschritte

gen, der den Zugang zu Schulen in den peripheren Landkreisen erleichtert. 4.2.1

Konstruktion und Handhabung des Interviewleitfadens

Die Interviews wurden mithilfe eines Leitfadens durchgeführt, der jedoch flexibel an die Interviewsituation angepasst gehandhabt wurde. Er diente mehr als Gedächtnis- und Orientierungsstütze für mich, denn als strikt abzuarbeitendes Frageprogramm.37 Der Leitfaden wurde zudem im Laufe des Forschungsprozesses mehrfach überarbeitet und an den jeweiligen Erkenntnisstand bzw. an die Samplingschwerpunkte angepasst, im Anhang findet sich jeweils eine Version für die deutschen und schwedischen Interviews. In beiden Ländern waren Fragen zu den folgenden Themenbereichen enthalten: zum berufsbiografischen Erlernen von Leistungsbeurteilung und ggf. deren Wandel; zur eigenen Beurteilungspraxis, persönlichen Leitsätzen, Hilfsmitteln und Strategien; zur Frage von Schulabschlüssen, Übergängen und der schulischen Selektionsfunktion; sowie zu standardisierten Formen der Leistungsbeurteilung, zentralen Prüfungen und Tests. Die Fragen zielten entsprechend den Ideen des episodischen Interviews auf konkrete Beurteilungsmomente (Klassenarbeit, Zeugniserstellung, zentrale Abschlussprüfungen), aber auch generelle Haltungen zum jeweiligen Beurteilungssystem ab. Es wurde versucht in allen Interviews alle Themen anzusprechen, die Frageformulierungen variierten dabei je nach Gesprächsfluss und in Abhängigkeit der Selbstthematisierungen durch die Lehrer_innen. Den Intervieweinstieg bildete in den meisten Fällen eine eher berufsbiographisch orientierte Frage („Können Sie mir bitte erzählen, wie Sie eigentlich gelernt haben Leistungen zu beurteilen?“). Dieser Einstieg wurde gewählt, um einen narrativen Stimulus zu setzen, der einerseits eine möglichst wenig normativ aufgeladene Hinführung zum Thema gerech37

Zu den Gefahren einer allzu rigiden „Leitfadenbürokratie“ bei leitfadengestützten Interviews vgl. Kruse (2014, S. 213–219).

Interviewdurchführung

107

ter Leistungsbeurteilung ermöglichte, andererseits den individuellen Relevanzsetzungen der befragten Lehrkräfte bei der Leistungsbeurteilung ausreichend Spielraum ließ. Ziel war es wichtige rahmende Faktoren der individuellen Beurteilungspraxis – und gegebenenfalls deren Veränderungen im Laufe der Berufserfahrung – bereits zu Beginn des Interviews hervorzubringen. Die Frage, wie etwas gelernt wurde, impliziert dabei, dass es sich um etwas grundsätzlich Erlernbares handelt – es wird also davon ausgegangen, dass Leistungsbeurteilung als Teil des pädagogischen Kerngeschäfts von Lehrkräften vermittelt und erlernt werden kann. Gleichzeitig lässt die Frage aber offen, wie und wo diese Fähigkeiten erlernt wurden und zielt damit auf die persönliche Bewältigung dieser beruflichen Entwicklungsaufgabe (Hericks, 2006). Mögliche Schwierigkeiten können hier ebenso angebracht werden, wie auch die Veränderung von Beurteilungspraxen und damit verbundenen handlungsleitenden Überzeugungen im Laufe der Berufserfahrung. Die so gewählte Einstiegsfrage erwies sich in den meisten Interviews als außerordentlich anregend und geeignet, um eine Erzählung in Gang zu bringen, die einer gewissen Chronologie folgte. Sowohl die nordrheinwestfälischen als auch die schwedischen Lehrkräfte berichteten übereinstimmend, dass ihre Beurteilungspraxis nur in geringem Maße auf Kenntnisse aus der Studienzeit aufbaute, sondern vielmehr individuell im praktischen Vollzug erlernt und verfeinert wurde, teilweise begleitet durch Studienseminare im Referendariat (NRW) oder durch Mentor_innen und andere (Fach-)Kolleg_innen angeregt wurde. Diese Einstiegserzählungen verdeutlichen den Charakter der Leistungsbeurteilung als einer in höchstem Maße individuellen Praxis. Gerade in den Interviews mit erfahreneren Lehrkräften zeigte sich aber auch der starke Zusammenhang von persönlichen Beurteilungssystemen und -vorlieben mit dem regulativen Rahmen des Machbaren, wenn beispielweise von Veränderungen in den Vorgaben berichtet wurde, die dann eine geänderte Praxis nach sich zogen (Bsp. „heute gilt die mündliche Note ja 50 %, das war früher nicht so“). Auch wenn die Einstiegsfrage nicht direkt auf die Frage gerechter Beurteilung abzielte, zeigte sich im Zuge der Analyse, dass zentrale Konzepte und Überzeugungen der Lehrkräfte

108

4 Konkrete Forschungsschritte

bereits in der Eingangserzählung auftauchten, die sich dann wie ein roter Faden durch das gesamte Interview zogen. Insgesamt zielten die Fragen im Leitfaden darauf ab, die Lehrkräfte zu ausführlichen Erzählungen (Episoden) über ihr Beurteilungshandeln in verschiedenen Situationen zu animieren, aus denen später die handlungsleitenden Überzeugungen rekonstruiert werden sollten. Die Lehrkräfte konnten dabei frei wählen zu welchen Aspekten der schulischen Leistungsbeurteilung sie wie ausführlich berichteten und was eine in ihren Augen ‚gerechte‘ oder ‚ungerechte‘ Beurteilungspraxis auszeichnet. Durch erzählgenerierende Nachfragen („Können Sie das noch etwas ausführen?“ „Wie haben Sie das gemeint?“) wurden die in den Stehgreiferzählungen erwähnten Themen weiter spezifiziert und die Befragten zur Konkretisierung aufgefordert. Gleichzeitig verhinderten die thematisch auf die Leistungsbeurteilung fokussierten Fragen ein ‚Abgleiten‘ in allgemeinere Bereiche des schulischen Alltags. Mit konkreten Fragen nach subjektiven Definitionen („Was bedeutet eine gerechte Leistungsbeurteilung für Sie?“, „Was zeichnet einen guten Schüler/eine gute Schülerin in Ihren Augen aus?“) wurde versucht, an das semantische Wissen (vgl. Kap. 3.2) der Befragten anzuknüpfen. Ziel war es, möglichst dichte Beschreibungen der eigenen bzw. bei Kolleg_innen beobachteten Beurteilungspraxis zu erhalten. Indem die Lehrkräfte diese Beschreibungen selbst beurteilten, als gerecht bzw. ungerecht beschrieben oder die Bevorzugung einer spezifischen Beurteilungsform vor mir rechtfertigten, lieferten sie gleichzeitig subjektive Erklärungsmuster und damit wertvolle Hinweise auf Gerechtigkeitsüberzeugungen. Insbesondere in Bezug auf das Berichten von ‚schlechter‘ Praxis bzw. als ungerecht erlebter Beurteilungspraxis erwies sich das Einzelinterview als außerordentlich fruchtbar: in den Interviews finden sich zahlreiche Passagen, in denen die Lehrkräfte sich von der Praxis bestimmter Kolleg_innen distanzieren und diese als ungerecht bezeichnen – dies wäre im Rahmen einer Gruppendiskussion mit Lehrkräften vermutlich eher selten geschehen. Eine Befragung der Lehrkräfte in Einzelgesprächen dürfte zudem, zumindest für die deutschen Lehrkräfte, auch der typischen beruflichen Alltagssituation mit ihrer individualisierten Berufspraxis entsprechen, die teilweise

Interviewdurchführung

109

abfällig, teilweise zustimmend als „Einzelkämpfertum“ von den befragten Lehrkräften beschrieben wurde. Den Abschluss der Interviews bildete eine bilanzierend-resümierende Frage („Können Sie noch einmal zusammenfassen, was gerechte Beurteilung für Sie bedeutet?“), die sich in der Analyse als sehr fruchtbar erwies, da hier häufig noch einmal die für die Befragten wichtigsten Themen angesprochen wurden und zu einem abschließenden Statement formuliert wurden (Erzählkoda). Mit einer offenen Ausstiegsfrage („Von meiner Seite aus war es das nun. Möchten Sie eventuell noch etwas ergänzen?“) wurde das Ende des Gesprächs eingeleitet, teilweise führte diese Aufforderung aber noch einmal zu weiteren Erzählungen bzw. nutzten die Befragten die Gelegenheit einen für sie besonders wichtigen Punkt nochmals zu betonen. 4.2.2 Mehrsprachigkeit im Forschungsprozess Grundsätzlich sind mit der Entscheidung für qualitative Interviewverfahren, die sich hauptsächlich auf sprachliche Äußerungen und deren Interpretation beziehen, vielfältige Verstehensprozesse verknüpft. In der sprachlichen Darstellung von Welt spiegeln sich kulturelle, soziale und historisch gewachsene Bedeutungszuschreibungen, die jeweils in ihrer Kontextgebundenheit analysiert und interpretiert werden müssen, um verstanden zu werden. Dies trifft sowohl auf Interviews in der eigenen Muttersprache wie auch auf fremdsprachlich geführte Interviews zu. Nichtsdestotrotz erfordert die Erhebung, Transkription und Analyse fremdsprachlicher Interviews eine Reihe von qualitätssichernden Maßnahmen, will man nicht auf einem vereinfachenden, allein auf der lexikalischen Bedeutungsebene verharrenden, Verständnis stehen bleiben. In der Literatur werden dafür verschiedene Wege vorgeschlagen, wie mit Mehrsprachigkeit im Forschungsprozess und der Übersetzung- bzw. Verstehensproblematik in interkulturellen Forschungsprojekten sensibel umgegangen werden kann (vgl. hierzu Kruse, Bethmann, Niermann & Schmieder, 2012; Bettmann & Roslon, 2013). Im Folgenden begründe ich daher zunächst die Entscheidung für die Erhebungssprachen Deutsch

110

4 Konkrete Forschungsschritte

und Schwedisch, anschließend erfolgt die Offenlegung der in dieser Studie angewendeten Maßnahmen zur Qualitätssicherung bei fremdsprachlichen Interviews. Die Befragung der Lehrkräfte in NRW erfolgte naheliegender Weise auf Deutsch, da dies meine Muttersprache ist und davon ausgegangen werden kann, dass Lehrkräfte, die in NRW angestellt sind, ebenfalls Muttersprachler_innen sind bzw. über entsprechend gute Sprachkenntnisse verfügen. Die gemeinsame Sprache sollte allerdings nicht darüber hinwegtäuschen, dass Verständnisschwierigkeiten auch durch die Verwendung einer spezifischen Fachsprache oder unterschiedliche Sprachregister (lokale Dialekte, alltagssprachliche vs. fachsprachliche Formulierungen) möglich sind. In den Gesprächen mit den Lehrkräften traten beispielsweise trotz inhaltlicher Vorbereitung kurze Irritationen auf, wenn schulinterne Begriffe oder Abkürzungen verwendet wurden, die mir bis dahin nicht bekannt waren.38 Auch die zu Beginn eher aus der forschenden Perspektive formulierten Fragen mussten im Laufe der Erhebungswellen etwas alltagssprachlicher umformuliert und besser an die schulischen Gegebenheiten angepasst werden. Für die Befragung der schwedischen Lehrkräfte wurde zunächst davon ausgegangen, dass Interviews in einer gemeinsamen Fremdsprache (in diesem Fall Englisch als Lingua franca) eine für alle Beteiligten angenehme und erfolgversprechende Strategie sein könnte. Im Zuge eines Probeinterviews mit zwei schwedischen Lehrkräften – ein Englischlehrer und eine Schwedischlehrerin an einer grundskola – stellte sich allerdings heraus, dass die Ausdrucksmöglichkeiten durch die Fremdsprache deutlich eingeschränkter als erwartet waren und in Ermangelung ausreichender Sprachkenntnisse teilweise sogar sinnverändernde Wendungen genutzt wurden. Zwei Beispiele sollen dies veranschaulichen: Im folgen38

Z.B. die Abkürzung „AOSF-Schüler“. Damit sind Schüler*innen gemeint, bei denen ein Verfahren eingeleitet wird, um festzustellen ob diese Schüler_innen einen sonderpädagogischen Förderbedarf haben und ggf. auf eine Förderschule versetzt werden sollen. Die Abkürzung bezieht sich auf die Ausbildungsordnung für sonderpädagogische Förderung (AO-SF).

Interviewdurchführung

111

den Interviewausschnitt versucht der Englischlehrer Simon39 einige Veränderungen zu erläutern, die die Schulreform von 2011 für die schulische Leistungsbeurteilung in Schweden mit sich brachte. Er scheitert jedoch teilweise an seinem Vokabular und bricht mehrmals ab: „Because we have to= to= to grade them eh=eh (.) from year six (...) now. So it is the first year. Before it was from year eight (.) and it´s like (.) and this process maybe started in ye=in ye=year seven li=like up till eight. But not before. So now it´s like a (..) ja (.). And then they wake up […].” Das Abbrechen erfolgt immer dann, wenn es um die Beschreibung der Auswirkungen dieser Reform geht („it’s like (.)“), also immer dann, wenn es um seine subjektive Sichtweise geht. Da jedoch genau diese subjektiven Wahrnehmungen und Überzeugungen im Mittelpunkt der Arbeit stehen, zeigte sich hier eine unerwünschte Einschränkung in der Ausdruckfähigkeit der Befragten. Die ebenfalls interviewte Schwedischlehrerin wechselte anfangs häufiger in ihre Muttersprache Schwedisch, bis sie schließlich nur noch Schwedisch sprach. Die schwedischen Narrationen fallen auch deutlich länger und detaillierter aus als ihre englischen Redeanteile. Das zweite Beispiel zeigt die Schwierigkeiten der Übersetzungen: So führt der Englischlehrer aus, dass es ihm wichtig sei, dass die Schüler_innen im Unterricht ein tiefergehendes Verständnis von bestimmten curricularen Inhalten entwickeln können. Die von ihm verwendete Formulierung „that the students, that they get the=the=the deep knowledge“ verweist auf die in den schwedischen Regularien häufig verwendete Formulierung fördjupad förståelse, die wortwörtlich als ein „tiefergehendes Verständnis“ übersetzt werden kann. Stattdessen spricht er aber von einem „tiefen Wissen“ (deep knowledge). Hier wird auch deutlich, welche Gefahren des Missverstehens in der Doppelübersetzung (zunächst ins Englische durch den Lehrer, dann vom Englischen ins Deut-

39

In Schweden ist die Anrede mit dem Vornamen (auch im beruflichen Kontext) üblich, insofern sind für die befragten schwedischen Lehrkräfte entsprechende Vornamen als Pseudonyme gewählt worden. Die deutschen Lehrkräfte sind nach dem Muster „Herr/Frau Nachname“ pseudonymisiert (vgl. Kap. 6).

112

4 Konkrete Forschungsschritte

sche durch mich) lauern und eine möglichst sinngetreue Annäherung an das von den Befragten Geäußerte erschweren. Eine Auslagerung der Interviews an sprachkundige(re), aber zwangsläufig weniger im Forschungsthema bewanderte Dritte hätte einen zu großen Informationsverlust bedeutet, wenn man davon ausgeht, dass die Interviewführung selbst bereits zu weiterführenden Erkenntnissen führt und erste Interpretationsschritte beinhaltet.40 Mit der Entscheidung, die Interviews selbst auf Schwedisch und damit einer den Befragten vertrauten Sprache durchzuführen, wurde den Lehrkräften die Möglichkeit gegeben, ihre subjektive Sicht auf die angesprochenen Themen möglichst facettenreich und ausdrucksstark in ihren eigenen Worten wiederzugeben ohne über Fragen von adäquater Übersetzung nachdenken zu müssen. Für mich als Forschende bedeutete diese Entscheidung allerdings auch eine zeitliche Verzögerung der Erhebungen, da ich zunächst die notwendigen Sprachkenntnisse erwerben musste. Glücklicherweise handelt es sich beim Schwedischen um eine germanische Sprache mit einfacher Grammatik und vielen aus dem Deutschen und Englischen entlehnten Worten, sodass das Erlernen für eine deutsche Muttersprachlerin keine allzu große Hürde darstellt. Um möglichst schnell auf ein sicheres Sprachniveau zu gelangen, habe ich zunächst mehrere Intensivkurse bei muttersprachlichen Sprachlehrer_innen in Göteborg und Berlin sowie vier semesterbegleitende Sprachkurse an der HumboldtUniversität zu Berlin besucht. Begleitend dienten Filme, Musik und natürlich die schwedische Forschungsliteratur sowie Publikationen der schwedischen Schulbehörde Skolverket als Lernmaterialien. Der regelmäßige Austausch mit den ebenfalls Schwedisch sprechenden Kolleg_innen im DFG-Projekt und den Kolleg_innen aus Växjö rundete das ‚Sprachbad‘ ab und führte zu einem zügigen und zufriedenstellenden Spracherwerb. Um den weiterhin bestehenden potentiellen, (nicht nur) sprachlichen Verständnisschwierigkeiten meinerseits entgegen zu wirken, wurden 40

Zur Diskussion um die Schwierigkeiten und Fallstricke fremdsprachlicher Interviewforschung im Rahmen der Migrationsforschung vgl. Enzenhofer und Resch (2011).

Interviewdurchführung

113

mehrere Qualitätssicherungsmaßnahmen unternommen, um diese Schwierigkeiten, wo sie nicht aufzulösen waren, so doch zumindest abzuschwächen: Bei der Vorbereitung der Interviews: Der Interviewleitfaden für die schwedischen Lehrkräfte wurde im Verlauf des Forschungsprozesses mehrfach mit schwedischen Muttersprachler_innen bzw. schwedischsprachigen Kolleg_innen diskutiert und anschließend modifiziert, um sowohl inhaltlich aufschlussreiche als auch sprachlich adäquate Fragen herauszuarbeiten. Der Feldzugang wurde durch Schlüsselpersonen vor Ort (gatekeeper) ermöglicht (vgl. hierzu ausführlicher Kap. 4.1 zum Sampling). Auch für die Vorbereitung der Interviews in NRW wurden sowohl der Feldzugang als auch die Interviewleitfäden innerhalb der Forschungsgruppe diskutiert und fortlaufend inhaltlich sowie sprachlich angepasst. Im Interview selbst: Die Interviews in NRW erfolgten grundsätzlich zu zweit (in den meisten Fällen zusammen mit einer studentischen Hilfskraft aus dem Projektkontext), um eine Triangulation der Perspektiven auf den Verlauf und Besonderheiten im Interview im Nachhinein zu ermöglichen. Aus forschungspragmatischen Gründen der Ressourcenknappheit war dies bei den schwedischen Interviews nicht durchgängig möglich. Bei einigen Interviews in Schweden nahm eine zweisprachige Kollegin aus dem DFG-Projekt, Bettina Vogt, an den Interviews teil und konnte spontan bei Missverständnissen aushelfen oder auf für die Analyse besonders interessante Auffälligkeiten im Nachgespräch hinweisen. Teilweise entpuppte sich die sprachliche Barriere auch als Vorteil in der Erhebungssituation, denn so waren die Befragten zu umfassenderen Erklärungen, Wiederholungen und Beispielerzählungen angehalten und konnten auf plausible Weise zu ausführlichen Narrationen bewegt werden. Zusätzlich wurden alle Interviews (auch die deutschen) aufgezeichnet, um ein nachträgliches Anhören und Transkribieren der Gespräche zu ermöglichen. Im Anschluss an die Interviews: Alle Interviewaufzeichnungen wurden durch muttersprachliche Personen detailliert transkribiert (zur Notwendigkeit originalsprachlicher Transkripte in qualitativer Forschung vgl.

114

4 Konkrete Forschungsschritte

Enzenhofer & Resch, 2011). Die Transkription erfolgte anhand eines Regelsystems (vgl. Anhang) bei dem jede Äußerung sowie Sprachpausen möglichst genau verschriftlicht wurden. Umgangssprachliche Formulierungen wurden dabei ins Hochsprachliche übertragen, solange dadurch keine inhaltliche Sinnverschiebung erfolgte. Durch die Verschriftlichung konnten auch solche Interviewstellen, die ich im Gespräch aufgrund von mangelnden Sprachkenntnissen oder akustischen Verständnisproblemen nicht umfassend erfassen konnten, im Nachhinein ‚verstehbar‘ gemacht werden. Für die ersten zehn schwedischen Interviews erfolgte im Anschluss an die Transkription eine intensive Besprechung der Transkripte (Zeile für Zeile) mit einer in das Forschungsthema eingeführten studentischen Hilfskraft, die ebenfalls schwedische Muttersprachlerin ist und somit als „kulturvertraute Co-Interpretin“ (Schröer, 2013) fungieren konnte. In diesen Besprechungen konnten erste Eindrücke und offene Kodierungen validiert und sprachliche Auffälligkeiten (wie die Verwendung besonderer Verben oder ungewöhnliche umgangssprachliche Formulierungen) für die spätere Analyse festgehalten werden. Im Analyseprozess: Die Auswertung der Interviews habe ich jeweils anhand der originalsprachlichen Transkripte, und nicht anhand von Übersetzungen, durchgeführt, da Übersetzungen immer schon ein erster Schritt von Interpretationen sind. In einer regelmäßig stattfindenden zweisprachigen Interpretationsrunde konnten Transkriptstellen intensiv besprochen und Interpretationen kommunikativ validiert werden (ausführlicher zur Interpretation in Arbeitsgruppen vgl. Reichertz, 2013). Die Diskussion von Interpretationen mit schwedischen Kolleg_innen sowie die Präsentation von Teilergebnissen auf internationalen Tagungen dienten dabei auch der kulturellen Validierung im Sinne einer Reflektion meiner durch die Sozialisation im deutschen Bildungssystem geprägten Lesarten auf das schwedische Material. Für die Nachvollziehbarkeit der Interpretationen für die Leser_innen dieser Arbeit werden im Folgenden alle Interviewzitate in der deutschen Übersetzung im Fließtext und die schwedischen Originalaussagen in der Fußnote angegeben.

Sukzessive Integration weiterer Daten

115

Trotz all dieser Maßnahmen kann natürlich nicht ausgeschlossen werden, dass bestimmte Inhalte, Zwischentöne und Stimmungen in den schwedischen Interviews verloren gingen, obwohl es zumeist problemlos möglich war, dem groben Erzählstrang der Befragten zu folgen. Auch stieß die Interpretationsarbeit zuweilen an ihre Grenzen, insbesondere dann, wenn nicht mehr ganz eindeutig zu rekonstruieren war, ob bestimmte Begriffe auf eine sprachliche Besonderheit einer einzelnen Lehrkraft oder aber auf verallgemeinerbarere Konzepte mit kultureller Prägung hinwiesen. An diesen Stellen war besondere Vorsicht und Sensibilität gegenüber dem fremdsprachlichen Material angebracht, wie in der ausführlichen Darstellung der Gerechtigkeitsüberzeugungen in Kapitel 6 zu sehen sein wird. Wie weiter oben bereits beschrieben, trifft dies jedoch grundsätzlich für das methodisch geleitete Fremdverstehen in interpretativen Forschungskontexten zu (vgl. Kap. 3). Gleichzeitig eröffneten sich mir durch die Position als gewissermaßen außenstehende Forscherin im schwedischen Schulsystem äußerst produktive Gesprächsdynamiken. Einerseits lieferten die befragten Lehrkräfte immer wieder auch unaufgefordert Erläuterungen zu ihnen wichtig erscheinenden Besonderheiten des schwedischen Bildungssystems, um mir so ein besseres Verständnis des Gesagten zu ermöglichen. Dadurch verbreiterte sich mein Feldwissen mit jedem Interview um wichtige Details, die dann wiederum bei der Interpretation hilfreich waren. Andererseits waren so auch ‚naive‘ Fragen meinerseits möglich, die auch das Ansprechen kultureller Tabus ermöglichten. Beispielsweise konnte ich so auf eine sehr direkte Weise nach der Selektionsfunktion von schulischer Leistungsbeurteilung fragen, obwohl gerade diese (sehr ‚deutsche‘) Perspektive an ein kulturelles Tabu in Schweden rührt. 4.3 Sukzessive Integration weiterer Daten Ebenso wie bei der Erarbeitung der Interviewleitfäden und deren kontinuierlicher Anpassung an den fortschreitenden Erkenntnisstand im Forschungsprozess wurden auch für die Analyse der Interviewtranskripte zusätzliche Datenquellen herangezogen. Zu Beginn der Untersuchung

116

4 Konkrete Forschungsschritte

waren dies vor allem die offiziellen Regularien, also die Schulgesetze, Lehrpläne und weitere Vorschriften zur Leistungsbeurteilung, um einen Überblick über die grundlegenden Ideen der institutionellen Rahmung in beiden Kontexten zu erhalten und Besonderheiten des jeweiligen Beurteilungssystems einfließen lassen zu können (eine Charakterisierung der einbezogenen Regularien findet sich jeweils zu Beginn der Darstellung der jeweiligen Schul- und Beurteilungssysteme beider Länder in Kap. 5.1 und 5.2). Im Zuge der Interviews wurde auch deutlich, dass die Lehrkräfte sich in ihren Erzählungen häufig auf spezifische Beurteilungsmaterialien und Hilfsmittel bezogen, um beispielsweise auf besondere Schwierigkeiten bei der mündlichen Leistungsbeurteilung oder der Erstellung der Zeugniszensuren hinzuweisen. Teilweise skizzierten sie dafür ihre Beurteilungsmatrizen oder beschrieben diese mit Gesten – beides wurde zunächst versucht in Interviewprotokollen während des Interviews oder direkt im Nachgang des Gesprächs festzuhalten. Die Materialien kristallisierten sich als hilfreiche Gesprächsstützen heraus, so dass ab der zweiten Erhebungswelle in NRW alle potentiellen Interviewpartner_innen aufgefordert wurden ihre Beurteilungsmaterialien – sofern vorhanden und gewünscht – zum Interview mitzubringen. Die mitgebrachten Materialien reichten dabei von schulinternen Absprachen zur Leistungsbeurteilung, über Notenlisten, Sitzpläne oder Erwartungshorizonte hin zu digitalen Dokumentationssystemen mithilfe von Laptops und anderen Geräten. Während des Interviews dienten diese Materialien als Kommunikationshilfen, indem sie spontane Erzählungen zu konkreten Beurteilungssituationen, eventuellen Schwierigkeiten oder individuellen Schüler_innen provozierten. Einige Materialien wurden mir anschließend von den Lehrkräften als Kopie oder per E-Mail zur Verfügung gestellt und ebenfalls kodiert und in die Analyse der Interviews einbezogen, bei anderen liegen nachträglich von mir angefertigte Beschreibungen des Materials vor. Die in NRW üblichen schulinternen Grundsätze zur Leistungsbeurteilung konnten nicht für alle Schulen der befragten Lehrer_innen einbezogen werden, da dies zum Teil von den Schulleitungen untersagt wurde. Die erwähnten Interviewprotokolle sowie weitere Feldnotizen

Datenanalyse und Kodierprozeduren

117

flossen kontinuierlich in die Analyse und Planung der weiteren Erhebungen ein. Da sich die schwedische Schulbehörde Skolverket als wichtiger Bezugspunkt in den Interviews mit den schwedischen Lehrkräften herausstellte, wurden zunehmend auch die verschiedenen Publikationen sowie die Homepage und ein Newsletter der Behörde als weitere Datenquellen einbezogen. Durch die besondere Situation der grundlegenden Reform des schwedischen Bildungssystems fungiert(e) die Schulbehörde häufig als Vermittlungsinstanz zwischen Bildungspolitik und schulischer Praxis, was sich auch in den zahlreichen Pressemitteilungen, Informationsbroschüren und erklärenden Videos auf der Homepage zeigte. Das nordrhein-westfälische Pendant zu Skolverket, das Ministerium für Schule und Weiterbildung (MSW), unterhält ebenfalls eine Homepage, auch „Bildungsportal Nordrhein-Westfalen“ genannt, auf der zielgruppenspezifische Informationen für Schüler_innen, Eltern und Lehrkräfte über das nordrhein-westfälische Bildungssystem bereitgestellt werden. Allerdings finden sich unter der Rubrik „Für Lehrkräfte“ keinerlei Handreichungen oder Praxishinweise zu konkreten Fragen der Durchführung der schulischen Leistungsbeurteilung wie im schwedischen Fall. Hier wurden vor allem die landesweit gültigen Kernlehrpläne der Fächer Mathematik und Deutsch sowie Hinweise auf Verwaltungsvorschriften u.ä. in spezifischen Detailfragen zur Leistungsbeurteilung (z.B. „Dürfen Hausaufgaben benotet werden?“) entnommen und in die Analyse einbezogen. Für beide Kontexte gilt, dass insbesondere diejenigen Regularien und offiziellen Publikationen für den Zeitraum 2010 bis 2016 berücksichtigt wurden. 4.4 Datenanalyse und Kodierprozeduren Um mit der beschriebenen Fülle an Daten unterschiedlicher Art in zwei Sprachen sinnvoll umzugehen und diese im Hinblick auf die interessierenden Forschungsfragen auswerten zu können, wurden verschiedene Kodierprozeduren, wie sie von Vertreter_innen der GTM vorgeschlagen werden, genutzt. So wurden bspw. die von Strauss (1994) vorgeschlagenen drei Formen des Kodierens – offenes, axiales und selektives Kodieren

118

4 Konkrete Forschungsschritte

– angewandt. Das offene Kodieren meint dabei den ersten Zugang zum Material und die Generierung von eher beschreibenden und noch stark materialnahen Kodes. Beim axialen Kodieren werden die gefundenen Kodes zu Kategorien verdichtet und miteinander verglichen, um so weitere Dimensionierungen zu ermöglichen sowie durch die Suche nach Kontrastfällen übergreifende Kategorien entwickeln zu können. Beim selektiven Kodieren schließlich wird ein weiterer Abstraktionsgrad angestrebt, der in der Verdichtung der übergreifenden Kategorien zu einer oder mehreren Kernkategorien kumuliert. Für das offene Kodieren (aber auch darüber hinaus) erwiesen sich die von Mey und Mruck (2009) vorgeschlagenen generativen Fragen als sehr hilfreich, um dem Material gegenüberzutreten. Die generativen Fragen sind an die Struktur des Kodierparadigmas von Strauss und Corbin (1996) angelehnt, dienen aber zunächst dazu die Daten ‚aufzubrechen‘, erste Kodes und Ideen zu entwickeln und damit eine erste Dimensionalisierung der gefundenen Positionen vorzunehmen. Generative Fragen können wie folgt lauten: Tab. 4 – Generative Fragen (eigene Darstellung in Anlehnung an Mey & Mruck, 2009, S. 120) W-Frage Was? Wer? Wie? Wann? Wie lange? Wo? Warum? Womit? Wozu?

Umschreibung Um welches Phänomen geht es? Welche Akteure sind beteiligt? Welche Rollen nehmen sie ein bzw. werden ihnen zugewiesen? Welche Aspekte des Phänomens werden behandelt bzw. ausgespart? Welche Bedeutung kommt der raum-zeitlichen Dimension zu (biografisch bzw. für eine einzelne Handlung)? Welche Begründungen werden gegeben bzw. sind erschließbar? Welche Strategien werden verwandt? Welche Konsequenzen werden antizipiert bzw. wahrgenommen?

Zunächst wurde jedes Interview einzeln für sich am ausgedruckten Transkript Zeile-für-Zeile offen kodiert. Dabei habe ich meist in der jeweiligen Interviewsprache kodiert, um möglichst nah an den Formulierungen der Befragten zu bleiben und um bildhafte in-vivo-Kodes nicht ihrer Ausdrucksstärke zu berauben. Parallel dazu habe ich zahlreiche Memos zu

Datenanalyse und Kodierprozeduren

119

auffälligen Interviewpassagen angefertigt und Notizen für potentielle Kontrastfälle angefertigt. Um weiterhin einen Überblick über die wachsende Zahl verschiedener Datensorten zu behalten, nutzte ich ab Beginn der zweiten Erhebungswelle in NRW die Software MaxQDA und übertrug die bisherigen handschriftlichen Kodierungen und Memos aus verschiedenen Dateien in dieses Programm. Ein Teil der Analyse fand jedoch weiterhin analog statt, in Form von handschriftlichen Notizen in einem Forschungstagebuch, Mind-Maps sowie darauf aufbauenden ausformulierten Memos und Teilkapiteln, in die immer wieder auch neue Forschungsliteratur bzw. andere Datenquellen einbezogen wurden. Kollegiale Interpretationsrunden dienten der gemeinsamen Erschließung des Materials bzw. der Diskussion entstehender Kategorisierungen. Das digitale Kodieren in MaxQDA war immer wieder dann hilfreich, wenn ich beim axialen und selektiven Kodieren auf der Suche nach minimalen oder maximalen Kontrasten für eine konkrete Kategorie das gesamte Material durchsuchen konnte bzw. um die bereits vergebenen Kodes neu zu gruppieren, zu Kategorien zu verdichten und übergeordnete Kategorien anzulegen. Als zentrale Kategorien schälten sich im Laufe der Analyse unter anderem das professionelle Selbstbild der Lehrkräfte, ihr Beurteilungsverständnis und die Beziehungskonstellationen zwischen Lehrkräften und Schüler_innen sowie Lehrkräften und Kollegium bzw. Schulleitung heraus. Diese zentralen Kategorien stehen wiederum über die entwickelte Kernkategorie „Gerechte Leistungsbeurteilung als Balanceakt“ und die damit zusammenhängenden Handlungsstrategien miteinander in Beziehung. Im letzten Schritt erfolgte durch die Anwendung des von Strauss und Corbin (Strauss & Corbin, 1996) vorgeschlagenen Kodierparadigmas41 eine Integration der zentralen Kategorien zu einem Modell der 41

Im 1994 auf Deutsch erschienen Buch „Grundlagen qualitativer Sozialforschung“ spricht Strauss noch vom Kodierparadigma, später wird im Lehrbuch von Corbin und Strauss daraus die „Bedingungsmatrix“ oder „conditional/consequential matrix“, die kreisförmig angeordnete Ringe vom interessierenden Phänomen ausgehend beinhaltet und die Einbeziehung von interaktionalen, organisationalen und institutionellen Bedin-

120

4 Konkrete Forschungsschritte

gegenstandsverankerten Theorie zu Gerechtigkeitsüberzeugungen von Lehrkräften bei der schulischen Leistungsbeurteilung (vgl. ausführlicher dazu die Ausführungen in Kap. 6.1 und 6.2). Eine große Herausforderung bei der Analyse des Materials stellte der Umgang mit den beiden Kontexten Schweden und NRW dar, konkret die Gefahr der vorschnellen Erklärung von Unterschieden zwischen einzelnen Lehrkräften aufgrund von zugeschriebenen ‚kulturellen‘ Unterschieden. Die kleinteilige Analyse (Zeile-für-Zeile) und auch der permanente fallinterne sowie fallübergreifende Vergleich ermöglichten allerdings immer wieder die Rückkehr zu einer offenen und gegenstandzentrierten Haltung gegenüber dem Material und einem Fokus auf das Phänomen ‚gerechter Leistungsbeurteilung‘. Da die institutionelle Rahmung schulischer Leistungsbeurteilung in beiden Kontexten jedoch zum Teil sehr unterschiedlich ausgestaltet ist und sich dadurch unterschiedliche Gestaltungsspielräume für die agierenden Lehrkräfte ergeben, nimmt die Darstellung der Beurteilungssysteme in Schweden und NordrheinWestfalen in der Ergebnispräsentation trotzdem einen besonderen Stellenwert ein. Die Begründung der gewählten Ergebnisdarstellung erfolgt im nächsten Kapitel.

gungen und Konsequenzen in die Analysearbeit vorschlägt (vgl. Strauss, 1994; Corbin & Strauss, 2008).

Die zwei Darstellungsebenen der Ergebnisse

121

4.5 Die zwei Darstellungsebenen der Ergebnisse Für das Verständnis der rekonstruierten Gerechtigkeitsüberzeugungen und die gewählten Handlungsstrategien der befragten Lehrkräfte spielen die Kontextbedingungen unter denen schulische Leistungsbeurteilung in Schweden und Nordrhein-Westfalen stattfindet eine zentrale Rolle. Insofern erfolgt die Ergebnisdarstellung in zwei aufeinanderfolgenden Schritten: zunächst werden die institutionellen Rahmenbedingungen schulischer Leistungsbeurteilung ausführlich für beide Vergleichsfälle dargestellt, anschließend die aus den Interviews und ergänzenden Datenmaterialien rekonstruierten Gerechtigkeitsüberzeugungen und Handlungsstrategien. Unter den institutionellen Rahmenbedingungen werden die grundsätzlichen Charakteristika der beiden Bildungssysteme, die jeweiligen Elemente schulischer Leistungsbeurteilung sowie die Spezifika der Lehramtsausbildung verstanden. Aus ihnen werden im ersten Schritt die kulturell-gesellschaftlich geprägten Gerechtigkeitsnormen abgeleitet, die als Kontextbedingungen das Beurteilungshandeln und die Gerechtigkeitsüberzeugungen der befragten Lehrkräfte rahmen. Wie im vorangegangenen Abschnitt zur Vorgehensweise bei der Datenanalyse deutlich wurde, verlief die analytische Arbeit in erster Linie entlang der sukzessiv erarbeiteten Kodes und Kategorien zunächst über Ländergrenzen hinweg. Auch die Darstellung der Gerechtigkeitsüberzeugungen und Beurteilungsstrategien in Kapitel 6 wird sich auf die Entfaltung des Phänomens ‚gerechter Leistungsbeurteilung‘ aus Lehrer_innenperspektive in länderübergreifender Perspektive fokussieren, allerdings immer dort auf Gemeinsamkeiten und Unterschiede der Lehrkräfte beider Kontexte eingehen, wo diese sich auf unterschiedliche institutionelle Rahmungen bzw. gesellschaftlich-kulturell geprägte Gerechtigkeitsnormen zurückführen lassen. Für die bessere Nachvollziehbarkeit der Interpretationen der Interviews werden in Kapitel 5 allerdings die institutionellen Rahmenbedingungen der schulischen Leistungsbeurteilung zunächst getrennt für Schweden und NRW (Kap. 5.1 und 5.2) und anschließend in einem ersten Zwischenfazit (Kap. 5.3) vergleichend dargestellt. Auf dieser Grundlage werden in Kapitel 6 die

122

4 Konkrete Forschungsschritte

Kernkategorie dieser Arbeit – Gerechte Leistungsbeurteilung als Balanceakt – sowie weitere zentrale Kategorien dargestellt. Im Anschluss folgen die detaillierte Darstellung der rekonstruierten Gerechtigkeitsüberzeugungen und Beurteilungsstrategien anhand exemplarischer Interviewausschnitte und deren Interpretationen. Dort, wo es der Verständlichkeit dient, werden weiterführende Details der regulativen Ebene in die Darstellung der empirischen Rekonstruktion der Gerechtigkeitsüberzeugungen eingeflochten. Auf Unterschiede und Gemeinsamkeiten innerhalb oder zwischen verschiedenen Subgruppen des Samples wird ebenfalls eingegangen und die Variationsbreite mithilfe kontrastierender Fälle nachgezeichnet. In Kapitel 7 wird die gegenstandsverankerte Theorie zu Gerechtigkeitsüberzeugungen von Lehrkräften bei der schulischen Leistungsbeurteilung anhand des entwickelten Modells abschließend und vergleichend diskutiert.

5 Institutionelle Rahmung schulischer Leistungsbeurteilung in Schweden und Nordrhein-Westfalen Sowohl in Schweden als auch in Deutschland kommt der einzelnen Lehrkraft bei der schulischen Leistungsbeurteilung eine zentrale Rolle zu, da sowohl die fortlaufende Beurteilung von Schüler_innenleistungen im laufenden Schuljahr als auch die übergangsrelevanten Entscheidungen am Ende eines Bildungsganges ausschließlich von den Lehrkräften durchgeführt werden – und nicht etwa durch schulexterne Beurteiler_innen, wie dies beispielsweise im englischen Bildungssystem üblich ist. Die schulische Leistungsbeurteilung besteht vielmehr aus individuellen Praktiken, die durch spezifische Regeln und Erwartungen, die sich beispielsweise in der Form der Lehramtsausbildung, den offiziellen Regularien zur Leistungsbeurteilung oder informellen einzelschulischen Bewertungskulturen ausdrücken, gerahmt und vorgeprägt sind. Daneben existiert in Schweden auch noch ein System standardisierter Tests, mit dessen Hilfe eine landesweit einheitliche Beurteilung sichergestellt werden soll. Diese verschiedenen institutionellen Rahmenbedingungen schulischer Leistungsbeurteilung sollen im Folgenden zunächst getrennt für die beiden Vergleichskontexte Schweden und NRW (Kap. 5.1 und 5.2) herausgearbeitet werden. Es kann hier nicht um die umfassende Darstellung aller Detailfragen des jeweiligen Bildungssystems gehen, vielmehr werden thematische Schwerpunkte, die für die schulische Leistungsbeurteilung relevant sind, gesetzt. In Kapitel 5.3 werden anschließend die wichtigsten Grundlinien, die als institutionelle Vorbedingungen des Verständnisses von gerechter Leistungsbeurteilung in beiden Kontexten identifiziert wurden, vergleichend dargestellt. Insofern liefert dieses Kapitel wichtige Kontextinformationen zu den Beurteilungssystemen Schwedens und NRWs, die für ein Verständnis der in Kapitel 6 anschließenden Darstellung der Gerechtigkeitsüberzeugungen grundlegend sind. Gleichzeitig stellt es zentrale Befunde aus der Analyse der die Interviews ergänzenden Materialien (Regularien, Beurteilungsmaterialien, Forschungsliteratur, etc.) bezüglich der institutionellen Rahmung der Ge© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 K. Falkenberg, Gerechtigkeitsüberzeugungen bei der Leistungsbeurteilung, https://doi.org/10.1007/978-3-658-28275-2_5

124

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

rechtigkeitsüberzeugungen von Lehrkräften in Schweden und NRW dar. Wie in den Kapiteln 6 und 7 deutlich werden wird, spielen diese institutionellen Rahmungen und die in ihnen bereits eingelassenen Gerechtigkeitsnormen eine zentrale Rolle für das Verständnis der Gerechtigkeitsüberzeugungen von Lehrkräften im jeweiligen Beurteilungssystem. 5.1 Schulische Leistungsbeurteilung in Schweden Die folgenden Darstellungen beruhen zu einem Großteil auf der sukzessiven Analyse zentraler Regularien bezüglich der allgemeinen Systemarchitektur des schwedischen Bildungssystems sowie der schulischen Leistungsbeurteilung im Speziellen. Die Dokumente wurden zunächst im Vorfeld der Interviewdurchführung für die Leitfadenkonstruktion sowie im Zuge der Analyse der Interviews immer dann als zusätzliche Quellen herangezogen, wenn sich diese als erhellend für den Verständnis- und Rekonstruktionsprozess erwiesen. Dafür wurden systematisch die Publikationsdatenbanken der schwedischen Schulbehörde Skolverket bzw. die Gesetzessammlung des schwedischen Reichstags nach relevanten Dokumenten durchsucht. Die Studie konzentriert sich auf das aktuelle Beurteilungssystem, insofern lag der Fokus auf Dokumenten aus dem Zeitraum 2010-2016. Vereinzelt wurden auch ältere Publikationen einbezogen, wenn sie für das Verständnis der Entstehungsgeschichte des Bildungs- und Beurteilungssystems notwendig waren. Da die in die Analyse einbezogenen Dokumente vor allem zur Generierung von Kontextwissen verwendet wurden, handelt es sich also nicht um eine im engeren Sinne klassische Dokumentenanalyse; ein Anspruch auf Vollständigkeit der einbezogenen Dokumente wird ebenfalls nicht erhoben. Die wichtigsten Dokumente, die für die Leitfadenkonstruktion sowie als ergänzende Daten bei der Analyse herangezogen wurden, entstammen folgenden Dokumentgruppen: 1) Das allgemeine Schulgesetz (skollag; im Folgenden: Skollag 2010:800) und die dazugehörigen Verordnungen (allgemeine Schulverordnung – skolförordningen SFS 2011:185; Verordnung für die weiterführende

Schulische Leistungsbeurteilung in Schweden

125

Schule – gymnasieförordning SFS 2010:2039) enthalten die grundlegenden Regelungen zum Aufbau des Bildungssystems, den Schulformen und Trägerschaften sowie Qualitätssicherungsmaßnahmen und Rahmenvorgaben zur schulischen Leistungsbeurteilung. Diese werden in den schulformbezogenen Verordnungen noch spezifiziert. 2) Die zentralen Lehrpläne für die grundskola (Lgr11) und die gymnasieskola (Lgy11) enthalten sämtliche inhaltlichen Lernziele und Beurteilungsvorgaben für alle Fächer sowie einen einleitenden Teil mit grundlegenden Aussagen zur gesellschaftlichen Rolle der Schule als Institution sowie übergreifende Bildungsziele für alle Schüler_innen. Diese finden sich im nordrhein-westfälischen Kontext eher im allgemeinen Schulgesetz und nicht in den einzelnen Kernlehrplänen (vgl. Kap. 5.2). Zusätzlich gibt es zu den einzelnen Fächern von Skolverket verfasstes Kommentarmaterial (vgl. z. Bsp. SKOLFS 2010:37, SKOLFS 2010:250, Skolverket 2011a), in dem die Lehrplanziele und vor allem Beurteilungskriterien anhand von Beispielen erläutert werden. 3) In den Verordnungen und Vorschriften42 zur schulischen Leistungsbeurteilung werden Detailfragen, wie die korrekte Erstellung eines Abschlusszeugnisses (SKOLFS 2014:50), die Durchführung der landesweiten Tests in Klasse 3, 6 und 9 (SKOLFS 2011:185) oder die Benotungskriterien der Fächer ab Klasse 6 (SKOLFS 2011:19), geklärt. 4) Die von der schwedischen Bildungsbehörde Skolverket veröffentlichten Publikationsreihen „Hilfsmittel für Lehrkräfte“ (stödmaterial) und „Allgemeine Hinweise“ (allmänna råd) zu spezifischen Themen der Leistungsbeurteilung kommentieren die schulrechtlichen Verordnungen und dienen damit der Erklärung der Vorgaben bzw. erläutern, welche Veränderungen zwischen dem aktuellen und den vorherigen Beurteilungssys42

Zur Unterscheidung der offiziellen Dokumente: Gesetze (lagar) und Verordnungen (förordningar) werden vom schwedischen Reichstag verabschiedet, darin kann ein Auftrag an die schwedische Schulbehörde Skolverket zur Anfertigung weiterer Ausführungsvorschriften (föreskrifter) enthalten sein. Skolverket kann darüber hinaus noch weitere Handreichungen und Kommentarmaterial zu den Vorschriften verfassen (stödmaterial, allmänna råd, kommentar till föreskrifter).

126

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

temen stattfanden. Sie richten sich gezielt an Lehrkräfte und Schulleitungen und stellen dabei ein Bindeglied zwischen den im Schulgesetz und den schulrechtlichen Verordnungen festgeschriebenen Vorgaben und der lokalen Umsetzung in der pädagogischen Praxis dar. Im Vorwort zu einem der ersten allmänna råd nach der Reform 2010/11 heißt es daher auch: „Die Allgemeinen Hinweise der Schulbehörde enthalten Empfehlungen, wie Lehrkräfte, Schulleitungen und Schulträger handeln können oder sollen, um die Anforderungen der Vorschriften zu erfüllen. [Sie] zielen darauf ab, die Entwicklung in eine bestimmte Richtung zu lenken und eine einheitliche Umsetzung der Gesetze zu stärken“ (Skolverket, 2011c, S. 7; Übersetzung K.F.). Die Betonung der Einheitlichkeit der Umsetzung zentraler Vorgaben verdeutlicht bereits hier die besondere Rolle, die einem gleichwertigen Bildungssystem im schwedischen Kontext zugesprochen wird. Auf diesen Aspekt gehe ich in den Kapiteln 5.1.1 und 5.1.2 ausführlicher ein. 5) Eine weitere Dokumentengruppe stellen Berichte der 2008 gegründeten Schulinspektionsbehörde (skolinspektionen) dar, die sich bspw. mit der Überprüfung der Beurteilungen der zentralen Tests befassen und Abweichungen zwischen Testergebnissen und Zeugniszensuren thematisieren (vgl. u.a. Skolinspektionen, 2010, 2014a). 6) Zu Guter Letzt wurde die aktuelle schwedische und internationale Forschungsliteratur gesichtet, um die innerschwedische wissenschaftliche Diskussion bezogen auf die schulische Leistungsbeurteilung und deren Wandel im Laufe der mehrfachen Reformierung des Bildungssystems zwischen 1990 und 2011 nachvollziehen und in Beziehung zu den in den Interviews gewonnenen Informationen zu setzen. Bereits an dieser Stelle sei darauf verwiesen, dass die schwedische Schulbehörde Skolverket sehr detaillierte und vielfältige Publikationen gerade auch hinsichtlich der praktischen Umsetzung der schulischen Leistungsbeurteilung veröffentlicht, die sich zum großen Teil direkt an Lehrkräfte und Schulleitungen richten. Aber auch für Schüler_innen und Eltern gibt es spezielle Informationsbroschüren und Hilfestellungen. Die große Anzahl an Publikationen zum Thema schulische Leistungsbeurteilung kann dabei klar auf die 2010/2011 durchgeführten Reformen im

Schulische Leistungsbeurteilung in Schweden

127

Bildungswesen zurückgeführt werden, die eine umfangreiche Aufklärungs- und Legitimationskampagne notwendig machten. Für die vorliegende Arbeit konnten auf diese Weise die normativen Grundlagen des schwedischen Bildungssystems und die Besonderheiten des Beurteilungssystems sehr gut anhand dieser offiziellen Selbstdarstellungen der Schulbehörde herausgearbeitet werden. Im Folgenden werden nun zunächst der Aufbau des Bildungswesens und anschließend die Besonderheiten der schulischen Leistungsbeurteilung dargestellt.

5.1.1 Grundlegende Charakteristika des schwedischen Schulsystems Das gegenwärtige schwedische Bildungssystem ist im Kern ein integriertes Gesamtschulsystem, bestehend aus zwei aufeinander folgenden Schulformen: der allgemeinbildenden neunjährigen grundskola und der daran anschließenden weiterführenden Schule, der dreijährigen gymnasieskola. Innerhalb der weiterführenden Schule werden sowohl studienvorbereitende als auch berufsvorbereitende Programme angeboten, d.h. die Differenzierung auf dem Niveau der Sekundarstufe II findet innerhalb einer Schulform und nicht wie in Deutschland üblich an verschiedenen Schulformen statt. Nichtsdestotrotz fand in den vergangenen 15 Jahren eine Ausdifferenzierung infolge der zunehmen Vermarktlichung des Bildungssystems43 insbesondere des Sekundarschulbereichs statt, die zunehmend als Bedrohung des inklusiven Gesamtschulsystems betrachtet wird (vgl. Carlgren, 2009; Lundahl, Erixon Arreman, Holm & Lundström, 2014). Die Schülerschaft der Grund- und weiterführenden allgemeinbildenden Schulen zeichnet sich aber nach wie vor durch eine große Heterogenität aus, auf die durch entsprechende schulinterne Differenzierungs- und Individualisierungsangebote eingegangen werden soll. Neben der grund- und der gymnasieskola existieren landesweit noch neun Spe43

Vgl. zu den Entwicklungen auf dem schwedischen Bildungsmarkt auch Vogt, Falkenberg und Waldow (2018) sowie Falkenberg, Vogt und Waldow (2015).

128

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

zialschulen (specialskolor) für taube und hörgeschädigte Schüler_innen und Sonderschulen für Schüler_innen mit besonderem Förderbedarf (grundsärskola und gymnasiesärskola) sowie fünf Grundschulen für die ethnische Minderheit der Samen (sameskolor) – allerdings werden diese Schulen von lediglich rund 1% der Gesamtschülerschaft besucht, die Mehrheit der Schüler_innen wird in den inklusiven grund- respektive gymnasieskolor beschult.44 Die an die Schulen angegliederten Freizeitund Betreuungseinrichtungen (fritidshem), die kommunale Erwachsenenbildung (kommunal vuxenutbildning, kurz: komvux) sowie die Kindergärten und Vorschulen (förskolor) gehören – laut Selbstdarstellung der Schulbehörde Skolverket45 – ebenfalls zum Bildungssystem. In Abbildung 4 (nächste Seite) findet sich eine schematische Übersicht über das schwedische Schulsystem.

44

So besuchten bspw. im Schuljahr 2015/16 landesweit insgesamt 553 Schüler_innen eine der neun specialskolor und gut 9.700 Schüler_innen eine grundsärskola. Die überwiegende Mehrheit der Schüler_innen wurde dagegen an einer regulären grundskola beschult (gut 985.000 Schüler_innen im gleichen Schuljahr). Vgl. die Schulstatistik von Skolverket: https://www.skolverket.se/statistik-och-utvardering/nyhetsarkiv/2016/nyheter-20161.244417/okat-antal-elever-i-specialskolan-1.247997 [11.03.2016]. 45 Vgl. die Übersicht über das Bildungssystem auf der Homepage von Skolverket: https://www.skolverket.se/skolformer/karta-over-utbildningssystemet [17.03.2016].

Schulische Leistungsbeurteilung in Schweden

Sek. II

12

11

Weiterführende Schule gymnasieskola

129

18 17 16

10 9

Elementarstufe

15

7

14

6

13

5 4

Allgemeinbildende Schule grundskola

12 11 10

3

9

2

8

1

7

F

Alter

Klassenstufen

Primarstufe

Sek. I

16 8

Vorschulklasse förskoleklass Vorschule/Kindergarten förskola

6

0-5

Abb. 4 – Struktur des Schulsystems in Schweden

Die für alle Kinder gemeinsame neunjährige grundskola wurde 1962 als Ergebnis einer knapp zehnjährigen Pilotphase zur Erprobung der Gesamtschule eingeführt und vereinheitlichte das bis dahin bestehende gegliederte Schulsystem (Lundgren, 2012b, S. 87–95). Geprägt durch das sozialdemokratische Verständnis einer „Schule für Alle“ (en skola för alla) verband sich mit der Einführung eines zentralstaatlich organisierten und verwalteten Gesamtschulsystems insbesondere in den 1950er und 1960er Jahren die Hoffnung auf ein sozial inklusiveres Bildungssystem, das auch einen größeren gesellschaftlichen Zusammenhalt hervorbringen sollte (vgl. Telhaug, Medias & Aasen, 2006). Das Bildungswesen wurde zunehmend als Teil eines fürsorgenden Wohlfahrtsstaates be-

130

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

trachtet, ein höheres Bildungsniveau für breitere Gesellschaftsschichten galt auch unter sozialpolitischen Gesichtspunkten als erstrebenswert. Mit der Einführung eines Lehrplans für die neue Schulform der gymnasieskola im Jahr 1970 (Lgy70) wurde auch das gegliederte Sekundarschulwesen vereinheitlicht und die bis dato bestehenden Schulformen Gymnasium, Fachschule und Berufsschule (gymnasie, fackskola, yrkesskola) in der gymnasieskola zusammengefasst (Lundgren, 2012b, S. 95). Verbunden mit der Expansion und Vereinheitlichung des Sekundarschulwesens war ebenfalls die Hoffnung den gestiegenen Anforderungen auf dem Arbeitsmarkt durch die Ausbildung qualifizierter Fachkräfte besser entsprechen zu können (vgl. Lundahl, Erixon Arreman, Lundström & Rönnberg, 2010, S. 48). Parallel zur Abschaffung des mehrgliedrigen Schulsystems wurden auch die Abschlussprüfungen der verschiedenen Schulformen abgeschafft, d.h. es existieren auch heute keine wie in Deutschland üblichen Prüfungen am Ende der Sekundarstufe I oder II (vgl. dazu auch Kap. 5.1.2). Auf die politisch und wirtschaftlich stabilen Nachkriegsjahre46 folgten allerdings die wirtschaftlichen Krisen der späten 1970er Jahre, der Expansionsoptimismus wich einer immer stärker werdenden Kritik am umfassenden, aber auch teuren Wohlfahrtsstaatsmodell Schwedens. Ab den 1980er Jahren wurde als Folge dieser Kritik auch eine tiefgreifende Transformation der Steuerung des Bildungsbereichs eingeleitet, die sich insbesondere ab den 1990er Jahren in den zentralen Prozessen der Dezentralisierung, Deregulierung und Vermarktlichung äußerte (vgl. u.a. Lundahl, 2002; Arnesen & Lundahl, 2006; Telhaug et al., 2006; zu den Transformationsprozessen auch Lindensjö & Lundgren, 2000). Die vormals zentrale Steuerung durch staatliche Verwaltungseinheiten wurde 46

Von 1936 bis 1976 stellte die Sozialdemokratische Partei Schwedens (socialdemokraterna) ohne Unterbrechung den Ministerpräsidenten und konnte sich auf eine breite gesellschaftliche Unterstützung für ihre politischen Vorhaben stützen. Seit Mitte der 1970er Jahre wechseln sich bürgerlich-konservative bzw. bürgerlich-liberale sowie sozialdemokratische Regierungen ab und es sind weitere Parteien in den schwedischen Reichstag eingezogen.

Schulische Leistungsbeurteilung in Schweden

131

nun als ineffizient, technokratisch und undemokratisch kritisiert, woraufhin zwischen 1975 und 1990 verschiedene Reformmaßnahmen ergriffen wurden, die den Einfluss des Staates einschränken sollten und u.a. eine schrittweise Verlagerung der Verantwortung auf die Ebene der Gemeinden und Kommunen einleiteten (vgl. u.a. Regeringens Proposition 1988/89:4, 1989/90:41). Ziel war es demokratische Entscheidungsprozesse auf die lokale Ebene zu transferieren und den Professionellen vor Ort mehr Freiheiten einzuräumen. Gleichzeitig ebneten die im Namen der Demokratisierung eingeführten Dezentralisierungsreformen und die Erhöhung der Schulautonomie – obwohl zunächst unbeabsichtigt – auch den Weg zu einer stärker auf Marktmechanismen beruhenden Bildungspolitik, die ab 1991 von der konservativen Regierung weiter vorangetrieben wurde. Diese führte beispielsweise das Recht auf freie Schulwahl ein, stellte die Finanzierung des Schulwesens auf ein gutscheinbasiertes Wettbewerbsmodell um und förderte den Ausbau des Privatschulsektors (vgl. Regeringens Proposition 1991/92:95, 1992/93:230) – wegweisende Beschlüsse, die auf die Etablierung von Marktmechanismen und eine weitere Einschränkung des staatlichen Einflusses im Bildungsbereich abzielten. Mit der Verabschiedung neuer Lehrpläne im Jahr 1980 (Lgr80) wurde zugleich die Idee der Zielsteuerung etabliert, d.h. die Lehrpläne enthielten nun weniger konkrete Detailvorgaben als vielmehr grobe Lernziele, die die Schüler_innen am Ende des Schulbesuchs erreicht haben sollten. Verbunden damit war auch die Hoffnung, den Lehrkräften mehr Freiraum bei der Unterrichtsgestaltung und Auswahl des Unterrichtsstoffes zu gewähren, um wiederum den Unterricht besser an die lokalen Besonderheiten und die Bedarfe der heterogenen Schüler_innenschaft anpassen zu können (vgl. Lundgren, 2012a, S. 110–111). Mit der erneuten Überarbeitung der landesweiten Lehrpläne 1994 und der Einführung eines neuen kriterienorientierten Beurteilungssystems, das das bisherige normorientierte System ablöste, wurde endgültig das Zeitalter der standards-based reform im schwedischen Bildungssystem eingeläutet (vgl. ausführlicher zu den verschiedenen Beurteilungssystemen Kap. 5.1.2).

132

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

In den Folgejahren wurden die Beschlüsse zur freien Schulwahl und zur Finanzierung von Schulen zwar von den sozialdemokratischen und konservativen Nachfolgeregierungen modifiziert, an den Grundideen eines wettbewerbsgesteuerten und gutscheinfinanzierten Bildungssystems wurde jedoch ebenso festgehalten wie an der Idee einer gleichwertigen Schulbildung (likvärdig utbildning) (vgl. zu einigen der damit einhergehenden Dilemmata Alexandersson, 2011). Die Idee von Gleichwertigkeit (likvärdighet) bezieht sich dabei traditionellerweise sowohl auf einzelne Schulen, aber auch auf die Unterrichtsfächer und -inhalte sowie die pädagogische Praxis, wie z.B. die schulische Leistungsbeurteilung (vgl. Carlgren, 2009, S. 638). Um diesen Spagat zwischen Marktorientierung, Wettbewerb und Effizienz einerseits und einer an Gleichwertigkeit orientierten pädagogischen Praxis andererseits zu bewältigen, wird seither auf vier Elemente gesetzt: ein bereits in den 1950er Jahren eingeführtes System standardisierter Leistungstests (nationella prov), das eine gleichwertige Schulleistungsbeurteilung im ganzen Land sicherstellen soll; die Orientierung an zentralen Lernzielen und Beurteilungsvorgaben bei gleichzeitiger lokaler Freiheit der pädagogischen Arbeit; die Reform der Lehramtsausbildung und Professionalisierung aller im Bildungsbereich Tätigen; sowie ein kontinuierlich ausgebautes Schulmonitoring (u.a. durch eine neu eingerichtete Behörde für Schulinspektionen). Hieran wird auch der Paradigmenwechsel hinsichtlich des dominanten Steuerungsregimes im Bildungsbereich deutlich: Das schwedische Bildungssystem hat sich seit der zweiten Hälfte des 20. Jahrhunderts von einem der am stärksten zentralisierten und auf Inputsteuerung fokussierten Systeme hin zu einem stark dezentralisierten, outputorientierten Bildungssystem verändert (vgl. zu Veränderungen im Steuerungsregime von Bildungssystemen generell Altrichter & Maag Merki, 2010; für den schwedischen Fall u.a. Kotthoff, 2003; Lundahl, 2002; Lindblad, Lundahl, Lindgren & Zackari, 2002). Durch die Einführung von Bildungsgutscheinen und die Diversifizierung der Schulträger im Zuge des Privatschulausbaus hat sich das schwedische Schulwesen – insbesondere auf dem Sekundarschulniveau – in den vergangenen 15 Jahren sehr stark ausdifferenziert, auch wenn die Grundstruktur des Gesamtschulsystems

Schulische Leistungsbeurteilung in Schweden

133

(grundskola plus gymnasieskola) erhalten blieb (vgl. hierzu ausführlicher Carlgren, 2009; Lundahl et al., 2014; Vogt et al., 2018). Forsell argumentiert, dass mit der Veränderung des Bildungssystems im Laufe der 1990er Jahre hin zu mehr Wahlfreiheit und Privatisierung auch eine tiefgreifende Bedeutungsverschiebung des Slogans einer „Schule für Alle“ stattfand: von der ursprünglichen Bedeutung einer gemeinsamen Schule für alle Kinder (en skola för alla) hin zu einem Verständnis als der passenden Schule für jeden Einzelnen (en skola för alla) (vgl. Forsell, 2011, S. 90–92). Auch Rabo attestiert dem schwedischen Bildungssystem einen ideologischen Paradigmenwechsel „from an ideology lauding ‚sameness‘ and ‚similarity‘ [...] to an ideology of ‚choice and ‚empowerment‘ and a lauding of ‚diversity‘ and ‚competition‘“ (Rabo, 2007, S. 43). Der Besuch der allgemeinbildenden grundskola ist heute für alle Kinder zwischen 7 und 16 Jahren verpflichtend und umfasst die Vorschulklasse (förskoleklass oder F-klass)47 sowie die Klassenstufen 1 bis 9, wobei häufig die Klassenstufen 1-3, 4/5, 6/7 sowie 8/9 als organisatorische Einheiten verstanden werden. In der Regel befindet sich die Vorschule (die in etwa dem deutschen Kindergarten entspricht) auf demselben Gelände, die Vorschulklasse meist auch im selben Gebäude wie die höheren Klassen der Grundschule. Teilweise werden aus organisatorischen Gründen getrennte Schulgebäude für die unteren Klassen F bis 6 (Primarstufe) und die oberen Klassen 7 bis 9 (Sekundarstufe I) eingerichtet, institutionell umfasst die grundskola aber die Bildungsbereiche der Elementarstufe (Vorschulklasse), der Primarstufe (Klasse 1 - 6) und der Sekundarstufe I (Klasse 7 - 9).

47

Die Vorschulklasse wurde 1998 als freiwilliges Angebot eingerichtet. Alle Kinder, die im jeweiligen Schuljahr das sechste Lebensjahr vollenden, haben ein Anrecht auf einen Platz in einer Vorschulklasse. Ebenso existiert ein eigener Lehrplan mit Bildungszielen für die Vorschulklasse (als Teil des Grundschullehrplans Lgr11). Die Teilnahme an der Vorschulklasse ist nach wie vor freiwillig, allerdings besuchen fast alle berechtigten Kinder die Vorschulklasse (zuletzt im Schuljahr 2015/16 rund 97 % aller berechtigten Kinder; vgl. http://www.skolverket.se/statistik-och-utvardering/statistik-i-tabeller/forskoleklass [16.11.2016]).

134

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

In den ersten drei Schuljahren werden die Schüler_innen in allen Fächern von Klassenlehrer_innen unterrichtet, in Klasse 4 und 5 werden die Fächer Sprachen, Mathematik, Werken und Kunst von spezialisierten Fachlehrer_innen unterrichtet und ab Klasse 6 sind alle Lehrkräfte Fachlehrer_innen mit zwei oder drei Fächern. Neben den (Fach-)Lehrkräften gehören an schwedischen Schulen auch Sonderpädagog_innen, Erzieher_innen, Studien- und Berufsberater_innen, Schulkrankenpfleger_innen sowie Schulpsycholog_innen zum (pädagogischen) Personal. Die verschiedenen Berufsgruppen verdeutlichen dabei auch das Verständnis der Institution Schule als sozialpolitisch relevanter Einrichtung, die neben dem Bildungs- auch einen kompensatorischen Auftrag hat (Skolverket, 2014a, S. 10). Viele der seit den 1970er Jahren sich entwickelnden Elemente schulischer Arbeit – wie die räumliche Integration von formalem Unterrichtslernen und informellem Freizeitlernen, die Zusammenarbeit in interdisziplinären Teams, aber auch die Etablierung individualisierter Unterrichtsformen im Laufe der 1970er und 1980er Jahre – werden in direkten Zusammenhang mit dem integrativen Selbstanspruch der „Schule für Alle“ gebracht (vgl. Carlgren, 2009, S. 638–640) und prägen bis heute die pädagogische Praxis. Einzelschulen verfügen im schwedischen Bildungssystem über einen großen organisatorischen und pädagogischdidaktischen Gestaltungsspielraum und können selbstständig über die Verwendung ihres Budgets für Differenzierungs- und Fördermaßnahmen, wie z.B. die Klassenzusammensetzung und -größe, die Gruppenorganisation in Jahrgangsklassen, altersgemischten Klassen oder nach Interessengruppen, die Unterrichtsform und Gestaltung des Stundenplans (fachbezogen, fächerübergreifend oder in Projektform), die Einbeziehung zusätzlichen pädagogischen Personals u.v.m., entscheiden. Gleichzeitig wurde der Bedarf an individualisierten Angeboten für die heterogenen Lerngruppen immer größer, so dass ab den 1980er Jahren verstärkt auf pädagogische Ideen des selbstständigen Lernens der Schüler_innen gesetzt wurde, die auch zu einem gewandelten Verständnis der Lehrer_innen- und Schüler_innenrolle führten (vgl. Eriksson, 2009). Schüler_innen wurden zunehmend als selbstverantwortlich für ihren

Schulische Leistungsbeurteilung in Schweden

135

Lernprozess konzipiert, der unterstützt durch Selbst- und Peerbeurteilungsinstrumente individuell gestaltet werden sollte, die Rolle der Lehrkräfte sollte perspektivisch vor allem die einer unterstützenden Lernbegleitung und -beratung annehmen (Eriksson, 2009, S. 54). An der weiterführenden gymnasieskola (10. bis 12. Klasse) können die Schüler_innen seit 2011 aus 18 sogenannten Studienprogrammen wählen, sechs davon sind studienvorbereitende48 und 12 berufsvorbereitende Programme.49 Die berufsvorbereitenden Programme stellen eine schulische Berufsausbildung mit integrierten Praxisphasen in Betrieben (arbetsplatsförlagd lärande)50 dar, während die studienvorbereitenden Programme in der Regel auf den Besuch einer Hochschule bzw. Universität vorbereiten. Unter bestimmten Voraussetzungen ist allerdings auch noch nach dem Besuch eines berufsvorbereitenden Programms der Hochschulbesuch möglich (vgl. hierzu auch Kap. 5.1.2). Neben den 18 landesweiten Programmen gibt es eine Vielzahl zusätzlicher lokaler Ausbildungszweige und -kurse51, die von einzelnen Schulen beantragt und von der staatlichen Schulinspektionsbehörde (Skolinspektionen) genehmigt werden müssen.52 Die schwedische gymnasieskola umfasst damit 48

Die studienvorbereitenden Programme lauten: Wirtschaftsprogramm; Ästhetisches Programm; Geisteswissenschaftliches Programm; Gesellschaftswissenschaftliches Programm; Naturwissenschaftliches Programm; Technikprogramm. 49 Die berufsvorbereitenden Programme sind folgende: Kindheits- und Freizeitprogramm; Bau- und Anlagenprogramm; Fahrzeug- und Transportprogramm; Handels- und Verwaltungsprogramm; Handwerksprogramm; Hotel- und Tourismusprogramm; Industrietechnisches Programm; Landwirtschafts- und Naturprogramm; Restaurant- und Lebensmittelprogramm; Installationstechnik- und Immobilienprogramm; Krankenpflegeund Pflegeprogramm. 50 Daneben gibt es seit 2010 auch eine sogenannte Lehrlingsausbildung (lärlingsutbildning), bei der die Hälfte der Ausbildungszeit in Betrieben begleitet von Mentor_innen stattfindet, die andere Hälfte der Zeit regulär in der gymnasieskola gelernt wird. 51 An der gymnasieskola wird nicht mehr in Fächern, sondern differenzierten Kursen unterrichtet. Die Schüler_innen belegen, je nach Studienprogramm, unterschiedliche Grund- bzw. weiterführende Kurse ähnlich dem System der Grund- und Erweiterungskurse an deutschen Haupt-, Real- und Gesamtschulen. 52 Im Zuge der Etablierung eines Bildungsmarktes im schwedischen Bildungssystem versuchten einige weiterführende Schulen so auch eine Profilbildung, die stärker an den

136

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

(trotz des ähnlichen Namens) deutlich mehr als das deutsche Gymnasium – nämlich auch die berufliche (Grund-)Bildung – weshalb sie auf funktionaler Ebene nicht miteinander gleichgesetzt oder verwechselt werden sollten.53 Für die Aufnahme in eines der 18 regulären Studienprogramme der gymnasieskola, müssen die Schüler_innen gewisse Mindestanforderungen auf dem Abgangszeugnis der grundskola nachweisen (vgl. ausführlicher zu den Übergangsbedingungen Kap. 5.1.2). Für Schüler_innen, die diese Voraussetzungen für den Besuch eines regulären Programms noch nicht erfüllen, gibt es zusätzlich fünf sogenannte Vorbereitungsprogramme (introduktionsprogram), in denen die notwendigen Kenntnisse erworben und das Abgangszeugnis der grundskola für einzelne Fächer komplettiert werden kann. Ziel dieser individuell gestalteten Vorbereitungsprogramme ist es entweder, dass die Schüler_innen zeitnah in ein reguläres Programm übergehen können oder aber auf den direkten Eintritt in den Arbeitsmarkt vorbereitet werden. Für Schüler_innen, die erst seit kurzem in Schweden leben und zunächst noch ihre Sprachkenntnisse ausbauen müssen, gibt es ebenfalls ein gesondertes Vorbereitungsprogramm.54 Insgesamt zeichnet sich das schwedische Schulsystem im Vergleich zum deutschen Bildungssystem durch ein verhältnismäßig geringes Maß an Selektionshürden aus: Innerhalb der grundskola gehen die Schüler_innen automatisch in die nächsthöhere Klasse über, das ‚Sitzenbleiben‘ bzw. die Klassenwiederholung wurde bereits mit der Einführung der Gesamtschule in den 1960er Jahren abgeschafft. Schüler_innen, die die Hobbies und Freizeitinteressen von Jugendlichen orientiert waren und boten zeitweise auch ein „Stylistenprogramm“ oder „Skateboardprogramm“ neben den regulären Ausbildungsprogrammen an (z.B. am Plusgymnasiet in Norrköping, www.plusgymnasiet. se/skola/norrkoping; vgl. hierzu auch Vogt et al. (2018). 53 Dass dies gerade im deutschsprachigen Raum dennoch schnell passiert, belegen die Überschriften von Zeitungsberichten wie „Viel Theorie, wenig Praxis. In Schweden gibt es Gymnasien für Friseure und Bauarbeiter“ (vgl. „Viel Theorie, wenig Praxis.“, 23.08.2011). 54 Vgl. für eine Übersicht über die verschiedenen Studienprogramme der gymnasieskola die entsprechende Homepage der Schulbehörde Skolverket: https://www.skolverket.se /skolformer/gymnasieutbildning/gymnasieskola/program-och-utbildningar [16.03.2016].

Schulische Leistungsbeurteilung in Schweden

137

vorgesehenen Minimalstandards einer Klassenstufe nicht erreichen, sollen durch individualisierte Unterstützungsangebote gefördert und bei der Erreichung dieser Minimalziele bis zum Abschluss der 9. Klasse unterstützt werden. In Einzelfällen ist es auch möglich über die 9. Klasse hinaus an der grundskola zu verweilen, um einzelne Kurse abzuschließen und mit einem vollständigen Zeugnis die grundskola verlassen zu können. Durch das gemeinsame Lernen bis zur 9. Klasse erfolgt auch keine Leistungsselektion beim Übergang in die Sekundarstufe I (7. bis 9. Klasse), wie in Deutschland mit den verschiedenen Sekundarschulformen üblich. Besondere Förderangebote für Schüler_innen mit Lernschwierigkeiten und Differenzierungsangebote finden ebenfalls innerhalb des Regelschulsystems statt. Da durchschnittlich 98% der Schüler_innen eines Jahrgangs von der grundskola weiter auf die gymnasieskola wechseln, spielt das Grundschulzeugnis im Hinblick auf den Übergang zur weiterbildenden Schule auch hier eine geringere Rolle als in NordrheinWestfalen. Seit der Reform von 2010/11 entscheiden die Noten des Abgangszeugnisses der grundskola allerdings darüber, in welches Programm der weiterführenden Schule die Schüler_innen aufgenommen werden können (ausführlicher zu den Übergangsregelungen und der Notenskala vgl. ebenfalls Kap. 5.1.2). Auch gibt es keine gesonderten Abschlussprüfungen am Ende der Pflichtschulzeit bzw. der weiterführenden Schule – das frühere realexamen, mit dem die realskola abgeschlossen wurde, ist bereits 1962 abgeschafft worden, 1968 folgte dann die Abschaffung des dem deutschen Abitur äquivalenten studentexamen.55 Seitdem erhalten die Schüler_innen am Ende der 9. bzw. 12. Klasse ein Abgangszeugnis (slutbetyg) mit dem der Schulbesuch bestätigt und die erreichten Noten in den einzelnen Fächern mitgeteilt werden. Für den Hochschulzugang wiederum wird das Abschlusszeugnis der gymnasieskola und/oder aber das Ergebnis des zentralen Hochschuleignungstests (högskoleprov) benötigt (näheres dazu ebenfalls im Kap. 5.1.2). Die Abgangszeugnisse der grundsko55

Allerdings gibt es auch hier immer wieder Überlegungen eine solche Abschlussprüfung am Ende der gymnasieskola wiedereinzuführen (vgl. Olsson, 2011).

138

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

la sowie der gymnasieskola können zusätzlich in den Einrichtungen der kommunalen Erwachsenenbildung komplettiert werden, d.h. einzelne Fächer der grundskola bzw. Kurse der gymnasieskola können hier auch nach Abschluss der Regelschulzeit nachgeholt werden. Ein wichtiges bildungspolitisches Ziel des schwedischen Bildungssystems ist es demnach keine „Sackgassen“ zu produzieren, d.h. immer auch Möglichkeiten der Wiederaufnahme bzw. Fortsetzung von unterbrochenen Bildungswegen zu ermöglichen (vgl. Carlgren, 2009, S. 637). Das aktuelle Schulgesetz verbietet z.B. auch explizit Aufnahme- bzw. Auswahltests sowie Tests zur Fortsetzung eines Bildungsgangs (Skollag, 2010:800, Kap. 10, §9). Wie weiter oben bereits eingeführt, wird die Steuerung und Evaluation des schwedischen Bildungssystems durch zentrale Behörden gewährleistet, gleichzeitig verfügen die Einzelschulen über große lokale Entscheidungsspielräume. Aus der seit 1920 bestehenden zentralen Schulsteuerungsbehörde Skolöverstyrelsen ging 1991 die auch heute noch tätige schwedische Schulbehörde Skolverket hervor. Ihre Aufgaben umfassen die Erarbeitung der zentralen Lehrpläne, Fragen der Anerkennung von Abschlüssen, die Legitimation der Lehrkräfte, die Entwicklung der landesweiten Leistungstests (nationella prov) für die grundskola und gymnasieskola, weiterhin Fragen der Schulentwicklung56 sowie die Evaluation des Gesamtsystems.57 Seit 2008 existiert eine eigenständige Schulinspektionsbehörde (skolinspektionen), die für die Supervision aller Bildungseinrichtungen (inklusive der Vorschulen, innerschulischen Freizeit- und Betreuungseinrichtungen sowie Einrichtungen der Erwachsenenbildung) zuständig ist. Sie entscheidet auch über die Anträge freier Träger zur Einrichtung neuer Schulen und die Vergabe von staatlichen Zuschüssen an kommunale und 56

Von 2003 bis 2008 existierte eine gesonderte Schulentwicklungsbehörde (myndigheten för skolutveckling), ab 2008 wurde dieser Bereich jedoch wieder von Skolverket übernommen. 57 Vgl. die Selbstdarstellung auf der Homepage: https://www.skolverket.se/omskolverket [16.03.2016].

Schulische Leistungsbeurteilung in Schweden

139

freie Schulträger – und kann diese bei Beanstandungen auch wieder entziehen. Skolverket publiziert darüber hinaus, wie ebenfalls weiter oben bereits erwähnt, zahlreiche Handreichungen für Lehrkräfte und andere Beschäftigte im Bildungsbereich, gibt Evaluationsstudien in Auftrag und informiert die Öffentlichkeit zu allen Fragen des Bildungssystems.58 Die von Skolverket herausgegebenen Lehrpläne für die grund- und gymnasieskola dienen dabei als Grundlage für die lokale Schulplanung, d.h. jede Schule muss sich einen eigenen Zeit- und Arbeitsplan unter Berücksichtigung der zentralen Vorgaben und lokalen Bedingungen erarbeiten. Konkret bedeutet dies, dass z.B. die Gesamtzahl der zu unterrichten Unterrichtsstunden in der grundskola pro Unterrichtsfach zentral festgelegt wird – wie diese Stundenzahl jedoch innerhalb der Fächer auf die Jahrgangsklassen aufgeteilt und wann welches Fach eingeführt wird, entscheidet jede Schule selbstständig. Zusätzlich können die Schulen von den 6.890 Unterrichtsstunden, die bis zum Ende der 9. Klasse vorgesehen sind, über bis zu 600 Stunden frei verfügen und zusätzliche Wahlfächer oder Fächerschwerpunkte anbieten.59 Die Lehrmethoden und Unterrichtsmaterialien können (und müssen) dabei ebenfalls individuell von den Lehrkräften einer Schule ausgewählt werden. Die landesweiten Lehrpläne enthalten neben den allgemeinen Bildungszielen und Angaben über die Pflichtfächer auch die Kurspläne für einzelne Fächer und definierte Bildungsziele für die Klassenstufen 3, 6 und 9 der grundskola bzw. die Kurse der weiterführenden Schule im Sinne von Minimalstandards, die möglichst von jedem und jeder Schüler_in erreicht werden sollen. Die Lehrplanziele können entsprechend der Logik der standardsbased reform als zentral vorgegebene Zielvereinbarungen verstanden 58

Dazu gehören beispielsweise auch Informationsbroschüren in zahlreichen Sprachen, die sich gezielt an zugewanderte Eltern und deren Kinder richten; vgl. https://www.skolverket.se/skolformer/grundskoleutbildning/informationsmaterial-tillforaldrar-1.122648 [17.03.2016]. 59 Eine Übersicht über die vorgeschriebenen Unterrichtsstunden pro Fach findet sich unter: https://www.skolverket.se/laroplaner-amnen-och-kurser/grundskoleutbildning/ grundskola/timplan [16.03.2016].

140

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

werden, deren Erreichung von den lokalen Akteuren – den Schulleitungen und vor allem Lehrkräften – sichergestellt werden soll. Die zentralen Tests wiederum dienen auch dazu, das Erreichen dieser Zielvereinbarungen zu überprüfen (vgl. ausführlicher hierzu auch Kap. 5.1.2). Wie bereits erwähnt, soll die Idee einer „Schule für Alle“ auch durch die Sicherstellung einer gleichwertigen Schulbildung (likvärdig utbildning) für alle Schüler_innen, unabhängig davon, wo im Land sie wohnen und in welcher Trägerschaft die von ihnen besuchte Schule sich befindet, ermöglicht werden (vgl. Skollag, 2010:800, §9). Einen zentralen Aspekt dieser gleichwertigen Schulbildung stellt die Frage gleichwertiger schulischer Leistungsbeurteilung (likvärdig bedömning) dar. Im folgenden Kapitel wird zunächst in einem kurzen historischen Rückblick die Entwicklung des aktuellen Beurteilungssystems skizziert, um anschließend auf die Frage von likvärdighet im Zusammenhang mit der schulischen Leistungsbeurteilung zurückzukommen. 5.1.2 Zentrale Elemente schulischer Leistungsbeurteilung in Schweden Die schulische Leistungsbeurteilung erfolgt in Schweden – ebenso wie in Deutschland – in erster Linie durch die unterrichtenden Lehrkräfte und auf Basis der regelmäßigen Beobachtung und Dokumentation der Lernstandsentwicklung der Schüler_innen im Unterrichtsalltag. Daneben existiert aber seit Mitte des 20. Jahrhunderts auch ein System zentraler Leistungstests (heute: nationella prov), das eine landesweit gleichwerti60 ge Beurteilung der Schüler_innenleistungen sicherstellen soll. Schwedische Lehrkräfte greifen bei der alltäglichen Leistungsbeurteilung auf ebenso vielfältige Instrumente zurück, wie ihre deutschen Kolleg_innen (Unterrichtsbeobachtungen, mündliche und schriftliche Leistungsüberprüfungen, etc.) – die Vergabe von Zensuren erfolgt allerdings im Vergleich zum deutschen System relativ spät: Schwedische Schüler_innen 60

Auf die Entstehung und Rolle der nationella prov im heutigen Beurteilungssystem wird in den folgenden Abschnitten näher eingegangen.

Schulische Leistungsbeurteilung in Schweden

141

erhalten in der Primarstufe grundsätzlich keine Zensuren, sondern hauptsächlich mündliches und verschriftlichtes Feedback zu ihrem Lernstand. Erst mit dem Halbjahreszeugnis in Klasse 6 werden Noten im klassischen Sinne vergeben; bis zur Bildungsreform von 2011 bekamen die Schüler_innen sogar erst in den letzten beiden Jahren (Klasse 8 und 9) der allgemeinbildenden Schule Zeugniszensuren. Das Schuljahr unterteilt sich in Schweden ebenfalls wie in NRW in zwei Halbjahre, das sogenannte Herbsthalbjahr (hösttermin) läuft von Ende August bis Ende Dezember, daran schließt sich das Frühlingshalbjahr (vårtermin) von Januar bis Anfang Juni an. Ab dem ersten Halbjahr der 6. Klasse werden jeweils zum Ende des Herbst- bzw. Frühlingshalbjahres die Halbjahreszeugnisse (terminsbetyg) vergeben, mit dem Ende der 9. bzw. 12. Klasse dann das Abschlusszeugnis (slutbetyg). Wie wenig formalisiert die Vergabe von Zeugnissen traditionellerweise war, zeigt sich auch daran, dass erst 2014 eine Ausführungsvorschrift von Skolverket zur Anfertigung von Zeugnissen erlassen und verbindliche Formularvorlagen vorgelegt wurden (vgl. SKOLFS 2014:50). Obwohl auch in Schweden die schulische Leistungsbeurteilung als behördliche Amtsausübung (myndighetsutövning) gilt, kann gegen einmal erlassene Noten und Zeugnisse nicht juristisch vorgegangen werden. Eine Ausnahme bilden offensichtliche Schreibfehler, die von den Schulleitungen korrigiert werden dürfen (vgl. Skollag 2010:800, Kap. 3, §19). In diesem Punkt unterscheiden sich die beiden Beurteilungssysteme in NRW und Schweden sehr deutlich (vgl. Kap. 5.2.2). Um die spezifischen Besonderheiten des schwedischen Beurteilungssystems besser nachvollziehen zu können, werden im Folgenden zunächst kurz zwei wichtige Etappen der Entwicklung des aktuellen Beurteilungssystems nachgezeichnet: zunächst das ab den 1960er bis Anfang der 1990er Jahre geltende normorientierte Beurteilungssystem; anschließend die Entwicklung des 1994 eingeführten kriterienorientierten Beurteilungssystems sowie dessen Veränderungen bis 2011. Im Anschluss daran erfolgt die detaillierte Darstellung des aktuellen Beurteilungssystems. Da diese Entwicklungen immer auch mit umfassenderen Reformen des gesamten Bildungssystems zusammenhingen, lassen sich hieraus

142

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

zentrale Traditionslinien und Gerechtigkeitsnormen ablesen, die in Kapitel 5.3 vergleichend zusammengefasst werden.

Das normorientierte Beurteilungssystem (1960er bis 1990er Jahre) Die Etablierung des sogenannten normorientierten (oder relativen) Beurteilungssystems in Schweden ist eng mit der Entstehung eines Systems externer standardisierter Leistungstests verbunden. Folgt man den Ausführungen Lundahls (2006) kann die Einführung landesweiter standardisierter Tests im Laufe der 1940er Jahre als professionssoziologisch interessante Auseinandersetzung zwischen Lehrkräften einerseits und Psycholog_innen andererseits verstanden werden. Waren die Tests ursprünglich als Unterstützung für die Beurteilungspraxis der Lehrkräfte konzipiert worden, setzte sich zunehmend die psychometrische Sicht der Psycholog_innen durch – dies wird teilweise als Deprofessionalisierung der noch jungen Lehrer_innenprofession gedeutet (vgl. Lundahl, 2006, S. 262; zur historischen Entstehungsgeschichte des Testsystems vgl. auch Lundahl, 2009). Interessant für diese Arbeit ist außerdem, dass Frits Wigforss, einer der Entwickler der ersten standardisierten Tests (centralprov), bereits die Verbindung zwischen standardisierten Tests, einem verbesserten Unterricht und einer gerechten Benotung herstellte (Wigforss, 1931, zitiert nach Lundahl, 2012, S. 281). Die Bezeichnung als ‚normorientiertes‘ Beurteilungssystem bezieht sich auf das dem System zugrundeliegende Prinzip, dass die Verteilung der von Lehrkräften vergebenen Schulnoten einer Normalverteilungskurve mit vorab festgelegten Prozentsätzen für jede Note entsprechen sollte. Die Notengrenzen wurden mithilfe landesweit einheitlicher Tests bestimmt, an denen jeweils eine bestimmte Schüler_innenkohorte teilnahm. Die Tests dienten damit der Kalibrierung des Notenniveaus und wichtiger Orientierungspunkt für Lehrkräfte. Durch die wechselseitige Anpassung der Tests an die Lehrpläne (und vice versa) würden die Lehrer_innenurteile genauer und insgesamt das Beurteilungssystem weniger komplex, so die damals gängige Auffassung (Lundahl & Waldow, 2009, S. 368–369). Waren die Tests ursprünglich hauptsächlich zur Ver-

Schulische Leistungsbeurteilung in Schweden

143

besserung der Beurteilungen der Lehrkräfte gedacht, veränderte sich ihre Verwendung jedoch im Laufe der Jahre mehr und mehr in Richtung eines Selektionsinstruments mit dem Schüler_innen unterschiedlichen Schulformen zugewiesen werden konnten (Lundahl & Waldow, 2009, S. 369). Im Jahr 1962 (im selben Jahr, in dem die neunjährige gemeinsame grundskola eingeführt wurde), wurde die vormals siebenstufige Notenskala abgelöst von einer fünfstufigen Notenskala mit den Ziffern 1 bis 5, wobei 1 die schlechteste und 5 die beste Note darstellte. Orientiert an der Normalverteilungskurve der Ergebnisse der standardisierten Tests sollten auch die Schulnoten festen Prozentanteilen entsprechend vergeben werden, so dass die mittlere Note 3 die am häufigsten vergebene Note mit 38%, die beste Note 5 und schlechteste Note 1 jeweils nur an 7% der Schüler_innen zu vergeben war. Erst mit dem neuen Lehrplan für die grundskola im Jahr 1980 wurde diese feste Prozentaufteilung (zumindest an der grundskola) aufgehoben. Bei aller Standardisierung waren es jedoch die einzelnen Lehrkräfte, die für die Durchführung und Korrektur der zentralen Tests verantwortlich waren (und es bis heute sind). Im Hinblick auf die Frage einer gerechten Beurteilung waren in Schweden immer auch die Lehrkräfte und ihr holistischer Blick auf die Schüler_innen von zentraler Bedeutung bei der schulischen Leistungsbeurteilung (vgl. Skolöverstyrelsen, 1962). Ein Problem in der Anwendung des normorientierten Beurteilungssystems war jedoch, dass die Lehrkräfte nicht, wie in der ursprünglichen Konzeption vorgesehen, ihre Schüler_innen mit den standardisierten Testwerten des entsprechenden landesweiten Jahrgangs verglichen, sondern die jeweilige Schulklasse mit nur 20-30 Schüler_innen als Bezugsgröße anlegten (Skolverket, 2014d). Solange das normorientierte System existierte (1962-1994), bestand dieses Missverständnis weiterhin. In den 1970er und 1980er Jahre wuchs zudem die Kritik am normorientierten System, da dieses die sozialen Unterschiede der Schüler_innen reproduziere und dem Gleichwertigkeitsstreben des schwedischen Bildungssystems entgegenstehe (vgl. Lundahl, 2011, S. 14). Die Normorientierung schien zwar geeignet, um Schüler_innen zu unter-

144

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

scheiden, nicht aber um angemessen abzubilden inwieweit diese Schüler_innen die Lehrplanziele erreicht hatten bzw. welche Fähigkeiten und Kenntnisse sie erworben hatten (vgl. Forsberg & Lundahl, 2012, S. 207). Diese grundsätzliche Kritik an der schulischen Leistungsbeurteilung führte später auch zu einer Verschiebung der Beurteilung in Form von Noten auf höhere Klassen (vgl. nächster Abschnitt).61 Mit den zunehmenden Dezentralisierungsbestrebungen im Bildungsbereich im Laufe der 1980er Jahre galt das normorientierte Beurteilungssystem zunehmend als unpassend und überholt (vgl. Ds 1990:60), sodass im Oktober 1990 die damalige sozialdemokratische Regierung eine Untersuchungskommission zur Reform des Beurteilungssystems einsetzte (vgl. Lundgren, 2012a, S. 117). Als Ergebnis dieser Untersuchung wurden 1994 neue Lehrpläne für die grund- und gymnasieskola eingeführt und das Beurteilungssystem erneut verändert.

Das kriterienorientierte Beurteilungssystem (1994-2011) Mit den umfassenden Reformen von 1994 wurde ein kriterienorientiertes Beurteilungssystem eingeführt, dessen zentrale Orientierungspunkte die in den Lehrplänen festgehaltenen Lernziele und Anforderungen für die verschiedenen Jahrgänge darstellten. Die Orientierung an vorab festgelegten Prozentwerten bei der Vergabe der Noten wurde also durch inhaltliche Benotungskriterien basierend auf den Lehrplanzielen abgelöst. Eine Hoffnung, die sich mit der Abkehr vom alten System verband, war die Verringerung der Auswahl- oder Selektionsfunktion schulischer Leistungsbeurteilung (Dir 1990:62, 1990). Daneben sollte der oben bereits geschilderten Praxis, die Schüler_innen einer Klasse anhand der Normalverteilungskurve zu benoten, Einhalt geboten werden. In einer Untersuchung der schwedischen Bildungsbehörde aus dem Jahr 2000 61

Einen ähnlichen Diskurs gab es zur gleichen Zeit in Norwegen, wo schließlich 1997 mit den neuen Lehrplänen für die zehnjährige grundskola auch die Benotung ab der 8. Klasse eingeführt wurde (vgl. Lundahl, 2011, S. 32).

Schulische Leistungsbeurteilung in Schweden

145

zeigte sich allerdings, dass trotz der Abschaffung des relativen Beurteilungssystems weiterhin die Orientierung an der Schulklasse als soziale Bezugsnorm bei der Beurteilung von Schüler_innenleistungen verbreitet war (Skolverket, 2000). Indem die Benotungen nun an die in den neuen Lehrplänen definierten inhaltlichen Kriterien gekoppelt wurde, waren die standardisierten Tests zumindest theoretisch nicht mehr notwendig zur Gewährleistung eines einheitlichen Notenniveaus – trotzdem wurde an ihnen festgehalten und die Anzahl der Tests und Klassenstufen im Laufe der Jahre sogar noch erhöht (vgl. Lundahl & Waldow, 2009). Die Einführung der neuen Lehrpläne und Umstellung des Beurteilungssystems bedeutete auch einen steuerungspolitischen Paradigmenwechsel, weg vom vormals inputorientierten System hin zu einem outputorientierten Bildungssystem (vgl. Alexandersson & Engstrom, 2006). Verbunden mit den Dezentralisierungsbestrebungen und der Verantwortungsverlagerung auf die lokale Ebene war auch die Hoffnung auf größere Professionalisierungsmöglichkeiten für die Lehrkräfte (Lundahl, 2012, S. 290). Die an Zielvorgaben orientierte neue Steuerungsidee zeigte sich in den 1994 eingeführten neuen Lehrplänen (Lpo 94 und Lpf 94), in denen nun zwischen zwei verschiedenen Arten von Lernzielen unterschieden wurde: den sogenannten anzustrebenden Zielen (mål att sträva) und den zu erreichenden Lernzielen (mål att uppnå) (vgl. SOU 1992:94; SKOLFS 1994:11; SKOLFS 1995:65). Während erstere diejenigen Lernziele darstellten, die idealerweise im Unterricht erreicht werden konnten, legten letztere Minimalziele fest, die alle Schüler_innen mindestens erreichen sollten. Für die zu erreichenden Lernziele wurden zusätzlich zentrale Benotungskriterien aufgelistet, die den Notenstufen der neuen Benotungsskala entsprachen. Diese enthielt nun drei Notenstufen für bestandene Leistungen: G = godkänt (bestanden), VG = väl godkänt (gut bestanden), MVG = mycket väl godkänt (sehr gut bestanden); sowie zusätzlich an der gymnasieskola eine Notenstufe für nicht bestanden (IG = icke godkänt). Um die Schüler_innenleistungen in aggregierter Weise vergleichen zu können, wurden diese Verbalnoten mithilfe eines Punktsystems umgerechnet (Note G = 10 Punkte, VG = 15 Punkte und MVG = 20 Punk-

146

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

te). Aus diesen Leistungspunkten (meritvärde) ließ sich außerdem die Durchschnittsnote des Abschlusszeugnisses berechnen. Das ambitionierteste Ziel dieser Reform war die Erwartung, dass alle Schüler_innen am Ende der 9. Klasse der grundskola mindestens die Note G, also bestanden, in allen Fächern erreichen sollten, um so das allgemeine Bildungsniveau anzuheben. In der Realität konnte diese 100%-Quote nie erreicht werden (vgl. Carlgren, 2009, S. 642), allerdings führte die neue Normsetzung dazu, dass sich die Lehrkräfte stärker um Hilfsangebote für alle Schüler_innen bemühten. Gleichzeitig bestätigte sich die oben bereits angesprochene Veränderung in Richtung eines selbstverantwortlichen Lernens auch hinsichtlich der hauptsächlich genutzten Sozialformen im Unterricht: zwischen 1995 und 2000 verdoppelte sich bspw. der Anteil individuellen Lernens, respektive ging der Anteil des Frontalunterrichts und der Gruppenarbeit entsprechend zurück (vgl. Carlgren, Klette, Myrdal, Schnack & Simola, 2006; Granström, 2003). Verschiedene Studien zu dieser Phase des schwedischen Bildungssystems zeigen, dass die Lehrkräfte Schwierigkeiten bei der Umsetzung der neuen Beurteilungsvorgaben hatten, insbesondere die Umsetzung der relativ offen formulierten allgemeinen Lernziele in die lokale Beurteilungspraxis führte häufig zu Schwierigkeiten (vgl. Selghed, 2004; Tholin, 2006). Diese als „teilnehmende Zielsteuerung“ (deltagande målstyrning) (SOU 1992:94) bezeichnete lokale Umsetzung und Präzisierung der zentralen Vorgaben war Teil der umfassenden Reformen hin zu einem stärker dezentralisierten Bildungssystem, bei dem lediglich die groben Ziele zentral definiert, die konkrete Umsetzung dieser Ziele jedoch auf der einzelschulischen Ebene stattfinden sollte. Auch aus den Reihen der Hochschulen gab es Kritik an der Ungenauigkeit der Zielvorgaben in den Lehrplänen (SOU 2002:120) und den Vorwurf der ungerechtfertigten Noteninflation (vgl. Cliffordson, 2004). Gleichzeitig zeigten Untersuchungen, dass die von den Lehrkräften vergebenen Noten einen deutlich besseren Prädiktor für den Studienerfolg von Schüler_innen ergaben, als es der Studierfähigkeitstest (högskoleprovet) hatte (vgl. Cliffordson, 2008). Skolverket reagierte auf die Kritik am kriterienorientierten Beurteilungssystem erneut mit der verstärkten Veröffentlichung umfangrei-

Schulische Leistungsbeurteilung in Schweden

147

chen Informations- und Unterstützungsmaterials für die Lehrkräfte (vgl. Skolverket, 1994) – eine Strategie, die auch in der folgenden Reformphase ab 2011 weiterverfolgt wurde. Die Beurteilung in Form von Zensuren erfolgte aber weiterhin relativ spät, die Schüler_innen erhielten erst ab Klasse 8 Zensuren – in einem Alter also, in dem ihre nordrhein-westfälischen Altersgenoss_innen mit dem Übergang von der Grundschule zur weiterführenden Schule nach Klasse 4 bereits die erste schulische Auswahlhürde auf der Grundlage von Noten durchlaufen und insgesamt auf sechs Jahre Erfahrungen mit Schulnoten zurückblicken konnten (vgl. Kap. 5.2.2). Rückmeldungen über die Lernentwicklung bekamen selbstverständlich alle schwedischen Schüler_innen auch in den unteren Klassenstufen, allerdings ausschließlich in der Form von mündlichem oder schriftlichem Feedback und nicht in Zensurenform. Zusätzlich wurden in jedem Halbjahr sogenannte Entwicklungsgespräche (utvecklingssamtal) geführt, an denen die Schüler_innen und ihre Eltern sowie die jeweilige Klassenlehrkraft teilnahmen. Auf der Grundlage dieser Gespräche und schriftlicher Beurteilungen (omdöme) durch alle Fachlehrkräfte (und ggf. Sonderpädagog_innen) wurden dann individuelle Entwicklungspläne (individuell utvecklingsplan – IUP) verfasst, in denen jeweils der momentane Lernstand sowie die nächsten Lernziele für das kommende Halbjahr verschriftlicht waren. Obwohl das kriterienorientierte Beurteilungssystem mit der dreistufigen Notenskala (G, VG, MVG) deutlich weniger kritisiert wurde als sein normorientierter Vorgänger, gab es doch Unzufriedenheiten hinsichtlich der Verbindlichkeit und Aussagekraft der Notenstufen. So wurde beispielsweise bemängelt, dass die Notenvergabe zwischen einzelnen Schulen sehr unterschiedlich ausfallen konnte; dass die Benotungskriterien zu undeutlich und auch die Unterscheidung in „anzustrebende“ (mål att sträva) und „zu erreichende Ziele“ (mål att uppnå) unscharf blieb; und, dass die drei Notenstufen zu wenig Differenzierung zwischen unter-

148

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

schiedlichen Schüler_innen ermöglichten62 (vgl. Lundahl, 2011, S. 34; Skolverket, 2012b, S. 7). Die Idee einer differenzierteren Notenskala war deshalb nur eines von verschiedenen bildungspolitischen Themen, das ab Mitte der 2000er Jahre die öffentliche Debatte und auch den Wahlkampf zur Reichstagswahl 2006 dominierte. Insbesondere die sich verschlechternden Ergebnisse in internationalen Vergleichsstudien wie PISA führten nun auch in Schweden zu einer veränderten Selbstwahrnehmung und Diskussion um die Leistungsfähigkeit des schwedischen Bildungssystems (vgl. Ringarp & Rothland, 2008, 2010). Insbesondere die Qualität der Lehrkräftebildung und der professionelle Status der Lehrkräfte wurden in der öffentlichen Diskussion infrage gestellt und die Einführung eines Zertifizierungssystems für Lehrkräfte gefordert (Baylan, Fjelkner & Preisz, 2006). Zugleich entspann sich ein Diskurs um sinkende Disziplin und Ordnung in der Schule als Ursachen für das schlechte Abschneiden der Schüler_innen (vgl. Larsson, Löfdahl & Peréz Prieto, 2010) und von konservativer Seite wurde der Schmähbegriff der flumskola geprägt. Im Deutschen findet sich hierfür der ähnlich aufgeladene Begriff der „Kuschelpädagogik“, aber die Bezeichnung flumskola zielte auch auf die Kritik der bisherigen Bildungspolitik als zu schwammig, unklar und vor allem wenig leistungsorientiert. Nach der Reichstagswahl 2006, aus der die bürgerlichkonservative „Allianz für Schweden“63 als Sieger hervorging, wurde daraufhin u.a. eine Verordnung zur „Verbesserung von Ordnung, Sicherheit und Ruhe in der Schule“ (Regeringens Proposition 2006/07:69) erlassen, verbunden mit der Hoffnung auf eine Leistungssteigerung der schwedischen Schüler_innen (Larsson et al. 2010, S. 178). Detailliertere Lehrpläne mit genauen Lernzielen wurden zudem als Mittel gesehen, die 62

Die informelle Praktik der Vergabe von Tendenznoten, also V+ oder V- usw., deutete ebenfalls auf den Wunsch nach mehr Differenzierungsstufen hin. 63 Die „Allianz für Schweden“ (Allians för Sverige) setzte sich aus vier bürgerlichkonservativen Parteien zusammen: Zentrumspartei, Moderate, Liberale und Christdemokratische Partei. Alliansen regierte 2006-2010 als stärkste Kraft, 2010-2014 dann noch als Minderheitenregierung. Seit 2014 wird Schweden von einer Minderheitenregierung bestehend aus der Sozialdemokratischen Partei und den Grünen regiert.

Schulische Leistungsbeurteilung in Schweden

149

Gleichwertigkeit der Beurteilungen zu erhöhen, die wiederum die Leistungsfähigkeit der Schüler_innen insgesamt steigern sollte (vgl. Lundahl, 2011, S. 34). Weiterhin wurde die Anzahl der standardisierten Tests im Laufe der 2000er Jahre ausgeweitet auf mehr Fächer (Mathematik, Englisch, Schwedisch/Schwedisch als Zweitsprache) und mehr Klassenstufen (Klassen 3, 5 und 9 der grundskola; verschiedene Kurs der gymnasieskola). Dies wurde jedoch auch als erhöhte Kontrolle und Deprofessionalisierung von Lehrkräften kritisiert (vgl. Lundgren, 2012a, S. 130).

Zentrale Elemente des aktuellen, kriterienorientierten Beurteilungssystems seit 2011 Die Kritik am schwedischen Bildungswesen und die bildungspolitischen Auseinandersetzungen zwischen den verschiedenen politischen Lagern während der 2000er Jahre kulminierten in der Verabschiedung eines neuen Schulgesetzes im Jahr 201064 und der Einführung neuer landesweiter Lehrpläne für die allgemeinbildenden und weiterführenden Schulen im Jahr 2011. Ebenfalls beschlossen wurde die frühere Benotung ab Klasse 6 (statt wie bisher ab der achten Klasse) mit dem Schuljahr 2012/13, die Erweiterung der Notenskala um zwei Notenstufen auf eine sechsstufige Skala, sowie die Verschiebung der nationalen Tests von Klasse 5 in Klasse 6, welche im Frühjahr 2013 erstmalig durchgeführt wurden. Das halbjährliche Entwicklungsgespräch (utvecklingssamtal) blieb weiterhin verpflichtend für alle Schüler_innen bis einschließlich der 9. Klasse, allerdings wird der umfangreiche schriftliche individuelle Entwicklungsplan (individuell utvecklingsplan – IUP) seit Herbst 2013 nur noch einmal im Schuljahr für die Schüler_innen bis einschließlich Klasse 5 erstellt. Die Abschaffung des IUP für die Schüler_innen ab Klasse 6 wurde mit dem Hinweis darauf begründet, dass die ausführlichen schriftlichen Beurteilungen immer stärker als bürokratische Belastung 64

Das neue Schulgesetz trat zum 01. August 2010 in Kraft, die Änderungen wurden ab dem 01. Juli 2011 verbindlich umgesetzt.

150

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

von den Lehrkräften empfunden wurden, die zu Lasten anderer Aufgaben ginge (Utbildningsutskottets betänkande 2013/14:UbU5).65 Das Reformpaket von 2010/11 betraf neben dem Benotungssystem, den zentralen Leistungstests und den Lehrplänen aber auch die Lehramtsausbildung sowie die bereits beschäftigten Lehrkräfte, hierauf wird in Kapitel 5.1.3 gesondert eingegangen. Ziel des gesamten Reformpaketes war einerseits eine Qualitätsverbesserung aller Schulen im Land und die Erhöhung der Wettbewerbsfähigkeit Schwedens als Wissensgesellschaft mit Blick auf die sinkenden Ergebnisse in internationalen Schulleistungsstudien wie PISA (Larsson et al., 2010). Aus Sicht der Schulbehörde sollten die Reformen zu einer „gerechten und gleichwertigen Beurteilung“ führen (Skolverket, 2011b, S. 3), sowie insgesamt zu einer Verbesserung der Gleichwertigkeit der Lern- und Unterrichtsbedingungen sowie der Beurteilung von Schüler_innenleistungen beitragen (vgl. Skolverket, 2015a, S. 9). Unter Gleichwertigkeit (likvärdighet) im Bildungswesen wird, wie schon erwähnt, verstanden, dass Schüler_innen einerseits unabhängig davon, wo im Land sie zur Schule gehen, die gleichen Bildungsangebote vorfinden sollten und andererseits, dass die von den Schüler_innen erbrachten schulischen Leistungen unabhängig von der besuchten Schule und der beurteilenden Lehrkraft landesweit einheitlich beurteilt werden sollen.66 Für die Sicherstellung einer gleichwertigen Beurteilung von Schüler_innenleistungen wird einerseits auf die standardisierten Tests (nationella prov) gesetzt, auf die weiter unten noch gesondert eingegangen wird. Eine weitere Strategie stellt die Etablierung einer gemeinsamen Beurteilungspraxis von Lehrkräften einer Schule bzw. eines Faches dar, das sogenannte sambedömning. Skolverket publizierte dazu eine speziel65

Die Lehrkräftegewerkschaft Lärarförbundet begrüßte die Reduzierung des administrativen Aufwands durch die Entwicklungspläne ebenfalls (vgl. Lärarförbundet, 2013). 66 §9 des Schulgesetzes lautet sinngemäß: „Die Ausbildung im Schulwesen soll innerhalb jeder Schulform und innerhalb der Kindertagesstätten und Schulhorte gleichwertig sein, unabhängig davon, wo im Land sie durchgeführt wird“ (Skollag, 2010:800, §9; Übers. K.F.).

Schulische Leistungsbeurteilung in Schweden

151

le Handreichung (Skolverket, 2013a) und auch in der erziehungswissenschaftlichen Forschung wird die gemeinsame Beurteilung von Lehrkräften als Strategie für mehr likvärdighet diskutiert (Jönsson & Thornberg, 2014).

Neue Notenskala und Wissensanforderungen Mit der Schulreform von 2011 wurde aus der vierstufigen eine sechsstufige Notenskala mit den Buchstabennoten A bis F.67 Die Note A stellt dabei die beste Note dar, während F für ‚fail‘, also ‚nicht bestanden‘ (okänd) steht. Allerdings signalisiert die Note F zunächst einmal nur das Nicht-Erreichen des Mindeststandards für die Note E – weitere negative Konsequenzen, wie das in Deutschland übliche Sitzenbleiben ab einer bestimmten Anzahl mangelhafter Leistungen, sind mit der Note nicht verbunden. Im Gegenteil, führt ein F häufig zur Einleitung von speziellen Fördermaßnahmen angepasst an die Bedürfnisse des jeweiligen Kindes. Für die Zulassung zu den Studienprogrammen der gymnasieskola oder einem Hochschulstudium werden die Notenstufen weiterhin in sogenannte ‚Leistungspunkte‘ (meritpoäng) umgerechnet. Analog zur Erweiterung der Notenskala im Zuge der Reform 2011 wurden auch die Ziffernäquivalente für die Berechnung der Leistungspunkte angepasst. Abbildung 5 (nächste Seite) verdeutlicht die Veränderungen zwischen den verschiedenen Notenskalen noch einmal.

67

Die Buchstabennoten wurden eingeführt in Anlehnung an die ECTS-Noten (European Credit Transfer System), die im Rahmen des europäischen Erasmus-Programms erprobt und im Zuge der Bologna-Reform eingeführt wurden (vgl. Lundahl, 2011, S. 30).

152

5 Institutionelle Rahmung schulischer Leistungsbeurteilung Notenskalen und Umrechnung in Leistungspunkte (meritpoäng)

1994 - 2010 20

seit 2011 A

MVG

B

20

17,5

VG 15

C

15

D

12,5

E

10

G 10

Bestehensgrenze IG 0

F

0

_

Pflichtschule

Weiterführende Schule

Abb. 5 – Gegenüberstellung der schwedischen Notenskalen 1994-2010 und seit 2011 sowie Umrechnung der Noten in Leistungspunkte (meritpoäng); eigene Darstellung

Im 2010 verabschiedeten Schulgesetz (Skollag, 2010:800) werden nur die allgemeinen Rahmenbedingungen, die die schulische Leistungsbeurteilung betreffen (Kap. 3, §13-21) sowie einige schulformspezifische Vorgaben für die Benotung und Zeugnisse an der grundskola (Kap. 10, §15-23) bzw. gymnasieskola (Kap. 15, §21-29) geregelt. Die neuen Lehrpläne für die grundskola (Lgr11) respektive gymnasieskola (Lgy11) enthalten dagegen sehr viel ausführlichere Angaben zu den Unterrichtsinhalten und Lernzielen als ihre jeweiligen Vorgänger. Für die Umsetzung der zentralen Vorgaben auf der lokalen Ebene sind jedoch nach wie vor die Schulen bzw. einzelnen Kollegien und Lehrkräfte zuständig.

Schulische Leistungsbeurteilung in Schweden

153

Alle Fachlehrpläne (kursplaner) sind nach dem gleichen Prinzip aufgebaut: zunächst wird in der einleitenden Rubrik der Sinn und Zweck eines jeden Faches (ämnets syfte) kurz erläutert sowie die langfristigen Bildungsziele und übergreifenden Fähigkeiten und Fertigkeiten beschrieben, die im Rahmen des Faches ausgebildet und gefördert werden sollen. Im anschließenden Teil „zentraler Inhalt“ (centralt innehåll) wird konkretisiert, welche Inhalte im Unterricht behandelt werden sollen. Dazu werden verschiedene Wissensbereiche (kunskapsområden) definiert, die im Rahmen des Faches behandelt werden. Es werden keine näheren Angaben gemacht, wie die Gewichtung der Wissensbereiche untereinander und Verteilung innerhalb eines Schuljahres aussehen soll, dies ist den einzelnen Schulen und Lehrkräften überlassen. Im letzten Schritt werden aus den langfristigen und übergreifenden Lernzielen sowie Wissensbereichen konkrete Wissensanforderungen (kunskapskrav)68 definiert, die im jeweiligen Fach am Ende der Klasse 3, 6 oder 9 der grundskola bzw. am Ende jedes Kurses an der weiterführenden Schule von den Schüler_innen erreicht werden sollen. Anders gesagt: es gibt nicht für alle Klassenstufen der Primarstufe und Sekundarstufe I Lernziele und Wissensanforderungen, sondern nur für die 3., 6. und 9. Klassenstufe, d.h. die Lehrkräfte müssen beispielsweise die Lernleistungen ihrer Schüler_innen in der 7. und 8. Klasse immer im Verhältnis zur nächsthöheren Stufe einschätzen und benoten (vgl. Lgr11; Lgy11). Die langfristigen Lernziele sollen dabei helfen, den unterschiedlichen Lerntempi von Schüler_innen gerecht zu werden, so dass individuelle Lernwege möglich sind und gleichzeitig das zu erreichende Mindestniveau sichergestellt ist. In Kapitel 6 wird auf einige der Schwierigkeiten eingegangen, die sich in

68

Der schwedische Begriff kunskap kann ähnlich dem deutschen Wort „Wissen“ mit einer Vielzahl von Konnotationen versehen sein. Die kunskapskrav werden in dieser Arbeit als „Wissensanforderungen“ übersetzt, die im Sinne von Mindeststandards diejenigen Kenntnisse und Fähigkeiten beschreiben, die Schüler_innen am Ende des jeweiligen Lernabschnittes mindestens erworben haben sollen. Schüler_innen, die die Anforderungen auf dem untersten Niveau (Note E) nicht erfüllen, erhalten die Note F (‚nicht bestanden‘).

154

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

der praktischen Umsetzung dieser – aus lerntheoretischer Perspektive – einleuchtenden Idee für die Lehrkräfte ergeben. Dass im Gegensatz zu den vorhergehenden Lehrplänen in Lgr11 und Lgy11 nicht mehr von Notenkriterien (betygskriterier), sondern von Wissensanforderungen (kunskapskrav) gesprochen wird, verdeutlicht darüber hinaus auch die Hinwendung zu einer stärkeren Kompetenz- und Lernzielorientierung. Die Wissensanforderungen werden für die Klasse 3 in den Fächern Mathematik, Schwedisch/Schwedisch als Zweitsprache und die naturwissenschaftlich bzw. gesellschaftswissenschaftlich orientierten Fächer definiert. In Klasse 6 gibt es dann für alle Fächer außer der ersten Fremdsprache Wissensanforderungen. Für Klasse 9 und die Jahrgänge an der weiterführenden Schule werden die Wissensanforderungen für sämtliche Fächer und Kurse für die drei Notenstufen E, C und A definiert. Interessant ist, dass die Wissensanforderungen für Kinder am Ende der Klassenstufe 3 als „akzeptables Wissen“ (godtagbara kunskaper) bezeichnet werden, also im Sinne von durchschnittlichen oder mittleren Leistungen verstanden werden können. Für die höheren Klassenstufen werden die Wissensanforderungen dann als Mindeststandards formuliert, die möglichst von allen Schüler_innen erreicht werden sollen. Ab der Klassenstufe 6 werden diese Wissensanforderungen zusätzlich noch getrennt für die drei Notenstufen E, C und A definiert und ausformuliert. Die unterschiedlichen Notenstufen sollen dabei widerspiegeln auf welchem qualitativen Niveau Schüler_innen die betreffende Wissensanforderung erfüllen. Für die Unterscheidung dieser Qualitätsniveaus wird mit sogenannten Bewertungsbegriffen (värdeord) gearbeitet, die eine Steigerung der jeweiligen Fertigkeit zwischen den Notenstufen umschreiben. Am Ende jedes Lehrplans werden diese Wissensanforderungen noch einmal in einer tabellarischen Ansicht zusammengefasst. Als Beispiel soll hier ein Auszug aus dem Lehrplan für das Fach Schwedisch im Bereich „Lesen und Schreiben“ am Ende der 9. Klasse zur Illustration der Wissensanforderungen und Bewertungsbegriffe dienen (vgl. Abb. 6):

Schulische Leistungsbeurteilung in Schweden Notenstufe Wissensanforderungen im Fach Schwedisch Bereich „Lesen und Schreiben“ in deutscher Übersetzung

Originaltext (Lgr11, S. 237)

155

E

D

C

B

A

Sch. können verschiedene Texte mit einer gewissen sprachlichen Variation, einfacher Textbindung und im Allgemeinen gelingender Anpassung an Textsorten, sprachliche Normen und Strukturen schreiben. Eleven kan skriva olika slags texter med viss språklig variation, enkelt textbinding samt i huvudsak fungerande anpassning till texttyp, språkliga normer och strukturer.

Note D bedeutet, dass die Wissensanforderungen für Note E erfüllt und für Note C zum überwiegenden Teil erfüllt sind.

Sch. können verschiedene Texte mit relativ guter sprachlicher Variation, entwickelter Textbindung und relativ gut gelingender Anpassung an Textsorten, sprachliche Normen und Strukturen schreiben.

Note B bedeutet, dass die Wissensanforderungen für Note C erfüllt und für Note A zum überwiegenden Teil erfüllt sind.

Sch. können verschiedene Texte mit guter sprachlicher Variation, sehr gut entwickelter Textbindung und gut gelingender Anpassung an Textsorten, sprachliche Normen und Strukturen schreiben.

Betyget D innebär att kunskapskr aven för betyget E och till övervägand e del för C är uppfyllda.

Eleven kan skriva olika slags texter med relativt god språklig variation, utvecklad textbindning samt relativt väl fungerande anpassning till texttypen, språkliga normer och strukturer.

Betyget B innebär att kunskapskr aven för betyget C och till övervägand e del för A är uppfyllda.

Eleven kan skriva olika slags texter med god språklig variation, väl utvecklad textbindning samt relativt väl fungerande anpassning till texttyper, språkliga normer och strukturer.

Abb. 6 – Auszug aus den Wissensanforderungen Klasse 9 im Fach Schwedisch, Bereich „Lesen und Schreiben“ (Quelle: Lgr11, S. 237; Übersetzung K.F., Hervorh. i. Orig.)

Die neue Notenskala und die dazugehörigen Wissensanforderungen können als eine Art Stufensystem verstanden werden, bei dem die für die Noten E, C und A definierten Wissensanforderungen in jedem Fach aufeinander aufbauen. Um die Note C zu erhalten, müssen Schüler_innen alle Anforderungen für die Note E und C vollständig erfüllen.

156

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

Um die Note A zu bekommen, müssen respektive alle Anforderungen für Note C und diejenigen für Note A erfüllt sein. Dies verweist auf ein verändertes Verständnis der im Lehrplan definierten Wissensanforderungen: waren diese im vorhergehenden Lehrplan (Lpo94) noch als typische bzw. zu erwartende Lehrplanziele gedacht, können die in Lgr11 und Lgy11 definierten Wissensanforderungen als Minimalstandards bezeichnet werden. Anders gesagt, wenn die Notenstufen ein Intervall darstellen würden, wären die neuen Lehrplanziele als untere Grenzen der jeweiligen Noten zu verstehen, während sie im alten System eher die mittlere Leistung von Schüler_innen auf diesem Notenniveau beschrieben (Skolverket, 2015a, S. 210). In den Begleitmaterialien zum neuen Lehrplan betont Skolverket immer wieder, dass die Wissensanforderungen auf den jeweiligen Notenstufen als ganzheitliche Beschreibungen der Kompetenzen von Schüler_innen verstanden werden müssen und eine Note nur dann erteilt werden kann, wenn alle beschriebenen Wissensanforderungen einer Notenstufe erfüllt wurden (Skolverket, 2011b, S. 12). Wie in Kapitel 6 gezeigt wird, stellt diese Vorgabe die Lehrkräfte in der Beurteilungspraxis zum Teil vor erhebliche Schwierigkeiten. Für die neu eingeführten ‚Zwischennoten‘ B und D hingegen wurden keine gesonderten Wissensanforderungen ausformuliert, diese sollen in Bezug auf die nächsthöhere bzw. –niedrigere Note bestimmt werden. Konkret bedeutet dies, dass Schüler_innen nur dann die Note D erhalten, wenn sie die Anforderungen für Note E vollständig und diejenigen für Note C „zum überwiegenden Teil“ (till övervägande del) erfüllen. Respektive müssen für die Note B die Anforderungen für Note C vollständig und für Note A zum überwiegenden Teil erfüllt sein. Diese Vorgabe ist als sogenannte tröskelregel („Schwellenregelung“) in den Sprachgebrauch eingegangen und führte in der Praxis zu erheblichen Verständnis- und Interpretationsschwierigkeiten. Skolverket veröffentlichte als Reaktion auf die Kritik seit 2011 zahlreiche Handreichungen für Lehrkräfte, um die Handhabung der neuen Notenstufen und damit zusammenhängenden Wissensanforderungen zu erläutern (vgl. u.a. Skolverket, 2011b, 2012a, 2012b).

Schulische Leistungsbeurteilung in Schweden

157

Diese Handreichungen enthalten u.a. tabellarische Beurteilungsraster (wie in Abb. 6 dargestellt) sowie Beispiellösungen oder –texte von Schüler_innen, um die verschiedenen Beurteilungsniveaus zu illustrieren. Diese Beispiele werden auch als Hilfsmittel verwendet, um zu Beginn einer Unterrichtseinheit die Lehrplanziele und deren mögliche Umsetzung sowie anschließende Beurteilung nachvollziehbarer für die Schüler_innen darzustellen. Neben diesen vorgegebenen Beispielen werden die Lehrkräfte ermuntert, im Laufe der Schuljahre eigene Beispielsammlungen zu den unterschiedlichen Anforderungen und Notenstufen zu sammeln, um Schüler_innen an realen Beispielen die Beurteilungsgrundlagen erklären zu können (vgl. Lundahl, 2011, S. 98–102). Weiterhin weist Lundahl (2011) darauf hin, dass diese Art der Beurteilung und des Feedbacks bereits während der vorhergehenden Lehrpläne (1994-2011) eingeführt bzw. von den Lehrkräften verwendet wurde, um die relativ vagen Lehrplanziele auf der lokalen Ebene zu konkretisieren und damit verständlicher zu machen. Die „Übersetzungsarbeit“ der Lehrplanziele wäre mit den neuen konkreteren Lehrplänen Lgr11 und Lgy11 nun ein wenig erleichtert worden, auch wenn die konkrete Umsetzung in den Unterricht nach wie vor durch die einzelnen Lehrkräfte geschehen würde, wodurch die Beurteilungsraster weiterhin wichtige Bestandteile schulischer Leistungsbeurteilung seien (Lundahl, 2011, S. 93–94). Am 02. Mai 2016, also knapp 5 Jahre nach Einführung der neuen Lehrpläne und Notenskala, räumte Skolverket in einer Evaluation der Reformen ein, dass die Formulierungen in den Lehrplänen für viele der schwedischen Lehrkräfte nach wie vor schwierig zu verstehen und anzuwenden seien. Demnach wurden bewusst nur leicht variierte Formen der in den Lehrplänen verwendeten Bewertungsbegriffe (wie ‚einfach‘, ‚relativ gut‘ und ‚sehr gut‘) in verschiedenen Fächern und Wissensbereichen verwendet, um den Lehrkräften „das Verständnis [dafür] zu erleichtern, sowohl innerhalb als auch zwischen Fächern, wie Schüler_innen ihr Wissen zeigen können“. Ein Problem dabei sei jedoch, dass diese Bewertungsbegriffe in den verschiedenen Fächern unterschiedliche Bedeutungen haben könnten und, so Skolverket weiter: „Worte wie ‚nuanciert‘ oder ‚entwickelt‘ sind jedoch relativ und müssen interpretiert

158

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

werden“ (Skolverket, 2016c, S. 7). Es wurde auch mitgeteilt, dass die tröskelregel mit sofortiger Wirkung weitreichender auszulegen und das Verständnis dessen, was „zum überwiegenden Teil“ bedeuten kann, zu erweitern sei. Inwiefern diese Versuche der nachträglichen Klärung für Lehrkräfte im Unterrichtsalltag hilfreich sind, kann an dieser Stelle nicht beurteilt werden. Wie in Kapitel 6 jedoch deutlich wird, stellt die Interpretation und Umsetzung der Wissensanforderungen und Bewertungsbegriffe für Lehrkräfte eine große Herausforderung im alltäglichen Unterrichts- und Beurteilungshandeln dar.

Übergänge und Abschlüsse Wie im vorangegangenen Kapitel 5.1.1 bereits eingeführt, existieren schon seit den 1960er Jahren keine Abschlussprüfungen mehr im schwedischen Schulsystem. Die Schüler_innen erhalten am Ende der 9. bzw. 12. Klasse lediglich ein Zeugnis auf dem die in den jeweiligen Fächern erreichten Noten ausgewiesen werden. Im Anschluss an den Besuch der allgemeinbildenden grundskola haben alle Schüler_innen grundsätzlich das Recht auf den Besuch einer weiterführenden gymnasieskola – unabhängig davon, ob sie die Mindestanforderungen für die Note E in allen Fächern erreicht haben. Der Anteil derjenigen Schüler_innen, die in einem oder mehreren Fächern die Mindestanforderungen für die Note E am Ende der 9. Klasse nicht erreicht haben, liegt seit dem Schuljahr 2011/12 bei rund 23%, d.h. ein knappes Viertel der Schüler_innen verlässt die allgemeinbildende Schule mit einem sogenannten „unvollständigen Zeugnis“ (Skolverket, 2017). Für das Schuljahr 2015/16 lag dieser Wert bei 25,9%, zieht man jedoch neu eingewanderte Schüler_innen, die vermutlich noch nicht über die erforderlichen Sprachkenntnisse verfügen, ab, sinkt dieser Wert deutlich ab auf 18,9%. Diese Schüler_innen haben zwar das grundsätzliche Recht auf den Besuch der weiterbildenden Schule, allerdings können sie nicht in die regulären studien- und berufsvorbereitenden Programme aufgenommen werden, sondern besuchen zunächst eines der fünf individuellen Programme (vgl. Kap. 5.1.1). Für den Besuch der regulären Programme der gymnasieskola

Schulische Leistungsbeurteilung in Schweden

159

müssen Schüler_innen am Ende der 9. Klasse mindestens die Note E in den Fächern Schwedisch/Schwedisch als Zweitsprache, Mathematik und Englisch auf dem Grundschulzeugnis vorweisen. Seit den Reformen von 2010/2011 müssen darüber hinaus in weiteren fünf bzw. neun Fächern die Mindestanforderungen (Note E) erreicht worden sein, um in ein berufsvorbereitendes bzw. studienvorbereitendes Programm aufgenommen werden zu können. Je nachdem welche Kurse innerhalb der gymnasieskola besucht und mit mindestens Note E abgeschlossen werden, können zwei Abschlussarten an der gymnasieskola erworben werden: ein Berufsabschluss (yrkesexamen) und ein hochschulvorbereitender Abschluss (högskolförberedande examen), für beide Abschlüsse wird auch der Begriff des gymnasieexamen69 verwendet. Der Erwerb des Abschlusszeugnisses (slutbetyg) der gymnasieskola in einem studienvorbereitenden Programm berechtigt zum Besuch der Universitäten und Hochschulen in Schweden, aber auch Schüler_innen, die ein berufsvorbereitendes Programm belegt haben, können unter bestimmten Voraussetzungen ein Studium aufnehmen. So müssen diese Schüler_innen beispielsweise eine „bestanden“ Note (A-E) im Fach Schwedisch bzw. Schwedisch als Zweitsprache auf der Niveaustufe 2 bzw. 3 vorweisen, sowie den Kurs Englisch 6 bestanden haben (Note A-E). Schüler_innen, die diese Mindestanforderungen für den Abschluss nicht erreichen, erhalten lediglich ein Zeugnis (studiebevis), in dem die besuchten Kurse und erreichten Noten festgehalten werden. Im Schuljahr 2015/16 erwarben rund 40% der Schüler_innen in berufsvorbereitenden Programmen gleichzeitig die grundlegende Berechtigung zum Besuch einer Hochschule (grundläggande behörighet); insgesamt erreichten 80% aller Schüler_innen die Hochschulberechtigung (Skolverket, 2016a). Der Anteil der theoretischen Fächer innerhalb der berufsvorbereitenden Programme wurde bereits 1994 erhöht, um auch diesen Schüler_innen den späteren Weg an die Hochschulen zu ermöglichen 69

Der Begriff gymnasiexamen bezeichnet lediglich den Abschlusstyp, es werden keine gesonderten Abschlussprüfungen wie beim deutschen Abitur dafür abgelegt.

160

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

und die verschiedenen Bildungswege möglichst lange offen zu halten (vgl. Carlgren, 2009, S. 637). In diesem Zuge wurden auch die kommunalen Erwachsenenbildungseinrichtungen gestärkt, die eine Fortsetzung der (Aus-)Bildung über das Pflichtschulalter hinaus ermöglich sollten und damit der Idee des Lebenslangen Lernens (livslångt lärande) entsprachen. Mit dem Regierungswechsel 2006 geriet diese Angleichung der beiden Zweige, Berufsvorbereitung und Studienvorbereitung, erneut in die Kritik und eine stärkere Trennung der beruflichen und studienvorbereitenden Kurse wurde angestrebt. Die Anhebung der Zulassungsbedingungen für die verschiedenen Studienprogramme der gymnasieskola mit den Reformen 2010/2011 ist daher vielfach kritisiert worden, unter anderem wurde bemängelt, dass einmal getroffene Wahlentscheidungen später schwerer zu revidieren seien, das Risiko für Schulabbrüche steige sowie spätere hochschulische Weiterqualifizierungen für Schüler_innen der beruflichen Studienprogramme kaum noch möglich wären (vgl. Lundahl et al., 2010). Für den Beginn eines Studiums sind keine Aufnahmeprüfungen notwendig, allerdings werden für die einzelnen Studienfächer bestimmte Eingangsvoraussetzungen festgelegt, wie z.B. der erfolgreiche Besuch von naturwissenschaftlichen Fächern an der gymnasieskola, um in einen Ingenieursstudiengang aufgenommen zu werden. Zusätzlich zum Abschlusszeugnis der gymnasieskola existiert seit den späten 1970er Jahren eine freiwillige Hochschuleignungsprüfung (högskoleprov)70, die zweimal pro Jahr stattfindet und deren Testergebnisse die Aufnahmechancen in beliebte Studienfächer erhöhen können. An den Tests können alle Einwohner_innen Schwedens71, unabhängig des Alters oder Schulabschlusses, teilnehmen, also auch Menschen ohne formalen 70

Für weiterführende Informationen vgl. die offizielle Informationsseite des Universitätsund Hochschulrates (universitets- och högskoleråd): http://www.studera.nu/hogskoleprov/anmalan-och-information-om-provet/allt-omhogskoleprovet/ [12.12.2016]. 71 Zur Legitimation genügt ein Ausweisdokument bzw. die Personennummer, die vom Finanzamt vergeben wird.

Schulische Leistungsbeurteilung in Schweden

161

Schulabschluss. Die Testergebnisse sind fünf Jahre lang gültig und können bei Bewerbungen als zusätzliche Information beigefügt werden. Die Eignungsprüfung kann unbegrenzt wiederholt werden, teilweise wird sogar dazu geraten den Test mehrfach zu absolvieren, um das Testergebnis und damit die Chancen zur Aufnahme in einem beliebten Studiengang zu verbessern.72 Aus den Zeugnisnoten sowie den Testergebnissen werden wiederum Punktwerte (meritpoäng) errechnet, die ähnlich des Numerus Clausus in Deutschland für die Zulassung zu besonders begehrten Studiengängen angewandt werden. Für die Studienwahl steht ein Informationsportal im Internet bereit (www.studera.nu), aber auch die Berufs- und Studienfachberater_innen an den weiterführenden Schulen und Erwachsenenbildungseinrichtungen informieren über die Zugangsvoraussetzungen und Möglichkeiten fehlende Qualifikationen über die Einrichtungen der kommunalen Erwachsenenbildung (komvux) nachzuholen.

Nationella prov – landesweite Leistungstests Zentrale Leistungstests sind, wie oben bereits erwähnt, in Schweden seit Mitte des 20. Jahrhunderts ein fester Bestandteil des Bildungssystems. Die landesweiten Tests finden seit 2011 in drei Klassenstufen der grundskola statt: in der 3. Klasse in den Fächern Mathematik und Schwedisch (bzw. Schwedisch als Zweitsprache), in der 6. und 9. Klasse in den Fächern Mathematik, Schwedisch (bzw. Schwedisch als Zweitsprache) und Englisch. Zusätzlich werden in der 9. Klasse noch Tests in den Fächern Biologie, Chemie und Physik geschrieben. An der gymnasieskola werden die Tests ebenfalls in den drei Kernfächern Mathematik, Schwedisch (bzw. Schwedisch als Zweitsprache) und Englisch in verschiedenen Kursstufen durchgeführt. Die Tests bestehen aus mehreren

72

Vgl. beispielsweise das Interview mit dem Studienbewerber Hugo Söderström http://www.studera.nu/hogskoleprov/intervjuer/Hugo-tipsar-om-provet/ [02.02.2017].

162

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

Untertests, zu denen sowohl schriftliche als auch mündliche Teile gehören. Die landesweit einheitlichen Tests orientieren sich an den Lernzielen und Wissensanforderungen der zentralen Lehrpläne. Sie sollen einerseits den Lehrkräften als Orientierungshilfe bei der Leistungsbeurteilung dienen und andererseits bei der kontinuierlichen Evaluation und Anpassung des Curriculums helfen. Die Testaufgaben werden im Auftrag von Skolverket an verschiedenen Universitäten des Landes entwickelt und den Schulen von Skolverket zentral zu landesweiten Testterminen bereitgestellt. Die Verantwortung für die Durchführung, Korrektur und Bewertung der Tests liegt allerdings in den Händen der unterrichtenden Lehrkräfte vor Ort. Für die Benotung wird ebenfalls die Notenskala A-F verwendet, sodass Testergebnisse und Schulnoten miteinander verglichen werden können. Um eine gleichwertige Beurteilung der nationalen Tests durch die Lehrkräfte sicherzustellen, stellt Skolverket in einer umfangreichen Datenbank zahlreiche nationale Tests vergangener Jahre und beispielhafte Leistungsbeurteilungen als Übungsmaterial für die Lehrer_innen zur Verfügung. Skolverket betont in ihren Publikationen auch immer wieder, dass eine gerechte Leistungsbeurteilung nur eine gleichwertige Beurteilung sein kann (zuletzt vgl. Skolverket, 2016c, S. 17). Einen Weg, um diese Gleichwertigkeit der Benotungen zu überprüfen, stellen die regelmäßig durchgeführten Nachkontrollen durch Skolinspektionen, die schwedische Schulinspektion, dar. Dabei werden die von den Lehrkräften bewerteten zentralen Tests erneut von externen Beurteiler_innen benotet und die Ergebnisse mit den von den Lehrkräften vergebenen Noten verglichen. Die Lehrkräftenoten liegen dabei regelmäßig über den durch die externen Beurteiler_innen vergebenen Testwerten – was als Gefährdung des Gleichwertigkeitsanspruchs betrachtet und immer wieder kritisiert wird (vgl. Skolinspektionen, 2010, 2011, 2013a). In ihren Re-Analysen der Benotungen der zentralen Tests aus den Jahren 2010 und 2011 überprüften Hinnerich und Vlachos (2013) diese hinsichtlich systematischer Abweichungen in den Beurteilungen für bestimmte Gruppen von Schüler_innen. Insgesamt konnten sie zeigen, dass Lehr-

Schulische Leistungsbeurteilung in Schweden

163

kräfte bessere Noten vergeben als die von Skolverket bestellten externen Beurteiler_innen. Hinsichtlich verschiedener Gruppen von Schüler_innen zeigte sich jedoch, dass die Noten der Lehrkräfte u.a. für die Gruppe der Jungen, der Schüler_innen mit ‚Migrationshintergrund‘ und der Schüler_innen, deren Eltern einen niedrigeren Bildungsabschluss haben, schlechter ausfielen, als die Benotungen durch externe Beurteiler_innen (Hinnerich & Vlachos, 2013, S. 89). Außerdem würden Schüler_innen, die insgesamt gute Schulleistungen zeigten auch bessere Testresultate von den Lehrkräften erhalten als leistungsschwächere Schüler_innen, obwohl die externen Beurteiler_innen die Tests als gleichwertig einstuften (Hinnerich & Vlachos, 2013, S. 123). Skolverket weist immer wieder darauf hin, dass die zentralen Tests keine Examensprüfungen darstellen würden, sondern vor allem als Instrument der Qualitätssicherung verstanden werden müssen, mit deren Hilfe die Gleichwertigkeit der von den Lehrkräften getroffenen Beurteilungen sichergestellt werden soll. Daneben zeigt sich seit Mitte der 2000er Jahre ein gestiegenes Interesse an der weitergehenden Professionalisierung und damit einhergehend einer Stärkung des professionellen Status der Lehrkräfte als wichtige Akteure der schulischen Leistungsbeurteilung. Hierauf soll nun im folgenden Kapitel näher eingegangen werden. 5.1.3

Grundzüge der schwedischen Lehramtsausbildung und der professionelle Status von Lehrkräften

Zur institutionellen Rahmung der Gerechtigkeitsüberzeugungen schwedischer Lehrkräfte gehören neben der Struktur des Schulsystems und den Besonderheiten der schulischen Leistungsbeurteilung auch die Charakteristika der Lehramtsausbildung, die konkreten Arbeitsbedingungen und der damit zusammenhängende professionelle Status der schwedischen Lehrkräfte. Da diese zum Teil sehr deutlich von den Bedingungen in Deutschland abweichen und für das Verständnis der Gerechtigkeitsüberzeugungen grundlegend sind, wird die Verfasstheit der schwedischen Lehrkräfteprofession an dieser Stelle etwas ausführlicher beleuchtet.

164

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

Historische Entwicklung der verschiedenen Lehrämter Das schwedische Bildungswesen entwickelte sich historisch betrachtet aus zwei Schulformen heraus, deren Entwicklung eng mit der Konstitution der heutigen Lehrprofession zusammenhängt. Zunächst bestand das Schulwesen aus den höheren Schulen (läroverket), die größtenteils aus den mittelalterlichen Kathedralschulen entstanden waren und ursprünglich der Ausbildung von Priestern und hohen Staatsbeamten dienten. Erst ab Mitte des 19. Jahrhunderts bildeten sich dann die Volksschulen (folkskola) als öffentliche Grundschulen für die wachsende Mittelschicht heraus, die Schulform aus der ein Jahrhundert später die allgemeinbildende Schule für alle Kinder (grundskola) werden sollte. Die Lehrerschaft der höheren Schulen bestand vornehmlich aus gebildeten Männern der Oberschicht, die über ein hohes soziales Ansehen, eine hochschulische Ausbildung und professionelle Autonomie verfügten. Demgegenüber entstammten die Lehrkräfte der Volksschulen eher niedrigeren sozialen Schichten, waren vornehmlich weiblich und genossen nur eine seminaristische Ausbildung, die ihnen weniger professionelle Souveränität und weniger Prestige verlieh als ihren männlichen Kollegen des läroverket (zur Entwicklung der schwedischen Lehrprofession vgl. u.a. Ringarp 2011a, 2011b; Beach, Bagley, Eriksson & Player-Koro, 2014). Mit der Gründung einer eigenen Interessenvertretung der Volksschullehrkräfte im Jahr 1880 (Sveriges Allmänna Folkskollärareförening – SAF; heute: Lärarförbundet) sollte diesen unterschiedlichen Bedingungen entgegengewirkt und eine einheitliche Lehramtsausbildung eingeführt werden. Die Vereinigung der Lehrkräfte der höheren Schulen, Lärarnas Riksförbund, gründete sich nur vier Jahre später und sprach sich vehement gegen eine solche allgemeine und vereinheitlichende Ausbildung aller Lehrkräfte aus. Die unterschiedliche soziale Zusammensetzung der Lehrkräfte beider Schulformen sowie deren unterschiedliche Ausbildungstraditionen prägten die schwedische Lehrer_innenschaft bis weit in die 1980er Jahre hinein, obwohl bereits ab 1977 alle Lehramtsausbildun-

Schulische Leistungsbeurteilung in Schweden

165

gen73 an die Universitäten verlagert wurden. Ab der Mitte des 20. Jahrhunderts wurden zudem immer wieder Reformen der Lehramtsausbildung eingefordert und die Vereinheitlichung der Ausbildungen weiter vorangetrieben. Die beiden Interessenvertretungen – Lärarförbundet und Lärarnas Riksförbund – bestehen bis heute und vertreten ihre jeweilige Klientel. Auch die strukturellen Unterschiede in der Lehramtsausbildung konnten trotz mehrfacher Reformbemühungen nicht gänzlich aufgehoben werden, sodass nach wie vor von einer „zweigeteilte[n] Profession“ gesprochen wird (vgl. Beach et al., 2014; Jedemark, 2006).

Aktuelle Struktur der Lehramtsausbildung Mit der Verabschiedung des neuen Gesetzes zur Lehramtsausbildung im Jahr 2009 (Regeringens Proposition 2009/10:89) wurde die bis dahin geltende übergreifende Struktur der Lehramtsausbildung wieder rückgängig gemacht und zwei getrennte Curricula für Lehrkräfte eingeführt. Seit der 2011 in Kraft getretenen Reform existieren nun wieder spezielle Abschlüsse für die verschiedenen Lehrämter der grund- und gymnasieskola, das zwischenzeitlich gültige gemeinsame Lehramtsexamen wurde damit wieder abgeschafft. Allen Lehramtsstudiengängen gemeinsam ist weiterhin die grundlegende Struktur, bei der fachwissenschaftliche, erziehungswissenschaftliche und fachdidaktische Studienanteile mit praktischen Phasen in der Schule abwechseln. Die Studiengänge variieren in der Dauer und den konkreten Studieninhalten, je nach Abschlussziel: 1) Vorschullehrkräfte (förskollärare) studieren sieben Semester, 2) Lehrkräfte für die Klassen 1-3 bzw. 4-6 (grundskollärare) acht Semester, 3) Fachlehrkräfte (ämneslärare) für die Klassen 7-9 neun Semester bzw. Fachlehrkräfte für die Klassen 10-12 der weiterführenden gymnasieskola zehn oder elf Semester. Daneben ist auch die Qualifikation als Lehrkraft 73

Dies schloss auch die Seminare für Lehrkräfte der beruflichen Zweige sowie die eher weiblich dominierten Berufsfelder der Elementarbildung und Sozialen Arbeit ein, die hierdurch einen enormen Professionalisierungsschub erhielten.

166

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

für berufliche Fächer (yrkeslärare)74 sowie Förderlehrkraft (speciallärare)75 möglich. Die konkreten Bedingungen können jedoch an den einzelnen Hochschulen und Universitäten im Land abweichen. Neben den regulären Studiengängen werden auch zahlreiche berufsbegleitende Kurse und Studiengängen angeboten, die eine nachträgliche Qualifizierung von Quereinsteiger_innen ermöglichen sollen (vgl. dazu ausführlicher im Abschnitt "Studienabschluss und Berechtigungen"). Zur schwedischen Lehrprofession gehören auch die Vorschullehrkräfte – eine Berufsgruppe, die es so noch in keinem Bundesland Deutschlands gibt.76 Die Ausbildung der „Kindergartenlehrer_innen“ (barnträdgårdslärarinnor), wie die Vorschullehrer_innen zunächst hießen, erfolgte zunächst in seminaristischer Weise, ähnlich wie bei den Volksschullehrkräften. Mit der Hochschulreform von 1977 wurde jedoch auch die Ausbildung der Vorschullehrkräfte an die Universitäten verlagert (Ringarp, 2011b, S. 366). Aber erst seit 1998 gilt die schwedische Vorschule, die den Kindergarten und eine vorbereitende Vorschulklasse beinhaltet und räumlich häufig an eine grundskola angegliedert ist, als eigenständige Schulform und die Ausbildung der Vorschullehrkräfte erfolgt in einem eigenen universitären Studiengang. Die aktuelle universitäre Lehramtsausbildung beinhaltet ebenso wie in Deutschland Hospitationen und mehrwöchige Praktikumsphasen im 74

Yrkeslärare unterrichten in den berufsvorbereitenden Programmen der weiterführenden Schule und sind damit eher mit Berufsschullehrkräften zu vergleichen als mit den Lehrer_innen an den allgemeinbildenden Schulen in Deutschland. 75 Speciallärare sind speziell ausgebildete Lehrkräfte mit einer Vertiefung u.a. in den Bereichen Sprach-, Schrift-, Lese- oder Mathematikförderung, die als zusätzliche Lehrkraft an allen Schulformen für die Unterstützung von Schüler_innen zuständig sind, die einen besonderen Förderbedarf haben. Sie können als zusätzliche Lehrkräfte im regulären Unterricht der grundskola sowie gymnasieskola eingesetzt werden oder aber ein gesondertes Angebot parallel zum Unterricht anbieten. Sie beraten gemeinsam mit den Fachlehrkräften, welche Art von Unterstützung für einzelne Schüler_innen notwendig ist und arbeiten gemeinsam einen Förder- und Hilfeplan aus, vgl. Skolverket (2014a). 76 Obwohl sich mit dem Berufsbild der Kindheitspädagog_innen allmählich eine vergleichbare Berufsgruppe zu entwickeln scheint (vgl. Weiß, Kiel, Keller-Schneider, Syring & Hellsten, 2017).

Schulische Leistungsbeurteilung in Schweden

167

Schulbetrieb. Die sogenannte verksamhetsförlagd utbildung (VFU), also derjenige Teil der Lehramtsausbildung, der am zukünftigen Arbeitsplatz Schule stattfindet und universitär begleitet wird, wurde 2001 verbindlich eingeführt. Die damit verbundene Hoffnung auf eine stärkere Verzahnung der theoretischen und berufspraktischen Anteile der Lehramtsausbildung konnten jedoch nur teilweise erfüllt werden (kritisch für das Studienfach Schwedisch vgl. Manderstedt, 2013). Die sogenannte zweite Phase der deutschen Lehramtsausbildung – das Referendariat mit anschließender Examensprüfung – existiert in Schweden dagegen nicht.

Studienabschluss und Berechtigungen (lärarlegitimation) Das Lehramtsstudium wird mit dem sogenannten lärarexamen abgeschlossen, dies ist jedoch anders als das deutsche Staatsexamen keine gesonderte Abschlussprüfung, sondern die Bezeichnung für den Studienabschluss und die daran geknüpften Berechtigungen. Lehramtsstudierende, die alle Voraussetzungen zum Studienabschluss erfüllen, also die notwendigen Studienpunkte erreicht und alle Studienanteile absolviert haben, erhalten das lärarexamen. Im Anschluss an die universitäre Ausbildung folgt eine einjährige Einführungsphase (introduktionsperioden), die an einer Schule unter Anleitung einer erfahrenen Lehrkraft absolviert wird. Im Unterschied zum deutschen Referendariat findet jedoch keine weitergehende seminaristische Ausbildung statt, die Absolvent_innen unterrichten bereits während dieser Einführungsphase hauptsächlich in den Fächern und Altersgruppen, für die sie ausgebildet wurden. Da die Verantwortung für die Einführungsphase jedoch vollständig auf der lokalen Ebene, d.h. in den Händen der einzelnen Schulleitungen, liegt, sind hier gewisse Spielräume möglich hinsichtlich dessen was hauptsächlich im Einzelfall bedeutet. Zum 01. Juli 2012 trat die Verordnung zur obligatorischen Einführungsphase (SFS 2011:326) in Kraft, nach der alle Lehrkräfte, die weniger als ein Jahr Berufserfahrung bzw. noch keine Legitimation erhalten hatten, ein verpflichtendes Einführungsjahr an einer Schule absolvieren müssen. Sie sollen durch eine erfahrene Lehrkraft als

168

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

Mentor_in begleitet und am Ende durch die Schulleitung in ihrer Eignung als Lehrkraft beurteilt werden. Die Einführung der introduktionsperiod wurde medial kritisch begleitet, da diese als Überprüfung und Einmischung verstanden wurde. In einer Informationsbroschüre von Skolverket wird daher auch betont, „dass die Einführungsphase nicht als Überprüfung des Lehramtsabschlusses angesehen wird, sondern als Qualitätssicherung der Ausbildung, in der die Lehrkräfte zeigen sollen, wie sie die in der Lehramtsausbildung erworbenen Kenntnisse, Fertigkeiten und Verhaltensweisen im täglichen Unterrichten umsetzen können“ (Skolverket, 2013b, S. 8). Da die Einführungsphase ausschließlich in der Verantwortung der Schulen liegt und keine weiteren Ausbildungseinrichtungen (wie bspw. die Haupt- und Fachseminare während des deutschen Referendariats), kann die konkrete Ausgestaltung sehr unterschiedlich ausfallen, wie Berichte der schwedischen Schulinspektion zeigen (Skolinspektionen, 2014b). Im Anschluss an die erfolgreich absolvierte Einführungsphase können die Lehrkräfte ihre sogenannte Legitimation (lärarlegitimation) erwerben, diese berechtigt sie dazu eigenständig zu Unterrichten und – für die vorliegende Arbeit besonders interessant – Zensuren zu vergeben und Zeugnisse zu erstellen.77 Im Umkehrschluss bedeutet dies aber auch, dass Lehrkräfte während der Einführungsphase noch nicht selbstständig benoten und/oder Zeugnisse ausstellen dürfen, dies kann nur in Zusammenarbeit mit den jeweiligen Mentor_innen bzw. der Schulleitung geschehen. Bis 2011 war eine solche Berechtigung wie die lärarlegitimation nicht notwendig, so dass der Anteil von Quereinsteiger_innen und anders beruflich Qualifizierten im Lehramt vergleichsweise hoch war. 78 Für Leh77

Für einen Überblick über die diskursive Vorgeschichte und das parteipolitische Ringen um die Einführung von lärarlegitimation und introduktionsperioden vgl. Fransson (2012). 78 Insbesondere an den Grundschulen in freier Trägerschaft (friskolor) war der Anteil von Lehrkräften ohne abgeschlossenes Lehramtsstudium mit 30% im Jahr 2010/11 sehr hoch. An den kommunalen Schulen betrug der Anteil dieser Lehrer_innen immerhin 12%. An den weiterführenden Schulen war dieser Unterschied noch deutlicher: 20% der Lehrkräf-

Schulische Leistungsbeurteilung in Schweden

169

rer_innen, die vor Inkrafttreten der Reform angestellt wurden und 2010 bereits als Lehrer_innen tätig waren, wurde eine Übergangsfrist eingerichtet, innerhalb derer diese Lehrkräfte einen Antrag auf Legitimation stellen konnten. Dies bedeutete für viele Lehrkräfte, die bisher fachfremd unterrichtet hatten bzw. nur über einen „unvollständigen“ Lehramtsabschluss79 verfügten, dass sie verpflichtet wurden ab sofort nur in denjenigen Jahrgangsstufen, Fächern und Schulformen zu unterrichten, für die sie ausgebildet wurden bzw. die fehlenden Ausbildungsteile an einer Hochschule bzw. Universität nachzuholen. Ziel war es, dass ab dem Schuljahr 2015/16 nur noch behöriga lärare, also berechtigte Lehrkräfte mit einem Studienabschluss im Unterrichtsfach, an den Schulen des Landes unterrichten und benoten sollten. Allerdings lag der Anteil der Lehrkräfte, die über das Hochschulexamen und die Berechtigung im zu unterrichtenden Fach verfügten, bei lediglich 72,7% der beschäftigten Lehrer_innen im Schuljahr 2015/16 (Skolverket, 201680). Ein Grund für die nach wie vor hohe Zahl nicht-legitimierter Lehrkräfte ist, dass die für die Prüfung und Zuteilung der Legitimation zuständige Schulbehörde Skolverket mit der Bearbeitung der Anträge überfordert war und die Bearbeitungsfristen verlängern musste (ursprünglich sollten ab Juli 2012 nur noch legitimierte Lehrkräfte unterrichten dürfen). Auch ist es unter bestimmten Voraussetzungen nach wie vor möglich nicht-legitimierte Lehrer_innen bzw. Personen ohne jegliche Lehramtsausbildung einzustellen – solange diese nur befristet bis zu maximal einem Schuljahr eingestellt werden und nur dann, wenn keine legitimierten Fachkräfte zur Verfügung stehen. Das heißt, ein nicht unwesentlicher Teil der beschäftigten Lehrkräfte darf zwar weiterhin unterrichten, für die abschließende te in kommunalen Schulen gegenüber 42% der Lehrkräfte an freien Schulen waren 2010/11 demnach ohne Legitimation (vgl. Skolverket, 05.04.2011). 79 Analog zur Möglichkeit, die gymnasieskola zu unterbrechen und fehlende Kurse später nachzuholen, um das Abschlusszeugnis zu ergänzen, werden auch bei Unterbrechung eines Hochschulstudiums alle belegten Kurse und Studienanteile festgehalten, so dass die fehlenden Studienanteile nachträglich belegt und ergänzt werden können. 80 www.skolverket.se/polopoly_fs/1.247252!/Menu/article/attachment/Grundskolan_Pe rsonal_Riksniv%C3%A5_Tab7_2015_16webb.xls [08.10.2016].

170

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

Beurteilung und die Erstellung der Zeugniszensuren müssen sie jedoch mit bereits berechtigten Kolleg_innen bzw. den Schulleitungen zusammenarbeiten, die für diese Aufgabe berechtigt sind (vgl. Skollagen 2010:800, Kap 2, §13). 81 Dass diese Situation teilweise zu unübersichtlichen Situationen im Schulalltag führt (wer darf unterrichten, wer benoten), belegen regelmäßig erscheinende Zeitungsberichte und Blogdiskussionen (vgl. z.B. Thomson, 19.10.2015; Färlin, 01.12.2015). Die Gewerkschaft Lärarförbundet veröffentlichte im März 2016 auf ihrer Homepage sogar eine im Comicstil illustrierte zweiseitige Kurzanleitung für Lehrkräfte, in der die verschiedenen Konstellationen und Handlungsmöglichkeiten bei der Benotung erläutert werden. 82 Insgesamt lässt sich – trotz der oben geschilderten Schwierigkeiten in der Umsetzung der Reformen – zusammenfassen, dass die Einführung einer vereinheitlichenden Qualifizierung und Zertifizierung von angehenden Lehrkräften durch introduktionsperiod und lärarlegitimation grundsätzlich als deutlicher Professionalisierungsversuch verstanden werden kann, der auf eine Steigerung des Ansehens und Berufsprestiges von Lehrer_innen abzielt und gleichzeitig die Lehrprofession gegenüber Quereinsteiger_innen aus anderen Professionen abschottet. Für die bürgerlich-konservative Allianzregierung unter Fredrik Reinfeldt (2006201483) stellte die Reform der Lehramtsausbildung und die Einführung der lärarlegitimation zudem einen Weg zur Demonstration politischer Handlungsfähigkeit dar, nachdem in Folge des sinkenden PISA-Erfolgs des schwedischen Bildungssystems eine mediale Diskussion über die

81

Ausgenommen davon sind Lehrkräfte, die muttersprachlichen Unterricht für Kinder mit ‚Migrationshintergrund‘ anbieten, bestimmte Fachlehrkräfte im berufsbildenden Zweig der weiterführenden Schule, Lehrkräfte an Förderschulen sowie in der Erwachsenenbildung (Skolverket, 2014e, S. 4). 82 Zu finden unter: blogg.lararnasnyheter.se/pdf/lathund_betygsattning.pdf [04.11.2016]. 83 Von 2010-2014 regierten die Allianzparteien (Zentrumspartei, Moderate, Liberale und Christdemokratische Partei) als Minderheitenregierung.

Schulische Leistungsbeurteilung in Schweden

171

„Schulkrise“84 ausgebrochen war. Auch der Fachverband der schwedischen Lehrkräfte der weiterführenden Schulen (Lärarnas Riksförbund) hatte bereits seit den 1990er Jahren die Einführung einer Legitimationsprüfung für Lehrkräfte gefordert (Fransson, 2012, S. 25), sodass die Reform der Lehramtsausbildung als Ergebnis einer längerfristigen politischen Auseinandersetzung betrachtet werden muss. Mickwitz (2015) argumentiert zudem, dass zunächst in den Reformphasen nach 1990 im bildungspolitischen Diskurs Schwedens die „unprofessionelle“ Lehrkraft als Problemursache für die sogenannte Schulkrise konstruiert wurde, sodass die Professionalisierungsreformen als ‚Rettung‘ für das schwedische Bildungssystem dargestellt werden konnte. Gleichzeitig sank das Vertrauen in die professionelle Autonomie von Lehrkräften und Vorstellungen von einer stärkeren Qualitätssicherung durch erhöhte Kontrolle, Standardisierung und Verantwortungsübernahme setzten sich stärker durch. Durch die Verknüpfung von lärarlegitimation und die Berechtigung zur Notenvergabe sollten schließlich sowohl das gesunkene Vertrauen in die Lehrkräfteprofession als auch generell in Zensuren und Zeugnisse als Auswahlinstrumente wiederhergestellt werden (vgl. hierzu Mickwitz, 2015, S. 258-259).

Arbeitsbedingungen und professioneller Status der schwedischen Lehrkräfte Im Rahmen der medialen Diskussion um die wahrgenommene „Schulkrise“ seit Mitte der 2000er Jahre wurden zunehmend auch die schlechten Arbeitsbedingungen der Lehrkräfte als Ursache für eben jene Krise thematisiert (vgl. exemplarisch Sirén, 05.06.2013). Vor allem die niedrige Vergütung, die steigende Arbeitsbelastung und der insgesamt eher nied84

Bspw. in der 2009 ausgestrahlten Radioserie „Kris i skolan“ des staatlichen Radiosenders P1, zu finden unter: http://sverigesradio.se/sida/gruppsida.aspx?programid=2938&grupp=21081&artikel=26 17551 [08.06.2015].

172

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

rige berufliche Status des Lehrberufs wurden als Gründe dafür ausgemacht, dass die besten Schulabgänger_innen sich eher gegen den Lehrberuf und insgesamt nur wenige Studierende für ein Lehramtsstudium entscheiden würden (vgl. Nyman, 09.07.2014). Im Folgenden werden diese Fragen hinsichtlich ihrer Auswirkungen auf den professionellen Status der Lehrkräfte näher beleuchtet. Wie oben bereits ausgeführt, konnte die schwedische Lehrkräfteprofession auf eine lange Phase der zentralstaatlichen Regulierung zurückblicken, die nicht nur die Organisation des Bildungswesens betraf, sondern bis hinein in die Vorgaben und Ansprüche an eine ‚gute Lehrkraft‘ wirkten. Das Bild eines „eisernen Dreiecks“ (järntriangeln) – bestehend aus Bildungsforscher_innen, Politiker_innen und Verwaltungskräften (vgl. Rosengren & Öhngren, 1997) –, in dem die Lehrkräfte wenig Spielräume für professionelle Entwicklung hatten, wird zuweilen als Beschreibung für diese Phase herangezogen. Mit der Hinwendung zu einem stärker dezentralisierten und an Ziel- bzw. Outputsteuerung orientierten Bildungswesen ab den 1980er Jahren und der Einführung des kriterienorientierten Beurteilungssystems 1994 veränderte sich der Blick auf die Lehrkräfte und ihren professionellen Spielraum jedoch fundamental. In den bildungspolitischen Steuerungsdokumenten wurden die Lehrkräfte nun als „curriculum makers“ (Carlgren & Klette, 2008, S. 129) konstruiert, die selbstständig darüber entscheiden sollten, wie sie die in den Lehrplänen vorgesehenen allgemeinen Lernziele in konkrete Unterrichtseinheiten, didaktische Methoden und Beurteilungskriterien übersetzen. Die damit einhergehende „Schock-Professionalisierung“ (Carlgren & Klette, 2008, S. 130) wurde zudem überlagert durch den zunehmenden äußeren Druck auf die Einzelschulen, ausgelöst durch die Dezentralisierungs- und Deregulierungspolitik der späten 1980er Jahre. Im Zuge dieser wurde die staatliche Verantwortung für die Arbeitsbedingungen von Lehrkräften auf die kommunalen und lokalen Akteure übertragen (vgl. Kap. 5.1.1 zur grundlegenden Struktur des Bildungssystems in Schweden). Damit fielen den Kommunen bzw. einzelnen Schulträgern erhöhte Entscheidungsspielräume zu, die zunehmend an den Steuerungslogiken des entstehenden Bildungsmarktes (Management, Wahl-

Schulische Leistungsbeurteilung in Schweden

173

freiheit, Wettbewerb und Standardisierung) orientiert waren. Einerseits eröffneten sich professionelle Handlungsspielräume, andererseits wurden die Arbeitsbedingungen der Lehrkräfte zunehmend auf die lokale Ebene verlagert und der Einflussnahme der kollektiven Interessenvertretungen entzogen. Ab Mitte der 1990er Jahre folgte bspw. die Abschaffung einheitlicher Tarife für Lehrkräfte und die Etablierung von individuellen Lohnverhandlungen zwischen Schulen und einzelnen Lehrkräften, die an Leistungskomponenten gekoppelt waren. Diese leistungsbezogene Bezahlung wird teilweise auch an das Abschneiden der Schüler_innen bei den standardisierten Tests (nationella prov) gekoppelt (vgl. Mickwitz, 2015, S. 256). Wie aktuellere Untersuchungen zeigen, bleiben die genauen Kriterien für die leistungsbezogene Bezahlung für die betroffenen Lehrkräfte allerdings häufig im Unklaren (vgl. Winkler, 2013; Lärarnas Riksförbund, 2012). Die Gehälter schwedischer Lehrkräfte sind generell als niedrig einzustufen, im Jahr 2013 lag beispielsweise das Durchschnittseinkommen einer Lehrkraft an der gymnasieskola noch unterhalb des schwedischen Durchschnittseinkommens (vgl. Statistiska Centralbyrån, 2013). Nach Larsson (2013) wurden zusätzlich die Arbeitsbedingungen für Lehrkräfte sukzessive verschlechtert, indem bspw. eine verstärkte Präsenzpflicht eingeführt und zeitgleich die Aufgabengebiete für Lehrkräfte erweitert wurden, so dass das Kerngeschäft des Unterrichtens zunehmend in den Hintergrund trat (vgl. hierzu auch Skolverket, 2013c; Lundström & Holm, 2011). In Kombination mit den individuellen Lohnverhandlungen führten diese wenig attraktiven Arbeitsbedingungen zu einem Rückgang der Studierendenzahlen bzw. wurde der Lehrberuf zunehmend unattraktiv für leistungsstarke Studierende (vgl. Larsson, 2013; Fredriksson, 2010). Diese Veränderungen hatten und haben auch Folgen für das Selbstbild von Lehrkräften, die sich zunehmend nicht mehr als Angestellte des öffentlichen Dienstes fühlten (und es praktisch ja auch nicht mehr waren) und damit ein weniger stark ausgeprägtes professionelles Selbstbild aufrechterhalten konnten. In Bezug auf die neuen kriterienorientierten Lehrpläne (Lgr11, Lgy11) und eine damit einhergehende stärkere Fokussierung auf Resultate (outcomes) des Bildungsprozesses

174

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

wird zudem ein weitergehender Verlust der professionellen Selbstbestimmung befürchtet (vgl. Englund, 2012). Die in diesem Kapitel vorgenommene Skizzierung des schwedischen Bildungssystems, der zentralen Elemente der schulischen Leistungsbeurteilung, der Grundzüge der Lehramtsausbildung und des professionellen Status schwedischer Lehrkräfte diente der Offenlegung wichtigen Kontextwissens für das Verständnis der rekonstruierten Gerechtigkeitsüberzeugungen. Im folgenden Kapitel 5.2 erfolgt nun die Beschreibung des nordrhein-westfälischen Kontextes, um anschließend in Kapitel 5.3 in einem ersten Zwischenfazit die institutionellen Rahmenbedingungen der schulischen Leistungsbeurteilung vergleichend zusammenzufassen und zentrale Gerechtigkeitsnormen beider Kontexte herauszustellen.

5.2 Schulische Leistungsbeurteilung im Sekundarschulbereich in Nordrhein-Westfalen Analog zur Darstellung des schwedischen Bildungssystems und der Analyse der auf die schulische Leistungsbeurteilung bezogenen Dokumente erfolgt nun die Darstellung für den nordrhein-westfälischen Kontext. Auch hierfür wurde auf eine Reihe von Dokumenten, Regularien und einschlägiger Forschungsliteratur zurückgegriffen, die im Folgenden kurz charakterisiert werden. Anders als im zentralstaatlich organisierten schwedischen Bildungssystem müssen hierfür sowohl bundeslandübergreifende Vorgaben als auch die spezifischen Regularien des Ministeriums für Schule und Weiterbildung des Bundeslandes NordrheinWestfalen (MSW) berücksichtigt werden. 1) Die bundeslandübergreifenden Regelungen entstammen vor allem den Bestimmungen des Ständigen Sekretariats der Kultusministerkonferenz der Länder in der Bundesrepublik Deutschland (KMK). Die KMK,

Schulische Leistungsbeurteilung in NRW

175

deren Aufgaben nach eigener Darstellung85 u.a. die Vereinbarung der „Einheitlichkeit und Vergleichbarkeit von Zeugnissen und Abschlüssen“ sowie die „Sicherung von Qualitätsstandards in Schule, Berufsbildung und Hochschule“ sind, regelt grundlegende Strukturen der schulischen Leistungsbeurteilung, wie bspw. die Notenskala, und die Struktur der allgemeinbildenden und beruflichen Schulen sowie deren Abschlüsse. 2) Das Schulgesetz des Landes Nordrhein-Westfalen (NRW SchulG) enthält die grundlegenden Vorgaben zur Struktur des nordrheinwestfälischen Bildungswesens, den Rechten und Pflichten aller beteiligten Akteure sowie die Grundlagen des Bildungs- und Erziehungsauftrags der Schule. Enthalten sind auch fünf Paragraphen (§48-52), die sich ausschließlich auf die schulische Leistungsbeurteilung beziehen und deren Bestimmungen in ergänzenden Ausbildungs- und Prüfungsordnungen der verschiedenen Schulformen weiter spezifiziert werden (z.B. APO–S I, Ausbildungs- und Prüfungsordnung der Sekundarstufe I; APO–GOSt, Ausbildungs- und Prüfungsordnung der gymnasialen Oberstufe). 3) Die Kernlehrpläne der Fächer Mathematik und Deutsch 86 für die verschiedenen Schulformen der Sekundarstufe I wurden ebenfalls in die Analyse einbezogen, da in ihnen neben den allgemeinen Bildungszielen des jeweiligen Faches auch die verbindlichen Anforderungen in Form von zentralen Kompetenzerwartungen für jedes Fach definiert werden sowie Kriterien für die Leistungsbeurteilung formuliert sind. Dabei fokussieren die Kernlehrpläne nur auf die wesentlichen Inhalte und Kompetenzen, die dann auf der lokalen Ebene von den einzelnen Schulen umgesetzt werden sollen (kompetenzorientierte Steuerung). Der Umfang und die inhaltliche Darstellung der Kernlehrpläne fällt zwischen den Schulformen teilweise sehr unterschiedlich aus, dies betrifft insbesondere die Abschnitte zur Leistungsbeurteilung.

85

Vgl. https://www.kmk.org/kmk/aufgaben.html [07.11.2015] Zu finden über den sogenannten ”Lehrplannavigator” der Qualitäts- und Unterstützungsagentur-Landesinstitut für Schule (QUA-LiS) NRW, zu finden unter: http://www.schulentwicklung.nrw.de/lehrplaene/lehrplannavigator-s-i/ [07.11.2015] 86

176

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

4) In den schulinternen Lehrplänen sollen die in den Kernlehrplänen enthaltenen zentralen Lernziele und Kompetenzen an die spezifische Situation der Einzelschulen angepasst und im Rahmen der Schulprogrammarbeit ausgearbeitet und kontinuierlich angepasst werden. Neben den schulinternen Lehrplänen sollen die Fachkollegien sich über schulinterne Grundsätze der Leistungsbeurteilung abstimmen und diese für die Schüler_innen und deren Eltern transparent machen. Beides, die schulinternen Lehrpläne und die Grundsätze der Leistungsbeurteilung, waren wichtige Datensorten für die Rekonstruktion der Gerechtigkeitsüberzeugungen der befragten Lehrkräfte und fließen daher in deren Darstellung im Kapitel 6.3 ein. 5) Eine weitere Datengruppe stellen Veröffentlichungen des Ministeriums für Schule und Weiterbildung des Landes Nordrhein-Westfalen (MSW) dar, insbesondere die Informationsblätter und Hinweise für Schüler_innen, Eltern und Lehrkräfte hinsichtlich spezifischer Detailfragen der schulischen Leistungsbeurteilung. Auf der Homepage des MSW („Bildungsportal des Landes Nordrhein-Westfalen“87) finden sich für die verschiedenen Zielgruppen eigens eingerichtete Bereiche, auf denen u.a. über die Möglichkeiten der Benotung von Hausaufgaben, die Anzahl der Klassenarbeiten nach Schularten und zentrale Prüfungstermine informiert wird. 6) Ergänzend wurde auch hier die deutsch- und englischsprachige Forschungsliteratur in die Analyse und Darstellung des nordrheinwestfälischen Bildungssystems einbezogen. Im Vergleich zum schwedischen Kontext bestehen die einbezogenen Dokumente stärker aus offiziellen Regularien (Ausbildungs- und Prüfungsverordnungen, Runderlassen, Gesetzen) zu formalen Detailfragen (Häufigkeit und Gewichtung verschiedener Formen von Beurteilungen, Zusammensetzung der Zeugnisnoten, etc.) und weniger aus Handreichungen, die sich mit pädagogischen Fragen der Gestaltung der schulischen Leistungsbeurteilung befassen. Eine Ausnahme bilden die ergänzenden Handreichungen für Lehrkräfte zu den im Schuljahr 2006/07 87

https://www.schulministerium.nrw.de/docs/bp/index.html [07.11.2015]

Schulische Leistungsbeurteilung in NRW

177

eingeführten zentralen Abschlussprüfungen und den zentralen Lernstandserhebungen, die in ihrem Charakter den schwedischen Handreichungen ähnlich sind. Für die alltägliche Beurteilung von Schüler_innenleistungen in verschiedenen Fächern existieren jedoch meines Wissens keine offiziellen Handreichungen von Seiten des Bildungsministeriums wie im schwedischen Kontext die von Skolverket herausgegebenen Publikationen. Allerdings finden sich zahlreiche Publikationen, die der pädagogischen Praxisliteratur zugeordnet werden und als informelle Wissensquelle für Lehrkräfte gelten können. Die darin behandelten Themen sind sehr breit und beziehen sich auf verschiedene Aspekte des alltäglichen Beurteilungshandelns, wie z.B. Formen der Beurteilung mündlicher Leistungen. Inwiefern Lehrkräfte auf diese Art Ratgeberliteratur zurückgreifen ist sehr individuell und hängt zum Teil davon ab, welche Lehrbücher von welchen Verlagen an der Schule genutzt werden. Konkrete Beispiele sind u.a. die Fachzeitschrift „PÄDAGOGIK“, die sich gezielt an Lehrkräfte und Studierende richtet und regelmäßig praxisnahe Empfehlungen u.a. zu Aspekten der schulischen Leistungsbeurteilung enthält (Heft 3/2014 – Fordern und Fördern; Heft 4/2014 – Feedback im Unterricht; Heft 9/2016 – Binnendifferenzierung) oder die gleichermaßen an Praktiker_innen wie Wissenschaftler_innen gerichteten Friedrich-Jahreshefte, die ebenfalls spezielle Schwerpunkthefte zur Leistungsbeurteilung enthalten (z.B. Jahresheft 1996 – Prüfen und Beurteilen; Jahresheft 2005 – Standards; Jahresheft 2006 – Diagnostizieren und Fördern). 5.2.1 Grundlegende Charakteristika der Bildungssysteme Deutschlands Aufgrund der föderalen Struktur der Bundesrepublik Deutschland und der Kulturhoheit der Bundesländer kann nicht von dem deutschen Bildungssystem gesprochen werden, mitunter bestehen zwischen den Bildungssystemen einzelner Bundesländer erhebliche Unterschiede – beispielsweise hinsichtlich der bestehenden Schulformen im Sekundarbereich und den darin möglichen Abschlussarten. Gleichzeitig existieren gerade im Hinblick auf die schulische Leistungsbeurteilung einige Vorga-

178

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

ben, die bundeslandübergreifend gelten (z.B. KMK-Richtlinien) und seit 2004/05 auch bundesweit geltende Bildungsstandards. Im Folgenden werden daher einige der grundlegenden Charakteristika der deutschen Bildungssysteme skizziert, um im Anschluss die Besonderheiten des nordrhein-westfälischen Bildungssystems hinsichtlich der Schulstruktur, Abschlussarten und schulischen Leistungsbeurteilung darzustellen (Kap. 5.2.2).

Entwicklung der gegliederten Schulstruktur Hinsichtlich der Schulstruktur können die deutschen Bundesländer auf eine lange Tradition gegliederter Bildungssysteme zurückblicken, deren Entstehungsgeschichte hier nur schlaglichtartig zusammengefasst werden kann (für eine ausführliche Darstellung vgl. u.a. Geissler, 2011; Herrmann & Müller, 2003; Lundgreen, 2000; Müller & Zymek, 1987). Während des späten 18. und vor allem im 19. Jahrhundert entwickelten sich in den deutschen Ländern verschiedene Schulformen, aus denen das spätere dreigliedrige Bildungswesen erwuchs: das niedere Schulwesen, die mittleren Schulen und die höheren Lehranstalten. Letztere waren mit der Vergabe des Abiturs eng an die Entstehung des deutschen Berechtigungswesens gekoppelt, indem sie den Hochschulbesuch nicht an das Bestehen einer Aufnahmeprüfung durch die Universitäten banden (wie in anderen Ländern üblich), sondern durch eine an den Gymnasien abzulegende Abschlussprüfung ihren Absolventen88 die allgemeine Hochschulreife (Abitur) bescheinigten, die zum Besuch einer Hochschule berechtigte. Ein weiteres wichtiges Kennzeichen der höheren Lehranstalten war daneben, dass die dort unterrichtenden Lehrkräfte ein erfolgreich absolviertes Staatsexamen vorweisen mussten, während die Lehrkräfte der Volksschulen lediglich eine seminaristische Ausbildung 88

Mädchen und Frauen war es erst zum Ende des 19. Jahrhunderts gestattet höhere Lehranstalten zu besuchen und auch der Besuch einer Hochschule war für sie erst ab Anfang des 20. Jahrhunderts möglich.

Schulische Leistungsbeurteilung in NRW

179

durchliefen. An den mittleren Schulen konnte ab 1927/31 die mittlere Reife als Berechtigung vergeben werden (vgl. Lundgreen, 2000, S. 143), die bis heute als Fachschulreife Bestand hat. Mit der Verabschiedung des Grundschulgesetzes von 1920 wurde erstmalig dem Nebeneinander verschiedener Schulformen eine einheitliche, für alle Kinder verpflichtende Grundschule gegenübergestellt. Die vierjährige Grundschule der Weimarer Republik war dabei Ergebnis langwieriger Auseinandersetzungen zwischen Befürworter_innen einer sechsjährigen Einheitsschule einerseits und Vertreter_innen des Philologenverbands89 andererseits, die sich für eine dreijährige Schule analog zu den bestehenden Vorklassen der Gymnasien ausgesprochen hatten (vgl. Zymek, 2008c, S. 78). Mit der Einführung der vierjährigen Grundschule vollzog sich auch endgültig der Wandel von der „Unterrichtspflicht“ zur „allgemeinen Schulpflicht“ (Zymek, 2008c, S. 79). Gleichzeitig blieb die „Buntscheckigkeit des höheren Schulwesens“ (Zymek, 2008c, S. 81) sowie die Vielgestaltigkeit der mittleren Schulen bis nach dem Zweiten Weltkrieg ein Wesensmerkmal der deutschen Bildungslandschaft, denn auch während der Zeit des Nationalsozialismus wurden trotz groß angekündigter Reformen keine entscheidenden Veränderungen an den bestehenden Schulstrukturen vorgenommen. Nach dem Zweiten Weltkrieg entstanden in den beiden deutschen Staaten unterschiedliche Bildungssysteme: in der DDR ein Einheitsschulsystem, in den Ländern der Bundesrepublik hingegen dreigliedrige Schulsysteme.90 Im Folgenden wird jedoch ausschließlich die Entwicklung der bundesrepublikanischen Bildungssysteme seit dem Ende des Zweiten Weltkriegs skizziert, da der

89

Der Philologenverband wurde 1903 als Interessenvertretung der Lehrkräfte der höheren Schulen gegründet und besteht bis heute unter dem Namen „Deutscher Philologenverband“ (DPhV) als Dachorganisation der Landesverbände der Bundesländer weiter. 90 Die Bezeichnung „Dreigliedrigkeit“ sollte jedoch nicht darüber hinwegtäuschen, dass es auch weiterhin eine Vielfalt lokaler Umsetzungen und Lösungsmöglichkeiten der formal vorgesehenen Schulstrukturen gab. Weiterhin werden mit diesem Begriff die Gesamtschulen, Schulen in privater Trägerschaft, sowie der sonderpädagogische und berufsbildende Bereich ausgeblendet (vgl. Zymek, 2013).

180

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

Fokus dieser Arbeit auf dem westdeutschen Bundesland NordrheinWestfalen liegt. In den Nachkriegsjahren bestand die große Herausforderung im Bildungsbereich zunächst in der Wiederaufnahme des geregelten Schulbetriebs angesichts massiver Kriegszerstörungen, ideologisch belasteter Lehrkräfte und den großen Flüchtlingsströmen aus den ehemaligen Ostgebieten des Deutschen Reiches. Die alliierte Nachkriegspolitik zielte zudem darauf einen erneuten „kulturellen Zentralismus zu verhindern und die föderale Struktur Deutschland[s] zu stärken“ (Zymek, 2008a, S. 99). Im Laufe der 1950er Jahre wurde das Volksschulwesen wiederaufgebaut, auf dem Land häufig wieder als einklassige ‚Zwergschulen‘ und in konfessioneller Gebundenheit (vgl. Baumert, Cortina & Leschinsky, 2005, S. 55). Mitte der 1960er Jahre schließlich wurde die Abschaffung der Volksschule beschlossen und durch die Grundschule als eigenständige Schulform und die neu gegründete Sekundarschulform der Hauptschule ersetzt, an der mit Abschluss des 9. Schuljahres der erste allgemeinbildende Schulabschluss, der Hauptschulabschluss, erworben werden konnte (bei besonderen Leistungen war auch der Erwerb des Qualifizierten Hauptschulabschlusses möglich). Die seit Ende der 1950er Jahre steigenden Geburtenzahlen führten zudem zu einem Ausbau der Mittelbzw. Realschulen, wobei die Bezeichnung „Realschule“ erst mit dem „Hamburger Abkommen“ flächendeckend eingeführt wurde (vgl. Baumert et al., 2005, S. 56). Die Gymnasien wiederum griffen die verschiedenen Schultypen der Vorkriegszeit wieder auf, so dass es in NRW beispielsweise zu einer verwirrenden Vielfalt unterschiedlicher Gymnasialtypen kam: „altsprachliche, mathematisch-naturwissenschaftliche, neusprachliche, musische, erziehungswissenschaftliche, sozialwissenschaftliche, und wirtschaftswissenschaftliche Gymnasien sowie Aufbauvarianten“ (Zymek, 2008a, S. 102). Das „Hamburger Abkommen“ von 1964 bestätigte schließlich die formale Vereinheitlichung der Schulformen in einer dreigliedrigen Struktur – bestehend aus Haupt- und Realschulen sowie Gymnasien – als flächendeckende Angebotsstruktur in den Bundesländern.

Schulische Leistungsbeurteilung in NRW

181

Ab Ende der 1960er Jahre entspann sich jedoch eine Grundsatzdebatte über die Frage der Beibehaltung des gegliederten Schulsystems oder der Einführung eines integrierten Schulsystems, deren Ausläufer bis heute in schulpolitischen Auseinandersetzungen nachwirken. Die häufig ideologisch geführten Diskussionen waren dabei auch ein Abbild der Auseinandersetzungen und Abgrenzungsversuche zwischen den politischen Systemen der BRD und der DDR. Die Kompromisslösung bestand schließlich in der weitgehenden Angleichung der Lehrpläne und damit einhergehend der Abschlussoptionen aller drei Schulformen sowie der Einführung der Gesamtschule als vierter Schulform in einigen Bundesländern, so auch in NRW (vgl. Zymek, 2008a, S. 102–103). Auch im Bereich der Sekundarstufe II wurden einschneidende Reformen durchgeführt: so löste die Reform der gymnasialen Oberstufe 1972 endgültig die bis dahin bestehende Typenvielfalt der Gymnasien auf, indem das Kurswahlsystem eingeführt wurde; und mit der Verabschiedung des Berufsbildungsgesetzes von 1969 wurde das duale System der Berufsausbildung etabliert. Ab Mitte der 1970er Jahre begann jedoch im Zuge der Bildungsexpansion die Akzeptanz des dreigliedrigen Systems zunehmend zu schwinden und die Haupt- und Realschulen verloren immer stärker an Attraktivität für breite Bevölkerungsschichten mit steigenden Bildungsaspirationen (vgl. Zymek, 2008a, S. 105). Die Gymnasien hingegen entwickelten sich von Eliteschulen für nur 10% eines Altersjahrgangs zur Schulform für die Mehrheit der Schüler_innen, insbesondere in Ballungsgebieten und Großstädten. Nachdem die ostdeutschen Bundesländer im Zuge der Wiedervereinigung zunächst die gegliederten Schulstrukturen ihrer westdeutschen Partnerländer – zumindest teilweise und in modifizierter Form – übernommen hatten, wurden in jüngster Zeit verschiedene Weichenstellungen hin zu einem zweigliedrigen Schulsystem vorgenommen, mit dem Gymnasium einerseits und einer alternativen Sekundarschulform, an der formal alle Abschlüsse der Sekundarstufe erworben werden können,

182

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

andererseits (vgl. KMK, 2014b).91 Der spätestens in Folge der PISABefunde auch öffentlich diskutierte Befund, dass der Zusammenhang zwischen sozialer Herkunft und Bildungserfolg von Schüler_innen in den gegliederten deutschen Bildungssystemen nach wie vor eklatant hoch ist (vgl. Ehmke & Baumert, 2008), führte unter anderem zu Bemühungen auf schulstruktureller Ebene eine formale Gleichstellung und erhöhte Durchlässigkeit zwischen den verschiedenen Schulformen anzustreben.

„Begabung“ und „Leistung“ als zentrale Konzepte Die Dreigliedrigkeit der bundesdeutschen Bildungssysteme wurde traditionell in einer „nativistischen Begabungstypologie“ (Baumert et al., 2005, S. 56) abgestützt, die eine Verknüpfung zwischen verschiedenen ‚Begabungstypen‘92, Schulformen und Berufsgruppen ermöglichte. Die Haupt- bzw. Volksschulen waren dabei für die „praktisch begabten unteren Volksschichten“ vorgesehen, die Gymnasien sollten die „abstrakt Begabten“ auf ein Universitätsstudium vorbereiten (Baumert et al., 2005, S. 56), die Realschulen wiederum für administrative Tätigkeiten u.ä. vorbereiten. Dieser Logik eines statischen Begabungsbegriffs, bei dem individuelle ‚Begabungen‘ (oder Potenziale) als angeboren gelten, entsprach die Aufteilung unterschiedlich ‚begabter‘ Schüler_innen auf verschiedene Schulformen, in denen erst eine optimale Förderung der verschiedenen Begabungstypen möglich wäre. Auch wenn die Idee natürlicher Begabung und Intelligenz als angeborene und vor allem messbare Qualität sich auch international in der ersten Hälfte des 20. Jahrhunderts in vielen Ländern verbreitete, fand sie doch in der gegliederten 91

Zur kritischen Einschätzung dieser Strukturveränderungen vgl. die Beiträge im ZfPädThementeil „Zweigliedrigkeit: Strukturwandel des Schulsystems?“ (Caruso & Ressler, 2013). 92 Zu den Wurzeln des statischen, naturalistischen Begabungsbegriffes in Vererbungstheorien des ausgehenden 19. Jahrhunderts sowie der Verflechtung reformpädagogischer Ideen mit eugenisch-völkischen Verständnissen von Begabung zu Beginn des 20. Jahrhunderts vgl. Hoyer (2012).

Schulische Leistungsbeurteilung in NRW

183

Schulstruktur der deutschen Länder ein besonders passendes Pendant. In einer Stellungnahme des Deutschen Ausschusses für das Erziehungsund Bildungswesen von 1959 wurde die (damals) verbreitete Begründung des dreigliedrigen Schulsystems unter Berufung auf „drei Haupttypen der Begabung“ folgendermaßen zusammengefasst: „Man ist bestrebt, den gegenwärtigen Schulaufbau zu erhalten, und macht dafür geltend, er habe sich bewährt. Die Dreiteilung in höhere Schulen, Volksschulen und Mittelschulen entspräche den drei Hauptschichten der Berufe, die sich im modernen Leben herausgebildet hätten: einer geistig führenden, einer ausführenden und einer dazwischen vermittelnden Schicht praktischer Berufe mit erhöhter Verantwortung. Die Dreiteilung werde auch den drei Haupttypen der Begabung gerecht: einem theoretischen, einem praktischen und einem theoretisch-praktischen Typ.“ (Deutscher Ausschuss für das Erziehungs- und Bildungswesen, 1966, S. 68)

Das statische Begabungskonzept half so einerseits bei der Konservierung der gegliederten Schulstruktur und lieferte andererseits eine legitime Begründung für die unterschiedlichen Bildungs- und daraus folgenden Lebenschancen unterschiedlich ‚begabter‘ Schüler_innen. Indem entsprechend der meritokratischen Idee schulische Selektion nicht mehr aufgrund der sozialen Herkunft und vererbter Privilegien stattfand, sondern individuelle Leistung und Leistungsfähigkeit (die sich in unterschiedlichen ‚Begabungen‘ äußerten) zu den relevanten Selektionskriterien wurden, konnten „Leistungsunterschiede als natürliche Begabungsunterschiede interpretiert und als ‚gerechte‘ Basis für die differenzierenden Laufbahnzuweisungen genommen werden“ (Holzkamp, 1993, S. 453; vgl. zur Naturalisierung von Bildungsunterschieden auch Solga, 2013). Durch die Verknüpfung von biologisch bedingten und sozial vererbbaren Komponenten von Begabung gelang es weiterhin „problemlos als Befürworter von Begabtenselektion und Begabungsförderung auf[zu]treten und den ‚Aufstieg der Begabten‘ [zu] fordern, ohne die herkömmlichen Schulstrukturen und die herkunftsorientierten Verteilungsmechanismen in Frage zu stellen“ (Hoyer, 2012, S. 17). Dass ‚Begabungen‘ dabei nicht direkt beobacht- oder messbar, sondern immer auch Zuschreibungen von außen sind, tat der Attraktivität des Begabungsmythos keinen Abbruch (Hoyer, 2012). Lenhardt zeigt auf, wie der

184

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

sogenannte Begabungsglaube eine vollständige Umsetzung des sogenannten ‚Leistungsprinzips‘ im deutschen Bildungssystem verhindert hat: So würden „die deutschen Schulen das Leistungsprinzip nur mit erheblichen Einschränkungen zur Wirkung bringen. Sie reagieren auf schwache Leistungen ihrer Schüler mit der Rücknahme des Leistungsanspruchs und mit Beschränkungen der Lernmöglichkeiten. Die Bildung leistungsschwacher Schüler gilt als aussichtslos und wirtschaftlich auch als unnötig. Sie ist letztlich nicht gewollt“ (Lenhardt, 2002, S. 6). Der Begabungsglaube zeige sich als besonders wirkmächtig im Umgang mit leistungsschwachen Schüler_innen: deren Leistungsmängel könnten so durch einen Mangel an Begabung begründet werden und fielen nicht auf das pädagogische (Un-)vermögen der Lehrkräfte zurück. Durch verschiedene Selektionsmechanismen konnten die schwächeren Schüler_innen so begründet aus der Klasse oder Schule entfernt werden, die homogene Lerngruppe wiederhergestellt und das professionelle Selbstbild der Lehrkräfte unbeschadet aufrechterhalten werden. Gleichzeitig führe der Begabungsglaube auch bei vermeintlich leistungsschwächeren Schüler_innen zu verstärkter Leistungsverweigerung: indem die schwächeren Leistungen auf natürliche Begabungsmängel zurückgeführt werden, sähen diese Schüler_innen sich einer ausweglosen Situation gegenüber. Um ein letztes Stück Handlungsfähigkeit zurückzuerlangen, könnten diese Schüler_innen nur noch auf weitere Anstrengungen verzichten, um die daraus folgenden schlechten Noten als Produkt ihrer bewussten Entscheidung und persönlichen Unabhängigkeit darstellen zu können: „So lernt ein Teil der Schüler in Übereinstimmung mit Schule und Gesellschaft, dass Bildung ihre Sache nicht ist“ (Lenhardt, 2002, S. 19). Mit dem Schlagwort der integrierten Gesamtschule als einer „demokratischen Leistungsschule“ (Sander, Rolff & Winkler, 1967) verband sich in den 1960er bis 1980er Jahren das Versprechen des Ausgleichs herkunftsbedingter Nachteile durch die Institution Schule. Leitendes Prinzip sollte eine rein an Leistungen orientierte Schule sein, die jedem und jeder Schüler_in Leistungspotenziale gleichermaßen zusprach, deren Entwicklung jedoch von den schulischen Angeboten einerseits und der individuellen Anstrengungsbereitschaft andererseits abhingen. Über den

Schulische Leistungsbeurteilung in NRW

185

„Sinn und Unsinn des Leistungsprinzips in der Erziehung“ (Klafki, 1974) wurde in dieser Phase heftig gestritten, die Idee eines „pädagogischen Leistungsprinzips“ konnte sich jedoch nur bedingt durchsetzen. Nicht zuletzt die außergewerkschaftlichen Interessenvertretungen der Lehrkräfte spiel(t)en bei der Fortführung des Begabungsglaubens eine zentrale Rolle. So wies der Deutsche Philologenverband (DPhV), die Interessenvertretung der Gymnasiallehrkräfte, bereits in den 1950er Jahren darauf hin, dass die „Begabungsreserve des deutschen Volkes ausgeschöpft“ sei und eine weitere Expansion der Gymnasien daher nicht notwendig wäre – und dass, obwohl die Abiturientenquote damals noch unter 10% der Schüler_innenschaft lag (zitiert nach Lenhardt, 2002, S. 17). Auch in seinen aktuellen Selbstdarstellungen wird die Idee der verschiedenen Begabungen, die ein gegliedertes Schulsystem erfordern würden, fortgeführt: „Der DPhV setzt sich für ein begabungsgerechtes, gegliedertes Schulwesen unter dem Prinzip des Förderns und Forderns ein“.93 Der Deutsche Lehrerverband, eine ebenfalls eher konservative Dachorganisation zahlreicher nichtgewerkschaftlicher Lehrkraftverbände, setzt sich ebenso auch heute noch für ein „vielfältig gegliedertes Schulwesen“ ein.94 Im Zusammenhang mit sogenannter „Hochbegabung“ und der entsprechenden Förderung von als „hochbegabt“ wahrgenommenen Schüler_innen taucht das Begabungskonzept auch in zeitgenössischen Debatten immer wieder auf und führt teilweise zu vereinfachenden Verknüpfungen des Begabungsbegriffs mit den Konzepten der Leistung bzw. Leistungsfähigkeit (vgl. u.a. jüngst BMBF, 2015), worin sich die nach wie vor hohe Attraktivität des Begabungsbegriffs im deutschsprachigen Raum äußert.

93

Zu finden auf der Homepage des DPhV http://www.dphv.de/organisation/portrait.html [16.12.2016]. 94 Zitat entsprechend der Selbstdarstellung auf der Homepage in der Rubrik „Wir über uns“, http://www.lehrerverband.de/ [16.12.2016].

186

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

Die Homogenisierung der Lerngruppen Klaus-Jürgen Tillmann spricht unter Verweis auf Johann Friedrich Herbart (1776-1841) und Ernst Christian Trapp (1745-1810) für die deutsche Schule von einer langen Tradition „der Ausrichtung des Schulunterrichts auf ein fiktives Mittelmaß der Köpfe“ (Tillmann, 2008, S. 33). Gemeint sind damit neben der Organisation des Lernens in Jahrgangsklassen verschiedene in das gesamte Bildungssystem eingebaute Mechanismen, die allesamt auf die Herstellung einer möglichst homogenen Lerngruppe und einer Orientierung an eben jenen „Mittelköpfen“ (E. C. Trapp) im Unterricht ausgerichtet sind. Grundidee ist es dabei möglichst altershomogene Lerngruppen zu schaffen, von denen angenommen wird, dass sie auch über eine gewisse Leistungshomogenität verfügen bzw. ein ähnliches Leistungspotenzial verfügen. Die Homogenisierungsstrategien im deutschen Bildungssystem umfassen dabei konkret: erstens, die Unterrichtung in Jahrgangsklassen, ausgehend von der Annahme, dass altersgleiche Kinder auf einem ähnlichen Entwicklungsstand stehen und gemeinsam fortschreitend unterrichtet werden können und sollten. Zweitens, das Zurückstellen von Kindern vor der Einschulung mit dem Verweis auf eine fehlende ‚Schulreife‘. Diese Kinder sollen durch einen längeren Verbleib im Kindergarten vor einer Überforderung durch die Schule bewahrt werden, allerdings werden auf diese Weise auch mögliche ‚Problemkinder‘ aus der Regelklasse ferngehalten. Drittens, das Sitzenbleiben bzw. die Klassenwiederholung innerhalb einer Schulform. Schüler_innen, die hinter den Erwartungen an die mittlere Leistungsentwicklung zurückbleiben und im „gemeinsam-fortschreitenden Unterricht nicht mithalten können“ (Tillmann, 2008, S. 34), sollen durch die Klassenwiederholung ihre Lernrückstände aufholen und sich an das mittlere Leistungsniveau der Klassenstufe anpassen.95 Viertens, die Zuweisung eines sonderpädagogischen Förderbedarfs und daraus folgender 95

Und dies, obwohl wiederholt auf das Fehlen empirischer Belege für die leistungssteigernde Wirkung von Klassenwiederholungen hingewiesen wurde (vgl. u.a. Einsiedler & Glumpler, 1989; Krohne & Tillmann, 2006; Ehmke, Drechsel & Carstensen, 2008).

Schulische Leistungsbeurteilung in NRW

187

separater Beschulung. Auch hier ist das Ziel ein doppeltes: einerseits diejenigen Schüler_innen zu konzentrieren, die einer besonderen Förderung bedürfen, andererseits die Regelschulklassen von eben jenen schwierigeren Schüler_innen zu entlasten. Fünftens, die nach Leistung gegliederten weiterführenden Schulen. Auch hier liegt wieder die Annahme der unterschiedlichen Begabungen und Leistungsfähigkeiten zugrunde, nach denen eine Zuordnung von Schüler_innen zu verschiedenen Schulformen, die unterschiedliche Abschluss- und anschließende Ausbildungsmöglichkeiten bieten, erfolgt. Sechstens, die ‚Abschulung‘ von Schüler_innen von einem Typus weiterführender Schule zum ‚nächstniedrigeren‘ Schultypus. Die politisch gewollte Leistungsdifferenzierung der Schüler_innenschaft in verschiedenen Schulformen, die auf eine Homogenisierung der Lerngruppen innerhalb einer Schulform abzielte, war immer auch schon gekoppelt an eine soziale Differenzierung, die die Herausbildung „differenzielle[r] Lern- und Entwicklungsmilieus“ (Baumert, Stanat & Watermann, 2006b) zwischen Schulformen beförderte, die insbesondere für die Schüler_innen der Hauptschule zu einer strukturellen Benachteiligung führt (Baumert et al., 2006b, S. 171). Daneben konnten empirische Untersuchungen immer wieder zeigen, dass es hinsichtlich der Schüler_innenleistungen verschiedener Schulformen große Überlappungsbereiche auf der Individualebene gibt (vgl. Lehmann, Peek, Pieper & von Stritzky, 1995; Lehmann et al., 2002; Baumert et al., 1997; Baumert et al., 2001), d.h. dass eine Leistungsdifferenzierung nach Schulformen nur bedingt und eine Verteilung der Schüler_innen auf die Schulformen auf der Grundlage leistungsunabhängiger Faktoren (wie soziale oder ethnische Herkunft) stattfindet. Gleichzeitig zeigten die Ergebnisse der PISA-Studien und nachfolgenden Bundesländervergleiche, dass die Unterschiede hinsichtlich der durchschnittlichen Schüler_innenleistungen und der sozialen Herkunft der Schülerschaft teilweise größer zwischen Einzelschulen derselben Schulform sind als zwischen Schulen verschiedener Schulformen (vgl. Baumert, Stanat & Watermann, 2006a). Die Idee des gegliederten Schulwesens mit einer ‚begabungsgerechten‘ oder leistungsbezogenen Aufteilung sowie spezifischen Förderung der Schü-

188

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

ler_innen in homogenen Lerngruppen gerinnt angesichts solcher Befunde zur „Fiktion“ (Tillmann, 2004).

Bildungssystem und Selektivität Laut Radtke (2004) ist es vor allem eine gewisse „Normalitätserwartung“ der Institution Schule gegenüber den Schüler_innen, die sicherstellen soll, dass die Schule mit ihren Schüler_innen „erfolgreich arbeiten kann“ (Radtke, 2004, S. 157). Diese Normalitätserwartung schließt beispielsweise das Beherrschen der Unterrichtssprache Deutsch ein oder die erfolgreiche Absolvierung vorhergehender Bildungsabschnitte. Schüler_innen, die dieser Normalitätserwartung (aus welchen Gründen auch immer) nicht entsprechen können, würden durch das System Schule aussortiert – durch Rückstufung oder Nichtversetzung, Überweisung an andere Schulformen etc. Als Begründung für diese „Delegation von Problemen bzw. Problemkindern“ (Radtke, 2004, S. 158) werde dann jedoch das Argument der spezielleren Förderung bzw. das Eingehen auf die besonderen Bedürfnisse der entsprechenden Kinder und Jugendlichen in spezialisierten Einrichtungen angeführt. Es sind vor allem sozial benachteiligte Kinder und Jugendliche, die systematisch in den deutschen Bildungssystemen benachteiligt wurden und werden. Zwar haben sich die Differenzlinien im Laufe der Jahre verschoben, so dass aus dem sinnbildlichen „katholischen Arbeitermädchen vom Lande“ (Peisert, 1967) der ersten Bildungsreformphase der 1960er Jahre der „Migrantensohn aus bildungsschwachen Familien“ (Geißler, 2013, S. 95) wurde, die selektive Grundtendenz bleibt jedoch weiterhin bestehen. Besonders eklatant zeigt sich die kumulative Wirkung verschiedener Homogenisierungsstrategien an den Förderschulen: so sind beispielsweise Kinder, die der Förderschule Lernen zugewiesen werden, überdurchschnittlich häufig vom Schulbesuch zurückgestellt worden und/oder sitzen geblieben im Vergleich zu Schüler_innen an Haupt- und Realschulen bzw. Gymnasien (vgl. Gomolla, 2013, S. 10; Bellenberg, 1999, S. 47). Diese biografische Aufschichtung ungleicher Lernvorausset-

Schulische Leistungsbeurteilung in NRW

189

zungen (vgl. Krüger, Rabe-Kleberg, Kramer & Budde, 2010, S. 9) trifft aber auch überproportional für Kinder mit Migrationshintergrund zu, die durch die gegliederte, selektive Schulstruktur einerseits (vgl. Radtke & Gomolla, 2002; Kronig, 2003) sowie den „monolingualen Habitus“ (Gogolin, 2008) der Schulen und ihrer Akteure andererseits institutionell benachteiligt werden. Seit der Ratifizierung der UN-Behindertenrechtskonvention durch Deutschland im Jahr 2009 wird das Thema Inklusion bzw. inklusive Schule intensiv diskutiert und u.a. zu führte schulstrukturellen Veränderungen in den einzelnen Bundesländern. Der Anteil der Schüler_innen mit einem sogenannten „sonderpädagogischen Förderbedarf“ lag im Schuljahr 2014/15 insgesamt bei rund 6% der Schüler_innenschaft bundesweit (Statistisches Bundesamt, 2016, S. 23), wobei die Verfahren und Kriterien zur Bestimmung eines solchen Förderbedarfs in den Bundesländern sehr unterschiedlich ausfallen können. Allgemein lässt sich ein deutlicher Anstieg der Anzahl der Schüler_innen mit einem sonderpädagogischen Förderbedarf an allgemeinbildenden Schulformen (ausgenommen Förderschulen) seit dem Schuljahr 2004/05 erkennen, was mit einer Öffnung der „Regelschulen“ und einem zunehmend inklusiveren Selbstanspruch der Bildungssysteme erklärt wird. Auf die Situation der Förderschulen in NRW gehe ich im Kapitel 5.2.2 gesondert ein. Die Homogenisierungstendenzen der deutschen Bildungssysteme spiegeln sich auch in den Haltungen der in ihnen tätigen Lehrkräfte: So sei eine gewisse „Homogenitätsmentalität“ unter deutschen Lehrkräften verbreitet, die einen „strukturierten wie auch strukturbildenden Raum für Wahrnehmungsprozesse der Akteure“ (Reh, 2005, S. 77) bilde, die in enger Verbindung zur historischen Entwicklung der Schulstrukturen und Professionalisierung der Lehrkräfte entstanden sei. Auch in aktuelleren Untersuchungen lässt sich zeigen, dass Lehrkräfte in Deutschland ihre Schüler_innen stark homogenisierend wahrnehmen und beschreiben, eine relativ stabile Orientierung an Defiziten aufweisen und Heterogenität grundsätzlich eher problematisierend thematisieren (vgl. u.a. Schieferdecker, 2016, S. 116–121; Budde, 2010). Dieser problematisierende Blick auf Heterogenität wäre dabei eine Grundvoraussetzung professio-

190

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

nellen Handelns für die befragten Lehrkräfte: indem das eigene Scheitern an zu hohen Idealen einer gleichzeitig zu großen Heterogenität seitens der Schüler_innen gegenübergestellt wird, erfolgt eine Komplexitätsreduktion, die pädagogisches professionelles Handeln erst wieder möglich macht. „Heterogenität als Problem“ stelle damit ein „konstituierendes Element der Handlungspraxis von Lehrerinnen und Lehrern dar“ (Schieferdecker, 2016, S. 121). Miller konnte in ihrer Befragung von Lehrkräften an Grund- und Förderschulen in NRW diese „Homogenitätsmentalität“ belegen und kommt zu dem Schluss: „Der in der pädagogischen Fachdiskussion fast programmatisch positiv besetzte Heterogenitätsbegriff scheint in der Berufspraxis von Lehrerinnen und Lehrern deutlich differenzierter und stärker unter dem Realisierungs- und Belastungsaspekt wahrgenommen zu werden“ (Miller, 2013, S. 238).

„Neue Steuerung“ – bildungspolitische Veränderungen seit den 2000ern In Folge der öffentlichen aber auch schulpolitischen Debatten um die Ergebnisse der internationalen Schulleistungsstudie PISA 2000 wurden bundesweit eine Reihe von Entwicklungen angeschoben, die eine Neuorientierung der deutschen Schulentwicklungspolitik und stärkere Hinwendung zu einer Outputsteuerung zur Folge hatten (vgl. Altrichter & Maag Merki, 2010). Im deutschen Kontext wird hierfür häufig der Begriff „Neue Steuerung“ verwendet (vgl. Bellmann, 2006; Bellmann & Weiß, 2009), obwohl die Instrumente der an accountability und educational output orientierten Steuerung von Bildungssystemen im internationalen Kontext teilweise auf eine sehr lange Tradition verweisen und so neu nicht sind (Waldow, 2012b). Die 2004/05 in Deutschland eingeführten und bundesweit gültigen Bildungsstandards sowie die daran anschließenden Vergleichsarbeiten sollen vor allem als Instrument der Systemevaluation und für die Unterrichtsentwicklung dienen – und nicht als Diagnoseinstrumente auf der Individualebene (vgl. KMK, 2006). Auf beide Instrumente gehe ich Im folgenden Kapitel ausführlicher ein.

Schulische Leistungsbeurteilung in NRW

191

5.2.2 Schulformen, Abschlussarten und schulische Leistungsbeurteilung in NRW Das nordrhein-westfälische Pflichtschulsystem besteht zunächst aus einer vierjährigen Grundschule, die von allen Kindern ab dem 6. Lebensjahr96 besucht wird. Nach dem Besuch der Grundschule wählen die Schüler_innen und deren Eltern zwischen fünf weiterführenden Schulformen innerhalb des stark gegliederten Schulsystems (vgl. Abb. 7). Mit dem Halbjahreszeugnis der vierten Klasse werden von den Grundschullehrkräften sogenannte Schulformempfehlungen auf der Grundlage der Lernentwicklung in den ersten Grundschuljahren erteilt. Diese Schulformempfehlung soll die anschließende Schulwahl der Eltern unterstützen, ist aber nicht bindend wie in anderen deutschen Bundesländern, d.h. das Elternwahlrecht wiegt schwerer als die Empfehlung durch die Lehrkraft.

96

Die Einschulung erfolgt in der Regel zum 01. August für alle Kinder, die bis zum 30.September des Jahres 6 Jahre alt werden. Eine vorgezogene oder um ein Jahr verschobene Einschulung ist unter bestimmten Voraussetzungen ebenfalls möglich (vgl. MSW, 2016a).

Primarstufe

5 Institutionelle Rahmung schulischer Leistungsbeurteilung Jgst.

Jgst.

Gymnasiale Oberstufe

Q2

am Gymnasium

13

an der Gesamtschule

12

Eph

Förderschule

Realschule

Sekundarschule

9

Gesamtschule

11

10

8 7 6 5

Berufskolleg

Hauptschule

Q1

Gymnasium

Sekundarstufe I

Sekundarstufe II

192

4 3 2

Grundschule

Förderschule

1

Abb. 7 – Aufbau des Schulsystems in Nordrhein-Westfalen; eigene Darstellung

Neben den drei klassischen Schulformen des gegliederten Systems – Hauptschule, Realschule und Gymnasium – existiert seit den 1970er97 Jahren die Gesamtschule an vielen Standorten im Bundesland, eine Schulform, die mehrere Bildungsgänge unter einem Dach vereint und an der alle Abschlüsse der Sekundarstufe I und II erlangt werden können. Seit 2011 besteht zusätzlich die Möglichkeit, eine Sekundarschule98 zu besuchen. Diese Schulform verbindet ebenfalls alle Bildungsgänge der Sekundarstufe I, für den Erwerb der allgemeinen Hochschulreife (Abitur) bestehen hier verbindliche Kooperationen mit der Oberstufe eines 97

Das Kultusministerium hatte 1969 den „Schulversuch Gesamtschulen“ mit sieben Schulen gestartet, bis zum Ende der Schulversuchszeit 1982 existierten bereits 32 solcher Schulen. Mit der Verwaltungsrechtsänderung von 1981 wurde die Gesamtschule als Regelschule der Sekundarstufe I anerkannt (vgl. Arbeitskreis Gesamtschule in NordrheinWestfalen e.V., 2011). 98 Die Sekundarschule ist als Kompromisslösung im Rahmen des sogenannten „Schulfriedens“ zwischen CDU, SPD und Bündnis90/Die Grünen eingeführt worden (vgl. MSW, 19.07.2011).

Schulische Leistungsbeurteilung in NRW

193

Gymnasiums, einer Gesamtschule bzw. einem Berufskolleg. Grundsätzlich sind der Erwerb des Hauptschulabschlusses nach Klasse 9 bzw. des erweiterten Hauptschulabschlusses nach Klasse 10 sowie der mittlere Schulabschluss (Fachoberschulreife) nach Klasse 10 an allen fünf Schulformen möglich. Der Bildungsgang zum Abitur (Allgemeine Hochschulreife) ist nur an Gymnasien, beruflichen Gymnasien99, Gesamtschulen oder Sekundarschulen möglich und dauert acht Jahre an Gymnasien (G8) bzw. neun Jahre an Gesamt- und Sekundarschulen sowie beruflichen Gymnasien (G9).100 Mit der Einführung des Abiturs nach acht Schuljahren (G8) im Jahr 2005 veränderte sich auch die Struktur der Sekundarstufen I und II am Gymnasium. Die Sekundarstufe I umfasst dort nun die Klassen 5 bis 9, wobei die Klassen 5 und 6 als sogenannte Erprobungsstufe und die Klassen 7 und 8 als Mittelstufe bezeichnet werden. Die Sekundarstufe II – oder gymnasiale Oberstufe – beginnt mit der Einführungsphase in die gymnasiale Oberstufe in Klasse 10, gefolgt von der Qualifikationsphase in Klasse 11 (Q1) und Klasse 12 (Q2). Nach Abschluss der 11. Klasse ist zudem der Erwerb des schulischen Teils der Fachhochschulreife möglich, dieser Abschluss berechtigt zum Studium an einer Fachhochschule. Die berufliche Bildung findet an sogenannten Berufskollegs statt, die verschiedene Schulformen und damit Bildungsgänge unter einem Dach vereinen: die klassischen Berufsschulen, an denen der schulische Teil der dualen Berufsausbildung stattfindet; die Berufsfachschulen, an denen der gleichzeitige Erwerb beruflicher Qualifikationen und allgemeinbil99

Das Berufskolleg bzw. berufliche Gymnasium bietet 29 Bildungsgänge mit Abituroption in wirtschaftlich-kaufmännischen, technischen, natur- und sozialwissenschaftlichen Ausrichtungen an, in denen neben der Hochschulreife auch berufliche Kenntnisse oder ein Berufsabschluss erworben werden können (Doppelqualifikation) (vgl. Disdorn-Liesen, 2016, S. 31–33); https://www.schulministerium.nrw.de/docs/Schulsystem/Schulformen/Berufskolleg/ [12.09.2016]. 100 Allerdings führten bereits 2011 13 Gymnasien im Rahmen eines Schulversuchs wieder das G9 ein. Seit Februar 2017 läuft außerdem ein Volksbegehren, das die Abschaffung des als „Turbo-Abitur“ verschrienen G8 und eine Ausweitung der neunjährigen Schulzeit bis zum Abitur auf alle weiterführenden Schulen landesweit erreichen will (vgl. https://www.g9-jetzt-nrw.de/[16.04.2017]).

194

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

dender Schulabschlüsse möglich sind; die Fachschulen und Fachoberschulen, die neben der beruflichen Qualifikation auch zur Fachhochschulreife bzw. allgemeinen Hochschulreife führen; sowie die beruflichen Gymnasien, die zur beruflichen Qualifikation und der allgemeinen Hochschulreife führen. Daneben sind auch teilschulische Weiterqualifikationen für Berufstätige möglich bzw. finden auch Berufsvorbereitungsmaßnahmen für Schulabgänger_innen ohne Schulabschluss am Berufskolleg statt (vgl. MSW, 2015a). Neben dem allgemeinbildenden und beruflichen Bildungssystem existiert in NRW weiterhin ein Förderschulsystem, in dem Schüler_innen mit einem sogenannten „sonderpädagogischen Förderbedarf“ unterrichtet werden. Dieser „sonderpädagogische Förderbedarf“ von Schüler_innen wird in einem schulamtlichen Feststellungsverfahren101 ermittelt und nach verschiedenen Förderschwerpunkten unterschieden: Förderschwerpunkt Lernen; Förderschwerpunkt emotionale und soziale Entwicklung; Förderschwerpunkt Sprache; Förderschwerpunkte Hören und Kommunikation; Förderschwerpunkt Sehen; Förderschwerpunkt geistige Entwicklung; Förderschwerpunkt körperliche und motorische Entwicklung; und Schwerstbehinderung. Im Zuge der durch die Ratifizierung der UN-Behindertenrechtskonvention von 2009 eingeleiteten Maßnahmen in Richtung eines inklusiveren Schulsystems wurden auch in NRW verschiedene Beschlüsse gefasst, die letztlich zur Verabschiedung des „Ersten Gesetzes zur Umsetzung der VN-Behindertenrechtskonvention“ vom 16. Oktober 2013 führten. Darin wurde u.a. mit dem Konzept des „Gemeinsamen Lernens“ versucht, die institutionelle Trennung zwischen Förderschulen und ‚Regelschulen‘ aufzulösen. Allerdings besucht nach wie vor der größte Anteil der Schüler_innen mit einem sonderpädagogischen Förderbedarf eine Förderschule (rund 80 % im Schuljahr 2009/10, vgl. Klemm & Preuss-Lausitz, 2011, S. 143). Auch die finanzielle Ausstattung sowie Versorgung mit sonderpädagogisch geschultem Personal 101

Das Feststellungsverfahren wird in der „Ausbildungsordnung sonderpädagogische Förderung (AO-SF)“ geregelt, im allgemeinen Sprachgebrauch ist daher auch die Rede von AOSF-Verfahren.

Schulische Leistungsbeurteilung in NRW

195

wird als verbesserungswürdig eingestuft. Bemängelt wird weiterhin die Konzentration einzelner Förderschwerpunkte an bestimmten Schulformen, d.h. dass Schüler_innen mit einem attestierten Förderbedarf an Hauptschulen überrepräsentiert sind, an Gymnasien hingegen deutlich weniger AOSF-Schüler_innen unterrichtet werden. Die Selektivität des gegliederten Bildungssystems setze sich auch an dieser Stelle fort (vgl. ausführlich zu diesem Punkt Klemm & Preuss-Lausitz, 2011). In den 1990er Jahren wurde in NRW mit der Einsetzung einer Bildungskommission (Bildungskommission NRW, 1995) ein steuerungspolitischer Paradigmenwechsel eingeleitet, bei dem u.a. die Verantwortungsverlagerung auf die Einzelschule und lokale Ebene vorangetrieben und die Entwicklung sogenannter „regionaler Bildungslandschaften“ in „staatlich-kommunaler Verantwortungsgemeinschaft“ befördert wurden (vgl. Zymek, Wendt, Hegemann & Ragutt, 2011, S. 498). Ein Modellversuch „Selbstständige Schule“ wurde von 2002 bis 2008 als Kooperation des Ministeriums für Schule und Weiterbildung NRW und der Bertelsmann Stiftung ebenfalls durchgeführt und seit der Verabschiedung des neuen Schulgesetzes 2006 werden alle Schulen in NRW als „eigenverantwortliche Schulen“ (§3 SchulG NRW) adressiert. Damit einher geht die eigenständige Umsetzung der Vorgaben des Schulgesetzes im lokalen Schulkontext sowie die Verantwortung für die Festlegung schulinterner Qualitätsentwicklungsmaßnahmen samt deren Überprüfung. Verbindlich geregelt sind hingegen die Lernziele durch die Kernlehrpläne, deren Erreichen durch die regelmäßige Überprüfung durch die zentralen Prüfungen, die Lernstandserhebungen sowie die Schulinspektion, in NRW Qualitätsanalyse genannt. Auf diese Instrumente gehe ich weiter unten gesondert ein.

Bundeslandübergreifende Regelungen und Grundlagen der schulischen Leistungsbeurteilung in NRW im Sekundarschulbereich Die schulische Leistungsbeurteilung in Deutschland ist der KMK zufolge grundsätzlich eine pädagogische Frage, die durch rechtliche Vorgaben

196

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

und Regularien gerahmt wird. Der einzelnen Lehrkraft wird dabei ein Ermessens- und Beurteilungsspielraum eingeräumt (vgl. KMK, 2014a, S. 126), der gemeinhin als „pädagogische Freiheit“ bezeichnet wird. In Nordrhein-Westfalen wird diese alleinige Verantwortung der Lehrkräfte in der Allgemeinen Dienstordnung für Lehrkräfte in NRW (ADO) festgehalten, die unter Berufung auf die „pädagogische Freiheit“ besagt: „Es gehört zum Beruf der Lehrer und Lehrerinnen, in eigener Verantwortung und pädagogischer Freiheit die Schüler und Schülerinnen zu erziehen, zu unterrichten, zu beraten und zu beurteilen“ (MSW, 01.07.2011, §4, 1). Hier drücken sich schon die große professionelle Autonomie und die damit einhergehenden Entscheidungs- und Deutungsspielräume für die nordrhein-westfälischen Lehrkräfte aus, die in Kapitel 6.3 am empirischen Material weiter ausgeführt werden. Von den Lehrkräften durchgeführte Beurteilungen sollen dabei von den Schüler_innen als „fair und gerecht“ (KMK, 2000, S. 3) erfahren werden, worin genau sich diese Fairness oder Gerechtigkeit ausdrückt und wie dieses zu erreichen wäre, wird allerdings offen gelassen. Lehrkräfte sollen darüber hinaus den Schüler_innen helfen „ihre eigene Leistungsfähigkeit und Anstrengungsbereitschaft einzuschätzen und zu steigern“ (KMK, 2000, S. 3). Die Grundlage der schulischen Leistungsbeurteilung stellen dafür „alle vom Schüler im Zusammenhang mit dem Unterricht erbrachten Leistungen, insbesondere schriftliche Arbeiten, mündliche Beiträge und praktische Leistungen“ (KMK, 2014a, S. 124) dar, vereinfacht gesagt: die ‚gezeigten‘ Leistungen der Schüler_innen. Die Gewichtung der verschiedenen Beurteilungsbereiche kann dabei zwischen den Schulformen und innerhalb der Unterrichtsfächer unterschiedlich ausfallen (dazu ausführlicher weiter unten in diesem Kapitel). Mit den zum Schuljahr 2006/07 eingeführten Zentralen Abschlussprüfungen in Klasse 10 bzw. den Zentralen Abiturprüfungen in Klasse 12 bzw. 13 wurden zwar in gewisser Weise auch externe Prüfungselemente in das bis dahin dezentral organisierte Beurteilungssystem eingeführt, allerdings haben die Beurteilungen der Lehrkräfte nach wie vor mehr Gewicht, wenn es um die versetzungsrelevanten Zeugnisnoten und Schulabschlüsse geht.

Schulische Leistungsbeurteilung in NRW

197

Die sechsstufige Notenskala ist in allen 16 Bundesländern verbindlich und wurde seit ihrer Verabschiedung im Hamburger Abkommen 1964 nicht mehr verändert (vgl. KMK, 1971). Die folgenden Bezeichnungen für die Notenstufen gelten seitdem bundesweit102: Note 1 = sehr gut, Note 2 = gut, Note 3 = befriedigend, Note 4 = ausreichend, Note 5 = mangelhaft, Note 6 = ungenügend. Für die gymnasiale Sekundarstufe II in NRW wird diese sechsstufige Notenskala zusätzlich in ein 15stufiges Punktesystem mit Notentendenz umgerechnet und die Noten anhand folgender Notendefinitionen voneinander unterschieden (vgl. Abb. 8): Note

Sehr gut Gut Befriedigend Ausreichend Schwach ausreichend Mangelhaft

Punkte nach Notentendenz (15-13) (12-10) (9-7) (6-5) (4)

Notendefinition

Die Leistungen entsprechen den Anforderungen in besonderem Maße. Die Leistungen entsprechen den Anforderungen voll. Die Leistungen entsprechen den Anforderungen im Allgemeinen. Die Leistungen weisen zwar Mängel auf, entsprechen aber im Ganzen noch den Anforderungen. Die Leistungen weisen Mängel auf und entsprechen den Anforderungen nur noch mit Einschränkungen.

Die Leistungen entsprechen den Anforderungen nicht, lassen jedoch erkennen, dass die notwendigen Grundkenntnisse vorhanden sind und die Mängel in absehbarer Zeit behoben werden können. Ungenü(0) Die Leistungen entsprechen den Anforderungen nicht gend und selbst die Grundkenntnisse sind so lückenhaft, dass die Mängel in absehbarer Zeit nicht behoben werden können. Abb.8 – Notenstufen, Punkte und Notendefinitionen gemäß APO-GOSt (§16), NRW

102

(3-1)

Die Notenskala in der DDR enthielt nur fünf Notenstufen (1-5, wobei 1 die beste und 5 de schlechteste Note darstellte), die sechsstufige Notenskala wurde in den neuen Bundesländern ab 1990 übernommen.

198

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

Mit dem KMK-Beschluss vom 03.10.1968 wurden diese Notenstufen verabschiedet und damit eine Abwendung von den bis dahin gültigen Definitionen der Notenstufen vollzogen, die sich an den durchschnittlichen Leistungen orientierten. Insofern wird hier von einem Wechsel von der sozialen hin zu einer kriterialen Bezugsnorm gesprochen (Sacher, 2001, S. 47–48). Allerdings finden sich kaum weiterführende Hinweise in den deutschen Regularien bezüglich der bei der Leistungsbeurteilung anzulegenden Bezugsnorm, und wie in der Einleitung bereits ausgeführt, lässt sich eine gewisse Tendenz zur sozialen Bezugsnorm im deutschen Bildungssystem nicht leugnen (vgl. Kalthoff, 1996, S. 108; Terhart et al., 1999). Ebenfalls für alle Bundesländer gilt, dass die über das Schulhalbjahr erbrachten Leistungen zu einer Zeugnisnote zusammengefasst und in einem Zeugnis am Ende des ersten bzw. zweiten Schulhalbjahres festgehalten werden. Ab wann die Beurteilung in Form von Zensuren in der Primarstufe beginnt, unterscheidet sich zwischen den Bundesländern. Allerdings wurden bereits 1970 von der KMK „Empfehlungen zur Arbeit in der Grundschule“ beschlossen, die die Einführung verbaler Beurteilungen an Stelle von Ziffernzeugnisse in den ersten beiden Grundschuljahren für die Bundesländer der alten BRD vorsahen (vgl. KMK, 1970). Die Gründe für die Einführung der Berichtszeugnisse waren vielgestaltig: „umfassende Beurteilung von Leistungsstand, Arbeits- und Sozialverhalten, ermutigende Erziehung statt Leistungsdruck, Wegfall des Konkurrenzkampfes und Förderung der sozialen Kooperation, Ermöglichung individueller Förderung durch differenziertere Rückmeldung und Förderpreise, Kennzeichnung der individuellen Lernverläufe sowie der Stärken und Schwächen, Verbesserung der Beziehungen zwischen Lehrerinnen und Eltern einerseits und Lehrerinnen und Schüler(inne)n andererseits“ (Valtin, 2002, S. 12–13).

In der für diese Arbeit relevanten Sekundarstufe I und II erfolgt die Leistungsbeurteilung jedoch in allen Bundesländern in Form von Ziffernzen-

Schulische Leistungsbeurteilung in NRW

199

suren103, weshalb hier nicht weiter auf die Berichtszeugnisse der Primarstufe eingegangen wird. Die schulische Leistungsbeurteilung gilt, wie überhaupt der Schulbereich in Deutschland, als stark verrechtlicht, was auch auf den Wunsch zurückgeführt wird, „to overcome the vestiges of an earlier, more etatist and authoritarian legal perspective on the status of schools and their inhabitants“ (Weiler, 1983, S. 264). Teilweise wird hier auch von einer „Vergerechtlichung“ (Schlink, 2004) gesprochen (vgl. ausführlicher zur Frage der Verrechtlichung der deutschen Bildungssysteme Waldow, 2011b). Im Hinblick auf Widerspruchsrechte gegen als unzulässig empfundene Beurteilungen wird in NRW zwischen zwei Verfahrensweisen unterschieden. Einzelne Noten im Unterricht bzw. Noten auf Zeugnissen sind in der Regel in einem schulinternen Beschwerdeverfahren anfechtbar, gegen sie kann also zunächst gegenüber der benotenden Lehrkraft bzw. der Schulleitung eine Beschwerde eingereicht werden, die bei NichtEinigung an die zuständige Schulbehörde weitergeleitet wird. Abschlusszeugnisse bzw. Noten der Zentralen Prüfungen gelten hingegen aufgrund der weitreichenden Konsequenzen für die Schüler_innen als Verwaltungsakte gegen die ein formaler Widerspruch vor einem Verwaltungsgericht eingelegt werden kann. Auch Fragen der Versetzung bzw. Nichtversetzung oder die Aufnahme bzw. Entlassung von Schüler_innen gelten als Verwaltungsakte und sind gerichtsbar. Die genauen Vorschriften hierzu finden sich daher auch nicht im Schulgesetz, sondern in der Verwaltungsgerichtsordnung (VwGO, §§ 68 ff.). Gleichzeitig wird den Lehrkräften ein gewisser Entscheidungsspielraum bei der Leistungsbeurteilung unter Berufung auf ihre pädagogische Freiheit eingeräumt, so dass das Lehrkrafturteil vom Rechtssystem als „höchstpersönliches Fachurteil“ behandelt wird: „Es soll zwar fachliche, pädagogische und formelle Kriterien einlösen, wird aber nicht bereits dadurch ungültig, 103

Ausnahmen hiervon bilden teilweise Schulen in freier Trägerschaft mit besonderen pädagogischen Konzepten (z.B. Montessori- oder Waldorfpädagogik) bzw. anerkannte staatliche Modellschulen mit alternativen pädagogischen Konzepten.

200

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

dass die Beurteiler individuelle Gesichtspunkte und Erwägungen in ihre Urteilsbildung einfließen lassen“ (Lüders, 2001a, S. 218).

Schulformwechsel und Versetzung bzw. Klassenwiederholung Ein weiterer Aspekt der schulischen Leistungsbeurteilung in allen Bundesländern ist ihr Zusammenhang mit der Versetzung von Schüler_innen in die nächsthöhere Klassenstufe bzw. die Wiederholung einer Klassenstufe aufgrund mangelhafter oder ungenügender Leistungen in mehreren Fächern am Ende eines Schuljahres. Das ‚Sitzenbleiben‘ hat sich historisch betrachtet im Laufe des 19. Jahrhunderts mit der Durchsetzung des Jahrgangsklassensystems entwickelt (Lohmann, 1987), und bezog sich zunächst auf die Anordnung der Schüler_innen verschiedener Klassenstufen im Klassenraum und das Aufrücken um bzw. Sitzenbleiben in einer Bankreihe in Abhängigkeit vom jeweiligen Leistungsstand am Ende des Schuljahres (vgl. Lindenhayn, 2013). Die (pädagogische) Grundidee ist nach wie vor die, dass für Schüler_innen, die die grundlegenden Lernziele einer Klassenstufe in mehreren Fächern nicht erreichen, auch in den folgenden Jahrgangsstufen kein erfolgreiches Weiterlernen zu erwarten sei und die Wiederholung einer Jahrgangsstufe den Schüler_innen daher die Möglichkeit biete ihren Lernrückstand aufzuholen (Roßbach & Tietze, 2006). Die Versetzungsentscheidung entspricht aber auch der „Erlaubnis, in die nächsthöhere Jahrgangsstufe vorzurücken, und ist ein juristischer Akt“ (Palowski, 2016, S. 20). In der Praxis wird das Sitzenbleiben von den betroffenen Schüler_innen und deren Eltern häufig als Bestrafung erlebt, die erwarteten Effekte auf Schulleistung und akademisches Selbstbild der Schüler_innen bleiben häufig gänzlich aus oder wirken sich negativ auf selbiges aus (vgl. Bellenberg, 1999; Ehmke et al., 2008), wodurch auch der volkswirtschaftliche Nutzen des Instruments Sitzenbleiben zunehmend infrage gestellt wird (Klemm, 2009). Auch in internationalen Untersuchungen konnte wiederholt gezeigt werden, dass Schüler_innen, die eine Klasse wiederholten, keine besseren Schulleistungen zeigten, als diejenigen, die

Schulische Leistungsbeurteilung in NRW

201

bei gleich schlechten Leistungen versetzt worden waren (vgl. Holmes, 1989; Jimerson, 2001) und die Wahrscheinlichkeit eines späteren Schulabbruchs sich durch Klassenwiederholungen erhöhte (vgl. Grissom & Shepard, 1989; Roderick, 1994). Für die Bundesrepublik kann insgesamt ein stetiger Rückgang der Wiederholungsquoten in den vergangenen Jahrzehnten konstatiert werden, u.a. aufgrund eines bildungspolitischen Umdenkens und daraus resultierenden gesetzlichen Veränderungen. Hinzu kommt die Tendenz zur Entkopplung von Wiederholung und Versetzung, d.h. die Unterscheidung zwischen einer (mehr oder weniger) freiwilligen Wiederholung einer Klassenstufe mit dem Ziel der Verbesserung der Zeugnisnoten (um z.B. in der gymnasialen Oberstufe die Abiturnote zu verbessern) und der erzwungenen Wiederholung aufgrund einer Nichtversetzung (vgl. Palowski, 2016, S. 20–21). Auch die Einführung einer „Versetzung auf Probe“, wie bspw. in NRW, zielte auf die Reduzierung der Wiederholungsquoten. Insbesondere seit Beginn der 2000er Jahre scheinen sich die Quoten auf einem relativ niedrigen Niveau einzupendeln: Im Jahr 2013 waren es bundesweit nur 0,9 % der Primarschüler_innen, 2,6 % der Schüler_innen der Sekundarstufe I und 3,1 % der Schüler_innen der Sekundarstufe II (Palowski, 2016, S. 24–28; vgl. auch Statistisches Bundesamt, 2016, S. 24–25). Im Vergleich der Schulformen im Sekundarbereich stechen allerdings die Haupt- und Realschüler_innen besonders hervor, ihr Anteil lag im Schuljahr 2014/15 mit 4,5 % bzw. 4 % deutlich über dem Durchschnitt (Statistisches Bundesamt, 2016, S. 25). Wie in Kapitel 5.2.1 geschildert, finden sich im deutschen Bildungswesen zahlreiche Übergangs- und Selektionshürden. Für das Bildungssystem in Nordrhein-Westfalen stellen der Übergang von der Grundschule in eine weiterführende Schule, der potentielle Wechsel der gewählten Schulform während der Sekundarstufe I sowie die Versetzung innerhalb einer Schulform in die nächsthöhere Klassenstufe die häufigsten Hürden dar. Klassenwiederholungen treffen die Schüler_innen der verschiedenen Schulformen dabei in unterschiedlichem Ausmaß: auf der Grundlage der bundesländervergleichenden Daten aus PISA-E 2006 geht hervor, dass unter den 15-jährigen mit einer „verzögerten Schullaufbahn“ (also min-

202

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

destens einer Klassenwiederholung) 55 % die Hauptschule besuchten, 24 % eine Realschule, 27 % die Gesamtschule und nur 11 % ein Gymnasium (Prenzel et al., 2008). Während der Schuleingangsphase der Grundschule (1. und 2. Klasse) erhalten die Schüler_innen in NRW noch keine Noten, die Zeugnisse werden in Berichtsform abgefasst und sollen eine Rückmeldung des Leistungsstandes sowie der Lernfortschritte „beschreib[en] und würdig[en]“.104 Mit dem Versetzungszeugnis in die Klasse 3 können die Zeugnisse auch Noten enthalten, in Klasse 4 werden ausschließlich Ziffernzeugnisse ausgestellt. Für den Übergang an eine weiterführende Schule im Anschluss an die Grundschule wird mit dem Halbjahreszeugnis der 4. Klasse durch die jeweilige Klassenlehrkraft eine Empfehlung für die Schulform Hauptschule, Realschule oder Gymnasium ausgestellt.105 Grundlage dafür sind der Leistungsstand, die Lernentwicklung sowie die Fähigkeiten der Schüler_innen (vgl. KMK, 2015, S. 19). Diese Empfehlung ist in NRW jedoch nicht bindend, d.h. Eltern sind im Zweifelsfall frei in ihrer Entscheidung für eine weiterführende Schule. An der Hauptschule, Realschule und dem Gymnasium bilden die Klassenstufen 5 und 6 eine pädagogische Einheit, die sogenannte Erprobungsstufe.106 Ein ‚Sitzenbleiben‘ ist in dieser Erprobungsstufe nicht vorgesehen, die Schüler_innen gehen automatisch in die 6. Klasse über. Allerdings finden sogenannte Erprobungsstufenkonferenzen statt, auf denen unter anderem über die individuelle Entwicklung der einzelnen Schüler_innen beraten und gegebenenfalls über einen Schulformwechsel entschieden werden kann. Im entsprechenden Paragraphen der Ausbildungs- und Prüfungsordnung der Sekundarstufe I (APO-S I) steht dazu, 104

https://www.schulministerium.nrw.de/docs/Schulsystem/Schulformen/Grundschule/ Lernen-in-der-Grundschule/Leistungsbewertung/index.html [22.09.2016]. 105 Für die Schulformen Gymnasium und Realschule können auch sogenannte „eingeschränkte Empfehlungen“ ausgestellt werden, wenn Lehrkräfte unschlüssig bei der Beurteilung der Leistungen der Schüler_innen sind. 106 An Gesamtschulen und Sekundarschulen entfällt die sogenannte Erprobungsstufe, die Schüler_innen gehen ohne Versetzung von der 6. bis 9. Klasse in die nächsthöhere Klassenstufe über (vgl. KMK, 2015, S. 20).

Schulische Leistungsbeurteilung in NRW

203

dass ein solcher Wechsel angeraten werden kann, wenn „eine Schülerin oder ein Schüler in einer anderen Schulform besser gefördert werden kann“ (APO-S I, §11, 1). Am Ende der Erprobungsstufe wird dann erneut durch die Erprobungsstufenkonferenz geprüft, ob die Schüler_innen „unter Berücksichtigung des Leistungsstandes, der bisherigen von der Schule durchgeführten Fördermaßnahmen und der zu erwartenden Entwicklung an der gewählten Schulform bleiben kann oder an eine andere Schulform wechseln muss“ (APO-S I, §12, 1). Die in Kapitel 5.2.1 herausgearbeitete Tendenz zur homogenen Lerngruppe im deutschen Bildungswesen findet sich zu einem gewissen Grad also auch in Nordrhein-Westfalen wieder, andererseits sind mit der Einführung zensurenfreier Zeugnisse in der Grundschule, einer nicht bindenden Grundschulempfehlung sowie der Einführung der Erprobungsstufe in der Sekundarstufe I Reformbemühungen erkennbar, die ein schrittweises Aufweichen der Selektionsfunktion von Noten anstreben.107 Die Ausbildungs- und Prüfungsordnung für die Sekundarstufe I (APO-S I) sieht im Falle einer Versetzungsgefährdung in die nächsthöhere Klassenstufe aufgrund unzureichender Leistungen verschiedene Maßnahmen vor: Ist die Versetzung in die nächste Klassenstufe gefährdet, erhalten Schüler_innen zunächst einen Vermerk im Halbjahreszeugnis und werden auf die möglichen Folgen einer Nicht-Versetzung hingewiesen. Hält die Versetzungsgefährdung im zweiten Schulhalbjahr weiter an, erhalten die Eltern bis spätestens 10 Wochen vor Ende des Schuljahres eine schriftliche Benachrichtigung (den sogenannten „Blauen Brief“). Darüber hinaus sollen individuelle Lern- und Förderempfehlungen sowie Beratungsgespräche mit Schüler_innen und deren Eltern helfen eine drohende Nicht-Versetzung abzuwenden (vgl. APO-S I, §7, 3-5). Mit der Verabschiedung des neuen Schulgesetzes im Jahr 2005 wurde der Anspruch auf „eine ihren Stärken und Begabungen sowie auch den 107

Die 2008 vom nordrhein-westfälischen Schulministerium gestartete Initiative „Komm mit! - Fördern statt Sitzenbleiben“, die das Ziel hatte, „insbesondere in den Klassen 7, 8 und 9 die Sitzenbleiberquote schrittweise zu reduzieren“ (König & Drage, 2010, S. 92), ist ein weiterer Beleg für diese neueren Tendenzen.

204

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

persönlichen Bedarfen entsprechende individuelle Förderung“ für alle Schüler_innen in NRW festgeschrieben (MSW, 27.11.2013, S. 2). In der Ausbildungs- und Prüfungsordnung für die Sekundarstufe I (APO-S I) wird unter §3 „Unterricht, individuelle Förderung“ festgehalten, dass der reguläre Unterricht aus sogenannten Kern- und Ergänzungsstunden besteht und „durch individuelle Förderung als pädagogisches Grundprinzip geprägt“ sein soll (APO-S I, §3, 1). Im Folgenden wird dann weiter ausgeführt, worauf diese individuelle Förderung abzielt: „eine gleichberechtigte Teilhabe [aller Schüler_innen] am Leben in der Gesellschaft unabhängig von Geschlecht, kultureller und sozialer Herkunft oder Behinderung“ (APO-S I, §3, 4). Für die Ausgestaltung der individuellen Förderung sind die Schulen selbst verantwortlich, das Ministerium erwartet dafür, dass jede Schule ein eigenes Förderkonzept erstellt, welches „Maßnahmen der inneren Differenzierung und Maßnahmen der äußeren Differenzierung umfasst“ (APO-S I, § 3, 4).

Schulgesetz und Kernlehrpläne Das nordrhein-westfälische Schulgesetz regelt seit 2005108 grundsätzlich „unter welchen Bedingungen, mit welchen Rechten und Pflichten und mit welchen Zielen in Schulen in Nordrhein-Westfalen gelehrt und gelernt wird“ (NRW SchulG, Präambel). Neben der Bestimmung der Schulformen, Regelungen zur Schulpflicht u.a. finden sich in §48 bis §52 schulformübergreifende Regelungen zur Leistungsbeurteilung, darunter auch die „Grundsätze der Leistungsbewertung“. Darin sind u.a. die oben aufgeführten Notenstufen definiert, Versetzungsregelungen und Vorgaben zur Ausfertigung von Zeugnissen enthalten. 108

Das 2005 verabschiedete Schulgesetz stellt das erste einheitliche Schulgesetz des Bundeslands NRW dar, das eine Reihe von verschiedenen Gesetzen bündelte, die bis dahin die verschiedenen schulrechtlichen Belange regelten. Es wurde seither mehrfach überarbeitet bzw. ergänzt, in dieser Arbeit beziehe ich mich auf die im Zeitraum der Untersuchung 2011-2015 gültigen Fassungen.

Schulische Leistungsbeurteilung in NRW

205

Seit dem Jahr 2004 wurden in Nordrhein-Westfalen sukzessive für alle Fächer der allgemeinbildenden Schulformen Kernlehrpläne erstellt und eingeführt, die an den Vorgaben der bundeseinheitlichen Bildungsstandards ausgerichtet sind. Die Bildungsstandards sind am mittleren Schulabschluss nach Klasse 10 orientiert und schulformübergreifend angelegt. Die Kernlehrpläne in NRW „greifen die in den KMK-Standards enthaltenen schulformübergreifenden Ansprüche auf und berücksichtigen die Besonderheiten der einzelnen Schulformen und Bildungsgänge“ (MSW, 2007, S. 10). Die Bildungsstandards, welche von der Kultusministerkonferenz in Auftrag gegeben und vom Institut für Qualitätsentwicklung (IQB) entwickelt werden, beziehen sich auf ein mittleres Anforderungsniveau und entsprechen damit sogenannten Regelstandards. Langfristig sollen daneben auch Minimalstandards und Standards auf Exzellenzniveau entwickelt werden (vgl. MSW, 2007, S. 10). Die Kernlehrpläne für Mathematik, Deutsch und Englisch an den Real- und Gesamtschulen in NRW wurden bereits 2004 erlassen, für die Sekundarstufe I der Gymnasien folgten die Kernlehrpläne für die Fächer Deutsch, Englisch und Mathematik zum 01.08.2007. Für die Hauptschulen wurden erst im Jahr 2011 die Kernlehrpläne für die Fächer Deutsch, Englisch, Mathematik und andere verabschiedet (vgl. u.a. MSW, 2011a). Die Kernlehrpläne der anderen Fächer folgten für alle Schulformen zwischen 2005 und 2015 bzw. werden kontinuierlich angepasst. Die Kernlehrpläne bestehen in der Regel aus fünf Teilen: im ersten Teil werden die allgemeinen Ziele und Aufgaben des jeweiligen Faches beschrieben. Daran anschließend werden die Kompetenzanforderungen aufgelistet, die am Ende der Sekundarstufe I erreicht sein sollen. Im dritten Teil erfolgt dann eine Aufschlüsselung der konkreten Kompetenzerwartungen nach Kompetenzbereichen die jeweils am Ende der Jahrgangsstufen 6, 8 und 9 bzw. 10 109 erreicht sein sollen. Darin enthalten sind ebenfalls verbindliche Unterrichtsinhalte und methodisch-didaktische Vorschläge zur Umsetzung 109

Durch die Verkürzung der Schulzeit am Gymnasium auf acht Jahre (G8) endet die Sekundarstufe I am Gymnasium bereits mit der 9. Klasse, an den anderen Schulformen mit Klasse 10.

206

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

dieser. Im vierten Teil werden sogenannte Aufgabentypen für die Überprüfung der Kompetenzen von Schüler_innen aufgelistet – getrennt nach mündlichen und schriftlichen Aufgaben, den Kompetenzbereichen und nach Jahrgangsstufen. Im fünften und letzten Teil werden noch einmal die Bestimmungen des Schulgesetzes hinsichtlich der Lernerfolgsüberprüfung und Leistungsbewertung spezifiziert. Anders als in den schwedischen Lehrplänen werden hier jedoch keine Beurteilungskriterien für einzelne Notenstufen angegeben, sondern eher allgemeine Hinweise zum Zweck der schulischen Leistungsbeurteilung. Neben den relativ offenen Vorgaben in den Kernlehrplänen regelt noch zusätzlich die Ausbildungs- und Prüfungsordnung für die Sekundarstufe I (APO-S I) einige Details der Leistungsbeurteilung. Im Internetprotal des nordrhein-westfälischen Bildungsministeriums finden sich beispielweise für alle Schulformen aufgelistet die Anzahl und Dauer der in einem Schuljahr zu schreibenden Klassenarbeiten für alle Jahrgangsstufen.110 Des Weiteren wird der Beurteilungsbereich der sonstigen Leistungen definiert, zu dem „alle im Zusammenhang mit dem Unterricht erbrachten mündlichen und praktischen Leistungen sowie gelegentliche kurze schriftliche Übungen“ gehören (APO-S I, §6, 2).111 Auf die Unterscheidung der Beurteilungsbereiche gehe ich im Folgenden näher ein.

Beurteilungsbereiche Die Unterscheidung zwischen den Beurteilungsbereichen „Schriftliche Arbeiten“ und „Sonstige Leistungen im Unterricht“ stellen ein weiteres 110

In den Klassen 5-7 sind dies an allen Schulformen jeweils sechs Klassenarbeiten in Mathematik und Deutsch pro Schuljahr, in Klasse 8 jeweils fünf Klassenarbeiten und in den Klassen 9 und 10 jeweils 4-5 Klassenarbeiten, wobei die Dauer der einzelnen Klassenarbeit mit jeder Klassenstufe zunimmt. https://www.schulministerium.nrw.de/docs/Recht/Schulrecht/APOen/HS-RS-GE-GYSekI/Anzahl-Klassenarbeiten/index.html 111 Eine fast identische Formulierung findet sich auch in der APO für die gymnasiale Oberstufe, vgl. (APO-GOSt, §15,1).

Schulische Leistungsbeurteilung in NRW

207

zentrales Element der schulischen Leistungsbeurteilung dar. Diese Unterscheidung wird bereits im Schulgesetz in den schulformübergreifenden Regelungen zur Leistungsbeurteilung und den darin enthaltenen „Grundsätzen der Leistungsbewertung“ festgehalten (vgl. MSW, 2015c, §48-52). Allerdings findet sich hier nur der Hinweis darauf, dass diese beiden Bereiche „bei der Leistungsbeurteilung angemessen berücksichtigt“ werden sollen (MSW, 2015c, § 48). Obwohl die Unterteilung in die beiden Beurteilungsbereiche der „schriftlichen“ und der „sonstigen Leistungen“ (umgangssprachlich auch als „mündliche Leistungen“ bezeichnet) sehr deutlich gemacht wird, lassen sich aus den Kernlehrplänen jeweils nur sehr vage Beschreibungen dessen, was als sonstige Leistungen zählen kann, ableiten. Generell wird eher verallgemeinernd von „Beiträgen zum Unterrichtsgespräch“ und anderen „mündlichen Beiträgen“ (Referat, Rollenspiel, Präsentation), verschiedenen „schriftlichen Beiträgen“ (schriftliche Übung, Portfolios, Protokoll, etc.), sowie „Gruppen- und Projektarbeiten“ gesprochen (vgl. u.a. MSW, 2004, 2007, 2011b). Unterschiede finden sich lediglich im Kernlehrplan Deutsch für die Hauptschule, bei dem zusätzlich auch das Anfertigen von „außerunterrichtlichen Aufgaben“, sprich Hausaufgaben, als „Pflicht der Schülerinnen und Schüler“ besonders erwähnt wird, die auch zur Leistungsbeurteilung herangezogen werden können (MSW, 2011a, S. 36). 112 In allen Kernlehrplänen wird zudem davon gesprochen, dass der Bewertungsbereich der „sonstigen Leistungen“ die „Qualität und die Kontinuität der Beiträge“ erfasst. Im Kernlehrplan Deutsch der Hauptschule wird dies noch um das Kriterium der Quantität der Beiträge ergänzt – inwiefern es sich hier um einen zufälligen Unterschied oder eine bewusste Setzung handelt, ist kaum noch zu rekonstruieren. In den Interviews mit nordrhein-westfälischen Lehrkräften tauchen die Hausaufgaben auch als 112

Ein Runderlass, der zum 01.08.2015 in Kraft trat, untersagt mittlerweile ausdrücklich das Benoten von Hausaufgaben an allen allgemeinbildenden Schulen: „Hausaufgaben werden regelmäßig überprüft und für die weitere Arbeit im Unterricht ausgewertet. Sie werden nicht benotet, finden jedoch Anerkennung“ (MSW, 2015b).

208

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

ein wichtiger Bestandteil der mündlichen Noten auf, ebenso wird die Häufigkeit des Meldens und Mitarbeitens im Unterricht als Kriterium für die Zusammensetzung der mündlichen Note angeführt (und dies sowohl von Hauptschullehrkräften als auch den Lehrkräften der anderen Sekundarschulformen im Sample, vgl. Kap. 6.3). Insbesondere die Frage, ob und inwieweit auch Aspekte des Arbeits- und Sozialverhaltens Bestandteil des Beurteilungsbereichs der sonstigen Leistungen sein sollen, bleibt in den Kernlehrplänen relativ offen. Zwischen 2007 und 2010 wurden diese Bereiche in den sogenannten „Kopfnoten“ ausgedrückt, die fester Bestandteil der Zeugnisse der allgemeinbildenden Schulen in NRW waren. In ihnen sollte das Arbeits- und Sozialverhalten von Schüler_innen fächerübergreifend erfasst und für Eltern, aber auch potentielle Arbeitgeber_innen, in Form einer Zensur transparent gemacht werden. Mit der Novellierung des Schulgesetzes im Jahr 2010 wurden die umstrittenen Kopfnoten allerdings wieder abgeschafft (vgl. MSW, 15.12.2010). 113 Aus der Analyse der Interviews der befragten nordrhein-westfälischen Lehrkräfte geht allerdings hervor, dass Aspekte des Arbeits- und Sozialverhaltens nach wie vor eine Rolle bei der Beurteilung der mündlichen Leistungen spielen und in teilweise kompensatorischer, teilweise disziplinierender Form eingesetzt werden (vgl. Kap. 6.3).

Zentrale Prüfungen am Ende der Sek I (ZP10) Die zentralen Prüfungen am Ende der Klasse 10 werden seit dem Schuljahr 2006/07 von allen Schüler_innen der Haupt-, Real- und Gesamtschulen in den Fächern Deutsch, Mathematik und Englisch geschrieben; für die Schüler_innen an Gymnasien entfällt diese Prüfung. Die Ergebnisse der ZP10 gehen allerdings nur zur Hälfte in die Abschlussnoten der Prüfungsfächer ein, die andere Hälfte setzt sich aus den Leistungen im 113

Zur Diskussion der Möglichkeiten und Grenzen der Beurteilung des Arbeits- und Sozialverhaltens von Schüler_innen in Form von Kopfnoten vgl. Arnold und Vollstädt (2001).

Schulische Leistungsbeurteilung in NRW

209

Unterricht während des Schuljahres zusammen und geht als sogenannte Vornote in die Berechnung der Abschlussnote ein. Für den mittleren Schulabschluss werden dann die Prüfungsnoten aus den zentralen, standardisierten Tests, die Vornoten der Fächer Mathematik, Deutsch und Englisch sowie die durch die Lehrkräfte erstellten Noten aller anderen Fächer zusammengestellt. Trotz zentraler Prüfungen setzt sich der Abschluss also zu einem großen Teil aus dezentralen Benotungen durch einzelne Lehrkräfte während des gesamten Schuljahres zusammen. Zur Vorbereitung auf die zentralen Prüfungen werden die Prüfungsarbeiten der jeweils letzten drei Jahre vom Schulministerium für Schüler_innen und Lehrkräfte zugänglich gemacht114 und die Lehrkräfte aufgefordert, die Schüler_innen mit den Aufgabenformaten vertraut zu machen. Die Aufgabenentwicklung selbst erfolgt durch Expertenteams bestehend aus erfahrenen Fachlehrkräften unter der Leitung des MSW. Die Bewertung der zentralen Tests erfolgt dann wiederum schulintern durch zwei Fachlehrkräfte, können diese sich nicht auf eine Note einigen kann auch noch eine dritte Lehrkraft einbezogen werden. Die Lehrkräfte erhalten „zur Sicherstellung einer gerechten Bewertung [...] verbindliche Bewertungsvorgaben“ (MSW, 2013b, S. 9) durch das MSW, die einen aufgabenbezogenen Bewertungsbogen und eine genaue Aufschlüsselung der Bepunktung der einzelnen Aufgaben enthalten. Auf der Homepage des MSW finden sich zur Frage der Vorgaben bezüglich der Bewertung der zentralen Tests noch folgende Faustregeln: „Grundsätzlich wird davon ausgegangen, dass  die Note ‚ausreichend‘ das Erreichen von etwa 45 % der Höchstpunktzahl voraussetzt,  oberhalb der Note ‚ausreichend‘ die Zuordnung der Punktzahlen zu den Notenstufen linear verteilt ist,

114

https://www.standardsicherung.schulministerium.nrw.de/cms/zentrale-pruefungen10/pruefungsaufgaben/

210

5 Institutionelle Rahmung schulischer Leistungsbeurteilung 

die Grenze zwischen den Noten ‚mangelhaft‘ und ‚ungenügend‘ bei etwa 18 % der Höchstpunktzahl liegt.“ (MSW NRW)115

Wie in Kapitel 6.3 deutlich werden wird, referieren auch die befragten Lehrkräfte in NRW teilweise auf diese Faustregeln, wenn sie über die Bepunktung einfacher Klassenarbeiten sprechen, obwohl diese explizit für die Zentralen Prüfungen aufgeführt werden. Auch die detaillierten Bewertungsbögen finden bei der Beurteilung einfacher Klassenarbeiten Anwendung bzw. dienen als Vorlage für die Erstellung eigener Bewertungsbögen. Insofern lässt sich hier vorsichtig auf einen indirekten Einfluss der Zentralen Prüfungen auf die alltägliche Beurteilungspraxis der Lehrkräfte schließen, der jedoch lokal sehr unterschiedlich ausfallen kann, wie ebenfalls in Kapitel 6.3 deutlich wird. Die Ergebnisse der zentralen Prüfungen werden jährlich in einem kurzen, deskriptiven Bericht getrennt nach Schulformen und im Vergleich zur Vornote auf der Homepage des MSW veröffentlicht.116 In den Vorbemerkungen zu diesem Bericht wird betont, dass die zentralen Prüfungen „landesweit einheitlichen Anforderungen und landesweit einheitlichen Bewertungsvorgaben“ unterliegen – und die Beurteilungen nicht, wie bei den durch einzelne Lehrkräfte vergebenen Noten, „mit Bezug auf die jeweilige Lerngruppe“ (QUA-LiS, 2015, S. 3) zustande kommen. Den zentralen Prüfungen käme somit eine „justierende Funktion“ (QUA-LiS, 2015, S. 3) zu. Inwiefern eine solche Justierung notwendig ist, geht aus dem kurzen Bericht nicht hervor, ebenso wenig werden die landesweiten Ergebnisse diskutiert oder zueinander in Beziehung gesetzt. Insofern lässt sich hier nur sehr vorsichtig von einer impliziten Gerechtigkeitsüberzeugung sprechen, die eine Kombination aus zentralen und dezentralen Beurteilungskomponenten befürwortet. Im Bericht von 2013 wird 115

https://www.standardsicherung.schulministerium.nrw.de/cms/zentrale-pruefungen10/fragen-und-antworten/ 116

https://www.standardsicherung.schulministerium.nrw.de/cms/upload/zp10/berichte/ZP 10_Ergebnisbericht_2015.pdf

Schulische Leistungsbeurteilung in NRW

211

jedoch gesondert darauf hingewiesen, dass die durch die Lehrkräfte vergebenen Vornoten „in der deutlichen Mehrheit der Fälle“ (MSW, 2013a, S. 2) mit den durch die zentralen Prüfungen ergänzten Abschlussnoten übereinstimmten, woraus offenbar sowohl auf die Richtigkeit und Legitimität der Lehrkraftbeurteilungen als auch der zentralen Tests geschlossen wird. Für Schüler_innen mit einer Behinderung, sonderpädagogischem Förderbedarf oder chronischer Erkrankung kann im Zusammenhang mit der Zentralen Abschlussprüfung ein sogenannter Nachteilsausgleich gewährt werden. Dieser zielt darauf ab die Schüler_innen „durch gezielte Hilfestellungen in die Lage zu versetzen, ihre Fähigkeiten im Hinblick auf die gestellten Anforderungen nachzuweisen“ (MSW, 27.11.2013, S. 4). Seit 2013 können die Schulleitungen über die Gewährung eines solchen Nachteilsausgleichs selbstständig entscheiden, ohne wie bis dahin eine Genehmigung durch die zentrale Schulaufsicht einholen zu müssen (vgl. MSW, 27.11.2013, S. 3).

Zentralabitur Das Zentralabitur wurde im Jahr 2007 in Nordrhein-Westfalen eingeführt und löste damit eine langjährige Tradition der dezentral organisierten Abiturprüfungen ab.117 Wichtige Ziele der Einführung des Zentralabiturs waren die Vereinheitlichung der Prüfungsformate und damit einhergehend die Verbesserung der Vergleichbarkeit der in den Bundesländern vergebenen Hochschulreife, die wiederum die Grundlage für weitere Bildungs- und damit Lebenswege (wie z.B. bei der Vergabe von Studien117

Bundesländer mit einer langen Tradition zentraler Abiturprüfungen sind Bayern, Baden-Württemberg und das Saarland, die östlichen Bundesländer MecklenburgVorpommern, Sachsen-Anhalt, Sachsen und Thüringen führten 1991 zentrale Abiturprüfungen ein, ab 2005 zogen dann die restlichen Bundesländer nach und führten ebenfalls die zentralen Prüfungen ein. Lediglich Rheinland-Pfalz führt heute noch als einziges Bundesland dezentrale Prüfungen durch (vgl. KMK, 2009). Für einen Überblick über die verschiedenen Verfahren in den Bundesländern vgl. Kühn (2010).

212

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

plätzen) sind (vgl. Kühn & van Ackeren, 2012; Maag Merki, 2012b). Mit der Verabschiedung von „Bildungsstandards für die Allgemeine Hochschulreife“ durch die KMK im Jahr 2012 sollten die Abiturprüfungsverfahren bundeslandübergreifend kalibriert und eine einheitliche Bewertungspraxis angestrebt werden (vgl. z.B. für das Fach Deutsch KMK, 2012a). Diese Bildungsstandards auf Abiturniveau sollen ab dem Schuljahr 2016/17 die bisher gültigen „Einheitlichen Prüfungsanforderungen“ (EPA) ablösen, wobei durch einen gemeinsamen Aufgabenpool „die Vorteile pädagogischer Vielfalt in den Ländern mit der notwendigen Einheitlichkeit und Vergleichbarkeit der Aufgaben hinsichtlich ihrer Schwierigkeit, Qualität und Bewertung“ verbunden werden sollen (KMK, 2013). Für die Einführung zentraler Abiturprüfungen mit standardisierten Testformaten wurde auch damit argumentiert, dass Schulnoten, die von einzelnen Lehrkräften vergeben würden, häufig nicht die tatsächliche Leistung von Schüler_innen abbilden und damit kaum vergleichbare Maßstäbe liefern würden (vgl. Ingenkamp, 1972; Neumann, Nagy, Trautwein & Lüdtke, 2009; Bos, Dohe & Walzebug, 2010). Auch die individuelle Auswahl von Prüfungsthemen – mit der eine sehr unterschiedliche Schwerpunktsetzung im Unterricht der gymnasialen Oberstufe sowie potentiell gezielter Vorbereitung auf bestimmte Prüfungsinhalte einhergehen könne – geriet zunehmend unter Kritik. Das Zentralabitur hingegen basiert auf einem zentral vorgegebenen Aufgabenpool, aus dem die Lehrkräfte die Prüfungsaufgaben auswählen, wodurch sich eine erhöhte Vergleichbarkeit der Ergebnisse erhofft wird. Zusammen mit den zentralen Prüfungen am Ende der 10. Klasse (ZP10) und den Vergleichsarbeiten in Klasse 3 bzw. Lernstandserhebungen in Klasse 8 zählt das Zentralabitur zu den outputorientierten Überprüfungsverfahren im Sinne der Neuen Steuerung (vgl. Kap. 5.2.1 sowie Altrichter & Maag Merki, 2010). Ebenso wie die ZP10 finden die Prüfungen des Zentralabiturs am Ende eines Bildungsganges im Sinne summativer Lernstandsüberprüfungen zu einem extern festgelegten Prüfungszeitpunkt statt – dies ist einer der zentralen Unterschiede zu den von Lehrkräften durchgeführten Klassenarbeiten und anderen Formen der den Lernprozess begleitenden, forma-

Schulische Leistungsbeurteilung in NRW

213

tiven Leistungsbeurteilung. Der zweite Unterschied besteht in ihrer klar auf den schulischen Selektionsauftrag begrenzten Funktion: mit den zentralen Abschlussprüfungen nach Klasse 10 bzw. dem Zentralabitur wird das Erreichen eines Lernstands am Ende eines Bildungsabschnitts gemessen, die Ergebnisse fließen in Form von Zeugnissen und Abschlussnoten in die Vergabe von Berechtigungen und zukünftigen Lebenschancen ein. Sie stellen damit sogenannte high-stakes tests dar, da an ihr Bestehen bzw. Nicht-Bestehen nicht unerhebliche Konsequenzen für die weiteren Lebenswege von Schüler_innen gebunden sind (vgl. Heubert & Hauser, 1999; Resnick, Nolan & Resnick, 1995). Allerdings fließen neben den Prüfungsergebnissen im Zentralabitur auch die vorab erbrachten schulischen Leistungen in die Abschlussnoten ein, weshalb der Selektionsgrad durch die eigentliche Prüfung sich in Grenzen hält. Nach Klein, Kühn, van Ackeren und Block (2009) erreichen die in den deutschen Bundesländern durchgeführten zentralen Abiturprüfungen im internationalen Vergleich nur einen geringen bis mittleren Standardisierungsgrad. Dies liegt u.a. auch daran, dass die Abiturprüfungen und deren Korrektur nicht, wie beispielsweise in England mit den external examination boards üblich, durch externe Prüfungsinstanzen, sondern durch die schulinternen Lehrkräfte selbst durchgeführt werden. Konkret führen die Kurslehrkräfte eines Faches die Abiturprüfungen zu einem zentral festgelegten Termin nach einem einheitlichen Verfahren durch, die Aufgaben sind den Lehrkräften dabei vor dem Prüfungstermin nicht bekannt. Für die Bewertung liegen zentral erstellte Kriterienkataloge vor, anhand derer die Lehrkräfte jede einzelne Aufgabe bepunkten müssen. Allerdings sind in den Beurteilungsrastern lediglich die maximal zu vergebenen Punkte pro Aufgabe festgelegt – wie diese Punkte sich im Einzelnen zusammensetzen, liegt im Ermessen der Lehrkräfte. Im Anschluss an die Erstkorrektur werden die Beurteilungen noch einmal durch eine zweite Lehrkraft geprüft und bei starken Abweichungen zusätzlich einer Drittbegutachtung unterzogen. Die einzelnen vergebenen Punktzahlen ergeben am Ende eine Gesamtpunktzahl der Abiturprüfung, diese lässt sich wiederum in eine Note umwandeln und fließt in die Abiturnote des Faches ein.

214

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

Für die Lehrkräfte hat die Einführung des Zentralabiturs in den deutschen Bundesländern zunächst zu einem erhöhten Leistungsdruck geführt (vgl. Oerke, 2012), aber auch zu einer gesteigerten Kooperation zwischen Lehrkräften (vgl. Appius, 2012; Maag Merki & Holmeier, 2008). Für die Bundesländer Bremen und Hessen lässt sich zeigen, dass die anfänglich von Lehrkräften verspürte Mehrbelastung durch das Zentralabitur mit der Zeit nachlässt und mit dem Grad der Sicherheit im Umgang mit den Prüfungsvorgaben und der Kooperationsbereitschaft im Kollegium die zentralen Prüfungen zunehmend als Entlastung empfunden werden (vgl. Maag Merki, 2012a, S. 402). Hinsichtlich der gestiegenen Kooperationsbereitschaft der Lehrkräfte durch das Zentralabitur kommen Ferchow und Pfuhl (2011) in ihrer Befragung von nordrheinwestfälischen Lehrkräften zu dem Schluss, dass diese Kooperation sich vor allem auf das Erstellen von konkreten Unterrichtsmaterialien und den Austausch der durch die bundesweiten Bildungsstandards und das Zentralabitur veränderten Bewertungsvorgaben beziehen. Nur ein kleiner Teil der Lehrkräfte gibt dagegen an, sich über Fragen der pädagogischen Qualität oder eigene Schwierigkeiten und Defizite bei der Umsetzung der Vorgaben im Unterricht (im Sinne pädagogischer Professionalisierung) auszutauschen (Ferchow & Pfuhl, 2011). Studien des Instituts für Schulentwicklungsforschung (ISF) der Universität Dortmund, das mit der wissenschaftlichen Begleitung der Implementation des Zentralabiturs in NRW beauftragt wurde, belegen eine grundsätzliche Akzeptanz des Zentralabiturs durch die Lehrkräfte in NRW (Lorenz, Kahnert, Eickelmann & Bos, 2012); auch gaben die Lehrkräfte an, dass die Vergleichbarkeit der Ergebnisse sowohl innerhalb als auch zwischen Schulen durch das Zentralabitur zugenommen habe (Lorenz, Kahnert, Eickelmann & Bos, 2011). Inwiefern sich die „subjektive Wahrnehmung der Gerechtigkeit der Benotung“ im Zentralabitur veränderte, konnte in der Fragebogenuntersuchung von Lorenz et al. (2011) nicht abschließend geklärt werden, da die Frage „nach einem so komplexen Begriff wie dem der Gerechtigkeit, der sicherlich intersubjektiv und situativ größeren Interpretationsspielraum zulässt“, nicht erschöpfend durch ein einzelnes Item zu erfassen ist (Lorenz et al., 2011, S. 26). Wie

Schulische Leistungsbeurteilung in NRW

215

eine der Autorinnen später einräumt, erfordere dies eine weitergehende Erforschung mittels qualitativer Methoden (vgl. Lorenz, 2013). Auch an diese Forschungslücke schließt die vorliegende Arbeit zumindest teilweise an. Im Hinblick auf Gerechtigkeitsfragen lag der Fokus bisheriger Studien zum Zentralabitur vor allem auf der Überprüfung der Testfairness. Mit Testfairness ist gemeint, „ob bestimmte Personengruppen bevorzugt oder benachteiligt werden und ob der Test für alle Personengruppen die gleiche Schwierigkeit aufweist“ (Lorenz, 2013, S. 54; vgl. auch Schwabe, McElvany & Gebauer, 2013), Fairness wird hier also als Teil der Validität von Tests verstanden. Als gerecht bzw. fair werden Tests dann betrachtet, wenn für alle Schüler_innen gleiche Bedingungen bei der Testdurchführung und -bewertung vorliegen. Das dominierende Gerechtigkeitsprinzip ist hier also die Gleichbehandlung (equality). So hat Lorenz (2013) beispielsweise in ihrer Arbeit zum Zentralabitur in NRW die Angemessenheit der Aufgabenformate im Fach Englisch hinsichtlich gruppenspezifischer Unterschiede hinsichtlich Geschlecht und Schulformzugehörigkeit (Gymnasium/Gesamtschule) untersucht und festgestellt, dass die Fairness der untersuchten Prüfungsformate gewährleistet sei, da Potenziale aller untersuchten Gruppen berücksichtigt würden und somit keine systematische Benachteiligung stattfinde. Die Kritiker einheitlicher Prüfungen auf der Ebene des mittleren Schulabschlusses wie auch im Abitur befürchten, dass eine Vereinheitlichung der Prüfungen auch zu einer Vereinheitlichung der Aufgabenstellungen in den von Lehrkräften gestellten Klausuren und damit einer möglichen Engführung von im Unterricht behandelten Themen auf ausschließlich Prüfungsrelevantes zur Folge haben werde (vgl. u.a. Abraham, 2010; Bekes, 2010; GEW, 2008) – mit negativen Auswirkungen u.a. auf die Implementation fachdidaktisch innovativer Neuerungen sowie einer vergleichsweise geringeren Schüler_innen-orientierung im Unterricht. Diese Entwicklungen sind im anglo-amerikanischen Raum als backwashEffekt bereits mehrfach untersucht und belegt worden (vgl. Nichols & Berliner, 2007; Cheng & Curtis, 2012; Prodromou, 1995), eine Übertragung dieser internationalen Befunde auf den deutschen Kontext (und die

216

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

durchaus differenten Spezifika der 15 Bundesländer) ist jedoch aufgrund der verschiedenen Logiken der Prüfungssysteme nicht ohne weiteres möglich (vgl. Otto & Kühn, 2014). Für den deutschen Kontext sehen die Befunde sehr gemischt aus, so dass kaum zuverlässige Aussagen über alle Fächer und Schulformen hinweg möglich sind (vgl. Kühn & van Ackeren, 2012; für einen Überblick über Forschungen zu den Effekten zentraler Prüfungen Klein, Krüger, Kühn & van Ackeren, 2014). Für NRW kann Bekes (2010) zeigen, dass es im Fach Deutsch zumindest teilweise zu einer „Rekanonisierung“ in Bezug auf ausgewählte Autor_innen und literarische Epochen durch das Zentralabitur kommt (Bekes, 2010). Auch Eickelmann, Kahnert, Lorenz und Bos (2011) kommen in einer Lehrkräftebefragung zu dem Schluss, dass seit der Einführung des Zentralabiturs eine Verengung der Unterrichtsinhalte auf die prüfungsrelevanten Themen sowie ein eingeschränkteres Eingehen auf Schüler_innenwünsche bei der unterrichtlichen Vorbereitung auf die Prüfungen stattfindet. Und laut Maag Merki (2012a) kann diese Vereinheitlichung der Unterrichtsinhalte auch durchaus als ein erwünschtes Ziel zentraler Prüfungen bezeichnet werden, da hierdurch sogenannte ‚Orchideenthemen‘ in den Abiturprüfungen der Vergangenheit angehören würden (S. 403).

Vergleichsarbeiten Im Zuge der 2006 von der KMK verabschiedeten „Gesamtstrategie zum Bildungsmonitoring“ (KMK, 2006) wurden verschiedene Instrumente zur Qualitätsüberprüfung und -sicherung im Bildungsbereich eingeführt. Dabei wird zwischen zwei Arten von Instrumenten unterschieden: einerseits die auf Stichproben basierenden Ländervergleiche, die über die Bundesländer hinweg auf der Systemebene Aufschluss über Qualifikationsindikatoren im Bildungsbereich geben sollen. Andererseits die auf Vollerhebungen bestimmter Jahrgangsklassen innerhalb eines Bundeslandes basierenden Vergleichsarbeiten, die Aussagen auf der Ebene individueller Schüler_innen, Klassen und Schulen ermöglichen und damit einen Beitrag zur Schul- und Unterrichtsentwicklung leisten sollen. Seit

Schulische Leistungsbeurteilung in NRW

217

dem Schuljahr 2008/09 werden daher jedes Jahr in allen Bundesländern in allen dritten und achten Klassen118 sogenannte Vergleichsarbeiten geschrieben, deren Aufgaben eng an den in den Bildungsstandards definierten Zielvorgaben orientiert sind. In der dritten Klasse umfassen die Tests die Fächer Deutsch und Mathematik, in der achten Klasse werden auch die Lernleistungen in der ersten Fremdsprache (Englisch oder Französisch) erfasst. In Nordrhein-Westfalen wird synonym zum Begriff der Vergleichsarbeiten von „Lernstandserhebungen“ gesprochen. Laut KMK liegt die zentrale Funktion der Vergleichsarbeiten „in der Unterrichts- und Schulentwicklung jeder einzelnen Schule“ (KMK, 2012b, S. 2), die Ergebnisse der Tests werden daher auch nicht auf der Individualebene als Diagnoseinstrumente für einzelne Schüler_innen verwendet. Laut einem Runderlass des MSW NRW geben die Ergebnisse der Lernstandserhebungen „Hinweise auf Stärken und Schwächen der Lerngruppen und unterstützen die Unterrichtsentwicklung“ (MSW, 20.12.2006). Auch hier findet sich die klare Orientierung an der Lerngruppe – und nicht etwa den individuellen Schüler_innen - und einer Weiterentwicklung und Verbesserung des Unterrichts. Die Aufgaben werden zentral durch das MSW vorgegeben und orientieren sich an den Bildungsstandards der Kultusministerkonferenz. Die Schüler_innen in den jeweiligen Jahrgängen 3 bzw. 8 sind dazu verpflichtet an den Tests teilzunehmen; Ausnahmen gelten für Schüler_innen mit sonderpädagogischem Förderbedarf bzw. für Schüler_innen, die weniger als 12 Monate in Deutschland leben (MSW, 20.12.2006). Die Durchführung und Korrektur der Lernstandserhebungen erfolgt durch die jeweiligen (Fach-)Lehrkräfte in den einzelnen Schulen anhand von vorgegebenen Auswertungsanleitungen, trotzdem sind diese Tests 118

Die ersten Vergleichsarbeiten im Primarbereich wurden im Jahr 2003 in RheinlandPfalz im Fach Mathematik durchgeführt, ein Jahr später schlossen sich dann Berlin, Brandenburg, Bremen, Mecklenburg-Vorpommern, Nordrhein-Westfalen und SchleswigHolstein an und die Tests wurden auch im Fach Deutsch durchgeführt. In einigen Bundesländern werden neben den Tests in Klasse 3 und 8 auch in der sechsten Klasse Leistungstests durchgeführt (vgl. Richter, Böhme, Becker, Pant & Stanat, 2014, S. 227).

218

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

damit bei weitem nicht so standardisiert wie bspw. die internationale Schulleistungsstudie PISA (Programme for International Student Assessment) oder die vom Institut für Qualitätsentwicklung im Bildungswesen (IQB) durchgeführten Ländervergleiche119 Die Ergebnisse sollen den Lehrkräften sowie den getesteten Schüler_innen und deren Eltern mitgeteilt werden, wobei die Vorgaben dazu je nach Bundesland unterschiedlich ausfallen. Auch die Frage, inwiefern Schulleitungen, die Schulaufsicht und Schulinspektion über die Ergebnisse der Vergleichsarbeiten informiert werden, unterscheidet sich zwischen den Bundesländern zum Teil erheblich. In NRW erfolgt die Rückmeldung der Ergebnisse durch die jeweiligen Lehrkräfte an die einzelnen Schüler_innen und deren Eltern. Diese erhalten dabei sowohl das Ergebnis ihres Kindes als auch das der besuchten Klasse, sowie den Durchschnitt aller Schüler_innen der jeweiligen Schule. Innerhalb der Schule sollen die Ergebnisse dem Kollegium vorgestellt und im Rahmen von Fach- und Lehrer_innenkonferenzen über Konsequenzen für die schulische Arbeit beraten werden. Die Schulen berichten der Schulaufsicht von den Ergebnissen der Tests und die Ergebnisse aller Schulen werden in einer zentralen Datenbank gesammelt (vgl. MSW, 20.12.2006). Einer allgemeinen Veröffentlichung der Ergebnisse und daraus ableitbaren Rankings von Schulen, beispielsweise auf Bundeslandebene, widerspricht die KMK entschieden, da dies „mit der Kernfunktion des Instruments, Schul- und Unterrichtsentwicklung zu betreiben, nicht zu vereinbaren ist“ (KMK, 2012b, S. 2). Erlaubt sind jedoch kleinräumige Darstellungen bei denen die Anonymität der Einzelschulen sichergestellt ist.

119

Die Ländervergleiche dienen ebenfalls der Überprüfung der Erreichung der Bildungsstandards und werden alle fünf Jahre in der Primarstufe sowie alle drei Jahre in der Sekundarstufe I durchgeführt. Die Teilnahme der Bundesländer ist verpflichtend, allerdings handelt es sich nicht um eine Vollerhebung bestimmter Klassenstufen wie bei den Lernstandserhebungen/Vergleichsarbeiten, sondern um eine bundesweit repräsentative Stichprobe von Schüler_innen der vierten bzw. neunten Jahrgangsstufe. Die Tests selbst werden durch externe Testleiter_innen durchgeführt und ausgewertet (vgl. https://www.iqb.hu-berlin.de/laendervergleich).

Schulische Leistungsbeurteilung in NRW

219

Mit dem KMK-Beschluss von 2012 wurde auch die Benotung von Vergleichsarbeiten, sowie der Ersatz einer Klassenarbeit durch die Tests untersagt (vgl. KMK, 2012b, S. 2). Im selben Jahr stellte auch das Ministerium für Schule und Weiterbildung NRW in einem Runderlass klar, dass Lernstandserhebungen „nicht als Klassenarbeit gewertet und nicht benotet [werden dürfen]“ (MSW, 20.12.2006). Im Schulgesetz von NRW in der Fassung vom 18.01.2013 heißt es aber immer noch: „Grundlage der Leistungsbewertung sind alle von der Schülerin oder dem Schüler im Beurteilungsbereich ‚Schriftliche Arbeiten‘ und im Beurteilungsbereich ‚Sonstige Leistungen im Unterricht‘ erbrachten Leistungen. Beide Beurteilungsbereiche sowie die Ergebnisse zentraler Lernstandserhebungen werden bei der Leistungsbewertung angemessen berücksichtigt“ (NRW SchulG, §48, 2; Hervorh. K.F.). Dieser Passus wurde erst mit dem 12. Schulrechtsänderungsgesetz vom 17.06.2015 gestrichen und damit drei Jahre nach dem Beschluss der KMK eine juristische Grauzone aufgehoben (Landtag NRW, 2015). 5.2.3 Lehramtsausbildung in NRW und professioneller Status der Lehrkräfte Im Folgenden sollen analog zum schwedischen Fall (vgl. Kap. 5.1.3) kurz einige Charakteristika der deutschen Lehkräfteprofession im Allgemeinen und die Rahmenbedingungen der nordrhein-westfälischen Lehramtsausbildung sowie die Beschäftigungssituation der in NRW tätigen Lehrkräfte skizziert werden. Auch hier wird weniger Anspruch auf Vollständigkeit erhoben als der Versuch unternommen auf zentrale Aspekte und einige deutsche Eigenheiten des Lehrer_innenberufs hinzuweisen, die gerade im Vergleich zu ihren schwedischen Kolleg_innen für die vorliegende Arbeit relevant sind.120

120

Für einen umfangreichen Überblick über die Forschung zu verschiedenen historischen Entwicklungsphasen der deutschen Lehrkräfteprofession sei stellvertretend auf die

220

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

Historisch betrachtet sind nach Zymek (2017) die Lehrerbildung sowie der Status und die Professionsentwicklung der Lehrkräfte aufs Engste mit der Entwicklung moderner Bildungssysteme in den deutschen Staaten verbunden: erst die Anstellung von Lehrkräften, die an der Universität ausgebildet waren und eine „standesgemäße Besoldung und Versorgung“ (S. 74) erhielten, ermöglichte die Anerkennung einer Schule als höhere Lehranstalt – und ausschließlich von diesen konnten wiederum Abschlüsse und Berechtigungen verliehen werden. Die sukzessive Weiterentwicklung des Primarschulwesens und der Mädchenbildung zu Beginn des 20. Jahrhunderts vollzogen sich demnach nach dem Vorbild der höheren Lehranstalten ebenfalls über die Anpassung der Lehrer(innen)bildung, sodass sich das Idealbild des deutschen Gymnasiallehrers als „Leitmodell der Entwicklung und als strategischer Orientierungspunkt des Emanzipations- und Aufstiegs-strebens aller anderen Lehrergruppen“ erwies (Zymek, 2017, S. 76). Lehrkräfte als Staatsbedienstete mit einer universitären fachwissenschaftlichen Ausbildung und entsprechender Besoldung und Versorgung galten lange Zeit als ausreichende Garantien für hohe Qualitätststandards im Bildungswesen – durch den sogenannten „PISA-Schock“ kam diese Sicherheit ins Wanken.

Aktuelle Struktur der Lehramtsausbildung in NRW Terhart betont die Einzigartigkeit der deutschen Lehrerbildungsstruktur mit ihren zwei Phasen, die so „in keiner anderen modernen Gesellschaft entwickelt“ sei (Terhart, 2004, S. 38). 121 Anders als im schwedischen Fall wird die Lehramtsausbildung in Deutschland nicht zentral und einheitlich auf Bundesebene festgelegt und gesteuert, sondern analog zu (fast) Arbeiten von Kintzinger, Hellekamps & Musolff sowie Kemnitz im Handbuch der Forschung zum Lehrerberuf (Terhart, Bennewitz & Rothland, 2014) verwiesen. 121 Zu den verschiedenen Phasen und Reformen der Lehrkräftebildung in Westdeutschland vgl. Beckmann (1998), Schützenmeister (2002), Bellenberg und Tierack (2003). Für die aktuellen Reformen seit 2004, vgl. Terhart (2011c).

Schulische Leistungsbeurteilung in NRW

221

allen anderen Fragen des Bildungsbereichs auf der Ebene der Bundesländer. Durch die verschiedenen Schulformen und -strukturen der Bundesländer sind so auch bundesweit viele verschiedene Lehramtsstudiengänge entstanden. Die von der Kultusministerkonferenz verabschiedeten „Standards für die Lehrerbildung: Bildungswissenschaften“ (KMK, 2004)122 liefern hierfür jedoch einen verbindlichen Rahmen, der bei aller Unterschiedlichkeit zwischen den Bundesländern eine gewisse Einheitlichkeit – zumindest des bildungswissenschaftlichen Studienanteils – sichern soll. Allen Bundesländern gemeinsam ist die grundsätzliche Struktur der Lehramtsausbildung in zwei Phasen: die erste Phase, das Studium bzw. die universitäre Ausbildung, wurde bis zur Einführung des Bachelor-Master-Systems mit dem Ersten Staatsexamen abgeschlossen, heute erhalten Absolvent_innen den Master of Eucation bescheinigt; daran schließt sich die zweite Phase, der Vorbereitungsdienst bzw. das Referendariat, an, das im Studienseminar und an der Ausbildungsschule absolviert wird und mit dem (Zweiten) Staatsexamen abschließt.123 In Nordrhein-Westfalen wurden zuletzt 2009 mit der Verabschiedung des neuen Lehrerausbildungsgesetzes (LABG) und der dazugehörigen Lehramtszugangsverordnung (LZV) verschiedene Änderungen in der Lehramtsausbildung vorgenommen. Die Angleichung der Studiendauer aller Lehramtsstudiengänge und eine Erhöhung der Praxisanteile während des Studiums sowie die Verkürzung des Referendariats auf nunmehr 18 Monate stellten dabei zentrale Änderungen dar. 122

Zum Hintergrund und der Entstehungsgeschichte der „Standards“ vgl. Terhart (2014). Die „Standards“ wurden 2014 aktualisiert und um den Inklusionsgedanken erweitert, vgl. https://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/2004/2004_12_16Standars-Lehrerbildung-Bildungswissenschaften [06.02.2015]. 123 Die Lehramtsstudiengänge wurden im Nachgang des neuen Lehrerausbildungsgesetzes 2009 auf Bachelor/Master umgestellt, bereits eingeschriebene Studierende konnten teilweise noch bis 2015/16 nach den alten Studienordnungen studieren und das Erste Staatsexamen ablegen und folglich auch das Zweite Staatsexamen nach dem Vorbereitungsdienst ablegen. Absolvent_innen mit einem Abschluss Master of Education legen die Staatsprüfung ebenfalls nach dem Vorbereitungsdienst ab, sie heißt dann aber nicht mehr Zweites Staatsexamen.

222

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

In NRW können Studieninteressierte heute (Stand: 2013) zwischen fünf verschiedenen Lehramtsstudiengängen wählen, die auf die Tätigkeit an der jeweiligen Schulform vorbereiten: Lehramt an Grundschulen; Lehramt an Haupt-, Real- und Gesamtschulen; Lehramt an Gymnasien und Gesamtschulen; Lehramt an Berufskollegs; sowie Lehramt für sonderpädagogische Förderung. Alle Studiengänge schließen in der Regel mit dem Bachelor nach sechs und dem Master of Education nach weiteren vier Semestern ab. Mit der Angleichung der Regelstudienzeit auf zehn Semester für alle Lehramtsstudiengänge wurde gleichzeitig eine Aufwertung der verschiedenen Lehramtsausbildungen angestrebt (vgl. MSW, 2013, S. 3). Lehramtsstudierende studieren zwei bis drei Fächer (je nach anvisiertem Abschluss), in denen auch die fachdi-daktische Ausbildung erfolgt, sowie einen bildunsgwissenschaftlichen Studienanteil, der von den Erziehungswissenschaften, Psychologie, Soziologie, teilweise auch Philosophie und Politikwissenschaft gestaltet wird. Der größte Anteil des bildungswissenschaftlichen Studienteils im Lehramt besteht jedoch aus erziehungswissenschaftlichen Veranstaltungen (wobei dieser Anteil wiederum zwischen 5 – 20 % des gesamten Lehramtsstudiums ausmachen kann, vgl. Terhart, 2011b, S. 115). Trotz Bemühungen um curriculare Standards in Form eines Kerncuriculums kann dieser Teil des Lehramtsstudiums bisher lediglich als ein „kaum strukturiertes Wahlcurriculum“ (Terhart, 2011b, S. 116) bezeichnet werden, dessen Inhalte stark von den Präferenzen und Wahlentscheidungen der Studierenden abhängig sind. Das Studium beinhaltet mehrere Praxisphasen, darunter ein Eignungsund ein Orientierungspraktikum.124 Während des Bachelorstudiums sollen Studierende ein mindestens einmonatiges Orientierungspraktikum sowie ein mindestens vierwöchiges Berufsfeldpraktikum im schulischen bzw. außerschulischen Bereich absolvieren. Im Masterstudium ist zudem 124

Vgl. für diese und die folgenden Angaben zum Lehramtsstudium die Informationsseiten des nordrhein-westfälischen Ministeriums für Schule und Weiterbildung, https://www.schulministerium.nrw.de/docs/bp/Lehrer/Lehrkraftwerden/Lehramtsstudium/index.html [07.12.2016].

Schulische Leistungsbeurteilung in NRW

223

ein mindestens fünfmonatiges Praxissemester abzuleisten, in dem die Studierenden im Unterricht hospitieren und unter Anleitung eines Mentors oder einer Mentorin der Schule selbständig unterrichten. Damit wird im Praxissemester ein Teil der Ausbildungsinhalte der Zweiten Phase vorweggenommen, was laut Terhart zu einem „Zielkonflikt bzw. eine[r] Funktionsüberlastung“ (Terhart, 2011b, S. 114) des Praxissemesters führen kann. Im Anschluss an die universitäre Ausbildung beginnt mit dem sogenannten Vorbereitungsdienst (früher: Referendariat), der seit 01.11.2011 nur noch 18 Monate125 umfasst, die zweite Ausbildungs-phase. Mit Eintritt in den Vorbereitungsdienst erfolgt die Verbeamtung auf Widerruf, d.h. Lehramtsanwärter_innen werden für die Zeit des Vorbereitungsdienstes verbeamtet. Der Vorbereitungsdienst wird an einer Schule der zum jeweiligen Lehramtsabschluss passenden Schulform und den jeweiligen Fachseminaren der schulpraktischen Zentren126 absolviert. Die Ausbildungsinhalte werden im „Kerncurriculum für die Ausbildung im Vorbereitungsdienst für Lehrämter“ festgehalten. Darin findet sich u.a. das sogenannte „Handlungsfeld L - Lernen und Leisten herausfordern, dokumentieren, rückmelden und beurteilen“ (MSW, 2016b, S. 7), in dem das komplexe Feld der schulischen Leistungsbeurteilung beschrieben wird. Lehramtsanwärter_innen im Vorbereitungsdienst hospitieren bei erfahrenen Lehrkräften und unterrichten unter Anleitung, geben aber auch eigenständig Unterricht (Ausbildungsunterricht). Darüber hinaus erstreckt sich die Ausbildung „auf alle Handlungsfelder des Lehrerberufs“ (OVP, §11,3), also auch einschließlich der Beurteilung von Schüler_innen. Lehramtsanwärter_innen können so bspw. an der Korrektur von Klassenarbeiten beteiligt werden oder die Beurteilung der mündli125

Es gibt auch die Möglichkeit den Vorbereitungsdienst in Teilzeit abzulegen, dann verlängert sich dieser auf 24 Monate. 126 Anders als in anderen Bundesländern existiert in Nordrhein-Westfalen keine zentrale Institution für die Lehrer_innenbildung. Die Verantwortung für die fachwissenschaftliche und -didaktische Ausbildung obliegt den „Zentren für schulpraktische Lehrerbildung“ an den für die Lehramtsausbildung zuständigen Universitäten. In den fünf Regierungsbezirken gibt es 33 solcher Zentren.

224

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

chen und schriftlichen Leistungen der Schüler_innen ihres Ausbildungsunterrichts verantworten. Am Ende des Vorbereitungsdienstes legen angehende Lehrkräfte eine Staatsprüfung vor dem Landesprüfungsamt ab. Im Rahmen der Maßnahmen zur Öffnung des Bildungssystems in Richtung einer inklusiveren Schule gibt es seit Februar 2013 zudem für bereits ausgebildete Lehrkräfte die Möglichkeit einer berufs-begleitenden Nachqualifizierung zur Lehrkraft für sonderpädagogische Förderung (gemäß der „Verordnung zur berufsbegleitenden Ausbildung zum Erwerb des Lehramts für sonderpädagogische Förderung“ = VOBASOF). Obwohl die Ausbildung bei den teilnehmenden Lehrkräften überwiegend auf große Zustimmung stößt (vgl. MSW, 2014, S. 49-50), wird der Einfluss der Nachqualifizierung einzelner Lehrkräfte auf die gewünschten Entwicklungsprozesse innerhalb der Einzelschulen in Richtung einer inklusiveren Schullandschaft skeptisch begegnet (vgl. Badstieber & Amrhein, 2016). Um den hohen Bedarf an Lehrkräften zu decken und Unterrichtsausfall zu vermeiden, gibt es für Schulen die Möglichkeit auch solche Lehrkräfte einzustellen, die (noch) keinen Lehramtsabschluss haben. Durch die „Ordnung zur berufsbegleitenden Ausbildung von Seiteneinsteigerinnen und Seiteneinsteigern und der Staatsprüfung“ (OBAS) wird geregelt, wie der berufsbegleitende Seiteneinstieg für andere Hochschulabsolvent_innen ins Lehramt über einen berufsbegleitenden Vorbereitungsdienst ermöglicht wird. Der Anteil der Seiten-einsteiger_innen an den Neueinstellungen nimmt aufgrund des gestiegenen Lehrkräftemangels in den letzten Jahren kontinuierlich zu, was insbesondere auch von den Gewerkschaften zunehmend mit Sorge betrachtet wird (vgl. Paschert, 2017).

Arbeitsbedingungen und Rechtsstellung Lehrkräfte arbeiten in Deutschland im Beamten- oder Beschäftigtenverhältnis, die Quote der Verbeamtungen schwankt dabei aufgrund der föderalen Struktur zwischen den Bundesländern erheblich: so waren

Schulische Leistungsbeurteilung in NRW

225

2011 in Baden-Württemberg rund 90 %, in Berlin 63 % aller Lehrkräfte verbeamtet, in Sachsen lag diese Quote bei nur 3 % und in MecklenburgVorpommern sogar bei nur 0,1 % (vgl. Gehrke & Bruno-Latocha, 2013, S. 309). In NRW lag die Quote im Schuljahr 2015/16 bei 78,3 % verbeamteten und 20,2 % beschäftigten Lehrkräften (vgl. MSW, 2016c, S. 53). Die Beamtenbesoldung erfolgt je nach Bundesland auf unterschiedlicher rechtlicher Grundlage, für die Beschäftigten gilt der Tarifvertrag der Länder (TV-L). Ursprünglich wurde der Beamtenstatus für Lehkräfte eingeführt, da diese gleichzeitig Lehrer_in und Prüfungs-beamte_r in einer Person waren (vgl. Zymek, 2017, S. 80). Für die Ausübung ihrer Tätigkeiten spielen die Unterschiede des Beschäf-tigungsverhältnisses heute keine Rolle mehr, sowohl verbeamtete als auch beschäftigte Lehrkräfte haben die gleichen Rechte und Pflichten (vgl. Cramer, 2014, S. 178-179). Deutlich werden die Unterschiede vor allem in der Bezahlung und den Versorgungsansprüchen, beschäftigte Lehrkräfte verdienen (bei oftmals gleicher Arbeit) deutlich weniger als ihre verbeamteten Kolleg_innen. Im OECD-Vergleich verdienen deutsche Lehrkräfte allerdings insgesamt überdurchschnittlich gut (vgl. OECD, 2016, S. 3). Im Gegensatz zu den schwedischen Lehrkräften gibt es keine leistungsbezogenen Zulagen, weshalb Cramer konstatiert: „Leistung lohnt sich finanziell nicht – umgekehrt schadet auch ‚Dienst nach Vorschrift‘ nicht“ (Cramer, 2014, S. 179). Gleiches gilt für die berufliche Weiterentwicklung: die Teilnahme an Lehrkräfteweiter- und fortbildungen wird weder belohnt noch kontrolliert. Es fehle insgesamt an Aufstiegs- und Karrierechancen, wie sie in anderen akademischen Berufen üblich sind (vgl. Cramer, 2014, S.179). Auch die Arbeitsstelle können Lehrkräfte in Deutschland nicht frei wählen oder wechseln, sondern müssen dafür auf eine freie Planstelle in ihrer Wunschschule hoffen, für die sie sich bewerben und von der Schulaufsicht abgeordnet werden können. In diesem Sinne sind Lehrkräfte in Deutschland in einer eigentümlichen Zwischenposition: einerseits reglementiert die staatliche Schuladministration die Rahmenbedingungen des Lehrerberufs bis ins Detail, andererseits genießen sie in ihrem alltäglichen Unterrichtshandeln – und

226

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

auch bei der Leistungsbeurteilung – sehr viele Freiheiten und Entscheidungsbefugnisse. 5.3 Zwischenfazit: Institutionelle Rahmung von Leistungsbeurteilung und darin eingelassene Gerechtigkeitsnormen Nachdem die Bildungssysteme Schwedens und Nordrhein-Westfalens mit ihren jeweiligen Besonderheiten dargestellt wurden, sollen im Folgenden einige zentrale Merkmale beider Systeme bezogen auf die Rolle schulischer Leistungsbeurteilung innerhalb der Bildungssysteme sowie die Rolle der Lehrkräfte in Hinblick auf ihren pädagogischen Gestaltungsspielraum zusammenfassend beleuchtet werden. Wie zu Beginn des fünften Kapitels eingeführt, wird davon ausgegangen, dass die je spezifischen institutionellen Konfigurationen der schulischen Leistungsbeurteilungssysteme beider Kontexte auf gesellschaftlich-kulturell geteilte Gerechtigkeitsnormen schließen lassen, die wiederum (bewusst oder unbewusst) auch die Gerechtigkeitsüberzeugungen der befragten Lehrkräfte rahmen und damit bspw. spezifische Beurteilungs-strategien als legitim, andere hingegen als illegitim für sie wirken lassen. Das Zwischenfazit zu diesen institutionell geprägten Gerechtigkeitsnormen wird dabei anhand dreier thematischer Stränge entfaltet: zunächst wird der Frage nachgegangen, welche Gerechtigkeitsnormen bereits implizit in die gegliederte bzw. gesamtschulische Struktur der beiden Bildungssysteme eingelassen sind; anschließend den Unterschieden und Gemeinsamkeiten in der regulativen Rahmung der schulischen Leistungsbeurteilung nachgegangen; um abschließend den professionellen Status der Lehrkräfte beider Kontexte vergleichend im Hinblick auf ihre professionellen Spielräume bei der Gestaltung einer „gerechten“ schulischen Leistungsbeurteilung zu betrachten. Das inklusive Gesamtschulsystem Schwedens mit einer gemeinsamen Schule für alle Kinder von der Vorschul- bis zur 9. Klasse (grundskola) wird von einem breiten gesellschaftlichen und parteipolitischen Konsens getragen. Auch wenn die grundskola sowie die weiterführende Schulform gymnasieskola in den vergangenen 20 Jahren regelmäßig für sin-

Zwischenfazit

227

kende Leistungen oder zu wenig Leistungsorientierung kritisiert wurde (vgl. Ringarp & Rothland, 2008, 2010), blieb die grundsätzliche Struktur des Gesamtschulsystems unangetastet und die sozial-demokratische Leitidee einer Schule für alle Kinder bis heute bestimmend. Das lange gemeinsame Lernen von Schüler_innen, die Abschaffung des ‚Sitzenbleibens‘ und der Abschlussprüfungen (bereits in den 1960er Jahren) sowie die Etablierung zahlreicher Individuali-sierungs- und Unterstützungsangebote innerhalb der Schule waren dabei immer auch mit einem gesellschaftlichen Anspruch an die Schule als wichtige sozialisatorische Instanz mit kompensatorischem Auftrag verbunden, an dem bis heute festgehalten wird (Skolverket, 2014a, S. 10). Die individuellen Fördermaßnahmen der allgemeinbildenden Schule zielen dabei nicht nur auf Schüler_innen mit Lernschwierigkeiten, körperlichen oder geistigen Beeinträchtigungen, sondern sind an alle Kinder und Jugendlichen gerichtet mit dem Ziel der individuellen Lernentwicklungsförderung (vgl. auch Kap. 6.3.4.3). Als ein dominierendes Gerechtigkeitsprinzip kann das Prinzip der Schwellengerechtigkeit (vgl. Kap. 2.4.1) gelten, das sich u.a. darin zeigt, dass große Anstrengungen durch die schulischen Akteure unternommen werden, um möglichst viele Schüler_innen auf ein Mindestniveau zu bringen. Dies wurde bereits bei der Einführung des kriteriengeleiteten Beurteilungssystems Mitte der 1990er Jahre deutlich, bei dem das bildungspolitische Ziel erklärt wurde, möglichst allen Schüler_innen zu ermöglichen die Schwelle zur Note ‚bestanden‘ (G) zu erreichen (vgl. SOU 1992:94). Dies wurde auch mit der Umstellung auf die Zensurenskala (A-F) beibehalten (vgl. hierzu Kap. 5.1.2). Die Orientierung auf equality of outcomes kann zumindest bis einschließlich der 9. Klasse der grundskola als wichtiges Ziel gelten, auf dem Niveau der weiterführenden gymnasieskola gilt Differenzierung (auch nach Leistung) hingegen nicht mehr als verwerflich. Die Bildungssysteme der deutschen Bundesländer setzen hingegen traditionellerweise auf eine Homogenisierung ihrer Schüler_innenschaft, indem sie die Schüler_innen u.a. auf der Grundlage einer zugeschriebenen Leistungsfähigkeit unterschiedlichen Schultypen zuweisen, die ungleiche Leistungsanforderungen und –erwartungen an sie stellen und zu

228

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

unterschiedlichen Abschlüssen und damit Lebenschancen führen. Die Idee einer „begabungsgerechten“ Förderung (vgl. Kap. 5.2.1) steht hier der oben geschilderten Schwellen-gerechtigkeit gegenüber. Durch die Zusammenlegung verschiedener Schularten bzw. die Einführung von anderen Sekundarschulformen, die alle Abschlussarten ermöglichen und sich neben dem Gymnasium etablieren, wird die traditionelle dreigliedrige Struktur der Bildungssysteme der Bundesländer zunehmend aufgelöst – im Fall von NRW wurde jedoch im Zuge bildungspolitischer Streitigkeiten sowohl die Beibehaltung der drei klassischen Schulformen Haupt-, Realschule und Gymnasium sowie der in den 1970er Jahren eingeführten Gesamtschule, als auch die Einführung der schulartübergreifenden Sekundarschule vollzogen, so dass hier sogar eine noch stärker gegliederte Struktur vorliegt (vgl. Kap. 5.2.1). Gleichzeitig wurden mit den Bemühungen um ein inklusiveres Bildungssystem Veränderungsprozesse angeschoben, die mit verän-derten Anforderungen an die Lehrkräfte und deren Umgang mit heterogenen Lerngruppen einhergehen und eine Herausforderung für deren professionelles Handeln darstellen (vgl. dazu u.a. Wittek, 2013; Schieferdecker, 2016). Der wohl größte Unterschied zwischen den Beurteilungssystemen Schwedens und NRWs dürfte das vollständige Fehlen von Abschlussprüfungen im schwedischen System sein, aber auch die verhältnismäßig späte Benotung schwedischer Schüler_innen ab der 6. Klasse stellt einen deutlichen Unterschied dar. Obwohl es auch in NRW Bestrebungen gibt, die Selektionshürden innerhalb der Bildungsgänge zu verringern (u.a. kein Sitzenbleiben in der Erprobungsstufe, zensurenfreie Grundschulzeugnisse), bleiben die mittlerweile zentralen Abschlussprüfungen am Ende der Klasse 10 bzw. das Zentralabitur high-stakes Situationen für Schüler_innen. Die Leistungsbeurteilung findet im schwedischen Kontext zunächst als lernprozessbegleitende, formative Beurteilung im Laufe des Schuljahres statt, erst am Ende des Schulhalbjahres127 findet eine Benotung mit Zensuren statt. Die schwedischen Lehrpläne definieren dafür sehr genaue 127

In der gymnasieskola am Ende des jeweiligen Kurses, vgl. Kap. 5.1.2.

Zwischenfazit

229

Beurteilungskriterien für jedes Lernziel auf verschiedenen Notenstufen, die genauen Beurteilungsformen sind den Lehrkräften demgegenüber freigestellt. In NRW liegen wiederum detaillierte Vorga-ben zur Art und Anzahl der „Leistungsüberprüfungen“ sowie zur Gewichtung verschiedener Beurteilungsbereiche vor, neben den sehr allgemein gehalten Notendefinitionen (sehr gut, gut, ...) finden sich aber keine weitergehenden Verbindungen zwischen den Lernzielen der Kernlehrpläne und den Noten. Die in den schwedischen Lehrplänen formulierten Wissensanforderungen (kunskapskrav) stellen dabei Mindeststandards dar, die für eine Note zu erreichen sind. Die nordrhein-westfälischen Kernlehrpläne orientieren sich hingegen an den bundesweiten Bildungsstandards, die sich wiederum auf ein mittleres Anforderungsniveau beziehen, also Regelstandards darstellen. Die Betonung der Gleichwertigkeit (likvärdighet) des Bildungssystems und der schulischen Leistungsbeurteilung ist ein zentraler Anspruch, der in den Regularien immer wieder formuliert (vgl. Skollag 2010:800, §9) und einerseits durch die detaillierten Beurteilungskriterien in den Lehrplänen, andererseits durch die landesweiten standardisierten Tests (nationella prov) sichergestellt werden soll. In den nordrhein-westfälischen Regularien wird hingegen die „pädagogische Freiheit“ der Lehrkräfte bei der schulischen Leistungsbeurteilung betont. Daneben wird durch die zentralen Abschlussprüfungen und dazugehörigen Korrekturvorgaben eine größere Standardisierung und Vereinheitlichung der Abschlüsse angestrebt. Gleichzeitig nehmen in beiden Ländern die Lehrkräfte die Korrektur der nationella prov bzw. Abschlussprüfungen vor128, wodurch ein eher mittlerer Standardisierungsgrad erreicht wird (verglichen mit Systemen in denen externe Institutionen diese Aufgabe übernehmen, wie die external examination boards in England). Hinsichtlich der Bezugsnormorientierung gibt es ebenfalls deutliche Unterschiede auf der Ebene der Regularien: während die schwedischen Vorgaben insbesondere die Orientierung an den in den Lehrplänen vor128

Die nationella prov stellt keine Abschlussprüfung dar und wird hier nur aufgrund des standardisierten Testformats den zentralen Prüfungen in NRW gegenübergestellt.

230

5 Institutionelle Rahmung schulischer Leistungsbeurteilung

gegebenen Wissensanforderungen (kunskapskrav) unter Berücksichtigung der individuellen Lernvoraussetzungen der einzelnen Schüler_innen propagieren – also eine Mischung aus kriterialer und individueller Bezugsnorm –, positionieren sich die nordrhein-west-fälischen Regularien weniger deutlich hinsichtlich der zu präferierenden Bezugsnorm. Aus den Notendefinitionen ist zumindest aber eine Orientierung an den „Anforderungen“, also den Lehrplanzielen, vorgegeben. Es zeigt sich, dass sich in Schweden eine normativ aufgeladene Erwartungshaltung, was eine ‚gerechte Leistungsbeurteilung‘ sein soll, aus den offiziellen Regularien ableiten lässt. Die deutliche Bestimmung einer gerechten Beurteilung als einer umfassenden, holistischen, dabei aber auch gleichwertigen Beurteilung (allsidig och likvärdig bedömning, vgl. Lgr11, S. 18) rahmt das konkrete Beurteilungshandeln schwedischer Lehrkräfte auf einer normativen Ebene sehr viel stärker als dies in NRW der Fall ist. Es scheint stärker vorgegeben, was eine legitime Beurteilung ist und an welchen Maßstäben dies gemessen wird. Es wäre allerdings verkürzt, hier bereits von einer eingeschränkten professionellen Autonomie zu sprechen, da den schwedischen Lehrkräften auf der anderen Seite die konkreten Beurteilungssituationen und – formen sehr viel weniger vorgeschrieben werden als ihren Kolleg_innen in NRW. Vorgegeben sind die curricularen Inhalte und die Erwartung, dass Lehrkräfte alles daran setzen jedem Kind bzw. Jugendlichen dabei zu helfen, sich so gut wie möglich zu entwickeln und die gegebenen Lernziele so weit wie möglich zu erreichen.129 Während den Lehrkräften (und Schüler_innen) in NRW in den Kernlehrplänen jahrgangsweise Lernziele vorgegeben werden, gelten die Lehrplanziele der schwedischen grundskola für jeweils drei Jahre (Klassen 1-3, 4-6 und 7-9), und können folglich auch in unterschiedlichem Tempo erreicht werden. Auf welche Art und Weise der Lernfortschritt durch verschiedene Arten der Leistungsbeurteilung festgestellt und rückgemeldet wird, steht den schwedischen Lehrkräften 129

In den Veröffentlichungen von Skolverket drückt sich dies in der fast schon formelhaften Phrase nå så bra som möjligt aus, die auch von den Lehrkräften in den Interviews verwendet wird.

Zwischenfazit

231

vollkommen frei. In NRW wiederum existieren genaue Vorgaben darüber, dass die Leistungsbeurteilung sich aus mündlichen und schriftlichen Bestandteilen zusammensetzen soll, wie diese beiden Bereiche für die Halbjahresnote zu gewichten sind und wie viele Klassenarbeiten bspw. im Fach Mathematik innerhalb eines bestimmten Jahrgangs an welcher Schulform zu schreiben sind.130 Bei der Festlegung einer bestimmten Note für ein Leistung sind die nordrhein-westfälischen Lehrkräfte wiederum vollkommen frei, wohingegen ihre schwedischen Kolleg_innen angehalten sind die Beurteilungskriterien (kunskapskrav) anzuwenden. Die hier skizzierten institutionellen Rahmenbedingungen schulischer Leistungsbeurteilung in den beiden untersuchten Bildungssystemen stellen – wie eingangs dargestellt – wichtige Kontextbedingungen dar und sind gleichermaßen als eine der zentralen Kategorien in die Entwicklung einer grounded theory um die Kernkategorie ‚gerechte Leistungsbeurteilung als Balanceakt‘ eingeflossen. Die schrittweise Entwicklung dieser Kernkategorie sowie die Darstellung der rekonstruierten Gerechtigkeitsüberzeugungen der befragten Lehrkräfte erfolgt nun ausführlich im folgenden Kapitel 6.

130

Vgl. hierfür den Anhang zu den Ausbildungs- und Prüfungsordnungen auf dem Bildungsportal NRW: https://www.schulministerium.nrw.de/docs/Recht/Schulrecht/APOen/HS-RS-GE-GYSekI/Anzahl-Klassenarbeiten/

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen von Lehrkräften und Entwicklung einer gegenstandsverankerten Theorie Im folgenden Kapitel werden nun die aus den Interviewtranskripten rekonstruierten Gerechtigkeitsüberzeugungen der befragten Lehrkräfte beider Länder sowie die daraus abgeleitete gegenstandsverankerte Theorie dargestellt. Zu diesem Zweck wird zunächst die in der fall- und länderübergreifenden Analyse herausgearbeitete Kernkategorie skizziert (Kap. 6.1). Wie in Kapitel 3.1 bereits erläutert, stellt die Kernkategorie den zentralen Bezugspunkt aller im Laufe des iterativen Forschungsprozesses entwickelten Kodes und Kategorien dar; in ihr fließen die verschiedenen Variationen oder Ausprägungen der Gerechtigkeitsüberzeugungen zusammen. Im Anschluss an die Darstellung der Kernkategorie werden in Kapitel 6.2 weitere zentrale Kategorien erläutert, um am Ende das Modell der gegenstandsverankerten Theorie zu Gerechtigkeitsüberzeugungen von Lehrkräften bei der schulischen Leistungsbeurteilung einzuführen. Aufbauend auf diesem Modell werden in den anschließenden Kapiteln die rekonstruierten Gerechtigkeitsüberzeugungen sowie Beurteilungsstrategien ausführlich anhand von ausgewählten Interviewauszügen dargestellt: mathematisch-rechnerische Gerechtigkeit (Kap. 6.3.1), prozedural-bürokratische Gerechtigkeit (Kap. 6.3.2), diskursivinteraktive Gerechtigkeit (Kap. 6.3.3), kompensatorische Gerechtigkeit (Kap. 6.3.4). Die Darstellungslogik erfolgt somit ausgehend vom Allgemeinen (Kap. 6.1. und 6.2) hin zum Speziellen (Kap. 6.3), um die Analyseergebnisse abschließend in Kapitel 6.4 wiederum auf einem abstrakteren Level zu diskutieren. Sowohl die Kernkategorie als auch die weiteren zentralen Kategorien der gegenstandsverankerten Theorie stellen dabei das Produkt der fall- und länderübergreifenden Vergleichsprozesse, wie sie in Kapitel 3 und 4 dargestellt wurden, dar. Die Ausführungen in den folgenden beiden Kapiteln 6.1 und 6.2 dienen daher einem doppelten Zweck: zum einen wird© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 K. Falkenberg, Gerechtigkeitsüberzeugungen bei der Leistungsbeurteilung, https://doi.org/10.1007/978-3-658-28275-2_6

234

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

der Entstehungsprozess der Kernkategorie und der gegenstandsverankerten Theorie nachgezeichnet, indem die einzelnen Entwicklungsschritte und analytischen Vorläufer (als Zwischenschritte 1 bis 3 markiert) intersubjektiv nachvollziehbar skizziert werden. Zum anderen wird schon hier in abstrahierter Form das Modell einer Theorie ‚gerechter Leistungsbeurteilung als Balanceakt‘ vorweggenommen, das in den darauffolgenden Kapiteln angewandt wird, um die länderübergreifende Darstellung der rekonstruierten Gerechtigkeitsüberzeugungen zu strukturieren. Insofern finden sich bereits in den Kapiteln 6.1 und 6.2 von den Interviews abstrahierte und zusammenfassende analytische Ergebnisse, die sich auf den gesamten Analyseprozess stützen und in den anschließenden Kapiteln 6.3.1 bis 6.3.4 ausführlicher anhand konkreter Beispiele offengelegt werden. 6.1 Entwicklung der Kernkategorie: Gerechte Leistungsbeurteilung als Balanceakt Ausgangspunkt dieser Untersuchung war die Annahme, dass die schulische Leistungsbeurteilung fester Bestandteil des beruflichen Aufgabenspektrums von Lehrkräften ist und sie diese Aufgabe so gerecht wie möglich bewältigen wollen. Offen war allerdings, was genau verschiedene Lehrer_innen unter einer ‚gerechten Leistungsbeurteilung‘ verstehen könnten. Für die Annäherung an das unbestimmte Phänomen gerechter Leistungsbeurteilung wurden die Lehrkräfte zu ihrer Haltung gegenüber schulischer Leistungsbeurteilung im Allgemeinen und zu ihrer eigenen Beurteilungspraxis im Speziellen befragt (vgl. Kap. 4.2). In den im Rahmen episodischer Interviews stimulierten Erzählungen beschrieben die befragten Lehrkräfte ausführlich ihre eigene Beurteilungspraxis und welche Hilfsmittel sie dafür anwenden, erläuterten ihre Beurteilungsideale und berichteten von den Schwierigkeiten in der alltäglichen Umset zung derselben.131 Gleichzeitig nutzten sie Negativbeispiele, um sich von

Entwicklung der Kernkategorie

235

einer in ihren Augen ungerechten Beurteilungspraxis abzugrenzen. Diese Art der negativen Praxis tauchte ausschließlich als Beurteilungserfahrung aus der eigenen Schulzeit sowie als bei Kolleg_innen beobachtete oder über andere Lehrkräfte berichtete Praxis auf. Die eigene Beurteilungspraxis (und damit verbundene Gerechtigkeitsüberzeugungen) wird demgegenüber als Versuch einer gerechten Beurteilung geschildert. Im Verlauf der Interviews wurde immer deutlicher, dass die Lehrkräfte zum Teil sehr unterschiedliche Überzeugungen vertraten und ihnen die Spannbreite der verschiedenen Praxen und Überzeugungen zu einem gewissen Grad bewusst war – was teilweise zu einem Infrage stellen und Relativieren der grundsätzlichen Möglichkeit gerechter Leistungsbeurteilung führte, im Allgemeinen aber als Ergebnis und Bedingung professioneller Autonomie akzeptiert wurde. In der anfänglichen Analyse fanden sich damit schnell zwei Pole zwischen denen alle Erzählungen der Interviews zu verorten waren und mit in-vivo-Kodes beschrieben werden konnten: zum einen die Selbst- und Fremdpositionierung „alle wollen gerecht sein“, die ein grundsätzliches Streben nach gerechter Beurteilung auszeichnet, verbunden mit der Einschätzung der eigenen Beurteilungspraxis als ‚gerecht‘; und zum anderen die Feststellung einer Vieldeutigkeit dessen, was ‚gerechte Leistungsbeurteilung‘ ausmachen kann, zusammengefasst in der Aussage „DIE Gerechtigkeit gibt es nicht“ – was gerecht sei, wäre situationsabhängig und müsste von jeder Lehrkraft situativ neu geklärt werden. Die situative Kontingenz schulischer Leistungsbeurteilungen zeigte sich auch daran, dass einzelne Lehrkräfte im Verlauf des Interviews mehrere, teilweise auch sich widersprechende Positionen bezüglich der Frage einer gerechten Leistungsbeurteilung einnahmen – je nachdem von welcher Art der Beurteilung im Verlauf eines Schuljahres sie berichteten: 131

Wie oben erläutert, basieren die folgenden Aussagen auf der Analyse des gesamten Materials unter Vorwegnahme zentraler Befunde derselben und es erfolgt an dieser Stelle kein Verweis auf konkrete Interviewstellen. Diese werden in der Darstellung der Gerechtigkeitsüberzeugungen und Beurteilungsstrategien (Kap. 6.3) ausführlich aufgeführt.

236

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

der alltäglichen, fortlaufenden Leistungsbeurteilung während des Schuljahres (das sogenannte classroom assessment), der abschließenden Beurteilung am Ende eines Schuljahres in Form eines Zeugnisses, der Beurteilung im Rahmen von Abschlussprüfungen und der Beurteilung mit Hilfe standardisierter Tests, wie der schwedischen nationella prov oder den deutschen Lernstandserhebungen. Diese vier verschiedenen Beurteilungssituationen gingen damit ebenfalls in die Analyse ein (und werden später als Teil der kontextuellen Bedingungen im Modell der entwickelten gegenstandsorientierten Theorie wieder aufgegriffen).

Zwischenschritt 1: Professionelle Spannungsfelder Im nächsten Schritt kristallisierten sich in der Analyse verschiedene Spannungsfelder heraus innerhalb derer die Lehrkräfte ihre eigene Beurteilungspraxis verorteten.132 Eines dieser Spannungsfelder konnte als Einzelfallorientierung vs. Vergleichbarkeit von Beurteilungen identifiziert werden und umfasst diejenigen Erzählungen, in denen Lehrkräfte entweder betonen, dass es vor allem das individuelle Kind sei, an dem sich eine gerechte Leistungsbeurteilung messen lasse müsse oder aber die Anwendung eines gleichen Maßstabs für alle Schüler_innen und damit die Vergleichbarkeit der Beurteilungen hervorheben. Es fanden sich aber auch Erzählungen, in denen Lehrkräfte über die Schwierigkeiten berichteten diesen beiden Ansprüchen gleichermaßen gerecht werden zu wollen. Als zweites Spannungsfeld ließ sich die Thematisierung von Subjektivität vs. Objektivität der Beurteilung herausarbeiten. Hierunter sind verschiedene Positionierungen von Lehrkräften hinsichtlich der beiden Begriffe Subjektivität und Objektivität zu verstehen: einerseits die Vorstellung 132

Die Idee der Spannungsfelder schließt dabei an professionstheoretische Überlegungen zur antinomischen Grundstruktur professionellen Handelns von Lehrkräften (Helsper, 2002) sowie die darin eingelassenen und professionelles Handeln rahmenden Paradoxien (Schütze et al., 1996) an.

Entwicklung der Kernkategorie

237

von ‚gerechter Beurteilung‘ als ‚objektive‘, da frei von persönlichen Einflüssen durchgeführte Beurteilung, bei der Subjektivität auf Seiten der Lehrkräfte (in Form von Sympathien und Antipathien) als ungerecht problematisiert wird; andererseits die Vorstellung, dass ‚gerechte Beurteilung‘ nur durch eben diese subjektiven Elemente, verstanden als persönliches Näheverhältnis und ‚Einander-Kennen‘ zwischen Lehrkräften und Schüler_innen, ermöglicht wird und eine ‚objektive‘, unpersönliche Beurteilung den einzelnen Schüler_innen nicht gerecht werden kann. Damit zusammen hängt ein weiteres Spannungsfeld, das sich mit den Begriffen Fordern vs. Fördern zusammenfassen lässt.133 Hiermit sind verschiedene Positionierungen hinsichtlich der Frage, wer die Verantwortung für den Lernerfolg von Schüler_innen trägt, verbunden. Polarisierungen fanden sich hier zwischen einer als Fordern bezeichneten Haltung, bei der die Lehrkräfte ihre Aufgabe vor allem in der Aufbereitung und anschließenden Abprüfung von fachlichem Wissen sahen, ihren Schüler_innen wiederum eine sogenannte „Bringepflicht“134 auferlegten und es in ihren Verantwortungsbereich fiel, Leistungen zu zeigen. Demgegenüber findet sich eine Positionierung, die mit dem Begriff des Förderns zusammengefasst wird, bei der die Lehrkräfte eine geteilte Verantwortung zwischen ihnen und den Schüler_innen äußern, die das Anbieten, Suchen und Finden von verschiedenen Möglichkeiten der Leistungserbringung durch die Lehrkräfte beinhalten und damit eher dem Bild einer „Holpflicht“ auf Seiten der Lehrkräfte entspricht. Die Frage, ob eine gerechte Beurteilung nur das Lernergebnis am Ende eines Unterrichtsabschnitts oder auch den Lernprozess und den individuellen Lern133

Damit schließe ich an die bereits in Kap. 1 und 2 ausgeführten Überlegungen zu den widersprüchlichen Erwartungen an die schulische Leistungsbeurteilung, die sich aus den gesellschaftlichen und pädagogischen Funktionen (vgl. Kap. 2.2) ergeben an (vgl. hierzu auch Streckeisen et al., 2007). 134 Dies ist ein in-vivo-Kode aus den NRW-Interviews, der sich auf §13, 4 APO-GOSt bezieht, der besagt, dass Schüler_innen der gymnasialen Oberstufe dazu „verpflichtet [sind], die geforderten Leistungsnachweise zu erbringen“. Das Pendant dazu ist die „Holpflicht“ der Lehrer_innen in der Sekundarstufe I, da hier eine solche gesetzliche Verpflichtung der Schüler_innen nicht vorgesehen ist.

238

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

fortschritt einzelner Schüler_innen berücksichtigen müsse, war ebenfalls Teil dieser ambivalenten Spannung. Als letztes Spannungsfeld kristallisierte sich die Frage heraus, was überhaupt als ‚Leistung‘ verstanden wird und legitimer Bestandteil der Leistungsbeurteilung sein kann. Die Spannung verlief hier zwischen fachlichem Urteil vs. Beurteilung der Person und beinhaltete Verortungen zwischen der Position, dass allein die ‚gezeigte Leistung‘, das fachliche Wissen und entsprechende Kompetenzen in die Beurteilung einbezogen werden dürften einerseits und andererseits der Auffassung, dass das Arbeits- und Sozialverhalten gleichermaßen in die Beurteilung einbezogen werden müsse, wozu auch Anstrengung, Sich-Mühe-Geben und Aufmerksamkeit im Unterricht gehörten.

Zwischenschritt 2: Einflussfaktoren auf ‚gerechte‘ Leistungsbeurteilung Ausgehend von diesen Spannungsfeldern, die sich wie ein roter Faden durch alle bis zu diesem Punkt der Analyse durchgeführten Interviews zogen, konzentrierte ich mich in den folgenden Analyseschritten darauf zu verstehen, worauf diese Spannungen zurückzuführen waren. Hinweise dafür lieferten direkte Bezugnahmen der Lehrkräfte auf rechtliche Vorgaben, die von den Lehrkräften in unterschiedlichem Maße als handlungseinschränkend oder –fördernd beschrieben wurden, von denen sie sich teilweise distanzierten, teilweise deren unterstützende Funktionen hervorhoben. Deutlich wurde immer mehr, dass die Lehrkräfte aus den rechtlichen Rahmungen verschiedene normative Erwartungen an ihre eigene Beurteilungspraxis ableiteten, diese gleichzeitig aber auch Deutungsspielräume frei ließen, die die Lehrkräfte unterschiedlich stark nutzen. Ebenfalls formulierten die Lehrkräfte verschiedene Erwartungen, die von konkreten Akteuren an sie in ihrer Beurteilungsfunktion herangetragen wurden: beispielsweise Schüler_innen, die mit einzelnen Noten nicht einverstanden waren; Eltern, die in Sprechstunden den Wunsch nach bestimmten Abschlusszielen für ihre Kinder formulierten; Schulleitungen oder Kolleg_innen, die einzelne Zeugnisentscheidungen hinter-

Entwicklung der Kernkategorie

239

fragten. Neben diesen ‚äußeren‘ Erwartungshaltungen formulierten die Lehrkräfte auch ihre eigenen Vorstellungen darüber, was eine gerechte Leistungsbeurteilung ausmachen würde und eine in ihren Augen legitime professionelles Beurteilungspraxis beinhalten würde. Diese ‚inneren‘ Erwartungen korrespondierten mit dem, was als professionelles Selbstbild der Lehrkräfte bezeichnet werden kann. Zu den Regularien und normativen Erwartungen von innen wie außen traten als dritte Komponente noch die von den Lehrkräften beschriebenen Handlungsweisen in konkreten Beurteilungssituationen. Diese wurden vorläufig unter der Kategorie Interpretationen zusammengefasst, worunter sowohl die Umsetzung der Regularien in konkrete Beurteilungspraxis verstanden wird, als auch die Interpretationsleistungen, die die Lehrkräfte beschrieben, um ein konkretes Schüler_innenverhalten als schulische Leistung zu dekodieren und wiederum in einer Beurteilungsskala einzelnen Notenwerten zuzuordnen, das gezeigte Verhalten also in Noten zu ‚übersetzen‘ (vgl. hierzu auch die Ausführungen in Kap. 2.3 sowie Sadler, 1998; Lundahl, 2011, S. 97). In diesem Zwischenschritt ließ sich das Phänomen ‚gerechter Leistungsbeurteilung‘ somit als Ergebnis eines Aushandlungsprozesses zwischen den drei Elementen Regularien, Erwartungen und Interpretationen dieser zusammenfassen.135 Die von den befragten Lehrkräften geäußerten Gerechtigkeitsüberzeugungen konnten so trotz ihrer teilweisen Widersprüchlichkeit nicht als konkurrierend oder sich gegenseitig ausschließend verstanden werden, vielmehr stellten sie sich als dialektisch aufeinander bezogene, sich gegenseitig konstituierende Überzeugungen dar, die den Lehrkräften situativ unterschiedliche Positionierungen ermöglichen. Die Aushandlungsprozesse zwischen Regularien, Erwartungen und Interpretationen wurden als innerhalb von (professionellen) Spannungsfeldern stattfindend verstanden, die wiederum das Beurteilungshandeln beeinflussen und begrenzen. In den Interviews, die bis zu diesem Analy135

Terhart spricht in diesem Zusammenhang auch von einer „Art Abwägen oder inneres Aushandeln angesichts konfligierender (normativer) Bezugspunkte“ (Terhart, 2009, S. 43).

240

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

seschritt kodiert waren, stand im Kern die Frage nach diesen Aushandlungsprozessen, wie die Lehrkräfte mit den widersprüchlichen Erwartungen umgehen und für welche individuelle, situativ-kontingente Lösung sie sich entscheiden. Dieses Zwischenergebnis der Analyse ist in Abbildung 9 grafisch zusammengefasst. In diesem Schaubild finden sich einige der später in die gegenstandsorientierte Theorie übernommene Kategorien (Beurteilungssituation, professionelles Selbstbild), andere wurden jedoch wieder verworfen – wie der Begriff der Aushandlungsprozesse.

Regularien

Erwartungen und Normen

Interpretationen

landesweit kommunal/regional

extern: Kollegium, Schulleitung, Schüler_innen, Eltern

von Leistungen

lokal (schulintern)

intern: professionelles Selbstbild

von Verhalten

von Regularien

Beurteilungssituation alltägliche Beurteilung - Zeugnisse - Abschlussprüfungen - standardisierte Tests

"gerechte Leistungsbeurteilung"

als Ergebnis von Aushandlungsprozessen

Abb. 9 – Erste Kategorien und Ideen für eine Theorie zu handlungsleitenden Gerechtigkeitsüberzeugungen von Lehrkräften

Dazu ausführlicher im folgenden Abschnitt zum dritten und letzten Zwischenschritt auf dem Weg zur Kernkategorie.

Entwicklung der Kernkategorie

241

Zwischenschritt 3: Entwicklung der Kernkategorie Besonders interessant für die weitere Analyse waren diejenigen Interviewpassagen, in denen Lehrkräfte über Schwierigkeiten oder konflikthafte Situationen bei der Beurteilung sprachen, da sich an ihnen die besonderen Spezifika der Aushandlungsprozesse genauer beleuchten ließen. In nahezu allen Interviews tauchten Formulierungen auf, die mit den Kodes „Belastungen“ oder „Schwierigkeiten“ in Bezug auf schulische Leistungsbeurteilung in Verbindung gebracht werden konnten. Auch ein gewisses Maß an Unwohlsein oder Unbehagen mit der Beurteilungsaufgabe schwingt in vielen der Interviews mit: Leistungsbeurteilung wird in keinem der Interviews als ausschließlich positiv oder affirmativ beschrieben, im Gegenteil reichen die Bezugnahmen von distanziertneutral – im Sinne einer gegebenen, aber nicht veränderbaren Tatsache – bis ablehnend-negativ. Wie in Kapitel 2.3 schon deutlich wurde, bedeutet die schulische Leistungsbeurteilung für Lehrkräfte häufig unter Unsicherheitsbedingungen eine Entscheidung treffen zu müssen, die ggf. einschneidende Konsequenzen für die Schüler_innen nach sich zieht (vgl. Luhmann & Schorr, 1982; Terhart, 2009). Eine mögliche Strategie mit dieser Unsicherheitssituation umzugehen, ist die Komplexitätsreduktion der Beurteilungssituation. Dafür können Lehrkräfte auf verschiedene Welterklärungsmuster – oder beliefs – zurückgreifen (Reusser & Pauli, 2014). Gerechtigkeitsüberzeugungen, die in dieser Arbeit als handlungsleitende berufsbezogene Überzeugungen verstanden werden (vgl. Kap. 2.4), können eine solche Entscheidungshilfe in unsicheren Situationen sein. Durch den Verweis auf verschiedene situativ-kontingente Gerechtigkeitsüberzeugungen lassen sich diese Unsicherheitssituationen überwinden und professionelle Handlungsfähigkeit (wieder) herstellen. Die oben genannten Aushandlungsprozesse zwischen inneren und äußeren Erwartungen stellen also ein permanentes Ringen um die eigene Handlungsfähigkeit in komplexen Situationen dar, die daraus ableitbaren Gerechtigkeitsüberzeugungen und zugehörigen Handlungsstrategien dienen dabei der Legitimation des eigenen professionellen Handelns.

242

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Gleichzeitig befördern sie die Akzeptanz der getroffenen Beurteilungen gegenüber anderen Beteiligten des Beurteilungsprozesses. Bereits im dritten Interview mit einer Deutschlehrerin und Schulleiterin einer Realschule in NRW wurde der Begriff der ‚Gratwanderung‘ verwendet, der zunächst als in-vivo-Kode in die Analyse aufgenommen wurde. Bei der genaueren Analyse dessen, was diese Lehrerin unter einer Gratwanderung verstand, wurde deutlich, dass sie sich zwischen zwei verschiedenen Gerechtigkeitsorientierungen zerrissen fühlte: der individuellen Förderung und formativen Leistungsbeurteilung einzelner Schüler_innen einerseits und andererseits der Orientierung an zentral vorgegebenen Abschlussprüfungen, bei denen der gleiche Maßstab für alle Schüler_innen angelegt werden muss (also dem entsprach was weiter oben als professionelles Spannungsfeld „Einzelfallorientierung vs. Vergleichbarkeit von Beurteilungen“ benannt wurde). Auch in anderen Interviews tauchten ähnliche sprachliche Bilder und Formulierungen auf, so z.B. das „abwägen müssen“ (väga ihop alltihoppa; väga fram och tillbaka) verschiedener Beurteilungsaspekte, „ein gesundes Gleichgewicht halten“, einen „verzwickten Balanceakt“ (kluriga balansgången) zu absolvieren und „Wege finden“ (att hitta vägar) zu müssen. Auch in die Regularien zur schulischen Leistungsbeurteilung sind teilweise schon Metaphern des Abwägens und Ausbalancierens eingelassen.136 Der Begriff der Gratwanderung erwies sich für die fortschreitende Analyse als zentral für die Beschreibung dessen, wie Lehrkräfte die verschiedenen Wege und Strategien zur ‚Herstellung‘ gerechter Leistungsbeurteilung beschrieben und floss schließlich in die Bildung der Kernkategorie gerechte Leistungsbeurteilung als Balanceakt ein. 136

So z.B. in den Bestimmungen zur Notenskala in Schweden, wenn davon gesprochen wird, dass die Noten B und D zu vergeben sind, wenn die Kriterien der jeweils nächsthöheren Note zum überwiegenden Teil erfüllt sind (till övervägande del) - was genau dieses ‚überwiegend‘ sein kann, gestaltet sich im Einzelfall sehr unterschiedlich und es ist die Aufgabe der Lehrkräfte, diese Abwägung vorzunehmen und die einzelnen Teilleistungen und Kompetenzbereiche zu gewichten – in diesem Sinne also auszubalancieren. Gleiches gilt in gewisser Weise auch für NRW mit der Orientierung an einer holistischen Urteilsbildung (vgl. Kap. 5).

Entwicklung der Kernkategorie

243

Das Bild der schulischen Leistungsbeurteilung als beruflicher Balanceakt, den Lehrkräfte immer wieder aufs Neue absolvieren müssen, kristallisierte sich immer stärker als verbindendes Element aller Interviews heraus, sowohl für die nordrhein-westfälischen als auch die schwedischen Lehrkräfte und konnte so als Kernkategorie (und tertium comparationis) bestätigt werden. Auf einige der Parallelen dieses sprachlichen Bildes mit Charakteristiken der schulischen Leistungsbeurteilung als professioneller Herausforderung wird im Folgenden eingegangen. Aber auch die Brüche bzw. Unterschiede zum Bild des Balanceakts sollen erwähnt werden. Es gibt viele Möglichkeiten, ein Drahtseil, einen Balken oder schmalen Steg zu überqueren: man kann schneller oder langsamer gehen, barfuß oder mit speziellen Schläppchen an den Füßen, unter Zuhilfenahme einer langen Balancierstange, eines kleinen Schirmchens oder der ausgebreiteten Arme, man kann auf dem Fahrrad oder gar auf dem Motorrad hinüberfahren, rückwärts oder auf einem Bein hüpfend, oder aber auch gemeinsam mit einer weiteren Person laufen. Allen diesen Möglichkeiten gemeinsam ist die Tatsache, dass es immer die balancierende Person selbst ist, die die eigentliche Aufgabe, nicht vom Drahtseil herunterzufallen und heil am anderen Ende anzukommen, selbst erledigen muss. Ebenso wie Hochseilartist_innen zumeist allein auf ihrem Drahtseil agieren, stehen auch die schwedischen und nordrhein-westfälischen Lehrkräfte zumeist allein vor der Aufgabe der schulischen Leistungsbeurteilung. Sie können sich verschiedener Hilfsmittel bedienen, beispielweise Beurteilungsraster und Erwartungsbögen nutzen oder aber erfahrene Kolleg_innen um Hilfe bitten, Klausuren gemeinsam korrigieren und vieles mehr. Die aufgezählten Möglichkeiten stellen jeweils nur Variationen ein und derselben Tätigkeit dar – das Ausbalancieren des eigenen Körpergewichts und Beibehalten des Gleichgewichts respektive die Aufrechterhaltung der eigenen professionellen Handlungsfähigkeit im Angesicht widersprüchlicher Anforderungen. Ziel ist es in beiden Fällen, die gestellte (oder gesuchte) Aufgabe erfolgreich bewältigen zu können. Die Schwerkraft, gegen die Hochseilartist_innen versuchen anzukämpfen indem sie ihr eigenes Körpergewicht ausbalancieren, entspricht übertra-

244

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

gen auf die Beurteilungsentscheidungen von Lehrkräften ungefähr dem, was der gesellschaftlich-institutionelle Rahmen und daraus abgeleitete Erwartungen an eine gerechte Beurteilung sind – sie verkörpern die Kontextbedingungen innerhalb derer der Balanceakt zu bewältigen ist. Dabei variiert die konkrete Zusammensetzung dieser Kontextbedingungen zeitlich und räumlich, und der Balanceakt muss von jedem und jeder selbst ausprobiert und erlernt werden. So, wie auch Artist_innen die Grundlagen einer gelungenen Drahtseilüberquerung von erfahrenen Könnern gezeigt bekommen, um durch Übung einen eigenen Stil, ein eigenes Gefühl für das Seil zu entwickeln, erlernen angehende Lehrkräfte auch die Grundbegriffe schulischer Leistungsbeurteilung in ihrer Ausbildung und sind doch darauf angewiesen, diese Grundkenntnisse im Laufe ihres Berufslebens zu verfeinern, an verschiedene Schüler_innen und Beurteilungssituationen anzupassen und dabei einen individuellen, für sie selbst zufriedenstellenden Arbeitsmodus zu entwickeln. Je erfahrener Artist_innen sind, umso schneller werden sie sich auf neue Situationen einstellen können, Windrichtung und –stärke einschätzen lernen, die Spannung des Seils fühlen und entsprechend die geeigneten Hilfsmittel anpassen können. Auch Lehrkräfte werden mit zunehmender Unterrichts- und Beurteilungserfahrung Methoden entwickeln, um Schüler_innenleistungen in verschiedenen Klassenstufen, aus unterschiedlichen Themenbereichen und in unterschiedlichen Prüfungsformen angemessen beurteilen zu können. Allerdings garantiert die Erfahrung allein, sowohl was die Beurteilung von Schüler_innenleistungen als auch die Überquerung eines Abgrunds auf einem schmalen Seil angeht, kein Erfolgserlebnis. Lehrkräfte wie auch Artist_innen müssen sich in jedem einzelnen Fall (jeder Beurteilungssituation, jedem Gang über das Seil) aufs Neue auf ein Ausbalancieren aller Faktoren einstellen – und damit rechnen, dass es immer wieder auch Misserfolgserlebnisse geben kann. Hier bricht das Bild des Hochseiltanzes im Vergleich zur schulischen Leistungsbeurteilung ein wenig, denn die Konsequenzen eines Absturzes bzw. einer ungerechten Beurteilung sind von gänzlich unterschiedlicher Natur. Wenn Artist_innen die Balance verlieren, droht ihnen in den meisten Fällen der Sturz ins Sicherungsnetz. Bei der Leistungsbeurteilung

Entwicklung der Kernkategorie

245

treffen die Konsequenzen einer ungerechten Beurteilung zunächst nicht die Lehrkräfte selbst, sondern die von ihnen beurteilten Schüler_innen, denen im Zweifelsfall weiterführende Bildungs- und Lebenschancen verwehrt bleiben. Erst auf den zweiten Blick finden sich hier wieder Ähnlichkeiten, wenn davon ausgegangen wird, dass sowohl Seiltänzer_innen wie auch Lehrkräfte unterschiedliche Erklärungen dafür geben können, warum ein Absturz oder eine bestimmte Beurteilung erfolgt ist: führen sie äußere Umstände (wie ein zu heftiger Wind respektive Schüler_innen, die nicht richtig gelernt haben oder zentral vorgegebene Aufgabenstellungen, die nicht angemessen waren) an oder suchen sie die Erklärung in ihrem eigenen Handeln (mangelhafte Vorbereitung und Unaufmerksamkeit beim Überqueren respektive unzureichende Vorbereitung der Schüler_innen im Unterricht auf bestimmte Aufgabenformate). Gerechte Leistungsbeurteilung als Balanceakt ist auch, anders als der Drahtseilakt in der Zirkuskuppel, etwas sehr Subjektives und von außen schwer zu Beobachtendes. Lediglich die Ergebnisse der Beurteilung in Form von Zensuren können von Außenstehenden für mehr oder weniger gerecht erklärt werden – dies aber immer auf der Grundlage der eigenen Referenzgrößen für eine gerechte Beurteilung. Den eigentlichen Herstellungsakt, den Prozess des Abwägens, Ausbalancierens und Aushandelns vollziehen die meisten Lehrkräfte mit sich selbst bzw. im engen Austausch mit einzelnen Kolleg_innen. Für außenstehende Dritte wird dieser Balanceakt nur in der retrospektiven Erläuterung nachvollziehbar, in der Erklärung dessen, was eigentlich nur schwer auszudrücken ist. Die Kernkategorie ‚gerechte Leistungsbeurteilung als Balanceakt‘ beschreibt darüber hinaus sowohl einen Prozess als auch einen Zustand. Das Bild des Balanceaktes bezieht sich dabei auf das aktive Ausgleichen, Aushandeln und Handhabbar-Machen der verschiedenen Erwartungen an die Leistungsbeurteilung durch die Lehrkräfte, sprich den Prozess der Herstellung gerechter Leistungsbeurteilung unter Anwendung verschiedener Beurteilungsstrategien. Gleichzeitig wird das Ergebnis dieses Herstellungsprozesses – die als gerecht empfundene Beurteilung – wiederum unter Rückgriff auf unterschiedliche Legitimationsquellen als ge-

246

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

recht oder ungerecht beurteilt, als legitime oder illegitime pädagogische Praxis kategorisiert. Das Ergebnis ‚gerechte Beurteilung‘ ist jedoch flüchtig und muss immer wieder aufs Neue hergestellt, ausgehandelt und erarbeitet werden, weshalb das Bild des ‚Balanceakts‘ sowohl als Prozess- als auch als Zustandsmetapher verstanden werden muss. Mit dem sprachlichen Bild einer ‚gerechten Leistungsbeurteilung als Balanceakt‘ ließen sich auch die anderen zentralen Analysekategorien (vgl. Kap. 6.2) zusammenfassen und ihr Zusammenspiel in den verschiedenen Gerechtigkeitsüberzeugungen fall- und kontextübergreifend strukturieren. Die Kernkategorie ist nicht schulfachspezifisch determiniert, auch wenn die rekonstruierten Gerechtigkeitsüberzeugungen teilweise fächerspezifische Besonderheiten aufzeigen. Sie ist ebenso wenig länderspezifisch oder schulformspezifisch zu verstehen, sondern muss vielmehr als übergreifende Beschreibung des Kernprozesses verstanden werden. Bevor die rekonstruierten Gerechtigkeitsüberzeugungen und Beurteilungsstrategien im Kapitel 6.3 ausführlich anhand von beispielhaften Interviewauszügen dargestellt werden, werden im folgenden Kapitel zunächst die weiteren aus der Analyse gewonnenen zentralen Kategorien dargestellt, die als Vergleichsdimensionen im Kapitel 6.3 zur Anwendung kommen. 6.2 Weitere zentrale Analysekategorien Im Zuge der Analyse der Interviewdaten und ergänzenden Materialien kristallisierten sich verschiedene Kategorien heraus, die in allen Interviews eine zentrale Rolle spielten und in engem Zusammenhang zur Kernkategorie ‚Gerechte Leistungsbeurteilung als Balanceakt‘, den Gerechtigkeitsüberzeugungen und damit zusammenhängenden Handlungsstrategien stehen. Diese Kategorien können auch als Vergleichsdimensionen verstanden werden anhand derer die verschiedenen Beurteilungspraxen und damit zusammenhängenden handlungsleitenden Überzeugungen einzelfallübergreifend und auch kontextübergreifend miteinander in Beziehung gesetzt werden können. Dem Kodierparadigma nach

Weitere zentrale Analysekategorien

247

Strauss und Corbin (1996) folgend, lässt sich dabei zwischen Kontextbedingungen und intervenierenden Bedingungen unterscheiden. Als Kontextbedingungen bezeichnen Strauss und Corbin (1996) eine „spezifische Reihe von Eigenschaften, die zu einem Phänomen gehören; d.h. die Lage der Ereignisse oder Vorfälle in einem dimensionalen Bereich, die sich auf ein Phänomen beziehen. Der Kontext stellt den besonderen Satz von Bedingungen dar, in dem die Handlungs- und interaktionalen Strategien stattfinden“ (Strauss & Corbin, 1996, S. 75). Mit den intervenierenden Bedingungen werden die „strukturellen Bedingungen, die auf die Handlungs- und interaktionalen Strategien einwirken [bezeichnet]. [...] Sie erleichtern oder hemmen die verwendeten Strategien innerhalb eines spezifischen Kontexts“ (Straus & Corbin, 1996, S. 75). Wie Strübing (2008) betont, ist die Unterscheidung in Kontext und intervenierende Bedingungen eher analytischer Natur und muss im Forschungsprozess immer wieder geprüft und ggf. angepasst werden: „Für die Theoriebildung ist es wichtig den Unterschied zwischen konkreten, eher situationsgebundenen Eigenschaften des Phänomens und allgemeinen, eher sozialstrukturellen, ökonomischen etc. Zusammenhängen im Blick zu behalten, um das Verhältnis von Fallspezifik und verallgemeinerbaren Strukturmerkmalen angemessen konzipieren zu können“ (S. 29). Diese Einschätzung von Strübing teile ich ebenfalls und möchte an dieser Stelle betonen, dass die Unterscheidung zwischen kontextuellen und intervenierenden Bedingungen in erster Linie als analytisches Hilfsmittel zu verstehen ist, diese Trennung sich jedoch in der empirischen Überprüfung auch als hinderlich oder unscharf herausstellen kann. Ich komme darauf zurück.

Kontextbedingungen Als Kontextbedingungen für die vorliegende Untersuchung konnten zunächst die institutionellen Rahmenbedingungen, wie sie bereits in Kapitel 5 dargestellt wurden, sowie darin eingelassene Gerechtigkeitsnormen als ‚externe‘ Erwartungen an die Beurteilungspraxis der Lehrkräfte,

248

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

identifiziert werden. Auch die Möglichkeiten für individuelle Deutungsund Handlungsspielräume im Rahmen von professioneller Autonomie gehören zu den kontextuellen Bedingungen, die bestimmte Gerechtigkeitsüberzeugungen und Beurteilungsstrategien innerhalb eines Beurteilungssystems erst möglich machen. Ob und wie diese Spielräume von den Lehrkräften genutzt werden, hängt wiederum von verschiedenen intervenierenden Bedingungen ab, die weiter unten erläutert werden. Neben den institutionellen Rahmungen spielen die konkreten Beurteilungssituationen, wie im Kapitel zur Kernkategorie erwähnt, eine wichtige Rolle. Im schwedischen und nordrhein-westfälischen Bildungssystem existieren zum Teil unterschiedliche Elemente der schulischen Leistungsbeurteilung, die mit spezifischen Funktionen innerhalb des jeweiligen Systems verbunden sind. Insofern stellen die verschiedenen Beurteilungssituationen einen Teil des rahmenden Kontexts dar, innerhalb dessen die Lehrkräfte eine konkrete Beurteilungspraxis als in ihren Augen gerecht oder ungerecht befinden. In beiden Beurteilungssystemen spielt die alltägliche Leistungsbeurteilung durch die Lehrkräfte im Verlauf des Schuljahres eine zentrale Rolle. Wie im folgenden Kapitel gezeigt wird, folgt diese alltägliche Beurteilung zum Teil unterschiedlichen Logiken, die einerseits durch die in den Regularien vorgegebenen Rahmenbedingungen geprägt sind, sich andererseits auf unterschiedliche Beurteilungsverständnisse zurückführen lassen. Gemeinsam ist jedoch allen Lehrkräften, dass für die Beurteilung während des Schuljahres zum Teil andere Gerechtigkeitsmaßstäbe angewandt werden, als bespielweise bei der Erstellung der Halbjahreszeugnisse. Die Zeugnisnoten sind die zweite Form der Beurteilungssituationen, die als kontextuelle Bedingung in den Erzählungen der befragten Lehrkräfte auftauchen. In NRW hängt diese Form der Beurteilung häufig auch mit Fragen des Übergangs in die nächsthöhere Klassenstufe bzw. der Gefahr des Sitzenbleibens zusammen. Die Abschlussprüfungen, die in NRW zentral organisiert am Ende der Sekundarstufe I respektive II stattfinden, stellen eine weitere Beurteilungssituation dar. Diese spezifischen Prüfungen und die damit zusammenhängenden Entscheidungen über weiterführende Bildungs- und Lebenschancen der Schüler_innen haben im schwedischen System keine

Weitere zentrale Analysekategorien

249

direkte Entsprechung, wie in Kapitel 5 gezeigt wurde. Nichtsdestotrotz stellt das Abgangszeugnis der grundskola seit der Verschärfung der Zugangsvoraussetzungen für die berufs- und studienvorbereitenden Programme der gymnasieskola eine besondere Beurteilungssituation dar, die von den Lehrkräften im Hinblick auf Gerechtigkeitsfragen thematisiert wurde. Die standardisierten Tests, die in beiden Ländern in unterschiedlichen Formen vorhanden sind, stellen die vierte Beurteilungssituation dar, wobei die Ergebnisse der Lernstandserhebung in NRW nicht in die Zeugnisnoten der Schüler_innen einbezogen werden dürfen, die Ergebnisse der nationella prov in Schweden hingegen schon. In einigen Fällen thematisierten die Lehrkräfte auch grundsätzlich den Zeitfaktor als rahmende Bedingung für ihre (gerechte) Beurteilungspraxis, insbesondere die Frage, zu welchem Zeitpunkt im Schuljahr bzw. in welcher Klassenstufe oder ‚Schulkarrierenstufe‘ die Beurteilung stattfindet. Darüber hinaus wird auch eine Fachspezifik aufgeführt, die zu unterschiedlichen Beurteilungsformen innerhalb bestimmter Beurteilungssituationen führen würde.

Intervenierende Bedingungen Als intervenierende Bedingungen, Bedingungen also, die sich förderlich oder hemmend auf die gewählten Beurteilungsstrategien auswirken, konnten das professionelle Selbstbild der Lehrkräfte, ihr jeweiliges Beurteilungsverständnis sowie die Beziehungskonstellationen, innerhalb derer Beurteilungen stattfinden, identifiziert werden. Das professionelle Selbstbild der befragten Lehrkräfte umfasst hierbei zunächst implizite oder explizite Selbstpositionierungen hinsichtlich dessen, was eine ‚gute Lehrkraft‘ in ihren Augen ausmacht, welche ‚internen Erwartungen‘ an ihr eigenes Unterrichts- und vor allem Beurteilungshandeln formuliert werden. Diese Selbstbeschreibungen reichen von „Sozialarbeiter“ über „Begleiterin“ und „Coach“ über „Wissensvermittlerin“ und „Mathematiker“ bis hin zu „Agent der Gesellschaft“ eröffnen eine Bandbreite an Zuständigkeits- und Aufgabenbereichen, die die

250

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Lehrkräfte sich im Rahmen der schulischen Leistungsbeurteilung zuschreiben. Insbesondere die Frage, wer in ihren Augen hauptsächlich für den Lernerfolg der Schüler_innen verantwortlich ist, stellt sich als zentral im Hinblick auf Gerechtigkeitsüberzeugungen und Beurteilungsstrategien dar. Auch die selbstzugeschriebene Expertise als Beurteilende spielt hier mit hinein. Das Beurteilungsverständnis der Lehrkräfte umfasst zum einen die Frage, inwiefern Lehrkräfte ein eher summatives oder eher formatives Verständnis von Leistungsbeurteilung haben – bzw. Leistungsbeurteilung als ein Zusammenspiel beider Elemente begreifen. Daran schließt sich auch die Frage der Bezugsnormorientierung an, inwiefern also Lehrkräfte eher zu einer individuellen, sozialen oder kriterialen Bezugsnorm tendieren (vgl. Kap. 2.1.4) bzw. wann sie welche Bezugsnorm als gerecht(er) empfinden und warum. Die Frage nach dem jeweiligen Subjektivitäts- und Objektivitätsbegriff der Lehrkräfte, die schon früh eine der zentralen Spannungen bei der Entwicklung der Kernkategorie war, stellt eine weitere Unterkategorie des Beurteilungsverständnisses dar. Zu guter Letzt unterscheiden sich die Gerechtigkeitsüberzeugungen und Beurteilungsstrategien auch hinsichtlich der Frage, was genau als ‚Leistung‘ definiert, was also aus Sicht der Lehrkräfte legitimer Weise beurteilt werden darf – und was nicht. Unter der Kategorie Beziehungskonstellationen werden zweierlei Arten von Beziehungen verstanden: diejenigen zwischen Lehrkräften und ihren Schüler_innen und diejenigen zwischen Lehrkräften und dem Kollegium bzw. der Schulleitung ihrer Schule. Die Beziehungen zwischen Lehrkräften und ihren Schüler_innen stellten sich insofern als weitere intervenierende Bedingung dar, als die Lehrkräfte sehr unterschiedliche Positionierungen hinsichtlich der notwendigen Nähe bzw. Distanz zu ihren Schüler_innen für eine gerechte Beurteilung äußerten. Diese Nähe-DistanzBeziehungen zu den Schüler_innen stehen in engem Zusammenhang mit den Überzeugungen hinsichtlich einer gerechten Beurteilung als ‚subjektive‘ oder ‚objektive‘ Beurteilung. Zu den Beziehungskonstellationen zählt ebenfalls das aus den Erzählungen rekonstruierte Idealbild von ‚guten‘ Schüler_innen, das Lehrkräfte implizit bei der Beurteilung von

Weitere zentrale Analysekategorien

251

Schüler_innenleistungen anwenden. Letztlich prägt die Wahrnehmung und Zuschreibung von Fähigkeiten, Kompetenzen und Lernpotenzialen der Schüler_innen wiederum das, was als ‚Leistung‘ anerkannt und beurteilt werden kann und bestimmt mit, was als gerechte Beurteilung für einzelne Schüler_innen gewertet wird. Eine weitere Unterkategorie stellt die Unterscheidung in eine eher kollektivierende oder individualisierende Wahrnehmung der Schüler_innen durch die Lehrkräfte dar. Die Beziehungen zwischen Lehrkräften und dem Kollegium bzw. der Schulleitung ihrer Schule können ebenfalls als intervenierende Bedingungen gelten, insofern sich hier ebenfalls eine Spannung zwischen individueller und kollektiver Praxis auftut, die sich z.T. auf die Bewertung von spezifischen Beurteilungspraxen als legitim oder illegitim auswirkt. Hier finden sich sowohl Positionen, die individuelle Beurteilungsstrategien, abgestützt in der eigenen professionellen Erfahrung, bevorzugen als auch solche, die eine Beurteilungspraxis auf der Grundlage kollektiver Abstimmungsprozesse als gerecht(er) beurteilen. Auch die Frage, inwiefern die Schulleitung als unterstützend und fördern bzw. als kontrollierend empfunden wird, wirkt sich auf die Wahl der Beurteilungsstrategien und deren Einschätzung als gerecht aus.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien Die kontextuellen und intervenierenden Bedingungen wirken sich dabei unterschiedlich auf die rekonstruierten Gerechtigkeitsüberzeugungen aus. In welcher Weise sie hemmend oder förderlich auf bestimmte Überzeugungen und damit verbundene Beurteilungsstrategien wirken, wird in den Kapiteln 6.3.1 bis 6.3.4 ausführlicher dargestellt. Ebenfalls ausführlicher werden die Begriffe Gerechtigkeitsüberzeugung und Beurteilungsstrategie in Kapitel 6.3 definiert und aufeinander bezogen. An dieser Stelle sei allerdings schon darauf hingewiesen, dass davon ausgegangen wird, dass die handlungsleitenden Gerechtigkeitsüberzeugungen sich auf die Wahl bestimmter Beurteilungsstrategien auszuwirken scheinen, einzelne Beurteilungsstrategien aber durchaus im Rahmen mehre-

252

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

rer Gerechtigkeitsüberzeugungen zur Anwendung gebracht werden können. Aus dem Material konnten vier verschiedene Gerechtigkeitsüberzeugungen rekonstruiert werden, in denen die oben genannten Bedingungen und Beurteilungsstrategien zusammenlaufen: mathematisch-rechnerische, prozedural-bürokratische, diskursiv-interaktive und kompensatorische Gerechtigkeitsüberzeugung. Neben den hier dargestellten Kategorien, die als kontextuelle und intervenierende Bedingungen in die gegenstandsverankerte Theoriebildung eingeflossen sind, wurden zu Beginn des Kodier- und Analyseprozess zunächst viele weitere Kategorien gebildet. Diese stellten sich jedoch im Verlauf der Analyse als weniger zentral für die interessierende Fragestellung heraus, weshalb sie nicht in die finale Fassung aufgenommen wurden. Am Ende ließen sich die zentralen Kategorien zu einem Modell der gegenstandsverankerten Theorie verdichten. Dieses ist in Abbildung 10 dargestellt und dient als Verständnisgrundlage für die in den folgenden Kapiteln dargestellten Gerechtigkeitsüberzeugungen und Beurteilungsstrategien.

Weitere zentrale Analysekategorien

253

Ursächliche Bedingung

(Gerechte) Leistungsbeurteilung als Kernaufgabe und antinomische Herausforderung professionellen Handelns von Lehrkräften

Kontextbedingungen

Institutionelle Rahmung und Gerechtigkeitsnormen

Intervenierende Bedingungen

Kernkategorie Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

Konsequenzen

Professionelles Selbstverständnis

Beurteilungssituationen

Beurteilungsverständnis

Beziehungskonstellationen

Gerechte Leistungsbeurteilung als Balanceakt Mathematisch-rechnerisch Prozedural-bürokratisch Diskursiv-interaktiv Kompensatorisch

Erfahrung der (Un-)Möglichkeit gerechter Leistungsbeurteilung, Legitimität eigener Beurteilungspraxis und Handlungsfähigkeit

Abb. 10 – Modell der gegenstandsverankerten Theorie zu Gerechtigkeitsüberzeugungen von Lehrkräften in Bezug auf schulische Leistungsbeurteilung

Ausgehend von der Feststellung, dass die schulische Leistungsbeurteilung eine der Kernaufgaben von Lehrkräften ist und diese Aufgabe durch zum Teil widersprüchliche Anforderungen geprägt ist, ergibt sich ein Handlungsdruck für Lehrkräfte zu dem sie sich verhalten müssen (ursächliche Bedingung). Die institutionellen Rahmenbedingungen der schulischen Leistungsbeurteilung wirken als äußere Erwartungen und bilden zusammen mit den konkreten Beurteilungssituationen den Handlungskontext (kontextuelle Bedingungen). Neben den Kontextbedingungen wirken das professionelle Selbstbild der Lehrkräfte, ihr spezifisches Beurteilungsverständnis sowie die Beziehungskonstellationen, in die sie eingebettet sind und die sie aufbauen, als intervenierende Bedingungen

254

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

auf die Gerechtigkeitsüberzeugungen und Beurteilungsstrategien ein. Aus diesen Bedingungsgefügen ergibt sich die grundlegende Charakterisierung einer gerechten Leistungsbeurteilung als Balanceakt (Kernkategorie). Dieser Balanceakt wird wiederum unter Rückgriff auf verschiedene Gerechtigkeitsüberzeugungen (mathematisch-rechnerisch, prozedural-bürokratisch, diskursiv-interaktiv, kompensatorisch) und durch verschiedene Beurteilungsstrategien von den Lehrkräften bewältigt, die sich auf verschiedene Legitimationsquellen stützen und in Abhängigkeit zu den kontextuellen und intervenierenden Bedingungen stehen. Die gewählten Beurteilungsstrategien führen damit eine in den Augen der einzelnen Lehrkraft gerechte(re) Leistungsbeurteilung herbei, ermöglichen die (Wieder-)Herstellung ihrer Handlungsfähigkeit und legitimieren so ihre Beurteilungspraxis (Konsequenzen). Im Folgenden werden nun die verschiedenen Gerechtigkeitsüberzeugungen sowie Beurteilungsstrategien dargestellt. Auf das Modell der gegenstandsverankerten Theorie wird in Kapitel 7 noch einmal zusammenfassend eingegangen.

6.3 Gerechtigkeitsüberzeugungen und Beurteilungsstrategien zur Herstellung gerechter Leistungsbeurteilung Wie in Kapitel 2.4 bereits dargestellt, werden Gerechtigkeitsüberzeugungen von Lehrkräften in Bezug auf die schulische Leistungsbeurteilung in dieser Arbeit als handlungsleitende, berufliche Überzeugungen verstanden, die als Bindeglied zwischen individuellen Vorstellungen und professionellem Handeln als Lehrkraft fungieren. Anders ausgedrückt: wie verschiedene Lehrkräfte mit unterschiedlichen Beurteilungssituationen umgehen, welche Schwierigkeiten und Dilemmata sie für ihr Handeln identifizieren und mit welchen Strategien sie diese bewältigen – all dies wird als Hinweis auf handleitungsleitende Überzeugungen verstanden, die sich wiederum zu Gerechtigkeitsüberzeugungen verdichten lassen. Das, was als gerechte oder ungerechte Beurteilung beschrieben wird, variiert zwischen den einzelnen Lehrkräften zum Teil erheblich. Ihnen allen ist jedoch gemeinsam, dass die Herstellung gerechter Leis-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

255

tungsbeurteilung bzw. die Vermeidung ungerechter Beurteilungen eng mit Fragen ihrer professionellen Selbstwahrnehmung und der Legitimation ihres professionellen Handelns zusammenhängt. Dabei greifen verschiedene Lehrkräfte auf unterschiedliche Legitimationsquellen für ihr Beurteilungshandeln zurück, mit denen sie die gewählten Beurteilungsstrategien als ‚gerecht‘ qualifizieren. Unter Beurteilungsstrategien werden in dieser Arbeit sowohl Handeln als auch Nicht-Handeln eingeschlossen, da auch ein Unterlassen von bestimmten Handlungen als gerechtigkeitsfördernd oder –hindernd von den Lehrkräften verstanden werden kann.137 Ganz im Sinne von Strauss und Corbin geht es hierbei um den Umgang der Lehrkräfte mit bestimmten Beurteilungserfahrungen (vgl. Strauß & Corbin, 1996, S. 36). Er stellt damit einen weichen Strategiebegriff dar, der nicht nur absichtsvolles, strategisch geplantes Handeln umfasst, sondern auch spontane Formen des Umgangs mit den skizzierten widersprüchlichen Anforderungen an die schulische Leistungsbeurteilung einschließt. Die identifizierten Beurteilungsstrategien können dabei auch Ausdruck unterschiedlicher Gerechtigkeitsüberzeugungen sein: so kann eine detaillierte Dokumentation einzelner Teilleistungen von Schüler_innen beispielsweise im Sinne einer Lernprozessunterstützung für die Schüler_innen von einer Lehrkraft angelegt sein, für andere Lehrkräfte aber hauptsächlich als Absicherung der eigenen Beurteilungen im Falle einer Überprüfung durch Dritte dienen (im Sinne von Buchhaltung und accountability). Je nachdem, welche Gerechtigkeitsüberzeugung die Lehrkräfte mit der jeweiligen Beurteilungsstrategie verbinden, werden Beurteilungsstrategien von bestimmten Lehrkräften als legitime Praxis vertreten, während die gleichen Strategien für andere Lehrkräfte überhaupt nicht in Betracht kommen und abgelehnt werden. Wiederum andere Beurteilungsstrategien werden quasi als ‚Universalinstrument‘ von vielen Befragten zur Sicherstellung einer gerechten Beurteilung berichtet.

137

Wie bereits ausgeführt, handelt es sich hierbei um berichtete, keine beobachtete Praxis.

256

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Im Folgenden werden die berichteten Handlungsstrategien und Gerechtigkeitsüberzeugungen der befragten Lehrkräfte ausführlich anhand ausgewählter Interviewauszüge dargestellt. Diese lassen sich in vier Muster unterscheiden: mathematisch-rechnerische, prozeduralbürokratische, diskursiv-interaktive und kompensatorische Gerechtigkeitsüberzeugung. Innerhalb dieser vier übergeordneten Muster wiederum finden sich verschiedene konkrete Umsetzungen, die im Hinblick auf ihr Zusammenspiel mit bzw. die Begrenzung durch die oben beschriebenen kontextuellen und intervenierenden Bedingungen vergleichend dargestellt werden. Die vier im Folgenden dargestellten Muster von Handlungsstrategien und Gerechtigkeitsüberzeugungen können gewissermaßen als Kontinuum verstanden werden, bei dem die mathematisch-rechnerische und kompensatorische Gerechtigkeitsüberzeugung jeweils Extrempole einnehmen, die am weitesten voneinander entfernt liegen. Dazwischen finden sich die Überzeugungen und Beurteilungsstrategien der prozedural-bürokratischen und der diskursiv-interaktionalen Gerechtigkeit, die jeweils auch Überschneidungsbereiche mit diesen Extrempolen sowie auch miteinander teilen, die Übergänge zwischen den Gerechtigkeitsüberzeugungen sind dabei fließend (vgl. ausführlicher dazu Kap. 7). Bedingt durch die situativ-kontingente Charakteristik schulischer Leistungsbeurteilung und der sich im Laufe des Berufslebens wandelnden Beurteilungspraxis vieler Lehrkräfte können einige der befragten Lehrkräfte sehr deutlich als Referenzfälle für bestimmte Überzeugungen und Beurteilungsstrategien herangezogen werden, während in anderen Interviews sowohl Merkmale der einen wie auch der anderen Überzeugung aufzufinden sind. Die hier benannten Gerechtigkeitsüberzeugungen müssen dabei als Idealtypen im Weber’schen Sinne verstanden werden (Weber, 1904/1985): Sie stellen eine komprimierte Zusammenfassung der analytischen Arbeit dar, indem zentrale Elemente in abstrahierter Form dargestellt werden. Diese Idealtypen müssen dabei nicht mit den empirisch auftretenden Einzelfällen identisch seien, im Gegenteil finden sich Elemente verschiedener Gerechtigkeitsüberzeugungen auch in Interviews mit ein und den-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

257

selben Lehrkräften. Im Umkehrschluss wird auch nicht der Anspruch erhoben, eine jede empirisch vorgefundene Form müsse dem idealtypischen Charakter, wie er hier dargestellt wird, entsprechen. Die verschiedenen idealtypisch skizzierten Überzeugungs- und Handlungsmuster sind teilweise nicht trennscharf voneinander abzugrenzen, vielmehr sind die Übergänge hier fließend. Die Unterscheidung der verschiedenen Gerechtigkeitsüberzeugungen muss somit als analytisches Hilfsmittel verstanden werden, um der empirisch vorfindlichen Vielfalt strukturierend gegenüberzutreten, keinesfalls dient sie der originalgetreuen Abbildung eines Einzelfalles in Form von Typen. Um die Besonderheiten der jeweiligen Überzeugung gegenüber anderen empirisch vorgefundenen Ausprägungen herauszuarbeiten, werden jeweils auch Kontrastfälle als Gegenbeispiele eingeführt. Gleichzeitig dienen diese Kontrastfälle auch dazu die innere Varianz der jeweiligen Überzeugung abzubilden und nicht der Illusion einer spannungsfreien, homogenen Darstellung aufzusitzen. Für alle vier Gerechtigkeitsüberzeugungen werden im Folgenden ausgewählte Referenzfälle ausführlicher dargestellt – wo dies möglich ist, jeweils ein Fall aus dem deutschen und einer aus dem schwedischen Sample. Daran anschließend erfolgt der fallübergreifende Vergleich dieser Referenzfälle innerhalb der schwedischen bzw. nordrheinwestfälischen Samplegruppe, im Anschluss daran wird eine länderübergreifende Perspektive auf Gemeinsamkeiten und Unterschiede zwischen den beiden Samplegruppen eingenommen. Ziel ist dabei die Kontrastierung und Darstellung der rekonstruierten Varianzen innerhalb der jeweiligen Gerechtigkeitsüberzeugung. Abschließend werden die aus dem Material rekonstruierten Bedingungen zusammenfassend dargestellt, die eher förderlich bzw. hemmend auf die verschiedenen Gerechtigkeitsüberzeugungen der Lehrkräfte beider Länder einwirken. Für die bessere Nachvollziehbarkeit werden die Interviewausschnitte jeweils den pseudonymisierten Lehrkräften zugeordnet sowie die Zeilennummern aus dem Interviewtranskript in Klammern angegeben. Für die schwedischen Interviewauszüge wird im Fließtext die deutsche Übersetzung verwendet, in der Fußnote jeweils aber auch das schwedische

258

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Original eingefügt. Wo nötig, werden zusätzliche Informationen zu Übersetzungsfragen ebenfalls in den Fußnoten aufgeführt. Interviewzitate werden immer kursiv und in Anführungszeichen mit Angabe der Zeilennummer im Transkript angegeben, Begriffe oder Formulierungen in einfachen Anführungszeichen wiederum stellen Hervorhebungen durch die Autorin dar. 6.3.1 Mathematisch-rechnerische Gerechtigkeitsüberzeugung Im Zentrum dieser Gerechtigkeitsüberzeugung steht die Legitimation der Beurteilung von Schüler_innenleistungen über rechnerische Operationen (z.B. Addieren von Einzelnoten, Mittelwertbildung) bzw. unter Verweis auf mathematische Gesetzmäßigkeiten oder Verfahren (u.a. Normalverteilung, Näherungswerte). Die auf diese Weise hergestellten Noten werden als zuverlässig und gerecht beschrieben, da sie auf ‚harten‘ Fakten und ‚logischen‘ Verfahren beruhen. Ein typisches Beispiel aus Nordrhein-Westfalen dafür sind die Zeugnisnoten, die sich aus dem Mittelwert der im Schuljahr erbrachten Einzelnoten zusammensetzen und bei denen die mathematische Genauigkeit als Garant einer gerechten Beurteilung angeführt wird. Im Vergleich zu den anderen Gerechtigkeitsüberzeugungen liegt der Fokus auf der Erstellung einer Zensur und deren Zusammensetzung aus Teilnoten, die sich wiederum aus der Berechnung von Punktwerten in einzelnen schriftlichen Arbeiten ergeben. Die Lehrkräfte beschäftigen sich in den Interviews intensiv mit der Frage der Angemessenheit und Genauigkeit von Bepunktungstabellen und Notenschlüsseln, diskutieren aber auch die Grenzen und Schwierigkeiten dieser Instrumente. Auf Kompetenzbegriffe oder in den Lehrplänen definierte Lernziele wird in den Interviews allerdings eher selten zurückgegriffen, die Umrechnung der gezeigten Schüler_innenleistungen in Noten wird nahezu ohne inhaltliche Bezüge erläutert und als Abfolge logischer (Rechen-)Schritte charakterisiert. Die Überlegungen bezogen auf eine gerechte Leistungsbeurteilung drehen sich bei der mathematisch-rechnerischen Gerechtigkeitsüberzeugung vornehmlich um die richtige Form der Korrektur und Bepunktung

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

259

schriftlicher Arbeiten. Zu diesem Zweck werden Punkteschemata, Notenschlüssel oder Prozentverteilungen für die Beurteilung genutzt. Die Lehrkräfte beschreiben sehr ausführlich, wie sie Fehler markieren, für welche Fehlerarten es Punktabzüge gibt und in welchen Fällen über Zusatzpunkte eine Ausnahmeregelung möglich ist. Dahinter steht auch die Idee, dass die Teilleistungen, für die jeweils ein Punkt vergeben wird, gleichartig sind und die gleiche Anzahl von Punkten ein ähnliches Leistungsbild abbildet. Dabei wird außer Acht gelassen, dass sich hinter der gleichen Punktzahl sehr wohl auch unterschiedliche Kompetenzprofile von Schüler_innen verbergen können. Die Grundannahme ist aber auch hier scheinbar, dass die Umrechnung einer bestimmten Teilleistung in Punkte ähnlich wie die Umrechnung von Maßzahlen oder Längeneinheiten funktioniere. Die zentrale Gerechtigkeitsfrage lautet also: „wie viel Punkte gebe ich eigentlich für welche Leistung?“ (Herr Grabenmüller, Z. 107). Was genau aber unter einer ‚Leistung‘ zu verstehen ist, wird im Zusammenhang mit schriftlichen Arbeiten kaum hinterfragt, da diese ‚Schwarz auf Weiß‘ vorlägen und als leichter zu beurteilen charakterisiert werden als mündliche Leistungen, die, wie die Mitarbeit im Unterricht, von verschiedenen Faktoren beeinflusst und vor allem flüchtiger und daher weniger standardisiert messbar sei. Leistungsbeurteilung wird hier vor allem als Leistungsmessung verstanden, der Fokus liegt dafür auf schriftlichen Leistungen und konkreten Messzeitpunkten (u.a. Klassenarbeiten, Tests). Subjektivität auf Seiten der Lehrkräfte wird als großer Störfaktor empfunden, der die ‚reine Messung‘ erschwere, weshalb die Lehrkräfte eine möglichst unpersönliche, d.h. eine Beurteilung unabhängig von Sympathien oder Antipathien, anstreben. Eine implizite Orientierung am messtheoretischen Gütekriterium der Objektivität wird hier zur Unterscheidung einer gerechten von einer ungerechten Leistungsbeurteilung angewandt. Die Lehrkräfte sprechen sich selbst eine gute Einschätzungsfähigkeit des Leistungsniveaus ihrer Schüler_innen zu, auf deren Grundlage sie den Schwierigkeitsgrad der Aufgaben bei der Erstellung schriftlicher Lernkontrollen oder Klassenarbeiten angemessen festlegen können. Diese gute Einschätzungsfähigkeit wird auf ihre Expertise als Fachlehrkraft („Ma-

260

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

thematiker“) oder aber ein Selbstbild als Wissensvermittler_in zurückgeführt – als „Pädagogen“ bezeichnen sich diese Lehrkräfte, im Gegensatz zu anderen Lehrkräften des Samples, nicht. Schwierigkeiten bei der Leistungsbeurteilung beschreiben die Lehrkräfte daher vor allem dann, wenn das Ergebnis einer Klassenarbeit nicht mit ihrer Einschätzung der Leistungsfähigkeit der Klasse übereinstimmt. Um ihre Beurteilungskompetenz nicht infrage gestellt zu sehen, weichen die Lehrkräfte in diesen Fällen von ihrer Maxime des gleichen Maßstabs ab und korrigieren die Punkteschemata und Notenschlüssel nachträglich. Eine weitere Schwierigkeit stellen ‚auffällige‘ Ergebnisse dar, beispielsweise eine Klassenarbeit mit besonders vielen guten oder auffällig vielen schlechten Noten. In beiden Fällen offenbart sich eine implizite Orientierung an der Gaußschen Normalverteilungskurve bei der Vergabe von Schulnoten, eine Abweichung davon wird von den Lehrkräften als potentielle Gefährdung der eigenen Beurteilungskompetenz betrachtet, die es zu vermeiden gilt. An dieser Stelle verweisen die Lehrkräfte auf ihre sogenannte „pädagogische Freiheit“, die es ihnen beispielsweise ermögliche, das zunächst starr erscheinende Punkteschema nachträglich zu korrigieren und ihrem Eindruck entsprechend anzupassen. Obwohl die Lehrkräfte also einerseits eine stark mathematisch-rechnerische Logik bei der Notenfindung anwenden, nutzen die gleichen Lehrkräfte ihren pädagogischen Spielraum für individuelle Anpassungen eben dieser Logik. Das Noten- oder Punkteschema dient also als Hilfsmittel oder Richtschnur, wird jedoch im Einzelfall auch durch pädagogisch begründete Ermessensentscheidungen ergänzt. Der Balanceakt für diese Lehrkräfte besteht vor allem darin, die Idee einer Beurteilung, die einer rein mathematisch-rechnerischen Logik folgt und unabhängig von persönlichen Animositäten der beurteilenden Person erfolgt, aufrecht zu erhalten und gleichzeitig ihre eigene Beurteilungskompetenz nicht infrage zu stellen, wenn ihre fachliche Einschätzung nicht mit dem Bepunktungsergebnis übereinstimmt. Im länderübergreifenden Vergleich wurde deutlich, dass die mathematisch-rechnerische Gerechtigkeitsüberzeugung vor allem im nordrheinwestfälischen Sample rekonstruiert werden konnte. Im schwedischen

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

261

Sample hingegen trat die Orientierung an mathematisch-rechnerischen Legitimationsmustern häufig nur ex negativo auf, d.h. die befragten schwedischen Lehrkräfte distanzierten sich von Praktiken der Bepunktung und Mittelwertbildung bzw. charakterisierten diese als überholt und ungerecht. Insofern wird im Folgenden lediglich für den nordrheinwestfälischen Kontext eine ausführliche Einzelfalldarstellung für die Lehrerin Frau Ehrl138 vorgenommen, für das schwedische Sample hingegen in Kapitel 6.3.1.2 ein sampleinterner Vergleich angestellt. 6.3.1.1 Frau Ehrl – „da kann man noch was drehen“ Frau Ehrl ist zum Zeitpunkt des Interviews 33 Jahre alt und unterrichtet seit fünf Jahren die Fächer Mathematik, Musik und Biologie an einem städtischen Gymnasium. Im Vorgespräch zum Interview teilte sie mir mit, dass sie von ihrem Schulleiter gewissermaßen dienstverpflichtet wurde am Interview teilzunehmen, sich also anders als andere Lehrkräfte des Samples nicht selbst für ein Interview gemeldet habe und etwas aufgeregt sei. Ihre anfängliche Nervosität ließ im Verlauf des Gesprächs nach und das Interview zeichnete sich durch sehr reiche Erzählepisoden aus, in denen Frau Ehrl häufiger lachte und immer entspannter wirkte. Ein zentrales Thema des Interviews war für sie die Erläuterung der richtigen Bepunktung von Klassenarbeiten und anderen schriftlichen Leistungen sowie daran anschließende Überlegungen zur nachträglichen Anpassung der Bepunktungsschemata bei nicht erwartungskonformen Ergebnissen.

Ausgangsdilemma: Benotung und Unterricht im Widerspruch Frau Ehrl formuliert an mehreren Stellen des Interviews einen Gegensatz zwischen ihrem Unterrichtsideal und dem damit verbundenen pädagogi138

Die Namen der Lehrkräfte sind, wie bereits erwähnt, Pseudonyme (vgl. Fußnote 39)

262

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

schen Auftrag einerseits und der Benotung von Schüler_innenleistungen als teilweise belastende Verpflichtung andererseits. Dieser Grundwiderspruch findet sich beispielhaft auch im folgenden Auszug: „Also ich würde es in mehr/ Mathe wirklich eher so sehen, man soll im Unterricht entspannt das zusammen lernen. ICH zeige euch, wie das geht oder ich helfe euch, das hinzukriegen. (.) Und ja, dummerweise müssen wir [lacht] ab und zu Klausuren schreiben und ich muss euch eine Note geben.“ (Z. 375-378)

Für Frau Ehrl bedeutet Unterrichten zunächst ein gemeinsames Erarbeiten neuen Stoffs, das gern „entspannt“ vonstattengehen soll. Gemeint ist damit vermutlich ein nicht auf die Beurteilung fixiertes Lernen, das zunächst vor allem den Zugewinn von Wissen und Fähigkeiten im Fokus hat. Ihre eigene Rolle beschreibt sie dabei als anleitende („zeige euch“) und unterstützende („helfe euch“) Lehrperson, die gemeinsam mit den Schüler_innen daran arbeitet „das hinzukriegen“. Auch an anderen Interviewstellen spricht sie davon „schönen Unterricht“ (Z. 256-257) machen zu wollen, was in ihrem Fall auch bedeutet, dass sie darauf achtet, dass alle Schüler_innen ungeachtet ihres Vorwissens und des familiären Hintergrunds im Unterricht mitkommen können: „Ich gehe davon aus, dass alle kommen, erst mal ohne v/ ohne Vorwissen. Ich fange immer ganz vorne an. Und (.) so halt soll eigentlich jeder die Chance haben, ähm auch (.) ja, auch wirklich das komplett da zu lernen im Unterricht. Und nicht äh weil die Eltern noch geholfen haben.“ (Z. 476-479)

Auch hier skizziert sie ihre Aufgabe vor allem darin, eine für möglichst alle Schüler_innen ansprechende Lernsituation zu schaffen und den Unterrichtsstoff so aufzubereiten, dass alle Schüler_innen erfolgreich lernen können. In dieses pädagogische Ideal hinein tritt nun aber die Verpflichtung Leistungen auch beurteilen zu müssen, was von ihr als eher störendes Element im pädagogischen Alltag beschrieben wird, das von außen vorgegeben wird („dummerweise müssen wir“). Leistungsbeurteilung wird so als eine dem ‚eigentlichen‘ pädagogischen Auftrag gegenüberstehende Aufgabe entworfen, die von jeder Lehrkraft „dummerweise“ bewältigt werden müsse. Im Verlauf des Interviews wird sehr deutlich, dass Frau Ehrl diesen von außen an sie herangetragenen Auftrag als

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

263

individuell zu bewältigende Aufgabe auffasst, die schulische Leistungsbeurteilung also als individuelle Praxis verstanden wird („ganz klar hat jeder da sein eigenes“, Z. 263). Am Ende des Interviews resümiert sie schließlich: „Leistungsbeurteilung ist auch was ganz Persönliches“ (Z. 544). Insofern überrascht es auch nicht, dass Frau Ehrl die Kernlehrpläne und schulinternen Grundsätze der Leistungsbeurteilung als unerwünschte Standardisierungsmaßnahme vehement ablehnt und auf ihren Wunsch verweist, die Leistungsbeurteilung „je nach Klasse“ und „je nach Situation“ gestalten zu können, „wie es gerade passt“ (Z. 245-246): „Ich wehre mich dagegen, dass dann vorher festzulegen. Bevor ich nicht mal die Klasse gesehen habe und Unterricht gemacht habe. Ich will das gar nicht GENERELL FÜR ALLE festlegen“ (Z. 252-254). An der Umsetzung der Kernlehrpläne in schulinterne Lehrpläne und Grundsätze kritisiert sie, dass diese „alles abprüfbar (.) beschreiben müssen“ (Z. 179) und empfindet sie zudem als „Prüfung der Lehrer“ (Z. 209-210), die „viel Arbeit fü=für nichts“ (Z. 207) bedeuten. Diese Ablehnung kann auch aus dem Gegensatz des eigenen pädagogischen Anspruchs an „schönen Unterricht“ einerseits und der äußeren Erwartung „dummerweise“ „Note[n] geben“ zu müssen erklärt werden: indem sie sich gegen eine äußere Kontrolle und Standardisierung wehrt, bewahrt sich Frau Ehrl einen kleinen Spielraum bei der Ausübung der als unangenehm empfundenen Aufgabe. Wie sie diesen Spielraum nutzt, wird im Folgenden näher beleuchtet.

Orientierung an der Normalverteilung – Herstellen von unauffälligen Noten Gleich zu Beginn des Interviews erklärt Frau Ehrl, dass sie sich zu Beginn ihrer Berufstätigkeit Rat und Hilfe für die Beurteilung schriftlicher Arbeiten geholt habe und führt sogenannte Punkteschemata als wichtigstes Hilfsmittel dafür ein: „Also in Mathe hole ich mir=habe ich mir Tabellen organisiert mi=äh=mit Punkteschema, was ist/ welche Punkte sind wel-

264

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

che Note. Aber wie man rich/ letztlich Punkte verteilt (.) ähm und/[...]“ (Z. 8-10). In dem abgebrochenen zweiten Satz deutet sich schon an, dass diese Punkteschemata einerseits zwar eine Zuordnung von erreichten Punktzahlen in einer Arbeit zu Notenstufen ermöglicht, die eigentliche Schwierigkeit hingegen – wie man „letztlich Punkte verteilt“ – sei hingegen weder im Studium noch im Referendariat thematisiert worden und eine individuell zu lösende Aufgabe. Wie weiter unten gezeigt wird, besteht die größte Herausforderung für eine gerechte Beurteilung in Frau Ehrls Verständnis vor allem darin, über die Zuordnung von Punkten zu bestimmten Leistungen zu entscheiden und anschließend zu rechtfertigen. Zunächst einmal wird deutlich, dass Frau Ehrl sich darum bemüht, den Schwierigkeitsgrad der von ihr gestellten Klassenarbeiten angemessen zu gestalten. Was dabei als angemessen gilt, wird im folgenden Auszug deutlich, in dem sie indirekt ein normalverteiltes Ergebnis als Ziel einer Klassenarbeit beschreibt: „Äh in der Klassenarbeit soll natürlich ein Grundstock sein, was=was jeder kann, dass jeder seine (.) Vier mindestens erreichen kann. Und es soll aber auch eine Aufgabe eben/ man sagt ja im Anforderungsbereich drei, was dabei sein. Dass eben ähm ja, die/ man sagt immer die Unterscheidung zwischen Eins und Zwei, dass man eben sagt, hier jetzt was über den Unterricht hinausgeht, eigene äh Verwendung des Gelernten, dass man das eben auch abprüft. Aber dass das eben auch nur ein kleiner Teil ist. Ähm (.) ja und (.) so guck=so gucke ich mir auch meine Arbeiten an. Dass ich wirklich das äh erfülle, dass ich bedenke, dass nur jeder gut was schaffen kann und aber auch nicht zu leicht ist, dass alle eine Eins schreiben.“ (Z. 19-27)

Das Merkmal einer guten Klassenarbeit stellt also die erwartungskonforme Verteilung der Schüler_innen über die Notenspanne von Eins bis Sechs dar. Eine zu leichte Arbeit, bei der „alle eine Eins schreiben“ wird hier als ebenso wenig erstrebenswert markiert, wie eine zu schwere Arbeit, bei der nicht „jeder seine Vier mindestens erreichen kann“. Erwartungskonform für Frau Ehrl ist damit eine Normalverteilung der Noten innerhalb einer Lerngruppe mit einem Hauptanteil in den mittleren Notenbereichen (Note 3 und 4) sowie wenigen Noten an den Rändern (Note Eins bzw. Fünf und Sechs). Wie in Kapitel 1.1 und 2.2 erläutert,

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

265

stellt diese implizite Orientierung an der Normalverteilung eine im deutschen Bildungssystem weit verbreitete Grundannahme in Bezug auf die schulische Leistungsbeurteilung dar, die auf verkürzten Rückschlüssen von normalverteilten Persönlichkeitsmerkmalen wie der Intelligenz innerhalb einer Gesellschaft auf eine ebenfalls normalverteilte Streuung der Fähigkeiten innerhalb einer Schulklasse beruhen. Sie verwendet mehrfach die unpersönliche Formulierung „man sagt“ und beschreibt eine gewisse Erwartungshaltung („in der Klassenarbeit soll“), beides deutet auf eine überindividuell geteilte Norm hin, der sich Frau Ehrl bewusst ist und die sie zu erfüllen sucht. Frau Ehrl setzt gleichsam unabhängig vom Unterrichtsstoff und den individuellen Schüler_innen voraus, dass es bei jeder Klassenarbeit eine solche Normalverteilung der Noten geben muss und deklariert die Streuung der Noten als Qualitätskriterium einer guten, angemessenen Beurteilung. Die Herstellung einer lerngruppenbezogenen Rangordnung unter Anwendung der sozialen Bezugsnorm wird damit zur primären Aufgabe schulischer Leistungsbeurteilung, dem nachgeordnet dienen die schriftlichen Tests dazu abzuprüfen, inwiefern Schüler_innen bestimmte Lehrplanziele erreichen (kriteriale Bezugsnorm) oder inwiefern sich einzelne Schüler_innen im Vergleich zu einem früheren Zeitpunkt verbessert haben (individuelle Bezugsnorm). Anders gesagt: Die Funktion der Klassenarbeit ist in diesem Falle nicht in erster Linie zu erfassen, was die Schüler_innen gelernt haben, sondern sie hinreichend gut voneinander unterscheiden und auf einer Notenskala einsortieren zu können. Das im obigen Auszug geschilderte Klausurergebnis mit einer möglichst normalverteilten Notenstreuung innerhalb einer Lerngruppe stellt allerdings zunächst nur ein anzustrebendes Ideal dar, dass mit der Beurteilungsrealität häufig nicht übereinstimmt. Für Frau Ehrl ergibt sich daraus eine Handlungsaufforderung zur Herstellung eines erwartungskonformen Gesamtbildes: „Und (.) ja, was man auch nachher mit den Punkten machen kann, um noch irgendwie die Noten anständig hinzukriegen. Also man denkt ja immer in Mathe ist das alles klar, aber ist es nicht. Also da kann man wirklich richtig viel dran drehen“ (Z. 29-32).

266

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Die von ihr gewählte Handlungsstrategie zum Umgang mit nichterwartungskonformen Ergebnissen besteht in der nachträglichen Korrektur der Bewertungsmaßstäbe (etwas „mit den Punkten machen“) mit dem Ziel „die Noten anständig hinzukriegen“. Dieses „anständig“ kann in diesem Zusammenhang als ordentlich, gewissenhaft oder richtig verstanden werden. Es kann aber auch als Hinweis auf eine befriedigende, weil unauffällige und erwartungskonforme Beurteilung interpretiert werden. 139 In beiden Fällen schwingt eine äußere Erwartungshaltung an die in der Klausur vergebenen Noten mit, die Frau Ehrl versucht zu erfüllen. Wichtig ist offenbar die Außenwirkung der vergebenen Noten als „anständig“. Als Mittel der Wahl für diese Außendarstellung wird die nachträgliche ‚Arbeit an den Punkten‘ eingeführt, an denen „man wirklich richtig viel dran drehen“ könne.

„da kann man wirklich richtig viel dran drehen“ - Anpassen des Notenschlüssels für eine gerechte(re) Note Frau Ehrl berichtet angeregt über verschiedene Möglichkeiten der nachträglichen Anpassung der Bepunktungen, um die gewünschte Zensurenverteilung innerhalb einer Klasse zu erreichen (Z. 66-72) und verkündet: „da gibt es ja ganz viele Möglichkeiten, das (.) hinzukriegen“ (Z. 71-72). Als Bedingung dafür, die Noten erwartungsgerecht „hinzukriegen“ führt sie ihre fachwissenschaftliche Ausbildung als Mathematikerin an: „Ja, das ist mir als Mathematiker natürlich klar, dass ich das äh entsprechend dann ähm (.) beim Korrigieren anpassen kann“ (Z. 50-51). Damit wiederspricht sie nur scheinbar der oben zitierten Beobachtung, „man denkt ja immer in Mathe ist das alles klar, aber ist es nicht. Also da kann man wirklich richtig viel dran drehen.“ Die scheinbare Eindeutigkeit von Er139

Nach Terhart handelt es sich bei der „Erstellung einer ‚normalen‘, im Kontext der jeweiligen Schule unauffälligen Notenverteilung“ (Terhart, 2011a, S. 703) um eine für deutsche Lehrkräfte typische Strategie der Leistungsbeurteilung. Ich greife diesen Gedanken im fallübergreifenden Vergleich noch einmal auf.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

267

gebnissen im Mathematikunterricht und damit unterstellte Leichtigkeit der Beurteilung von Schüler_innenleistungen im Fach Mathematik steht hier Frau Ehrls Einschätzung gegenüber, dass es einer gewissen fachlichen Befähigung bedarf, diese scheinbare Eindeutigkeit zunächst einmal herzustellen. Erst ihr fachwissenschaftliche Expertise erlaubt es ihr, die vorerst vorgenommenen Bepunktungen „beim Korrigieren an[zu]passen“ bzw. an den Bepunktungen und Notendurchschnitten „richtig viel [zu] drehen“, so dass diese am Ende erwartungskonform und „anständig“ ausfielen. Gleichzeitig betont sie an anderer Stelle, dass der Vorteil des Fachs Mathematik darin liege, dass die Ergebnisse eindeutig seien und die Lehrkraft nur entscheiden müsse: „Ist es richtig oder ist es falsch?“ (Z. 98). Dies sei im Gegensatz zu anderen Fächern, in denen stärker hermeneutische Deutungsfähigkeiten gefordert sind, leichter: „Dass man da eben nicht selber überlegen muss äh (.) wie verstehe ich das jetzt und/ Also ich stelle mir das in anderen Fächern schwieriger vor“ (Z. 100-101). Es zeigt sich also eine gewisse Ambivalenz hinsichtlich der Eindeutigkeit mathematischer Leistungen, die einerseits einer fachwissenschaftlichen Expertise bedürfen, andererseits aber weniger Interpretationsspielräume böten und damit entlastend für Lehrkräfte bei der Beurteilung dieser Leistungen seien. Das Problem einer als ungerecht empfundenen Beurteilung entsteht damit erst, wenn die zunächst einfach vorzunehmenden Bepunktungen nicht mit dem erwarteten Gesamtergebnis der Lerngruppe übereinstimmen. Wie Frau Ehrl auf ein zunächst nicht erwartungskonformes Klausurergebnis reagiert, wird im folgenden Ausschnitt deutlich: „Ja, das ist ja wirklich, wenn ich für (.) ähm (.) eine Aufgabe sehe (.) zum Beispiel, weiß=ich, ich habe eine Klausur und sehe nachher: okay, diese Aufgabe konnten ganz viele nicht. Dann fange ich natürlich auch an=dran=darüber nachzudenken: ‚Mhm, habe ich denen das nicht anständig beigebracht?‘ Ähm (.) wenn ich dann darüber nachdenke und weiß, okay (.) das ist so und dann kriegen sie halt die Punkte nicht. Dann bleibt das so. Aber ich kann auch sagen, okay dann ist das wohl irgendwie/ ist da was schiefgelaufen, da ist es nicht richtig angekommen oder irgendwas war unklar oder: ‚Ach Mensch, das war der Tag wo=wo viele gefehlt haben‘ oder was=auch=immer.“ (Z. 41-47)

268

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Der Ausschnitt steht exemplarisch für weitere ähnliche Erzählungen, die alle darum kreisen das Entstehen einer unerwarteten Leistung in einer schriftlichen Arbeit im Nachhinein zu erklären und anschließend bei der Bepunktung zu berücksichtigen. In der Formulierung „das konnten ganz viele nicht“ zeigt sich zunächst eine Orientierung an der gesamten Lerngruppe, nicht den einzelnen Schüler_innen. Die Benotung einer Klausur wird für Frau Ehrl erst dann schwierig, wenn Aufgaben von einer nicht weiter bestimmten, aber für sie kritischen Masse von Schüler_innen nicht im erwarteten Maße bewältigt werden konnten. Die Gruppe dient hier als Korrektiv für die Lehrerin, d.h. wenn eine größere Menge von Schüler_innen nicht-erwartungskonforme Ergebnisse produziert, wird ein Einschreiten ihrerseits notwendig. Abweichungen einzelner Schüler_innen vom erwarteten Ergebnis scheinen dagegen weniger aufmerksamkeitsrelevant zu sein (und werden vermutlich mit individuellen Schwächen erklärt). In dem Moment, in dem jedoch „ganz viele“ Schüler_innen nicht den Erwartungen entsprechen, droht ein Abweichen der Ergebnisse von der Normalverteilung, die hier als implizite Orientierung angelegt wird. Und diese Abweichungen müssen erklärt werden, um die Legitimität der Beurteilung aufrecht zu erhalten. Bis auf die erste selbstkritische Frage („habe ich denen das nicht anständig beigebracht“), werden von der Lehrerin eher diffuse Zuschreibungen von Unzulänglichkeiten („ist da was schiefgelaufen, da ist es nicht richtig angekommen oder irgendwas war unklar“) oder organisatorische Gründe („das war der Tag wo=wo viele gefehlt haben“) als mögliche Erklärungen für ein schlechtes Abschneiden aufgeführt. Insbesondere die diffusen Zuschreibungen lassen offen, bei wem etwas „schiefgelaufen“ ist, wer also die Verantwortung für die schlechten Lernergebnisse trägt – die Lehrerin mit ihrem Unterricht oder die Schüler_innen, die nicht richtig gelernt haben. Frau Ehrls grundsätzliche Orientierung an der sozialen Bezugsnorm zeigt sich ebenfalls in einer Episode über eine Schülerin, die im Leistungskurs eine „ganz passable Klausur“ geschrieben habe, die mit „Drei oder Drei Minus“ (Z. 354) von ihr bewertet wurde. Zur Einordnung dieser Note erklärt Frau Ehrl anschließend: „Ähm wobei die natürlich auch vorher besser war in Mathe. Aber das ist natürlich auch im LK, wenn da alle

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

269

Guten zusammenkommen, muss man auch erst mal gucken, wer sind jetzt hier die Besseren und die (.) weniger Guten“ (Z. 356-359). Für Frau Ehrl ist vollkommen selbstverständlich, dass die Leistung der Schülerin relativ zu denen ihrer Mitschüler_innen betrachtet werden muss, wodurch auch eine Verschlechterung der Klausurnoten möglich ist, wenn sich die Bezugsgruppe durch den Wechsel vom Grund- in den Leistungskurs (LK) verändert. Die mathematischen Fähigkeiten der Schülerin werden also nicht hinsichtlich eines im Lehrplan vorgegebenen Kriteriums beurteilt, sondern in ihrer Positionierung innerhalb der Rangordnung einer Lerngruppe. Die Orientierung an der Lerngruppe zeigt sich weiterhin in ihrer Unterscheidung zwischen legitimen und illegitimen Anpassungen der Bepunktung: „Man kann insgesamt an der Klasse was tun, aber m/ oder an einzelnen Aufgaben, die zu gewichten, dass das ähm (.)/ Aber der Vergleich unter den Schülern untereinander, (.) den (.) da kann man ja nichts machen. Entweder gebe ich für was Punkte, dann mache ich das bei allen oder eben/ Und das=das ist eigentlich in Mathe ja sehr vergleichbar. Da kann man nicht (.) ja (.)geht man ja nicht hin und gibt dem Einen einen Punkt für etwas und dem Anderen nicht.“ (Z. 92-97)

Wichtig bei der nachträglichen Korrektur des Bewertungsmaßstabs und Anpassung der Bepunktungen ist es also, diese Anpassungen bei allen Schüler_innen gleichermaßen vorzunehmen, so dass keine Bevorzugung oder Benachteiligung einzelner Schüler_innen entsteht. Hier wird die Ausrichtung an einer für alle gleichen Beurteilung (equality) als Grundlage gerechter Beurteilung deutlich. Dass die nachträgliche Anpassung von Punkten als Beurteilungsstrategie jedoch auch Grenzen hat, zeigt sich im folgenden Ausschnitt, indem Frau Ehrl von einer besonders „schlecht“ ausgefallenen Klassenarbeit berichtet: „Ich (.) hatte letzte Woche auch eine Klassenarbeit, die war so schlecht, dann/ also das ist mir noch nie passiert! Wirklich, (.) das war jetzt das erste Mal. Ähm, (.) dass ich eine Klassenarbeit hatte, die so schlecht ausgefallen ist, dass ich die neu geschrieben habe. Weil ich gesagt habe, wenn ich da jetzt einfach (.) ja, einfach auch schon bei weniger Punkten eine gute Note gebe, ähm (.) ist das auch nicht passend. Denn ich will ja, dass die das können. Ich will ja nicht/ es geht mir ja nicht irgendwie darum

270

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

schlechte oder gute Noten zu verteilen. Ich will ja die=dass die die Sache können.“ (Z. 52-58)

Frau Ehrl rahmt diese Begebenheit als besondere Ausnahme („das ist mir noch nie passiert!“, „das erste Mal“), wobei unklar ist, ob damit die Tatsache gemeint ist, dass die Klassenarbeit „so schlecht ausgefallen ist“ oder dass sie sich gegen eine Anpassung der Punkte entschieden habe und die Arbeit „neu geschrieben“ wurde. Deutlich wird jedoch, dass eine so unerwartet schlecht ausfallende Arbeit von der Lehrerin nicht akzeptiert werden kann. Das schlechte Abschneiden der Lerngruppe wird von ihr zwar als diagnostischer Hinweis gedeutet, dass die Schüler_innen den abgefragten Unterrichtsstoff anscheinend noch nicht so gut beherrschen und sie betont, dass es ihr ja nicht darum gehe „schlechte oder gute Noten zu verteilen“, sondern „dass die das können“. Sie führt an, dass die nachträgliche Anpassung der Bepunktungen zu ungerechtfertigt guten Noten geführt hätte, was sie als „auch nicht passend“ verwirft. Hier wird die Prekarität ihrer Beurteilungsstrategie deutlich, bei der die Noten am Ende einerseits abbilden sollen, wie gut Schüler_innen einen Unterrichtsstoff beherrschen – die Schüler_innen „[s]ollen die Chance haben zu zeigen, was sie können und nicht zu zeigen, wie schnell ich bin“ (Z. 65-66) – andererseits aber ein ausgewogenes Abschneiden als Normalerwartung vorausgesetzt wird. Die graduellen Anpassungen durch das „drehen“ am Punkteschema sind zudem nur so lange legitim, wie der Klassendurchschnitt über einer bestimmten Marke liegt. Fällt die Arbeit schlechter aus, droht auch die Lehrerin mit ihrem Unterricht in schlechtem Licht dazustehen. Um diese heikle Situation zu umgehen, entscheidet sich Frau Ehrl für die Wiederholung der Klassenarbeit und vermeidet so ein zu auffälliges Endergebnis. Als Erklärungen, warum diese Arbeit so schlecht ausgefallen ist, führt Frau Ehrl verschiedene Faktoren an: die Arbeit sei „zu lang“ und die Schüler_innen zudem „nervös“ gewesen, weiterhin seien die Aufgaben „nicht passend zu dem, was sie können“ gewesen (Z. 59-63). Auch hier wird wieder der oben ausgeführte Anspruch an eine angemessen gestaltete Klassenarbeit, die möglichst unauffällige, d.h. normalverteilte, Ergebnisse produziert, deutlich.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

271

„gerecht [...], weil ja EIN Lehrer für die GANZE Klasse Noten gibt“ Wie bereits oben ausgeführt, stellt die schulische Leistungsbeurteilung für Frau Ehrl eine sehr individuelle Praxis dar, bei der jede Lehrkraft ihren „eigenen Weg findet“ und „[j]eder macht das anders“ (Z. 267-268). „[W]illkürlich“ (Z. 266) sei diese eigenständige Beurteilungspraxis allerdings nicht, denn „es ist trotzdem so, finde ich schon, dass die Noten letztlich (.) gerecht sind, weil ja EIN Lehrer für die GANZE Klasse Noten gibt. Also UNTEREINANDER, im Vergleich der Schüler untereinander, stimmt das“ (Z. 268-270). Gerechte Noten bestimmen sich hier also aus dem Verhältnis der Beurteilungen von einzelnen Schüler_innen innerhalb einer Lerngruppe zueinander (soziale Bezugsnorm). Noch deutlicher wird dies am folgenden Auszug: „Also erst mal innerhalb einer Klasse gerecht, finde ich, wenn (..) ähm (...) ja, wenn man es hinkriegen würde, dass immer die Schüler, die wirklich (..) ja (.) dass man eigentlich jeden Schüler untereinander immer zwei vergleichen könnte und genau der, der besser ist, kriegt auch die bessere Note und der, der schlechter ist, kriegt die schlechtere Note.“ (Z. 495-499)

Die soziale Bezugsnorm wird hier als zentrale Gerechtigkeitsnorm herangezogen, der Vergleich der Schüler_innen untereinander zum Maßstab einer gerechten Beurteilung erklärt. Wichtig ist für sie die eindeutige Unterscheidung zwischen „besser[en]“ und „schlechter[en]“ Schüler_innen sowie die Abbildung dieser Unterschiede durch die vergebenen Noten. Dass es sich hierbei zunächst um ein anzustrebendes Ideal handelt, wird in der Verwendung des Konjunktivs („wenn man es hinkriegen würde“, „vergleichen könnte“) deutlich, der anzeigt, dass hier gegebenenfalls Unterschiede zur erlebten Praxis bestehen. Nicht erwähnt wird von Frau Ehrl hingegen ein Abgleichen der Fähigkeiten der einzelnen Schüler_innen mit einem kriterialen Maßstab, wie den im Lehrplan formulierten Lernzielen. In der Fokussierung auf die Lerngruppe („innerhalb einer Klasse“) wird auch deutlich, dass es hier um eine lokal begrenzte Form von Gerechtigkeit geht, ein über den Klassenverband hinausgehender Vergleichsmaßstab wird nicht erwogen. Im Gegenteil hält Frau Ehrl fest, dass es zwischen Klassen, die von verschiedenen

272

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Lehrkräften beurteilt werden, durchaus größere Unterschiede geben kann: „Stimmt natürlich nicht im Vergleich mit einer anderen Klasse, die einen anderen Lehrer hat. (..) Dann darf man das nicht vergleichen. Vielleicht gibt der einfach/ der eine immer eine Note besser als der andere. (.) Kommt vor! Klar.“ (Z. 270-271)

Für Frau Ehrl stellt eine potentiell unterschiedliche Beurteilung durch verschiedene Lehrkräfte keinerlei Gefährdung der Legitimität einer Beurteilung dar, vielmehr ist sie Ausdruck des professionellen Spielraums und der Eigenständigkeit von Lehrkräften. Unterschiedliche Beurteilungspraktiken verschiedener Lehrkräfte eines Kollegiums gehören selbstverständlich zu ihrem Berufsalltag („Kommt vor! Klar.“) und ein Vergleich unterschiedlicher Benotungen verschiedener Lehrkräfte miteinander wird von ihr als illegitim bezeichnet („darf man das nicht vergleichen“). Für die Schüler_innen sei eine solch unterschiedliche Beurteilung durch verschiedene Lehrkräfte wiederum unproblematisch, da diese ebenfalls über die unterschiedlichen Ansprüche und Gewohnheiten der Lehrer_innen im Bilde seien und die Noten entsprechend gewichten könnten: „Aber für die Schüler ist das auch okay. Denn die wissen untereinander: ‚Oh, du hast bei DEM eine Drei! Das ist aber schon gut.‘ (.) Oder du sagst äh: ‚Du hast bei dem eine Drei? Da war ich aber immer besser!‘ So das (.) ähm (.) untereinander als Vergleich ist das okay.“ (Z. 284-287)

Hier wird noch einmal deutlich, dass es zwar eine starke Orientierung an der sozialen Bezugsnorm gibt, gleichzeitig aber der Maßstab für die Unterscheidung von Schüler_innenleistungen von einzelnen Lehrkräften unterschiedlich ausgelegt werden kann. Die Noten sind also zum einen von der Zusammensetzung der jeweiligen Lerngruppe abhängig, zum anderen aber auch davon welchen Standard jede einzelne Lehrkraft selbst anlegt bzw. wie die Lehrkräfte eine Zensur definieren. Im Beispiel wird so aus einer eigentlich ‚befriedigenden‘ Note Drei in der inoffiziellen Schüler_innendeutung eine „gut[e]“ Note Zwei, da für eine Drei „bei DEM“ Lehrer offenbar deutlich höhere Anforderungen erfüllt werden müssen als bei seinen Kolleg_innen. Für Frau Ehrl stellen diese Bedeu-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

273

tungsunterschiede keine größere Problematik dar, in ihren Augen sei diese kontingente Deutung der Notenstufen für die Schüler_innen „okay“, denn „[d]ie kennen das, das ist so“ (Z. 319). Natürlich handelt es sich auch hier nur um bereits gedeutete Beobachtungen einer Lehrerin, die sich nicht nachprüfen lassen. Gleichwohl drückt sich darin eine akzeptierte Alltäglichkeit unterschiedlicher Noteninterpretationen und Beurteilungsverständnisse aus, die sowohl von Frau Ehrl als selbstverständlich betrachtet wird als auch von den Schüler_innen akzeptiert zu sein scheint.140

Leistungsbeurteilung als individuelle Praxis Begründet wird die akzeptierte Selbstverständlichkeit der Ungleichheit von Beurteilungen verschiedener Lehrkräfte von Frau Ehrl wiederum mit dem Hinweis auf die in ihrem Kollegium übliche individuelle Beurteilungspraxis, die nur selten durch kollegialen Austausch expliziert wird: „[...] ich meine wir sind ja auch alle Individuen. Jeder macht so sein/ wie er das für richtig hält. Und (.) ähm (.) ja, solange da keiner irgendwie ein Unmensch ist und möchte irgendwen niedermachen oder ist wirklich UNGERECHT den Schülern untereinander innerhalb einer Klasse, ähm funktioniert das auch gut.“ (Z. 318-322)

Als illegitim wird hier einerseits aufgeführt, wenn Beurteilungen zur Bestrafung von Schüler_innen angewandt würden („irgendwen niedermachen“), andererseits aber auch wieder die soziale Bezugsnorm als Maßstab für eine gerechte Beurteilung herangezogen und eine Missachtung dieser als „wirklich UNGERECHT“ bezeichnet. Trotz der grundsätzlichen Befürwortung der sozialen Bezugsnorm als zentralem Gerechtigkeits140

Die psychologische Gerechtigkeitsforschung zeigt allerdings, dass Schüler_innen die Anwendung der kriterialen Bezugsnorm als besonders gerecht, die soziale Bezugsnorm hingegen als ungerecht einschätzen (Dalbert, Schneidewind & Saalbach, 2007), was gegen Frau Ehrls Eindruck einer akzeptierten ungleichen Beurteilung sprechen würde.

274

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

maßstab äußert Frau Ehrl in Bezug auf die Vergleichbarkeit von Abschlussnoten leichte Zweifel – die sie allerdings auch schnell wieder verwirft: „Nicht mehr okay ist das natürlich dann (..) ähm wenn man die Schule verlässt und damit weiter was werden will. (.) Ähm (..) dann in/ ja, dann ist es natürlich schöner, wenn einer gute Noten gegeben hat. Wobei ich/ wobei ich selber auch immer denke, (.) wenn ich damit dann an die Uni komme, letztlich interessiert einen da auch nicht die Note. Da interessiert auch nur, ob man es kann oder nicht. (.) Und (.) ob ich denen da für=für ihr Können eine Zwei oder eine Drei gegeben habe, ist egal. (.) Die sind froh, wenn sie die Sachen, die sie da (.) brauchen auch tatsächlich können. Und dann sind sie froh, wenn sie hier guten Unterricht gehabt haben, wo sie was gelernt haben.“ (Z. 287-294)

Frau Ehrl versucht hier die Konsequenzen ihres Beurteilungshandelns zu relativieren, indem sie wieder auf den eingangs angesprochenen Unterschied zwischen Beurteilung einerseits und Unterricht bzw. Lernen andererseits zurückkommt. Im Grunde seien die konkreten Noten für die zukünftigen Lebenswege der Schüler_innen „egal“, vielmehr komme es darauf an, was in der Schule gelernt werde, „ob man es kann oder nicht“. Vor dem Hintergrund der bereits geschilderten Prekarität ihrer Beurteilungsentscheidungen – und der immer wieder durchscheinenden Unsicherheit dabei – wirkt diese Passage wie eine Selbstberuhigung zur Legitimation ihrer Beurteilungspraxis. Frau Ehrl ist sich durchaus über die Tragweite ihrer Beurteilungen – noch dazu in einem Kernfach – bewusst, gleichzeitig weist sie die Verantwortung für potentiell versperrte Bildungs- und Lebenswege ein Stück weit von sich. Ähnlich äußert sie sich im Hinblick auf eine in ihren Augen zu starke Fixierung der Schüler_innen auf die vergebenen Noten, der sie gern eine relativierende Position entgegenhalten möchte: „[...] eigentlich sind es auch die Schüler, (.) die (.) ähm (..) ja, die das auch VIEL wichtiger finden, was sie in der Arbeit haben als ich. (.) Weil ich ja immer das Gefühl habe, ja ich weiß ja, ob derjenige das kann. Und eben genau/ Wenn der eine mal eine schlechte Arbeit schreibt, dann denke ich mir und sage dem Schüler das auch: (.) ‚Bleib mal locker!‘ ne?!, ‚Ich weiß ja, dass du das kannst!‘ Und (.) was nachher auf das Zeugnis kommt, ist dann auch immer noch eine andere Frage. Ähm (.) ja, also die Schüler sehen das enger. Also (.) ich finde auch, man kann mit einer Zwei glücklich

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

275

sein und es gibt Schüler, die wollen halt immer die Eins haben und sind unglücklich, wenn sie die Zwei haben. So. (..) Wo ich dann auch sage: ‚Naja, aber, wenn man immer eine Zwei hat, äh hat man doch auch ein schönes Leben.‘ Also (..) warum sich stressen?“ (Z. 128-136)

Hier zeigt sich, dass es offenbar eine sehr unterschiedliche Wahrnehmung der Bedeutung schulischer Leistungsbeurteilung aus Sicht der Lehrerin und ihrer Schüler_innen gibt. Während die Schüler_innen sich vor allem auf das Benotungsergebnis fixieren würden und dieses „VIEL wichtiger finden“ würden, versucht Frau Ehrl dem wiederum das Lernen an sich und ein „schönes Leben“ gegenüberzustellen. Analog zur eingangs formulierten äußeren Erwartung an sie als Lehrkraft, neben dem Unterrichten auch die Leistungen ihrer Schüler_innen zu beurteilen, wird hier ein durch die Schüler_innen verstärkter Fokus auf die Noten als externe Erwartung konstruiert, zu der sich Frau Ehrl – ob gewollt oder nicht – verhalten muss. Interessant ist hier auch ihr Hinweis „ich weiß ja, ob derjenige das kann“, der ihre Selbsteinschätzung als fähige Beurteilerin ausdrückt, gleichzeitig aber auch den von ihr vergebenen Noten eine gewisse Ungenauigkeit zuspricht, inwiefern diese der ‚tatsächlichen‘ Leistung der Schüler_innen entsprechen. Mit dem Verweis darauf, dass die zusammenfassende Zeugniszensur am Ende des Halbjahres „eine andere Frage“ sei, verdeutlicht sie wiederum den professionellen Spielraum, den sie bei der Zeugnisnotenerstellung nutzen kann und will. Damit lässt sie sich eine kleine Hintertür offen, um die Zeugnisnoten – wie auch die Noten der einzelnen Arbeiten – im Zweifel an ihre Erwartungen anzugleichen. Dass diese Freiheit durch kollegial abgestimmte Beurteilungskriterien potentiell bedroht wäre, wird in folgender Passage deutlich, in der sie die Einführung schulinterner Grundsätze der Leistungsbeurteilung als Einschränkung ihrer pädagogischen Freiheit beschreibt: „Das ist ja total verrückt! Das wird so durchorganisiert (.) ähm (.) wo wir dann eigentlich (.) ja gezwungen sind/ wir sollen so ein=was aufsetzen/ ein Schreiben, was dann auch auf die Homepage kommt, wo das steht. Wo wir aber gleichzeitig eigentlich dasitzen und wollen das ja gar nicht festlegen. Wir wollen ja einfach unseren Unterricht machen, den Schülern das beibringen.“ (Z. 239-243)

276

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Für Frau Ehrl stellt die kollegiale Verabredung schulinterner Grundsätze der Leistungsbeurteilung kein Moment des kollektiven Austauschs dar, in dem die Anforderungen eines Faches verbindlich geklärt oder individuelle Beurteilungskriterien kollegial abgestimmt werden könnten. Vielmehr empfindet sie diese Anforderung als eine weitere von außen gestellte Erwartung, die eine Belastung und Einschränkung der Lehrkräfte mit sich bringt, auch, weil die Verabredung und Transparentmachung der Beurteilungskriterien ihren professionellen Spielraum einschränken könnte. Mit der erneuten Gegenüberstellung von Beurteilung und „einfach unseren Unterricht machen“ disqualifiziert sie diese externe Erwartung als irrelevant für das ‚eigentlich‘ wichtige im pädagogischen Alltag.

„Diskussionen“ vermeiden In Bezug auf die Noten im mündlichen Beurteilungsbereich fällt auf, dass Frau Ehrl sich hier deutlich schwerer tut mit der Beurteilung der Schüler_innenleistungen („mündlich finde ich immer schwierig“, Z. 346) als im schriftlichen Bereich, wo sie durch ihre Punkteschemata ein hilfreiches Beurteilungsinstrument gefunden hat. Bei den mündlichen Noten scheint sie kein besonderes Dokumentationssystem zu haben und benennt keine konkreten Kriterien, an denen die Schüler_innen sich orientieren können. Es findet sich lediglich der Hinweis: „ich versuche das (.) gut und passend zu machen“ (Z. 424). Dieses „passend machen“ der mündlichen Noten erinnert an die eingangs rekonstruierte Praxis des Abgleichens zwischen einer normalverteilten Erwartungshaltung und dem in den Klassenarbeiten vorgefundenen Leistungsprofil. Frau Ehrl berichtet ausführlicher über verschiedene Rückmeldesituationen, in denen sie ihren Schüler_innen die mündlichen Quartalsnoten141 mitteilt und die Schüler_innen teilweise ihr Unverständnis äußern:

141

Laut APO-GOSt §13, 3 sind die Lehrkräfte in NRW verpflichtet den Schüler_innen der gymnasialen Oberstufe „etwa in der Mitte des Kurshalbjahres“ über den „bis dahin er-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

277

„[...] dann war das schwer, das ihr zu begründen. Also (.) vor allem zu begründen, ich gebe dir jetzt ähm eine schlechtere Note, weil (..) du hast viel gefragt und ähm (.) bei den Fragen habe ich gemerkt, dass du was nicht kannst. Das ist natürlich albern, die soll ja fragen! Die soll ja in Mathe fragen, wenn sie was nicht weiß. Aber ich kann das nicht als Leistung beurteilen. Ich kann das als gute Mitarbeit beurteilen. Aber ich kann ihr ja nicht=nicht eine Eins geben, weil sie (.) dauernd was fragt!“ (Z. 365-370)

Die wenig explizierten Beurteilungskriterien führen einerseits zu Irritationen über die unterschiedliche Selbsteinschätzung der Schüler_innen und die Fremdeinschätzung der Lehrerin, andererseits zeigt sich im obigen Ausschnitt, dass es für Frau Ehrl selbst schwierig ist zu unterscheiden, was sie als gute mündliche Mitarbeit bewerten soll und was nicht. Die Nachfragen der Schülerin werden einerseits als zwingend notwendig für den Lernprozess charakterisiert („die soll ja [...] fragen, wenn sie was nicht weiß“), andererseits wird das Nachfragen als Hinweis auf Verständnislücken gedeutet und schließlich als Begründung für eine schlechtere Mitarbeitsnote herangezogen. So entsteht die paradoxe, und von der Schülerin nicht nachvollziehbare, Situation, dass die in Frau Ehrls Augen übermäßige Aktivitität im Unterricht als Leistungsschwäche ausgelegt wird und sich als negative Mitarbeitsnote niederschlägt. An anderer Stelle spricht sie davon, dass sich durch ein Zettelverfahren die Rückmeldesituation für die mündlichen Noten „unpersönlicher“ gestalten ließe und man damit „Diskussionen aus dem Weg“ (Z. 409) gehen könne. Sie erklärt weiterhin: „dass ich jedem mal ein Zettelchen geschrieben hatte und die einfach verteilt habe, damit es geheim bleibt“ (Z. 389-390). Vornehmlich will sie hier die Privatsphäre der Schüler_innen wahren, gleichzeitig wird es durch die individuelle nonverbale Rückmeldung für die einzelnen Schüler_innen schwieriger sich miteinander zu vergleichen und einen Überblick über die zugrunde gelegten Kriterien zu erhalten, wodurch auch die von ihr befürchteten „Diskussionen“ ausbleiben könnten:

reichten Leistungsstand“ zu informieren. Im Unterrichtsalltag geschieht dies häufig auch schon in den Jahrgängen der Sekundarstufe I in Form von sogenannten Quartalsnoten.

278

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

„Und äh (..) ich will eben natürlich damit vermeiden, diese Diskussion um Noten. Denn wenn wir jetzt alle über Noten verhandeln und äh der Schüler, der am besten diskutiert, äh nachher am meisten rausschlagen kann. Das darf nicht passieren. Also es muss einfach so sein, der Lehrer gibt die Noten. Und nicht die Schüler.“ (Z. 433436)

Das Vermeiden von „Diskussionen“ mit ihren Schüler_innen durch unpersönlichere Rückmeldeformen gleicht damit die fehlende Transparenz bei den der Beurteilung zugrundeliegenden Kriterien aus und ermöglicht auch hier wieder einen professionellen Entscheidungsspielraum, den Frau Ehrl bei der abschließenden Notenfestsetzung nutzen kann. Wenn die Noten „geheim bleiben“, braucht es auch keinerlei Offenlegung von Beurteilungskriterien und Erläuterung von Unterschieden zwischen Schüler_innen. „Der Lehrer gibt die Noten“ verweist auf diese finale Autorität der Lehrkraft, die nicht durch rhetorische Begabung von Schüler_innen infrage gestellt werden soll. Frau Ehrls Schwierigkeiten bei der Beurteilung mündlicher Leistungen stellt in gewisser Weise das Gegenstück zu den scheinbar klaren Abläufen bei der Erstellung, Bepunktung und gegebenenfalls auch Korrektur der Bepunktung von schriftlichen Arbeiten dar. Die von ihr beschriebenen Anpassungen (etwas „an den Punkten machen“, „dran drehen“, „Zusatzpunkte“ Z. 69) können im mündlichen Beurteilungsbereich nicht eingesetzt werden, sodass sich hier ein gewisses Vakuum auftut. Theoretisch wäre es auch möglich, die unterschiedlichen Lernausgangslagen der Schüler_innen hier stärker einfließen zu lassen, worüber sie in der letzten Passage des Interviews im Hinblick auf die Schülerin mit der schlechteren mündlichen Note sinniert: „Ist das gerecht? Nur weil sie (..) ja, dauernd fragt, kriegt sie eine schlechtere Note? Oder/ ähm (.) und jemand anders, der=dem das einfach alles zufliegt, (.) der ähm (..) der=der schafft einfach seine Eins. Weil er eben einfach so einen Kopf hat, der das alles ganz leicht kann. (.) Ähm, da hat sie eigentlich viel mehr gearbeitet. Sie hat ja viel mehr getan, sie hat viel mehr Energie investiert. Und (.) ähm das ist natürlich nicht gerecht, dass der dann einfach eine Eins kriegt und sie muss dann um ihre Drei oder Zwei kämpfen. Ähm (.) gerecht ist das nicht, aber (..) trotzdem würde ich behaupten, dass ICH meine Noten/ (.) Natürlich versuche ich die gerecht zu machen. [...] Und (.) ja, das=das kann ich nicht mit einbeziehen immer und MUSS ich auch nicht. Soll ich auch nicht unbedingt. Weil es wirklich/ es heißt Leistungsbeurteilung. (.) Und (...) ja,

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

279

das ist das, was die Schüler können und nicht, wie sie dazu=dazu gekommen sind“ (Z. 509-525)

Hier wird Frau Ehrls innerer Balanceakt zwischen der Berücksichtigung unterschiedlicher Ausgangslagen und Lernprozesse verschiedener Schüler_innen einerseits und der eingangs herausgearbeiteten Orientierung an der sozialen Bezugsnorm und einer für alle Schüler_innen gleichen Beurteilung andererseits sichtbar. Im Ringen darum, was nun eine gerechte Beurteilung sei, relativiert sie die empfundene moralische Verpflichtung zur Berücksichtigung der individuellen Situation immer weiter: Aus „kann ich nicht mit einbeziehen“ wird das betonte „MUSS ich auch nicht“ und endet schließlich in „soll ich auch nicht“. Mit der finalen Festlegung, zu berücksichtigen sei bei der Leistungsbeurteilung „das, was die Schüler können und nicht, wie sie dazu=dazu gekommen sind“ schließt sie den individuellen Lernprozess abschließend als Beurteilungskriterium aus und vollzieht gleichsam den Bogen zur eingangs beschriebenen Fokussierung auf schriftliche Leistungen und damit das Lernergebnis und die Betonung einer für alle Schüler_innen gleichen Beurteilung unabhängig von der individuellen Situation.

Zusammenfassung Frau Ehrl Die Frage einer gerechten Beurteilung kreist in Frau Ehrls Augen vor allem um die ‚richtige‘ Bepunktung schriftlicher Arbeiten. Sie verwendet dafür Punkteschemata, die einerseits leicht in der Anwendung sind, andererseits verschiedene Möglichkeiten eröffnen, die Noten im Nachhinein „anständig“ „hinzukriegen“ – z.B. durch „Zusatzpunkte“, „dran drehen“ „gewichten“. Es wird deutlich, dass Frau Ehrl implizit ein normalverteiltes Ergebnis bei Klassenarbeiten erwartet und darum bemüht ist, möglichst unauffällige und erwartungskonforme Noten innerhalb einer Klasse herzustellen. Dies ist vor allem durch ihre fachwissenschaftliche Expertise und ihr professionelles Selbstbild als „Mathematiker“ möglich. Die dominierende Bezugsnorm stellt weiterhin die gesamte Lerngruppe dar, die kriteriale Bezugsnorm hingegen scheint keine be-

280

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

sondere Rolle zu spielen. Als gerecht wird zudem die gleiche Beurteilung durch eine Lehrkraft angesehen – Unterschiede zwischen Klassen, die von verschiedenen Lehrkräften beurteilt werden, sind in ihren Augen hingegen normal und allgemein akzeptiert. Kollegial abgestimmte Beurteilungskriterien werden von ihr abgelehnt, ebenso wie sie die Kernlehrpläne und schulinterne Grundsätze für die Leistungsbeurteilung als „Prüfung der Lehrer“ empfindet. Zusammenfassend lässt sich eine klare Orientierung an den Lernergebnissen feststellen, die dann wiederum mit dem erwarteten Leistungsbild abgeglichen und in Relation zur Lerngruppe gestellt werden. 6.3.1.2 Fallübergreifender Vergleich Wie oben bereits angekündigt findet an dieser Stelle zunächst ein fallübergreifender Vergleich des Falls Frau Ehrl innerhalb des nordrheinwestfälischen Samples statt, um im Anschluss die befragten schwedischen Lehrkräfte kontrastierend darzustellen. Im dritten Schritt erfolgt eine länderübergreifende Betrachtung unter Rückbindung der dargestellten Unterschiede und Gemeinsamkeiten an die jeweiligen institutionellen Rahmenbedingungen beider Länder. Der Fall Frau Ehrl im Vergleich zu anderen nordrhein-westfälischen Lehrkräften Im fallübergreifenden Vergleich wird zunächst deutlich, dass mathematisch-rechnerische Verfahren sehr verbreitete Hilfsmittel bei der schulischen Leistungsbeurteilung im gesamten nordrhein-westfälischen Sample darstellen. Die Anwendung (und nachträgliche Korrektur) von Punktetabellen und Prozentverteilungen ist ebenso gängig, wie die Berechnung von Mittelwerten aus Einzelnoten – und dies unabhängig davon, in welchen Fächern beurteilt wird. Es finden sich sowohl Deutsch- als auch Mathematiklehrkräfte im Sample, vornehmlich der Realschulen und Gymnasien, die eine mathematisch-rechnerische Gerechtigkeitsüber-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

281

zeugung aufweisen. Allen gemeinsam ist dabei auch die Infragestellung der grundsätzlichen Möglichkeit einer gerechten Beurteilung, die von ihnen geschilderten mathematisch-rechnerischen Beurteilungsstrategien werden gleichzeitig aber als Versuche der Annäherung an eine gerechte Beurteilung verstanden.

Zeugniszensuren als „Annäherungswert“ und Mittelwertberechnungen Für Frau Amberg, eine Deutschlehrerin am Gymnasium, stellt die Mittelwertberechnung aus den im Laufe eines Schuljahres vergebenen Teilnoten aus den beiden Beurteilungsbereichen der schriftlichen und mündlichen Leistung einen „Annäherungswert“ an die ‚tatsächliche‘ Leistung dar. Der aus der Mathematik stammende Begriff der Näherungswerte wird angewandt, wenn eine genaue Berechnung eines Wertes nicht möglich oder nicht nötig ist und nur eine ungefähre Genauigkeit notwendig ist. Dieses Prinzip überträgt Frau Amberg hier mehr oder weniger auf die von ihr berechneten Zeugnisnoten, die letztlich nur eine Annäherung an die Schüler_innenleistung darstellen. Die per Mittelwert ermittelte Note bezieht dabei unterschiedliche Messzeitpunkte ein und umfasst verschiedene Formen der Leistungsbeurteilung, weshalb sie als grundsätzlich legitim akzeptiert wird: „Dann gibt es halt sechs Noten von sechs Klassenarbeiten. Es gibt mehrere mündliche Noten. Und dann hat man so am Ende so einen Annäherungswert, wo man sagt, da müsste man sich so annähernd drin wiederfinden.“ (Z. 1073-1075)

Die Erstellung einer Zeugniszensur scheint damit relativ einfach und problemlos durch pures Zusammenrechnen und Mittelwertbilden möglich. Dem voraus gehen allerdings zahlreiche weitere mathematische Operationen, um die Einzelnoten für die finale Mittelwertberechnung zu produzieren. Im Interview zeigte sich, dass die schriftlichen Leistungen eine größere Bedeutung für die Leistungsbeurteilung für Frau Amberg haben als der mündliche Beurteilungsbereich. Der folgende Ausschnitt macht deutlich, dass diese Bedeutungsschwere sich gerade aus der ge-

282

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

wählten Strategie der an Punkten orientierten Beurteilung und der damit zusammenhängenden Mehrarbeit für die Lehrerin ergibt: „Ansonsten geht jetzt diese mündlichen Noten ist man relativ schnell. Da mache ich mir wenig Gedanken nach der Stunde (.) kreuze ich das halt so schnell an und dann kommt halt schon das Nächste irgendwie. Und viele Gedanken mache ich mir halt bei schriftlichen Arbeiten ähm (.) einfach dadurch, dass ich ja auch dieses äh erst mal überhaupt so einen Erwartungshoriton/zont selber schreiben m:muss. Überlegen, wie verteile ich da die Punkte und so. Und dass ich dann natürlich bei jeder Arbeit auch noch mal so gucke, ist das jetzt in Ordnung? Passt das jetzt mit dem? Ne? Wie ich=wie ich die Arbeit/ Also von dem/ Wenn ich das Sch:schema da habe, ist dann die Note, die da rauskommt, auch gerechtfertigt?“ (Z. 395-402)

Frau Amberg verwendet offenbar viel mehr Arbeitszeit und Überlegungen auf die Erstellung von Erwartungshorizonten für schriftliche Arbeiten als auf die ‚korrekte‘ Erfassung der mündlichen Leistungen. Während sie das im Unterrichtsgeschehen beobachtete Schüler_innenverhalten eher nebenbei im Anschluss an die Schulstunde auf ihrer Liste abhakt („kreuz ich das halt so schnell an“), fließen viele Überlegungen in die richtige Benotung der schriftlichen Arbeiten. Die Erwartungshorizonte dienen einerseits als Grundlage für das Zusammenrechnen der Bepunktungen und Überführen in einzelne Noten für Klassenarbeiten. Damit erleichtern sie die Zeugnisnotenerstellung für Frau Amberg. Gleichzeitig werden sie auch als Instrument der Rechenschaftslegung benötigt und werden deshalb sehr genau durchdacht und geprüft durch die Lehrerin („Passt das jetzt mit dem? [...] [I]st dann die Note, die da rauskommt, auch gerechtfertigt?“). Das Abgleichen ihrer Erwartungshaltung in Form eines Punkteschemas und dem Beurteilungsergebnis als Note erfolgt allerdings auch wieder nicht im Rückgriff auf konkrete Lerninhalte, sondern verbleibt auf einer rein rechnerischen Ebene. Es wird nicht hinterfragt, wofür die Punkte und daraus errechneten Noten eigentlich stehen, welche Kompetenzen damit abgebildet werden, was genau ein_e Schüler_in kann, wenn sie oder er die Note Zwei im Deutschaufsatz erhält. Frau Ambergs Überlegungen kreisen um das richtige Verhältnis, die Zusammensetzung der Note aus den Punkten im Erwartungshorizont. Die Schwierigkeit der schriftlichen Beurteilung scheint

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

283

sich für Frau Amberg auch daraus zu ergeben, dass sie die Erwartungshorizonte „selber schreiben muss“. Die durch die Kernlehrpläne ermöglichte inhaltliche Freiheit in der Ausgestaltung des konkreten Unterrichts zieht in der Konsequenz eine individualisierte Beurteilungspraxis einzelner Lehrkräfte nach sich, die zuweilen auch als Belastung empfunden werden kann. Frau Amberg erhält in dieser Hinsicht kaum Unterstützung von ihren Kolleg_innen, was sie selbst verwundert feststellt (vgl. Z. 8490). Ähnlich wie die Mathematiklehrerin Frau Ehrl stellt sich für Frau Amberg die Frage einer gerechten Leistungsbeurteilung vor allem als Frage der ‚richtigen‘ Bepunktung dar: Frau Amberg versucht diese auch für Deutschaufsätze mithilfe detaillierter Erwartungshorizonte zu ermöglichen, die die Schüler_innen auch als Rückmeldung von ihr erhalten. Diese Erwartungshorizonte enthalten verschiedene Rubriken, die sie aufzählt: es wird zwischen „Inhaltsleistung“ und „Darstellungsleistung“ unterschieden, hinzu kommen noch formale Fragen wie „Satzbau und solche Sachen“ sowie „einen Punkt mit Rechtschreibung“ (Z. 510-513). Am Ende erfolgt wiederum eine Berechnung: „Und daraus setzt sich dann halt diese Gesamtsumme zusammen. (.) Und dann steht halt dabei, wie ich das dann umrechne so“ (Z. 513-514). Einerseits erhalten die Schüler_innen also eine Rückmeldung über die verschiedenen Beurteilungsbereiche, gleichzeitig erfolgt die Rückmeldung ausschließlich in Form von Zahlenwerten, aus denen Frau Amberg am Ende wiederum eine „Gesamtsumme“ berechnet. Der Fokus liegt auf der Zusammenstellung der Noten und Transparentmachung der Berechnung, nicht aber so sehr auf der Vermittlung der Kompetenzen, die die Schüler_innen erworben haben bzw. an denen sie noch weiter üben sollten (wie dies bei einer stärker formativen Rückmeldung mit Hilfe von Beurteilungsbögen auch möglich wäre).142 Hinsichtlich der mündlichen Leistungsbeurteilung beschreibt Frau Amberg zu Beginn des Interviews ihre Vorgehensweise folgendermaßen:

142

Konkrete Beispiele für eine eher formative Rückmeldung mithilfe von Beurteilungsbögen finden sich in den Kapiteln 6.3.3 und 6.3.4.

284

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

„Also ich mache das nicht richtig mit Noten, sondern ich mache [lachend] mir da mehr so Kreuze und Sterne und Punkte und so. Halt so ein eigenes System. Ähm (.) was jetzt mehr so eine Tendenz ist, als eine Note halt. (.) Und was auch schneller geht, als wenn ich mich auf so eine Note festlegen müsste.“ (Z. 59-62)

Sie baut also zunächst einen Zwischenschritt in ihre Beurteilung ein, indem sie die beobachteten Schüler_innenleistung – scheinbar neutral – in einem bewusst nicht-notenförmigen System aus verschiedenen Symbolen vermerkt. Dieser Zwischenschritt wird von ihr als effizient und einfach („was auch schneller geht“) und vor allem auch vorläufiger („mehr so eine Tendenz“) als die Festlegung auf eine bestimmte Note beschrieben. Ihr Symbolsystem ermöglicht ihr einerseits das Sammeln und Festhalten von Eindrücken, gleichzeitig bleibt ein gewisser Spielraum für die Interpretation dieser Eindrücke und die Umwandlung in eine Note zu einem späteren Zeitpunkt bestehen. Im Verlauf des Interviews kommt Frau Amberg immer wieder auf ihr Dokumentationssystem zu sprechen, bis sie schließlich zur besseren Erläuterung für mich ein A4Blatt hervorholt, auf dem sie in einer Tabelle die Namen der Schüler_innen einer Klasse und die entsprechenden Symbole für einzelne Unterrichtsstunden notiert hat. Abbildung 11 verdeutlicht das Dokumentationssystem von Frau Amberg (die Darstellung beruht auf den Interviewnotizen).

Schülerin A Schüler B

28.08. o +

30.08. + Ø

05.09. + +

07.09. ++ Ø

... ... ...

Schülerin C

o

o

+

o

...

NOTE 2 ??

Abb. 11 – Dokumentation mündlicher Noten (Frau Amberg); Legende: o = „eher 3“, + = „gut“, ++ = „sehr gut“, Ø = abwesend

In der nachfolgenden Erläuterung ihres Dokumentationssystems wird deutlich, dass sie die verwendeten Symbole synonym zur Notenskala

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

285

und den dazugehörigen Bezeichnungen der Notenstufen (sehr gut – gut – befriedigend) verwendet: „Das Krei=der Kreis wäre so im Dreierbereich. Und hier (.) mit dem Kreuz ist halt dann, da war mal=war mal eine gute Mitarbeit und so. Aber das wä=würde jetzt nicht ausreichen, um zu sagen, das ist jetzt äh (.) ist jetzt noch im Zweierbereich, ne? (..) Genau. Und die hier unten zum Beispiel, das ist so die beste Schülerin in dem Kurs. Die hat halt in drei Stunden eine Eins gehabt und hier eher im Zweierbereich.“ (Z. 231235)

Entgegen ihrer Einführung als symbolhafte Alternative zur Ziffernnote korrespondieren die Zeichen in ihrem Kopf mit den gängigen Notenstufenbezeichnungen. Eine gewisse Unschärfe wird lediglich in den Begriffen „Dreierbereich“ und „Zweierbereich“ deutlich, die noch den Spielraum zwischen den entsprechenden Tendenznoten (Zwei minus bis Zwei Plus) eröffnen. Die Ermittlung der mündlichen Note erfolgt aber trotzdem durch eine Art Mittelwertbildung dieser notenäquivalenten Symbole. Obwohl sie sich also um eine alternative Dokumentation der mündlichen Leistungen bemüht, die sich bewusst von den Ziffernzensuren abgrenzt, vollzieht sich die Notenfindung am Ende des Quartals doch wieder per mathematischer Operation. Interessant ist weiterhin, dass Frau Amberg nur die oberen Notenstufen zu verwenden scheint, es finden sich keine Symbole für mangelhafte oder unzureichende Mitarbeit. Lediglich die Abwesenheit von Schüler_innen wird mit einem Strich vermerkt. Schwierigkeiten bereiten ihr laut eigener Aussage diejenigen Schüler_innen mit hohen Fehlzeiten, bei denen sie unsicher ist wie sie diese Fehlzeiten gewichten und in die Berechnung des Mittelwerts einbeziehen soll. Auch Frau Heinkötter, eine sehr junge Lehrerin für Deutsch und Mathematik an der Realschule, nutzt die Strategie der Mittelwertberechnung, um aus einer Vielzahl von Teilnoten eine Zeugnisnote zu generieren. Interessant ist an Frau Heinkötters Ausführungen im Vergleich zu anderen Lehrkräften, wie unaufgeregt und scheinbar ohne Schwierigkeiten die finalen Zeugnisnoten durch eine Abfolge von Mittelwertberechnungen zustande kommen:

286

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

„Also ich versuche mir eigentlich immer nach jeder Stunde zu/ eine Note zu notieren dann äh in der Pause. Das klappt natürlich nicht immer. Und mache dann am Ende einen Schnitt daraus. (.) Ja. (.) Genau. Einen Mittelwert. (..) Ja. (.) Und den mittel ich dann wiederum mit dem äh Klassenarbeitsmittel. [lacht] So. Also ich habe das auch durchaus schon gemacht dann, um/ damit man auch das Minus, Plus und so weiter berücksichtigt/ berück/ Berücksichtigung findet. Dass ich das dann äh auf die Abiturpunkte umrechne. (.) Um dann zu wissen: Ist das jetzt/ (..) Ja, dann kommt da Drei Komma Fünf raus und dann weiß man ja immer noch nicht, was man gibt, ne? [lacht] Deswegen dann, in DEN Fällen, manchmal auch schon mit plus minus auch noch. (..) Genau.“ (Z. 71-78)

Die einzige Schwierigkeit scheint zu sein, wenn das arithmetische Mittel keine eindeutige Tendenz zu einer Note vorgibt („dann kommt da Drei Komma Fünf raus und dann weiß man ja immer noch nicht, was man gibt“), so dass sich Frau Heinkötter für diese Fälle zusätzlich auch Tendenznoten notiert, die sie in einer solchen Pattsituation zur Entscheidungsfindung heranzieht. Dass diese scheinbar einfache Operation von anderen Lehrkräften zum Teil sehr skeptisch gesehen wird, soll anhand zweier Auszuge kurz kontrastiert werden. Den ersten Kontrastfall stellt die Hauptschullehrerin Frau Ahle-Demmerer dar, die sehr viel Wert darauflegt, dass die Leistungsbeurteilungen, aber vor allem auch die Zeugnisnoten, von den Schüler_innen ihrer Klasse mitgetragen werden. Sie erteilt einer rein an Punkten und dem arithmetischen Mittelwert orientierten Notengebung eine klare Absage, wenn sie feststellt: „Und wenn das äh erfolgt, dass eine Klasse das mit trägt (.) dann äh finde ich ist mehr erreicht als dass ich mich da hinter Punkten verkrieche und sage: ‚Du hast jetzt eine Zwei Komma Sieben Fünf, und das ist eine Drei.‘ Das, finde ich, ist nicht in Ordnung“ (Z. 105-107).

Wie in Kapitel 6.3.3.1 noch ausführlicher dargestellt wird, liegt für Frau Ahle-Demmerer der Fokus einer gerechten Beurteilung darauf, dass in die einzelnen Benotungen auch der persönliche Hintergrund und die individuelle Lernentwicklung einbezogen wird, wodurch teilweise sehr unterschiedliche Leistungen zur gleichen Note führen können. Wichtig dabei ist ihr, dass diese Entscheidungen von der gesamten Lerngruppe

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

287

mitgetragen und verstanden werden, da sich hieraus eine Legitimationsquelle ihrer Beurteilungspraxis speist. Auch die Gymnasiallehrerin Frau Pohle-Hanewinkel lehnt eine rein am arithmetischen Mittel orientierte Notenfindung mit dem Hinweis auf eine stärkere Einbeziehung der Lernentwicklung der Schüler_innen – insbesondere bei der Zeugnisnotenerstellung – ab: „Und bei diesen Quartalsnoten finde ich es halt ein bisschen doof, wenn jetzt einer wirklich da eine Zwei geschrieben hat, ist aber Mündlich jetzt zum Beispiel Vier bis Fünf, dann kann ich sagen: ‚So das gibt jetzt rechnerisch eine Drei Komma Fünf. Da kann ich jetzt aussuchen, ob eine Vier od=oder eine Drei oder Vier.‘ Also so mathematisch mache ich das in dem Sinne nicht, sondern schaue schon die Entwicklung. Ähm, vor allen Dingen, wenn es dann nachher zu den Notenfindungen am Ende des Schuljahres geht.“ (Z. 287-293)

Frau Dorpenbeck, eine Deutschlehrerin an der Realschule, wiederum versucht durch eine sehr gewissenhafte Orientierung an einer auf mathematisch-rechnerischen Operationen ruhenden Beurteilung „möglichst fair“ zu sein und sich selbst dadurch zu disziplinieren. Letztlich stellt aber auch dies nur eine Annäherung an eine gerechte Beurteilung dar, wie sie einräumt, und „um ehrlich zu sein, glaub ich NIE das ist hundertprozentig fair“: „Und auch wenn es diese Fünfzig-Fünfzig Regelung gibt und ich sie auch SEHR streng einhalte, glaub ich nachher, dass bei mir immer noch, wenn ein Schüler zwischen zwei Noten steht und die mündliche Mitarbeit sozusagen der besseren Note entspricht, dass ich vom Herzen her, glaub ich immer eher zu der besseren Note tendieren würde. Weil ich denke, so ein GANZES Schuljahr im Vergleich zu drei Klassenarbeiten á neunzig Minuten (.), das steht in gar keinem Verhältnis. Ähm (..) aber das errechne ich schon immer sehr genau (.) und auch so, dass ich mir so einen Durchschnitt der Klassenarbeitsnoten jetzt grad bei den Zehnern, dann wirklich eine mündliche Note ähm (..) festsetze und daraus dann sozusagen den (..) Mittelwert (.) errechne. Und VERSUCHE, dass das dann möglichst fair ist. Aber (.) um ehrlich zu sein, glaub ich NIE das ist hundertprozentig fair. Dass man das KANN. Also ich versuch immer die Mittel, im Sinne von Transparenz zu schaffen, alles offen zu legen, das wirklich genau auszurechnen.“ (Z. 381-391)

Mittelwertberechnungen können im nordrhein-westfälischen Sample zusammenfassend also als gängige Verfahren der Zeugnisnotenerstel-

288

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

lung betrachtet werden, gleichzeitig wird deutlich, dass diese häufig nur als eine Möglichkeit der Annäherung an eine ‚gerechtere‘ Beurteilung verstanden werden. Bepunktungen als Hilfsmittel und nachträgliche Korrekturen Für Herrn Grabenmüller, einen erfahrenen Mathematiklehrer am Gymnasium, leitet sich eine gerechte Beurteilung aus der regelhaften Umrechnung von Punkten in Noten ab: „Na ja, indirekt wird ja die=die Gerechtigkeit definiert durch die Notenskala. Da haben wir es in Mathematik [lacht] relativ leicht, dass man im Grunde sagt: ‚Die äh Klassenarbeit hat 100 Punkte oder 50, ist ja letztlich egal. Und wer 50 schafft steht ausreichend.‘ Das scheint ein gerechtes Urteil zu sein. Wir machen es von den Bepunktungen abhängig.“ (Z. 138-142)

„Gerechtigkeit“ sei also indirekt „durch die Notenskala“ definiert, gemeint ist aber offenbar die damit verbundene Verknüpfung von Prozentpunkten und Noten, wie im nächsten Satz deutlich wird. Die Festlegung, dass bei 50% der Gesamtpunktzahl die Note Vier vergeben wird, wird von Herrn Grabenmüller als gerecht empfunden.143 Interessant ist auch der Verweis darauf, dass es für Mathematiklehrkräfte – in seinen Augen – „relativ leicht“ sei Noten zu vergeben, da man sich schlicht an den vorab definierten Bepunktungen orientiere, mehr noch, sich von den „Bepunktungen abhängig“ mache. Herr Grabenmüller macht deutlich, dass mit Hilfe der Übersetzung von Leistungen in Punkte und daraus abgeleiteten Noten auf den ersten Blick ein sehr simples, aber überzeugendes System der Leistungsbeurteilung wirkt, das von den Lehrkräften – insbesondere den Mathematiklehrkräften – als gerecht empfunden wird und problemlos angewendet werden kann. Die Aufgaben einer Klassenarbeit werden auf drei verschiedenen Schwierigkeitsstufen (bzw. Anforderungsbereichen) erstellt, aus der Anzahl der Aufgaben je Schwie143

Für die Zentralen Prüfungen in Klasse 10 findet sich in den Regularien, wie in Kapitel 5.2.2 ausgeführt, der Hinweis, dass „die Note ‚ausreichend‘ das Erreichen von etwa 45% der Höchstpunktzahl voraussetzt“.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

289

rigkeitsstufe ergibt sich ein Punkteschlüssel für die gesamte Klassenarbeit und am Ende werden lediglich Punkte in Noten umgerechnet. Dass diese Umrechnung von Leistungen in Punkte jedoch nicht ganz so trivial ist, zeigt sich im nächsten Abschnitt, in dem Herr Grabenmüller von einer fiktiven Situation mit zwei Schülern berichtet: „Äh der Gesamtein/ Ausdruck äh Eindruck zählt auch. Das heißt, um eine wirklich gerechte Benotung durchzuführen, reicht es nicht, zu sagen: ‚Du hast 43 Punkte und kriegst eine Vier. Und Du hast 44 und kriegst eine Vier Plus.‘ Da kommt der sofort an und sagt: ‚Der eine Punkt?! Wo ist denn da jetzt der Punktunterschied?‘ Und dann konnte ich praktisch dann immer argumentieren, das mache ich im Grunde heute noch so: ‚ABER, (.) ähm es gab sechs Aufgaben. Du hast bei ALLEN sechs Aufgaben immer so ein BISSCHEN was gemacht, sozusagen leichte Punkte abgearbeitet. Der ANDERE, der hat drei Aufgaben weggelassen, aber alle drei komplett gelöst.‘ Das ist mir wichtiger. Da scheint mir das Urteil, wenn es in den Bepunktungen sich ausdrückt, gerechter zu sein. Der ist=der ist besser.“ (Z. 144-152)

In der Unterscheidung zwischen „leichten Punkten“ und scheinbar schwerer zu erreichenden Punkten nimmt Herr Grabenmüller hier eine Gewichtung vor, die sich auf den von ihm zugeschriebenen Einsatz der Schüler bei der Aufgabenbearbeitung und den Umfang der gelösten Aufgaben bezieht. Die höhere Anzahl „komplett gelöst[er]“ Aufgaben sollte sich demnach auch in der Bepunktung und folglich auch der Benotung widerspiegeln, um „gerechter zu sein“. Insofern tritt zur rein rechnerischen Logik der Addition von Punkten in seinen Augen auch noch ein qualitativer Aspekt, den Herr Grabenmüller als Gesamteindruck bezeichnet. Diese Formulierung erinnert an die in Kapitel 5.3.2 erläuterte Orientierung an einer holistischen Gesamtbeurteilung, die als typisches Charakteristikum der Leistungsbeurteilung im deutschen Kontext herausgearbeitet wurde. Eine gerechte Beurteilung spiegele diesen Gesamteindruck wieder, „wenn es in den Bepunktungen sich ausdrückt“, wie Herr Grabenmüller folgert. Frau Neever, eine ebenso erfahrene Mathematiklehrerin an der Realschule, berichtet ebenfalls davon, dass an ihrer Schule klare Bepunktungstabellen mit Zuordnungen zu festen Notenstufen existieren, an denen sie sich grundsätzlich bei der Benotung schriftlicher Arbeiten

290

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

orientiere. Doch auch sie hält sich das Abweichen von diesen eigentlich festen Absprachen unter bestimmten Bedingungen offen: „Dann, dass wir ganz klar sagen, mit so=und=so viel Prozent gibt es eine (.) Eins, eine Zwei, eine Drei, eine Vier, eine Fünf, eine Sechs. (.) Ich sage aber ganz ehrlich/ [...] Wenn ich eine Arbeit korrigiere (.) und ich würde äh ein Ergebnis herausbekommen, wo ich sage: ‚Boah (.) das sind aber doch ganz viele Fünfen. (..) Das geht gar nicht.‘ Äh. Dann nehme ich mir das Recht des Lehrers heraus und werte eine Aufgabe als Zusatzaufgabe. Das tue ich dann. Einfach um die Schüler auch bei der Stange zu halten. (.) Ich glaube, es bringt uns allen nichts, wenn die völlig demotiviert sind und wir nicht weiterkommen. [...] Das=die Freiheit nehme ich mir. Einfach um äh ein relativ gutes Arbeiten zu gewährleisten. (.) Mit der Intention. Ich glaube, es bringt nix, wenn man die Schüler da mit äh schlechten Noten erschlägt.“ (Z. 333-350)

Ähnlich wie Frau Ehrl scheint sich auch Frau Neever implizit an der Normalverteilung zu orientieren, wenn es um die Verteilung der Klausurergebnisse geht: eine Arbeit, in der „ganz viele Fünfen“ herauskämen, wird von ihr als inakzeptabel beschrieben („das geht gar nicht“) und als Anlass zur nachträglichen Korrektur des Bepunktungsschlüssels genommen. Dieses „Recht des Lehrers“ begründet sie zusätzlich mit der pädagogischen Intention ihre Schüler_innen „bei der Stange zu halten“ und nicht „völlig [zu] demotivieren“. Um die Lernmotivation zu erhalten ist ein Abrücken von den schulinternen Absprachen in ihren Augen legitim („die Freiheit nehme ich mir“). Dass sie dieses pädagogische Moment allerdings auch sehr kritisch sieht, wird in einer Passage deutlich, in der sie ihre aktuelle Klasse 9a mit der vorhergehenden Klasse vergleicht und die unterschiedliche Benotung aufgrund des „Leistungsgefälle[s]“ zwischen den Klassen als nicht gerecht beschreibt: „Das heißt also, dass ich im Grunde genommen (.) äh wenn ich in der äh 9A jetzt eine Zwei gebe äh das wäre nicht zu vergleichen mit der Klasse, die ich vorher hatte. Äh die hat mit diesen Leistungen nicht eine Zwei gekriegt, ganz eindeutig NEIN. Das ist äh weil das Niveau der Klasse, äh, hier ein ganz anderes ist. Ein GANZ anderes. Und äh auf der anderen Seite sage ich mir, ich muss äh aufpassen, dass ich die Leute bei der Stange halte, dass sie noch ein bisschen Spaß an Mathematik halten. Und dass ich die da abhole, wo sie stehen. Gerecht ist das in meinen Augen nicht, sage ich auch ganz klar. Dass ich äh (.) in der Zehn, die ich jetzt verabschiedet habe äh (.) äh Schüler vielleicht eine Drei gegeben habe, die hätten vielleicht, in dieser Klasse, vielleicht Eins

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

291

gestanden. Wären/ Also s/ Da war wirklich ein UNHEIMLICHES Leistungsgefälle.“ (Z. 94-102)

Frau Neever beurteilt die Leistungen ihrer Schüler_innen offenbar nicht anhand eines lerngruppenunabhängigen Kriteriums, wie dem Lehrplan, sondern wendet vielmehr die soziale Bezugsnorm an. Die oben eingeführte pädagogische „Freiheit“ führt nun dazu, dass sie – anscheinend etwas widerwillig – eine weniger anspruchsvolle Arbeit schreiben lässt, um die Schüler_innen „da ab[zu]hole[n], wo sie stehen“. Gleichzeitig bezeichnet sie dieses Vorgehen als ungerecht gegenüber der vorherigen Lerngruppe, die „mit diesen Leistungen nicht eine Zwei gekriegt“ hätten. Insofern legt sie für die Frage, ob die Beurteilung der aktuellen Lerngruppe gerecht ist, nicht nur eine lerngruppeninterne soziale Bezugsnorm an, sondern weitet diese sogar auf frühere Klassen aus. Das Anpassen des Schwierigkeitsgrads der Arbeit wird von ihr letztlich nicht als sinnvolle pädagogische Maßnahme verstanden, vielmehr sieht sie darin ein eher unerwünschtes Absenken der Standards und eine Ungerechtigkeit ihrer ehemaligen ‚leistungsstärkeren‘ Klasse gegenüber. Ihre grundsätzliche Orientierung an der sozialen Bezugsnorm zeigt sich auch in einer weiteren Passage, in der sie das „Arbeitsverhalten“ einer Klasse als wichtiges Kriterium für die Leistungsbeurteilung benennt: „Äh, das wirkt sich bei mir, sag ich ganz klar, als Lehrer auch in Hinblick auf Leistungsbeurteilung ganz positiv aus. Wenn ich sehe, das Arbeitsverhalten ist da, die WOLLEN äh (.) dann äh ist das für mich erst mal ein ganz großer Pluspunkt für die Schüler auch. Dass ich sage, im Zweifelsfalle immer die bessere Note. Wenn ich DAS so sehe. Dass sie einfach die Arbeitshaltung haben und die es wollen und stellen Fragen, das Arbeitsklima stimmt, die waren bei der Sache, haben ihre Hausaufgaben größtenteils auch wirklich immer gemacht, bis auf ein paar Ausnahmen. Das Arbeitsverhalten war in der Klasse so, dass ich sagen kann, die waren LEISE, haben zugehört. (.) Äh, DAS ist für mich einmal für die Leistungsbewertung also ein ganz großes Kriterium. Wie ist insgesamt das Arbeitsverhalten in der Klasse? WOLLEN die oder wollen die nicht?“ (Z. 70-79)

Auch hier zeigt sich wieder die Orientierung an der sozialen bezugsnorm, wenn sie das „Arbeitsverhalten“ der Klasse insgesamt als Kriterium bei der Leistungsbeurteilung beschreibt. Die von ihr aufgezählten Bestand-

292

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

teile einer guten „Arbeitshaltung“ – aktive Mitarbeit („Fragen stellen“), Anstrengungsbereitschaft („die es wollen“), Konzentrationsfähigkeit („bei der Sache“), Fleiß („Hausaufgaben [...] gemacht“), Disziplin („LEISE“ sein und Zuhören) – skizzieren dabei auch ein ideales Schüler_innenbild, das sich vor allem durch die Ermöglichung eines reibungslosen Unterrichtsablaufs auszeichnet. Das Arbeitsverhalten als „ein ganz großer Pluspunkt für die Schüler“ führt dann auch zu einer etwas großzügigeren Beurteilung, die besseren Noten sind damit verdient. Eine ähnliche Strategie wird von Frau Kregel berichtet, wenn beispielsweise besonders positiv herausstechende Leistungen in einer Klassenarbeit durch Zusatzpunkte belohnt werden, die dann zu einer besseren Note führen (vgl. Frau Kregel, Z. 234-244). Frau Kregel erzählt zwar, dass sie sich im Kollegium häufig über Klassenarbeiten austauschen würden und auch die Bepunktungen vorab festlegen würden, gleichzeitig führt sie aus, wie sie auf nicht erwartungskonforme Ergebnisse reagiert, indem sie diese Bepunktungen entsprechend der Ergebnisse wieder abändert: „Ansonsten mach ich es eigentlich so, dass ich also einmal über die Arbeit drüber gucke und dann vielleicht sehe, die Aufgabe ist nicht so toll gelaufen, dann gibt es da nicht so viele Punkte für. Und die Aufgabe ist besser gelaufen, da setzen wir eine stärkere Bewertung drauf oder sowas. Also DAS äh mach ich lieber im Nachhinein. Und das hat sich für mich eigentlich besser bewährt.“ (Z. 223-227)

Ähnlich wie bei Frau Ehrl wird hier erst im Nachhinein an den Bepunktungen korrigiert, so dass möglichst unauffällige Noten im Klassendurchschnitt entstehen. Deutlich wird auch, dass eine nachträgliche Korrektur auch deshalb notwendig wird, weil sich in den Leistungen der Schüler_innen zeigt, wie gut der Unterricht war bzw. wie gut die Lehrer_innen den Stoff vermitteln konnten. Die Klausurergebnisse halten den Lehrkräften insofern auch einen Spiegel ihrer eigenen Leistung vor. Wenn dieses Bild nicht übereinstimmt mit ihren Erwartungen, wird an den Bepunktungen und Gewichtungen gearbeitet, bis das Bild wieder passt (vgl. auch Frau Ehrls Formulierung vom „passend machen“ von Noten).

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

293

Zusammenfassend lässt sich festhalten, dass das nachträgliche Korrigieren von Bepunktungen vor allem von Lehrkräften angewandt wird, die eher weniger im kollegialen Austausch stehen und eine implizite Orientierung an normalverteilten Ergebnissen bei Klassenarbeiten aufweisen. Das nachträgliche Korrigieren dient dabei auch der Aufrechterhaltung der Idee einer objektiven Note, da Objektivität im Rahmen schulischer Leistungsbeurteilung immer nur als eine Annäherung an Objektivität im testtheoretischen Sinn sein kann. Nachträgliches Anpassen ist immer auch riskant für die Lehrkräfte, da die Glaubwürdigkeit ihrer Beurteilungen an der Illusion der objektiven, rein auf mathematischen Operationen basierenden Gesamtnote hängt. Ein nachträgliches Korrigieren der Beurteilungsgrundlage würde hier Zweifel an der Richtigkeit der Beurteilung schüren, weshalb diese Korrekturen selten öffentlich gemacht werden. Ausnahmen stellen die wenigen Situationen dar, in denen die Lehrkräfte sich tatsächlich beim Addieren der Teilpunkte verrechnet haben und dies von den Schüler_innen bemerkt und eine Korrektur eingefordert wird.

Einheitliche Bewertung Das gegenteilige Beispiel zum oben geschilderten nachträglichen Anpassen findet sich bei der jungen Mathematiklehrerin Frau Buschkamp, die sich zwar ebenfalls für die Klarheit von Bepunktungstabellen (hier „Notenschlüssel“ genannt) ausspricht, dabei aber die konsequente Anwendung dieser Notenschlüssel durch alle Lehrkräfte einer Schule einer individuellen Anpassung vorzieht: „Also was ich besonders gut finde, [lacht kurz] ist dieser Notenschlüssel. Ähm weil es wirklich einheitlich ist, ne? Also, es gibt äh diesen Notenschlüssel: ‚Bei so und so viel Punkten gibt es die und die Note.‘ So, nach dem Motto. Und äh das ist wirklich sehr leicht zu handhaben, weil da steht dann direkt, meinetwegen habe ich jetzt ein Test, und da gibt es insgesamt 30 Punkte, und dann kann man in der Spalte bei 30 gucken, dann weißt man sofort, bei welcher Punktzahl hat man welche Note, theoretisch. (..) So, und ähm das finde ich auch wichtig, dass das einheitlich ist. Weil sonst hat nämlich irgendein Schüler Glück und hat einen sehr großzügigen Lehrer und der vergibt

294

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

dann die Punkte irgendwie und, ne?, hat eine gute Note. Und ein Anderer [atmet schwer ein] (..) Also, das finde ich, ist ein bisschen unfair, wenn das nicht einheitlich ist.“ (Z. 92-101)

Die Vergleichbarkeit der Beurteilungen über verschiedene Klassen und Lehrkräfte hinweg wird hier als zentrale Bedingung für eine gerechte Beurteilung benannt. Als Mittel der Wahl werden dabei einheitliche Punktetabellen aufgeführt, in denen die Verteilung von Punkten zu Noten klar geregelt ist, die also bereits vor der Korrektur der Arbeiten feststehen und nicht nachträglich geändert werden. Dies wäre in ihren Augen „ein bisschen unfair“. Frau Buschkamp berichtet aber auch von vielen weiteren kollegial abgesprochenen Beurteilungshilfsmitteln („einheitlichen Kriterienkatalog zur Bewertung des ähm Heftes“ Z. 111, „Kriterienbogen“ für schriftliche Arbeiten, Z. 170) die einerseits auf eine erhöhte Transparenz der Kriterien gegenüber den Schüler_innen abzielen, andererseits auch eine schulintern einheitliche Beurteilung absichern sollen. Diese schulintern einheitlichen Vorgaben werden vor ihr ausdrücklich begrüßt, insofern unterscheidet sie sich deutlich von den bisher hier zitierten Lehrkräften. Für Herrn Clemens, einen erfahrenen Mathematiklehrer am Gymnasium, bedeutet einheitliche Beurteilung vor allem die einheitliche Bepunktung durch ein und dieselbe Lehrkraft. Er berichtet, wie er als Referendar gelernt habe schriftliche Arbeiten zu benoten und dieses System bis heute anwendet: „Da sagt der: ‚Das ist mir VÖLLIG egal, wie viele Punkte du gibst. Ja? Wichtig ist nur, DU guckst jetzt diese Aufgabe bei allen durch (.) und wendest auf alle den gleichen Maßstab an. Und welchen Maßstab du anwendest, ist mir völlig egal. Aber überall denselben!‘ Und das ist so für mich auch so ein Leitthema geworden. Der hatte auch völlig recht. Also wenn man sich ankuckt, wenn ich jetzt in Klassenarbeiten Punkte gebe, (.) dann ist das reine Willkür. Auch in Mathematik.“ (Z. 9-14)

Das wichtigste für eine gerechte Beurteilung ist in Herrn Clemens Augen also die Anwendung des gleichen Maßstabs für alle Schüler_innen bei der Benotung schriftlicher Leistungen („Sonst ist das völlige Illusion“, Z. 67). Die konkreten Punkte und daraus abgeleiteten Noten seien zwar „reine Willkür“, wichtig sei aber, dass diese Willkür in Form eines für alle

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

295

„gleichen Maßstab[s]“ allen Schüler_innen gleichermaßen widerfahre, um eine Ungleichbehandlung auszuschließen. Hier findet sich eine Parallele zu Frau Ehrl, die ebenfalls davon sprach, dass Noten letztlich „willkürlich“ seien, durch die Benotung aller Schüler_innen einer Klasse durch dieselbe Lehrkraft diese Willkür jedoch wieder aufgehoben werde. Der konkrete Beurteilungsmaßstab ist für Herrn Clemens eine „reine Geschmackssache“ (Z. 22), wobei die Selbstbeschreibung als „Willkür“ von ihm nicht als Bedrohung der eigenen Beurteilungsfähigkeit verstanden wird. Die scheinbare Beliebigkeit der Punkte wird durch ihr Verhältnis zueinander und die darin ausgedrückten Unterschiede zwischen Schüler_innen aufgewogen. Im Gegensatz zu Lehrkräften wie Frau Buschkamp, die durch kollegial abgestimmte einheitliche Maßstäbe eine einheitliche Beurteilung garantieren wollen, wird in den Augen von Herrn Clemens die einzelne Lehrkraft zum einzigen Maßstab einer lerngruppenbezogenen einheitlichen Beurteilung erklärt. Ähnlich fällt auch sein Urteil zum Zentralabitur aus, wenn er befindet: „Also das Zentralabitur ist kein Zentralabitur [lachend], weil eben verschiedene Leute nachgucken“ (Z. 87-88), woraus er schlussfolgert: „Also auch beim Zentralabitur gibt es keine Gerechtigkeit“ (Z. 116-117).

Lernergebnis, nicht Lernprozess Deutlich wird im Interview mit Herrn Clemens auch, dass die schulische Leistungsbeurteilung in seinen Augen vor allem auf das Lernergebnis fokussieren sollte, weniger auf den Lernprozess: „Ja, äh, die einen, die es sofort verstehen, die kriegen dann natürlich etwas bessere Noten und die anderen, die länger brauchen, die kriegen halt nicht so gute Noten. (.) Ne? Die kriegen dann eben eine Drei, weil sie (.) entweder gar nicht mitmachen oder nachfragen. Und wo ich dann auch sehe, es klemmt immer noch. (.) Ne? (.) Das/ denen kann ich ja nicht so eine gute Note geben. Auch nicht, wenn sie es irgendwann mal herauskriegen. Es ist ja eine LEISTUNG. Leistung heißt ja Arbeit pro Zeit. Wenn ich irgendwas in drei Jahren raushabe, ist das keine Leistung. Ne? Das heißt, ich muss auch hinterher eine bestimmte Geschwindigkeit haben. (.) Ja? Und damit kann ich das abchecken.“ (Z. 310-316)

296

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Hier wird ein Terminus der Physik auf die Beurteilung von Schüler_innenleistungen übertragen: Bei der physikalischen Definition von Leistung wird der Zeitfaktor als wichtigster Maßstab genommen, d.h. eine gute Leistung ist abhängig davon wieviel Arbeit pro Zeiteinheit verrichtet wurde oder, auf die Schule angewandt, wie viele Aufgaben in einer Klassenarbeit gelöst wurden. ‚Leistung‘ stellt also den Quotienten aus Arbeit und Zeit dar. An anderer Stelle bemerkt er: „Das ist so, beim Fußball da zählen hinterher die TORE. Das spielt keine Rolle, ob das Spiel schön war oder nicht“ (Z. 369-370) und bekräftigt damit seine Sicht auf die schulische Leistungsbeurteilung als Instrument der punktuellen Lernstandsmessung. Die Hintergründe für unterschiedliche Lerntempi bei verschiedenen Schüler_innen werden von ihm nicht problematisiert (wie dies im Modus der kompensatorischen Gerechtigkeitsüberzeugung deutlich werden wird), vielmehr stellen diese Unterschiede hinreichende Gründe zur differenzierenden Beurteilung dar. Auch bei Frau Neever, der Mathematiklehrerin, für die die „Arbeitshaltung“ einer Klasse ein wichtiges Kriterium bei der Leistungsbeurteilung darstellt, äußert sich ähnlich wie Herr Clemens zum Thema unterschiedliche Lerntempi, wenn sie ausführt, dass die schnelle Auffassungsgabe ein Kriterium bei der Leistungsbeurteilung darstellt: „Oder auch wie schnell er Sachen erfasst. (..) Äh, und der muss eine Aufgabe 20 Mal rechnen, und DER ein Mal. Oder zwei Mal. Das sind so schon für mich Kriterien. (.) Ob das gerecht ist WEISS ich nicht“ (Z. 225-226). An anderer Stelle spricht Frau Neever auch von „Denkstrukturen“ über die einige Schüler_innen verfügen würden bzw. die sie bei anderen vermissen würde. Die rhetorische Frage, „[ob] das gerecht ist“, beantwortet sie im weiteren Verlauf der Passage selbst, wenn sie ausführt: „Ich gebe mir MÜHE, sage ich ganz ehrlich äh, möglichst gerechte Noten zu geben. Aber ich glaube, gerechte Noten gibt es nicht. Sage ich ganz ehrlich“ (Z. 227-228). Ähnlich wie bei Frau Ehrl findet sich hier einerseits ein grundsätzliches Zweifeln an der Möglichkeit gerechter Leistungsbeurteilung, gleichzeitig haben beide Lehrerinnen Strategien entwickelt, wie sie eine in ihren Augen gerechtere Beurteilung mithilfe mathematischrechnerischer Operationen verwirklichen können.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

297

Auch für Herrn Freymann dient die schulische Leistungsbeurteilung in erster Linie der Feststellung und Überprüfung von Leistungsniveaus im Sinne einer ‚produktorientierten‘ Beurteilung mit dem Fokus auf das, was gelernt wurde und entspricht eher dem Verständnis von Leistungsmessung. Für diese Leistungsmessung greift Herr Freymann vorzugsweise auf schriftliche Arbeiten zurück, wie der folgende Auszug verdeutlicht: „Ähm in Mathematik kann man oft feststellen, was ein Schüler denn kann. (.) Und man hat ja (..) dann eben auch schriftliche Ergebnisse vorliegen. Man kann (.) sehen, wie ein Schüler Aufgaben löst, OB er sie dann eben auch löst. Und kann dann, hoff/ hoffe ich dann, unterscheiden, ob so Beiträge im Unterricht tatsächlich so Rückschlüsse zulassen so auf:f fundiertes Wissen oder ob das eher so Zufallstreffer sind. Dass man so sieht, an welchem/ bei welchen Beiträgen meldet sich denn ein Schüler. Bei welchen Beiträgen muss er sich/ bei welchen Fragen muss er sich überhaupt nicht melden? Und da können wir dann von ausgehen, dass er das wohl weiß.“ (Z. 27-33)

Für Herrn Freymann stellen die schriftlichen Leistungen seiner Schüler_innen zunächst ein Moment der Leistungsdiagnostik dar, die durch die verwendeten Formulierungen („kann man feststellen“, „man kann sehen“) als belastbare und eindeutige Instrumente erscheinen. Gleichzeitig bieten die verschriftlichten Lösungswege de Schüler_innen (wie etwas gelöst wird, ob etwas gelöst wird) auch eine Art Prognosehilfsmittel für die Qualität der mündlichen Beiträge im Unterrichtsgeschehen an. Herr Freymann leitet aus den schriftlichen Leistungen seiner Schüler_innen ein Leistungsbild einzelner Schüler_innen ab, das als Folie für die Beurteilung der Schüler_innenhandlungen im Unterrichtsgeschehen dient. Auf diese Weise qualifiziert er die Unterrichtsbeiträge der Schüler_innen ausgehend von ihrer schriftlichen Leistung auf einem Kontinuum, das sich zwischen den Extrempunkten „fundiertes Wissen“ und „Zufallstreffer“ bewegt. Die in den schriftlichen Arbeiten gezeigten Leistungen prägen somit das Bild der Schüler_innen bereits vor. Der Verlauf des Unterrichtsgesprächs, das als klassisches fragend-entwickelndes Unterrichtsgespräch hauptsächlich aus Fragen der Lehrkraft und entsprechenden Antworten der Schüler_innen zu bestehen scheint, dient Herrn Frey-

298

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

mann dann als weiterer Indikator für die Leistungsfeststellung.144 Der Dichotomie „fundiertes Wissen“ vs. „Zufallstreffer“ folgend, skizziert er nun zwei mögliche Szenarien für Schüler_innenbeteiligungen und umschreibt, welche Bedeutung für den jeweiligen Wissensstand er den verschiedenen Szenarien zuschreibt. Während es einerseits Fragen zu geben scheint, bei denen es wichtig ist, welche Schüler_innen sich melden und einen Beitrag zum Unterrichtsfortgang liefern bzw. welche dies nicht tun und damit Wissenslücken offenbaren, gibt es andererseits auch solche Fragen, bei denen gerade das Nicht-Melden und Nicht-Beteiligen ein Indikator für „fundiertes Wissen“ sein kann. Die Grundlage für die Beurteilung der Wissensstände (und daraus folgender Benotungen) im Unterrichtsgeschehen stellt jedoch das in den schriftlichen Arbeiten diagnostizierte Leistungsbild der Schüler_innen dar. Der Begriff des „Zufallstreffers“ verdeutlicht dabei den Überprüfungscharakter des Unterrichtsgesprächs, bei dem es vornehmlich darum zu gehen scheint herauszufinden, was die Schüler_innen tatsächlich wissen und wo vermutlich Wissenslücken bestehen, die richtige Antwort also nur zufällig gegeben wurde. Das Aufdecken dieser Wissenslücken durch das Unterrichtsgespräch zieht jedoch keine kompensatorischen Maßnahmen im Sinne einer Anpassung des Unterrichts zur besseren Unterstützung des Lernprozesses nach sich. Vorrangiges Ziel ist vielmehr das Identifizieren der ‚richtigen‘ Leistungsniveaus, die mit den vorab aus den schriftlichen Arbeiten abgeleiteten Einschätzungen verglichen werden und der Sortierung der Schüler_innen nach diesen Leistungsniveaus dienen. Die Unsicherheitsmarkierung „hoffe ich“ kann deshalb auch eher darauf bezogen sein, hoffentlich die richtigen Einschätzungen zu treffen und ‚die Spreu vom Weizen zu trennen‘, denn als tatsächliche Verunsicherung in seinem Beurtei-

144

Kalthoff beschreibt, wie Lehrkräfte im Unterrichtsgespräch die den Schüler_innen zugeschriebenen Leistungsfähigkeiten durch unterschiedliche Adressierung mit Fragen auf bestimmten Anforderungsniveaus reproduzieren und somit die „Zuständigkeiten“ von Schüler_innen für bestimmte Wissensbereiche verfestigen (vgl. Kalthoff, 2000, S. 441-442).

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

299

lungshandeln. Ähnliches zeigt sich in einer weiteren Passage aus dem Interview mit Herrn Freymann: „Also in der Mathematik halte ich es (..) äh verlasse ich mich mehr auf das, was ich von den Schülern auch tatsächlich sehe. (.) Also nur die mündlichen Beiträge alleine sind/ (.) vermitteln mir kein Bild vom Leistungsvermögen der Schüler. Also bei Ausnahmen natürlich doch. Aber so bei der/ bei den 25, 30 Schülern, die man so hat, möchte ich bei den Schülern auch (.) mal Leistungen im größeren Zusammenhang sehen. Das müssen jetzt keine Klassenarbeiten sein, sondern das kann auch sein, dass sie dann eben im Unterricht mal so Aufgaben alleine oder mit ihrem Partner rechnen. Aber dass sie eben nicht nur so kleinschrittig mal EINE Sache bearbeiten, sondern (..), dass sie mal fünf, sechs Lösungsschritte hintereinander durchführen.“ (Z. 114-122)

In der Formulierung „was ich von den Schülern auch tatsächlich sehe“ offenbart sich Herrn Freymanns spezifisches Verständnis dessen, was als Schüler_innenleistung anzuerkennen und entsprechend zu beurteilen sei. Während die mündlichen Beiträge teilweise ‚falsche Fährten‘ legen können und nicht ganz eindeutig zwischen fundiertem Wissen und Zufallstreffern unterschieden werden könne („vermitteln mir kein Bild“), liefern die schriftlichen Arbeiten der Schüler_innen die verlässlichere Beurteilungsgrundlage. Das, was als Leistung ‚gesehen‘ werden kann, zeigt sich in seinen Augen hauptsächlich im schriftlichen Arbeiten, nicht unbedingt in der Unterrichtsbeteiligung. Der potentiellen Mehrdeutigkeit der Unterrichtskommunikation (wann bedeutet eine Meldung ‚Wissen‘, wann ‚Unwissen‘) stellt er damit das für ihn klarere und eindeutigere Instrument der schriftlichen Leistungsüberprüfung gegenüber, an denen er „auch tatsächlich sehe[n]“ kann, was die Schüler_innen können. Ebenfalls deutlich wird an diesem Ausschnitt, dass die Spezifik der Beurteilung mathematischer Kompetenzen sich für ihn vor allem darin ausdrückt, die kognitiven Prozesse der Schüler_innen ‚sichtbar‘ zu machen, weshalb er auf die Verschriftlichung komplexer Aufgaben als Beurteilungsgrundlage besteht. Die Bearbeitung einer kleineren Aufgabe hingegen würde noch nicht ausreichen, um die Schüler_innen nach ihrem „Leistungsvermögen“ einzuschätzen und auf einem gedachten Leistungskontinuum zu sortieren. Später spricht er auch in Bezug auf mündliche Schüler_innenkommentare davon, diese „innerhalb eines Rahmens

300

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

ein[zu]sortiere[n]“ (Z. 151). Mit dem Hinweis auf die Klassengröße von bis zu 30 Schüler_innen, bei der es schwierig sein dürfte alle Schüler_innen und deren Leistungen zu sehen, legitimiert er seinen Fokus auf schriftliche, komplexere Aufgabenstellungen als Beurteilungsmittel seiner Wahl.

Selektionsfunktion von Noten Herr Freymann orientiert sich zunächst an einer kriterialen Bezugsnorm, die deutlich wird, wenn er beispielsweise ausführt, dass sich Gerechtigkeit im Zusammenhang mit schulischer Leistungsbeurteilung für ihn in erster Linie an den „Zielen, die im Mathematikunterricht erreicht werden sollen“ (Z. 503) bemisst. Gleichzeitig räumt er aber ein, dass damit eine Benachteiligung derjenigen Schüler_innen einhergehe, die eben diese Anforderungen nur mit Mühe erreichen könnten. Dazu der folgende Auszug: „Aber natürlich ist das (.) in gewissem Sinne ungerecht, weil einigen fliegt etwas zu. Die kriegen mit viel weniger Anstrengung das. Und andere strengen sich an. Das tut ja auch so weh. Jemand strengt sich an, man sieht/ und der kriegt das nicht auf die Kette. (...) Ähm aber ich muss dem dann trotzdem (.) die höheren Noten verweigern. (..) Aber (...) ich meine, dass dann also diese Vier oder auch diese Fünf, die der dann kriegt, dann trotzdem (.) gerecht ist. Also wenn Sie es so nehmen/ bin der/ (..) Ich=ich, was weiß ich, Lehrer als Agent der Gesellschaft.“ (Z. 503-509)

Herr Freymann stellt also fest, dass die vorgegebenen Lernziele von verschiedenen Schüler_innen unterschiedlich gut bewältigt werden können. Dafür dient ihm die notwendige Anstrengung für die Aufgabenbewältigung als Indiz für unterschiedliche Leistungsfähigkeit, wenn er die Dichotomie aufmacht zwischen Schüler_innen, die sich anstrengen und solchen denen „etwas zufliegt“. Die Schlussfolgerung aus dieser zugeschriebenen Leistungsfähigkeit scheint zu sein: Je mehr Anstrengung sichtbar wird, umso schlechter müssen die Noten auch ausfallen. Diese Entscheidung fällt ihm zwar nicht leicht („das tut ja auch so weh“), im Gegensatz zu anderen Lehrkräften des Samples schließt sich für Herrn Freymann

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

301

aber keine Handlungsaufforderung an das Feststellen eines potentiellen Scheiterns von Schüler_innen an.145 Mit der Formulierung „Lehrer als Agent der Gesellschaft“ (Z. 509) wird deutlich, dass in Herrn Freymanns Augen Lehrkräfte vor allem den gesellschaftlichen Selektionsauftrag zu erfüllen hätten, auch wenn dies bedeute, dass sie teilweise harte Urteile treffen müssen, d.h. die individuellen Lernvoraussetzungen und Schwierigkeiten einzelner Schüler_innen nicht beachten könnten. Er führt an dieser Stelle dann noch weiter aus, dass es bei einem Piloten schließlich auch darum gehe, dass dieser sein Examen bestanden hätte, da er die „objektiven Anforderungen, die an einen Piloten gestellt werden [erfülle]“ und weiter: „Und nicht, weil er vielleicht eine schwere Kindheit hatte und eigentlich so gerne Pilot werden wollte, aber weil er es eigentlich nicht kann“ (Z. 511-515).

Leistungsbeurteilung als individuelle Praxis Ähnlich wie bei Frau Ehrl, die davon sprach, dass Leistungsbeurteilung zwar „willkürlich“ und „was ganz Persönliches“ sei, finden sich auch bei den anderen Lehrkräften, die als Vergleichsfälle für eine eher mathematisch-rechnerische Gerechtigkeitsüberzeugung herangezogen wurden, Äußerungen, die auf eine eher individuelle Beurteilungspraxis ohne besonderen kollegialen Austausch hinweisen. So stellt beispielsweise Frau Berkhoff fest: „Und letztendlich strickt sich dann sicherlich jeder auch so ein bisschen seins zusammen, wie das jetzt passt, wie er das sinnvoll findet. Und so mache ich es halt auch.“ (Z. 86-88) und verwahrt sich gleichzeitig gegen eine zu große Einschränkung ihrer pädagogischen Freiheit („letztendlich muss man auch so gewisse Freiheiten haben, Sachen so oder so zu machen“, Z. 621-622). Ganz konkret bezieht sie diese 145

Insbesondere die im Kapitel 6.3.4 zur kompensatorischen Gerechtigkeitsüberzeugung zitierten Lehrkräfte stehen Herrn Freymann hier gewissermaßen diametral gegenüber, wenn sie von einer Verantwortung der Lehrkräfte sprechen die ungleichen Startbedingungen von Schüler_innen auszugleichen.

302

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Aussage auf ihre Praxis die Schüler_innen einen sogenannten „Fehlerquotienten“ ausrechnen zu lassen, wenn sie schriftliche Arbeiten einreichen – eine Vorgehensweise, die anscheinend nur von ihr und einer weiteren Kollegin durchgeführt wird, aber im krassen Gegensatz zu den von Frau Berkhoff berichteten Bemühungen des Kollegiums der Schule um eine eher formative Rückmeldekultur steht (vgl. Z. 621-648). Auch die Rede von „meine[n] Kriterien“ (Frau Neever, Frau Amberg), „meine Noten“ (Frau Ehrl) oder einem „eigene[n] System“ (Frau Amberg) weist auf eine eher individuelle, denn eine kollegial abgestimmte Beurteilungspraxis hin. Zusammenfassend lässt sich im nordrhein-westfälischen Sample in Hinblick auf die mathematisch-rechnerische Gerechtigkeitsüberzeugung festhalten, dass eine an mathematischen Operationen orientierte Beurteilung, die sich aus verschiedenen Teilleistungen zusammensetzt und vornehmlich auf schriftliche Arbeiten fokussiert, dominiert. Als gerecht gelten insbesondere solche Beurteilungen, die sich entlang von Bepunktungsrastern mit klaren Punkt-Noten-Zuordnungen orientieren und dabei eine vor allem innerhalb der jeweiligen Lerngruppe einheitliche Bepunktung vornehmen. Als schwierig erweist sich dabei die implizite Orientierung an normalverteilten Ergebnissen, die bei nicht erwartungskonformen Ergebnissen nur durch nachträgliches Korrigieren, Zusatzpunkte und ähnliches erreicht werden kann. Legitimiert werden diese nachträglichen Eingriffe in das nach außen hin objektive Punkteverfahren unter Rückgriff auf die pädagogische Freiheit und ein Expertentum qua Fachwissen. Leistungsbeurteilung wird als vornhemlich individuelle Praxis verstanden, kollegialer Austausch oder standardisierende Verfahren werden hingegen weitgehend abgelehnt. Vergleich innerhalb des schwedischen Samples In der Analyse fiel deutlich auf, dass im schwedischen Sample der Verweis auf mathematisch-rechnerische Gerechtigkeitsüberzeugungen sehr viel schwächer ausfiel und Beurteilungspraktiken, die von nordrheinwestfälischen Lehrkräften als selbstverständlich berichtet wurden, bei

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

303

den schwedischen Lehrkräften nur am Rande erwähnt oder aber als Negativbeispiel abgelehnt wurden. Eine mögliche Erklärung dafür liegt sicherlich in der grundsätzlichen Architektur des schwedischen Beurteilungssystems: so ist beispielsweise ein einfaches Zusammenrechnen von Buchstabennoten schlicht nicht so einfach möglich wie dies bei Ziffernzensuren der Fall ist. Gleichzeitig ist mit der Umstellung von einem relativen zu einem kriterienbezogenen Beurteilungssystem ab Mitte der 1990er Jahre (vgl. Kap. 5.1.2) die soziale Bezugsnorm offiziell aus dem Benotungsprozess verbannt worden. Dass diese regulativen Änderungen nicht zwangsläufig auch die Beurteilungspraxis und dazugehörige Überzeugungen verändern, habe ich ebenfalls bereits in Kapitel 5.1.2 erläutert. Trotzdem kann ein klarer Wandel auf regulativer Ebene festgestellt werden, der auch in den Interviews von den Lehrkräften benannt wurde. Ebenso wurden Hinweise auf eine gewandelte Beurteilungspraxis gegeben, die in einen direkten Zusammenhang mit den verschiedenen Beurteilungssystemen der vergangenen 15 Jahre gebracht werden. Dies zeigt sich z.B. im Interview mit dem Mathematiklehrer Fredrik, der in Kapitel 6.3.2.1 ausführlicher dargestellt wird, wenn er die Beurteilung unter dem früheren Beurteilungssystem mit der Notenskala MVG-VG-G mit dem aktuellen System folgendermaßen vergleicht: „Und (...) da war es teilweise so, dass man bei kleinen Tests und Prüfungen viel mit Punkten gearbeitet hat. Und dann die Punkte addiert wurden. Und dann so nach Gefühl [teilweise unverständlich im Original]. Und dann viell/ Manchmal hatte man dann Grenzen. (.) So, um ein G zu bekommen, musst du mindestens so viele Punkte haben. Und dann für VG und für MVG. [...] Und jetzt ist es mehr so, dass man noch mehr auf (..) das große Ganze schaut.“146 (Z. 489-492)

Aus dieser kurzen Passage lassen sich einige Parallelen zu den Beurteilungspraktiken der nordrhein-westfälischen Lehrkräfte ziehen, die im 146

Original: „Och (...) då var det ju dels så när man hade lite prover och tester så var det ju mycket poäng. Och så summerade man ju poängen. Och gjorde ju liksom en [unverst. det där med?] känsla. Och s:satte kan/ Ibland kanske man satte gränser. (.) Att, för att nå eh ett G så måste du minst ha så många poäng. Och sen VG, och så MVG. [...] Och nu har det väl gått mer att man tittar på (..) ännu större helheter.” (Z. 121-130)

304

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

vorangegangen Kapitel dargestellt wurden: „Punkte addiert“, „nach Gefühl“, feste „Grenzen“ für bestimmte Noten. Für Fredrik verbindet sich mit dem Wechsel der Notenskala auch ein Wandel in der Beurteilungspraxis und dahinterliegenden pädagogischen Überzeugungen, wenn er eine Gegenüberstellung zwischen einer auf Punkten und Notengrenzen fußenden Beurteilung einerseits und einer Beurteilung, die auf „das große Ganze schaut“, aufmacht. Im aktuellen Beurteilungssystem wird in seinen Augen weniger kleinteilig auf die punktuelle Beurteilung und Messung von Lernständen fokussiert, als vielmehr der gesamte Lernprozess ins Auge gefasst. Dies drückt sich u.a. in einer klaren Trennung zwischen formativer, bewusst nicht-notenförmiger Beurteilung und Rückmeldung während des Lernprozesses und einer summativen Benotung am Ende des Halbjahres aus, wie bereits in Kapitel 5.1.2 ausgeführt.147 Auch die Schwedischlehrerin Eva vergleicht das alte mit dem aktuellen Beurteilungssystem und beschreibt dabei aber auch die Schwierigkeiten, die eine solche Trennung zwischen formativen nicht-notenförmigen Beurteilungen und summativen Benotungen mit sich bringt: „Also, wir sollen keine summative, wir sollen eine FORMATIVE Beurteilung machen. Ähm (..) und da müssen wir (.) die Gesamtheit beurteilen. (.) Aber das ist kompliziert. Manchmal wünsche ich mir, dass es einfach, also äh Tests (.) mit Punkten wären. Und so exakten Grenzen für die=oder=die=oder=die=oder=die Note. ‚Und du hast äh (.) 95 % richtig, dann wird das ein A. – Aha, du hast 63 % richtig, dann wird das ein E.‘ Und das ist ja summative Beurteilung. Aber damit sollen wir nicht arbeiten. Aber manchmal wünsche ich mir, dass wir äh (.) summative Beurteilung hätten. [lacht] Das scheint viel einfacher zu sein. Aber nun ist es entschieden, dass es formativ sein soll und das führt dazu, dass es so breit wird.“148 (Z. 813-821)

147

Eine ausführlichere Diskussion dieser Passage findet sich auch in Fredriks Falldarstellung in Kapitel 6.3.2.1. 148 Original: „Alltså, vi ska ju inte göra en summativ, vi ska ju göra en FORMATIV bedömning. Ehm (..) och då måste vi ju bedöma (.) helheten. (.) Men det är krångligt. Ibland önskar jag att det bara var, alltså eh prov (.) med poäng. Och så exakta gränser för det=eller=det=eller=det=eller=det betyget. "Och du fick eh (.) 95 procent rätt, det blir ett A.", "Aha, du fick 63 procent rätt, det blir ett E." Och det är ju summativ bedömning. Men det ska ju vi inte jobba med. Men ibland önskar jag att vi hade eh (.) summativ

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

305

Eva spricht hier zwei zentrale Veränderungen an, die sich durch den Wechsel vom Beurteilungssystem mit den Notenstufen MVG-VG-G hin zum neuen Beurteilungssystem mit den Buchstabennoten A bis F ergeben haben: einerseits die oben bereits angesprochene Trennung zwischen formativer und summativer Beurteilung und andererseits die damit verbundene Form der Rückmeldungen, die nicht mehr in Form von Zensuren geschehen soll, sondern in Form von verbalen bzw. ausformulierten Beurteilungen, die den Schüler_innen konkrete Rückmeldungen zu ihren Fähigkeiten geben sollen. Diese Formulierungen werden häufig aus den in den Lehrplänen enthaltenen Wissensanforderungen (kunskapskrav) abgeleitet bzw. aus den Handreichungen entnommen, die zur Beurteilung der standardisierten Tests von der schwedischen Schulbehörde Skolverket herausgegeben werden und zahlreiche Beurteilungsbeispiele mit Schüler_innenlösungen enthalten. Die Lehrerin Eva drückt hier eine gewisse Spannung aus zwischen dem, was politisch gewünscht und als externe Erwartung an sie herangetragen wird (formative Beurteilung), und dem, was sie sich für ihre alltägliche Beurteilungsarbeit wünschen würde (summative Benotung). Während ersteres aber als „kompliziert“ beschrieben wird, wäre eine „einfache“ Benotung anhand von „Tests mit Punkten“ und „exakten Grenzen“ offenbar eine hilfreiche Arbeitserleichterung und entspräche eher Evas gewohnter Beurteilungspraxis. Letztlich macht sie aber auch deutlich, dass sie sich dem politischen Willen beugt und versucht sich mit den neuen Rückmeldeformen zu arrangieren. Die Formulierung, dass die Beurteilung dadurch „so breit“ werde, bezieht sich vermutlich auf die Anforderung, dass Noten erst am Ende des Schuljahres vergeben werden sollen und die Lehrkräfte sich dafür auf alle zur Verfügung stehenden Informationen (all tillgänglig information) zu den einzelnen Schüler_innen stützen sollen. Evas Einschätzung, dass eine auf Punkten beruhende Beurteilung „einfacher“ wäre, wird auch von der Schwedischlehrerin Pernilla geteilt, die aber

bedömning [skratt]. Det känns att det skulle vara mycket enklare. Men nu är det bestämt att det ska vara formativt, och det är ju det som gör att det blir så (.) brett.” (Z. 813-821)

306

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

gleichzeitig auch deutlich macht, dass das neue System mit dem Fokus auf formative Rückmeldungen „konstruktiver“ sei: ”Hast du so und so viel Prozent in dieser Prüfung, dann bist du auf dem Niveau, und bla, bla, bla. Da gibt es keine Widerrede. Das hier ist das sehr viel anstrengendere System. (.) Das ist überhaupt nicht selbsterklärend. ABER ich sollte/ Ich denke schon, dass unsere Art es zu machen, wenn man es auf die richtige Weise tut, dass das mehr äh (..) das ist konstruktiver (.) denke ich. Aber es ist anstrengender für eine Lehrkraft. Denn es ist viel einfacher sozusagen nur Punkte zu vergeben.“149 (Z. 184-188)

Hier findet sich auch die bereits im nordrhein-westfälischen Vergleich herausgearbeitete Position wieder, dass mithilfe von Bepunktungstabellen und klaren Notengrenzen „Diskussionen“ mit Schüler_innen leichter abzuwenden seien, wenn Pernilla sagt: „da gibt es keine Widerrede.“ Ihre Einschätzung, dass das neue System „anstrengender“ sei, muss vor genau diesem Hintergrund gelesen werden: Dadurch, dass die Rückmeldung zum Lernprozess nicht mehr in der „quick language“ als Noten (vgl. Lundahl & Waldow, 2009) stattfindet, wird die Vermittlung für die Lehrkräfte aufwändiger, da die Beurteilungskriterien nicht mehr „selbsterklärend“ sind. Dieser erhöhte Kommunikationsaufwand wird in Pernillas Augen allerdings durch den höheren Grad der Lernprozessunterstützung („konstruktiver“) aufgewogen. Wie diese konstruktivere Rückmeldung im Gegensatz zu Bepunktungen aussehen kann, wird an einem Auszug aus dem Interview mit Lisbeth, einer Schwedischlehrerin an der grundskola deutlich: „Ich versuche auch von den Punkten mehr wegzugehen, und mehr mit formativer Beurteilung zu arbeiten. Dass ich drunter SCHREIBE äh: ‚Du musst den Akkusativ mehr üben. Denk daran, wie man Verben beugt, schau nach und übe mit der Tabelle auf Seite 22‘. Zum Beispiel. [lacht kurz] Denn ich merke, dass äh (..) ähm, dass man, wenn 149

Original: „har du si och så många procent utav det här provet så är du på den nivån, och bla, bla, bla. Det är inget snack. Det här är ett mycket jobbigare system. (.) Det är inte alls lika självklart. MEN jag skulle tycka att/ Jag tycker nog att vårt sätt är, när man gör det på riktigt sätt, att det är mer eh (..) det är mer konstruktivt (.) tycker jag. Men det är jobbigare för en lärare. För det är mycket lättare att bara eh liksom sätta poäng.” (Z. 184-188)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

307

ich Punkte vergebe, sehen sie nur die PUNKTE: ‚Aber ich=ich habe hier einen halben Punkt weniger bekommen, ich sollte einen halben Punkt MEHR bekommen.‘ Anstatt sich darauf zu konzentrieren: ‚WAS kann ich besser machen? Woran muss ich noch arbeiten?‘“150 (Z. 84-89)

Hier wird deutlich, welche Hoffnungen sich bezogen auf die Auswirkungen auf den Lernprozess mit einer veränderten Beurteilungs- und Rückmeldekultur im schwedischen Kontext verbinden. Gleichzeitig wird deutlich, dass auch Lisbeth, die in Kapitel 6.3.4.1 zur kompensatorischen Gerechtigkeitsüberzeugung ausführlicher dargestellt wird, die neuen formativen Beurteilungsformen erst allmählich in ihrem Unterricht zu etablieren versucht und „von den Punkten mehr wegzugehen“. Pernilla betont auch, dass die abschließenden Noten am Ende eines Kurses oder die Zeugnisnoten am Ende des Halbjahres von anderer Qualität seien als die formative Beurteilung während des Lernprozesses. Sie unterscheidet deshalb in der Kommunikation mit ihren Schüler_innen auch konsequent zwischen Zensuren (summativ) und Zensurenniveau (formativ): „Ich sage nicht, dass das eine Zensur ist. Also immer, wenn ich mit den Schüler_innen kommuniziere, spreche ich von ZensurenNIVEAU. Und da kann man sich fragen (.) warum sage ich nicht, dass das eine Zensur ist? Denn, auf eine Art ist es das ja. Aber das ist deshalb, weil ich die Zensur geben will, wenn der Kurs vorbei ist. Ich will nicht, dass sie sagen: ‚Naja, ich hatte doch D bei dem, ich hatte E bei dem.‘ Und/So als ob das Fakten wären. Denn ich bin nicht/ Das habe ich nicht beurteilt. Sondern ich schaue mir alle Aufgaben am Ende noch mal an und dann sehe ich die Steigerung (.) wie sie sich dahin entwickeln zu der Zensur, die sie dann bekommen.“151 (Z. 162-168)

150

Original: „Eller siffran försöker jag också frångå mycket, jag jobbar mycket med FORMATIV bedömning. Att jag SKRIVER ner eh: ,Du måste jobba mer med ackusativen. Tänk på hur du ska böja, gå in och plugga på ehm tabellen på sidan 22.’ Till exempel. [skratta snart] Just för att jag märker att ehm (..) e:ehm att man, skriver man siffror så ser de bara SIFFRAN: ,Men jag=jag har ju fått ett halvt poäng mindre här, jag ska ha ett halvt poäng MER.’ Istället för att fokusera på: ,VAD kan jag göra bättre? Vad är det jag måste jobba med?’" (Z. 84-89) 151 Original: „Jag säger inte att detta är betyget. Så, alltid när jag kommunicerar med eleven så pratar jag betygsNIVÅ. Och det kan man undra varför (.) varför eh säger jag

308

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Die zunächst vor allem semantische Unterscheidung in Zensurenniveau und Zensur gibt der Lehrerin den Freiraum, am Ende des Halbjahres noch einmal alle Eindrücke abzuwägen und den Lernfortschritt in die Zeugnisnote einfließen zu lassen. Gleichzeitig will sie einem schlichten Zusammenrechnen der einzelnen Beurteilungen durch die Schüler_innen vorbeugen. Es zeigt sich, dass die Rückmeldung von Zensurenniveaus auch einen größeren Spielraum für die Lehrerin eröffnen, da diese – anders als Zensuren – keine „Fakten“ in ihren Augen darstellen. Die Zensurenniveaus sind vorläufiger und entsprechen damit eher ihrem Anspruch einer Rückmeldung zum Lernprozess als es ‚richtige‘ Zensuren wären. An anderer Stelle führt sie ebenfalls aus, dass verschiedene Arten von Beurteilungen und Prüfungsformen unterschiedlich gewichtet in die Zeugniszensur eingehen würden und damit ein einfaches Zusammenzählen unmöglich sei (vgl. Z. 165-172). Für Pernilla scheint die Unterscheidung von Zensur und Zensurenniveau eindeutig, ebenso die unterschiedliche Gewichtung verschiedener Teilleistungen – für ihre Schüler_innen hingegen sei all dies „ENORM, enorm anstrengend zu verstehen. Weil es so anders ist, als das was sie gewohnt sind“152 (Z. 173-174), wie sie berichtet. Aber nicht nur die Schüler_innen haben Schwierigkeiten mit dem neuen Beurteilungssystem, auch im Kollegium ihrer Schule finden laut Pernilla regelmäßig Auseinandersetzungen über Fragen der Leistungsbeurteilung statt: „Ich we:eiß, dass es immer noch Leute gibt, die summativ benoten und das ist SO falsch! Wir haben diese Diskussion recht häufig, dass (.) man merkt, dass Leute immer noch da drin stecken mit: ‚Ja, das rechnet man zusammen und das entspricht so

inte att det är ett betyg? För på ett sätt är det ju det. Men det är ju för att jag vill sätta betyget efter kursen är avslutad. Jag vill inte att dom ska säga: "Jamen, jag hade ju D på det, jag hade ju s=E på det." Och/ Som om det vore fakta, liksom. För jag är inte/ Det har jag inte bedömt. Utan jag tittar ju på alla uppgifter en gång till mot slutet och så ser jag progressionen (.) i hur eh dom växer fram till det här betyget dom sen får.” (Z. 155-161) 152 Original: „Och det DÄR är nytt för våra elever, och det är VÄLDIGT, väldigt jobbigt att förstå. För det är så annorlunda från det dom är vana vid.” (Z. 173-174)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

309

vielen Punkten hier, und das sind so viele Pu/‘ Aber das ist/ Das stimmt so nicht! (.) 153 Also das ist [lacht] da gibt es Krieg, sozusagen, so ist das.“ (Z. 458-462)

Die drastische Formulierung „da gibt es Krieg“ wird zwar von ihr durch ein Lachen versucht zu entschärfen, gleichzeitig ist sie aber ein Hinweis darauf, wie umstritten das neue Beurteilungssystem nach wie vor in den Kollegien zu sein scheint.154 Pernilla lehnt eine summative Benotung allerdings rigoros ab („das ist SO falsch!“). Dass sich aber auch im vorliegenden Sample Spuren einer mathematisch-rechnerischen Gerechtigkeitsüberzeugung finden lassen, soll im Folgenden gezeigt werden. Der Mathematiklehrer Ingmar, der an einer sehr kleinen Dorfschule unterrichtet und daher wenig kollegialen Austausch hat, spricht in seinem Interview wie Pernilla ebenfalls von Zensurenniveaus. Auffällig in seinem Interview ist die Verwendung von bestimmten Verben im Vergleich zu den anderen schwedischen Lehrkräften, wie am folgenden Auszug verdeutlicht werden soll: „Ähm (.) äh dann können sie auf sehr unterschiedlichen ZensurenNIVEAUS landen für die verschiedenen äh (...) äh verschiedenen Fähigkeiten oder so, die man misst. Und dann kann das ein bisschen schwieriger sein, das zusammenzustellen für (.) für ja das richtige Zensurenniveau oder so. Mhm.“155 (Z. 267-269)

Ingmar berichtet hier von der Schwierigkeit, aus den einzelnen Teilleistungen eines Halbjahres am Ende eine Gesamtnote zu erstellen. Auffällig ist dabei die Verwendung des Verbs „messen“ (mäter), das in den schwedischen Interviews insgesamt nur sehr selten im Zusammenhang 153

Original: „Jag ve:et att det fortfarande är folk som sätter det summativt och det är SÅ fel! Och vi har den diskussionen rätt ofta, att (.) man märker att folk är ändå inne på det där att: "Jamen, det räknar man ju ihop och det gäller för så många poäng där, och det är ju så många po"/ Men det är ju/ Det stämmer ju inte! (.) Så att det [skratt] det är krig där, liksom, så är det.” (Z. 458-462) 154 Das Interview mit Pernilla fand im März 2015, also ca. 4 Jahre nach Einführung des neuen Beurteilungssystems, statt. 155 Original: „Ehm (.) eh så här kan de hamna på väldigt många olika betygsNIVÅER på olika eh (..) eh olika förmågor eller så som man mäter. Och då kan det vara lite svårare att sammanställa det till (.) till ja rätt betygsnivå eller så. Mm.” (Z. 267-269)

310

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

mit der schulischen Leistungsbeurteilung verwendet wird und wenn, dann in Bezug auf die standardisierten Tests (nationella prov). Ebenso wie der Fokus darauf, die „richtige“ Notenstufe vergeben zu wollen, deuten sich hier in der Sprachwahl schon eher mathematisch-rechnerische Legitimationsquellen an. Er verwendet weiterhin das Verb „sammanställa“ für die abschließende Notenvergabe auf dem Zeugnis, spricht also von einem Zusammenstellen im Sinne eines ‚Zusammenrechnens‘ der Gesamtnote aus den einzelnen Teilnoten. Er weicht auch damit deutlich von den Beschreibungen seiner Kolleg_innen ab und es wird der Eindruck erweckt, dass die Zeugnisnote am Ende des Schuljahres eben doch das Durchschnittsergebnis der verschiedenen Teilnoten darstellt. Noch deutlicher wird dies im Interview mit Malin, einer Schwedischlehrerin an einer städtischen grundskola. In der Art und Weise, wie sie die eigentlich als formative Rückmeldung gedachten Beurteilungsraster einsetzt, wird deutlich, wie die Rückmeldefunktion teilweise von einer summativen Logik überlagert wird. Malins Vorgehensweise wird daher im Folgenden kurz erläutert und anschließend hinsichtlich dieser Frage diskutiert. Malin erstellt für jede Unterrichtseinheit eine Art Arbeitsheft für die Schüler_innen, auf dem Deckblatt werden dafür das zu behandelnde Thema, die Lernziele entsprechend des Lehrplans und die geplanten Unterrichtsaktivitäten sowie Beurteilungsformen aufgelistet. Dahinter finden sich die verschiedenen Arbeitsblätter mit Aufgabenstellungen und am Ende ein Beurteilungsraster, in dem die Lehrplanziele für 4 verschiedene Niveaus aufgeschlüsselt sind: Spalte eins enthält den Kompetenzbereich, die Spalten 2-5 die jeweiligen Wissensanforderungen (kunskapskrav) für verschiedene Niveaus (vgl. Abb. 12, die dunkel hinterlegten Felder 5a – 6 in der ersten Spalte stellen die für die aktuelle Unterrichtseinheit relevanten Lernziele und Wissensanforderungen dar).

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

311

Abb. 12 – Beurteilungsraster mit Niveaustufen für Schüler_innen (Material der Lehrerin Malin)

Malin unterscheidet also ebenfalls zwischen Zensurenniveaus (betygsnivå) für die fortlaufende Rückmeldung und Zensuren (betyg) für die Zeugnisnoten. Im Interview wird allerdings immer wieder deutlich, dass

312

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

diese semantische Unterscheidung nur schwer einzuhalten ist156 und von den Schüler_innen teilweise auch nicht nachvollzogen werden kann: „Dieses Mädchen hier hatte 13 von 16 [Punkten] und das ist C. Eigentlich soll man nicht C sagen bei den Kompetenzen. Wa=Man soll eigentlich Niveau sagen, denn C ist es erst we=b=b/ wenn alles zusammengestellt ist, alle Kompetenzen zusammengestellt sind zu einer Note. Ja. Aber sie werden so verwirrt, so dass: ‚Ja, was bedeutet das nun, wenn ich drei habe, was ist drei?‘ sagen sie. (.) ’Naja, wenn du alle Kompetenzen hier, dieses, dieses=dies=und=diese Kompetenz, wenn du alle auf Niveau drei hast, ja, dann wird das ein C auf dem Zeugnis‘ sozusagen.“157 (Z. 167-172)

Es zeigt sich auch, dass Malin sehr wohl mit Bepunktungen und Notengrenzen bei der Korrektur schriftlicher Tests arbeitet, gleichzeitig weist sie darauf hin, dass eine Note (betyg) erst am Ende des Schuljahres kommuniziert werden soll und es daher „eigentlich“ falsch sei von der Note C im vorliegenden Test gegenüber der Schülerin zu sprechen. Für ihre eigene Beurteilungsdokumentation hat Malin sich zudem ein Beurteilungsraster angefertigt, mit dem sie für jeden und jede Schüler_in die im Laufe des Schuljahres erreichten Lernziele dokumentiert. Dieses Beurteilungsraster enthält alle Wissensbereiche des Fachs (Lesen, Hören, Schreiben, Sprechen/Unterhalten, Reflektieren) sowie ebenfalls die vier Niveaustufen 1-4. Im Unterschied zur Matrix, die die Schüler_innen ausgeteilt bekommen, ist in Malins Version allerdings für jedes Niveau die ‚Übersetzung‘ in eine Note in Klammern notiert: Niveau 1 (F), Niveau 2 (E), Niveau 3 (C), Niveau 4 (A) – hier wird die nur symbolische 156

Vgl. Z. 209-211, wo sie über verschiedene Rückmeldestrategien spricht und erzählt, dass es manchen Schüler_innen ausreiche, die Zensur (betyg) unter ihrem Test zu sehen, andere wiederum die Arbeit im Einzelnen besprechen wollen. Konsequenterweise hätte sie hier ebenfalls von Niveaus sprechen müssen. So aber lässt sich vermuten, dass die Unterscheidung von Niveau und Zensur im alltäglichen Sprachgebrauch verschwimmt. 157 Original: „Den här tjejen hade 13 av 16 och det är C. Och egentligen ska man inte säga C på förmågorna. Va=ska man egentligen säga nivåer, för att C är ju sen en de=b=b/ allt är sammanställt, alla förmågorna är sammanställda till ett betyg ju. Ja. Men dom blir ju så förvirrade, så att: "Jamen, vad innebär det om jag har tre nu, vad är tre?", säger dom. (.) "Jamen, har du alla (.) förmågorna här, den förmågan, den=den=och=den förmågan, har du alla dom på en nivå tre, ja=men då blir det ett C i betyg", liksom.” (Z. 167-172)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

313

Trennung von Zensurenniveau und Zensur sehr deutlich. In Abbildung 13 findet sich eine solche Beurteilungsmatrix für eine Schülerin der 7. Klasse, für die Malin bereits einige Beurteilungen mit einem Kreuz markiert hat, teilweise auch mit zusätzlichen Kommentaren versehen, wie in der Zeile zur Schreibkompetenz zu sehen. Ganz unten auf dem Blatt findet sich ein eingekreistes C – dies ist die Halbjahresnote, die die Schülerin erhalten hat. Daneben steht in kleinerer Schrift die Vorjahresnote (åk 6 – B; Klasse 6 – B).

Abb. 13 – Beurteilungsraster mit Niveaustufen, Teilnoten und Halbjahresnote (Material der Lehrerin Malin)

314

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Aus Malins Ausführungen zu diesen Beurteilungsbögen lässt sich ein entscheidender Unterschied zu den restlichen Befragten erkennen: Malin summiert die Ergebnisse der punktuellen Beurteilungsmomente zu einer Gesamtsumme auf, wohingegen die anderen Lehrkräfte im schwedischen Sample betonen, dass sie erst am Ende des Schuljahres für die einzelnen Kompetenzbereiche mit einer Zensur festlegen, wie weit die Lernziele erreicht wurden. In Malins System setzen sich die Zeugnisnoten (wie in NRW auch) aus der Summe der Teilnoten zusammen, ohne dass eine spätere Verbesserung zu einer besseren Gesamtbeurteilung führen kann. Sie betont zwar auch, dass ein einmaliger Ausrutscher in einem Test nicht gleich die Zeugnisnote ruiniert, trotzdem wird die Logik des Aufsummierens sehr deutlich: „Ich mache schon so ungefähr sechs, sieben Hörverstehenstests. Hat man EINEN mit E, dann macht das nichts. [...] Das senkt nicht die ganze Note ab, wenn man EINEN Test verhauen hat. [...] ‚Hier haben wir sechs von acht Tests, die auf Niveau drei liegen. Dann ist das Niveau drei.‘“158 (Z. 259-268)

Schwierig wird die Festlegung einer Note für Malin vor allem dann, wenn die Teilbeurteilungen (also die Kreuze im Beurteilungsraster) sich nicht so eindeutig wie im Beispiel in Abb. 13 auf einem Niveau konzentrieren, sondern stärker streuen: „Ich habe diese Mappe da, und da war ein i/ ein Junge in Schwedisch. (.) Im Prinzip bei ALLEM was er tat, war es Hälfte-Hälfte Niveau zwei, Niveau drei bei allen Bereichen. (.) Und dann ist das EIGENTLICH ein E (.). Ich gab ihm ein D. Wenn du bedenkst, dass alles lag/ [...] Die ganze Zeit lag das zur Hälfte hier, zur Hälfte da, in allen Bereichen. [...] Und dann ist es eigentlich ein E. [...] Ich habe ein D gegeben, aber eigentlich war das kein D. [I: Ach, nein?] Nee, weil eigentlich, für ein D sollst Du (.), da sollst Du

158

Original: „Jag gör ju liksom kanske sex, sju hörförståelser. Har man EN på E, det gör ju ingenting. [...] Det sänker ju inte hela betyget för att man misslyckas på ETT prov. [...] ’Här har vi ju, här ligger ju liksom sex av åtta prov, dom ligger liksom på nivå tre. Då är det ju nivå tre." (Z. 259-268)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

315

zum überwiegenden Teil in den Bereichen bei Niveau drei liegen und vie=nur vielleicht 159 EINS da (.) bei/“ (Z. 276-297)

Wie sich auch in den folgenden Kapiteln immer wieder zeigen wird, stellt gerade die Entscheidung für die sogenannten Zwischennoten D und B eine große Herausforderung für die schwedischen Lehrkräfte dar. Laut Skolverket sollen, wie Malin auch erläutert, die Wissensanforderungen (kunskapskrav) der nächsthöheren Notenstufe zum überwiegenden Teil (till övervägande del) erfüllt sein, um die Zwischennote zu vergeben. Malin hingegen summiert die gleichermaßen auf E und C verteilten Kreuze kurzerhand zu einer mittleren Note D, wohlwissend, dass sie damit gegen die offiziellen Beurteilungsvorgaben verstößt. Im Interview mit dem Schwedischlehrer Nils, der an einer grundskola am Stadtrand unterrichtet, finden sich einerseits Parallelen zu seinen nordrhein-westfälischen Kolleg_innen mit einer mathematisch-rechnerischen Gerechtigkeitsüberzeugung. So stellt Nils beispielsweise fest: „Alle Notensysteme sind schon eine Art Sortierung. (.) Wer ist tüchtig, wer liegt in der Mitte, wer ist nicht tüchtig? Also es gibt sozusagen/ (..) Es gibt kein Notensystem, das nicht sortiert“160 (Z. 512-514) und schließt damit nahtlos an die Position von Herrn Freymann an, der davon sprach die Schüler_innen „innerhalb eines Rahmens ein[zu]sortiere[n]“ (Herr Freymann, Z. 151). Des Weiteren befürwortet Nils die standardisierten Tests (nationella prov) als wichtige Hilfestellung für seine eigene Beurteilung, da diese mit klaren Punktgrenzen für Noten arbeite und eine einfache Überprüfung ermögliche: 159

Original: „Jag har den mappen där, och då var en i/ kille i Svenska. (.) I princip ALLT han gjorde så var det hälften-hälften nivå två, nivå tre på alla förmågorna. (.) Och då är det ju EGENTLIGEN ett E (.). Så jag satte ett D på honom. Om du tänker att allt låg/ [...] Hela tiden låg det hälften där, hälften där på alla förmågorna. [...] Och då är det ju egentligen ett E. [...] Jag satte D, men egentligen är det inte D. [I: Ah, nej?] Nä, för egentligen då, för ett D då ska du ha (.), då ska du ha övervägande förmågor på nivå tre och ka=bara kanske EN då (.) på/” (Z. 276-297) 160 Original: „Eh=alla betygssystem är ju nån slags sortering. (.) Vilka är duktiga, vilka ligger mittemellan, vilka är inte duktiga? Alltså, det är ju liksom/ (..) Det finns ju inget betygssystem som inte sorterar.” (Z. 512-514)

316

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

„Und das finde ich sehr gut, denn da weiß man, dass (.) diese Prüfungen hier hat jemand anders gemacht, und am Schluss sieht man sozusagen: ‚Stimmen diese Prüfungen mit meinen Noten überein?‘ Denn da ist es ganz oft so, dass da zum Beispiel dasteht, wenn sie 32 haben ist das ein E, haben sie 38 ist das D, haben sie 43 dann ist das C. Verstehst Du? Also da rechnen sie das sozusagen für jede Kompetenz aus. Und da kann man ziemlich gut sehen, ob die Note mit diesen Prüfungen übereinstimmt, die Skolverket gemacht hat. Und das fühlt sich ziemlich schön an.“161 (Z. 228-233)

Die standardisierten Tests dienen ihm so als Garanten der Richtigkeit der eigenen Benotungen, und dies auch in Fächern, in denen es keine nationella prov, dafür aber freiwillige Tests gibt, wie für die Fächer Deutsch und Spanisch in der grundskola (vgl. Z. 221-233). Im Falle einer Abweichung zwischen Testergebnis und seinen Noten führt dies sogar so weit, dass er die Zeugnisnote verändert, weil die Tests höhere Autorität haben als seine eigenen Beurteilungen („dann habe ich falsch beurteilt“162, Z. 237). Ein zentraler Unterschied zu seinen nordrhein-westfälischen Kolleg_innen findet sich allerdings, wenn Nils ausführt, dass die soziale Bezugsnorm für ihn ungerecht ist und er deshalb versucht sich stark an den im Lehrplan vorgegeben Lernzielen zu orientieren, also eine kriteriale Bezugsnorm anzulegen: „Es gibt schon das Risiko, dass man innerhalb der Gruppe vergleicht, dass man sozusagen/ Man muss schon darauf schauen, was hier steht [zeigt auf Lehrplan], so dass man nicht zu viel innerhalb der Gruppe vergleicht, weil das gefährlich ist. Denn, wenn jemand sehr tüchtig ist, dann kann jemand der NICHT so=der beinahe so tüchtig ist, kann dann weiterhin ein A sein. Denn der andere Schüler (.) lag auf einem so hohen Niveau. Er war auf Gymnasialniveau163. (.) Deshalb, also das/ Das Risiko ist, dass/

161

Original: „Och det tycker jag är väldigt bra för då vet man att (.) dom här proven har någon annan gjort, och på slutet så kan man se liksom: ‚Stämmer dom proven med mina betyg?’ För då är det ju ofta så, att om dom har till exempel, det står att har dom 32 så är det E, har dom 38 så är det D, har dom 43 så är det C. Förstår du? Så då räknar dom ut liksom på varje förmåga. Och då ser man ganska bra om betyget stämmer med dom här proven som Skolverket har gjort. Så det känns ganska skönt.” (Z. 228-233) 162 Original: „Då har jag bedömt fel,// tänker jag. (..) Då har jag bedömt fel.” (Z. 237) 163 „Gymnasialniveau” ist hier aus pragmatischen Gründen als Übersetzung gewählt worden, streng genommen aber irreführend, da lediglich ein fortgeschrittenes Niveau

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

317

Man soll nicht zu viel mit, mit der Gruppe vergleichen, aber ich glaube, dass das als 164 Lehrer leicht passiert.“ (Z. 175-181)

Zusammenfassend lässt sich festhalten, dass die befragten schwedischen Lehrkräfte deutlich zurückhaltender hinsichtlich einer an mathematischrechnerischen Operationen orientierten Leistungsbeurteilung sind, diese häufig auch als veraltet und illegitim bezeichnen. Nichtsdestotrotz finden sich Hinweise darauf, dass die in den Regularien angestrebte Trennung von formativen Beurteilungen und summativen Benotungen in der Beurteilungspraxis teilweise verschwimmt. Dieser Aspekt wird im länderübergreifenden Vergleich noch einmal aufgegriffen.

Länderübergreifender Vergleich und institutionelle Rahmung Im länderübergreifenden Vergleich wird deutlich, dass sich die mathematisch-rechnerische Gerechtigkeitsüberzeugung sehr stark bei den nordrhein-westfälischen Lehrkräften herauskristallisiert hat, wohingegen im schwedischen Sample diese vor allem im Verweis auf mittlerweile veraltete und abzulehnende Praktiken zu Tage trat. Eine Ausnahme stellt die Zeugnisnotenerstellung im Fall der Lehrerin Malin dar, die sich hierbei der Logik der Mittelwertbildung bedient. Wie ebenfalls deutlich wurde, weisen die in diesem Kapitel zitierten Lehrkräfte mehrheitlich ein professionelles Selbstbild auf, das eher dem einer Wissen vermittelnden Fachlehrkraft („Mathematiker“) nahekommt als dem des unterstützengemeint ist, das nicht zwangsläufig einem studienvorbereitenden Programm analog zum deutschen Gymnasium entsprechen muss. 164 Original: „Det finns ju en risk att man jämför inom gruppen, (.) att man liksom/ Man måste ju titta vad som står här [zeigt auf läroplan] så att man inte jämför för mycket inom gruppen, därför det är ju f=farligt att göra det. För att om nån är jätteduktig så kan ju nån som INTE är så d=som är nästan lika duktig kan ju fortfarande vara A. För att den andra eleven (.) låg på så hög nivå. Han låg på gymnasienivå. (.) Så därför, alltså att, det/ Risken är att in/ Man ska inte jämföra för mycket med, med gruppen, men jag tror det som lärare är väldigt lätt att göra det.” (Z. 175-181)

318

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

den „Pädagogen“ (wie bei der kompensatorischen Gerechtigkeitsüberzeugung). Die Kernaufgabe schulischer Leistungsbeurteilung wird in der Feststellung eines Leistungsniveaus gesehen (Herr Freymann), wofür die im Unterricht oder in schriftlichen Arbeiten gezeigten Leistungen zunächst in Punktwerte transferiert werden (Frau Amberg), um anschließend ein „Einsortieren“ von Leistungen bzw. Schüler_innen auf der Notenskala (Frau Ehrl und Nils). Die summative Logik mathematischer Verfahren findet sich im nordrhein-westfälischen Kontext dabei vor allem bei Realschul- und Gymnasiallehrkräften, bezogen auf die Fächer finden sich weder im schwedischen noch im nordrhein-westfälischen Kontext Unterschiede. Eine mögliche Erklärung für die vorwiegend ablehnende Haltung zur mathematisch-rechnerischen Gerechtigkeitsüberzeugung im schwedischen Sample liegt sicherlich, wie bereits erwähnt, in den grundlegenden Veränderungen des schwedischen Beurteilungssystems seit Mitte der 1990er Jahre, durch die beispielsweise eine Abkehr von der sozialen Bezugsnorm in den Regularien verankert und nicht-numerische Notenskalen eingeführt wurden. In den aktuellen Regularien zur schulischen Leistungsbeurteilung seit 2011 wird zudem immer wieder betont, dass die Zeugnisnoten als ganzheitliche Beurteilung des Lernprozesses zu verstehen sind und in Relation zu den in den Lehrplänen vorgegebenen Wissensanforderungen (kunskapskrav) erstellt werden sollen (Lgr11, S. 18). Nichtsdestotrotz finden sich im vorliegenden Sample Hinweise darauf, dass beispielsweise eine summative Beurteilungspraxis nach wie vor existiert (bzw. durch die Beurteilungsraster wieder verstärkt wird) und die befragten Lehrkräfte teilweise Schwierigkeiten haben alternative Beurteilungsformen in ihrem Unterrichtsalltag zu etablieren.165 Auf normativer Ebene wird eine mathematisch-rechnerische Gerechtigkeits165

Selghed (2004) und Korp (2006) konnten zudem zeigen, dass die grundlegenden Ideen des relativen Beurteilungssystems (insbesondere die Orientierung an der Normalverteilung) auch zehn Jahre nach der Einführung des kriterienorientierten Beurteilungssystems noch im Beurteilungsalltag der Lehrkräfte fortbestanden. Dass sie in meinem Sample so wenig zutage treten, könnte auf den langfristigen ‚Erfolg‘ der Reformen hinweisen.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

319

überzeugung und vor allem die Dominanz der sozialen Bezugsnorm hingegen deutlich abgelehnt. In den schwedischen Lehrplänen und Beurteilungsregularien finden sich auch keinerlei quantifizierende Vorgaben, wie die ganzheitliche Beurteilung auf dem Zeugnis sich zusammensetzen soll und welche Aspekte in welcher Gewichtung einzubeziehen sind. In einem aktuellen Kommentar betont Skolverket z.B. extra, dass die abschließende Zensurenvergabe auf dem Zeugnis – insbesondere bei den Zwischennoten B und D – auf der Grundlage des professionellen Urteils der Lehrkraft und nicht auf einer rein quantitativen Einschätzung des Lernstands der Schüler_innen basieren soll: „Wir möchten klarstellen, dass es sich in erster Linie um eine qualitative Beurteilung handelt und dass Lehrkräfte ausgehend von ihrer Professionalität auf unterschiedliche Weise begründen können, dass die übergeordneten Wissensanforderungen zum überwiegenden Teil erfüllt worden sind, um die Note B oder D zu vergeben. Es handelt sich also nicht darum, ob Schüler_innen mehr als die Hälfte des in den Wissensanforderungen Beschriebenen erfüllt haben müssen, sondern dass Sie als Lehrkraft beurteilen, ob dieser oder jener Teil als überwiegend erfüllt angesehen wird.“ (Skolverket, 2016b)

Die Entscheidung der Lehrerin Malin für die Zwischennote D im oben geschilderten Beispiel eines Schülers, für den sie in ihrem Dokumentationsbogen jeweils zur Hälfte Niveau Zwei und Drei angekreuzt hatte, kann damit als noch im Ermessensspielraum der Lehrerin liegend interpretiert werden. Gleichwohl lehnt Skolverket eine Mittelwertbildung der im Laufe des Schuljahres erreichten Kompetenzen sehr deutlich ab, wenn in einer früheren Handreichung betont wird: „Es ist wichtig, dass die Lehrkraft bei der Zensurenvergabe für einen Kurs nicht die Ergebnisse aller Tests und Aufgaben nebeneinanderstellt, um daraus einen Mittelwert zu bilden“ (Skolverket, 2012a, S. 23; Übersetzung K.F.). Vielmehr sollten Schüler_innen auch die Möglichkeit haben, Wissenslücken, die sie zu Beginn eines Schuljahres hatten im Verlauf des Unterrichts auszugleichen und so die erforderlichen Wissensanforderungen zu erfüllen (vgl. hierzu auch Skolverket, 2011b, S. 18). Durch das schlichte Auszählen der Kreuze in ihrem Dokumentationssystem, um daraus eine Zeugnisno-

320

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

te zu bilden, verstößt die Lehrerin Malin also gegen die grundlegende Idee eines kontinuierlichen, jedoch individuellen Wissenszuwachses, der auch ein Erlernen gewisser Fähigkeiten zu einem späteren Zeitpunkt erlaubt. Eine Gewichtung unterschiedlicher Leistungsbereiche oder quantitative Vorgaben zur Zusammensetzung der Zeugnisnote, wie in NRW üblich, ist damit auch auf regulativer Ebene in Schweden nicht vorgesehen. Die Einschätzung der Wichtigkeit einzelner Wissensanforderungen für die abschließende Beurteilung auf dem Zeugnis obliegt vollständig den Lehrkräften. Dass diese interpretative Freiheit auch zu großen Schwierigkeiten in der Beurteilungspraxis für die schwedischen Lehrkräfte führen kann, wurde am Fall der Lehrerin Malin schon angedeutet und wird in Kapitel 6.3.3.3 noch ausführlicher diskutiert. Demgegenüber lassen sich für die nordrhein-westfälischen Lehrkräfte zahlreiche detaillierte Vorgaben ausmachen, die sowohl die fortlaufende Beurteilung während des Unterrichts als auch die Zeugnisnotenerstellung betreffen und dabei vor allem die Gewichtung und Anzahl verschiedener Beurteilungsformen festlegen, nicht aber die inhaltliche Auslegung der Kernlehrpläne bzw. die Verknüpfung konkreter Leistungen mit einer Zensur, wie in den Handreichungen der schwedischen Bildungsbehörde (vgl. u.a. Skolverket, 2011b, 2011c, 2012b). Auch für die Korrektur der Klausuren der Zentralen Abschlussprüfungen bzw. das Zentralabitur finden sich detaillierte Bepunktungsvorgaben. Die Berechnung der Abiturnoten erfolgt ebenfalls durch Mittelwertbildung aus der Note der Erst- und Zweitkorrektur. Wie bereits in Kapitel 5.2.2 ausgeführt, wird beispielsweise im Schulgesetz bereits die Unterscheidung zwischen dem Beurteilungsbereich „Schriftliche Arbeiten“ und dem Beurteilungsbereich „Sonstige Leistungen im Unterricht“ eingeführt (MSW, 2015b, §48, 2). In den Kernlehrplänen wiederum finden sich Angaben zur Gewichtung der beiden Beurteilungsbereiche bei der Erstellung der Zeugnisnoten: Für die Kernfächer Mathematik und Deutsch wird hier zumeist eine jeweils hälftige Gewichtung vorgegeben, lediglich in den Kernlehrplänen für die Hauptschule wird von einer genauen Angabe abgesehen und eine „angemessene“

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

321

Berücksichtigung beider Beurteilungsbereiche vorgeschlagen (MSW, 2011a, S. 33; MSW, 2011b, S. 33). Hinsichtlich des schriftlichen Leistungsbereichs finden sich detaillierte Vorgaben hinsichtlich der Anzahl der zu schreibenden Klassenarbeiten bzw. Klausuren sowie zur inhaltlichen Ausrichtung dieser Arbeiten, da die Klassenarbeiten die in den Kernlehrplänen vorgesehenen Kompetenzbereiche abprüfen sollen (vgl. Kap. 5.2.2). Aus beiden Aspekten, der Unterscheidung und Gewichtung zweier Beurteilungsbereiche einerseits und der exakten Vorgabe zur Anzahl der schriftlichen Arbeiten andererseits, ergibt sich eine gewisse Vorstrukturierung des Schuljahres, die die Lehrkräfte dazu anhält, die vorgesehenen Kompetenzbereiche und Lehrplaninhalte innerhalb von bestimmten Zeitfenstern mit ihren Schüler_innen zu erarbeiten, um am Ende des Lernabschnitts eine schriftliche Überprüfung des Gelernten vorzunehmen und ausreichend viele Noten zu „produzieren“ (vgl. zu dieser Problematik auch die Befunde in Breidenstein, 2011, S. 346–349). Die quantifizierende Logik einiger in diesem Kapitel zitierter Lehrkräfte lässt sich also durchaus auch aus der in den Regularien eingeschriebenen Vorgabe zur Herstellung einer bestimmten Anzahl von Noten im Verlauf eines Schuljahres schlussfolgern. Im Vergleich dazu verfügen die schwedischen Lehrkräfte insgesamt über größere Freiheiten hinsichtlich der zeitlichen Taktung und inhaltlichen Gestaltung ihres Unterrichts, vor allem aber gibt es größere Freiräume hinsichtlich der Art und Anzahl verschiedener Beurteilungsformen. Gleichzeitig bleibt der eigentliche Akt der Beurteilung von beispielsweise schriftlichen Arbeiten im nordrhein-westfälischen Schulgesetz wie auch in den Kernlehrplänen im Vergleich zu den schwedischen Dokumenten merkwürdig vage und unterbestimmt166, woraus sich die in Kapitel 2.1 erwähnten „Dispositionsspielräume“ bei der schulischen Leistungsbeurteilung (Lüders, 2001a) für Lehrkräfte ergeben. Lediglich in Bezug auf die zentralen Prüfungen (ZP10) bzw. das Zentralabitur finden sich Hinweise 166

Eine Charakteristik, die sich auf alle deutschen Bundesländer übertragen lässt (vgl. Niehues & Rux, 2006, S. 119).

322

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

darauf, wie die Notengrenzen anhand fester Prozentwerte der Gesamtpunktzahl zu setzen sind (vgl. hierzu die in Kap. 5.2.2 zitierten Faustregeln des MSW). Eine Verknüpfung zwischen Lehrplaninhalten und Notenstufen, wie in den schwedischen Lehrplänen und Handreichungen, findet sich allerdings nirgends. Auch Rheinberg (2002) spricht von einem nur „halbherzigen Versuch“ des Verweises auf die kriteriale Bezugsnorm in deutschen Regularien zur schulischen Leistungsbeurteilung, da diese häufig nur die Orientierung an einem angemessenen Niveau vorgeben würden ohne jedoch konkrete Hinweise für Lehrkräfte zu liefern, wann eine spezifische Leistung welcher Note entsprechen würde (Rheinberg, 2002, S. 66–67). Insofern überrascht es auch nicht, dass Beurteilungsfragen von den nordrhein-westfälischen Lehrkräften mit einer mathematischrechnerischen Gerechtigkeitsüberzeugung weniger stark anhand der wahrgenommenen Fähigkeiten und Kompetenzen der Schüler_innen diskutiert werden, vielmehr steht die Frage der richtigen Bepunktung im Zentrum ihrer Legitimationen. Das Erklären, Legitimieren und sogar das Korrigieren der Punkteschemata erfolgt scheinbar losgelöst vom tatsächlichen Lernstand der Schüler_innen und das Bepunktungsverfahren ersetzt dabei teilweise auch die tiefere Auseinandersetzung mit dem Lernprozess der einzelnen Schüler_innen, der wie bei Frau Ehrl deutlich wurde, aber auch nicht als Bestandteil schulischer Leistungsbeurteilung verstanden wird. Das von ihr ausführlich beschriebene „drehen“ an Punkten, also das nachträgliche Korrigieren des Punkteschemas eines Erwartungshorizonts, findet sich auch schon bei Kalthoff, wenn Lehrkräfte „am Schnitt“ arbeiten (Kalthoff, 1996, S. 113-114). Lüders spricht in diesem Zusammen auch von der „Verrechnung von Notenwerten“ als „technokratische[r] Lösung“ (Lüders, 2001b, S. 466). „Das Recht des Lehrers“, wie die Lehrerin Frau Neever es ausdrückt, bzw. der pädagogische Spielraum wird vor allem zur nachträglichen Korrektur der eigenen Beurteilungen genutzt, um unauffällige, d.h. normalverteilte, Ergebnisse zu produzieren – und nicht unbedingt im Sinne individueller Förderung und Unterstützung des Lernprozesses, wie dies bei der kompensatorischen Gerechtigkeitsüberzeugung deutlich werden wird.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

323

Wie in Kapitel 1.1 bereits ausgeführt, ist die implizite Orientierung an der Normalverteilung bei deutschen Lehrkräften verbreitet (vgl. Kalthoff, 1996, S. 108; Terhart et al., 1999). Für den nordrhein-westfälischen Kontext kann sie auch von einer mittlerweile zwar abgeschafften, von manchen der erfahreneren Lehrkräfte jedoch im Interview auch erwähnten Vorgabe aus der Allgemeinen Schulordnung (ASchO NRW), die von 2003 bis 2005 galt, abgeleitet werden. Darin fand sich der sogenannte „Drittelerlass“, nach dem schriftliche Arbeiten, bei denen von einem Drittel der Schüler_innen einer Klasse die Note Vier („ausreichend“) nicht erreicht wurde, zu wiederholen waren (ASchO, § 22).167 Diese Vorgabe kann zwar einerseits als Versuch verstanden werden ein einheitliches Beurteilungsniveau innerhalb einer Schule sicherzustellen (Lüders, 2001b, S. 468). Gleichzeitig zeigt sich darin eine implizite Orientierung an der Normalverteilung, wenn der Notendurchschnitt einer Arbeit als Maßstab genommen wird und bei zu schlechtem Abschneiden diese Arbeit nicht gewertet wird. Rheinberg spricht in diesem Zusammenhang auch davon, dass Lehrkräfte durch den Drittelerlass dazu genötigt würden, zumindest für die unteren Notenstufen 4, 5 und 6 die soziale Bezugsnorm anzuwenden (Rheinberg, 2002, S. 66–67). Deutlich wird, dass die in diesem Kapitel zitierten Lehrkräfte sich durch eine starke Orientierung an der sozialen Bezugsnorm auszeichnen, inwiefern sich dies direkt auf den mittlerweile abgeschafften Drittelerlass zurückführen lässt, ist natürlich fraglich. Allerdings handelt es sich bei diesen Lehrkräften zum Teil um Personen mit sehr langjähriger Berufserfahrung (Herr Clemens, 167

Hier der genaue Wortlaut: „Die Anforderungen in den Arbeiten müssen den aufgrund des erteilten Unterrichts zu erwartenden Leistungen und den Anforderungen der Lehrpläne entsprechen. Erreicht bei einer Arbeit ein Drittel der Schülerinnen und Schüler kein ausreichendes Ergebnis, ist zu prüfen, ob die Anforderungen im Sinne des Satzes 1 angemessen sind. Erscheinen die Anforderungen angemessen, ist die Arbeit zu werten. Anderenfalls ist die Arbeit zu wiederholen. Die Entscheidung trifft die Schulleiterin oder der Schulleiter nach Anhörung der Fachlehrerin oder des Fachlehrers. Wird die Arbeitet gewertet, sind geeignete Maßnahmen einzuleiten, die die unterrichtlichen Ergebnisse verbessern und die Leistungsfähigkeit der Schülerinnen und Schüler fördern.“ (ASchO § 22)

324

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Herr Freymann, Frau Neever), Lehrkräfte also die ihren Beruf mehrheitlich in einer Zeit ausgeübt haben, in der eine „institutionalisierte Dominanz sozialer Bezugsnormen“ (Rheinberg, 1980, S. 180) vorherrschte. Hinsichtlich der Erstellung der Zeugnisnoten finden sich in den nordrhein-westfälischen Regularien kaum weiterführende Hinweise, die über die oben genannten Gewichtungen der beiden Beurteilungsbereiche hinausgehen. Eine interessante Ausnahme bildet die Ausbildungs- und Prüfungsordnung für die gymnasiale Oberstufe (APO-GOSt): Darin findet sich ein ausdrückliches Verbot der oben geschilderte Praxis der Mittelwertbildung aus den Teilnoten bei der Zeugnisnotenerstellung (vgl. APOGOSt, §13, 1)168, für die Sekundarstufe I wiederum fehlt eine solche Vorgabe vollständig. Obwohl also die rein rechnerische Bildung von Zeugnisnoten ausdrücklich untersagt ist, wird dies, wie in den fallübergreifenden Analysen deutlich wurde, als legitime Praxis von den Lehrkräften des Samples berichtet (vgl. insbesondere die Abschnitte zu Frau Amberg und Frau Heinkötter). Neben diesen deutlichen Unterschieden in den offiziellen Regularien zur schulischen Leistungsbeurteilung in Schweden und NRW lassen sich zusammenfassend folgende Aspekte als Bedingungen herausstellen, unter denen eine eher mathematisch-rechnerische Gerechtigkeitsüberzeugung im vorliegenden Sample auftritt: Kontextübergreifend ist ein professionelles Selbstverständnis als Wissensvermittler_in bzw. als Fachlehrkraft („Mathematiker“), die die Leistungsbeurteilung als individuelle Praxis ausüben und wenig kollegialen Austausch suchen, festzustellen. Der Fokus liegt auf der Wissensvermittlung und anschließenden Feststellung von Leistungsständen, wobei die Beurteilung insbesondere von schriftlichen Arbeiten mit einer besonderen Expertise verbunden wird. Gleichermaßen zentral ist die Fähigkeit des Erkennens von Leistungsniveaus und das ‚richtige‘ Einsortieren die168

APO-GOSt, §13, 1: „Die Kursabschlussnote wird gleichwertig aus den Endnoten beider Beurteilungsbereiche gebildet. Eine rein rechnerische Bildung der Kursabschlussnote ist unzulässig, vielmehr ist die Gesamtentwicklung der Schülerin oder des Schülers im Kurshalbjahr zu berücksichtigen“.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

325

ser auf der Notenskala. Damit einher geht auch ein eher statischer Leistungsbegriff.169 Ebenfalls kontextübergreifend geht eine mathematisch-rechnerische Gerechtigkeitsüberzeugung einher mit einem hauptsächlich summativen Beurteilungsverständnis, die lernprozessbegleitende und – unterstützende Anwendung von Rückmeldungen findet vor allem im nordrhein-westfälischen Kontext nur sehr begrenzt statt. Beurteilungsgespräche mit Schüler_innen finden hauptsächlich anlässlich von bereits erfolgten Benotungen statt und dienen eher der Mitteilung über den IstStand, weniger als Anlass für Hilfestellungen bei der weiteren Lernentwicklung. Ebenfalls im nordrhein-westfälischen Sample tritt eine starke Orientierung an der sozialen Bezugsnorm auf, die jedoch durch die konsequente Beurteilung durch die gleiche Lehrkraft legitimiert wird. Hinsichtlich der Beziehungskonstellationen mit Schüler_innen kann für die nordrhein-westfälischen Lehrkräfte eine Fokussierung auf Klassenebene, weniger stark auf individuelle Schüler_innen festgestellt werden. Die einzelnen Schüler_innen, ihr Lernprozess und ihre individuelle Situation tauchen in den Erzählungen selten auf, die Wahrnehmung der Schüler_innen erfolgt insgesamt eher kollektivierend als gesamte Lerngruppe oder als in sich homogene (Leistungs-)Gruppen im oberen, mittleren und unteren Leistungsbereich. Hinsichtlich der Beziehungskonstellationen im Kollegium lässt sich kontextübergreifend eine Tendenz zum ‚Einzelkämpfertum‘ feststellen mit vergleichsweise wenig Austausch im Kollegium.

169

Rheinberg (1980) konnte ebenfalls einen Zusammenhang zwischen der Bezugsnormorientierung und bevorzugten subjektiven Theorien zur Erklärung von Leistungsunterschieden zwischen Schüler_innen aufzeigen. So neigten Lehrkräfte, die eine soziale Bezugsnorm bevorzugten, eher dazu zeitstabile und internale Faktoren (Begabung, Fleiß, Anstrengung) als Erklärung für Unterschiede heranzuziehen. Lehrkräfte, die eher eine individuelle Bezugsnorm bevorzugten, erklärten Leistungsunterschiede dahingegen stärker mit zeitvariablen und externalen, d.h. in der Aufgaben- und Bewertungssituation liegenden, Faktoren (Rheinberg, 1980, S. 73–80).

326

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

6.3.2 Prozedural-bürokratische Gerechtigkeitsüberzeugung Die gewählte Doppelbezeichnung als prozedural-bürokratische Gerechtigkeitsüberzeugung bezieht sich auf zweierlei markante Merkmale: zum einen die Bevorzugung von kleinteiligen und dadurch standardisierbaren Beurteilungsverfahren, zum anderen die Orientierung an formalen Regeln als Garanten einer gerechten Leistungsbeurteilung. Mit dem Begriff der Prozedur wird laut Duden häufig eine „meist umständliche und für die Betroffenen unangenehme Weise, in der etwas durchgeführt wird“ bezeichnet, das dazugehörige Adjektiv prozedural wird etwas neutraler auch mit „den äußeren Ablauf betreffend“ umschrieben. Bürokratisch wiederum dient als Bezeichnung für jemanden, der „sich pedantisch und übergenau an Vorschriften klammernd, auf die Einhaltung von Vorschriften pochend“ verhält.170 Im Gegensatz zu diesen eher negativ konnotierten Beschreibungen wird im Modus der prozedural-bürokratischen Gerechtigkeitsüberzeugung einer verfahrens- und verwaltungsmäßig korrekten Beurteilung eine zentrale Rolle für die Einschätzung als ‚gerechte‘ oder ‚ungerechte‘ Leistungsbeurteilung zugeschrieben – unabhängig davon, ob diese Verfahrenstreue im Einzelnen tatsächlich eingehalten wird. Wichtig ist vor allem die Legitimation der eigenen Beurteilungen unter Verweis auf ihre Verfahrenstreue. Eine ‚gerechte‘ Leistungsbeurteilung wird im Modus der prozeduralbürokratischen Gerechtigkeitsüberzeugung mittels möglichst standardisierter Verfahren bzw. durch das Befolgen von Vorgaben und Regularien hergestellt. Diese Verfahren bzw. Vorgaben können sowohl von den Lehrkräften selbst erstellte bzw. für die Einzelschule gültige Verabredungen sein, aber auch die Orientierung an zentralen Lehrplänen, Bildungsstandards oder zentralen Tests ist hier besonders ausgeprägt. Im Zentrum der Interviews stehen häufig die von den Lehrkräften gewählten Beurteilungsverfahren, die eine ‚gerechte‘ Leistungsbeurteilung garantieren sollen. Sie dienen dabei auch der Entlastung der Lehrkräfte von einer als widersprüchlich oder herausfordernd empfundenen Aufgabe. 170

Alle drei Definitionen gemäß der Online-Ausgabe des Duden (www.duden.de).

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

327

Durch sie können die Lehrkräfte wichtige Entscheidungen auf Verfahrensweisen externalisieren, die im Zweifel auch über ihren persönlichen Vorlieben stehen und so eine gewisse Distanz zwischen sich selbst und die Beurteilungsaufgabe bringen. Sie liefern sich in gewisser Weise einem Verfahren aus, um im Gegenzug weniger Verantwortungslast zu tragen. Natürlich finden sich in allen Interviews Beschreibungen von Routinen und Verfahrensweisen in Bezug auf die schulische Leistungsbeurteilung, der Unterschied im Modus der prozedural-bürokratischen Gerechtigkeitsüberzeugung ist jedoch die große Bedeutung, die ihnen für die Sicherstellung einer gerechten Beurteilung von den Lehrkräften zugeschrieben wird. Die Standardisierung der Leistungsbeurteilung wird im Modus der prozedural-bürokratischen Gerechtigkeitsüberzeugung als Instrument der Absicherung der einzelnen Lehrkraft gegenüber den Schüler_innen und deren Eltern sowie der eigenen Schulleitung bzw. dem Kollegium verstanden. Standardisierung der Leistungsbeurteilung kann sich also über die eigene Praxis hinaus auch auf eine Standardisierung der Beurteilungen aller Lehrkräfte einer Schule beziehen. Insbesondere die schwedischen Lehrkräfte äußern hier ein starkes Bedürfnis nach einer Vergleichbarkeit ihrer Beurteilungen mit denen ihrer Kolleg_innen (likvärdig bedömning). Gerecht ist eine Beurteilung im Modus der prozeduralbürokratischen Gerechtigkeitsüberzeugung vor allem dann, wenn sie sich an für alle Schüler_innen gleichermaßen gültige Absprachen und Vereinbarungen hält. Das Gleichheitsprinzip (equality) stellt somit das überwiegende Gerechtigkeitsmaß dar. Ausnahmen von der Regel werden eher als potentielle Bedrohung der Verfahrenstreue und damit als ungerecht empfunden – gleichzeitig finden sich aber immer wieder auch ausführliche Erläuterungen für eben solche Ausnahmen in den Interviews, die in der Analyse interessante Brüche mit dem Gleichheitsprinzip zutage förderten.

328

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Eine ‚gerechte‘ Beurteilung ist eine objektive Beurteilung Individuelle Ausnahmen bzw. individuelle Formen der Beurteilung, wie sie im Kapitel zur kompensatorischen Gerechtigkeitsüberzeugung (Kap. 6.3.4) dargestellt werden, werden im Modus der prozeduralbürokratischen Gerechtigkeitsüberzeugung eher als potentielle Gefährdung einer möglichst objektiven Beurteilung wahrgenommen. Diese Gleichsetzung von einer möglichst objektiven Beurteilung als gerechte Beurteilung definiert sich dabei über das Ausblenden bzw. Vermeiden subjektiver Einflüsse auf die Beurteilung. Subjektivität – sowohl auf Seiten der Schüler_innen als auch auf Seiten der Lehrkräfte – wird hier nicht positiv konnotiert als Individualität verstanden, sondern vielmehr als von der Leistungsbeurteilung getrennt zu betrachtender Faktor gesehen. Einen Gegenentwurf zu einer prozedural-bürokratisch hergestellten gerechten Leistungsbeurteilung stellt eine Beurteilung ‚nach Gefühl‘ dar, die es nach Einschätzung der Lehrkräfte möglichst zu vermeiden gilt. Während Fragen von Subjektivität oder Objektivität von Leistungsbeurteilung für andere Gerechtigkeitsüberzeugungen kaum eine Rolle spielen, dient die Abgrenzung des einen (Objektivität) vom anderen (Subjektivität) im Modus der prozedural-bürokratischen Gerechtigkeitsüberzeugung hingegen als Richtschnur einer gerechten (und professionellen) Beurteilung. Objektivität soll unter anderem durch verschiedene Dokumentationsverfahren sichergestellt werden. Mittels einer kleinteiligen Dokumentation einzelner Leistungsbereiche, wie zum Beispiel die mündliche Mitarbeit im Unterricht, sollen subjektive Einflüsse möglichst klein gehalten werden. Die Sicherstellung objektiver und damit gerechter Noten erfolgt – ähnlich wie im Modus der mathematisch-rechnerischen Gerechtigkeitsüberzeugung – auch über das Sammeln möglichst vieler Einzelnoten, die eine kontinuierliche Beurteilung über einen längeren Zeitraum abbilden. Die vielen kleinen Leistungsüberprüfungen sollen dabei auch das Gewicht einzelner Noten relativeren, so dass subjektive Faktoren (auf Seiten der Lehrkräfte sowie der Schüler_innen) weniger stark ins Gewicht fallen.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

329

Eine weitere Parallele zur mathematisch-rechnerischen Gerechtigkeitsüberzeugung stellt die Orientierung an den Lernergebnissen dar, der Lernprozess wird hier weniger stark in den Blick genommen als bei den anderen beiden Gerechtigkeitsüberzeugungen. Die Überlegungen bezüglich einer gerechten Leistungsbeurteilung beziehen sich hauptsächlich auf die Herstellung oder Machbarkeit einer vergleichbaren Leistungsbeurteilung, bei der für gleiche Leistungen die gleiche Note vergeben werden soll. Mit dem Fokus auf die Lernergebnisse soll ebenfalls eine möglichst objektive Beurteilung ermöglicht werden, beispielsweise indem bei der Beurteilung einer Klassenarbeit alles persönliche Vorwissen über die Schüler_innen bewusst ausgeblendet wird. Eine gerechte Note ist damit eine möglichst unpersönliche – im Sinne einer unparteiischen – Note. Die Orientierung an den Lehrplänen und den darin enthaltenen Vorgaben bezüglich der Leistungsbeurteilung wird hierfür als Mittel der Wahl beschrieben.

Gerechte Leistungsbeurteilung ist belegbar Im Modus der prozedural-bürokratischen Gerechtigkeitsüberzeugung spielt der Verweis auf Transparenz als notwendige Bedingung einer gerechten Leistungsbeurteilung eine wichtige Rolle. Das Transparentmachen der Beurteilungskriterien wird dabei einerseits von den Lehrkräften als pädagogische Notwendigkeit geschildert, die es den Schüler_innen ermöglicht den Beurteilungsprozess besser zu verstehen. Andererseits finden sich zahlreiche Interviewstellen an denen das Transparentmachen der Beurteilung vor allem als Rechenschaftslegung der Lehrkräfte gegenüber Dritten verstanden werden kann. Die Belegbarkeit der Einzelbeurteilungen – und damit ihre Legitimität – wird versucht durch detaillierte Beurteilungshilfen zu erhöhen. Insbesondere für die Beurteilung mündlicher Beiträge im Unterricht bzw. die Dokumentation der sonstigen Mitarbeit stellt dabei für die nordrhein-westfälischen Lehrkräfte eine Herausforderung dar. In den Interviews nimmt die Darstellung und Erklärung der individuellen Beurteilungslösungen und -verfahren eine

330

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

zentrale Rolle ein. Anders als in den anderen Gerechtigkeitsüberzeugungen legen diese Lehrkräfte viel Wert auf die detaillierte Darstellung ihrer Beurteilungsverfahren – aber auch die Legitimation von Abweichungen und Ausnahmen davon – im Gespräch mit mir. Für die ausführliche Darstellung je eines Falls aus dem schwedischen und dem nordrhein-westfälischen Sample wurden zwei Mathematiklehrer – Fredrik und Herr Dabert – ausgewählt, die beide eine technisch unterstützte Form der Beurteilung ins Zentrum ihrer Gerechtigkeitsbemühungen stellen. In der fallübergreifenden Analyse wird jedoch deutlich werden, dass darüber hinaus auch andere Verfahren der Beurteilung verwendet werden, um eine gerechte Beurteilung abzusichern. 6.3.2.1 Fredrik – „einfach ausschneiden und einfügen“ und „objektive Beurteilung“ Der Mathematik- und Naturwissenschaftslehrer171 Fredrik ist zum Zeitpunkt des Interviews 44 Jahre alt und seit 15 Jahren im Schuldienst. Er unterrichtet in den Klassen 7 – 9 an einer städtischen grundskola. Zum Interview hat Fredrik seinen Laptop mitgebracht, um anhand eines von ihm verwendeten Beurteilungsprogramms seine Beurteilungspraxis zu erläutern und Beispielarbeiten der Schüler_innen zu zeigen. Die detaillierte Beschreibung seiner Beurteilungspraxis – und dem, was für ihn eine ‚gerechte Beurteilung‘ ausmacht – nimmt sehr viel Raum in Fredriks Interview ein. Demgegenüber formuliert er kaum Zweifel oder benennt 171

Die in Deutschland getrennt unterrichteten Fächer Biologie, Chemie, Physik und Technik werden im schwedischen Schulsystem häufig unter der Bezeichnung naturorienterade ämnen (NO) – naturwissenschaftliche Fächer – zusammengefasst und die Unterrichtsinhalte während des Schuljahres in thematisch vertiefenden Kursen behandelt. Das gleiche gilt für die gesellschaftswissenschaftlichen Fächer Geschichte, Geografie, Sozialkunde und Religion, die als samhällsorienterade ämnen (SO) bezeichnet werden. Die Schulen können selbst entscheiden, ob die Schüler_innen für jedes Fach einzeln eine Zeugnisnote bekommen oder aber eine übergreifende Bereichsnote für die NO- bzw. SOFächer vergeben wird.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

331

Schwierigkeiten bei der Beurteilung seiner Schüler_innen, im Gegenteil wirkt er sehr selbstsicher und überzeugt von seinem professionellen Handeln.

Beurteilungsprogramm „Planering & Bedömning“ Fredriks zentrale Beurteilungsstrategie basiert auf der Anwendung des auf seinem Arbeits-Laptop installierten Programms „Planering & Bedömning“, das der Kommune seiner Schule von einer lokalen Computerfirma zur Verfügung gestellt wurde (IST - IT for Education, o.J.). 172 Die Lehrkräfte an seiner Schule sind von der Schulleitung angehalten worden, ihre Beurteilungen perspektivisch nur noch mit diesem Programm vorzunehmen und zu dokumentieren, jedoch verwendet nach Fredriks Auskunft zum Zeitpunkt des Interviews nur ein Teil des Kollegiums das Programm regelmäßig.173 „Planering & Bedömning“ ermöglicht die digitale Planung und Vorbereitung von Unterrichtseinheiten, dient der Dokumentation der Leistungsbeurteilungen ähnlich einem Klassenbuch und soll als Kommunikationsgrundlage zwischen Lehrkräften, Schüler_innen und deren Eltern dienen – all dies auf der Grundlage der von Skolverket veröffentlichten Lehrpläne und kommentierenden Materialien für Lehrkräfte, die sich auszugsweise auch in den Bedienfeldern des Programms finden. In der Programmansicht können so beispielsweise Klassenlisten mit den Namen der Schüler_innen erstellt werden, die wiederum mit 172

Die Lehrkräfte und Schüler_innen sowie deren Eltern erhalten per Passwort Zugang zu einem mit diesem Programm verbundenen Beurteilungsportal, für Außenstehende ist dieser Zugang jedoch nicht möglich. Die folgenden Beschreibungen basieren daher auf den Beobachtungen während des Interviews, meinen Notizen dazu und Fredriks Erklärungen zu seiner Benutzeroberfläche im Beurteilungsportal Planering & Bedömning, einzusehen über https://oldweb.ist.com/neted/services/file/?hash=764dd69a9d667fff74b337750456c7f2 [12.12.2016]. 173 Auch die anderen beiden befragten Lehrkräfte der Schule – Lisbeth und Gunilla – verwenden das Programm nach eigener Auskunft nicht.

332

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

den im Schuljahr geplanten Unterrichtseinheiten und Themenblöcken kombiniert werden können. Auf der Benutzeroberfläche erscheint dann eine Beurteilungsmatrix in Tabellenform mit den Namen der Schüler_innen in den Zeilen und den Unterrichtsthemen in den Spalten. Per Mausklick können die detaillierten Beschreibungen der Wissensanforderungen (kunskapskrav) für die Notenstufen A, C und E für jedes Unterrichtsthema bzw. Lehrplanziel angezeigt werden. Zusätzlich können alle anderen Bestandteile des Lehrplans zum jeweiligen Fach und Themengebiet (Ziel des Faches, zentraler Inhalt, Wissensbereiche; vgl. Kap. 5.1.2) über Pull-Down-Menüs aufgerufen werden. Die einzelnen Felder werden von den Lehrkräften ausgefüllt, beispielsweise indem zu jeder Wissensanforderung eine Notiz bei den Schüler_innen vermerkt wird, inwieweit diese erfüllt wurde. In Abbildung 14 findet sich zum besseren Verständnis die Ansicht eines Menüpunktes im Fach Mathematik mit Beurteilungen für den fiktiven Schüler ‚Stig Lennart Allen‘.

Abb. 14 – Ansicht eines Menüpunktes im Beurteilungsprogramm „Planering & Bedömning“ (Quelle: IST - IT for Education, o.J.)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

333

Die grün hinterlegten Felder markieren die von diesem fiktiven Schüler erreichten Lernziele auf dem jeweiligen Niveau (E, C, A), am rechten oberen Rand findet sich eine Art Kurzübersicht mit den erreichten Notenniveaus. Im unteren Teil folgt ein Feld für freie Eintragungen in denen auch das Wort lärarkommentar zu finden ist: hier können von den Lehrkräften Notizen zu einzelnen Schüler_innen vermerkt werden bzw. Rückmeldungen an die Schüler_innen formuliert werden. Zudem gibt es die Möglichkeit, die Anwesenheit der Schüler_innen in einzelnen Unterrichtsstunden zu notieren, sowie weiterführende Materialien oder Hausaufgaben zu den einzelnen Sitzungen einzustellen, die dann von den Schüler_innen heruntergeladen bzw. bearbeitet werden können.

Arbeitserleichterung durch digitales Beurteilungswerkzeug Fredrik berichtet nun im Interview, wie er mit Hilfe dieses Programms seinen Unterricht plant, indem er einzelne Unterrichtseinheiten und Beurteilungssituationen basierend auf den vorgegebenen Lehrplanzielen für das jeweilige Fach aus einer Liste auswählt, per „drag & drop“-Befehl in die Planungsansicht einfügt und anschließend die Unterrichtseinheiten mit den Klassenlisten verknüpft. Er betont dabei mehrfach, wie einfach dieses Verfahren sei und dass es sich um eine große Arbeitserleichterung handele (das hilft wirklich sehr/det hjälpa väldigt mycket, Z. 85). Im Folgenden wird der Aspekt der Arbeitserleichterung im Hinblick auf seine Funktion für Fredriks Gerechtigkeitsüberzeugung näher betrachtet. Dazu zunächst ein Auszug vom Beginn des Interviews: ”Und wenn man dann anfängt mit etwas zu arbeiten, dann nimmt man sich den zentralen Inhalt, den man für wichtig hält und den man bei diesem Thema dabeihaben soll. Man nimmt sich die Lernziele und WÄHLT sie aus.“174 (Z. 18-20)

174

Original: „Och när man då börjar jobba med någonting så plockar man centrala innehållet man tycker är viktigt som man ska ha med i arbetsområdet. Man plockar kunskapsmålen och VÄLJER ut dem.” (Z. 18-20)

334

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Fredrik beschreibt hier sein Vorgehen bei der Unterrichtsplanung: ausgehend von dem im Lehrplan definierten zentralen Inhalt, wählt er die entsprechenden Lernziele aus, die „man für wichtig hält“ und „dabeihaben soll“. Hier manifestiert sich eine gewisse Grundspannung zwischen seiner persönlichen Einschätzung dessen, was unterrichtsrelevant ist und er in seinem Fach behandeln möchte – „was man für wichtig hält“ – und dem, was an Unterrichtsinhalten offiziell vorgegeben ist, was man also „dabeihaben soll“. Der relativ offen gehaltene Lehrplan, der lediglich die Lernziele vorgibt, die am Ende der 9. Klasse erreicht werden sollen, eröffnet dabei Spielräume für die Lehrkräfte, was die Auswahl der Unterrichtsinhalte, deren Abfolge und Vertiefung im Verlauf der drei Schuljahre nach ihren individuellen Vorstellungen (und Vorlieben) angeht. Fredrik verwendet hierfür in dieser Passage mehrfach das Verb plockar ut, was sinngemäß mit ‚herauspicken‘, ‚aufsammeln‘ oder ‚abpflücken‘ übersetzt werden kann. Die Darstellung der Lehrplanziele im Beurteilungsprogramm erscheint damit als Angebot, als Tableau des Möglichen, ähnlich einem reich gedeckten Buffet, aus dem die Lehrkräfte sich nun das Passende ‚herauspicken‘ können. Gleichzeitig bleibt es eine Wahl aus vorgegebenen Alternativen. Dass er die Möglichkeit des Wählens jedoch auch sprachlich betont („man WÄHLT sie aus“), kann als Hinweis auf ein Beharren seinerseits auf die zwar eingeschränkten, aber doch möglichen und vor allem von ihm genutzten professionellen Entscheidungsspielräume gedeutet werden. Im weiteren Verlauf des Interviews wird außerdem deutlich, dass das Beurteilungsprogramm auch als Instrument der (Selbst-)Kontrolle für Fredrik dient, wenn er im folgenden Auszug erklärt, dass das Programm ihm dabei helfe den Überblick zu behalten, dass „alle Lernziele durchgearbeitet wurden“, er mit seinen Schüler_innen „die richtigen Sachen“ bearbeitet habe und „nichts vergessen“ wurde: ”Also, wenn sie von der Siebten bis zur Neunten gekommen sind, dann soll man zum Beispiel in Biologie sehen können, da sollen alle Lernziele durchgearbeitet (.) worden sein eigentlich. Und es soll irgendeine Form der Beurteilung geben dafür. (.) So, dass,

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

335

ob das jetzt so hundertprozentig ist, aber das ist die Idee dahinter. Der Sinn ist, dass 175 man (.) nicht so viel vergisst und mit den richtigen Sachen arbeitet.“ (Z. 31-35)

Mit der genauen Auflistung aller vorgesehenen Lernbereiche und dem sukzessiven „Durcharbeiten“ dieser im Verlauf der drei Schuljahre – was durch eingetragene Beurteilungen für jeden einzelnen Lernbereich wie auf einer Art Checkliste markiert wird – wird den Lehrkräften einerseits eine Orientierung geboten. Das „Durcharbeiten“ und anschließende Abhaken der Themen soll dabei verhindern, dass die Lehrkräfte den Überblick verlieren. Andererseits wirkt sich die digitale Übersicht über alle potentiell zu behandelnden Themen und gleichzeitige Verknüpfung mit Beurteilungen in gewisser Weise auch disziplinierend auf die Lehrer_innen aus, indem sichergestellt wird, dass „mit den richtigen Sachen“ – also dem, was an Unterrichtsinhalten im Lehrplan vorgesehen ist – gearbeitet wird. Gleichzeitig lässt Fredrik durch zwei relativierende Einschübe („ob das jetzt so hundertprozentig ist“; „eigentlich“) offen, inwieweit seine Beurteilungspraxis tatsächlich von den Lehrplanvorgaben beeinflusst ist bzw. wo er sich eventuell auf professionelle (Entscheidungs-)Spielräume beruft und davon abweicht. Neben der lernzielorientierten Unterrichtsplanung erfüllt das Programm „Planering & Bedömning“ die Funktion der digitalen Dokumentation von Leistungsbeurteilungen für einzelne Schüler_innen. Im folgenden Auszug beschreibt Fredrik, wie er im Anschluss an die jeweiligen Unterrichtseinheiten das Beurteilungsprogramm nutzt, um darin den Lernstand seiner Schüler_innen zu vermerken: „Nachdem man damit gearbeitet hat (.) geht man ganz einfach hier rein und klickt das mit einer Farbe an. Rot, wenn sie, ich spreche jetzt über jedes Lernziel. Dass du/ Wenn ein_e Schüler_in das Lernziel nicht erreicht hat zum Beispiel. Wenn man das getestet hat, mündlich oder schriftlich oder einen Test, dann färbt man entweder mit 175

Original: „Så när de har gått från sjuan till nian, då ska du kunna titta på i biologi till exempel, då ska ju alla kunskapsmålen vara (.) genomarbetade egentligen. Och det ska finnas någon form av bedömning på det. (.) Så att, sen om det blir så hundraprocentigt, men det är ju det som är tanken. Så me=meningen är att man ska (.) inte missa så mycket och jobba med rätt saker.” (Z. 31-35)

336

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Rot, hat es nicht geschafft, mit Gelb, hat etwas davon geschafft. Und äh Grün, dann=dann ist das okay. Und dann gibt man auch/ Da sitzt dann auch eine Note, E, C oder A. So, so geht das. So dass man, wenn man alle Themenbereiche bearbeitet hat, dann sollten die Wissensanforderungen beurteilt worden sein (.) für jede Schülerin.“176 (Z. 23-28)

Die Verwendung der Beurteilungssoftware scheint für Fredrik zunächst vor allem eine Arbeitserleichterung darzustellen, eine technische Unterstützung seiner Beurteilungspraxis. Die vorgegebenen Menüpunkte und Dokumentationsoptionen ermöglichen eine intuitive, leichte Bedienung, wie an der Formulierung „geht man ganz einfach hier rein“ deutlich wird. Vereinfacht wird die Beurteilungsaufgabe scheinbar auch durch eine Farbkodierung für die Notenstufen, die von dem Programm unterstützt wird. Diese Art ‚Ampelbeurteilung‘, bei der die Farben – ähnlich wie die Lichter einer Ampel auch – den Schüler_innen ein Signal bezüglich ihres Lernstandes geben, scheint sehr eingängig. Den Lehrkräften wiederum ermöglicht die Farbkodierung einen schnellen Überblick über den Lernstand einer Klasse oder einzelner Schüler_innen und sendet auch ihnen Signale, wo sie gegebenenfalls mithilfe gezielter Unterrichtsmethoden gegensteuern müssen bzw. welche Unterrichtsthemen ausreichend behandelt worden sind.177 Anders als die Buchstabennoten ist mit den Farbkodierungen jedoch eine etwas gröbere Zuordnung zu ‚Ampelphasen‘ möglich, die von Fredrik auch nicht mit den Bewertungsbegriffen (värdeord) für die jeweiligen Buchstabennoten umschrieben 176

Original: „Sen efterhand som man jobbar (.) så går man helt enkelt in och klickar i med en färg. Rött om de, nu pratar jag om varje kunskapsmål. Att du/ Om eleven inte har eh uppnått ett kunskapsmål till exempel. När man har testat det muntligt eller skriftligt eller ett prov, så sätter man antingen rött färg är ju inte klarat det, gult att det=det fattas någonting. Och eh grönt då=då är det okej. Och då sätter man också/ Då sitter det också ett betyg, E, C eller A. Så, så är det. Så att när man har jobbat färdigt arbetsområdet så ska de kunskapsmålen vara bedömda (.) på varje elev.” (Z. 23-28) 177 Die Rückmeldung mit Hilfe von farblich markierten Beurteilungsbögen oder anderen Beurteilungsmaterialien wird auch von mehreren schwedischen Lehrkräften im Sample angewandt: z.B. nutzen Mats und Karin ebenfalls die klassischen Ampelfarben Rot-GelbGrün, Pernilla hingegen verwendet die Farben Rot, Blau und Grün, und Barbro schraffiert die erreichten Lernziele mit einem Bleistift Grau aus.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

337

werden, sondern mit eher vagen Formulierungen wie „hat es nicht geschafft“ (Rot), „hat etwas davon geschafft“ (Gelb) und „dann ist das okay“ (Grün). Sowohl den Schüler_innen als auch den Lehrkräften ermöglicht diese Farbkodierung eine etwas offenere Rückmeldung zum Leistungsstand, ohne direkt an eine Notenstufe gekoppelt zu sein. Fredrik weist an anderer Stelle auch extra darauf hin, dass das Beurteilungsprogramm zwar den Anschein eines eher summativen Beurteilungsinstruments habe, für ihn aber die formative und ganzheitliche Beurteilung im Vordergrund stünde: „[...] und wenn ich mich durch das ganze Halbjahr gearbeitet habe, dann habe ich eine Menge. Also das fängt an sich hier aufzubauen, plopp=plopp=plopp. Das wird mehr und mehr, und dann bekomme ich für alle Unterrichtsthemen Resultate hier. Und na klar, das sieht aus wie ein E, aber, wenn ich mir das ansehe, (.) dann steht darunter noch was worauf es hinausläuft. Also das ist nicht/Das ist nicht/ Das sieht ein wenig summativ aus hier. Aber eigentlich ist das mehr äh (.) eine mehr ganzheitliche Beurteilung. Es gibt viel mehr dahinter (.) ähm das formativ ist. Also das ist eigentlich eine formative Beurteilung, obwohl man=man sieht es nicht so richtig.“ 178 (Z. 206212)

Obwohl Fredrik seinen formativen Anspruch betont, wird doch gerade in der letzten Formulierung deutlich, dass die Art und Weise der Darstellung im Beurteilungsportal für Schüler_innen eventuell zu einseitig auf die Notenstufen – und damit eine summative Zusammenfassung ihrer Leistungen – wahrgenommen werden kann. Fredriks Erklärungen, dass sich in den freien Feldern auch noch zusätzliche, weiterführende Informationen finden lassen, die über das reine Notenniveau E hinausreichen, lassen sich vor allem vor dem Hintergrund der starken Betonung formativer Beurteilungen in den offiziellen Regularien verstehen. Fredrik 178

Original: „[...] så när jag har jobbat igenom hela terminen då har jag ju jag mycket, alltså det börjar bygga upp här ju plopp=plopp=plopp. Det blir mer och mer sådant här ju eh för varje arbetsområde så får jag resultat här ju. Och eh visst, det ser ut som ett E men om jag tittar på det (.) så står det ju mynna någonting under det. Så det är inte/ Det är ju inte/ Det ser ju lite summativt ut här. Men det är ju egentligen eh (.) en mer helhetsbedömning. Det finns ju mycket mer bakom (.) ehm formativ är det ju. Så detta är ju egentligen en formativ bedömning fast man=man ser ju inte riktigt.” (Z. 206-212)

338

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

weiß, dass eine rein summative Beurteilung auf der programmatischen Ebene abgelehnt wird und betont daher den formativen Charakter des Programms. Offenbleiben muss an dieser Stelle jedoch, inwiefern auch die Schüler_innen diesen formativen Zug erkennen können, obwohl man „es nicht so richtig“ sehen kann. Die Beschreibung seiner Arbeit mit dem Programm erzeugt denn auch einen eher mechanischen Eindruck: Fredrik wählt die Lernziele aus, die „Resultate“ bauen sich in den Registern des Programms auf, „plopp=plopp=plopp“, dann die entsprechenden Beurteilungen anklicken, einfärben, „ganz einfach“, „so geht das“. Auch an anderen Interviewstellen fällt auf, dass es kaum Momente des Zögerns oder Haderns in seinen Schilderungen gibt, es für ihn kaum Schwierigkeiten bei der Leistungsbeurteilung zu geben scheint. Im Vordergrund steht die ‚richtige‘ Zuordnung von Schüler_innenleistungen zu verschiedenen Notenniveaus oder Farbkodierungen, der Prozess des ‚Einsortierens‘ wird damit zum Kernprozess schulischer Leistungsbeurteilung in seinen Erzählungen. Dabei erwähnt er jedoch an keiner Stelle einen Entwicklungsprozess von Schüler_innen, der Vergleich mit früheren Leistungen (individuelle Bezugsnorm) oder aber der Lerngruppe (soziale Bezugsnorm) findet – zumindest in seinen Erzählungen – nicht statt. Die Orientierung an den Lehrplanzielen und Wissensanforderungen, also die kriteriale Bezugsnorm, taucht hingegen mehrfach im Verlauf des Interviews auf. Im Folgenden soll noch näher auf die oben angesprochene Funktion der Arbeitserleichterung eingegangen werden. Dazu wird ein weiterer Ausschnitt eingeführt, in dem Fredrik die Vorteile des Beurteilungsprogramms bei der Unterrichtsplanung gegenüber seiner bisherigen Arbeitsweise mit klassischen Papiernotizen und einem Klassenbuch bzw. einem Textverarbeitungsprogramm am PC beschreibt: „Ich muss nicht SELBST das aufschreiben, was dort stand. Sondern ich schaue, wo ich denke, die passen rein und: ‚Ja, das hier mit ökologischer Nachhaltigkeit, ja damit will ich arbeiten.‘ Also ich muss nicht selbst den Text produzieren, sondern die=die/ Sondern, ja, es ist ein wenig ‚Ausschneiden und Einfügen‘. So, dass ich da reinbekomme,

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

339

was und mit welchen Sachen wir arbeiten sollen. Alles=alles, was es im Lehrplan gibt, 179 gibt es hier.“ (Z. 68-71)

Erneut taucht hier die Figur des Auswählens aus vorgegebenen Alternativen auf, diesmal ergänzt um die Frage der Konsequenzen für den notwendigen Arbeitsaufwand: mit dem Beurteilungsprogramm wird Fredrik von der Aufgabe erlöst bei seiner Unterrichtsplanung „selbst den Text [zu] produzieren“, und kann sich mit Hilfe der Funktionen „Ausschneiden und Einfügen“ („copy and paste“ bzw. „klipp och klistra“) diesen Arbeitsschritt erleichtern. Neben dem rein physischen Aspekt, dass Fredrik nun „nicht SELBST das aufschreiben“ muss, was offenbar eine eher unangenehme Aufgabe für ihn ist, geht hier auch eine gewisse kognitive Erleichterung einher: durch die im Programm hinterlegten Lehrplanvorgaben wird durch einfaches Anklicken bzw. copy and paste eine Zuordnung von Lehrinhalten zu Jahrgangsstufen ohne zusätzlichen Rechercheaufwand ermöglicht. Die Frage der Unterrichtsplanung reduziert sich mehr oder weniger auf das Auswählen aus dem Angebotskatalog des Programms, denn „alles, was es im Lehrplan gibt, gibt es hier“. Die komplexe ‚Übersetzungsleistung‘ der Vorgaben in konkrete Unterrichts- und Beurteilungssituationen wird somit zumindest ein Stück weit vereinfacht und gerinnt zu einer fast schon mechanischen Sortierarbeit. Denn durch die Sortierung von Themen zu Lerngruppen entsteht so auch jeweils eine Liste von noch nicht im Unterricht behandelten Themen, aus der sich wiederum die Planung der kommenden Lernzeiträume ableiten lässt. Die Arbeitserleichterung findet also auf mehreren Ebenen statt: das Programm erleichtert zunächst die Unterrichtsplanung (Inhalte „einfach“ auswählen und zusammenstellen) und gibt dann auch Orientierung im Verlauf des Schuljahres mit Blick auf die im Lehrplan vorgesehenen Lerninhalte (also, welches Thema wurde schon bzw. noch nicht behandelt). 179

Original: „Jag behöver inte SJÄLV skriva det som stod där. Utan jag tittar, vilka tycker jag passar in på dem och att: ;Jo, men det här med=med ekologisk hållbarhet, ja det vill jag jobba med.’ Så jag behöver ju inte själv producera texten utan de=de/ Utan ja, det är lite klipp och klistra. Så att jag får in det och de grejerna som vi ska jobba med. Allt=allt som finns i läroplanen, finns där.“ (Z. 68-71)

340

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Beides führt auch in gewisser Weise zu einer Normierung des Unterrichts bzw. der Unterrichtsinhalte auf der Grundlage der zentral vorgegebenen Lehrpläne, ganz im Sinne des in Kapitel 5.1.2 eingeführten Anspruchs an eine landesweit „gleichwertige Bildung“ (likvärdig utbildning). Darüber hinaus dienen die im Programm vorgenommenen Beurteilungen auch als Vorlage für die Rückmeldung zum individuellen Lernstand an die Schüler_innen und als Kommunikationshilfe für Gespräche mit deren Eltern. So hat sich das Programm beispielsweise für die Kommunikation mit den Eltern während des Schuljahres und in Vorbereitung auf die sogenannten Entwicklungsgespräche (utvecklingssamtal), die zweimal pro Schuljahr zwischen den Lehrkräften, Schüler_innen und deren Eltern stattfinden, bewährt: „[...] die Eltern haben ein Passwort, können sich einloggen und alles nachverfolgen. 180 (.) Äh und wenn man sich zum Entwicklungsgespräch trifft, IUP und so, dann soll/ braucht man nicht anfangen massenhaft Neues zu schreiben, sondern man kann das hier als Ausgangspunkt nutzen, wenn es um die Fächerbeurteilung geht. Da geht man rein und schaut ein wenig, dann kann man vielleicht den Fokus mehr auf das Soziale legen, wie es so allgemein klappt in der Schule. Früher haben wir dagesessen und WAHNSINNIG viel geschrieben.“ 181(Z. 76-80)

Durch das für alle Beteiligten zugängliche Beurteilungsportal wird eine Transparenz geschaffen, die den Eltern einen Einblick in die Unterrichtsplanung der Lehrkraft und den Lernstand ihrer Kinder ermöglicht ohne 180

IUP ist die Abkürzung für individuell utvecklingsplan, also einen individuellen Förderoder Entwicklungsplan, der auf der Grundlage der Beurteilungen der Lehrkräfte beim Entwicklungsgespräch erarbeitet und zwischen den drei anwesenden Parteien (Lehrkraft, Schüler_in, Eltern) vereinbart und mit einer Unterschrift besiegelt wird. Vgl. ausführlicher dazu Kap. 5.1.2 181 Original: „[..] föräldrarna har inloggning, kan gå in och följa efter hand. (.) Eh och när man sitter på individuella utvecklingssamtal, IUP och sådant, så ska/ behöver man inte börja skriva en massa nytt utan man kan använda det här som en=en utgångspunkt när det gäller ämnesbedömningen. Gå in och titta här lite, sen kan man lägga fokus kanske mer på det sociala, hur det funkar i skolan allmänt. Innan har vi suttit och skrivit JÄTTEmycket.” (Z. 76-80)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

341

direkt auf ein Gespräch mit oder eine Information durch die Lehrkraft angewiesen zu sein. Für Fredrik wiederum fällt durch diese Möglichkeit der elterlichen Einsichtnahme eine scheinbar eher belastende Aufgabe – die schriftliche Dokumentation der Leistungsentwicklung der einzelnen Schüler_innen bzw. ausführliche Besprechung dieser Dokumentationen im Entwicklungsgespräch – weg. Die dadurch gewonnene Zeit im Entwicklungsgespräch kann so für andere Aspekte des Schullebens, wie „das Soziale“, verwendet werden. Das Beurteilungsportal wird so für Fredrik auch zu einem Steuerungsinstrument der Kommunikation mit Eltern und Schüler_innen: diese können (und sollen) sich jederzeit selbst über den Lernfortschritt der Schüler_innen informieren, die Lehrkraft wird von der Mitteilungspflicht dadurch teilweise entlastet. Ich komme darauf in einem gesonderten Abschnitt weiter unten zurück. Fredrik bezeichnet das Beurteilungsprogramm selbst als „Werkzeug“ (verktyg, Z. 105) und sehr hilfreich (det hjälpa väldigt mycket, Z. 85) für seine Unterrichts- und Beurteilungspraxis. Doch neben der bisher geschilderten Arbeitserleichterung auf verschiedenen Ebenen zieht Fredrik auch eine grundlegendere Legitimation seines Beurteilungshandelns aus der Anwendung dieses Werkzeugs – der Rückgriff auf ein scheinbar unpersönliches, und damit in seinen Augen objektiveres Verfahren dient auch der Steigerung der Gültigkeit seiner Beurteilungsentscheidungen, wie im folgenden Abschnitt verdeutlicht wird.

„Objektive“ und kleinschrittige Beurteilung als ‚gerechte‘ Beurteilung Wie bereits ausgeführt, ermöglicht Fredrik das Beurteilungsprogramm eine relativ einfache Zuordnung der im Lehrplan vorgesehenen Lernziele und Wissensanforderungen zu konkreten Beurteilungsmomenten und einzelnen Schüler_innen. Diese Zerlegung des Beurteilungsvorgangs in kleinere Teilschritte taucht in Fredriks Interview an verschiedenen Stellen immer wieder auf. Um jedoch als ‚gerechte‘ Beurteilung qualifiziert zu werden, führt Fredrik darüber hinaus ein weiteres Kriterium ein – die objektive Beurteilung von Schüler_innenleistungen: „Ein ein=eine RICH-

342

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

TIG gerechte Beurteilung ist, wenn man bei JEDEM KLEINEN Schritt von Anfang an (..) eine objektive Beurteilung macht“ (Z. 448-449). 182 Durch die Zerlegung von Beurteilungen in viele kleine Teilbeurteilungen und die detaillierte Dokumentation dieser Teilbeurteilungen erhofft sich Fredrik eine objektivere und dadurch in seinen Augen gerechtere Beurteilung der Schüler_innenleistung. Auf die Nachfrage, was er unter einer „objektiven Beurteilung“ versteht, antwortet Fredrik folgendermaßen: „Ja, dass ich das beurteile, was sie gemacht haben. Nicht das, unabhängig davon welche Person das ist. Ich kann sogar sagen: ‚Ihr schreibt das hier, aber ihr schreibt euren Namen auf die Rückseite, so dass ich nicht weiß, von wem das ist.‘ Und dann korrigiere ich das. (..) Denn bestimmt ist es so, dass (.) es passiert schnell, dass man gewisse Sachen von Schüler_innen erwartet, die auf eine bestimmte Weise gehandelt haben und aktiv waren.“183 (Z. 471-474)

Für Fredrik ist eine Beurteilung, die unparteiisch erfolgt und losgelöst von möglichen Erwartungshaltungen gegenüber Schüler_innen der Inbegriff einer objektiven (und damit gerechten) Beurteilung. Mit dem Fokus auf die gezeigten Leistungen („was sie gemacht haben“) einher geht scheinbar der Wunsch danach, bei der Beurteilung ausschließlich die ‚tatsächliche‘ Leistung der Schüler_innen zu bewerten und andere Aspekte – wie ihr Verhalten im Unterricht und daraus abgeleitete Leistungspotenziale – möglichst auszuschließen. Auch der Aspekt der Unpersönlichkeit ist hier zentral: Beurteilungen sollen für Fredrik am besten „unabhängig davon welche Person das ist“ erfolgen. Diese Unpersönlichkeit kann zunächst in zwei Richtungen gedacht werden: Beurteilung unabhängig davon, wer beurteilt wird (welcher oder welche Schüler_in also beurteilt wird) und Beurteilung unabhängig davon, wer die 182

Original: „En en=en RIKTIGT rättvis bedömning är ju att man i VARJE LITET läge här från början (..) gör en objektiv bedömning.” (Z. 448-449) 183 Original: „Ja, att jag bedömer det de har gjort. Inte på, utifrån vilken person det är. Jag kan till och med ta att: ,Ni skriver det här, men ni skriver namnen på baksidan, så att jag inte vet vem det är.’ Och så rättar jag det. (..) För visst är det så att när man, om (.) det är lätt hänt att man förväntar sig vissa saker av en elev som har agerat på ett visst sätt och varit aktiv.” (Z. 471-474)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

343

Beurteilung vornimmt (welche Lehrkraft also beurteilt). Sein Umsetzungsvorschlag für eine solcherart von Personen unabhängige und damit objektive Beurteilung ist dann das (pseudo-)anonyme Anfertigen einer Aufgabe, indem die Schüler_innen ihren Namen auf die Rückseite einer Arbeit schreiben. Dieses Vorgehen soll anscheinend verhindern, dass die Lehrkraft durch Erwartungshaltungen gegenüber bestimmten Schüler_innen bei der Beurteilung ihrer Leistungen beeinflusst wird. Auf diese Weise wird für die beurteilende Lehrkraft eine Trennung zwischen ‚tatsächlicher‘ Leistung und den persönlichen Eigenschaften der Schüler_innen möglich, die dann zu einer gerechteren Beurteilung führen soll. Ähnlich argumentiert er in Bezug auf die Korrektur der landesweiten Tests (nationella prov) bei der er ebenfalls eine Beurteilung möglichst frei von persönlichen Eindrücken favorisiert: „Da korrigieren wir nicht unsere eigenen Schüler_innen, sondern wir korrigieren sie gegenseitig.“184 (Z. 176-177). Analog zu statistischen Messverfahren, bei denen durch die Erhebung möglichst vieler Daten versucht wird, die Schätzfehler zu reduzieren und die Aussagekraft der Daten zu erhöhen, kann auch Fredriks Bemühen um eine möglichst kleinteilige Beurteilung bzw. das Sammeln von möglichst vielen Eindrücken als Versuch der Annäherung an die ‚tatsächliche‘ Leistung der Schüler_innen gelesen werden: „Ich glaube, wenn man es in kleinere Schritte zerteilt, glaube ich, wird es schwieriger ungerecht zu sein. Wenn es nur/wenn du das nicht machst, hast du es nur ein bisschen in deinem Kopf. Und irgendwelche Aufzeichnungen, und dann vergibst du am Ende eine Zensur. Da ist es glaube ich leichter, ein bisschen ungerecht in seiner Beurteilung zu sein. Da is/ Es ist weniger deutlich, was passiert ist, es ist mehr so als ob du Dir ein Bild machst. Und dieses Bild kann sich verändern. Das ist wie bei Zeugen. Drei Leute, es passiert etwas und Du und ich sollen aussagen, dann sagen wir zwei verschiedene Sachen. U:und wenn ein anderer etwas anderes sagt, ändert das unsere Erinnerung und wie wir darüber denken, also das ist klar (.) ja, also das hier [zeigt auf

184

Original: „Då rättar vi ju inte våra egna elever. Utan vi rät=rättar varandras.” (Z. 176177)

344

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Laptop], glaube ich, macht es gerecht. GERECHTER. (.) Es gibt kein perfektes System“ 185 (Z. 459-466)

In diesem Auszug zeigt sich die Verbindung einer objektiven, da unpersönlich und auf kleinteiliger Beurteilung beruhenden Beurteilung und der eingangs beschriebenen Wahl des Beurteilungsprogramms als nützlichem „Werkzeug“. Fredrik versucht, möglichst viele Beurteilungsmomente (bedömningstillfälle) zu schaffen, aus denen in der Summe dann ein Gesamturteil entstehen kann, das möglichst ungetrübt durch den ‚subjektiven Faktor‘ der beurteilenden Lehrkraft – wie beispielsweise durch Sympathie gegenüber oder Erwartungen zum Leistungsvermögen von Schüler_innen – ist. Gleichzeitig vertraut er seinem Erinnerungsvermögen an eben diese vielfältigen Beurteilungsmomente weniger als der Software zur Dokumentation der Teilleistungen. Eine Beurteilung, die „nur ein bisschen in deinem Kopf“ stattfindet bzw. durch „irgendwelche Aufzeichnungen“ dokumentiert wird, wird folgerichtig von ihm auch als „ungerecht“ bezeichnet. Das Hilfsmittel seiner Wahl ist nicht der eigene „Kopf“, die eigene Erfahrung, sondern vielmehr die Zerlegung von Schüler_innenleistungen in kleinere Einheiten und deren Speicherung im Beurteilungsprogramm („ja, also das hier [zeigt auf Laptop], glaube ich, macht es gerecht“). Die Zuhilfenahme eines technischen Geräts erzeugt für ihn auch eine Art von Absicherung gegenüber der Veränderlichkeit von Erinnerungen und persönlichen Eindrücken, wie an dem von ihm herangezogenen Beispiel der Unzuverlässigkeit von Zeugenaussagen deutlich wird. Durch das Abspeichern seiner im Grunde immer noch subjektiven Eindrücke in einem Gerät wird die Beurteilung von Schü185

Original: „Jag tror att bryter ner det i mindre bitar, så tror jag att det är svårare att va/ att vara orättvis. Om det bara blir att du=du gör inte så mycket sådant, du=du har det bara i huvudet lite. Och någon anteckning, och så sätter du ett betyg i slutet. Då tror jag att det är lättare att vara lite orättvis i sin bedömning. Då s/ det är inte så tydligt vad som har hänt här, utan det blir liksom, du målar upp en bild. Och den bilden kan ju förändras. Det är ju som vittnen. Tre personer, händer något här och du och jag ska vittna så säger vi två olika saker. O:och är det någon annan som berättar någonting så ändras vårat minne och hur vi tänker, så det är klart att (.) ja, så det här [visa på datorn] tror jag gör det rättvist. RÄTTVISARE. (.) Det finns inga perfekta system.” (Z. 459-466)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

345

ler_innen objektiviert und versachlicht – und damit in seinen Augen gerechter. Die digitale Übersicht im Beurteilungsprogramm stellt demnach sicher, dass die Lehrkräfte bei der finalen Zeugnisnotenerstellung auch auf alle festgehaltenen Teilleistungen und –eindrücke aus dem Schuljahr zurückblicken können, ohne etwaige Erinnerungslücken oder andere subjektive ‚Fehlerquellen‘ zu riskieren. Das Programm ist neutral und zuverlässig, und liefert – anders als die menschliche Erinnerung – ‚handfeste Beweise‘, um in der Analogie der Zeugenaussage zu bleiben. Durch die Anwendung eines scheinbar neutralen Verfahrens der Dokumentation, unter Zuhilfenahme eines technischen Hilfsmittels, dessen Operationen zudem mit den offiziellen Regularien abgestimmt sind, zeigt sich Fredriks zentrale Orientierung an einer durch Verfahrensweisen objektivierbaren Beurteilung als Grundkonstante seiner Gerechtigkeitsüberzeugung. Durch die Relativierung und Einschränkung der Möglichkeit gerechter Leistungsbeurteilung am Ende des oben zitierten Abschnittes („es gibt kein perfektes System“) verdeutlicht Fredrik allerdings auch, dass ihm die Grenzen seiner Objektivierungsstrategie durchaus bewusst sind. Als Hindernis für ein „perfektes System“ gerechter Leistungsbeurteilung führt Fredrik nun erneut „das Subjektive“ an: „Also, es ist klar, dass (.) man versucht GERECHT zu sein, aber manchmal ist man nun mal, man nimmt manchmal das Subjektive mit hinein, welche Person es ist, verstehst Du was ich meine? [...] Obwohl man manchmal das mitberücksichtigen muss, denke ich. Bei denjenigen, die kleinere Schwierigkeiten haben, zum Beispiel. Dass man sieht, dass einer so SCHREIBT, (.) aber das Wort, der=der Ausdruck ist vielleicht nicht ganz richtig, aber ich weiß, was sie meinen. [...] Aber gerechte Beurteilung ist schon, darüber könnte man beliebig lange sprechen, es gibt kein System, das mir einfällt, das (.) komplett gerecht ist. (.) Am Ende bist trotzdem du/ äh du derjenige, der etwas festlegt.“186 (Z. 479-488)

186

Original: „Så det är klart att (.) man försöker vara RÄTTVIS men ibland så är man ju, man tar ju ibland in det subjektiva, vilken person är, du förstår hur vad jag menar? [...] Fast ibland så måste man ta hänsyn tycker jag, till det. Till vissa som har lite, svårigheter de har till exempel. Att man ser att den=den SKRIVER såhär (.) men det ordet, det=det

346

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

„Das Subjektive“, der menschliche Faktor, wird hier als Begrenzung seiner Idealvorstellung einer gerechten Leistungsbeurteilung eingeführt, die sich rein auf die ‚tatsächliche‘ Leistung der Schüler_innen konzentriert. Es steht im Gegensatz zu der oben skizzierten Objektivität und Unparteilichkeit gerechter Beurteilungen. Als mögliche Ausnahme führt Fredrik nun Schüler_innen an, die „kleinere Schwierigkeiten“ haben – hier sei es manchmal legitim, auch nicht ganz richtige Antworten, bei denen er als Lehrer weiß, was die Schüler_innen gemeint haben könnten, gelten zu lassen und sozusagen ‚ein Auge zuzudrücken‘. Worin genau diese „kleineren Schwierigkeiten“ liegen können, und wo die Grenze zu größeren, und ggf. nicht mehr tolerierbaren Schwierigkeiten liegt, wird nicht deutlich. Es scheint jedoch einen (kleinen) Spielraum für Lehrkräfte bei der Unterscheidung von legitimer Hilfe durch die Verwendung von Vorwissen über die Schüler_innen („ich weiß, was sie meinen“) und nicht mehr legitimer Hilfestellung bei größeren Fehlern zu geben. Und eben dieser Spielraum führt scheinbar zu seiner Absage an ein „komplett gerecht[es]“ Beurteilungssystem, denn am Ende seien es eben doch wieder die subjektiven Entscheidungen der Lehrkräfte, die sich nicht „komplett“ oder „hundert Prozent“ objektivieren bzw. standardisieren ließen. Dazu noch ein weiterer Auszug: „Aber GERECHT, hundert Prozent, das hängt all/ Das hängt=das hängt alles von demjenigen ab, der am Ende beurteilt. Und wir sind nun mal unterschiedliche Personen. (..) Aber eine Möglichkeit, es ein wenig gerechter zu machen, ist trotzdem, dass hier steht, was es sein soll. Mhm.“187 (Z. 500-502)

uttrycket är ju kanske inte riktigt rätt, men jag vet ju vad den menar. [...] Men rättvis bedömning är ju:u, det skulle man ju kunna prata hur länge som helst, det finns ju inget system kan jag tänka, som ä:är (.) helt rättvist. (.) Det är ju ändå slut/ e:eh du som s:s/ bestämmer någonting.” (Z. 479-488) 187 Original: „Men RÄTTVIST, hundra procent, det är ju all/ Det är ju=det är ju alltid upp till den som bedömer i slutändan. Och vi är ju olika som personer. (..) Men ett sätt att få det lite rättvisare är ju ändå att det står här vad det ska vara för någonting. Mm.” (Z. 500-502)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

347

Fredriks Überzeugung, eine gerechte Beurteilung könne nur eine objektive und möglichst unparteiische Beurteilung sein, findet ihre Begrenzung in der Unterschiedlichkeit der Beurteilenden. Diese Unterschiedlichkeit, die vermutlich auf verschiedene Wahrnehmungen und Überzeugungen von Lehrkräften hinsichtlich der schulischen Leistungsbeurteilung bezogen ist, scheint in Fredriks Augen unabänderlich. Die Lösung für ein – zumindest annäherungsweise – gerechtes Beurteilungssystem findet sich für Fredrik daher in der Anwendung der Beurteilungssoftware und der Lehrplanvorgaben von Skolverket. Mit der Formulierung „dass hier steht, was es sein soll“ ist der Lehrplan und die darin enthaltenen Wissensanforderungen für die verschiedenen Notenstufen gemeint. Der Vielfalt der Beurteilenden setzt Fredrik so die Einheitlichkeit der offiziellen Vorgaben entgegen, denn diese gelten für alle Schüler_innen gleichermaßen und existieren unabhängig von den Beteiligten (Lehrkraft und Schüler_in) – also personenunabhängig und neutral. Auch an anderen Stellen des Interviews kommt Fredrik auf die Frage einer ‚objektiven‘ Beurteilung als ‚gerechter‘ Beurteilung zurück. So führt er beispielsweise aus, warum er die Verwendung standardisierter Tests mit multiple-choice-Aufgaben, wie sie in US-amerikanischen Schulen oder bei der schwedischen Hochschuleignungsprüfung (högskoleprov) verwendet werden, auch stärker in der schwedischen Schule bevorzugen würde: „Anspruchsvolle Fragen mit nur einem Kreuz. [...] Das halte ich eigentlich für das gerechteste, eigentlich. [...] Weil man, JA, weil man kein/ Es gibt nur eine Alternative die richtig ist. (...) Also kann ich nicht dasitzen: ‚Aber sie, äh sie war in dieser Woche so nett.‘ Also, das ist FALSCH, es gibt einfach nur richtig oder falsch. [...] Und du=du kannst nicht einfach, du hast darin überhaupt gar KEINE subjektive Beurteilung. Wenn alles falsch ist, dann ist es eben falsch. So, dass, (.) das ist=wir haben kein solches Sys/ Wir=wir=wir=wir=wir haben so etwas nicht oft in der Schule, aber auf eine 188 Art glaube ich, dass das das gerechteste ist=ist.“ (Z. 515-531)

188

Original: „Avancerade frågor med bara ett kryss. [...] Det tror jag egentligen är det mest rättvisa egentligen. [...] För att du, JA för att du har ju ing/ Det finns bara ett alternativ som är rätt. (..) Så jag kan inte sitta: ,Men hon, eh hon har varit så trevlig den

348

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Neben der oben ausgeführten Vorliebe für eine möglichst objektive, d.h. unparteiische Beurteilung, die „überhaupt gar KEINE subjektive Beurteilung“ ermöglicht, wird hier auch deutlich, dass ein solches standardisiertes Beurteilungsverfahren auch die Beurteilungsentscheidung selbst für die Lehrkraft erleichtern könnte. Wenn es „einfach nur richtig oder falsch“ gibt, fallen die Ermessensspielräume und damit verbunden auch die Entscheidung der Lehrkräfte diese zu nutzen weg und weichen einem einfachen Richtig-Falsch-Schema. Denn, obwohl Fredrik einräumt, dass es manchmal legitim sei über kleinere Fehler hinwegzusehen, so ist dies doch immer wieder eine bewusste Entscheidung, die getroffen werden muss. Ein Verfahren, bei dem diese Spielräume von Anfang an nicht existieren, entfallen auch diese Entscheidungen (und ggf. rückwirkende Legitimierung von Ausnahmen) und die komplexe Beurteilungsaufgabe reduziert sich auf ein Auszählen der richtigen Kreuze. Als Grundbedingung nennt Fredrik dann auch, dass es „anspruchsvolle Fragen“ sein müssten, die Testkonstruktion also durchaus aufwändiger und komplex sein sollte. In einem solchen System wäre dann aber auch die Verantwortung der Lehrkraft für das Testergebnis geringer, da die Tests als solche solide Instrumente wären und falsche Antworten der Schüler_innen nicht mehr durch die Lehrkraft beeinflusst werden könnten (wie bei der bewussten Veränderung von Bepunktungsschemata, vgl. Kap. 6.3.1). Die Verantwortung wird so zu einem Großteil auf die Schüler_innen und das Beurteilungsinstrument verlagert, die Lehrkraft von der Beurteilungsentscheidung entlastet. Auf diesen Aspekt gehe ich im Folgenden noch näher ein.

här veckan.’ Ja, men det är ju FEL, det finns ju bara rätt eller fel. [...] Men du=du kan ju inte, du har ju INGEN subjektiv bedömning alls i det. Är det helt fel så är det ju fel. Så att (.) det är=vi har ju inte det sys:s/ vi=vi=vi=vi=vi har ju inte det mycket i skolan men på ett sätt tror jag att det är=är det rättvisaste.” (Z. 515-531)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

349

Verantwortungsübergabe durch digitale Beurteilung Wie oben beschrieben ermöglicht das Programm „Planering & Bedömning“ – neben der Einsicht in die Dokumentation der Lernentwicklung mit Hilfe der farblich markierten Wissensanforderungen – auch das Einstellen von Unterrichtsmaterialien und Hausaufgaben für einzelne Unterrichtseinheiten, die dann von den Schüler_innen wiederum heruntergeladen und bearbeitet werden können. Die dadurch hergestellte Transparenz über den Unterrichtsverlauf und die Beurteilungen im Laufe des Schuljahres ermöglicht es Fredrik auch einen Teil der Verantwortung für den Lernerfolg an die Schüler_innen und deren Eltern abzugeben. Der folgende längere Ausschnitt verdeutlicht dabei, dass das Beurteilungsprogramm neben der oben erwähnten Arbeitserleichterung und der (scheinbaren) Objektivierung der Beurteilung auch zu seiner Entlastung von erzieherischen Aufgaben beiträgt, die Kommunikation mit den und über die Schüler_innen verändert sowie eine Verantwortungsübergabe für die schulischen Lernerfolge erleichtert: „Mit den Computern hier, da können sie nun reingehen. Dann kann keiner sagen: [mit verstellter Stimme] ‚Ja, aber ich habe den Zettel von letzter Woche nicht mehr.‘ Nein, der liegt dort. Ich habe damit aufgehört, weil ich nicht will [atmet tief ein] [..] Ein Teil der Schüler_innen, da verschwinden Sachen einfach die ganze Zeit. Und dann rufen die Eltern an und sie sollten eine Menge Zeug zuhause haben und man soll sie erinnern und erinnern. Also habe ich ein bisschen mehr Energie dafür aufgewandt. Und dann: ‚Hier habt ihr alles. Wenn ihr euch nun ENTSCHEIDET, das nicht zu tun/‘. Du kannst am Strand auf den Bahamas liegen, wenn du WLAN hast. Oder liegst verletzt im Krankenhaus oder bist krank zuhause. Du kannst trotzdem dem Unterricht folgen. Du kannst es auf nichts mehr schieben. Und die Eltern können es nicht mehr abnehmen und jede Menge private Emails schicken, welche Hausaufgaben die Schüler_innen haben – denn darum geht es die ganze Zeit. Also: ‚Hier habt ihr das Paket‘ [überreicht ein imaginäres Paket]. Da brauche ich mich nicht mehr mit zu beschäftigen. Und dann kann ich ihnen helfen, aber kein SPEZIALSERVICE189 mehr. [...] Sondern 189

Das von Fredrik verwendete schwedische Wort „specialserva” könnte auch mit „Sonderbehandlung” oder „Extrawurst” übersetzt werden. Da ersteres ein historisch belasteter, zweiteres ein eher umgangssprachlicher Begriff ist, habe ich mich für das neutralere Wort „Spezialservice“ bei der Übersetzung entschieden. Inhaltlich ist damit eine beson-

350

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

(.) die Verantwortung übergeben. Und dieses System ist auch ein Weg dafür: ‚Ihr, die ihr eine Menge wissen wollt und den Schüler_innen JEDEN MONAT folgen wollt, bitteschön. Und die, die das langweilig finden, kommt einmal im Jahr vorbei, oder zweimal im Jahr und hört beim Gespräch zu.‘ Ja, auch okay, schaut ihr eben weniger hinein. Aber es liegt trotzdem an euch=bei euch. (..) Und das finde ich gut daran.“ 190 (Z. 329-342)

Auch im Hinblick auf Fredriks Selbstbild als Lehrkraft lassen sich in dieser Passage einige Hinweise finden: er schafft die Rahmenbedingungen für die Schüler_innen, erklärt ihnen die Anwendung der Plattform und stellt regelmäßig Informationen zum Lernstand der Schüler_innen darin ein. Wie die Schüler_innen das Portal und seine Möglichkeiten allerdings nutzen, liegt ganz klar nicht mehr in seiner Verantwortung („da brauche ich mich nicht mehr mit zu beschäftigen“). Er liefert alle notwendigen Informationen und Materialien, für das Lernen (bzw. Nachholen von Unterrichtsinhalten bei Krankheit) tragen die Schüler_innen und deren Eltern die Verantwortung – besonders deutlich wird dies in der die Passage unterstreichende Geste des Paketüberreichens. Auch die Betonung, dass es eine Entscheidung der Schüler_innen sei (‚Hier habt ihr alles. dere, mit zusätzlichem Aufwand für Fredrik verbundene Betreuung der Schüler_innen gemeint, die über das hinausgeht, was er im normalen Unterrichtsalltag leisten würde. 190 Original: „Så de har ju datorer, så de kan ju gå in. Så ingen kan säga: [verstellt seine Stimme] ,Ja, men jag blev av med den här lappen förra veckan.’ Nej, det ligger där. Så jag har slutat med det, för jag vill inte [atmet tief ein] (..) En del elever, grejerna bara försvinner hela tiden. Och så föräldrarna ringer och de ska ha massa grejer hem och man=man ska påminna och påminna. Så=så jag försökte lägga ner lite extra energi på det. Och sen: ,Här har ni allting. Om ni nu VÄLJER att inte göra det/’. Du kan ligga på en strand i Bahamas, bara du har wifi/ Eller ligga skadad på sjukhuset, eller vara hemma sjuk. Du kan följa undervisningen ändå. Du kan inte skylla på någonting. Och föräldrarna kan inte hålla på och=och ska ha en massa egna privata mail om vilka läxor eleven har för att det är detta hela tiden. Så: ,Ni har paketet här.’ [überreicht ein imaginäres Paket] Behöver jag inte bry mig mer om det. Och sen ska jag hjälpa dem, men inte SPECIALSERVA. [...] Utan (.) flytta över ansvaret. Och detta systemet är ju också ett sätt att: ,Ni som vill veta jättemycket och följa elever VARJE MÅNAD, varsågod. Ni som tycker det är tråkigt, kom hit en gång om året, eller två gånger om året och LYSSNA på samtalen.’ Ja men okejdå, titta inte på det här så ofta då. Men det ligger ändå på er=hos er. (..) Det tycker jag är bra med det.” (Z. 329-342)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

351

Wenn ihr euch nun ENTSCHEIDET, das nicht zu tun/‘), zeigt auf, dass mit der Nutzung bzw. Nicht-Nutzung der Plattform seine eigene Verantwortung endet und in die Verantwortung der Schüler_innen bzw. deren Eltern übergeht. An anderer Stelle formuliert er diese Verantwortungsübergabe noch deutlicher: „Dann kann man die Verantwortung mehr zu den Eltern rübergeben. Dann brauchen wir nicht mehr alles nach Hause schicken, sondern: ‚Geh rein und schau‘“191 (Z. 109-110). Legitimatorische Rückendeckung erhält Fredrik nicht zuletzt auch durch die im Lehrplan und anderen Publikationen von Skolverket immer wieder gewünschte Förderung eigenverantwortlicher Schüler_innen (vgl. Kap. 5.1.2). Das gewählte Verfahren fungiert dabei einerseits zur Transparentmachung und Objektivierung der Beurteilungen, gleichzeitig soll es auch die Schüler_innen wieder stärker in die Verantwortung nehmen. Auf der Ebene der Kommunikation und Vermittlung von getroffenen Beurteilungen entsteht darüber hinaus der Eindruck eines neutralen Mittlers zwischen Lehrkraft und Schüler_innen durch das scheinbar neutrale, unparteiische und damit ‚gerechte‘ Beurteilungsverfahren.

Illegitime Formen der Beurteilung und professionelles Selbstbild Fredriks Vertrauen in sein gewähltes Beurteilungsverfahren als Garant einer ‚gerechten‘ Beurteilung zeigt sich auch in der Ablehnung von anderen Beurteilungsformen, die er früher angewandt hat, wie beispielsweise die Verwendung von Notenschlüsseln und Punkterastern. Er berichtet in seinem Interview von einem Wandel seiner eigenen Beurteilungspraxis im Laufe der Zeit und beschreibt das Beurteilen im vorhergehenden schwedischen Benotungssystem (mit den Noten MVG, VG, G) ganz ähnlich zu dem, wie es von den nordrhein-westfälischen Lehrkräften beschrieben wird als hauptsächlich durch die Frage der richtigen Bepunktung geleitete Beurteilung. Diese war in seinen Augen stärker durch 191

Original: „Så man kan lägga över mer av ansvaret på föräldrar. Så inte vi behöver skicka hem allting, utan: ,Gå in och titta.’” (Z. 109-110)

352

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

eine gewisse Willkür geprägt, die mit der neuen Notenskala und der Hinwendung zu einer stärker kompetenzorientierten Beurteilung nun aufgehoben werden könne: „Und (...) da war es teilweise so, dass man bei kleinen Tests und Prüfungen viel mit Punkten gearbeitet hat. Und dann die Punkte addiert wurden. Und dann so nach Gefühl […]. Und dann viell/ Manchmal hatte man dann Grenzen. (.) So, um ein G zu bekommen, musst du mindestens so viele Punkte haben. Und dann für VG und für MVG. [...] Und jetzt ist es mehr so, dass man eher auf (..) das große Ganze schaut. [...] Der Vorteil davon ist, dass, wenn man, wenn man seine Fragen oder Aufgaben macht oder die Schüler_innen prüfen soll, mündlich, im Labor oder irgendeine Prüfung. Also dafür habe ich mir jedenfalls beigebracht genauer dabei zu sein, wie ich meine Fragen stelle. So dass ich diese Aufgaben leichter mit den Kompetenzen zusammenbringen kann. [...] Wenn ich meine Fragen nicht so gemacht habe (.) so, dass ich das RAUSHOLEN192 kann. Dann ist es wirklich, dann wird es ziemlich willkürlich.“ 193 (Z. 121-137)

Insbesondere Fredriks Assoziation des alten, eher auf Punkten und Prozentanteilen beruhenden Beurteilungssystems mit dem Begriff der Willkür lässt hier im Vergleich zu den Ausführungen anderer Lehrkräfte mit einer mathematisch-rechnerischen Gerechtigkeitsüberzeugung aufhorchen. Während die Umwandlung der Schüler_innenleistungen in Punkte und das Umrechnen dieser Punkte in Zensuren für die einen Lehrkräfte als Garant einer gerechten Leistungsbeurteilung gilt, stellt sie für Fredrik 192

Die Formulierung krämar ur ist umgangssprachlich und wird z.B. im Zusammenhang mit sportlichen Leistungen verwendet, bei denen jemand sich bis aufs Äußerste anstrengt und versucht ‚das Letzte herauszuholen‘. Sie kann aber auch im Sinne des creamskimmings, also sinnbildlichen ‚Sahne abschöpfen‘, verstanden werden. 193 Original: „Och (...) då var det ju dels så när man hade lite prover och tester så var det ju mycket poäng. Och så summerade man ju poängen. Och gjorde ju liksom en [unverst. det där med?] känsla. Och s:satte kan/ Ibland kanske man satte gränser. (.) Att, för att nå eh ett G så måste du minst ha så många poäng. Och sen VG, och så MVG. [...] Och nu har det väl gått mer att man tittar på (..) ännu större helheter. [...] Fördelen med detta är att när man, när man gör sina frågor eller uppgifter eller ska examinera eleven, muntligt, laborativt eller om det är någon prov. Så har jag lärt mig i alla fall att bli nogrannare med att tänka på hur jag ställer mina frågor. Så att jag lättare kan koppla de här uppgifterna till exempelvis just den förmågan. [...] Om jag inte har gjort mina frågor (.) så att jag liksom kan KRÄMA ur detta. Så är det väldigt, då blir det rätt så godtyckligt.” (Z. 121-137)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

353

eher den Inbegriff eines veralteten und auf willkürlichen Entscheidungen beruhenden Beurteilungssystems dar. Für ihn ist klar, dass trotz der scheinbaren Logik der Addition von Punkten die Grenzsetzungen zwischen den einzelnen Notenstufen doch auf Einzelentscheidungen der Lehrkräfte, teilweise „so nach Gefühl“ vorgenommen wurden. Die Orientierung an den im Lehrplan aufgeführten Kompetenzen und detaillierten Wissensanforderungen eröffnet für Fredrik die Möglichkeit seine Beurteilungsinstrumente (Fragen, Aufgabenstellungen) besser auf die geforderten Lernziele abzustimmen und einen ganzheitlicheren Blick auf die Lernprozesse der Schüler_innen zu haben („das große Ganze“). Die scheinbar von den Inhalten entkoppelten Bepunktungsraster als Grundlage für Leistungsbeurteilungen werden von ihm als „ziemlich willkürlich“ abgelehnt. Die veränderten Aufgabenstellungen ermöglichen eine bessere Abstimmung der Unterrichtsinhalte auf die Prüfungsinhalte (oder Wissensanforderungen) und damit eine in Fredriks Augen verbesserte Beurteilungspraxis. Dieses aufeinander Abstimmen von Unterricht und Prüfung wird in der englischsprachigen Forschung zur (hoch)schulischen Leistungsbeurteilung unter dem Schlagwort des „constructive alignment“ (Biggs, 2003) verhandelt. Auch dafür ist das Programm „Planering & Bedömning“ hilfreich, da es die Lernziele für jede Notenstufe einzeln auflistet, so dass diese dann wie bei einer Checkliste ‚nur noch‘ abgearbeitet und entsprechend markiert werden müssen. Allerdings behält auch Fredrik sich vor, die endgültige Entscheidung zu treffen, wie weiter unten deutlich wird. Die Frage der Willkührlichkeit von Beurteilungen scheint auch noch einmal auf, als er sich kritisch über die in seinen Augen wenig systematische Beurteilungspraxis einiger Kolleg_innen der Schule äußert: „So, dass das nicht nur willkürlich wird: ‚Ja:a, mhm, gibt man ein E oder ein C?‘ Denn man hat hier die ganze Breite an der Schule. Diejenigen, die gar nichts gemacht haben und vielleicht eine Klassenliste haben und dann ein Themengebiet und dann gibt man ein paar Beurteilungen: ‚Beim Mündlichen fand ich, dass er es so gemacht hat, ein E. Und da war es so.‘ Und dann gibt es diejenigen, die auf diese Art und Weise denken, aber man hat es immer noch als=als Papierversion und=und so. O-

354

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

der=o=o=oder EIGENE Systeme auf dem Rechner. (..) Ja, so ist das. Ob das gerecht ist, 194 das ist die Frage. Ist es beinahe=ist es beinahe! [beide lachen]“ (Z. 140-145)

Wieder geht es darum, dass das Beurteilungsprogramm und die darin vorgegebenen Strukturen ihm helfen eine in seinen Augen ‚gerechtere‘ Beurteilung vorzunehmen als beispielsweise Lehrkräfte, die sich nur handschriftliche Notizen machen und durch Entscheidungen ‚aus dem Bauch heraus‘ zu ihren Beurteilungen gelangen. Die kleinteilige Dokumentation der Lernprozesse seiner Schüler_innen im Beurteilungsprogramm stellt für ihn eine Möglichkeit dar, der potentiellen Willkürlichkeit von Beurteilungen zu entkommen. Der Hinweis darauf, dass man „hier die ganze Breite an der Schule“ habe, irritiert beim ersten Lesen zunächst, da gewöhnlich das Leistungsspektrum der Schüler_innen auf diese Weise beschrieben wird. Hier geht es allerdings um die Bandbreite der unterschiedlichen Dokumentationsformen und Praktiken der Beurteilung der Lehrkräfte, die ein Spektrum von „gar nichts“ machen, über „vielleicht eine Klassenliste“ haben, hin zu „Papierversion[en]“ und „EIGENE Systeme auf dem Rechner“ ausfüllen. Und obwohl deutlich wird, das Fredrik sich von diesen Formen der Dokumentation abgrenzt, sie als „willkürlich“ und unzureichend empfindet, ist es nur eine vorsichtige Kritik an den Kolleg_innen. Die Passage endet mit einer bilanzierenden Bemerkung („so ist das“) und der rhetorischen Frage an sich selbst, inwiefern diese Vielfalt „gerecht ist“ – mit der überraschenden Antwort, dass es das „beinahe“ sei. Fredrik lacht an dieser Stelle des Interviews herzlich, was als ironisierende Distanzierung gelesen werden kann. Im weiteren Verlauf berichtet er von einigen Umstrukturierungen im Kollegium, bei denen es auch um die Verbesserung der Zusammenarbeit der 194

Original: „Så att det inte bara blir godtyckligt: ,Ja:a mm sätter man ett E eller ett C?’ För du har ju hela spannet här på skolan. De som inte har gjort någonting och kanske har en klasslista och så ett arbetsområde och så sätter man lite bedömningar: ;Men det muntliga tyckte jag han gjorde så, ett E. Och där var det så.’ Så finns det de som tänker i de här banorna, men man har det fortfarande i=i papper och=och så. Eller=e=e=eller EGNA system i datorn. (..) Ja, så är det. Sen om det är rättvist, det är frågan. Det är nästan=det är nästan! [båda skrattar].” (Z. 140-145)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

355

Lehrkräfte geht – aus beiden Beobachtungen lässt sich vorsichtig schließen, dass es in Fredriks Augen noch einige Veränderungsbedarfe an der Schule gibt, er sich gleichzeitig aber mit Kritik zurückhalten möchte (oder diese zumindest nicht mir gegenüber direkt äußern möchte). Zum Thema Zusammenarbeit führt Fredrik noch aus, dass er insbesondere mit einer Kollegin, die Mathematiklehrerin Gunilla im schwedischen Sample, den Austausch sucht und mit ihr gemeinsam die Inhalte des Chemiekurses plant. Hierbei wird deutlich, dass die gemeinsame Planung und vor allem die gemeinsame Interpretation der Lehrplanziele und Wissensanforderungen in gewisser Weise ein Scharnier zwischen dem eher mechanischen Abhaken von Inhalten und Notenstufen im Beurteilungsprogramm und den teilweise sehr unklar formulierten Vorgaben darstellt: „Und das ist klar, dass wir uns hinsetzen, sie und ich sitzen nebeneinander. Wir grübeln dann wie wir: ‚Diese Frage hier, wie=was/Was denkst du dazu?‘ Was IST ‚einfach‘? Was ist ’gut entwickelt’? Das muss man wohl tun, denn das steht ja nirgendwo. Sondern, das ist mehr ein Gefühl auf eine Weise, das man hat.”195 (Z. 182-185)

Wie fast alle befragten schwedischen Lehrkräfte thematisiert Fredrik hier auch die teilweise unklaren Formulierungen des Lehrplans und stellt fest, dass es die gemeinsame Interpretationsarbeit zur Absicherung eines gemeinsamen Verständnisses brauche. Denn, so Fredrik weiter, „das ist nicht in Stein gemeißelt“ (det är inget som är hugget i sten, Z. 189) und „es gibt keine Bibel in der man nachlesen könnte” (det finns ju ingen bibel där man kan gå in, Z. 191), es gibt also genug Deutungsspielräume. Gleichzeitig wird deutlich, dass es vor allem eine eher punktuelle Zusammenarbeit zwischen Gunilla und Fredrik gibt, die konkreten Beurteilungsentscheidungen aber von ihm allein und unter Zuhilfe-nahme der Daten im Beurteilungsprogramm getroffen werden. Dass er sich dem 195

Original: „Och det är klart att vi kommer sitta, hon och jag sitter jämte varandra. Vi kommer ju bolla hur vi: ,Den här frågan, hur=vad/ Hur tyck=tycker du liksom?’ Vad ÄR ,enkla’? Vad ä:är ,välutvecklade’? Det måste man ju, för det står ju ingenstans. Utan det är ju någon känsla på något vis ju, man har.” (Z. 182-185)

356

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Programm allerdings auch nicht widerspruchslos ausliefert, verdeutlicht eine weitere kurze Passage, in der er auf seine Erfahrung und Souveränität als Lehrkraft verweist: „Und wenn ich mir das dann ANSCHAUE dann werfe ich zum Schluss einen Blick darauf und sehe: ‚Wie ist es für diesen Jungen gelaufen?‘ Plus, ich habe so ein Gefühl im Kopf, ich habe ihn jede Woche. So dass man=man hat ein ganz gutes Gefühl dafür ähm ohne reinschauen zu müssen.“196 (Z. 216-218)

Bei der Zeugnisnotenerstellung am Ende des Schuljahres tritt zu den Ergebnissen des Beurteilungsprogramms Fredriks Erfahrung als eine zusätzliche Legitimationsquelle für die Noten. Der Hinweis, dass seine Einschätzung mit denen im Beurteilungsprogramm übereinstimme, darf hier aber nicht als Absage an die Nützlichkeit des Programms verstanden werden. Vielmehr verstärkt das etwas schiefe Bild vom „Gefühl im Kopf“ den Wunsch nach einem objektiven, vielleicht auch rationalen Beurteilungsverfahren, in dem die Subjektivität der Lehrkraft begrenzt wird. Es handelt sich eben nicht um ein reines ‚Bauchgefühl‘ als Korrektiv, sondern ein quasi rationalisiertes „Gefühl im Kopf“, das die digitale Dokumentation bestätigt und den potentiell als subjektiv beschreibbaren Eindruck der Lehrkraft in eine nur schwer hinterfragbare ‚Tatsache‘ auf der Grundlage detaillierter Dokumentation und einer rein kriterialen Bezugsnorm transformiert.

Zusammenfassung: Fredrik Für den Mathematiklehrer Fredrik sind es vor allem zwei Dinge, die eine in seinen Augen ‚gerechte‘ Leistungsbeurteilung ausmachen: Objektivität und eine detaillierte Dokumentation des Lernprozesses. Beide Ziele 196

Original: „Men när jag väl TITTAR på detta så då=då tar jag mig en titt på slutet och ser: ’Hur har det gått för den här killen?’ Plus att jag har ju känslan i huvudet, jag har han varje vecka. Så man har=man har ju rätt så bra känsla här e:eh utan att behöva titta.” (Z. 216-218)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

357

werden für ihn durch die Anwendung eines digitalen Beurteilungsprogramms erreicht, das eine Beurteilung nah an den Lernzielen und Vorgaben der Lehrpläne ermöglicht (kriteriale Bezugsnorm). Die Schüler_innen und deren Eltern haben jederzeit Zugriff auf die digitale Dokumentation des Unterrichtsverlaufs und des erreichten Lernstands, wodurch einerseits eine größere Transparenz hergestellt, andererseits aber auch eine Verantwortungsübergabe für den individuellen Lernprozess an die Schüler_innen ermöglicht wird. Zusätzlich wird durch das Programm die Kommunikation mit den Schüler_innen sowie deren Eltern vereinfacht, insgesamt wird es als arbeitserleichterndes „Werkzeug“ von ihm beschrieben. Die Anwendung des Beurteilungsprogramms bedeutet für Fredrik auch eine Auslagerung bzw. Eingrenzung ‚subjektiver Faktoren‘, wie Sympathien für oder Vorwissen über die Schüler_innen. Im Gegensatz zu Lehrkräften wie Lisbeth, die eher eine kompensatorische Gerechtigkeitsüberzeugung vertritt, hebt Fredrik vor allem auf die Objektivität der Beurteilungen ab, sowie die Gleichbehandlung der Schüler_innen (bspw. durch eine anonymisierte Korrektur von Tests). Die Schaffung spezieller Beurteilungssituationen, angepasst an die Bedarfe einzelner Schüler_innen tauchen im Interview nicht auf bzw. nur in der Ablehnung von solcherlei „Spezialservice“. Die Zusammenarbeit mit Kolleg_innen findet nur punktuell statt und betrifft bspw. die gegenseitige Korrektur der nationella prov (auch hier wieder mit dem Motiv der Wahrung der Anonymität und Objektivität der Beurteilungen). Darüber hinaus fällt Fredriks Blick auf die Beurteilungspraxis seiner Kolleg_innen eher kritisch-distanziert aus und wird von ihm als teilweise unsystematisch und daher „willkürlich“ beschrieben. Das von Fredrik verwendete Beurteilungsprogramm hingegen legitimiert sein Beurteilungshandeln, indem es in einzelne Teilbeurteilungen zerlegt und diese detailliert dokumentiert, aber auch ein Stück weit depersonalisiert und damit objektiviert wird.

358

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

6.3.2.2 Herr Dabert – Beurteilung mit dem „zweiten Gehirn“ Herr Dabert unterrichtet die Fächer Mathematik, Geschichte und katholische Religionslehre am einzigen Gymnasium eines kleineren Ortes und ist zum Zeitpunkt des Interviews 29 Jahre alt. Sein Studium hat er, wie er betont, in der Regelzeit abgeschlossen, anschließend das zweijährige Referendariat absolviert und ist seit knapp zwei Jahren an dieser Schule als Lehrer tätig. Er zählt damit noch zur Gruppe der Berufsanfänger.

Orientierung am Schulgesetz und Verfahrenstreue Als Rahmung seiner aktuellen Beurteilungspraxis als ‚gerechter‘ Beurteilung führt Herr Dabert aus, dass es vor allem zwei Überlegungen waren, die ihn dazu brachten eine „GANZ EIGENE Methode“ (Z. 43) der Beurteilung zu entwickeln. Diese Überlegungen waren zum einen, „dass im Schulgesetz steht, dass wir Lehrer verpflichtet sind, jederzeit den Schülerinnen und Schülern Auskunft über ihren derzeitigen Leistungsstand zu geben“ (Z. 34-35) und zum anderen die Feststellung, „dass Jugendliche und Kinder einen WAHNSINNIG ausgeprägten Gerechtigkeitssinn haben, ne? Und SOBALD DA IRGENDWO Ungerechtigkeit ins Spiel kommt, hat man unnötige Diskussionen. Dann hat man eine schlechte Lernatmosphäre. Dann äh gerät man mit den Schülern aneinander. Das ist nicht gut für das Lernklima, ne?“ (Z. 39-42). Für Herrn Dabert scheint damit klar zu sein, dass eine gerechte Leistungsbeurteilung eines Ausbalancierens verschiedener Anforderungen – im obigen Beispiel der Informationspflicht des Schulgesetzes einerseits und des sensiblen Gerechtigkeitssinns der Schüler_innen andererseits – bedarf. Gleichzeitig deutet sich in dem Auszug bereits an, dass sein Wunsch „einen Weg zu finden, wie ich das umsetzen kann“ (Z. 31) auch darauf abzielt, den Eindruck von Ungerechtigkeit zu verhindern, um „unnötige Diskussionen“ mit Schüler_innen zu vermeiden und eine reibungslosere Unterrichtsroutine aufrechterhalten zu können. Anders als im Modus der diskursivinteraktiv ausgehandelten Gerechtigkeitsüberzeugungen wird die poten-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

359

tielle Infragestellung seiner Beurteilungen durch Schüler_innen als eher lästige und möglichst zu vermeidende „Diskussion“ mit den Schüler_innen verstanden. Ich führe diesen Gedanken weiter unten weiter aus, zunächst wird aber das von ihm entwickelte Beurteilungsverfahren näher beleuchtet, da er dieses selbst als zentrales Element einer „gerechten Benotung“ (Z. 31) einführt. Interessanterweise handelt es sich hierbei um ein Instrument der Dokumentation der sogenannten mündlichen Leistungen, also solchen Aspekten schulischer Leistungen, die hauptsächlich während des laufenden Unterrichtsgeschehens und in vielgestaltiger, wenig standardisierbarer Form von den Schüler_innen erbracht werden. Doch auch für die Beurteilung schriftlicher Arbeiten verfügt Herr Dabert über ein spezielles Beurteilungssystem, welches ebenfalls weiter unten beleuchtet wird. Dass er darin ebenso wie die in Kapitel 6.3.1 zitierten Lehrkräfte zunächst auch auf Punktwerte und Umrechnungen setzt, darf hier jedoch nicht darüber hinwegtäuschen, dass der zentrale Orientierungspunkt seiner Beurteilungsstrategie die detaillierte Dokumentation – und nicht die Herstellung normalverteilter Noten oder nachträgliche Anpassung der Bepunktungsraster –darstellt. Insofern finden sich zwar ähnliche Elemente wie bei der mathematischrechnerischen Gerechtigkeitsüberzeugung, diese werden jedoch anders begründet und als gerecht legitimiert.

Detaillierte Dokumentation mit dem „zweiten Gehirn“ Im Mittelpunkt des Interviews mit Herrn Dabert steht die Beschreibung eines Systems der kleinteiligen Dokumentation und anschließenden Benotung der „mündlichen Mitarbeit“ (Z. 67) der Schüler_innen mit Hilfe eines Pocketcomputers und einer selbst angelegten Excel-Tabelle. Darin sind für alle Klassen, in denen er im Schuljahr unterrichtet, Namenslisten mit allen Unterrichtsterminen angelegt, so dass er sich „von JEDER Stunde von JEDEM Schüler eine Notiz“ (Z. 53) machen kann, die er für die mündliche Mitarbeit während des Unterrichts vergibt:

360

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

„Und das ist ein Punkteschema (.) ähm zwischen minus zwei und zwei Punkten. (.) Wobei Leistungen nur bewertet werden im Bereich von Null bis Zwei. Ne? Also man kann entweder EINEN Punkt holen pro Stunde oder MAXIMAL zwei. [...] Ja und Minuspunkte werden nur vergeben für/ also in der Oberstufe beispielsweise für (..) äh NICHT erbrachte Hausaufgaben, wenn DIE dazu führen, dass der Schüler sich im Unterricht absolut passiv verhalten MUSS.“ (Z. 67-72)

Die „Notizen“ zu einzelnen Schüler_innen erfolgen also ausschließlich in Form von Punkten, die entweder für erbrachte Leistungen (positiv) oder fehlende Leistungen (negativ) vergeben werden. Es gibt offenbar keine weiteren schriftlichen Anmerkungen zu den Schüler_innen und ihrem Unterrichtsverhalten oder Lernstand, abgesehen von der ‚Umrechnung‘ ihrer als Mitarbeit wahrgenommenen Unterrichtsbeiträge in Punkte zwischen -2 und +2, die er während oder möglichst zeitnah nach der jeweiligen Unterrichtsstunde in seinem Pocketcomputer vermerkt. Am Ende des Halbjahres rechnet Herr Dabert die so erworbenen Punkte mit Hilfe eines Umrechnungsschlüssels in Noten um, die dann zusammen mit den Noten im schriftlichen Bereich die Halbjahresnoten der Schüler_innen ergeben.197 Interessant ist nun, wie Herr Dabert die Vergabe unterschiedlicher Punktzahlen für verschiedene Schüler_innenleistungen – und damit die Gewichtung als bessere oder schlechtere Leistung – begründet: „Ich sage denen: ‚Ihr könnt pro Stunde hier maximal zwei Punkte holen. Wenn ihr dieses, jenes und sonstiges beitragt, ne?‘ (.) Ähm das geht dann tatsächlich äh das ist dann also ein Punkt oder zwei Punkte, das ist ja so das gängige, das ist so eine Mi-

197

Herr Dabert ist der einzige aus dem nordrhein-westfälischen Sample, der von einer solcherart technisch unterstützten Dokumentationspraxis berichtet, gleichwohl gibt es mittlerweile verschiedene kommerzielle Softwareanbieter, die sich auf die besonderen Bedürfnisse von Lehrkräften und die digitale Dokumentation von Leistungsbeurteilungen spezialisiert haben. So wird bspw. das von Uwe Hilwerling entwickelte Teacher Tool als Instrument der „Schülerverwaltung“ für Apple-Geräte beworben, für Android-Geräte gibt es u.a. die Software Tapucate der Firma Apenschi Software, das für die digitale „Notenverwaltung“ empfohlen wird. http://teachertool.de/de/ bzw. http://www.apenschi.de/?page_id=40.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

361

schung aus Qualität und Quantität. Und das mache ich tatsächlich nach Erfahrung und Gefühl. Beteiligt sich jemand vielleicht zwei, drei Mal in einer Stunde oder sagen wir mal zwei Mal, was schon für einen einzelnen Schüler nicht schlecht ist, aber die Aussagen sind eher so im mittleren Anforderungsbereich, dann gibt das einen Punkt. Dann ist das eine gescheite, eine gute, eine durchschnittliche Mitarbeit. Beteiligt sich jemand EIN Mal, aber (.) liefert eine unglaublich hochwertige Antwort, die den Unterricht voranbringt, dann ist das automatisch eine Zwei-Punkte-Bewertung, ne?“ (Z. 120-128)

Offenbar dient hier vor allem die Lehrkraft als Maßstab der Beurteilung, genauer gesagt erfolgt die Beurteilung „nach Erfahrung und Gefühl“. An dieser Stelle sei noch einmal auf sein vergleichsweise niedriges Dienstalter verwiesen: zum Zeitpunkt des Interviews kann Herr Dabert (nach Absolvierung des zweijährigen Referendariats) auf knapp zwei Jahre Berufserfahrung an seiner Schule zurückblicken. Die selbstbewusste Qualifizierung der Unterrichtsbeiträge der Schüler_innen als „gute“, „durchschnittliche“ oder „unglaublich hochwertige“ Antworten zeugen von seinem Vertrauen in die eigenen Beurteilungsfähigkeiten und lassen auf ein gefestigtes professionelles Selbstbild als eigenverantwortlich handelnde Lehrkraft schließen. Auch die Formulierung „das ist ja so das gängige“ verweist auf eine gewisse Routiniertheit bei der Beurteilung mündlicher Unterrichtsbeiträge und in der abschließenden Bewertung „dann ist das automatisch eine Zwei-Punkte-Bewertung“ findet sich dann auch wenig Raum für Zweifel an seiner Einschätzung der Schüler_innenleistung – sie erweckt sogar den Eindruck, dass eine alternative Einschätzung vollkommen ausgeschlossen ist, die beobachtete Leistung also „automatisch“ zu einer bestimmten Beurteilung führen müsse. Mit der Rückversicherungspartikel „ne?“ stellt Herr Dabert zudem sicher, dass diese für ihn eindeutige Kausalität auch von mir als Interviewerin nachvollzogen wird. Auch im restlichen Interview finden sich kaum Anflüge von Unsicherheit oder Zweifel in Fragen der Beurteilung, ganz im Gegenteil wirkt Herr Dabert überaus selbstsicher in seinen Schilderungen und stellt selbst fest, „dass mir kein Beispiel ein=einfällt, wo mir das mal wirklich schwerfiel“ (Z. 242-243). Herr Dabert betont mehrfach, dass er den Schüler_innen seine Beurteilungsweise transparent mache, um so eine gerechte Beurteilung zu ge-

362

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

währleisten. Allerdings bezieht sich diese Transparenz vor allem auf die formale Vorgehensweise – Plus- und Minuspunkte, maximale Punktzahl pro Unterrichtsstunde –, die konkreten inhaltlichen Beurteilungsmaßstäbe bleiben hingegen vage. Ebenso offen bleibt für die Schüler_innen, wann eine Äußerung in die Beurteilung einbezogen wird und wann nicht, wie im folgenden Auszug deutlich wird: „Jetzt könnte man natürlich kritisieren: Ja, dann meldet sich so ein Schüler einmal, sagt was und lehnt sich dann für den Rest der Stunde zurück. Die Sorge hatte ich am Anfang, aber das passiert einfach nicht. Weil ähm (.) ich wiederum auch mit dem Gerät nicht so vor der Klasse stehe und sage: ‚Ja, Schülerin X bitte. (.) Das war eine ZweiPunkte-Bewertung.‘ Trage das ein und/ So passiert das ja auch nicht, ne? (.) Ähm (..) ja. Aber dass man eben maximal zwei Punkte holen kann, das wissen die Schüler und das finde ich auch wiederum gerecht, äh, weil es sonst zu einer Schieflage kommen könnte. Mal angenommen, ein Schüler hat einen besonders guten Tag oder eine Schülerin. Ne? (.) Ähm dann kassiert die in der Stunde aufgrund ihrer (.) ZAHLreichen Meldungen, die vielleicht auch gut sind, PRO Meldung EINEN Punkt ab und kommt auf sieben, acht Punkte.“

Es zeigen sich zwei vermeintliche Schwachstellen seines Punktesystems, zum einen die ‚Gefahr‘ des Ausnutzens durch „ZAHLreiche Meldungen“ und damit ein unzulässiges „[K]assier[en]“ von vielen Punkten; zum anderen die Sorge um die Aufmerksamkeit der Schüler_innen nach Erhalt eines Punktes. Für Herrn Dabert scheint eine vor allem durch Fleiß und aktive Mitarbeit erworbene bessere Note nicht legitim, weshalb er sich für die Begrenzung der maximal pro Unterrichtsstunde erreichbaren Punkte auf zwei Punkte ausspricht. Obwohl Fleiß und Anstrengung für Herrn Dabert wichtige Aspekte der schulischen Leistung sind, stellen sie für sich genommen noch keine hinreichende Bedingung für gute Noten dar – ich komme darauf im Abschnitt zum Schüler_innenidealbild zurück. Gleichzeitig steht Herr Dabert mit der Beschränkung auf maximal zwei zu erreichende Punkte pro Stunde vor dem Problem, die Aufmerksamkeit der Schüler_innen eventuell nicht für die gesamte Unterrichtsstunde aufrechterhalten zu können („Ja, dann meldet sich so ein Schüler einmal, sagt was und lehnt sich dann für den Rest der Stunde zurück“). Die Denkfigur dahinter scheint zu sein, dass Schüler_innen sich vor allem wegen der Noten am Unterrichtsgeschehen beteiligen würden, nicht aus intrin-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

363

sischer Motivation, Interesse am Fach oder Lernfreude. Die Punkte (und daraus folgend die Noten) verwandeln sich damit in seinen Augen in ‚Belohnungen‘ für Aufmerksamkeit und Mitarbeit. Indem er die Schüler_innen nun darüber im Ungewissen lässt, wann sie wofür ihre ‚Belohnung‘ in Form von Punkten erhalten, versucht er den befürchteten Abfall der Motivation und Aufmerksamkeit, der ein Risiko für mögliche Unterrichtsstörungen darstellen könnte, zu verhindern. Inwiefern durch diese Art der Beurteilung die Schüler_innen in ihrem Lernverhalten und ihrer Mitarbeit beeinflusst werden, muss an dieser Stelle offenbleiben. Zu vermuten wäre jedoch, dass das Wissen um eine potenziell jederzeit mögliche Beurteilung aller im Unterricht (nicht) getätigten Äußerungen sowohl hemmend als auch fördernd auf die Schüler_innen wirken kann.198 Offen bleibt an dieser Stelle auch, inwiefern Schüler_innen über die Bepunktung hinaus auch weiterführendes Feedback zu den im Unterricht stattfindenden Lernprozessen erhalten – insgesamt lässt sich eine eher eingeschränkte Feedbackkultur erahnen, wie weiter unten gezeigt wird. Die von Herrn Dabert gewählte Beurteilungsstrategie für die mündlichen Leistungen wirkt sich auch auf die Gestaltung seines Unterrichts aus, wie er weiterhin berichtet. So plant er bewusst verschiedene Arbeitsphasen in unterschiedlichen Sozialformen für jede Unterrichtsstunde ein, „die so ausgedehnt sind, dass ich IN der Zeit mir Gedanken machen kann zu dem Leistungsstand der Schüler“ (Z. 59-60). Die Unterrichtsgestaltung wird scheinbar stärker durch seine Form der Beurteilung geprägt und strukturiert als durch inhaltliche oder didaktische Überlegungen. Dies zeigt sich auch in folgender Beschreibung seiner Beurteilungspraxis: „Äh wichtig ist aber auch, dass diese Phasen AUCH mit in die Benotung mit eingehen, ne? Häufig spaziere ich auch mit DEM Gerät während einer Gruppenarbeitsphase mal 198

In den schwedischen Interviews wurde von einigen Lehrkräften hierfür der Terminus bedömning hela tiden verwendet, der wortwörtlich mit „Beurteilung die ganze Zeit“ übersetzt werden kann. Diese fortlaufende Beurteilung kann auch unter dem Aspekt einer formativen Lernprozessbegleitung betrachtet werden und wird in Kapitel 6.3.4 erneut aufgegriffen.

364

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

(.) äh durch die Klasse und sehe dann ja auch, wie groß das Engagement der einzelnen Schüler ist und der Schülerinnen, und kann das dann entsprechend auch notieren.“ (Z. 89-92)

Deutlich wird hier u.a. die Omnipräsenz der Leistungsbeurteilung, die sich in der geschilderten Szene durch das offensichtliche Herumtragen des „Geräts“ während einer Gruppenarbeitsphase manifestiert. Da die Schüler_innen von ihm in den Sinn dieses „Geräts“ eingeweiht wurden, kann vermutet werden, dass sie ihr „Engagement“ auch nach dessen Sichtbarkeit ausrichten und gegebenenfalls aufmerksamer oder aktiver in der jeweiligen Unterrichtsphase agieren. Durch die Markierung als „wichtig“, die Betonung des Wortes „AUCH“ und die abschließende Rückversicherungspartikel „ne?“ (“Äh wichtig ist aber auch, dass diese Phasen AUCH mit in die Benotung mit eingehen, ne?“) kann der obige Auszug zudem als Absicherung mir gegenüber verstanden werden, die Gruppenarbeitsphasen keinesfalls als unbeobachtete Phasen zu deuten, in denen die Schüler_innen sich selbst überlassen wären. Mit der detaillierten Dokumentation der Unterrichtsbeteiligung der Schüler_innen wird somit auch ein Instrument der Kontrolle der Schüler_innen eingebaut, das für die Lehrkraft zwar zeitaufwändig, gleichzeitig aber auch effektiv zu sein scheint. Demgegenüber führt Herr Dabert an keiner Stelle aus, dass die Strukturierung der Unterrichtsstunden in verschiedene Arbeitsphasen mit wechselnden Sozialformen in Verbindung mit didaktischen oder lerntheoretischen Überlegungen steht. Als Begründung für das möglichst zeitnahe Dokumentieren seiner Eindrücke aus dem Unterricht führt Herr Dabert einen potentiellen ‚Datenverlust‘ durch unzureichende Erinnerung an, den er durch das akribische Ausfüllen seiner Excel-Tabelle zu vermeiden sucht: „Das hat mich auch die Erfahrung gelehrt, am besten immer sofort eintragen, ne? So ein Tag ist lang, da hat man manchmal vier, fünf verschiedene Lerngruppen. Am Ende des Tages weiß ich dann DOCH NICHT MEHR so genau, wer sich wie beteiligt hat. Ähm das ist dann so eine kleine Fehlerquote, die sich dann manchmal doch einschleicht. Also bemühe ich mich, tatsächlich entweder IN den Stunden, ZUM Ende der Stunde oder NACH der Stunde ähm (.) für jeden Schüler (.) Punkte zu vergeben.“ (Z. 62-66)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

365

Wichtig für ihn ist das unmittelbare Vermerken seiner Beurteilung im Anschluss an die jeweilige Unterrichtssituation, um die sogenannte „Fehlerquote“ möglichst gering zu halten. Ziel ist es eine möglichst ungetrübte Dokumentation der mündlichen Leistungen der Schüler_innen zu erhalten, im Sinne einer ‚wahrheitsgetreuen Abbildung‘ der Leistungen ohne potentiell beeinflussende Fehler, wie die eigene Vergesslichkeit oder die Gefahr der Verwechslung von Schüler_innen verschiedener Lerngruppen. Dass die Umwandlung des im Unterricht erlebten Schüler_innenverhaltens in Bepunktungen immer auch schon eine Interpretation des Unterrichtsgeschehens durch Herrn Dabert ist, die durch die Transformation in einen Zahlenwert schon bestimmte Informationen einbezieht und andere ausblendet, reflektiert er (zumindest im Interview) nicht. Das zeitnahe und regelmäßige Festhalten der Unterrichtseindrücke in Form von Zahlen in seinem „Gerät“ kann als Versuch der Objektivierung der zunächst subjektiv durch Beobachtung gewonnenen Informationen verstanden werden. Er weiß dabei zwar auch um die Begrenztheit dieser Objektivierungsstrategie („ich bemühe mich“), gleichzeitig verwandeln sich die einmal eingetragenen Werte unwiederbringlich in das Abbild des „Leistungsstands“ der Schüler_innen. Sie werden zum Absolutum, an das er „sich binde[t]“ (Z. 101), wie im nächsten Abschnitt deutlich wird.

„Enge Zusammenarbeit“ mit dem Organizer Wie stark seine Beurteilungspraxis auf der Anwendung des Pocketcomputers ruht, wird deutlich an der Art, wie Herr Dabert das Gerät zu Beginn des Interviews einführt: „Und zwar arbeite ich [...] ganz eng (.) mit meinem Organizer (.) zusammen. Ich nenne den immer liebevoll mein zweites Gehirn“ (Z. 45-46). Der Pocketcomputer („Organizer“) wird von ihm mit einem Spitznamen („zweites Gehirn“) versehen, wie in engen persönlichen Beziehungen auch. Dieser Spitzname verweist dabei gleich auch auf die wichtigste Funktion des Gerätes für Herrn Dabert: es speichert Informationen, auf die er anschließend zurückgreifen kann und

366

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

dient damit der Rechenschaftslegung gegenüber Dritten. Es ermöglicht ihm die Einhaltung der Informationspflicht gegenüber den Schüler_innen, die er oben als rahmende Bedingung seiner Beurteilungspraxis aufgeführt hat. Das „zweite Gehirn“ dient ihm also nicht im Sinne eines erweiterten Reflexionsrahmens, sondern wird vor allem als Informationsspeicher, als eine Art ‚Festplatte‘ verstanden, auf dem die zahlreichen Eindrücke aus verschiedenen Unterrichtsstunden und von verschiedenen Schüler_innen sicher gespeichert werden können. Die Auslagerung auf einen Gegenstand dient dabei der Objektivierung – und damit Legitimierung – des Beurteilungsprozesses, die erst durch die sachliche Trennung zwischen Lehrperson und Beurteilungsinstrument vollständig erreicht wird. Gleichzeitig wird durch die Formulierung der „engen Zusammenarbeit“ mit dem technischen Gerät eine Art Beziehung suggeriert, die an die kollegiale Zusammenarbeit im Fachbereich erinnert. Unter einer engen Zusammenarbeit würde man zunächst erwarten, dass von einer anderen Person die Rede ist, mit der er sich bei Unsicherheiten oder Schwierigkeiten austauscht, konkrete Fälle bespricht, Handlungsmöglichkeiten abwägt oder gegenseitig unterstützt.199 In diesem Fall handelt es sich allerdings um einen Gegenstand, genauer eine Maschine, bei der die oben geschilderten Aspekte von Zusammenarbeit im Sinne eines Austausches nicht stattfinden. Das ‚Zusammenarbeiten‘ mit dem Gerät steht eher unter dem Vorzeichen der Arbeitserleichterung und Entlastung der Lehrkraft, produktive Irritationen durch konträre Standpunkte oder ein Infragestellen der eigenen Beurteilungen – wie sie in der Zusammenarbeit mit Kolleg_innen möglich wären – können in der Zusammenarbeit mit einem Gegenstand nicht auftreten. Insofern handelt es sich um eine eher ‚dienende‘ Zuarbeit, im Sinne technischer Unterstützung, denn um

199

Es findet sich auch im gesamten Interview kein Hinweis auf solcherlei alltägliche und kontinuierliche Zusammenarbeit mit Kolleg_innen, lediglich punktuelle Absprachen im Rahmen von Fach- oder Zeugniskonferenzen werden berichtet.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

367

eine ‚echte‘ Zusammenarbeit.200 Beide Aspekte, die Vergabe eines Spitznamens und die Beschreibung als Zusammenarbeit, zeigen zusammengenommen die hohe emotionale Bindung Herrn Daberts an sein „Gerät“ und die durch den Pocketcomputer gewonnene Legitimationssteigerung für seine Beurteilungspraxis. Dieser Zugewinn an Legitimität für seine Beurteilungen durch den Pocketcomputer wird auch im folgenden Auszug deutlich, wenn er seine Beurteilungen mit Hilfe der Excel-Tabelle gegenüber den Schüler_innen erklärt: „Ja. Äh rundum (.) als Feedback von den Schülern kriege ich sehr positive Rückmeldungen. SEHR positive Rückmeldungen darüber. Die Schüler (.) ähm diskutieren, seit (.) seit ich das so mache, ÜBERHAUPT nicht (.) über Noten mit mir. (.) Äh und sollte doch irgendwo mal Unmut aufkommen, was:s:s (.) ja seit der Zeit, seit dem ich das so mache, höchstens zwei Mal so vorgekommen ist, hole ich das Gerät raus, zeig die einzelnen Leistungsstände von den einzelnen Stunden und sage: ‚Du vertust dich offensichtlich in deiner Selbstwahrnehmung. Schau mal, in der ersten Hälfte des Quartals hast du dich gar nicht beteiligt, wie man sieht. In der zweiten hast du dich MEHR beteiligt. Und diese Mehrbeteiligung ist offensichtlich bei dir hängen geblieben und täuscht dein eigenes Selbstbild.‘ Ne? Und dann füge ich meistens noch so was hinterher, dass ich sage: ‚Ja vom Bauchgefühl würde ich dir jetzt auch eine bessere Note geben, aber ich binde mich an das Teil.‘ Und das ähm vermeidet wirklich viele Diskussionen und viel Unmut, ne?“ (Z. 92-102)

Die Gegenüberstellung einer Beurteilung nach „Bauchgefühl“ und der scheinbar objektiven Benotung durch den Pocketcomputer verdeutlicht noch einmal die Trennung zwischen Lehrkraft und Beurteilungsinstrument, die Herr Dabert nutzt, um potentielle „Diskussionen“ mit unzufriedenen Schüler_innen zu vermeiden. Er verweist auf das Gerät und dessen Beurteilungsergebnisse als wären diese eigenständig und unabhängig von seiner Person – und nicht erst durch seine eigenen Regelsetzungen (wann gibt es wofür wie viele Punkte?) und Interpretationen des Unterrichtsgeschehens erschaffen. Herr Dabert übergibt sich damit 200

Dies wird auch an der Aufzählung der Nutzungsvorteile des Gerätes deutlich, die Herr Dabert zu Beginn des Interviews nennt: „schneller und besser als jedes gängige Smartphone zurzeit, weil der ein sehr simples Betriebssystem hat und unglaublich schnell also zwischen den Programmen schaltet“ (Z. 47-48).

368

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

scheinbar uneingeschränkt an ein Gerät und ‚dessen‘ Entscheidungen („ich binde mich an das Teil“), wodurch er gleichzeitig seinen eigenen Anteil an der Beurteilung minimiert und sich symbolisch auf die Seite der Schüler_innen stellen kann. Das „Gerät“ ermöglicht damit eine Objektivierung der Beurteilungen im Sinne einer Entpersonalisierung und Neutralität, der eine Überlegenheit gegenüber dem menschlichen, subjektiven Urteil eingeräumt wird. Als Negativbeispiel bringt Herr Dabert an anderer Stelle die Berichte von Schüler_innen über Beurteilungen von Lehrkräften an, die durch subjektive Faktoren beeinträchtigt würden, um sich davon abzugrenzen: „Und äh, dass es auch wohl Lehrer geben muss, die nach Belieben oder (.) nach Geschlecht sogar Noten vergeben, also wo dann grundsätzlich das weibliche Geschlecht bevorzugt wird notenmäßig und Jungs benachteiligt werden“ (Z. 320-322). Die Bepunktung durch den Pocketcomputer stellt Herrn Daberts Strategie zur Vermeidung solcher subjektiver ‚Fehlerquellen‘ dar. Wie weit die Bindung an die Ergebnisse des Pocketcomputers gehen kann, zeigt folgender Ausspruch: „Ich habe einen Schüler in meinem Mathegrundkurs, der steht kurz vor dem Abitur. Der sagt FAST NIE was im Unterricht, ne? Das ist ein GENIALER Kopf. Ne? Das ist ein genialer Kopf. Blöderweise muss ich dem trotzdem eine Drei geben, im besten Falle.“ (Z. 487-490) Hier wird deutlich, dass selbst seine eigene Einschätzung eines Schülers als „genialer Kopf“ die vermeintliche ‚Wahrheit‘ der Bepunktungen im Pocketcomputer nicht überstimmen kann und „blöderweise“ zu einer schlechteren Benotung des Schülers führt. Das hier anklingende Bedauern für diese schlechtere Benotung kombiniert sich allerdings mit einer scheinbaren Unumgänglichkeit der technisch unterstützten Notenfindung, die auf der ‚objektiven‘ Erfassung der Schüler_innenleistungen beruht und Herrn Dabert damit ein Stück weit aus der Verantwortung entlässt. Dass sich mit der „engen Zusammenarbeit“ zwischen professioneller Lehrkraft und dem technischen Hilfsmittel auch eine gewisse Ambivalenz in die Beurteilungspraxis einschleichen kann, zeigt sich im folgenden Auszug:

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

369

„Und da hatte ich tatsächlich einen Fall, dass MEINE Noten, die ich ermittelt habe (.) durch dieses Verfahren, nicht (.) nicht passten. Das spürte ich auch. Ich mein, man hat ja auch immer noch mal das eigene Bauchgefühl. (.) Von dem ich mich ja sonst NICHT täuschen lassen möchte. Aber in dem Fall merkte ich: Das passt nicht. Da hatten also auf einmal Schülerinnen/ eine SCHÜLERIN habe ich vor Augen, die hatte dann auf einmal eine Drei. Die ist aber eigentlich eine Einserkandidatin, ne? Die hat es drauf! Die kann die Mathematik und die beteiligt sich auch. Was war geschehen? Ich habe den Schülern einfach nicht genügend Möglichkeit gegeben, sich mündlich zu beteiligen. Das hat das Bild total verzerrt. (.) Ne? Und äh zudem habe ich das auch irgendwie (.) ja von meiner Prioritätensetzung habe ich diesen Kurs irgendwo ganz hintenangesetzt und habe tatsächlich auch mal geschludert und nicht jede Stunde Eintragungen gemacht“ (Z. 257-266).

Die Erklärung für das „etwas schräge[] Bild“ der mündlichen Noten liegt Herrn Dabert zufolge darin, dass das eigentlich fehlerfreie System durch ihn selbst ‚sabotiert‘ und dadurch „das Bild total verzerrt wurde“: einerseits habe er den Schüler_innen zu wenige Möglichkeiten der Beteiligung im Unterricht (und damit zu wenige Möglichkeiten der Leistungserbringung) gegeben, andererseits selbst „geschludert und nicht jede Stunde Eintragungen gemacht“ und damit keine ausreichende ‚Datengrundlage‘ für die Notenfindung gehabt. Er identifiziert damit sich selbst, also die Lehrkraft, bzw. seinen Umgang mit dem eigenen System als potentielle ‚Fehlerquelle‘ (analog zu den Ausführungen über lückenhafte Erinnerungen als „Fehlerquote“, Z. 64). Gleichzeitig wird diese ‚Fehlerquelle‘ erst auf der Grundlage des „eigenen Bauchgefühl[s]“ für ihn sichtbar und das professionelle Gespür („das spürte ich auch“) als Korrektiv der prozedural hergestellten Note eingeführt. Während eben dieses „Bauchgefühl“ an anderer Stelle als illegitim markiert wurde, führt es im oben geschilderten Fall dazu, dass Herr Dabert seine Beurteilungen noch einmal überdenkt und sogar – in Einzelfällen – die Noten korrigiert. Als Markierung, dass „das Bild total verzerrt wurde“, dient Herrn Dabert das deutliche Abweichen von der erwarteten Note einer in seinen Augen sehr guten Schülerin („Einserkandidatin“). Hier zeigt sich wie fragil die von ihm eingeführte Verfahrenstreue als Gerechtigkeitsgarant sein kann, wenn Verfahrensergebnis und Normalerwartung nicht übereinstimmen. Für die Auflösung des Widerspruchs zwischen formal „ermittelt[er]“ Note und seinem (professionellen) „Bauchgefühl“ verwirft er nun nach

370

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

anfänglichem Überlegen das pauschale Heraufsetzen der ermittelten Note um eine halbe Notenstufe für alle Schüler_innen und wendet stattdessen ein wenig durchschaubares Vorgehen an, bei dem er einige Noten „nach oben korrigiert. (.) Aber nicht nach unten, ne?“ (Z. 273-274), bei anderen wiederum keine Veränderungen vornimmt, da „die sich auch nicht beschwert haben“ (Z. 271). Dass Herr Dabert das Ausbleiben von Beschwerden seitens der Schüler_innen an dieser Stelle erwähnt, kann als Beleg dafür gedeutet werden, dass ihm die Prekarität seiner Beurteilungen im geschilderten Fall bewusst ist, gleichwohl wird das Ausbleiben von Kritik als Akzeptanz des eigenen Handelns gedeutet. Dieser Aspekt wird im Folgenden ausführlicher erläutert.

Vermeidung von „Diskussionen“ und Ausbleiben von „Nachfragen“ Wie im vorhergehenden Ausschnitt zum Feedback der Schüler_innen auch deutlich wurde, wirkt sich die von Herrn Dabert gewählte Form der Beurteilung auch auf die Kommunikation mit den Schüler_innen über ihre Noten aus. Die von ihm beschriebenen „rundum [...] sehr positive[n] Rückmeldungen“ der Schüler_innen auf die Benotung mithilfe des Punktesystems fasst er mit dem Ausbleiben von für ihn offenbar unangenehmen „Diskussionen“ über die jeweiligen Noten zusammen („Die Schüler (.) ähm diskutieren, seit (.) seit ich das so mache, ÜBERHAUPT nicht (.) über Noten mit mir.“, Z. 93-94). Damit wird deutlich, dass die Auslagerung auf ein Gerät und die damit einhergehende ‚Objektivierung‘ der Beurteilungen auch unter dem Aspekt der Anfechtbarkeit der Beurteilungen bzw. Vermeidung dieser von ihm betrachtet wird. In dem von ihm wiedergegebenen Dialog spricht er den Schüler_innen ihre eigene Einschätzungsfähigkeit ab („Du vertust dich offensichtlich in deiner Selbstwahrnehmung.“, Z. 97), um sogleich im Stile einer Beweisführung mit Hilfe des Geräts aufzuzeigen, wie sich die Bepunktungen im Verlauf des Schuljahres verändert hätten. Auch hier wird die Überlegenheit der objektivierten Beurteilung durch das Gerät gegenüber der scheinbar unzuverlässigen Erinnerung und subjektiven Selbsteinschätzung durch

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

371

die Schüler_innen deutlich. Die offenbar tröstlich gemeinte Ergänzung, ihm selbst würde dieser Fehler auch passieren, würde er sich nicht „an das Teil [binden]“, verstärkt den Eindruck der Überlegenheit der Bepunktungen im Pocketcomputer gegenüber dem menschlichen, subjektiven Urteil. Auffällig ist, dass die von ihm berichtete Kommunikation mit den Schüler_innen sowie deren Eltern nur bezogen auf „den Leistungsstand“ (Z. 60, 297), also die vergebenen Noten, stattfindet, nicht etwa zur Lernentwicklung, möglichen Lern- und Förderstrategien oder anderen eher formativen Beurteilungsaspekten. Er beschreibt im Interview vor allem bilanzierende Gespräche, wie das obige Beispiel zeigt, oder aber Situationen ausbleibender Kommunikation, wie das Vermeiden von „Diskussionen“ oder „Nachfragen“ seitens der Schüler_innen und Eltern im folgenden Ausschnitt: „Aber die Eltern beschweren sich nicht und wenn die zum Elternsprechtag kommen, habe ich auch immer dieses kleine Gerät dabei. Und äh (.) das ist ja kurios. Viele Eltern kommen zum Elternsprechtag NUR, um den Leistungsstand ihrer Kinder zu erfragen. Dann sage ich immer wieder: ‚Sie wissen, ihre Sohn/ ä:äh ihre Tochter, ihr Sohn kann JEDERZEIT bei mir den Leistungsstand erfragen. Das müssen SIE NICHT tun. Aber gerne sage ich Ihnen/‘ Ne? Und dann hole ich das Ding raus und nenne den Leistungsstand. Und (.) da gibt es nie Nachfragen.“ (Z. 294-300)

Herr Dabert interpretiert das Ausbleiben von „Nachfragen“ der Eltern bzw. die Abwendung von „unnötige[n] Diskussionen“ mit den Schüler_innen als einen Beleg für die Richtigkeit und vor allem Akzeptanz seines Beurteilungsverfahrens, wodurch er sich offenbar in seiner Beurteilungspraxis bestärkt sieht. Auch, dass es keine Beschwerden der Eltern über die Benotung der Kinder gäbe, wird extra von ihm erwähnt, wodurch sich der Eindruck verstärkt, die kleinteilige Dokumentation mithilfe des Pocketcomputers diene vor allem als vorbeugende Maßnahme gegenüber etwaigen Anfechtungen durch Dritte. Auffallend ist, dass er potentielle Nachfragen mit Unzufriedenheit und „viel Unmut“ gleichsetzt, diese also einen negativen Beigeschmack für ihn haben – und nicht als zunächst neutral oder gar positiv besetzt gelesen werden, im Sinne eines Interesses am eigenen Lernstand bzw. dem des eigenen Kindes. Auch die von ihm verwendeten Erwartungshorizonte für die

372

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Beurteilung schriftlicher Arbeiten werden von ihm als Mittel zur Herstellung von Transparenz gegenüber den Schüler_innen und als Arbeitserleichterung beschrieben: „er sorgt für Transparenz, er ist gerecht und man korrigiert nachher viel schneller [...] Ich spare mir einen ellenlangen Kommentar unter jeder Klausur. Und die können Punkt für Punkt durchgehen, beklagen sich nicht, denen leuchtet das ein. Die wissen sofort, was sie nächstes Mal besser machen müssen“ (Z. 215-225).

Auch hier scheint die implizite Funktion des Abwendens von „Diskussionen“ mit den Schüler_innen durch, wenn er erwähnt, dass die Schüler_innen sich nicht „beklagen“ würden.

Balanceakt: Verfahrenstreue vs. „pädagogische Freiheit“ In der fiktiven Ansprache an die Eltern, dass die Schüler_innen „JEDERZEIT [...] den Leistungsstand erfragen“ könnten, zeigt sich zudem die eingangs erwähnte Orientierung an der Einhaltung gesetzlicher Vorgaben. Herr Dabert kennt die gesetzlichen Vorgaben der schulischen Leistungsbeurteilung – aber auch deren Grenzen bzw. Unschärfen – genau: an zwei Stellen im Interview verweist er beispielsweise direkt auf das Schulgesetz, nur, um im nächsten Moment zu demonstrieren, wie er bestimmte Vorgaben „geschickt umgeh[t]“ (Z. 73) und die darin eingelassenen Spielräume für seine Beurteilungspraxis nutzt. Dazu ein Auszug zum Umgang mit nicht erbrachten Hausaufgaben: „Denn das Schulgesetz sagt ja auch, wir dürfen das Fehlen von Hausaufgaben nicht benoten. Das kann man aber geschickt umgehen, indem ich sage: Wenn ein Schüler seine Hausaufgaben nicht gemacht hat, (.) die für die (.) Unterrichts/ oder für DEN Unterrichtsverlauf von großer Bedeutung waren, ja, dann KANN er sich ja gar nicht beteiligen, ne? Und das ist dann weniger als nichts, ja? Also dieses Recht nehme ich mir dann heraus, ne? Weil ich dann ja auch weiß, der Schüler hat zu Hause auch nicht gearbeitet, ne? Und die Anderen eben doch.“ (Z. 72-77)

In der Formulierung „das kann man aber geschickt umgehen“, schwingt ein gewisser Stolz darüber mit, seine eigenen pädagogischen Überzeu-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

373

gungen umsetzen zu können ohne dafür einen offenen Regelverstoß begehen zu müssen: Die nicht erbrachten Hausaufgaben werden zwar nicht direkt mit einer schlechten Note bewertet (was laut Herrn Dabert nicht erlaubt wäre), sie fließen aber über den Umweg des Punktesystems als Minuspunkte in die Halbjahresnote für die mündliche Mitarbeit ein. Das „Umgehen“ des Verbots wird anschließend auch durch den Verweis auf eine zu vermeidende Ungleichbehandlung derjenigen Schüler_innen, die ihre Aufgaben erfüllt und „gearbeitet“ haben, legitimiert. Insofern nutzt Herr Dabert das Dokumentationssystem nicht nur zur Disziplinierung der Schüler_innen durch eine Negativbepunktung bei nicht erbrachten Hausaufgaben, vielmehr ermöglicht es ihm auch seinen eigenen Regelverstoß nachträglich als pädagogische Maßnahme zu legitimieren. Auch an anderer Stelle taucht die Figur des SchulgesetzUmgehens unter Verweis auf die pädagogische Freiheit auf, wenn er die Legitimität seines Bepunktungssystems als Grundlage für die Notenfindung erläutert: „Und habe dann ähm (.) in meinem ersten Dienstjahr so ein bisschen äh (.) ähm (.) versucht, an einem Schlüssel zu arbeiten, der mir diese Punkte umrechnet auf eine Note. Skaliert nach dem 15-Punkte-Prinzip, ne? Also von=von Sechs, null Punkte bis Eins plus, 15 Punkte, ne? Jetzt sagt das Schulgesetz ja wiederum, Noten dürfen kein arithmetisches Mittel sein. Das wären sie ja nach meinem Prinzip. Da ich ja aber auch Pädagoge bin, behalte ich mir das Recht vor, diese Note, die DA steht, natürlich noch pädagogisch zu korrigieren. Ob ich das dann tue oder nicht, ist meine Freiheit und deshalb sage ich mit Fug und Recht, dass/ äh meine Noten SIND kein arithmetisches Mittel.“ (Z. 79-86)

Obwohl Herr Dabert die gezeigte Leistung der Schüler_innen nach einem Punkteschema notiert und diese Punkte dann von seinem Pocketcomputer zusammengerechnet werden, behält er sich die letztendliche Entscheidung über die Note im Bereich sonstige Leistungen unter Berufung auf seine ‚pädagogische Freiheit‘ als Lehrkraft vor. Er distanziert sich damit gleichsam von dem von ihm gewählten Hilfsmittel, um den Eindruck einer rein mathematischen Beurteilung zu vermeiden. Inwiefern er allerdings von seinem „Recht“ der pädagogischen Korrektur der errechneten Noten tatsächlich Gebrauch macht – und was legitime Gründe

374

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

für ein solches Abweichen wären – lässt er an dieser Stelle leider offen. Wie jedoch weiter oben gezeigt wurde, betont Herr Dabert selbst, dass er sich an die Ergebnisse des Gerätes „binde“. Hier zeigt sich eine interessante Ambivalenz in Herrn Daberts Erzählungen zu seiner Beurteilungspraxis, die er unter Rückgriff auf die sogenannte pädagogische Freiheit auflöst: Wie eingangs bereits beschrieben, stellen die Orientierung an den gesetzlichen Vorgaben einerseits und die akribische Einhaltung spezifischer Beurteilungsverfahren andererseits zwei wichtige Elemente einer in seinen Augen gerechten Beurteilung dar. In dem Moment, in dem sein Verfahren der kleinteiligen Bepunktung und Dokumentation jedoch an die Grenzen der gesetzlichen Vorgaben stößt (keine Benotung von Hausaufgaben, keine arithmetischen Mittelwerte bilden), findet sich im Rückbezug auf die pädagogische Freiheit eine Möglichkeit des legitimen Abweichens vom selbstgewählten Verfahren ohne dabei die Legitimität und Gerechtigkeit seiner Beurteilungspraxis zu gefährden. Seine Entscheidungen bewegen sich damit innerhalb des gesetzlich zugesicherten Rahmens des pädagogischen Freiraums und sind nicht willkürlich – ein Eindruck, den es in seinen Augen möglichst zu vermeiden gilt, um das eingangs erwähnte Gerechtigkeitsempfinden der Schüler_innen nicht zu verletzen. Auch im Hinblick auf die Beurteilung schriftlicher Arbeiten findet sich eine ähnliche Spannung zwischen einem einerseits strengen Beurteilungsverfahren anhand vorab festgelegter Notengrenzen und der gleichzeitigen Berufung auf den pädagogischen Spielraum, sollten die Ergebnisse einer Klassenarbeit einmal nicht erwartungskonform ausfallen. Dazu zunächst ein Auszug, in dem Herr Dabert die schulinterne Verfahrensweise für die Beurteilung schriftlicher Arbeiten erläutert: „Ich habe auch, was die Klassenarbeiten anbetrifft, einen festen Umrechnungsschlüssel. Der geht nach Prozenten. Es gibt also eine bestimmte Punktzahl, die man erreichen kann und dann gibt es einen Prozentschlüssel. (.) Der ist fest. Der ist auch in unserer Mathefachkonferenz völlig unflexibel festgelegt. Der unterscheidet sich in Sekundarstufe I und II. In der Sekundarstufe II ist er noch mal ein bisschen strenger. Da äh bekommt man also eine Vier minus, wenn man 50 Prozent der Punkte erreicht hat. Wissenschaftspropädeutisch, so läuft es an der Uni auch. Ne? (.) Mit 50 Prozent der Punkte ist man durch. Weniger (.) eben nicht. In der Sekundarstufe I gibt es die Vier

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

375

minus ab 40 (.) bis 45 Prozent. Also DIESEN Spielraum haben wir uns belassen.“ (Z. 352-359)

Die von Herrn Dabert vorgestellte – von der Fachkonferenz festgelegte – Absprache zur Benotung der Klassenarbeiten erinnert an die im Kapitel zur mathematisch-rechnerischen Gerechtigkeitsüberzeugung ausgeführten Beurteilungspraxen. Der „feste Umrechnungsschlüssel“ wird von ihm als Richtschnur seines Beurteilungshandelns für schriftliche Arbeiten eingeführt, und, anders als bei anderen Lehrkräften, nicht als unangenehme oder unerwünschte Einschränkung seiner professionellen Praxis beschrieben. Im Gegenteil, die Klassifikation des Umrechnungsverfahrens als „völlig unflexibel“ scheint für ihn positiv konnotiert zu sein. Die klaren Absprachen und Notengrenzen stellen für ihn eine Arbeitserleichterung dar, da die Entscheidungen über die Noten scheinbar widerspruchsfrei und eindeutig auf der Grundlage mathematischer Operationen (Punkte zu Prozenten zu Noten) getroffen werden. Eine der zentralen Legitimationsquellen findet sich also in der Eindeutigkeit des Instruments, das unflexibel und somit mit dem gleichen Maßstab für alle Schüler_innen angewandt wird. Dass die Notengrenzen zudem in kollektiver Absprache im Kollegium („Mathefachkonferenz“) beschlossen wurden, erhöht in seinen Augen deren Legitimität. Die kollektive Absprache eines Entscheidungsspielraums in der Sekundarstufe I („In der Sekundarstufe I gibt es die Vier minus ab 40 (.) bis 45 Prozent. Also DIESEN Spielraum haben wir uns belassen.“) ermöglicht zudem die flexible Anwendung bzw. regelkonforme Abweichung von dem zunächst als „völlig unflexibel“ charakterisierten Bepunktungsschlüssel in bestimmten Fällen. Im zweiten Teil des obigen Ausschnitts wird mit dem Verweis auf universitäre Beurteilungspraxen eine weitere Legitimationsquelle eingeführt, auf die sich Herr Dabert im Laufe des Interviews an mehreren Stellen bezieht. Die Hochschule und deren vermeintliche Beurteilungspraxis steht hierbei als Platzhalter für eine allgemeinere Orientierung am Wissenschaftssystem und den von ihm zugeschriebenen Standards wissenschaftlichen Arbeitens auf die er seine Schüler_innen vorbereiten will. ‚Wissenschaft‘ oder ‚Wissenschaftlichkeit‘ dienen als wichtige Bezugsgrößen seines Handelns, was nicht zuletzt daran deutlich wird, dass er

376

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

seine Beurteilungspraxis als „wissenschaftspropädeutisch“ qualifiziert. An anderer Stelle spricht er von sich selbst als „Mathematiker“ (Z. 765) und eben nicht als Mathematiklehrer, wodurch eine Selbstpositionierung als Fachwissenschaftler im naturwissenschaftlichen Feld nahegelegt wird. Inwiefern die von ihm aufgeführte Praxis, dass bei 50 % der Punkte die Note ‚bestanden‘ (4,0) vergeben wird, tatsächlich so auf die Notengebung an allen Universitäten in allen Studiengängen in Deutschland zutrifft, darf bezweifelt werden. Vielmehr scheint er hier seine eigenen Studienerfahrungen zu generalisieren. Seine Orientierung an den der Hochschule zugeschriebenen Standards – auf die er seine Schüler_innen nicht nur fachlich, sondern eben auch durch die Gewöhnung an die vermeintlichen Beurteilungsstandards vorbereiten will – korrespondieren mit einer auch an anderen Stellen des Interviews auftretenden studienorientierten Grundhaltung, die als typisch für Gymnasiallehrkräfte im deutschen Kontext gelten kann. Er bezieht sich auch positiv auf die schriftlichen Klausuren in seinem Mathematikstudium mit dem Hinweis: „Äh dass es in den=in den schriftlichen Prüfungen (.) eigentlich (..) ja sehr klar zugeht, keinen Diskussionsspielraum gibt, keinen Verhandlungsspielraum. Ne? Also da ist sozusagen die Note wirklich unglaublich fair“ (Z. 841-843). Hier zeigt sich erneut die Verknüpfung eines standardisierten Beurteilungsverfahrens, das für alle Schüler_innen den gleichen Maßstab anlegt und „keinen Diskussionsspielraum“ zulässt, mit seiner Vorstellung einer gerechten bzw. „fair[en]“ Beurteilung. Insgesamt wird deutlich, dass ‚Wissenschaftlichkeit‘ von Herrn Dabert vor allem in Bezug auf die klassischen Gütekriterien statistischer Messungen – Objektivität, Reliabilität, Validität – und einem eher naturwissenschaftlichpositivistischen Wissenschaftsbegriff gedacht wird. Konstruktivistische oder hermeneutische Konzepte, die eher in den Geisteswissenschaften verortet sind, finden sich hingegen nicht als Orientierungsrahmen in seinen Ausführungen. Im weiteren Verlauf des Interviews berichtet Herr Dabert von zwei Episoden, in denen das Umgehen bzw. Anpassen des oben als „völlig unflexibel“ beschriebenen Bepunktungsschlüssels für schriftliche Arbeiten thematisiert wird. Auch das bereits eingeführte Thema der Differenz

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

377

zwischen prozedural hergestellter Note und erwarteter Note taucht hier erneut auf. Dazu der erste Auszug: „Natürlich kann man dann solche Ergebnisse (.) schönen, ne? Wenn man feststellt, ähm (.) äh die GANZE Klasse als solche rutscht in einen eher schlechten Bereich, dass man dann diese Prozente (.) VERSTELLT. Das läuft auch alles über ein Berechnungsprogramm. Es gibt ja so Software dazu. Ich mache das über eine Excel-Tabelle. (.) Das äh VERBIETE ich mir aber selbst. Ich tue das bewusst nicht. (.) Ich finde, die Schüler müssen auch mal mit schlechten Ergebnissen leben. Die müssen auch mal erfahren, dass äh eine Klausur oder Klassenarbeit auch wirklich anspruchsvoll war. WAS ich häufig mache, ist, dass ich dann die nächste Klassenarbeit (.) etwas abspecke. (.) Damit die im Schnitt [lachend] wieder auf ihr (.) Leistungsbild kommen, ne? Es wäre auch eine Form von Manipulation, aber nicht IN der Sache, (.) sondern als Reaktion.“ (Z. 360-368)

In dieser Passage findet ein auffälliger Wechsel der Sprechpositionen zwischen dem unpersönlichen „man“ und der Ich-Erzählung statt, die von Herrn Dabert zur deutlichen Distanzierung von einer bestimmten Art der „Manipulation“ der Bepunktung genutzt wird. Das sogenannte „[S]chönen“ der Ergebnisse durch ein Herauf- oder Herabsetzen der Notengrenzen wird zunächst als möglicher Umgang mit nichterwartungskonformen Klausurergebnissen in der unpersönlichen manForm eingeführt, um dann jedoch vehement in der Ich-Form abgelehnt zu werden („Ich tue das bewusst nicht“). Durch die betonte Steigerung „das VERBIETE ich mir aber selbst“ wird die klare Distanzierung von solcherlei Praktiken – und indirekt auch von den Kolleg_innen, die diese Anpassungen der Notengrenzen ggf. vornehmen – noch deutlicher. Unklar bleibt jedoch, worauf sich die vorangegangene Aussage „Ich mache das über eine Excel-Tabelle“ bezieht – die Dokumentation der erreichten Punktzahlen je Schüler_in oder das „verstell[en]“ der Prozentwerte – da an dieser Stelle keine Nachfrage im Interview erfolgte. Als Gegenentwurf zu der von ihm verworfenen Praxis der nachträglichen Anpassung der Prozentwerte für die Notengrenzen führt Herr Dabert seine „Form der Manipulation“ ein, die er für legitim(er) hält: das inhaltliche „Abspecken“ der nächsten Klassenarbeit. In der Konjunktivformulierung „es wäre auch eine Form der Manipulation“ deutet sich schon die Distanzierung vom negativ besetzten Begriff der Manipulation an, durch die nachfol-

378

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

gende Unterscheidung einer Manipulation „IN der Sache“ und einer Manipulation „als Reaktion“ versucht er diesen negativen Beigeschmack noch weiter aufzuweichen. Das „Abspecken“ der Klassenarbeiten – im Umfang, Inhalt oder Schwierigkeitsgrad – wird dabei als legitime pädagogische Maßnahme charakterisiert, da sie in Reaktion auf die vorangegangene schlechtere Benotung erfolge. Das ursprünglich verabredete Benotungsverfahren wird somit nicht korrigiert, die gesetzten Notengrenzen eingehalten und damit die Verfahrenstreue nicht gefährdet. Mit der konsequenten Einhaltung der abgesprochenen Regeln verbindet sich für Herrn Dabert sogar eine pädagogische Lektion für die Schüler_innen, die „auch mal mit schlechten Ergebnissen leben [müssen]“ und „auch mal erfahren [müssen], dass äh eine Klausur oder Klassenarbeit auch wirklich anspruchsvoll war“. Das „Abspecken“ der nächsten Klassenarbeit erfolgt wiederum zur Herstellung einer gewissen Normalität im „Leistungsbild“ der Klasse („Damit die im Schnitt [lachend] wieder auf ihr (.) Leistungsbild kommen, ne?“), wobei nicht ganz klar wird, ob mit der Formulierung „ihr Leistungsbild“ aus der Perspektive der Schüler_innen (die ihr eigenes „Leistungsbild“ verbessern wollen) oder der Lehrkraft (die das zugeschriebene „Leistungsbild“ aufrechterhalten will) gesprochen wird. Deutlich wird aber, dass ein auffälliges Abweichen einer ganzen Schulklasse von der Normalerwartung, wie im Beispiel eingangs eingeführt, in jedem Fall durch die Lehrkraft aufgefangen werden muss – sei es durch in seinen Augen illegitime Veränderungen des Punktesystems oder legitimes nachträgliches Ausgleichen durch eine ‚leichtere‘ Folgeklausur. In einer längeren anschließenden Passage erzählt Herr Dabert von einer weiteren Ausnahme bzw. einem Fall, in dem er von den von ihm geschätzten Vorgaben abgewichen ist. So habe er einmal eine 8. Klasse in Mathematik übernommen von einem Kollegen, der „einen sehr modernen Mathematikunterricht“ machte, der allerdings „(..) um es positiv auszudrücken, den Schülern viel zu viel Freiräume gelassen hat“ (Z. 372374). Wie er nun auf die Ergebnisse der ersten Klassenarbeit in dieser neuen Lerngruppe reagierte, schildert Herr Dabert im folgenden Auszug:

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

379

„Jetzt haben diese meine Schüler natürlich ein WAHNsinniges Mathematikverständnis so im intuitiven Bereich gehabt, aber überhaupt kein Handwerkszeug, ne? DAS musste ich denen erst Mal nahebringen und die erste Klassenarbeit fiel also GROTTENSCHLECHT aus. GROTTENSCHLECHT. Lauter Fünfen, also (.) ein furchtbares Bild. Das ich dann auch äh bewusst (.) versch/ also beschönigt habe. Wobei ich DIESE Beschönigung den Schülern auch transparent gemacht habe. Ich habe das gegenübergestellt und habe denen gesagt: ‚Wenn ich euch bewertet hätte nach dem Maßstab, wie ich es sonst tue, wäre DIESES Leistungsbild dabei rumgekommen. (.) Und das will ich euch nicht antun. Denn ich weiß, dass der Wechsel, der Klassenlehrerwechsel oder der Lehrerwechsel für euch auch eine sehr, sehr große Umstellung ist.‘ [...] Und äh auf diesem ganzen Hintergrund habe ich dann einmal tatsächlich die ganze Klassenarbeit aber wirklich radikal äh beschönigt, ne? Also wo dann also ALLE mindestens/ ja mindestens eine ganze Notenstufe heraufgesetzt wurden. Wenn nicht drei Tendenzen. Ne? Also aus Fünf wurde dann Vier plus. Nein. (..) Fünf plus. Ja, das wären ja vier=vier Notenschritte sogar. Ne?“ (Z. 382-400)

Deutlich wird zunächst der enge Zusammenhang zwischen grundsätzlichen fachdidaktischen Überzeugungen (was ist ein guter Mathematikunterricht) und den damit zusammenhängenden Beurteilungskriterien, die je nach Lehrkraft sehr unterschiedlich ausfallen können. Herr Dabert bemüht sich, den Unterricht seines Kollegen, den er als „unglaublich toll“, „menschlich ein ganz warmer Typ“ (Z. 371-373) charakterisiert, wertschätzend zu beschreiben („moderner Mathematikunterricht“). Gleichzeitig macht er aber deutlich, dass „das drohende Zentralabitur oder die zentralen Abschlussprüfungen oder die Lernstandserhebungen in der 8, die auf einmal eine ganz andere Mathematik fordern, ne?“ (Z. 377-379) in seinen Augen nicht mit dieser Art des Mathematikunterrichts konformgingen. Den Beweis dafür scheint er im “GROTTENSCHLECHT[EN]“ Abschneiden der Klasse in der ersten Klassenarbeit unter seiner Leitung zu sehen, denn die Schüler_innen hätten zwar ein „intuitive[s]“ Mathematikverständnis entwickelt, aber eben „überhaupt kein Handwerkszeug“ gelernt. Die Erklärung der schlechten Noten der Lerngruppe liegt somit für Herrn Dabert in der unterschiedlichen didaktischen Fokussierung des Unterrichtsstoffs der beiden Lehrkräfte und den daraus entstandenen Defiziten, die er zunächst habe ausgleichen müssen. Unter diesen besonderen Umständen (Lehrerwechsel, didaktische Unterschiede) wird eine „Beschönigung“ der Ergebnisse nun für ihn

380

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

legitim. Dass er genau diese Anekdote auswählt, um mir zu erläutern, was für ihn als legitime bzw. illegitime Abweichung von seiner zu Beginn erläuterten Beurteilungspraxis gilt, zeigt noch einmal den starken Fokus auf die Einhaltung von Regeln und Verfahrensweisen als dominierende Gerechtigkeitsüberzeugung. Die ausführliche Legitimierung des Abweichens von dieser (selbst gesetzten) Norm erfolgt dabei auch über die Abgrenzung von einem bestimmten didaktischen Verständnis eines ‚guten‘ Mathematikunterrichts, den er zwar als „modern“ beschreibt, gleichzeitig aber im Spiegel zentraler Prüfungen als unzureichend verwirft. In den zentralen Lernstandserhebungen wiederum hätten die Schüler_innen dieser Klasse „im Vergleich zu den anderen Klassen gut abgeschnitten“ (Z. 751), da sowohl der Unterricht des Kollegen als auch die Tests „problemorientiert“ (Z. 750) gewesen seien. Das daraus entstandene Erfolgserlebnis für die Schüler_innen führte jedoch nicht zur Veränderung seines Unterrichts oder der Beurteilungspraxis.

Individuelle Förderung als „Dienstpflicht“ Die bisher herausgearbeitete handlungsleitende Orientierung Herrn Daberts an rechtlichen Vorgaben und der Einhaltung spezifischer Beurteilungsverfahren findet sich in gewisser Weise auch in seinem Verständnis individueller Förderung wieder. Ausgehend von seiner Einschätzung der zentralen Lernstandserhebungen als „Mehrarbeit (.) völlig sinnfrei“ (Z. 740), sowie eine „Zusatzbelastung, die wir NICHT einmal leistungsmäßig in unsere Notengebung einfließen lassen DÜRFEN“ (Z. 747-748) erläutert Herr Dabert seinen eher pragmatischen Umgang mit den Ergebnissen der Lernstandserhebungen („Da schreibt man was. [..] Dann wird das abgeheftet (.) und gut ist“, Z. 764-766), um anschließend überzuleiten, dass es „natürlich sehr löblich“ wäre diese Ergebnisse auch als Anregungen für Veränderungen im Unterricht und den Ausbau von Angeboten individueller Förderung zu nutzen. In seinen anschließenden Ausführungen wird allerdings deutlich, dass er dies vor allem als „Dienstpflicht“, die es zu erfüllen gilt, versteht:

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

381

„Ähm (...) das tun wir auch (..) mit größter Überwindung. Und dann werden zum Beispiel so Sachen beschlossen wie: ‚Wir müssen einzelne Schüler fördern durch unser (.) fest verankertes Konzept ‚Schüler helfen Schülern‘. ‚Wir müssen Förderunterricht einrichten‘. Zum Beispiel durch Mathematikreferendare, bei denen einzelne Stunden frei geworden sind, gezielt in DER Klasse. Also ich will das jetzt nicht alles schlecht reden. Wir TUN das, ja. Weil das ist ja auch unsere Dienstpflicht. Ne?“ (Z. 769-774)

Deutlich wird die grundsätzliche Skepsis gegenüber Maßnahmen individueller Förderung, denen die Lehrkräfte „mit größter Überwindung“ begegnen. Inwiefern die Lehrkräfte der Schule sich tatsächlich an der Durchführung zusätzlicher Fördermaßnahmen beteiligen, kann hier nicht beurteilt werden. Auffällig ist allerdings, dass Herr Dabert lediglich davon spricht, dass einzelne Maßnahmen im Kollegium beschlossen wurden, in der eigentlichen Umsetzung scheinen dann wiederum vor allem die Schüler_innen selbst als Peer-Tutor_innen und Referandar_innen als tatsächliche Akteure der von der Schule verabschiedeten Konzepte zur individuellen Förderung in Erscheinung zu treten – nicht die Lehrkräfte selbst. Die Verwendung der Pluralform lässt vermuten, dass Herr Dabert hier von einer im Kollegium geteilten eher ablehnenden Haltung gegenüber der Idee der individuellen Förderung ausgeht, die lediglich im Rahmen der „Dienstpflicht“ erfüllt werde. Ein weiterführendes Engagement über diese Pflichterfüllung hinaus schließt er anscheinend aus. Diese skeptisch-ablehnende Haltung verdeutlicht er im weiteren Verlauf der Passage, wenn er resümiert: „Aber (.) ich glaube, was uns so zuwider ist und was auch mir schwerfällt, ist, dass da offensichtlich die Einstellung dahintersteckt: Man MUSS es nur richtig machen (.) und dann kann jeder Schüler Spitzenleistungen bringen und im obersten Kompetenzniveau landen. Ja? (.) Und DAS IST BLÖDSINN. [...] Sonst müsste man doch alle Realund Hauptschulen auflösen und sagen wir schicken ALLE zum Gymnasium. Ausnahmslos alle. Denn, man muss es nur richtigmachen und dann kann jeder Abitur und kann auch jeder studieren. Dann kann auch jeder (.) nach Princeton, dann/ so/ Verstehen Sie, was ich meine?“ (Z. 774-786)

Für Herrn Dabert stellt das Konzept der individuellen Förderung eine utopische Idee dar, die er vehement als „BLÖDSINN“ ablehnt. In der Generalisierung und überspitzten Darstellung der vermeintlich zugrundeliegenden Idee („kann jeder Schüler Spitzenleistungen bringen und im

382

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

obersten Kompetenzniveau landen“) wird diese Ablehnung besonders deutlich. Die wiederholte Formulierung „man muss es nur richtigmachen“ lässt sich auch als Reaktion auf einen impliziten Vorwurf verstehen, dem er sich – stellvertretend für alle Lehrkräfte – ausgesetzt sieht: Mit der Forderung nach einer individuelleren Förderung von Schüler_innen einher ginge eine Erwartungshaltung an die Lehrkräfte, allen Schüler_innen – unabhängig von ihrer jeweiligen Lernausgangslage – zu „Spitzenleistungen“ und zum Abitur zu verhelfen. Diesen (vermeintlichen) Anspruch sieht er als unmöglich einzulösen an, weshalb ihm das gesamte Konzept der individuellen Förderung „zuwider“ sei und „schwerfällt“. Als Beleg für die Unmöglichkeit der Umsetzung führt er weiterhin an, dass dieses die Auflösung des gegliederten Schulwesens zur Folge haben müsste – offenbar eine Vorstellung, die Herrn Dabert wenig sinnvoll und utopisch erscheint, wie in der Steigerung „dann kann jeder Abitur und kann auch jeder studieren. Dann kann auch jeder (.) nach Princeton“ deutlich wird. Der Besuch der US-amerikanischen Eliteuniversität Princeton wird hierbei als ironisches Beispiel angeführt, um die Lächerlichkeit der von ihm attestierten Grundannahme zu belegen und sich noch deutlicher davon zu distanzieren. Mit der Rückversicherungsfrage „Verstehen Sie, was ich meine?“ sichert er sich mir gegenüber ab und zeigt gleichzeitig seine Ungläubigkeit gegenüber einem solchen Vorhaben. Wie weiter oben bereits eingeführt, finden sich im Interview mit Herrn Dabert kaum Momente der Unterstützung oder Hilfestellung gegenüber Schüler_innen, auch die Art der Leistungsrückmeldung erfolgt lediglich bezogen auf den Ist-Stand, nicht auf den Lernprozess. „Individuelles Feedback“ (Z. 451) zu geben, bedeutet für Herrn Dabert vor allem die Noten in schriftlichen Arbeiten bei der Rückgabe der Hefte zu kommentieren und vereinzelt Hinweise zu bestimmten typischen Fehlern zu geben. Manchmal versuche er auch Schüler_innen bei schlechten Noten etwas aufzumuntern - „die Mühe mache ich mir bei den Unterstufen“ (Z. 449-450) – dies passiere jedoch in der Mittelstufe „abgespeckter“ und in der Oberstufe gar nicht mehr. Er bezeichnet seine Form der Rückmeldung selbst mit den Worten „ich mache das SEHR klassisch und sehr

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

383

konventionell“ (Z. 413-414), die Rückmeldungen erfolgen hauptsächlich über die Punkte und Noten in den Erwartungsbögen für schriftliche Arbeiten bzw. den Punktestand im Pocketcomputer. Eine darüberhinausgehende Erläuterung zur Entstehung der Beurteilungen bzw. eine in die Zukunft gerichtete Beratung und Unterstützung des Lernprozesses im formativen Sinne wird nicht erwähnt. Insofern fügt sich die starke Abwehr des Konzeptes individueller Förderung in eine generellere Haltung gegenüber schulischer Leistung als etwas, das ausschließlich von den Schüler_innen zu erbringen und von den Lehrkräften abzuprüfen ist. Eine weitergehende Verantwortung für den Lernerfolg der Schüler_innen und eine Unterstützung ihrer Lernprozesse, wie sie im Modus der diskursiv-interaktiven und kompensatorischen Gerechtigkeitsüberzeugungen deutlich werden wird, findet sich bei Herrn Dabert nicht. Ebenfalls deutlich wird im obigen Ausschnitt, dass die Ablehnung individueller Förderung als Aufgabe von Lehrkräften mit seinem grundsätzlichen Befürworten des gegliederten Schulsystems – und der damit einhergehenden Hierarchisierung von Schulformen – zusammenhängt. Maßnahmen der individuellen Förderung scheinen für ihn eher an den ‚niedrigeren‘ Schulformen Haupt- und Realschule angemessen zu sein, nicht aber an einem Gymnasium. Dass Herr Dabert individuelle Fördermaßnahmen eher als lästige Zusatzaufgabe ansieht, die nicht zu den Kernaufgaben einer Gymnasiallehrkraft gehören, zeigt sich auch am Fall einer Schüler_in in Klasse 6, die im Fach Mathematik „im Fünfer-Bereich“ stehe, weshalb die „Aussicht eher schlecht“ (Z. 175-176) sei. Herr Dabert räumt kurz ein, dass dies „aus der familiären Situation und auch IHRER Rolle INNERHALB des Klassenverbands“ (Z. 173-175) resultiere, weshalb Herr Dabert argumentiert, in diesem Fall könne er nicht „nur nach Leistung“ (Z. 178) bei der Beurteilung gehen. Er führt dann weiter aus: „Also muss ich ein anderes Kriterium anlegen und das ernsthafte Bemühen (.) der Schülerin mit in den Blick nehmen. Ihre Sorgen auch. (.) Und dann auch eine=eine Entwicklungslinie mit in den Blick nehmen. Zum Beispiel, wenn sie=wenn sie eine Fünf geschrieben hat, eine Fünf geschrieben hat, auf einmal gemerkt hat, so kann das nicht weitergehen. Und schafft DANN eine Drei durch ein Wunder und beteiligt sich auch im Unterricht AUF EINMAL etwas mehr als vorher - ich will das Ganze ja jetzt

384

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

nicht so [lachend] übertrieben darstellen, also das wäre vielleicht so die=die Krönung – DANN kann ich auch als Lehrer mit Fug und Recht sagen, also da hat wirklich mal jemand gezündet, wenn auch spät. Und es ist dann doch noch eine Vier geworden. (.) Ja? Also so behalte ich mir eben doch das Recht vor, von diesen arithmetischen Mitteln, dieser Berechnungsgrundlage also (.) abzuweichen, ne? Immer zum Wohl der Schülerin, des Schülers und nicht zum Nachteil.“ (Z. 182-192)

Die zunächst eingeführten „andere[n] Kriteri[en]“ der Leistungsbeurteilung – „ernsthaftes Bemühen“, „ihre Sorgen“ und „eine Entwicklungslinie“ – erscheinen zunächst als Erweiterung dessen, was als Leistung von ihm anerkannt und in die Benotung einbezogen werden kann. Auf den zweiten Blick wird deutlich, dass die Verbesserung der Note vor allem von der Anstrengung, dem „ernsthaften Bemühen“ der Schülerin abhängt, da Herr Dabert deutlich macht, dass es sich schon um eine deutliche Steigerung der Leistungen handeln müsse, um „mit Fug und Recht“ eine Vier vergeben zu können. In der Formulierung „durch ein Wunder“ wird diese Leistungssteigerung ins Reich des Übernatürlichen verwiesen, so als traue er der Schülerin diese nicht ganz zu. Auch müsse eine Verbesserung sowohl im schriftlichen als auch im mündlichen Beurteilungsbereich erfolgen, um die bessere Note zu erreichen. Gleichzeitig wird an keiner Stelle ein Hilfsangebot durch die Lehrkraft erwähnt, eine Unterstützung der Bemühungen der Schülerin findet sich nicht. Die Erwartungshaltung scheint vielmehr zu sein, dass die Schülerin die oben geschilderte Leistungsverbesserung von sich aus erbringt, um Herrn Dabert davon zu überzeugen, „von diesen arithmetischen Mitteln, dieser Berechnungsgrundlage [...] abzuweichen“.201 Das Wissen um die anscheinend schwierige Ausgangslage der Schülerin (abgeleitet aus einer nicht näher beschriebenen „familiären Situation“ und ihrer Rolle innerhalb der Lerngruppe) wird zwar von Herrn Dabert als Begründung für einen erweiterten Leistungsbegriff aufgeführt, in der geschilderten Benotungspraxis findet sich jedoch keine besondere Berücksichtigung dieser Aus201

An dieser Stelle wiederholt Herr Dabert erneut die Formulierung des „arithmetischen Mittels“ als Grundlage seiner Beurteilungen, obwohl er sich, wie oben gezeigt, davon zu distanzieren versucht.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

385

gangslage. Die im nordrhein-westfälischen Kontext häufig verwendete Formulierung der ‚pädagogischen Note‘ wird von Herrn Dabert zu Beginn der obigen Passage zwar auch eingeführt, in den darauffolgenden Erzählungen wird jedoch deutlich, dass es sich vor allem um Einzelfälle handelt, in denen Zensuren durch pädagogische Überlegungen ergänzt werden: So beispielsweise, wenn die Versetzung gefährdet ist und die Zeugniskonferenz zu einer gemeinsam getragenen Entscheidung kommt, die Note eines Schülers oder einer Schülerin anzuheben. Hier betont er jedoch, dass diese Veränderungen der Noten immer nur zum Besseren stattfinden würden, eine Korrektur der Noten „nach unten“ sei „eher auch umstritten“ (Z. 164-165), dies sei „ja auch nicht haltbar. Da macht man sich angreifbar, ne?“ (Z. 167-168). Eine Verschlechterung der Zeugnisnote wird also nicht aus pädagogischen Gründen, wie einer potentiellen Demotivation der Schüler_innen, abgelehnt, sondern vor allem aufgrund des möglichen Risikos eines Widerspruchs durch die Schüler_innen oder deren Eltern bzw. die Schulleitung. Vor diesem Hintergrund fällt dann auch auf sein Schlusswort zum Fall der Sechstklässlerin („Immer zum Wohl der Schülerin, des Schülers und nicht zum Nachteil“, Z. 191-192) ein anderes Licht. Die Einhaltung der Verfahrensregeln überwiegt hier die ‚pädagogischen‘ Überlegungen, Abweichungen von den Regeln sind nur unter besonderen Bedingungen legitim: im Fall der korrigierten Zeugnisnoten wird die Entscheidung kollektiv getragen und auch nur „nach oben“ verändert; im Fall der Sechstklässlerin bedarf es des Nachweises besonderer Anstrengungen, um das Abweichen vom arithmetischen Mittel zu rechtfertigen. ` Ideales Schüler_innenbild: „Pfiffigkeit, die sie haben oder nicht“ Herrn Daberts skeptisch-ablehnende Haltung gegenüber der Idee individueller Förderung lässt sich auch aus seinem idealen Schüler_innenbild erklären. Angesprochen auf sein Verständnis eines ‚guten‘ Schülers bzw. einer ‚guten‘ Schülerin antwortet er folgendermaßen:

386

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

„Ich definiere gute oder schlechte Schüler ÜBERHAUPT nicht über ihre NOTEN. [I: Sondern, über?] Ähm (..) ihre charakterlichen Stärken. (..) Übe:er (..) ja, Pfiffigkeit, die sie haben oder nicht. Ich finde sowieso, dass man noch mal neu, gerade in dieser leistungsorientierten Gesellschaft, eine Diskussion losbrechen müsste über den Begriff der Intelligenz. Ne? Ich stehe ja auch diesem ganzen äh (.) dem Begriff des Intelligenzquotienten GANZ skeptisch gegenüber, ne? Das ist für mich völliger Blödsinn. Ne? (.) Also, was ist das für eine Art von Intelligenz, ne? Ich bin mehr für das äh/ für den antiken Begriff der=der Weisheit oder so. Oder der Klugheit. Ne? Und DIE hängt nicht zweifel/ also DIE hängt für mich äh (.) zweifelsfrei NICHT an schulischen Leistungen. Wo die doch (.) in vielen Fällen sowieso so schwammig sind.“ (Z. 495-506)

Herr Dabert distanziert sich hier sehr stark von den Zensuren als Marker für „gute oder schlechte Schüler“ und führt stattdessen die weicheren Kriterien „charakterliche Stärken“ und „Pfiffigkeit, die sie haben oder nicht“ ein. Beide Kriterien stellen Persönlichkeitsmerkmale dar, über die Schüler_innen in seinen Augen verfügen – oder eben auch nicht. Hier tut sich eine starke Analogie zu einem statischen Begabungsbegriff auf, der Begabung als angeborenes Merkmal und nicht als zu entwickelndes Potenzial fasst und dessen Vorhandensein als Begründung für besondere Leistungen herangezogen wird. Im Gegenzug begründet das Fehlen einer bestimmten Begabung schwächere Leistungen in einem Gebiet. Neben der „Pfiffigkeit“ führt Herr Dabert auch die Begriffe der „Weisheit“ und „Klugheit“ als Merkmale ‚guter‘ Schüler_innen an und stellt diese wiederum dem für ihn negativ besetzten Begriff der „Intelligenz“ gegenüber. In seiner Ablehnung des Intelligenzbegriffs und insbesondere des Intelligenzquotienten schwingt auch eine unbestimmte Skepsis gegenüber der Aussagekraft dieser Konstrukte und dem, was sie vorgeben zu messen, mit. Die von ihm bevorzugten Begriffe hingegen entziehen sich der statistischen Messbarkeit und lassen damit einen großen Deutungsspielraum offen. „Klugheit“ und „Weisheit“ werden folgerichtig auch als etwas entworfen, dass sich „zweifelsfrei NICHT an schulischen Leistungen“ messen lasse, also auch nicht in Form von Noten abbilden lasse. Vor dem Hintergrund seiner sehr ausführlich geschilderten Bemühungen um die exakte Erfassung der Schüler_innenleistungen mithilfe verschiedener Beurteilungsverfahren (Pocketcomputer, Erwartungshorizonte) wirkt diese Distanzierung von Noten und schulischer Leistung zunächst irritie-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

387

rend – insbesondere die Qualifizierung schulischer Leistungen als „schwammig“. Diese ambivalente Positionierung zwischen einer (programmatischen) Ablehnung von Noten einerseits und einer positiven Bezugnahme auf Noten in der geschilderten Beurteilungspraxis andererseits findet sich jedoch auch an anderen Stellen des Interviews. So beispielsweise der Ausspruch: „Die armen Kinder. Ähm, (.) das alles immer nur über Noten geht!“ (Z. 484-485) nur wenige Momente nachdem Herr Dabert lachend erzählt, dass er mit den Schüler_innen der Unterstufe in Mathematik ein klassenöffentliches Belohnungsritual eingeführt habe, bei dem die Schüler_innen mit den besten Noten ein Siegertreppchen an die Tafel gemalt bekommen: „Das geht dann nach Noten. Und manchmal teilen sich auch zwei, drei Schüler ein Podest, wenn die die gleiche Punktzahl äh erreicht haben. Und dann male ich denen tatsächlich so ein Podest. Ne? Platz eins, zwei, drei. Und so ein lustiges Männchen da drauf“ (Z. 418-421). Auf der einen Seite findet also eine Ablehnung von Noten statt, auf der anderen wird bewusst mithilfe von Ritualen ein „Wettbewerbscharakter“ (Z.415) initiiert, der den Erwerb von Noten – und insbesondere guten und sehr guten Noten – als erstrebenswert inszeniert. Die oben zitierte „Pfiffigkeit“, über die ‚gute‘ Schüler_innen Herrn Dabert zufolge von sich aus verfügen, erklärt dann auch seine Einschätzung einer Schülerin, deren sehr gute Leistungen er damit kommentiert, dass diese auf „Büffelei“ und durch „Druck von zuhause“ entstünden, das Mädchen aber kein „geborenes Naturtalent“ sei (Z. 716-717). Ähnlich wie im obigen Beispiel mit der Sechstklässlerin werden Anstrengung und Fleiß für sich genommen als nicht ausreichend bzw. sogar etwas Negatives („Büffelei“) betrachtet, da diese Bemühungen nicht auf einem grundlegend vorhandenen Talent (oder einer Begabung) bzw. der nicht messbaren „Pfiffigkeit“ als einem unausgesprochenen Extra aufbauen.202 Als zusätzlich schwierigen Faktor führt Herr Dabert die familiäre Herkunft der ‚büffelnden‘ Schülerin ein, die offenbar als Erklärung für deren 202

Das Phänomen der Ablehnung von zu offensichtlicher Anstrengung bei Gymnasialschüler_innen findet sich auch schon bei Fend und Specht (1976).

388

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

– in seinen Augen übertriebenen – schulischen Ehrgeiz dient: „Und das ist genau so eine Familie, wo die Mutter die Hauptschule besucht hat. Der Vater ist glaube ich/ äh der arbeitet in der Verwaltung. Ich will damit überhaupt jetzt kein Klischee auftun, ich nenne nur konkrete Beispiele. Ne? Die wollen also für ihr Kind das ALLERBESTE und wollen die mit aller Kraft da durchdrücken“ (Z. 707-710).

Auch wenn Herr Dabert sich mir gegenüber bemüht „kein Klischee“ bedienen zu wollen, so findet sich auch an anderer Stelle der Hinweis darauf, dass die Frage der familiären, sozialen Herkunft der Schüler_innen für Herrn Dabert in engem Zusammenhang mit der den Schüler_innen zugeschriebenen Leistungsfähigkeit steht. Im folgenden Auszug verallgemeinert er diese Zuschreibung auf die Schüler_innenschaft seiner Schule: „Es gibt (.) GANZ wenige Akademiker in unserer Elternschaft. Also dieses typische Innenstadtklischee, dass man als Lehrer bangen muss, weil man da einen Juristen, einen Notar, einen Richter oder Chirurgen oder was=weiß=ich vor sich sitzen hat. Das kommt hier nicht vor. Mittelschicht bis Arbeiterklasse. Und diese Eltern schicken ALLESAMT ihre Kinder zu uns. Was ich zunächst einmal völlig legitim finde, denn wir stellen natürlich auch fest, dass (.) diese Kinder äh hervorragende Leistungen bringen.“ (Z. 627-632)

In der einschränkenden Formulierung, dass es „zunächst einmal völlig legitim“ sei, dass Schüler_innen aus nicht-akademischen Elternhäusern seine Schule besuchen, da „diese Kinder äh hervorragende Leistungen bringen“, zeigt sich Herrn Daberts ‚Normalvorstellung‘ der Schülerschaft eines Gymnasiums: Diese würden hauptsächlich aus akademischen Elternhäusern stammen, in denen die Eltern beispielsweise „Richter“ oder „Chirurgen“ seien, woraus anscheinend auf die ‚Gymnasialtauglichkeit‘ der Kinder geschlossen werden könne. Dass die tatsächliche Schüler_innenschaft, die eher der „Mittelschicht bis Arbeiterklasse“ entstamme, „natürlich auch“ „hervorragende Leistungen“ bringe, wird damit als eine Besonderheit gerahmt, die dieser Normalerwartung nicht entspricht. Implizit scheint Herr Dabert von der sozialen Vererbbarkeit schulischer Leistung(sfähigkeit) auszugehen, die durch die nichterwartungsgemäßen guten Leistungen der atypischen Gymnasialschüler_innen gebrochen wird. Gleichzeitig schwingt ein wenig Erleichterung

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

389

darüber mit, dass es nur wenige Eltern gebe vor denen „man als Lehrer bangen muss“, woraus sich wiederum eine Hierarchisierung der sozialen Zusammensetzung der Schüler_innenschaft ablesen lässt. 203 Die Eltern seiner Schüler_innen ließen dagegen teilweise einen übertriebenen Aufstiegswunsch erkennen, der dazu führe, dass sie „SO sehr frustriert [seien], wenn das dann auch MAL nicht funktioniert“ (Z. 643). Die Charakterisierung der Schüler_innen seiner Schule als atypisch verbunden mit einem teilweise ungerechtfertigten Aufstiegswunsch ihrer nichtakademischen Eltern (Z. 637-641) liefern ihm damit zugleich eine potentielle Erklärung für schwächere schulische Leistungen – ohne, dass diese direkt auf ihn als Lehrkraft oder die Schule als Organisation zurückfallen können. Denn, dass die Schüler_innen teilweise nicht dem Anspruchsniveau des Gymnasiums entsprechen würden, macht Herr Dabert unmissverständlich deutlich: „Ich persönlich würde sagen: Unsere Schüler sind überhaupt nicht mehr so richtig daran gewöhnt, ähm (.) ein=ein hohes Niveau anzupeilen. Was vielleicht vor der Bildungsexpansion das Abitur noch war. Gehen dann an die Uni [lachend] und wollen sich da ähnlich entspannt durchwurschteln wie das an den Schulen passiert. Ne? [...] ich würde sagen das Abitur ist unglaublich abgesackt. (.) Unglaublich abgesackt. (..) Kurioserweise haben die Schülerinnen und Schüler von heute trotzdem Schwierigkeiten damit. [...] Oder empfinden das als viel, (.) als anstrengend. Ne?“ (Z. 652-659)

Die oben noch mit der sozialen Herkunft von Schüler_innen verknüpfte fehlende ‚Gymnasialtauglichkeit‘, wird nun zu einer verallgemeinernden Klage über den ‚Verfall‘ des Gymnasiums, nach der das Niveau des Gymnasiums im Allgemeinen und der Wert des Abiturs im Besonderen an Wert verliere („unglaublich abgesackt“). Für dieses ‚Absacken‘ des gymnasialen Niveaus finden sich laut Herrn Dabert drei erklärende Faktoren, die ineinandergreifen: Zum einen die fehlende Leistungsbereitschaft und/oder –fähigkeit der Schüler_innenschaft („Unsere Schüler sind überhaupt nicht mehr so richtig daran gewöhnt, ähm (.) ein=ein hohes Niveau 203

Dass Herr Dabert ausschließlich juristische und medizinische Berufe benennt, die als starke Professionen – vor allem im Vergleich zum Lehrberuf – gelten, verstärkt diesen Eindruck noch einmal.

390

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

anzupeilen“); zum anderen die oben erwähnten ‚übertriebenen‘ Ansprüche der Eltern, die den Erwerb des Abiturs für ihre Kinder anstreben, „Als wäre das so eine Art ähm (..) ja Konsumgut. Ne? (.) Das man das einfach bekommen kann“ (Z. 640-641); und drittens, ein Absinken der Ansprüche des Gymnasiums selbst, dass sich beispielsweise in zu leichten Aufgaben des Zentralabiturs zeige: „Ich persönlich bin der Meinung, man bekommt das Abitur heute sowieso viel zu einfach“ (Z. 641). Aufgrund seines vergleichsweise jungen Berufsalters irritieren Formulierungen wie „Schülerinnen und Schüler von heute“ zunächst, da zwischen ihm und den Abiturient_innen zum Teil nur wenige Jahre Lebenserfahrung liegen. Wie im nächsten Ausschnitt deutlich wird, scheint Herr Dabert hier wiederum eine im Kollegium geteilte Einschätzung wiederzugeben: „[...] es gibt einige junge Kollegen, ich bin da gar nicht so ein Hardliner, ne? Obwohl ich vielleicht so wirke. Es gibt Einige, die sind äh noch weiter rechts außen als ich, die sagen: ‚Das Gymnasium muss wieder Eliteschule werden.‘ Ne? Und das ist/ ist es längst nicht mehr. Ich sehe das ein bisschen anders, obwohl ich äh doch auch so ein bisschen diesen Zeiten nachtrauere und dem etwas abgewinnen kann, dass es ähm (..) nein, nicht dass=nicht dass das Gymnasium eine Eliteschule wird in dem Sinne. Weil es/ das ist so negativ behaftet. Aber das man mal langsam aufhören sollte, das Niveau IMMER weiter runter zu schrauben. Ne? Und dann eben nur noch auf glanzvolle Abschlüsse zu gucken. Was sind das für Abschlüsse, ne? Die alle eine Eins vor dem Komma haben, aber wo kein Inhalt mehr ist.“ (Z. 681-689)

Auffällig ist, dass Herr Dabert sich im gesamten Interview immer wieder von einer zu starken Leistungsorientierung „in der heutigen Zeit“ (Z. 148) distanziert, Noten und die Beurteilung von Schüler_innen als „ein sehr LÄSTIGES Feld“ (Z. 511) bezeichnet, und seinen Schüler_innen erklärt, „die Noten sind ganz egal“ (Z. 476). Gleichzeitig beklagt er ein absinkendes Niveau des Gymnasiums, des Abiturs und auch der Qualität von Studienabschlüssen („Bachelor-Absolventen, (.) die zwar TOLLE Noten haben, die aber zu nichts zu gebrauchen sind“; Z. 508).204 Die ‚Verfallsse204

Er weist ebenfalls darauf hin, dass er sein eigenes Bachelorstudium in Regelzeit absolviert habe, obwohl dieses „VIEL zu vollgepackt“ gewesen sei und das Studium „NACH meinem Jahrgang im ersten Jahr um die HÄLFTE reduziert“ wurde (Z. 646-649).

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

391

mantik‘ vom absinkenden Niveau des Gymnasiums wird im obigen Auszug als kollektiv geteilte Einschätzung des Kollegiums gerahmt, verbunden mit einer sehr deutlichen Positionierung als konservativer, wenn auch nicht ganz so weit „rechts außen“205 stehender, Befürworter des „Gymnasium[s] als Eliteschule“ und seiner Kritik an einer (vermeintlichen) Noteninflation im Abitur. Er distanziert sich zwar vom Begriff der Elite, da dieser „so negativ behaftet“ sei, gleichzeitig stimmt er der dahinterliegenden Grundidee offenbar zu. Das von Herrn Dabert attestierte sinkende Niveau im Abitur drückt sich auch in dem ironisierenden Kommentar zu den „glanzvollen[n] Abschlüsse[n]“ der Schüler_innen aus, die zwar „alle eine Eins vor dem Komma haben, aber wo kein Inhalt mehr ist“. Als Beleg für diese These der ungerechtfertigt guten Abiturnoten führt Herr Dabert das Zentralabitur an, dessen Einführung einerseits eine gewisse „Unsicherheit“ (Z. 664) für Schüler_innen und Lehrkräfte gebracht habe, sich aber gleichzeitig zeige, „dass die Zentralabituraufgaben (.) in gewisser Weise relativ einfach sind für das gymnasiale Niveau“ (Z. 672). Er führt dazu weiter aus: „Also offensichtlich legen wir Lehrer (.) ähm ein höheres Niveau an (.) als es dann im Zentralabitur abgefragt wird. Weil wir das doch durch die Bank erleben, dass unsere Schüler im Zentralabitur durchschnittlich BESSER abschneiden als wir sie sonst erleben und sonst kennen, ne? Als sie sonst bei uns abschneiden. Anders natürlich an den Gesamtschulen. Ne? Da ist das Niveau ungefähr so, wenn ich da richtig informiert bin. Ich weiß es aber nicht. [...] Ja, was ja im Prinzip das Gymnasium an die Gesamtschule etwas vom Niveau angleicht. Ne?“ (Z. 674-681)

Das Abweichen der Noten in den standardisierten Tests nach oben wird von Herrn Dabert nicht als Kritik an seinen eigenen Beurteilungen wäh205

Die Selbstbezeichnung als „rechts außen“ positionierter Lehrer hat mich im Interview insofern überrascht, da diese Formulierung meist eher als Fremdbezeichnung und mit negativ-ablehnender Konnotation verwendet wird und gewöhnlich die Selbstbezeichnung „konservativ“ bevorzugt wird. Für Herrn Dabert scheint die Selbstpositionierung rechts außen jedoch positiv besetzt zu sein. Auch macht er aus seinen parteipolitischen Vorlieben kein Geheimnis und führt beispielsweise verschiedene CDU-Politiker_innen als Persönlichkeiten mit interessanten Lebensläufen bzw. Beispiele für erfolgreiche Menschen an.

392

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

rend der gymnasialen Oberstufe interpretiert, sondern vielmehr als Beleg dafür, dass das Anforderungsniveau des Zentralabiturs unterhalb dem der Lehrkräfte läge. Hier zeigt sich abermals sein großes Vertrauen in die eigene Beurteilungskompetenz auf der Basis seines professionellen Selbstbildes. Die externen Tests werden von Herrn Dabert nicht als sinnvolle Ergänzung seiner Beurteilungspraxis verstanden, sondern vielmehr als Bedrohung des besonderen gymnasialen Leistungsanspruchs. Die Sorge um den Statusverlust des Gymnasiums durch ein „Angleich[en]“ des Niveaus an die Gesamtschulen verdeutlicht noch einmal seine Befürwortung eines gegliederten Schulsystems, in dem das Gymnasium als ‚Schule der Besten‘ in der Hierarchie der Schulformen einen gesonderten Platz einnehmen sollte. Die Feststellung, dass die Ergebnisse der Gesamtschüler_innen „natürlich“ weniger abweichen würden, die Aufgaben also dem zugeschriebenen niedrigeren Leistungsniveau der Gesamtschüler_innen entsprächen, fußt dabei zwar nur auf Vermutungen („ich weiß es aber nicht“), bestätigt aber offenbar seine grundsätzlichen Annahmen über das schwächere Leistungsniveau der Gesamtschulen. In seiner Kritik des Zentralabiturs wird deutlich, dass die Bevorzugung möglichst detaillierter Leistungsbeurteilung mit Hilfe strenger Verfahrensregeln nicht unbedingt mit der Befürwortung externer Beurteilungsinstrumente einhergeht. Wie weiter oben ausgeführt, ergänzen sich für Herrn Dabert die Orientierung an Verfahrensweisen einerseits und die Anwendung professioneller Beurteilungsspielräume andererseits zu einer für ihn gerechten Leistungsbeurteilung. Da diese Spielräume im Rahmen externer Beurteilungsinstrumente stärker eingeschränkt sind, stoßen diese eher auf Ablehnung bei ihm.

Zusammenfassung: Herr Dabert Insbesondere der Fokus auf standardisierte Verfahrensweisen und die Einhaltung von Regeln im Zusammenhang mit der schulischen Leistungsbeurteilung prädestinieren Herrn Dabert als idealtypischen Vertre-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

393

ter einer prozedural-bürokratischen Gerechtigkeitsüberzeugung. Seine „enge Zusammenarbeit“ mit einem Pocketcomputer dient dabei der detaillierten Dokumentation jeder Teilleistung der Schüler_innen, die für ihn zu einer größeren ‚Objektivität‘ und damit Legitimität seiner Beurteilung beitragen soll. Gleichzeitig vermeidet das Beharren auf Verfahrensweisen aber auch „lästige Diskussionen“ mit Schüler_innen und deren Eltern, die als Infragestellung seiner Beurteilungskompetenz verstanden werden. Potentielle ‚Regelverstöße‘ legitimiert Herr Dabert über den Verweis auf seine pädagogische Freiheit und die professionellen Spielräume, die teilweise über kollektive Absprachen im Kollegium abgesteckt sind. Eine weiterführende Zusammenarbeit im Kollegium hinsichtlich der schulischen Leistungsbeurteilung findet jedoch nicht statt. Im Hinblick auf sein ideales Schüler_innenbild wird deutlich, dass Fleiß und Anstrengung zwar wichtige Aspekte der schulischen Leistung darstellen, ‚gute‘ Schüler_innen jedoch in Herrn Daberts Augen darüber hinaus eine gewisse „Pfiffigkeit“ auszeichne, die sinnbildlich für einen statischen Begabungsbegriff steht. Zusammen mit der Problematisierung des sozialen Hintergrunds einiger Schüler_innen als ‚atypisch‘ für das Gymnasium bildet dieses statische Begabungskonzept die erklärende Folie für Herrn Daberts Ablehnung gegenüber Maßnahmen individueller Förderung und den Fokus auf summative Leistungsbeurteilungen am Ende eines Lernprozesses. Leistungsbeurteilung dient für ihn vor allem der Feststellung eines „Leistungsstands“, den Schüler_innen erreichen, eine weiterführende Unterstützung des Lernprozesses der Schüler_innen liegt für Herrn Dabert aber nicht mehr in der Verantwortung der Lehrkraft. Insofern lässt sich auch das potentielle Scheitern von Schüler_innen am „gymnasialen Leistungsniveau“ individualisieren und als unabhängig von der Beurteilungspraxis der einzelnen Lehrkraft erklären.

394

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

6.3.2.3 Fallübergreifender Vergleich Im fallübergreifenden Vergleich der beiden dargestellten Referenzfälle Fredrik und Herr Dabert fielen einige Besonderheiten auf, die im Folgenden noch weiter aufgeschlüsselt werden sollen. Dazu werden belegartig weitere Auszüge aus Interviews mit anderen Lehrkräften herangezogen, die einzelnen Fälle jedoch nicht mehr so ausführlich dargestellt, wie bei Fredrik und Herrn Dabert. Der Fokus liegt vielmehr auf der Kontrastierung und Darstellung der rekonstruierten Varianzen innerhalb der kompensatorischen Gerechtigkeitsüberzeugung. Dabei wird zunächst auf Unterschiede und Gemeinsamkeiten innerhalb der schwedischen bzw. nordrhein-westfälischen Samplegruppe eingegangen, im Anschluss daran eine länderübergreifende Perspektive auf Gemeinsamkeiten und Unterschiede zwischen den beiden Samplegruppen eingenommen. Abschließend werden die aus dem Material rekonstruierten Bedingungen zusammenfassend dargestellt, die eher förderlich bzw. hemmend auf die prozedural-bürokratische Gerechtigkeitsüberzeugung der Lehrkräfte beider Länder einwirken. Der Fall Fredrik im Vergleich zu anderen schwedischen Lehrkräften Die starke Orientierung an den offiziellen Vorgaben der schulischen Leistungsbeurteilung sowie standardisierten Beurteilungsverfahren findet sich auch bei anderen Interviews im schwedischen Sample, allerdings sticht Fredriks Beschreibung eines scheinbar einfachen und beinahe widerspruchsfreien Verfahrens besonders hervor. Im Folgenden werden deshalb weitere Lehrkräfte kontrastierend dargestellt, die einerseits Fredriks Vorliebe für standardisierte Verfahren und Regeltreue teilen, andererseits aber auch Brüche und Schwierigkeiten in der Umsetzung damit thematisieren.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

395

Balanceakt zwischen objektiver Beurteilung und zwischenmenschlicher Beziehung Für die Lehrerin Eva, die die Fächer Schwedisch und Englisch an einer weiterführenden Schule (gymnasieskola) unterrichtet, stellt die Orientierung an den Beurteilungsvorgaben von Skolverket ebenfalls ein zentrales Element einer ‚gerechten‘ Leistungsbeurteilung dar. Sie beruft sich im Laufe des Interviews immer wieder auf die Publikationen und Beurteilungshilfen der Schulbehörde sowie die standardisierten Tests (nationella prov) als „Hilfe für die eigene Beurteilung“206 (Z. 152). Die Korrekturvorgaben in den Beurteilungsmaterialien für die nationella prov werden von ihr als „eindeutig“ und „wirklich konkret“ beschrieben, mit „massenhaft Beispielen“207, die bei der Beurteilung nicht nur der Tests, sondern auch der Einschätzung der Leistungen während des Schuljahres sehr hilfreich seien („en enorm hjälp“, Z. 172). Für Eva steht vor allem eine „objektive Beurteilung” im Mittelpunkt, die sie wie Fredrik auch als losgelöst von ‚subjektiven‘ Einflussfaktoren versteht. Das wichtigste Hilfsmittel für die Umsetzung einer solchen objektiven Beurteilung stellt die konsequente Orientierung an den Vorgaben dar: „Dagegen nehme ich keine Rücksicht auf (..) Schüler_innen also=ob ich die Schüler_innen kenne oder was ich über die Persönlichkeit weiß, wenn ich zum Beispiel die Tests [nationella prov] korrigiere, das kann ich nicht machen. Sondern das ist so, die Beziehung gibt es eigentlich nur während der Lernphase. Bei der Beurteilung muss nun mal/ Man muss danach streben und so objektiv wie möglich sein. (..) Ähm (..) und seine Wahl und seinen Beschluss in (.) in=äh (.) den Wissensanforderungen ver-

206

Original: „då har man det eh andra konkreta eh (.) bedömnings=eh=underlaget och (...) en stödja för ens egen bedömning på. Så för mig är det en jättebra hjälp.” (Z. 151152) 207 Original: „Om jag får backa tillbaka då, det som jag sa att jag gillar med nationella prov och att man får så TYDLIGA bedömningsanvisningar/ [blättert in Unterlagen] Engelska 5, delprov C, Engelska 5, delprov 1 (.), B1 och B2/ Väldigt konkret. Svenska 3/ Hur skriver man/ Och den här är ju tjock. Det är ett prov och det är liksom (.) åttiofe/ nästan åttiofem sidor text (.) som hjälper att=en att bedöma. Och massa exempel.” (Z. 254-258)

396

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

ankern. Das ist das, wovon wir ausgehen müssen. Wir MÜSSEN damit arbeiten. Wir können nicht einfach/ Da gibt es kein (.) äh ne:ett sein oder toll oder (.) äh ein Auge zudrücken oder so, sondern das ist das, was gilt. Und ICH sehe das so, dass man niemandem hilft, wenn man (.) extra nett ist.“208 (Z. 197-204)

Für Eva ist es wichtig zwischen einer guten zwischenmenschlichen Beziehung zu den Schüler_innen während der Lernphasen im Unterricht und der personenunabhängigen Beurteilung ihrer Leistungen zu unterscheiden. Das wichtigste Instrument zur Herstellung einer solchen „objektiven Beurteilung“ stellt für Eva die kriteriale Bezugsnorm, also die Orientierung an den Lernzielen des Lehrplans, dar, aber auch anonymisierte Tests wären in ihren Augen eine gute Möglichkeit, persönliche Eindrücke und Einschätzungen der Schüler_innen aus dem Beurteilungsprozess auszuklammern und sich nur auf die gezeigte Leistung zu konzentrieren (vgl. Z. 165-173). Eva bezeichnet es aber auch als „verzwickten Balanceakt“ („kluriga balansgången“; Z. 207-208) einerseits eine gute Beziehung zu den Schüler_innen aufrechterhalten zu wollen, andererseits ihre daraus gewonnenen Eindrücke nicht in die Beurteilung einfließen zu lassen. Als Lösung für diesen Balanceakt stellt Eva die detaillierte Dokumentation der Leistungsbeurteilungen mithilfe von Beurteilungsrastern dar, die sie über das Schuljahr anwendet, um die Schüler_innen einzuschätzen. Ähnlich wie der Mathematiklehrer Fredrik nutzt sie hierfür Beurteilungsraster, dies ich am Lehrplan orientieren, allerdings verwendet sie gedruckte Papierversionen. Darin markiert sie, wenn einzelne Wissensanforderungen von den Schüler_innen erreicht wurden und schraffiert das entsprechende Notenniveau gelb aus. An 208

Original: „Däremot tar jag ju inte hänsyn till (..) elevens alltså=att om jag känner eleven eller om jag vet elevens personlighet när jag rättar till exempel nationella prov, det kan jag ju inte göra. Utan det är ju den här eh relationen är ju bara vid inlärnings=eh=situationer egentligen. Bedömning måste ju/ Måste man ju sträva efter och vara så objektiv som möjligt. (..) Ehm (..) och kunna förankra sina val och sina beslut i (.) i=eh (..) i=i (.) kunskapskrav. Det är ju det som vi har att utgå ifrån. Vi MÅSTE ju arbeta mot det. Vi kan ju inte liksom/ Det finns ju ingenting att vara (.) eh snä:äll eller schyss:st eller (.) eh se mellan fingrarna eller så, utan det är ju det som gäller. Och JAG anser ju inte att man hjälper någon genom att vara (.) extra snäll.”(Z. 197-204)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

397

anderer Stelle spricht sie auch von Listen, auf denen sie die Lernziele „abhaken kann“ („så att man kan bocka av“, Z. 798), was an Fredriks Formulierung des „anklicken, einfärben, fertig“ und ein eher mechanisches Einsortieren bzw. Abhaken erreichter Lernziele erinnert. Die farbig markierten Bögen nutzt sie dann auch in Feedbackgesprächen mit ihren Schüler_innen zur Leistungsrückmeldung: „Äh und das macht es schon deutlich und klar. Und DA ist das schon eine Hilfe diese Papiere zu haben. Es sind sehr wenige Schüler_innen, die Einwände erheben. [...] Wenn man das schwarz auf weiß hat und mit den Schüler_innen sitzt und seine Entscheidung begründen kann (.) sind es wirklich wenige, die sich beschweren.“209 (Z. 667-671)

Hier findet sich auch die Idee des Ausbleibens von Widersprüchen durch die Schüler_innen als Beweis für eine von allen Beteiligten akzeptierte – und damit ‚gerechte‘ – Leistungsbeurteilung wieder. Auch der Aspekt der Belegbarkeit einer Note taucht erneut auf, wenn sie davon spricht, dass ihre Beurteilungen „schwarz auf weiß“ stünden. Damit suggeriert sie eine gewisse Verlässlichkeit, so als stünden ihre Beurteilungen durch die Raster auf einer dauerhaft festgehaltenen und nicht revidierbare Grundlage. Später im Interview findet sich auch eine gewisse Erleichterung über diese Art der Belegbarkeit durch die Raster, wenn sie sagt: „Also bei den Beurteilungen, da darf man sagen, Gott sei Dank, wenn man irgendwas konkretes hat, nach dem man gehen kann.“210 Die Herausforderung für Eva stellt die Transformation des im Unterricht Gesehenen in „irgendwas konkretes“ dar. Durch die Rückbindung der Beurteilungen auf den Lehrplan über die detaillierten Beurteilungsraster bietet sich Eva eine wichtige Absicherung ihrer Beurteilungspraxis gegenüber Dritten – aber auch für sich selbst. Gleichzeitig wird immer wieder deut209

Original: „Eh, och då blir det ju tydligt och klart. Och DÅ är det ju ett stöd att ha dom här papperen. Det är väldigt få elever som opponerar sig. [...] När man har det svart på vitt s=och sitter med eleverna och eh kan motivera (.) sina beslut då är det väldigt få som (.) opponerar sig.” (Z. 667-671) 210 Original: „Alltså, i bedömningar, då får man väl ändå säga tack och lov när man har nånting konkret att gå efter.”(Z. 661-662)

398

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

lich, dass die teilweise unterschiedliche Auslegung der Beurteilungsvorgaben durch verschiedene Lehrkräfte einer Schule von Eva als potentielle Bedrohung einer gerechten Beurteilung verstanden wird: „Also, das ist sehr gefährlich, wenn sich bei einem System zeigt (.) dass man unterschiedliche Beurteilungen in der gleichen Schule hat. [...] Dann ist das nicht gerecht. Deshalb muss man die ganze Zeit danach streben auf die gleiche Weise zu denken, zu deuten, zu beurteilen. Wir streben ohnehin nach Gleichwertigkeit und=und=und Gerechtigkeit.“211 (Z. 885-889)

Die Schaffung eines gemeinsamen Verständnisses („samsyn“) der Beurteilungsvorgaben ist für Eva daher unerlässlich für die Herstellung einer gerechten Beurteilung, weshalb sie sich dafür auch im Kollegium sehr stark macht und den Austausch über die Beurteilungsgrundlagen sucht. 212 In diesem Punkt unterscheidet sich die berichtete kollektive Beurteilungspraxis von Eva und Fredrik deutlich, dem die Schaffung eines geteilten Verständnisses weniger wichtig ist. Allerdings macht auch Eva deutlich, dass es letztlich immer die einzelne Lehrkraft sei, deren Aufgabe es sei, die von den Schüler_innen gezeigten Leistungen mit den im Lehrplan formulierten Wissensanforderungen abzugleichen und zu entscheiden, wann bspw. etwas der Note E oder C entspräche. Insgesamt lobt Eva die neue fünfstufige Notenskala als „nuancierter“ (Z. 353) und dadurch gerechter als die vorhergehende dreistufige Skala. Sie berichtet beispielsweise davon, dass das alte Benotungssystem nur eine sehr grobe Einteilung der Leistungsniveaus von Schüler_innen zuließ und dieses häufig zu Frustrationen bei den Schüler_innen geführt habe (vgl. Z. 331-338), insbesondere bei denjenigen, die sich trotz großer Anstrengungen mit der gleichen Note zufriedengeben mussten, wie ihre Klassenkamerad_innen, 211

Original: „Alltså (.), det är ju väldigt sårbart om ett system visar sig (.) ha olika (.) bedömningar på samma skola. Elever är kompisar, i det programmet är dom kompisar med det programmet och så har läraren uppfattat saker och ting helt olika. Då är det ju inte rättvist. Så man får ju hela tiden sträva efter att tänka, tolka, bedöma, på likvärdigt sätt. Vi strävar ju ändå mot likvärdighet och=och=och rättvisa.” (Z. 885-889) 212 Auf den Aspekt eines geteilten Beurteilungsverständnisses im Kollegium als Grundlage gerechter Leistungsbeurteilung gehe ich ausführlicher in Kap. 6.3.3 ein.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

399

die eventuell weniger hart für die gleiche Note gearbeitet hatten. Im Hinblick auf Evas Beurteilungsverständnis wird hier zweierlei deutlich: einerseits erhofft sich die Lehrerin ein genaueres Abbilden der Leistungsniveaus von Schüler_innen durch die differenziertere Notenskala. Ein Sortieren und Unterscheiden, die Darstellung von Unterschieden zwischen Schüler_innen durch die Benotungen am Ende des Schuljahres werden hier als zentrale Funktion von Zensuren deutlich. Zweitens, wird der starke Zusammenhang von Anstrengung und Belohnung – in der Form von besseren Zensuren – herausgestellt. Dies zeigt sich auch bei Evas Ausführungen zu besonderen Hilfen für Schüler_innen mit Schwierigkeiten, wenn sie betont, dass diese sich wirklich anstrengen müssten und die Schulleitung „wirklich einen Beleg haben will, oder Beweis, dass die Schüler_innen wirklich WOLLEN“213 (Z. 772). Eva führt weiterhin aus: „Man kann nicht nur rumquatschen und schwänzen und auf alles pfeifen, und dann erwarten, dass man (.) mehr Zeit und Hilfe und so bekommt. Sondern da soll man/ Da sollte es etwas, eine spezielle Ursache haben, die macht, dass man eine Verlängerung bekommt. Denn die Schule will am liebsten keine Schüler_innen (.) entlassen, die (.) äh (.) nicht bestanden haben. Es ist klar, dass die Schule danach strebt, äh (.) bestandene Schüler_innen zu entlassen.“214 (Z. 772-776)

Die Gewährung besonderer Hilfen ist für Eva ganz klar an die Anstrengungsbereitschaft der Schüler_innen gekoppelt, diese sollen „Verantwortung“ („ansvar“; Z. 785) für ihr Lernen übernehmen und der Schule beweisen, dass sie die besonderen Unterstützungsleistungen in gewissem Sinne ‚verdienen‘. Dies steht im deutlichen Kontrast zu dem fast bedingungslosen Anbieten zusätzlicher Hilfen, wie es bei anderen Lehrkräften im Kapitel zur kompensatorischen Gerechtigkeitsüberzeugung 213

Original: „att rektorn verkligen vill ha prov på att, eller bevis på att eh eleven verkligen VILL.” (Z. 772) 214 Original: „Man kan ju inte bara flumma runt här och skolka och strunta i saker och ting, och sen förvänta sig att få (.) extra tid och hjälp och=och så. Utan då ska man/ Då ska det vara nån, liksom, (.) nån speciell orsak som gör att man får förlängt. För skolan vill ju helst inte släppa ut (.) elever som inte (.) eh (.) är godkända. Det är klart att skolan strävar ju efter att eh (.) släppa ut godkända elever.” (Z. 772-776)

400

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

deutlich wird. Dass Eva an dieser Stelle nicht nur für sich selbst spricht, sondern im Namen „des Schulleiters" und „der Schule“, verdeutlicht ihre starke Identifikation mit dieser und den dort vorherrschenden Normen und Erwartungen. Das von ihr angesprochene Interesse „der Schule“ an einer möglichst geringen Quote von Schüler_innen mit der Note F („nicht bestanden“) auf dem Zeugnis weist einerseits auf die kollektiv geteilte Orientierung an einem für alle Schüler_innen zu erreichenden Mindeststandard hin. Eva spricht auch an anderen Stellen davon, dass es ihre Aufgabe als Lehrerin sei, die Schüler_innen mindestens auf die Note E zu bringen (vgl. Z. 254-257), was als Befürwortung der Idee von Schwellengerechtigkeit, wie in Kapitel 2.3.1 dargelegt, gelesen werden kann. Gleichzeitig muss diese Formulierung auch vor dem Hintergrund der Marktförmigkeit insbesondere des schwedischen Sekundarschulwesens betrachtet werden, dessen Pro-Kopf-Finanzierung unter anderem auch zu einer Konkurrenz zwischen Einzelschulen um potentielle Schüler_innen führt – und niedrige Durchfallquoten dabei als Wettbewerbsvorteil gelten können.215 Inwieweit solche Überlegungen in Evas Beurteilungspraxis einfließen, kann allerdings anhand des vorliegenden Materials nicht beantwortet werden.216 Trotz der klaren Vorteile, die eine Beurteilung mithilfe der Beurteilungsraster für Eva hat, räumt sie ein, dass diese auch dazu geführt hätten, dass die Beurteilung „noch komplizierter“ („ännu mer komplicerad“, Z. 375) geworden sei. Schuld daran seien eben jene detaillierten Beurteilungsraster und die Formulierungen der Beurteilungsvorgaben, insbesondere der Bewertungsbegriffe (värdeord): „Man sitzt da und überlegt (..) hin und her, ‚variiert und teilweise gut formuliert‘ [Zensur C], (.) ‚variiert und enthält gute Formulierungen‘ [Zensur A]. Wo ist der Unter215

Zur Funktionslogik des schwedischen Bildungsmarkts und einigen Konsequenzen vgl. Kapitel 5.1.1 sowie ausführlich bei Vogt et al. (2018). 216 Eva war allerdings die einzige Lehrerin im Sample, die zum Interview mit einer Werbebroschüre sowie einem Block und Stift mit dem Logo der Schule erschien und mir diese sichtlich stolz überreichte. Auch aus dieser Geste kann auf eine hohe Identifikation mit der Schule und Evas Verständnis als Repräsentantin der Schule abgeleitet werden.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

401

schied? Und dann sitzt man da und überlegt, hin und her, hin und her. Und manchmal denkt man: ‚Ja:a (.), nein, vielleicht bekomme ich das mit dieser Aufgabe gar nicht heraus. Was habe ich noch, das ich beurteilen kann, welchen anderen Text, welche andere Aufgabe?‘ Äh, also man (.)/ Also, auf gewisse Weise ist es jetzt (...) Schwerstarbeit. Aber, trotzdem vielleicht besser für die Schüler_innen, denn jetzt ist es nuancierter.“217 (Z. 379-384)

Der Ausschnitt zeigt, wie komplex die Beurteilungspraxis durch die erhöhte Detailliertheit der Vorgaben und Beurteilungshilfen geworden ist. Zunächst gilt es, die abstrakten Formulierungen in den Lehrplänen in eigene Begriffe zu übersetzen und für sich selbst verständlich zu machen („Wo ist der Unterschied?“), um damit die im Unterricht gezeigten Schüler_innenleistungen abgleichen zu können. Dann muss die gewählte Prüfungsform validiert („vielleicht bekomme ich das mit dieser Aufgabe gar nicht heraus“) und gegebenenfalls eine andere Beurteilungssituation in die Gesamtbeurteilung einbezogen werden („was habe ich noch“). Indem Eva nun die gewünschte Teilkompetenz an anderer Stelle sucht („andere[r] Text“, „andere Aufgabe“), erweitert sie die einbezogene Datengrundlage für ihre Entscheidungsfindung, weicht aber nicht grundsätzlich von den Beurteilungsvorgaben ab und kann weiterhin kriteriengeleitet beurteilen. Die kurzzeitig als nicht passend markierte Prüfungsform kann anschließend auf die gleiche Weise an anderer Stelle in das Beurteilungsraster einfließen und bewahrt Eva vor der Delegitimierung ihrer eigenen Praxis. Die detaillierten Beurteilungsraster dienen ihr also einerseits als Schablone, die über die verschiedenen gezeigten Leistungen gelegt wird, um am Ende eine Zuordnung zu Beurteilungskriterien vornehmen zu können. Diese Schablone kann aber andererseits auch mit Hilfe des Prinzips der umfassenden Beurteilung (allsidig bedömning) 217

Original: „Man sitter och väger (..) fram och tillbaka, "varierat och delvis välformulerat", (.) "varierat och innehåller goda formuleringar". Vad är skillnaden? Och så sitter man där och väger, fram och tillbaka, fram och tillbaka. Så ibland tänker man: "Ja:a (.), nej, jag kanske inte få fram det ur den här uppgiften. Vad har jag annat jag kan bedöma, nån annan text, nån annan uppgift?" Eh, så man (...)/ Så, på vissa sätt har det ju blivit (...) mer svårarbetat Men, kanske bättre för eleverna ändå, för att det är mer nyanserat.” (Z. 379-384)

402

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

flexibel an die vorgefundenen Leistungen und Beurteilungssituationen angepasst werden. Das, was von Eva im Beispiel als „Schwerstarbeit“ bezeichnet wird, bezieht sich damit auf die Umsetzung der zwar detaillierten, gleichzeitig aber abstrakten Vorgaben in der Beurteilungspraxis.

Die „richtigen Sachen“ beurteilen Wie oben dargestellt, dient die Beurteilungssoftware „Planering & Bedömning“ für den Mathematiklehrer Fredrik auch als Form der Selbstkontrolle seines Unterrichts- und Beurteilungshandelns: indem er die vorgegebenen Unterrichtsthemen und Wissensanforderungen im Beurteilungsprogramm systematisch mit seinen Schüler_innen ‚abarbeitet‘, stellt er sicher die „richtigen Sachen“ („rätt saker“) im Unterricht zu bearbeiten und zu beurteilen. Die Schwedischlehrerin Alva betont ebenfalls, wie wichtig es für eine gerechte Leistungsbeurteilung sei, diese entlang der im Lehrplan vorgegebenen Beurteilungskriterien vorzunehmen, um „die richtigen Sachen“ (bedömer rätt saker) zu beurteilen. Eine gerechte Beurteilung orientiert sich ihr zu folge ausschließlich an diesen Beurteilungskriterien und schließt damit eine Beeinflussung durch Persönlichkeitsmerkmale oder Verhaltensweisen der Schüler_innen aus: „Ja also, eine gerechte Beurteilung ist ja, dass ich die RICHTIGEN SACHEN BEURTEILE. Ich soll nicht beurteilen, ob jemand nett ist oder nicht. Oder fleißig oder nicht“218 (Z. 532-533). Im Unterschied zu Fredrik und Eva spricht Alva allerdings an anderer Stelle ihr Bedauern dafür aus, dass sie den „Fleiß“ und die „Anstrengung“ ihrer Schüler_innen nicht beurteilen dürfe: „In Schweden gibt es, also das ist nichts, was ich mit reinnehmen kann, leider. Ich sehe da, ich wünschte es gäbe eine Note, wie (..) für

218

Original: „Ja men, alltså en rättvis bedömning det är ju att jag BEDÖMER RÄTT SAKER Jag ska inte bedöma om någon är snäll eller inte. Eller flitig eller inte.” (Z. 532-533)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

403

Fleiß und (.) äh Anstrengung. Aber das haben wir nicht“219 (Z. 229-230). Während sie sich also einerseits für eine rein an Leistungen orientierte Beurteilung ausspricht, räumt Alva andererseits ein, dass auch die Beurteilung des Bemühens der Schüler_innen Teil der „richtigen Sachen“ und damit legitim sein könnte. Letztendlich gelte aber das, was im Lehrplan stehe und nichts weiter. Dass die Vorgaben der schwedischen Lehrpläne allerdings nicht immer eindeutig für die Lehrkräfte sind und die strenge Befolgung der Vorgaben teilweise zu Beurteilungen führen würden, die als ungerecht empfunden werden, zeigt sich im Interview mit der Schwedischlehrerin Malin, die hier als Kontrastfall zu Fredrik und Eva eingeführt werden soll: „Skolverket sagt ja, um ein=ein C zu bekommen, müssen die (.) Kompetenzen zum überwiegenden Teil auf Niveau Drei liegen. Man kann EINE Kompetenz bei E haben. Aber er hatte eigentlich keine (.) Kompetenz so richtig auf C verstanden. Die lagen nur BEINAHE auf C, und er lag eigentlich BEINAHE bei C mit ALLEN Kompetenzen. (..) Und da ist das dann/ Da bleibt er eigentlich auf E, wenn man es genau nimmt. (.) Aber ich fühl/ Das fühlt sich nicht gerecht an, weil er hat/ Er hat so gute Kenntnisse und gute Kompetenzen in allem, dass es sich nicht gerecht anfühlte ihn auf ein E runterzuziehen (.) so geradewegs. […] Aber das, äh/ ICH denke, dass es sich gerechter anfühlte, ich persönlich fand: ‚Jetzt ist es gerecht‘. Aber ich glaube nicht, dass/ Wenn Skolv=Skolverket reingegangen wäre und sich das angesehen hätte, hätten sie das nicht für richtig befunden. (.) Das glaube ich nicht. Aber ICH war sehr zufrieden (.) hinterher. Äh, weil wenn ich ihn mir ansehe, seine Noten und die Noten seiner Klassenkameraden, dann fühlt sich das richtig an. So dass äh ICH (.)/ Ich=ich fühlte mich wohl. [lacht] Ja. (.) So. Mhm. […] Das war eigentlich nicht regelkonform.“ 220 (Z. 327341, 904)221

219

Original: „I Sverige så har vi ju, så är det ju inget jag kan väga in det tyvärr. Jag ser då, jag önskar det fanns ett betyg som (.) för flit och (.) eh hårt arbete. Men vi har inte det.“ (Z. 229-230) 220 Original: „Nämen eh Skolverket säger ju att, ska man få ett=ett C, då ska ju (.) övervägande förmågor ligga på nivå tre. Man kan ha EN förmåga på E. Men han hade ju egentligen inte riktigt fått upp (.) någon förmåga helt och hållet på C. Det låg ju precis bara NÄSTAN uppe vid C, och han låg NÄSTAN uppe vid C på ALLA förmågorna. (..) Och då är det ju/ Då är han ju faktiskt kvar här egentligen då på E, om man ska hårdra det. (.) Men jag kä/ Det känns inte rättvist, för han har/ han har så goda kunskaper och goda

404

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Das Beispiel illustriert den Konflikt zwischen zwei unterschiedlichen Erwartungen, die sich aus den Regularien zur schulischen Leistungsbeurteilung ergeben. Auf der einen Seite sollen die Leistungen aller Schüler_innen anhand der in den Lehrplänen aufgeführten Wissensanforderungen (kunskapskrav) für jede Notenstufe kriterienorientiert und in gleichwertiger Weise (likvärdig) beurteilt werden. Auf der anderen Seite sollen der Unterricht und auch die Beurteilung an die individuellen Lernvoraussetzungen der Kinder angepasst werden, wodurch sehr verschiedene Beurteilungssituationen entstehen können. Bei der abschließenden Benotung auf dem Zeugnis wiederum sollen die Lehrkräfte alle verfügbaren Informationen über den Lernprozess und Leistungsstand der Schüler_innen berücksichtigen, um zu einer holistischen Gesamtbeurteilung zu gelangen (allsidig bedömning). Aus dieser regulativen Rahmung entsteht die widersprüchliche Anforderung an die Lehrkräfte alle Schüler_innen gleich anhand des vorgegebenen Kriterienkatalogs zu beurteilen und dabei trotzdem jedes Kind in seiner individuellen Lernsituation zu begleiten. Malin, die Schwedischlehrerin im obigen Beispiel, berichtet nun von einer Situation, in der sie das Gefühl hatte, dass eine strikt an den Beurteilungskriterien orientierte Beurteilung dem Schüler nicht gerecht werden würde. Sie entscheidet sich daher, den Lernprozess des Schülers stärker zu gewichten und seine Anstrengungen mit der besseren Note zu belohnen – die sie ihm „wenn man das genau nimmt“ jedoch nicht geben dürfte. Sie begründet die Entscheidung für die bessere Note einerseits mit einem pädagogischen Motiv, denn in ihren Augen förmågar i allt, så att det kändes ändå inte rättvist att dra ner honom till ett E (.) rakt över. [...] Fast det, eh/ JAG tycker att det kändes mer rättvist, jag personligen kände att: ,Nu blir det rättvist’, så. Men jag tror inte att/ Hade Skolv=Skolverket gått in och tittat så hade dom nog inte tyckt att det var rätt. (.) Det tror jag inte. Fast JAG kände mig väldigt nöjd (.) efteråt. Eh för tittar jag på honom, hans betyg och ha=hans klasskompisars betyg, då känns det rätt. Så att eh JAG (.)/ Ja=jag mådde bra. [skratt] Ja. (.) Så. Mhm. [...] Det var ju inte enligt regelboken.” (Z. 327-341, 904) 221 Malin berichtet in der Mitte und am Ende des Interviews ausführlich über den gleichen Schüler und ihren Umgang mit dem ‚Regelverstoß‘. Für die platzsparende Darstellung habe ich die Auszüge hier gekürzt zusammengenommen.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

405

hätte ihn die schwächere Note „runtergezogen“ (dra ner) und demotiviert. Auf der anderen Seite betont sie ihre eigene Unzufriedenheit mit der formal richtigen Beurteilung unter Verweis auf ihr persönliches Gerechtigkeitsempfinden („dass es sich nicht gerecht anfühlte“, „ich persönlich fand“) und verdeutlicht damit noch einmal den Charakter der schulischen Leistungsbeurteilung als individuelle Praxis. In letzter Konsequenz muss sie als Lehrerin mit der Entscheidung leben, die vergebene Note rechtfertigen und erklären können. Malin kommt am Ende des Interviews wieder auf diese Episode zurück und schließt sie mit dem Hinweis darauf, dass ihre Entscheidung für die bessere Note „nicht regelkonform“ (inte enligt regelboken) war und rahmt sie damit als besondere Ausnahmesituation. Die Markierung als Regelverletzung bestätigt die stark normierende Kraft der Regularien auf das alltägliche Unterrichtshandeln und steht gleichzeitig für den flexiblen Umgang mit diesen Vorgaben durch die Lehrkräfte. Die Lehrerin Malin entscheidet sich letztlich dazu ihren pädagogischen Überzeugungen zu folgen, um trotz der als widersprüchlich erlebten Erwartungen handlungsfähig zu bleiben. Als zusätzliche Legitimationsquelle für ihre Entscheidung verweist sie anschließend auch noch auf die Noten der anderen Schüler_innen der Lerngruppe (soziale Bezugsnorm) und betont, dass sich die bessere Note auch im Vergleich zu diesen „richtig anfühlt“ (det känns rätt). Eine weitere Schwierigkeit für die schwedischen Lehrkräfte stellt die Beurteilung mündlicher Leistungen dar. Für die Schwedischlehrerin Alva dient daher das zeitnahe Festhalten ihrer Eindrücke während oder nach einer Unterrichtseinheit zur Absicherung ihrer Beurteilungen. Das Mittel ihrer Wahl sind dafür vorab vorbereitete Beurteilungsraster zum Ankreuzen, die ihre Aufmerksamkeit lenken: „Das kann sein, wenn man etwas Mündliches beurteilen soll, denn das ist ja nur in dem Moment. Das ist auch schwierig. Für gewöhnlich bereitet man da irgendeine Matrix vor, so dass ich dann ankreuzen kann. Denn, sich hinzusetzen und einen Fließtext zu schreiben dauert viel zu lang. Wir dürfen unsere Schüler_innen nicht beliebig aufnehmen. [...] Und so versuche ich immer, das was ich schaffe in der Stunde zu dokumentieren und dann so schnell wie möglich danach, so dass da (..) nichts in Verges-

406

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

senheit gerät. [...] Dass ich was habe, das meiste habe ich noch da und kann drauf zu222 rückblicken.“

Hier findet sich ebenfalls das Bedürfnis des möglichst zeitnahen Dokumentierens, insbesondere der mündlichen Leistungen im Unterricht, die als besonders flüchtig bezeichnet werden. Alva nutzt dafür ebenfalls vorbereitete Beurteilungsraster zum Ankreuzen und führt weiter aus, dass die Alternativen entweder einen längeren Fließtext zu den einzelnen Schüler_innen zu verfassen oder aber die Wortmeldungen mithilfe von Video- und/oder Audiotechnik aufzuzeichnen, seien. Ersteres verwirft sie aufgrund des höheren Arbeitsaufwands („dauert viel zu lang“), die Aufzeichnung scheint von der Schulleitung untersagt worden zu sein bzw. nur für besondere Anlässe möglich, nicht aber für die alltägliche Dokumentation der Leistungen. Das Aufzeichnen von Unterrichtsgesprächen, Gruppenarbeiten u.ä. wurde allerdings auch von anderen schwedischen Lehrkräften als mögliche Dokumentationsform für mündliche Leistungen berichtet223, für gewöhnlich findet dies aber nur im Rahmen der mündlichen Testteile der nationella prov statt. In allen Fällen wird jedoch auf die Flüchtigkeit mündlicher Leistungen im Unterricht hingewiesen („das ist ja nur in dem Moment“), die nur partiell von den Lehrkräften erfasst werden könnten. Mit dem Aufzeichnen der Unterrichtsgespräche werde ein Festhalten dieser flüchtigen Eindrücke möglich. Das anschließende, teilweise mehrmalige Anhören der Aufzeichnungen 222

Original: „Det kan ju vara om man ska bedöma något muntligt för det är ju i stunden. Det är också svårt. För man brukar ju alltid försöker att förbereda någon matris så att jag kan kryssa i. För att sitta och skriva löpande text tar alldeles för lång tid. Vi får inte spela in våra elever hur som helst. Och så försöker jag alltid dokumentera det jag hinner under tiden och sen så snabbt efter som möjligt så att det (..) inte blir bortglömd. [...] Att jag har ju, det mesta har jag ju kvar och kan titta tillbaka på.” (Z. 218-226) 223 Im Rahmen des Probeinterviews berichtet beispielsweise ein Englischlehrer davon, dass er für die Beurteilung mündlicher Leistungen die Schüler_innen in Gruppen eingeteilt in verschiedene Räume schicke, in denen sie Aufgaben bearbeiten und ihre Gespräche dabei mit dem Laptop aufzeichnen sollten. Später nutzte er diese Aufzeichnungen für die Beurteilung der mündlichen Fähigkeiten der Schüler_innen. Auch Jenny, Mathematiklehrerin an einer weiterführenden Schule, berichtet von dieser Praxis.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

407

durch die Lehrkraft helfe damit die Beurteilung der mündlichen Leistungen ‚objektiver‘ und damit ‚gerechter‘ zu machen. In der Formulierung „dass da (..) nichts in Vergessenheit gerät“ drückt sich auch Alvas Bemühen um eine möglichst vielseitige, d.h. aus vielen Eindrücken zusammengesetzte Beurteilung (allsidig bedömning) aus. Gleichzeitig trägt die detaillierte Dokumentation in Alvas Augen zur Objektivierung der abschließenden Notenfindung am Ende des Schuljahres bei, denn „die Zensur ist nicht mehr so willkürlich. Ich glaube, das war früher mehr so nach Gefühl“224 (Z. 523-524).

„Gerecht und gleichwertig hängen zusammen“ Auch das Moment der Gleichwertigkeit von Beurteilungen (likvärdig bedömning) stellt für Alva ein zentrales Moment gerechter Leistungsbeurteilung dar, in ihren Augen hängen gerechte und gleichwertige Beurteilungen eng zusammen („Rättvist och likvärdig hänger ju ihop, väldigt mycket.“ Z. 541). Für Alva sollte es keine Rolle spielen, von welcher Lehrkraft jemand unterrichtet und beurteilt wurde, am Ende sollten immer die gleichen Ergebnisse (hier also Noten) entstanden sein. Diese Haltung kann als verbindendes Element für den Modus der prozeduralbürokratische Gerechtigkeitsüberzeugung in verschiedenen Interviews – sowohl mit schwedischen als auch deutschen Lehrkräften – rekonstruiert werden. Auffällig im fallübergreifenden Vergleich ist die Haltung zur eigenen Rolle als Lehrkraft, die weniger an der persönlichen Beziehung zu den Schüler_innen oder der Verantwortungsübernahme für die Kompensation der individuellen Besonderheiten und Schwierigkeiten der Schüler_innen orientiert ist. Die prozedural-bürokratische Überzeugung betont vielmehr die Expertise der Lehrer_innen als unabhängige Beurteiler_innen, deren Aufgabe eine möglichst objektive, für alle Schüler_innen gleichermaßen gültige und dadurch unbestechliche Beurtei224

Original: „betygen är inte lika godtyckliga längre. Jag tror att det var lite mer så på känsla, förr.” (Z. 523-524)

408

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

lung ist. Sie verstehen sich dabei selbst keineswegs als lediglich mechanisch Ausführende, als sprichwörtlich verlängerter Arm der Schulgesetzgebung. Vielmehr betonen sie die Schwierigkeit der richtigen Auslegung der Vorgaben und Regularien, deren Einhaltung für sie höchste Priorität besitzt. „Die richtigen Sachen“ zu beurteilen, bedeutet für Alva aber eben auch, dass es keine Rolle spielen sollte, welche Lehrkraft letzten Endes die Schüler_innen beurteilt. Wenn alle Lehrer_innen sich gleichermaßen an die Vorgaben halten, so Alvas Überzeugung, kann eine solche personenunabhängige Beurteilung möglich sein: „Gerecht und gleichwertig hängen zusammen, sehr stark. Also das ist klar, dass ich will, dass soll keine Bedeutung haben welche Lehrkraft man gehabt habt. [...] wenn jemand anderes meine Schüler_innen benotet, dann sollte das gleich aussehen. Das ist klar, dass ich danach strebe (6). Also das muss das Ziel sein, denke ich.” 225 (Z. 541544)

Wie bereits bei Fredrik und Eva ausgeführt, versteht auch Alva eine möglichst ‚objektive‘, d.h. personenunabhängige Beurteilung als Voraussetzung für eine gerechte Leistungsbeurteilung. In der vergleichsweise langen Pause am Ende des Auszugs und der Formulierung als „Ziel“ nach dem sie „strebe“ deutet sich allerdings auch ein nachdenkliches Hinterfragen der von Alva angestrebten Vergleichbarkeit der Beurteilungen verschiedener Lehrkräfte an. Die standardisierten Tests (nationella prov) sollen ihrem Anspruch nach eben diese Gleichwertigkeit (likvärdighet) der Beurteilungen sicherstellen und werden von den Lehrkräften der prozedural-bürokratischen Gerechtigkeitsüberzeugung auch in diesem Sinne bewertet. Gunilla, eine Mathematiklehrerin und Kollegin von Fredrik, betont beispielsweise, dass an ihrer Schule die Korrektur der nationella prov nicht von jeder Lehrkraft einzeln für die eigene Lerngruppe vorgenommen würde, son225

Original: „Rättvist och likvärdig hänger ju ihop, väldigt mycket. Så det är klart att jag vill ju att det ska spela, kvittar vilka lärare man har haft. Jag vill ju att det ska, att jag ska sätta betyg (.) om någon annan ska sätta betyg på mina elever så skulle det se likadant ut. Det är klart, att jag vill eftersträva det (6). Så det måste ju vara målet, tycker jag. Men det var en svår fråga.” (Z. 541-544)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

409

dern immer aufgabenweise von verschiedenen Mathematik- und Naturwissenschaftslehrkräften durchgeführt werde, wodurch die Korrektur in ihren Augen eine „tatsächlich objektive Beurteilung“ („faktisk objektiv bedömning“, Z. 70-71) sei. Auch Alva betont, dass sie nicht die Tests ihrer eigenen Schüler_innen korrigieren wolle (Z. 336-340), sondern nur von Schüler_innen bei denen sie keinerlei „Erwartungen“ (förväntningar) oder „Hoffnungen“ (förhoppningar) habe (Z. 349-350). Sie berichtet weiterhin, dass in der Nachbarkommune die Schulen die Testbögen untereinander austauschen und gegenseitig korrigieren würden, „um es so objektiv wie möglich zu machen“ („För att det ska vara så objektivt som möjligt.“, Z. 331-332). Neben den Aspekt der gesteigerten Objektivität durch die mehr oder weniger anonymisierte Korrektur der Arbeiten tritt bei Eva noch die Verfahrenserleichterung durch die detaillierten Vorgaben der standardisierten Tests: Sie lobt insbesondere die „KLAREN Beurteilungsanweisungen“ („TYDLIGA bedömningsanvisningar“, Z. 145), mit denen „man etwas Konkretes haben und den Schüler_innen zeigen [kann]“ („man kan ha nånting mer konkret och visa eleverna“, Z. 152). Gleichzeitig würde die gemeinsame Korrektur zu wichtigen Diskussionen innerhalb des Kollegiums führen, da die Lehrkräfte gezwungen seien ihre Beurteilungen voreinander zu rechtfertigen. Ein einfaches „Abtauchen“ („gömma undan“) und „benoten, was ich will“ („sätter jag det jag vill“, Z. 372) sei so nicht mehr möglich. Die gemeinsame Korrektur der Tests dient damit auch der Objektivierung in Alvas Sinne, da das Kollegium sich gegenseitig korrigiere und diszipliniere. Mit der Referenz auf die Beurteilungsmaterialien wird hier auch die zentrale Rolle der Schulbehörde Skolverket als Bezugspunkt und weitere Legitimationsquelle für eine als ‚gerecht‘ verstandene Leistungsbeurteilung deutlich. Skolverket wird von manchen der Befragten so häufig zitiert, dass der Eindruck entsteht, die Schulbehörde sei wie ein ‚unsichtbarer Dritter‘ immer auch mit anwesend. Es zeigt sich weiterhin, dass die neuen Lehrpläne und die damit verbundene detaillierte Aufschlüsselung der Lernziele in Form von Beurteilungsrastern sowohl als Hilfestellung und Erleichterung für die Beurtei-

410

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

lungspraxis bewertet werden, als auch die Solbruchstellen schulischer Leistungsbeurteilung sichtbar machen.

Der Fall Herr Dabert im Vergleich zu anderen nordrhein-westfälischen Lehrkräften Auch wenn Herrn Daberts konkretes Dokumentationssystem mit Hilfe eines Pocketcomputers einmalig im nordrhein-westfälischen Sample ist, finden sich auch bei anderen Lehrkräften ähnliche Präferenzen für eine durch möglichst detaillierte Beurteilungsverfahren und eine strenge Orientierung an den rechtlichen Vorgaben garantierte ‚gerechte‘ Beurteilung. Im Folgenden werden einige der in Kapitel 6.3.2.2 bereits ausgeführten Aspekte zum Teil kontrastierend aufgegriffen, um die Bandbreite der prozedural-bürokratischen Gerechtigkeitsüberzeugungen aufzuzeigen.

Balanceakt zwischen „Standards“ und dem „individuellen Weg“ Für Frau Stakenhues, eine Deutschlehrerin an der Realschule, ist zunächst einmal vollkommen klar: „Ich meine wir sind eine staatliche Schule. Und wir müssen uns nach dem richten, was die Politik vorgibt.“ (Z. 7475). Und weiter: „Eine gerechte Leistungsbeurteilung ähm (.) richtet sich nach den Kriterien und Vorgaben. Um überhaupt erstmal eine Folie zu haben (.) äh was müssen Schüler können“ (Z. 518-519). Die rechtlichen Vorgaben der schulischen Leistungsbeurteilung werden damit klar als wichtige Rahmung ihrer Beurteilungspraxis eingeführt, die orientierende Funktion für die Lehrkräfte wird ebenfalls deutlich, wenn sie die Vorgaben als „Folie“ beschreibt. Gleichwohl benennt sie im Verlauf des Interviews zwei Begrenzungen, an denen eine regelkonforme Beurteilung ihrem Gerechtigkeitsempfinden widerspräche: erstens, die von ihr attestierte Unmöglichkeit, den Lernfortschritt der Schüler_innen beurteilen zu können und zweitens, im Umgang mit Lese-Rechtschreib-Schwächen

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

411

der Schüler_innen. Für ersteres drückt sie ihr Bedauern und Unbehagen aus, wie im folgenden Auszug deutlich wird: „Also was mir in der Schule grundsätzlich fehlt ist ähm (.) Lernfortschritt zu=zu benoten zu dürfen. Das darf ich nicht. (.) Ich darf immer nur gucken wo=wo stehen die Schüler (.) zu einem gewissen Zeitpunkt. (.) Das ist mir manchmal sehr unangenehm. (..) Das finde ich (.) auch nicht gerecht.“ (Z. 538-541)

Frau Stakenhues beklagt mehrmals im Interview den vorgeschriebenen Fokus auf das Lernergebnis anstelle des Lernprozesses bei der Benotung, scheint sich jedoch wider ihr Unbehagen an die Vorgabe zu halten und bei der Benotung vor allem die gezeigte Leistung einzubeziehen. Anders sieht es hingegen bei der Gewichtung der Rechtschreibleistung aus, die gemäß einer schulinternen Absprache zu 20% in die Note der schriftlichen Leistungen einfließen sollte, die wiederum 50% der Gesamtnote ausmacht: „50 Prozent. Und 20 Prozent zählen Rechtschreibleistungen. (.) Äh das haben wir sowohl in Deutsch als auch in Englisch übernommen. (.) Ob das noch so stimmig und politisch aktuell ist, wage ich zu bezweifeln. [lacht kurz] (..) Äh es ist auch ehrlich gesagt/ (.) Ich halte mich nicht immer dran. Das gebe ich ganz offen zu. Weil ich (.) es manchmal nicht für angemessen halte. Ne? Also es gibt diese Standards. [...] Und äh wie gesagt, es gibt aber auch den individuellen Weg.“ (Z. 319-332)

Frau Stakenhues gibt unumwunden zu, dass sie einerseits nicht sicher sei, ob diese schulinterne Absprache überhaupt mit den offiziellen Regularien übereinstimme226 und führt andererseits aus, dass sie sich selbst nicht immer an die kollektive Absprache halten würde und selbstständig über die ‚Angemessenheit‘ des Kriteriums Rechtschreibung entscheide. 226

Im Kernlehrplan Deutsch für Realschulen findet sich keine prozentuale Vorgabe für die Gewichtung der Rechtschreibleistung bei schriftlichen Arbeiten, wie von Frau Stakenhues angeführt. Es gibt aber den Hinweis darauf, dass die korrekte Rechtschreibung und Grammatik wichtige Beurteilungskriterien bei schriftlichen Arbeiten seien und „[g]ehäufte Verstöße gegen die sprachliche Richtigkeit [...] zu einer Absenkung der Note im Umfang einer Notenstufe“ führen können. Die beiden Beurteilungsbereiche schriftliche und mündliche Leistungen sollen jedoch zu gleichen Teilen in die Abschlussnote einfließen (MSW, 2004, S. 48).

412

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Als Begründung für das gelegentliche Abweichen von den kollektiven Absprachen im Kollegium nennt sie unter anderem persönliche Erfahrungen aus dem Familienkreis, da ihr Vater und ihre beiden Kinder ebenfalls „Legastheniker“ seien: „also von daher weiß ich wie SCHWER dieser Weg ist“ (Z. 295). Aus dieser persönlichen Erfahrung heraus legitimiert Frau Stakenhues ihr Abweichen von den Regeln – ähnlich wie andere Lehrkräfte auf ihre pädagogische Freiheit verweisen, benennt Frau Stakenhues ihre Einschätzung der Vorgaben als „manchmal nicht [...] angemessen“. In der Gegenüberstellung der für alle Lehrkräfte verbindlichen „Standards“ einerseits und dem „individuellen Weg“ andererseits wird Frau Stakenhues‘ Balanceakt bei der Leistungsbeurteilung auf den Punkt gebracht.

Detaillierte Dokumentation: „Daten sammeln“ zur rechtlichen Absicherung der Noten Die Beurteilung mündlicher Leistungen wird von verschiedenen Lehrkräften als besonders schwierig beschrieben, eine Lösungsstrategie stellt die möglichst detaillierte Dokumentation der Unterrichtsbeteiligung dar. Hierbei wird versucht eine große Anzahl von Daten über die einzelnen Schüler_innen zu produzieren, die dann zu einer Note zusammengefasst werden können. Die zentrale Idee ist dabei, eine lückenlose Dokumentation der Unterrichtsbeteiligung zu schaffen, die nicht nur „im Kopf“227 der jeweiligen Lehrperson stattfindet, sondern nach vorab festgelegten Kriterien abläuft, um eine möglichst objektive Beurteilung der beobachteten Leistungen im Unterricht gewährleisten zu können. Das Unbehagen gegenüber einer rein auf Beobachtungen beruhenden Beurteilung wird durch die Umwandlung dieser Beobachtungen in Datenreihen auf227

Die aus einem in-vivo-Kode entstandene Kategorie Beurteilung im Kopf bezeichnet die von einigen Lehrkräften des Samples beschriebenen Beurteilungspraxis, die sich vor allem auf die Erfahrenheit und ad hoc-Urteile von Lehrkräften stützt – im Gegensatz zu einer auf explizierten, kommunizierten Kriterien aufbauenden Beurteilung.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

413

gefangen. Schlichte Zensurenreihen im Klassenbuch oder aber selbst entwickelte Symbolsysteme228 für verschiedene Arten der mündlichen Beteiligung, erbrachte oder vergessene Hausaufgaben, die Quantität und Qualität von Schüler_innenfragen unterstützen diesen Prozess des Datensammelns – mit ihrer Hilfe wird versucht alles Unterrichtsgeschehen zu erfassen und belegbar zu machen, um darauf eine Beurteilung stützen zu können. Die Formulierung des „Datensammelns“ geht dabei auf einen in-vivoKode aus dem Interview mit dem Mathematiklehrer Herrn Grabenmüller zurück, der diese Formulierung als Synonym für seine Notizen zur mündlichen Beteiligung seiner Schüler_innen verwendet: „Und da muss ich DATEN haben. Und die samm/ und die sammel ich entsprechend. […] Auch aus rechtlichen (.) Gründen, aber auch, um da (.) eine gerechtere Note zu finden“ (Z. 194-197). Im weiteren Verlauf des Interviews stellt Herr Grabenmüller seine detaillierte Dokumentation als nur mit einer „sehr gute[n] Buchführung“ (Z. 215) widerlegbar dar.229 Seine Dokumentation diene unter anderem dazu, Beurteilungen gegenüber skeptischen Eltern erklären und damit legitimieren zu können, wenn diese „Einsprüche beim Schulleiter landen“ (Z. 212) wollten. Mit dieser Rechtfertigungshaltung verweist Herr Grabenmüller auf ein im nordrheinwestfälischen Sample häufiger auftretendes Muster der Legitimation konkreter Beurteilungen: die detaillierte Dokumentation der Noten dient gewissermaßen der ‚Gefahrenabwehr‘, indem diese vorsorglich für den Fall der Infragestellung durch außenstehende Dritte ‚wasserdicht‘ gemacht werden. Der Zusammenhang zwischen einer detaillierten Do228

Wie bereits in Kap. 6.3.1.1 am Fall von Frau Ehrl dargestellt oder aber das Dokumentationssystem von Frau Dorpenbeck, Deutschlehrerin an der Realschule, die verschiedene Symbole für die Mitarbeit im Unterricht nutzt: ein Pluszeichen für „gute Mitarbeit“, „Das äh (.) Durchgestrichene ist mein Zeichen für: Da war GAR NICHTS“, „Plusminus ist so ein=so ein Mittelding“, ein Blitz „der bedeutet dann Katastrophe in der Stunde. Wenn jemand wirklich extrem gestört hat“ (Z. 362-365). 229 Auf das Phänomen der „Leistungsbewertung als Buchführung“ weisen auch Dietrich und Fricke (2013, S. 275) hin und benennen ebenfalls den Zusammenhang mit einer zu erbringenden Pflicht der Beurteilung.

414

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

kumentation der Teilnoten als einer juristischen Absicherung taucht immer wieder im Interview mit Herrn Grabenmüller auf, so beispielweise wenn er mit einem gewissen Stolz berichtet: „Widersprüche (.) hat es in den 33 Jahren [...] nie gegeben [...] ich bin nie zum Chef zitiert worden, nie zur Bezirksregierung“ (Z. 373-375). Das Ausbleiben von Widersprüchen wird hier – analog zum „Ausbleiben von Diskussionen“ mit Schüler_innen bei Herrn Dabert – als Beleg für die Richtigkeit und Legitimität der Beurteilungen aufgeführt. Auch seine Vorliebe für schriftliche Leistungen muss in diesem Sinne gelesen werden: „das ist auch für mich verlässlicher. Was geschrieben ist, ist geschrieben und im Mathematikunterricht wird eh nicht so viel gesprochen“ (Z. 738-740). Der Begriff der Verlässlichkeit schriftlicher Leistungen, den Herr Grabenmüller anführt, verweist dabei auf eine Verknüpfung von Leistungsbeurteilung mit Konzepten der Nachvollziehbarkeit und Belastbarkeit von Beurteilungen im Sinne einer Rechenschaftslegung gegenüber Dritten. Zugleich erinnert die Formulierung „was geschrieben ist, ist geschrieben“ an die Aussage der Schwedischlehrerin Eva, die davon sprach, dass ihre Beurteilungen „schwarz auf weiß“ vorlägen und damit weniger stark von den Schüler_innen infrage gestellt würden. Herr Imburg, ein Mathematiklehrer an der Realschule, verwendet für die Dokumentation der mündlichen Leistungen einen Sitzplan der jeweiligen Klassen, in den er zusätzliche Notizen zu den Hausaufgaben, aber auch einzelne Noten und andere Symbole für die mündliche Mitarbeit für die einzelnen Schüler_innen einträgt. Auch für ihn steht die Rechenschaftslegung gegenüber Dritten im Zentrum: „Und das ist dann (.) also so eine Dokumentation, die dann abzuheften ist und dann habe ich das als ähm, ja auch als Grundlage für eventuelle Nachfragen von Eltern. Kritischer Art oder eben für Einsprüche. Wobei das noch nicht vorgekommen ist. Und das mache ich nicht aus Angst. Das mache ich eben, weil ich mich damit gut fühle, wenn ich das habe. Also nicht aus Angst vor den Ein/ Wi/ vor den Widersprüchen.“ (Z. 123-127)

Auch wenn Herr Imburg betont, dass er die Notendokumentation „nicht aus Angst“ vorhalte, wird deutlich, dass die Belegbarkeit und Transparenz der Noten wichtig für ihn und die Legitimität seiner Beurteilungen

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

415

ist. Auch wenn seine Beurteilungen noch nicht beanstandet wurden, wie er sofort hinterherschiebt, möchte er im Fall der Fälle vorbereitet sein und einer solchen Überprüfung standhalten können. Einen interessanten Kontrastfall zur detaillierten Dokumentation der mündlichen Leitungen stellt der im Kapitel zur mathematischrechnerischen Gerechtigkeitsüberzeugung bereits erwähnte Mathematiklehrer Herr Clemens dar, der eine solche Dokumentation rigoros ablehnt: „Ich schreibe mir nichts auf. Ich hab das im Kopf. Ich kann die Schüler UNGEFÄHR einschätzen. Wenn ich da andauernd mit denen zusammen bin, selbst wenn ich nur drei Stunden in der Woche in irgendeinem Oberstufenkurs habe, ne? Also nach=nach=nach vier Wochen, da kann man sagen, das ist ein Dreierkandidat! Wenn ich mir jetzt Notizen mache, da kommt hinterher auch nichts anderes bei raus. Dann kann ich wohl, wenn es vor Gericht geht, kann ich sagen: ‚Am so=und=so=vielten hat der den Satz gesagt.‘ Oder so. Aber wem ist damit geholfen? Ne? Dem Richter. [lacht] Aber (.) äh das kann man abschätzen. Ne?“ (Z. 170-175)

Im Interview mit Herrn Clemens wird deutlich, dass er seine Beurteilungen aus einer Expertenrolle heraus trifft, die für ihn als wichtigste Legitimationsressource dient. Die Explikation dieses Expertenwissens fällt ihm schwer, da es sich vornehmlich um implizites Handlungswissen handelt bzw. aus zu Wissen geronnener Erfahrung besteht („das kann man abschätzen“, „ich hab das im Kopf“). Seine Beurteilungen im mündlichen Bereich werden, anders als bei anderen Kolleg_innen, nicht dokumentiert oder anderweitig nachvollziehbar gemacht, sondern vollziehen sich ausschließlich im inneren Dialog mit sich selbst, basierend auf der eigenen Berufserfahrung. Dabei legt Herr Clemens – im Unterschied zu Herrn Dabert – keinen besonderen Wert auf eine detaillierte Dokumentation. Im Gegenteil findet sich sogar eher eine ironisierende Distanzierung („Aber wem ist damit geholfen? Ne? Dem Richter. [lacht]“) aus der sich eine gewisse Belustigung über die Praxis anderer Lehrkräfte ableiten lässt. An anderer Stelle wird er noch deutlicher: „Das kriegt man einfach so hin. Das ist (.) ne? ist wie das Einmaleins, oder so. Ja?“ (Z. 207). Das Einmaleins steht hier symbolisch für eine routinisierte, in ‚Fleisch und Blut übergegangene‘ Tätigkeit, über die er als Mathematiklehrer gar

416

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

nicht mehr nachdenken muss, die er vor langer Zeit erlernt hat und nun auswendig, ohne große Mühe ausführen kann. Benotung wird damit zu einer professionellen Routine, in der für alle Varianten bereits ein Handlungs- und Entscheidungsmuster vorliegt, das gleichsam mechanisch abgespult werden kann wie beim Aufsagen des Einmaleins. Gleichzeitig stellt er seine Art des Benotens als ein großes Können dar, denn er betont mehrfach, wie unzweifelhaft die Angelegenheit für ihn ist („Also ich kann das so sagen, weil das=das ist ja ganz klar“, Z. 204). Ad-hocBeurteilungen („In dem Moment, wo Sie mich fragen würden, würde ich mir überlegen: Was ist das?“, Z. 206-207) stellen keine besondere Herausforderung für ihn dar, sie sind selbstverständlicher Teil seines beruflichen Könnens. Er kennt seine Schüler_innen und ist sehr erfahren, also lassen sich die mündlichen Noten auch ad hoc fällen.

Transparente Kriterien und ‚objektive‘ Beurteilung Für Frau Dr. Gröhlich, eine Deutschlehrerin am Gymnasium, geht der Wunsch nach einer transparenten Beurteilung noch über den Aspekt der Rechenschaftslegung hinaus, wenn sie ausführt, dass nicht nur die Ergebnisse der Beurteilung offengelegt werden sollen, sondern vor allem auch die zugrunde gelegten Beurteilungskriterien für die Schüler_innen deutlich sein sollen: „Ja, äh (.) Offenheit (.) äh Transparenz der Note. Das komplett darlegen zu können. (..) Welche Erwartungen man an Schüler gehabt hat und welche er erfüllt hat oder nicht erfüllt hat. [...] Ein/ dem ja standhalten zu können, das wirklich auch belegen zu können. Gerade auch in der sonstigen Mitarbeit nicht eine wischi=waschi=Note (…) äh zu setzen. [...] selber als Lehrer transparent zu sein und äh (.) ja, dem Schüler überhaupt die Gelegenheit (.) geben äh zu=zu geben, diesen Erwartungen gerecht zu werden. Das heißt, dass man selber als Lehrer (.) äh ja offen arbeitet, Kriterien von vornherein nennt, Erwartungen nennt, ähm (.) im mündlichen wie schriftlichen. Was soll man lernen und wonach beurteile ICH jetzt als Lehrer. Um daran halt das Ganze zu reiben. Und nicht, dass der Schüler hinterher sagt: ‚Ja, wusste ich ja nicht, dass das=und=das (.) kommt.‘ Ne? Also das beiderseitige Transparenz dran kommt. (.) Also das finde ich wichtig für eine gerechte Beurteilung [...].“ (Z. 553-566)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

417

Im ersten Teil wird durch die verwendeten Verben noch auf die Funktion der Rechenschaftslegung hingewiesen („komplett darlegen“, „standhalten“, „belegen“), durch die Dokumentation reduziert sich die Möglichkeit einer nachträglichen Infragestellung ihrer Beurteilung. Auch wird damit der Eindruck vermieden, ihre Beurteilungen könnten willkürlich entstanden sein („keine wischi=waschi=Note“). Analog zu Herrn Daberts Bemühen um ein möglichst zeitnahes Festhalten der Unterrichtseindrücke spricht sich auch Frau Dr. Gröhlich dafür aus sich möglichst regelmäßig Notizen zu machen, denn: „Dann vergesse ich das nicht so schnell“ (Z.45). Gleichzeitig wird durch die Offenlegung der Beurteilungskriterien sichergestellt, dass die Schüler_innen wissen, für welche Leistung sie welche Note erwarten können, woraus eine größere Akzeptanz der Benotungen auf Seiten der Schüler_innen zu erwarten sei. Die dadurch ermöglichte „Transparenz der Note“ (sowohl in der Entstehung als auch im Endergebnis), wird von Frau Gröhlich als zentral für eine ‚gerechte‘ Beurteilung markiert. In der Betonung „wonach beurteile ICH jetzt als Lehrer“ wird jedoch auch deutlich, dass es sich bei den angesprochenen Beurteilungskriterien nicht unbedingt um zentral vorgegebene oder im Kollegium abgesprochene Kriterien der Leistungsbeurteilung handeln muss, vielmehr wird wieder einmal der individuelle Spielraum der Lehrkräfte in NRW bei der schulischen Leistungsbeurteilung deutlich. Ein wiederum anderes Verständnis einer ‚gerechten‘, da transparenten Beurteilung findet sich bei Frau Boven, einer Hauptschullehrerin, die unter anderem das Fach Deutsch unterrichtet: „WEITGEHEND gerecht versuche ich, versuchen wir glaub ich alle, ähm (.) ist Leistungsbeurteilung dann, wenn sie transparent ist für den Schüler. Wenn der Schüler sieht ähm (.) ich hab/ Andere Schüler mit den gleichen Leistungen bekommen auch die gleiche Note. Äh oder die gleichen Punkte. Und auch das Gefühl haben, ob ich jetzt bei Frau X oder bei Frau Y äh (.) das mache, da kommt auch das Gleiche bei raus. (..) Ähm dann ist es sicherlich weitgehend gerecht.“ (Z. 529-534)

Transparenz wird hier wiederum im Sinne eines für alle Schüler_innen gleichen Bewertungsmaßstabs verstanden, und ähnlich wie im Modus der mathematisch-rechnerischen Gerechtigkeitsüberzeugung an der Vergabe der gleichen Punkte bei gleicher Leistung orientiert. Darüber

418

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

hinaus fügt Frau Boven allerdings noch den Aspekt einer von den Lehrpersonen unabhängigen Beurteilung hinzu, mit der sie wiederum an die von Herrn Dabert und anderen Lehrkräften hervorgehobene Objektivität (im Sinne einer personenunabhängigen, neutralen Beurteilung) als Voraussetzung für eine ‚gerechte‘ Beurteilung anschließt. Die Einschränkung als „WEITGEHEND gerecht“ löst Frau Boven etwas später auf, wenn sie erklärt, dass eine Gleichbehandlung aller Schüler_innen eigentlich auch nicht gerecht sei, „weil dazu die Schüler viel zu (.) unterschiedlich sind“ (Z. 535) und die individuellen Lernvoraussetzungen der Schüler_innen stärker einbezogen werden müssten, „und das tun wir natürlich gar nicht“ (Z. 537-538). Hier zeigt sich wiederum ein Widerspruch zwischen dem, was von der Lehrerin als rechtlich möglich und pädagogisch notwendig erlebt wird. Auch für Herrn Beckmann, einen Mathematiklehrer an der Hauptschule, stellt eine möglichst ‚objektive‘ Beurteilung eine wichtige Voraussetzung ‚gerechter‘ Beurteilung dar: „Das ist wichtig für einen selber auch. Das man nicht so einfach so aus dem (.) äh (.) ja, wie soll ich das sagen? Also aus dem Gefühl heraus einfach Noten verteilt. Das=das/ also das wäre Wahnsinn. Man muss schon bei aller (.) äh, wie soll ich das sagen, bei aller Liebe zu den Schülern oder bei aller Zuneigung oder Nicht-Zuneigung, schon immer versuchen, irgendwo äh da objektiv zu bleiben. Das ist schwer genug, ganz klar. Aber wir haben wie gesagt unsere=unsere Kataloge, wir haben unsere Vereinbarungen, wir haben diese Standards und die helfen da ungemein.“ (Z. 689-694)

Die von Herrn Beckmann angesprochenen „Kataloge“ und „Standards“ umfassen hierbei die schulinternen Absprachen zur Leistungsbeurteilung, die Herrn Beckmann als Orientierung und Hilfe im Beurteilungsprozess dienen. Als ‚objektiv‘ wird hier eine an Kriterien und Standards orientierte Beurteilung verstanden, die nicht „aus dem Gefühl heraus“ passiert und beispielsweise Sympathien oder Antipathien für einzelne Schüler_innen nicht in die Beurteilung einfließen lässt. Wie weiter oben ausgeführt handelt es sich also um den Versuch der Eindämmung der ‚subjektiven Fehlerquellen‘ durch die Einhaltung von kollektiven „Vereinbarungen“ sowie das Ausbalancieren zwischen einer pädagogischen Bezie-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

419

hung zwischen Lehrkraft und Schüler_in einerseits und den Anforderungen einer ‚objektiven‘ Beurteilung andererseits. Für schriftliche Aufgaben, wie Klassenarbeiten oder Tests, wird von vielen Lehrkräften die Anwendung sogenannter Erwartungshorizonte als Hilfsmittel bei der Beurteilung angeführt. Diese Erwartungshorizonte können sehr unterschiedlich ausfallen, was die Detailliertheit der formulierten Anforderungen und erwarteten Antworten angeht, aber auch den Einsatz als Rückmeldeinstrument für die Schüler_innen. Allen Schilderungen gemeinsam ist jedoch die Markierung als relativ neues Instrument, das von den Lehrkräften meist individuell, teilweise auch in Kooperation mit Fachkolleg_innen, für jede Klassenarbeit erstellt wird. Insbesondere für die jüngeren Lehrkräfte im Sample dienen Erwartungshorizonte als wichtige Orientierung bei der Beurteilung schriftlicher Leistungen, wie am folgenden Auszug aus dem Interview mit Frau Heinkötter deutlich wird, einer Mathematik- und Deutschlehrerin an der Realschule, die erst seit zwei Jahren im Schuldienst ist: „Deswegen ja/ Helfen mir a/ Also ohne Bewertungsbögen könnte ich es auch nicht. Zu sagen: ‚So das ist jetzt (.) Drei.‘ Würde ich nicht schaffen. Also da (.) brauche ich die wirklich auch für mich, um einen Überblick zu verschaffen. Ne? Was ist jetzt abgehakt und was nicht? (..) Ja. Ganz klar.“ (Z. 116-119)

Die hier als „Bewertungsbögen“230 bezeichneten Erwartungshorizonte stellen einen Kriterienkatalog dar, mit dessen Hilfe die Lehrerin die in den Klassenarbeiten auftauchende Vielfalt an Schüler_innenleistungen mit einem vorgegebenen Raster abgleichen, in ihrer Formulierung „abhak[en]“, kann. Ohne diese Unterstützung wäre ein Festlegen auf eine Note für Frau Heinkötter nicht möglich („würde ich nicht schaffen“), die Erwartungshorizonte stellen damit auch eine Arbeitserleichterung dar, 230

Weitere verwendete Synonyme sind: „Kriterienbogen“, „Rückmeldebogen“, „Erwartungsbogen“ und „Beurteilungsbogen“. Es finden sich aber auch die Begriffe „Punkteraster“, „Auswertungsraster“ und „Bewertungsraster“, wobei diese stärker auf die Logik der Punktevergabe und Prozentwerte als Notenkriterien ausgerichtet scheinen, wie im Kapitel zur mathematisch-rechnerischen Gerechtigkeitsüberzeugung ausgeführt.

420

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

indem sie die Komplexität der Beurteilung auf ein Abgleichen zwischen den vorab festgelegten Kriterien und dem von den Schüler_innen Erbrachtem reduzieren. Für Frau Dorpenbeck, ebenfalls seit zwei Jahren im Schuldienst, stellt die Beurteilung schriftlicher Arbeiten ohne einen Erwartungshorizont sogar eine illegitime Praxis dar: „Und ich merk auch immer noch, dass es Kollegen gibt, die dann eine Arbeit lesen und drunter schreiben: insgesamt ausreichend. Da könnt‘ ich dann durchdrehen. Wo ich dann denke, dann (..) kann ich das auch alles würfeln.“ (Z. 76-78) Die Verwendung des Erwartungshorizonts wird hier auch mit der Abwehr einer als willkürlich empfundenen Beurteilungspraxis verbunden und wird von Frau Dorpenbeck als ein Diskussionspunkt innerhalb des Kollegiums ihrer Schule benannt. Dass die Verwendung von Erwartungshorizonten von erfahreneren Lehrkräften auch mit Skepsis betrachtet wird, zeigt sich im Interview mit Herrn Bredehorst, einem Deutschlehrer am Gymnasium mit rund 20 Jahren Berufserfahrung: „Wenn ich mir überleg, das muss man sich auch mal vorstellen, als ich anfing als Lehrer vor (.) fünfundzwanzig Jahren oder zwanzig Jahren ähm (.) da schrieb man eine halbe Seite drunter (.) und erklärte dann auch kurz weshalb=wie man zu der Note gekommen ist. Heute machen sie zwei Seite=zwei Seiten Erwartungshorizont. (.) Ob das IMMER objektiver und gerechter ist, weiß ich nicht so genau. Aber alles unter dem Gerechtigkeitsmaßstab jeder jetzt/ Jeder soll nach dem gleichen Maß beurteilt werden.“ (Z. 31-40)

Hier wird zunächst deutlich, wie sich die Beurteilung schriftlicher Leistungen aus Sicht von Herrn Bredehorst zu einer stärker formalisierten Beurteilungskultur entwickelt hat, die allein vom Umfang her („halbe Seite“ vs. „zwei Seiten“) einen Anstieg der zu berücksichtigen Kriterien zur Folge hatte. Es wird auch deutlich, dass damit ein gestiegener Arbeitsaufwand einherging, den Herr Bredehorst, anders als andere Lehrkräfte, jedoch nicht weiter bewertet. Mit dem Hinweis auf den „Gerechtigkeitsmaßstab“ „jeder [...] nach dem gleichen Maß“ wird seine grundlegende Zustimmung zu den Erwartungshorizonten als egalisierende Beurteilungsinstrumente deutlich, die auch an anderen Stellen des Interviews deutlich wird. Gleichzeitig zeigt er sich skeptisch, inwiefern die ausführlicheren Erwartungshorizonte die Beurteilung tatsächlich „objek-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

421

tiver und gerechter“ gemacht hätten. Eine Erklärung hierfür findet sich etwas später im Interview, wenn er ausführt: „UND jetzt sage ich Ihnen auch, das äh geht mir wie vielen Kollegen auch: (.) wir lesen die Arbeit durch, ein=zwei Mal und haben dann eine ziemlich genaue Vorstellung davon, was da ungefähr bei rauskommt. (..) Und das ähm deckt sich dann mit dem, was dann hinterher im Erwartungshorizont an Punkten steht. Und jetzt ist das auch glaube ich gar nicht so=so unmoralisch, wie das erst klingt, ne? Ähm (.) äh (.) Sie (.) können das im Grunde gar nicht genau auf Punkte irgendwie verteilen.“ (Z. 235-240)

Für Herrn Bredehorst stellt die jahrelange Erfahrung als Lehrkraft eine wichtige Ressource bei der Beurteilung von (schriftlichen) Schüler_innenleistungen dar, die Erwartungshorizonte werden von ihm eher zur nachträglichen Absicherung seines Eindrucks genutzt. Und obwohl er einerseits dem Beurteilungsinstrument Erwartungshorizont in gewisser Weise die Genauigkeit abspricht, da man die in den Arbeiten gezeigten Schüler_innenleistungen „im Grunde gar nicht genau auf Punkte irgendwie verteilen“ könne, wird die Übereinstimmung zwischen seiner „ziemlich genaue[n] Vorstellung“ der Arbeitsleistung und dem „was dann hinterher im Erwartungshorizont an Punkten steht“ als Legitimation seiner Beurteilung genutzt. Erst aus der Kombination aus professioneller Erfahrung und der Verwendung der Erwartungshorizonte wird so eine für ihn ‚gerechte‘ Beurteilung möglich. Für Frau Dr. Gröhlich stellen die Erwartungshorizonte hingegen eine deutliche Verbesserung gegenüber der auch von Herrn Bredehorst benannten Praxis des Kommentars als Rückmeldung dar: „Ich meine, dass es deutlich objektiver ist, als (.) VOR dem Erstellen eines (.) Fragebogens oder äh Erwartungshorizontes. Wenn man einfach nur einen Kommentar schreibt. (.) Ich finde das ist einem als Lehrer dann auch nicht immer ganz so klar, worauf es letztendlich hinausläuft. Das ist dann va/ deutlich VAGER als (.) ein Erwartungshorizont. Aber letztendlich (.) ähm kann man sicherlich auch noch einiges dran drehen. Also man kann sicherlich sich noch über einige Punktevergaben unterhalten. (.) Ähm, aber es hat eine Scheinobjektivität.“ (Z. 354-359)

Die konkreten Kriterien des Erwartungshorizontes werden hier einer „vage[n]“, teilweise vielleicht auch willkürlichen Beurteilung ohne explizite Beurteilungskriterien gegenübergestellt und als Verbesserung mar-

422

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

kiert. Gleichzeitig ist sie sich der Möglichkeiten einer nachträglichen Veränderung der Erwartungshorizonte bewusst und verwendet sogar eine ähnliche Formulierung wie die Mathematiklehrerin Frau Ehrl aus dem Kapitel zur mathematisch-rechnerischen Gerechtigkeitsüberzeugung, wenn sie bezogen auf die Bepunktungen im Erwartungshorizont davon spricht, dass man „noch einiges dran drehen“ könne. Nichtsdestotrotz explizieren die Erwartungshorizonte die Beurteilungskriterien, wodurch sich für Frau Gröhlich eine „Scheinobjektivität“ des Instruments ergibt. Der Begriff der „Scheinobjektivität“ taucht auch im Zusammenhang mit dem Ausbleiben von „Diskussionen“ mit Schüler_innen um ihre Noten auf, wenn Frau Dr. Gröhlich eingangs erzählt: „Äh, seitdem ich diese Erwartungshorizonte mache, auch in der Sek I, fragt keiner mehr nach. (.) Das wird akzeptiert. Wobei=wobei auch da manchmal die äh Gewichtung so, ob ich jetzt fünf Punkte oder vier gebe (.) auch irgendwo relativ ist. Äh, es wird akzeptiert. Es hat so eine=so eine Scheinobjektivität. (.) Bei Schülern und Eltern.“ (Z. 39-42)

Analog zu Herrn Daberts Erzählungen deutet auch Frau Dr. Gröhlich das Ausbleiben von Nachfragen seitens der Schüler_innen zu ihren Beurteilungen als Ausdruck der Akzeptanz selbiger. Dadurch scheint das gewählte Verfahren legitimiert, unabhängig davon, dass sie selbst einräumt, dass dieses Verfahren nur eine „Scheinobjektivität“ vorspiegelt. Diese „Scheinobjektivität“ bezieht sich dabei auf die genaue Zusammensetzung der Bepunktungen, die durchaus unterschiedlich ausfallen kann. Allerdings gibt sie an, „dass je nach dem wo ich mehr im Unterricht einen Fokus draufgelegt habe, dass das dann auch (.) mit mehr Punkten oder mehr Gewichtung“ (Z. 33-34) in die Beurteilung der Arbeiten eingehe. Insofern sind die Erwartungsbögen an das Unterrichtsgeschehen und die behandelten Inhalte angepasst, weshalb sie die genaue Zusammensetzung der Punkte und daraus abgeleiteter Noten als „auch irgendwo relativ“ – und nicht etwa als ‚willkürlich‘ – beschreibt. Die von ihr attestierte „Scheinobjektivität“ der Erwartungshorizonte trägt nicht dazu bei, dass Frau Dr. Gröhlich ihre Beurteilungen grundsätzlich infrage stellt, vielmehr stellen sie einen „Versuch das Ganze zu objektivieren“ (Z. 77) dar –

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

423

wohl wissend, dass die Möglichkeit der nachträglichen Anpassung des Instruments an die Erwartungen der Lehrkraft o.ä. immer besteht.

Standardisierung durch zentrale Abschlussprüfungen Im Vergleich der nordrhein-westfälischen Lehrkräfte untereinander fällt auf, dass die zentralen Abschlussprüfungen in Klasse 10 bzw. das Zentralabitur durchaus ambivalent betrachtet werden. Einerseits führten die zentralen Prüfungen zu einer größeren Standardisierung und Einheitlichkeit der Abschlussprüfungen, wodurch „der Beliebigkeit ein Riegel vorgeschoben“ werde, wie es Herr Grabenmüller ausdrückt (Z. 535). Andererseits findet durch sie auch ein Eingriff in die professionelle Praxis statt, die von den Lehrkräften unterschiedlich gewertet wird. Dazu ein weiterer Auszug aus dem Interview mit Herrn Grabenmüller: „Ob dadurch mehr Gerechtigkeit erzielt wird, wenn man standardisierte Tests einsetzt? Vermutlich ja. […] Weil es ist schon ein Unterschied, wie in den ersten 15 Jahren oder ersten 20 Jahren, wenn man praktisch für SICH seine Klasse unterrichtet oder für SICH seinen Kurs, sein Aufgabenmaterial macht. Äh ich/ Und man merkt gar nicht, dass der Kollege nebenan regelmäßig viel LEICHTERE Aufgaben macht, auch in den Klausuren viel leichtere macht. Äh oder umgekehrt, ganz anspruc/ Ähm, das ist jetzt offengelegter, das ist transparenter und das sorgt sicherlich für eine=eine gerechtere Bewertung. Nicht? Da ist der Beliebigkeit ein Riegel vorgeschoben. Also das ist das Gute an=an=an diesen Tests. Ob es jetzt zentral erfolgen muss, von oben, [sucht nach Worten] unabhängig davon, was so in den Schulen läuft, (..) so lange wir im oberen Drittel sind, sage ich mal, (..) passt das schon [I lacht; Hr. Grabenmüller lächelt].“ (Z. 525-538)

Zentrale Abschlussprüfungen werden hier als Mittel gesehen, um die „Beliebigkeit“ von Beurteilungen aufzuheben, indem standardisierte, für alle Schüler_innen gleiche Prüfungsaufgaben formuliert werden. Herr Grabenmüller kritisiert indirekt auch das traditionelle Einzelkämpfertum des Lehrberufs, denn mit der Einführung der zentralen Prüfungen würden Lehrkräfte nun nicht mehr nur „für SICH“ unterrichten und Aufgaben festlegen, die im Zweifelsfall von denen der Kolleg_innen im Anspruchsniveau abweichen. Die Betonung des Reflexivpronomens „sich“

424

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

deutet hier auch eine Haltung zum Unterrichten an, die die Schüler_innen zunächst ausblendet: es geht darum, den Unterricht zu bewältigen, aus der Perspektive der Lehrkraft, den Unterricht und die daraus resultierenden Leistungsüberprüfungen für die Lehrkraft stimmig zu gestalten. Mit der Einführung der zentralen Prüfungen tritt nun das Kollegium als Korrektiv in die Unterrichts- und Prüfungsgestaltung hinein, indem die Prüfungsergebnisse der Schüler_innen als Indikator für guten Unterricht betrachtet werden können. Lehrkräfte können nun nicht mehr durch die Auswahl der Prüfungsfragen (mit-)beeinflussen, wie die Schüler_innen abschneiden, sondern müssen ihren Unterricht stärker an die Kernlehrpläne und die Prüfungsform anpassen. Ungerechtigkeit wird in diesem Beispiel als illegitimes Abweichen nach unten, d.h. als Erleichtern von Prüfungen durch „viel LEICHTERE Aufgaben“ beschrieben. Herr Grabenmüller argumentiert hier aber nicht aus der Perspektive der Schüler_innen, die dadurch unterschiedlichen Anforderungen gegenüberstehen würden, vielmehr scheint es ihn zu stören, dass er selbst durch die schwierigeren Aufgaben Gefahr läuft als schlechterer Lehrer dazustehen, wenn seine Schüler_innen in den Prüfungen schlechter abschneiden. Das „Offenlegen“, die erhöhte „Transparenz“, die er als direkte Folge der zentralen Prüfungen beschreibt, beziehen sich hier vornehmlich auf das Offenlegen einer in seinen Augen illegitimen Praxis des Herabsetzens des Anspruchsniveaus in Prüfungen durch andere Kolleg_innen. Er bringt kurz auch das gegenteilige Beispiel ein (zu anspruchsvolle Aufgaben), bricht diesen Satz aber sofort wieder ab – so als ob diese Variante nur hypothetisch, nicht aber als reale Option im Schulalltag bestehen würde. Er schließt mit der zusammenfassenden Feststellung, dass mit der Einführung von zentralen Prüfungen „der Beliebigkeit ein Riegel vorgeschoben“ sei. Mit Beliebigkeit meint er in erster Linie vermutlich eine wenig kontrollierte und dadurch für willkürliche Entscheidungen anfällige Benotung, der durch die zentralen Prüfungen Einhalt geboten werden kann. Im Kontext der oben ausgeführten Argumentationslogik kann sie aber auch als eine Art gerichtete Beliebigkeit verstanden werden: als Abwehr eines beliebigen Abweichens ‚nach unten‘. Für Herrn Grabenmüller stellen die zentralen Prüfungen auch ein In-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

425

strument dar, mit dem das Prüfungs- und damit das Leistungsniveau des Gymnasiums gesichert und Aufweichungen dieses Leistungsniveaus durch zu leichte Prüfungsaufgaben abgewehrt werden können. Sie dienen damit auch der Kontrolle und Disziplinierung des Kollegiums, indem die Prüfungsergebnisse der Schüler_innen in direkten Zusammenhang mit der Unterrichtsqualität und dem Anspruchsniveau der Kolleg_innen gebracht werden. Im letzten Absatz dieses Auszugs zeigt sich noch einmal die grundsätzlich ambivalente Haltung gegenüber zentralen Elementen der Leistungsbeurteilung, die auch andere Lehrkräfte des Samples äußern. Einerseits sieht Herr Grabenmüller positive Effekte zentraler Prüfungen wie oben beschrieben, gleichzeitig scheint aber eine grundsätzliche Skepsis gegenüber einer zentralen Erstellung von Prüfungsaufgaben ‚von oben‘ durch. Ähnlich wie in den Argumentationen zur Bewertung von Schüler_innen und ihren Leistungen immer wieder das Argument auftaucht ‚gerechte‘ Bewertungen wären nur auf der Grundlage persönlicher Kenntnis der Schüler_innen möglich, wird hier die Frage nach dem Sinn zentraler Prüfungen gestellt, die „unabhängig davon, was so in den Schulen läuft“ erfolgen würden. Hier tut sich erneut das Spannungsfeld zwischen einer gleichwertigen Beurteilung aller Schüler_innen durch zentrale, standardisierte Prüfungen einerseits und dem Wunsch nach Berücksichtigung von Besonderheiten im Einzelfall auf der anderen Seite auf. Interessant ist, wie Herr Grabenmüller diese Spannung für den Moment auflöst, indem er auf die soziale Bezugsnorm zurückgreift: „so lange wir im oberen Drittel sind“, so lange die durchschnittlichen Prüfungsergebnisse der Schüler_innen seiner Schule also über dem landesweiten Durchschnitt aller Gymnasien liegen, überwiegen in seinen Augen die Vorteile zentraler Prüfungen. Die Bewertung als sinnvolles oder ‚gerechtes‘ Instrument wird hier also ausgehend von den Ergebnissen und vor dem Hintergrund des sozialen Vergleichs getroffen. Die Korrekturvorgaben und Erwartungen für die zentralen Prüfungen wirken sich neben der eigentlichen Prüfung am Ende der Schullaufbahn auch auf die Beurteilungen im Laufe der Sekundarstufe I aus. So berichtet Frau Dr. Gröhlich beispielsweise, dass sie sich erst durch die „feste[n]

426

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Vorgaben“ (Z. 12) des Zentralabiturs auch bei der Beurteilung in den unteren Klassenstufen angewöhnt habe, die Erwartungshorizonte für die schriftlichen Arbeiten einzuführen, „auch für die Fünfer in Deutsch“ (Z. 14-15). Und weiter: „Letztendlich, wenn man am Ende da rauskommen soll, muss man ja gucken, dass man (.) ne? (.) das Ganze immer weiter nach unten (.) runterbricht. Dass sich die Schüler auch langfristig dran gewöhnen können“ (Z. 22-24). Für Frau Dr. Gröhlich hängen die zentralen Prüfungen und die erhöhte Standardisierung der Leistungsbeurteilung durch die konsequente Anwendung der Erwartungshorizonte eng zusammen. Sie dienen einerseits dazu, die Transparenz der Beurteilungen für die Schüler_innen zu erhöhen und damit einer willkürlichen Beurteilung vorzubeugen.231 Gleichzeitig geht es auch darum, die Schüler_innen im Laufe der Schuljahre auf die zentrale Prüfung vorzubereiten und „dran [zu] gewöhnen“. Offen bleibt an dieser Stelle, woran genau sich die Schüler_innen gewöhnen sollen – das Prüfungsformat, die Form der Beurteilung durch Erwartungshorizonte, das Anspruchsniveau? Bei Frau Dorpenbeck, der jungen Realschullehrerin, wird das Ziel der Gewöhnung deutlicher, wenn sie davon spricht, „dass man ab Klasse Fünf versucht die Aufgabentypen einzutrainieren, die sie in Klasse Zehn jetzt in zwei Wochen in der Abschlussprüfung brauchen“ (Z. 66-68). Beide Begriffe, das ‚Gewöhnen‘ an etwas und das ‚Eintrainieren‘ von Aufgabentypen deuten verschiedene Veränderungen im Hinblick auf die Rolle von Prüfungen im Allgemeinen – aber auch die Rolle der Lehrkräfte und Schüler_innen – durch die Einführung der zentralen Prüfungen an, die im Folgenden näher betrachtet werden. Dazu ein Zitat von Frau Dr. Gröhlich:

231

Durch die Einführung der zentralen Prüfungen würde auch die früher eher angewandte soziale Bezugsnorm durch ein kriteriale abgelöst: „Der Vorteil dabei ist, gerade bei diesen (.) ähm zentralen Prüfungen, dass im Vorfeld schon eine Erwartungshaltung (.) ähm festgemacht wird. Und früher, oder vor zehn Jahren war das noch so, oder im Referendariat, man guckt erst mal was auch so die besten Schüler überhaupt schreiben können, was sie an Leistungen bringen. Und daran orientiert man sich dann letztendlich auch in der Notengebung.“ (Z. 223-227)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

427

„[...] und was durch diese Zentralprüfungen äh sich komplett verschiebt, das ist äh sind=sind die Allianzen. Also es ist mittlerweile Lehrer und Schüler (.) gegen Zentralprüfung. Und wir versuchen das gemeinsam. Und ich bereite euch darauf vor. Ich weiß ja auch nicht was drauf=was drankommt. Ne? Im Zentralabitur noch mehr. (.) Es gibt die Vorgaben. Und der Schü=Schü=der Lehrer steht mit seiner Schülerschaft (.) äh vor einem großen Fragezeichen, was letztendlich drankommt. Und versucht dann eben bestmöglich (.) zusammen mit den Schülern sich darauf vorzubereiten.“ (Z. 324330)

Hier wird deutlich, dass mit der Einführung der zentralen Prüfungen nicht nur neue „Aufgabentypen“ in den Klassenarbeiten Einzug gehalten haben, auf die die Schüler_innen vorbereitet werden müssen. Vielmehr kommt es für Frau Dr. Gröhlich zu einer Verschiebung der Verantwortlichkeiten und „Allianzen“ im Zuge der Standardisierung der Beurteilungen. Diese „Allianzverschiebungen“ zwischen Lehrkräften und ihren Schüler_innen heben die normalerweise herrschende Aufteilung in Prüfende und Prüflinge auf, da selbst die Lehrkräfte nicht genau wüssten, welche Aufgaben in den zentralen Prüfungen auf die Schüler_innen zukommen werden. Der ‚gemeinsame Feind‘ der zentralen Prüfung führt also vorübergehend zu einer Auflösung der tradierten Machtkonstellationen zwischen Lehrer_innen und Schüler_innen und vereint sie gegenüber dem Ungewissen. Die Vorbereitung auf den Schulabschluss wird dabei von ihr als gemeinsames Projekt der Schüler_innen und ihrer Lehrerin skizziert. Dass sie als Lehrerin nicht mehr „auf der anderen Seite steht und die Klausuren stellen muss“ (Z. 331), empfindet Frau Dr. Gröhlich als „angenehmer“, und „das ist schon netter geworden“ (Z. 332). Dieses ‚auf der anderen Seite stehen‘ wird jedoch nicht von allen Lehrkräften so positiv beurteilt, wie sich beispielweise auch im Interview mit Frau Kregel, einer Mathematiklehrerin an der Realschule, zeigt: „ZP10 ist ein ganz mächtiges Instrument. Wir warnen die Schüler, äh WEIL diese Arbeit ja wirklich fünfzig Prozent zählt und äh wir ähm persönlich ganz wenig Möglichkeiten haben da zu variieren. (.) Ähm sie darauf vorzubereiten, bereiten sie natürlich auch ganz GEZIELT darauf vor. [...] Ist natürlich ein bisschen stressig für alle Beteiligten, weil KEINER will da irgendwie (.) danebenliegen. Sei es wir Lehrer, die wir=wo wir uns natürlich auch immer wieder Gedanken machen. [lacht] Hab ich das jetzt alles richtiggemacht? Oder: Was hab‘ ich versäumt? Und: Liegt es an mir oder woran liegt es?“ (Z. 635-651)

428

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Hier wird deutlich, dass mit der oben attestierten „Allianzverschiebung“ auch die Lehrkräfte indirekt auf dem Prüfstand stehen, indem das Abschneiden der Schüler_innen immer auch auf die Vorbereitung durch die Lehrkraft zurückfällt. So werden die Schüler_innen durch die Lehrkräfte vor den zentralen Prüfungen „gewarnt“, da diese weniger Spielraum bei der Auswahl der Themen und Aufgaben haben als bei normalen Klassenarbeiten („ganz wenig Möglichkeiten haben da zu variieren“). Damit ist ein Anpassen der Aufgabenschwierigkeit an das vermutete Leistungsniveau der Klassen nicht mehr möglich und die Lehrkräfte müssen ihre Schüler_innen inhaltlich auf die gesamte Bandbreite des Kernlehrplans vorbereiten. Ein schlechtes Abschneiden der Schüler_innen in den zentralen Tests wiederum ließe auch ihre Lehrer_innen in einem schlechteren Bild dastehen. Dieser Aspekt ist insbesondere im Vergleich zu den schwedischen Lehrkräften bemerkenswert, da die Lehrkräfte in NRW im Grunde nur ‚weiche‘ Konsequenzen aus den schlechten Prüfungsergebnissen ihrer Schüler_innen zu erwarten haben. Anders sieht es bei ihren schwedischen Kolleg_innen aus, bei denen durch die leistungsbezogene Bezahlung das erfolgreiche Abschneiden der Schüler_innen durchaus auch direktere Konsequenzen haben kann (vgl. Winkler, 2013). In NRW reicht offenbar schon die Aussicht auf vergleichsweise weiche immaterielle Konsequenzen, wie das Bekanntwerden der Ergebnisse im Kolleg_innenkreis und ein damit verbundenes öffentliches Bekanntwerden ihres ‚Versagens‘, um als Kontrollinstrument auf die Unterrichtspraxis einzuwirken. Wie eingangs bei Herrn Grabenmüller deutlich wurde, bieten die zentralen Elemente der schulischen Leistungsbeurteilung in NRW (Lernstandserhebungen, zentrale Prüfungen) den Lehrkräften aber auch zahlreiche Abgrenzungsmöglichkeiten, indem sie die Art der Aufgaben und Fragestellungen, die Angemessenheit, das Schwierigkeitsniveau und ähnliches kritisieren und von ihrer eigenen Beurteilungspraxis abgrenzen können. Sollten ihre Schüler_innen ein schlechtes Ergebnis erhalten, können dafür die als unpassend oder ungenau qualifizierten Instrumente verantwortlich gemacht werden.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

429

Länderübergreifender Vergleich und institutionelle Rahmung Im länderübergreifenden Vergleich finden sich einige Parallelen zwischen den schwedischen und nordrhein-westfälischen Lehrkräften mit einer prozedural-bürokratischen Gerechtigkeitsüberzeugung, die trotz der sehr unterschiedlichen Rahmenbedingungen auf ein ähnliches Beurteilungsverständnis zurückzuführen sind. Gleichzeitig finden sich aber auch Unterschiede – beides wird im Folgenden zusammenfassend betrachtet. Mit Blick auf die in diesem Kapitel herausgearbeitete prozeduralbürokratische Gerechtigkeitsüberzeugung wird deutlich, dass der Aspekt der Belegbarkeit einer Beurteilung in ihren Einzelschritten ein übergreifendes Motiv sowohl der schwedischen wie auch der nordrheinwestfälischen Lehrkräfte bildet. Dies wurde im Bild des „Datensammelns“ und der „Buchführung“ deutlich, mit dem im nordrheinwestfälischen Kontext eine detaillierte Dokumentation von Einzelbeurteilungen zum Zweck der rechtlichen Absicherung verbunden ist. Wie in Kapitel 5.2.2 ausgeführt, können Schüler_innen bzw. deren Eltern in NRW Beschwerden gegen Einzelnoten bei der Schulleitung einlegen bzw. Widersprüche vor dem Verwaltungsgericht gegen als Verwaltungsakte geltende Abschlusszeugnisse, Prüfungsergebnisse etc. einreichen. Insofern ist die Strategie der Datensammlung, wie sie im Interview mit Herrn Dabert oder Herrn Grabenmüller deutlich wurde, als Form der Rechenschaftslegung zu verstehen, die vor einer etwaigen Anfechtung der Beurteilungen durch Schüler_innen bzw. deren Eltern schützen soll. Gleichzeitig erfüllen sie damit ihre „Informationspflicht“ gegenüber den Schüler_innen und deren Eltern.232 Dieser deutliche Hinweis auf eine gerichtsfeste Note fehlt in den schwedischen Interviews komplett – was sich aber, wie in Kapitel 5.1.2 bereits ausgeführt, auf das vollständige Fehlen von rechtlichen Einspruchsmöglichkeiten gegen einmal getroffene Beurteilungsentscheidungen zurück232

Diese leitet sich aus SchulG NRW, §44, 2 ab. Ich gehe darauf in Kapitel 6.3.3.3 ausführlicher ein.

430

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

führen lässt.233 Trotzdem scheint es auch in Schweden einen gewissen Rechtfertigungsdruck gegenüber den Schüler_innen und deren Eltern zu geben, der mithilfe detaillierter Beurteilungsverfahren aufzufangen versucht wird. Eine Erklärung hierfür kann in der gestiegenen Anforderung an die Lehrkräfte gesehen werden ihre Beurteilungen schriftlich zu dokumentieren, dies wird von vielen Lehrkräften als zusätzliche Belastung empfunden (Skolverket, 2015a, S. 12). Insbesondere für die Unterscheidung der Noten für bestanden und nicht bestanden (die sogenannte E-FGrenze) am Ende der Klasse 9 wird diese detaillierte Dokumentation als besonders wichtig erachtet, da die Erreichung der Mindestschwelle E für einen erfolgreichen Übergang in die weiterführende Schule notwendig ist. Denkbar wäre weiterhin, dass der im Lehrplan formulierte Anspruch bei der Zeugnisnotenerstellung „alle verfügbaren Informationen“ (Lgr11, S. 18) einzubeziehen, zu einer erhöhten Dokumentation „bei JEDEM KLEINEN Schritt von Anfang“ (Fredrik, Z. 448) führt. Die möglichst kleinteilige Beurteilung und detaillierte Dokumentation von Einzelbeurteilungen kann somit als übergreifende Strategie zur Absicherung einer gerechten – und im nordrhein-westfälischen Fall auch gerichtsbaren – Beurteilung festgehalten werden. Während andere Lehrkräfte eine kleinteilige Beurteilung für diagnostische Zwecke und im Sinne einer formativen Lernprozessbegleitung anwenden, wird im Modus der prozedural-bürokratischen Gerechtigkeitsüberzeugung die Produktion möglichst vieler Daten – also die Quantität von Beurteilungen – und das belegbare Vorhalten dieser Daten zur Absicherung einer aus den Teilnoten erstellten Gesamtnote genutzt. Zentral ist der Hinweis auf standardisierte Verfahrensweisen, die durch zeitnahes Notieren von Eindrücken einen potentiellen ‚Datenverlust‘ durch fehlerhafte Erinnerung ausschließen und damit die „Fehlerquote“ und den subjektiven Faktor der Beurteilung minimieren sollen. Die deutliche Bestimmung einer gerechten Beurteilung als einer umfassenden, holistischen, dabei aber auch gleichwertigen Beurteilung (all233

Laut schwedischem Schulgesetz (Skollag, 2010:800, Kap 3, §19) sind lediglich offensichtliche Schreibfehler korrigierbar (vgl. Kap. 5.1.2).

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

431

sidig och likvärdig bedömning, vgl. Lgr11, S. 18) in den schwedischen Regularien wird von Fredrik dahingehend interpretiert, dass er versucht die fortlaufende Beurteilung im Laufe des Schuljahres mithilfe eines digitalen Beurteilungsprogramms detailliert zu dokumentieren. Dieses „Werkzeug“ ermöglicht ihm das sukzessive „Durcharbeiten“ der geforderten Lehrplanziele, die wie auf einer Checkliste abgehakt werden können und die komplexe Übersetzungsarbeit der Vorgaben auf eine fast schon mechanische Sortierarbeit reduzieren. Auch Olovsson (2015) bestätigt eine solche Tendenz zum kleinteiligen Runterbrechen der im Lehrplan aufgeführten Lernziele und anschließenden Abhaken selbiger in Form von Checklisten für Lehrkräfte der grundskola und führt dies auf eine veränderte Beurteilungspraxis durch die Lgr11-Reform zurück. Ähnliches wird im Vergleich mit anderen schwedischen Lehrkräften meines Samples deutlich, wenn sie die vorgefertigten Beurteilungsraster als hilfreiche Instrumente benennen, die eine objektive Beurteilung ermöglichen und gleichzeitig Orientierung dafür bieten, „das richtige“ zu beurteilen. Insofern wirken die detaillierten Wissensanforderungen (kunskapskrav) sich auch standardisierend auf die Beurteilungspraxis aus. Dies wird auch in einer Evaluation der Reformmaßnahmen um die Einführung neuer kriterienorientierter Lehrpläne und einer neuen Notenskala berichtet, in der von einer zunehmenden Standardisierung des Unterrichts und der Zunahme summativer Beurteilungen mithilfe vorgefertigter Matrizen gesprochen wird (vgl. Wahlström & Sundberg, 2015, S. 72–74). Der zentrale Begriff der Gleichwertigkeit (likvärdighet) von Beurteilungen wird von den schwedischen Lehrkräften mit einer prozeduralbürokratischen Gerechtigkeitsüberzeugung vor allem im Hinblick auf eine Beurteilung, die objektiv und möglichst frei von subjektiven Einflüssen stattfindet, interpretiert. Damit schließen sie an eine Begriffsverschiebung im Verständnis von likvärdighet an, die sich nach Englund (2008) seit den 1960er Jahren vollzogen hat: Während mit dem Begriff der likvärdighet früher vor allem Fragen der Gleichheit und Einheitlichkeit adressiert wurden, ziele dieser heute vor allem auf die Zielerreichung (måluppfyllelse) und Ergebnisse des Bildungsprozesses (Englund & Quennerstedt, 2008). Damit einher geht auch die Erwartung, dass

432

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

gleichwertige Schüler_innenleistungen mit der gleichen Note beurteilt werden, unabhängig davon wer die Beurteilung vornimmt (Jönsson & Thornberg, 2014, S. 388). Auch die Orientierung an den Ergebnissen der standardisierten Tests in Klasse 9 wird von diesen Lehrkräften als wichtiges Element einer gerechten Beurteilung angeführt. Gemeinsam ist den Lehrkräften der prozedural-bürokratischen Gerechtigkeitsüberzeugung in beiden Ländern wiederum, dass mit dem jeweils gewählten Beurteilungsverfahren eine Objektivierung und Entpersonalisierung der Beurteilungen angestrebt wird.234 Eine solcherart von subjektiven „Fehlerquoten“ freie Beurteilung wird als gerecht empfunden. Die schwedischen Lehrkräfte sprechen sich zudem auch für eine anonymisierte Beurteilung aus, wodurch eine noch größere Entpersonalisierung ermöglicht werden soll. Der Wunsch objektiv zu bleiben kann als Ausdruck eines Professionsverständnisses gelesen werden, nachdem persönliche Beziehungen, Gefühle und Sympathien bzw. Antipathien das professionelle Beurteilungshandeln negativ beeinflussen beziehungsweise erschweren würden. Objektivität durch Unpersönlichkeit kann dabei aus zweierlei Richtungen verstanden werden: einerseits geht es darum, die eigenen Urteile durch persönliche Befindlichkeiten beeinflussen zu lassen; andererseits sollen die Leistungen unabhängig von der zu beurteilenden Person betrachtet werden, es findet also eine Trennung der Schüler_innenleistungen von ihrer Person statt. Beurteilt werden soll lediglich die Leistung, nicht aber, ob Schüler_innen fleißig, höflich, nett, sympathisch usw. sind. Um sich vor einem solcherlei subjektiv eingefärbten Urteil zu schützen, betonen insbesondere die schwedischen Lehrkräfte in diesem Modus wie wichtig es sei ausschließlich die in den Lehrplänen beschriebenen Kriterien und Kompetenzen zu beurteilen. Teilweise äußert sich der Wunsch nach Objektivität darin, die eigentliche Beurteilungsaufgabe von den Lehrkräften auf externe Akteure zu verla-

234

Zur Objektivierung von Zensuren durch Praktiken der schulischen Leistungsbeurteilung vgl. auch Breidenstein (2011, S. 351) sowie Kalthoff und Dittrich (2016).

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

433

gern, um eine möglichst geringe Beeinflussung durch den subjektiven Faktor Lehrkraft zu ermöglichen. Im Gegensatz zu Fredrik, der das Beurteilungsprogramm explizit auch für die Transparentmachung seiner Beurteilungen und Kommunikation mit seinen Schüler_innen nutzt, verwendet Herr Dabert sein „Gerät“ zwar klassenöffentlich, die Beurteilungskriterien bleiben jedoch im Unklaren und die Ergebnisse werden den Schüler_innen nur auf Nachfrage zur Einsicht gegeben. Hier zeigt sich einerseits ein unterschiedliches Verständnis der Transparenz von Noten und den zugrundeliegenden Beurteilungskriterien, gleichzeitig wird jedoch deutlich, dass die jeweils gewählten Verfahren auch eine Vermeidung von Nachfragen bzw. Kanalisierung der Kommunikation nach sich zieht. Anders als bei der diskursivinteraktiven Gerechtigkeitsüberzeugung wird das Ausbleiben von „Diskussionen“ mit Schüler_innen als Erleichterung der Beurteilungsaufgabe und Zustimmung durch die Schüler_innen interpretiert. Gerechte Beurteilungen werden demnach nicht als etwas diskursiv Verhandelbares und interaktiv Hergestelltes verstanden, sondern als eher statischer Zustand, mit klaren Grenzen zwischen gerecht und ungerecht. Am Beispiel von Frau Dr. Gröhlich zeigt sich wiederum, wie die Transparentmachung der Beurteilungskriterien als „Orientierungspraktik“ (Meier, 2011, S. 60–75) genutzt wird, um den Schüler_innen das Erkennen der in ihrem Unterricht gültigen Leistungsnormen zu erleichtern und sich somit in ihrem Unterrichtshandeln besser darauf einstellen zu können. Gleichzeitig dienen die auf diese Weise explizierten Erwartungen Frau Dr. Gröhlich als Bestandteil einer Rechenschaftslegung gegenüber Dritten, mit der sie die Unterstellung einer „wischi-waschi-Note“ zu umgehen versucht. Sie räumt aber auch ein, dass die Verwendung der Erwartungshorizonte nur eine „Scheinobjektivität“ produzieren würde.235 Auffällig ist ebenfalls im Vergleich zur diskursiv-interaktiven Gerechtigkeitsüberzeugung, dass nur wenig Austausch im Kollegium zu Fragen der 235

Auf den wichtigen Unterschied zwischen einer auf Transparenz ausgelegten Offenlegung der Beurteilungskriterien und einer auf Nachvollziehbarkeit zielenden Auseinandersetzung mit diesen Kriterien gehe ich in Kapitel 6.3.3.3 näher ein.

434

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Leistungsbeurteilung stattfindet. Es gibt zwar punktuelle Zusammenarbeit, wie die gemeinsame Korrektur der standardisierten Tests im Fall von Fredrik, aber keine darüberhinausgehenden Diskussionen um gemeinsame Beurteilungskriterien für die alltägliche Beurteilung. Im Hinblick auf die konkreten Verfahrensweisen wird insbesondere im Vergleich von Herrn Dabert und dem schwedischen Lehrer Fredrik ein Unterschied deutlich, der sich wiederum unter Rückbezug auf die jeweiligen Vorgaben zur Leistungsbeurteilung erklären lässt: So nimmt Herr Dabert insbesondere bei der mündlichen Leistungsbeurteilung eine Umwandlung von beobachteten Schüler_innenleistungen in Punkte vor, die später in eine Note umgerechnet werden und spricht sich auch bei der Benotung von schriftlichen Arbeiten für „feste Umrechnungsschlüssel“ und Notengrenzen aus. Für Fredrik wiederum stellt eine auf Punkten und Prozentwerten basierende Benotung eine „willkürliche“ Beurteilung dar, da die Notengrenzen häufig „nach Gefühl“ gezogen würden. Für Herrn Dabert wiederum liegt die Möglichkeit der Veränderung von Notengrenzen innerhalb des „pädagogischen Spielraums“ einer Lehrkraft und stellt keine per se illegitime Beurteilungspraxis dar. Die Verwendung von Punkten in Herrn Daberts Fall entspricht allerdings, wie im Kapitel zur mathematisch-rechnerischen Gerechtigkeitsorientierung herausgearbeitet wurde, einer Grundlogik des nordrhein-westfälischen Beurteilungssystems, wohingegen die Ablehnung derselben im schwedischen Kontext auch den Regularien entspricht. Gleiches gilt für die klare Orientierung an der kriterialen Bezugsnorm der schwedischen Lehrkräfte und die teilweise unklare Vermischung von kriterialer und sozialer Bezugsnorm im nordrhein-westfälischen Kontext. Zusammenfassend lassen sich folgende Merkmale beschreiben, die übergreifend als förderlich für eine eher prozedural-bürokratische Gerechtigkeitsüberzeugung herausgearbeitet werden konnten: Im Hinblick auf das professionelle Selbstbild lässt sich eine Tendenz zur Expert_innenrolle erkennen, die einerseits mit einem großen Vertrauen in die eigene Beurteilungskompetenz einhergeht und wenig Momente des Zögerns oder Zweifelns aufzeigt. Andererseits wird eine strikte Trennung zwischen Person und Rolle betont, die auf eine möglichst entper-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

435

sonalisierte Beurteilung abzielt. In der Berufung auf die rechtlichen Rahmenbedingungen und deren Erfüllung wird insbesondere bei den nordrhein-westfälischen Lehrkräften ein Selbstbild als ‚Unterrichtsbeamte‘236 deutlich, die ihre „Dienstpflicht“ erfüllen. Das Beurteilungsverständnis zeichnet sich durch eine Orientierung an schriftlichen Arbeiten einerseits und der möglichst detaillierten Dokumentation mündlicher Leistungen andererseits aus. Eine gerechte Beurteilung wird hier vor allem durch die Zerlegung des Beurteilungsprozesses in viele kleine Einzelteile, die dann wiederum eine möglichst genaue und objektive Beurteilung ermöglichen sollen. Hinsichtlich externer standardisierter Instrumente der Leistungsbeurteilung findet sich in Schweden eine positive Einschätzung dieser als Hilfsmittel und Orientierung für die eigene Beurteilung, die nordrhein-westfälischen Lehrkräfte stehen diesen eher ambivalent bis skeptisch gegenüber. Hinsichtlich der Beziehungskonstellationen wird ein eher distanziertes Verhältnis zwischen Lehrkräften und Schüler_innen bevorzugt, das insbesondere zur Vermeidung von subjektiven Faktoren wie Sympathie oder Antipathie bei der Beurteilung dient. Die detaillierten Beurteilungsund Dokumentationsverfahren dienen wiederum der Kanalisierung der Kommunikation mit bzw. Vermeidung von kritischen Nachfragen durch Schüler_innen.

236

Der Begriff des Unterrichtsbeamten geht auf eine Bezeichnung aus dem 19. Jahrhundert zurück (vgl. Tenorth, 2003).

436

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

6.3.3 Diskursiv-interaktive Gerechtigkeitsüberzeugung Bei der diskursiv-interaktiven Gerechtigkeitsüberzeugung steht die Herstellung eines Konsenses über den Beurteilungsprozess und das Beurteilungsergebnis zwischen den beteiligten Akteur_innen im Vordergrund. Dies kann in Form von Feedback- oder Benotungsgesprächen zwischen Lehrkräften und ihren Schüler_innen geschehen bzw. in kollegialen Beratungen innerhalb des Kollegiums. Eine als gerecht empfundene Leistungsbeurteilung wird also über die Kommunikation mit den am jeweiligen Beurteilungsprozess beteiligten Akteuren diskursiv hergestellt. Der Fokus liegt dabei weniger auf strikt einzuhaltenden Regelungen oder Verfahrensweisen, wie dies im Modus der prozedural-bürokratischen Gerechtigkeitsüberzeugungen der Fall ist, sondern stärker auf der diskursiven Herstellung und kollektiven Absicherung des Beurteilungsprozesses und -ergebnisses. Indem die Beurteilungsverfahren und deren Ergebnisse kommunikativ verhandelt werden, erfolgt eine Legitimierung und diskursive Validierung der Beurteilungen. Bestimmendes Element der diskursiven Aushandlung ist die Deutung von ‚Leistung‘ und damit verbunden das Interpretieren und Aushandeln der ‚richtigen‘ Deutung. Natürlich finden derlei Deutungen immer statt, wenn Lehrkräfte das von den Schüler_innen im Unterricht Gezeigte als Leistung beurteilen. Im Modus der diskursiv-interaktiven Gerechtigkeitsüberzeugung werden allerdings diskursive Aushandlungen von den Lehrkräften explizit als Instrumente zur Herstellung einer in ihren Augen gerechten Beurteilung benannt und die Deutung von Leistung geschieht im Austausch mit anderen. Die diskursiv-interaktiven Aushandlungen zwischen Lehrer_innen und Schüler_innen sowie zwischen Lehrkräften und ihren Kolleg_innen und der Schulleitung können zu unterschiedlichen Zeitpunkten im Beurteilungsprozess stattfinden: vor, während und im Anschluss an die eigentliche Beurteilung der Schüler_innenleistungen. Die diskursive Rahmung der Leistungsbeurteilung vor der eigentlichen Beurteilung dient dabei der Offenlegung der Lernziele und Beurteilungskriterien für den jeweiligen Lernabschnitt und der Herstellung eines trag-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

437

fähigen Arbeitsbündnisses zwischen Lehrkraft und Schüler_innen. Dies kann zum Beispiel anhand von Arbeitsblättern oder Präsentationen bzw. Tafelbildern geschehen. Der Fokus liegt dabei auf der Absicherung eines gemeinsamen, geteilten Verständnisses der Beurteilungskriterien noch bevor der Lernabschnitt begonnen wurde – verbunden mit der Hoffnung, dass dieses geteilte Verständnis zu einer erhöhten Nachvollziehbarkeit und damit auch Akzeptanz der Beurteilungen führt. Bezogen auf die diskursive Aushandlung im Kollegium finden sich hier Momente der gemeinsamen Planung von Unterrichtsreihen sowie darauf abgestimmter Beurteilungsformen. Während des Lernprozesses im Unterricht kann die diskursive Aushandlung in Form von kontinuierlichen, wenig formalisierten Feedbackgesprächen zwischen Lehrkraft und einzelnen Schüler_innen stattfinden. Eine weitere Möglichkeit stellen Peer- und Selbstbeurteilungsformate dar, die systematisch in den Lern- und Beurteilungsprozess eingebaut werden. Auch hier geht es um das Absichern eines geteilten Verständnisses über den Lernstand der individuellen Schüler_innen und daraus folgender Beurteilungen mit dem Ziel einer erhöhten Nachvollziehbarkeit und Akzeptanz derselben. Durch die aktive Beteiligung der Schüler_innen wird ihnen – aus Sicht der befragten Lehrkräfte – eine Mitwirkungsgelegenheit gegeben, die zu einem bewussteren Lernprozess auf Seiten der Schüler_innen führen soll. Wie gezeigt werden kann, oszillieren die von den Lehrkräften berichteten Strategien zwischen erweiterten Partizipationsmöglichkeiten für die Schüler_innen, institutionalisierten Formalisierungen und dem Anspruch nach objektiver(er) Beurteilung der schulischen Leistungen der Schüler_innen. Durch gemeinsames Unterrichten ergeben sich auch zwischen Lehrkräften und ihren Kolleg_innen diskursiv-interaktive Aushandlungsprozesse hinsichtlich der Einschätzung einer Schüler_innenleistung. Aber auch das punktuelle Abgleichen schriftlicher Arbeiten bzw. das Einholen eines ‚zweiten Blicks‘ durch Kolleg_innen zählen hierzu. Mit diskursiv-interaktiv hergestellter Gerechtigkeit im Anschluss an die eigentliche Beurteilung sind die vor allem in NRW üblichen Gespräche zu festgelegten Zeitpunkten über bereits gesetzte (Zeugnis-)Zensuren ge-

438

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

meint. In diesen Gesprächen findet eine retrospektive Legitimierung der Notengebung statt, d.h. die Lehrkräfte suchen erst nachdem die Note bereits festgesetzt ist das Gespräch mit den Schüler_innen. Bei diesen Gesprächen wird deutlich, dass die Schüler_innen mehr oder weniger durch die Lehrkraft über ihren Lernstand in Form von Zensuren informiert werden – ohne tatsächlich noch Einfluss auf die Zensurengebung zu haben. Ein Beispiel hierfür ist die Praxis der Verkündung der Quartalsoder Halbjahresabschlussnoten in NRW. Die in den beiden vorhergehenden Abschnitten skizzierten Formen diskursiver Aushandlung sind hier auf ein Minimum begrenzt und dienen vor allem der ritualisierten Rechtfertigung durch mündliche Offenlegung auf Seiten der Lehrkräfte. Gegenüber dem Kollegium und vor allem der Schulleitung tritt vor allem im Zuge der Zeugnisnotenerstellung ein Moment diskursiv-interaktiver Aushandlung auf. Im Folgenden werden die verschiedenen Varianten diskursiv-interaktiv hergestellter Gerechtigkeit bei der Leistungsbeurteilung wiederum ausführlich anhand eines nordrheinwestfälischen Falles – Frau AhleDemmerer – und zweier schwedischer Lehrerinnen, die im Team unterrichten – Barbro und Christina – exemplarisch dargestellt. Anschließend folgt wie bereits zuvor die jeweils fallübergreifende Diskussion innerhalb des nordrhein-westfälischen respektive schwedischen Samples, um anschließend im länderübergreifenden Vergleich zentrale Aspekte der diskursiv-interaktiven Gerechtigkeitsüberzeugungen vor dem Hintergrund der institutionellen Rahmungen zu diskutieren. 6.3.3.1 Frau Ahle-Demmerer – „Entscheidungen mit einer Klasse zusammen treffen“ Frau Ahle-Demmerer ist zum Zeitpunkt des Interviews 38 Jahre alt und seit gut 10 Jahren im Schuldienst. Ursprünglich studierte sie auf Gymnasiallehramt, unterrichtet nun aber u.a. die Fächer Deutsch und Englisch an einer Hauptschule. Das Interview fand in ihrem Klassenzimmer statt, wodurch sie einerseits angeregt wurde sehr detailliert von einzelnen Schüler_innen ihrer Klasse zu erzählen; andererseits wurde das Ge-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

439

spräch mehrfach unterbrochen, da die Schüler_innen in ihren Klassenraum hineinkommen wollten und von der Lehrerin wieder hinausgeschickt wurden. Die Interviewnotizen zu diesen Interaktionen flossen ebenfalls in die Auswertung ein. Die Grundlage für eine diskursiv ausgehandelte gerechte Beurteilung stellt für Frau Ahle-Demmerer das buchstäbliche Offenlegen ihrer Beurteilungsgrundlage dar: „Ich bin=ich bin eine Lehrerin, die hat ihr Zensurenbuch immer hier offen liegen“ (Z. 62). Während andere Lehrkräfte des Samples die Beurteilungen im Laufe des Schuljahres in eigens angelegten Notizbüchern oder ihrem Pocketcomputer festhalten, die von den Schüler_innen häufig nur auf Nachfrage eingesehen werden können, hat sich Frau Ahle-Demmerer dafür entschieden, das Klassenbuch (hier Zensurenbuch genannt) für diesen Zweck zu verwenden und dieses Klassenbuch immer offen und aufgeschlagen auf dem Lehrerpult liegen zu haben. Den Schüler_innen ist es ausdrücklich erlaubt während der Pausen die eingetragenen Informationen (Noten, Fehlzeiten, weitere Notizen) nachzulesen. Nachfragen oder Irritationen, die aus diesem Einblick ins Klassenbuch entstehen, „begrüße“ (Z. 46) Frau Ahle-Demmerer, da sie ihr die Gelegenheit zur Erklärung der Noten gäben (Z. 64-66). Stolz berichtet sie, dass die Schüler_innen die Situation nicht zu ihren Gunsten ausnutzen würden, beispielsweise indem sie die Eintragungen manipulierten („es ist noch nie was raus getrennt, geschnitten oder irgendwie vernichtet worden“, Z. 66-67). Ihr Grundsatz „transparent und offen sein“ (Z. 68) bezieht sich damit zunächst auf die grundsätzliche Offenlegung ihrer Beurteilungen, aber auch auf die jederzeit mögliche Klärung von Nachfragen seitens der Schüler_innen. Durch das leicht zugängliche Klassenbuch werden die Noten der einzelnen Schüler_innen so auch für die Klassenöffentlichkeit einsichtig, die Schüler_innen können also auch direkt untereinander vergleichen, wie sie im Verhältnis zu anderen Schüler_innen stehen. Der Aspekt der klassenöffentlichen Transparenz der Noten spielt dabei für die Herstellung einer von allen Schüler_innen geteilten – und damit gerechten – Beurteilung eine zentrale Rolle für Frau Ahle-Demmerers Gerechtigkeitsverständnis.

440

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

„demokratisches Recht auf eine faire Leistungsbewertung“ Das demokratiepädagogische Konzept des Klassenrats237 stellt ein partizipatives Grundelement des Unterrichtsalltags in Frau Ahle-Demmerers Erzählungen dar. Der Klassenrat ist ein regelmäßig stattfindendes Treffen der Schüler_innen mit ihrer Klassenlehrerin, wobei das Treffen auch spontan von der Lehrkraft oder den Schüler_innen einberufen werden kann. Der Klassenrat dient dem regelmäßigen Austausch über organisatorische Fragen, aber auch als Forum für die gemeinsame Bearbeitung von Konflikten, die Äußerung von Kritik und die Explikation geteilter Absprachen und Regeln. Da in diesem Rahmen häufiger auch Fragen der schulischen Leistungsbeurteilung verhandelt werden, stellt der Klassenrat als Partizipationsstruktur und Interaktionsmoment einen zentralen Bestandteil von Beurteilungsgerechtigkeit aus Frau Ahle-Demmerers Perspektive dar, wie im folgenden Auszug deutlich wird: „Wenn einer sich ungerecht hier behandelt fühlt, kann er jeden ansprechen, kann aber auch sagen: ‚Ich glaube, Frau Ahle-Demmerer wird mir mit ihrer Benotung nicht gerecht. Ich gehe zu Frau [Kollegin A].‘ (.) Also, da muss ich einfach mit rechnen. Ich kann nicht erwarten, dass von meinen 22 Schülerinnen und Schülern mich alle lieben. Das geht nicht. Dann (.) sollte ich mich irgendwo einweisen lassen. (.) Aber das Recht zu haben auch den Mund aufzumachen ist mir ganz wichtig, und nicht die Angst zu haben: ‚Die Konsequenz heißt, ich beschwere mich und kriege sofort die Fünf.‘ Also das darf es bei einem Lehrer nie passieren. Ich will auch nicht sagen, dass ich super gerecht bin. Also, ich hab aber meinen Schülern d=das Recht gegeben, sich zu beschweren. Und sich im Klassenrat damit auseinander zu setzen. Was nicht immer einfach ist. Da muss man auch mal drei=viermal schlucken. Aber (.) es ist deren Recht. Ihr demokratisches Recht auf eine faire Leistungsbewertung. Was nicht einfach ist.“ (Z. 144-154)

237

Ursprünglich geht das Konzept des Klassenrats (in der Grundschule häufig auch als Morgenkreis institutionalisiert) auf reformpädagogische Ideen zurück (vgl. Freinet, 1979). Für einen Überblick über seine Bedeutung im Rahmen demokratiepädagogischer Überlegungen vgl. Edelstein (2010); sowie aus schulpädagogischer Perspektive de Boer (2006) und Friedrichs (2004).

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

441

Im Gegensatz zu anderen bisher porträtierten Lehrkräften des nordrhein-westfälischen Samples bedeutet die Einbeziehung der Schüler_innen bei Fragen der Leistungsbeurteilung für Frau Ahle-Demmerer nicht nur eine lästige Pflicht, die sich aus dem Schulgesetz ergibt. Vielmehr drückt sich darin ein weitreichender Anspruch an die Sozialisationsaufgabe der Institution Schule aus, wenn sie davon spricht die Schüler_innen hätten ein „demokratisches Recht auf eine faire Leistungsbewertung“. Zu diesem demokratischen Recht gehöre es auch, dass die Schüler_innen das Recht haben „den Mund aufzumachen“ und „sich zu beschweren“, wenn sie etwas als ungerecht erleben. Dazu gehört auch, dass sie selbst als Lehrkraft keinen Anspruch auf eine ‚absolute‘ Gerechtigkeit bei der Leistungsbeurteilung erhebt („ich will auch nicht sagen, dass ich super gerecht bin“), sondern vielmehr ihre Beurteilungen auch zur Diskussion stellt und mögliche Irrtümer einräumt. Als zentral dafür wird eine Gesprächskultur skizziert, in der die Schüler_innen angstfrei Kritik an der Beurteilung äußern können und in ihrer Kritik ernst genommen werden. Dass diese offene Haltung gegenüber der Kritik der Schüler_innen teilweise auch schwerfällt, drückt sich in der Formulierung „was nicht immer einfach ist. Da muss man auch mal drei=viermal schlucken“ aus. Dennoch schließt sie die Episode mit dem Hinweis darauf, dass genau dieses Infragestellen der Beurteilungen das Recht der Schüler_innen sei. Wie später noch gezeigt wird, finden Auseinandersetzungen über als unfair erlebte Noten nicht nur zwischen der Lehrerin und ihren Schüler_innen statt, vielmehr werden auch einzelne Beurteilungen anderer Lehrkräfte von der Lerngruppe diskutiert und hinterfragt, wenn diese beispielsweise eine Schülerin bevorteilen würden. Die Feststellung „Da muss man auch mal drei=viermal schlucken“ bezieht sich damit sowohl auf die Schüler_innen als auch die Lehrkraft. Frau Ahle-Demmerer verweist auch auf den „gesetzlich[en] Anspruch“ (Z. 336) der Schüler_innen, jederzeit über den eigenen Leistungsstand informiert zu werden. Dieser Anspruch würde von manchen Lehrkräften „abgewehrt“, was sie folgendermaßen kommentiert: „Und das finde ich FALSCH. Also ich möchte ja auch von anderen wissen, wie komme ich bei dir an? Das ist völlig normal. Und nur beim Pult endet es dann?“ (Z. 338-

442

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

340). Für Frau Ahle-Demmerer ist eine offene Kommunikation über die Beurteilungen und die Einsicht in die vergebenen Noten Teil einer Feedbackkultur, die den Schüler_innen eine Orientierung bieten soll. Insofern stellen Nachfragen der Schüler_innen für sie keine potentielle Infragestellung ihrer Beurteilungen (und in der Verlängerung ihrer professionellen Urteilskraft) dar, wie dies im Kapitel zur prozedural-bürokratischen Gerechtigkeitsüberzeugung ausgeführt wurde. Vielmehr bestärkt der gesetzliche Informationsanspruch der Schüler_innen die oben beschriebene Haltung eines „demokratischen Rechts auf eine faire Leistungsbewertung“. Deutlich wird hier auch schon die zentrale Bedeutung einer guten Beziehung zu ihren Schüler_innen für eine gerechte Beurteilung in Frau AhleDemmerers Perspektive. Die Schüler_innen sollen in ihren Anliegen ernst genommen werden, auch wenn dies z.B. bedeutet, dass Schüler_innen die Klasse (und damit die Klassenlehrerin) wechseln würden („Ich gehe zu Frau [Kollegin A]“), um eine als ungerecht erlebte Beurteilung abzuwenden. Wie im Folgenden weiter ausgeführt wird, ermöglicht Frau Ahle-Demmerer ihren Schüler_innen weitreichende Mitbestimmungs- und Teilhabemöglichkeiten, die nicht nur die konkrete Notenvergabe betreffen, sondern auch Fragen der Klassenzusammensetzung oder die Vergabe von Abschlüssen berühren.

Lehrkraft als „Berater“ Frau Ahle-Demmerer bezieht die Schüler_innen aktiv in die Leistungsbeurteilung mit ein, indem sie bei Gruppenarbeiten beispielsweise Verantwortung für ihre Lerngruppe übernehmen und „selber die Leistungen ihrer Gruppen bewerten“ (Z. 325) sollen. Die Endnote für eine solche Gruppenarbeit besteht dann zu gleichen Teilen aus der von ihr vergebenen Note und der Selbstbeurteilung der Schüler_innen. Als positiven Nebeneffekt dieser Selbstbewertungen benennt Frau Ahle-Demmerer, dass die Schüler_innen sich dabei auch gegenseitig disziplinieren würden, wodurch sich ihre Rolle als Lehrkraft ebenfalls verändere:

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

443

„Und ähm es ist auch so, dass während des Erarbeitens sich manchmal Schüler melden und sagen: ‚Frau Ahle-Demmerer, das geht hier gar nicht. XY arbeitet ABSOLUT nicht mit. Der redet die ganze Zeit mit X.‘ Dann sitzen da zwei gestandene 1,90m Jungs mit roten Köpfen und müssen sich mal kurz mit ihrer Gruppe auseinandersetzen, mit den anderen. Und dann gibt es ein paar äh Kneipensprüche hier in die Richtung, und dann ist auch Ruhe im (.) im Kontor. Das muss der Lehrer dann nicht machen. Also da geht es darum, ich habe ein Ziel, da will ich hin. Und wenn du nicht mitmachst, dann hab‘ ich das Recht das auch einzufordern. Und ich finde, das ist das Allerwichtigste. Also, dass der Lehrer sich da bewusst auch rausnimmt. Dass ich Berater bin, dass ich ähm, was die Zensuren anbelangt, die Schüler mich fragen können jederzeit.“ (Z. 328-336)

Die Einbeziehung der Schüler_innen in die Beurteilung ihrer Gruppenarbeit führt also teilweise dazu, dass Frau Ahle-Demmerer sich als Lehrkraft stark zurücknimmt und die Schüler_innen zunächst nur beobachtet. Die Schüler_innen übernehmen wiederum auch erzieherische Aufgaben, indem sie sich gegenseitig zur aktiven Mitarbeit ermahnen. In der Formulierung „das muss der Lehrer dann nicht machen“ schwingt hier auch eine gewisse Erleichterung auf Seiten der Lehrerin mit, dass diese Aufgabe (zumindest teilweise) von den Schüler_innen selbst übernommen wird. Ihre eigene Rolle beschreibt Frau Ahle-Demmerer hingegen als „Berater“, der sich „da bewusst auch rausnimmt“. Sie ist also anwesend und beobachtet die Interaktionen der Schüler_innen, steht auch als Ansprechpartnerin zur Verfügung, gleichzeitig sollen die Schüler_innen auftretende Konflikte innerhalb ihrer Lerngruppe selbst lösen. Diese Gleichzeitigkeit von Präsenz und Zurückhaltung in den Interaktionen mit ihren Schüler_innen findet sich immer wieder im Interview. Im Vergleich zu anderen Lehrkräften des Samples wird ebenfalls deutlich, dass die erzieherische Funktion, die teilweise durch die Vergabe einer ‚pädagogischen Note‘ verfolgt wird (Belohnung bzw. Bestrafung durch Noten), hier durch die Auslagerung eines Teils der Beurteilungsaufgabe an die Schüler_innen eingelöst wird. Dadurch werden auch vorherrschende

444

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

institutionelle und generationale Ordnungen aufgebrochen, die eine Rollenverschiebung erfordern – aber auch ermöglichen.238 Die Einbeziehung der Klasse in die Beurteilung einzelner Schüler_innen erfolgt auch, wenn es um die Ahndung größerer Regelverstöße geht. So berichtet Frau Ahle-Demmerer beispielsweise von einer Episode, in der eine Schülerin nachträglich ihre Fehlzeiten mit selbstgeschriebenen Entschuldigungen ausgleichen wollte (vgl. Z. 341-351), woraufhin sich andere Schüler_innen der Klasse empörten: „Nee, Frau Ahle-Demmerer, die Entschuldigungen kennen/ erkennen Sie aber nicht an, oder? Wir gehen hier zum Arzt, bezahlen sogar noch fürs Attest" (Z. 348-349). Die Klasse wurde von ihr als Kollektiv aktiv in die Konfliktlösung einbezogen („könnte die Klasse kurz erklären, was hier passiert gerade?“, Z. 344), wodurch einerseits eine Maßregelung der Schülerin auch durch ihre Peergroup erfolgte, andererseits aber auch die Regeln erneut thematisiert und ins kollektive Gedächtnis gerufen wurden. Frau Ahle-Demmerer resümiert diese Episode folgendermaßen: „die greifen dann in das Sozialverhalten mit ein. Also die F/ ich darf mich über die Noten anderer äh äußern, ich darf aber auch den=den anderen dann sagen, wenn sie sich falsch verhalten“ (Z. 349-351). Das oben eingeführte „demokratische Recht auf eine faire Leistungsbeurteilung“ umfasst damit neben dem Recht auf Einspruch und Kritik an Beurteilungen durch die Lehrkraft auch ein Anrecht auf Kritik durch die Peergroup in Bezug auf das eigene Sozialverhalten oder klare Regelverstöße. Warum der Umgang mit Fehlzeiten und die Anerkennung von Entschuldigungen eine zentrale Gerechtigkeitsfrage im Rahmen dieser Schulklasse darstellt, wird im folgenden Abschnitt noch deutlicher.

238

Nach Kiper (2008) geht auch schon die Einrichtung eines Klassenrats mit spezifischen Anforderungen an das professionelle Handeln der Lehrkräfte einher und erfordert eine eher zurückhaltende, egalitäre und beratende Lehrer_innenrolle. Dies weitet sich hier auch auf das Beurteilungshandeln der Lehrerin aus.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

445

Diskursive Aushandlung von Zeugnisnoten Auch bei der Erstellung der Zeugnisnoten findet in Frau Ahle-Demmerers Klasse teilweise eine gemeinsame Aushandlung der Beurteilungen einzelner Schüler_innen statt. Kurz vor der sogenannten Zeugniskonferenz am Ende eines Halbjahres wird von allen Fachlehrkräften die jeweilige Zeugnisnote in das Klassenbuch eingetragen, so dass Frau AhleDemmerer als Klassenlehrerin einen Überblick über die Zensuren ihrer Schüler_innen erhält. Im folgenden Beispiel geht es nun um die Zeugnisnote eines anderen Fachlehrers, der eine Schülerin in den Augen Frau Ahle-Demmerers und ihrer Klasse zu gut benotet habe, da die erhöhten Fehlzeiten der Schülerin offenbar nicht in die Halbjahresnote einbezogen wurden. Dieses Vorgehen wird als ungerecht empfunden, weshalb eine Beratung im Klassenrat stattfindet. Frau Ahle-Demmerer berichtet über diese Episode folgendermaßen: „[...] ich hab ein Mädchen bei mir, das sehr hochintelligent wirklich ist. Die/ wenn Sie mit ihr sprechen, die hat ein ganz tolles Auftreten, die ist (.) sehr präsent in der Klasse. Die kommt aber nie regelmäßig zur Schule. Aber WENN sie da ist, dann ist die sensationell. Die überstrahlt alle anderen. So. (.) Und dann kriege ICH die Zensuren und ein Kollege [...] hat ihr eine Zwei gegeben. (...) Ich bin hier in die Klasse, ich sag: ‚Klassenrat.‘ (..) Die wurde auch schon rot als ich sagte: ‚Möchtest du mal was zu deiner/ der=und=der Not=Note sagen?‘ (..) ‚Äh ja, ich war nicht so oft da. Aber wenn ich da bin/‘ ‚Ja, aber Moment‘ sagt einer, ‚wenn du nicht da bist, ist das Fünf. Holen wir mal das Klassenbuch, wollen wir das mal gegenrechnen?‘ Und dann haben die die Fehltage gegengerechnet und ihr dann auch gesagt: ‚Pass mal auf, das reicht gerade für eine Vier. (.) Wenn es hoch kommt.‘ Dann habe ich den Kollegen gesprochen: ‚Der Klassenrat hat hier da drüber getagt. Du warst leider nicht da.‘ Ähm ‚Ja‘ sagt er, ‚wenn=wenn=wenn die Klasse das so sieht. Also, wenn sie da ist, ist sie wirklich sensationell.‘ Ich sag: ‚Aber komm, hier, wir=wir müssen auch sagen, wenn du nicht da bist und unentschuldigt fehlst, ist das Fünf. Oder Sechs in dem Falle.‘ ‚Ja, ist in Ordnung.‘ Also und plötzlich hatte dieses Mädchen auf dem Zeugnis im letzten Jahr statt einer erwarteten Zwei (.) plus die Vier. Über die sich die Klasse dann:n/ einfach ihr knallhart gesagt hat: ‚So nicht!‘“ (Z. 652-668)

Zwischen Frau Ahle-Demmerer und ihren Schüler_innen scheint es klare Absprachen zu geben, dass unentschuldigtes Fehlen in einer Unterrichtsstunde zu einer schlechten Note (Fünf oder Sechs) im mündlichen Be-

446

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

reich führt. Der Lerngruppe ist diese Regelung klar, weshalb die NichtErteilung der schlechten Noten durch den anderen Lehrer Unmut hervorruft. Es wird deutlich, dass die Lerngruppe diese Regeln verinnerlicht hat und auf der Anwendung für alle Schüler_innen – ohne Ausnahmen – besteht. Auch hier zeigt sich wieder die teilweise Übernahme der erzieherischen Funktion von Beurteilungen durch die Schüler_innen, die stellvertretend für die Lehrerin in die Auseinandersetzung mit der Schülerin gehen. Auch die abschließende Formulierung, dass „die Klasse dann:n/ einfach ihr knallhart gesagt hat: ‚So nicht!‘“ zeugt von dieser geteilten Verantwortung für die Disziplinierung der Schüler_innen durch die Noten. Gleichzeitig findet sich die im nordrhein-westfälischen Sample typische Mittelwertbildung bei der Erstellung einer Zeugnisnote, also der Rückgriff auf mathematische Operationen wieder („Fehltage gegengerechnet“). Die von Frau Ahle-Demmerer angeführten Persönlichkeitsmerkmale und Verhaltensweisen der Schülerin („hochintelligent“, „ganz toll im Auftreten“, „sehr präsent“, „überstrahlt alle anderen“) werden hier nicht weiter berücksichtigt, da die Nicht-Anwesenheit im Unterricht höher gewichtet wird als ihre „sensationell[en]“ Leistungen, wenn sie am Unterricht teilnimmt. Auch gegenüber dem erwähnten Kollegen rechtfertigt Frau Ahle-Demmerer die schlechtere Zeugnisnote mit dem Hinweis darauf, dass das unentschuldigte Fehlen zu einem Absenken der Durchschnittsnote führen müsse. Sowohl in der Argumentation gegenüber der Schülerin selbst als auch gegenüber dem Kollegen wird allerdings vor allem die kollektiv geteilte Entscheidung als Legitimationshilfe genutzt und scheinbar auch von beiden akzeptiert. Die diskursiv ausgehandelten Bestandteile der Benotung (Leistung und Anwesenheit) und der dadurch hergestellte Beurteilungskonsens liefern so die Grundlage für eine als gerecht eingeschätzte Beurteilung. Frau Ahle-Demmerer weist schließlich auch darauf hin, dass die Schülerin „rot wurde“ als sie auf die Note des Fachlehrers angesprochen wurde – was von der Lehrerin als Einsicht oder Eingeständnis der Schülerin gegenüber der ungerechtfertigten Note gelesen wird. Offenbleiben muss an dieser Stelle allerdings, inwiefern diese Episode eine Besonderheit im Schulalltag ist

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

447

oder aber eine im Kollegium geteilte Handlungsoption bei der Erstellung der Zeugnisnoten in dieser Schule darstellt. Ein weiteres Beispiel für die Einbeziehung der Klassengemeinschaft in die Zeugnisnotenerstellung einzelner Schüler_innen stellt der Fall eines aus Afghanistan geflüchteten Jungen dar, der mitten im Schuljahr neu in die Klasse kam und innerhalb kürzester Zeit Deutsch gelernt hat, sodass am Ende des Schuljahres die Option auf einen Hauptschulabschluss im Klassenrat diskutiert wurde: „Und die Klasse hat entschieden, (.) auch wenn sie das eigentlich de facto nicht darf, dass wir diesem Jungen einen Hauptschulabschluss nach 9 mit der Qualifikation zur Realschule geben. Obwohl er eigentlich nur zweieinhalb Monate hier war. Und das hat auch nicht zu Aufregern geführt, GAR NICHT. Nein, wir verstehen das. Der Junge hat sensationell schnell Deutsch gelernt, der ist ein toller Mitschüler, der ist ein toller Freund. Bei dem stimmt es hinten und vorne. Da hat sich keiner hier irgendwo beschwert. Da sind auch keine Eltern aufgeschlagen, weil die Schüler das von Anfang an gewusst haben. Wir machen das jetzt und (.) wir glauben, dass das läuft.“ (Z. 85-86)

Obwohl die Schüler_innen formal gesehen kein Mitspracherecht bei einer solch weitreichenden Entscheidung haben, ist es für Frau AhleDemmerer dennoch sehr wichtig die Zustimmung der Lerngruppe einzuholen. Aus dem Material geht leider nicht hervor, wann die Beratung im Klassenrat stattfand, ob also die eigentliche Zeugnisnotenvergabe schon abgeschlossen war oder aber erst im Nachgang zu der Beratung im Klassenrat stattfand. Auch ist unklar, inwiefern die Beratung und Beschlussfassung im Klassenrat mit der Schulleitung und dem Kollegium abgesprochen war bzw. wie verbindlich eine solche Entscheidung der Lerngruppe für sie wären. Dass Frau Ahle-Demmerer diese Aspekte beim Erzählen der Episode nicht erwähnt, zeigt aber, wie wichtig für sie die Einbeziehung der Klasse und die einvernehmliche Entscheidung der Lerngruppe in dieser Frage ist. Deutlich wird zudem, dass die von der Gruppe legitimierte Entscheidung auch dazu dient, etwaigen Anfechtungen im Nachhinein (durch Schüler_innen oder deren Eltern) vorzubeugen und einen breiten Konsens herzustellen („hat sich keiner beschwert“). Diese konsensuelle Haltung wird verstärkt durch die von der Lehrerin vorgenommene Wir-

448

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Konstruktion, die sie gleich an zwei Stellen vornimmt: „wir verstehen das“ und „Wir machen das jetzt und (.) wir glauben, dass das läuft“. Hier zeigt sich, dass die gemeinsam mit der Lerngruppe ausgehandelten Beurteilungen auch ein Moment der Vergemeinschaftung darstellen, in denen die Lerngruppe als Kollektiv angesprochen wird und sich gleichzeitig als solches reproduziert. Die Lehrerin wird dadurch ebenfalls Teil dieses Kollektivs und die antagonistischen Rollen der beurteilenden Lehrkraft einerseits und der zu beurteilenden Schüler_innen andererseits für den Moment aufgelöst. Die gemeinsam durch Lehrkraft und Schüler_innen getragene Beurteilungsentscheidung wird damit auf eine breitere Legitimationsbasis gestellt und bezieht die Schüler_innen in die Beurteilungsverantwortung mit ein. Ein Anfechten der Beurteilungen wird damit deutlich schwieriger als bei einer ausschließlich von der Lehrkraft verantworteten Beurteilungsentscheidung. Als letztes wird aber auch deutlich, dass die Entscheidung zur Vergabe des Schulabschlusses an Kriterien gebunden ist, die sowohl fachliche Leistungen und Anstrengungsbereitschaft umfassen („sensationell schnell Deutsch gelernt“) als auch soziale Kompetenzen („toller Mitschüler“, „toller Freund“). Der Schulabschluss wird damit als ‚verdient‘ gerahmt, wodurch die Entscheidung zusätzlich vor der Klasse und dem Kollegium legitimiert wird. Wie wichtig die gemeinsam getragene Beurteilungsentscheidung als Grundlage einer gerechten Beurteilung für Frau Ahle-Demmerer ist, wird auch an folgendem Auszug deutlich: „Ähm (.) da haben die anderen auch gesagt: ‚Na klar, kommt der mit! Da müssen wir gar nicht drüber reden.‘ Und wenn das äh erfolgt, dass eine Klasse das mit trägt (.) dann äh finde ich ist mehr erreicht als dass ich mich da hinter Punkten verkrieche und sage: ‚Du hast jetzt eine Zwei Komma Sieben Fünf, und das ist eine Drei.‘ Das, finde ich, ist nicht in Ordnung.“ (Z. 104-107)

Die kollektive Entscheidung der Lerngruppe wird hier einer mathematischen Logik der Notenerstellung gegenübergestellt, die von ihr rigoros abgelehnt wird („nicht in Ordnung“). Die im Kapitel zur mathematischrechnerischen Gerechtigkeit bevorzugten Beurteilungsstrategien werden hier als unzulässiges „hinter Punkten verkrieche[n]“ beschrieben, gleich-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

449

zeitig wird deutlich, dass der damit zusammenhängende Grundsatz des „alle gleich“-Behandelns für Frau Ahle-Demmerer in diesem Fall weniger Gewicht hat als die individuelle Situation einzelner Schüler_innen. Im Zusammenhang mit dieser Episode spricht sie sich dann auch für eine grundsätzlich flexiblere Handhabung von Beurteilungsvorgaben in Einzelfällen aus, wenn sie fordert: „Und DA finde ich, muss Schule auch was tun und auch öffnen. Denn wir verbauen solchen jungen Menschen zum Beispiel die Chance“ (Z. 99-100). Entscheidend für eine als gerecht empfundene Note wird also weniger die Berufung auf mathematisch korrekt erstellte Noten, sondern vielmehr die von der Klassengemeinschaft getragene Entscheidung – die wiederum erst durch diskursive Aushandlungen über einzelne Schüler_innen hervorgebracht wird.

Diskursive Aushandlung von ‚Leistung‘ während des Unterrichts Diskursive Aushandlungen finden sich jedoch nicht nur in Bezug auf bereits erteilte Noten, vielmehr berichtet Frau Ahle-Demmerer von mehreren Episoden aus ihrem Unterricht, in denen deutlich wird, dass die diskursiv-interaktive Aushandlung dessen, was als Leistung von der Lehrkraft überhaupt anerkannt wird, bereits eine Frage gerechter Leistungsbeurteilung für sie darstellt. Im folgenden Ausschnitt berichtet sie von einer Unterrichtssituation, in der eine Schülerin auf eine „typische Lehrerfrage“ (Z. 222) mit einer ironischen Antwort reagiert. Für Frau AhleDemmerer ergeben sich nun verschiedene Handlungsoptionen als Lehrkraft, die auf die Anerkennung bzw. Nicht-Anerkennung einer Leistung abzielen: „Und da denke ich manchmal, [...] liegt es am Lehrer zu sagen, wie bewerte ich diese Leistung? Lache ich mit dem Mädchen darüber, weil ich weiß, sie hat vor der Klasse einen Witz gemacht? Oder (.) ähm maßregele ich sie sofort? Und ich denke, da ist das Lachen das Wichtigste. Ich kann auch eine Leistung durch ein nettes Gesicht bewerten und sagen: ‚Möp‘. Ich sage ganz oft möp, fail oder sonst was. Dann lachen wir zwar darüber, aber dann wird die Leistung auch nicht so ganz runter gedrückt, sondern das kann jedem passieren.“ (Z. 225-230)

450

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Frau Ahle-Demmerer fällt die Entscheidung zwischen einer Ermahnung und dem Zulassen von Humor als Bestandteil der Unterrichtsinteraktion leicht: „Und ich denke, da ist das Lachen das Wichtigste.“ Anknüpfend an ihr oben geschildertes Bemühen um eine angstfreie Kommunikationskultur in Bezug auf die Noten spricht sich Frau Ahle-Demmerer auch in diesem Beispiel dafür aus, die Äußerung der Schülerin nicht als Affront gegen die Lehrkraft zu interpretieren, sondern vielmehr deren Funktion im Klassenverband anzuerkennen („hat vor der Klasse einen Witz gemacht“). Gleichzeitig lässt sie die Äußerung der Schülerin nicht unkommentiert, sondern ordnet durch ihre nonverbale Reaktion („nettes Gesicht“) und den ritualisierten Kommentar („möp“) das Geschehen für die Schüler_innen als erlaubte Ausnahme ein. Das gemeinsame Lachen trägt dabei in ihren Augen auch zur Entspannung der Leistungssituation bei, in der der belustigende Kommentar der Schülerin in seiner Funktion als Belustigung anerkannt wird, gleichzeitig aber auch für die Schülerin die Möglichkeit besteht eine ernstgemeinte Antwort nachzuschieben, so dass „die Leistung auch nicht so ganz runtergedrückt“ wird. Auch durch die Kulanzeinschätzung „das kann jedem passieren“ wird hier versucht einen ‚weicheren‘ Blick auf die geschilderte Unterrichtssituation einzunehmen.239 In der Rahmung als bewusste Entscheidung der Lehrkraft („liegt es am Lehrer zu sagen, wie bewerte ich diese Leistung?“) drückt sich auch Frau Ahle-Demmerers Einschätzung des Unterrichtsgeschehens als Teil des Herstellungsprozesses von Schüler_innenleistungen aus. Diese konstruktivistische Perspektive paart sich dann wiederum mit dem Bewusstsein über die vorhandenen Gestaltungsspielräume und ihre eigene Rolle innerhalb dieses Herstellungsprozesses. Für Frau AhleDemmerer begründet sich diese Haltung zum Unterricht und der Ko-

239

Meier spricht in diesem Zusammenhang von „Kulanzpraktiken“, die jedoch vornehmlich zur Aufrechterhaltung eines Eindrucks von ‚Leistungsstärke’ angewandt werden (Meier, 2011, S. 113-121).

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

451

Konstruktion240 von Schüler_innenleistungen durch die Lehrkraft auch in der Spezifik der Hauptschule, wie im Folgenden deutlich wird: „Also (.) die Schüler sitzen dann manchmal auch da und sagen: ‚Ich weiß nicht, wie ich es sagen soll.‘ Ich sage: ‚Gibt es denn hier jemanden, der helfen kann?‘ und ähm/ und die Leistung bleibt trotzdem beim Schüler. Also solche Dinge braucht Hauptschule. Oder braucht dieses Milieu. Bestätigung.“ (Z. 230-233)

Durch das Öffnen der Aufgabenbearbeitung für die gesamte Klasse bezieht Frau Ahle-Demmerer im Beispiel die Lerngruppe als Kollektiv in die Leistungserbringung mit ein. Mit der Frage, ob jemand „helfen kann“ wird zudem signalisiert, dass die Lerngruppe als zusätzliche Unterstützung zugelassen, die Aufgabe aber nicht vollständig vom ursprünglich adressierten Schüler abgezogen wird. Vielmehr betont sie: „die Leistung bleibt trotzdem beim Schüler“. Indem Frau Ahle-Demmerer nicht auf der alleinigen Beantwortung der Frage durch den adressierten Schüler beharrt, sondern die Lerngruppe als Unterstützung einbezieht, eröffnet sie dem Schüler in diesem Beispiel eine Möglichkeit sich trotz anfänglichen Schwierigkeiten als ‚leistungsfähiger‘ Schüler zu präsentieren. Wie im Kapitel zur kompensatorischen Gerechtigkeitsüberzeugung deutlich werden wird, finden sich diese Momente des ‚Möglichkeiten Bietens‘ durch das punktuelle Anpassen der Anforderungen und die Nutzung diverser Hilfsmittel vor allem bei Haupt- und Realschullehrkräften im nordrhein-westfälischen Sample. Und auch Frau Ahle-Demmerer begründet diese Kulanzregelung mit dem Hinweis auf die spezifische Situation des Unterrichtens in einer Hauptschulklasse und die spezifischen Bedürfnisse „dieses Milieu[s]“. Mit dem Begriff des Milieus kann dabei sowohl die sozioökonomische Herkunft ihrer Schüler_innen gemeint sein, als auch Zuschreibungen hinsichtlich eines spezifischen Lern- und Leistungsniveaus, die ein besonderes Eingehen auf die Schüler_innen 240

Mit dem Begriff der Ko-Konstruktion schließe ich an dieser Stelle an Überlegungen von Reußer an, der unterstreicht: „The basis of personal development and enculturation […] is not the socially isolated construction of knowledge, but its co-construction in a social and cultural space“ (Reusser, 2004, S. 2058; vgl. auch Kap. 2.1.5)

452

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

erforderlich machen würden. Für Frau Ahle-Demmerer dient die oben geschilderte Öffnung der Aufgabenbearbeitung und gegenseitige solidarische Unterstützung der Schüler_innen in der Leistungserbringung der „Bestätigung“ der Schüler_innen. Damit ist eine Ermunterung der Schüler_innen gemeint, sich bei Schwierigkeiten im Lernprozess nicht entmutigen zu lassen und es weiterhin zu versuchen – was, laut Frau AhleDemmerer, insbesondere bei Hauptschüler_innen notwendig sei und sich auch auf eine gerechte Leistungsbeurteilung auswirke, wie im nächsten Abschnitt ausgeführt wird.

„Bewertungen von der Lerngruppe her“ Frau Ahle-Demmerer führt an mehreren Stellen des Interviews aus, dass eine gerechte Beurteilung immer die Spezifik der jeweiligen Lerngruppe einbeziehen müsse. Dies ergebe sich vor allem durch die große Heterogenität der Schüler_innen, die insbesondere an Hauptschulen vorliege und differenzierte Beurteilungsmaßstäbe erfordere: „Ähm (.) ich bewerte von der Lerngruppe her. Also (.) ich weiß, dass ich in meiner Klasse Schüler habe, die hoch intelligent sind. Ich habe in meiner Klasse aber genauso gut Schüler, die lernbehindert sind. (.) Und da einen Maßstab zu finden, der richtig ist, wird schwer und trotzdem versteht es eine Lerngruppe.“ (Z. 68-71)

Obwohl der Begriff der „Lerngruppe“ zunächst eine eher kollektive Ansprache der Schüler_innen als Einheit suggeriert, wird am obigen Auszug deutlich, dass damit vor allem eine gewisse Sensibilität gegenüber den individuellen Unterschieden der Schüler_innen innerhalb einer Klasse gemeint ist. Für Frau Ahle-Demmerer entspannt sich das Leistungsspektrum ihrer Klasse zwischen „hoch intelligent[en]“ und „lernbehindert[en]“241 Schüler_innen als den zwei Extrempolen der leistungs241

Der Begriff der ‚Lernbehinderung‘ findet sich trotz Kritik (vgl. Pfahl, 2011) nach wie vor in der deutschsprachigen Erziehungswissenschaft sowie im (schul-)pädagogischen Diskurs. Gemeint sind damit häufig Lernschwierigkeiten und/oder kognitive Beeinträch-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

453

zentrierten Klassifizierung, denen sie gleichermaßen versucht gerecht zu werden. Die Schwierigkeit einen „Maßstab“ für die Beurteilung dieser so unterschiedlichen Schüler_innen zu finden, stellt die große Herausforderung bei der Herstellung einer gerechten Leistungsbeurteilung für Frau Ahle-Demmerer dar. Die individuelle Bezugsnorm wird dabei – wie in den folgenden Beispielen noch deutlicher wird – von ihr als geeignete Beurteilungsgrundlage präferiert. Gleichzeitig ist es für die Lehrerin wichtig, dass die daraus resultierende unterschiedliche Beurteilung von Schüler_innen von allen Beteiligten verstanden (und damit legitimiert) wird. Die Orientierung an der individuellen Bezugsnorm erfordert damit einen erhöhten Kommunikationsbedarf mit allen Schüler_innen, um die individuellen Beurteilungen intersubjektiv nachvollziehbar zu gestalten. Im Folgenden wird am Beispiel einer schriftlichen Leistungskontrolle verdeutlicht, wie diese individuelle Aushandlung auch bei zunächst für alle Schüler_innen gültigen Bepunktungsvorgaben ermöglicht wird. Frau Ahle-Demmerer erläutert, dass sie bei schriftlichen Leistungskontrollen und Klassenarbeiten immer bereits vor der Arbeit einen Erwartungshorizont erstelle und die zu erreichenden Punkte pro Aufgabe auf dem Aufgabenblatt für die Schüler_innen sichtbar einträgt. Dass die vorab festgelegten Punktzahlen jedoch nicht immer verbindlich gehandhabt werden, zeigt sich im weiteren Verlauf der Episode: „Und unsere Schüler können bei der Arbeit schon ganz genau sehen, wo es hingeht. Also, die sehen schon unten drunter, ah, passt oder passt nicht. Oder sagen auch: ‚Frau Ahle-Demmerer, ich habe gesehen, das sind fünf Punkte. Ich kriege das echt nicht hin. Aber ich habe doch noch eine Chance?‘ Oder: ‚Kann ich noch Zusatz machen?‘ Zusatz heißt, ich habe vorher was gelernt, das wird jetzt nicht abgefragt, aber da würde ich keinem Schüler verbieten: Schreib es nicht auf. Das ist ja auch blöd, ne? Wir sind hier kein Gymnasium. Gymnasium würde sagen: Vier a) nicht richtig beantwortet, Pech gehabt. Null Punkte. Aber die Kreativität zu unterstützen und den=di=diese Eigendynamik ‚Ich habe gelernt und ich stehe gerade neben der Spur‘/ Und viele Kinder haben ja auch solche äh Defizite. Äh dann muss ich das auch an=anerkennen und sagen: ‚Du dann mach das. Aber du weißt, fünf Punkte ist dann tigungen von Schüler_innen, die eine sonderpädagogische Förderung notwendig machen würden. Ich verwende diesen Begriff hier bewusst nur als Zitat der Lehrerin.

454

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

bisschen viel, aber zwei können wir noch/‘ ‚Ja, super.‘ So. Sonst gebe ich bei Aufgabe drei schon auf, wenn es zwölf geben würde, theoretisch. Also (.) das is:st (.) ist einfach nicht vertretbar. Und deswegen haben wir jetzt entschlossen (.) ähm wir werden Bewertungen von der Lerngruppe her treffen.“ (Z. 263-275)

Hier wird deutlich, dass der klar kommunizierte Erwartungshorizont zunächst als Orientierung für die Schüler_innen dient („sehen, wo es hingeht“). Gleichzeitig wird ihnen auch ermöglicht, ihre Leistungen noch während der Klassenarbeit zu ergänzen, indem sie zusätzliches Wissen, das nicht abgefragt wurde, ebenfalls aufschreiben und dafür Zusatzpunkte erhalten können. Wie viele Punkte es für diese Zusatzleistungen gibt, wird im Beispiel scheinbar individuell zwischen Lehrkraft und Schüler_in ausgehandelt. Die Option des „Zusatz“-Machens wird allerdings so definiert, dass die Vermutung naheliegt, dass diese Option eine in der Lerngruppe bekannte Möglichkeit und regelmäßiger Bestandteil schriftlicher Arbeiten ist. „Zusatz“-Machen ist damit eine Option, die nicht nur denjenigen Schüler_innen offensteht, die danach fragen – allerdings müssen die Schüler_innen zunächst selbst erkennen, wo ihre Defizite liegen und was mögliche Zusatzleistungen zum Ausgleich dieser sein könnten. Inwiefern dies allen Schüler_innen gleichermaßen möglich ist, muss an dieser Stelle offenbleiben. Deutlich wird jedoch, dass die Anwendung von Zusatzpunkten hier im kompletten Gegensatz zu der in Kapitel 6.3.1 ausgeführten Praxis einiger Lehrkräfte steht, die bei der Korrektur schriftlicher Arbeiten durch nachträgliches Addieren von Zusatzpunkten am Durchschnitt der Klassenarbeit arbeiten, um ein in ihren Augen „anständig[es]“, d.h. erwartungskonform und normalverteiltes Klausurergebnis zu produzieren (vgl. Frau Ehrl im Kap. 6.3.1.1). Begründet wird die Möglichkeit der flexiblen Erweiterung des abgefragten Wissens von Frau Ahle-Demmerer wiederum mit der Besonderheit der Hauptschule und den spezifischen Lernvoraussetzungen ihrer Schüler_innen. Mit dem Hinweis „viele Kinder haben ja auch solche äh Defizite“ charakterisiert sie die Schüler_innen ihrer Schule als weniger leistungsstark und die Möglichkeit des „Zusatz“-Machens als motivierende Unterstützung dieser Schüler_innen in ihrem Lernprozess. Als Gegenhorizont führt sie das Gymnasium an, mit dem Hinweis, dass eine Kulanz-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

455

praktik, wie die oben geschilderte, dort so nicht möglich wäre. Hier zeigen sich deutliche schulformspezifische Unterschiede in der Leistungskonstruktion durch die Lehrkraft: während am Gymnasium nur die richtigen Antworten als Leistung gelten würden, zählten an der Hauptschule auch zusätzliche Kriterien wie „Kreativität“ und „Eigendynamik“ in die schriftliche Leistung hinein. Auch die Motivation der Schüler_innen bzw. das Abschwächen von demotivierenden Erfahrungen wird von ihr abschließend als Begründung für eine im Kollegium geteilte „Bewertung von der Lerngruppe her“ aufgeführt. Diese im Kollegium geteilte Haltung zeigt sich ebenfalls an verschiedenen Stellen des Interviews. Dabei wird auch deutlich, dass die Orientierung an der Lerngruppe teilweise auch ein Abweichen von den bestehenden Richtlinien legitimiert: „Denn, den Erwartungshorizont auch für Arbeiten festzulegen, ist teilweise recht schwierig. Und da haben wir hier andere Wege gefunden, weil wir auch einfach sagen, äh die=das Ziel muss es nicht sein vor einem gesetzlich vertretbaren Hintergrund zu argumentieren, sondern vor der Sozialform, vor der Gruppe, vor der Klasse an sich. Und dahin erst mal zu kommen, ist ein langer Weg. Also den Lehrer da f/ äh nur als Experten zu nehmen für eine Lerngruppe. Das ist hier zum Beispiel (.) entscheidend an der Schule. (.) Und nicht was mir die äh Richtlinien vorschreiben.“ (Z. 31-37)

Die Lehrkraft als „Experten [...] für eine Lerngruppe“ wird damit zum Sinnbild des an dieser Schule vertretenen idealen Lehrer_innenbild. Die von Frau Ahle-Demmerer oben geschilderte Kulanzpraktik des „Zusatz“Machens kann daher als eingebettet in die kollegial geteilten Beurteilungsüberzeugungen verstanden werden. „Zusatz“-Machen ist dabei nur eine mögliche Variante des „andere Wege“-Findens, dem sich das Kollegium Frau Ahle-Demmerer zufolge verschrieben hat. In der Abgrenzung zu einem „gesetzlich vertretbaren Hintergrund“ wird jedoch auch deutlich, dass die Lehrer_innen sich hier bewusst darüber sind, dass im Einzelfall auch gegen die offiziellen Vorgaben verstoßen werden kann (vielleicht sogar muss), um eine in ihren Augen gerechte Beurteilung zu ermöglichen. Ein zu strenges Einhalten der Vorgaben würde demnach eher als Benachteiligung der Schüler_innen verstanden, das punktuelle Um-

456

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

gehen der Vorgaben hingegen scheint legitim, solange damit ungleiche Chancen der Schüler_innen ausgeglichen werden können. Im Bild der Lehrkraft als „Experten […] für eine Lerngruppe“ wird auch deutlich, dass eine gerechte Beurteilung neben einer engen Beziehung zwischen Lehrkraft und Schüler_innen auch mit größeren Entscheidungsfreiräumen einhergeht, die von diesen „Experten“ genutzt werden können. Ein Beispiel für diese professionellen Entscheidungsspielräume stellt die konkrete Ausgestaltung der Unterrichtsstunden dar. So hat sich beispielsweise das Fachkollegium Deutsch der Schule darauf verständigt, welche im Kernlehrplan vorgesehenen Textsorten in den jeweiligen Klassenstufen behandelt werden sollen, die Entscheidung welche Texte genau behandelt werden, tirfft jede Lehrkraft individuell: „Ähm das heißt, ähm wir werden NICHT verabreden, was man machen MUSS. Sondern wir verabreden immer, was man machen KANN“ (Z. 276-277). Frau AhleDemmerer berichtet nun, dass sie diese Freiheit auch dazu nutzt, mit ihren Schüler_innen teilweise anspruchsvollere Lektüren zu bearbeiten, als dies für Hauptschüler_innen vorgesehen ist: „Oder Scott O‘Dell ‚Insel der blauen Delfine‘. Haben die im Original gelesen, mit der Mappe, die auch im Gymnasium bearbeitet wird. Und das interessante ist, sie können auch die Leistung erbringen. Man muss ihnen nur nicht sagen: ‚Pass mal auf, das ist fürs Gymnasium.‘ Dann sagen die sofort: ‚Nee, das kriegen wir nicht hin.‘ Dann sitzen die manchmal bei einer Aufgabenstellung: ‚Ist aber schon schwer, ne? Sie haben aber nicht vergessen, dass wir hier Hauptschule sind?‘ Und dann sage ich immer: ‚Nee, ist eigentlich für Hauptschule.‘ ‚Ja gut, dann/‘“ (Z. 294-299)

Auch hier wird die schulformspezifische Leistungskonstruktion deutlich, die sich in den impliziten Fähigkeitsselbstbildern der Schüler_innen äußert: die Nachfragen der Schüler_innen deuten auf ein Selbstbild als leistungsschwächere Schüler_innen hin, deren Leistungsaspirationen an dieses schwächere Fähigkeitsselbstbild angepasst werden. Die Lehrerin versucht nun, diese schulformspezifischen Selbstpositionierungen als ‚leistungsschwache‘ Hauptschüler_innen nicht zu bedienen, indem sie ihnen nicht sagt, dass die verwendeten Unterrichtsmaterialien für eine andere Schulform gedacht sind und resümiert stolz „das interessante ist, sie können auch die Leistung erbringen“. Damit legitimiert sie das offene

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

457

Anlügen der Schüler_innen hinsichtlich des Anforderungsniveaus der Materialien mit der Begründung, dass die Schüler_innen auf diese Weise nicht entmutigt würden, bevor sie mit einer Aufgabe begonnen haben. „Experten [...] für eine Lerngruppe“ zu sein, bedeutet hier also auch, die potenzielle Leistungsfähigkeit der Schüler_innen durch geeignete Materialien hervorzulocken, auch wenn diese nicht der eigenen Schulform entsprechen.242 In der diskursiven Aushandlung über die Passung zwischen dem von der Lehrerin gewählten Anforderungsniveau und den Selbsteinschätzungen der Schüler_innen wird ebenfalls deutlich, wie eng die Darbietung von Möglichkeiten der Leistungserbringung mit einer als gerecht empfundenen Leistungsbeurteilung für Frau Ahle-Demmerer verbunden sind. Die Anhebung der Anforderungen kann dabei auch auf einen kollegial geteilten Strategiewechsel hinsichtlich der Förderung der Schüler_innen zurückgeführt werden, wie Frau Ahle-Demmerer berichtet (Z. 300-304): Diese solle sich nicht mehr nur nach den ‚schwächsten‘ Schüler_innen richten, sondern vor allem auf eine bessere „Binnendifferenzierung“ (Z. 304) abzielen. Dafür wurde u.a. die sonst übliche Aufteilung der Schüler_innen der 10. Klasse in Hauptschul- und Realschulklassen (10a und 10b) entsprechend der anvisierten Abschlüsse aufgehoben und anstelle dieser äußeren Differenzierung der Unterricht innerhalb der bestehenden Klassenverbände verändert: „Und es gibt Pflichtaufgaben, die müssen alle zusammen in der Gruppe machen. Da sitzen 10a- und 10b-Schüler gemischt bei mir. [...] Es gibt Wahlaufgaben, da entscheidet die Gruppe, welche dieser beiden Aufgaben sie macht. Und es gibt Zusatzaufgaben, das ist für die 10b-Schüler zuhause hier in der Schule, falls sie fertig sind. Und das wird dann separat bewertet.“ (Z. 314-318)

242

Damit widerspricht ihre Unterrichtspraxis einer immer wieder in ethnographischen Studien (vgl. Zaborowski et al., 2011; Straehler-Pohl, 2014; Gellert, 2015) belegten Tendenz zur Reproduktion von ‚Leistungsschwäche‘ insbesondere an Haupt- oder Sekundarschulen durch das Herabschrauben der Erwartungen seitens der Lehrkräfte an ihre Schüler_innen.

458

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Die „Bewertung von der Lerngruppe her“ kann damit als ein von weiten Teilen des Kollegiums geteilter Anspruch verstanden werden, der sich auch auf die Gestaltung des Fachunterrichts und die Zusammensetzung der Klassen auswirkt. Hinzu kommt eine ebenfalls kollegial geteilte Absprache hinsichtlich der Gewichtung der beiden Beurteilungsbereiche der mündlichen und schriftlichen Leistungen, die ebenfalls mit der Spezifik der Hauptschule begründet wird. Dazu wieder Frau Ahle-Demmerer: „[...] deswegen haben wir ja auch gesagt, dass die mündliche Leistung hier VIEL mehr bewertet wird. Das zu mündlichen, was eigentlich n:nicht so gern gesehen wird, auch einen großen Teil auch Sozialverhalten mit rein spielt. Also, wie gehe ich in meiner Gruppe um? Wie helfe ich der Gruppe, dass sie an ein Ziel kommt?“ (Z. 363-366)

Frau Ahle-Demmerer ist bewusst, dass sie mit den schulinternen Absprachen zum Teil gegen gesetzliche Vorgaben verstoßen („was eigentlich n:nicht so gern gesehen wird“), gleichzeitig werden diese Abweichungen unter Verweis auf die besonderen Bedürfnisse der Hauptschüler_innen aber von ihr legitimiert. Die größere Gewichtung der mündlichen Anteile begründet sie beispielsweise damit, dass bei den schriftlichen Leistungen nur eine punktuelle Beurteilung stattfinde (Z. 360-362), einige ihrer Schüler_innen dazu aber „nicht intellektuell und sozial in der Leistung/ äh in der=in der Lage das zu tun“ (Z. 362-363) seien. Neben den fachlichen Leistungen fließen deshalb auch Aspekte des Sozialverhaltens in die Beurteilung mit ein, wobei im obigen Beispiel vor allem ein auf gegenseitige Rücksichtnahme und Hilfestellung gerichtetes Sozialverhalten benannt wird. Inwiefern als negativ konnotiertes Sozialverhalten (Stören, Reden im Unterricht, etc.) ebenfalls einfließt, wird hier nicht deutlich. Analog zu dem im Klassenrat konstruierten kollektiven Wir zwischen Lehrkraft und Schüler_innen, wird allerdings ein kollegiales Wir deutlich, dass sich auf kollegial geteilte Absprachen hinsichtlich der schulischen Leistungsbeurteilung bezieht und als Legitimationsquelle für Frau Ahle-Demmerers Beurteilungen dient („haben wir ja auch gesagt“). Gleichzeitig finden sich aber auch Distanzierungen von bestimmten Beurteilungspraktiken anderer Kolleg_innen, was als Hinweis auf eine gewisse Heterogenität innerhalb des Kollegiums gelesen werden kann. Das

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

459

nachträgliche Anpassen des Bewertungsschlüssels bei schriftlichen Arbeiten wird so beispielsweise von ihr als illegitime Praxis benannt: „Also, ich äh lege Erwartungshorizonte fest und äh die stehen auch schon VORHER unter der Arbeit. Ich finde, ähm es gibt genügend Kollegen, (.) ähm die sich selber betrügen indem sie erst die Arbeit anschauen, und dann noch mal ihren Spiegel überdenken“ (Z. 262-263).

Interessant ist diese Distanzierung vor dem Hintergrund der oben geschilderten Praxis des „Zusatz“-Machens, bei dem Frau Ahle-Demmerer den Schüler_innen auch ein nachträgliches Verändern der Bepunktungsschlüssel ermöglicht. Während hier jedoch vor allem die Schüler_innen von der Kulanzregelung profitieren können, liegt der Schwerpunkt bei der nachträglichen Veränderung des Bepunktungsschlüssels durch die Lehrkraft eher auf der Herstellung unauffälliger Noten, die wiederum als vorbeugende Maßnahme gegen mögliche Einsprüche eingesetzt wird und damit lediglich den Lehrkräften nützt. Als illegitime Beurteilungspraktiken nennt sie weiterhin willkürliche Beurteilungen aufgrund persönlicher Vorlieben oder Antipathien. Als Beispiel dafür nennt sie eine Beurteilung einer Schülerin „von der Kollegin, die ich nicht mag und dann kriegt die halt die schlechten Noten“ (Z. 602). Auch berichtet sie von einer Episode, in dem ihre Schüler_innen von einem früheren Kollegen schlechter beurteilt worden seien, weil diese „im falschen Fußballverein“ (Z. 605) waren. Gegen diese als ungerecht empfundene Beurteilung sei sie jedoch eingeschritten: „Und dann gibt es aber einen Klassenrat mit den Lehrern. Weil das lass ich mir auch nicht gefallen“ (Z. 606-607). Wieder einmal findet sich hier der Klassenrat als Instrument der Aushandlung von Beurteilungen sowie das persönliche Einsetzen für ihre Schüler_innen: in der Formulierung „das lasse ich mir auch nicht gefallen“ spiegelt sich zudem die oben angesprochene Vergemeinschaftung von Lerngruppe und Lehrerin wider. Auf die besondere Beziehung zwischen Frau Ahle-Demmerer und ihren Schüler_innen gehe ich im folgenden Abschnitt noch einmal gesondert ein.

460

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

„echte Vollpfosten“ und „liebenswerte, kleine, süße Baselköpfe“ Auffällig im gesamten Interview ist die Art und Weise, wie Frau AhleDemmer über, aber auch mit ihren Schüler_innen spricht. Sie verwendet dabei häufig eine sehr lockere Sprache, die von einer großen Vertrautheit zeugt und teilweise ins familiäre abrutscht. Die beobachteten Wortwechsel zwischen ihr und den Schüler_innen, die während des Interviews den Klassenraum betraten, wirkten sehr locker, beinahe freundschaftlich. Es entstand der Eindruck, Frau Ahle-Demmerer versuche durch ein Anpassen an die Jugendsprache der Schüler_innen eine Kommunikation auf Augenhöhe zu etablieren, gleichzeitig wurden einige Schüler_innen gemaßregelt und Aufgaben von ihr vergeben, die diese in der Pause erledigen sollten. Mit einigen Schüler_innen ihrer Klasse ist sie auch durch soziale Netzwerke wie Facebook verbunden, wodurch sie teilweise auch viele private Informationen über die Schüler_innen erhält. Diese Informationen nutze sie auch, um Schüler_innen in schwierigen familiären Situationen zu helfen, indem sie beispielsweise mit Kolleg_innen einen Nachschreibetermin für anstehende schriftliche Arbeiten vereinbart (vgl. Z. 387-392). Beispiele für den eher lockeren Umgang sind die oben bereits erwähnte Reaktion auf Schüler_innenkommentare im Unterricht, bei der sie mit einer Kombination aus „nettem Gesicht“ und den Worten „möp“ oder „fail“ eine ironisierende Kommentierung und gleichzeitige Aufrechterhaltung des Unterrichtsgesprächs beschreibt. Sie berichtet davon, das Humor und gemeinsames Lachen sehr wichtig im Umgang mit ihren Schüler_innen seien und baut Referenzen auf die Buchreihe „Harry Potter“ ein („Hogwarts“ Z. 633-635). Am deutlichsten wird der Bezug zur Jugendsprache jedoch am folgenden Zitat: „Also bei mir gibts auch den Vollpfosten des Tages, ähm dass jemand wirklich sich so dämlich verhält, dass wir alle sagen: ‚Oh ja, Vollpfosten des Tages!‘ Aber das nehmen die nicht böse an, sondern sie leben damit“ (Z. 214-216).

Der Titel des „Vollpfosten des Tages“ wird dabei von ihr als ironische Disziplinierungsmaßnahme beschrieben, die von den Schüler_innen ge-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

461

teilt und gleichermaßen angewandt werde. Während dieser Begriff in anderen Situationen durchaus als unangebrachte Beleidigung aufgefasst werden kann, fügt er sich im Interview mit Frau Ahle-Demmerer in gewisser Weise passend für die geschilderte Beziehung zwischen der Lehrerin und ihren Schüler_innen ein (wie die Schüler_innen mit dieser Anrufung umgehen, kann hier nicht rekonstruiert werden). Dies wird noch deutlicher wenn sie am Ende des Interviews weiter ausführt: „Ich habe eben den Begriff genannt, und den finde ich auch nicht ganz böse, da sind echte Vollpfosten dabei. Liebenswerte, kleine, süße Baselköpfe“ (Z. 825-826). Hier wird der ironische Unterton noch deutlicher, mit dem sie diesen Begriff auch während des Interviews verwendete. Deutlich wird auch die wohlwollende Grundhaltung, die sie ihren Schüler_innen trotz offensichtlicher Schwierigkeiten entgegenbringt, in der sie an die ambivalente Haltung von Eltern gegenüber ihren pubertierenden Kindern erinnert. Dass sie sich für ihre Klasse gegenüber anderen Lehrkräften einsetzt, wenn sie eine Beurteilung als unfair empfindet (vgl. Z. 606-607, 621-624), fügt sich dabei ebenso in dieses Bild, wie auch der Wunsch, die Schüler_innen in der Schule ein Stück weit vor der ‚harten Realität‘ des Lebens beschützen zu wollen (vgl. Z. 403-406). Zu einer vertrauensvollen Beziehung zwischen Schüler_innen und Lehrerin gehört es dabei für Frau Ahle-Demmerer auch, sich als Lehrkraft nicht zu verstellen und „authentisch“ (Z. 608) zu sein. Diese Authentizität erhöhe dabei auch die Akzeptanz der von ihr vorgenommenen Beurteilungen bei den Schüler_innen: „ich=kann glaube ich nicht fünf, sechs Jahre jemandem was vorspielen. Das geht nicht. Die können einen schon einschätzen. Und das ist ganz wichtig. Und dann gebe ich auch vielleicht bessere Zens/ nicht bessere, aber (.) die entsprechenden Zensuren ähm (.) weil ich eben (.) von der Lerngruppe auch so angenommen werde. [...] Also ich glaube auch, dass=dass Schüler bereit sind von einem authentischen Lehrer (.) also von jemandem, der (.) sie NIE über den Tisch gezogen hat in ihrer Wahrnehmung, oder nicht sehr oft, oder irgendwie immer für sie präsent war, eher eine Zensur annehmen, oder e=eine Bewertung, als jemand der sie immer wieder falsch bewertet hat. Also wo=wo Disharmonie im Verständnis ist.“ (Z. 609-620)

462

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Hier zeigt sich nun das Gegenstück zu dem oben eingeführten Kennen der Schüler_innen als Voraussetzung für eine gerechte Beurteilung: auch die Schüler_innen sollten in Frau Ahle-Demmerers Sicht ihre Lehrkraft sehr gut kennenlernen können, da dies die Akzeptanz der Beurteilungen verbessere. Es zeigt sich, dass es hier auch um eine gegenseitige Wahrnehmung und Akzeptanz geht, in der die Lehrkraft sich „authentisch“ zeigen könne und den Schüler_innen nichts „vorspielen“ solle. Im Gegenzug dafür würde die Lehrkraft „von der Lerngruppe auch so angenommen“ – eine Formulierung, die eher an familiäre oder Freundschaftsbeziehungen erinnert, im professionellen Kontext der LehrkraftSchüler_innen-Beziehung jedoch irritiert. Im weiteren Verlauf des Interviews wird deutlich, dass dieses gegenseitige Verständnis ihr auch insofern helfe, als sie ihre Emotionen und Launen mit in die Klasse nehmen könne und teilweise sogar emotional aufgefangen werde von den Schüler_innen (vgl. Z. 612-616). Was genau eine „authentische“ Lehrerin auszeichnet, bestimmt Frau Ahle-Demmerer im obigen Beispiel vor allem ex negativo: „authentisch“ sei jemand, der die Schüler_innen „NIE über den Tisch gezogen“ habe bzw. jemand, der sie nicht „immer wieder falsch bewertet“ habe, gesteigert wird diese Negativdefinition noch durch die Formulierung einer „Disharmonie im Verständnis“. All dies weist sie für sich selbst und die Beziehung zu ihren Schüler_innen von sich, vielmehr wird ein Selbstbild als verlässliche Partnerin der Schüler_innen deutlich („immer für sie präsent“). Eine wichtige Bedingung für das Engagement für ihre Schüler_innen sind aber auch die unterschiedlichen Arbeitsbedingungen von Klassen- und Fachlehrkräften, wie Frau Ahle-Demmerer einräumt: Als Klassenlehrerin kann sie sich viel intensiver um ihre Schüler_innen kümmern, kennt diese sehr gut und hat jederzeit einen Überblick über deren Lernstand („wenn ich nur meine 22 Pappenheimer hab, da können Sie mich nachts wach machen“ Z. 671-672). Bei Fachlehrer_innen hingegen sähe die Situation ganz anders aus: „Der arme Fachlehrer, der ein gewisses Fach über die ganze Schule verteilt gibt, und immer wieder neue Sozialgruppen da hat, und überhaupt die gar nicht kennt, weil er die gar nicht äh außer einer St=oder zwei Stunden die Woche sieht“ (Z. 674-676). Die

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

463

Schüler_innen zu kennen ist also ebenso wichtig, wie eine vertrauensvolle Beziehung zwischen Lehrkraft und Schüler_innen aufzubauen, um eine gerechte Beurteilung überhaupt erst zu ermöglichen.

Mehr Freiräume durch Zentrale Prüfungen Als letzten Aspekt bezüglich Frau Ahle-Demmerers Gerechtigkeitsüberzeugung gehe ich noch auf die Rolle zentraler Prüfungen ein. Befragt zu den möglichen Veränderungen durch die Einführung zentraler Prüfungen in NRW gibt Frau Ahle-Demmerer zunächst an, dass die ZAP „den Druck auf den Lehrer erhöht“ (Z. 792) habe, fügt aber auch hinzu, dies gelte vor allem dann, wenn man „als Lehrer glaubt, man müsse das irgendwie beweisen“ (Z. 793-794). Die kritische Sorge, die Zentralen Prüfungen könnten als Kontrollinstrument für die Lehrkräfte genutzt werden, findet sich also auch hier – allerdings scheint Frau Ahle-Demmerer diese nur bedingt zu teilen. Sie befürchtete zunächst vor allem, dass mit den ZAPs ein Rankingsystem etabliert werden könnte, bei dem die Schulen aufgrund der ZAP-Ergebnisse um potentielle Schüler_innen buhlen würden (Z. 794-796). Diese Befürchtung habe sich jedoch nicht bewahrheitet. Zusätzlich habe sie auch „so ein bisschen den Respekt davor“ (Z. 808) verloren, nachdem einige der Prüfungsaufgaben fehlerhaft gewesen seien: „in vielen ZAPs sind Fehler. Die sind nicht gut gemacht. Die ste=sind auch nicht an der Lernwirklichkeit der Schüler orientiert“ (Z. 803-804). Als positive Entwicklung der Zentralen Prüfungen und Kernlehrpläne begrüßt sie die größeren Freiräume für Lehrkräfte in der Unterrichtsgestaltung – und nimmt damit eine deutliche Gegenposition zu den eher skeptisch bis ablehnenden Haltungen der Lehrkräfte, die im Kapitel zur mathematisch-rechnerischen bzw. prozedural-bürokratischen Gerechtigkeitsüberzeugung zitiert wurden: „Ich be/ persönlich begrüße es, wenn ich als Lehrerin einen größeren Handlungsspielraum habe und eine Entscheidung mit einer Klasse zusammen treffen kann. Als wenn ich gezwungen werde, bestimmte Dinge zu tun. (.) Also auf dem Weg zur zentralen Abschlussprüfung sind wir alle. Das heißt, wir haben ein feststehendes Ziel. Auch

464

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Hauptschulen haben so eine Art Abitur, wenn man es so möchte. Aber auf dem Weg DORTHIN (.) ist es den Lehrern überlassen, wie sie das gestalten. Und=und das ist hier entscheidend.“ (Z. 46-51)

Wie bereits weiter oben bei der Gestaltung des Deutschunterrichts erwähnt, begrüßt Frau Ahle-Demmerer die kompetenzorientierten Kernlehrpläne und zentralen Abschlussprüfungen grundsätzlich, solange ihr dadurch mehr Freiräume in der Unterrichtsgestaltung und Vorbereitung auf die Zentralen Prüfungen gewährt werden. Auch hier bringt sie die Mitbestimmungsmöglichkeiten der Schüler_innen wieder zur Sprache („eine Entscheidung mit einer Klasse zusammen treffen“), weist aber auch auf die Schulformspezifik der Hauptschule hin („das ist hier entscheidend“). Vor dem Hintergrund des oben Geschilderten überrascht diese positive Haltung kaum, zielen die Kernlehrpläne und Zentralen Prüfungen doch genau auf diese Eröffnung von Freiräumen „auf dem Weg zur zentralen Abschlussprüfung“ für die Lehrkräfte. Kritischer betrachtet Frau Ahle-Demmerer hingegen die grundsätzliche Aussagekraft von klassischen Zensurenzeugnissen, die in ihren Augen häufig ihren Schüler_innen nicht gerecht würden: „Und ich fände es manchmal für die Schüler fairer, es gäbe ein Zeugnis, das zwar aus nennbaren Noten besteht, aber auch aus feststellbaren Sozialkompetenzen. Wo man wirklich sagt, wenn du als zukünftiger Arbeitgeber jemanden wie den übernimmst, dann hast du GLÜCK. Das ist ein ganz toller Mensch, der wird auch diesen Job toll machen. Einen=eine Zensur sagt manchmal recht wenig da drüber aus.“ (Z. 838-849)

Hier zeigt sich eine grundsätzliche Unzufriedenheit mit dem bestehenden Beurteilungssystem und der darin eingelassenen Fokussierung auf fachliche Leistungen, die in Frau Ahle-Demmerers Augen manche ihrer Schüler_innen bei der Arbeitsplatzsuche benachteilige. An anderer Stelle berichtet sie, dass die Schule sich deshalb dazu entschieden habe, den Schüler_innen fakultativ auf einem Zusatzblatt zum Zeugnis auch sogenannte „Kopfnoten“ mitzuteilen, um bei Bewerbungen die Fachnoten auch um Angaben zu den Sozialkompetenzen zu ergänzen (vgl. Z. 479490). Auch hier findet sich also wieder die situative Aushandlung dessen, was als ‚Leistung‘ anerkannt werden kann und soll sowie eine die Schüler_innen stützende und schützende Grundhaltung.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

465

Zusammenfassung Frau Ahle-Demmerer Leistungsbeurteilungen sind in Frau Ahle-Demmerers Augen dann gerecht, wenn sie von der Klassengemeinschaft mitgetragen werden, d.h. wenn die Schüler_innen einer Lerngruppe die Beurteilungen nachvollziehen können und diesen zustimmen. Dies versucht Frau AhleDemmerer durch zahlreiche kommunikative Aushandlungssituationen während des Unterrichts und in regelmäßig stattfindenden „Klassenräten“, also Besprechungen mit der gesamten Klasse, zu erreichen. Weniger wichtig ist ihr andererseits das strenge Einhalten von Vorgaben und Richtlinien, vielmehr nutzt sie hier – unterstützt durch die Schulleitung und das Kollegium ihrer Schule – die vorhandenen Spielräume innerhalb der gesetzlichen Vorgaben, um eine in ihren Augen gerechte Beurteilung für die Schüler_innen zu ermöglichen. Auch lehnt sie die Anwendung mathematischer Verfahren, wie die Mittelwertbildung bei der Notenvergabe, zum Teil vehement ab. Frau Ahle-Demmerer wendet einen vergleichsweise flexiblen Leistungsbegriff an, dies zeigt sich beispielsweise indem bei mündlichen Leistungen andere Schüler_innen als Unterstützung in die Aufgabenbearbeitung einbezogen werden können oder aber bei schriftlichen Leistungskontrollen ein „Zusatz“ möglich ist, um fehlende Punkte auszugleichen. Zentral für die diskursiv-interaktive Herstellung einer gerechten Note ist daher auch eine vertrauensvolle Beziehung zwischen Lehrkraft und Schüler_innen, die von ihr u.a. durch Humor und eine sehr lockere Ansprache der Schüler_innen aufzubauen versucht wird. Ihr professionelles Selbstbild beschreibt sie als „Berater“ der Schüler_innen und „Experte [...] für eine Lerngruppe“, gleichzeitig räumt sie den Schüler_innen weitreichende Mitbestimmungsrechte ein und beteiligt sie durch die diskursive Aushandlung an der Beurteilungsverantwortung.

466

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

6.3.3.2 Barbro (und Christina): Gemeinsam unterrichten und beurteilen Barbro und ihre Kollegin Christina sind die beiden einzigen Schwedischlehrerinnen an einer einzügigen städtischen grundskola und unterrichten beide hauptsächlich in den Klassenstufen 7-9. Barbro ist zum Zeitpunkt des Interviews 48 Jahre alt, seit 19 Jahren im Schuldienst und war eine der ersten förstelärare („Leitende Lehrkraft“, vgl. Kap. 5.1.3) der Schule. Christina, ihre Kollegin, ist zum Zeitpunkt des Interviews 52 Jahre alt und seit 15 Jahren als Lehrerin tätig. Da beide Lehrerinnen sehr eng zusammenarbeiten und im Interview auch aufeinander verweisen, beziehe ich in die Falldarstellung von Barbro auch ihre Kollegin Christina mit ein.

„wir müssen nicht ALLES können“ – Teamteaching als Entlastung Barbro und ihre Kollegin Christina arbeiten sehr eng zusammen, obwohl sie nicht unbedingt zur gleichen Zeit im gleichen Klassenzimmer sind. Vielmehr haben sie die Lehrplaninhalte untereinander aufgeteilt und unterrichten abwechselnd in den gleichen Klassen jeweils unterschiedliche Themen des Schwedischlehrplans in sogenannten Kursen.243 Die Aufteilung, wer welche Kurse unterrichtet, erfolgte vor allem nach persönlichem Interesse, so dass Barbro beispielsweise Unterrichtsreihen zu Grammatik, Sprachgeschichte und Literaturgeschichte übernimmt, Christina sich wiederum den Textsorten Gedichte und Erzählungen widmet (vgl. Z. 76-79). Diese Aufteilung des Schwedischunterrichts in thematische Kurse wird von Barbro als sehr positiv eingeschätzt, da sie sich besonders auf Unterrichtsinhalte konzentrieren könne, auf die sie sich „spezialisiert“ habe und die ihr „Spaß machen“ 244 (Z. 77-78). Als Begrün243

Wie in Kap. 5.1 dargestellt, verfügen die Schulen in Schweden über einen großen organisatorischen Freiraum, der eine solche Gestaltung des Fachunterrichts bzw. auch den fächerübergreifenden Unterricht in thematischen Kursen ermöglicht. 244 Original: „det som jag är lite mer specialiserat på, som jag tycker är roligt“ (Z. 77-78)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

467

dung für diese Fokussierung auf Unterrichtsschwerpunkte nennt sie auch, dass diese zu einer „besseren Qualität“ („bättre kvalité“, Z. 84) führen würden, womit vermutlich eine bessere Unterrichtsqualität durch die vertiefte Expertise auf Seiten der spezialisierten Lehrkraft gemeint ist. Gleichzeitig eröffnet sich dadurch ein gewisser professioneller Freiraum, der sie in ihrer Lehrerinnenrolle entlastet: „Also wir müssen nicht ALLES können oder Expertinnen in ALLEM sein. Sondern, wir machen das, wo wir denken (.) ja, das ist am interessantesten. (..) Für uns, sozusagen”245 (Z. 71-72). Eine gute Lehrkraft zeichnet sich in Barbros Augen also nicht unbedingt durch die Beherrschung aller im Lehrplan aufgeführten Unterrichtsthemen aus, vielmehr legt sie Wert auf Spezialisierung und die Möglichkeit eigene Interessen in die Unterrichtsplanung einzubringen. Der Vorteil dieser Art Spezialisierung liegt für sie klar auf der Hand: „Und da tauschen wir. Anstelle, dass man sich in alles einarbeiten muss, haben wir (.) unsere (.) verschiedenen (.) Kurse, die wir anbieten. Und so tauschen wir die Klassen stattdessen“246 (Z. 80-81). Die thematischen Kurse bieten ihr somit auch eine Arbeitserleichterung bei der Unterrichtsvorbereitung, haben also neben dem motivationalen Aspekt (eigene Interessen) auch einen pragmatischen Vorteil. Auch Christina begrüßt diese Aufteilung in inhaltliche Kurse, da ihr auch die Beurteilung bestimmter Themen, die sie „wirklich GUT beherrsch[t]“ 247 (Z. 205), leichter falle als bei anderen. Für die Schüler_innen bedeutet dies im Umkehrschluss, dass sie während eines Schuljahres nicht nur von einer, sondern gleich von zwei Lehrerinnen im Fach Schwedisch unterrichtet – und vor allem auch – beurteilt werden. In dieser gemeinsamen Beurteilung liegt in Barbros Augen ein weiterer Vorteil ihrer Zusammenarbeit mit Christina:

245

Original: „Så vi behöver inte kunna ALLT eller vara experter på ALLT. Utan vi gör det, som vi tycker (.) ah, är mest intressant. (..) För oss, liksom.” (Z. 71-72) 246 Original: „Så då byter vi. Istället att man ska sätta sig in i allt så har vi (.) våra (.) olika (.) kurser som vi går in. Och så byter vi klasserna istället.” (Z. 80-81) 247 Original: „nåt som jag [...] behärskar väldigt BRA“ (Z. 205)

468

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

„Und wir beurteilen auch zusammen. Sie und ich. Das ist auch so gut daran. Dass wir beide jede Klasse treffen. Was dazu führt, dass wir zu zweit sind. Also da bin es nicht nur ICH, die das aus MEINER Perspektive sieht, sondern da treffen wir uns, sehen wir dieselben Sachen“ 248(Z. 84-86)

Hier wird deutlich, dass der Vorteil für Barbro vor allem in der Erweiterung der Perspektiven auf die Schüler_innen besteht: Beide Lehrerinnen lernen die Schüler_innen einer Klasse kennen, beide erleben die Schüler_innen im gleichen Unterrichtsfach und beide verwenden (wie später noch gezeigt wird) die gleichen Beurteilungsmaterialien. Sie unterrichten zwar nicht gleichzeitig in einer Klasse, planen jedoch das Schuljahr und die Unterrichtsinhalte gemeinsam und stimmen sich während des Schuljahres fortlaufend über die Lernfortschritte und Schwierigkeiten einzelner Schüler_innen ab. Inwiefern diese Perspektiventriangulation und damit einhergehende Aushandlungsprozesse zwischen den beiden Lehrerinnen mit der Sicherung einer gerechten Leistungsbeurteilung zusammenhängen, wird im nächsten Abschnitt beleuchtet.

Gemeinsame Beurteilung ist gerechter Barbro und Christina haben sich, ausgehend von den Beurteilungshilfen von Skolverket und dem Lehrplan, verschiedene Beurteilungsraster erarbeitet, die sie in ihren Klassen gleichermaßen einsetzen, um die Leistungen und Lernfortschritte der Schüler_innen beurteilen zu können. Im folgenden Auszug zeigt sich, wie diese Beurteilungsraster als Kommunikationshilfe für die beiden Lehrerinnen beim Übergang von einem Kurs zum nächsten fungieren: „Und wenn ich das dann an Christina übergebe und sie soll dann, und sie [die Schüler_innen, K.F.] sollen dann mündliche Präsentationen für sie machen nach Weihnachten, dann schaut sie auf die [Beurteilungsraster, K.F.] hier und schaut, was sie 248

Original: „Och vi bedömer ju ihop. Hon och jag. Det är det som är så bra också där. Att vi båda möter varje klass. Vilket gör att då är vi ju två stycken. Så då är det inte bara JAG som ser det från MITT perspektiv utan då möts vi, ser vi samma sak”(Z. 84-86)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

469

schon erreicht haben und was nicht. Und dann kann es sein, dass ich vielleicht hier etwas beurteilt habe und sie denkt: ‚Was hast du/waru/Was hast du hier gedacht?‘ und dann sprechen wir DARÜBER. Also wir arbeiten sehr oft so, sie und ich, dass wi:i:ir, dass wir uns besprechen und diskutieren sozusagen: ‚Was hast du hier gedacht und worauf achtest du da?‘ Denn wir schauen schon auf unterschiedliche Sachen.“249 (Z. 145-151)

Die Beurteilungsraster sind also nicht unbedingt thematisch eingegrenzt, sondern fokussieren eher auf übergeordnete Kompetenzen, wie die Präsentationskompetenz, die sowohl in Barbros Kurs zu literaturhistorischen Themen als auch im Kurs von Christina zur Gedichtinterpretation von den Schüler_innen erworben bzw. von den Lehrerinnen beurteilt werden können.250 In den Beurteilungsrastern findet dabei eine Dokumentation der Beurteilungen der jeweiligen Lehrkraft statt, die wiederum bei der Übergabe an die andere Lehrerin expliziert und begründet werden müssen. In den Gesprächen über ihre jeweiligen Beurteilungen verhandeln die beiden Kolleginnen dabei nicht nur die bereits erfolgten Beurteilungen, sie erläutern sich auch gegenseitig die zugrundeliegenden Beurteilungskriterien („worauf achtest du da?“). Somit findet im Anschluss an die eigene Beurteilung immer auch noch ein Abgleichen mit der Kollegin über diese Beurteilungen statt. Christina wiederum berichtet, dass sie sich für die Beurteilung der Diskussionskompetenz ihrer Schüler_innen auch mit anderen Lehrkräften austauschen, die bspw. die gesellschaftswissenschaftlichen Fächer oder Mathematik unterrichten,

249

Original: „Så när jag lämnar över det här nu till [kollega E.] och hon ska göra, och de ska göra muntliga presentationer sen för henne här efter jul, då tittar hon på de här och tittar vad har de uppnådd och vad har de inte uppnådd. Och då kan det ju vara, att kanske jag har bedömd någonting här och hon tycker: "vad gjorde/ varf/ hur tänkte du där?" och då prata vi om DET. Så vi jobbar väldigt mycket så, hon och jag att vi:i:i ah, att vi samtalar och diskuterar liksom: "Hur tänkte du där och vad är det du titta på?" För vi tittar ju på väldigt olika saker.” (Z. 145-151) 250 Vgl. hierzu auch Christinas Interview (Z. 184-192), in dem sie über die Vorteile der fächerübergreifenden Anwendung derselben Beurteilungsraster durch verschiedene Lehrkräfte spricht.

470

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

um einen Eindruck zu bekommen, wie einzelne Schüler_innen von diesen Lehrkräften eingeschätzt werden (vgl. Z. 167-180). Anders als im Kapitel zur prozedural-bürokratischen Gerechtigkeitsüberzeugung dargestellt, sind es nicht die Beurteilungsraster und Lehrplanvorgaben als solche, die von Barbro und Christina als Hilfsmittel für eine gerechte Beurteilung genutzt werden. Vielmehr stellen diese den Ausgangspunkt für kollegiale Aushandlungsprozesse über die Deutung dieser Vorgaben dar und (wie im Folgenden noch gezeigt wird) erst die diskursiv geschaffenen gemeinsamen Beurteilungsverständnisse werden anschließend als gerechtigkeitsfördernd betrachtet. Auch bei schriftlichen Arbeiten tauschen sich die beiden Kolleginnen regelmäßig über ihre Beurteilungen aus. Dafür lassen sie beispielsweise in zwei Parallelklassen die gleiche Arbeit schreiben und beurteilen diese dann folgendermaßen: „Alle hatten die gleiche Aufgabe. Und dann lasen wir ALLE. Und gaben eine Zensur dafür. Also ich habe sie selbst benotet und gab, was ich dachte. Und sie saß für sich und gab, was sie dachte und dann trafen wir uns und diskutierten: ‚Denken wir gleich?‘. Und die, bei denen wir gleichlagen, die legte man beiseite. Aber die, wo wir uns nicht eins waren, da war das recht interessant zu diskutieren: ‚Warum denkst du das, ich denke so hier.‘ Und hin und her zu überlegen.“251 (Z. 96-100)

Auch hier findet eine zweischrittige Beurteilung statt, indem zunächst jede Lehrerin für sich selbst die Arbeiten beurteilt, anschließend jedoch die einzelnen Beurteilungen miteinander verglichen werden. Die sich daraus ergebenden Diskussionen dienen vor allem der Annäherung der Perspektiven der beiden Lehrerinnen, wie in der Formulierung „denken wir gleich?“ deutlich wird. Die schwedische Frage „tycker vi lika?“ kann auch mit „haben wir den gleichen Eindruck?“ oder „halten wir das gleiche davon?“ übersetzt werden. Ziel ist es offenbar, eine möglichst hohe 251

Original: „Alla fick samma uppgift. Och så läste vi ALLA. Och så satte vi betyg på de. Så jag satte de för mig själv och satte vad jag tyckte. Och hon satte för sig och satte det hon tyckte och sen träffades vi och så diskuterar vi: ‚Tycker vi lika?’. Och de vi tyckte lika, de lägger man ju ifrån sig. Men de vi tycker olika, de blir det ju intressant att diskutera: ‚Varför tycker du så, jag tycker såhär.’ Och att bolla fram och tillbaka.” (Z. 96-100)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

471

Übereinstimmung zwischen den Beurteilungen der beiden Lehrerinnen in der konkreten Arbeit herzustellen. Gleichzeitig findet aber auch eine grundsätzlichere Auseinandersetzung über und Angleichung dessen, was als Leistung wie eingeschätzt wird, durch die gemeinsame Beurteilung statt.252 Wie viele ihrer Kolleg_innen im schwedischen Sample korrigieren auch Barbro und Christina die standardisierten Tests in der 9. Klasse (nationella prov) gemeinsam und auch hier finden ähnliche Diskussionen und Aushandlungen zwischen den beiden Kolleginnen statt (vgl. Z. 100102). Für Barbro stellen diese kollegialen Aushandlungen und Gespräche einen wichtigen Grundpfeiler für eine „gerechtere“ Beurteilung von Schüler_innen dar, wie im folgenden Auszug deutlich wird: „Ob man das nun als gerechte Beurteilung nehmen soll, es wird MEHR, vielleicht GERECHTER, wenn man zu zweit auf die gleichen Aufgaben schaut. Und dann stimmen wir nicht überein. Manchmal kann das schon sein, dass ICH an eine niedrigere Note denke und sie an eine höhere und umgekehrt. Äh (.) manchmal kann das eine solche Streuung sein, dass es von der niedrigsten bis fast zur höchsten Note geht. Und wenn wir dann jeder für sich eine Note gegeben hätten, wären die sehr unterschiedlich gewesen. Ob das ungerecht oder gerecht ist, ja, das kann man wohl diskutier/ Aber so wird es eine gleichwertigere Beurteilung. Da sind sie und ich gezwungen, das zu diskutieren [...]. Und das führt dazu, dass sie und ich UNSERE Beurteilungskompetenzen weiterentwickeln. Wir werden ja besser. Bei der Beurteilung von Texten. Zum Beispiel.“253 (Z. 102-110)

252

Auf den Unterschied zwischen Übereinstimmung bei der Benotung und geteiltem Beurteilungsverständnis gehe ich im länderübergreifenden Vergleich näher ein, vgl. Kap. 5.3.3. 253 Original: „(..) om man nu ska tar det ur en rättvis bedömning, så blir det ju MER, kanske MER rättvis när man är två stycken som ser på samma uppgift. Och sen tycker vi olika. För ibland kan det ju vara att JAG tycker ett lägre betyg och hon ett högre och tvärtom. Eh (.) ibland kan det vara en sådan spridning så att det kan vara från lägsta betyget till nästan högsta betyget. Och då hade vi satt betyg själva då hade vi ju blivit väldigt o:olika. Om det är orättvist eller rättvist, ah, det kan man ju diskute/ Men det blir ju mer likvärdig bedömning då. Då är hon och jag tvungna (.) att eh diskutera [...] Och det gör ju att hon och jag, utvecklar ju VÅR bedömarkompetens också. Vi blir ju bättre. Eh på att bedöma eh (.) texter. Till exempel.” (Z. 102-110)

472

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Durch die kollegialen Auseinandersetzungen über die Frage, wie die von den Schüler_innen gezeigten Leistungen beurteilt werden sollten, findet eine für Barbro zentrale Annäherung der Beurteilungen verschiedener Lehrkräfte statt. Dass diese Annäherung von Barbro als eher prozessual und tendenziell unabschließbar gedacht wird, zeigt sich in ihrer vorsichtigen Distanzierung vom Begriff ‚gerecht‘ („ob man das nun als gerechte Beurteilung nehmen soll“) und der anschließenden betonten Differenzierung „GERECHTER“. Erst durch den kollegialen Austausch, den Blick „zu zweit auf die gleichen Aufgaben“ würden Beurteilungen gerechter und vor allem „gleichwertiger“. Insofern betrachtet Barbro die regelmäßigen Diskussionen mit ihrer Kollegin auch nicht als Belastung oder gar Infragestellung ihrer Beurteilungskompetenz (wie andere Lehrkräfte des Samples), im Gegenteil weist sie darauf hin, dass diese Aushandlungen auch eine Art Weiterbildung für sie darstellen („UNSERE Beurteilungskompetenzen weiterentwickeln“). Insgesamt wird deutlich, dass Leistungsbeurteilungen für Barbro immer auch Interpretationen einer Lehrkraft innerhalb eines bestimmten Deutungsspielraums sind und weniger ‚objektive‘ Abbildungen dessen sind, was Schüler_innen können: „Beurteilung ist schon sehr subjektiv. Weil es ist schon, was ich hineinlege in (.) in äh (..) in das was da steht“254 (Z. 151-152). Sie verwendet im gesamten Interview kein einziges Mal den Begriff ‚objektiv‘ im Zusammenhang mit der Leistungsbeurteilung – wie andere Lehrkräfte des Samples – vielmehr spricht sie immer wieder davon, dass es mehr um die Schaffung eines kollegial geteilten Verständnisses von Beurteilungen gehe: „Und deshalb ist es super gut, dass wir zu zweit sind. Denn dann sind es schon zwei, die es aus verschiedenen Richtungen sehen (...). Auf diese Weise wird es gerechter bei uns oder hier an unserer Schule, kann ich mir schon denken.“255 (Z. 259-261). Die Erweite254

Original: „Bedömning är ju väldigt subjektivt. För det är ju vad lägger jag in i:i (.) i eh (..) i det som står där” (Z. 151-152) 255 Original: „Och därför är det ju super bra att vi är två. För då är vi ju två som kan se det från olika håll (...). Så på det sättet så blir det ju mer rättvis på vår eller här på skolan kan jag nog tycka.” (Z. 259-261)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

473

rung der eigenen Einschätzung um die Perspektive einer Kollegin und das kontinuierliche Abgleichen von Erwartungen und Beurteilungskriterien führen dabei zu einer in ihren Augen gerechteren Beurteilung. Nicht zuletzt auch durch die geteilte Beurteilungsverantwortung wird diese Perspektiventriangulation zweier Lehrkräfte zur Legitimationshilfe für ihre eigene Beurteilungspraxis.

Lernprozessorientierte Beurteilung ist gerecht Wie in Kapitel 2.1 bereits eingeführt, wird im schwedischen Diskurs häufig zwischen einer formativen, eher auf den Lernprozess ausgerichteten Beurteilung und einer summativen Benotung der Ergebnisse des Lernprozesses unterschieden. Auch in Barbros Interview findet sich diese Unterscheidung in eine den Lernprozess der Schüler_innen begleitenden Rückmeldung während des Unterrichts, die von der abschließenden Benotung am Ende des Halbjahres unterschieden wird. „Bedömning för lärande“, also die formative auf das Lernen bezogene Beurteilung, wird von Barbro dabei folgendermaßen definiert: „Was=was machen sie? Was können sie jetzt? Und was passiert im Klassenzimmer? Wo ich als Lehrerin ein Teil des Prozesses sein muss. Dass ich bei den Schüler_innen bin. Nicht dass ich nur lehre, sondern dass ich zusammen mit den Schüler_innen unterrichte“256 (Z. 288-290). Deutlich wird hier, dass die Art der Beurteilung sich auch auf die Gestaltung des Unterrichts und die Beziehung zwischen Lehrkräften und Schüler_innen auswirkt. Zunächst einmal gehe es darum, die Schüler_innen genau zu beobachten („mycket observation“, Z. 288), um ihren aktuellen Lernstand („Was können sie jetzt?“) feststellen zu können. Dafür dürften Lehrkräfte nicht mehr nur sprichwörtlich aus der Distanz lehren und vortragen, sondern müssten vielmehr „Teil des Prozesses“ werden, sich in den Lernprozess der Schü256

Original: Vad=vad gör de? Vad kan de nu? Och vad händer i klassrummet? Var jag som lärare måste vara en del av processen. Att jag är med eleverna. Inte att jag lär ut utan att jag lär tillsammans med eleverna. Handlar det ju om.” (Z. 288-290)

474

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

ler_innen hineinversetzen und „zusammen mit den Schüler_innen“ unterrichten. Dieses ‚Zusammensein‘ oder ‚Nahsein‘ erfordert eine kontinuierliche Kommunikation zwischen der Lehrerin und ihren Schüler_innen, Barbro spricht hier auch von einem „fortwährenden Gespräch“ („ett pågående samtal”, Z. 294) als Beschreibung des Unterrichts- und Beurteilungsprozesses. Ihre Aufgabe als Lehrerin bestehe vor allem darin, „LERNsituationen [zu schaffen], in denen die Schüler_innen beteiligt und aktiv sein sollen“257 (Z. 293). Im Umkehrschluss führt diese Mehrbeteiligung der Schüler_innen aber auch zu einer veränderten Rolle der Lehrkraft, wie oben bereits angedeutet wurde: „Also es geht viel darum, dass man als Lehrkraft eigentlich einen Schritt zurückgeht. Dass man nicht erzählt, wie es IST. Sondern, dass man, ich arbeite viel damit, sie zum DENKEN anzuregen“ 258(Z. 294-296). Diese zurückgenommene Rolle der Lehrerin spiegelt sich dann wiederum in der Rolle der verwendeten Beurteilungsinstrumente, die den Schüler_innen vor allem dabei helfen sollen ihren eigenen Lernprozess zu verstehen und sich bewusst um Unterstützung durch die Lehrkraft zu bemühen.259 Barbro und Christina haben dafür auf der Grundlage der Beurteilungsmaterialien von Skolverket eigene Beurteilungsraster (auch Matrizen genannt) erarbeitet, die sowohl als Rückmeldeinstrumente durch die Lehrkraft als auch für die Selbsteinschätzung der Schüler_innen verwendet werden sollen. Diese Beurteilungsraster sind optisch sehr ähnlich aufgebaut, wie die im Lehrplan abgedruckten Tabellen der Wissensanforderungen für jedes Fach, auch die Formulierungen in den Zeilen sind 257

Original: „LÄRANDEsituationer [...] där eleven ska vara delaktig och eleven ska vara aktiv” (Z. 293) 258 Original: „Så där handlar det ju mycket om att man som lärare egentligen tar ett steg bakåt. Inte att man berätta hur det ÄR. Utan att man, jag jobbar mycket med att få de att TÄNKA.” (Z. 294-296) 259 Dass diese Erwartungshaltung an Schüler_innen als eigenverantwortliche Lernende nicht von allen Schüler_innen gleichermaßen erfüllt werden und ggf. zu Benachteiligungen führen kann, diskutiere ich in Kap. 6.3.3.3 im Abschnitt zum länderübergreifenden Vergleich.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

475

gleich und es werden die gleichen Bewertungsbegriffe (värdeord) wie in den Lehrplänen verwendet. Der zentrale Unterschied findet sich in der obersten Zeile, in der anstelle der Bezeichnungen für die Notenstufen E, C und A sogenannte „Stufen“ (steg) 1, 2 und 3 stehen (vgl. Abb. 15). steg 1 Eleven kan diskutera och framföra åsikter med enkla och till vissa del underbyggda argument.

steg 2 Eleven kan diskutera och framföra åsikter med utvecklade och relativt väl underbyggda argument.

steg 3 Eleven kan diskutera och framföra åsikter med välutvecklade och väl underbyggda argument.

Stufe 1 Schüler_innen können ihre Ansichten mit einfachen und zu gewissem Teil begründeten Argumenten ausführen und diskutieren.

Stufe 2 Schüler_innen können ihre Ansichten mit entwickelten und relativ gut begründeten Argumenten ausführen und diskutieren.

Stufe 3 Schüler_innen können ihre Ansichten mit gut entwickelten und gut begründeten Argumenten ausführen und diskutieren.

Abb. 15 – Auszug aus einem Beurteilungsraster der Lehrerin Barbro (Schwedischunterricht, Kl. 9, Thema: „künstlerischer Bericht“ – konstnärlig rapport), unten: Übersetzung und eigene Darstellung K.F.

Obwohl das abgebildete Beurteilungsraster stark an die Darstellung der Wissensanforderungen für die Noten E, C und A im Lehrplan erinnert, betont Barbro: „Das ist aufgeteilt in Stufe eins bis hoch zu Stufe drei. Aber das sind keine Noten. Das ist es nicht. Sondern, da geht es mehr darum, dass man nur seinen Lernfortschritt260 sehen soll“261 (Z. 135-137). Inwiefern die Schüler_innen diese vor allem semantische Unterscheidung zwischen Stufe und Zensur nachvollziehen können, wenn ansonsten die Darstellungsform und Formulierungen gleichbleiben, geht aus 260

Im Original wird von „kunskapsutveckling” gesprochen, was wortwörtlich mit „Wissensentwicklung” übersetzt werden müsste. Im Kontext des Zitats scheint mir jedoch „Lernentwicklung“ die passendere Übersetzung zu sein. 261 Original: „Sen är det uppdelat i steg ett, upp till steg tre. Men det är inte betyg. Det är det inte. Utan det handlar mer om bara att man ska kunna se sin kunskapsutveckling.” (Z. 135-137)

476

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

dem Material natürlich nicht hervor.262 Barbro betont jedoch an anderer Stelle, dass sie mit den Schüler_innen während des Unterrichts „wirklich selten über Noten“ sprechen würde, da diese auch nicht „interessant“ seien: „Zensur, Abschlusszeugnis oder Halbjahreszeugnis. Die sind für mich jedenfalls nicht so präsent. Während des Schuljahres. Wenn wir arbeiten. Das ist nicht das, was interessant ist. Wir sprechen wirklich selten über Noten und geben den Schüler_innen auch keine Noten auf ihre Aufsätze. Sondern da bekommen sie diese Matrizen stattdessen“263 (Z. 414-416).

Die Rückmeldebögen (oder Matrizen) haben in Barbros Augen einen viel höheren Stellenwert für die Begleitung des Lernprozesses der Schüler_innen, da hier die Lernziele verbalisiert werden und durch das Ausschraffieren der erreichten Stufen eine Visualisierung des Lernprozesses möglich ist. Die abschließenden Zensuren am Ende eines Kurses bzw. auf dem Zeugnis treten für sie währenddessen in den Hintergrund und werden offenbar auch sprachlich ausgeblendet, solange es sich um Rückmeldungen zum Lernprozess handelt. Auffällig ist in jedem Fall das bewusste Vermeiden von Benotungen im klassischen Sinne gegenüber den Schüler_innen, obwohl sie im Beispiel weiter oben davon spricht, dass sie die Arbeiten benoten würde und sich anschließend mit Christina über die Noten austausche (vgl. Beispiel oben, Z. 96-100). Dass dieses Bemühen um eine Trennung der Rückmeldeprozesse im laufenden Schuljahr und der finalen Benotung auf dem Zeugnis eng mit Barbros Vorstellungen einer gerechten Beurteilung zusammenhängt, wird im folgenden Ausschnitt noch deutlicher:

262

In Kap. 6.3.1.2 hatte ich bereits die Lehrerin Pernilla zitiert, die ebenfalls den Unterschied zwischen Zensurenniveau (betygsnivå) und Zensur (betyg) betont. 263 Original: „Betyg, slutbetygen eller terminsbetygen. De är inte så närvarande hos mig iallafall. Under terminen. När vi jobbar. Det är inte det som är det intressanta. Vi pratar väldigt sällan betyg och ger ju inte eleverna betyg på deras uppsatser. Utan då får de ju de här matriserna istället.” (Z. 414-416)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

477

„Denn wir denken, das ist eigentlich das wichtigste, die Beurteilungen im Unterricht anzuwenden, so dass die Schüler_innen das als Ausgangspunkt nehmen können, um besser zu werden. Und nich/ Und dann gibt es das summative am Schluss. Dass äh (..) man macht eine Beurteilung und gibt eine Note. Aber dann sind die/ Dann ist es sozusagen FERTIG. Da kann man nichts mehr beeinflussen. Also, das sind eigentlich zwei Sachen. [...] die gerechte Beurteilung liegt darin (.), wenn die Schüler_innen die Möglichkeit bekommen zu wissen: ‚Jetzt bin ich hier. Und ich soll dorthin. Und wie sollen wir da, was soll ich machen, um dahin zu kommen?‘ [...] Also man hat etwas, woran man arbeiten kann, anstatt herumzusitzen und zu warten, dass der/die Lehrkraft HINTERHER kommt, wenn man fertig ist[...]“ 264 (Z. 165-172)

Eine gerechte Beurteilung ist demnach eng mit der Gestaltung des Lernprozesses durch die Lehrkraft verwoben und erfordert in Barbros Augen einen permanenten Austausch der Schüler_innen mit ihrer Lehrkraft über den aktuellen Lernstand und weitere den Lernprozess unterstützende Maßnahmen. Eine Rückmeldung allein zum Ergebnis eines solchen Prozesses wäre hingegen unzureichend, denn „nur auf das FERTIGE Produkt zu schauen ist ja nicht gerecht“ („att bara titta på den FÄRDIGA produkten är ju inte rättvist“, Z. 325). Eine rein auf summativen Benotungen fußende Leistungsbeurteilung lehnt Barbro somit kategorisch als ungerecht ab. Deutlich wird in diesem Auszug aber auch, dass die permanente Evaluation des Lernstands und Anpassung des Unterrichts daran auch von den Schüler_innen eine aktivere Rolle erfordert und Barbro sie zur Verantwortungsübernahme für ihren eigenen Lernprozess auffordert. Das oben eingeführte „fortwährende Gespräch“ zwischen Lehrkraft und Schüler_innen entpuppt sich dabei als Ausdruck einer kontinuierlichen Evaluation und Anpassung auf beiden Seiten. Barbro bringt diese aktive Rolle 264

Original: „För det är det vi tycker är viktigast egentligen att använder bedömningen i undervisningen så att eleverna får det som en utgångspunkt för att bli bättre. Och int/ och sen har vi ju det summativa i slutet. Att eh (..) man gör en bedömning och sätter ett betyg. Men den är de i/ då är det ju liksom FÄRDIGT. Det kan man ju inte påverka. Så det är ju två saker egentligen. [...] den rättvisa bedömningen ligger ju i den (.), där eleven får möjlighet att veta: ,Nu är jag här. Och jag ska dit. Och hur ska vi då, hur ska jag göra för att komma dit.’ [...] Men man har något att jobba mot då istället för att man ska sitta och vänta på att läraren kommer EFTERÅT, när man är färdigt [...]” (Z. 165-172)

478

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

der Schüler_innen folgendermaßen auf den Punkt: „Das bin nicht ICH, die die Note vergibt, sondern das bist DU als Schüler_in, die zeigen muss, was du kannst. Und was du zeigst, dass du es kannst, DAS ist das, was ich beurteile“265 (Z. 315-316). Hier werden Lernfortschritte und schulische Leistungen als etwas aktiv Herzustellendes und von den Schüler_innen auch zu Zeigendes charakterisiert, womit gewissermaßen das Gegenstück zur eingangs zitierten Verantwortung auf Seiten der Lehrkraft „LERNsituationen [zu schaffen], in denen die Schüler_innen beteiligt und aktiv sein sollen“ (Z. 293), benannt ist. Inwiefern eine solche selbstreflexive Haltung gegenüber dem eigenen Lernprozess von Schüler_innen erwartet werden kann, und wie sich verschiedene Schüler_innengruppen gegenüber dieser Anforderung verhalten, lässt sich anhand des vorliegenden Materials nicht rekonstruieren. Allerdings thematisiert Barbro selbst an anderer Stelle noch einmal die Rolle einer als formativ verstandenen Beurteilung für die Anpassung des Unterrichts an unterschiedliche Lerntempi von Schüler_innen: „Es geht nicht um die Note, das ist nicht das wichtigste, eigentlich. Sondern das Wichtigste bei der Beurteilung ist, dass man sieht wer schnell lernt. Äh so, dass die auch Herausforderungen bekommen und weiterlernen können. Und wer vielleicht ein bisschen langsamer lernt. Und wer es SCHWER hat. So, dass ALLE die Möglichkeit bekommen, so gut zu werden, wie sie können.“266 (Z. 319-322)

Hier wird noch einmal Barbros Perspektive auf die schulische Leistungsbeurteilung als diagnostisches Hilfsmittel deutlich, mit der sie die unterschiedlichen Lernvoraussetzungen und –geschwindigkeiten ihrer Schüler_innen identifizieren und die gewonnenen Informationen für didaktische Anpassungen des Unterrichts nutzen kann. In der Formulierung, 265

Original: „Det är inte JAG som sätter betygen utan det är DU som elev som måste visa vad du kan. Och det du visar, att du kan, det är DET jag bedömer." (Z. 315-316) 266 Original: „Det är ju inte betyget, är ju inte det viktigaste, egentligen. Utan det viktigaste med bedömningen är ju att se, vilka som lär sig fort. Eh så att de också får utmaningar och kan fortsätta att lära sig. Och vilka som lär sig kanske lite långsammare. Och vilka som har SVÅRT. Så att ALLA får möjlighet att bli så bra, som de kan.” (Z. 319322)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

479

„dass ALLE die Möglichkeit bekommen, so gut zu werden, wie sie können“ drückt sich zudem ihr Wunsch aus, allen Schüler_innen in ihren individuellen Lernbedürfnissen gerecht werden zu können. Auffällig ist hier auch die Beschreibung der Schüler_innen als „schnell“ oder „langsamer“ lernend: hier liegt der Fokus offenbar mehr auf der Geschwindigkeit, in der Schüler_innen Neues erlernen und ihre Fähigkeiten weiterentwickeln können, es wird jedoch nicht an der grundsätzlichen Lernund Leistungsfähigkeit der Schüler_innen gezweifelt, wie dies bei Charakterisierungen als ‚leistungsschwache‘ vs. ‚leistungsstarke‘ Schüler_innen und der Orientierung an einer vorhandenen oder nicht vorhandenen Begabung häufig mitschwingt. Barbros Leistungsbegriff entspricht dagegen eher dem eines grundsätzlich vorhandenen Potenzials, das Schüler_innen haben und das es durch passende Angebote und Herausforderungen im Unterricht zu entwickeln gilt. In ihren eigenen Worten fasst sie diese Haltung folgendermaßen zusammen: „Ich würde mich riesig freuen, wenn ich allen Schüler_innen ein A geben könnte. Das ist sozusagen ein bisschen mein Ausgangspunkt“267 (Z. 323-324). Grundsätzlich sollen also alle Schüler_innen die beste Note erreichen können, die Aufgabe der Schule wäre demnach, die optimalen Voraussetzungen für die individuellen Bedürfnisse und Lernvoraussetzungen der Schüler_innen zu schaffen. Mit der Aussage, dass grundsätzlich alle Schüler_innen die Möglichkeit haben sollten, die Bestnote zu erreichen, lehnt Barbro gleichzeitig eine Beurteilung auf der Grundlage der sozialen Bezugsnorm ab, die die Schüler_innen nicht individuell, sondern nur im Vergleich zu ihrer jeweiligen Lerngruppe beurteilen würde. Im folgenden Auszug zeigt sich zudem, dass sie einer an der Normalverteilung orientierten Beurteilung deutlich ablehnend gegenübersteht – stattdessen sei ausschließlich eine individuelle Beurteilung auf der Grundlage der im Lehrplan vorgegebenen Lernziele legitim:

267

Original: „jag skulle vara super glad, när jag skulle kunna ge A till alla elever. Det är liksom lite det som är min utgångspunkt då.

480

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

„Aber ich darf NIEMALS die Note geben, indem ich meine Gruppe abstufe. Denn in einer Klasse sollen alle im Prinzip die Möglichkeit haben (.) die Note A zu bekommen, wenn man die Anforderungen erfüllt in=in (.) der Notentabelle oder den Wissensanforderungen. Also es ist nie so, dass ich sie abstufen darf. Untereinander innerhalb der Gruppe.“268 (Z. 279-282)

Hier wird deutlich, dass Barbros grundsätzliche pädagogische Haltung allen Schüler_innen die Möglichkeiten zu geben die Bestnote A zu erreichen nicht verwechselt werden darf mit der tatsächlichen Beurteilung. Für diese ist ein Abgleichen der Leistungen mit den Anforderungen im Lehrplan notwendig, bei dem weder das Abschneiden der Schüler_innen im Vergleich zu ihrer Lerngruppe (soziale Bezugsnorm) noch der individuelle Lernfortschritt, also das Abgleichen der aktuellen Leistungen mit früheren Leistungen (individuelle Bezugsnorm), legitim sind. Dass eine relative Beurteilung, bei der die Schüler_innen also im Vergleich zueinander beurteilt werden, im Beurteilungsalltag für die Lehrkräfte aber auch Vorteile haben kann, räumt Barbro zumindest teilweise ein, wenn sie sagt: „Beim relativen Beurteilungssystem von 1 bis 5, da war das so. Da war das so. Da sollte man die Schüler_innen miteinander vergleichen. Das war schon ungerecht eigentlich. Trotzdem war das leichter eine Note zu geben“269 (Z. 491-493). Obwohl Barbro das alte Beurteilungssystem also als im Grunde ungerecht bezeichnet, da es weder den individuellen Lernfortschritt der Schüler_innen noch die Orientierung an den Lehrplänen voraussetzte, weist sie darauf hin, dass es für sie als Lehrerin in diesem System „leichter [war] eine Note zu geben“. Dass dieses „leichter“ sein sich vermutlich auf die Schwierigkeiten bei der Interpretation der Vorgaben des aktuellen, lernzielorientierten Beurteilungssystems bezieht, wird im nächsten Abschnitt herausgearbeitet. 268

Original: „Men jag kan ju ALDRIG sätta betyg genom att i min grupp graderar. För i en klass så ska ju alla i princip kunna ha möjlighet (.) att få betyg A utifrån om man uppnår då de här kräven i=i (.) betygstabellen eller kunskapskraven då. Så det är ju aldrig så att jag får gradera de. Inbördes med varandra i gruppen.” (Z. 279-282) 269 Original: „I det relativa betygssystemet från ett till fem, då var det ju. Då var det ju. Då skulle man ju jämföra eleverna i klassen med varandra. Det var ju väldigt orättvist egentligen. Fast det var lättare att sätta betyg.” (Z. 491-493)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

481

Gemeinsame Interpretation der Vorgaben: „Wo ist die Grenze?“ Wie weiter oben bereits herausgearbeitet wurde, stellt die permanente Abstimmung mit ihrer Kollegin Christina eine zentrale Beurteilungsstrategie zur Sicherung einer in ihren Augen gerechten Beurteilung für Barbro dar. Diese diskursiven Aushandlungen sind auch deshalb so wichtig, weil Barbro sich mit dem 2010 veränderten Beurteilungssystem und der neuen Notenskala nach wie vor schwertut und dieses auch scharf kritisiert: „Ich muss EHRLICH sagen, dass das Beurteilungssystem, das wir jetzt haben, ich finde das nicht gut. (.) Weil, wenn man schon über gerechte Beurteilung spricht, das kann niemals gerecht werden. Weil es ähm (6) es ist sehr subjektiv [...]“270 (Z. 185-187). Im weiteren Verlauf des Interviews wird deutlich, dass ihre Kritik sich vor allem auf die Zensurenvergabe am Ende eines Kurses und die Zeugniserstellung am Ende des Halbjahres bezieht, nicht jedoch auf die Phasen der formativen Rückmeldung während des Halbjahres, in denen keine Noten vergeben werden, sondern vor allem die Rückmeldebögen mit den „Stufen“ zum Einsatz kommen. Für die Erstellung der Zeugnisnoten jedoch müssen die vielfältigen Eindrücke aus dem Unterricht und zum Lernprozess der Schüler_innen, die in den Beurteilungsbögen erfasst wurden, zu einer einzelnen Note verdichtet und die erbrachten Leistungen abschließend bewertet werden: „Dann übertragen wir das und dann müssen wir bewerten“ („Så då flyttar vi ju över, då måste vi ju värdera”, Z. 200). Hier verwendet Barbro auch nicht mehr das Verb bedöma (beurteilen, einschätzen), sondern spricht von värdera (bewerten, messen) – eine linguistische Feinheit, die jedoch die Bedeutung des abschließenden Notengebens (värdera) im Unterschied zur lernprozessbegleitenden Beurteilung und Rückmeldung (bedöma) deutlich macht. Anders als bei den fortlaufenden Rückmeldungen im Unterricht müssen Barbro und Christina sich für die Zeugnis270

Original: „jag ska ÄRLIGT säga att det betygssystemet som vi har nu, tycker jag inte är bra. (.) Därför att, om man nu ska prata rättvis bedömning, så kan det aldrig blir rättvist. Därför att ehm (6) det är väldigt subjektivt [...]” (Z. 185-187)

482

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

noten endgültig festlegen, welche Wissensanforderungen von den Schüler_innen erfüllt wurden und welche nicht – was ihnen offensichtlich schwer fällt. Die Lösung findet sich für beide in der gemeinsamen Besprechung der Beurteilungsgrundlagen und diskursiven Aushandlung dessen, was sie in die finale Benotung einbeziehen und wie sie die Benotungsvorgaben im Lehrplan interpretieren. Insbesondere die Unterscheidung der Wissensanforderungen (kunskapskrav) für die drei Notenstufen A, C und E mit Hilfe der Bewertungsbegriffe (värdeord) stellt sich dabei als schwierig heraus: „Und da kann man schon diskutieren: ,Was ist EINFACH und was ist HAUPTSÄCHLICH?‘ [...] Ja. WO IST DIE GRENZE? Haben wir IRGENDWAS, woran wir (..) gibt es irgendein nationales äh/ Es gibt Kommentarmaterial dazu. Aber das ist=das ist sehr schwer zu verstehen. Also da fühlen wir uns als Lehrkräfte wirklich ein bisschen ausgeliefert.“271 (Z. 203-207)

Bei der abschließenden Beurteilung tritt die Orientierung an den Lehrplänen und Vorgaben sehr stark in den Vordergrund. Gleichzeitig wird deutlich, dass die Übersetzung dessen, was in den Wissensanforderungen der Lehrpläne und den dazugehörigen Kommentarmaterialien steht, und dem, was die Schüler_innen im Laufe des Halbjahres gezeigt haben, keine triviale Aufgabe ist. Barbros Gefühl als Lehrkraft „wirklich ein bisschen ausgeliefert“ zu sein, verweist dabei auf ihren Zwiespalt eine den Vorgaben entsprechende Benotung vornehmen zu wollen, gleichzeitig aber unsicher darüber zu sein, wie eine solche regelkonforme Benotung im konkreten Fall aussehen müsste. Die wenig hilfreichen Kommentarmaterialien („schwer zu verstehen“) müssen daher von den beiden Lehrerinnen gedeutet und diese Deutungen wiederum in der kollegialen Auseinandersetzung legitimiert werden. 271

Original: „Och då kan man ju diskutera: ”Vad är ENKELT och vad är I HUVUDSAK?” [...] Ah. VAR GÅR GRÄNSEN? Här har vi INGENTING som vi kan (..) finns ingen nationell eh/ Det finns kommentarmaterial till det här. Men det är=det är jätte svårt att förstå. Så här känner vi oss lärare lite utlämnade faktiskt.” (Z. 203-207)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

483

Ähnlich verhält es sich mit den Ergebnissen der standardisierten Tests in Klasse 9 (nationella prov), die von Barbro zwar als „Richtwerte“ für die eigene Beurteilung und Zeugnisnote bezeichnet, aber auch erst in der gemeinsamen diskursiven Deutung zu Hilfsmitteln ihrer Beurteilung werden: „Das ist so der Richtwert. Die sind nicht zeugnisrelevant. Das ist ja keine Abschlussprüfung. Aber wir sollen sie schon (.) DABEI haben, wenn wir beurteilen. Und da soll man/ Gewöhnlich diskutieren wir so: ,Aha, das hier/ Das hier ist, wenn es um Leseverstehen geht, dann sagen sie, dass das hier okay ist. Was sind das für Aufgaben, die unsere Schüler_innen bekommen haben? Ah, vielleicht sind sie ein bisschen zu schwer, da haben wir vielleicht/‘. Also, das ist ein gutes Training. Aber vielleicht müssen wir ein wenig ändern, wie wir über die Beurteilung gedacht haben, von vorher.“272 (Z. 448-453)

Auch wird deutlich, wie sich Barbro und Christina durch die gemeinsame Diskussion der Beispielaufgaben in den Kommentarmaterialien für die nationella prov ein geteiltes Beurteilungs- und Leistungsverständnis erarbeiten und fortlaufend anpassen. Die diskursive Annäherung der Perspektiven der beiden Lehrkräfte wird von ihr als „gutes Training“ beschrieben, wodurch ihr Blick auf die eigene Beurteilungskompetenz als etwas Prozessuales und im Grunde Unabschließbares erneut durchscheint. Die fortlaufende diskursive Arbeit an einem kollegial geteilten Beurteilungsverständnis wirkt sich dabei auch auf die miteinander verzahnten Prozesse der Unterrichtsgestaltung und Lernprozessbeurteilung aus, wie im letzten Auszug verdeutlicht werden soll. So sind es nicht nur Barbro und ihre Kollegin Christina, die sich über Fragen der Leistungsbeurteilung austauschen, vielmehr findet diese diskursive Aushandlung im ge272

Original: „Det är ju det som är riktmärket. De är ju inte betygssättande. Det är ju inga examensprov. Men vi ska ju ha de (.) MED, när vi bedömer. Och där får man/ Där brukar vi ju diskutera: ,Aha. Det här/ Där här är, när det gäller läsförståelse, så tycker de att det här är okej. Vad är det för uppgifter, våra elever har fått? Ah det kanske är lite för svåra då kanske vi har/’ Alltså det är ju bra träning. Men då kanske vi måste ändra lite om hur vi har tänkt lite kring hur vi har tänkt kring betygssättningen, innan och så.” (Z. 448-453)

484

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

samten Fachbereich statt und zielt auf die Verzahnung und Gestaltung des Schwedischunterrichts von der Vorschulkasse bis hoch zur 9. Klasse: „UNSERE äh IDEE ist die, gleich von Beginn an. Dadurch, dass wir sie ab der Vorschulklasse haben, setzen wir uns als Fachbereich zusammen, Fachbereich Schwedisch. Mit ALLEN Lehrkräften, die Schwedisch unterrichten in allen Jahrgängen auf dem ganzen Weg. Und da diskutieren wir: ‚Das hier soll man in der Neunten können, womit beginnen wir in der Ersten, damit man dorthin kommt?‘ So macht man es die ganze Zeit. Da setzen wir die Ressourcen so früh wir nur können ein.“273 (Z. 466-469)

Der im Kollegium abgestimmte Unterricht über die verschiedenen Jahrgänge hinweg wird hier als Bedingung für den Lernerfolg der Schüler_innen skizziert, der einen kontinuierlichen Austausch zwischen und die Zusammenarbeit aller Kolleg_innen voraussetzt. Die oben beschriebenen kontinuierlichen Abstimmungsprozesse zwischen Barbro und Christina sind also auch Teil der insgesamt auf Abstimmung und kollegialer Zusammenarbeit basierenden pädagogischen Arbeit an dieser Schule.

Zusammenfassung: Barbro Gerechte Beurteilungen basieren in Barbros Augen vor allem auf zwei diskursiven Aushandlungsprozessen: einerseits die kontinuierliche Rückmeldung an Schüler_innen zu ihrem Lernprozess durch formative Leistungsbeurteilungen und die diskursive Aushandlung dessen, was die Erwartungen an Schüler_innenleistungen sind bzw. wie ‚Leistungen‘ sich überhaupt zusammensetzen; andererseits durch die fortwährende Abstimmung im Kollegium und diskursive Herstellung eines geteilten Beurteilungsverständnisses. Die zentralen Lehrpläne und daraus abgeleiteten Beurteilungsraster dienen hier vor allem als Ausgangspunkt für diese 273

Original: „VÅR eh:h TANKE är ju, redan från början. I och med att vi har de från förskoleklassen så då träffas vi ju i ämnesgruppen, ämnesgruppen svenska. Med ALLA lärare som undervisar i svenska i alla årskursen hela vägen. Och där diskutera ju vi: ,Det här ska man kunna i nian, vad börjar vi med i ettan så att man ska nå dit?’ Så går man här hela tiden. Så där sätter vi ju in resurser så tidigt som vi bara kan.” (Z. 466-469)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

485

diskursiven Aushandlungsprozesse, indem die zunächst individuell vorgenommenen Interpretationen im kollegialen Austausch abgeglichen und schließlich durch die Perspektiventriangulation mehrerer Lehrkräfte legitimiert werden. Eine solcherart kollegial geteilte Beurteilung wird von Barbro als „gleichwertig“ (likvärdig) und damit gerechter beurteilt, als Beurteilungen, die nur von einer einzelnen Lehrkraft vorgenommen wurden. 6.3.3.3 Fallübergreifender Vergleich Wie bereits in den Kapiteln zur mathematisch-rechnerischen und prozedural-bürokratischen Gerechtigkeitsüberzeugung wird an dieser Stelle die Perspektive von den Einzelfällen schrittweise erweitert, indem zunächst der Fall Frau Ahle-Demmerer mit anderen Lehrkräften des nordrhein-westfälischen Samples und der Fall Barbro mit anderen Lehrkräften des schwedischen Samples verglichen werden, um anschließend im länderübergreifenden Vergleich unter Rückbindung an die jeweiligen institutionellen Rahmungen die Besonderheiten der diskursivinteraktiven Gerechtigkeitsüberzeugungen herauszuarbeiten und gegenüber den anderen drei Gerechtigkeitsüberzeugungen abzugrenzen.

Der Fall Frau Ahle-Demmerer im Vergleich zu anderen nordrheinwestfälischen Lehrkräften Wie in Frau Ahle-Demmerers Falldarstellung deutlich wurde, stellt die enge Beziehung zu ihren Schüler_innen verbunden mit diskursiven Aushandlungen im Klassenrat eine wichtige Grundlage für eine in ihren Augen gerechte Beurteilung dar. Sie räumt ihren Schüler_innen dabei große Mitsprachemöglichkeiten ein, teilweise auch über den gesetzlichen Rahmen hinaus, wie am Beispiel der Diskussion um die Vergabe des Hauptschulabschlusses an einen geflüchteten Jugendlichen nach nur wenigen Monaten an der Schule deutlich wurde. Frau Ahle-Demmerer

486

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

wird dabei grundsätzlich von der Schulleitung gestützt und es gibt schulinterne Absprachen, die vom Kollegium mitgetragen werden. Im Vergleich mit ihren nordrhein-westfälischen Kolleg_innen im Sample fällt auf, dass diese weitreichende Beteiligung der Schüler_innen bei Fragen der Leistungsbeurteilung und insbesondere bezüglich der Zeugnisnoten und Schulabschlüsse eine Besonderheit darstellt. Typischer scheint hingegen eine eher symbolische Beteiligung der Schüler_innen, die vor allem darauf abzielt bereits getroffene Beurteilungen nachträglich durch die Schüler_innen diskursiv legitimieren zu lassen. Dabei werden unterschiedliche Formen der Rückmeldung von Quartals- oder Halbjahresnoten verwendet, die eine mehr oder weniger diskursive Beteiligung der Schüler_innen ermöglichen. So äußert sich beispielsweise Frau Dr. Gröhlich, die Deutschlehrerin am Gymnasium aus Kapitel 6.3.2.3, die das Ausbleiben von „Diskussionen“ seitens der Schüler_innen auf die „Scheinobjektivität“ der von ihr verwendeten Erwartungshorizonte bei schriftlichen Arbeiten zurückführt, zur Rückmeldung der mündlichen Noten folgendermaßen: „Dass die Schüler dann zum Halbjahr Osterferien, Herbstferien wirklich eine Note mündlich genannt bekommen. Und zwar auch alleine. Nicht vor der ganzen Klasse. Ne? Dann auch sagen können: ‚Äh, damit bin ich einverstanden oder nicht einverstanden.‘ Und dann unterhält man sich noch mal drüber. Und gibt die Möglichkeit für Referate. So solche Dinge.“ (Z. 511-515)

Einerseits legt Frau Dr. Gröhlich Wert darauf, dass ihre Schüler_innen über das Zustandekommen der Zeugnisnoten informiert werden und versucht daher die Beurteilungskriterien möglichst offenzulegen („Transparenz der Note“, vgl. Kap. 6.3.2.3). Andererseits findet eine Einbeziehung der Schüler_innen nur sehr reglementiert zu festen Zeitpunkten im Schuljahr („Osterferien, Herbstferien“) statt. Das Einverständnis der Schüler_innen wird also dann eingeholt, wenn die Note bereits von ihr erstellt wurde. Bei Unzufriedenheit mit einer Note gibt es anschließend die Möglichkeit in der folgenden Zeit eine zusätzliche Leistung zu erbringen („gibt die Möglichkeit für Referate“) und die Note dadurch zu verbessern, eine Korrektur der bereits erstellten und ggf. als ungerechtfertigt empfundenen Benotung ist jedoch nicht möglich. Die Beteiligung

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

487

der Schüler_innen bleibt also auf das retrospektive Legitimieren durch Zustimmung zu den mündlichen Noten beschränkt. Frau Amberg, ebenfalls Deutschlehrerin an einem Gymnasium, berichtet davon, dass es an ihrer Schule üblich sei, die Schüler_innen im Zuge der Rückmeldung der Halbjahresnoten zu einer Selbsteinschätzung ihrer Leistungen aufzufordern und darüber ins Gespräch miteinander zu kommen: „Ähm, also was oft gemacht wird, ist, dass man halt auch so Selbsteinschätzungen von den Schülern ähm (.) also nach Selbsteinschätzungen fragt und dann halt irgendwie guckt, ne?, (.) wie schätzen die sich selber ein, das auch begründen müssen. Und dass man halt darüber dann in ein Gespräch kommt auch mit den Schülern, wie sehe ich dich, wie siehst du dich und so.“ (Z. 80-83)

Im weiteren Verlauf des Interviews wird jedoch deutlich, dass die Selbsteinschätzungen der Schüler_innen von Frau Amberg hauptsächlich als „Gesprächsgrundlage“ (Z. 120) im Sinne eines Kommunikationsanlasses genutzt werden, die eigentliche Benotung basiert auf ihren regelmäßig angefertigten Notizen zur mündlichen Mitarbeit und wird nicht durch die Selbsteinschätzungen der Schüler_innen ergänzt oder korrigiert. Dass es hierbei auch mal zu größerem Unverständnis kommen kann, zeigt eine Episode über eine Schülerin, die sich selbst besser eingeschätzt hatte als Frau Amberg und das Gespräch suchte, um sich die Note erklären zu lassen: „Und dann habe ich ihr halt nochmal genau erklärt/ habe ich ihr halt auch meine Liste gezeigt, eben wie ich das mache und ähm (.) habe halt gesagt: [...] Und wenn ich mir das halt jetzt so angucke, dann ist das einfach so, dann komme ich da jetzt nicht auf eine Zwei, sondern dann ist es halt eben im befriedigenden Bereich. Was ja aber nicht heißt, dass es das nächste Mal nicht besser sein kann. [...] Und am Anfang war es halt teilweise auch mal eher im=im ausreichenden Bereich oder sie hat sich gar nicht beteiligt oder so. (.) Und dann habe ich halt gesagt: ‚Aber du siehst ja, man sieht so eine Entwicklung nach oben. Also das wird halt auch besser. Nur zum jetzigen Zeitpunkt kann ich dir halt noch keine Zwei minus geben. Aber wenn du so weiterarbeitest, dann (.) klappt das halt, denke ich mal, in der nächsten Zeit!‘. Und dann hat die echt total angefangen [lachend] zu weinen und hat dann gesagt, sie würde sich aber so ungerecht behandelt fühlen und sie würde sich selber viel besser einschätzen.“ (Z. 154-173)

488

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Frau Amberg gibt zwar an, der Schülerin „genau erklärt“ zu haben, wie ihre mündliche Note zustande kam, aus den folgenden Ausführungen wird jedoch nicht deutlich, was genau die Schüler_in getan oder nicht getan hat, vielmehr rechnet Frau Amberg ihr die Zusammensetzung der Einzelnoten vor, auf deren Grundlage sie eine Drei minus vergeben habe. Es werden wenig konkrete Anhaltspunkte für eine mögliche Verbesserung gegeben („wenn du so weiterarbeitest“), auch bleiben die zu Grunde liegenden Kriterien sehr schwammig. Die Reaktion der Schülerin ist entsprechend emotional, was von Frau Amberg eher verwundert aufgenommen wird. Hier wird deutlich, wie schwierig insbesondere in Bezug auf die mündlichen Noten die diskursive Vermittlung der getroffenen Beurteilungen werden kann, weshalb diese Aushandlungen häufig nur als symbolische Beteiligung der Schüler_innen stattfinden. Eine weitere Form der symbolischen Einbindung der Schüler_innen findet sich am Beispiel von Frau Ehrl, der Mathematiklehrerin aus Kapitel 6.3.1.1 (mathematisch-rechnerische Gerechtigkeitsüberzeugung): „ich sage den Schülern vorher (.) allen dann, bevor ich die mündlichen Noten sage, [...] dass sie gerne kommen sollen, wenn sie irgendwie das nicht in Ordnung finden. Dass sie mir das auch (.) wirklich sagen sollen. Dass ich aber die Note nicht ändere. (.) Weil ich finde, dass/ es ist völlig klar, dass diese soMi-Noten (.) ähm MEIN subjektiver Eindruck sind. (.) [...] Und ähm ich versuche das (.) gut und passend zu machen. Ähm (.) und ich sage den Schülern dann immer, wenn (.) wenn sie das anders sehen, sollen sie mir es sagen. Dann werde ich darauf achten. (.) Eben äh wirklich noch mal genau darauf achten. Der Schüler hat ja vielleicht ein Argument. Und äh ich kann dann in den nächsten Wochen, im nächsten Quartal (.) ähm erkenne ich vielleicht: Okay, der hat Recht. Und dann kann ich/ dann mache ich das auch mit der Note anders. Ähm (.) Aber ist weil/ ist ja trotzdem so gewesen, dass in dem Quartal vorher eben mein Eindruck ein anderer war.“ (Z. 417-429)

Frau Ehrl führt an, dass sie um die Prekarität ihrer Beurteilungen der mündlichen Leistungen weiß („subjektiver Eindruck“), sie werden als grundsätzlich hinterfragbar und korrigierbar gerahmt. Die Aufforderung zur Kritik an ihrer Notengebung ist jedoch aus Schüler_innensicht nur eine halbherzige, da sie zwar auffordert sich bei Unzufriedenheit bei ihr zu melden, gleichzeitig aber ankündigt, nichts an der Note zu verändern. Erst wenn der durch die Schüler_innen angeregte Verdacht, sie hätte

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

489

etwas übersehen oder ihr Urteil würde nicht der Beteiligung der betroffenen Schüler_innen entsprechen, erst wenn dieser Verdacht sich im kommenden Quartal bestätigt, wird der Einwand der Schüler_innen in ihre Beurteilung einfließen. Es handelt sich also um eine in der Zukunft liegende, potentielle Chance auf eine Notenverbesserung, um die sich die Schüler_innen erneut bemühen müssen. Die bereits getroffene Beurteilung wird von ihr nicht widerrufen, durch das Ritual des NoteVorlesens jedoch von der Klasse legitimiert.

„Diskussionen“ mit Schüler_innen zwischen symbolischer Beteiligung und Infragestellung der eigenen Beurteilungskompetenz Frau Pohle-Hanewinkel unterrichtet die Fächer Deutsch und Sport an einem Gymnasium und berichtet im Interview, wie die Schüler_innen im Laufe des Schuljahres Rückmeldungen zu ihren Leistungen bekommen: „[...]die Schüler können jederzeit bei mir erfragen ähm, wie sie stehen [...] Und dann ähm können die eigentlich immer fragen. Äh bei denen, die sehr, sehr ähm stark rausfallen und wenig sagen, gehe ich schon mal hin und sage: ‚Du musst Dich mehr beteiligen.‘ Dass ICH dann auch auf die Schüler zugehe. Bei allen anderen ähm können die das bei mir erfragen, aber ähm meistens, wenn ich die erste Klassenarbeit dann zurückgebe, gebe ich auch ähm=gehe ich mal rum und sage allen kurz: ‚Im Mündlichen äh bist Du besser. Jetzt sei wegen der Vier nicht so betrübt. Äh ne, da hast Du einen Ausgleich.‘ Mehr so diese Gesamtsituation. Wie das Schriftliche ausgefallen ist und dann gehe ich auch rum und gebe denen so einen Eindruck, wie ich im Mündlichen mit der Leistung zufrieden bin.“ (Z. 267-283)

Während die Rückmeldung zu den schriftlichen Arbeiten anhand eines detaillierten Beurteilungsbogens erfolgt, den die Schüler_innen zusammen mit der Klassenarbeit erhalten, verfährt Frau Pohle-Hanewinkel bei den mündlichen Noten eher nach dem Prinzip der Rückmeldung auf Nachfrage („Schüler können jederzeit bei mir erfragen“). Lediglich bei auffälligen Abweichungen in der mündlichen Mitarbeit („sehr, sehr stark ähm rausfallen“) wird sie selbst aktiv und spricht die Schüler_innen auf ihre unzureichende Beteiligung am Unterrichtsgeschehen an. In der Betonung „dass ICH dann auf die Schüler zugehe“ wird deutlich, dass sie

490

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

dies als besonderes Engagement ihrerseits versteht, als großzügiges Entgegenkommen, das keine Selbstverständlichkeit darstellt. Neben der Rückmeldung auf Nachfrage findet im Zuge der Rückgabe der schriftlichen Klassenarbeiten ein ritualisierter Austausch über den aktuellen Lernstand der Schüler_innen statt, indem Frau Pohle-Hanewinkel den Schüler_innen zusätzlich zur schriftlichen Note auch ihren „Eindruck“ zum mündlichen Leistungsbereich mitteilt. Diese kurzen Rückmeldungen werden dabei von ihr auch zur Motivation einzelner Schüler_innen genutzt wird („sei wegen der Vier nicht so betrübt“), indem beide Beurteilungsbereiche zueinander ins Verhältnis gesetzt und einzelne Noten von ihr relativiert werden. Ihr Hinweis auf die „Gesamtsituation“ der Schüler_innen, die es zu beachten gelte, findet sich immer wieder im Verlauf des Interviews (z.B. „Schüler als Ganzes mit im Auge haben“, Z. 397), woraus sich eine lernprozessorientierte Perspektive ableiten lässt, die auf eine holistische Beurteilung der Schüler_innenleistungen abzielt. Die Kehrseite dieser Orientierung stellt jedoch die relative Vagheit ihrer Rückmeldungen dar, die für die Schüler_innen unter Umständen wenig selbsterklärend sein kann. Frau Pohle-Hanewinkel spricht auch davon, dass es ihr wichtig sei, ein „Miteinander“ mit den Schüler_innen anzustreben und nah an den Schüler_innen zu sein, um auch besser einschätzen zu können, warum Schüler_innen beispielsweise ihre Hausaufgaben nicht machen oder im Sportunterricht fehlen. Das Erklären der Anforderungen vor einer Beurteilung fällt für sie ebenfalls in dieses „Miteinander“: „Aber ich denke das hat ja auch Gründe und=und ich möchte da jetzt auch keinen so ins Messer laufen lassen, oder so sagen: ‚Ich bin jetzt Lehrer und habe dieses hohe Amt und=und ähm doziere nur nach oben oder von oben weg.‘ Ich glaube dieses Miteinander, vielleicht liegt das auch an meinem zweiten Fach Sport, ähm ist mir sehr wichtig.“

Ähnlich wie bei Frau Ahle-Demmerer wird hier eine enge Beziehung zwischen Lehrkraft und Lerngruppe sowie der regelmäßige Austausch als Voraussetzung für eine von allen Seiten als gerecht empfundene Leistungsbeurteilung entworfen. Voraussetzung dafür sei auch, dass Schüler_innen die Beurteilungskriterien kennen („die Schüler brauchen schon

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

491

so gewisse Kriterien [...] an denen Sie sich [...] entlanghangeln können“, Z. 461-462), gleichzeitig müssten die Unterschiede zwischen Beurteilungen innerhalb der Lerngruppe nachvollziehbar sein (vgl. Z. 442-445). Hier sieht Frau Pohle-Hanewinkel jedoch einen grundsätzlichen Unterschied zwischen ihrer eigenen Beurteilungsfähigkeit und der Perspektive der Schüler_innen: „Äh das kann ICH ja viel besser als Profi oder als=als äh Lehrer unterscheiden. Da sind die natürlich jetzt nicht so ähm (.) in der Lage, Dinge zu entscheiden oder zu bewerten wie ich das kann. Aber ich bin gerne bereit ähm, meine Noten zu erklären. Aber ich werde nicht über meine Noten DISKUTIEREN.“ (Z. 446-449)

Während Frau Ahle-Demmerer also ihren Schüler_innen verhältnismäßig viele Mitsprachemöglichkeiten einräumt und ihre Schüler_innen auch bei Beurteilungsfragen quasi auf Augenhöhe betrachtet, verläuft für Frau Pohle-Hanewinkel hier eine klare Trennlinie zwischen der Lehrerin als professioneller Beurteilerin und den zu beurteilenden Schüler_innen. Ihr „Miteinander“ mit den Schüler_innen schließt – anders als die umfassende Wir-Konstruktion bei Frau Ahle-Demmerer – die schulische Leistungsbeurteilung und insbesondere die Zeugnisnotenvergabe nicht mit ein. Frau Pohle-Hanewinkel unterscheidet zudem zwischen einem legitimen „meine Noten zu erklären“ und dem illegitimen „über meine Noten DISKUTIEREN“. Die Rolle der Schüler_innen in der diskursiven Aushandlung wird also darauf beschränkt Informationen von der Lehrerin einzuholen („erfragen, wie sie stehen“) und diese Informationen anschließend auch erläutert zu bekommen. Ein weiteres Hinterfragen oder gar Widerspruch gegen die von der Lehrerin vergebenen Noten werden als illegitime „Diskussion“ abgelehnt und sind in diesem Aushandlungsprozess nicht vorgesehen. Als Begründung für diese Begrenzung führt Frau Pohle-Hanewinkel folgendes aus: „Ich ähm sage: ‚Ich erkläre Dir das kurz, aber dann rede auch nur ICH.‘ Und wenn das dann als Erklärung nicht reicht, als Darlegung der Notenfindung, dann kann man gern nochmal nachfragen. Aber ich lasse mich nicht so auf=auf=auf Diskussionen ein. Das ist auch so ein gewisser Selbstschutz, denn das führt dann eigentlich äh zu Irritationen aller oder=oder vielleicht auch zu einer Unsicherheit.“ (Z. 451-455)

492

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Der Austausch über die Noten erfolgt also weniger in einem gleichberechtigten Gespräch als in einer Art ‚kommunikativer Einbahnstraße‘, bei der die Schüler_innen als Stichwortgeber_innen fungieren und die Lehrerin eine Erklärung liefert, die möglichst von den Schüler_innen akzeptiert werden soll. Geschieht dies nicht und es entsteht eine „Diskussion“ zwischen Lehrkraft und Schüler_innen sieht Frau Pohle-Hanewinkel die Legitimität ihrer Beurteilungen gefährdet, da andere Schüler_innen der Lerngruppe irritiert bzw. verunsichert werden könnten. Hier wird deutlich wie schmal der Grat zwischen der diskursiven Einbeziehung der Schüler_innen und einem potentiellen Infragestellen ihrer Beurteilungskompetenz für Frau Pohle-Hanewinkel ist. Das Einschränken der „Diskussionen“ wird damit zum „Selbstschutz“. Auch bei anderen Lehrkräften findet sich dieser Balanceakt wieder, bei dem einerseits betont wird, dass es wichtig sei, die Schüler_innen in die Beurteilung einzubeziehen indem die Kriterien offengelegt und erläutert werden, andererseits aber die Mitsprachemöglichkeiten der Schüler_innen sich auf ein nachträgliches Legitimieren von bereits getroffenen Beurteilungen beschränken, um die Beurteilungskompetenz der Lehrkraft nicht infrage zu stellen.

Kollegialer Austausch zwischen Ent- und Belastung Was den kollegialen Austausch hinsichtlich der schulischen Leistungsbeurteilung angeht, zeigt sich ähnlich wie bei Frau Ahle-Demmerer, dass dieser eher punktuell und ad hoc bzw. bezogen auf größere schriftliche Arbeiten oder aber die Zentralen Abschlussprüfungen stattfindet. Eine stärker institutionalisierte Kooperation der Lehrkräfte wird in keinem der Interviews ersichtlich, vielmehr wird deutlich, dass der Austausch zu Fragen der Leistungsbeurteilung vor allem informell und spontan entsteht, also eher dann, wenn Lehrkräfte Entscheidungsschwierigkeiten haben und sich eine zweite Meinung einholen wollen. So erzählt z.B. Frau Heinkötter: „Klassenarbeiten, wo wir uns recht unsicher sind, gerade bei den Großen, versuchen wir uns dann auch noch mal auszutauschen: ‚Na, was meint du denn? Ist das jetzt

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

493

hier eher Drei oder ist das eher noch eine Vier?‘ Dass wir da mal gucken äh auch noch mal beim Anderen, uns noch mal andere Meinungen einholen.“ (Z. 227-230)

Als Bedingung, wann ein solcher Austausch stattfindet, führt Frau Heinkötter an, dass dies „gerade bei den Großen“ stattfinde – gemeint sind vermutlich die Schüler_innen der oberen Klassen 8 bis 10, bei denen die einzelnen Zensuren offenbar wichtiger werden, da es auf den Schulabschluss hinausgeht. Weiterhin führt sie an, dass sie durch das Einholen „anderer Meinungen“ versucht, den „subjektiven Touch“ (Z. 224), den Beurteilungen immer haben würden, auszugleichen. Hier zeigt sich wieder die Strategie des ‚Vier-Augen-Prinzips‘ zur Relativierung der eigenen subjektiven Perspektive. Als Auslöser für eine gesteigerte Zusammenarbeit der Kolleg_innen ihrer Schule benennt Frau Heinkötter noch die Zentralen Abschlussprüfungen und den damit einhergehenden gestiegenen Abstimmungsbedarf im Kollegium (vgl. Z. 318-325). Insbesondere die jüngeren Lehrkräfte im Sample berichten davon, dass sie sich im jeweiligen Fachbereich mit ihren Kolleg_innen austauschen würden – aber auch hier wird vor allem über die Bewertung schriftlicher Arbeiten gesprochen. Frau Lindenau berichtet z.B. sie habe „mit einigen Kollegen sehr, sehr engen Austausch“ (Z. 327), was vor allem bedeutet, dass sie gemeinsam Klassenarbeiten erstellen bzw. diese austauschen würden, sich über das Schwierigkeitsniveau einzelner Aufgaben unterhalten sowie ab und zu auch Parallelarbeiten in ihren Klassen schreiben würden. Deutlich wird, dass der kollegiale Austausch in erster Linie der Arbeitserleichterung dient, aber auch für ein Angleichen der schulinternen Standards hilfreich sei (vgl. Z. 794-818). Als Bedingung für die von Frau Lindenau als besonders gerahmte enge Zusammenarbeit im Kollegium nennt sie: „gerade in Mathe ein sehr, (.) sehr junges Kollegium. Und äh da sind auch äh ja viele, sage ich mal, daran=daran interessiert, das zu machen“ (Z. 368-369). Ein grundsätzliches Interesse an kollegialem Austausch sind also ebenso wichtig, wie persönliche Fragen von Sympathie und einer ähnlichen Arbeitsweise, um sich als jüngere Lehrkraft Hilfe von Älteren zu holen, wie Frau Dorpenbeck betont: „auch mir einen Rat einzuholen von älteren Kolleginnen, von denen ICH weiß, dass sie von der (.) Art und Weise ihrer Arbeit, von ihrer Vorbereitung, von dem gan-

494

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

zen Paket sozusagen, ähnlich ticken“ (Z. 843-844). Auch Herr Kleinert hebt hervor, dass er sich gerade bei der Erstellung der ersten Zeugnisnoten Hilfe von erfahreneren Kolleg_innen geholt hätte: „Und ähm da habe ich auf jeden Fall immer häufig Rücksprache gehalten mit den Kollegen. (.) Um da halt äh (.) ja, auch mich in gewisser Weise vielleicht selbst abzusichern auch ein bisschen. Weil man äh einfach ja noch völlig neu auf diesem Gebiet auch ist. (.) Ähm, und das natürlich dann auch einem eine gewisse Sicherheit gibt, wenn man weiß: Okay, der Kollege hätte eventuell genauso entschieden. (.) Und ähm (.) wenn zwei das so sehen/ Vielleicht noch ein dritter Kollege das AUCH so sieht, dann ist es vielleicht mehr oder weniger gerecht erstmal.“ (Z. 36-42)

Die Absicherung durch das Einbeziehen von einem oder zwei weiteren Kolleg_innen bei der Zeugnisnotenerstellung wird hier als besondere Maßnahme eines Novizen gerahmt, der „noch völlig neu auf diesem Gebiet ist“. Hier schwingt schon die Erwartung mit, diese Beratung zukünftig nicht mehr zu benötigen und durch Erfahrung obsolet zu machen. Bei der Realschullehrerin Frau Berkhoff, die über acht Jahre Berufserfahrung verfügt, wird diese Erwartung dann auch bestätigt, wenn sie ebenfalls von punktuellen Beratungen im Kollegium berichtet, dabei aber gleich deutlich macht, dass diese als zusätzliche Belastungen verstanden werden können, weshalb der kollegiale Austausch „viel auch zwischen Tür und Angel“ (Z. 615) stattfinde: „Ähm also manche machen es zum Beispiel so, dass die auch mal Arbeiten austauschen. Ne? Wenn man sich nicht sicher ist, so: ‚Ja, ist das jetzt noch eine Drei oder ist das schon eine Vier?‘ Äh, dass man sich schon mal ein Heft auch rüberschiebt so, ne? Nur man kann es auch nicht überstrapazieren, weil ja jeder selber auch genug zu tun hat.“ (Z. 610-613)

Die Grundhaltung hier scheint zu sein, dass Lehrkräfte die schulische Leistungsbeurteilung ebenso allein bewältigen müssen, wie auch den Unterricht selbst – das professionelle Selbstbild scheint eher am klassischen Bild der Lehrkraft als ‚Einzelkämpfer‘ ausgerichtet zu sein, weshalb Kooperation und kollegialer Austausch eher als Belastung („nicht überstrapazieren“), denn als Zugewinn professioneller Handlungsfähigkeit gewertet werden. Im Interview mit Frau Ehrl, der Mathematiklehrerin aus Kapitel 6.3.1, wird zudem deutlich, dass der kollegiale Austausch

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

495

auch als Zeichen persönlicher Schwäche und damit geringerer Professionalität gedeutet werden kann: „aber da ist natürlich auch jeder Kollege äh wie er meint. Also andere, die vielleicht überzeugter von sich sind, äh haben es nicht nötig zu fragen. Während ich eben jemand bin und äh mich da auch darum bemühe und eben auch fragen gehe. Mich da äh (.) hinter klemme das in Erfahrung zu bringen. (..) Und das/ ja, MUSS man nicht. Institutionalisiert ist das nicht.“ (Z. 335-338)

Frau Ehrl begründet ihren Wunsch nach mehr Austausch mit Kolleg_innen einerseits mit ihrem Bemühen um eine kontinuierliche Verbesserung ihres Beurteilungshandelns („bemühe“, „hinter klemme“). Andererseits führt sie diesen Wunsch nach mehr Austausch auf ihre Selbsteinschätzung als weniger selbstbewusste Lehrperson zurück und konstruiert als Gegenhorizont eine Lehrkraft, die „vielleicht überzeugter von sich“ sei und „es nicht nötig [habe] zu fragen“. Kollegiale Beratung wird damit zu etwas Defizitärem gedeutet, dass bestimmte Lehrkräfte, die einem professionellen Idealbild nicht entsprechen, zum Ausgleich persönlicher Schwächen benötigen, andere selbstbewusstere Lehrkräfte hingegen nicht. An anderer Stelle erklärt Frau Ehrl auch, dass ein Gespräch über die Benotungen nur mit einer Kollegin möglich sei, „mit der (.) ich mich gut kenne, gut auskomme“ (Z. 309), wodurch der heikle Charakter einer solchen Unterhaltung ebenfalls deutlich wird. Durch das Offenlegen der eigenen Beurteilungspraxis geben Lehrkräfte sich scheinbar eine Blöße, die ihr professionelles Ansehen bedrohen kann und daher nur im Rahmen einer vertrauensvollen kollegialen Beziehung stattfinden kann. Mit der Verneinung der Interviewerfrage nach einer möglichen Institutionalisierung kollegialen Austauschs und der Betonung „MUSS man nicht“ lässt sich auch vermuten, dass diese Haltung eine an ihrer Schule geteilte Position hinsichtlich kollegialer Zusammenarbeit darstellt. Fallübergreifend wird damit deutlich, dass die diskursive Aushandlung von Leistungsbeurteilungen zwischen Lehrkräften und ihren Schüler_innen im nordrhein-westfälischen Sample hauptsächlich der nachträglichen Erläuterung bereits getroffener Beurteilungen dient, die von den Schüler_innen akzeptiert und damit legitimiert werden sollen. Ins-

496

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

besondere die Explikation mündlicher Leistungen wird hierbei zu einem Balanceakt für die Lehrer_innen, da aufgrund der wenig belastbaren Beurteilungsgrundlage ihre Beurteilungskompetenz von den Schüler_innen infrage gestellt zu werden droht. Hinsichtlich des kollegialen Austauschs findet sich vor allem bei der Vorbereitung und Benotung schriftlicher Arbeiten eine intensivere Zusammenarbeit, die allerdings in Abhängigkeit von den Beziehungskonstellationen im Kollegium von eher sporadischen Beratungen im Zweifelsfall bis hin zu systematischer Kooperation und Erarbeitung gemeinsamer Beurteilungsstandards reichen kann. Der Fall Barbro im Vergleich zu anderen schwedischen Lehrkräften Ein „gemeinsames Verständnis“ schaffen Die besondere Betonung des kollegialen Austauschs bei der schulischen Leistungsbeurteilung als Grundlage einer gerechten Beurteilung findet sich außer bei Barbro auch in einigen anderen Interviews des schwedischen Samples. Die von Barbro gestellte zentrale Frage „denken wir gleich?“ („tycker vi lika?“) taucht u.a. in den Interviews mit Eva, Pernilla und Jonathan in der Formulierung eines Bedürfnisses danach ein „gemeinsames Verständnis [zu] schaffen“ („att skapa en samsyn“) auf, womit häufig die kollegiale Verständigung über die in den Lehrplänen aufgeführten Wissensanforderungen (kunskapskrav) gemeint ist. Der Austausch im Kollegium über die Bewertungsgrundlagen stellt ein wichtiges Element ihres Arbeitsalltags dar und wird auch unmittelbar mit Gerechtigkeitsfragen verbunden. Dieser Austausch wird teilweise durch die gemeinsame Planung von Unterrichtseinheiten, das Besprechen des Lehrplans innerhalb der Fachkollegien zu Beginn des Schuljahres, sowie die gemeinsame Beurteilung von schriftlichen Arbeiten während des Schuljahres gefördert. Einen wichtigen Kommunikationsanlass stellen zudem die standardisierten Tests (nationella prov) dar, deren Korrektur häufig gemeinschaftlich erfolgt. Neben der Erweiterung der Perspektiven auf die Schüler_innenleistungen, wie in Barbros Falldarstellung her-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

497

ausgearbeitet, wird auch das Erreichen eines kollegial geteilten Beurteilungsniveaus durch die gemeinsame Beurteilung angestrebt. Dazu ein Auszug aus dem Interview mit Gunilla, einer Mathematiklehrerin an der grundskola: ”Ähm und ich glaube nicht, dass ich ALLEINE die Schüler gerecht beurteilen kann, sondern da muss man kollegial zusammenarbeiten, sich aushelfen, ein NIVEAU ERREICHEN. Zuallererst in unserer Schule, dass WIR HIER zumindest gleich beurteilen in verschiedenen Situationen. (.) Das glaube ich ist sehr wichtig, dass man äh/ dass ich WEIß, wie das Niveau ist.“274 (Z. 296-299)

In Gunillas Aussage zeigt sich der oben angesprochene Anspruch einer gleichwertigen Beurteilung und der Erreichung eines einheitlichen Beurteilungsniveaus – mit der einschränkenden Bemerkung, diese zumindest innerhalb ihrer Schule anzustreben („dass WIR HIER zumindest gleich beurteilen“). Diese Einschränkung zeigt bereits, wie schwierig die Umsetzung des in den Regularien formulierten normativen Anspruchs einer landesweit einheitlichen Beurteilung für die Praktiker_innen zu sein scheint. Allein die Schaffung eines gemeinsamen Verständnisses der Vorgaben innerhalb einer Schule, also auf lokalem Niveau, stellt bereits eine große Herausforderung für die Lehrkräfte dar, insbesondere wenn es um die Interpretation der Wissensanforderungen (kunskapskrav) und Bewertungsbegriffe (värdeord) bzw. deren Übersetzung in konkrete Schüler_innenleistungen – und vice versa – dar. Dazu ein Beispiel von Jonathan, einem sehr jungen Schwedischlehrer an der grundskola: „Das ist überhaupt nicht selbsterklärend, was Skolverket mit diesen verschiedenen Begriffen meint. Das finde ich nicht. Und deshalb fühlt sich das so wichtig an, dass

274

Original: „Eh och jag tror inte att jag SJÄLV kan ge eleverna rättvisa bedömningar, utan då måste man jobba kollegialt, hjälpas åt, HITTA en NIVÅ. Eh framförallt på vår skola, att VI åtminstone HÄR bedömer lika i olika situationer. (.) Det tror jag är jätteviktigt att man eh/ att jag VET var nivån ligger.” (Z. 296-299)

498

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

man sich mit seinen Kollegen zusammensetzt und ein gemeinsames Verständnis 275 schafft. WIE man/ Wie man die sozusagen deutet.“ (Z. 143-145)

Insgesamt finden sich viele ähnliche Interviewpassagen, aus denen hervorgeht, wie schwierig die Interpretation der Wissensanforderungen und Deutung der Schüler_innenleistung für die Lehrkräfte in der Praxis häufig ist. Als umso wichtiger wird daher der kollegiale Austausch und die Verständigung über ein geteiltes Beurteilungsverständnis benannt – und dies nicht nur von den jungen und weniger erfahrenen Lehrkräften des Samples. So bringt Nils, ein erfahrener Schwedischlehrer an einer grundskola, seine Bedenken folgendermaßen auf den Punkt: „Das sind Worte, die alle Lehrer_innen deuten müssen. Alle Lehrer_innen deuten/ Das hier verstehe ich unter ‚einfach‘, das hier verstehe ich unter ‚relativ deutlich‘ und das hier verstehe ich unter ‚zusammenhängend‘. Und da sehe ich eine Gefahr drin. [...] Und da ist es auch gut, dass man mit Kolleg_innen vergleichen kann, wie ich und Karolina.“276 (Z. 189-193)

Nils tauscht sich sehr häufig mit seiner Kollegin Karolina, die ebenfalls befragt wurde, aus, obwohl beide unterschiedliche Sprachen unterrichten, aber ähnlich arbeiten. Auch für Pernilla, eine Schwedischlehrerin an einer weiterführenden Schule mit 14 Jahren Berufserfahrung, stellt der kollegiale Austausch eine wichtige Grundlage für eine gerechte Beurteilung dar, allerdings weist sie auch darauf hin, dass es für diesen Austausch gewisse organisatorische Rahmenbedingungen braucht, die einen solchen Austausch überhaupt erst ermöglicht: „Und das ist nun mal et275

Original: „Det är ju inte så HELT självklart vad eh Skolverket menar med eh de här olika begreppen. Det tycker inte jag. Och därför känns det som att det är viktigt att man eh sitter med eh sina kollegor och eh skapar en samsyn. HUR man vil/ hur man tolkar de liksom.” (Z. 143-145) 276 Original: „Det är ju ord som alla lärare gör en tolkning av. Alla lärare tolkar/ Det här tolkar jag som "enkelt", det här tolkar jag som "relativt tydligt" och det här tolkar jag som "sammanhängande". Och det ser jag ju (.) en fara med. Men=eh=eh, jag tror att med alla betygssystem så finns det en risk för tolkningar. (...) Det är väl det som är, ja/ (.) Det är svårt. Och då är det också bra att man kan jämföra med kollegor, som jag och Karolina.” (Z. 189-193)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

499

was, wo man dafür sorgen muss, dass es Zei:it dafür gibt (.) im Stundenplan (.) wenn es diese Möglichkeiten geben soll“277 (Z. 206-207). An Pernillas Schule wurde dafür ein regelmäßiges Zeitfenster für die Lehrkräfte festgelegt, in dem das Kollegium zusammenkommen und u.a. über Beurteilungsfragen beraten kann. Insbesondere während der Phasen im Schuljahr, in denen die standardisierten Tests (nationella prov) durchgeführt werden, werden diese Zeitfenster intensiv für den kollegialen Austausch und die gemeinsame Korrektur genutzt: „Wir haben es so organisiert an unserer Schule, dass (.) ähm (.) jeden Dienstag und Donnerstag (.) haben wir Konferenzzeit (.) [...] Halb vier bis um fünf. Und diese Zeit, im April und Mai, die wird dann angewandt als Korrekturpool, so heißt das dann, ne? Da sitzt man oft (.)/ Kann man zus=mm=fünf oder zehn Lehrkräfte und schaut die Sachen durch, so hier: ‚Jetzt schauen wir auf die Einleitungen. (.) Was soll dabei sein wenn man s=eine solche Note werden soll?’“278 (Z. 207-211)

Die regelmäßigen Treffen innerhalb der Fachbereiche (arbetslag) gehören somit zur regulären Arbeitszeit und ermöglichen den Lehrkräften das Besprechen der Klausuren und Tests sowie den intensiven Austausch über verschiedene Qualitätsniveaus der vorliegenden Aufsätze. Diese Art des Austauschs ist für Pernilla die Grundlage eines geteilten Beurteilungsverständnisses („samsyn“, Z. 217), das wiederum dazu dient insgesamt eine gleichwertige Beurteilung innerhalb des Kollegiums zu ermöglichen. Denn: „Es soll keine Rolle spielen für eine Schülerin, ob ICH sie in Englisch habe oder meine Kollegin sie in Englisch hat“279 (Z. 217-218). Auch für Eva, die Schwedischlehrerin an einer weiterführenden Schule, die bereits im Kapitel 6.3.2.3 zitiert wurde, stellt die Herstellung eines 277

Original: „Och det här är ju nåt som man måste se till att det finns ti:id för (.) i schemat (.) om det ska finnas möjligheter.“ (Z. 206-207) 278 Original: „Vi har ju så organiserat på vår skola att (.) ehm (.) varje tisdag och torsdag (.) så har vi konferenstid (.) [...] Halv fyra till fem. Och den tiden, under eh april och maj, så används den som rättningspr=pooler, heter det då, va. Då sitter man ofta (.)/ Kan man sitta ti=mm=fem eller tio lärare och kolla igenom (.) grejer, så här: ,Nu tittar vi på inledningar. (.) Vad ska vara med för att det ska bli ett s=ett sånt betyg?’"(Z. 207-212) 279 Original: „Det ska inte spela nån roll för en elev om JAG har dom i Engelska eller om min kollega har dom i Engelska” (Z. 217-218)

500

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

kollegial geteilten Beurteilungsverständnisses eine wichtige Grundlage für eine als gerecht empfundene Beurteilung dar. Wie im folgenden Ausschnitt deutlich wird, liegt für Eva aber insbesondere im Hinblick auf die Legitimität ihrer Beurteilungen gegenüber den Schüler_innen der besondere Mehrwert des kollegialen Austauschs: „U=und in der Gerechtigkeits=äh=Beurteilungs=äh=frage da kommt auch rein, dass man diese fortlaufenden Diskussionen mit (.) anderen Kolleg_innen hat, zum Beispiel. So, dass die Schüler_innen das Gefühl bekommen, dass wir eine Art gemeinsames Verständnis haben. GEMINSAMES VERSTÄNDNIS ist schon ein Wort, das sehr häufig in unseren Diskussionen vorkommt. ‚Haben wir dazu ein gemeinsames Verständnis? Können wir uns nicht hinsetzen und ein GEMEINSAMES VERSTÄNDNIS entwickeln?’ Also (.), das ist wirklich gefährlich, wenn sich in einem System zeigt (.) dass es verschiedene (.) Beurteilungen an der gleichen Schule gibt. Die Schüler_innen haben Kumpels, in diesem Programm sind sie Kumpels mit jenem Programm und dann hat der oder die Lehrer_in die Sachen ganz unterschiedlich aufgefasst. Das ist dann nicht gerecht. Man muss die ganze Zeit danach streben, dass wir auf eine gleichwertige Art und Weise denken, deuten, beurteilen. Wir streben trotz allem nach Gleichwertigkeit und=und=und Gerechtigkeit. Also das ist ein fortlaufender Dialog (.) den man haben 280 muss (.) auch zwischen den Lehrer_innen.“ (Z. 882-890)

Die von Barbro verwendete Frage „denken wir gleich?“ („tycker vi lika?“) wird hier noch weiter ausgeführt und auf die Verben „denken“, „deuten“ und „beurteilen“ ausgeweitet. Ziel der fortlaufenden Angleichung des Beurteilungshandelns der Lehrkräfte ist eine nach außen darstellbare, von den Schüler_innen wahrgenommene Einheitlichkeit der Beurteilung. 280

Original: „O=och i rättvise=eh=bedömnings=eh=frågan så kommer det ju också in att ha dom här fortlöpande diskussionerna med (.) andra kollegor, till exempel. Så att eleven får en känsla av att vi har nån slags samsyn. SAMSYN är ju ett sånt ord som återkommer väldigt mycket i våra diskussioner. "Har vi samsyn kring detta? Kan vi inte sitta ner och få nån slags SAMSYN?" Alltså (.), det är ju väldigt sårbart om ett system visar sig (.) ha olika (.) bedömningar på samma skola. Elever är kompisar, i det programmet är dom kompisar med det programmet och så har läraren uppfattat saker och ting helt olika. Då är det ju inte rättvist. Så man får ju hela tiden sträva efter att tänka, tolka, bedöma, på likvärdigt sätt. Vi strävar ju ändå mot likvärdighet och=och=och rättvisa. Så det är ju en eh fortlöpande dialog (.) som man eh måste ha till (.) där också mellan eh lärare.” (Z. 882890)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

501

Diese dient wiederum als Absicherung gegenüber kritischen Nachfragen und einer möglichen Infragestellung der Beurteilungskompetenz der Lehrkräfte durch die Schüler_innen, wie an der Warnung „das ist wirklich gefährlich“ deutlich wird. In der Formulierung „danach zu streben“ wird jedoch auch deutlich, dass es sich um ein ideales Ziel handelt, um dessen Erreichung die Lehrkräfte sich fortwährend bemühen müssen, das aber potentiell nie abgeschlossen sein kann. Neben der Schaffung eines kollegial geteilten Beurteilungsverständnisses betonen einige der schwedischen Lehrkräfte auch, dass es für eine gerechte Beurteilung zentral sei, in einem engen diskursiven Austausch mit den Schüler_innen zu stehen. Dabei kann teilweise zwischen der diskursiven Vermittlung der Beurteilungsgrundlagen einerseits und der ko-konstruktiven Herstellung von Leistungen durch die Lehrkräfte kaum unterschieden werden, wie im Folgenden deutlich wird.

„im Dialog mit dem Schüler“ Für den Mathematiklehrer Mats, der an einer grundskola unterrichtet, geht eine gerechte Leistungsbeurteilung einher mit einer kontinuierlichen formativen Begleitung des Lernprozesses und einer Beurteilung im „Dialog mit dem Schüler“: „Also ich sage, dass das kontinuierlich ist, die ganze Zeit. Beurteilung. Ein Gespräch mit Schüler_innen, dass (.) wir schreiben dann so: ‚Jetzt hast du es geschafft, dir dieses Wissen zu erobern.‘ Zu analysieren, beispielsweise. Aber das geht noch zu verbessern. (.) So, dass es sehr viel Gespräch ist, und so. Wie sie ihr Lernen geschafft haben. (.) Ich glaube, dass das das Lernen auch ein BISSCHEN vom Individuum isoliert. Es geht darum, zu üben. Es ist nichts Komisches daran, dass man (.) üben muss, um etwas zu lernen. Das kommt nicht so [schnippt mit dem Finger]. Also (.) also für mich ist Beurteilung, und das=das denke ich, ist, wenn man einen Dialog mit dem Schüler, oder der Lerngruppe hat, dann=dann wird das (.) gerechter.“281 (Z. 89-96)

281

Original: „Så att jag säger att det är kontinuerligt, hela tiden. Bedömning. Ett samtal med eleverna, att (.) vi skriver då att: ,Nu har du ju lyckats erövra de här kunskaperna.’

502

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Für Mats bedeutet Leistungsbeurteilung also ein fortlaufendes Gespräch zwischen Lehrkraft und Schüler_innen, dass der gemeinsamen Herstellung von Leistung durch formatives Feedback während des Lernprozesses dient. Durch die Besprechung einzelner Lernfortschritte erhalten die Schüler_innen ein kontinuierliches Feedback, das ihnen sowohl den IstStand als auch die weiteren Perspektiven aufzeigen soll. Die fortlaufende Evaluation des Lernstands verweist dabei auch auf Mats‘ Beurteilungsverständnis als unauflösbarem Bestandteil des Lernprozesses, Unterrichten und Beurteilen gehen hier ineinander über. Die zunächst etwas irritierende Formulierung „Ich glaube, dass das das Lernen auch ein BISSCHEN vom Individuum isoliert“ verweist dabei auf Mats‘ Verständnis des Lernprozesses als permanente Herausforderung, die sich die Schüler_innen jedoch nicht zu sehr zu Herzen nehmen sollten: sich neues Wissen anzueignen und neue Fähigkeiten auszubilden, brauche immer Übung und sei nicht mit einem Fingerschnippen zu erwerben, vereinzelte Rückschläge gehören daher zum Lernprozess dazu und sind zunächst erst mal unabhängig von den individuellen Schüler_innen. Die beständige Rückmeldung und Ermunterung der Schüler_innen wird so zum Bestandteil dieses herausfordernden Prozesses. Im „Dialog mit den Schüler_innen“ zu bleiben, verhindert in Mats‘ Augen auch ‚böse Überraschungen‘ am Ende des Schuljahres, wenn die Zeugnisnoten vergeben werden, da die Schüler_innen kontinuierlich im Bilde über ihren aktuellen Leistungsstand seien und dadurch lernten sich selbst einzuschätzen (vgl. Z. 111-119). Inwiefern Mats‘ idealisierender Blick auf die Lernprozesse der Schüler_innen und seine Begleitung durch die kontinuierliche Beurteilung auch von seinen Schüler_innen geteilt wird, muss an dieser Stelle offen bleiben. Deutlich wird aber, dass er viel Wert darauflegt, die

Att analysera, till exempel. Men den går att förbättra. (.) Så att det är mycket samtal, och så. Kring hur de har lyckats med sitt lärande. (.) Det tycker jag isolerar lärande LITE ifrån individen också. Det handlar om att träna. Det är liksom inget konstigt att för att lära sig något så måste man (.) träna. Det kommer liksom inte [schnippt mit dem Finger]. Så. (.) Så för mig är bedömning, och det=det tycker jag eh när man har en dialog med eleven, eller elevgruppen så=så blir det mer (.) rättvist.” (Z. 89-96)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

503

Wissensanforderungen und Notenkriterien anhand von konkreten Schüler_innenarbeiten gemeinsam zu besprechen und so den Schüler_innen die Möglichkeit zu geben ein „Bewusstsein“ („medveten“, Z. 497) für ihren eigenen Lernprozess zu entwickeln: „Und dann sprechen wir darüber: ‚Wie kann man von dieser Arbeit dorthin kommen? Und was musst du noch MEHR lernen, um dahin zu kommen?‘“282, Z. 117-119). Der Lernprozess der Schüler_innen wird von ihm auch mehrfach als „Reise“ („resan“, Z. 80, 105, 449f., 496) bezeichnet, seine eigene Rolle als Lehrkraft beschreibt Mats folgerichtig auch als die eines erfahrenen Begleiters seiner Schüler_innen auf dieser Lernreise: „Also ich sage normalerweise, ich BESITZE das Wissen nicht. Aber ich habe es mir angeeignet und ich kann sehen, wie du auf eine bessere Weise lernen kannst, oder kann diese Methode anwenden, oder so. Aber ich bin kein=ich bin kein Symbol für Wissen. Also ich stehe als Symbol für die Reise dorthin. Das ist ein riesengroßer Unterschied. (.) Wenn man Pädagoge ist. Du musst den jungen Menschen ein wenig die Angst 283 nehmen.” (Z. 102-106)

Mats vermittelt im gesamten Interview den Eindruck eines sehr erfahrenen Lehrers, eines Experten mit „bewährter Erfahrung“ („beprövad erfarenhet“, Z. 55) hinsichtlich der Beurteilung von Schüler_innen, der gelernt habe „im Klassenzimmer zu tanzen“ 284 (Z. 60), wie er es ausdrückt, und sich daher auch die Freiheit herausnimmt, sich teilweise über die offiziellen Regularien hinwegzusetzen: „Wenn ich auf die Beurteilung schaue, dann ist das also so, dass ich sehr viel freier bin von=von all diesen da draußen=eh=Einflüssen”285 (Z. 54-55). Die Lehrpläne und 282

Original: „Och så prat=pratar vi om: ,Hur kan man gå från det arbetet hit? Och vad behöver du lära dig MER för att komma dit?’" (Z. 117-119) 283 Original: „Så jag brukar, jag ÄGER inte kunskapen. Men jag har skaffat mig och jag kan se hur du kan lära dig på ett bättre sätt, eller kan använda den här metoden och så. Men jag står inte=jag står inte som symbol för kunskap. Alltså jag står som symbolen för resan dit. Det är en jättestor skillnad. (.) Om man är pedagog. Du får bort lite av rädslan hos eh den unga människan då.” (Z. 102-106) 284 Original: „jag har lärt mig att dansa i klassrummet” (Z. 60) 285 Original: „Om jag ser på bedömning så är det alltså att jag är mycket friare från=från alla de där utan=eh=påverkan.” (Z. 54-55).

504

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Wissensanforderungen sind für ihn eine Orientierungshilfe, „etwas zu dem man sich verhalten soll“ und als Lehrkraft selbstständig auslegen müsse: „Der ist nicht wie ein Dokument geschrieben, wo (.) wo du als Lehrkraft keine Flexibilität hast. (..) Du sollst schon/ Du als Lehrkraft SOLLST das ausdehnen“286. Auch die standardisierten Tests seien „nichts, wovon ich mich antreiben lasse in meinem Lernen mit den Schüler_innen“287 (Z. 131-132), allerdings gibt es einige Lehrkräfte an seiner Schule, die ihre Schüler_innen speziell vorbereiten würden vor den Tests, sodass er manchmal gezwungen sei auch mit seinen Klassen zu üben (vgl. Z. 132-140) – er lehnt dieses teaching to the test-Verhalten jedoch als „sinnlos“ („meningslöst“) ab. Mats verfügt im Vergleich mit allen anderen befragten Lehrkräften des schwedischen Samples über ein sehr entspanntes Verhältnis zu den politisch vorgegebenen Erwartungen, was sich vermutlich auch aus seiner langjährigen Berufserfahrung erklären lässt. Da er vor seiner Tätigkeit als Lehrkraft an dieser Schule bereits eine erfolgreiche Privatschule begründet und das Konzept gewinnbringend verkauft hat, wie er zu Beginn des Interviews erzählt, dürfte er sowohl über eine gewisse finanzielle Freiheit als auch organisatorische Erfahrung verfügen, die ihm diese Gelassenheit gegenüber den gesellschaftlichen Erwartungen und regulativen Anforderungen ermöglichen. Auch für Mats‘ Kollegin, die Schwedischlehrerin Karin, stellt die fortlaufende Kommunikation mit ihren Schüler_innen über ihren Lernprozess und die begleitende formative Beurteilung eine Grundlage für eine gerechte Beurteilung dar. Wie viele der schwedischen Lehrkräfte nutzt auch Karin den Lehrplan und die Beurteilungsraster von Skolverket als Instrument der Rückmeldung im Unterricht. Wie im folgenden Auszug

286

Original: „alltså läroplanen är=eh=är=är någonting man ska ha som eh någonting att förhålla sig till. Så är den skriven. Den är inte skriven som ett eh dokument som (.) som du som lärare inte får ha en=en=en töjbarhet till. (..) Du=du ska ju/ Du SKA som lärare töja på det här, va. Du SKA som lärare töja på det här, va.” (Z. 350-356) 287 Original: „ ingen sak som driver mig i mitt lärande med eleverna” (Z. 131-132)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

505

auch deutlich wird, führt der Einsatz dieser Beurteilungsraster mit den Notenstufen A bis E jedoch auch zu unerwünschten Nebeneffekten: „Gleichwohl haben wir gesehen, dass einige sich GEWALTIG an dem hier orientieren, so, dass wir aufhören sollten, das die ganze Zeit zu zeigen. Weil sie sich so UNGLAUBLICH auf diese Matrizen fokussieren, aber (.) aber äh wir reden schon viel über eigenes Ler/ Also wie man am besten lernt und am wei/ so gute Resultate wie möglich für sich selbst erreicht. Und dass man Verantwortung für sein eigenes Lernen übernehmen soll. (.) Und da sollte man das hier manchmal beiseitelegen. (.) Auch, wenn (..) ja, die summative Beurteilung muss nicht immer dabei sein. Mehr so das formative: ‚Was hattest du für ein Ziel und wie weit bist du gekommen?‘ Warum bist du nicht weitergekommen?‘ Oder so. (.) Und (.) das ist viel Kommunikation mit den Schüler_innen (.) auch.“288 (Z. 89-95)

Für Karin besteht der Balanceakt in der formativen lernprozessbegleitenden Beurteilung vor allem darin, zwar einerseits durch die fortlaufende Kommunikation mit den Schüler_innen über ihren Lernprozess zu begleiten, andererseits aber eine zu starke Fixierung der Schüler_innen auf die finalen Noten zu vermeiden. Durch die Anwendung der Beurteilungsraster (Matrizen) wird dies aber offenbar schwieriger, da sich in ihnen eben nicht nur die verbalisierten Anforderungen finden, sondern diese eben auch den drei Notenstufen A bis E zugeordnet werden. Die Unterscheidung zwischen formativer und summativer Beurteilung, wie von Karin angestrebt und in den Regularien eingelassen, wird für die Schüler_innen dadurch erschwert und die Dauerpräsenz der Notenstufen führt offenbar eher zu einer ungewünschten Notenfixierung. Was im obigen Auszug ebenfalls deutlich wird, ist die aktive Einbeziehung der Schüler_innen in den Lernprozess durch die gemeinsame Evaluation von 288

Original: „Fast vi har sett att några blir VÄLDIGT inriktade på det här, så vi ska sluta och visa allting hela tiden. För att de blir så OTROLIGT inriktade på matriser här såhär, men (.) men eh vi pratar ju mycket om eget lär/ alltså hur man lär sig själv bäst och når hö/ så höga resultat som möjligt för sig själv. Och att man ska ta ansvar för sitt eget lärande. (.) Och då ibland får man lägga det åt sidan då. [beide lachen] (.) Även om (..) ja, den summativa bedömningen behöver inte alltid vara med. Mer den formativa såhär: ;Vad hade du för mål och hur långt kom du? Varför nådde du inte enda fram?’ Eller så. (.) Men (.) det är mycket kommunikation med eleverna (.) också.” (Z. 89-95)

506

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

selbstgesteckten Lernzielen und erreichtem Lernstand. Ähnlich wie bei Mats, der von einem „Bewusstsein“ der Schüler_innen sprach, erwartet auch Karin, dass ihre Schüler_innen „Verantwortung“ für ihr Lernen übernehmen sollen und im engen Austausch mit der Lehrkraft fortwährend den eigenen Lernprozess evaluieren. Die Rolle der Lehrerin wird hier ebenfalls zu der einer Begleiterin des Lernprozesses, die durch „viel Kommunikation mit den Schüler_innen“ diesen Lernprozess mit steuert und gleichzeitig fortlaufend beurteilt. Für Karin steht fest: „eine gute Beziehung zu haben ERLEICHTERT im Grunde eine gerechte Beurteilung“289 (Z. 611), denn diese ermögliche es ihr den Schüler_innen auch negative Beurteilungen zu „erklären“ und damit zu legitimieren: „Also die Beziehung ist schon wichtig, absolut. Um beurteilen zu können. Dennoch gilt es professionell zu sein in seiner Beurteilung. Nicht, dass, man gibt die Note nicht wegen der Beziehung. [lacht] Sondern es geht ums Ergebnis. Aber ich denke, dass, wenn ich eine Beziehung zu meinem Schüler habe, dann kann ich eine ges=gerechte Note geben, denn ich kann sie dem Schüler auch erklären. Wenn wir eine Beziehung zueinander haben, dann kann ich dir auch erklären, warum du ein D hast und dein Kumpel, von dem du denkst, dass ihr gleich gut seid, hat ein B. Wenn du eine Beziehung hast, kannst du auch leichter (..) darüber sprechen.“290 (Z. 247-252)

Gerecht wird eine Benotung in Karins Augen also vor allem dann, wenn sie erklärbar, vermittelbar ist. Die Bedingung dafür ist eine gute Beziehung zwischen Lehrkraft und Schüler_innen, ein Vertrauensverhältnis, dass auch ein gewisses Wissen über den sozialen Hintergrund und die Lernsituation jedes einzelnen Kindes erfordert. Gleichzeitig betont Karin, 289

Original: „Men att ha en god relation i botten UNDERLÄTTAR en rättvis bedömning.” (Z. 611-612) 290 Original: „Men relationen är ju viktigt, absolut. För att kunna bedöma. Sen gäller det att vara professionell i sin bedömning. Inte att, man sätter ju inte betyg på relationen. [lacht] Utan det är ju resultatet. [klopft auf den Tisch] Men jag tänker det, att har jag en relation med min elev, så kan jag sätta ett rest=rättvist betyg för jag kan också förklara för den eleven. Har vi en relation så kan jag förklara varför du har ett D, och din kompis som du tyckte [att] du var lika bra som har ett B. Men har du en relation så kan du också lättare (..) tala om det.” (Z. 247-252)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

507

dass eine solche gute Beziehung nicht die Benotung als solche beeinfluss dürfe, und es gelte „professionell“ zu sein. Ähnlich wie bei der Lehrerin Eva im Kapitel 6.3.2.3 spricht Karin sich hier für eine Trennung zwischen der guten Beziehung zwischen Lehrkraft und Schüler_innen und der Benotungssituation aus. Für Karin ist allerdings diese Beziehungsebene nicht nur während der Lernphase, wie bei Eva, sondern gerade auch in der diskursiven Vermittlung der abschließenden Noten von großer Bedeutung. In gewisser Weise wird hier erst durch die gemeinsame Besprechung und anschließende Akzeptanz der Note durch die Schüler_innen eine gerechte Benotung erreicht. Hinsichtlich der Zeugnisnoten legt auch Karin eher wenig Gewicht auf die Ergebnisse der standardisierten Tests (nationella prov) und verwendet diese lediglich zur „Abstimmung“ („avstämning“, Z. 363) ihrer Beurteilungen im laufenden Schuljahr: „Also für mich dient die nationella prov zur Abstimmung. F:für mich ist das nicht, ist die nationella prov nicht die Norm. [lacht kurz] Äh das ist KEINE Zensur. Denn wir können alle mal scheitern“291(Z. 363-364). Ein Abweichen zwischen ihrer eigenen Beurteilung und den Testergebnissen führt folglich auch nicht unbedingt zur Veränderung der Zeugnisnote: „Aber (..) ich habe öfter, das ist selten, dass ich eine Note gesenkt habe aufgrund der nationella prov. Dagegen habe ich Noten schon verbessert. (.) Denn ich kann mir vorstellen, dass ich in meiner Beurteilung während des Schuljahres streng war, wenn sie ein besseres Ergebnis in der nationella prov zeigen können. Aber scheitern können alle, weil man nervös ist oder (.) einen Blackout hat während der nationella prov.“292 (Z. 369-372)

291

Original: „Alltså för mig är nationella prov en avstämning. F:för mig är inte, är inte nationella proven en norm. [lacht kurz] Eh det är INTE ett betyg. För alla vi kan misslyckas en dag.” (Z. 363-364) 292 Original: „Men (..) jag har oftast, det är sällan jag har sänkt ett betyg på grund av ett nationellt prov. Däremot har jag nog höjt betyg. (.) För att jag kan tänka att jag har varit hård i min bedömning under året om de kan visa ett bättre resultat på nationella provet. Men misslyckas kan alla göra för att man är nervös eller (.) får en black out under ett nationellt prov liksom.” (Z. 369-372)

508

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Ähnlich wie bereits bei Barbro und Mats ausgeführt, stellen die Ergebnisse der standardisierten Tests lediglich ein weiteres Puzzleteil der Leistungsbeurteilung für Karin dar, dass mal als „Richtwert“ (Barbro), mal als „nichts, wovon ich mich antreiben lasse“ (Mats) beschrieben wird und für alle drei Lehrkräfte „nicht die Norm“ (Karin) darstelle bei der schlussendlichen Erstellung der Zeugnisnote. Diese müsse mehr als eine punktuelle Leistungsüberprüfung umfassen und daher vor allem die während des Schuljahres erbrachten Leistungen einbeziehen. In Bezug auf die Erstellung der Zeugnisnoten berichtet Pernilla von einer weiteren interessanten Vorgehensweise, bei der sie ihren Schüler_innen zunächst einen ausführlichen Zeugnisbogen per Email zuschickt, auf dem alle während des Schulhalbjahres erfolgten Beurteilungen dokumentiert sind und am Ende eine Gesamtnote für das Halbjahr gebildet wird. Diesen Bogen, der als „Zeugnisvorschlag“ („betygsförslag“, Z. 119) von ihr bezeichnet wird, können die Schüler_innen wiederum kommentieren und bei Unklarheiten noch einmal nachfragen (vgl. Z. 119-124). Die abschließende Zeugnisnote wird so ebenfalls noch einmal Teil der diskursiven Aushandlungen zwischen Lehrkraft und Schüler_innen, denn im Falle eines Widerspruchs gegen die vorgenommene Beurteilung findet noch mal ein ausführliches Gespräch zwischen Pernilla und dem oder der Schüler_in statt, um am Ende eine von beiden Seiten akzeptierte Note zu erhalten. Pernilla begründet dieses Verfahren mit dem Verweis auf eine in ihren Augen spezifisch schwedische Konsensorientierung: „Nein, also das ist schon, das ist schon dieses Schwedische. Wenn ich Lehrerin in einem anderen Land wäre, hätte ich eine ganz andere Autorität zu sagen/ Das hier ist/ Das hier ist ein wenig demütiger. Gleichwohl haben sie, sie haben ja trotzdem nicht viel dazu zu sagen. Ich gebe die Note trotzdem. (.) Ich meine, ich sage immer: (.) ,Sicher, ihr könnt gerne darüber nachdenken, aber ich habe fünfeinhalb Jahre an der Universität studiert. Ich SOLLTE ein bisschen darüber Bescheid wissen. Und ich habe als Lehrerin gearbeitet, seit, ja wie viel jetzt (..), fünfzehn Jahren, jedenfalls. So, dass,

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

509

ich meine ein bisschen dabei bin ich schon. Aber sicher, das hier ist mein Vorschlag, 293 ausgehend von dem hier.“ (Z. 600-606)

In Pernillas Augen haben Lehrkräfte im schwedischen Bildungssystem weniger „Autorität“ als in anderen nationalen Bildungssystemen und sind daher stärker auf das Einverständnis der Schüler_innen angewiesen. Auch wenn Pernilla betont, dass die Schüler_innen „ja trotzdem nicht viel dazu zu sagen“ hätten, weil die letztendliche Entscheidungsbefugnis bei ihr als Lehrkraft liege, stellt diese institutionalisierte Form der Beteiligung der Schüler_innen eine Besonderheit im länderübergreifenden Vergleich dar. Dass die Schüler_innen zunächst einen Zeugnisvorschlag erhalten, mit dem sie einverstanden sein sollen, bevor das Zeugnis endgültig vergeben wird, mag in der Praxis eine reine Formsache für die beteiligten Akteur_innen darstellen. Auf der Ebene der in den Regalarien eingelassenen Gerechtigkeitsnormen findet sich hier aber ein zentraler Unterschied zum nordrhein-westfälischen Kontext. Auf diesen und weitere Aspekte wird im Folgenden näher eingegangen. Länderübergreifender Vergleich und institutionelle Rahmung Im länderübergreifenden Fallvergleich fällt zunächst auf, dass die kommunikative Vermittlung der Beurteilungsergebnisse in beiden Kontexten ein immer wiederkehrendes Motiv der Erzählungen der Lehrkräfte mit einer diskursiv-interaktiven Gerechtigkeitsüberzeugung darstellt: So müssen sowohl die Bepunktungen und Ziffernnoten im nordrheinwestfälischen System kommunikativ erklärt und transparent gemacht 293

Original: „Nej, men det är ju, det är ju det svenska. Hade jag varit lärare i ett annat land så hade jag ju haft auktoritet på ett helt annat sätt att säga att/ Det här är/ Det här är lite ödmjukare. Fast dom, dom har ju inte så mycket att säga till om ändå. Jag sätter ju ändå betyg. (.) Jag menar, jag brukar säga det (.) [suck]: ,Visst, ni får gärna tycka till om det här, men jag har ju läst fem och ett halvt år på universitet. Jag BORDE veta något om det här. Och jag har jobbat som lärare i, vad är det nu (..), femton år i alla fall. Så att, jag menar lite har jag ju varit med om. Men visst, det här är mitt förslag, utifrån det här’." (Z. 600-606)

510

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

werden, als auch die Beurteilungen anhand von ausformulierten Beurteilungskriterien und Buchstabennoten im schwedischen Kontext. Die Lehrkräfte verweisen – unabhängig vom jeweiligen Beurteilungssystem und seinen immanenten Logiken – auf den legitimatorischen Mehrwert, der durch die kommunikative Validierung ihrer Beurteilungen entsteht. Die beiden ausführlicher dargestellten Fälle (Frau Ahle-Demmerer und Barbro) verweisen zudem auf ein ganz spezifisches Verständnis von professionellem Expertentum, das sich sowohl deutlich von dem in Kapitel 6.3.1 (mathematisch-rechnerische Gerechtigkeitsüberzeugung) herausgearbeiteten Bild einer Wissen vermittelnden Fachlehrkraft („Mathematiker“) als auch vom Bild der professionellen Lehrkraft als bürokratischem Unterrichtsbeamten, wie in Kapitel 6.3.2 (prozeduralbürokratische Gerechtigkeitsüberzeugung) gezeigt, unterscheidet. Die nordrhein-westfälische Lehrerin Frau Ahle-Demmerer verwies so beispielsweise darauf, dass sie sich selbst vor allem als „Berater“ und „Experte für eine Lerngruppe“ verstehen würde und verband damit eine besonders enge und vertrauensvolle Beziehung zu ihren Schüler_innen, die sich u.a. in einer jugendaffinen Sprache, intensiven Beratungen im Klassenrat und der Berücksichtigung der familiären Situation von Schüler_innen ausdrückt und auf Fragen der Leistungsbeurteilung niederschlägt. Für die schwedische Lehrerin Barbro hingegen bedeutet Expertentum vor allem eine Spezialisierung auf ausgewählte Unterrichtsbereiche und –themen, die eine bessere Unterrichtsqualität ermöglicht, als Bedingung jedoch die enge Zusammenarbeit mit einer Kollegin voraussetzt, die ihrerseits in komplementären Themenbereichen spezialisiert ist. In beiden Fällen drückt sich eine eigenwillige Erweiterung des Expertenbegriffs aus, die in enger Verbindung zu den für diese Lehrkräfte relevanten Beziehungskonstellationen stehen. Im Folgenden werden daher die für diese Gerechtigkeitsüberzeugung zentralen Punkte hinsichtlich der diskursiven Aushandlungsprozesse zwischen Lehrkraft und Schüler_innen sowie zwischen Lehrkraft und Kolleg_innen jeweils länderübergreifend vergleichend dargestellt.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

511

Gerechte Beurteilung durch Aushandlungen zwischen Schüler_innen und Lehrer_innen Die Beteiligung der Schüler_innen an der Beurteilung ihrer Leistungen wird im Modus der diskursiv-interaktiven Gerechtigkeitsüberzeugung als zentrales Element einer als gerecht empfundenen Beurteilung verstanden. Unterschiede finden sich hinsichtlich der Form, in der Schüler_innen beteiligt werden sowie dem Zeitpunkt der Beteiligung. Auffällig ist im Ländervergleich, dass die Erklärung von Beurteilungen sich in NRW hauptsächlich auf das Erklären einer Note bezieht, nicht jedoch so stark auf die Erläuterung des damit verbundenen Wissens- bzw. Lernstands der Schüler_innen. Es wird die Zusammensetzung der Gesamtnote aus den vorhergehenden Teilnoten erklärt, teilweise werden die Kriterien für die Beurteilung offengelegt. Für die schwedischen Lehrkräfte kann hingegen die Absicherung eines geteilten Verständnisses der Kriterien und Bewertungsgrundlagen im Sinne einer verbesserten Lernprozessorientierung als primäres Ziel der diskursiven Aushandlungen zwischen Lehrkräften und den von ihnen beurteilten Schüler_innen festgestellt werden. Diese Unterschiede lassen sich zum Teil auch aus den unterschiedlichen rechtlichen Vorgaben in beiden Ländern erklären. Hinsichtlich der offiziellen Regularien bezüglich der schulischen Leistungsbeurteilung finden sich für den nordrhein-westfälischen Kontext nur wenige Hinweise darauf, wie die Schüler_innen in den Prozess der Leistungsbeurteilung einbezogen werden sollen. Laut Schulgesetz sollen Lehrkräfte ihre Schüler_innen und deren Eltern „über die individuelle Lern- und Leistungsentwicklung“ informieren, „Bewertungsmaßstäbe für die Notengebung und für Beurteilungen“ erläutern sowie „auf Wunsch“ den „Leistungsstand“ mitteilen (SchulG NRW, §44, 2). In den Kernlehrplänen wird wiederum darauf hingewiesen, dass die „Kriterien für die Notengebung den Schülerinnen und Schülern transparent“ sein sollen (MSW, 2011a, S. 33; ähnliche Formulierungen finden sich in auch in den anderen Kernlehrplänen). Auch sollen „individuelle Hinweise für das Weiterlernen“ mit den Beurteilungen verbunden werden. Welche Kriterien angemessen sind, wie die Transparentmachung der Beurteilungskri-

512

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

terien oder aber die Hinweise zum Lernprozess zu gestalten sind, ist dabei jeder Lehrkraft und Einzelschule selbst überlassen, in der Regel sollen solche Fragen aber in den schulinternen Grundsätzen der Leistungsbeurteilung geregelt werden (vgl. Kap. 5.2.2). Die im Rahmen dieser Studie von den Lehrkräften zugänglich gemachten oder aber öffentlich auf der Homepage der Schule einsehbaren schulinternen Grundsätze gingen jedoch mehrheitlich nicht über die wenigen in den Kernlehrplänen formulierten Vorgaben hinaus, so dass hier wenige Anhaltspunkte zur Konkretisierung dieser recht schwammigen Vorgaben zu finden sind. Ein weiterer Hinweis bezüglich der Information der Schüler_innen über die Leistungsbeurteilung findet sich in der Ausbildungs- und Prüfungsordnung für die gymnasiale Oberstufe (APO-GOSt), in der festgehalten wird, dass Lehrkräfte verpflichtet sind ihre Schüler_innen „zu Beginn des Kurses über die Zahl und Art der geforderten Klausuren und Leistungsnachweise im Beurteilungsbereich ‚Sonstige Leistungen‘ zu informieren“ und „etwa in der Mitte des Kurshalbjahres [...] über den bis dahin erreichten Leistungsstand“ zu unterrichten (MSW, , §13, 3). 294 Insofern entspricht die oben konstatierte Fokussierung auf die Mitteilung von Quartalsnoten bzw. Erklärung bereits getroffener Beurteilungsentscheidungen den Regularien. Am Fall von Frau Ahle-Demmerer wurde allerdings auch deutlich, dass auch eine weitergehende Einbeziehung der Schüler_innen zu Fragen der Leistungsbeurteilung durch diskursive Aushandlungen möglich sind. Auf die spezifischen Ermöglichungsbedingungen hierfür gehe ich weiter unten zusammenfassend ein. Im schwedischen Schulgesetz wiederum wird zunächst relativ prominent in Kap. 3, §15 die Verpflichtung der Lehrkräfte benannt, die Schüler_innen über die Grundlage der Zeugnisnote zu informieren und „auf Nachfrage den Schüler_innen und deren Eltern die Grundlage der Benotung [zu] erläutern“ (Skollag 2010:800, §§15, 17). In den verschiedenen Handreichungen zur schulischen Leistungsbeurteilung wird diese Informationspflicht über die summative Benotung um die Rolle kommunika294

Für die Schüler_innen der Sekundarstufe I findet sich kein entsprechendes Pendant in der APO-S I.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

513

tiver Aushandlungsprozesse zwischen Lehrkräften und Schüler_innen bei der formativen Beurteilung im Laufe des Schuljahres ergänzt und sehr ausführlich diskutiert. So wird z.B. in den „Allgemeinen Hinweisen“ zur Beurteilung in der weiterführenden Schule empfohlen, den Schüler_innen „fortlaufend Informationen über Erfolge und Entwicklungsbedarfe ihres Lernens“ zu geben und sich zu „vergewissern, dass die Schüler_innen ausreichend Informationen haben, um zu verstehen, welche Fähigkeiten sie [...] entwickeln sollen und wie sie diese Fähigkeiten zeigen können“ (Skolverket, 2012a, S. 10–11); an anderer Stelle wird davon gesprochen „im Dialog mit den Schüler_innen“ (Skolverket, 2012a, S. 12) sicherzustellen, dass die Schüler_innen sich über die Lernziele und Beurteilungsgrundlagen im Klaren und die Schüler_innen „einverstanden“ (Skolverket, 2012a, S. 16) sind mit der Art und Weise der Beurteilung. Ähnliches findet sich in vielen anderen Handreichungen (vgl. z.B. Skolverket, 2011b, S. 11; Skolverket, 2014b, S. 4), in denen die Einbeziehung der Schüler_innen in die Beurteilung ihres Lernprozesses als wichtiges Element einer gerechten Beurteilung entworfen wird. In einer Evaluation der Reformen aus dem Jahr 2014 gaben zudem über die Hälfte der befragten Lehrkräfte an, mehr mit ihren Schüler_innen über Beurteilungsfragen zu sprechen als vor der Reform von 2011 (Skolverket, 2014c, S. 15). Daneben besteht im schwedischen Bildungssystem durch die seit Mitte der 1990er Jahre existierenden halbjährlichen Beurteilungsgespräche (utvecklingssamtal; vgl. Kap. 5.1.2) eine gewisse Tradition der kommunikativen Aushandlung von Lernzielen, Erwartungen an die Schüler_innen und dem individuellen Lernprozess zwischen Lehrkräften, Schüler_innen und deren Eltern. Wie in den schwedischen Interviews allerdings auch deutlich wurde, führt die fortlaufende Besprechung der Beurteilungskriterien mit den Schüler_innen teilweise zu einer erhöhten Notenfixierung der Schüler_innen (vgl. die Äußerungen von Karin) durch die Dauerpräsenz von Zensuren (oder Zensurenniveaus) in Beurteilungsrastern und ähnlichem, wodurch die formative Funktion der Beurteilungsraster teilweise von einer summativen Logik überlagert wird. Das Phänomen der gestiegenen Notenfixierung der Schüler_innen wird auch als „Zensurenhetze“

514

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

(betygshets) bezeichnet und nicht nur in der schwedischen Presse seit Einführung der neuen Notenskala heftig diskutiert, sondern auch in qualitativen Studien zur veränderten professionellen Rolle schwedischer Lehrkräfte im neuen Beurteilungssystem bestätigt (Mickwitz, 2015, S. 208–215). Zudem wird befürchtet, dass die mit den formativen Beurteilungsinstrumenten einhergehenden Erwartungen an die Schüler_innen, sich als eigenverantwortliche Lernende den eigenen Lernprozess fortlaufend bewusst zu machen und die eigenen Stärken und Schwächen kontinuierlich zu evaluieren, eine wachsende „performativity culture“ befördert würde (vgl. Ball, 2003; Olovsson, 2015; Larsson et al., 2010). Dass das Einverständnis der Schüler_innen eine so wichtige Rolle im schwedischen Beurteilungssystem spielt, kann zudem auch auf die fehlende Möglichkeit der Anfechtung von Zeugniszensuren zurückgeführt werden (vgl. hierzu Kap. 6.3.2.3), wie am Beispiel des „Zeugnisvorschlags“ („betygsförslag“) der Lehrerin Pernilla deutlich wurde. Die Sicherstellung einer einvernehmlichen Beurteilung zwischen Lehrkraft und Schüler_innen im Vorfeld der Zeugniserstellung kompensiert damit sozusagen die fehlenden Widerspruchsmöglichkeiten im Nachhinein. Allen Lehrkräften, die in den vorhergehenden Abschnitten zur diskursivinteraktiven Gerechtigkeitsüberzeugung zitiert wurden, gemeinsam ist jedoch die Betonung einer guten und vertrauensvollen Beziehung zwischen Lehrkraft und ihren Schüler_innen für eine gerechte Beurteilung. Die diskursiven Aushandlungsstrategien gehen dabei über das Konzept der Transparenz (vgl. Kap. 6.3.2.3) insofern hinaus, als es nicht nur um die Sichtbarmachung von Kriterien oder Benotungen geht, vielmehr bemühen sich die Lehrkräfte darum sicherzustellen, dass die Schüler_innen diese Kriterien oder Benotungen im Gespräch auch verstehen und nachvollziehen können. Dies erfordert auch, wie deutlich wird, eine zurückgenommenere Haltung der Lehrkräfte im Sinne von beratenden Begleiter_innen des Lernprozesses. Die schwedische Beurteilungsforschung zeigt so auch, dass die Verwendung detaillierter Beurteilungsraster einerseits positive Auswirkungen auf den Lernprozess haben können, insbesondere, weil Schüler_innen die genauen Beurteilungskriterien besser nachvollziehen können (Pandero & Jönsson, 2013). Gleichzeitig führen

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

515

detaillierte Vorgaben nicht unbedingt zu gleichen Beurteilungen (Jönsson & Svingby, 2007), da Lehrkräfte die Beurteilungsvorgaben immer noch unterschiedlich auslegen und interpretieren können, beispielweise hinsichtlich der Gewichtung einzelner Kriterien für das Gesamturteil. Dessen ungeachtet existiert eine nicht zu verleugnende „Symmetrieund Machtantinomie“ (Helsper, 2002) zwischen Lehrenden und Lernenden, d.h. die Aushandlungsprozesse mit Schüler_innen finden nicht wirklich auf Augenhöhe statt, sie sind immer auch Teil eines allen Beteiligten bewussten Machtungleichgewichts. Nichtsdestotrotz ringen die Lehrkräfte um das Verständnis ihrer Schüler_innen, versuchen ihnen ihre Entscheidungen zu verdeutlichen, zu erklären, sie zu rechtfertigen. Bei diesen diskursiven Aushandlungsprozessen geht es um die Herstellung eines Arbeitsbündnisses, bei dem alle Beteiligten wissen, dass es ein Machtungleichgewicht gibt und die Schüler_innen im Zweifel die Entscheidungen der Lehrkräfte akzeptieren (müssen). Die Lehrkräfte versuchen auf unterschiedliche Weisen ihren Beurteilungen mehr Legitimität zu verschaffen, indem sie die von ihnen Beurteilten einbinden und den Beurteilungsprozess entweder detailliert darlegen, die Schüler_innen durch Selbst- und Peerbeurteilungen direkt am Beurteilungsprozess beteiligen oder retrospektiv Erklärungen für ihre Beurteilungen liefern bzw. von den Schüler_innen retrospektiv ‚absegnen‘ lassen. Im Unterschied zur kompensatorischen Gerechtigkeitsüberzeugung liegt der Fokus zudem bei der diskursiv-interaktiven Gerechtigkeitsüberzeugung stärker auf der gemeinsamen Herstellung von zu beurteilenden Leistungen durch Schüler_innen und Lehrkräfte, wie das Beispiel vom „Zusatz machen“ in Klassenarbeiten bei Frau Ahle-Demmerer oder die Betonung des Miteinander-Lernens von Schüler_innen und Lehrkräften bei Mats und Barbro deutlich wurde. Bei der kompensatorischen Gerechtigkeitsüberzeugung wird vielmehr das Ermöglichen von Bedingungen des Lernens thematisiert, ohne dass die aktive Rolle der Schüler_innen als Bedingung hervorgehoben wird.

516

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Gerechte Beurteilung mittels Aushandlungen zwischen Kolleg_innen Der länderübergreifende Fallvergleich hinsichtlich des kollegialen Austauschs als Strategie für eine gerechte Leistungsbeurteilung zeigt zunächst einen deutlichen Unterschied zwischen den befragten nordrheinwestfälischen und schwedischen Lehrkräften: Während der kollegiale Austausch unter dem Stichwort eines geteilten Beurteilungsverständnisses (samsyn) von den schwedischen Lehrkräften als zentraler Bestandteil einer gerechten Beurteilung entworfen wird, findet sich bei den nordrhein-westfälischen Lehrkräften ein sehr heterogenes Bild, das auf eine wenig institutionalisierte und von lokalen Beurteilungskulturen abhängige Kooperationspraxis schließen lässt. Im Vergleich zu ihren schwedischen Kolleg_innen fällt auf, dass die Lehrkräfte in NRW weniger über kollegialen Austausch zu konkreten Beurteilungsfragen mit ihren Kolleg_innen berichten. Es scheint zwar rege Kommunikation über Unterrichtsgestaltung und –themen zu geben, zu konkreten Beurteilungsfragen werden die Kolleg_innen aber häufig nur im Zweifelsfall bei schriftlichen Arbeiten einbezogen, um eine zweite Meinung einzuholen, wenn Schüler_innen ‚zwischen zwei Noten stehen‘. Im Regelfall beurteilt eine Lehrkraft allein und die Legitimität ihrer Beurteilungen stützt sich hauptsächlich auf das Vertrauen in die eigene professionelle Urteilskraft. Dies zeigt sich u.a. auch in der Betonung von Lehrkräften ihrer Eigenständigkeit und pädagogischen Freiheit bei der Leistungsbeurteilung – ein Begriff der in den schwedischen Interviews gar nicht auftaucht. Auch Formulierungen wie „meine Kriterien“, „meine Noten“ sowie „nach meinem Verständnis“ zeugen von einer eher individuellen und weniger kollektiv ausgehandelten Beurteilungspraxis. Wie an den Interviewauszügen im vorangehenden Kapitel deutlich wurde, beinhaltet die kollegiale Aushandlung immer auch die Gefahr der Infragestellung der Beurteilungskompetenz, weshalb dieser Austausch nur unter bestimmten Bedingungen stattfindet: So drücken einige jüngere Lehrkräfte des Samples aus, dass sie sich mehr Austausch wünschen bzw. diesen bereits praktizieren (vgl. Frau Lindenau, Herr Kleinert), wobei dies natürlich auch als Bewältigungsstrate-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

517

gie für die klassischen „Entwicklungsaufgaben“ des Berufseinstiegs (vgl. Hericks, 2006) gelesen werden kann. Nichtsdestotrotz haben diese Lehrkräfte durch veränderte Ausbildungsinhalte möglicherweise auch eine offenere Haltung gegenüber kollegialer Zusammenarbeit entwickeln können, die nicht auf die berufliche Einstiegsphase beschränkt bleibt. Andere Lehrkräfte wiederum berichten davon, dass die Zusammenarbeit vor allem eine Frage der gegenseitigen Sympathie und ähnlicher Arbeitsweise sei (vgl. Frau Dorpenbeck, Frau Stakenhues), was den Aspekt des Vertrauens in die kollegiale Beziehung als Bedingung für Zusammenarbeit betont. Einige der Lehrkräfte des NRW-Samples wiesen wiederum explizit darauf hin, dass sich durch die Einführung der Zentralen Prüfungen in Klasse 10 bzw. das Zentralabitur die Notwendigkeit des Austauschs innerhalb der Kollegien verändert habe, da die Lehrkräfte nun stärker gezwungen seien zusammenzuarbeiten und sich über die Beurteilungskriterien auch in den unteren Jahrgangsstufen stärker austauschen würden (vgl. z.B. Herr Opdenkamp, Z. 100-106; Frau Heinkötter, Z. 318-325). Eine bildungspolitische Zielstellung der KMK-Gesamtstrategie zum Bildungsmonitoring war u.a. die Förderung „verbindlicher Zusammenarbeit der Lehrkräfte“ durch die Einführung von VERA und schulinternen Qualitätssicherungsmaßnahmen (KMK, 2012c, S. 5). Wie in Kapitel 5.2.2 ausgeführt, konnte dieser Effekt mit gewissen Einschränkungen für Lehrkräfte in NRW bereits nachgewiesen werden (vgl. Ferchow & Pfuhl, 2011). Insgesamt kann damit der Befund einer „Tabuisierung des Themas ‚Praxis und Standards der Leistungsbeurteilung‘ innerhalb kollegialer Kommunikation“ (Terhart, 1999, S. 281) für die nordrheinwestfälischen Lehrkräfte nur bedingt bestätigt werden. Die schwedischen Lehrkräfte mit einer diskursiv-interaktiven Gerechtigkeitsüberzeugung legen vor allem Wert darauf sich mit ihren Kolleg_innen über die Beurteilungsgrundlagen zu verständigen, um ein gemeinsames Verständnis der Wissensanforderungen (kunskapskrav) und Bewertungsbegriffe (värdeord) zu entwickeln („Was heißt ,einfach‘, was

518

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

heißt ,relativ entwickelt‘?“).295 In den schwedischen Regularien wurde der kollegiale Austausch über die Beurteilungskriterien und die Verständigung über ein geteiltes Beurteilungsverständnis (samsyn) seit den Reformen ab 2011 besonders betont (vgl. hierzu Skolverket, 2011b, S. 5; Skolinspektionen, 2013b) und unter dem Schlagwort des „gemeinsamen Beurteilens“ (sambedömning) als ein wichtiges Instrument zur Sicherung einer gleichwertigen Beurteilung und Notenvergabe propagiert (Skolverket, 2013a, S. 5). Aber auch schon vor der letzten Reformwelle wurde die Übereinstimmung (samstämmighet) von Beurteilungen insbesondere in Bezug auf die standardisierten Tests (nationella prov) als zentral für eine gleichwertige und damit gerechte Beurteilung betont (vgl. u.a. Skolverket, 2005, S. 26–28; Erickson, 2009; Skolverket, 2009). Der Unterschied zwischen einem geteilten Beurteilungsverständnis (samsyn) und einer Übereinstimmungsquote im Beurteilungsergebnis (samstämmighet) (vgl. hierzu auch Jönsson & Thornberg, 2014) zeigt sich so auch in den Überzeugungen der Lehrkräfte, die eher eine diskursiv-interaktive bzw. eine prozedural-bürokratische Gerechtigkeitsüberzeugung vertreten. Wie in Kapitel 6.3.2 deutlich wurde, liegt der Fokus bei der prozedural-bürokratischen Gerechtigkeitsüberzeugung stärker auf den Ergebnissen und einem möglichst gleichen Endergebnis – ohne dabei jedoch die zugrundeliegenden Kriterien abzugleichen. Im Zweifel könnten so auch zwei Aufsätze die gleiche Note bekommen, im einen Fall aber die Gewichtung auf der Rechtschreibleistung und im anderen auf der Darstellungsform liegen. Das Ergebnis wäre trotzdem gleich und würde auch als gerecht angesehen, ohne jedoch die unterschiedlichen zugrundeliegenden Kriterien zu problematisieren. Das von den Lehrkräften mit diskursiv-interaktiver Gerechtigkeitsüberzeugung betonte Herstellen eines gemeinsamen Beurteilungsverständnisses geht über diese Ergebnisorientierung hinaus und zielt auf ein in regelmäßigen Gesprächen über die Kriterien der Leistungsbeurteilung geschaffenes kollegial geteiltes Beurteilungsverständnis. 295

In der Falldarstellung des Mathematiklehrers Fredrik habe ich für die kollegiale Deutung der Vorgaben auch den Begriff der „Scharnierfunktion“ verwendet, vgl. Kap. 6.3.2.1.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

519

Das gemeinsame Beurteilen von Schüler_innenleistung durch mehrere Lehrkräfte kann weiterhin als Strategie verstanden werden, die eigene subjektive Beurteilung durch das Abgleichen mit anderen zu relativieren und durch die Bündelung mehrerer Perspektiven diese Subjektivität einzuschränken bzw. zu kontrollieren, wie am Beispiel der Lehrerin Barbro oder Pernilla deutlich wurde (vgl. zum Konzept der kontrollierten Subjektivität Kleber, 1992). Dies kann auch mit einem Gefühl gestiegener gesellschaftlicher Beobachtung und Kontrolle von Lehrkräften durch die Fokussierung auf die „Zielerreichung“ (måluppfyllelse) von Schule insgesamt zusammenhängen. Dass die Notwendigkeit der gemeinsamen Deutung besteht, da die zentral vorgegebenen Beurteilungskriterien bei weitem nicht so eindeutig sind, wird sowohl in ersten Evaluationen der Schulbehörde (vgl. u.a. Skolverket, 2015b; Skolverket, 2014c) als auch weiteren Forschungen (vgl. u.a. Mickwitz, 2015; Wahlström & Sundberg, 2015) zur Umsetzung und ersten Effekten der Reformen von 2011 deutlich. Zusammenfassend können vor allem die Beziehungskonstellationen wie auch das professionelle Selbstbild als wichtige, miteinander verbundene Merkmale einer diskursiv-interaktiven Gerechtigkeitsüberzeugung ausgemacht werden. Wie am Fall der schwedischen Lehrerin Barbro wie auch der nordrhein-westfälischen Lehrerin Frau Ahle-Demmerer deutlich wurde, zeichnen sich diese Lehrkräfte durch ein professionelles Selbstbild als in erster Linie beratende Lehrkraft aus, die versuchen als Gesprächspartner_innen auf Augenhöhe eine vertrauensvolle Beziehung zu ihren Schüler_innen aufbauen. Im Gegensatz zur mathematischrechnerischen und prozedural-bürokratischen Gerechtigkeitsüberzeugung sind Nachfragen von Schüler_innen selbstverständlicher Bestandteil einer gerechten Beurteilung und werden nicht als lästige „Diskussionen“ aufgefasst. Die Erklärung und Offenlegung von Beurteilungskriterien dient nicht nur der Herstellung von Transparenz, vielmehr sollen Schüler_innen ein tieferes Verständnis des Beurteilungsprozesses entwickeln und diesen nachvollziehen können, um daraus wiederum Rückschlüsse für ihr weiteres Lernen zu ziehen. Dies führt auch zu einer Rollenverschiebung auf beiden Seiten: die Schüler_innen werden als aktive

520

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Lernende stärker in den Beurteilungsprozess einbezogen, die Lehrkräfte hingegen nehmen eine eher zurückhaltende Rolle ein. Das Pendant hierzu bildet – vor allem für die schwedischen Lehrkräfte – der kollegiale Austausch, der zur Herstellung eines geteilten Beurteilungsverständnisses dient und eine eher individuelle Beurteilungspraxis ausschließt. Bedingung für diesen kollegialen Austausch ist jedoch eine grundsätzliche Offenheit für Kritik und Anregungen von außen, die nicht als Angriffe auf die eigene Professionalität gedeutet werden; auch müssen die organisatorischen Rahmenbedingungen dies zulassen, wie der Hinweis der Lehrerin Pernilla zeigt. Im Hinblick auf das Beurteilungsverständnis ist eine deutliche Tendenz zur individuellen Bezugsnorm erkennbar, wobei diese immer auch in Konkurrenz zur kriterialen Bezugsnorm steht und je nach Einzelfall zwischen beiden abgewogen wird. Besonders deutlich wird dies bei den schwedischen Lehrkräften, deren diskursive Aushandlungen sowohl im Kollegium als auch mit den Schüler_innen hauptsächlich um die richtige Deutung der Lehrplanvorgaben und Beurteilungskriterien drehen. Die nordrhein-westfälischen Lehrkräfte verfügen in dieser Hinsicht über größere Spielräume, da die Kernlernpläne zwar die Lernziele, nicht aber die Beurteilungskriterien vorgeben. Die soziale Bezugsnorm wird hingegen, anders als bei der mathematisch-rechnerischen und prozeduralbürokratischen Gerechtigkeitsüberzeugung, nicht als legitimer Maßstab angesehen.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

521

6.3.4 Kompensatorische Gerechtigkeitsüberzeugung Unter Kompensation wird gemeinhin das Ausgleichen von etwas durch etwas Anderes verstanden (latein. compensare = ausgleichen, ersetzen). Im Rahmen von Schule und Unterricht, und hier speziell der Beurteilung von Schüler_innenleistungen, bezieht sich dieses Ausgleichen oder Kompensieren auf unterschiedliche Voraussetzungen von Schüler_innen bei der Erbringung und anschließenden Beurteilung von schulischen Leistungen. In diesem Kapitel sollen Variationen von Gerechtigkeitsüberzeugungen dargestellt werden, in denen es um die Kompensation von Benachteiligungen von Schüler_innen durch die schulische Leistungsbeurteilung geht. Welcher Art diese Benachteiligungen sein können, fällt in den Interviews sehr unterschiedlich aus. Ebenso die Frage, welche Benachteiligungen von den Lehrkräften benannt werden und welche Arten der Kompensation für sie legitim erscheinen, ist hier von Bedeutung. Hervorzuheben ist hierbei, dass in den Interviews bewusst nicht nach spezifischen Formen von Benachteiligungen gefragt wurde – etwa entlang der klassischen Ungleichheitsdeterminanten Geschlecht, soziale oder ethnische Herkunft, Behinderung (vgl. Solga & Dombrowski, 2009, S. 11). Sofern die Lehrkräfte nicht von selbst das Thema ansprachen, wurden sie durch offene Fragen nach der Unterschiedlichkeit von Schüler_innen dazu animiert, eigene Definitionen von Benachteiligungen zu formulieren sowie ihren Umgang damit in Bezug auf die Leistungsbeurteilung zu beschreiben. Abgeleitet aus dem empirischen Material dieser Untersuchung kann unterschieden werden, was (Art der Benachteiligung) wodurch (kompensatorische Maßnahme bzw. Strategie) wie begründet (Legitimation) und durch wen (Akteure) kompensiert werden soll. Diese Dimensionen kompensatorischer Gerechtigkeit sollen hier nur kurz skizziert werden, bevor sie im Anschluss am empirischen Material gezeigt und ausführlich diskutiert werden. Hinsichtlich der Art der Benachteiligung kann es sich um das Ausgleichen temporärer, punktueller Beeinträchtigungen oder zeitstabilerer Benachteiligungen von einzelnen Schüler_innen handeln, hier spielt also zusätz-

522

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

lich eine zeitliche Dimension hinein. Was genau von den Befragten als dauerhaft bzw. temporäre Beeinträchtigung gelesen wird und wie darauf reagiert wird – kurz: welche Beeinträchtigung welche Unterstützung legitimiert und notwendig macht – unterscheidet sich dabei zwischen den befragten Lehrkräften z.T. erheblich. Darüber hinaus wird die Notwendigkeit kompensatorischer Maßnahmen von den befragten Lehrkräften teilweise explizit unter Verweis auf unterschiedliche Ausgangslagen von Schüler_innen (bezogen auf den sozialen bzw. familiären Hintergrund, körperlich oder geistige Behinderungen, Mehrsprachigkeit, Fluchterfahrungen, sog. ‚Teilleistungsschwächen‘ wie Lese-RechtschreibSchwäche oder Dyskalkulie, u.a.) begründet. Darüber hinaus finden sich aber auch zahlreiche implizite bzw. von diesen Ausgangslagen scheinbar losgelöste Begründungen von unterschiedlichen Leistungen einzelner Schüler_innen, die durch kompensatorische Maßnahmen ausgeglichen werden sollen (z. Bsp. Persönlichkeitszuschreibungen wie Schüchternheit oder allgemeine Zuschreibungen als ‚schwache‘ Schüler_innen). Die gewählten bzw. berichteten Strategien im Umgang mit Benachteiligungen stehen dabei im engen Zusammenhang zu dem in den jeweiligen Regularien umschriebenen Handlungsspielraum, diese beeinflussen damit das für Lehrkräfte überhaupt Denkbare und Machbare. Unterschieden werden können institutionalisierte Kompensationsmöglichkeiten bzw. Möglichkeiten der Unterstützung sowie individuelle Entscheidungen einzelner Lehrkräfte, die unter Rückgriff auf ihre pädagogischen Überzeugungen begründet werden. Letztlich handeln die Lehrkräfte die potentiellen Kompensationsmaßnahmen mal im inneren Dialog mit sich selbst, mal im Austausch mit Kolleg_innen, mal in Zusammenarbeit mit der Schulleitung aus. Deutlich wird jedoch eine weniger starke Fokussierung auf das eigentliche Beurteilungsverfahren (wie im Modus prozedural-bürokratischer Gerechtigkeitsüberzeugungen, vgl. Kap. 6.3.2), vielmehr erweitert sich hier der Blick auf den Zusammenhang von Unterrichten und Beurteilen sowie die Schaffung von Voraussetzungen, unter denen Schüler_innen ermöglicht wird, ihre schulischen Leistungen überhaupt zeigen zu können.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

523

Allen Formen der kompensatorischen Gerechtigkeitsüberzeugungen gemeinsam ist eine starke Orientierung am Bedürfnisprinzip (need).296 Der Fokus liegt auf dem individuellen Kind bzw. Jugendlichen und seinen speziellen Bedürfnissen. Mithilfe kompensatorischer Maßnahmen soll die Überwindung von Hürden zur Leistungserbringung ermöglicht werden. Damit verbunden ist ein spezifisches Verständnis des Gleichheitsprinzips (equality). Im Mittelpunkt steht nicht die Absicherung eines für alle Schüler_innen gleichen Beurteilungsverfahrens oder das Messen aller Schüler_innen am gleichen Maßstab (wie im Modus der prozeduralbürokratischen bzw. mathematisch-rechnerischen Gerechtigkeitsüberzeugung), vielmehr geht es darum gleiche Chancen durch das Ausgleichen von ungleichen Ausgangslagen zu ermöglichen (equality of opportunity). Damit einher geht immer auch die Frage, wann eine Ungleichbehandlung von Schüler_innen aufgrund von kompensatorischen Maßnahmen als legitim gilt – und wann nicht. Das heißt, wem ‚darf‘ geholfen werden, ab wann sind kompensatorische Maßnahmen, wie ein Zeitausgleich bei schriftlichen Prüfungen, (nicht mehr) legitim? Es zeigt sich weiterhin, dass Lehrkräfte mit einer kompensatorischen Gerechtigkeitsüberzeugung die individuelle Bezugsnorm (vgl. Rheinberg, 1981) bei der Beurteilung von Schüler_innenleistungen bevorzugt anwenden und diese für gerechter halten, als dies bei den anderen Gerechtigkeitsüberzeugungen geschieht. Die Lehrkräfte betonen eher den individuellen Lernfortschritt einzelner Schüler_innen gemessen an ihren eigenen Leistungen zu einem früheren Zeitpunkt bzw. setzen die Lernfortschritte in Beziehung zu den Benachteiligungen, die sie den jeweiligen Schüler_innen zuschreiben. Eng verbunden mit einer an Kompensation ausgerichteten Gerechtigkeitsüberzeugung ist auch ein Selbstbild als fördernde und beratende Lehrkraft, deren Aufgabenbereich über das reine Unterrichten hinausgeht. Dieses Selbstbild geht auch mit einer hohen Bereitschaft

296

Zu den drei Prinzipien der Verteilungsgerechtigkeit – Bedürfnisprinzip (need), Gleichheitsprinzip (equality) sowie Leistungsgerechtigkeit (equity) – vgl. Kapitel 2.2 sowie Volkmann (2006, S. 53–54).

524

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

zur Verantwortungsübernahme für den Lernerfolg der Schüler_innen einher. Im Folgenden werden zwei exemplarische Referenzfälle – die schwedische Lehrerin Lisbeth und Frau Hollerdieck aus NRW – ausführlich dargestellt und dabei erste Unterschiede und Gemeinsamkeiten präsentiert. Im Anschluss an die Einzeldarstellungen werden die herausgearbeiteten Charakteristika wiederum fall- und länderübergreifend vergleichend diskutiert. 6.3.4.1 Lisbeth – „man kann verschiedene Wege finden“ Die Lehrerin Lisbeth ist zum Zeitpunkt des Interviews 35 Jahre alt und seit zehn Jahren im Schuldienst. Sie unterrichtet die Fächer Schwedisch und Deutsch in den Klassen 7 bis 9 an einer grundskola und hat sich freiwillig zum Interview gemeldet. Das Interview fand in einem Beratungsraum in der Schule während einer Freistunde statt und war eines von drei Interviews an dieser Schule.

Fortlaufende Beurteilung und Fokus auf den Lernprozess In der allgemeinen Beschreibung ihrer Beurteilungspraxis im Schwedischunterricht betont Lisbeth, dass es sich um einen fortlaufenden Prozess („det är mer LÖPANDE hela tiden“, Z. 20-21) handele und sie kaum punktuelle Überprüfungen, wie Tests oder Klassenarbeiten, anwende. Vielmehr würden die Schüler_innen kontinuierlich an längerfristigen Schreibaufgaben arbeiten und regelmäßige Rückmeldungen dazu bekommen: „Sie bekommen FEEDBACK darauf und dann versucht man ihnen hinterher zu helfen. Und dann sammelt man das ein und macht eine Beurteilung. Und sie sollen ihre Texte dann auch danach überarbei-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

525

ten, damit sie LERNEN, was sie (.) falsch gemacht haben, sozusagen“297 (Z. 23-26). Die fortlaufende, formative Beurteilung ist für Lisbeth die Grundlage ihres unterrichtlichen Handelns, bei dem sie permanent versucht herauszufinden, was ihre Schüler_innen schon gelernt haben und welche zusätzlichen Hilfen sie gegebenenfalls noch benötigen. Dafür ist eine kontinuierliche Beobachtung und ‚Datensammlung‘ notwendig („Ich versuche sie während des Halbjahres zu beobachten und=und so viel wie möglich einzusammeln“298 Z. 304-305). Doch anders als für andere Lehrkräfte des Samples liegt der Sinn dieser ‚Datensammlung‘ nicht darin, Rechenschaft gegenüber Dritten ablegen zu können (wie z.B. für Herrn Grabenmüller oder Lisbeths Kollegen Fredrik) oder eine mathematisch korrekte Beurteilung als Ergebnis von Mittelwertberechnungen (wie z.B bei Frau Amberg oder Malin) erstellen zu können. Das Einsammeln von Schülerarbeiten dient der fortlaufenden Beurteilung (fortlöpande bedömning) im Sinne eines Beobachtens und Feststellens der Lernentwicklung durch die Lehrkraft. Aus ihnen erfolgt eine Rückmeldung an die Schüler_innen („Feedback geben“) und daraus sollen die Schüler_innen wiederum Orientierung für den darauf aufbauenden Lernprozess ziehen können, indem Lisbeth den Schüler_innen auch aufzeigt, woran diese noch weiterarbeiten müssen („überarbeiten, damit sie LERNEN, was sie falsch gemacht haben“). Die Betonung des Verbs lernen an dieser Stelle verdeutlicht ihre Perspektive auf Beurteilungsprozesse als Lernprozesse. Ihre Beurteilungspraxis wird auch von ihrem Kollegium geteilt und Lisbeth kann nach eigenen Aussagen auf verschiedene institutionalisierte Unterstützungsangebote zurückgreifen: es gibt regelmäßige Austauschmöglichkeiten mit den Fachkolleg_innen und den Lehrkräften der Klassen 7-9, eine enge Zusammenarbeit mit einer sonderpädagogischen

297

Original: „De får FEEDBACK på den och man försöker hjälpa dem efter hand. Och sen att man samlar in och gör en bedömning. Och att de får bearbeta sin text efter det också, för att LÄRA sig då vad de har gjort (.) fel så att säga.” (Z. 23-26) 298 Original: „jag försöker ju liksom under terminens gång att observera dem och=och samla in så mycket som möjligt.” (Z. 304-305)

526

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Fachkraft und eine grundsätzliche Atmosphäre der gegenseitigen Hilfestellung (vgl. Z. 353-355). Auch Lisbeths Art der Dokumentation von Beurteilungen folgt eher dem Lernprozess der Schüler_innen als einem streng formalisierten Procedere, wie es beispielsweise im Abschnitt zur prozedural-bürokratisch hergestellten Gerechtigkeit ausgeführt wurde. Lisbeth führt eine vergleichsweise simple digitale Ablage, d.h. sie legt für alle ihre Schüler_innen jeweils einen Ordner auf ihrem PC an, in den im Verlauf des Schuljahres verschiedene Dokumente299 abgelegt werden: von den Schüler_innen eingereichte Texte in den verschiedenen Entstehungsphasen, ihre eigenen zusammenfassenden schriftlichen Kommentare dazu, die die Schüler_innen als Rückmeldung zu ihren Texten erhalten haben, und zusätzliche Materialien (z.B. eingereichte Hausaufgaben). Die Anzahl und Art der Dokumente kann sehr unterschiedlich ausfallen, je nachdem, was sie im Verlauf des Schuljahres „einsammeln“ kann und was die Schüler_innen ihr auch geben und zeigen. Neben der Begleitung des Lernprozesses ihrer Schüler_innen im Schuljahresverlauf dienen diese Dateien am Ende des Schuljahres als Beurteilungsgrundlage bei der Erstellung der Zeugniszensuren – in ihrer Offenheit und wenig standardisierten Form lässt diese Art der Dokumentation jedoch noch viel Spielraum für die endgültige Notenentscheidung. Auf die Frage, wie genau die Zeugniszensuren (betyg) am Ende des Schuljahres zustande kommen und ob diese sich ähnlich zur Praxis in NRW aus verschiedenen Teilnoten zusammensetzen würden, antwortet Lisbeth folgendermaßen: „Ja, da=das dürfen wir eigentlich nicht machen. Äh ich mache es so, dass ich=ich gebe die Note für MICH. Das mache ich. In meinen Notizen. Also, wenn wir Hausaufga-

299

Die schwedischen Lehrkräfte berichten häufig davon, dass – gerade in den sprachlichen Fächern – die Schüler_innen ihre Aufgaben am PC oder Laptop erfüllen und die Texte, Hausaufgaben etc. per E-Mail oder auf geteilten Netzlaufwerken der Schule einreichen. Auch die Korrektur dieser Schülerarbeiten und Rückmeldungen durch die Lehrkraft erfolgen häufig digital und ermöglichen so ein detailliertes Nachvollziehen des Lernfortschritts einzelner Schüler_innen.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

527

benkontrolle hatten und ich dann alles summiert300 habe, dann schreibe ich mir eine=eine Zusammenfassung dafür auf. Oder besser gesagt, schreibe ich: Leseverstehen – diese Note; Hörverstehen – diese; schriftlich – diese. Und so weiter. Ä:äh, aber ich teile das den Schüler_innen nicht auf die gleiche Weise mit. Ich sage: ‚Genau, seid ihr über dieser Grenze, dann ist das GUT. Und wenn es darüber hinaus geht, dann ist es umso besser.‘“301(Z. 78-83)

Mit der Aussage „das dürfen wir eigentlich nicht machen“ verweist Lisbeth direkt auf die Grenzen dessen, was sie als legitime Beurteilungspraxis aus den Regularien ableitet: Beurteilungen sollen nicht in Form von Noten erfolgen und erst mit dem Zeugnis am Ende des Halbjahres vergeben werden. Gleichzeitig relativiert sie das Verbot mit dem Partikel „eigentlich“ und erläutert ihre Strategie der Unterscheidung zwischen einer ‚inneren‘ und einer ‚äußeren‘ Kommunikation: für ihre eigene Dokumentation nutzt sie sehr wohl die Notenstufen und notiert sich für einzelne Teilleistungen oder Wissensanforderungen aus den Lehrplänen eine entsprechende Zensur – aber eben nur in ihren Notizen. In der Kommunikation mit den Schüler_innen nutzt sie dagegen verbale Umschreibungen dessen, was sie sich als Notennotiz vermerkt hat und versieht diese Kommentare an die Schüler_innen noch mit kleinen Aufmunterungen („dann ist das gut“, „dann ist es umso besser“). Die Schü300

Das von ihr verwendete schwedische Verb att summera kann sowohl als mathematisches summieren/aufsummieren übersetzt werden, als auch mit zusammenfassen. Allerdings beinhaltet das deutsche, bildungssprachliche Wort subsummieren auch eine mathematische Komponente und kann ebenfalls als zusammenfassen verstanden werden. Welche dieser beiden Bedeutungen Lisbeth eher gemeint haben könnte, lässt sich aus dem Interview nicht eindeutig rekonstruieren, in der Übersetzung habe ich daher sowohl summieren als auch Zusammenfassung verwendet. Die Vermutung liegt jedoch nahe, dass es nicht in einem mathematischen Sinne als zusammenrechnen, sondern eher als zusammenfassen zu verstehen ist. 301 Original: „Ja, de=det får vi ju egentligen inte göra. Eh sen gör jag ju så att jag=jag sätter betyg för MIG. Det gör jag. I mina noteringar. Så när vi har haft läxförhör och jag har summerat allting så sätter jag ju en, en summering på det. Eller rättare sagt jag sätter ehm ja: ”Läsförståelse; det betyget, hörförståelse; den, skriftligt; den." Och så vidare. E:eh men jag delger inte det till eleven på samma sätt. Jag säger att: ”Visst, har ni över den här gränsen så är det BRA. Och går det uppåt så är det ännu bättre.” (Z. 78-83)

528

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

ler_innen erhalten somit zwar eine (mehr oder weniger hilfreiche) Rückmeldung zu ihrem Lernprozess, gleichzeitig lässt Lisbeth sie ‚im Dunkeln tappen‘ was die finale Note sein wird. Begründet wird diese doppelte Kommunikation von Lisbeth mit ihrer Erfahrung, dass die Schüler_innen „blind auf die Noten starren”302 (Z. 83) würden. Ähnlich begründet sie auch ihre Abkehr von Bepunktungen bei der Beurteilung von schriftlichen Arbeiten, denn „wenn man Punkte vergibt, sehen sie nur die PUNKTE [...] Anstatt sich darauf zu konzentrieren: ‚WAS kann ich besser machen? Woran muss ich noch arbeiten?‘“303 (Z. 87-89). Lisbeth möchte ihre Beurteilungspraxis als formative, den Lernprozess begleitende Beurteilung verstanden wissen und versucht deshalb den Einsatz von Punkten und Noten in der Kommunikation mit den Schüler_innen zu vermeiden. Gleichzeitig dienen die Noten in ihren Notizen ihr als ‚heimliche Helfer‘ bei der Dokumentation des Lernprozesses der Schüler_innen und bilden die Beurteilungsgrundlage für die Zeugniszensuren. Dass sie diese jedoch mehr als Orientierungshilfe denn als bindende Maßgabe betrachtet, wird später noch deutlicher, wenn es um die Entscheidung zwischen den Noten ‚E‘ und ‚F‘ geht.

„Verschiedene Wege finden“ – Professionelles Selbstverständnis und Beurteilungsstrategien Lisbeths Überzeugungen hinsichtlich einer gerechten Beurteilungspraxis lassen sich mit der aus einem in-vivo-Kode stammenden Formulierung „verschiedene Wege finden“ („hitta olika vägar“) zusammenfassen. Wie diese verschiedenen Wege aussehen können, wird im Folgenden dargestellt.

302

Original: „att eleven stirrar sig så blind vid det här betyget” (Z. 83) Original: „Just för att jag märker att ehm (..) e:ehm att man, skriver man siffror så ser de bara SIFFRAN[...] Istället för att fokusera på: "VAD kan jag göra bättre? Vad är det jag måste jobba med?" (Z. 87-89) 303

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

529

In Bezug auf die Beziehung zu ihren Schüler_innen betont Lisbeth, wie wichtig es für sie sei, ihre Schüler_innen auch etwas persönlicher zu kennen. Diese persönlichere Beziehung stellt eine wichtige Grundlage für ihren Unterricht und insbesondere die individuelle Anpassung der Unterrichtsinhalte an ihre Schüler_innen dar. Vor allem bei ‚schwächeren‘ Schüler_innen nutzt sie beispielsweise Informationen über bestimmte Hobbies oder Interessen ihrer Schüler_innen gezielt, um sie zu motivieren und ihnen den Unterrichtsstoff näher zu bringen: „Was=WIE kann ich ihn oder sie dazu bringen es zu WOLLEN? Aha, er interessiert sich für Fußball. (.) Dann nehme ich das auf irgendeine Art und Weise mit auf. Oder/ Ja, sie ist ein Tanzmädchen. Ja dann nehmen wir das. So, dass man etwas hat, was SIE können, wo SIE fähig sind. Wo sie gleichsam aufblühen. Und dann versucht, darauf aufzubauen, dass sie dann darüber berichten können. Ich denke, dass das wichtig ist, die Schüler_innen persönlich kennen zu lernen.“304 (Z. 220-224)

Ihr liegt viel daran, die Schüler_innen zu ermutigen, ihnen Erfolgserlebnisse zu verschaffen, „wo sie aufblühen“ können und zeigen, dass sie etwas gut können („fähig sind“). Die persönliche Beziehung zu ihren Schüler_innen und die daraus gewonnenen Zusatzinformationen über deren Interessen stellen eine Form dar, in der Lisbeth „einen Weg finde[t]“, um den Schüler_innen zu ermöglichen sich am Unterricht zu beteiligen, sie zu motivieren und ihre Leistungen beurteilen zu können. Auch an anderen Stellen im Interview betont sie, dass es ihre Aufgabe sei, Gelegenheiten des Lernens und der Beteiligung für alle Schüler_innen zu schaffen. Dazu ein weiterer Auszug aus Lisbeths Interview, in dem sie berichtet, wie sie sich um einige besonders ‚schwache‘ Schüler_innen im Englischunterricht der 9. Klasse bemüht:

304

Original: „Vad=HUR kan jag få honom eller henne att VILJA? Jaha, han är intresserad av fotboll. (.) Och då kan jag kanske fånga upp det på något sätt. Eller/ Ja, det är en danstjej. Ja men då fångar vi det. Eh så att man har någonting där DE kan, där DE är duktiga. Där de blommar upp liksom. Och så försöka bygga på det, att de kan berätta om det. Jag tycker det är viktigt att=att lära känna eleverna personligen." (Z. 220-224)

530

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

„Ich hatte äh tatsächlich EINIGE Schüler_innen in der NEUNTEN, die wirklich sehr schwach waren. Äh und äh da habe ich es so gemacht, dass ich einen kleinen Extrakurs für sie gemacht habe. Äh und sie einige Male rausgenommen habe und mich mit ihnen hingesetzt und mit ihnen gearbeitet habe. Wir arbeiteten mit der Grammatik, wir arbeiteten am SCHREIBEN. Wir haben auch mit dem Mündlichen gearbeitet, sie haben paarweise miteinander gesprochen und sie haben mit MIR gesprochen. Und wir haben einen Film im Klassenzimmer gesehen und sie bekamen dann Fragen dazu. Ähm (.) also, um ihnen diese kleinen extra Gelegenheiten zu geben, um zu ZEIGEN eh (.) was sie=was sie konnten.“305 (Z. 57-62)

Die Feststellung, dass einige ihrer Schüler_innen in der Abschlussklasse der grundskola „sehr schwache“ Leistungen zeigten – und damit ihr erfolgreiches Abgangszeugnis riskierten – führt bei Lisbeth zu einem erhöhten Engagement. Sie bietet diesen Schüler_innen gesonderte Lerngelegenheiten an, in denen sie sich exklusiv den spezifischen Problemen und Defiziten dieser Schüler_innengruppe widmet („Grammatik“, „SCHREIBEN“, „Mündlich“) bzw. Unterrichtsmethoden anwendet, die in ihren Augen den Schüler_innen entgegenkommen (Wechsel der Sozialformen und „Film ansehen und Fragen dazu“). Für Lisbeth gehört dieses ‚Sich-Bemühen‘ um die Schüler_innen, das Bemühen darum, ihnen verschiedene Wege anzubieten, wie sie Leistungen zeigen können, zu ihrem professionellen Selbstverständnis. Im Vergleich zu anderen Lehrkräften fällt auf, dass sie dieses Extraengagement weder problematisiert im Hinblick auf eine mögliche Ungleichbehandlung anderer, weniger ‚leistungsschwacher‘ Schüler_innen, noch, dass sie über diese Extraaufgaben als zusätzliche Belastung klagt. Es ist ihre Aufgabe als Lehrerin individuelle Lerngelegenheiten zu schaffen und gehört selbstverständlich zu ihrem Verantwortungsbereich. Auch die Verwendung des Personalpronomens 305

Original: „[...] jag hade eh NÅGRA elever faktiskt i tyska i NIAN som var väldigt svaga. Eh och ehm då gjorde jag så att då gjorde jag en liten extrakurs för dem. Eh och tog ut dem vid ett flertal tillfällen då och satt och jobbade med dem. Vi jobbade med grammatik, vi jobbade med att SKRIVA. Vi jobbade med [det] muntliga också, de fick prata två och två och de fick prata med MIG. Ehm och då eh körde vi en film inne i klassrummet och de hade frågor till den då. E:ehm (.) så just för att eh ge dem lite extra tillfälle och VISA eh (.) vad de=vad de kunde då.” (Z. 57-62)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

531

„wir“ („wir arbeiteten“) deutet auf eine Verantwortungsübernahme für die Lernergebnisse der Schüler_innen durch Lisbeth hin. Durch das vergemeinschaftende „wir“ wird aus der Konstellation ‚Lehrerin plus Schüler_innen‘ eine Einheit, eine ‚Lerngruppe‘ mit dem gemeinsamen Ziel, die Schüler_innen so gut wie möglich zu fördern. Das Thema ‚Wege finden‘ und individuelle Förderung zieht sich durch das gesamte Interview mit Lisbeth und drückt sich insbesondere in wiederholten Episoden, in denen sie über die Förderung der ‚schwachen‘ Schüler_innen spricht, aus. Auch die dem schwedischen Beurteilungssystem innewohnende Grundspannung zwischen individualisiertem Unterrichten und Beurteilen einerseits und der Orientierung an den für alle Schüler_innen gleichermaßen geltenden Beurteilungskriterien bei der Zeugnisnotenerstellung andererseits, löst Lisbeth im Sinne der in ihren Augen benachteiligten Schüler_innen folgendermaßen: ”Obwohl es INDIVIDUALISIERT sein soll, soll es ja/ Man soll auf die Kompetenzen schauen, das ist das was man machen soll. Und das ist es=da kann es dann sein, dass es für DIESEN Schüler sehr leicht ist ‚bestanden‘ zu erreichen. Für JENEN Schüler ist es viel schwerer und da muss ich dann toleranter sein gegenüber dem Schüler, der es schwerer hat. Denn ich muss ja seine oder ihre REISE sehen. Und=und (.) wenn ich da dann die Note gebe, muss ich davon ausgehen, dass ja, wenn ich es hier sehe, dann geht das auch voran. Und das ist wirklich schwach aber ich gebe trotzdem ein E, weil ich sehe, dass er oder sie kämpft.“306 (Z. 236-241)

Lisbeth zeichnet den spannungsreichen regulativen Rahmen kurz nach, indem sie den Bogen zwischen individualisiertem Unterricht einerseits und „auf die Kompetenzen schauen“ andererseits aufspannt. Mit dem modalen Hilfsverb ‚sollen‘ in der unpersönlichen Formulierung „man 306

Original: „För i och med att det ska vara INDIVIDANPASSAT så ska det ju/ Man ska ju titta på kunskapen, det är ju det man ska göra. Och det är ju där=det är där det kan bli att för DEN eleven så kan det ju vara väldigt lätt att uppnå ett betyg. För DEN eleven är det mycket svårare och då måste jag ju vara mer tolerant mot den eleven som har svårare. För jag måste ju se hennes eller hans RESA. Och=och (.) när jag då sätter sen betyget så=så måste jag ju utgå från att ja, när jag ser här så går det ju framåt. Och det är väldigt svagt men jag sätter ändå ett E, för jag ser ju att han eller hon kämpar.” (Z. 236-241)

532

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

soll“ wird dieser Rahmen als verpflichtend für Lehrkräfte generell markiert. Indem sie jedoch den individuellen Lernfortschritt der einzelnen Schüler_innen (hier als „Reise“ bezeichnet) in die finale Notengebung einbezieht, weicht sie diese Beurteilungsvorgaben in ihrem eigenen Beurteilungshandeln etwas auf und ermöglicht so auch den ‚schwächeren‘ Schüler_innen die ‚bestanden‘-Schwelle zu übertreten. Für Lisbeth wiegt die Orientierung an einem für alle Schüler_innen gleichen Maßstab weniger stark, als die Orientierung an den individuellen Bedürfnissen und dem individuellen Lernfortschritt der einzelnen Schüler_innen (was auch in der Betonung des Wortes „INDIVIDUALISIERT“ deutlich wird). Mit dem Hinweis „da muss ich toleranter sein gegenüber dem Schüler, der es schwerer hat“, wird ihr professionelles Selbstbild als Unterstützerin und Wegbegleiterin der Schüler_innen auf ihrer ‚Lernreise‘ noch einmal betont – sie „muss“ die schwierigeren Voraussetzungen des Schülers beachten und in ihre Beurteilung einbeziehen. Eine kleine Einschränkung lässt sich allerdings herauslesen, wenn Lisbeth betont, dass die Note ‚E‘ auch deshalb gerechtfertigt sei, weil der oder die Schüler_in „gekämpft“ habe. Hier wird deutlich, dass ihr Wille zu einer großzügigeren Notenvergabe nicht ganz bedingungslos ist: der oder die Schüler_in muss wenigstens ein Mindestmaß an eigener Anstrengungsbereitschaft zeigen, um auch bei schwachen Leistungen noch mit ‚bestanden‘ bewertet werden zu können. Auf diesen Aspekt wird im Abschnitt zur Kooperation der Schüler_innen noch weiter eingegangen. Neben den oben beschriebenen Formen des individuellen Unterrichtens und Beurteilens im Laufe des Schuljahres zeigt sich eine weitere Form des ‚Wege-Findens‘ im Anbieten von individuellen Prüfungsformen am Ende des Halbjahres für die Zeugnisnotenerstellung – auch hier wieder am Beispiel eines ‚schwachen‘ Schülers an der Grenze zwischen den Noten ‚bestanden‘ und ‚nicht bestanden‘: „Und äh EIGENTLICH soll man schon streng sein, dass, wenn es ein kleines Stück aus dem Lehrplan gibt, das sie, die Schüler_innen, nicht erfüllen, dann=dann kann man kein ‚bestanden‘ geben. Aber es gibt immer Wege, das ein wenig zu umgehen. Man kann das auf andere Art herausfinden. Zum Beispiel, ein_e Schüler_in tut sich schwer mit dem Mündlichen, dann kann man ja äh sie rausnehmen und vielleicht selber ein bisschen mit ihnen reden. Und sie das dann eben auf eine äh, auf eine andere Weise

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

533

zeigen lassen, wenn nur ich da bin. Wenn sie im Klassenzimmer nicht ins Sprechen kommen. [...] Also man kann immer (.) und das kann dann zur Zensur führen. [...] man kann=man kann immer verschiedene Wege dahin finden.“307 (Z. 45-51)

Lisbeth interpretiert die Beurteilungsvorgaben von Skolverket so, dass sie „schon streng“ bei der Beurteilung sein solle, spricht sich aber für eine großzügigere Auslegung aus, insbesondere, wenn nur ein „kleines Stück aus dem Lehrplan“ von den Schüler_innen nicht erfüllt wurde. Sie weicht damit die als Mindestanforderungen konzipierten Vorgaben für sich selbst etwas auf und betont, dass es „immer Wege [gäbe], das ein wenig zu umgehen“. Im oben geschilderten Fall ändert sie das Prüfungssetting, indem sie einem Schüler anbietet, seine mündlichen Leistungen im Zwiegespräch mit der Lehrerin, abseits der Lerngruppe und der damit verbundenen Klassenöffentlichkeit, zu erbringen. Damit gibt sie dem Prinzip der Orientierung am einzelnen Kind den Vortritt gegenüber einer vorab festgelegten und für alle Schüler_innen gleichen Prüfungsform. Das von ihr verwendete Bild des ‚Wege-Findens‘ verdeutlicht, dass es trotz aller Vorgaben bezüglich schulischer Leistungsbeurteilungen einen Spielraum für unterschiedliche Auslegungen gibt – dies wird auch mit der Betonung der Abtönungspartikel „EIGENTLICH“ von Lisbeth unterstrichen. Es gibt das offizielle Regelwerk von Skolverket, dieses lässt sich aber auf unterschiedliche Weise auslegen bzw. lassen sich bestimmte Teile daraus auch „ein wenig [...] umgehen“. Die Aufgabe der Lehrkraft ist es demnach, diesen Spielraum zu nutzen und einen individuellen Weg zu finden, der einerseits keine zu starke Regelverletzung darstellt, andererseits aber ein positives Ergebnis für die Schüler_innen ermöglicht. Die Lehrerin erschafft damit einen Handlungsspielraum, der so explizit nicht 307

Original: „och eh EGENTLIGEN så ska man ju vara hård, att är det en bit i kursplanen som de, eleven, inte har uppfyllt så=så ska man ju inte sätta ett godkänt betyg. Men eh det finns ju alltid vägar att kringgå det lite. Man kan kolla det på andra sätt. Om man/ till exempel, en elev har svårt att visa det muntliga så kan man ju ja, eh ta ut dem och kanske prata lite själv med dem. Och låta de få visa det på ett ehm ja, på ett annat sätt för mig är bara då. Om inte de kommer till tals i klassrummet. Ehm:m (..) sådär. Så man kan ju alltid (.) eh och det ska leda till betyg så. [...] ja man kan=man kan hitta olika vägar där, eller så.” (Z. 45-51)

534

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

vorgesehen ist, ihr jedoch einen Ausweg aus einer für sie schwierigen Situation bietet. Wenn Lisbeth betont, „man kann immer verschiedene Wege dahin finden“, versichert sie sich und mir als Interviewerin gleichermaßen, dass der von ihr gewählte Sonderweg im Rahmen des Möglichen liegt. Gleichzeitig bestätigt sich darin auch ihr professioneller Selbstanspruch – aus dem optionalen Leitbild ‚einen Weg finden können‘ wird in Lisbeths Erzählungen die normative Haltung deutlich ‚einen Weg finden zu müssen‘. Auch im fallübergreifenden Vergleich von Lisbeths Interview mit den anderen Lehrkräften wird deutlich, dass ihr Fokus stark auf der Gruppe der ‚schwachen‘ Schüler_innen liegt und hier insbesondere auf der Überwindung der E/F-Schwelle, also der Frage ob diese Schüler_innen die Mindestanforderungen für ein ‚bestanden‘ erreichen oder nicht. Andere Schüler_innen tauchen in ihren Erzählungen nur am Rande und als Kontrastfall zu Schüler_innen ‚mit Problemen‘ auf, wie am obigen Beispiel deutlich wurde. Die Zentralität der Episoden über die Schwierigkeiten bei der Entscheidung über die Noten ‚E‘ oder ‚F‘ lässt auch auf Lisbeths Orientierung an einer Idee der Schwellengerechtigkeit schließen, bei der der Fokus vor allem auf der Überwindung einer vorab festgelegten Mindestgrenze, also der Note ‚E‘, von möglichst vielen Schüler_innen liegt. Dafür werden sehr individuelle (Lern-)Hilfen von der Lehrkraft bereitgestellt, sprich ‚Wege gesucht‘, um den Schüler_innen gerecht werden zu können. ‚Wege finden‘ kann hier also auch im Sinne eines sich Annäherns, Darauf-Einlassens auf die Besonderheiten einzelner Schüler_innen verstanden werden.308

308

Die Beachtung der Besonderheit der einen birgt jedoch auch die Gefahr der NichtBeachtung oder Benachteiligung der anderen, weniger ‚bedürftigen‘ Schüler_innen – auch dies ist in der Idee der Schwellengerechtigkeit angelegt, wenn davon ausgegangen wird, dass Benachteiligungen oberhalb einer bestimmten Mindestschwelle nicht als ungerecht betrachtet werden, solange alle Schüler_innen dabei unterstützt werden, wenigstens diese Mindestschwelle zu erreichen (vgl. Giesinger, 2007, S. 377).

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

535

Kooperation der Schüler_innen als Bedingung kompensatorischer Gerechtigkeit Wie sehr die Lehrerin darauf angewiesen ist, die im Lehrplan aufgeführten Kompetenzen und Fähigkeiten von ihren Schüler_innen auch gezeigt zu bekommen, um sie überhaupt beurteilen zu können, wird ebenfalls deutlich im obigen Beispiel. Indem Lisbeth aktiv eine individuelle Möglichkeit für den betroffenen Schüler schafft, ihr seine mündlichen Fähigkeiten zu präsentieren, werden sie beurteilbar und können in eine Note transferiert werden („und das kann dann zur Zensur führen“). Im Zentrum steht die Ermöglichung eines Erfolgserlebnisses für den einzelnen Schüler, unabhängig davon welche Prüfungsform für andere Schüler_innen genutzt wurde, um den fraglichen Beurteilungsaspekt benoten zu können. Diese aktive Ko-Konstruktion der Schüler_innenleistung durch die Lehrkraft als Voraussetzung für ihre anschließende Beurteilung zeigt sich noch deutlicher im nächsten Beispiel, in dem sie berichtet, wie sie zusammen mit einer Förderlehrkraft versucht, einem besonders ‚schwachen‘ Schüler verschiedene Prüfungsformen anzubieten, um ihm zumindest die Zensur ‚E‘ auf dem Zeugnis bescheinigen zu können: „Wir versuchten: ‚Willst du einen MÜNDLICHEN Vortrag zu dem hier machen? Willst du etwas dazu unter die Bilder schreiben, DAZU etwas schreiben oder Bilder malen und dazu dann etwas schreiben? Äh, was willst du schreiben?‘ Man hat versucht ihm tausende Ideen zu geben, aber er war so negativ, da ist es dann nur noch das Förderprogramm309 (.) wenn man merkt, dass sie kein E bekommen können.“ 310 (Z. 304307)

309

Als Förderprogramm (åtgärdsprogram) werden verschiedenste Formen individueller Förderung bezeichnet, die von der Schulleitung in Kooperation mit den Lehrkräften, Sonderpädagog_innen sowie betroffenen Kindern und Eltern beschlossen werden. Die Schulen verfügen über spezielle Budgets für die Umsetzung dieser individuellen Förderprogramme (vgl. Skolverket, 2014a). Vgl. ausführlicher dazu Kap. 6.3.4.3 im Abschnitt „Länderübergreifender Vergleich...“. 310 Original: „Vi försökte: ’Vill du göra MUNTLIG redovisning på det här? Vill du skriva ner bilder, skriva till DEM eller rita ner bilder och skriva till DEM? Eh vad vill du skriva?’ Man

536

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Das Beispiel illustriert das fast grenzenlose Bemühen um die einzelnen Schüler_innen durch die Lehrkraft, wobei sich diese Bemühungen vornehmlich auf die Form der Leistungserbringung („mündlichen Vortrag“, „Bilder malen“, „unter Bilder schreiben“) zu konzentrieren scheinen. Die konkreten Lerninhalte treten scheinbar hinter die verschiedenen Verfahrensweisen mit denen eine ‚Leistung‘ erbracht werden kann zurück. Wichtig scheint vor allem, dass der oder die Schüler_in etwas zu Beurteilendes vorzeigt, weniger hingegen was damit gelernt wurde. Gleichzeitig sind die Bemühungen der Lehrerin auf ein Mindestmaß an Kooperation durch die Schüler_innen angewiesen. Wenn diese Kooperation ausbleibt, die Schüler_innen die gebotenen Möglichkeiten nicht nutzen (wollen oder können), stößt auch Lisbeth an ihre Grenzen und muss einräumen: „Dann gibt es keinen Weg mehr auf irgendeine Weise, wenn man sie nicht dazu bringen kann zu verstehen, dass das wichtig ist (.) die Aufgaben wirklich zu machen.“ 311 (Z. 314-315). Insofern findet das Bild der Wege, die durch die Lehrerin gefunden und eröffnet werden können, sein Pendant (und seine Begrenzung) in der Bereitschaft der Schüler_innen, diese Wege auch zu gehen und die damit verbundenen Chancen zu nutzen. Im oben geschilderten Bemühen um einzelne Schüler_innen wird zuletzt auch deutlich, dass das Nicht-Erreichen der Mindestanforderungen für die Note ‚E‘ nicht nur die Gefahr des Scheiterns der Schüler_innen birgt, sondern auch ein Scheitern der Lehrkraft. Lisbeths professionelles Selbstbild als unterstützende Lernbegleiterin der Schüler_innen und damit die Legitimität ihres professionellen Handelns sind an den Erfolg der ‚schwachen‘ Schüler_innen gebunden. Bleibt dieser trotz ihres großen Engagements für ihre Schüler_innen aus, gerät ihr Selbstbild ins Wanken. Dass dieser Fall anscheinend höchst selten eintritt, verdeutlicht eine weitere Passage aus dem Interview, in der sie beschreibt, dass die ausförsökte ge tusentals idéer men han var så himla negativ och då är det ju åtgärdsprogram (.) eh när man märker att dem inte kan få E.” (Z. 304-307) 311 Original: „Då finns det ju ingen väg på något sätt, om inte man liksom kan få dem och att förstå att det är viktig (.) att faktiskt göra uppgifterna.” (Z. 314-315)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

537

bleibende Kooperation oder Anstrengung von Schüler_innen sie zwar zum „Zweifeln“ an ihrer Beurteilung bringe, die Note ‚nicht bestanden‘ allerdings wirklich nur sehr selten von ihr vergeben wird: ”Wenn es um einen Schüler geht, der sich vielleicht gar nicht darum kümmert, der es eigentlich kann, der aber nie etwas einreicht und ich meckere und=und der trotzdem genau auf der Grenze liegt, da bin ich dann stärker am Zweifeln, ob ich der Person ein E geben soll. Aber öfter mache ich, ja, wenn sie gleichauf liegen, dann mache ich das im Großen und Ganzen IMMER. Ja, im Zweifel für den Angeklagten312, dann gebe ich ein E. Aber äh aber natürlich kann man sich auch fragen, ob ich diesem Schüler wirklich ein E geben sollte. Helfe ich ihr oder ihm damit? Das ist schwer. Ja (.) Das ist sehr schwer.“313 (Z. 237-243)

Wie oben beschrieben, stellt die Entscheidung zwischen den Noten ‚E‘ und ‚F‘, also zwischen ‚bestanden‘ und ‚nicht bestanden‘, die größte Herausforderung für Lisbeths Beurteilungshandeln dar. Insbesondere dann, wenn Schüler_innen mit mangelhaften Leistungen sich wenig bemühen und die ihnen gebotenen Gelegenheiten offenbar nicht nutzen, stößt Lisbeth an die Grenzen ihres pädagogischen Tuns. Lisbeth ist mit ihrer Vorstellung einer gerechten Beurteilung auf die Mitarbeit der Schüler_innen angewiesen ist. Wird diese Kooperation verweigert, indem sich ein Schüler „gar nicht darum kümmert“, obwohl „der es eigentlich kann“, läuft ihre Idee der Hilfestellung ins Leere. Die folgenden Zweifel daran, welche Note in einem solchen Fall zu vergeben wäre, führen auch zu einer sprachlichen Distanzierung zu dem als unkooperativ empfundenen Schüler, indem sie von der Anrede als „Schüler“ in die Anrede als 312

Die schwedische Redewendung „hellre fria än fälla” – wörtlich: lieber freisprechen als verurteilen – entspricht ungefähr der Bedeutung der deutschen Redewendung „im Zweifel für den Angeklagten“. 313 Original: „När det står en elev som kanske inte bryr sig alls, som egentligen kan, som aldrig lämnar in, och jag tjatar och=och som ändå ligger liksom precis på gränsen, då är jag ju mer tveksam till om jag ska sätta ett E på den personen. Men jag gör oftast, ja, ligger de jämbördigt så gör jag ju det i stort sett ALLTID. Ja, det är ju hellre fria än fälla, då sätter jag ett E. Men eh men visst kan man ju tänka så att frågan är ju om jag verkligen ska sätta ett E på den här eleven. Hjälper jag honom eller henne då liksom? Det är svårt. Ja. (.) Det är (.) jättesvårt.“ (Z. 237-243)

538

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

„Person“ wechselt. Schließlich überwiegt aber „im Großen und Ganzen IMMER“ ihre fördernde Grundhaltung, so dass auch Schüler_innen, die sich offenbar weniger bemühen, trotzdem mit der Note ‚bestanden‘ rechnen können. Mit dem Rückgriff auf die Redewendung „hellre fria än fälla“ („im Zweifel für den Angeklagten“) verweist sie implizit auf die auch im Rechtssystem gebräuchliche Entscheidungsregel, bei Zweifeln an der Schuld des Angeklagten in dessen Sinne zu entscheiden und von einer Verurteilung abzusehen.314 Scheinbar kann Lisbeth sich selbst nicht hundertprozentig davon überzeugen, wirklich alles in ihrer Macht Stehende für ihre Schüler_innen getan zu haben, wodurch ein Restzweifel bleibt und sie sich am Ende doch für ‚den Freispruch‘, also die Note ‚E‘ entscheidet. Ihre grundlegende Haltung als fördernde Lehrkraft drückt sich auch in der Frage „Helfe ich ihr oder ihm damit?“ aus, bezieht sich diesmal allerdings auf die Frage, ob ein ‚bestanden‘ eventuell zu einem ungewollten Zufriedenheitsgefühl der Schüler_innen führt und diese sich noch weniger bemühen könnten. Lisbeths Förderintentionen beschränken sich damit nicht nur auf den Erwerb bestimmter Noten, sondern richten sich auch darauf ihren Schüler_innen eine gewisse Arbeitshaltung und Selbstverantwortlichkeit für ihren Lernerfolg zu vermitteln. Mit der wiederholten Feststellung, dass die Entscheidungen am unteren Ende der Notenskala ihr nicht leichtfallen würden („Das ist schwer. Ja (.) Das ist sehr schwer“), schließt Lisbeth diese Episode.

Kompensatorische Gerechtigkeit und standardisierte Leistungsbeurteilung Auch im Umgang mit den Ergebnissen der standardisierten, zentralen Tests (nationella prov) am Ende der Klasse 8 zeigt sich das oben erwähnte Motto „im Zweifel für den Angeklagten“. Im Unterschied zu den alltäglichen Beurteilungen im Laufe des Schuljahres kann Lisbeth sich hier 314

Die gleiche Analogie zum Rechtssystem findet sich auch bei Frau Hollerdieck, die als zweiter Referenzfall ausführlicher dargestellt wird.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

539

zusätzlich auf eine kollegial abgestimmte Entscheidung stützen, wie im folgenden Auszug deutlich wird: „Ä:ä:ähm aber die zentralen Tests, wir=wir=wir haben vereinbart, dass die Tests die Schüler_innen NICHT verschlechtern dürfen. Also wenn sie sonst ein C haben und im Test ein D, dann bekommen sie nicht das schlechtere. Demgegenüber kann ein Schüler, der zwischen äh C und B liegt, sich vielleicht verbessern. Wenn er im Test besser abschneidet. [...] Aber, das ist, ja=ja, das ist ein Teil wie alle anderen, sozusagen. Also das hat nicht mehr Gewicht als (.) äh andere Abgaben315 und so, die sie im Schuljahr oder Halbjahr gemacht haben. Nein.“ 316 (Z. 366-375)

Für Lisbeth stellen die Ergebnisse der standardisierten zentralen Tests nur einen weiteren Bestandteil ihrer Beurteilungen dar, einen Teil „wie alle anderen“. Ihrer Einschätzung, dass die Testergebnisse nicht mehr Gewicht haben als die während des Schuljahres vorgenommenen Beurteilungen durch die Lehrkräfte, widerspricht allerdings die schulinterne Regelung, dass die Testergebnisse die Zeugnisnoten nicht verschlechtern dürfen – eine Verbesserung um eine Notenstufe durch das Testergebnis in Einzelfällen jedoch möglich ist. Je nachdem, ob das Testergebnis einzelnen Schüler_innen also zum Vor- oder Nachteil gereicht, erhalten die Testergebnisse unterschiedlich starke Gewichtungen und werden entweder ignoriert (bei potentiell negativem Ausgang für die Schüler_innen) oder in die Gesamtbenotung einbezogen (bei positivem Ausgang für die Schüler_innen). Diese Praxis stützt sich dabei nicht nur auf 315

Gemeint sind hier die oben erwähnten schriftlichen Arbeitsaufgaben, an denen die Schüler_innen im Laufe des Schuljahres arbeiten, sowie Hausaufgaben, die sie einreichen. 316 Original: „E:e:ehm men eh det nationella provet, vi=vi=vi har ju sagt såhär att det nationella provet ska INTE sänka en elev. Så har den ett C annars och fick ett D på nationella så får den inte sämre. Men däremot en elev som ligger liksom mellan eh C och B kanske kan höja sig. Om den har bättre på nationella.[...] Men det är, ja=ja, det är en del som alla andra så att säga. Så den väger inte tyngre än (.) eh än övriga:a ehm inlämningar och så som de har haft under året eller terminen där. Nej. Men det är, ja=ja, det är en del som alla andra så att säga. Så den väger inte tyngre än (.) eh än övriga:a ehm inlämningar och så som de har haft under året eller terminen där. Nej.” (Z. 366-375)

540

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Lisbeths eigene Überzeugungen, sondern beruht vielmehr auf einer vom Kollegium (und vermutlich auch der Schulleitung) getragenen Absprache. Lisbeth berichtet darüber hinaus, dass die Korrektur der zentralen Tests im aktuellen Schuljahr nicht mehr von der jeweiligen Klassenlehrkraft, sondern kollegial geteilt stattfindet (d.h. die Anzahl der Tests wird durch die Anzahl der Lehrkräfte geteilt und gleichmäßig zur Korrektur auf das gesamte Kollegium verteilt). Die gemeinsame Korrektur der Tests wurde vor allem aus Gründen der Arbeitsentlastung eingeführt, was Lisbeth sehr begrüßt. Auch die anonyme Beurteilung ihrer Schüler_innen durch eine andere Lehrkraft schätzt sie als „ganz interessant“ ein: „Das war ganz interessant zu sehen, wie eine andere Lehrkraft die Aufsätze meiner Schüler_innen beurteilt hat. Ähm, oft ist es so, wenn man NEU ist und eine Beurteilung macht, dann gibt man eine bisschen schlechtere [Note]. Man traut sich nicht so richtig. Ähm, im Allgemeinen vielleicht ein bisschen schlechter als die Note, die ich 317 vergeben habe, hatten sie [die Schüler_innen].“ (Z. 363-366)

Obwohl die gegenseitige Korrektur der Tests von der Schulleitung als Maßnahme zur Verbesserung der Gleichwertigkeit (likvärdighet) der Beurteilungen an ihrer Schule eingeführt wurde, verweist Lisbeth zunächst vor allem auf die Arbeitserleichterung, die das geteilte Korrigieren mit sich gebracht hat. Die angestrebte Gleichwertigkeit stellt für Lisbeth nur eine zusätzliche Nebenfolge dar, steht aber nicht im Zentrum ihres Beurteilungshandelns. Im obigen Auszug berichtet sie nun, dass die Testergebnisse ihrer Klasse von den von ihr vergebenen Vornoten abweichen, relativiert dies jedoch gleich wieder, indem sie erklärt, dass die Ergebnisse nur „ein bisschen schlechter“ ausgefallen seien als ihre Noten. Als Erklärung für die Abweichungen schiebt sie vorweg, dass insbe-

317

Original: „Det var ju rätt intressant att se hur andra lärare hade bedömt mina elevers uppsatser då. E:eh oftast kanske när man är NY och gör en bedömning så sätter man det lite lägre. Man vågar inte riktigt så. E:eh så kanske:e:e generellt sätt lite lägre då än vad jag hade satt i betyg, hade dem.” (Z. 363-366)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

541

sondere neue Lehrkräfte318 dazu neigen würden, schlechtere Noten zu vergeben, da sie sich „nicht trauen“ würden bessere Noten zu vergeben.319 Auf diese Weise liefert Lisbeth eine (für sie selbst) plausible Erklärung dafür, warum ihre Vornoten etwas besser ausfielen als die Testergebnisse und kann über die Abweichungen hinwegsehen. Gleichzeitig führt sie die oben erwähnte kollegiale Absprache an, nach der die Testergebnisse nicht zur Verschlechterung der Zeugniszensur führen dürfen. Die Orientierung an einer Beurteilung im Sinne der Schüler_innen, die im Zweifel auch die besseren Noten ermöglicht, überwiegt in Lisbeths Fall deutlich gegenüber einer an Gleichwertigkeit orientierten Beurteilung. Im Hinblick auf ihre alltägliche Leistungsbeurteilung und hier vor allem die Rückmeldungen zu erbrachten Leistungen gegenüber den Schüler_innen kündigt sich demgegenüber ein Wandel zu einer stärker standardisierten Form der Rückmeldung an. Inwieweit diese stärkere Standardisierung der Rückmeldungen sich auch auf ihre zukünftige Beurteilungspraxis auswirken könnte, bleibt an dieser Stelle offen. Lisbeth berichtet im Interview, dass sie perspektivisch die Rückmeldungen für die Schüler_innen stärker an die Wissensanforderungen des Lehrplans anlehnen und entsprechende standardisierte Beurteilungsraster verwenden wollen würde. Im Nachgang des Interviews sendete sie mir eine entsprechende Vorlage zu (vgl. Abb. 16).

318

Hier können Lehrkräfte gemeint sein, die entweder neu an dieser Schule sind und die lokalen Beurteilungsgepflogenheiten (noch) nicht kennen oder aber Berufsanfänger_innen, die allgemein noch wenig Erfahrung in Beurteilungsfragen haben. 319 Dies deckt sich auch mit Kommentaren aus den Interviews mit NRW-Lehrer_innen, die davon sprachen, dass jüngere Kolleg_innen häufig strenger beurteilen und eher schlechtere Noten vergeben würden als erfahrene Lehrkräfte.

542

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Abb. 16 – Beurteilungsraster für den Schwedischunterricht Klasse 8 (Lisbeth)

Darauf ist ein Beurteilungsraster für einen zu schreibenden Zeitungsartikel (Reportage) im Fach Schwedisch in der 8. Klasse zu sehen, der sich an der tabellarischen Struktur der Kompetenzen und Wissensanforderungen des Lehrplans orientiert. In der linken Spalte sind fünf Beurteilungsaspekte aufgeführt (Zusammenhang zur Aufgabenstellung; Inhalt – Vollständigkeit, Gestaltung, Situations- und Personenbeschreibungen; Struktur; Sprache und Stil; Rechtschreibung), für die jeweils ein Kreuz in den drei anderen Spalten für die Noten E, C oder A gesetzt werden kann. Zusätzlich gibt es noch eine Zeile in der das Vorhandensein charakteristi-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

543

scher Merkmale eines Zeitungsartikels vermerkt werden kann: Überschrift, Einleitung, Spalten, Gedankenstriche320, Fotos, Bildunterschriften, Verfasserzeile. Unterhalb der Beurteilungsaspekte findet sich noch ein Kästchen mit den beiden Punkten ‚Gesamtbeurteilung‘ (helhetsbedömning) und ‚Zu verbessern bis zur nächsten Schreibaufgabe‘ (Att utveckla till nästa skrivuppgift) – hier können offenbar eine verbale Einschätzung des Textes als Rückmeldung an die Schüler_innen bzw. zusätzliche Hinweise zum Weiterlernen eingetragen werden. Ganz unten findet sich die Zeile ‚Zensur‘ (betyg), in der offenbar eine Gesamtnote aus den im Tabellenraster angekreuzten Teilbereichen erstellt werden soll. Dies ist insofern erstaunlich, als Lisbeth selbst bisher die Strategie der doppelten Kommunikation nutzt und es vermeidet in den Rückmeldungen von Noten zusprechen. Auch in den Regularien und von anderen Lehrkräften in den Interviews wird immer wieder betont, dass eine zensurenmäßige Rückmeldung (betygsmässig feedback) nicht erwünscht sei. Das Feld ‚Unterschrift‘ (sign=signatur) kann entweder für die Lehrkraft oder aber die Eltern vorgesehen sein, dies geht aus dem Material nicht hervor. Insgesamt fällt auch auf, dass die Beurteilungsaspekte (bis auf den Punkt ‚Inhalt‘) nicht weiter spezifiziert werden und relativ allgemein formuliert sind. Inwiefern diese Form der Rückmeldung von den Schüler_innen tatsächlich als ausführlicher und hilfreicher empfunden wird (wie Lisbeth es beschreibt) als ihre mündlichen und schriftlichen Kommentare, muss an dieser Stelle offen gelassen werden. Kritisch anzumerken bleibt aber, dass durch die Vergabe von Teilnoten für jeden einzelnen Beurteilungsaspekt und die Zusammenziehung dieser in einer Note am Ende des Beurteilungsrasters die Gefahr besteht, dass die von Lisbeth kritisierte Fokussierung der Schüler_innen auf die vergebenen Noten allein schon durch das Beurteilungsraster wieder stärker forciert werden könnte. Die von ihr präferierte formative, auf die erreichten Lernziele bzw. noch auszubauenden Kompetenzen ausgerichtete Rück320

In schwedischen Zeitungsartikeln werden direkte Zitate nicht mit Anführungszeichen markiert, sondern als eigenständige Absätze, die mit einem Gedankenstrich beginnen, in den Textfluss eingebaut.

544

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

meldung findet sich jedenfalls in diesem Beurteilungsblatt nur noch in sehr eingeschränkter Form. Die von ihr erwähnte Fokussierung auf Punkte könnte sich durch den Einsatz dieser Beurteilungsbögen auf die Buchstabennoten verschieben, bliebe im Grunde aber auf der Ebene des Lernergebnisses ohne weitere Auswirkungen für den anschließenden Lernprozess. Da das Beurteilungsraster allerdings nicht Thema des Interviews war, sollen hier keine weiterführenden Vermutungen zur Passung zwischen Lisbeths formativem Beurteilungsverständnis und diesem z.T. summativ anmutenden Beurteilungsinstrument angestellt werden.

Zusammenfassung: Lisbeth Trotz der potentiellen Infragestellung ihres Beurteilungshandelns durch unkooperative Schüler_innen kann das Bild des ‚Wege Findens‘ für ihre Schüler_innen als Lisbeths zentrale Gerechtigkeitsüberzeugung sowohl für die alltägliche Beurteilung im Unterricht als auch bei der Zeugnisnotenerstellung konstatiert werden. Gerechte Beurteilung beinhaltet für Lisbeth in erster Linie eine individuelle und formative, also den Lernprozess unterstützende und begleitende Beurteilung, die ein Selbstbild als unterstützende und fördernde Lehrkraft zur Voraussetzung hat und sich primär auf die Förderung der weniger leistungsstarken Schüler_innen fokussiert. Die Beurteilungsgrundlage, auf die sie ihre Entscheidung stützt, wird insbesondere bei der Entscheidung zwischen ‚bestanden‘ und ‚nicht-bestanden‘ zum Teil sehr großzügig und im Sinne der Schüler_innen ausgelegt. Die Orientierung an den individuellen Bedürfnissen der Schüler_innen und das Ausgleichen unterschiedlicher Lernvoraussetzungen durch individuelle Unterrichts- und Prüfungsangebote wird von ihr als wichtiger und gerechter eingeschätzt, als die Beurteilung anhand eines für alle Schüler_innen gleichermaßen gültigen Maßstabs oder eines standardisierten Verfahrens. Für Lisbeth stellt eine persönliche Beziehung zu ihren Schüler_innen eine der Voraussetzungen gerechter Leistungsbeurteilung dar, da diese ein individuelles Eingehen auf einzelne Schüler_innen in ihren Augen erst ermöglicht. Die Zusammenarbeit

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

545

im Kollegium ist für Lisbeth vor allem im Hinblick auf die Absprache individueller Förderangebote wichtig (hier vor allem die Zusammenarbeit mit der Förderlehrkraft), eine gleichwertige Beurteilung aller Schüler_innen steht hingegen nicht im Zentrum dieser Zusammenarbeit. 6.3.4.2 Frau Hollerdieck – „im Zweifel für den Schüler“ und „den pädagogischen Blick haben“ Den zweiten Referenzfall der kompensatorischen Gerechtigkeitsüberzeugungen stellt eine Schulleiterin aus NRW dar. Frau Hollerdieck unterrichtet die Fächer Deutsch und Englisch in den Klassen 5-10 an einer Realschule und ist um Zeitpunkt des Interviews ungefähr Mitte 50, blickt also auf einige Jahre Erfahrung als Lehrerin und Schulleiterin zurück. Das Interview fand in ihrem Büro in der Schule nach dem Unterricht statt, außer ihr hatte sich keine weitere Lehrkraft der Schule zum Interview bereit erklärt, was sie mit der zeitlichen Belastung der Kolleg_innen erklärt.

Selbstbild als Pädagogin und formatives Beurteilungsverständnis Besonders auffällig an diesem Interview war die eindeutige Selbstpositionierung der Lehrerin als Pädagogin, die in ihren Augen mit einer großen Verantwortung für den Lernerfolg der ihr anvertrauten Schüler_innen einhergeht: „Also wie gesagt, wir sind ja immer noch PÄDAGOGEN. Also wir sind ja jetzt keine Leu=Leute, die nur Beurteilen und MESSEN. Sondern letztendlich sind wir Pädagogen! (.) Und müssen Schü=mü=müssen Schülern helfen, bestimmte Dinge zu erreichen und bestimmte Kompetenzen zu erreichen und/ (.) Ja. Und da sind wir Begleiter, Coach. Aber wir sind nicht diejenigen, die nur abfragen und testen. (..) Also so sehe=so sehe ich uns nicht. Überhaupt nicht.“ (Z. 695-700)

Frau Hollerdieck macht hier ein Spannungsfeld zwischen „Pädagogen“ und „Leuten, die nur beurteilen und messen“ auf und grenzt sich von der

546

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

zweiten Gruppe deutlich ab. Sie beschreibt ihre Aufgabe als unterstützende Lernbegleiterin, als „Coach“ der Schüler_innen, verbunden mit einer Verpflichtung, den Schüler_innen helfen zu „müssen“. Dieser Verpflichtungsaspekt taucht auch an anderer Stelle im Interview auf, wenn sie davon spricht, dass Lehrkräfte eine „Holpflicht“ (Z. 351-357) gegenüber den Schüler_innen hätten. Gemeint ist damit eine Unterrichtsführung, die den unterschiedlichen Schüler_innen durch gezieltes Nachfragen und Ansprechen Gelegenheiten gibt ihre Fähigkeiten zu zeigen und nicht nur das zu bewerten, was Schüler_innen von sich aus zeigen würden. Frau Hollerdieck spricht in diesem Zusammenhang auch davon, „dass die Verantwortung beim Lehrer ist“ (Z. 357), was sie sehr begrüßen würde und den Lehrkräften an ihrer Schule auch immer wieder zu vermitteln versuche. In der obigen Passage lässt sich auch ihre Orientierung an der Idee der Schwellengerechtigkeit erkennen, wenn sie davon spricht, den Schüler_innen zu helfen „bestimmte Dinge [..] und bestimmte Kompetenzen zu erreichen“. Als Gegenpol entwirft sie Lehrkräfte, die sich allein auf das „abfragen und testen“ von Schüler_innenleistungen beschränken würden und damit vor allem das Lernergebnis im Blick hätten ohne eine vorhergehende Lernprozessbegleitung und – für sie mindestens genauso wichtig – daran anschließende Empfehlungen zum Weiterlernen. Frau Hollerdieck lehnt dabei Tests und Prüfungen nicht grundsätzlich ab, kritisiert aber mehrfach den defizitorientierten Umgang mit Testergebnissen: „Also gut finde ich schon, dass es so was wie=wie=wie Tests und Prüfungen gibt. Um einfach zu gucken, ne?, sind die Kompetenzen erreicht worden. Aber eben auch nicht nur als Rückmeldung für die Schüler, sondern auch als Diagnoseinstrument für Lehrkräfte, dass man sagt (..) ja, das ist/ da hat der bestimmte Kompetenzen noch gar nicht erreicht. Muss man=muss man noch mal gucken.“ (Z. 286-290)

In der Formulierung der „Klassenarbeit als Diagnoseinstrument für Lehrkräfte“ drückt sich ihr formatives Beurteilungsverständnis aus – die Klassenarbeit dient nicht nur der Überprüfung der Schüler_innen und deren Wissensstand, sie sollen vielmehr auch als Ausgangspunkt und Wegweiser für die weitere pädagogische Arbeit der Lehrkräfte genutzt werden

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

547

und damit den Lernprozess der Schüler_innen unterstützen. In diesem Zusammenhang spricht sie auch davon, dass Berichtigungen von schriftlichen Arbeiten ebenfalls in individualisierter Form stattfinden sollten, denn „Fehler gehören zum Lernen dazu“ (Z. 342). Diese Perspektive auf Fehler als Lernchancen kombiniert sich bei Frau Hollerdieck auch mit einer auf Motivation und Unterstützung ausgerichteten Form der Ansprache der Schüler_innen und Rückmeldung ihrer schriftlichen Leistungen, die nicht „defizitorientiert“ (Z. 465) sein sollte: „Ich kann sagen: ‚Super, du hast die ähm Vokabeln fast alle richtig gewusst.‘ (.) So. Auch wenn die Rechtschreibung überhaupt nicht stimmt.“ (Z. 465-466). Sie spricht sich damit für eine Beurteilung im Sinne der neuen „Fehlerkultur“ nach Oser und Spychiger (2005) aus. Diese Fehlerkultur propagiert einen konstruktiven, lernförderlichen Umgang mit Fehlern im schulischen Kontext im Gegensatz zu einem verbreiteten defizitären Blick auf Fehler als ‚Makel‘ oder ‚Störung‘ des reibungslosen Unterrichtsverlaufs (vgl. dazu auch Jürgens, 2013). Frau Hollerdieck vertritt damit ein ähnliches formatives Beurteilungsverständnis wie die schwedische Lehrerin Lisbeth, für die Leistungsbeurteilung ebenfalls ein Zusammenspiel aus der diagnostischen Feststellung individueller Lernstände und anschließender Anpassung des Unterrichts- und Förderangebots darstellt. Letztlich, so Frau Hollerdieck, „ist so dieser Bereich Notengebung, jemanden beurteilen, Leistungsmessung auch ähm gar nicht (.) zu trennen von dem Bereich Förderung“ (Z. 378-379). Hier wird deutlich, dass die schulische Leistungsbeurteilung für Frau Hollerdieck immer auch als diagnostisches Hilfsmittel im Sinne einer Lernprozessbegleitung fungiert (hier als „Förderung“ bezeichnet). Dass diese formative Perspektive auf Leistungsbeurteilung nicht unbedingt als breit geteilte Überzeugung im nordrhein-westfälischen Kontext betrachtet werden kann, wird deutlich, wenn der Interviewausschnitt noch um die folgenden Sätze erweitert wird: „Ähm, ja also letztendlich ist so dieser Bereich Notengebung, jemanden beurteilen, Leistungsmessung auch ähm gar nicht (.) zu trennen von dem Bereich Förderung. (..) Und das Kind, das mehr gefördert werden muss, kriegt das immer eine schlechtere

548

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Note? (.) Per se, oder (..) Also finde ich, ja das ist=ist schwierig. (..) Ist echt schwierig.“ (Z. 377-381)

Hier zeigt sich eine Distanzierung zu einer spezifischen Auslegung individueller Förderung im Sinne einer Defizitorientierung, wenn Frau Hollerdieck zweifelnd hinterfragt, ob ein erhöhter Förderbedarf sich negativ auf die Benotung der erbrachten Leistung auswirken solle (oder dürfe). Ihre rhetorische Frage: „Und das Kind, das mehr gefördert werden muss, kriegt das immer eine schlechtere Note?“ offenbart einen von ihr wahrgenommenen Diskurs um individuelle Förderung als Belastung und Abweichung von der schulischen Norm.321 Diesem Verständnis individueller Förderung zufolge, erhalten Schüler_innen, die „mehr gefördert werden müssen“, mehr Aufmerksamkeit durch die Lehrkräfte, wodurch eine Ungleichverteilung der Ressource Aufmerksamkeit innerhalb einer Lerngruppe entstehen kann. Gleichzeitig erhalten Schüler_innen durch diese erhöhte Aufmerksamkeit verbesserte Rahmenbedingungen, wodurch das Ideal der Gleichbehandlung aller Schüler_innen erneut infrage gestellt wird. Eine legitime Praxis scheint dann der ‚Abzug des Mehraufwands‘ von der zu vergebenen Note zu sein, um das entstandene Ungleichgewicht wieder auszugleichen – die ‚fordernden‘, ‚aufwändigeren‘ Schüler_innen erhalten eine schlechtere Note. Dahinter steht die Idee, dass Schüler_innenleistungen allein die gezeigten Leistungen umfassen und Beurteilungen sich ausschließlich auf eben diese von den Schüler_innen gezeigte Leistung beziehen sollen. Indem die Lehrkräfte einzelnen Schüler_innen Hilfestellungen durch Maßnahmen der individuellen Förderung geben, werden sie gewissermaßen Teil der Leistungserbringung. Mit der schlechteren Note soll offenbar der Anteil der Lehrkraft am gezeigten Lernergebnis wieder ‚herausgerechnet‘ werden. Frau Hollerdieck zweifelt dieses Verständnis von individueller Förderung als Belastung und Abweichung an, kann sich jedoch auch nicht vollständig 321

Wobei an dieser Stelle des Interviews unklar bleibt, ob sich ihre Distanzierung auf ein lokales, schulinternes oder durch breitere Diskurskonstellationen getragenes Verständnis individueller Förderung bezieht.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

549

dagegenstellen. In der sich steigernden Wiederholung „das ist=ist schwierig. (..) Ist echt schwierig“ drückt sie gleichermaßen ihre Ablehnung wie auch einen begrenzten Handlungsspielraum aus.

„KLARE Kriterien“ und individuelle Förderung als „Pflicht“ der Lehrkräfte Frau Hollerdiecks Selbstverständnis als unterstützende und helfende Pädagogin, das sie auch als Anspruch an ihr Kollegium deutlich formuliert322, und ihr formatives Beurteilungsverständnis gehen zusätzlich einher mit einer starken Orientierung an nachvollziehbaren Kriterien der Leistungsbeurteilung: „Dass man ganz genau sagt, ok, was ist eigentlich wesentlich bei einer Fabel? Und was muss beachtet werden? Diese KRITERIEN werden auch mit den Schülern gemeinsam erarbeitet. Und auch die Schüler im Vorfeld WISSEN (..) welche Kriterien es gibt und was dann eben auch in der Klassenarbeit dann bepunktet wird. Da gibt es im Vorfeld dann Checklisten. Und diese Checklisten habe ich dann selber eben bei der Korrektur der Klassenarbeit. (.) Ähm find ich (.) ganz wesentlich, weil dadurch (.) deutlich wird, dass im Deutschunterricht grad bei=gerade bei Aufsätzen Noten nicht IRGENDWIE gegeben werden. Sondern dass sowohl Eltern als auch Schülern GANZ KLAR ist, es gibt bestimmte Dinge, die muss ich einhalten (.) und dann kann ich eben auch eine bestimmte Note erreichen.“ (Z. 80-87)

Die in dieser Passage beschriebenen Beurteilungsstrategien scheinen auf den ersten Blick nah an den Strategien der mathematisch-rechnerischen Gerechtigkeit (Bepunktungen) und prozedural-bürokratischen Gerechtigkeit (Checklisten, klare Kriterien) zu liegen. Frau Hollerdieck betont mehrmals im Interview wie wichtig es für sie ist in Bezug auf die Notenvergabe eine große Transparenz herzustellen, die Beurteilungskriterien offen zu legen und diese mit den Schüler_innen im Unterricht auch gemeinsam zu erarbeiten – Strategien, die für Frau Hollerdieck zentral für die Sicherung einer gerechten Leistungsbeurteilung sind. Anders als im 322

Auf ihre Sonderrolle als Schulleiterin und die Beziehungskonstellationen zum Kollegium wird weiter unten gesondert eingegangen.

550

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Kapitel 6.3.2 ausgeführt, dienen diese Strategien aber nicht allein der Absicherung der eigenen Beurteilungspraxis im Sinne von accountability, sondern kombinieren sich mit ihrem eingangs dargestellten Selbstbild als unterstützende und helfende Pädagogin, wenn sie weiter ausführt: „Ich muss durch meinen Unterricht und durch die Kriterien, die ich da anlege (..) dafür sorgen, dass jedes Kind da auch eine einigermaßen gute Note schreiben kann. Auch, wenn es nicht äh super kreativ ist und bes/ eine besondere Begabung im=im Schriftlichen hat.“ (Z. 145-147)

In der Formulierung „ich muss [...] dafür sorgen“ drückt sich erneut ihr Selbstverständnis als Lehrerin aus, die den Lehrberuf ganz klar mit einem Auftrag zur Förderung verbindet. Auch die Idee der Schwellengerechtigkeit, wie sie bei der schwedischen Lehrerin Lisbeth eingeführt wurde, scheint hier erneut auf, wenn Frau Hollerdieck davon spricht, dass sie den Schüler_innen zu ermöglichen versucht „eine einigermaßen gute Note [zu] schreiben“. Es geht ihr nicht darum, allen Schüler_innen zu Bestnoten zu verhelfen, aber ein gewisses Grundniveau sollen alle Schüler_innen erreichen können – unabhängig davon, welche Lernvoraussetzungen die Schüler_innen mitbringen („Auch, wenn es nicht äh super kreativ ist und bes/ eine besondere Begabung im=im Schriftlichen hat“).323 Klare Kriterien der Leistungsbeurteilung und deren Offenlegung im Unterricht sollen dabei helfen, dieses Grundniveau erreichen zu können. Die von ihr erwähnten Checklisten sollen den Lernprozess der Schüler_innen dahingehend unterstützen, dass ihnen die Anforderungen für einzelne Aufgabenstellungen deutlich sind („was ist eigentlich wesentlich bei einer Fabel?“) und die Bepunktungen den Schüler_innen (und deren Eltern) im Nachhinein auch verständlich sind. Die offengelegten Kriterien dienen also auch dazu den Eindruck von Willkürlichkeit bei der Beurtei323

Diese Haltung zeigt sich auch in ihrem Wunsch, die Noten in den Klassen 5 und 6 „aussetzen“ zu können, damit sie als Lehrkraft „MEHR Zeit hat (.) ja, die vielleicht auch alle auf einen Stand zu bringen“ (Z. 268).

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

551

lung zu vermeiden, wenn sie betont, dass Schüler_innen und Eltern klar sein soll, dass „Noten nicht IRGENDWIE gegeben werden“. Mit der Erwähnung der Eltern als gleichberechtigte Adressaten der Beurteilungskriterien verdeutlicht Frau Hollerdieck ihre Perspektive auf die Eltern als wichtige Unterstützung für den Lernerfolg ihrer Schüler_innen. Sie betont mehrfach, dass es ihr sehr wichtig sei, dass auch die Eltern die Beurteilungsgrundlagen verstünden, um ggf. unterstützend zur Seite stehen zu können. Damit wird deutlich, dass trotz aller individuellen Förderung durch die Lehrkraft immer auch die Schüler_innen und ihre Eltern für den Lernerfolg mitverantwortlich bleiben. Eine hauptsächliche Verantwortungsübernahme durch die Lehrkraft, wie bei der schwedischen Lehrerin Lisbeth deutlich wurde, findet sich so bei Frau Hollerdieck nicht. Die Lehrer_innen sind aber für die kontinuierliche Kommunikation mit allen Beteiligten verantwortlich, um während des Schuljahres auch ggf. Vorkehrungen treffen zu können, wenn sich Leistungsschwächen abzeichnen. Dazu der folgende Ausschnitt: „Es geht NICHT, dass=dass auf einmal eine FÜNF da auf dem Zeugnis ist. Das geht nicht. Also das ERWARTE ich auch von Kollegen und das müssen die auch belegen können, dass sie die Eltern und die Schüler informiert haben, dass das schlechter wird mit den Leistungen. Und dass sie AUCH mit dem Schüler beziehungsweise mit den Eltern besprochen haben, WAS der Schüler tun kann, um seine Leistungen wieder zu verbessern. Wenn das nicht gelaufen ist, kann die schlechte Note nicht gegeben werden. (.) Das ist einfach auch eine Pflicht, die die Kollegen haben und die sie auch erfüllen müssen.“ (Z. 689-695)

Aus dem klaren Förderauftrag, der im Zentrum ihres beruflichen Selbstverständnisses steht, leitet Frau Hollerdieck ebenfalls eine „Pflicht“ zur regelmäßigen Information und kommunikativen Begleitung der Schüler_innen und ihrer Eltern über den aktuellen Leistungsstand ab. Neben der Offenlegung der Beurteilungskriterien im Unterricht und bei Lernstandsüberprüfungen sind Lehrkräfte in Frau Hollerdiecks Augen auch dafür verantwortlich, die Schüler_innen und deren Eltern regelmäßig über potentielle Leistungsschwächen ihrer Kinder zu informieren – mehr noch, sie sollen ihnen als Berater_innen mit Verbesserungsvorschlägen zur Seite stehen. Wie die Schüler_innen und Eltern auf diese Informatio-

552

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

nen reagieren, inwiefern sie die Beratungen annehmen, lässt Frau Hollerdieck offen. Deutlich wird aber eine gewisse Erwartungshaltung an alle Beteiligten – Lehrkräfte, Schüler_innen und Eltern. Mit dem Hinweis darauf, dass bei unzureichendem Austausch und daraus folgender unzureichender Förderung, „die schlechte Note nicht gegeben werden“ kann, macht Frau Hollerdieck auch deutlich, dass sie ihre Befugnisse als Schulleiterin im Zweifel zugunsten der Schüler_innen nutzen würde. Im Folgenden wird dieser Aspekt näher beleuchtet.

„Der pädagogische Blick“ als Garant für gerechte Leistungsbeurteilung Obwohl klare Beurteilungskriterien ein zentrales Element einer in ihren Augen gerechten Leistungsbeurteilung darstellen, ist sich Frau Hollerdieck gleichzeitig darüber bewusst, dass Kriterien allein diese nicht sicherstellen können. Im folgenden Ausschnitt berichtet sie über ein Erlebnis im Zusammenhang mit der Einführung der zentralen Abschlussprüfungen (ZP10), bei dem die beteiligten Lehrkräfte dieselbe Arbeit benoteten und zu sehr unterschiedlichen Noten kamen – und dass, wie sie betont, „OBWOHL es ganz klare Kriterien gab“: „Ich habe in verschiedenen Gremien gearbeitet, auch gerade als die Abschlussprüfungen eingeführt wurden. So, da (.) war das sehr interessant, da haben (.) ich glaube zehn Kollegen eine Deutscharbeit korrigiert, ja? Und da war von Drei bis Fünf alles dabei. (.) OBWOHL es ganz klare Kriterien gab. (.) Das zum Thema Gerechtigkeit. Und es ist auch immer die Frage, welche Bezugsgruppe habe ich denn? (..) Das:s/ (.) Ja. (.) Man versucht es so gerecht wie möglich zu machen, ja? Aber komplett gerecht kann das nicht sein. Und deswegen ist es eben ganz=ganz wichtig, dass die Kollegen auch einfach diesen pädagogischen Blick noch haben. Und im Zweifel für den Schüler. IMMER im Zweifel für den Schüler.“ (Z. 383-390)

Frau Hollerdieck macht deutlich, dass sie um die Vielzahl möglicher Einflussfaktoren („welche Bezugsgruppen“) auf die schulische Leistungsbeurteilung weiß und sich bewusst ist, dass auch vorab festgelegte Beurteilungskriterien zu unterschiedlichen Ergebnissen führen können. Aus diesem Grund sei eine „komplett gerecht[e]“ Beurteilung kaum möglich,

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

553

auch wenn „man versucht es so gerecht wie möglich zu machen“. In dieser Passage wird deutlich, dass Frau Hollerdieck sich der Unbestimmtheit dessen, was als ‚gerechte‘ Leistungsbeurteilung gelten kann, durchaus bewusst ist. Dennoch führt die Erzählung über ungleiche Beurteilungsergebnisse verschiedener Lehrkräfte nicht dazu, diese ungleichen Ergebnisse als ungerecht zu bewerten. Entscheidend für Frau Hollerdieck ist vielmehr, dass Lehrkräfte „diesen pädagogischen Blick noch haben“, der „ganz=ganz wichtig“ sei. Der „pädagogische Blick“ dient gewissermaßen als Ausgleich für die Unzulänglichkeiten einer Beurteilung, die zwischen Kriterienorientierung und verschiedenen Bezugsnormen hinund hergerissen sei, er helfe trotz widersprüchlicher Anforderungen das Hauptziel nicht aus den Augen zu verlieren: die Orientierung an individuellen Schüler_innen. Mit der Wiederholung des Mottos („im Zweifel für den Schüler. IMMER im Zweifel für den Schüler“) findet sich eine fast wortgleiche Parallele zur schwedischen Lehrerin Lisbeth, die davon sprach ‚im Zweifel für den Angeklagten‘ zu stimmen. Wie diese Haltung sich auf konkrete Beurteilungsentscheidungen auswirken kann, verdeutlicht der folgende Ausschnitt, in dem es um die drohende NichtVersetzung eines Schülers geht: „Auch, wenn jede Einzelnote vielleicht auch berechtigt ist und die Kollegen das dokumentieren können, dass das auf jeden Fall auch mangelhaft war [lachend], muss man vielleicht trotzdem gucken mit ALLEN PÄDAGOGISCHEN (.) Mitteln, die ich habe. Und diesen=diesen den=den GRÖßTEN pädagogischen Spielraum, den ich da irgendwie nutzen kann, ob man da nicht vielleicht doch noch eine Vier draus machen kann, dass der Schüler eben nicht sitzen bleibt. Denn auch dieses Sitzenbleiben, das ist ja (.) [pfffhh].“ (Z. 635-640)

Frau Hollerdieck lehnt das Konzept des Sitzenbleibens grundsätzlich ab324, was sich in dem abfälligen Pfeifen am Ende des Auszugs und einige Zeilen später im Interview ausdrückt: „dieser ganze Bereich Sitzenbleiben (.) macht für mich eigentlich auch überhaupt keinen Sinn. Würde ich 324

Damit sticht sie im nordrhein-westfälischen Sample deutlich hervor, wobei allerdings die Deutlichkeit und Vehemenz der Ablehnung des Sitzenbleibens sicherlich auch auf ihre hervorgehobene Rolle als Schulleiterin zurückzuführen ist.

554

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

auch eigentlich abschaffen wollen“ (Z. 649-650). Insofern plädiert sie dafür, sich „mit ALLEN PÄDAGOGISCHEN Mitteln“ für die Abwendung der Nicht-Versetzung einzusetzen – auch, wenn dies bedeutet, dass sie sich über die von ihren Kolleg_innen vergebenen Beurteilungen hinwegsetzen muss. Dass sie ihre eigene Überzeugung (im Zweifel für den Schüler) über die Beurteilungskompetenz ihrer Kolleg_innen stellt, lässt sich daran ablesen, wie sie über die Vorgeschichte der Versetzungsgefährdung spricht: zunächst zieht sie die Berechtigung der Einzelnoten in Zweifel, wenn sie diese als „vielleicht auch“ berechtigt bezeichnet, um sie dann mit lachendem Unterton (und trotz Dokumentation) zu verwerfen. Interessant ist ihr Wechsel zwischen verallgemeinernden Formulierungen („muss man vielleicht“, „ob man da nicht vielleicht doch noch“) und der personalisierten Rede („Mitteln, die ich habe“, „Spielraum, den ich nutzen kann“) in dieser kurzen Passage. Es wird deutlich, dass sie einerseits über ihre generellen Überzeugungen spricht und gleichzeitig über ihren ganz persönlichen Handlungsspielraum, der jedoch nicht deckungsgleich mit demjenigen ihrer Kolleg_innen sein muss. Als Schulleiterin nimmt sie eine Sonderstellung ein, ist prima inter pares, und verfügt über gewisse Freiheiten, die regulär angestellten Lehrkräften in der Regel nicht zur Verfügung stehen dürften. Die verschiedenen professionellen Spielräume und deren Einfluss auf Gerechtigkeitsüberzeugungen werden auch im folgenden Abschnitt wieder aufgegriffen.

Professionelle Spielräume und institutionelle Begrenzungen Nicht nur bei der Frage der Versetzung oder Nicht-Versetzung am Ende des Schuljahres, auch bei der alltäglichen Beurteilung im Laufe des Schuljahres, versucht Frau Hollerdieck ihrer fördernden Grundhaltung treu zu bleiben. So spricht sie sich beispielweise für eine größere zeitliche Flexibilität bei schriftlichen Prüfungen aus, die in ihren Augen abgestimmt auf den jeweiligen Lernstand der einzelnen Schüler_innen durchgeführt werden müssten. Im Gegensatz zu ihren schwedischen Kolleg_innen kann sie dabei aber nicht auf eigene Erfahrungen zurück-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

555

greifen, sondern formuliert in gewisser Weise ein pädagogisches Ideal („da bin ich ein großer Fan von“), dass sie nur vom Hörensagen kennt und befürwortet: „Also ich weiß, es=es gibt äh/ an Gesamtschulen wird das ja teilweise schon so gemacht, da bin ich ein großer Fan von, dass die die Klassenarbeiten in einem bestimmten Zeitabschnitt schnei=äh=schreiben lassen. Das heißt, wenn ähm Schüler XY schon das Gefühl hat: ‚Mensch, ich bin jetzt soweit. Ich=ich brauch da eigentlich auch keine Übungen mehr.‘ Dann schreibt der die am ersten November. So. Wenn aber jemand anderes sagt: ,Mensch, ich=ich schaff das noch nicht. Ich brauch da wirklich noch, nur ein bestimmtes Thema. Das kann ich noch nicht so gut.‘ Dann schreibt der zwei Wochen später. Also es muss natürlich innerhalb eines bestimmten Zeitraumes passieren. Aber die schreiben nicht alle zu einem gleichen=nicht zu einem gleichen Tag. Sondern derjenige, der das Gefühl hat, er braucht noch mehr (.) Übung, der=der bekommt die dann auch erst mal. Also das finde ich sehr gut. Und es ist zu organisieren, ja? Also es gibt Schulen, die das eben schon machen. Und das finde ich sehr gut.“ (Z. 197-207)

Frau Hollerdieck widerspricht hier massiv einem Verständnis vom Lernen ‚im Gleichschritt‘, wie es implizit in das System der Jahrgangsklassen eingelassen ist (vgl. dazu die in Kap. 5.3 dargestellten institutionellen Vorbegriffe von Gerechtigkeit). Ihre Idee einer individuell zeitversetzten schriftlichen Überprüfung von Schüler_innenleistungen – je nach Lerntempo der Schüler_innen – würde ihrem formativen Beurteilungsverständnis entsprechen und den Schüler_innen eine Individualisierung des Lernprozesses ermöglichen. Im zweiten Teil der Passage macht sie aber auch deutlich, dass ihr keine grundsätzliche Auflösung von Überprüfungsmomenten vorschwebt, wenn sie einschiebt: „es muss natürlich innerhalb eines bestimmten Zeitraumes passieren“. Dieser Einschub und auch der Verweis auf die grundsätzliche Machbarkeit („es ist zu organisieren“) sowie auf andere Schulen, „die das eben schon machen“ erweckt den Eindruck, Frau Hollerdieck würde hier auf bereits antizipierte Kritik reagieren und diese vorsorglich zu entkräften versuchen. Deutlich wird, dass ihre pädagogische Grundhaltung der individuellen Förderung sich nicht nur auf die Ausgestaltung des Unterrichts, sondern auch in den potentiellen Formen der Beurteilung niederschlägt – in der Umsetzung werden diese Ideen allerdings durch die gegebenen institutionellen

556

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Rahmenbedingungen eingeschränkt. Dies drückt sich auch in ihrem Wunsch nach „mehr Spielraum“ im folgenden Auszug aus: „Kinder, die nicht mit der deutschen Sprache aufwachsen, haben natürlich da einen großen Nachteil. Und DA fängt es dann an mit der Gerechtigkeit schwierig zu werden. (.) Das heißt, was DIE (.) da an Leistungen erbringen ist für sie sicherlich gut. Aber, wenn man (.) die Standards anlegt, die vorgegeben sind (.), ist das dann nicht mehr gut. (.) Deswegen finde ich das sehr=sehr schwierig. (.) Ähm, und da würde ich mir (.) häufig wünschen, dass ich mehr Spielraum habe. Dass ich also wirklich noch viel individueller auf die einzelnen äh Schülerinnen und Schüler eingehen kann, die einfach einen Migrationshintergrund haben und (.) bei denen Deutsch nicht die Muttersprache ist.“ (Z. 159-161)

Hier bricht sich Frau Hollerdiecks Anspruch der individuellen Förderung an den äußerlichen Gegebenheiten, die sie als Spannung zwischen der individuellen Bezugsnorm („was DIE (.) da an Leistungen erbringen ist für sie sicherlich gut“) und der kriterialen Bezugsnorm („die Standards [...], die vorgegeben sind“) charakterisiert. Die (im Lehrplan oder durch zentrale Abschlussprüfungen) vorgegebenen Standards werden hier als Begrenzung ihrer Bemühungen um individuelle Förderung benannt und der Wunsch nach „mehr Spielraum“ geäußert. Dass Frau Hollerdieck als Schulleiterin durchaus einen größeren Handlungsspielraum als ‚normale‘ Lehrkräfte im nordrhein-westfälischen Schulwesen hat, zeigt sich am folgenden Beispiel, in dem sie berichtet, wie sie versucht ihre Idee der individuellen Förderung innerhalb des vorgegebenen Rahmens zu ermöglichen: „Und das ist auch das womit Kollegen häufig zu mir kommen, wo sie auch nicht mehr weiterwissen. Wo sie dann einfach auch sagen: ‚Ok. (.) Das ist eigentlich gefordert. (.) Das muss ich bis jetzt erreicht haben. (.) Aber, wenn ich das jetzt so machen würde und dazu jetzt die Klassenarbeit schreiben WÜRDE, dann würde ein=ein großer Teil hinten rüber fallen. Also was tue ich?‘ So, was sage ich? ‚Dann schreiben Sie die Klassenarbeit jetzt NICHT.‘ [...] Ja? Oder ähm (...) ‚Sie nehmen weniger Inhalte mit hinein.‘ Und gucken [..] dann, dass sie die Kinder dann da einfach noch weiter fördern. Also, wie gesagt, das ist immer eine Gratwanderung.“ (Z. 174-188)

In dem Beispiel geht es wiederum um den Umgang mit Kindern mit ‚Migrationshintergrund‘, die die deutsche Sprache (noch) nicht ausreichend

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

557

beherrschen und die Frage, inwieweit auf die unterschiedlichen Ausgangslagen bei der Klassenarbeit Rücksicht genommen werden kann. Für Frau Hollerdieck sieht die Antwort sehr eindeutig aus, sie empfiehlt ein Verschieben der Klassenarbeit bzw. ein Anpassen der Schwierigkeitsstufe kombiniert mit weiterer individueller Förderung. Ziel ist es, die Schüler_innen nicht „hinten rüber fallen“ zu lassen, sie also vor einer schlechten Klassenarbeitsnote zu bewahren, die sich womöglich nachteilig auf ihre Halbjahresnote auf dem Zeugnis auswirken würde. Dass sie diese Verschiebung bzw. Anpassung der Klassenarbeit jedoch empfehlen kann und diese Handlungsoption überhaupt hat, liegt in ihrer besonderen Stellung als Schulleitung begründet. Sie kann diese Ausnahmen genehmigen, andere Lehrkräfte müssten sich zunächst ihr Einverständnis einholen und könnten Entscheidungen dieser Art nicht selbstständig treffen. Die Vermutung liegt nahe, dass der erhöhte Handlungsspielraum als Schulleiterin im nordrhein-westfälischen Sample325 als fördernde Bedingung für Beurteilungsstrategien, die auf kompensatorische Gerechtigkeit und individuelle Förderung ausgerichtet sind, gelten kann. Gleichzeitig macht Frau Hollerdieck im Interview deutlich, dass sie in ihrem Kollegium auch immer wieder Auseinandersetzungen mit Kolleg_innen hat, die ihre pädagogischen Überzeugungen nicht teilen und Probleme mit ihrem Verständnis der individuellen Förderung haben.326 Sie konstatiert hier einen gewissen Entwicklungsbedarf („da muss ein Umdenken stattfinden“ Z. 317), räumt aber auch ein, dass dieses Umdenken „GANZ, GANZ lange“ (Z. 318) dauern könne. Insofern verfügt sie zwar für ihr eigenes Beurteilungshandeln über einen größeren Handlungsspielraum für die Umsetzung kompensatorischer Maßnahmen und kann diesen auch für Lehrkräfte, die ihre Überzeugungen teilen und ihre Unterstützung su325

In Schweden sind die Rollen zwischen Schulleitung und Lehrkräften deutlicher getrennt, d.h. die Schulleiter_innen unterrichten nicht selbst und übernehmen vor allem Aufgaben der Verwaltung, Planung und Budgetierung (vgl. dazu Kap. 5.1.3). 326 So kritisiert sie beispielweise auch: „also manchmal ist das Problem, dass die Kollegen (.) eher DOZENTEN sind als individuelle Förderer“ und „den einzelnen Schüler überhaupt nicht im Blick“ haben (Z. 935-945).

558

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

chen, einsetzen. In letzter Konsequenz aber bleibt die schulische Leistungsbeurteilung eine individuelle Praxis, die nur schwer von außen beeinfluss- oder veränderbar zu sein scheint – die Überzeugungen eines Teils ihres Kollegiums stehen Frau Hollerdiecks eigenen Gerechtigkeitsüberzeugungen in Bezug auf die schulische Leistungsbeurteilung z.T. diametral gegenüber und begrenzen die Umsetzung ihrer kompensatorischen Gerechtigkeitsüberzeugungen und Beurteilungsstrategien auf der Schulebene teilweise. Den Begriff der „Gratwanderung“, den Frau Hollerdieck im letzten Satz des obigen Ausschnitts verwendet, führt sie bereits kurz vor dieser Passage folgendermaßen ein: „So und äh klar muss ich individuell fördern. Ich muss aber auch bestimmte Standards erreichen. Denn es gibt so etwas wie eine Abschlussprüfung am Ende. (.) Also das ist immer eine GRATWANDERUNG für uns Kollegen und Kolleginnen. Das ist nicht so ganz einfach.“ (Z. 172-174)

Die hier angesprochene „Gratwanderung“ zwischen individueller Förderung einerseits und „bestimmte[n] Standards“ sowie zentralen Abschlussprüfungen andererseits ist wie in Kapitel 6.1 ausgeführt als invivo-Kode in die Analyse eingegangen und später in die Ausformulierung der Kernkategorie ‚gerechte Leistungsbeurteilung als Balanceakt‘ eingeflossen. Frau Hollerdieck begrüßt die zentralen Abschlussprüfungen einerseits, da sie die Lehrkräfte stärker „in die Pflicht nehmen“ würden, andererseits sieht sie aber auch die Begrenzungen durch die institutionell-organisatorischen Rahmenbedingungen: „Ja also, wie gesagt, generell bin ich ein Fan von Abschlussprüfungen. Und von Standards. Weil, wie gesagt, ich einfach denke, dass Kollegen da mehr in die Pflicht genommen werden müssen und einfach auch zum Begleiter für die Schüler werden, weil gesagt wird: "Ok, das sind die Standards. Die müssen wir jetzt ZUSAMMEN erreichen. Und ICH bin dazu da euch zu helfen, dass ihr das schafft." (..) So. Aber, wie gesagt, und da sind wir dann/ und die Rahmenbedingungen sind aber eben auch so, dass es auch schwierig ist, alle da hin zu bringen. So und das ist eben/ das ist eben so das=dieses=dieses Dilemma in dem wir sind. Also auf der einen Seite da bin ich ein Fan von Standards. Aber Kinder sind eben ganz unterschiedlich und sie brauchen unterschiedlich lange beziehungsweise der eine braucht mehr Übung als der andere.“ (Z. 828)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

559

Hier zeigt sich erneut Frau Hollerdiecks Perspektive auf klare Kriterien und Standards als hilfreiche Instrumente, um eine gezielte(re) individuelle Förderung vornehmen zu können. Zusätzlich wird eine Verschiebung der Verantwortlichkeiten und Aufgaben der Lehrkräfte deutlich: von der reinen Wissensvermittlung hin zum „Begleiter“ der Schüler_innen, die für die Tests „fit gemacht“ (Z. 794) werden sollen. Mit dem Verweis auf die institutionellen Rahmenbedingungen verweist Frau Hollerdieck aber auch auf die Begrenzungen ihres professionellen Freiraums und ihres formativen Beurteilungsverständnisses – am Ende der zehnten Klasse müssen sich alle Schüler_innen den gleichen Prüfungen stellen. Die Gratwanderung für die Lehrkräfte besteht für Frau Hollerdieck in genau dieser Spannung zwischen individuellen Schüler_innen und standardisierten Prüfungen und Rahmenbedingungen. Neben der Gruppe der Schüler_innen mit ‚Migrationshintergrund‘ führt Frau Hollerdieck eine weitere Gruppe von Schüler_innen im Interview an, bei denen die schulische Leistungsbeurteilung einer solchen „Gratwanderung“ gleicht: Schüler_innen, die eine Lese-Rechtschreib-Schwäche aufweisen. Dazu der folgende Ausschnitt: „So, wenn da jetzt aber wirklich so eine extreme Lese-Rechtschreib-Schwäche (.) ist (.) dann:n (.) tun Kollegen sich auch schwer. Weil das ein Bereich ist, der in=in alle Fächer hineinfließt. Bis hinein in den Matheunterricht, wo der dann die Aufgabenstellung nicht richtig lesen kann. Vielleicht ist der mathematisch ganz begabt, aber er versteht den Text nicht, weil er große Schwierigkeiten hat beim Lesen. So und da kommt/ ist auch wieder dieser=dieser Bereich Gerechtigkeit. Dass:s (.) / also wie gesagt, ich hab schon auch den Kollegen gesagt, ich denke jemand der eine LeseRechtschreib-Schwierigkeit hat, MUSS auch hier an der Realschule seinen Abschluss machen können. Ich finde, der muss auch sein Abitur machen können letztendlich. Wenn es wirklich ganz eindeutig eine Teilleistungsschwäche ist. (.) Aber das ist schon sehr=sehr schwierig. Und da sind Kollegen sehr gefragt. Und da müssen Kollegen eigentlich auch fortgebildet werden.“ (Z. 416-426)

Die Frage inwieweit eine sogenannte Lese-Rechtschreib-Schwäche bei der Leistungsbeurteilung berücksichtigt werden sollte, taucht in verschiedenen Interviews im deutschen Sample auf. Im Gegensatz zu den schwedischen Kolleg_innen wird jedoch häufiger von Schwierigkeiten oder Diskussionen im Kollegium gesprochen, was ein adäquater Umgang

560

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

sein könnte. Frau Hollerdieck macht als Schulleiterin und Deutschlehrerin ihre Position unmissverständlich klar. Die Betonung, dass auch Schüler_innen mit Lese-Rechtschreib-Schwächen einen Realschulabschluss machen können müssen, würde im schwedischen Kontext vermutlich zu Unverständnis führen.327 Im deutschen Kontext ist jedoch die fächerübergreifende Sprachförderung nach wie vor keine Selbstverständlichkeit und Frau Hollerdiecks Aussage ein Zeichen dafür, dass betroffene Schüler_innen nicht selbstverständlich einen Mittleren Schulabschluss bzw. die Hochschulreife erreichen. Die vergleichsweise strikte Haltung gegenüber dieser Art von Benachteiligung zeigt sich auch in einem Runderlass zur „Förderung von Schülerinnen und Schülern bei besonderen Schwierigkeiten im Erlernen des Lesens und Rechtschreibens“, in dem betont wird, dass auch für diese Schüler_innen zunächst die allgemeinen Regelungen zur Leistungsbeurteilung gelten. Ausnahmen werden vor allem für jüngere Schüler_innen in Klasse 1-6 gewährt, für die ein zusätzlicher Förderbedarf festgestellt wurde. Für die älteren Schüler_innen ab Klasse 7 gelten jedoch nur „in besonders begründeten Einzelfällen“ Ausnahmeregelungen, bei denen bspw. die Rechtschreibung bei der Benotung von schriftlichen Arbeiten im Fach Deutsch ausgeklammert werden kann bzw. die Rechtschreibleistung bei der Zeugnisnotenbildung „zurückhaltend zu gewichten“ sei (MSW, 19.07.1991). Auffällig im Vergleich zum schwedischen Fall ist sowohl in den Formulierungen des Runderlasses („besonders begründete Einzelfälle“) wie auch in Frau Hollerdiecks Ausführungen („extreme Lese-Rechtschreib-Schwäche“, „ganz eindeutig eine Teilleistungsschwäche“) die Betonung eines Sonder- oder Ausnahmefalles, der zusätzlicher Bestätigung oder Beglaubigung bedarf, um eine besondere Unterstützung von Schüler_innen zu rechtfertigen.

327

Zumal die Idee der verschiedenen Abschlüsse nach Klasse 10, die mit unterschiedlichen weiterführenden Bildungs- und Lebenschancen verbunden sind, grundsätzlich für skeptische Blicke und Nachfragen in manchen Interviewnachgesprächen in Schweden führte.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

561

Zusammenfassung: Frau Hollerdieck Frau Hollerdieck spricht sich als „Pädagogin“ ganz klar für eine individuelle Förderung von Schüler_innen aus und tritt für individualisierte Formen von Unterricht und Leistungsbeurteilung ein. Mehr noch, für sie stellen die Bereiche Förderung und Leistungsbeurteilung komplementäre Bereiche schulischer Arbeit dar, die nicht voneinander zu trennen sind. Dabei beruft sie sich auch auf die Wichtigkeit klarer Kriterien der Leistungsbeurteilung und lobt die zentralen Abschlussprüfungen sowie Kernlehrpläne als wichtige Hilfsmittel und Diagnosemittel für Lehrkräfte. Sie benennt aber auch klare Anforderungen, die sie an die Schüler_innen und deren Eltern stellt, als Voraussetzung für individuelle Förderung und kompensatorische Maßnahmen. Ihr Motto „im Zweifel für den Schüler“ findet sich wie ein roter Faden immer wieder im Verlauf des Interviews ebenso wie die Einforderung eines „pädagogischen Blicks“ auf die schulische Leistungsbeurteilung, womit eine Orientierung an den einzelnen Schüler_innen gemeint ist. Mit ihrem Wunsch, die Strukturen an ihrer Schule wie auch Einstellungen des Kollegiums im Sinne einem stärker auf individuelle Förderung ausgerichteten Unterrichts- und Beurteilungsalltag zu verändern, verbinden sich gleichzeitig auch die (institutionellorganisatorischen, personellen) Herausforderungen, die ihren pädagogischen Überzeugungen Grenzen setzen und eine „komplett gerechte“ Leistungsbeurteilung erschweren. Als Schulleiterin verfügt sie zwar über größere Handlungsspielräume als ihre Kolleg_innen, ihre weitreichenden pädagogischen Wünsche zur Erweiterung individueller Förderung und kompensatorischer Maßnahmen (Aussetzen der Benotung in Klasse 5 und 6, Abschaffung des Sitzenbleibens, zeitlich flexible Klassenarbeiten) scheitern teilweise trotzdem an der schulischen Realität in NRW.

562

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

6.3.4.3 Fallübergreifender Vergleich Im fallübergreifenden Vergleich der beiden oben dargestellten Referenzfälle Lisbeth und Frau Hollerdieck fielen einige Besonderheiten auf, die im Folgenden noch weiter aufgeschlüsselt werden sollen. Dazu werden belegartig weitere Auszüge aus Interviews mit anderen Lehrkräften herangezogen, die einzelnen Fälle jedoch nicht mehr so ausführlich dargestellt, wie Frau Hollerdieck und Lisbeth. Der Fokus liegt, wie in den vorhergehenden Kapiteln auch, vielmehr auf der Kontrastierung und Darstellung der rekonstruierten Varianzen innerhalb der kompensatorischen Gerechtigkeitsüberzeugung. Dabei wird zunächst auf Unterschiede und Gemeinsamkeiten innerhalb der schwedischen bzw. nordrheinwestfälischen Samplegruppe eingegangen, im Anschluss daran eine länderübergreifende Perspektive auf Gemeinsamkeiten und Unterschiede zwischen den beiden Samplegruppen eingenommen. Abschließend werden die aus dem Material rekonstruierten Bedingungen zusammenfassend dargestellt, die eher förderlich bzw. hemmend auf die kompensatorische Gerechtigkeitsüberzeugung der Lehrkräfte beider Länder einwirken. Der Fall Lisbeth im Vergleich zu anderen schwedischen Lehrkräften Beim Vergleich der schwedischen Lehrkräfte untereinander wird deutlich, dass die Themen individuelle Förderung und formative Leistungsbeurteilung zwar in allen Interviews auftauchen, die Lehrkräfte diese pädagogischen Ideen aber unterschiedlich stark in ihrer Beurteilungspraxis aufgreifen. So gehen beispielsweise in vielen schwedischen Interviews Erzählungen über Beurteilungssituationen und Unterrichtssituationen immer wieder ineinander über bzw. erklären die Lehrkräfte selbst, dass diese Bereiche kaum voneinander zu trennen sind – was als Hinweis auf ein verbreitetes formatives Beurteilungsverständnis gelesen werden kann. Dazu ein Auszug aus dem Interview mit der Schwedischlehrerin Alva:

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

563

„Ich meine, das ist nun mal beides: die Schüler_innen beurteilen, um eine Zensur vergeben zu können, aber auch um den Schüler_innen formative Kommentare geben zu können, damit sie weiterkommen. Und dann auch um meinen Unterricht planen zu können. Das ist eigentlich ein natürlicher Teil von allem was ich tue.“ 328(Z. 69-72)

Alva weist auch darauf hin, dass sie „eigentlich keine Prüfungen“ (Z. 62) bräuchte und versuchen würde, die Schüler_innen fortlaufend zu beurteilen, „nicht nur in eindeutigen Testsituationen“ (Z. 61)329, um die Schüler_innen weniger nervös zu machen und ihnen diese Prüfungssituationen zu ersparen. Die Kehrseite dafür ist allerdings die permanente Beobachtung und Beurteilung der Schüler_innen in allen unterrichtlichen Situationen, die als bedömning hela tiden (wörtlich: „Beurteilung die ganze Zeit“) in den Analyseprozess eingeflossen ist. Diese den Lernprozess unterstützende permanente Beurteilung kann aber auch als große Belastung von den Schüler_innen empfunden werden und einen permanenten Leistungsdruck befördern, wie Bettina Vogt in ihrer Dissertation zeigen kann (vgl. Vogt, 2017).330 Wie in Kapitel 6.3.3.2 am Fall der Schwedischlehrerin Barbro bereits ausgeführt, stellt auch für sie die Frage, wie sie ihren Schüler_innen mithilfe der formativen Leistungsbeurteilung während des Lernprozesses unterstützend zur Seite stehen kann, so, dass „ALLE die Möglichkeit haben, so gut zu werden, wie sie können“331(Z. 317), eine zentrale Kompo-

328

Original: „Menar det är ju båda: att bedöma eleverna för att kunna sätta ett betyg men det är ju också att bedöma eleverna för att kunna ge de formativa kommentarer att komma vidare. Och sen är det ju också för att kunna lägga upp min undervisning. Så. Det är ju en naturligt del i allt jag gör egentligen.” (Z. 69-72) 329 Original: „Sen så försöker jag att bedöma i (...) i (..) inte i bara uttalade testsituationer. För att det det gör ju att eleverna blir väldigt nervösa. I tyska anser jag inte att jag egentligen inte behöver några prov. För jag ser vad de kan ändå.“ (Z. 61-63) 330 Vgl. hierzu ausführlicher auch den aus dem Projektkontext entstandenen gemeinsamen Artikel zur Frage des „bedömning hela tiden“ aus Lehrer_innen- und Schüler_innenperspektive Falkenberg, Vogt und Waldow (2017). 331 Original: „Det är ju inte betyget, är ju inte det viktigaste, egentligen. Utan det viktigaste med bedömningen är ju att se, vilka som lär sig fort. Eh så att de också får utmaningar och kan fortsätta att lära sig och vilka som lär sig kanske lite långsammare.

564

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

nente ihres pädagogischen Handelns dar. Ihre pädagogische Grundhaltung beschreibt sie folgendermaßen: „Dass ich als Pädagogin (.), dass ich davon ausgehe, dass meine Schüler_innen die beste Note haben sollen. Und dann schauen wir, wie weit es für alle reicht“332(Z. 393-395). Barbros professionelles Selbstverständnis als Pädagogin gründet sich auf den Anspruch, grundsätzlich allen Schüler_innen dabei zu helfen, ihre Fähigkeiten und Kompetenzen zu entwickeln, durch formative Beurteilungen herauszufinden, wo sie stehen und was sie (nicht oder noch nicht) können, um dann entsprechend helfen und unterstützen zu können. Für Barbro steht zudem fest, dass es keine abschließende, summative Benotung geben sollte ohne vorhergehende kontinuierliche formative Beurteilung; eine Beurteilung, die den Lernprozess außer Acht lasse und sich nur auf die Lernergebnisse stützen würde, wäre in Barbros Augen ungerecht (vgl. Z. 320-321; Kap. 6.3.3.2).333 Ihr professionelles Selbstbild als unterstützende Pädagogin lässt sich auch aus der folgenden Formulierung ableiten, wenn sie davon spricht, dass eine gerechte Beurteilung am Ende des Halbjahres darauf aufbaut, dass sie die Schüler_innen im Lernprozess begleitet hat und „[d]ass es mir als Lehrerin geglückt ist, das aufzufangen wo die Schüler_innen sich noch entwickeln müssen. Und dass ich die Schüler_innen auf den Weg gebracht habe“ 334 (Z. 530-531). Wortwörtlich müsste die Formulierung att jag har handledd eleverna mit „die Schüler an die Hand genommen“ oder „den Schülern die Hand halten“ übersetzt werden.335 In beiden Sinnbildern („an die Hand nehmen“ Och vilka som har SVÅRT. Så att ALLA får möjlighet att bli så bra, som de kan.” (Z. 314317) 332 Original: „Det är ju super viktigt, tycker jag. Att jag som pedagog, (.) jag utgår ifrån att mina elever ska ha högsta betyg. Och sen får vi se hur långt det räcker för alla.” (Z. 393-395) 333 Original: „Eh:h, att bara titta på den FÄRDIGA produkten är ju inte rättvist. Egentligen. För att det (..) Det måste vi ju också men det, det blir ju ingen lärande av det.” (Z. 320321) 334 Original: „Att jag som lärare har lyckats att fånga upp det som eleverna behöver utveckla. Och att jag har handledd eleverna på vägen.“ (Z. 530-531) 335 Das Wort handledning wird auch im universitären Kontext verwendet und bedeutet so viel wie Anleitung oder Betreuung von Studierenden bzw. Doktorand_innen.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

565

und „auf den Weg bringen“) sind es die Lehrer_innen, die eine aktive Rolle übernehmen, den Schüler_innen begleitend zur Seite stehen und damit ein Stück der Verantwortung für das Lernergebnis übernehmen.336 Andere Lehrkräfte sprechen davon, dass es ihre „Verantwortung“ sei, ihren Schüler_innen „verschiedene Werkzeuge zu geben, um es zu schaffen“ (Alva, Z. 273-274)337, oder ihrem „Auftrag, dafür zu sorgen, dass alle Schüler_innen ein ‚bestanden‘ bekommen oder, und alle Schüler_innen dahin zu bringen, dass sie so gut abschneiden, wie sie können“ (Karolina, Z. 727-728)338. Zentral ist immer wieder die Orientierung daran, dass alle Schüler_innen eine ausreichende Förderung erhalten, um die Mindestanforderungen der Note ‚E‘ zu erfüllen und gleichzeitig jedem und jeder Schüler_in ermöglicht wird, so weit wie möglich zu kommen. Dafür müssten sich die Lehrer_innen an ihre Schüler_innen anpassen, wie die Schwedischlehrerin Karolina weiter ausführt: für sie steht fest, dass sie alle ihre Schüler_innen – unabhängig davon, wie unterschiedlich ihre Lernvoraussetzungen aussehen – über die Schwelle der ‚bestanden/nicht bestanden-Grenze‘ zu bringen hat. Dafür stellt sie an sich selbst den Anspruch sich auf die individuellen Fähigkeiten und Bedürfnisse ihrer Schüler_innen einzustellen („Da MUSS ich mich schon anpassen“). Dass dieser Anspruch im Unterrichtsalltag schwer zu erfüllen ist, macht sie ebenfalls deutlich („riesig schwer“).339 Auch hier übernimmt

336

Zu den Bildern des „Wege Findens” und „Wege Bereitens” passt auch die Bezeichnung des Lernprozesses von Schüler_innen als „Reise” („resan“), wie sie Lisbeth vornimmt, sich aber auch im Interview mit dem Schwedischlehrer Mats wiederfindet (vgl. Mats, Z. 78-79, 99-103, 442-445) 337 Original: „Som också känner jag att det är ju MITT ansvar att ge de olika (.) redskap för att kunna klara det.” (Z. 273-274) 338 Original: „Eftersom vi har individanpassad undervisning, mitt uppdrag är att se till att få alla elever godkända eller, och få alla elever att (.) prestera så bra som dom kan.” (Z. 727-729) 339 Original: „Då MÅSTE jag=ju anpassa mig. (.) Alla är inte som A-barnet som läser, pratar, ta/ Som gör allt jättebra. En del är blyga, en del har svårt att skriva, en del har ingen ut-håll-hållighet, en del har svårt att hitta fantasin när dom ska skriva, en del pratar aldrig hemma, en del pratar mycket he-hemma. Så att, visst, man anpassar sig.

566

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

die Lehrkraft zu einem großen Teil die Verantwortung für die Erbringung der Schüler_innenleistung und ermöglicht sie im Grunde erst. In der Formulierung „alla ska nå så långt som möjligt“ („alle sollen soweit kommen wie möglich”) drückt sich die Förderorientierung dieser Lehrkräfte ebenfalls aus – eine Formulierung, die so auch im schwedischen Schulgesetz verwendet wird (vgl. dazu ausführlicher im länderübergreifenden Vergleich der kompensatorischen Gerechtigkeitsüberzeugung am Ende dieses Kapitels). Wie diese Unterstützung aussehen kann, soll an zwei Beispielen zum Umgang mit Schüler_innen, die eine Lese-Rechtschreib-Schwäche haben, verdeutlicht werden. Die Schwedischlehrerin Alva berichtet beispielsweise davon, dass sie für das Anfertigen von Schreibaufgaben im Schwedischunterricht teilweise den Computer nutzt, um „Dyslektiker, denen es schwer fällt mit der Hand zu schreiben“ oder Schüler_innen „mit motorischen Schwierigkeiten“340 besonders zu unterstützen. Auf diese Weise würden Überarbeitungen von Texten und das Beheben von Fehlern für diese Schüler_innen leichter als bei der herkömmlichen Korrektur am Blatt. Für Pernilla, die als Schwedischlehrerin an einer weiterführenden Schule arbeitet, eröffnet sich durch die Verlängerung des Beurteilungszeitraums über das Ende des Schulhalbjahres hinaus eine zusätzliche Möglichkeit kompensatorischer Gerechtigkeit für diese Schüler_innen: „Man kann einen Kurs341 auch verlängern. Also ich gebe dann die Note nicht vor (.) Oktober im nachfolgenden Schuljahr. Aber da muss es einen Grund342 geben, damit Men för att (.) nå dom här ele-eleverna, för att få dom att p-prestera. (.) Och det är jättesvårt.” (Z. 729-733). 340 Original: „Jag har med mig ett par stycken i årskurs nio som jag inte tror, hade orkat om det var papper. Dyslektiker, som har det jätte tufft att skriva från hand. Eller elever som har motoriska svårigheter när det blev så lite för man orkade inte. Men nu, när det finns det, så kan man gå tillbaka och bearbeta.” (Z. 250-253) 341 In der gymnasieskola werden die Unterrichtsfächer häufig in mehrere Kurse unterteilt unterrichtet, die mehrere Wochen dauern können, aber nicht zwangsläufig einem Halbjahr entsprechen. 342 Das Wort skäl kann sowohl mit „Grund” oder „Ursache“, aber auch mit „Begründung” übersetzt werden. Da diese besonderen Maßnahmen nicht von der Lehrkraft allein be-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

567

dieser Schüler/ Vielleicht besondere Schwierigkeiten, Dyslexie, (.) andere Dinge. Oder nur, dass man es unglaublich schwer hat beim Leseverstehen, schlechtes Leseverstehen oder so. Ähm, also ich habe schon auch die Möglichkeit, das Benotungsdatum zu verschieben.“ 343 (Z. 124-127)

Durch das Verschieben des Benotungszeitpunktes ermöglicht Pernilla es einzelnen Schüler_innen von dem vorgesehenen Rhythmus und der zeitlichen Taktung in Schulhalbjahre sowie Unterrichts- und Ferienzeiten abzuweichen und die zusätzliche Zeit für das Erreichen der Lernziele zu nutzen. Interessant ist, dass sie zunächst von „besonderen Schwierigkeiten“ und „Dyslexie“ als Gründe für eine solche Ausnahmeregelung spricht, diese dann aber wieder abschwächt mit der Ergänzung, dass die zeitliche Verschiebung auch für Schüler_innen möglich sei, die es „nur [...] unglaublich schwer“ haben beim Lesen. In Abstimmung mit der Schulleitung, die diese Ausnahmeregelungen genehmigen muss, kann Pernilla so einem relativ breiten Spektrum an Benachteiligungen entgegenwirken und im Sinne der Schüler_innen die Lernzeit verlängern. Im Vergleich zu ihren deutschen Kolleg_innen tut sich an diesem Punkt ein spannender Unterschied auf, der weiter unten wieder aufgegriffen wird. Eine weitere Strategie, um ‚schwachen‘ Schüler_innen bei der Leistungsbeurteilung entgegenzukommen, stellt die Schaffung individueller Prüfungssituationen dar, wie es beispielsweise die Lehrerin Malin für den Englischunterricht erzählt: „Ähm zum Beispiel Hörverstehen in Englisch. (.) Äh, wenn sie in der Klasse sitzen, werden sie oft ein bisschen nervös und es geht zu schnell. Aber dann denke ich, wenn das im wirklichen Leben draußen wäre, dann hätten sie: ‚Warte bitte. Say it again please!‘ Oder so. Also, dann kommen sie zu mir und sie bekommen einen Laptop und dann können sie mit Kopfhörern sitzen und dürfen Pause drücken (.) und vielleicht soschlossen, sondern auch von der Schulleitung genehmigt werden müssen, würden jedoch alle drei Übersetzungen passen. 343 Original: „Så kan man också förlänga en kurs. Så jag kanske inte sätter betyg på dom förrän (.) oktober efterföljande vå/ år. Men då ska det finnas skäl för att den här eleven/ Kanske extra svårigheter, dyslexi, (.) andra saker. Eller bara att man har otroligt svår eh läsförmåga, dålig läsförmåga eller så. Ehm, så jag har ju den möjligheten också, att=att skjuta på (.) betygsdatum.” (Z. 124-127)

568

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

gar zurückspulen. (.) Und äh:h (.) MEISTENS klappt das dann. Sie sind weniger gestresst, sie können Pause machen, sie können die Fragen ein paar Mal lesen und dann geht das. Und dann schafft man das trotzdem.“344 (Z. 382-387)

Weitere Hilfsmöglichkeiten, die sie aufzählt sind beispielsweise, Schüler_innen mehr Zeit für eine Aufgabe zu lassen, Prüfungen an einem anderen Termin fortzuführen oder das Vorlesen (und Erklären) der Fragen durch die Lehrkraft. Wie bereits im Kapitel 6.3.2.3 ausgeführt, stellt ein punktuelles Abweichen von den offiziellen Vorgaben zum Vorteil einzelner Schüler_innen eine für Malin legitime Strategie dar, um mit den teilweise widersprüchlichen Anforderungen an die Leistungsbeurteilung im Unterrichtsalltag umzugehen. Wie am Beispiel der Lehrerin Lisbeth und anderen Lehrkräften des schwedischen Samples gezeigt wurde, geht mit der kompensatorischen Gerechtigkeitsüberzeugung ein starker Fokus auf die Schüler_innen am unteren Ende des Leistungsspektrums einher, auf diejenigen Schüler_innen also, die drohen an der Mindestschwelle zur Note ‚E‘ zu scheitern. Aus dem Blick zu geraten scheinen demgegenüber diejenigen Schüler_innen, die sehr gute Leistungen erbringen bzw. sich eher im ‚Mittelfeld‘ befinden. Mit Blick auf die Kategorie der Beziehungsstrukturen zwischen Lehrkräften und ihren Kolleg_innen bzw. der Schulleitung fällt auf, dass die schwedischen Lehrkräfte mit einer eher kompensatorischen Gerechtigkeitsüberzeugung den kollegialen Austausch zwar suchen und schätzen, diesen aber vor allem für die Erarbeitung und Absprache der individuellen Fördermaßnahmen nutzen. Der Fokus liegt weniger auf der Herstellung eines im Kollegium geteilten Beurteilungsmaßstabs, wie bei der 344

Original: „E:eh, till exempel hörförståelse i Engelska. (.) Eh, när dom sitter i storklass så blir dom ju ofta lite nervösa och det går lite fort. Men då tänker jag ändå att, hade det varit i verkliga livet ute, då hade dom ju: ,Vänta lite. Say it again, please!’ Eller hur. Så att då får dom komma till mig och så får dom en dator och så får dom sitta med hörlurar och så får dom pausa (.) och kanske till och med backa nån gång. (.) Och e:eh (.) OFTAST fixar dom det då. Dom är mindre stressade, dom kan pausa, dom kan läsa frågan ett par gånger, och då går det. Och då klarar man ju det ändå.” (Z. 382-387)

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

569

diskursiv-interaktiven Gerechtigkeitsüberzeugung deutlich wurde. Am Beispiel Lisbeths lässt sich nachvollziehen, dass die Zusammenarbeit insbesondere mit der Förderlehrkraft der Unterstützung ihrer auf die Lernprozessbegleitung ausgerichteten Beurteilungspraxis dient; Fragen der intersubjektiven Nachvollziehbarkeit von Beurteilungen oder die Sicherstellung einer ‚objektiven‘ Beurteilung durch die Einbeziehung einer weiteren Lehrkraft spielen für Lisbeth keine Rolle, wenn es um eine in ihren Augen gerechte Beurteilung von Schüler_innenleistungen geht. Ebenso wenig beeinflussen Überlegungen hinsichtlich der Vergleichbarkeit oder Gleichwertigkeit (likvärdighet) ihrer Beurteilungen Lisbeths Beurteilungsüberzeugungen, weshalb die Ergebnisse der zentralen Tests (nationella prov) von ihr auch nur als „ein Teil wie alle anderen“ beurteilt werden. Der Fall Frau Hollerdieck im Vergleich zu anderen nordrheinwestfälischen Lehrkräften Frau Hollerdieck sticht mit ihrer sehr klar an individueller Förderung orientierten Grundhaltung aus dem nordrhein-westfälischen Sample heraus. Dies kann zum Teil, wie bereits in der ausführlichen Falldarstellung diskutiert, mit ihrer Sonderrolle als Schulleiterin und dem damit erhöhten professionellen Handlungsspielraum erklärt werden. Nichtsdestotrotz finden sich auch bei anderen Lehrkräften Elemente kompensatorischer Gerechtigkeitsüberzeugungen und auf Kompensation ausgerichteter Beurteilungsstrategien. Dabei lassen sich zwei Tendenzen ausmachen: zum einen sind es eher Haupt- und Realschullehrkräfte345, die die Notwendigkeit kompensatorischer Maßnahmen vor allem mit dem 345

Eine Ausnahme stellt der Gymnasiallehrer Herr Opdenkamp dar, der sich ebenfalls für eine stärkere Ausrichtung des Unterrichts und der Beurteilungspraxen an individueller Förderung auch am Gymnasium ausspricht. Er schlägt dafür beispielsweise einen „Bewertungsparkour“ vor, womit individuell auf die Schüler_innen zugeschnittene Lern- und Prüfungsangebote gemeint sind, „um den Kindern da möglichst viele verschiedene Möglichkeiten zu geben“ (Z. 130-131).

570

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Hinweis auf eine spezielle förderbedürftige „Klientel“346 begründen; zum anderen richten sich die Überlegungen zur kompensatorischen Gerechtigkeit weniger auf die individuelle Förderung einzelner Schüler_innen als vielmehr auf Gruppen von Schüler_innen mit besonderen Merkmalen, wie bspw. Schüler_innen mit einem nicht näher definierten ‚Migrationshintergrund‘ oder einer Lese-Rechtschreib-Schwäche. Eine Strategie, die sich stärker an der gesamten Lerngruppe orientiert, stellt der folgende Ausschnitt aus dem Interview mit Herrn Beckmann, einem Mathematiklehrer an der Hauptschule, dar: „Nicht jede Lerngruppe ist gleich, nicht jede Klasse ist gleich. Da muss man auch gucken. Dass man andere Wege findet, um das zu erklären oder auch äh eben halt die Arbeiten auch anders irgendwie ein bisschen zu stellen. (.) Und wenn es nur die Formulierungen sind. Wenn ich jetzt, sagen wir mal, eine Lerngruppe habe mit (.) äh sehr vielen äh Ausländern, die eben halt, sagen wir mal, der deutschen Sprache noch nicht ganz so äh mächtig sind, dann muss ich gucken, dass ich also da vom Text reduziere. Ne? (.) Äh weil es geht letztendlich um Mathe und nicht um Deutsch.“ (Z. 47-52)

Für Herrn Beckmann steht außer Frage, dass die Prüfungsformate, hier die Aufgabenstellungen der schriftlichen Klassenarbeiten, an das Sprachniveau der Schüler_innen angepasst werden müssen, um eine gerechte Beurteilung ihrer Fähigkeiten zu ermöglichen. Dies wird besonders deutlich in der Verwendung des Modalverbs „müssen“, das er zunächst in der distanzierten Formulierung „da muss man auch gucken“ und später in der personalisierten Form „dann muss ich gucken“ verwendet. In seinen Augen ist es seine Aufgabe als Lehrer den Unterrichtsinhalt einerseits verständlich zu erklären und andererseits auch geeigne346

Zitat aus dem Interview mit Herrn Beckmann (Z. 142). Das Wort „Klientel“ leitet sich vom lateinischen clientela ab, was laut Duden mit „Gesamtheit der Hörigen“ übersetzt wird. Im Rechtswesen sind damit Mandant_innen, in der Wirtschaft Kund_innen und in der Psychotherapie Patient_innen gemeint. In den nordrhein-westfälischen Interviews wird es häufiger als Synonym für die Schüler_innenschaft einer Schule genutzt und insbesondere von den Lehrkräften der Haupt- und Realschulen als Hinweis auf Schüler_innen mit eher benachteiligtem sozioökonomischem Hintergrund verwendet. Inwiefern damit auch eine implizite Adressierung im therapeutischen Sinne (als Patient_innen mit besonderen Bedürfnissen) einhergeht, muss an dieser Stelle offenbleiben.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

571

te Prüfungsformate für unterschiedliche Lerngruppen anzubieten. Die Figur des „Wege Findens“ aus dem Interview mit der schwedischen Lehrerin Lisbeth taucht auch hier wieder auf und verweist auf sein professionelles Selbstbild als (Lern-)Begleiter, in dessen Verantwortung es liegt, die passenden Angebote zu machen.347 An anderer Stelle macht er auch deutlich, dass es dafür unerlässlich ist, seine Schüler_innen sehr gut zu kennen („Ich muss von jedem Schüler alles wissen.“ Z. 156). Dass mit der Anpassung der Aufgabenstellungen für die einen zwangsläufig eine Ungleichbehandlung von anderen Schüler_innen einhergeht, scheint für Herrn Beckmann unproblematischer zu sein als die sprachlichen Anpassungen nicht vorzunehmen. Viel wichtiger ist es, dass die gewählten Prüfungsformate auch tatsächlich messen, was sie zu messen vorgeben, wie aus seinem Hinweis „es geht letztendlich um Mathe und nicht um Deutsch“ deutlich wird. Ein Anpassen der Prüfungsformate, in diesem Fall die Reduzierung von Textaufgaben im Mathematiktest für Schüler_innen mit nichtdeutscher Herkunftssprache, stellt im Gegenteil die einzig legitime Praxis für Herrn Beckmann dar.348 Dies wird auch an seiner Kritik an der „textlastigen“ zentralen Prüfung in Mathematik für die Hauptschule sichtbar, die sich für seine „Klientel“ nachteilig auswirke und deren Sinnhaftigkeit er deshalb anzweifelt (vgl. Z. 131-149). Da diese Prüfungen jedoch zentral vorgegeben sind, beschränkt sich sein Einflussbereich bei der Frage der Abschlüsse auf die Vorbereitung der Schüler_innen im Unterricht im laufenden Schuljahr. Herr Beckmann steht den zentralen Abschlussprüfungen hier skeptischer gegenüber als Frau Hollerdieck, die diesen einen stärkeren Impuls zur Unterstützung individueller Förderprozesse zuschreibt. 347

Eine Erklärung für seine fördernde Grundhaltung liefert Herr Beckmann später im Interview, wenn er sagt: „ich bin Hauptschullehrer. Mit Leib und Seele. Möchte auch nicht woanders hin“ (Z. 260) und damit sein professionelles Selbstbild als unterstützende Lehrkraft auch mit den Besonderheiten der Schulform Hauptschule und deren Schülerschaft begründet. 348 Herr Beckmann arbeitet zudem an einer Schule, die sich nach Aussage der Schulleiterin auf minderjährige Geflüchtete und Schüler_innen mit ‚Migrationshintergrund‘ spezialisiert hat, indem sie seit Jahren Deutschkurse und Einstiegsklassen anbietet.

572

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Herr Arnold, ein Mathematiklehrer an einer Hauptschule, betont zwar einerseits in seinem Interview, dass er bei der Benotung von schriftlichen Arbeiten immer unabhängig von der Person vorgehen würde, gleichzeitig führt er an, dass es manchmal eine „pädagogische Komponente bei den Noten“ brauche. Gemeint ist damit die Rücksicht auf die individuellen Lernsituationen der Schüler_innen und ihre Möglichkeiten sich auf eine Klassenarbeit vorzubereiten. Eine Möglichkeit, die „pädagogische Komponente“ einfließen zu lassen, wäre die Verbesserung der Note in der schriftlichen Arbeit, was er jedoch als ungerecht ablehnt: „Und DA kann man dann schon mal äh aus einer Vier plus eine Drei minus machen oder das umgedreht. Das ist natürlich nicht GERECHT den Anderen gegenüber. (..) Mache ich auch äußerst ungerne!“ (Z. 652-654). Anstelle einer willkürlichen Anhebung der Noten bietet Herr Arnold seinen Schüler_innen lieber die Möglichkeit, die gleiche Arbeit zu einem späteren Zeitpunkt noch mal zu schreiben, wenn die Schüler_innen „sich sicher genug fühlen“: „Dann bekommen sie irgendwann im Laufe der Zeit die Gelegenheit, wenn sie sich sicher genug fühlen/ die sagen das dann so: ‚Ja, jetzt bin ich sicher genug. Jetzt kann ich das alles. Ich habe das nochmal Zuhause geübt.‘ Oder wir haben in den Arbeitsstunden nochmal geübt. Man sieht/ merkt das dann/ in den Arbeitsstunden bin ich ja meistens auch dabei/ dann merkt man das dann schon, ob die das wirklich verstanden haben oder nicht. Und dann schreiben sie die Arbeit nochmal und MEISTENS wird es dann auch besser.“ (Z. 681-686)

Die Kompensationsmöglichkeit besteht hier also nicht in einer großzügigeren Bepunktung und Benotung, vielmehr erfolgt die Leistungsüberprüfung erst zu einem späteren Zeitpunkt und ermöglicht damit einigen Schüler_innen eine längere Übungsphase und einen selbstbestimmteren Lernprozess („jetzt bin ich sicher genug“). Ziel ist hier also nicht die Gleichbehandlung aller Schüler_innen, sondern vielmehr der Ausgleich ungleicher Lernbedingungen durch eine flexiblere Handhabung der schriftlichen Leistungsüberprüfung. Dass alle Schüler_innen die Arbeit schreiben müssen, steht nicht zur Diskussion, es werden keine Alternativen dazu angeboten. Über die Möglichkeit der Wiederholung wird jedoch eine Ausgleichsmöglichkeit geschaffen. Allerdings beschränkt sich

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

573

dieses Angebot von Herrn Arnold auf diejenigen Schüler_innen, die im ersten Versuch eine Fünf oder Vier in der Arbeit erreicht haben. Die Ausgleichsmöglichkeit besteht somit nur für einen Teil der Schüler_innen, diejenigen oberhalb der von ihm gesetzten Notengrenze erhalten keine weitere Gelegenheit zur Verbesserung. Wiederum anders sieht die Strategie von Frau Güngör aus, die an der gleichen Schule wie Herr Arnold Deutsch unterrichtet. Sie berichtet, dass sie ihren Schüler_innen sogenannte individuelle Fehlerschwerpunkte „zubilligt“, bei denen sie weniger streng in den schriftlichen Arbeiten ist: „Also, ähm ich geb/ ich billige den Schülern normalerweise so einen Fehlerschwerpunkt zu, wo ich sage: ‚Das ist einfach der Bereich, an dem Du arbeiten musst.‘ Es gibt Schüler, die kriegen das mit der Groß- und Kleinschreibung auch nach Jahren irgendwie nicht so richtig in den Kopf. Und wenn ich das WEIß, und bis auf DAS sind jetzt nicht auch noch 85.000 Flüchtigkeitsfehler drin. Sondern ich sehe, da ist ein Bemühen da, um eine anständige Rechtschreibung ähm, aber ich weiß eben im Zweifelsfall bei substantivierten Verben leider immer noch nicht, dass die großgeschrieben werden. Dann vermerke ich das, dass da ein/ dass da ein Fehlerschwerp/ also noch ein Übungsschwerpunkt ist. Aber sage, das ist trotzdem eine, eine annehmbare Rechtschreibung.“ (Z. 334-342)

Die „Fehlerschwerpunkte“ können von Schüler_in zu Schüler_in variieren, allerdings mit der Einschränkung, dass die Schüler_innen der Lehrerin gegenüber ein grundsätzliches „Bemühen [...] um eine anständige Rechtschreibung“ zeigen sollen. Fehlerschwerpunkte, die zu einem punktuellen Nicht-Berücksichtigen von Fehlern in der Rechtschreibung bei der Benotung einer Arbeit führen, werden damit nicht grundsätzlich und allen Schüler_innen zugestanden, sondern lediglich denjenigen, die sich ansonsten „bemühen“. Die Schüler_innen müssen sich also durch ihre sonstige Mitarbeit für einen solchen Fehlerschwerpunkt zunächst qualifizieren. Ob und wie weitreichend ein Fehlerschwerpunkt, der mit einer großzügigeren Benotung einhergeht, gewährt wird, verbleibt im Ermessensspielraum der Lehrerin. Interessant ist jedoch die Selbstkorrektur, die Frau Güngör im letzten Satz vornimmt. Aus dem Fehlerschwerpunkt wird hier ein Übungsschwerpunkt, eine Umdeutung des Defizitären zu einer Gelegenheit der Übung und Verbesserung. Auch die Erläuterung gegenüber den fiktiven Schüler_innen von Fehlerschwer-

574

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

punkten als „der Bereich, an dem Du arbeiten musst“ erinnert, wie schon bei Frau Hollerdieck, an eine pädagogische Haltung im Sinne der neuen „Fehlerkultur“ nach Oser und Spychiger (2005). Gleichzeitig finden sich weitere Stellen im Interview, an denen Frau Güngör einerseits eine unterstützende, fördernde Position vertritt (im Gegensatz zu vielen ihrer Kolleg_innen an der Schule, wie sie mehrfach betont), dabei aber ein Mindestmaß an Bemühen und das Zeigen von Anstrengung auf Seiten der Schüler_innen zur Bedingung für ihre Hilfe macht. Frau Güngörs grundsätzlich auf individuelle Förderung und Kompensation ausgerichtete Gerechtigkeitsüberzeugung wird zudem durch Auseinandersetzungen innerhalb des Kollegiums ihrer Schule eingeschränkt. Sie berichtet beispielsweise, dass die Zusammenarbeit im Kollegium „unterschiedlich intensiv“ (Z. 521) sei und sie auch schon die Erfahrung gemacht habe, dass Kolleg_innen ihren Wunsch nach mehr Austausch über bestimmte Schüler_innen aufgefasst hätten „als ob ich ihnen auf die Füße treten wollte“ (Z. 529). Besonders deutlich wird die angespannte Situation an einer Episode, in der sie berichtet, dass es an ihrer Schule sehr selten vorkomme, dass Schüler_innen die Note ‚Sehr gut‘ erhalten würden – und sie selbst aber trotzdem Einsen vergeben würde, „selbst auf dem ZEUGNIS“ (Z. 262) wie sie betont. Dazu der längere Ausschnitt aus dem Interview: „Ähm (.) und uns ganz, ganz schwer, und ich glaube da tun wir uns alle seltsamer Weise so unglaublich schwer damit, ist die Eins. Wann ist etwas wirklich so toll, dass es Eins ist? (...) Obwohl ich da auch schon freigie=giebiger geworden=geworden bin. Also anfangs ist man da sehr zugeknöpft und/ Ich stelle nur fest, dass man zum Beispiel/ Ich habe Schülern auf dem le/ auf dem Zeugnis von Neun nach Zehn, selbst auf dem ZEUGNIS Einsen gegeben. Und auch nicht nur in Kunst, wo jetzt einer brillant malen kann. Sondern es hat zum Beispiel einer von mir in Deutsch eine Eins bekommen. Und dann sind die anderen Kollegen teilweise richtig hämisch: (.) ‚Klar, Eins.‘ und [unverst.] ‚Was hat er denn getan für die Eins?‘ [Interviewerin: Ach, das ist ja interessant. Ja.] Und mmhmmhmm und so, ne? (.) ‚Dann kann der ja besser Deutsch als Du.‘ Und so einen Käse. Diesen ganzen Blödsinn, den wir als Schüler auch so von uns gegeben haben, der kam dann auch. (..) Und dann habe ich gesagt, dass=dass das jemand ist, der meinen Unterricht trägt. Und der den auch VORAN trägt und der den teilweise WEITER trägt als ich ihn angelegt habe und ähm (.), dass ich finde so viel Einsatz für die Sache und so viel Kontinuität und auch so viel Zusätzliches, WELTwis-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

575

sen und=und so. Das muss einfach honoriert werden. Und das ist mehr als nur gut. (.) Ja, das ist ja VIEL mehr als ich erwarten kann. (.) Fanden sie aber trotzdem lächerlich und dann haben sie mir hier sämtliche Arbeitsblätter von dem vorgelegt, auf denen der mal einen Rechtschreibfehler gemacht hat und (.) mir/ um mir zu beweisen, dass der niemals sehr gut ist und so. Und ich habe einfach gedacht: ‚Doch, das ist der.‘ Weil irgendwo benutzen wir diese blöden Ziffern ja auch um die zu vergleichen. Und im Vergleich ist der einfach viel besser als die anderen.“ (Z. 255-276)

Die Reaktionen der Kolleg_innen auf Frau Güngörs Entscheidung einem Schüler eine Eins im Fach Deutsch auf dem Zeugnis zu erteilen, haben mich im Interview sehr überrascht. Frau Güngör selbst bezeichnet die Äußerungen ihrer Kolleg_innen als „Blödsinn, den wir als Schüler auch so von uns gegeben haben“ und disqualifiziert sie damit als Bemerkungen auf dem Niveau unreifer, eventuell neidischer Jugendlicher. Trotzdem stellen sie eine Realität dar auf die Frau Güngör reagieren muss, da es sich eben nicht um irgendwelche Kinder oder Jugendlichen handelt, sondern ihre Kolleg_innen mit denen sie im Zweifel tagein, tagaus in Kontakt steht. Die Ausführlichkeit, mit der Frau Güngör von dieser Episode berichtet und die fast schon entschuldigend hervorgebrachte Begründung der sehr guten Note im Kernfach Deutsch belegen, dass die Beurteilungen nicht nur durch die Lehrerin selbst oder die Aushandlung mit den von ihr beurteilten Schüler_innen legitimiert werden kann. Vielmehr rückt das Urteil des Kollegiums an die Stelle eines MetaAssessments ihrer Beurteilungen und stellt damit auch ihre Beurteilungsfähigkeit in Frage. Wie sind nun diese „richtig hämisch[en]“ Kommentare des Kollegiums zu verstehen? Deutlich wird, dass Frau Güngör offenbar gegen eine implizite schulinterne Übereinkunft verstößt, indem sie die Zeugnisnote Eins (und noch dazu in einem Kernfach) vergeben will. Die Vergabe einer sehr guten Note wird in keinem der anderen nordrhein-westfälischen Interviews so ausführlich begründet und verteidigt, im Gegenteil, dies geschieht eher bei schlechten Noten, die womöglich unangenehme Konsequenzen für die Schüler_innen nach sich ziehen. Deutlich wird, dass die Note ‚Sehr gut‘ offenbar an dieser Schule einen solchen Seltenheitswert besitzt, dass selbst eine ausführliche Begründung seitens Frau Güngörs als Fachlehrerin nicht ausreicht, um die Kolleg_innen vollends von der Richtigkeit der Beurteilung zu überzeu-

576

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

gen. So wird ihre Urteilsfähigkeit dann auch nachträglich noch durch das Vorhalten fehlerhafter Arbeitsblätter des Schülers versucht zu diskreditieren. Frau Güngör begründet die sehr gute Note auch nicht nur auf fachlicher Ebene, sondern hebt die herausragenden Leistungen des Schülers hervor. Diese Auflistung der Leistungen, die eine so besondere Note in Frau Güngörs Augen rechtfertigen („viel Einsatz“, „viel Kontinuität“, „viel Zusätzliches, WELTwissen“), verdeutlicht, dass die Note Eins offenbar nicht allein mit dem für die jeweilige Jahrgangsstufe vorgesehenen Fachwissen erreichbar ist, sondern eine Extraleistung des Schülers erfordert („VIEL mehr als ich erwarten kann“). Abschließend zieht Frau Güngör auch noch die soziale Bezugsnorm heran und betont, dass die Note auch deshalb gerechtfertigt sei, da der Schüler auch im Vergleich zur restlichen Lerngruppe deutlich besser sei („Und im Vergleich ist der einfach viel besser als die anderen“). Besondere Brisanz erhält diese Passage dadurch, dass Frau Güngör an einer Hauptschule unterrichtet, deren Schüler_innen nach ihrem eigenen Bekunden häufig aus schwierigen familiären Verhältnissen stammen und sich neben den schulischen Anforderungen häufig mit ungünstigen Lebenssituationen herumschlagen müssen. Ausgerechnet diesen sozial eher benachteiligten Schüler_innen wird nun aber die Bestätigung und Belohnung ihrer Leistungen in Form von guten und sehr guten Schulnoten nur in Ausnahmefällen zugestanden. Im Weiteren nennt sie noch „Sportskanonen, die uns noch was vormachen können. Ähm, da kapituliert dann der Sportlehrer und gibt eine Eins, ne?“ (Z. 282-284) und „Musiker, die in einer Band spielen oder so, die schaffen auch eine Eins“ (Z. 291-292) als legitime ‚Ausnahmefälle‘ für eine sehr gute Note. Als Begründung für die knapp gehaltenen guten Noten führt sie abschließend noch aus: „es gibt viele Kollegen, die sagen: ‚Wenn ich dem Schüler eine Eins gebe, gestehe ich ein, dass der schlauer ist als ich‘“ (Z. 314-315). Damit skizziert sie eine schulinterne Beurteilungskultur, in der sehr gute Noten als künstlich knapp gehaltenes Gut349 verstanden werden, das fast ausschließlich nur 349

Zum Thema gute Noten als knappes Gut, vgl. auch Deutsch (1979, S. 393-394).

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

577

im Zusammenhang mit einer besonderen Begabung zu erreichen ist. Zudem scheinen ihre Kolleg_innen auch neben den drei klassischen Bezugsnormen (sachlich, individuell, sozial) sich selbst bzw. die Lehrkraft als Maßstab für die Beurteilung von Schüler_innenleistungen heranzuziehen. Auch wenn Frau Güngör betont, dass sie diesen Positionen nicht zustimmt („was ich hanebüchen finde“, Z. 315) und eben auch Einsen im Kernfach Deutsch erteilt, lässt sich erahnen wie stark ihre Beurteilungspraxis auch durch die Überzeugungen ihrer Kolleg_innen und Diskussionen wie die oben geschilderten mitgeprägt sein dürfte. Es kann vermutet werden, dass Ideen zur individuellen Förderung, wie sie Frau Hollerdieck geäußert hat, von Frau Güngör nicht oder nur unter sehr großem Widerstand des Kollegiums eingebracht werden könnten. Ein weiteres Beispiel eingeschränkter kompensatorischer Gerechtigkeitsüberzeugung stellt der folgende Auszug aus dem Interview mit der Realschullehrerin Frau Berkhoff, die die Fächer Deutsch und katholische Religionslehre unterrichtet, dar. Hier sind es weniger die Beziehungskonstellationen im Kollegium als vielmehr ihr Beurteilungs- und Leistungsverständnis und der Blick auf die Schüler_innen, die ein eher eingeschränktes Kompensationsverständnis von Leistungsbeurteilung begründen. Im folgenden Ausschnitt berichtet Frau Berkhoff über ihre Wahrnehmung von und den Umgang mit Lese-RechtschreibSchwierigkeiten bei ihren Schüler_innen: „Wenn jetzt einer sich ähm (.) sprachlich schwer tut, zum Beispiel die LRS-Schüler. Die kommen ja, (.) die tun sich mitunter schon schwer wirklich mal in Deutsch in den Zweierbereich zu kommen. In einer Grammatikarbeit können die das schaffen, wenn die Rechtschreibung nicht zählt. Aber je mehr Text die vorher lesen müssen, umso schwerer fällt denen das. Also werden die in der Regel im Mittelfeld sein. Denn die haben natürlich in einem mündlichen Fach, wenn die gut mitarbeiten, aufpassen ähm (.) auch mitdenken, können die sich ganz gut engagieren und dann stehen die auch mal Zwei oder auch Eins. (.) Also da ist es natürlich leichter jetzt als in Deutsch. (.) Da zählt dann zwar auch das mündliche, aber das zählt ja immer fünfzig Prozent jeweils dann mündlich schriftlich.“ (Z. 244-252)

Frau Berkhoff spricht davon, dass bestimmte Schüler_innen sich „sprachlich schwer tun“ und erkennt damit zu einem gewissen Grad an, dass Schüler_innen mit einer Lese-Rechtschreib-Schwäche Schwierigkei-

578

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

ten bei der Bewältigung von Aufgaben im Unterricht und in Prüfungssituationen haben können. In der Formulierung „die LRS-Schüler“ drückt sich jedoch schon eine starke Generalisierung aus, die für eine eher kollektive Wahrnehmung der Schüler_innen steht. Frau Berkhoff berichtet trotz mehrfacher Aufforderung im Verlauf des Interviews nur an drei Stellen von konkreten Einzelfällen, und dies jeweils nur sehr kurz und in knappen Worten. Das Interview ist stellenweise geprägt von eher stereotypen Vorstellungen und Beschreibungen der Schüler_innen ihrer Schule oder anderer Schulformen, die nur wenige Differenzierungen zulassen und als eher negativ besetzt eingeführt werden (wie bspw. „die sehr Schwachen“, die „ausländischen Schüler“, „Saisonarbeiter“ und „BlauerBrief-Kandidaten“). Die obenstehende Passage macht darüber hinaus deutlich, dass in Frau Berkhoffs Augen die Verantwortung für die Bewältigung der spezifischen Schwierigkeiten bei den Schüler_innen selbst liegt – sie stellt zwar fest, dass Schüler_innen verschiedene Schwierigkeiten haben können, an diese Feststellung werden aber keine Aktivitäten der Lehrerin geknüpft wie in den obigen Beispielen. Auch im restlichen Interview findet sich keine Äußerung, die auf ein Entgegenkommen oder ein Förderangebot durch die Lehrerin schließen lässt. Schüler_innen bewältigen entweder die gestellten Aufgaben oder sie tun dies eben nicht, eine besondere Hilfestellung bei der Bewältigung ist durch die Lehrkraft nicht zu erwarten – obwohl diese erkennt und benennt, dass die schlechteren Ergebnisse in Form von schlechteren Noten auf eine Teilleistungsschwäche zurückzuführen ist („Aber je mehr Text die vorher lesen müssen, umso schwerer fällt denen das.“). Für Frau Berkhoff ergibt sich aus der Feststellung der ‚Teilleistungsschwäche‘ einiger Schüler_innen kein Handlungsbedarf im Sinne besonderer Förderung, vielmehr werden die Schwierigkeiten mit der deutschen Rechtschreibung als unveränderbare, gar natürliche Gegebenheiten betrachtet, die dazu führen, dass die Schüler_innen bezogen auf das Notenspektrum „in der Regel im Mittelfeld sein“ werden. Entwicklungspotenziale spricht sie diesen Schüler_innen damit indirekt ab, eine Verbesserung ihrer Rechtschreibleistungen scheint allein durch das Label „LRS-Schüler“ bereits unmöglich. Kompensieren lassen sich diese ‚Leistungsschwächen‘ ledig-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

579

lich in den sogenannten mündlichen Fächern, in denen die Schüler_innen durch aktive Mitarbeit und das Zeigen von Leistungsbereitschaft die Möglichkeit haben ihre Noten auszugleichen („wenn die gut mitarbeiten, aufpassen ähm (.) auch mitdenken, können die sich ganz gut engagieren und dann stehen die auch mal Zwei oder auch Eins“). Für das Hauptfach Deutsch, in dem die mündlichen und schriftlichen Leistungen jeweils zur Hälfte in die Halbjahresnote eingehen, erhalten die Schüler_innen keine Möglichkeit der Kompensation ihrer durch eine Lese-Rechtschreib-Schwäche bedingten schlechteren Noten. Wie in Kapitel 6.3.1.2 bereits ausgeführt, beruht Frau Berkhoffs Beurteilungspraxis grundsätzlich auch eher auf der Logik mathematisch-rechnerischer Gerechtigkeit und tendiert eher zur sozialen denn zur individuellen Bezugsnorm.350 Eine weitere Parallele zum Umgang mit Lese-RechtschreibSchwächen findet sich in Frau Berkhoffs Umgang mit Schüler_innen, die aufgrund ihres ‚Migrationshintergrundes‘ Schwierigkeiten im Deutschunterricht aufweisen: „Ähm (.) ja, manchmal haben Sie ja auch ausländische Schüler und dann=dann rät man den Eltern: ‚Machen Sie doch jetzt das=und=das, damit er einfach mehr auch in die deutsche Sprache reinkommt und so.‘ Manche nutzen das. (.) Und manche nutzen es aber auch nicht. Aus welchen Gründen auch immer. Und dann find ich ähm (.) da kann man da bei der Note nicht Rücksicht nehmen.“ (Z. 742-745)

Frau Berkhoffs Verantwortung beschränkt sich auf die Feststellung von Unterschieden zur erwarteten Norm („mehr in die Sprache reinkommen“) – die Unterschiedsbearbeitung im Sinne einer Kompensation der ungleichen Lernausgangslagen delegiert sie jedoch aus ihrem Klassenraum hinaus in die Verantwortung der Schüler_innen und deren Eltern. Insofern ist, gerade im Vergleich zu den anderen Beispielen kompensatorischer Gerechtigkeit, im Fall von Frau Berkhoff lediglich von einer

350

Auch verwendet sie die in ihrem Kollegium abgesprochenen Rückmeldebögen und Instrumente formativer Beurteilung eher eigensinnig und ergänzt diese durch mathematische Instrumente, wie die Berechnung eines Fehlerquotienten (vgl. dazu Kap. 6.3.1.2).

580

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

eingeschränkten Kompensation durch Maßnahmen der Leistungsbeurteilung zu sprechen.351 Eine Beurteilungsstrategie, die von verschiedenen Lehrkräften berichtet wird, und sich zumeist auf alle Schüler_innen bezieht, stellt das unterschiedliche Gewichten der beiden Beurteilungsbereiche mündliche und schriftliche Leistungen bei der Erstellung der Zeugnisnoten dar. Dabei können gute mündliche Noten als Ausgleich für schwächere schriftliche Leistungen aufgeführt werden, und vice versa. Die Möglichkeit der Kompensation von sogenannten ‚Teilleistungsschwächen‘352 durch eine stärkere Gewichtung der Noten in einem anderen Leistungsbereich wird von den Lehrkräften dabei jedoch, wie im Beispiel zu den Fehlerschwerpunkten von Frau Güngör, immer auch an die Anstrengungsbereitschaft und das Bemühen der Schüler_innen gekoppelt. Deutlich wird im nordrhein-westfälischen Sample auch ein schulformspezifische Perspektive auf individuelle Förderung, die diese vor allem an Haupt- und Realschulen verortet, den Gymnasien allerdings abspricht: „am Gymnasium ist es eher so diese Friss=oder=Stirb=Mentalität. Entweder du kommst mit oder du lässt es bleiben“ (Frau Dorpenbeck, Z. 773-774). Diese Zuschreibung von außen korrespondiert auch mit einer vor allem bei Gymnasiallehrkräften des Samples vorgefundenen Haltung gegenüber den Instrumenten des Sitzenbleibens und des Schulformwechsels als „Maßnahme[n] der individuellen Förderung“ (Herr Grabenmüller, Z. 614). Frau Pohle-Hanewinkel, eine Deutschlehrerin am Gymnasium, versteht beispielsweise die Versetzung von Schüler_innen nach der Klasse 6 auf die Realschule infolge nicht erwartungskonformer Leistungen als pädagogisches Instrument, mit dem sie die Schüler_innen, aber auch deren Eltern, vor unnötigem „Stress“ bewahren kann:

351

Vgl. hierzu auch die Ausführungen von Maier zum „Nebengütekriterium“ der Testfairness, die ausschließlich mit Beispielen diagnostizierbarer „Teilleistungsstörungen“ gerechtfertigt wird (Maier, 2015). 352 Häufig sind damit Lese-Rechtschreib-Schwächen oder Probleme in einem anderen Teilbereich eines Faches gemeint.

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

581

„Aber ähm eigentlich soll es ja so auch sein, dass nach der Klasse Sechs bei uns die ähm die Gewissheit gegeben wird, auch den Eltern, ähm, dass dann die Schüler hier auch richtig aufgehoben sind. Es soll nicht jedes Jahr so ein=so ein Wackeln und eventuelles äh Sitzenbleiben so äh, ne? Immer auch Stress in die Familie bringen.“ (Z. 139142)

An die Stelle einer individuellen Förderung mittels unterschiedlicher Beurteilungsstrategien innerhalb der Schulform Gymnasium tritt hier der Versuch der optimalen Passung zwischen Schulform und von der Lehrkraft attestierter Leistung(sfähigkeit), um den Eltern und Schüler_innen eine „Gewissheit“ geben zu könne, dass das Kind „richtig aufgehoben“ ist. Im Zweifel müssten Schüler_innen die Schule eher verlassen, um diese Passung an einer anderen Schulform zu finden. Ihr oberstes Ziel beschreibt Frau Pohle-Hanewinkel damit, „dass wir wirklich glückliche, zufriedene Schüler haben, die nicht überfordert sind“ (Z. 149). Deutlich wird hier eine grundsätzliche Befürwortung unterschiedlicher Schulformen und die mit Verweis auf die (zugeschriebene) Leistungsfähigkeit begründete segregierte Beschulung von Schüler_innen, mit der die Lehrerin ihre Schüler_innen vor Überforderung beschützen will.353 Auch Herr Grabenmüller, der im Kapitel zur prozedural-bürokratischen Gerechtigkeitsüberzeugung vorgestellte Mathematiklehrer am Gymnasium, äußert sich ähnlich, wenn er den „Schulformwechsel auch als Maßnahme der individuellen Förderung“ (Z. 604) bezeichnet, die vor allem dann greife, wenn die Schule alle ihr zur Verfügung stehenden Fördermaßnahmen ausgeschöpft habe – eine Haltung, die auch von seiner jungen Kollegin, Frau Lindenau, geteilt wird (vgl. Z. 548-593). Die veränderten gesetzlichen Rahmenbedingungen im Hinblick auf die Versetzung und Maßnahmen der individuellen Förderung auch an Gymnasien werden sehr unterschiedlich aufgenommen bzw. teilweise auch von den Lehr353

Das gegenteilige Bild findet sich in den von Haupt- und Realschullehrkräften geäußerten Bedenken, ob ein_e bestimmte Schüler_in den Wechsel an die nächsthöhere Schulform bewältigen könne. Zaborowski und Breidenstein (2010) verweisen hierbei auf die „Haltekräfte“ der Hauptschule, umgekehrt ließe sich aber mit Blick auf das vorliegende Material auch von den ‚Abstoßungskräften‘ des Gymnasiums sprechen.

582

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

kräften abgelehnt.354 Deutlich wird, dass insbesondere für die Gymnasiallehrkräfte des NRW-Samples damit ein Wechsel der Beurteilungskultur einhergeht, wie im folgenden Auszug aus dem Interview mit Frau Dr. Gröhlich, Deutschlehrerin am Gymnasium, deutlich wird: „Letztendlich haben wir ja jetzt hier auch die glasklare Vorgabe, dass nach Eintritt der Schüler in die Mittelstufe (.) Schulen ja auch nachweisen müssen äh warum ein Schüler letztendlich nicht=nicht schafft. (.) Und ja beweisen muss, und der Lehrer muss nachweisen, dass genügend (.) gefördert wurde. Das ist auf der einen Seite natürlich unangenehm und macht mehr Arbeit. Auf der anderen Seite stützt es die Schüler ganz massiv und äh (.) ja, und letztendlich ist es eine gute Sache.“ (Z. 442-447)

Frau Dr. Gröhlich beschreibt hier wie sich auf der Regularienebene eine Verantwortungsumkehr vollzieht, die sich auf die Beurteilungs- und Förderpraxis in den Schulen auswirkt – und unterschiedlich von den Lehrkräften aufgenommen wird. Mit der Abschaffung des Sitzenbleibens für die Mittelstufe, also die Klassen 7-9 am Gymnasium, soll der Fokus stärker auf einer individuellen Förderung der Schüler_innen liegen. Damit einher geht eine Verantwortungsverschiebung auf die Lehrkräfte, die nun „nachweisen [müssen], dass genügend [.] gefördert wurde“. Damit liegt die Verantwortung für den Lernerfolg nicht mehr allein bei den Schüler_innen (und deren Eltern), sondern auch die Lehrkräfte und ihre Bemühungen um die Schüler_innen rücken stärker in den Fokus. Die Formulierung „beweisen müssen“ erinnert dabei an die Idee der ‚Beweisumkehr‘ aus dem Strafrecht. Frau Dr. Gröhlich macht zudem deutlich, dass diese Beweisführung „natürlich unangenehm“ sei und Mehrarbeit für die Lehrkräfte bedeute, schätzt die Entwicklung insgesamt aber als „gute Sache“ ein, da sie die Schüler_innen „ganz massiv“ unterstütze. 354

König und Drage (2010) konnten zeigen, dass die Sitzenbleiberquote an Schulen höher ist, an denen die Lehrkräfte zu einer externalen Attribuierung neigen – d.h., die Gründe für das Sitzenbleiben in erster Linie bei den Schüler_innen und insbesondere in deren sozialem bzw. familiärem Hintergrund sehen. Dieser Zusammenhang sei bei den Gymnasien deutlich höher als bei den Realschulen oder Hauptschulen (vgl. König & Drage, 2010, S. 99).

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

583

Eine Ausnahme im nordrhein-westfälischen Sample stellt der Gymnasiallehrer Herr Opdenkamp dar, der neben seiner Tätigkeit als Deutschlehrer auch als Beratungslehrer und Koordinator für individuelle Förderung an seiner Schule fungiert. Anders als die anderen Gymnasiallehrkräfte spielt für ihn der Fördergedanke eine zentrale Rolle bei der schulischen Leistungsbeurteilung. Er spricht sich auch für die Berücksichtigung individueller Probleme bei der Beurteilung aus (Z. 266-337), indem beispielsweise Klassenarbeiten weniger stark gewichtet werden, wenn Schüler_innen aktuell eine schwierige häusliche Situation zu bewältigen haben: „Sonst werde ich ja nur der Ausführende, dann wäre ich der Vollstrecker. Und dann habe ich das Selektionsprinzip ja im Grunde nur noch als alleiniges. Was ich ja nicht möchte.“ (Z. 280-282). Ähnlich wie für Frau Hollerdieck hat für ihn die formative Funktion der Lernprozessbegleitung bei der schulischen Leistungsbeurteilung eine herausgehobene Bedeutung: „Bewertung ist IMMER (.) eine vorübergehende Aussage, also ist eher prognostisch. Und muss IMMER mit einer Diagnose/ was heißt muss, SOLLTE, nicht immer, aber sollte häufig, machen wir so, sollte häufig mit einer Diagnose verbunden sein und DANACH mit deutlichen Hinweisen zur Verbesserung, zur Optimierung von Lernen. (.) Ansonsten ist Bewertung nämlich Selektion.“ (Z. 142-146)

Im Vorgespräch zum Interview zeigte sich, dass die individuelle Förderung von Schüler_innen auch der Schulleitung sehr am Herzen liegt, was sich einerseits in der Einrichtung der Funktionsstelle eines Koordinators für eben diese Frage ausdrückt, aber auch in verschiedenen institutionalisierten Unterstützungsangeboten, die die Schule den Schüler_innen anbietet (Förderstunden mit zwei Lehrkräften, Nachhilfe-Tandem, Z. 349-399). Gleichzeitig macht Herr Opdenkamp auch deutlich, dass sein Anspruch „wirklich ALLEN Kindern möglichst dieselben Möglichkeiten [zu] biete[n]“ (Z. 450) in der „jetzigen finanziellen und personellen Situation“ (Z. 455) nur schwer von den Schulen umzusetzen ist.

584

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

Länderübergreifender Vergleich und institutionelle Rahmung Im länderübergreifenden Fallvergleich kann zunächst festgehalten werden, dass die Orientierung an einer kompensatorischen Gerechtigkeitsüberzeugung in Bezug auf die schulische Leistungsbeurteilung in beiden Länderkontexten aus den Lehrer_inneninterviews rekonstruiert werden konnte. Gleichzeitig wird aber auch deutlich, dass die institutionellorganisatorischen Rahmenbedingungen in beiden Kontexten sehr unterschiedlich ausfallen und den Lehrkräften unterschiedlich große Spielräume für kompensatorische oder auf individuelle Förderung ausgerichtete Beurteilungsstrategien zur Verfügung stehen. Wie allerdings auch gezeigt werden konnte, steht die Frage, wie die Lehrkräfte beider Länder ihre jeweiligen Spielräume nutzen, offenbar in engem Zusammenhang mit ihrem jeweiligen professionellen Selbstbild, ihrem Beurteilungsverständnis und den Beziehungskonstellationen innerhalb derer Beurteilungen stattfinden. So konnte gezeigt werden, dass eine nordrheinwestfälische Schulleiterin über deutlich größere pädagogische Spielräume für eine in ihren Augen gerechte, da auf individuelle Lernprozessbegleitung ausgerichtete Leistungsbeurteilung, verfügte (Bsp. Frau Hollerdieck) – ihre Kollegin an einer Hauptschule sich jedoch nur schwer gegenüber den Vorstellungen einer guten Note als knappem Gut in ihrem Kollegium durchsetzen konnte (Bsp. Frau Güngör). Lehrkräfte mit einem eher an gezeigter Leistung orientierten Beurteilungsverständnis hingegen tendieren scheinbar zu eher eingeschränkten Kompensationsmaßnahmen, auch wenn das Kollegium sich in Richtung einer stärker formativen Beurteilungskultur verändern möchte (Bsp. Frau Berkhoff). Aber auch im schwedischen Kontext finden sich individuelle Ausgestaltungen des pädagogischen Spielraums, je nach Beurteilungsverständnis und professionellem Selbstbild. Deutlich wurde, dass im schwedischen Kontext eine grundsätzliche Förderorientierung vorherrscht, die die Unterstützung aller Schüler_innen vorsieht – unabhängig davon, ob und in welcher Art eine Beeinträchtigung vorliegt. Auch in NRW findet sich das Stichwort der individuellen Förderung im Schulgesetz, sowie in der Ausbildungs- und Prüfungsord-

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

585

nung für die Sekundarstufe I, in der ausgeführt wird, dass der Schulunterricht „durch individuelle Förderung als pädagogisches Grundprinzip geprägt“ sei (APO-S I, §3, 1). Gleichzeitig wird deutlich, dass die Gewährung von Nachteilsausgleichen im Sinne kompensatorischer Maßnahmen für Schüler_innen in NRW stärker reguliert und deutlich eingeschränkter möglich ist als im schwedischen Kontext. Einen Nachteilsausgleich bei den zentralen Abschlussprüfungen gibt es offiziell nur für Schüler_innen mit Behinderungen bzw. einem sonderpädagogischen Förderbedarf (vgl. APO-S I, §6, 9). Allerdings besteht dieser Nachteilsausgleich lediglich in einer Verlängerung der Vorbereitungsund/oder Prüfungszeit für die betroffenen Schüler_innen, die „fachlichen Leistungsanforderungen bei Abschlüssen und Berechtigungen bleiben unberührt“ (APO-S I, § 6). In einer Information an die Schulleitungen vom 18.10.2013 wird die Gewährung dieses zeitlichen Nachteilsausgleichs noch ergänzt um den Hinweis, dass eine Verlängerung der Prüfungszeiten nur dann zulässig sei, „wenn diese Form des individuellen Nachteilsausgleichs auch in der bisherigen Förderpraxis für die jeweilige Schülerin oder den jeweiligen Schüler entsprechend dokumentiert worden ist“ (MSW, 18.10.2013). Eine Anpassung der Prüfungsanforderungen wird in keinem Fall als zulässig erachtet, da dies gegen das Gleichbehandlungsgebot verstoßen würde (vgl. MSW, 27.11.2013, S. 4). Wichtig ist hierbei die von der KMK eingeführte Unterscheidung nach „zielgleichem“ und „zieldifferentem“ Lernen und Unterrichten von Schüler_innen mit Beeinträchtigungen.355 Zielgleiches Unterrichten und Lernen zielt auf den Erwerb der regulären Schulabschlüsse ohne Anpassung der Anforderungen ab, zieldifferentes Lernen und Unterrichten ermöglicht die Änderung bzw. Anpassung der Prüfungsanforderungen an den Lern- und Leistungsstand der jeweiligen Schüler_innen, führt dann aber nicht zum Erwerb eines regulären Schulabschlusses mit den daran geknüpften Berechtigungen. Die Thematik des Nachteilsausgleichs wird in Deutschland vor allem deshalb als wichtig angesehen, weil an die Schul355

Ausführlicher zur Frage inklusiver Bildung von Kindern mit Behinderungen, vgl. KMK (2011).

586

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

abschlüsse weitreichende Berechtigungen geknüpft sind, und anders als im schwedischen Kontext, weniger Möglichkeiten der nachträglichen Komplettierung von Zeugnissen oder andere Kompensationsmöglichkeiten existieren. Wie in Kapitel 3.3 bereits herausgearbeitet wurde, ist das schwedische Bildungssystem geprägt von einer Spannung zwischen Förderung durch individualisierte Formen des Unterrichts und der Leistungsbeurteilung (individanpassat undervisning och bedömning) einerseits und der Gewährleistung einer für alle Schüler_innen gleichwertigen Leistungsbeurteilung (likvärdig bedömning) durch zentrale Bildungsstandards und standardisierte Tests andererseits. Im schwedischen Schulgesetz ist die Aufgabe der Schule folgendermaßen definiert: „Allen Kindern und Schüler_innen soll die Anleitung und Stimulanz für ihr Lernen und ihre persönliche Entwicklung gegeben werden, die sie benötigen, um sich ausgehend von ihren eigenen Voraussetzungen so weit wie möglich den Lernzielen entsprechend zu entwickeln“ (Skollag, 2010:800, Kap. 3, §3; Übersetzung K.F.). In den Interviews zeigt sich diese Förderorientierung in der Formulierung „alla ska nå så långt som möjligt“ („alle sollen soweit kommen wie möglich”) mit der die Lehrkräfte darauf verweisen, dass es ihre Aufgabe sei ihre Schüler_innen zu fördern. Im schulischen Alltag gibt es zwei Wege, um die zusätzliche Förderung von Schüler_innen durch institutionelle Hilfsangebote zu ermöglichen: die „zusätzlichen Anpassungen“ (extra anpassningar) und die „besondere Hilfe“ (särskilt stöd). Zusätzliche Anpassungen können z.B. sein: besonders deutliche Aufgabenstellungen, zusätzliche Übungseinheiten (z.B. Lesetraining), Unterstützung beim Verständnis von Texten etc. aber auch zusätzliche Lehr- und Übungsmaterialien und technische Hilfsmittel sowie die zeitweise Zusammenarbeit mit einer Förderlehrkraft (Skolverket, 2014a, S. 22). Sie werden von den einzelnen Lehrkräften und anderem pädagogischen Personal flexibel und unbürokratisch eingesetzt. Besondere Hilfen hingegen erfordern einen offiziellen Beschluss der Schulleitung und die Dokumentation innerhalb eines sogenannten „Aktionsprogramms“ oder „Förderprogramms“ (åtgärdsprogramm). Die Einschätzung des jeweiligen Förderbedarfs erfolgt immer im Hinblick auf die in

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

587

den Lehrplänen definierten Lernziele und die individuelle Situation der Schüler_innen. Die Hilfs- und Förderangebote können sich dabei auf sehr verschiedene potentiell beeinträchtigende Faktoren beziehen, wie aus einer Handreichung von Skolverket von 2014 deutlich wird: „Es kann vorkommen, dass eine Schülerin oder ein Schüler zum jetzigen Zeitpunkt die Mindestanforderungen erreicht, aber andere Schwierigkeiten zeigt, die dazu führen, dass die Schule zu dem Ergebnis kommt, dass der oder die Schüler_in zukünftig Schwierigkeiten bekommen kann, die Mindestanforderungen zu erreichen. Das können zum Beispiel Schüler_innen mit einer Behinderung sein, mit psychosozialen Problemen, psychischen Erkrankungen, Schwierigkeiten in sozialen Zusammenhängen, Konzentrationsschwierigkeiten sowie wiederholtes oder langandauerndes Schwänzen. Auch in diesen Fällen können Schüler_innen einen Bedarf an zusätzlichen Anpassungen oder besonderen Hilfen haben“ (Skolverket, 2014a, S. 12-13, Übersetzung K.F.). Im Vergleich zu den Regularien für NRW kann für den schwedischen Kontext somit ein weiter gefasstes Verständnis von Förderbedarfen festgestellt werden. Während es in NRW stärker auf medizinisch oder anderweitig bestätigte, attestierte Beeinträchtigungen fokussierte Hilfsbzw. Ausgleichsmaßnahmen gibt, zählen in der schwedischen Schule auch Beeinträchtigungen aufgrund psychosozialer Merkmale in den schulischen Aufgabenbereich. Das, was von den befragten Lehrkräften in NRW teilweise als zusätzliche (und belastende) „Sozialarbeit“ bezeichnet wird356, gehört laut den schwedischen Regularien selbstverständlich zu den Aufgabenbereichen von Lehrkräften und anderem pädagogischen Personal. Im Vergleich wird auch ein anderes Zuständigkeitsverständnis für die Behebung von Lernhindernissen von Schüler_innen deutlich. Es ist die Aufgabe der schwedischen Schule, und hier in erster Linie die Aufgabe der Lehrkräfte, sicherzustellen, dass alle Schüler_innen die Bedingungen vorfinden, die sie benötigen, um sich entsprechend den Lehrplanzielen 356

Z.B. Herr Imburg (Realschule), Herr Arnold (Hauptschule), Herr Clemens (Gymnasium), Frau Stakenhues (Realschule), Herr Dabert (Gymnasium).

588

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

entwickeln und lernen zu können. Aus den Regularien geht ganz klar eine Erwartung an die Lehrkräfte hervor, mögliche Schwierigkeiten von Schüler_innen zu identifizieren und entsprechende Unterstützungsmaßnahmen einzuleiten (Skolverket, 2014a, S. 21–23; Skollag, 2010:800, Kap. 3, §§8-12). Auch die schwedische Schulbehörde Skolverket stellt fest, dass „die Schule einen kompensatorischen Auftrag [hat]“ (Skolverket, 2014a, S. 10). Diese Verantwortungsübernahme für die Unterstützung aller Schüler_innen durch die Schule zeigt sich auch darin, dass Eltern und Schüler_innen ein Recht darauf besitzen, diese umfassenden Unterstützungsmaßnahmen einzuklagen (Skollag, 2010:800, Kap. 28, §16).357 Im nordrhein-westfälischen Schulgesetz wiederum findet sich kein solch klares Bekenntnis zu einem kompensatorischen Auftrag der Schule. Hinsichtlich der individuellen Förderung von Schüler_innen kann jedoch im Zuge der verstärkten Umsetzung des Inklusionsgedankens seit 2013 (vgl. Kap. 5.2.2) ein allmähliches Umdenken in Richtung eines stärker auf individuelle Förderung ausgerichteten Schulalltags festgestellt werden. So findet sich beispielsweise in §50 „Versetzung, Förderangebote“ der allgemeine Hinweis darauf, dass „[d]ie Schule [...] ihren Unterricht so zu gestalten [hat] und die Schülerinnen und Schüler so zu fördern [sind], dass die Versetzung der Regelfall ist“ (SchulG NRW, §50, 3). Weiterhin soll Schüler_innen, deren Versetzung in die nächste Klassenstufe gefährdet sei, die „Teilnahme an schulischen Förderangeboten“ ermöglicht werden und eine „individuelle Lern- und Förderempfehlung“ zum Ende des Schuljahres ausgesprochen werden (SchulG NRW, §50, 3). Im Jahr 2014 startete zudem die Initiative „Zukunftsschulen NRW – Netzwerk Lernkultur Individueller Förderung“, deren Ziel der Aufbau regionaler Schulnetzwerke ist, um gemeinsam an Konzepten der individuellen Förderung zu arbeiten und sich gegenseitig bei der Umsetzung zu unterstützen. Wie allerdings diese schulischen Förderangebote konkret aussehen 357

Im Gegensatz dazu gibt es in Schweden keine Möglichkeit für Eltern oder Schüler_innen gegen bereits vergebene Noten und Zeugnisse Einspruch zu erheben (vgl. Kap.5.1.1 sowie 6.3.2.3).

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

589

können, wann Schüler_innen einen Anspruch darauf haben wird nicht weiter ausgeführt, ebenso wenig inwiefern überprüft wird, ob und wie Schulen flächendeckend diesen Anspruch umsetzen. In Bezug auf Schüler_innen mit Lese- oder Rechtschreibschwierigkeiten findet sich in den schwedischen Regularien lediglich der Hinweis, dass Schüler_innen individuelle Nachteilsausgleiche beim Absolvieren der landesweiten Tests in Klasse 3, 6 und 9 erhalten können. Diese können eine verlängerte Bearbeitungszeit, das Aufteilen der Tests auf mehrere Testtermine oder die Unterstützung durch eine sonderpädagogische Fachkraft, die bspw. die Testaufgaben vorliest, beinhalten (Skolverket, 2015c). Diese Tests fungieren jedoch nicht als Abschlussprüfungen wie im deutschen Fall. Sie dienen zwar der Überprüfung und Rückmeldung des Leistungsniveaus gemessen an den in den Lehrplänen definierten Kompetenzen und können beim Erstellen der abschließenden Zeugnisnoten berücksichtigt werden, sind aber nicht als Äquivalent zu den Zentralen Prüfungen in NRW zu verstehen (wie in Kap. 5.1 bereits ausgeführt). Im Gegensatz zu dem sehr weit gefassten Verständnis von Unterstützung und Hilfestellung im schwedischen Kontext berichten die befragten Lehrkräfte aus NRW häufig nur im Zusammenhang mit ärztlich attestierten Diagnosen, wie Dyslexie, Lese-Rechtschreib-Schwäche oder Dyskalkulie, davon, dass Schüler_innen einen speziellen Nachteilsausgleich bei der Leistungsüberprüfung erhalten können. Hilfestellungen für Schüler_innen im Sinne individueller Förderung werden häufig nicht als grundsätzliche Möglichkeit für oder legitimer Anspruch von Schüler_innen verstanden, sondern lediglich beim Nachweis einer amtlich beglaubigten Hilfsbedürftigkeit zugestanden. Vor diesem Hintergrund müssen die in diesem Kapitel präsentierten Interviewausschnitte als durch die bereits in den Regularien eingelassenen Gerechtigkeitsnormen geprägt gelesen werden. Wie jedoch bereits in den vorangegangenen Kapiteln gezeigt werden konnte, sind ebenso davon abweichende Überzeugungen aus den Interviews rekonstruierbar. Für die hier stellvertretend zitierten Lehrkräfte spielt die dargelegte Orientierung an den individuellen Bedürfnissen der Schüler_innen und daraus abgeleitete Fokus-

590

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

sierung auf Förder- und Unterstützungsmaßnahmen jedoch eine herausgehobene Rolle. Darüber hinaus lassen sich zusammenfassend folgende Bedingungen herausheben, unter denen die befragten Lehrkräfte eine eher kompensatorische Gerechtigkeitsüberzeugung vertreten bzw. ihnen diese ermöglicht wird: Erstens, die Lehrkraft verfügt über ein professionelles Selbstverständnis als Lernbegleiter_in, deren Aufgabe die individuelle Förderung der einzelnen Schüler_innen ist. In den Interviews fanden sich hierfür synonyme Selbstbeschreibungen als „Pädagogin“ (Karolina), „Begleiter“ und „Coach“ (Frau Hollerdieck). Die Lehrkräfte weisen ein hohes Verantwortungsgefühl für den Schulerfolg ihrer Schüler_innen auf, teilweise führt dieses sogar zur gemeinsamen Erbringung von Schüler_innenleistungen (Bsp. Lisbeth). In NRW verdeutlichte sich die Verantwortungsübernahme in der Idee einer „Holschuld“ der Lehrkräfte (gegenüber einer als „Bringschuld“ der Schüler_innen bezeichneten Haltung), gleichzeitig wurden schulformspezifische Unterschiede in der Ausprägung der Verantwortungsübernahme deutlich. Die schwedischen Lehrkräfte verwiesen immer wieder auf ihren Auftrag zur individuellen Förderung, den sie aus den im Lehrplan formulierten Zielen der Individualisierung und kompensatorischen Funktion von Schule ableiteten. Zweitens, erweist sich ein Beurteilungsverständnis im Sinne einer formativen Leistungsbeurteilung als fördernde Bedingung kompensatorischer Gerechtigkeit. Leistungsbeurteilung wird hier als fortlaufende und individuelle Unterstützung des Lernprozesses verstanden, weniger als punktuelle Leistungsmessung. Individuelle Förderung und die schulische Leistungsbeurteilung werden als miteinander verzahnte Elemente verstanden, ebenso wie Unterrichtsplanung und individuelle Förderung. Die Lehrkräfte greifen auf einen erweiterten Leistungsbegriff zurück, bei dem auch Aspekte wie Bemühen und Anstrengung gewürdigt und kleinere Lernfortschritte hervorgehoben werden sollen. Die individuelle Bezugsnorm stellt die wichtigste Messlatte bei der Leistungsbeurteilung dar (Lisbeth), aber auch die kriteriale Bezugsnorm findet sich wieder. Letztere jedoch als diagnostisch gedeuteter Beurteilungsmaßstab, indem

Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

591

Lernziele oder Bildungsstandards als Ausgangspunkt für weiterreichende Förderung betrachtet werden (Frau Hollerdieck). Im Hinblick auf die Beziehungskonstellationen lässt sich, drittens, eine Tendenz zu eher persönlichen, engen Beziehungen zwischen Lehrkräften und ihren Schüler_innen erkennen, die als Voraussetzung für eine gerechte Beurteilung angesehen werden. Die Lehrkräfte betonen, dass es wichtig sei, die Schüler_innen auch persönlich zu ‚kennen‘, um sie individuell fördern und sich im Unterricht auf sie einstellen zu können. Gleichzeitig wird deutlich, dass die Voraussetzung für individuelle Förderung auch die Mitarbeit der Schüler_innen ist: wenn Schüler_innen die ihnen gebotenen Lernmöglichkeiten nicht nutzen (können oder wollen), stoßen die Förderbemühungen der Lehrkräfte an ihre Grenzen. Eine eher kollektivierende Wahrnehmung von Schüler_innen und distanziertere Beziehungsgestaltung schränken die kompensatorische Gerechtigkeitsüberzeugung eher ein (Frau Berkhoff). Im Hinblick auf die Beziehungskonstellationen im Kollegium wurde deutlich, dass im nordrheinwestfälischen Kontext die herausgehobene Position als Schulleitung die Spielräume zur Umsetzung einer kompensatorischen Gerechtigkeitsüberzeugung erweitert. Gleichzeitig zeigte sich, dass Kolleg_innen, die eher ablehnend gegenüber individueller Förderung und kompensatorischen Maßnahmen eingestellt sind, die Förderbemühungen sowohl der Schulleiterin als auch ‚einfacher‘ Lehrerinnen einschränken können. Eine kollegial geteilte Haltung gegenüber formativen Beurteilungsstrategien führt demgegenüber nur begrenzt zur Veränderung eigener Beurteilungsmuster, wie am Beispiel von Frau Berkhoff deutlich wurde. Die institutionell-organisatorischen Rahmenbedingungen können, viertens, sowohl als hemmende als auch als fördernde Bedingungen für kompensatorische Gerechtigkeitsüberzeugungen und damit zusammenhängende Beurteilungsstrategien identifiziert werden. Insbesondere im Hinblick auf die von den nordrhein-westfälischen Lehrkräften berichteten Rahmenbedingungen wird deutlich, dass eine gewisse zeitliche Flexibilität notwendig für individuell abgestimmte Lern- und Beurteilungssettings wäre, ebenso wie zusätzliche Ressourcen personeller, finanzieller und räumlicher Art, um weiterreichende kompensatorische Maß-

592

6 Empirische Rekonstruktion der Gerechtigkeitsüberzeugungen

nahmen zu ermöglichen. Der klaren Ausrichtung der schwedischen Schule auf einen kompensatorischen Förderauftrag für alle Schüler_innen, stehen mehrere weniger auf Kompensation und Hilfestellung ausgerichtete Schulformen in NRW gegenüber, die die Schüler_innen und deren Eltern stärker in die Pflicht nehmen. Für individuelle Fördermaßnahmen, jenseits von diagnostizierten Teilleistungsschwächen, finden sich für Lehrkräfte in NRW nur innerhalb der eng abgesteckten regulativen Grenzen Ausgleichsmöglichkeiten, indem sie beispielweise die Gewichtung der zwei Beurteilungsbereiche (mündlich – schriftlich) kompensatorisch anwenden.

7 Fazit und Ausblick Die Ausgangsfragen für diese Untersuchung lauteten, erstens, welche Gerechtigkeitsüberzeugungen in Bezug auf die schulische Leistungsbeurteilung Lehrkräfte haben, zweitens, welche Strategien sie anwenden, um eine in ihren Augen gerechte Leistungsbeurteilung herzustellen und drittens, ob und, wenn ja, inwiefern sich diese Überzeugungen und Strategien zwischen Lehrkräften in verschiedenen Bildungssystemen unterscheiden (vgl. Kap. 1). In der vorliegenden Arbeit wurden dafür Lehrkräfte aus Schweden und Deutschland, konkreter Nordrhein-Westfalen, befragt, um das komplexe Wechselspiel aus institutionell eingeschriebenen Gerechtigkeitsnormen, situativ-kontingenten Handlungsroutinen und individuellen Überzeugungen hinsichtlich der schulischen Leistungsbeurteilung zu analysieren. In beiden Ländern unterliegt die schulische Leistungsbeurteilung hauptsächlich der Verantwortung der Lehrkräfte, in Schweden treten allerdings zur Sicherstellung eines gleichwertigen Beurteilungsniveaus standardisierte Tests (nationella prov) hinzu. In Deutschland spielen aufgrund der selektiven Grundstruktur des Bildungssystems Zensuren und Zeugnisse wiederum eine größere Rolle für Übergangsfragen – z.B. in die nächsthöhere Jahrgangsstufe oder verschiedene weiterführende Schulformen – als im schwedischen Kontext. Bezogen auf die alltägliche Beurteilung findet sich in den schwedischen Regularien eine klare Orientierung auf formative Beurteilung sowie die kriteriale Bezugsnorm bei der summativen Beurteilung am Ende des Schuljahres, wohingegen in den deutschen Regularien weitestgehend offenbleibt, welche Bezugsnorm Lehrkräfte bei der Beurteilung anlegen sollen. Diese und weitere institutionelle Rahmenbedingungen wurden in Kapitel 5 ausführlich dargestellt und hinsichtlich der darin eingelassenen Gerechtigkeitsnormen beleuchtet. Gerechtigkeitsüberzeugungen werden in dieser Arbeit im Anschluss an die Forschung zu teacher beliefs als Teil von berufsbezogenen, handlungsleitenden Überzeugungen entworfen (Reusser et al., 2011; vgl. Kap. © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 K. Falkenberg, Gerechtigkeitsüberzeugungen bei der Leistungsbeurteilung, https://doi.org/10.1007/978-3-658-28275-2_7

594

7 Fazit und Ausblick

2.4). Um diese teilweise latenten Sinnbestände zugänglich zu machen, wurde ein qualitativ-rekonstruktiver Ansatz gewählt und Lehrkräfte mithilfe episodischer Interviews, die nah an den beruflichen Erfahrungen ansetzen, befragt (vgl. Kap. 3.2). Die befragten Lehrkräfte beider Länder werden dabei nicht im Sinne von biographischen Einzelfallanalysen in ihrer jeweiligen Singularität betrachtet. Sie treten vielmehr als Repräsentanten überindividuell existierender kollektiver Überzeugungsmuster auf, als Vertreter_innen einer Berufsgruppe, die über ein gemeinsames „soziales Wissen“ (Flick, 1995, S. 13) verfügen (vgl. Kap. 3.2). Als zusätzliche Datenquellen für die Analyse dienten rechtliche Vorgaben und Regularien sowie Beurteilungsmaterialien, die von den Lehrkräften zum Interview mitgebracht wurden. Durch die Orientierung an der Grounded Theory Methodologie (GTM) wurde der Forschungsprozess dergestalt strukturiert, dass eine Annäherung an das interessierende Phänomen der Gerechtigkeitsüberzeugungen über mehrere Erhebungs- und Auswertungswellen im Zeitraum von 2011 bis 2016 möglich wurde. Der iterative Forschungsprozess wurde dabei durch eine schrittweise Entwicklung von Hypothesen und neuen forschungsleitenden Fragen aus dem bereits erhobenen Material sowie daran anschließende erneute Suchbewegungen im Feld geprägt (vgl. Kap. 3 und 4). Die Verbindung aus GTM und Vergleichender Erziehungswissenschaft erwies sich dabei als äußerst fruchtbare methodologische Erweiterung auf unterschiedlichen Ebenen: Zum einen konnte durch die materialnahe, kleinschrittige Auswertung sowie permanente fallinterne und fallübergreifende Vergleiche immer wieder die Rückkehr zu einer offenen und gegenstandzentrierten Haltung gegenüber dem Material und einem Fokus auf das Phänomen ‚gerechter Leistungsbeurteilung‘ erfolgen. Ein vorschnelles Erklären von vorgefundenen Unterschieden durch ‚kulturelle‘ Faktoren wurde so erschwert und die Analyseperspektive von der Deskription hin zur „Relationierung von Relationen“ (Schriewer, 2006, S. 310) erweitert. Durch die fortlaufenden Vergleichsprozesse über den gesamten Materialkorpus hinweg konnte so auch ein gemeinsamer „Denkraum“ (Matthes, 1992, S. 96) geschaffen werden, der gleichzeitig einer zu starken Exotisierung des

7 Fazit und Ausblick

595

schwedischen Kontexts entgegenwirkte und eine nostrifizierende Überhöhung des (vermeintlich) bekannten nordrhein-westfälischen Kontexts erschwerte. In Kapitel 3.1.4 habe ich weiterhin die methodologischen Parallelen des für vergleichende Untersuchungen zentralen tertium comparationis und der Kernkategorie einer grounded theory erläutert und dabei die Vorläufigkeit und Prozesshaftigkeit beider bestimmt. Zentrales Ergebnis dieser Untersuchung sind die Kernkategorie Gerechte Leistungsbeurteilung als Balanceakt und die darauf aufbauende gegenstandsverankerte Theorie, deren sukzessive Entwicklung mittels zahlreicher Kodier- und Vergleichsprozeduren in den Kapiteln 6.1 und 6.2 dargelegt wurde. Die Kernkategorie wurde, ebenso wie die weiteren zentralen Kategorien der Theorie, nicht durch länderspezifische Analysen gewonnen, sondern vielmehr im permanenten Vergleich über den gesamten Materialkorpus hinweg entwickelt (vgl. hierzu auch Falkenberg, 2018). In den vier aus der Analyse gewonnenen Gerechtigkeitsüberzeugungen – mathematisch-rechnerisch, prozedural-bürokratisch, diskursiv-interaktiv und kompensatorisch – zeigen sich die in der Kernkategorie benannten Balanceakte, die Lehrkräfte vollführen, um eine in ihren Augen gerechte Beurteilung zu ermöglichen. Sie sind, wie in Kapitel 6.3 erläutert, als Idealtypen im Weber’schen Sinne zu verstehen, als analytische Hilfsmittel, um der empirisch vorfindlichen Vielfalt strukturierend gegenüberzutreten. Gleichzeitig demonstrieren sie den analytischen Mehrwert einer an der GTM orientierten vergleichenden Forschung, da in ihnen deutlich wird, dass die Unterschiede zwischen verschiedenen Lehrkräften hinsichtlich ihrer Gerechtigkeitsüberzeugungen nicht zwangsläufig entlang von Ländergrenzen verlaufen bzw. auf das jeweilige Bildungssystem zurückzuführen sind. Vielmehr finden sich für das gesamte Sample übergreifende Strukturierungskategorien (im Theoriemodell in Abb. 17 als intervenierende Bedingungen bezeichnet), wie das professionelle Selbstbild, die Beziehungskonstellationen und das Beurteilungsverständnis, die im Wechselspiel mit verschiedenen institutionellen Rahmungen eine spezifische Gerechtigkeitsüberzeugung begünstigen.

596

7 Fazit und Ausblick

Im Folgenden wird zunächst die gegenstandsverankerte Theorie zum Phänomen gerechter Leistungsbeurteilung abschließend diskutiert (Kap. 7.1), um anschließend die rekonstruierten Gerechtigkeitsüberzeugungen vergleichend zusammenzufassen (Kap. 7.2). Das Kapitel endet mit einem kritischen Blick auf die Limitationen dieser Studie und einem Ausblick auf mögliche weiterführende Forschungen (Kap. 7.3). 7.1 Diskussion der gegenstandsverankerten Theorie zum Phänomen gerechter Leistungsbeurteilung Die in dieser Arbeit entwickelte gegenstandsverankerte Theorie zum Phänomen gerechter Leistungsbeurteilung wurde einführend bereits in Kapitel 6.1 dargestellt und soll an dieser Stelle abschließend diskutiert werden. Dafür werden zunächst die Bedingungsgefüge um die entwickelte Kernkategorie beschrieben, aus denen ein Modell der gegenstandsverankerten Theorie entwickelt wurde (vgl. Abb. 17). Die im länder- und fallübergreifenden Vergleich herausgearbeiteten Gerechtigkeitsüberzeugungen, in denen die in der Kernkategorie benannten Balanceakte deutlich werden, stellen den Kern dieser Theorie dar, weshalb sie im Anschluss noch einmal kontrastierend verglichen werden. Die gegenstandsverankerte Theorie lässt sich folgendermaßen zusammenfassen: Ausgehend von der Feststellung, dass die schulische Leistungsbeurteilung eine der Kernaufgaben von Lehrkräften ist und diese Aufgabe durch zum Teil widersprüchliche Anforderungen geprägt ist, ergibt sich ein Handlungsdruck für Lehrkräfte zu dem sie sich verhalten müssen (ursächliche Bedingung). Die institutionellen Rahmenbedingungen der schulischen Leistungsbeurteilung wirken als äußere Erwartungen und bilden zusammen mit den konkreten Beurteilungssituationen den Handlungskontext (kontextuelle Bedingungen). Neben den Kontextbedingungen wirken das professionelle Selbstbild der Lehrkräfte, ihr spezifisches Beurteilungsverständnis sowie die Beziehungskonstellationen, in die sie eingebettet sind und die sie aufbauen, als intervenierende Bedingungen auf die Gerechtigkeitsüberzeugungen und Beurteilungsstrategien ein.

Diskussion der gegenstandsverankerten Theorie

597

Aus diesen Bedingungsgefügen ergibt sich die grundlegende Charakterisierung einer gerechten Leistungsbeurteilung als Balanceakt (Kernkategorie). Das Bild des Balanceaktes bezieht sich dabei auf das aktive Ausgleichen, Aushandeln und Handhabbar-Machen der verschiedenen Erwartungen an die Leistungsbeurteilung durch die Lehrkräfte, sprich den Prozess der Herstellung gerechter Leistungsbeurteilung unter Anwendung verschiedener Beurteilungsstrategien. Gleichzeitig wird das Ergebnis dieses Herstellungsprozesses – die als gerecht empfundene Beurteilung – wiederum unter Rückgriff auf unterschiedliche Legitimationsquellen als gerecht oder ungerecht beurteilt, als legitime oder illegitime pädagogische Praxis kategorisiert. Das Ergebnis ‚gerechte Beurteilung‘ ist jedoch flüchtig und muss immer wieder aufs Neue hergestellt, ausgehandelt und erarbeitet werden, weshalb das Bild des Balanceakts sowohl als Prozess- als auch als Zustandsmetapher verstanden werden muss. Dieser Balanceakt wird unter Rückgriff auf verschiedene Gerechtigkeitsüberzeugungen (mathematisch-rechnerisch, prozedural-bürokratisch, diskursiv-interaktiv, kompensatorisch) und durch verschiedene Beurteilungsstrategien von den Lehrkräften bewältigt, die sich auf unterschiedliche Legitimationsquellen stützen und in Abhängigkeit zu den kontextuellen und intervenierenden Bedingungen stehen. Die gewählten Beurteilungsstrategien führen damit eine in den Augen der einzelnen Lehrkraft gerechte(re) Leistungsbeurteilung herbei, ermöglichen die (Wieder)Herstellung ihrer Handlungsfähigkeit und legitimieren so ihre Beurteilungspraxis (Konsequenzen). Abbildung 17 verdeutlicht das Modell der gegenstandsverankerten Theorie gerechter Leistungsbeurteilung noch einmal.

598

7 Fazit und Ausblick

Ursächliche Bedingung

(Gerechte) Leistungsbeurteilung als Kernaufgabe und antinomische Herausforderung professionellen Handelns von Lehrkräften

Kontextbedingungen

Institutionelle Rahmung und Gerechtigkeitsnormen

Intervenierende Bedingungen

Kernkategorie Gerechtigkeitsüberzeugungen und Beurteilungsstrategien

Konsequenzen

Professionelles Selbstverständnis

Beurteilungssituationen

Beurteilungsverständnis

Beziehungskonstellationen

Gerechte Leistungsbeurteilung als Balanceakt Mathematisch-rechnerisch Prozedural-bürokratisch Diskursiv-interaktiv Kompensatorisch

Erfahrung der (Un-)Möglichkeit gerechter Leistungsbeurteilung, Legitimität eigener Beurteilungspraxis und Handlungsfähigkeit

Abb. 17 – Modell der gegenstandsverankerten Theorie zum Phänomen gerechter Leistungsbeurteilung

Einschränkend muss jedoch betont werden, dass die strikte Unterscheidung in Kontextbedingungen und intervenierende Bedingungen, wie sie im Kodierparadigma von Strauss und Corbin (1996) vorgenommen wird, für diese Untersuchung teilweise nicht aufrechterhalten werden kann. Wie Strübing (2008, S. 29f) allerdings bemerkt, ist diese Trennung teilweise auch schon unscharf im Kodierparadigma von Strauss und Corbin angelegt (vgl. Kap. 6.2). In der vorliegenden Untersuchung zeigt sich diese Unschärfe besonders an der Rolle der als kontextuellen Bedingungen gefassten institutionellen Rahmenbedingungen innerhalb der Beurteilungssysteme, die – je nach Gerechtigkeitsüberzeugung – auch als intervenierende Bedingungen auftreten können. Dies wird insbesondere

Diskussion der gegenstandsverankerten Theorie

599

am Beispiel der nordrhein-westfälischen Lehrkräfte mit einer kompensatorischen Gerechtigkeitsüberzeugung deutlich, die aufzeigen, dass und wie spezifische institutionell-organisatorische Rahmenbedingungen (z.B. Sitzenbleiben, Jahrgangsklassen, zentrale Prüfungen) ihre kompensatorische Beurteilungspraxis einschränken und so die Umsetzung ihrer Überzeugungen hemmen. Deutlich wurde auch, dass die offiziellen Regularien zur schulischen Leistungsbeurteilung zwar eine wichtige Rahmung des Beurteilungshandelns darstellen, gleichzeitig sind sie aber nicht als präskriptiv für dieses zu verstehen. Vielmehr stellen sie einen Möglichkeitsrahmen dessen dar, was überhaupt von Lehrkräften innerhalb eines regulativen Rahmens als ‚gerecht‘ gedacht werden kann. Die unterschiedliche Interpretation der gesetzlichen Vorgaben und Regularien zeigt sich in der in Kapitel 6.3 skizzierten Bandbreite an Beurteilungsstrategien und damit verbundenen Gerechtigkeitsüberzeugungen. Es wird deutlich, dass die institutionelle Rahmung im Beurteilungsalltag genau das bleibt: eine Rahmung. Die konkrete Ausgestaltung dieser Rahmung variiert situativ und die Nutzung bzw. Nicht-Nutzung der darin eingelassenen Handlungsspielräume wird von den verschiedenen Lehrkräften sehr unterschiedlich legitimiert. Teilweise wird so ein direkter Verstoß unter Rückgriff auf die ‚pädagogische Freiheit‘ legitimiert (z.B. bei der Anwendung der Mittelwertberechnung bei der Zeugnisnotenerstellung) – in den meisten Fällen wird der gegebene Rahmen aber nur unterschiedlich weit ausgedehnt und verschiedene Legitimationsquellen genutzt, um ein konkretes Beurteilungshandeln zu erklären. Die Kernkategorie Gerechte Leistungsbeurteilung als Balanceakt hat sich als analytischer Fixpunkt als äußerst fruchtbar erwiesen, da sich in ihr das Wechselspiel aus institutionell eingeschriebenen Gerechtigkeitsnormen, situativ-kontingenten Handlungsroutinen und individuellen Haltungen gegenüber schulischer Leistungsbeurteilung und ihren gesellschaftlichen wie pädagogischen Funktionen verbindet und abbilden lässt. Die Kernkategorie ist dabei nicht schulfachspezifisch determiniert, auch wenn die rekonstruierten Gerechtigkeitsüberzeugungen teilweise fächerspezifische Besonderheiten aufzeigen. Sie ist ebenso wenig län-

600

7 Fazit und Ausblick

derspezifisch oder schulformspezifisch zu verstehen, sondern muss vielmehr als übergreifende Beschreibung des Kernprozesses der Beurteilung verstanden werden. 7.2 Vier Muster von Gerechtigkeitsüberzeugungen – Grenzziehungen und Überschneidungsbereiche Die vier in dieser Arbeit rekonstruierten Gerechtigkeitsüberzeugungen von Lehrkräften hinsichtlich der schulischen Leistungsbeurteilung lassen sich anhand dreier Vergleichsdimensionen analytisch differenzieren, die im obigen Modell als intervenierende Bedingungen eingeführt wurden. Diese sind das professionelle Selbstbild der Lehrkräfte, die Beziehungskonstellationen in die die schulische Leistungsbeurteilung eingebettet ist sowie das jeweilige Beurteilungsverständnis. Im Folgenden werden die vier herausgearbeiteten Gerechtigkeitsüberzeugungen anhand dieser drei Vergleichsdimensionen zusammengefasst. Für die mathematisch-rechnerische Gerechtigkeitsüberzeugung lässt sich ein professionelles Selbstbild als Wissen vermittelnde Fachlehrkraft festhalten, für die die primäre Aufgabe der schulischen Leistungsbeurteilung im Feststellen eines Leistungsstands im Sinne einer Leistungsmessung darstellt. Bevorzugtes Instrument hierfür sind schriftliche Arbeiten, denen eine größere Validität gegenüber anderen Formen der Leistungsbeurteilung zugestanden wird. Der Beurteilungsprozess wird als Abfolge mathematischer Teilschritte beschrieben, bei denen zunächst Leistungen in Punkte und anschließend Punktwerte in Noten transferiert werden. Das anschließende Einsortieren von Leistungen bzw. Schüler_innen auf einer Notenskala schließt diesen Prozess ab, wobei eine implizite Orientierung an der Normalverteilung und der Herstellung von in diesem Sinne ‚unauffälligen‘ Noten auffällt. Die nachträgliche Anpassung von Bepunktungsrastern und Notenschlüsseln an ein erwartetes Ergebnis wird dabei von den nordrhein-westfälischen Lehrkräften unter Rückgriff auf ihre pädagogische Freiheit legitimiert. Die potentielle Willkürlichkeit schulischer Leistungsbeurteilungen wird so auch einerseits thematisiert,

Vier Muster von Gerechtigkeitsüberzeugungen

601

gleichzeitig aber durch die Anwendung eines für alle Schüler_innen gleichermaßen angewandten Beurteilungsmaßstabs wieder verworfen. Mit dem Fokus auf die Sortierung auf der Notenskala einher geht auch ein eher statischer Leistungsbegriff, der Schüler_innen ein Fähigkeitsbild zuschreibt und nur wenige Entwicklungsmöglichkeiten erlaubt („Dreierkandidat“)358. Dieser statische Leistungsbegriff korrespondiert ebenfalls mit einem summativen Beurteilungsverständnis, bei dem vor allem auf das Abprüfen eines Lernergebnis fokussiert und den Schüler_innen eine gewisse „Bringschuld“ übertragen wird. Eine lernprozessbegleitende Anwendung von Rückmeldungen wird hingegen nicht erwähnt, die berichteten Beurteilungsgespräche informieren hauptsächlich über bereits getroffene Beurteilungen. Insbesondere die nordrhein-westfälischen Lehrkräfte berichten von der Orientierung an einer sozialen Bezugsnorm, diese wird wiederum von den schwedischen Lehrkräften als illegitim abgelehnt. Hinsichtlich der Beziehungskonstellationen mit Schüler_innen kann für die nordrhein-westfälischen Lehrkräfte eine Fokussierung auf Klassenebene, weniger stark auf individuelle Schüler_innen festgestellt werden. Die einzelnen Schüler_innen, ihr Lernprozess und ihre individuelle Situation tauchen in den Erzählungen selten auf, die Wahrnehmung der Schüler_innen erfolgt insgesamt eher kollektivierend als gesamte Lerngruppe oder als in sich homogene (Leistungs-)Gruppen im oberen, mittleren und unteren Leistungsbereich. Hinsichtlich der Beziehungskonstellationen im Kollegium lässt sich kontextübergreifend eine Tendenz zum ‚Einzelkämpfertum‘ feststellen mit vergleichsweise wenig Austausch im Kollegium. Wie in Kapitel 6.3.1.2 deutlich wurde, ließ sich die mathematisch-rechnerische Gerechtigkeitsüberzeugung insbesondere bei den nordrhein-westfälischen Lehrkräften rekonstruieren, im schwedischen Sample traten diese Orientierungen vor allem ex negativo auf, d.h. die befragten schwedischen Lehrkräfte distanzierten sich beispielsweise von Praktiken der Bepunktung und Mittelwertbildung bzw. charakterisierten diese als überholt und ungerecht. Dies lässt sich u.a. durch die klare Ablehnung einer an der Normalverteilung oder sozia358

Interviewzitate werden durch Kursivierung und Anführungszeichen markiert.

602

7 Fazit und Ausblick

len Bezugsnorm ausgerichteten Beurteilung in den schwedischen Regularien seit der Einführung eines kriterienorientierten Beurteilungssystems Mitte der 1990er Jahre erklären, aber auch schlicht durch die nichtnumerische Notenskala von A bis F. In den nordrhein-westfälischen Regularien wiederum werden zahlreiche Vorgaben quantifizierender Art (z.B. zur Anzahl der Klassenarbeiten pro Halbjahr) gemacht, die einen Fokus auf die schiere Anzahl von zu produzierenden Noten begünstigen. Gleichzeitig ist die Durchschnittsberechnung, wie beim Abiturdurchschnitt, gängige Praxis. Für die prozedural-bürokratische Gerechtigkeitsüberzeugung stellt der Aspekt der Belegbarkeit einer Beurteilung in ihren Einzelschritten ein übergreifendes Motiv dar. Das professionelle Selbstbild entspricht einer Expertenrolle, die mit einem großen Vertrauen in die eigene Beurteilungskompetenz und die gewählten Beurteilungsverfahren einhergeht. Diese Verfahren dienen zugleich der Objektivierung und Entpersonalisierung des Beurteilungsprozesses, der Verweis auf die Einhaltung rechtlicher Regelungen legitimiert diese zusätzlich. Insbesondere bei den nordrhein-westfälischen Lehrkräften verband sich hiermit auch ein Selbstbild als ‚Unterrichtsbeamte‘, die ihre „Dienstpflicht“ erfüllen. Das Beurteilungsverständnis zeichnet sich durch eine Orientierung an schriftlichen Arbeiten einerseits und der möglichst detaillierten Dokumentation mündlicher Leistungen andererseits aus. Eine gerechte Beurteilung wird hier vor allem durch die Zerlegung des Beurteilungsprozesses in viele kleine Einzelteile, die dann wiederum eine möglichst genaue und objektive Beurteilung ermöglichen sollen. Für die nordrhein-westfälischen Lehrkräfte wird eine Tendenz zur Dokumentation als Rechenschaftslegung deutlich, die sich aus der rechtlichen Anfechtbarkeit von Beurteilungen erklären lässt. Demgegenüber fehlen juristische Anfechtungsmöglichkeiten von Noten und Zeugnissen im schwedischen Kontext vollständig, hier scheint vielmehr der Anspruch einer umfassenden Beurteilung, die alle zugänglichen Informationen einbezieht, eine Erklärung für die kleinteilige Dokumentationspraxis zu liefern. Eine formative Lernprozessbegleitung mittels verschiedener Rückmelde- und Beurteilungsfor-

Vier Muster von Gerechtigkeitsüberzeugungen

603

men wird hingegen nur eingeschränkt berichtet. In Bezug auf den Umgang mit externen Instrumenten der Leistungsbeurteilung findet sich in Schweden eine positive Einschätzung der nationella prov als Hilfsmittel und Orientierung für die eigene Beurteilung. Die nordrhein-westfälischen Lehrkräfte stehen den Zentralen Abschlussprüfungen359 hingegen eher ambivalent bis skeptisch gegenüber. Hinsichtlich der Beziehungskonstellationen wird ein eher distanziertes Verhältnis zwischen Lehrkräften und Schüler_innen bevorzugt, das insbesondere zur Vermeidung von subjektiven Faktoren wie Sympathie oder Antipathie bei der Beurteilung dient. Die detaillierten Beurteilungs- und Dokumentationsverfahren dienen hier einerseits zur Schaffung von Transparenz über die Beurteilungskriterien, wobei diese sich auch auf eine Transparenz auf Nachfrage beschränken kann. Andererseits werden die Dokumentationsverfahren auch genutzt, um eine Kanalisierung der Kommunikation mit Schüler_innen vorzunehmen bzw. zur Vermeidung von kritischen Nachfragen durch Schüler_innen („Diskussionen“) genutzt. In Bezug auf den kollegialen Austausch lässt sich eine zumeist punktuelle Zusammenarbeit feststellen, die jedoch eher die standardisierten Tests im schwedischen Fall bzw. die Zentralen Prüfungen im nordrhein-westfälischen Fall betreffen und weniger die alltägliche Beurteilungsarbeit. Demgegenüber stellen für die diskursiv-interaktive Gerechtigkeitsüberzeugung die Beziehungskonstellationen ein zentrales Element gerechter Leistungsbeurteilung dar. Zusammen mit einem professionellen Selbstbild als in erster Linie beratende Lehrkraft wird hier eine vertrauensvolle Beziehung zu den Schüler_innen sowie eine Gesprächsatmosphäre auf Augenhöhe besonders hervorgehoben. Im Gegensatz zur mathematisch359

Wie bereits ausgeführt stellen die nationella prov und die ZAPs keine funktionalen Äquivalente dar, da die Testergebnisse der nationella prov nicht als Abschlussprüfungen angelegt sind und hauptsächlich der Sicherung eines gleichwertigen Beurteilungsniveaus dienen (vgl. Kap. 5.1 und 5.2). Gleichwohl handelt es sich in beiden Fällen um extern erstellte Instrumente der Leistungsbeurteilung, die von den Lehrkräften ausgeführt werden sollen, weshalb die Reaktionen auf diese Instrumente hier gegenübergestellt werden.

604

7 Fazit und Ausblick

rechnerischen und prozedural-bürokratischen Gerechtigkeitsüberzeugung sind Nachfragen von Schüler_innen selbstverständlicher Bestandteil einer gerechten Beurteilung und werden nicht als lästige „Diskussionen“ aufgefasst. Die Erklärung und Offenlegung von Beurteilungskriterien dient nicht nur der Herstellung von Transparenz, vielmehr sollen Schüler_innen ein tieferes Verständnis des Beurteilungsprozesses entwickeln und diesen nachvollziehen können, um daraus wiederum Rückschlüsse für ihr weiteres Lernen zu ziehen. Dies führt auch zu einer Rollenverschiebung auf beiden Seiten: die Schüler_innen werden als aktive Lernende stärker in den Beurteilungsprozess einbezogen, die Lehrkräfte hingegen nehmen eine eher zurückhaltende Rolle ein. Hinzu kommt – vor allem für die schwedischen Lehrkräfte – der kollegiale Austausch, der zur Herstellung eines geteilten Beurteilungsverständnisses dient und eine eher individuelle Beurteilungspraxis ausschließt. Bedingung für diesen kollegialen Austausch ist jedoch eine grundsätzliche Offenheit für Kritik und Anregungen von außen, die nicht als Angriffe auf die eigene Professionalität gedeutet werden. Hier zeigen sich dahingehend länderspezifische Unterschiede, dass der kollegiale Austausch im schwedischen Kontext stärker als Instrument zu Sicherstellung einer gleichwertigen Beurteilung verstanden und durch organisatorische Rahmenbedingungen lokal ermöglicht wird. Die nordrhein-westfälischen Lehrkräfte weisen demgegenüber eine größere Spannbreite hinsichtlich der kollegialen Zusammenarbeit auf, die u.a. von den lokalen Bedingungen und der Kommunikationskultur im Kollegium abhängig sind. Im Hinblick auf das Beurteilungsverständnis ist eine deutliche Tendenz zur individuellen Bezugsnorm erkennbar, wobei diese immer auch in Konkurrenz zur kriterialen Bezugsnorm steht und je nach Einzelfall zwischen beiden abgewogen wird. Besonders deutlich wird dies bei den schwedischen Lehrkräften, deren diskursive Aushandlungen sowohl im Kollegium als auch mit den Schüler_innen hauptsächlich um die richtige Deutung der Lehrplanvorgaben und Beurteilungskriterien drehen. Die nordrheinwestfälischen Lehrkräfte verfügen in dieser Hinsicht über größere Spielräume, da die Kernlernpläne zwar die Lernziele, nicht aber die Beurteilungskriterien vorgeben. Die soziale Bezugsnorm wird hingegen, anders

Vier Muster von Gerechtigkeitsüberzeugungen

605

als bei der mathematisch-rechnerischen und prozedural-bürokratischen Gerechtigkeitsüberzeugung, nicht als legitimer Maßstab angesehen. Fragen von Subjektivität bzw. anzustrebender Objektivität stehen für diese Lehrkräfte nicht so sehr im Zentrum ihrer Überlegungen hinsichtlich einer gerechten Leistungsbeurteilung wie bei den anderen Gerechtigkeitsüberzeugungen. In der diskursiv-interaktiven Aushandlung von Leistungen mit den Schüler_innen wird zudem ein erweitertes Leistungsverständnis sichtbar, bei dem auch der Lernprozess miteinbezogen wird. Für die kompensatorische Gerechtigkeitsüberzeugung lässt sich schließlich ein professionelles Selbstbild als Lernbegleiter_in festhalten, das mit Selbstbeschreibungen als „Pädagogin“ oder „Coach“ einhergeht. Die Lehrkräfte zeichnen sich durch ein hohes Verantwortungsgefühl hinsichtlich des Lernerfolgs ihrer Schüler_innen aus, teilweise führt dieses sogar zur gemeinsamen Erbringung von Schüler_innenleistungen. In NRW verdeutlichte sich die Verantwortungsübernahme in der Idee einer „Holschuld“ der Lehrkräfte (gegenüber einer als „Bringschuld“ der Schüler_innen bezeichneten Haltung). Damit einher geht auch ein Beurteilungsverständnis im Sinne einer formativen Leistungsbeurteilung, bei der Beurteilungen vor allem als fortlaufende und individuelle Unterstützung des Lernprozesses verstanden werden, nicht als punktuelle Leistungsmessung. Entsprechend unwichtig sind Fragen der Objektivität von Beurteilungen für diese Lehrkräfte. Individuelle Förderung und die schulische Leistungsbeurteilung stellen miteinander verzahnte Elemente dar, ebenso gehen Unterrichtsplanung und individuelle Förderung miteinander einher. Die Lehrkräfte greifen auf einen erweiterten Leistungsbegriff zurück, bei dem auch Aspekte wie Bemühen und Anstrengung gewürdigt und kleinere Lernfortschritte hervorgehoben werden sollen. Die individuelle Bezugsnorm stellt die wichtigste Messlatte bei der Leistungsbeurteilung dar, aber auch die kriteriale Bezugsnorm findet sich wieder. Letztere jedoch als diagnostisch gedeuteter Beurteilungsmaßstab, indem Lernziele oder Bildungsstandards als Ausgangspunkt für weiterreichende Förderung betrachtet werden. Hinsichtlich der Beziehungskonstellatio-

606

7 Fazit und Ausblick

nen lässt sich eine Tendenz zu eher persönlichen, engen Beziehungen zwischen Lehrkräften und ihren Schüler_innen erkennen, die als Voraussetzung für eine gerechte Beurteilung angesehen werden. Die Lehrkräfte betonen, dass es wichtig sei, die Schüler_innen auch persönlich zu ‚kennen‘, um sie individuell fördern und sich im Unterricht auf sie einstellen zu können. Gleichzeitig wird deutlich, dass die Voraussetzung für individuelle Förderung auch die Mitarbeit der Schüler_innen ist: wenn Schüler_innen die ihnen gebotenen Lernmöglichkeiten nicht nutzen (können oder wollen), stoßen die Förderbemühungen der Lehrkräfte an ihre Grenzen. Im Hinblick auf die Beziehungskonstellationen im Kollegium wurde deutlich, dass im nordrhein-westfälischen Kontext die herausgehobene Position als Schulleitung die Spielräume zur Umsetzung einer kompensatorischen Gerechtigkeitsüberzeugung erweitert. Gleichzeitig zeigte sich, dass Kolleg_innen, die eher ablehnend gegenüber individueller Förderung und kompensatorischen Maßnahmen eingestellt sind, die Förderbemühungen sowohl der Schulleiterin als auch ‚einfacher‘ Lehrerinnen einschränken können. Eine kollegial geteilte Haltung gegenüber formativen Beurteilungsstrategien führt demgegenüber nur begrenzt zur Veränderung eigener Beurteilungsmuster. Hinsichtlich der institutionellorganisatorischen Rahmenbedingungen können einige länderspezifische Unterschiede festgehalten werden. Insbesondere im Hinblick auf die von den nordrhein-westfälischen Lehrkräften berichteten Rahmenbedingungen wird deutlich, dass eine gewisse zeitliche Flexibilität notwendig für individuell abgestimmte Lern- und Beurteilungssettings wäre, ebenso wie zusätzliche Ressourcen personeller, finanzieller und räumlicher Art, um weiterreichende kompensatorische Maßnahmen zu ermöglichen. Der klaren Ausrichtung der schwedischen Schule auf einen kompensatorischen Förderauftrag für alle Schüler_innen, stehen mehrere weniger auf Kompensation und Hilfestellung ausgerichtete Schulformen in NRW gegenüber, die die Schüler_innen und deren Eltern stärker in die Pflicht nehmen. Für individuelle Fördermaßnahmen, jenseits von diagnostizierten Teilleistungsschwächen, finden sich für Lehrkräfte in NRW nur innerhalb der eng abgesteckten regulativen Grenzen Ausgleichsmöglich-

Vier Muster von Gerechtigkeitsüberzeugungen

607

keiten, indem sie beispielweise die Gewichtung der zwei Beurteilungsbereiche (mündlich – schriftlich) kompensatorisch anwenden. Bei der Rekonstruktion dieser vier Muster von Gerechtigkeitsüberzeugungen und Beurteilungsstrategien wurde deutlich, dass alle befragten Lehrkräfte über eine spezifische Vorstellung darüber verfügen, was in ihren Augen eine gerechte von einer ungerechten Beurteilung unterscheidet bzw. wie sie eine in ihren Augen gerechte Beurteilung herzustellen versuchen. Es zeigte sich gleichzeitig aber auch, wie schwierig diese Aufgabe zum Teil sein kann und wo Lehrkräfte beispielsweise durch die institutionellen Rahmenbedingungen oder lokale Beurteilungskulturen eingeschränkt oder ganz daran gehindert werden, ihre Vorstellungen einer gerechten Beurteilung umzusetzen. Insofern können die hier vorgestellten Muster von Gerechtigkeitsüberzeugungen und Beurteilungsstrategien immer nur als Annäherungsversuche an eine möglichst gerechte Beurteilung verstanden werden. Diese Annäherungen finden in den vier Gerechtigkeitsüberzeugungen unter Verweis auf verschiedene Legitimationsquellen statt: Mal sind es mathematische Operationen, mal die detaillierte Dokumentation von Teilbeurteilungen, dann wiederum diskursive Aushandlungen, oder der Ausgleich unterschiedlicher Lernvoraussetzungen, die eine konkrete Beurteilungsentscheidung als gerecht markieren. Wie dabei unterschiedliche Erwartungen und Normen durch die Lehrkräfte ausbalanciert werden müssen, wurde ebenfalls gezeigt, wodurch die Kernkategorie der hier entwickelten gegenstandsverankerten Theorie – gerechte Leistungsbeurteilung als Balanceakt – an Kontur gewann. Mit der Formel von der (Un-)Möglichkeit gerechter Leistungsbeurteilung wird nun die Gleichzeitigkeit eines grundsätzlichen Strebens nach Gerechtigkeit – „alle wollen gerecht sein“ – und der Erkenntnis der Vieldeutigkeit dessen, was gerechte Leistungsbeurteilung für einzelne Lehrkräfte sein kann – „DIE [eine] Gerechtigkeit gibt es nicht“ – ausgedrückt. Diese Gleichzeitigkeit findet sich in den Interviews in der Ablehnung einer „hundertprozentigen“ oder „absoluten“ Gerechtigkeit ebenso wie in der Betonung, dass eine Beurteilung durch die Anwendung einer bestimmten Beurteilungs-

608

7 Fazit und Ausblick

strategie nicht unbedingt gerecht sei, durch sie aber „gerechter“ werden würde. Die vier Gerechtigkeitsüberzeugungen stellen, wie bereits in Kapitel 6.3 erläutert, idealtypische Kategorisierungen dar, die sich auf einem Kontinuum zwischen den Extrempolen mathematisch-rechnerischer und kompensatorischer Gerechtigkeit verorten lassen. Es zeigt sich, dass es zwischen diesen beiden Überzeugungen keine Überschneidungen gibt, d.h. Lehrkräfte, die eher zu einer der beiden Überzeugungen tendieren, schließen die jeweils andere für sich aus. Demgegenüber finden sich zwischen prozedural-bürokratischen und der diskursiv-interaktiven Gerechtigkeitsüberzeugung durchaus Überschneidungen miteinander, sowie jeweils auch mit den beiden Extrempolen. Sie übernehmen damit gewissermaßen eine Brückenfunktion zwischen der mathematischrechnerischen und der kompensatorischen Gerechtigkeitsüberzeugung. Im Material finden sich sowohl Kombinationen aus mathematischrechnerischer und prozedural-bürokratischer Überzeugung als auch Kombinationen aus kompensatorischer und prozedural-bürokratischer Gerechtigkeitsüberzeugung. Auch treten diskursiv-interaktive und kompensatorische Gerechtigkeit gemeinsam auf. Dass diese Kombinationen jeweils eigene Mischformen von Gerechtigkeitsüberzeugungen bilden und unter verschiedenen Vorzeichen stehen hinsichtlich der zentralen Kategorien professionelles Selbstbild, Beurteilungsverständnis und Beziehungskonstellationen wurde in den vorangegangenen Kapiteln anhand kontrastierender Fälle versucht deutlich zu machen. In Abbildung 18 findet sich eine grafische Darstellung der Überschneidungsbereiche zwischen den rekonstruierten und zu Idealtypen verdichteten Gerechtigkeitsüberzeugungen.

Vier Muster von Gerechtigkeitsüberzeugungen

609

Abb. 18 – Überschneidungsbereiche zwischen verschiedenen Gerechtigkeitsüberzeugungen

Wie in der vergleichenden Darstellung der idealtypischen Gerechtigkeitsüberzeugungen ebenfalls deutlich wurde, finden sich sowohl innerhalb als auch zwischen den verschiedenen Gerechtigkeitsüberzeugungen zum Teil länderspezifische Unterschiede. So tendieren die befragten Lehrkräfte aus Schweden und NRW insgesamt betrachtet zu unterschiedlichen Handlungsstrategien und damit verbundenen Gerechtigkeitsüberzeugungen. Die größten Überschneidungen zwischen den beiden Samplegruppen finden sich bei der diskursiv-interaktiven und der prozedural-bürokratischen Gerechtigkeit, die in beiden Ländern gleichermaßen auftritt. Die kompensatorische Gerechtigkeitsüberzeugung hingegen zeigt sich hauptsächlich bei den schwedischen Lehrkräften; in NRW sticht vor allem die Schulleiterin Frau Hollerdieck und der Gymnasiallehrer Herr Opdenkamp aus dem Sample hervor, andere Lehrkräfte weisen hingegen eine eher eingeschränkte kompensatorische Gerechtigkeitsüberzeugung auf. Die mathematisch-rechnerische Gerechtigkeitsüberzeugung wiederum lässt sich nur in Spuren im schwedischen Sample wiederfinden (bzw. wird deutlich abgelehnt), findet bei den nordrhein-westfälischen Lehrkräften jedoch regen Zuspruch. Insofern lässt sich bei aller gebotenen Vorsicht vor einer zu starken Generalisierung der vorliegenden Daten eine länderspezifische Tendenz zu be-

610

7 Fazit und Ausblick

stimmten Gerechtigkeitsüberzeugungen für die befragten Lehrkräfte dieser Studie konstatieren (vgl. Abb. 19).

Abb. 19 – Länderspezifische Tendenzen hinsichtlich präferierter Gerechtigkeitsüberzeugungen der befragten Lehrkräfte

Diese länderspezifischen Tendenzen sollten jedoch keinesfalls als Zuschreibungen im Sinne eines „Nationalcharakters“ missverstanden werden (vgl. zur Kritik des Begriffs Caruso, 2010). Vielmehr zeigen sich in den Gerechtigkeitsüberzeugungen die unterschiedlichen institutionellen Rahmungen der schulischen Leistungsbeurteilungen, sie spiegeln die darin eingelassenen Gerechtigkeitsnormen und lassen sich teilweise nur noch als Sedimentierungen dieser Normen in den Interviews rekonstruieren. Die daraus resultierenden Differenzierungen innerhalb der rekonstruierten Gerechtigkeitsüberzeugungen habe ich versucht in den Kapiteln 6.3.1 bis 6.3.4 ausführlich darzustellen. Daraus ergibt sich die zent-

Vier Muster von Gerechtigkeitsüberzeugungen

611

rale Schlussfolgerung der vorliegenden Untersuchung, dass unterschiedliche Welten der Meritokratie – so der Titel des Forschungsprojekts innerhalb dessen die vorliegende Arbeit entstand – sich nicht nur zwischen abstrakten Entitäten wie nationalstaatlich gerahmten Bildungssystemen zeigen, sondern auch innerhalb dieser Entitäten auf der lokalen Ebene Variationen zwischen Kollegien einzelner Schulen bzw. zwischen einzelnen Lehrkräften einer einzigen Schule zu finden sind. Durch die schrittweise Rekonstruktion der Gerechtigkeitsüberzeugungen von Lehrkräften beider Länder und die sukzessive Rückbindung der Interviewdaten an die jeweilige institutionelle Rahmung wurde zudem versucht einem „methodologischen Nationalismus“ (Wimmer & Glick Schiller, 2002) vorzubeugen. Die Herausarbeitung einer übergreifenden Kernkategorie durch fallübergreifende Vergleichsprozeduren, die nicht an den Ländergrenzen haltmachen, hat sich für die vorliegende Studie als besonders ergiebig gezeigt. Abschließend sollen die vier von mir herausgearbeiteten Gerechtigkeitsüberzeugungen noch einmal mit Blick auf die in Kapitel 2.4 herausgearbeiteten Gerechtgkeitsbegriffe der empirischen Sozialforschung diskutiert werden. Diese unterscheidet klassischer Weise zwischen drei Formen von Gerechtigkeit: Verteilungs-, Verfahrens- und Interaktionsgerechtigkeit. Der Verteilungsgerechtigkeit werden dabei noch drei Verteilungsprinzipien zugewiesen: das Bedürfnisprinzip (need), das Gleichheitsprinzip (equality) und das Leistungsprinzip (equity). Wie in den vorangegangenen Kapiteln deutlich wurde, sind viele Aspekte dieser Forschungsrichtungen als sensibilisierende Konzepte in die Analyse meiner Daten eingeflossen. Dabei wurde allerdings auch deutlich, dass die von mir rekonstruierten Gerechtigkeitsüberzeugungen als quer zu diesen drei Gerechtigkeitsformen liegend beschrieben werden müssen, da sich in ihnen jeweils auch Elemente verschiedener Gerechtigkeitsformen identifizieren lassen. Ich möchte dies im Folgenden kurz an zwei Gerechtigkeitsüberzeugungen ausführen. Wie in Kapitel 6.3.2 herausgearbeitet, dienen für die prozeduralbürokratische Gerchtigkeitsüberzeugung vor allem das Einhalten von standardisierten Beurteilungsverfahren und die kleinschrittige Doku-

612

7 Fazit und Ausblick

mentation einzelner Teilbeurteilungen als zentrale gerechtigkeitsrelevante Legitimationsquellen. Beides kann zunächst im Sinne der Verfahrensgerechtigkeit als ein Bemühen um Objektivität und Nachvollziehbarkeit verstanden werden. Gleichzeitig drückt sich darin aber auch der Wunsch nach einer Gleichbehandlung aller Schüler_innen aus, die als equality of treatment auch im Zusammenhang mit der Verteilungsgerechtigkeit steht. Betrachtet man nun die kompensatorische Gerechtigkeitsüberzeugung (Kap. 6.3.4), zielt diese wiederum eher auf eine Ungleichbehandlung von Schüler_innen ab – allerdings mit dem Ziel einer durch diese Ungleichbehandlung gesteigerten Gerechtigkeit. Unterschiedliche Lernvoraussetzungen sollen hier durch eine individuelle – und damit zwangsläufig ungleiche – Behandlung im Unterricht und schließlich auch durch die Beurteilung kompensiert werden. Mit der Perspektive der Verteilungsgerechtigkeit steht hier das Bedürfnisprinzip (need) im Mittelpunkt – und das zu verteilende Gut betrifft die Aufmerksamkeit der Lehrkräfte bzw. die Zuteilung von Unterstützungsmaßnahmen. Zugleich wird bei der kompensatorischen Gerechtigkeitsüberzeugung die Wichtigkeit einer guten persönlichen Beziehung zu den Schüler_innen herausgestellt und Wert darauf gelegt, dass Schüler_innen für ihre Anstrengungen belohnt werden und sich fair behandelt fühlen – dies wiederum sind alles Aspekte der Interaktionsgerechtigkeit. Schon anhand dieser kurzen Beispiele zeigt sich, dass die drei klassischen Gerechtigkeitsformen hilfreiche konzeptuelle Stützen bieten um die empirische Varianz von Gerechtigkeitsüberzeugungen von Lehrkräften analytisch einzufangen. Gleichzeitig wird deutlich, dass eine getrennte Betrachtung der Aspekte von Verteilungs-, Verfahrens- und Interaktionsgerechtigkeit wenig sinnvoll für das Verständnis der komplexen Gerchtigkeitsüberzeugungen von Lehrkräften ist, weshalb ich hier für eine mindestens kombinierte Anwendung der klassischen Konzepte plädieren möchte. Ebenfalls deutlich geworden sein sollte, dass das gewählte qualitativ-rekonstruktive Forschungsdesign eben diese Vielschichtigkeiten, Widersprüche und Ambivalenzen des Materials einzufangen und für die Analyse fruchtbar zu machen ermöglicht und damit eine Erweite-

Limitationen dieser Studie

613

rung des Verständnisses von Gerechtigkeitsüberzeugungen in all ihren Schattierungen ermöglicht. 7.3 Limitationen dieser Studie, Implikationen und Ausblick auf weiterführende Forschung Aus den Ergebnissen der vorliegenden Studie ergeben sich verschiedene Implikationen auf unterschiedlichen Ebenen des untersuchten Phänomens gerechter Leistungsbeurteilung, gleichzeitig weist die Arbeit natürlich auch Limitationen auf. Beides wird im Folgenden im Hinblick auf weiterführende Forschungsperspektiven abschließend diskutiert. Die aufgezeigte Bandbreite und interne Verschiedenheit der in dieser Studie rekonstruierten Gerechtigkeitsüberzeugungen können zunächst zur Plausibilisierung datengestützter Hypothesen herangezogen werden bzw. als Grundlage für die Entwicklung weitergehender Hypothesen dienen. Sie stellen somit eine fundierte Grundlage für weiterführende Forschungsfragen dar. Die Einbeziehung weiterer Vergleichsländer mit anderen Beurteilungstraditionen könnte zudem eine weitere Möglichkeit der Überprüfung und gegebenenfalls spannende Erweiterung des hier vorgeschlagenen Kontinuums von Gerechtigkeitsüberzeugungen ergeben. Das englische Bildungssystem mit seinem starken Anteil externer Beurteilungsinstrumente wäre hier ein interessanter weiterer Fall. Im Rahmen der vorliegenden Studie lag der Fokus zunächst auf der explorativen Erkundung und Strukturierung der Bandbreite von möglichen Gerechtigkeitsüberzeugungen von Lehrkräften. Teilweise fanden sich Hinweise auf kollektiv geteilte Überzeugungsmuster innerhalb eines Kollegiums, die eine interessante Ergänzung und weitere Ausdifferenzierung der vorgeschlagenen Muster von Gerechtigkeitsüberzeugungen ergeben könnten. Dies könnte beispielweise durch die Perspektive auf den Einfluss verschiedener organisationaler Milieus von Schulen, wie Nohl (2007) sie im Anschluss an Bohnsack (2003) und Mannheims „konjunktiven Erfahrungsraum“ (Mannheim, 1980, S. 220) entwirft, besonders anschlussfähig und interessant sein. Der Fokus läge hier dann stärker auf der Einzelschule und deren formellen und informellen Regeln

614

7 Fazit und Ausblick

sowie dem Umgang der Lehrkräfte mit eben jenen Organisationsregeln als dies in der vorliegenden Arbeit möglich war. Dass Lehrkräfte bei der schulischen Leistungsbeurteilung mitunter bewusst die offiziellen Regelungen ignorieren oder selektiv abändern (müssen), um eine in ihren Augen gerechte Beurteilung zu ermöglichen, konnte in Kapitel 6.3 gezeigt werden. Spannend wäre hier die vergleichende Analyse mehrerer Lehrkräfte der gleichen Organisation, um ggf. Rückschlüsse auf eine Spezifik bestimmter Organisationsmilieus ziehen zu können. Die vorliegende Arbeit konnte zudem vereinzelte Hinweise auf schulformspezifische Besonderheiten für den nordrhein-westfälischen Kontext hinsichtlich der Gerechtigkeitsüberzeugungen der befragten Lehrkräfte nachweisen. Ob es sich jedoch tatsächlich um Unterschiede, die sich auf die Schulform zurückführen lassen, oder aber um einzelschulische Besonderheiten im Sinne einer lokalen Schul- und Beurteilungskultur handelt, kann nicht abschließend beantwortet werden und bedarf weiterer Untersuchungen. Wie Lange-Vester (2013) für den deutschen Kontext zeigt, müssen dabei aber nicht zwangsläufig nur Unterschiede zwischen Lehrkräften verschiedener Schulen und Schultypen auftreten, vielmehr macht sie deutlich, dass sich die berufsbezogenen Überzeugungen von Lehrkräften aufgrund von unterschiedlichen milieuspezifischen Habitusmustern auch innerhalb eines Kollegiums stark unterscheiden können. Inwiefern sich diese Habitusmuster auch auf Fragen der schulischen Leistungsbeurteilung auswirken, und inwiefern diese Befunde auch auf den schwedischen Kontext übertragbar sind, wäre ebenfalls eine interessante Erweiterung der vorliegenden Studie. Weiteren Erkenntnisgewinn könnte zudem die Einbeziehung weiterer Unterrichtsfächer bringen, die weniger selektionsrelevant als die Kernfächer Mathematik und die Landessprache sind und gegebenenfalls eine andere Beurteilungspraxis ermöglichen. So werden Nebenfächer in NRW häufig auch als ‚mündliche Fächer‘ bezeichnet, da sie nicht versetzungsrelevant sind und in ihnen keine Klassenarbeiten vorgeschrieben sind, gleichzeitig handelt es sich hierbei teilweise um sogenannte ‚Begabungsfächer‘, wie Kunst, Musik oder Sport, bei denen insbesondere der Aspekt des Leistungsverständnisses einen interessanten Kontrast zu den hier

Limitationen dieser Studie

615

betrachteten Unterrichtsfächern liefern könnte. Diese abweichenden Rahmenbedingungen könnten sich auch auf Fragen einer gerechten Leistungsbeurteilung auswirken, so dass eine Überprüfung der vorgeschlagenen Theorie auch hinsichtlich der berücksichtigten Unterrichtsfächer eine sinnvolle Ergänzung darstellen könnte. Weiterhin wurden im Rahmen dieser Untersuchung die subjektiven Relevanzstrukturen und Handlungsmöglichkeiten der befragten Lehrkräfte mittels episodischer Interviews rekonstruiert. Bei den in den Interviews berichteten Beurteilungsstrategien handelt es sich aber nur um berichtete, nicht beobachtete Praxis. Insofern kann nicht ausgeschlossen werden, dass es in einigen Fällen durchaus möglich ist, dass die tatsächlichen Beurteilungshandlungen der Lehrkräfte im Klassenraum von den im Interview geäußerten Überzeugungen abweichen. Rückschlüsse auf ihr tatsächliches Handeln in Beurteilungssituationen sind auf Grundlage der vorliegenden Daten natürlich nicht möglich. Eine weitere spannende Ergänzung dieser Studie könnten daher eher ethnographisch angelegte Untersuchungen sein. Darüber hinaus sind weitere Forschungen bezüglich der unterschiedlichen Wahrnehmungen von Gerechtigkeitssituationen im Unterricht durch Lehrkräfte bzw. Schüler_innen notwendig, wie sie beispielsweise in der innovativen Studie von Ehrhardt, Pretsch, Hermann und Schmitt (2016) vorgelegt wurden. Sie entwickelten beispielsweise Beobachtungsinstrumente für Lehrkräfte, Schüler_innen sowie neutrale Beobachter_innen, um unterschiedliche (Un-)Gerechtigkeitssituationen im Unterricht der Grundschule aus verschiedenen Perspektiven einschätzen lassen zu können. Die Studie zeigt jedoch auch, wie schwierig eine Operationalisierung des komplexen Phänomens individuell wahrgenommener Gerechtigkeit ist. Die Frage nach der Persistenz von Gerechtigkeitsüberzeugungen angesichts umfassender Reformen im Bildungs- und insbesondere Beurteilungssystem stellt sich für beide untersuchten Länder auf ihre je eigene Weise. Inwiefern sich beispielsweise die von Kritikern der schwedischen Reformen geäußerten Befürchtungen einer stärkeren Formalisierung und Instrumentalisierung von Unterricht sowie die Verstärkung einer „restricted professional and epistemic agency of teachers“ (Wahlström

616

7 Fazit und Ausblick

& Sundberg, 2015, S. 75) durch die Einführung detaillierter Beurteilungsvorgaben auf lange Sicht bestätigen, kann nur durch weitere Forschungen überprüft werden. Im Hinblick auf den unterschiedlichen Umgang der schwedischen Lehrkräfte mit den neuen Beurteilungsvorgaben und Benotungskriterien lässt sich jedoch als Nebenprodukt dieser Studie einmal mehr feststellen, dass umfassende Reformen im Bildungsbereich sich erst in der alltäglichen Unterrichtspraxis materialisieren und durch die Übersetzung der Lehrkräfte konstruiert werden. Steiner-Khamsi und Stolpe zeigen so auch am Fall der Mongolei, wie resistent Lehrer_innen auf die Einführung neuer Unterrichtsmethoden reagieren und diese nur dann und auch nur teilweise bzw. abgewandelt implementieren, wenn sie zu den eigenen Überzeugungen der Lehrkräfte passen (SteinerKhamsi & Stolpe, 2006, S. 109-129, 197). Für die in dieser Studie analysierten Regularien kann kein Anspruch auf Vollständigkeit erhoben werden. Wie bereits in Kapitel 4.3 erläutert, wurden diese sowohl für Nordrhein-Westfalen als auch für Schweden einerseits zeitlich eingegrenzt für den Zeitraum 2010-2016 berücksichtigt. Andererseits dienten diese Dokumente vor allem dazu ein besseres Kontextverständnis entwickeln zu können und wurden ausgehend von den in den Interviews angesprochenen Themen in die Analyse einbezogen. Eine eigenständige Dokumentenanalyse, wie beispielsweise bei Diskursanalysen üblich, wurde nicht durchgeführt. Insofern ist davon auszugehen, dass noch weitaus mehr Publikationen und Dokumente aller Art zum Themenbereich „Leistungsbeurteilung und Gerechtigkeit“ in beiden Ländern existieren, als in dieser Arbeit berücksichtigt werden konnten. Da der Fokus der Arbeit jedoch auf der Rekonstruktion der Überzeugungen der befragten Lehrkräfte lag, musste der Umfang der zusätzlich in die Analyse einbezogenen Dokumente nicht zuletzt aus forschungspragmatischen Gründen eingeschränkt werden. Eine diskursanalytische Untersuchung der in beiden Ländern existierenden medialen Auseinandersetzung zum Thema gerechter Noten wäre jedoch eine denkbare Ergänzung der vorliegenden Studie. Die methodisch-methodologische Erweiterung der vergleichenden Erziehungswissenschaft durch die Verbindung mit der Grounded Theory

Limitationen dieser Studie

617

Methodologie hat sich in der vorliegenden Arbeit als fruchtbarer Ansatz erwiesen und kann für weiterführende Forschungen, die auf einen kontextsensiblen Vergleich abzielen, empfohlen werden.

Literaturverzeichnis Abraham, U. (2010). Was sollen unsere Abiturienten in Zukunft können und wie lässt sich das überprüfen? Der Deutschunterricht, 62(1), 52– 61. Alexandersson, M. (2011). Equivalence and choice in combination: The Swedish dilemma. Oxford Review of Education, 37(2), 195–214. Alexandersson, U., & Engstrom, S. (May 2006). Assessment Project Country Report: Sweden. OECD. Allal, L. (2013). Teachers' professional judgement in assessment: A cognitive act and socially situated practice. Assessment in Education: Principles, Policy & Practice, 20(1), 20–34. Altrichter, H., & Maag Merki, K. (Hrsg.) (2010). Handbuch Neue Steuerung im Schulsystem. Wiesbaden: VS Verlag für Sozialwissenschaften. APO-GOst = Verordnung über den Bildungsgang und die Abiturprüfung in der gymnasialen Oberstufe. Vom 5. Oktober 1998 zuletzt geändert durch Verordnung vom 12. Juli 2018 (SGV. NRW. 223). Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen. APO-S I. Verordnung über die Ausbildung und die Abschlussprüfungen in der Sekundarstufe I (APO-S I, 13-21 Nr. 1.1 B). Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen. Appius, S. (2012). Kooperation zwischen Lehrpersonen im Zusammenhang mit dem Abitur. In K. Maag Merki (Hrsg.), Zentralabitur. Die längsschnittliche Analyse der Wirkungen der Einführung zentraler Abiturprüfungen in Deutschland (S. 95–118). Wiesbaden: Springer VS. Arbeitskreis Gesamtschule in Nordrhein-Westfalen e.V. (Hrsg.) (2011). Was ist das: Gesamtschule? Ein Ratgeber beim Übergang in das 5. Schuljahr (19. Aufl., GGGkonkret Nr. 3). Arnesen, A.-L., & Lundahl, L. (2006). Still social and democratic? Inclusive education policies in the Nordic welfare states. Scandinavian Journal of Educational Research, 50(3), 285–300.

© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 K. Falkenberg, Gerechtigkeitsüberzeugungen bei der Leistungsbeurteilung, https://doi.org/10.1007/978-3-658-28275-2

620

Literaturverzeichnis

Arnold, K.-H., & Vollstädt, W. (2001). Arbeits- und Sozialverhalten in der Schule. Möglichkeiten und Grenzen ihrer Beurteilung durch "Kopfnoten". Die Deutsche Schule, 93(2), 199–209. ASchO = Allgemeine Schulordnung NRW. Fassung vom 25.06.2002. Ministerium für Schule und Weiterbildung des Landes NordrheinWestfalen. Badstieber, B., & Amrhein, B. (2016). Lehrkräfte zwischen sonderpädagogischer Qualifizierung und inklusiver Bildung. In V. Moser & B. Lütje-Klose (Hrsg.), Schulische Inklusion (62. Beiheft der Zeitschrift für Pädagogik, S. 175-189). Weinheim/Basel: Beltz Juventa. Ball, S. J. (2003). The teacher's soul and the terrors of performativity. Journal of Education Policy, 18(2), 215–228. Baumert, J., Cortina, K. S., & Leschinsky, A. (2005). Grundlegende Entwicklungen und Strukturprobleme im allgemeinbildenden Schulwesen. In K. S. Cortina, J. Baumert, A. Leschinsky, K. U. Mayer & L. Trommer (Hrsg.), Das Bildungswesen in der Bundesrepublik Deutschland. Strukturen und Entwicklungen im Überblick (2. Aufl., S. 52–147). Reinbek bei Hamburg: Rowohlt-Taschenbuch-Verl. Baumert, J., Klieme, E., Neubrand, J., Prenzel, M., Schiefele, U., Schneider, W. et al. (Hrsg.) (2001). PISA 2000. Basiskompetenzen von Schülerinnen und Schülern im internationalen Vergleich. Opladen: Leske + Budrich. Baumert, J. & Kunter, M. (2006). Stichwort: Professionelle Kompetenz von Lehrkräften. Zeitschrift für Erziehungswissenschaft, 9(4), 469-520. Baumert, J., Lehmann, R., Lehrke, M., Schmitz, B., Clausen, M., Hosenfeld, I. et al. (Hrsg.) (1997). TIMSS - Mathematischnaturwissenschaftlicher Unterricht im internationalen Vergleich: Deskriptive Befunde. Opladen: Leske + Budrich. Baumert, J., & Schümer, G. (2001). Familiäre Lebensverhätnisse, Bildungsbeteiligung und Kompetenzerwerb. In Deutsches PISAKonsortium (Hrsg.), PISA 2000. Basiskompetenzen von Schülerinnen und Schülern im internationalen Vergleich (S. 323–407). Opladen: Leske+Budrich.

Literaturverzeichnis

621

Baumert, J., Stanat, P., & Watermann, R. (Hrsg.) (2006a). Herkunftsbedingte Disparitäten im Bildungswesen: Differenzielle Bildungsprozesse und Probleme der Verteilungsgerechtigkeit: Vertiefende Analysen im Rahmen von PISA 2000. Wiesbaden: VS Verlag für Sozialwissenschaften. Baumert, J., Stanat, P., & Watermann, R. (2006b). Schulstruktur und Entstehung differenzieller Lern- und Entwicklungsmilieus. In J. Baumert, P. Stanat & R. Watermann (Hrsg.), Herkunftsbedingte Disparitäten im Bildungswesen: Differenzielle Bildungsprozesse und Probleme der Verteilungsgerechtigkeit. Vertiefende Analysen im Rahmen von PISA 2000 (S. 95–188). Wiesbaden: VS Verlag für Sozialwissenschaften. Baurmann, M. (2012). Gerechtigkeitsüberzeugungen als kollektives Wissen: Marktwirtschaft und Gerechtigkeit aus der Sicht der Soziologie. In V. J. Vanberg (Hrsg.), Marktwirtschaft und soziale Gerechtigkeit. Gestaltungsfragen der Wirtschaftsordnung in einer demokratischen Gesellschaft (S. 247–274). Tübingen: Mohr Siebeck. Baylan, I., Fjelkner, M., & Preisz, E.-L. (2006, 03. Januar). Regeringen vill införa auktorisation av lärare. Dagens Nyheter. Beach, D., Bagley, C., Eriksson, A., & Player-Koro, C. (2014). Changing teacher education in Sweden. Using meta-ethnographic analysis to understand and describe policy making and educational changes. Teaching and Teacher Education, 44, 160-167. Beckmann, H.-K. (1998). Nichts Neues: Divergierende Aussagen über die Lehrer(aus)bildung. In B. Ofenbach (Hrsg.), Lehrerbildung zwischen Provinzialität und Globalität (S. 199-122). Frankfurt a.M.: Lang. Bekes, P. (2010). Berichte und Einschätzungen zum Zentralabitur aus fünf Bundesländern. Nordrhein-Westfalen. Der Deutschunterricht, 62(1), 71–86. Bellenberg, G. (1999). Individuelle Schullaufbahnen. Eine empirische Untersuchung über Bildungsverläufe von der Einschulung bis zum Abschluss. Frankfurt/M.: Juventa. Bellenberg, G., & Tierack, A. (2003). Ausbildung von Lehrerinnen und Lehrern in Deutschland. Opladen: Lesek + Budrich.

622

Literaturverzeichnis

Bellmann, J. (2006). Bildungsforschung und Bildungspolitik im Zeitalter 'Neuer Steuerung'. Zeitschrift für Pädagogik, 52(4), 487–504. Bellmann, J., & Weiß, M. (2009). Risiken und Nebenwirkungen Neuer Steuerung im Schulsystem: Theoretische Konzeptualisierung und Erklärungsmodelle. Zeitschrift für Pädagogik, 55(2), 286–308. Berg, C., & Milmeister, M. (2011). Im Dialog mit den Daten das eigene Erzählen der Geschichte finden: Über die Kodierverfahren der Grounded-Theory-Methodologie. In G. Mey & K. Mruck (Hrsg.), Grounded Theory Reader (2. aktualisierte und erweiterte Ausgabe, S. 303–332). Wiesbaden: VS Verlag für Sozialwissenschaften. Berger, P. A., & Kahlert, H. (Hrsg.) (2013). Institutionalisierte Ungleichheiten: Wie das Bildungswesen Chancen blockiert (3. Aufl.). Weinheim und München: Beltz Juventa. Berger, P. L., & Luckmann, T. (1966). The social construction of reality. A treatise in the sociology of knowledge. New York: Anchor Press. Berger, P. L., & Luckmann, T. (1977). Die gesellschaftliche Konstruktion der Wirklichkeit: Eine Theorie der Wissenssoziologie. Frankfurt a.M.: Fischer. Berg-Schlosser, D. (2004). Comparative studies: method and design. In N. J. Smelser & P. B. Baltes (Hrsg.), International encyclopedia for the social and behavioral sciences, Bd. 4 (S. 2427–2433). London: Elsevier. Bettmann, R., & Roslon, M. (Hrsg.) (2013). Going the distance: Impulse für die interkulturelle Qualitative Sozialforschung. Wiesbaden: Springer VS. Bies, R. J., & Moag, J. F. (1986). Interactional justice: Communication criteria of fairness. In R. J. Lewicki, B. H. Sheppard & M. H. Bazerman (Hrsg.), Research on negotiation in organizations. A biannual research series. Volume I (S. 44–55). Greenwich: JAI. Biggs, J. (2003). Aligning teaching and assessment to curriculum objectives. http://www.heacademy.ac.uk/assets/documents/resources/databas e/biggs-aligning-teaching-and--assessment.pdf [16.12.2016].

Literaturverzeichnis

623

Bildungskommission NRW (1995). Zukunft der Bildung - Schule der Zukunft. Denkschrift der Kommission beim Ministerpräsidenten des Landes Nordrhein-Westfalen. Neuwied/Kriftel/Berlin: Luchterhand. Black, P., & Williams, D. (2009). Developing the theory of formative assessment. Educational Assessment, Evaluation and Accountability, 21(1), 5–31. Bloom, B. S., Hastings, T. J., & Madaus, G. F. (Hrsg.) (1975). Handbook on formative and summative evaluation of student learning. New York: McGrawHill. Blumer, H. (2004). Der methodologische Standort des symbolischen Interaktionismus. In J. Strübing & B. Schnettler (Hrsg.), Methodologie interpretativer Sozialforschung. Klassische Grundlagentexte (S. 319– 387). Konstanz: UVK Verlagsgesellschaft. Boer, H. de (2006). Klassenrat als interaktive Praxis: Auseinandersetzung - Kooperation - Imagepflege. Wiesbaden: VS Verlag für Sozialwissenschaften. Bohnsack, R. (2003). Rekonstruktive Sozialforschung. Opladen: Leske + Budrich. Bos, W., Dohe, C., & Walzebug, A. (2010). Zum Zusammenhang von Schulnoten und Testleistungen. Eine Untersuchung auf der Grundlage der IGLU-Studie. Schulmanagement Online (1), 24–26. Bourdieu, P. (1982). Die feinen Unterschiede. Frankfurt a.M.: Suhrkamp. Bourdieu, P. (1987). Sozialer Sinn. Frankfurt a.M.: Suhrkamp. Bourdieu, P., & Passeron, J.-C. (1971). Die Illusion der Chancengleichheit: Untersuchungen zur Soziologie des Bildungswesens am Beispiel Frankreichs. Stuttgart: Klett. Bräu, K., & Fuhrmann, L. (2015). Die soziale Konstruktion von Leistung und Leistungsbewertung. In K. Bräu & C. Schlickum (Hrsg.), Soziale Konstruktionen in Schule und Unterricht. Zu den Kategorien Leistung, Migration, Geschlecht, Behinderung, soziale Herkunft und deren Interdependenzen (S. 49–64). Opladen: Barbara Budrich. Breidenstein, G. (2011). Zusammenfassende und vergleichende Betrachtungen. In K. U. Zaborowski, M. Meier & G. Breidenstein (Hrsg.), Leistungsbewertung und Unterricht. Ethnographische Studien zur Bewer-

624

Literaturverzeichnis

tungspraxis in Gymnasium und Sekundarschule (S. 345–366). Wiesbaden: VS Verlag für Sozialwissenschaften. Breuer, F., Mey, G., & Mruck, K. (2011). Subjektivität und Selbst/Reflexivität in der Grounded-Theory-Methodologie. In G. Mey & K. Mruck (Hrsg.), Grounded Theory Reader (2. aktualisierte und erweiterte Ausgabe, S. 427–448). Wiesbaden: VS Verlag für Sozialwissenschaften. Briscoe, C. (1994). Making The Grade: Perspectives on a teacher's assessment practice. Mid-Western Educational Researcher, 7(4), 14-16, 21-25. Broadfoot, P. (2007). An introduction to assessment. [London], New York: Continuum. Brookhart, S. M. (1994). Teachers' grading: practice and theory. Applied Measurement in Education, 7(4), 279–301. Brügelmann, H. (2006). Sind Noten nützlich - und nötig? Ziffernzensuren und ihre Alternativen im empirischen Vergleich: Kurzfassung für eilige LeserInnen. Eine wissenschaftliche Expertise des Grundschulverbandes erstellt von der Arbeitsgruppe Primarstufe an der Universität Siegen. http://grundschulverband.de/wpcontent/uploads/2017/03/neu_kurz_expertise.pdf [06.07.2017]. Bryant, A. (2003). A constructive/ist response to Glaser. Forum: Qualitative Sozialforschung, 4(1), Art. 15. Budde, J. (2010). Heterogenität und Homogenität aus der Perspektive von Lehrkräften. In D. Krüger (Hrsg.), Genderkompetenz und Schulwelten: Alte Ungleichheiten - neue Hemmnisse (S. 111–128). Wiesbaden: VS Verlag für Sozialwissenschaften. Budde, J., Scholand, B., & Faulstich-Wieland, H. (2008). Geschlechtergerechtigkeit in der Schule: Eine Studie zu Chancen, Blockaden und Perspektiven einer gender-sensiblen Schulkultur, Bd. 44. Weinheim, München: Juventa. BMBF = Bundesministerium für Bildung und Forschung (Hrsg.) (2015). Begabte Kinder finden und fördern: Ein Wegweiser für Eltern, Erzieherinnen und Erzieher, Lehrerinnen und Lehrer. Bielefeld: Bertelsmann.

Literaturverzeichnis

625

https://www.bmbf.de/pub/Begabte_Kinder_finden_und_foerdern.p df [11.4.2016]. Burger, R., & Groß, M. (2016). Gerechtigkeit und Studienabbruch. Die Rolle der wahrgenommenen Fairness von Benotungsverfahren bei der Entstehung von Abbruchsintentionen. Zeitschrift für Erziehungswissenschaft, 19(3), 625–647. Butler Shay, S. (2004). The assessment of complex performance: a socially situated interpretive act. Harvard Educational Review, 74(3). Carlgren, I. (2009). The Swedish comprehensive school - Lost in transition? Zeitschrift für Erziehungswissenschaft, 12(4), 633–649. Carlgren, I., & Klette, K. (2008). Reconstructionsof Nordic teachers: Reform policies and teachers‘ work during the 1990s. Scandinavian Journal of Educational Research, 52(2), 117-133. Carlgren, I., Klette, K., Myrdal, S., & Schnack, K., Simola, Hannu (2006). Changes in Nordic teaching practices: From individualised teaching to the teaching of individuals. Scandinavian Journal of Educational Research, 50(3), 301–326. Caruso, M. (2010). Die Vielfalt der vergleichenden Bildungsforschung: Forschungsdesigns und Textgattungen. Enzyklopädie Erziehungswissenschaft Online. https://contentselect.com/de/portal/media/view/5282482f-564c-4df2-a80411372efc1343 [06.07.2017]. Caruso, M., & Ressler, P. (2013). Zweigliedrigkeit: Strukturwandel des Schulsystems? Zeitschrift für Pädagogik, 59(4), 451–454. Charmaz, K. (2006). Constructing Grounded Theory: A practical guide through qualitative analysis (Reprinted). Thousand Oaks: Sage Publications. Cheng, L., & Curtis, A. (2012). Test impact and washback: Implications for teaching and learning. In C. Coombe, P. Davidson, B. O'Sullivan & S. Stoynoff (Hrsg.), The Cambridge guide to second language assessment (S. 89–95). Cambridge: Cambridge University Press. Clarke, A. (2005). Situational Analysis: Grounded Theory after the postmodern turn. Thousand Oaks: Sage.

626

Literaturverzeichnis

Clarke, A. E. (2012). Situationsanalyse: Grounded Theory nach dem Postmodern Turn. Wiesbaden: Springer VS. Cliffordson, C. (2004). Betygsinflation i de målrelaterade gymnasiebetygen. Pedagogisk Forskning i Sverige, 9(1), 1–14. Cliffordson, C. (2008). Differential prediction of study success across academic programs in the Swedish context: The validity of grades and tests as selection instruments for higher education. Educ. Assessment, 13(1), 56–75. Colquitt, J. A. (2005). What is organizational justice? A historical overview. In J. Greenberg & J. A. Colquitt (Hrsg.), Handbook of organizational justice (S. 3–56). Mahwah, New Jersey/ London: Lawrence Erlbaum Associates. Corbin, J. M., & Strauss, A. L. (2008). Basics of qualitative research: Techniques and procedures for developing Grounded Theory (3. Aufl.). Thousand Oaks: Sage. Cramer, C. (2014). Charakteristika und Rahmenbedingungen des Lehrerberufs. Diskussion. In E. Terhart, H. Bennewitz & M. Rothland (Hrsg.), Handbuch der Forschung zum Lehrerberuf (2. Aufl., S. 177-186). Münster: Waxmann. Crosby, F. (1984). Relative deprivation in organizational settings. Research in Organizational Settings, 6, 51–93. Dalbert, C. (2011). Warum die durch die Schüler und Schülerinnen individuell und subjektiv erlebte Gerechtigkeit des Lehrerhandelns wichtig ist. Zeitschrift für Pädagogische Psychologie, 25(1), 5–18. Dalbert, C., Schneidewind, U., & Saalbach, A. (2007). Justice judgements concerning grading in school. Contemporary Educational Psychology, 32, 420–433. Deutsch, M. (1975). Equity, equlity and need: What determines which value will be used as the basis for distributive justice? Journal of Social Issues, 31, 137–149. Deutsch, M. (1979). Education and distributive justice. American Psychologist, 34(5), 391–401. Deutsch, M. (1985). Distributive justice: A social-psychological perspective. New Haven: Yale University Press.

Literaturverzeichnis

627

Deutscher Ausschuss für das Erziehungs- und Bildungswesen (1966). Rahmenplan zur Umgestaltung und Vereinheitlichung des allgemeinbildenden öffentlichen Schulwesens (4.2.1959). In Deutscher Ausschuss für das Erziehungs- und Bildungswesen (Hrsg.), Empfehlungen und Gutachten des Deutschen Ausschusses für das Erziehungs- und Bildungswesen 1953-1965. Gesamtausgabe. (S. 59–115). Stuttgart: Ernst Klett Verlag. Dietrich, F., & Fricke, U. (2013). Reproduktion sozialer Ungleichheit im Prozess schulischer Leistungsbewertung. In F. Dietrich, M. Heinrich & N. Thieme (Hrsg.), Bildungsgerechtigkeit jenseits von Chancengleichheit. Theoretische und empirische Ergänzungen und Alternativen zu 'PISA' (S. 259–292). Wiesbaden: Springer VS. Dietrich, F., Heinrich, M., & Thieme, N. (Hrsg.) (2013). Bildungsgerechtigkeit jenseits von Chancengleichheit: Theoretische und empirische Ergänzungen und Alternativen zu 'PISA'. Wiesbaden: Springer VS. Dir 1990:62: Tillkallande av en beredning för att ge förslag till ett nytt betygssystem i grundskolan, gymnasieskolan och den kommunala vuxenutbildningen (1990) ( Nr. Dir 1990:62). https://www.riksdagen.se/sv/DokumentLagar/Utredningar/Kommittedirektiv/Tillkallande-av-en-beredningf_GEB162/ [16.5.2016]. Disdorn-Liesen, V. (2016). Vergleichbarkeit in der Vielfalt. Wiesbaden: Springer Fachmedien Wiesbaden. Ditton, H. (2010). Der Beitrag von Schule und Lehrern zur Reproduktion von Bildungsungleichheit. In R. Becker & W. Lauterbach (Hrsg.), Bildung als Privileg. Erklärungen und Befunde zu den Ursachen der Bildungsungleichheit (S. 247–275). Wiesbaden: VS Verlag für Sozialwissenschaften. Dreke, C. (2012). Künftige Lebenswege von Schulkindern: Deutungsmuster sozialer Ungleichheit von Lehrkräften in Italien und Deutschland. Wiesbaden: VS Verlag für Sozialwissenschaften. Ds 1990:60. Betygens effekter på undervisningen. Stockholm: Allmänna förlaget.

628

Literaturverzeichnis

Ebbinghaus, B. (2009). Mehr oder weniger? Quantitativer versus qualitativer Vergleich. In S. Pickel, G. Pickel, H.-J. Lauth & D. Jahn (Hrsg.), Methoden der vergleichenden Politik- und Sozialwissenschaft. Neue Entwicklungen und Anwendungen (S. 197–212). Wiesbaden: VS Verlag für Sozialwissenschaften. Edelstein, W. (2010). Ressourcen für die Demokratie. Die Funktionen des Klassenrates in einer demokratischen Schulkultur. In S. Aufenanger, F. Hamburger, L. Ludwig & R. Tippelt (Hrsg.), Bildung in der Demokratie. Beiträge zum 22. Kongress der Deutschen Gesellschaft für Erziehungswissenschaft (S. 65–78). Opladen, Farmington Hills, Mich: Budrich. Ehmke, T., & Baumert, J. (2008). Soziale Herkunft und Kompetenzerwerb. In M. Prenzel, C. Artelt, J. Baumert, W. Blum, M. Hammann, E. Klieme et al. (Hrsg.), PISA 2006 in Deutschland. Die Kompetenzen der Jugendlichen im dritten Ländervergleich (S. 309–335). Münster: Waxmann. Ehmke, T., Drechsel, B., & Carstensen, C. H. (2008). Klassenwiederholung in PISA-I-Plus: Was lernen Sitzenbleiber in Mathematik dazu? Zeitschrift für Erziehungswissenschaft, 11(3), 368–387. Ehrhardt, N., Pretsch, J., Hermann, I., & Schmitt, M. (2016). Observing justice in the primary school classroom. Zeitschrift für Erziehungswissenschaft, 19(1), 157–190. Eickelmann, B., Kahnert, J., Lorenz, R., & Bos, W. (2011). Das Zentralabitur in Nordrhein-Westfalen aus der Lehrerperspektive: Veränderungen für den Unterricht. SchulVerwaltung Nordrhein-Westfalen. (11), 318-17. Einsiedler, W., & Glumpler, E. (1989). Analysen zur Entwicklung des Sitzenbleibens (unter besonderer Berücksichtigung der Grundschule). Die Deutsche Schule, 81(2), 248–259. Elster, J. (1992). Local justice. How institutions allocate scarce goods and necessary burdens. New York: Russel Sage Foundation. Englund, T. (2012). Utbildningspolitisk monopolism – nya utmaningar för läroplansteorin. In T. Englund & E. Forsberg (Hrsg.), Vad räknas som

Literaturverzeichnis

629

kunskap? Läroplansteoretiska utsikter och inblickar i lärarutbildning och skola (S. 20-38). Stockholm: Liber. Englund, T., & Quennerstedt, A. (2008). Vadå likvärdighet? Studier i utbildningspolitisk språkanvändning. Göteborg: Daidalos. Enzenhofer, E., & Resch, K. (2011). Übersetzungsprozesse und deren Qualitätssicherung in der qualitativen Sozialforschung. Forum: Qualitative Sozialforschung, 12(2). http://www.qualitativeresearch.net/index.php/fqs/article/view/1652/3177 [17.7.2012]. Erickson, G. (2009). National assessment of foreign languages in Sweden. University of Gothenburg, Sweden. Eriksson, I. (2009). Re-interpreting teaching: A didived task in selfregulated teaching practices. Scandinavian Journal of Educational Research, 53(1), 53–70. Esping-Andersen, G. (1990). The three worlds of welfare capitalism. Cambridge: Polity Press. Falkenberg, K. (2018). Permanenter Vergleich. Methodologische Überlegungen zu einer an der Grounded-Theory-Methodologie orientierten international vergleichenden Forschung. Tertium Comparationis, 24(1), 107-134. Falkenberg, K., Vogt, B., & Waldow, F. (2015). Bildungsmarkt in Bullerbü. Zur aktuellen Debatte über die "Schulkrise" in Schweden. DDS - Die Deutsche Schule, 107(2), 104–118. Falkenberg, K., Vogt, B., & Waldow, F. (2017). Ständig geprüft oder kontinuierlich unterstützt? Schulische Leistungsbeurteilung in Schweden zwischen formativem Anspruch und summativer Notwendigkeit. Zeitschrift für Pädagogik, 63(3), 317-333. Färlin, M. (01.12.2015). Osäkert vem som ska sätta betyg. Skolvärlden. En tidning från Lärarnas Riksförbund. http://skolvarlden.se/artiklar/osakert-vem-som-ska-satta-betyg [04.11.2016]. Fend, H., & Specht, W. (1976). Zum Bluff gezwungen? Gymnasiasten im Vergleich: Ergebnisse einer Konstanzer Erhebung zur schulischen Sozialisation. Aspekte, (6), 36–39.

630

Literaturverzeichnis

Fend, H. (2006). Neue Theorie der Schule: Einführung in das Verstehen von Bildungssystemen. Wiesbaden: VS Verlag für Sozialwissenschaften. Ferchow, J., & Pfuhl, N. (2011). Zentralabitur – Neue Anforderungen an die Zusammenarbeit: Wie sich das Kooperationsverhalten verändert. SchulVerwaltung Nordrhein-Westfalen. (7-8), 219–220. Flick, U. (Hrsg.) (1995). Psychologie des Sozialen: Repräsentationen in Wissen und Sprache. Reinbek bei Hamburg: Rowohlt Taschenbuch Verlag. Flick, U. (1996). Psychologie des technisierten Alltags: Soziale Konstruktion und Repräsentation technischen Wandels in verschiedenen kulturellen Kontexten. Opladen: Westdeutscher Verlag. Flick, U. (2006). Episodic interviewing. In M. W. Bauer & G. Gaskell (Hrsg.), Qualitative researching with text, image and sound. A practical handbook (Reprint.) (S. 75–92). London: Sage. Flick, U. (2009). Qualitative Sozialforschung: Eine Einführung (2. Aufl.). Reinbek bei Hamburg: Rowohlt Taschenbuch Verlag. Flick, U. (2011). Das Episodische Interview. In G. Oelerich & H.-U. Otto (Hrsg.), Empirische Forschung und Soziale Arbeit. Ein Studienbuch (S. 273–280). Wiesbaden: VS Verlag für Sozialwissenschaften. Forgasz, H. J., & Leder, G. C. (2008). Beliefs about mathematics and mathematics teaching. In P. Sullivan & T. Wood (Hrsg.), International handbook of mathematics teacher education. Vol. I: Knowledge and beliefs in mathematics teaching and teaching development (S. 173– 192). Rotterdam: Sense Publishers. Forsberg, E., & Lundahl, C. (2012). Re/produktionen av kunskap i det svenska utbildningsystemet. In T. Englund, E. Forsberg & D. Sundberg (Hrsg.), Vad räknas som kunskap? Läroplansteoretiska utsikter och inblickar i lärarutbildning och skola (S. 200–223). Stockholm: Liber. Forsell, A. (2011). Skolan som politiskt narrative. En studie av den skolpolitiska debatten i Sveriges riksdag 1991-2002: Dissertation. Stockholm: Stockholms universitet. Fransson, G. (2012). Lärarlegitimation, introduktionsperiod och lämplighetsprövning. En översikt och problematisering av

Literaturverzeichnis

631

reformerna. In C. Gustafsson & G. Fransson, Kvalificerad som lärare? Om professionell utveckling, mentorskap och bedömning med sikte mot lärarlegitimation (S. 21-51). Gävle: Högskolan i Gävle. Fredriksson, A. (2010). Marknaden och lärarna. Hur organiseringen av skolan påverkar lärares offentliga tjänstmannaskap. Dissertation, Göteborg Universitetet. Freinet, C. (1979). Die moderne französische Schule. Paderborn: Schöningh. Friedrichs, B. (2004). Kinder lösen Konflikte: Klassenrat als pädagogisches Ritual. Eine ethnografische Studie. Baltmannsweiler: Schneider. Gehrke, A., & Bruno-Latocha, G. (2013). Die Verbeamtungspraxis der Bundesländer bei Lehrkräften. Recht der Jugend und des Bildungswesens, 3/2013, 306-316. Geissler, G. (2011). Schulgeschichte in Deutschland: Von den Anfängen bis in die Gegenwart. Frankfurt am Main, New York: P. Lang. Geißler, R. (2013). Die Metamorphose der Arbeitertochter zum Migrantensohn.: Zum Wandel der Chancenstruktur im Bildungssystem nach Schicht, Geschlecht, Ethnie und deren Verknüpfung. In P. A. Berger & H. Kahlert (Hrsg.), Institutionalisierte Ungleichheiten. Wie das Bildungswesen Chancen blockiert (3. Aufl.) (S. 71–100). Weinheim und München: Beltz Juventa. Gellert, U. (2015). Leistungskonstruktion im Mathematikunterricht. In K. Bräu & C. Schlickum (Hrsg.), Soziale Konstruktionen in Schule und Unterricht. Zu den Kategorien Leistung, Migration, Geschlecht, Behinderung, soziale Herkunft und deren Interdependenzen (S. 79–91). Opladen: Barbara Budrich. Gellert, U., & Hümmer, A.-M. (2008). Soziale Konstruktion von Leistung im Unterricht. Zeitschrift für Erziehungswissenschaft, 11(2), 288–311. GEW = Gewerkschaft Erziehung und Wissenschaft (2008). Abitur in der Diskussion. Analysen und Positionen zum Zentralabitur. Frankfurt a.M. Giesinger, J. (2007). Was heißt Bildungsgerechtigkeit? Zeitschrift für Pädagogik, 53(3), 362–381.

632

Literaturverzeichnis

Glaser, B. G. (1978). Theoretical sensitivity. Mill Valley, CA: Sociology Press. Glaser, B. G. (1992). Emergence vs. forcing: Basics of Grounded Theory analysis. Mill Valley, CA: Sociology Press. Glaser, B. G. (1998). Doing Grounded Theory: Issues and discussions. Mill Valley, CA: Sociology Press. Glaser, B. G. (2002). Constructivist Grounded Theory? Forum: Qualitative Sozialforschung, 3(3). http://www.qualitativeresearch.net/index.php/fqs/article/view/825/1793 [11.12.2013]. Glaser, B. G. (2004). Remodeling Grounded Theory. Forum: Qualitative Sozialforschung, 5(2). http://www.qualitativeresearch.net/index.php/fqs/article/view/607 [11.12.2013]. Glaser, B. G., & Strauss, A. L. (1967). The discovery of grounded theory: Strategies for qualitative research. Hawthorne, New York: Aldine de Gruyter. Gogolin, I. (2008). Der monolinguale Habitus der multilingualen Schule (2. Aufl.). Münster: Waxmann. Gomolla, M. (2013). Fördern und Fordern allein genügt nicht! Mechanismen institutioneller Diskriminierung von Migrantenkindern im deutschen Schulsystem. In G. Auernheimer (Hrsg.), Schieflagen im Bildungssystem. Die Benachteiligung der Migrantenkinder (5. Aufl., S. 87–102). Wiesbaden: Springer VS. Granström, K. (2003). Arbetsformer och dynamik i klassrummet. In S. Selander (Hrsg.), Kobran, nallen och majjen. Tradition och förnyelse i svensk skola och skolforskning (S. 223–243). Stockholm: Myndigheten för skolutveckling. Grissom, J., & Shepard, L. A. (1989). Repeating and dropping out of school. In L. A. Shepard & M. L. Smith (Hrsg.), Flunking grades: Research and policies on retention (S. 34–63). London: Falmer Press. Grunder, H.-U., & Bohl, T. (2001). Neue Formen der Leistungsbeurteilung in den Sekundarstufen I und II. Baltmannsweiler: Schneider Hohengehren.

Literaturverzeichnis

633

Gustafsson, J.-E., Cliffordson, C., & Erickson, G. (2014). Likvärdig kunskapsbedömning i och av den svenska skolan: Problem och möjligheter. Stockholm: SNS. Heckhausen, H. (1989). Motivation und Handeln (2., völlig überarbeitete und ergänzte Auflage). Berlin, Heidelberg, New York: Springer-Verlag. Heid, H. (1992). Was leistet das Leistungsprinzip? Zeitschrift für Berufsund Wirtschaftspädagogik, 88(2), 91–108. Helfferich, C. (2011). Die Qualität qualitativer Daten: Manual für die Durchführung qualitativer Interviews (4. Aufl). Wiesbaden: VS Verlag für Sozialwissenschaften. Helfferich, C., & Kruse, J. (2007). Vom "professionellen Blick" zum "hermeneutischen Ohr". Hermeneutisches Fremdverstehen als eine sensibilisierende Praxeologie für sozialarbeiterische Beratungskontexte. In I. Miethe (Hrsg.), Rekonstruktion und Intervention. Interdisziplinäre Beiträge zur rekonstruktiven Sozialarbeitsforschung (S. 175–188). Opladen: Budrich. Heller, K. A., Rosemann, B., & Steffens, K.-H. (1978). Prognose des Schulerfolgs. Eine Längsschnittstudie zur Schullaufbahnberatung. Weinheim: Beltz. Helsper, W. (2002). Lehrerprofessionalität als antinomische Handlungsstruktur. In M. Kraul, W. Marotzki & C. Schweppe (Hrsg.), Biographie und Profession (S. 64–102). Bad Heilbrunn: Klinkhardt. Hericks, U. (2006). Professionalisierung als Entwicklungsaufgabe: Rekonstruktionen zur Berufseingangsphase von Lehrerinnen und Lehrern. Wiesbaden: VS Verlag für Sozialwissenschaften. Herrmann, U. G., & Müller, D. K. (2003). Regionale Differenzierung und gesamtstaatliche Systembildung: Datenhandbuch zur deutschen Bildungsgeschichte II.2: Preußen und seine Provinzen - Deutsches Reich und seine Staaten. 1800-1945. Band I.2. Göttingen: Vandenhoeck & Ruprecht. Heubert, J., & Hauser, R. (1999). High stakes: Testing for tracking, promotion, and graduation. Washington, DC: National Academy Press. Hilker, F. (1964). What can the comparative method contribute to education? Comparative Education Review, 7(3), 223–225.

634

Literaturverzeichnis

Hinnerich, B. T., & Vlachos, J. (2013). Systematiska skillnader mellan interna och externa bedömningar av nationella prov - en uppföljningsrapport. In Skolinspektionen (Hrsg.), Olikheterna är för stora. Omrättning av nationella prov i grundskolan och gymnasieskolan (S. 86–138). Stockholm: Skolinspektionen. Hochweber, J. (2010). Was erfassen Mathematiknoten? Münster: Waxmann. Hofer, B. K., & Pintrich, P. R. (1997). The development of epistemological theories: beliefs about knowledge and knowing and their relation to learning. Review of Educational Research, 67(1), 88–140. Holmes, C. T. (1989). Grade level retention effects: Meta-analysis of research studies. In L. A. Shepard & M. L. Smith (Hrsg.), Flunking grades: research and policies on retention (S. 16–33). London: Falmer Press. Holzkamp, K. (1993). Lernen: Subjektwissenschaftliche Grundlegung. Frankfurt/M., New York: Campus. Hopmann, S. T. (2003). On the evaluation of curriculum reforms. Journal of Curriculum Studies, 35(4), 459–478. Hoyer, T. (2012). Begabungsbegriff und Leistung: Eine pädagogische Annäherung. In A. Hackl, C. Pauly, O. Steenbruck & G. Weigand (Hrsg.), Werte schulischer Begabtenförderung. Begabung und Leistung (Karg-Hefte. Beiträge zur Begabtenförderung und Begabungsforschung, S. 14–22). Frankfurt a.M.: Karg-Stiftung. Ingenkamp, K. H. (Hrsg.) (1972). Die Fragwürdigkeit der Zensurengebung: Texte und Untersuchungsberichte. Weinheim: Beltz Verlag. Ingenkamp, K. H. (Hrsg.) (1995). Die Fragwürdigkeit der Zensurengebung: Texte und Untersuchungsberichte. Weinheim: Beltz Verlag. Ingenkamp, K. H., & Lissmann, U. (2008). Lehrbuch der Pädagogischen Diagnostik. Weinheim: Beltz Verlag. Jachmann, M. (2003). Noten oder Berichte? Die schulische Beurteilungspraxis aus der Sicht von Schülern, Lehrern und Eltern. Opladen: Leske + Budrich.

Literaturverzeichnis

635

Jasso, G., Törnblom, K. Y., & Sabbagh, C. (2016). Distributive Justice. In C. Sabbagh & M. Schmitt (Hrsg.), Handbook of social justice theory and research (S. 201–218). New York: Springer. Jedemark, M. (2006). Lärarutbildningens olika undervisningspraktiker: en studie av lärarutbildares olika sätt att praktisera sitt professionella uppdrag. Dissertation, Lunds universitetet. Jimerson, S. R. (2001). Meta-analysis of grade retention research: Implications for practice in the 21st century. School Psychology Review, 30(3), 420–437. Jönsson, A. (2009). Lärande bedömning. Malmö: Gleerup. Jönsson, A., & Svingby, G. (2007). The use of scoring rubrics: Reliability, validity and educational outcomes. Educational Research Review, 2(2), 130–144. Jönsson, A., & Thornberg, P. (2014). Samsyn eller samstämmighet? En diskussion om sambedömning som redskap för likvärdig bedömning i skolan. Pedagogisk Forskning i Sverige, 19(4), 386–402. Jürgens, E. (1989). Lehrer empfehlen - Eltern entscheiden! Die Bewährung empfohlener und nicht-empfohlener Orientierungsstufenschüler im weiterführenden Schulsystem. Die Deutsche Schule, 81, 388– 400. Jürgens, E. (2010). Leistung und Beurteilung in der Schule: Eine Einführung in Leistungs- und Bewertungsfragen aus pädagogischer Sicht (7. überarbeitete Auflage). Sankt Augustin: Academia-Verl. Jürgens, E. (2013). Lehrerbewusstsein im selektiven Schulwesen: Der Umgang mit dem Fehler im Unterricht gefährdet den Heranwachsenden in seiner Rolle als Lernender. In E. Jürgens & S. Miller (Hrsg.), Ungleichheit in der Gesellschaft und Ungleichheit in der Schule. Eine interdisziplinäre Sicht auf Inklusions- und Exklusionsprozesse (S. 213– 234). Weinheim: Juventa. Jürgens, E., & Lissmann, U. (2015). Pädagogische Diagnostik: Grundlagen und Methoden der Leistungsbeurteilung in der Schule. Weinheim, Basel: Beltz.

636

Literaturverzeichnis

Jürgens, E., & Sacher, W. (2008). Leistungserziehung und Pädagogische Diagnostik in der Schule: Grundlagen und Anregungen für die Praxis. Stuttgart: Kohlhammer. Kalthoff, H. (1996). Das Zensurenpanoptikum: Eine ethnographische Studie zur schulischen Bewertungspraxis. Zeitschrift für Soziologie, 25(2), 106–124. Kalthoff, H. (2000). "Wunderbar, richtig": Zur Praxis mündlichen Bewertens im Unterricht. Zeitschrift für Erziehungswissenschaft, 3(3), 429– 446. Kalthoff, H., & Dittrich, T. (2016). Unterscheidung und Härtung. Bewertungs- und Notenkommunikation in Lehrerzimmer und Zeugniskonferenz. Berliner Journal für Soziologie, 26(3-4), 459-483. Kardorff, E. von (2014). Qualitative Sozialforschung: Versuch einer Standortbestimmung. In U. Flick, E. von Kardorff, H. Keupp, L. von Rosenstiel & S. Wolff (Hrsg.), Handbuch qualitative Sozialforschung. Grundlagen, Konzepte, Methoden und Anwendungen (3., neu ausgestattete Aufl., S. 3–8). Weinheim: Beltz, Psychologie-Verl.-Union. Kelle, U. (1996). Die Bedeutung theoretischen Vorwissens in der Methodologie der Grounded Theory. In R. Strobl & A. Böttger (Hrsg.), Wahre Geschichten? Zur Theorie und Praxis und Praxis qualitativer Interviews (S. 23–48). Baden-Baden: Nomos. Kelle, U. (2003). Die Entwicklung kausaler Hypothesen in der qualitativen Sozialforschung. Methodologische Überlegungen zu einem häufig vernachlässigten Aspekt qualitativer Theorie- und Typenbildung. Zentralblatt für Didaktik der Mathematik (ZDM), 35(6), 232–246. Kelle, U. (2011). "Emergence" oder "Forcing"? Einige methodologische Überlegungen zu einem zentralen Problem der Grounded-Theory. In G. Mey & K. Mruck (Hrsg.), Grounded Theory Reader (2. aktualisierte und erweiterte Ausgabe, S. 235–260). Wiesbaden: VS Verlag für Sozialwissenschaften. Keller, R. (2012). Das interpretative Paradigma: Eine Einführung. Wiesbaden: Springer VS. Kiper, H. (2008). Mitbestimmen im Klassenrat. Kompetenzmodelle zur demokratischen Erziehung. Pädagogische Führung, 19(4), 156–159.

Literaturverzeichnis

637

Klafki, W. (1974). Sinn und Unsinn des Leistungsprinzips in der Erziehung, Sinn und Unsinn des Leistungsprinzips. Ein Symposion (Mit Beiträgen von Arnold Gehlen, Günter Schmölders, Hans Peter Dreitzel, Frantz Vonessen, Wolfgang Klafki, Ommo Grupe, Christoph Theodor Wagner, Heinz Heckhausen, Wolfgang Förster; Nachwort von Max Müller) (S. 73–110). München: dtv. Klapp Lekholm, A. (2010). Vad mäter betygen? In C. Lundahl & M. FolkeFichtelius (Hrsg.), Bedömning i och av skolan. Praktik, principer, politik (S. 129–140). Lund: Studentlitteratur AB. Klapp Lekholm, A., & Cliffordson, C. (2008). Discrepancies between school grades and test scores at individual and school level: Effects of gender and family background. Educational Research and Evaluation, 14(2), 181–199. Kleber, E. (1992). Diagnostik in pädagogischen Handlungsfeldern: Einführung in Bewertung, Beurteilung, Diagnose und Evaluation. Weinheim, München: Juventa. Klein, E. D., Krüger, M., Kühn, S. M., & van Ackeren, I. (2014). Wirkungen zentraler Abschlussprüfungen im Mehrebenensystem Schule: Eine Zwischenbilanz internationaler und nationaler Befunde und Forschungsdesiderata. Zeitschrift für Erziehungswissenschaft, 17(1), 7– 33. Klein, E. D., Kühn, S. M., van Ackeren, I., & Block, R. (2009). Wie zentral sind zentrale Prüfungen? Zeitschrift für Pädagogik, 55(4), 596–621. Klein, H. (2009). Transparente Leistungsbewertung und Zensurengebung in der Sekundarstufe I. Baltmannsweiler: Schneider Hohengehren. Klemm, K. (2009). Klassenwiederholungen - teuer und unwirksam. Eine Studie zu den Ausgaben für Klassenwiederholungen in Deutschland. Gütersloh: Bertelsmann Stiftung. https://www.bertelsmannstiftung.de/de/publikationen/publikation/did/klassenwiederholungenteuer-und-unwirksam/ [10.12.2016]. Klemm, K., & Preuss-Lausitz, U. (2011). Auf dem Weg zur schulischen Inklusion in Nordrhein-Westfalen. Empfehlungen zur Umsetzung der UN-Behindertenrechtskonvention im Bereich der allgemeinen Schulen.

638

Literaturverzeichnis

Essen, Berlin (Gutachten im Auftrag des Ministeriums für Schule und Weiterbildung des Landes Nordrhein-Westfalen). www.schulministerium.nrw.de/docs/Schulsystem/Inklusion/Gutacht en-_Auf-dem-Weg-zur-schulischen-Inklusion-in-NordrheinWestfalen_/NRW_Inklusionskonzept_2011___neue_Version_08_07_11.pdf [2.12.2016]. Klieme, E., Bürgermeister, A., Harks, B., Blum, W., Leiß, D., & Rakoczy, K. (2010). Leistungsbeurteilung und Kompetenzmodellierung im Mathematikunterricht: Projekt CO2CA1. Zeitschrift für Pädagogik, 56(Beiheft), 64–74. KMK = Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (1970). Empfehlungen zur Arbeit in der Grundschule: Beschluss der Kultusministerkonferenz vom 02.07.1970. KMK = Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (1971). Abkommen zwischen den Ländern der Bundesrepublik zur Vereinheitlichung auf dem Gebiete des Schulwesens (Vom 28.10.1964 in der Fassung vom 14.10.1971). http://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/19 64/1964_10_28-Hamburger_Abkommen.pdf [7.11.2016]. KMK = Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (2000). Gemeinsame Erklärung des Präsidenten der Kultusminsterkonferenz und der Vorsitzenden der Bildungs- und Lehrergewerkschaften sowie ihrer Spitzenorganisationen Deutscher Gewerkschaftsbund DGB und DBB - Beamtenbund und Tarifunion: Beschluss der Kultusministerkonferenz vom 05.10.2000. Bremen. https://www.kmk.org/fileadmin/Dateien/veroeffentlichungen_beschl uesse/2000/2000_10_05-Bremer-Erkl-Lehrerbildung.pdf. KMK = Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (2004). Standards für die Lehrerbildung: Bildungswissenschaften. http://www.kmk.org/fi leadmin/veroeff entlichungen_beschluesse/2004/2004_12_16-StandardsLehrerbildung.pdf; [12.07.2014].

Literaturverzeichnis

639

KMK = Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (2006). Gesamtstrategie der Kultusministerkonferenz zum Bildungsmonitoring. München: Luchterhand. KMK = Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (2009). Zentrale oder dezentrale Abiturprüfungen in den Ländern: Stand: 01/2009. http://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/20 09/2009_01_01-Uebersicht-zentrale-Abiturpruefung.pdf [12.9.2016]. KMK = Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (2011). Inklusive Bildung von Kindern und Jugendlichen mit Behinderungen in Schulen: Beschluss der Kultusministerkonferenz vom 20.10.2011. https://www.kmk.org/fileadmin/Dateien/veroeffentlichungen_beschl uesse/2011/2011_10_20-Inklusive-Bildung.pdf [3.6.2016]. KMK = Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (2012a). Bildungsstandards im Fach Deutsch für die Allgemeine Hochschulreife: Beschluss der Kultusministerkonferenz vom 18.10.2012. https://www.kmk.org/fileadmin/Dateien/veroeffentlichungen_beschl uesse/2012/2012_10_18-Bildungsstandards-Deutsch-Abi.pdf [12.9.2016]. KMK = Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (2012b). Vereinbarung zur Weiterentwicklung von VERA.. Berlin: KMK. https://www.kmk.org/fileadmin/Dateien/veroeffentlichungen_beschl uesse/2012/2012_03_08_Weiterentwicklung-VERA.pdf [10.2.2016]. KMK = Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (2012c, 08. März). Vereinbarung zur Weiterentwicklung von VERA: Beschluss der Kultusministerkonferenz vom 08.03.2012. http://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/20 12/2012_03_08_Weiterentwicklung-VERA.pdf [17.2.2016].

640

Literaturverzeichnis

KMK = Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (2013, 21. Juni). Pressemitteilung zu den Ergebnissen der 342. Kultusministerkonferenz am 20./21. Juni 2013 in der Lutherstadt Wittenberg. https://www.kmk.org/presse/pressearchiv/mitteilung/ergebnisseder-342-kultusministerkonferenz-am-2021-juni-2013-in-derlutherstadt-wittenberg.html [12.9.2016]. KMK = Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (2014a). Das Bildungswesen der Bundesrepublik Deutschland 2012/13: Darstellung der Kompetenzen, Strukturen und bildungspolitischen Entwicklungen für den Informationsaustausch in Europa (KMK = Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (KMK), Hrsg.). Bonn. KMK = Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (2014b). Vereinbarung über die Schularten und Bildungsgänge im Sekundarbereich I: (Beschluss der Kultusministerkonferenz vom 03.12.1993 i.d.F. vom 25.09.2014). http://www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/19 93/1993_12_03-VB-Sek-I.pdf. KMK = Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (2015, 19. Februar). Übergang von der Grundschule in Schulen des Sekundarbereichs I und Förderung, Beobachtung und Orientierung in den Jahrgangsstufen 5 und 6 (sog. Orientierungsstufe). www.kmk.org/fileadmin/veroeffentlichungen_beschluesse/2015/201 5_02_19-Uebergang_Grundschule-SI-Orientierungsstufe.pdf [13.1.2016]. Köller, O. (2005). Formative assessment in classrooms: A review of the empirical German literature. In OECD (Hrsg.), Formative assessment. Improving learning in secondary classrooms (S. 265–279). Paris: OECD Publishing. König, J. (2012). Teachers' pedagogical beliefs: Current and future research. In J. König (Hrsg.), Teachers' pedagogical beliefs. Definition

Literaturverzeichnis

641

and operationalisation - Connections to knowledge and performance development and change (S. 7–11). Münster, München: Waxmann. König, J., & Drage, K. (2010). Sitzenbleiben - Erfahrungen und Einstellungen von Lehrerinnen und Lehrern: Erste Ergebnisse aus der wissenschaftlichen Begleitstudie zur Initiative "Komm Mit! - Fördern statt Sitzenbleiben" des Schulministeriums NRW und der nordrheinwestfälischen Lehrerverbände. In W. Böttcher, J. N. Dicke & N. Hogrebe (Hrsg.), Evaluation, Bildung und Gesellschaft. Steuerungsinstrumente zwischen Anspruch und Wirklichkeit (S. 89–104). Münster, New York, München, Berlin: Waxmann. Korp, H. (2006). Lika chanser i gymnasiet?: En studie om betyg, nationella prov och social reproduktion. Malmö: Malmö Högskola. Kotthoff, H.-G. (2003). Bessere Schulen durch Evaluation? Internationale Erfahrungen. Münster: Waxmann. Krampen, G. (1987). Differential effects of teacher comments. Journal of Educational Psychology, 79(2), 137–146. Krohne, J., & Tillmann, K.-J. (2006). "Sitzenbleiben" - eine tradierte Praxis auf dem Prüfstand. SchulVerwaltung Spezial. (4), 6–9. Kronig, W. (2003). Das Konstrukt des leistungsschwachen Immigrantenkindes. Zeitschrift für Erziehungswissenschaft, 6(1), 126–141. Krüger, H.-H., Rabe-Kleberg, U., Kramer, R.-T., & Budde, J. (2010). Bildungsungleichheit revisited? Eine Einleitung. In H.-H. Krüger, U. RabeKleberg, R.-T. Kramer & J. Budde (Hrsg.), Bildungsungleichheit revisited. Bildung und soziale Ungleichheit vom Kindergarten bis zur Hochschule (S. 7–24). Wiesbaden: VS Verlag für Sozialwissenschaften. Kruse, J. (2014). Qualitative Interviewforschung: Ein integrativer Ansatz. Weinheim: Beltz Juventa. Kruse, J., Bethmann, S., Niermann, D., & Schmieder, C. (Hrsg.) (2012). Qualitative Interviewforschung in und mit fremden Sprachen: Eine Einführung in Theorie und Praxis. Weinheim: Beltz Juventa. Kühn, S. M. (2010). Steuerung und Innovation durch Abschlussprüfungen? Wiesbaden: VS Verlag für Sozialwissenschaften.

642

Literaturverzeichnis

Kühn, S. M., & van Ackeren, I. (2012). Was wird anders durch zentrale Prüfungen? Empirische Befunde und praktische Implikationen. Friedrich Jahresheft, 104–105. Lamnek, S., & Krell, C. (2016). Qualitative Sozialforschung: Mit OnlineMaterialien (6., vollständig überarbeitete Aufl.). Weinheim, Basel: Beltz. Lamprecht, J. (2007). Die Bewertung von Schülerleistungen: Eine kritische Reflexion auf der Basis der dokumentarischen Evaluationsforschung. Berlin: Logos-Verl. Landtag Nordrhein-Westfalen (2015, 17. Juni). Gesetz zur Sicherung von Schullaufbahnen und zur Weiterentwicklung des Schulrechts (12. Schulrechtsänderungsgesetz). Lange-Vester, A. (2013). LehrerInnen und Habitus - Der Beitrag milieuspezifischer Deutungsmuster von Lehrkräften zur Reproduktion sozialer Ungleichheit in schulischen Bildungsprozessen. Sozialwissenschaftliche Literatur Rundschau, 66(1), 51–69. Langfeldt, H., & Tent, L. (1999). Pädagogisch-psychologische Diagnostik: Band 2: Anwendungsbereiche und Praxisfelder. Göttingen: Hogrefe. Lärarförbundet (2013, 19. Dezember). IUP och omdömen – vad innebär den nya lagen? https://www.lararforbundet.se/artiklar/iup-ochomdomen-vad-innebar-den-nya-lagen [30.3.2016]. Lärarnas Riksförbund (2012). Individuella löner – kollektivt bakslag. En rapport om lönesattningen av lärare. Stockholm: LR. Larsson, H.A. (2013). Skolpolitiken. In D. Tarschys & M. Lemne (Hrsg.), Vad staten vill. Mål och ambitioner I svensk politik (S. 347-381). Möklinta: Gidlunds förlag. Larsson, J., Löfdahl, A., & Peréz Prieto, H. (2010). Rerouting: Discipline, assessment and performativity in contemporary Swedish educational discourse. Education Inquiry, 1(3), 177–195. Lehmann, R., Peek, R., Gänsfuß, R., & Husfeldt, V. (2002). Aspekte der Lernausgangslage und der Lernentwicklung - Klassenstufe 9. Ergebnisse einer Längsschnittuntersuchung in Hamburg. Hamburg: Behörde für Bildung und Sport, Amt für Schule.

Literaturverzeichnis

643

Lehmann, R., Peek, R., Pieper, I., & von Stritzky, R. (1995). Leseverständnis und Lesegewohnheiten deutscher Schüler und Schülerinnen. Weinheim: Beltz. Lenhardt, G. (2002). Die verspätete Entwicklung der deutschen Schule. Pädagogische Korrespondenz, 29, 5–22. Lerner, M. J. (1977). The justice motive: Some hypotheses as to its origins and forms. Journal of Personality, 45(1), 1–52. Lerner, M. J. (1980). The belief in a just world. Boston: Springer. Leventhal, G. S. (1976). Fairness in social relationships. In J. W. Thibaut, J. T. Spence & R. C. Carson (Hrsg.), Contemporary topics in social psychology (S. 211–239). Morristown: General Learning. Leventhal, G. S. (1980). What should be done with equity theory? New approaches to the study of fairness in social relationships. In K. J. Gergen, M. S. Greenberg & R. H. Willis (Hrsg.), Social exchange: Advances in theory and research (S. 27–55). New York: Plenum Press. Leventhal, G. S., Karuza, J., & Fry, W. R. (1980). Beyond fairness: A theory of allocation preferences. In G. Mikula (Hrsg.), Justice and social interaction: Experimental and theoretical contributions from psychological research (S. 167–218). Bern: Hans Huber. Lgr11. Läroplan för grundskolan, förskoleklassen och fritidshemmet 2011. Stockholm. Lgy11. Läroplan, examensmål och gymnasiegemensamma ämnen för gymnasieskola 2011. Stockholm. Liebeskind, U. (2012). Komparative Verfahren und Grounded Theory. In K. Schittenhelm (Hrsg.), Qualitative Bildungs- und Arbeitsmarktforschung. Grundlagen, Perspektiven, Methoden (S. 325–358). Wiesbaden: Springer Fachmedien. Liebig, S. (2002). Gerechtigkeitseinstellungen und Gerechtigkeitsurteile. Zur Unterscheidung zweier Urteilskategorien. In S. Liebig & H. Lengfeld (Hrsg.), Interdisziplinäre Gerechtigkeitsforschung. Zur Verknüpfung empirischer und normativer Perspektiven. Frankfurt a.M.: Campus. Liebig, S. (2012). Gerechtigkeit als Bedingung individueller Kooperationsbereitschaft in modernen Gesellschaften. In V. J. Vanberg (Hrsg.),

644

Literaturverzeichnis

Marktwirtschaft und soziale Gerechtigkeit. Gestaltungsfragen der Wirtschaftsordnung in einer demokratischen Gesellschaft (S. 275– 295). Tübingen: Mohr Siebeck. Liebig, S., & Sauer, C. (2016). Sociology of justice. In C. Sabbagh & M. Schmitt, Handbook of social justice theory and research (S. 37-59). New York: Springer. Liebig, S., & Wegener, B. (1995). Primäre und sekundäre Ideologien. Ein Vergleich von Gerechtigkeitsvorstellungen in Deutschland und den USA. In H.-P. Müller & B. Wegener (Hrsg.), Soziale Ungleichheit und soziale Gerechtigkeit (S. 265–293). Opladen: Leske+Budrich. Lindblad, S., Lundahl, L., Lindgren, J., & Zackari, G. (2002). Educating for the new Sweden? Scandinavian Journal of Educational Research, 46(3), 283–303. Lindenhayn, N. (2013). Rangordnung/Raumordnung: Zur kompetitiven Logik schulischer Praxis im 19. Jahrhundert. In M. Tauschek (Hrsg.), Kulturen des Wettbewerbs. Formationen kompetitiver Logiken (S. 269-288). Münster: Waxmann. Lindensjö, B., & Lundgren, U. P. (2000). Utbildningsreformer och politiskt styrning. Stockholm: HLS. Lindström, L., Lindberg, V., & Pettersson, A. (Hrsg.) (2013). Pedagogisk bedömning: Att dokumentera, bedöma och utveckla kunskap (3. Aufl.). Stockholm: Liber. Lohmann, I. (1987). Wer hat das Sitzenbleiben erfunden? Eine historische Recherche. Westermanns Pädagogische Beiträge, 39(4), 12–15. Lorenz, R., Kahnert, J., Eickelmann, B., & Bos, W. (2011). Mehr Gerechtigkeit durch Zentralabitur? Analysen einer Lehrerbefragung in NRW. Schul-Management, 42(6), 24–27. Lorenz, R., Kahnert, J., Eickelmann, B., & Bos, W. (2012). Lehrerbelastung durch zentrale Abiturprüfungen? Ergebnisse aus NordrheinWestfalen. Schul-Managment, 43(2), 29–31. Lorenz, R. (2013). Das Zentralabitur im Kontext der Bildungsgerechtigkeit: Schwierigkeit und Fairness der Abituraufgaben im Fach Englisch in NRW. Münster: Waxmann.

Literaturverzeichnis

645

Lpf 94. Läroplan för de frivilliga skolformerna Lpf 94: Gymnasieskolan, gymnasiesärskolan, den kommunala vuxenutbildningen, statens skolor för vuxna och vuxenutbildningen för utvecklingsstörda. Stockholm. Lpo 94. Läroplan för det obligatoriska skolväsendet, förskoleklassen och fritidshemmet LPO 94. Stockholm: Utbildningsdepartementet. Lübke, S.-I. (1996). Schule ohne Noten: Lernberichte in der Praxis der Laborschule. Opladen: Leske + Budrich. Lüders, M. (2001a). Dispositionsspielräume im Bereich der Schülerbeurteilung: Auch ein Beitrag zur Professions- und Organisationsforschung. Zeitschrift für Pädagogik, 47(2), 217–234. Lüders, M. (2001b). Probleme von Lehrerinnen und Lehrern mit der Beurteilung von Schülerleistungen. Zeitschrift für Erziehungswissenschaft, 4(2), 457–474. Luhmann, N., & Schorr, K.-E. (1982). Das Technologiedefizit der Erziehung und die Pädagogik. In N. Luhmann & K.-E. Schorr (Hrsg.), Zwischen Technologie und Selbstreferenz. Fragen an die Pädagogik (S. 11–40). Frankfurt a.M.: Suhrkamp. Lundahl, C. (2006). Viljan att veta vad andra vet: Kunskapsbedömning i tidigmodern, modern och senmodern skola. Stockholm: Arbetslivinstitutet. Lundahl, C. (2008). The case of Sweden: International assessments as national curriculum. In M. Lawn (Hrsg.), An atlantic crossing? The work of the International Examination Inquiry, its researchers, methods and influence (S. 157–180). Oxford: Symposium. Lundahl, C. (2009). Varför nationella prov? Framväxt, dilemman, möjligheter. Lund: Studentlitteratur. Lundahl, C. (2010). Nationella prov - ett redskap med tvetydliga syften. In C. Lundahl & M. Folke-Fichtelius (Hrsg.), Bedömning i och av skolan. Praktik, principer, politik (S. 223–240). Lund: Studentlitteratur AB. Lundahl, C. (2011). Bedömning för lärande. Stockholm: Norstedt.

646

Literaturverzeichnis

Lundahl, C. (2012). Bedömning - Att veta vad andra vet. In U. P. Lundgren, Säljö Roger & C. Liberg (Hrsg.), Lärande, skola, bildning. Grundbok för lärare (2. Aufl., S. 257–293). Stockholm: Natur & kultur. Lundahl, C., & Waldow, F. (2009). Standardisation and 'quick languages': The shape-shifting of standardised measurement of pupil achievement in Sweden and Germany. Comparative Education, 45(3), 365– 385. Lundahl, L. (2002). From centralisation to decentralisation: Governance of education in Sweden. European Educational Research Journal, 1(4), 625–636. Lundahl, L., Erixon Arreman, I., Holm, A.-S., & Lundström, U. (2014). Gymnasiet som marknad. Umeå: Boréa. Lundahl, L., Erixon Arreman, I., Lundström, U., & Rönnberg, L. (2010). Setting things right? Swedish upper secondary school reform in a 40year perspective. European Journal of Education, 45(1), 46–59. Lundgreen, P. (2000). Schule im 20. Jahrhundert. Institutionelle Differenzierung und expansive Bildungsbeteiligung. In D. Benner & H.-E. Tenorth (Hrsg.), Bildungsprozesse und Erziehungsverhältnisse im 20. Jahrhundert (42. Beiheft der Zeitschrift für Pädagogik, S. 140–165). Weinheim: Beltz. Lundgren, U. P. (2012a). Det livslånga lärandet: Att utbilda för ett kunskapssamhälle. In U. P. Lundgren, Säljö Roger & C. Liberg (Hrsg.), Lärande, skola, bildning. Grundbok för lärare (2. Aufl., S. 101–133). Stockholm: Natur & kultur. Lundgren, U. P. (2012b). En gemensam skola - utbildning blir en nödvändighet för alla. In U. P. Lundgren, Säljö Roger & C. Liberg (Hrsg.), Lärande, skola, bildning. Grundbok för lärare (2. Aufl., S. 77– 99). Stockholm: Natur & kultur. Lundström, U., & Holm, A.-S. (2011). Market competition in upper secondary education: perceived effects on teachers’ work. Policy Futures in Education, 9(2), 193-205. Maag Merki, K., & Holmeier, M. (2008). Die Implementation zentraler Abiturprüfungen. Erste Ergebnisse zu den Effekten der Einführung auf das schulische Handeln der Lehrpersonen. In E.-M. Lankes (Hrsg.),

Literaturverzeichnis

647

Pädagogische Professionalität als Gegenstand empirischer Forschung (S. 233–244). Münster: Waxmann. Maag Merki, K. (2012a). Die Einführung zentraler Abiturprüfungen – Eine (Zwischen-)Bilanz nach drei Jahren. In K. Maag Merki (Hrsg.), Zentralabitur. Die längsschnittliche Analyse der Wirkungen der Einführung zentraler Abiturprüfungen in Deutschland (S. 385–407). Wiesbaden: Springer VS. Maag Merki, K. (Hrsg.) (2012b). Zentralabitur: Die längsschnittliche Analyse der Wirkungen der Einführung zentraler Abiturprüfungen in Deutschland. Wiesbaden: Springer VS. Maier, U. (2010). Formative Assessment - Ein erfolgversprechendes Konzept zur Reform von Unterricht und Leistungsmessung? Zeitschrift für Erziehungswissenschaft, 13(2), 293–308. Maier, U. (2015). Leistungsdiagnostik in Schule und Unterricht: Schülerleistungen messen, bewerten und fördern. Bad Heilbrunn: Klinkhardt. Manderstedt, L. (2013). Växelspel med förhinder: Skärningspunkter i verksamhetsförlagd svensklärarutbildning. Dissertation, Luleå universitetet. Mannheim, K. (1980). Strukturen des Denkens. Frankfurt a.M.: Suhrkamp. Matthes, J. (1992). The operation called "Vergleichen". In J. Matthes (Hrsg.), Zwischen den Kulturen? Die Sozialwissenschaften vor dem Problem des Kulturvergleichs (S. 75–99). Göttingen: Otto Schwartz. Mau, S. (2004). Moralökonomie: Eine konzeptionelle Bestimmung aus ungleichheitssoziologischer Sicht. In P. A. Berger & V. H. Schmidt (Hrsg.), Welche Gleichheit, welche Ungleichheit? Grundlagen der Ungleichheitsforschung (S. 165–190). Wiesbaden: VS Verlag für Sozialwissenschaften. Meier, M. (2011). Praktiken des Schulerfolgs. In K. U. Zaborowski, M. Meier & G. Breidenstein (Hrsg.), Leistungsbewertung und Unterricht. Ethnographische Studien zur Bewertungspraxis in Gymnasium und Sekundarschule (S. 39–162). Wiesbaden: VS Verlag für Sozialwissenschaften.

648

Literaturverzeichnis

Mey, G., & Mruck, K. (2009). Methodologie und Methodik der Grounded Theory. In W. Kempf & M. Kiefer (Hrsg.), Forschungsmethoden der Psychologie. Zwischen naturwissenschaftlichem Experiment und sozialwissenschaftlicher Hermeneutik. Band 3: Psychologie als Natur- und Kulturwissenschaft. Die soziale Konstruktion der Wirklichkeit (S. 100– 152). Berlin: Regener. Mey, G., & Mruck, K. (2010). Grounded-Theory-Methodologie. In G. Mey & K. Mruck (Hrsg.), Handbuch Qualitative Forschung in der Psychologie (S. 614–626). Wiesbaden: VS Verlag für Sozialwissenschaften. Mey, G., & Mruck, K. (2011). Grounded-Theory-Methodologie: Entwicklung, Stand, Perspektiven. In G. Mey & K. Mruck (Hrsg.), Grounded Theory Reader (2. Aufl., S. 11–48). Wiesbaden: VS Verlag für Sozialwissenschaften. Mey, G., & Mruck, K. (Hrsg.) (2014). Qualitative Forschung: Analysen und Diskussionen - 10 Jahre Berliner Methodentreffen. Wiesbaden: Springer VS. Mickwitz, L. (2015). En reformerad lärare: Konstruktionen av en professionell och betygssättande lärare i skolpolitik och skolpraktik. Stockholm: Stockholms universitet. Mikula, G. (2002). Gerecht und ungerecht: Eine Skizze der sozialpsychologischen Gerechtigkeitsforschung. In M. Held, G. Kubon-Gilke & R. Sturn (Hrsg.), Gerechtigkeit als Voraussetzung für effizientes Wirtschaften (S. 263–283). Marburg: Metropolis. Miller, S. (2013). Die Sicht der Lehrkräfte auf Heterogenität: Ergebnisse einer quantitativen Erhebung in NRW. In E. Jürgens & S. Miller (Hrsg.), Ungleichheit in der Gesellschaft und Ungleichheit in der Schule. Eine interdisziplinäre Sicht auf Inklusions- und Exklusionsprozesse (S. 235–251). Weinheim: Juventa. Moscovici, S. (1973). Foreword. In C. Herzlich & D. Graham (Hrsg.), Health and Illness. A Social Psychological Analysis (S. ix–xiv). London, New York: Academic Press. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (19.07.1991). Förderung von Schülerinnen und Schülern bei besonderen Schwierigkeiten im Erlernen des Lesens und

Literaturverzeichnis

649

Rechtschreibens (LRS) (GABI.NW. I S. 174.). Düsseldorf. https://www.schulministerium.nrw.de/docs/Recht/Schulrecht/Erlass e/LRS-Erlass.pdf [3.6.2016]. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (2004). Kernlehrplan für die Realschule in NordrheinWestfalen Deutsch. www.schulentwicklung.nrw.de/lehrplaene/upload/lehrplaene_downl oad/realschule/rs_deutsch.pdf [3.6.2016]. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (20.12.2006). Zentrale Lernstandserhebungen (Vergleichsarbeiten). Runderlass vom 20.12.2006, (BASS 12 - 32 Nr.4). MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (2007). Kernlehrplan für den verkürzten Bildungsgang des Gymnasiums - Sekundarstufe I (G8) in Nordrhein-Westfalen – Deutsch. Bd. Nr. 3409. Frechen: Ritterbach. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (15.12.2010). Schulgesetz geändert: Kopfnoten fallen weg - Eltern entscheiden wieder über die weiterführende Schule der Kinder: Presseinformation vom 15.12.2010. https://www.schulministerium.nrw.de/docs/bp/Ministerium/Presse/ Pressemitteilungen/Archiv-2009-2012/201015_LegPer/pm_15_12_2010_pdf.pdf [7.11.2013]. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (2011a). Kernlehrplan für die Hauptschule in Nordrhein-Westfalen - Deutsch. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (2011b). Kernlehrplan und Richtlinien für die Hauptschule in Nordrhein-Westfalen - Mathematik. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (01.07.2011). Allgemeine Dienstordnung für Lehrer und Lehrerinnen, Schulleiter und Schulleiterinnen an öffentlichen Schulen (ADO). Runderlass des Kultusministeriums vom 20.09.1992, i.d.F.vom 01.07.2011.

650

Literaturverzeichnis

MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (19.07.2011). Schulpolitischer Konsens für NordrheinWestfalen: Gemeinsame Leitlinien von CDU, SPD und Bündnis 90/DIE GRÜNEN für die Gestaltung des Schulsystems in Nordrhein-Westfalen. Düsseldorf. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (2013a). Landesweite Ergebnisse der Zentralen Prüfungen am Ende der Klasse 10 (ZP10). Düsseldorf. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (2013b). Zentrale Prüfungen nach Klasse 10. Düsseldorf. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (18.10.2013). Zentrale Prüfungen am Ende der Klasse 10 der Hauptschulen, Realschulen, Sekundarschulen, Gesamtschulen im Jahr 2014. https://www.schulministerium.nrw.de/docs/bp/Ministerium/Schulve rwaltung/Schulmail/Archiv-2013/1310182/index.html [3.6.2016]. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (27.11.2013). Arbeitshilfe: Gewährung von Nachteilsausgleichen für Schülerinnen und Schüler mit Behinderungen und/oder sonderpädagogischem Förderbedarf für die Zentralen Prüfungen 10: Eine Orientierungshilfe für Schulleitungen. Düsseldorf. https://www.schulministerium.nrw.de/docs/bp/Ministerium/Schulve rwaltung/Schulmail/Archiv2013/131217/Kontext/Handreichung_ZP_10.doc [3.6.2016]. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (2014). Sonderausgabe Inklusion. Schule NRW – Amtsblatt des MSW. Düsseldorf. https://broschueren.nordrheinwestfalendirekt.de/broschuerenservic e/msw/sonderausgabe-von-schule-nrw-zum-thema-inklusion/1708 [2.12.2016]. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (2015a). Das Berufskolleg in Nordrhein-Westfalen: Bildungsgänge und Abschlüsse. Düsseldorf.

Literaturverzeichnis

651

https://broschueren.nordrheinwestfalendirekt.de/broschuerenservic e/msw/das-berufskolleg-in-nordrhein-westfalen/903 [2.12.2016]. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (2015b). Unterrichtsbeginn, Verteilung der Wochenstunden, Fünf-Tage-Woche, Klassenarbeiten und Hausaufgaben an allgemeinbildenden Schulen: Runderlass des Ministeriums für Schule und Weiterbildung vom 05.05.2015 (ABI.NRW.S.270). MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (2015c, 15. August). Schulgesetz für das Land Nordrhein-Westfalen: NRW - SchulG. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (2016a). Die Grundschule in Nordrhein-Westfalen. Informationen für Eltern. Düsseldorf. https://broschueren.nordrheinwestfalendirekt.de/broschuerenservic e/staatskanzlei/die-grundschule-in-nordrhein-westfaleninformationen-fuer-eltern/1652 [16.12.2016]. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (2016b). Kerncurriculum für die Ausbildung im Vorbereitungsdienst für Lehrämter in den Zentren für schulpraktische Lehrerausbildung und in den Ausbildungsschulen. Runderlass vom 02.09.2016. https://www.schulministerium.nrw.de/docs/bp/Lehrer/Lehrkraftwerden/Vorbereitungsdienst/Kerncurriculum.pdf [16.12.2016]. MSW = Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen (2016c). Das Schulwesen in Nordrhein-Westfalen aus quantitativer Sicht 2015/16. Statistische Übersicht Nr. 391 – 1. Auflage. Müller, D. K., & Zymek, B. (1987). Sozialgeschichte und Statistik des Schulsystems in den Staaten des Deutschen Reichs, 1800-1945. Datenhandbuch zur deutschen Bildungsgeschichte. Bd. II. Höhere und mittlere Schulen, 1. Teil. Göttingen: Vandenhoeck & Ruprecht. Neumann, M., Nagy, G., Trautwein, U., & Lüdtke, O. (2009). Vergleichbarkeit von Abiturleistungen: Leistungs- und Bewertungsunterschiede zwischen Hamburger und Baden-Württemberger Abiturienten und

652

Literaturverzeichnis

die Rolle zentraler Abschlussprüfungen. Zeitschrift für Erziehungswissenschaft, 12, 691–714. Nichols, S., & Berliner, D. (2007). Collateral damage: How high-stakes testing corrupts America's schools. Cambridge, MA: Harvard Educational Group. Niehues, N., & Rux, J. (2006). Schul- und Prüfungsrecht, Bd. 1: Schulrecht. München: C.H. Beck. Nohl, A.-M. (2007). Kulturelle Vielfalt als Herausforderung für pädagogische Organisationen. Zeitschrift für Erziehungswissenschaft, 10(1), 61–74. Nohl, A.-M. (2009). Der Mehrebenenvergleich als Weg zum kontextuierten Ländervergleich. Methodologische Überlegungen anhand eines internationalen Projektes zur Migrationsforschung. In S. Hornberg, i. Dirim, G. Lang-Wojtasik & P. Mecheril (Hrsg.), Beschreiben - Verstehen - Interpretieren. Stand und Perspektiven International und Interkulturell Vergleichender Erziehungswissenschaft in Deutschland (S. 95-110). Münster: Waxmann. Nyman, E. (09.07.2014). Studenter väljer bort läraryrket. Svenska Dagbladet, https://www.svd.se/studenter-valjer-bort-lararyrket [04.12.2016]. OECD (2016). Lehrergehälter. In OECD (Hrsg.), Factbook 2015-2016: Economic, Environmental and Social Statistics. Paris: OECD Publishing. https://www.oecdilibrary.org/lehrergehalter_5jlv4dkx70q4.pdf?itemId=%2Fcontent%2Fc omponent%2Ffactbook-2015-73-de&mimeType=pdf [16.2.2017]. Oehme, F. (2015). Konzeptionen „gerechter Schulinspektion“ aus einer institutionen- und einstellungsanalytischen Perspektive. Ein Blick nach England. In V. Manitius, B. Hermstein, N. Berkemeyer & W. Bos (Hrsg.), Zur Gerechtigkeit von Schule. Theorien, Konzepte, Analysen. (S. 293–315). Münster: Waxmann. Oerke, B. (2012). Emotionaler Umgang von Lehrkräften und Schüler/innen mit dem Zentralabitur: Unsicherheit, Leistungsdruck und Leistungsattributionen. In K. Maag Merki (Hrsg.), Zentralabitur. Die längs-

Literaturverzeichnis

653

schnittliche Analyse der Wirkungen der Einführung zentraler Abiturprüfungen in Deutschland (S. 119–153). Wiesbaden: Springer VS. Oevermann, U. (1996). Theoretische Skizze einer revidierten Theorie professionellen Handelns. In A. Combe & W. Helsper (Hrsg.), Pädagogische Professionalität. Untersuchungen zum Typus pädagogischen Handelns (S. 70–183). Frankfurt a. M.: Suhrkamp. Ohle, A., & McElvany, N. (2015). Teachers` diagnostic competence and their practical relevance.Special issue editorial. Journal for Educational Research Online, 7(2), 5-10. Olovsson, T. G. (2015). Det kontrollera(n)de klassrummet: Bedömningsprocessen i svensk grundskolepraktik i relation till införandet av nationella skolreformer. Umeå: Umeå universitet. Olsson, E. (2011, 17. Dezember). Studentexamen kommer tillbaka. Dagens Nyheter. http://www.dn.se/nyheter/sverige/studentexamenkommer-tillbaka/ [17.3.2016]. Oser, F., & Blömeke, S. (2012). Überzeugungen von Lehrpersonen: Einführung in den Thementeil. Zeitschrift für Pädagogik, 58(4), 415–421. Oser, F., & Spychiger, M. (2005). Lernen ist schmerzhaft: Zur Theorie des negativen Wissens und zur Praxis der Fehlerkultur. Weinheim: Beltz. Otto, S., & Kühn, S. M. (2014). Zwischen Tradition und Innovation: Eine Analyse zentraler Prüfungsaufgaben im Fach Deutsch im nationalen Vergleich. Schulpädagogik heute, 5(9), 1–16. Pajares, M. F. (1992). Teacher's beliefs and educational research: Cleaning up a messy construct. Review of Educational Research, 62(3), 307–332. Palowski, M. (2016). Der Diskurs des Versagens: Nichtversetzung und Klassenwiederholung in Wissenschaft und Medien. Wiesbaden: Springer VS. Pandero, E., & Jönsson, A. (2013). The use of scoring rubrics for formative assessment purposes revisited: A review. Educational Research Review, 9, 129–144. Paschert, B. (2017). Seiteneinsteiger*innen machen Schule. Potenziale nutzen – professionell qualifizieren. nds – Zeitschrift der Bildungsgewerkschaft (GEW), 69(9), 22.

654

Literaturverzeichnis

Peisert, H. (1967). Soziale Lage und Bildungschancen in Deutschland. München: Piper. Pfahl, L. (2011). Techniken der Behinderung. Der deutsche Lernbehinderungsdiskurs, die Sonderschule und ihre Auswirkungen auf Bildungsbiographien. Bielefeld: transcript Verlag. Prenzel, M., Schütte, K., Rönnebeck, S., Senkbeil, M., Schöps, K., & Carstensen, C. H. (2008). Der Blick in die Länder. In M. Prenzel, C. Artelt, J. Baumert, W. Blum, M. Hammann, E. Klieme et al. (Hrsg.), PISA 2006 in Deutschland. Die Kompetenzen der Jugendlichen im dritten Ländervergleich (S. 149–264). Münster: Waxmann. Preuße, D., & Zlatkin-Troitschanskaia, O. (2008). Kollektiv geteilte mentale Modelle der Steuerungsakteure von Reformstrategien im öffentlichen Schulwesen. In E.-M. Lankes (Hrsg.), Pädagogische Professionalität als Gegenstand empirischer Forschung (S. 267–278). Münster, New York, München, Berlin: Waxmann. Prodromou, L. (1995). The backwash effect: From testing to teaching. ELT Journal, 49(1), 13–25. Przyborski, A., & Wohlrab-Sahr, M. (2010). Qualitative Sozialforschung: Ein Arbeitsbuch (3., korrigierte Aufl.). München: Oldenbourg. QUA-LiS = Qualitäts- und Unterstützungsagentur - Landesinstitut für Schule NRW (2015). Landesweite Ergebnisse der Zentralen Prüfungen am Ende der Klasse 10 (ZP10). Düsseldorf. https://www.standardsicherung.schulministerium.nrw.de/cms/uploa d/zp10/berichte/ZP10_Ergebnisbericht_2015.pdf. Rabenstein, K., Reh, S., Ricken, N., & Idel, T.-S. (2013). Ethnographie pädagogischer Differenzordnungen. Zeitschrift für Pädagogik, 59(5), 668–690. Rabenstein, K., Reh, S., Steinwand, J., & Breuer, A. (2014). Jahrgang und Entwicklung. Zur Konstruktion von Leistung in jahrgangsgemischten Lerngruppen. In B. Kleiner & N. Rose (Hrsg.), (Re-)Produktion von Ungleichheiten im Schulalltag. Judith Butlers Konzept der Subjektivation in der erziehungswissenschaftlichen Forschung (S. 135–154). Opladen: Budrich.

Literaturverzeichnis

655

Rabo, A. (2007). Reorganising teacher education in Sweden: Paradoxes of 'diversity'. In M. Carlson, A. Rabo & F. Gök (Hrsg.), Education in 'multicultural' societies. Turkish and Swedish perspectives (S. 35–50). London, New York: Svenska forskningsinstitutet i Istanbul. Rademacher, S. (2013). Fallvergleich und Kulturvergleich: Methodologische Implikationen einer kulturvergleichenden qualitativen Forschung. In M. Hummrich & S. Rademacher (Hrsg.), Kulturvergleich in der qualitativen Forschung. Erziehungswissenschaftliche Perspektiven und Analysen (S. 65–77). Wiesbaden: VS Verlag für Sozialwissenschaften. Radtke, F.-O. (2004). Die Illusion der meritokratischen Schule. Lokale Konstellationen der Produktion von Ungleichheit im Erziehungssystem. In K. Bade & M. Bommes (Hrsg.), Migration Integration - Bildung. Grundfragen und Problembereiche (IMISBeiträge 23, S. 143–178). Osnabrück: Institut für Migrationsforschung und Interkulturelle Studien (IMIS), Universität Osnabrück. Radtke, F.-O., & Gomolla, M. (2002). Institutionelle Diskriminierung. Die Herstellung ethnischer Differenz in der Schule. Opladen: Leske + Budrich. Raveaud, M. (2006). From assessment practices to conceptions of equity: France and England compared. In L. Moreno Herrera, G. Jones & J. Rantala (Hrsg.), Enacting equity in education. Towards a comparison of equitable practices in different European local contexts (S. 97–117). Helsinki. Rawls, J. (1971). A theory of justice. Cambridge: Belknap Press of Harvard University Press. Rawls, J. (1994). Gerechtigkeit als Fairneß: Politisch und nicht metaphysisch. In A. Honneth (Hrsg.), Kommunitarismus. Eine Debatte über die moralischen Grundlagen moderner Gesellschaften (Theorie und Gesellschaft, S. 36–67). Frankfurt, New York: Campus Verlag. Regeringens Proposition 1988/89:4. Skolans utveckling och styrning. Stockholm: Utbildningsdepartementet.

656

Literaturverzeichnis

Regeringens Proposition 1989/90:41. Kommunalt huvudmannaskap för lärare, slolledare, biträdande skolledare och syofunktionärer. Stockholm: Utbildningsdepartementet. Regeringens Proposition 1991/92:95. Om valfrihet och fristående skolor. Stockholm: Riksdagstryck. Regeringens Proposition 1992/93:230. Valfrihet i skolan. Stockholm: Riksdagstryck. Regeringens Proposition 2006/07:69. Förbättrad ordning, trygghet och studiero i skolan. Stockholm: Utbildningsdepartementet. Regeringens Proposition 2009/10:89. Bäst i klassen – en ny lärarutbildning. Stockholm: Regeringenskansliet. Reh, S. (2005). Warum fällt es Lehrerinnen und Lehrern so schwer, mit Heterogenität umzugehen? Historische und empirische Deutungen. Die Deutsche Schule, 97(1), 76–86. Reichertz, J. (2013). Gemeinsam interpretieren: Die Gruppeninterpretation als kommunikativer Prozess. Wiesbaden: Springer VS. Resh, N. (2009). Justice in grades allocation: Teachers' perspective. Social Psychology of Education: An International Journal, 12(3), 315– 325. Resh, N., & Sabbagh, C. (2016). Justice and education. In C. Sabbagh & M. Schmitt (Hrsg.), Handbook of social justice theory and research (S. 349–367). New York: Springer. Resnick, L., Nolan, K., & Resnick, D. (1995). Benchmarking education standards. Educational Evaluation and Policy Analysis, 17(4), 438– 461. Reusser, K. (2004). Co-constructivism in educational theory and practice. In N. J. Smelser & P. B. Baltes (Hrsg.), International encyclopedia for the social and behavioral sciences (S. 2058–2062). London: Elsevier. Reusser, K., & Pauli, C. (2014). Berufsbezogene Überzeugungen von Lehrerinnen und Lehrern. In E. Terhart, H. Bennewitz & M. Rothland (Hrsg.), Handbuch der Forschung zum Lehrerberuf (2. überarbeitete und erweiterte Auflage) (S. 642–661). Münster, New York: Waxmann. Reusser, K., Pauli, C., & Elmer, A. (2011). Berufsbezogene Überzeugungen von Lehrerinnen und Lehrern. In E. Terhart, H. Bennewitz & M.

Literaturverzeichnis

657

Rothland (Hrsg.), Handbuch der Forschung zum Lehrerberuf (S. 478– 495). Münster, New York, München, Berlin: Waxmann. Rheinberg, F. (1980). Leistungsbewertung und Lernmotivation. Göttingen: Hogrefe. Rheinberg, F. (1981). Schulische Leistung und Chancengleichheit. Pädagogische Welt, (August), 511–519. Rheinberg, F. (2002). Bezugsnormen und schulische Leistungsbeurteilung. In F. E. Weinert (Hrsg.), Leistungsmessungen in Schulen (2. Aufl., S. 59–71). Weinheim, Basel: Beltz. Richter, D., Böhme, K., Becker, M., Pant, H. A., & Stanat, P. (2014). Überzeugungen von Lehrkräften zu den Funktionen von Vergleichsarbeiten: Zusammenhänge zu Veränderungen im Unterricht und den Kompetenzen von Schülerinnen und Schülern. Zeitschrift für Pädagogik, 60(2), 225–244. Ringarp, J. (2011a). Der kommunaisierte Lehrer: Das Professionsverständnis der schwedischen Lehrer auf dem Prüfstand des Wohlfahrtsstaates. Tertium Comparationis, 17(1), 19-33. Ringarp, J. (2011b). Skolans lärarkårer. In E. Larsson & J. Westberg (Hrsg.), Utbildningshistoria. En introduktion (S. 357-371). Lund: Studentlitteratur. Ringarp, J., & Rothland, M. (2008). Sündenfälle im Bildungsparadies? Außen- und Innenansichten des schwedischen Schulwesens zwischen Verklärung und Ernüchterung. Zeitschrift für Pädagogik, 54(4), 498– 515. Ringarp, J., & Rothland, M. (2010). Is the grass always greener? The effect of the PISA results on education debates in Sweden and Germany. European Educational Research Journal, 9(3), 422–430. Rippl, S., & Seipel, C. (2008). Methoden kulturvergleichender Sozialforschung: Eine Einführung. Wiesbaden: VS Verlag für Sozialwissenschaften. Roderick, M. (1994). Grade retention and school dropout: Investigating the association. American Educational Research Journal, 31(4), 729– 759.

658

Literaturverzeichnis

Roßbach, H.-G., & Tietze, W. (2006). Sitzenbleiben. In D. H. Rost (Hrsg.), Handwörterbuch pädagogische Psychologie (3., überarb. und erw. Aufl., S. 706–712). Weinheim: Beltz, PVU. Rosengren, K.-E., & Öhngren, B. (1997). An evaluation of Swedish research in education. Uppsala: Uppsala Universitet. Sabbagh, C., & Resh, N. (2016). Unfolding justice research in the realm of education. Social Justice Research, 29(1), 1–13. Sacher, W. (2001). Leistungen entwickeln, überprüfen und beurteilen. Grundlagen, Hilfen und Denkanstöße für alle Schularten (3. überarb. Aufl.). Bad Heilbrunn: Klinkhardt. Sacher, W. (2014). Leistungen entwickeln, überprüfen und beurteilen: Bewährte und neue Wege für die Primar- und Sekundarstufe (6. Aufl.). Bad Heilbrunn: Klinkhardt. Sadler, R. D. (1998). Formative assessment: Revisiting the territory. Assessment in Education: Principles, Policy & Practice, 5(1), 77–84. Sander, T., Rolff, H.-G., & Winkler, G. (1967). Die demokratische Leistungsschule: Grundzüge der Gesamtschule. Hannover: Schroedel. Schäfer, A. (2015). Schulische Leistungsdiskurse: Zwischen Gerechtigkeitsversprechen und pharmazeutischem Hirndoping. Paderborn: Schöningh. Schelsky, H. (1957). Schule und Erziehung in der industriellen Gesellschaft. Würzburg: Werkbund Verlag. Schieferdecker, R. (2016). Orientierungen von Lehrerinnen und Lehrern im Themenfeld Heterogenität: Eine rekonstruktive Analyse. Opladen: Barbara Budrich. Schittenhelm, K. (2012). Sampling und die Suche nach fallübergreifender Gültigkeit. Vergleichende Analysen von Statusübergängen zwischen Bildungsabschluss und Arbeitsmarkt. In dies. (Hrsg.), Qualitative Bildungs- und Arbeitsmarktforschung. Grundlagen, Perspektiven, Methoden (S. 407-437). Wiesbaden: Springer Fachmedien. Schlink, B. (2004). Der Preis der Gerechtigkeit. Merkur. Deutsche Zeitschrift für europäisches Denken, 58(667), 983–997.

Literaturverzeichnis

659

Schrader, F.-W. (2006). Diagnostische Kompetenz von Eltern und Lehrern. In D. H. Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie (S. 95-100). Weinheim: Beltz. Schrader, F.-W. (2008). Diagnoseleistungen und diagnostische Kompetenzen von Lehrkräften. In W. Schneider & M. Hasselhorn (Hrsg.), Handbuch der Pädagogischen Psychologie (S. 168–177). Göttingen: Hogrefe. Schrader, F.-W. (2011). Lehrer als Diagnostiker. In E. Terhart, H. Bennewitz & M. Rothland (Hrsg.), Handbuch der Forschung zum Lehrerberuf (S. 683–698). Münster, New York, München, Berlin: Waxmann. Schriewer, J. (2003). Problemdimensionen sozialwissenschaftlicher Komparatistik. In H. Kaelble & J. Schriewer (Hrsg.), Vergleich und Transfer. Komparatistik in den Sozial-, Geschichts- und Kulturwissenschaften (S. 11–54). Frankfurt a. M.: Campus. Schriewer, J. (2006). Comparative social science: Characteristic problems and changing problem solutions. Comparative Education, 42(3), 299– 336. Schriewer, J. (2013). Vergleichende Erziehungswissenschaft als Forschungsfeld. In M. Hummrich & S. Rademacher (Hrsg.), Kulturvergleich in der qualitativen Forschung. Erziehungswissenschaftliche Perspektiven und Analysen (S. 15–41). Wiesbaden: VS Verlag für Sozialwissenschaften. Schröer, N. (2013). Zur hermeneutisch-wissenssoziologischen Auslegung des Fremden. Interpretieren mit Unterstützung kulturvertrauter CoInterpreten. In R. Bettmann & M. Roslon (Hrsg.), Going the distance. Impulse für die interkulturelle Qualitative Sozialforschung (S. 61–76). Wiesbaden: Springer VS. SchulG NRW = Schulgesetz für das Land Nordrhein-Westfalen. Ministerium für Schule und Weiterbildung des Landes Nordrhein-Westfalen. https://www.schulministerium.nrw.de/docs/Recht/Schulrecht/Schulg esetz/ [12.4.2015]. Schütz, A. (2004). Common-Sense und wissenschaftliche Interpretation menschlichen Handelns. In J. Strübing & B. Schnettler (Hrsg.), Metho-

660

Literaturverzeichnis

dologie interpretativer Sozialforschung. Klassische Grundlagentexte (S. 155–200). Konstanz: UVK Verlagsgesellschaft. Schütze, F. (1976). Zur Hervorlockung und Analyse von Erzählungen thematisch relevanter Geschichten im Rahmen soziologischer Feldforschung. In Arbeitsgruppe Bielefelder Soziologen (Hrsg.), Kommunikative Sozialforschung (S. 159–260). München: Fink. Schütze, F. (1978). Die Technik des narrativen Interviews in Interaktionsfeldanalysen - dargestellt an einem Projekt zur Erforschung von kommunalen Machtstrukturen (Arbeitsberichte und Forschungsmaterialien Nr. 1). Bielefeld: Universität Bielefeld; Fakultät für Soziologie. Schütze, F., Bräu, K., Liermann, H., Prokopp, K., Speth, M., & Wiesemann, J. (1996). Überlegungen zu Paradoxien des professionellen Lehrerhandelns in den Dimensionen der Schulorganisation. In W. Helsper, H.-H. Krüger & H. Wenzel (Hrsg.), Schule und Gesellschaft im Umbruch. Band 1: Theoretische und internationale Perspektiven (S. 333–377). Weinheim: Juventa. Schützenmeister, J. (2002). Professionalisierung und Polyvalenz in der Lehrerausbildung. Marburg: Tectum. Schwabe, F., McElvany, N., & Gebauer, M. (2013). (Test-)Fainess - eine Herausforderung an standardisierte Leistungsdiagnostik. In N. McElvany, M. M. Gebauer, W. Bos & H.-G. Holtappels (Hrsg.), Jahrbuch Schulentwicklung Band 17. Sprachliche, kulturelle und soziale Heterogenität in der Schule als Herausforderung und Chance der Schulentwicklung (S. 217–236). Weinheim, Basel: Beltz Juventa. Selghed, B. (2004). Ännu icke godkänt: lärares sätt att erfara betygssystemet och dess tillämpling. Lund: Lunds universitet. SFS 2010:2039. Gymnasieförordning. Stockholm: Utbildningsdepartementet. SFS 2011:185. Skolförordning. Stockholm: Utbildningsdepartementet. SFS 2011:326. Förordning om behörighet och legitimation för lärare och förskollärare. Stockholm: Utbildningsdepartementet. Sirén, E.-L. (05.06.2013). Sex av tio lärare överväger att lämna läraryrket. Dagens Nyheter. https://www.dn.se/debatt/sex-av-tio-larareovervager-att-lamna-lararyrket/ [04.12.2016].

Literaturverzeichnis SKOLFS

661

1994:11. Skolverkets föreskrifter om betygskriterier i gymnasieskolan och inom gymnasial vuxenutbildning. [aufgehoben am 27.06.1997]. SKOLFS 1995:65. Skolverkets föreskrifter om betygskriterier i grundskolan. [aufgehoben am 01.07.2000]. SKOLFS 2010:37 . Förordning om läroplan för grundskolan, förskoleklassen och fritidshemmet. SKOLFS 2010:250. Förordning om läroplan för specialskolan. SKOLFS 2011:19. Föreskrifter om kunskapskrav i grundskolans ämnen. SKOLFS 2011:185. Föreskrifter om ämnesprov 3, 6 och 9. SKOLFS 2014:50. Föreskrifter om utformningen av terminsbetyg i grundskolan, grundsärskolan, specialskolan och sameskolan. Skolinspektionen (2010). Kontrollrättning av nationella prov i grundskolan och gymnasieskolan: Redovisning av regeringsuppdrag Dnr. U2009/4877/G. Stockholm. Skolinspektionen (2011). Lika eller olika? Omrättning av nationella prov i grundskolan och gymnasieskolan: Redovisning av regeringsuppdrag, Dnr. U2009/4877/G. Stockholm. Skolinspektionen (2013a). Olikheterna är för stora: Omrättning av nationella prov i grundskolan och gymnasieskolan, 2013. Stockholm: Skolinspektionen. Skolinspektionen (2013b). Tillsyn av bedömning och betygssättning: Med fokus på skolor med stora avvikelser i förhållande till Skolinspektionen omrättning och i relationen mellan nationella prov och slutbetyg (Tillsynsrapport Nr. T-2013:01). Stockholm. Skolinspektionen (2014a). Uppenbar risk för felaktiga betyg: En kortrapport om likvärdighet och kvalitet i skolors betygssättning (Kvalitetsgranskning Nr. Rapport 2014:08). Stockholm. Skolinspektionen (2014b). Lärares och förskollärares introduktionsperiod (Dnr 40-2014:1396). Stockholm. Skollag (2010:800). Svensk Riksdag, 23.06.2010. Skolöverstyrelsen (1962). Läroplan för grundskolan. Stockholm.

662

Literaturverzeichnis

Skolverket (1994). Betygsboken - om betygskriterier i ett nytt betygssystem för gymnasieskolan och gymnasial vuxenutbildning. Stockholm. Skolverket (2000). Nationella kvalitetsgranskningar 2000. Helheten i utbildning. Utbildning på entreprenad. Betygssättningen. Stockholm: Liber. Skolverket (2005). National assessment and grading in the Swedish school system. Stockholm. Skolverket (2009). Bedömaröverensstämmelse vid bedömning av nationella prov. Stockholm. Skolverket (2011a). Kommentarmaterial till kursplanen i svenska. Stockholm. Skolverket (2011b). Kunskapsbedömning i skolan: Praxis, begrepp, problem och möjligheter. Stockholm. Skolverket (2011c). Planering och genomförande av undervisningen: För grundskolan, grundsärskolan, specialskolan och sameskolan (Skolverkets Allmänna Råd). Stockholm. Skolverket (05.04.2011). Pedagogisk personal i skola och vuxenutbilding läsåret 2010/11 (pressmeddelande). Stockholm. Skolverket (Hrsg.) (2012a). Bedömning och betygssättning i gymnasieskolan (Allmänna råd). Stockholm. Skolverket (Hrsg.) (2012b). Betygsskalan och betygen B och D: En handledning. Stockholm. Skolverket (2013a). Sambedömning i skolan: Exempel och forskning. Stockholm. Skolverket (2013b). Legitimation för lärare och förskollärare. Introduktionsperiod och kompetensprofiler för lärare och förskollärare (Kommentarer till föreskrifter, Reviderad version). Stockholm. Skolverket (2013c). Lärarnas yrkesvardag. En nationell kartläggning av grundskollärares tidsanvändning. Stockholm. Skolverket (2014a). Arbete med extra anpassningar, särskilt stöd och åtgärdsprogram: Allmänna råd med kommentarer. Stockholm.

Literaturverzeichnis

663

Skolverket (2014b). Bedömningsaspekter: Stödmaterial. Stockholm: Skolverket. Skolverket (2014c). Lärarnas uppfattningar om 2011 års gymnasiereform: Rapport 415. Stockholm. Skolverket (2014d). Tidigare betygssystem. https://www.skolverket.se/bedomning/betyg/tidigare-betygssystem1.46885 [26.2.2017]. Skolverket (2014e). Legitimation och behörighet för lärare och förskollärare. Juridisk vägledning. Stockholm. Skolverket (2015a). Skolreformer i praktiken: Hur reformerna landada i grundskolans vardag 2011 - 2014 (Rapport 418). Stockholm. Skolverket (2015b). Skolreformer i praktiken: Hur reformerna landade i grundskolans vardag 2011-2014 (Sammanfattning av rapport 418) (Resultaten i koncentrat). Skolverket (2015c, 10. April). Läs- och skrivsvårigheter och prov som prövar förmågan att läsa. http://www.skolverket.se/bedomning/nationellaprov/anpassning/las-och-skrivsvarigheter [11.7.2016]. Skolverket (2016a). Grundläggande behörighet till universitet och högskolestudier för elever på yrkesprogram i gymnasieskolan år 2016. https://www.skolverket.se/statistik-och-utvardering/statistik-itabeller/gymnasieskola/betyg-och-studieresultat [30.3.2017]. Skolverket (2016b). Till dig som ska sätta betyg. http://www.skolverket.se/polopoly_fs/1.250306!/Om%20B%20och% 20D_f%C3%A4rg.pdf [8.12.2016]. Skolverket (2016c). Utvärdering av den nya betygsskalan samt kunskapskravens utformning. Stockholm: Skolverket. Skolverket (2017). Elever som avslutat årskurs 9 läsåren 2011/122015/16 och ej nått kunskapskraven för lägst betyg E. https://www.skolverket.se/statistik-och-utvardering/statistik-itabeller/grundskola/betyg-ak-9 [30.3.2017]. Smit, R. (2008). Formative Beurteilung im kompetenz- und standardorientierten Unterricht. Beiträge zur Lehrerbildung, 26(3), 383–392.

664

Literaturverzeichnis

Smit, R. (2009). Die formative Beurteilung und ihr Nutzen für die Entwicklung von Lernkompetenz: Eine empirische Studie in der Sekundarstufe. Hohengehren: Schneider. Solga, H., & Dombrowski, R. (2009). Soziale Ungleichheiten in schulischer und außerschulischer Bildung. Stand der Forschung und Forschungsbedarf (Hans-Böckler-Stiftung, Arbeitspapier 171). Düsseldorf: Setzkasten GmbH. http://www.boeckler.de/pdf/p_arbp_171.pdf [21.2.2013]. Solga, H. (2013). Meritokratie - die moderne Legitimation ungleicher Bildungschancen. In P. A. Berger & H. Kahlert (Hrsg.), Institutionalisierte Ungleichheiten. Wie das Bildungswesen Chancen blockiert (3. Aufl., S. 19–38). Weinheim, München: Beltz Juventa. SOU 1992:94. Skola för bildning. Stockholm: Utbildningsdepartementet. SOU 2002:120. Åtta vägar till kunskap - en ny struktur för gymnasieskolan. Statistisches Bundesamt (2016). Schulen auf einen Blick. Wiesbaden (Fachserie 11). https://www.destatis.de/DE/Publikationen/Thematisch/BildungForsc hungKultur/Schulen/BroschuereSchulenBlick0110018169004.pdf?__blob=pu blicationFile [7.4.2017]. Statistiska Centralbyrån (2013). Lönestrukturstatistik. Genomsnittlig grund- och månadslön samt kvinnors lön i procent av mäns lön efter sektor, yrkesgrupp (SSYK), kön och ålder. År 2004-2013. http://www.statistikdatabasen.scb.se/pxweb/sv/ssd/START__AM__A M0110__AM0110B/LonYrkeAlder/?rxid=843acb05-3205-4ca2-abf206ef38b1c634 [04.12.2016]. Steiner-Khamsi, G. (2010). The politics and economics of comparison. Comparative Education Review, 54(3), 323–342. Steiner-Khamsi, G., & Stolpe, I. (2006). Educational import: Local encounters with global forces in Mongolia. New York: Palgrave Macmillan. Stojanov, K. (2011). Bildungsgerechtigkeit: Rekonstruktionen eines umkämpften Begriffs. Wiesbaden: VS Verlag für Sozialwissenschaften.

Literaturverzeichnis

665

Stouffer, S. A., Suchman, E. A., DeVinney, L. C., Star, S. A., & Williams, R. M. (1949). The American soldier: Adjustment during army life. Clinton, MA: Colonial. Straehler-Pohl, H. (2014). Mathematikunterricht im Kontext eingeschränkter Erwartungen. Beiträge zu einer soziologischen Theorie des Unterrichts. Dissertation, Freie Universität. Berlin. Strauss, A. L. (1994). Grundlagen qualitativer Sozialforschung: Datenanalyse und Theoriebildung in der empirischen soziologischen Forschung. München: W. Fink. Strauss, A. L., & Corbin, J. M. (1996). Grounded Theory: Grundlagen Qualitativer Sozialforschung. Weinheim: Beltz. Strauss, A. L., & Corbin, J. M. (1998). Basics of qualitative research: Techniques and procedures for developing Grounded Theory (2. Aufl.). Thousand Oaks: Sage Publications. Streckeisen, U., Hänzi, D., & Hungerbühler, A. (2007). Fördern und Auslesen: Deutungsmuster von Lehrpersonen zu einem beruflichen Dilemma. Wiesbaden: VS Verlag für Sozialwissenschaften. Streckeisen, U., Hänzi, D., & Hungerbühler, A. (2009). Zur Binnendifferenzierung des Volksschullehrberufs: Deutungsmuster von Lehrpersonen zum Dilemma von Fördern und Auslesen. In M. Pfadenhauer (Hrsg.), Profession, Habitus und Wandel (S. 67–94). Frankfurt a.M.: Lang. Stroet, K., Opdenakker, M.-C., & Minnaert, A. (2013). Effects of need supportive teaching on early adolescents' motivation and engagement: A review of the literature. Educational Research Review, 9, 65– 87. Strübing, J. (2008). Grounded Theory: Zur sozialtheoretischen und epistemologischen Fundierung des Verfahrens der empirisch begründeten Theoriebildung (2. Aufl.). Wiesbaden: VS Verlag für Sozialwissenschaften. Strübing, J. (2013). Qualitative Sozialforschung: Eine komprimierte Einführung für Studierende. München: Oldenbourg.

666

Literaturverzeichnis

Tata, J. (2005). The influence of national culture on the perceived fairness of grading procedures: A comparison of the United States and China. The Journal of Psychology, 139(5), 401–412. Telhaug, A. O., Medias, O. A., & Aasen, P. (2006). The Nordic model of education: Education as part of the political system in the last 50 years. Scandinavian Journal of Educational Research, 50(3), 245–283. Tenorth, H.-E. (2003). Schulmänner, Volkslehrer und Unterrichtsbeamte. Friedrich Adolph Wilhelm Diesterweg, Friedrich Wilhelm Dörpfeld, Friedrich Dittes. In H.-E. Tenorth (Hrsg.), Klassiker der Pädagogik. Bd. 1: Von Erasmus bis Helene Lange (S. 224–245). München: Beck. Terhart, E. (1996). Berufskultur und professionelles Handeln bei Lehrern. In A. Combe & W. Helsper (Hrsg.), Pädagogische Professionalität. Untersuchungen zum Typus pädagogischen Handelns (S. 448–471). Frankfurt a. M.: Suhrkamp. Terhart, E. (1999). Zensurengebung und innerschulisches Selektionsklima - die Rolle der Schulleitung. Zeitschrift für Soziologie der Erziehung und Sozialisation, 19(3), 277–292. Terhart, E. (2004). Struktur und Organisation der Lehrerbildung in Deutschland. In S. Blömeke, P. Reinhold, G. Tulodziecki & J. Wildt (Hrsg.), Handbuch Lehrerbildung (S. 36-59). Bad Heilbrunn: Klinkhardt. Terhart, E. (2008). Giving marks - constructing differences. Explorations in the micro-politics of selection in schools. In H.-H. Krüger, W. Helsper, G. Foljanty-Jost, R.-T. Kramer & M. Hummrich (Hrsg.), Family, school, youth culture. International perspectives of pupil research (S. 151–161). Frankfurt a.M., New York: Peter Lang. Terhart, E. (2009). Schüler beurteilen - Zensuren geben: Wie Lehrerinnen und Lehrer mit einem leidigen, aber unausweichlichen Element ihres Berufsalltags umgehen. In S.-I. Beutel & W. Vollstädt (Hrsg.), Leistung ermitteln und bewerten (3. Aufl., S. 39–50). Hamburg: Bergmann & Helbig. Terhart, E. (2011a). Die Beurteilung von Schülern als Aufgabe des Lehrers: Forschungslinien und Forschungsergebnisse. In E. Terhart, H. Bennewitz & M. Rothland (Hrsg.), Handbuch der Forschung zum Leh-

Literaturverzeichnis

667

rerberuf (S. 699–717). Münster, New York, München, Berlin: Waxmann. Terhart, E. (2011b). Lehrerbildung: Stichworte zu Organsation, Kultur, Disziplin. Erziehungswissenschaft, 22(43), 113-117. Terhart, E. (2011c). Über das langsame Bohren dicker Bretter. Ein kurzer Rückblick auf zehn Jahre Lehrerbildungsreform. In K.-E. Hillesheim & B. Weber (Hrsg.), Perspektiven der Lehrerbildung. Zum Auftrag der Zentren für schulpraktische Lehrerausbildung. Festschrift für Reinhard Zörner (S. 413-417) Münster: LIT. Terhart, E. (2014). Standards für die Lehrerbildung: Bildungswissenschaften – nach zehn Jahren. DDS Die Deutsche Schule, 106(4), 300-323. Terhart, E., Hellekamps, S., & Rothland, M. (Hrsg.). Handbuch der Forschung zum Lehrerberuf (2. überarbeitete und erweiterte Auflage). Münster: Waxmann. Terhart, E., Langkau, T., & Lüders, M. (1999). Selektionsentscheidungen als Problembereich professionellen Lehrerhandelns.: Abschlussbericht an die DFG. Bochum: Ruhr-Universität Bochum, Institut für Pädagogik. Tholin, J. (2006). Att kunna klara sig i ökänd natur: en studie av betyg och betygskriterier - historiska betingelser och implementering av ett nytt system. Borås: Högskolan i Borås. Thomson, C. (19.10.2015). Lärarna tvingas sätta betyg på andras elever. Dagens Nyheter. http://www.dn.se/sthlm/lararna-tvingas-sattabetyg-pa-andras-elever/ [04.11.2016]. Tierney, R. D. (2013). Fairness in classroom assessment. In J. H. McMillan (Hrsg.), SAGE Handbook of research on classroom assessment (S. 125–144). Thousand Oaks, Calif, London: Sage. Tierney, R. D., Simon, D., & Charland, J. (2011). Being fair: Teachers' interpretations of principles for standards-based grading. The Educational Forum, 75(3), 210–227. Tillmann, K.-J. (2004). System jagt Fiktion: Die homogene Lerngruppe. Friedrich Jahresheft, XXII, 6–9. Tillmann, K.-J. (2008). Die homogene Lerngruppe - oder: System jagt Fiktion. In H.-U. Otto & T. Rauschenbach (Hrsg.), Die andere Seite der

668

Literaturverzeichnis

Bildung. Zum Verhältnis von formellen und informellen Bildungsprozessen (2. Aufl., S. 33–39). Wiesbaden: VS Verlag für Sozialwissenschaften. Tillmann, K.-J., & Vollstädt, W. (2009). Funktionen der Leistungsbewertung. Eine Bestandsaufnahme. In S.-I. Beutel & W. Vollstädt (Hrsg.), Leistung ermitteln und bewerten (3. Aufl., S. 27–37). Hamburg: Bergmann & Helbig. Trolldenier, H.-P. (2008). Die Würzburger Rechtschreibtests für 1. und 2. Jahrgangsstufe (WÜRT1 und WÜRT2) und daraus ableitbare Interventionsmaßnahmen für Grund- und Förderschule. In W. Schneider, H. Marx & M. Hasselhorn (Hrsg.), Diagnostik von Rechtschreibleistungen und -kompetenz. Tests und Trends. Jahrbuch der pädagogischpsychologischen Diagnostik, Band 6 (S. 191–209). Göttingen: Hogrefe. Truschkat, I., Kaiser-Belz, M., & Volkmann, V. (2011). Theoretisches Sampling in Qualifikationsarbeiten: Die Grounded-TheoryMethodologie zwischen Programmatik und Forschungspraxis. In G. Mey & K. Mruck (Hrsg.), Grounded Theory Reader (2. Aufl., S. 353– 379). Wiesbaden: VS Verlag für Sozialwissenschaften. Utbildningsutskottets betänkande 2013/14:UbU5. Minskade krav på dokumentation i skolan. (Svensk riksdag, 2014). http://www.riksdagen.se/sv/dokumentlagar/arende/betankande/minskade-krav-pa-dokumentation-iskolan_H101UbU5 [30.3.2016]. Valtin, R. (Hrsg.) (2002). Was ist ein gutes Zeugnis? Noten und verbale Beurteilungen auf dem Prüfstand. Weinheim, München: Juventa. Vermunt, R., & Steensma, H. (2016). Procedural justice. In C. Sabbagh & M. Schmitt (Hrsg.), Handbook of social justice theory and research (S. 219–236). New York: Springer. Viel Theorie, wenig Praxis. In Schweden gibt es Gymnasien für Friseure und Bauarbeiter (2011, 23. August). Süddeutsche Zeitung. VOBASOF = Verordnung zur berufsbegleitenden Ausbildung zum Erwerb des Lehramts für sonderpädagogische Förderung (vom 20.12.2012). Ministerium für Schule und Weiterbildung NRW.

Literaturverzeichnis

669

Vogt, B., Falkenberg, K., & Waldow, F. (2018). Effizienz durch Vermarktlichung? Zu Entwicklung und Konsequenzen der Einführung von Bildungsmärkten am Beispiel Schwedens (S. 248-271). In S. Hartong, B. Hermstein & T. Höhne (Hrsg.), Ökonomisierung von Schule? Bildungsreformen in nationaler und internationaler Perspektive. Weinheim: Beltz Juventa. Vogt, B. (2017). Just assessment in school: Pupils’ conceptions in Sweden and Germany. Dissertation. Linnéuniversitet Växjö. Volkmann, U. (2006). Legitime Ungleichheiten: Journalistische Deutungen vom "sozialdemokratischen Konsensus" zum "Neoliberalismus". Wiesbaden: VS Verlag für Sozialwissenschaften. VwGO = Verwaltungsgerichtsordnung in der Fassung der Bekanntmachung vom 19. März 1991 (BGBl. I S. 686), die zuletzt durch Artikel 7 des Gesetzes vom 12. Juli 2018 (BGBl. I S. 1151) geändert worden ist. Wahl, D. (2001). Nachhaltige Wege vom Wissen zum Handeln. Beiträge zur Lehrerbildung, 19(2), 157–174. Wahlström, N., & Sundberg, D. (2015). Theory-based evaluation of the curriculum Lgr11 (IFAU - Working Paper Nr. 2015:11). Uppsala. http://www.ifau.se/sv/Forskning/Publikationer/Workingpapers/2015/Theory-based-evaluation-of-the-curriculum-Lgr-11/ [23.9.2015]. Waldow, F. (2011a). Juristen oder Testspezialisten? Zur Rolle von Experten bei der Herstellung von Notengerechtigkeit in Deutschland und Schweden. Zeitschrift für Pädagogik, 57(4), 484–496. Waldow, F. (2011b, 23. August). Unterschiedliche Welten der Meritokratie? Gerechtigkeitskonzeptionen und Leistungsbeurteilung in der Schule in Deutschland, Schweden und England im Zeitalter der "standards-based reform". Habilitationsschrift; unveröffentlichtes Manuskript, Westfälische Wilhelms-Universität Münster. Waldow, F. (2012a). Gerechtigkeit, Leistungsbeurteilung und Schuldifferenzierung in Deutschland und Schweden. In S. Fürstenau & M. Gomolla (Hrsg.), Migration und schulischer Wandel: Leistungsbeurteilung (S. 171–185). Wiesbaden: Springer VS.

670

Literaturverzeichnis

Waldow, F. (2012b). Taylorismus im Klassenzimmer: John Franklin Bobbits Vorschläge zur standards-based reform. Zeitschrift für Pädagogik, 58(2), 159–175. Waldow, F. (2014). Conceptions of justice in examination systems of England, Germany and Sweden: A look at safeguards of fair procedure and possibilities of appeal. Comparative Education Review, 58(2), 322–343. Walster, E., Walster, G. W., & Berscheid, E. (1978). Equity: theory and research (2. Aufl.). Boston: Allyn and Bacon. Walzer, M. (1983). Spheres of Justice: A defense of pluralism and equality. New York: Basic Books. Waterkamp, D. (2006). Vergleichende Erziehungswissenschaft: Ein Lehrbuch. Münster: Waxmann. Weber, M. (1904/1985). Die "Objektivität" sozialwissenschaftlicher und sozialpolitischer Erkenntnis. In J. Winckelmann (Hrsg.), Max Weber Gesammelte Aufsätze zur Wissenschaftslehre (6. Aufl., S. 146–214). Tübingen: Mohr. Wegener, B. (1992). Gerechtigkeitsforschung und Legitimationsnormen. Zeitschrift für Soziologie, 21(4), 269–283. Weiler, H. N. (1983). Legalization, expertise, and participation: Strategies of compensatory legitimation in educational policy. Comparative Education Review, 27(2), 259–277. Weiß, S., Kiel, E., Keller-Schneider, M., Syring, M. & Hellsten, M. (2017). Berufsfeld Kindheitspädagoge/in: Berufsbilder, Professionalisierungswege und Studienwahlmotive im europäischen Vergleich. Zeitschrift für Pädagogik, 63(2), 139-162. Wenzel, M., & Okimoto, T. G. (2016). Retributive justice. In C. Sabbagh & M. Schmitt (Hrsg.), Handbook of Social Justice Theory and Research (S. 237–256). New York: Springer. West, A., & Nikolai, R. (2013). Welfare regimes and education regimes: Equality of opportunity and expenditure in the EU (and US). Journal of Social Policy, 1–25.

Literaturverzeichnis

671

Wimmer, A., & Glick Schiller, N. (2002). Methodological nationalism and beyond: Nation-state building, migration and the social sciences. Global Networks, 2(4), 301-334. Winkler, C. (2013). Entwicklungsgespräche und Anreizsysteme für schwedische Lehrkräfte: Instrumente des schulischen Personalmanagements vor dem Hintergrund des neuen Steuerungsmodells. Wiesbaden: Springer VS. Winter, F. (2012). Leistungsbewertung: Eine neue Lernkultur braucht einen anderen Umgang mit Schülerleistungen (5., erw. Ausg.). Baltmannsweiler: Schneider Hohengehren. Wittek, D. (2013). Heterogenität als Handlungsproblem: Entwicklungsaufgaben und Deutungsmuster von Lehrenden an Gemeinschaftsschulen. Opladen: Budrich. Yair, G. (2007). Meritocracy. In G. Ritzer (Hrsg.), The Blackwell encyclopedia of sociology (Bd. 6, S. 2954-2658). Oxford: Blackwell. Zaborowski, K. U., & Breidenstein, G. (2010). "Geh lieber nicht hin! Bleib lieber hier." Eine Fallstudie zu Selektion und Haltekräften an der Hauptschule. In H.-H. Krüger, U. Rabe-Kleberg, R.-T. Kramer & J. Budde (Hrsg.), Bildungsungleichheit revisited. Bildung und soziale Ungleichheit vom Kindergarten bis zur Hochschule (S. 127–144). Wiesbaden: VS Verlag für Sozialwissenschaften. Zaborowski, K. U., Meier, M., & Breidenstein, G. (Hrsg.) (2011). Leistungsbewertung und Unterricht: Ethnographische Studien zur Bewertungspraxis in Gymnasium und Sekundarschule. Wiesbaden: VS Verlag für Sozialwissenschaften. Zymek, B. (2008a). Expansion und Internationalisierung des deutschen Schulwesens nach 1945. In G. Mertens, U. Frost, W. Böhm & V. Ladenthin (Hrsg.), Handbuch der Erziehungswissenschaft. Band 2: Schule, Erwachsenenbildung, Weiterbildung (S. 99–109). Paderborn: Schöningh Paderborn. Zymek, B. (2008b). Geschichte des Schulwesens und des Lehrerberufs. In W. Helsper & J. Böhme (Hrsg.), Handbuch der Schulforschung (2. Aufl., S. 203–237). Wiesbaden: VS Verlag für Sozialwissenschaften.

672

Literaturverzeichnis

Zymek, B. (2008c). Grundzüge der Schulentwicklung in Deutschland im 19. und 20. Jahrhundert. In G. Mertens, U. Frost, W. Böhm & V. Ladenthin (Hrsg.), Handbuch der Erziehungswissenschaft. Band 2: Schule, Erwachsenenbildung, Weiterbildung (S. 67–85). Paderborn: Schöningh Paderborn. Zymek, B. (2013). Die Zukunft des zweigliedrigen Schulsystems in Deutschland. Zeitschrift für Pädagogik, 59(4), 469–481. Zymek, B., Wendt, S., Hegemann, M., & Ragutt, F. (2011). Regional governance und kommunale Schulentwicklungspolitik im Prozess des Rück- und Umbaus regionaler Schulangebotsstrukturen. Zeitschrift für Pädagogik, 57(4), 497–512.

Anhang Transkriptionsregeln Allgemeines

Kennzeichnung

Absätze

Anonymisierung / //…// = GANZ KLAR (.)

: [unverst.] [Pausenklingeln, Stühle rücken]

Es wird wortwörtlich transkribiert, nicht zusammenfassend. Dialekte und mundartliche Äußerungen werden möglichst genau ins Hochdeutsche übersetzt. Wo es keine Übersetzung gibt, bleibt der Dialektbegriff; Wortverschleifungen werden ebenfalls ins Hochdeutsche übertragen. Bsp. „da lesen wir so’n Buch“ wird zu „da lesen wir so ein Buch“; „Ähm“ und ähnliches wird ebenfalls transkribiert. I: für die Interviewerin; Kürzel aus Geschlecht, Schulform oder Fach und Zahl für Lehrkräfte (Bsp. wGym1 = weiblich, Gymnasium, erste Interviewpartnerin; SVEM02 = svenska, manlig, andra intervjupartner) Jede neue Äußerung eines Gesprächspartners ist ein neuer Absatz, also auch Zwischenfragen, Kommentare etc.; Ausnahmen bilden Äußerungen des aktiven Zuhörens der Interviewerin (mmhm, ja, ok) während einer Erzählpassage; diese brauchen nicht transkribiert werden. Orts- und Personennamen werden anonymisiert und in eckigen Klammern geschrieben: [Stadt A], [Lehrkraft B], [Schülerin C] Wortabbruch „da lesen wir so ein Bu/“ Sprecher_innen überlagern sich; nur der gleichzeitig gesprochene Teil wird gekennzeichnet Zwei Wörter werden schnell hintereinander gesprochen, wie zusammengezogen, Bsp.: „Also, Sie=Sie machen das dann/“ Besondere Betonung eines Wortes oder Satzteils wird in Großbuchstaben ausgedrückt Redepausen werden durch Punkte in Klammern dargestellt, jeder Punkt ist eine Sekunde. Ab 4 Sekunden wird die Sekundenzahl in Klammern geschrieben, Bsp: Ja (5) also ich/ Langgezogene Buchstaben und Worte, Bsp: Das war so, das:s:s wir dann/ = unverständliche Passage, konnte nicht transkribiert werden Nebengeräusche und Anmerkungen zur Situation werden in eckigen Klammern vermerkt, wenn sie das Gespräch beeinflusst haben (Störungen durch andere Lehrkräfte/Schüler_innen; Suchen von Material, etc.)

© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2020 K. Falkenberg, Gerechtigkeitsüberzeugungen bei der Leistungsbeurteilung, https://doi.org/10.1007/978-3-658-28275-2

674

Anhang

Anschreiben und Informationsbrief für Schulleitungen

Musterschule „Muster-Muster“ Musterstr. 27 123456 Musterstadt Bitte um Teilnahme an Forschungsprojekt Sehr geehrte/r Frau/Herr Muster, ich wende mich heute mit der Bitte um Teilnahme an einem äußerst interessanten Forschungsprojekt an Sie. Ich bin Leiter eines Forschungsprojektes zur schulischen Leistungsbeurteilung an der Universität Münster mit dem Titel: „Unterschiedliche Welten der Meritokratie? Schulische Leistungsbeurteilung und Verteilungsgerechtigkeit in Deutschland, Schweden und England im Zeitalter der ‚standardsbased reform‘“ Bei diesem Projekt handelt es sich um eine international vergleichende Studie, die in Zusammenarbeit mit der Linnéuniversität (Växjö/Kalmar, Schweden) und der Durham University (Vereinigtes Königreich) durchgeführt und im Rahmen des Emmy-NoetherProgramms der Deutschen Forschungsgemeinschaft gefördert wird. Im Rahmen dieses Projekts sollen Lehrerinnen und Lehrer, die in der Sekundarstufe I die Fächer Deutsch und/oder Mathematik unterrichten, in Einzelinterviews befragt werden. In diesen Interviews steht die Frage, was Lehrerinnen und Lehrer unter gerechter Leistungsbeurteilung verstehen im Zentrum; eine genauere Darstellung des Projekts liegt diesem Schreiben bei. Die Interviews sollen außerhalb der Unterrichtszeit stattfinden. Alle gewonnenen Daten werden selbstverständlich streng vertraulich behandelt und ausschließlich anonymisiert verwendet. Wir würden uns sehr freuen, wenn Sie sich zur Teilnahme an unserer Studie bereit erklären würden und uns ein Interview mit zwei bis drei Lehrkräften Ihrer Schule ermöglichen könnten. Für die Information Ihres Kollegiums finden Sie anbei ein gesondertes Anschreiben, welches Sie gern im Lehrerzimmer aushängen können. Für ein ausführlicheres Gespräch kommt meine Mitarbeiterin Kathleen Falkenberg gerne an Ihre Schule, um das Projekt im Einzelnen zu erläutern und Fragen zu beantworten. Wir melden uns in den nächsten Tagen telefonisch bei Ihnen. Mit freundlichen Grüßen, Dr. Florian Waldow (Projektleitung) Kontakt für Terminabsprachen: Kathleen Falkenberg, M.A. Westfälische Wilhelms-Universität Münster, Institut für Erziehungswissenschaft Nachwuchsgruppe „Meritokratie“, Georgskommende 33, 48143 Münster kathleen.falkenberg@uni-münster.de

Anhang

675

Aushang für das Kollegium Interviewpartner_innen gesucht Sehr geehrtes Kollegium der Maxi-Muster-Schule, hiermit möchte ich Sie einladen an meinem Dissertationsprojekt zum Thema „Gerechtigkeitsüberzeugungen von Lehrerinnen und Lehrern in Bezug auf Leistungsbeurteilung in Deutschland und Schweden“ teilzunehmen. Ich untersuche die Frage, wie Lehrerinnen und Lehrer die Aufgabe der Leistungsbeurteilung bewältigen, was eine gerechte Leistungsbeurteilung in ihren Augen ausmacht und wie sie selbst ihre Rolle im Prozess der Leistungsbeurteilung sehen. Im Zentrum stehen also die individuellen Überzeugungen von Lehrerinnen und Lehrern in Bezug auf Leistungsbeurteilung und deren Konsequenzen, nicht aber die Frage ob Lehrkräfte in einem testdiagnostischen Sinne „richtig“ messen und beurteilen. Im Rahmen dieses Projekts sollen Lehrerinnen und Lehrer, die in der Sekundarstufe I die Fächer Deutsch und/oder Mathematik unterrichten, in Einzelinterviews befragt werden. Die Interviews sollen außerhalb der Unterrichtszeit stattfinden und werden ca. 60 Minuten dauern. Alle gewonnenen Daten werden selbstverständlich streng vertraulich behandelt und ausschließlich anonymisiert verwendet. Ich würde mich sehr freuen, wenn Sie sich zu einem Interviewtermin mit mir bereit erklären würden und mir somit einen Einblick in Ihre Erfahrungswelt ermöglichen. Bei Interesse können Sie mich jederzeit per E-mail erreichen ([email protected]), ich melde mich dann umgehend bei Ihnen, um einen Termin zu vereinbaren. Das Interview wird dann an Ihrer Schule oder, wenn gewünscht, an einem anderen Ort durchgeführt. Mit freundlichen Grüßen Kathleen Falkenberg

676

Anhang

Interviewleitfaden auf Deutsch

Überzeugungen zur alltäglichen Leistungsbeurteilung (mündl./ schriftl., formativ/summ ativ, coursework) Überzeugungen zu standardisierten Tests und Evaluationen Generelle Überzeugungen zu Bildungsabschlüssen, Noten und Selektionsfunktion der Schule

Konzepte/ Überzeugungen (Was heißt „gerechte Leistungsbeurteilung“ für LK?) Was sind Ihre persönlichen Leitsätze bei der LB? Was macht eine gerechte LB für Sie aus? Welche Rolle spielt LB im Unterrichtsalltag? Was zeichnet einen „guten Schüler/gute Schülerin“ aus? Was ist eine „gute Leistung“? Was ist Ihrer Meinung nach die Funktion von Noten? Welchen Sinn haben Noten? Wie ist die Philosophie zur Leistungsbewertung denn im Kollegium? Gibt es so etwas wie einen Schulkonsens zur Leistungsbeurteilung?

Was denken Sie, welche Rolle spielen ZAP und Zentralabitur für Fragen der gerechten LB? Und welche Rolle spielen Lernstandserhebungen? Was hat sich durch die Kernlehrpläne verändert? Welche Funktion haben die verschiedenen Schulabschlüsse im deutschen Bildungssystem Ihrer Meinung nach? Ist LB an den Schularten unterschiedlich? Welche Rolle spielt die Vergleichbarkeit von Noten? (zwischen Schüler_innen/Klassen/ Schulen/Schulformen/…) Was bedeutet individuelle Förderung für Sie? Wie wichtig sind Noten und Zeugnisse für Schüler_innen? Wenn Sie an die letzten 10 Jahre denken, inwiefern hat sich die Bedeutung von Noten und Zeugnissen verändert?

Handlungsstrategien (Wie stellen Sie „gerechte LB“ sicher?) (Wie haben Sie gelernt Schüler_innenleistungen zu beurteilen?) Wie beurteilen Sie Ihre Schüler_innen? (Was fließt in LB mit ein?) Wie kommen Sie zu einer mündlichen/schriftlichen Note? Wie melden Sie LB zurück? Können Sie mir von einer Situation erzählen in der es Ihnen leicht/schwer fiel Leistungen zu beurteilen? Inwiefern tauschen Sie sich mit Ihren Kolleg_innen über Fragen der LB aus? Inwiefern hat sich für Ihren Unterrichtsalltag etwas verändert durch a) ZAP/Zentralabitur b) Lernstandserhebung?

Was passiert mit versetzungsgefährdeten Schüler_innen? (Bsp. letzte Zeugniskonferenz). An welchem Punkt nehmen Sie Einfluss auf den weiteren Lebensweg Ihrer Schüler_innen? Besprechen Sie mit Ihren Schüler_innen, welche Abschlüsse welche Lebenswege ermöglichen würden?

Anhang

677

Interviewleitfaden auf Schwedisch

bedömning i generellt Hur gör du det med bedömningen? Vilken roll spelar bedömning i din vardagliga undervisning? Om du tänka på de sista dagarna – kommer du ihåg några bedömningstillfälle? Finns det några redskaper som hjälper dig med bedömning? (klasslista, matriser, bedömningsbok,...) Vad måste man göra för att bedöma på ett orättvist sätt? Finns det några svårigheter kring bedömning och betygssättning? Skulle du kunna berätta lite om dina egna erfarenheter med bedömningen? Kommer du ihåg några situationer där det var svårare att bedöma elevers arbete? Varför finns det bedömning i skolan? Vad är syftet med bedömning? elever (feedback, relation) Hur får eleverna återkoppling om deras kunskapsutveckling? Hur får eleverna veta om bedömning? Hur viktigt är det att känna de elever som du ska bedöma? Hur vet eleverna om bedömningen är formativ eller summativ? betygssättning – övergång till gymnasieskola Skulle du kunna berätta lite hur du kommer till ett betyg i slutet av årskursen? Vad är underlaget för betygssättning? Vad är syftet med att har slutbetyg? Vilken roll spelar slutbetyget för eleverna? Prata ni om konsekvenser från slutbetyget? Vilken roll spelar övergången till gymnasieskola/gymnasieval/vilken program elever vill kommer in? Om du märkar att en av dina elever inte når målen – vad gör du då som lärare? Vilken roll spelar dina bedömningar för elevernas framtid? Så bedömning och betyg har olika syfte. Känns det som en dilemma för dig ibland? professionell roll Hur skulle du beskriva ditt jobb som lärare? Vad är det viktigaste? Hur har du lärt dig att bedöma elevernas prestationer? Hur var det när du som lärare skulle bedöma dina första skriftliga prov? definitioner Vad är en bra prestation för dig? Vad är en ”bra elev” för dig? / Vad lägger du i begreppet ”bra elev”? / Vad utmärker en bra elev? Kan du sammanfatta vad „rättvis bedömning“ betyder för dig?

678

Anhang

Überblick über das Sample in NRW Anmerkungen: alle Namen sind Pseudonyme; Angaben zum Alter bzw. Berufserfahrung in Jahren gelten für den Zeitpunkt der Interviewerhebung; k.A. = keine Angaben vorhanden Interview Nr.

Erhebungs -jahr

1

2012

2

2012

3

2012

4

2012

5

2012

6

2012

7

2012

8

2012

9

2012

10

2012

11

2013

12

2013

Pseudonym, Alter Fr. Amberg (39) Fr. Güngör (36)

Berufserfahrung in Jahren 6 Jahre 9 Jahre

Unterrichtsfächer De, Ge

Schulform

Besonderheiten / Funktionen

Gymnasium Hauptschule

Teilzeit (14 Std.)

Hauptschule Realschule

vorher Kitaleitung Schulleiterin

Ursprünglich Gymnasiellehrerin Verantwortlicher für Berufsorientierung -

k.A.

De, Engl, u.a. Ma, Bio, Erdk De, Engl

10 Jahre

De, Engl

Hauptschule

12 Jahre

De, Ma, u.a.

Hauptschule

Fr. Ehrl (33) Fr. Fischer (31) Hr. Clemens (63) Hr. Dabert (29)

5 Jahre 2 Jahre

Ma, Mu, Bio Engl, De

33 Jahre

Ma, Phy

2 Jahre

Hr. Opdenkamp (53) Hr. Freymann (61)

23 Jahre

Ma, Ge, kath. Reli De, kath. Reli Ma

Gymnasium Gymnasium Gymnasium Gymnasium

Hr. Arnold (53) Fr. Hollerdieck (~50) Fr. AhleDemmerer (38) Hr. Beckmann (51)

12 Jahre

35 Jahre

Gymnasium Gymnasium

-

Vertrauenslehrer Koordinator f. individuelle Förderung -

Anhang

679

13

2013

14

2013

15

2013

16

2013

17

2013

18

2013

19

2013

20

2013

21

2013

22

2013

23

2013

24

2013

25

2013

26

2013

27

2013

28

2013

Fr. Dr. Gröhlich (42) Hr. Bredehorst (56) Hr. Arnt (61) Fr. Heinkötter (29) Fr. Dorpenbeck (29) Fr. Kregel (53) Fr. Berkhoff (46) Hr. Imburg (36) Fr. Lindenau (29) Hr. Kleinert (30) Hr. Grabenmüller (60) Fr. Boven (59) Fr. Buschkamp (25) Fr. PohleHanewinkel (45) Fr. Neever (50)

11 Jahre

De, Lat, Mu

Gymnasium

-

22 Jahre

Gymnasium Gesamtschule Realschule

-

4 Jahre

De, Philo De, Techn De, Ma

2 Jahre

De, Engl

Realschule

-

12 Jahre

Ma, Phy

-

10 Jahre

De, kath.Rel Ma, Bio, Phy Ma, Päd

Realschule Realschule Realschule Gymnasium

Fr. Stakenhues (45)

k.A.

6 Jahre 2 Jahre

Teilzeit (10 Std.) Vertrauenslehrer -

0,5 Jahre 33 Jahre

Engl, Ge

34 Jahre

De, Engl, Ge Engl,De, kath.Rel De, Sp

Hauptschule Hauptschule Gymnasium

33 Jahre

Ma,Bio, Ku, Tex

Realschule

-

7 Jahre

De, Engl

Realschule

-

0,5 Jahre 16 Jahre

Ma, Philo

Realschule Gymnasium

Didaktischer Leiter -

Mittelstufenkoordinator

-

680

Anhang

Überblick über das Sample in Schweden Anmerkungen: alle Namen sind Pseudonyme; Angaben zum Alter bzw. Berufserfahrung in Jahren gelten für den Zeitpunkt der Interviewerhebung Interview Nr.

Erhebu ngsjahr

Name, Alter

Berufse rfahrun g in Jahren 15 Jahre

Unterric htsfäch er

Schulfo rm

Besonderheiten / Funktionen

1

2013

Alva (39)

Schwe

förstelärare

Barbro (48) Christina (52) Lisbeth (35) Gunilla (39) Fredrik (44)

19 Jahre

Schwe

15 Jahre

Schwe

10 Jahre

Schwe, De Ma

15 Jahre

Ma, Nawi

grundskola grundskola grundskola grundskola grundskola grundskola

2

2013

3

2014

4

2014

5

2014

6

2014

7

2014

Ingmar (43)

15 Jahre

Ma, Che, Ku

grundskola

8

2014

Jonathan (26)

0 Jahre

grundskola

9

2014

Karin (46)

15 Jahre

10

2014

Mats (57)

32 Jahre

11

2015

14 Jahre

12

2015

Pernilla (46) Nils (40)

13

2015

Karolina (49)

16 Jahre

Schwe, Sozialku nde Schwe, Sozialku nde Ma, Nawi Schwe, Engl Schwe, De Schwe, Span

15 Jahre

13 Jahre

förstelärare

Interview einen Tag nach dem Examen

grundskola grundskola gymnasieskola grundskola grundskola

holt legitimation gerade nach

Anhang

681

14

2015

Malin (43)

20 Jahre

15

2015

Jenny (53)

13 Jahre

16

2015

Eva (46)

17 Jahre

Schwe, Eng Ma Schwe, Engl

grundskola gymnasieskola gymnasieskola

förstelärare