Die Geburt der Schulnote
Vor dem 16. Jahrhundert gab es keine Schulnoten, wie wir sie kennen. Im antiken Rom etwa wurden Schüler mündlich geprüft - direkt, spontan, ohne Ziffern. Der Lehrer beobachtete, korrigierte, lobte oder tadelte. Eine systematische Bewertung auf einer numerischen Skala? Undenkbar.
Das änderte sich mit den Jesuiten. Der 1534 gegründete Jesuitenorden erkannte früh, dass Bildung ein Machtinstrument war - und dass man Bildung organisieren musste. In ihren Klosterschulen führten sie das erste dokumentierte numerische Bewertungssystem ein: eine fünfstufige Skala mit lateinischen Bezeichnungen. Erstmals mussten Schüler formale Prüfungen bestehen, um in die nächste Klasse aufzusteigen.
1599 kodifizierten die Jesuiten ihr Bildungssystem in der berühmten Ratio Studiorum - einem umfassenden Lehrplan, der Unterrichtsinhalte, Prüfungsmethoden und Bewertungskriterien festlegte. Es war das erste standardisierte Curriculum der westlichen Welt. Das Grundprinzip: Wer die Prüfung nicht besteht, steigt nicht auf. Dieses Klassensystem - so selbstverständlich es uns heute erscheint - war eine Revolution.
Parallel öffnete die protestantische Reformation den Zugang zu Bildung über die katholische Kirche hinaus. Martin Luther forderte öffentliche Schulen für alle Kinder. Mehr Schulen bedeuteten mehr Schüler, mehr Schüler bedeuteten mehr Bedarf an standardisierter Bewertung. Die Büchse der Pandora war geöffnet.
Von Preußen zur Sechserskala
Schon 1530, vier Jahre vor den Jesuiten, experimentierte das Königreich Sachsen mit numerischen Prüfungen. Zweimal jährlich mussten Schüler vor dem Pfarrer und dem Bürgermeister ihr Wissen unter Beweis stellen. Doch es waren die Preußen, die die Notengebung im 19. Jahrhundert industrialisierten.
Um 1850 etablierte Preußen ein dreistufiges Bewertungssystem. Doch drei Stufen waren zu grob - zu viele Schüler landeten in der Mitte. Also erweiterte man auf vier, dann auf fünf Stufen. Das Problem blieb: Bei einer ungeraden Zahl tendieren Lehrer zur Mitte. Die Note 3 wurde zur Default-Bewertung, die eigentlich nichts aussagte.
Die Lösung kam 1938 - ausgerechnet unter dem NS-Regime. Reichserziehungsminister Bernhard Rust ordnete die reichsweite Umstellung auf ein sechsstufiges Notensystem an. Die Logik: Eine gerade Anzahl von Noten zwingt den Lehrer, sich zu entscheiden - entweder die obere oder die untere Haelfte. Kein bequemes Mittelfeld mehr.
Was als mathematischer Trick begann, wurde zur längsten Konstante im deutschen Bildungswesen: Das System von 1938 ist bis heute - 88 Jahre später - unverändert in Kraft. Keine andere bildungspolitische Entscheidung des 20. Jahrhunderts hat so lange überlebt.
Die deutsche Teilung und Wiedervereinigung
Nach 1945 kehrte die DDR zum fünfstufigen System zurück (1 = sehr gut bis 5 = ungenügend), während Westdeutschland das Sechsersystem beibehielt. Mit der Wiedervereinigung 1990 wurde die Sechserskala für das gesamte Bundesgebiet übernommen - ein stiller Sieg der westdeutschen Bildungstradition.
Drei Länder, drei Systeme
Deutschland, Österreich und die Schweiz teilen eine Sprache, aber nicht ein Notensystem. Die Unterschiede sind historisch gewachsen - und für Schüler, die zwischen den Ländern wechseln, oft verwirrend.
Warum die Unterschiede? Österreich behielt nach 1945 sein älteres 5-Stufen-System bei - eine bewusste Abgrenzung von der reichsweiten Reform von 1938. Die Schweiz entwickelte ihr System unabhängig, beeinflusst durch die französischsprachige Kultur der Westschweiz, wo höhere Zahlen intuitiv "besser" bedeuten.
Für Eltern, die zwischen diesen Ländern umziehen, kann das zu realen Problemen führen: Eine schweizerische 4 (knapp bestanden) wird in Deutschland als "ausreichend" gelesen - aber eine deutsche 4 wäre in der Schweiz eine gute Note.
Weltweit: So bewerten andere Länder
Weltweit existieren Dutzende unterschiedlicher Notensysteme. Was in einem Land "gut" ist, wäre in einem anderen "mittelmässig". Einige Länder bewegen sich sogar komplett weg von numerischen Noten.
| Land | System | Bestanden | Besonderheit |
|---|---|---|---|
| 🇺🇸USA | A - F (GPA 0-4.0) | D (60%) | Vergleichsweise milde Bewertung |
| 🇫🇷Frankreich | 0 - 20 Punkte | 10/20 | Streng: 15/20 gilt als exzellent |
| 🇬🇧Großbritannien | 9 - 1 (seit 2017) | 4 | Vorher A* bis G |
| 🇫🇮Finnland | 4 - 10 | 5 | Kaum standardisierte Tests |
| 🇩🇰Dänemark | 12-Stufen-Skala | 2 | Trend zu verbaler Beurteilung |
| 🇯🇵Japan | 1-5 oder 1-100 | variiert | Relative Bewertung innerhalb der Klasse |
| 🇸🇪Schweden | A - F (seit 2011) | E | Vorher Pass/Fail-System |
Der Trend in Nordeuropa ist bemerkenswert: Finnland, oft als Bildungsvorbild zitiert, setzt auf minimal testing und individuelle Rückmeldung statt numerischer Noten. Dänemark und Norwegen experimentieren mit rein verbalen Beurteilungen in den frühen Schuljahren. Die Frage, ob Ziffernnoten überhaupt der beste Weg sind, Lernen zu messen, wird weltweit intensiver diskutiert als je zuvor.
Die Notenlotterie - Wie subjektiv sind Noten wirklich?
Dieselbe Klassenarbeit, vorgelegt an verschiedene Lehrkräfte. Das Ergebnis ist ernüchternd - und wissenschaftlich gut dokumentiert.
Ingenkamps Klassiker (1960er Jahre)
Der Bildungsforscher Karl-Heinz Ingenkamp legte denselben Deutschaufsatz 92 verschiedenen Lehrkräften vor. Nur 40% vergaben dieselbe Note. Die restlichen 60% kamen zu unterschiedlichen Ergebnissen - teilweise mit einer Streuung von drei Notenstufen. Dieses Experiment wurde vielfach wiederholt, mit ähnlichen Ergebnissen.
IQB/Tuebingen-Studie (2024)
Forscher des Instituts für Qualitätsentwicklung im Bildungswesen (IQB) und der Universität Tuebingen kamen 2024 zu einem noch radikaleren Befund: Schulnoten korrelieren nur schwach mit den tatsächlich gemessenen Kompetenzen der Schüler. Eine gute Note sagt weniger über das Wissen aus als gemeinhin angenommen.
Dokumentierte Verzerrungen
Gender-Bias: Mädchen erhalten in MINT-Fächern durchschnittlich 0,8 Notenpunkte schlechter - bei nachweislich gleicher Leistung. In sprachlichen Fächern ist der Effekt umgekehrt: Dort werden Jungen benachteiligt. Die Ursache liegt in unbewussten Erwartungshaltungen der Lehrkräfte.
Sozioökononomischer Bias: In rund 30% der Faelle erhalten Kinder aus bildungsfernen Familien schlechtere Noten als Gleichaltrige aus Akademikerfamilien - trotz vergleichbarer Leistung. Dieser "Matthäus-Effekt" verstärkt bestehende Ungleichheiten.
Halo-Effekt und Anchoring: Äussere Erscheinung, Handschrift, Reihenfolge der Korrektur - all das beeinflusst die Notengebung messbar. Wer nach einer Serie schwacher Arbeiten korrigiert wird, profitiert. Wer nach Einser-Arbeiten drankommt, wird strenger bewertet.
Was Noten mit Schülern machen
Noten sind mehr als Zahlen auf Papier. Sie formen Selbstbilder, beeinflussen Lebenswege und können - je nach Kontext - motivieren oder zerstören. Die psychologische Forschung zeichnet ein differenziertes Bild.
Extrinsische vs. intrinsische Motivation
Schulnoten sind ein klassisches Instrument extrinsischer Motivation: Man lernt für die Note, nicht für das Verstehen. Psychologen wie Edward Deci und Richard Ryan haben gezeigt, dass extrinsische Belohnungen die intrinsische Motivation - das Lernen aus Neugier und Freude - langfristig untergraben können. Kinder, die für gute Noten belohnt werden, lernen weniger gern als solche, die aus eigenem Antrieb lernen.
Prüfungsangst: Ein Massenphänomen
Studien schätzen, dass 15 bis 25% aller Schüler unter klinisch relevanter Prüfungsangst leiden. Für diese Kinder misst die Note nicht das Wissen, sondern die Fähigkeit, unter Druck zu funktionieren. Mädchen sind häufiger betroffen als Jungen, ältere Schüler häufiger als jüngere.
Notenidentität: "Ich bin eine 4 in Mathe"
Besonders problematisch ist die Verschmelzung von Note und Selbstbild. Wer wiederholt schlechte Noten erhält, beginnt, sich selbst als "schlecht in Mathe" zu definieren - unabhängig davon, ob die Noten fair waren. Diese Selbstzuschreibung wird zur selbsterfuellenden Prophezeiung: Wer glaubt, schlecht zu sein, strengt sich weniger an, erhält schlechtere Noten, bestätigt sein negatives Selbstbild.
Die andere Seite: Warum Noten auch nützlich sind
Bei aller berechtigter Kritik: Noten bieten auch Orientierung. Sie machen Leistungen vergleichbar, geben Schülern und Eltern eine Einschätzung und können - bei fairer Anwendung - tatsächlich motivieren. Das Problem liegt nicht in der Idee der Leistungsbewertung an sich, sondern in ihrer Ausführung: zu subjektiv, zu wenig transparent, zu stark von Faktoren abhängig, die mit Leistung nichts zu tun haben.
Die Zukunft: Alternativen und Reformen
Während das Sechsersystem in Deutschland stabil steht, bewegen sich einzelne Bundesländer und viele Länder weltweit in Richtung differenzierterer Bewertungsformen.
Verbalbeurteilungen
Statt einer Zahl erhält das Kind einen beschreibenden Text: Stärken, Entwicklungsfelder, konkrete Empfehlungen. Bremen und Teile Bayerns erlauben dies bereits in der Grundschule. Der Vorteil: reichere Rückmeldung. Der Nachteil: weniger vergleichbar, aufwändiger für Lehrkräfte.
Waldorf und Montessori: Noten? Nie gehört.
An Waldorfschulen gibt es von der ersten bis zur letzten Klasse keine Ziffernnoten. Stattdessen verfassen Lehrkräfte ausführliche Textzeugnisse, die das Kind individuell beschreiben. Montessori-Schulen setzen auf Beobachtung und Dokumentation von Lernfortschritten - ohne jegliche Benotung. Beide Ansätze funktionieren seit Jahrzehnten.
Hamburg 2024: Der Testlauf
Hamburg ist das erste große Bundesland, das Schulen erlaubt, bis zur 9. Klasse auf Ziffernnoten zu verzichten und stattdessen Verbalbeurteilungen einzusetzen. Die Teilnahme ist freiwillig, aber der Schritt ist ein Signal: Die Debatte um Alternativen ist in der Politik angekommen.
KI-gestützte Bewertung: Fluch oder Segen?
68% der Universitäten pilotieren bereits KI-basierte Bewertungssysteme (Stand 2025). Die Versprechen sind verlockend: 60-80% weniger Korrekturzeit, höhere Konsistenz, sofortiges Feedback. Doch KI-Bewertung hat blinde Flecken: Sie kann kreative Antworten schlecht einschätzen, bildet bestehende Verzerrungen in den Trainingsdaten ab und funktioniert als "Black Box" - Schüler verstehen nicht, warum sie eine bestimmte Note erhalten haben.
Der entstehende Konsens: KI als Werkzeug, nicht als Ersatz. Die beste Bewertung entsteht vermutlich in der Zusammenarbeit von Mensch und Maschine - wobei die pädagogische Urteilskraft der Lehrkraft das letzte Wort behält.
Quellenverzeichnis und weiterführende Literatur
- Planet Wissen: Schulgeschichte - Schulnoten
- News4Teachers: Voreingenommene Lehrer (2024)
- Quarks: So wenig aussagekräftig sind Schulnoten
- Deutsches Schulportal: Schulnoten - Ja oder Nein?
- IQB - Institut für Qualitätsentwicklung im Bildungswesen
- TUM Clearinghouse: Geschlechterunterschiede
- News4Teachers: Hamburg ohne Noten (2024)
- PM Wissen: Seit wann gibt es Schulnoten?
- Wikipedia: Schulnote
- American University: Alternative Grading Systems
- Ingenkamp, K.-H. (1971): Die Fragwürdigkeit der Zensurengebung. Beltz Verlag.
- Deci, E. L. & Ryan, R. M. (2000): Self-Determination Theory. In: American Psychologist.
Genau deshalb gibt es die Zweitmeinung
In einem System, das nachweislich von Subjektivität, Bias und Zufallsfaktoren geprägt ist, kann eine unabhängige fachliche Einschätzung den entscheidenden Unterschied machen.
Zweitmeinung beauftragen