Stellungnahme zur Kritik an VERA in

Transcription

Stellungnahme zur Kritik an VERA in
Thema: VERA – Die Diskussion gehtThema:
weiter
Stellungnahme zur Kritik an VERA
in »Grundschule aktuell«, Heft 89
In Heft 89 von »Grundschule aktuell«
wurde VERA in scharfer Form kritisiert
(»ungeeignet«, »bildungsfern«, »zum Teil
skandalöse Aufgaben«, »schulpolitisches
Desaster«, »Bedienung eines zynischen
Menschenbildes« u. a.; ebd., S. 6, S. 10,
S. 16).
Im Folgenden skizzieren wir zunächst
einige der mit VERA verbundenen Ziele
und deuten den Kontext an, in dem dieses Projekt angesiedelt ist. Anschließend
gehen wir in Ausschnitten auf Bartnitzkys
Kritik ausgewählter Deutschaufgaben
sowie Selters’ Kritik an Mathematikaufgaben ein. Aus Platzgründen werden
nicht alle kritisierten Punkte an dieser
Stelle behandelt: Eine ausführlichere
Kommentierung zu allen thematisierten
Inhaltsbereichen stellen wir auf der Internetseite des Projekts zur Verfügung
(www.uni-landau.de/vera).
1 Zu einigen Zielen und
zum Kontext von VERA
Mit VERA werden wichtige Kompetenzen
der Fächer Deutsch und Mathematik erhoben und zwar auf der Ebene von Ländern, Schulen und Schulklassen. Auf
mittlere Sicht soll ein Beitrag zur Entwicklung und empirischen Absicherung
von Kompetenzmodellen geleistet werden. Erst dann ist ein inhaltlich begründeter Konsens über Standards möglich,
die über die einzelne Klasse bzw. Schule
hinaus Geltung beanspruchen können.
Bislang hängt – auch in der Grundschule
– die Bewertung der Schülerleistungen
stark von der Klassenzugehörigkeit ab:
Mit derselben Leistung kann man also
z. B. eine gute Note, aber auch nur ein
»Ausreichend« bekommen. Dass dies unbefriedigend ist, liegt auf der Hand.
Darüber hinaus ist VERA ein Baustein
zur »Umsetzung«, aber auch Überprüfung der Lehrpläne und (künftig)
Bildungsstandards für die Grundschule.
Für die Lehrkräfte vor Ort soll VERA auch
ein (nicht das) Mittel sein, den Lern- und
Förderbedarf der Kinder, ihre Stärken und
Schwächen zu ermitteln. Dabei kann man
die Ergebnisse der eigenen Klasse mit den
Leistungen von Klassen ähnlicher sozialer
Zusammensetzung vergleichen (»fairer
Vergleich«). Damit bietet VERA zugleich
Ansatzpunkte für die schulinterne Fortbildung und die Weiterentwicklung der
diagnostischen Kompetenz der Lehrkäfte.
Aus vielen Untersuchungen weiß man,
dass diagnostische Lehrerurteile häufig
ungenau sind, wenn man sie mit den Ergebnissen von Leistungstests vergleicht.
Dies gilt insbesondere hinsichtlich der
Leistungsfähigkeit der gesamten Klasse,
weniger für die Rangordnung einzelner
Kinder innerhalb der Klasse. Lässt man
sich auf die Testergebnisse ein, fallen
vielleicht bestimmte Fehlerschwerpunkte
auf, auf die man früher nicht geachtet hat
oder man bemerkt z. B., dass die Streuung
der Leistungen größer ist, als man bislang
dachte. Das könnte dazu anregen, für eigene »blinde Flecken« sensibel zu werden
und den Unterricht ein Stück weit anders
zu gestalten. Genau zu solchen Aspekten
der Unterrichtsentwicklung möchte VERA
Impulse liefern.
VERA ist ein standardisierter Leistungstest und sollte insofern »lehrplanvalide« sein, sich also auf Bereiche und
Themen beziehen, die laut Lehrplan
auch vorgesehen sind. Das ist der Fall
(vgl. »Lehrplanbezüge« unter www.unilandau.de/vera/aufgaben.htm). Inwiefern VERA aber auch »unterrichtsvalide«
ist, also mit dem zu tun hat, was in
sieben Bundesländern in den ersten
drei Schuljahren tatsächlich unterrichtet
wurde, lässt sich verständlicherweise
nicht sagen. Wäre dieses Kriterium aber
das Entscheidende, so dürfte der Test
angesichts der sehr großen Unterschiede
und der Vielzahl beteiligter Schulen nur
noch Stoff der ersten zwei Jahrgangsstufen umfassen und somit kaum geeignet
sein, nennenswert zwischen den Schülerinnen und Schülern einzelner Klassen
zu differenzieren. Ob VERA reliabel (zuverlässig) ist, hängt sehr stark davon ab,
in welchem Ausmaß die Durchführung
dem Kriterium der Objektivität genügt.
Dabei geht es darum, dass für alle Schülerinnen und Schüler gleiche Bedingungen
herrschen (ein zentrales Gebot der Fair-
ness). Dies bezieht sich sowohl auf die
Durchführung des Tests als auch auf die
Auswer-tung. Daher ist es im Rahmen eines Tests individueller Fähigkeiten unfair,
wenn die Schüler miteinander sprechen
dürfen. Denn die dadurch im Test gezeigte Leistung ist nicht nur von den Fähigkeiten des einzelnen Kindes abhängig,
sondern auch von den Fähigkeiten des
Tischnachbarn. Wer also neben dem oder
der Klassenbesten sitzt, wäre gegenüber
anderen Kindern im Vorteil. Allein deshalb
gelten in einem Testverfahren »Klassenarbeits- oder Klausurbedingungen«.
Gleiches gilt für die Verwendung von
Hilfsmitteln wie z. B. dem Wörterbuch:
Die VERA-Aufgabenentwickler/innen hät-­
ten die Fähigkeiten im Umgang mit dem
Wörterbuch gerne im Rahmen von VERA
erfasst. Aber solange nicht sicher gestellt
ist, dass alle gut 300 000 an VERA beteiligten Kinder am Testtag tatsächlich ein
Wörterbuch zur Verfügung haben (idealerweise auch noch alle das gleiche), führen entsprechende Aufgaben zu unfairen
Resultaten, die insbesondere Schülerinnen und Schüler aus einkommensschwachen Familien benachteiligen dürften. Es
ist daher ein Gebot der Fairness, zum gegenwärtigen Zeitpunkt auf vergleichbare
Aufgaben zu verzichten.
Auch für die Auswertung ist zu fordern, dass sie möglichst objektiv und reliabel erfolgt. Die Reliabilität gibt Hinweise
auf die Zuverlässigkeit des Tests, also z.B.
in Bezug darauf, ob zwei voneinander
unabhängige Beurteiler/innen bei ausgewählten Schülerinnen und Schülern
zu identischen Ergebnissen kommen.
Vor­aus­setzung dafür ist, dass die Korrekturanweisungen möglichst präzise
sind und wenig Spielraum für subjektive
Interpretationen lassen. Dies gelingt für
Mathematik insgesamt besser als für
Deutsch und ist bei den Schreibaufgaben
am wenigsten gegeben.
In welchem Umfang VERA diese Testgütekriterien erfüllt, hängt nicht zuletzt
von den durchführenden Lehrkräften
ab. Manche Lehrpersonen werden sich
anders verhalten haben als von den Testautoren gewünscht, z. B. deshalb, weil
Die Autor/-innen
Albert Bremerich-Vos,
Professor für deutsche
Sprache und Literatur
und ihre Didaktik an der
Universität Hildesheim,
fachdidaktischer Berater
des VERA- Projektes
Jana Groß Ophoff
(Dipl.-Psych.), wissenschaftliche Mitarbeiterin
an der Universität
Koblenz-Landau,
Campus Landau.
Forschungsschwerpunkte:
Lehr-/ Lernpsychologie,
Empirische Bildungs­
forschung. Betreuung des
Inhaltsbereiches Deutsch
im Projekt VERA
Ingmar Hosenfeld,
Junior-Professor an der
Universität KoblenzLandau, Campus Landau.
Forschungsschwerpunkte:
Empirische Bildungs­
forschung, Unterrichtsforschung. Leitung des
Projektes VERA
Andreas Helmke,
Professor an der Universität Koblenz-Landau,
Campus Landau.
Forschungsschwerpunkte:
Unterrichtsforschung,
Empirische Bildungs­
forschung, Kultur­
vergleich. Leitung des
Projektes VERA
Sonja Wagner
(Dipl.-Psych.), wissenschaftliche Mitarbeiterin
an der Universität
Koblenz-Landau, Campus
Landau. Forschungsschwerpunkte:
Empirische Bildungsforschung. Betreuung
des Inhaltsbereiches
Mathematik
im Projekt VERA
http://www.uni-landau.
de/vera/
GSV aktuell 90 • Mai 2005
3
Thema: VERA – Die Diskussion geht weiter
sie »ihren« Kindern helfen wollten.
Derlei Maßnahmen gefährden jedoch
die Fairness und den Nutzwert des
Verfahrens.
Bartnitzky betont emphatisch die
diagnostische Kompetenz der Lehrkräfte. Nur sie seien in der Lage, die
Leistungen eines Schülers heute mit
seinen früheren Leistungen kompetent zu vergleichen. Wir bestreiten
das überhaupt nicht. Es ist aber nicht
sinnvoll, diese Orientierung an einer
individuellen Bezugsnorm gegen
eine Orientierung an einer sozialen
Norm und an inhaltlichen Kriterien
auszuspielen.
Ein Teil seiner Argumente betrifft
offensichtlich nicht VERA speziell,
sondern Tests im Allgemeinen. So
räumt er zwar einerseits ein, dass ein
Blick von außen auf die eigene Klasse
oder Schule, den ein landesweiter Test
ermöglicht, im Prinzip sinnvoll sei.
Andererseits heißt es: »Nur führt der
›fremde Blick‹ bei VERA und Vergleichbarem zugleich zu einem verfremdeten Unterricht mit fremden Inhalten
und Aufgabenstellungen. Da wird
den Kindern ein Text vorgegeben, den
sie nicht selbst gewählt haben, der
im unterrichtlichen Zusammenhang
keine Rolle spielt.« (Ebd., 4) In der Tat:
So verhält es sich bei jedem professionellen Test und wer das kritisiert,
wendet sich gegen Tests schlechthin.
Das sollte man dann auch sagen.
Darüber hinaus wird hier unterstellt, dass sämtliche Testformate
automatisch und offensichtlich von
der Lehrerschaft völlig unreflektiert in
den Unterricht integriert werden. Dabei dürfte auch den meisten Grundschullehrkräften bekannt sein, dass
gute Testaufgaben einerseits und
gute Unterrichtsaufgaben andererseits ganz unterschiedlichen Kriterien
Genüge leisten müssen und sich Aufgaben deshalb selten für beide Zwecke gleichermaßen eignen. Ein sehr
zentrales Kriterium für Testaufgaben
ist beispielsweise die Ökonomie,
d. h. wie viel diagnostisch relevante
Informationen pro Zeiteinheit gewonnen werden können, weshalb in der
Testkonstruktion u. a. darauf geachtet
werden muss, dass die Schülerinnen
und Schüler möglichst wenig selbst
schreiben müssen (stattdessen: Ankreuzen, Unterstreichen etc.).
4
GSV aktuell 90 • Mai 2005
2 Zu Bartnitzkys Kritik
der VERA-Aufgaben
im Fach Deutsch
2.1 Eine Wetterkarte als
diskontiniuier­licher Text
Alle Schülerinnen und Schüler sollten
Aufgaben zu einer Wetterkarte (diskontinuierlicher Text) bearbeiten (vgl. ebd.,
S. 10). Ein Teil der Instruktion lautet: »Eine
Wetterkarte findest du täglich in allen
Tageszeitungen.« Bartnitzky schreibt
dazu, dass viele Kinder diese Karten in Tageszeitungen eben nicht fänden. »Grundschulkinder sind keine Zeitungsleser
und viele Elternhäuser halten gar keine
Tageszeitung. Schon der Einleitungssatz
zeigt die Kindferne der Ansprache.«
(S. 10f) – Gemeint ist, dass man eine solche Karte in den Zeitungen finden kann.
Die Instruktion unterstellt keineswegs,
dass die Kinder jeden Tag Zeitung lesen.
Man hätte auch einen Hinweis auf täglich im Fernsehen gezeigte Wetterkarten
geben können.
Bartnitzky moniert darüber hinaus,
dass diejenigen Kinder schlechte Karten
hätten, in deren Klassen Wetterkarten
bis zum Testbeginn noch nicht behandelt
worden seien. VERA ist aber, wie gesagt,
nicht unterrichtsvalide. Anders als mit
einer Klassenarbeit wird mit VERA nicht
nur überprüft, was vorher gelehrt wurde
– ebenso wenig wie bei PISA oder IGLU.
Eine Aufgabe: »Du verbringst deine Ferien
in Norddeutschland. Kannst du einen
Grillabend draußen planen? Begründe
deine Entscheidung.« Die Kinder sollen
hier verstreute Informationen aus der Abbildung und dem Vorhersagetext integrieren. Während in der Wetterkarte nur für
Bremen Schauer angezeigt werden, gibt
es unter der Überschrift »Reisewetter«
einen verbalen Hinweis, dass es abends in
Norddeutschland kräftige Regenschauer
geben wird. Bartnitzky kritisiert: »Für die
Testkonstrukteure zählt offenbar nur Bremen zu Norddeutschland. (…) die Leute in
Schleswig-Holstein, (…) werden sich über
solche eigenartige Geographie wundern.«
(S. 11) Diese Kritik ist hinfällig, da hier
entscheidende Textstellen übersehen
wurden.
»Du möchtest den Sonnenaufgang
beobachten. Wann musst du aufstehen?«
Die relevante Information lautet »Sonnenaufgang: 05:34«, als korrekte Lösung
wird verlangt »jeder Zeitpunkt bis einschließlich 5.34 Uhr«, wobei vage Angaben wie »morgens« als Fehler zählen sollen. Bartnitzky führt aus, was »das Kind
zu recht (denkt)« (S. 11), z. B. »Wo kann
Wer ist hier maßlos?
Zur Stellungnahme der VERA-Macher auf meine Kritik
an den Deutschaufgaben
Die Stellungnahme der VERA-Macher zu
meiner Kritik an den Deutschaufgaben ist
auf den vorigen Seiten zu lesen. Interessierten empfehle ich, beim Lesen meinen
Text und die dokumentierten Beispiele
aus den Tests dagegen zu halten (GRUNDSCHULE AKTUELL Heft 89 S. 10 ff.). Ich will
hier nur auf einige Punkte eingehen.
Maßlose Kritik?
Den Text »Christian« hatte ich als Schlag
gegen die Friedenserziehung bewertet.
Da kommt ein Neuer in die Klasse, groß
und stark, der sich gern prügelt. Der Text:
»Reihum probiert er aus, ob er der Stärkere bleibt.« Also gibt es wohl jede Menge
Prügelszenen. Dann gerät er an den Helden der Geschichte, an Jakob. Im ersten
Zweikampf unterliegt Jakob durch einen
Zufall. Im zweiten Zweikampf feuern die
Kinder ihn an: »Gib’s ihm, Jakob! Zahl’s
ihm zurück!« Jakob obsiegt. Nach Mei-
nung der Testkonstrukteure ist dies ein
Text für Gewaltfreiheit. Das verstehe, wer
wolle. Die Textauswahl ist für das in diesem Test nur mögliche affirmative Lesen
skandalös.
Kritik hinfällig?
Am Beispiel der Wetterkarte hatte ich
moniert, dass richtige Antworten der Kinder als Fehler gerechnet würden. Es ging
darum, ob es in Norddeutschland regnet.
Im Text rechts steht unter Norddeutschland: »In den Abendstunden kräftige
Regenschauer.« In der Karte sind Regenschauer nur bei Bremen markiert, nicht
aber bei Hamburg, Kiel und Rostock, also
im größten Teil Norddeutschlands. Diesen offensichtlichen Widerspruch können
die Testkonstrukteure nicht beseitigen.
Übersehen habe ich »entscheidende Textstellen« nicht, sondern ich hab sie miteinander verglichen. Meine Kritik ist mithin
Thema: VERA – Die Diskussion geht weiter
man die niedrig stehende Sonne sehen?«
und er weiß: »Wer um 5:34 aufsteht, wird
den Sonnenaufgang schwerlich erleben.«
(Ebd.) Folgt man seiner Logik, liegt ein Widerspruch auf der Hand: Was ist z. B. mit
dem Kind, das ein Bett direkt am Fenster
nach Osten hat? Wir halten es allerdings
nicht für ratsam, dieser Logik zu folgen.
Wir wissen nicht, was »das« Kind denkt,
sondern haben nur eine Hypothese zu
bieten. Demnach haben Kinder bis zum
Beginn des 4. Schuljahres in der Regel
gelernt, den Gehalt von Aufgaben »dekontextualisiert« zu erfassen. Wie sie 2
und 2 Eisbällchen zu 4 addieren, ohne
zu fragen, wie lange man sie – vielleicht
noch in der Sonne – in der Hand gehalten
hat, so können sie auch hier von spezifischen Kontexten absehen, von denen es
im Übrigen unendlich viele gibt.
2.2 Ein kontinuierlicher Text
Für den Kritiker ist die Wahl des Textes
»Christian« (abgedruckt ebd., S. 13) ein
»Skandal«. Die Begründung dieser These
sei etwas ausführlicher zitiert: »Die Situation des Neuen in der Klasse wird genutzt, um ihn sogleich als rüpelhaften
Außenseiter zu brandmarken. Genau so
werden Vorurteile gegen Minderheiten
gestärkt und die Aggressivität der Mehr-
nicht »hinfällig«, wie die VERA-Macher
behaupten. Die Vorlage ist fehlerhaft und
leitet Kinder in die Irre statt zu klären.
Lehrplanvalide,
nicht unterrichtsvalide?
Zur Wetterkarte hatte ich festgestellt,
dass sie zu Beginn der 4. Klasse nicht
in allen Klassen schon Thema war. Das
schaffe ungleiche Voraussetzungen. Die
VERA-Macher halten dagegen: Der Test
solle lehrplanvalide sein, unterrichtsvalide aber könne er nicht sein. Nun gibt es
aber keine Lehrplanvorgabe, dass Wetterkarten bis Ende Klasse 3 zu behandeln
seien. Kennen die Kinder solche Karten,
dann wird ihre Anwendungsfähigkeit am
selben Format geprüft. Kennen die Kinder
solche Karten nicht, dann wird ihre Kombinationsgabe am neuen Format geprüft.
Das sind zwei unterschiedlich zu gewichtende Leistungen. Es kann also für die Ergebnisse gar nicht gleichgültig sein, ob
die Kinder Vorwissen haben oder nicht.
Lehrplanvalide können solche Tests übrigens auch nur sein, wenn sie auf einer
heit begründet: Minderheiten sind unsympathisch, passen nicht in die Gruppe,
sind aggressiv und so weiter. Die Rollen
sind klar verteilt. […] Am Ende muss der
Besiegte die Gruppengesetze bedingungslos akzeptieren. Dies ist eine Konstellation, wie sie aus Kriegs-, Wild-Westund Blut-und-Boden-Filmen hinlänglich
bekannt ist. In der Geschichte wird dieser
für einen Grundschultext skandalöse Plot
dadurch legitimiert, dass der Neue, also
Christian, eben gerne ›rauft‹. Kein Gedanke aber daran, dass man mit einem
Neuen anders umgehen kann und muss,
um ihn zu integrieren, anstatt sich gleich
mit ihm zu prügeln. […] Friedenserziehung sieht wahrlich anders aus.« (Ebd.,
S. 13f)
Angesichts dessen, was hier gesagt
wird, fällt es schwer, sachlich zu bleiben. Denn die Kritik wird maßlos. Was
bringt Bartnitzky dazu, diesen Text auf
Blut-und-Boden-Filme zu beziehen, auf
faschistische Vorbilder also? Christian
wird anfänglich in der Tat als aggressiv
dargestellt. Darf das nicht sein? Muss
etwa gleich eine Erklärung z. B. in Form
der Frustrations-Aggressions-Hypothese
geliefert werden? Doch wohl nicht. Geht
aus dem Text etwa hervor, dass er für
irgendeine Minderheit steht? Nein. Muss
didaktisch begründeten repräsentativen
Auswahl beruhen. Das sind sie nicht. Sie
sind aus rein testpragmatischen Gründen
so entstanden, siehe den nächsten Punkt.
Restriktive Bedingungen
eines standardisierten Tests?
Kritik an der didaktischen Qualität der
Aufgaben weisen die Testkonstrukteure
zurück mit dem Hinweis der »restriktiven
Bedingungen«. Standardisierte Tests
seien nun einmal »restriktiv«, sprich: Die
Aufgaben müssten so gestellt werden,
dass sie in knapper Zeit lösbar und mit
den testmetrischen Mitteln auch gut auswertbar seien. Möglichst also keine freien
Antworten, sondern »Ankreuzen, Unterstreichen etc.«.
Genau dies ist aber auch das Problem.
Der Text Christian ist durchaus didaktisch
tauglich, dann müssten die Verhaltensweisen aber kritisch hinterfragt werden.
Dies geschieht nicht, weil die Aufgabenkonstruktion und die Auswertung für die
Testbedingungen nicht zu leisten seien.
Wesentliche Ziele des Rechtschreibunter-
in diesem Text der »Besiegte« am Ende
die Gesetze einer gewalttätigen Gruppe
akzeptieren? Nein, er lernt, dass es hier
offensichtlich gerade auf Gewaltfreiheit
ankommt. Wird gesagt, dass er nicht
integrierbar ist? Nein, denn er wird nicht
als tumber Schläger charakterisiert, sondern als jemand, der intelligent ist und
am Ende verstanden hat. Dieses Ende ist
offen, aber nur partiell. Der Leser bzw. die
Leserin kann den Schluss ziehen, dass das
»Raufen« keine Rolle mehr spielen wird,
denn es wäre eine »neue Mode«, die man
nicht einführen möchte. Die Kinder in der
Geschichte werden jenseits von Gewaltausübung einen Weg finden (müssen),
miteinander auszukommen.
Bartnitzky missversteht diesen Text
also auf eine befremdliche Art. Auf die
Kritik an einzelnen Aufgaben dazu kann
hier im Detail nicht eingegangen werden.
2.3 Aufgaben zur
Sprachbetrachtung
Diesmal lautet das Verdikt, die Aufgaben
unter »Sprachbetrachtung« zu fassen,
laufe auf »eine didaktische Hochstapelei«
(S. 11) hinaus. An einer Wortarten-Aufgabe
(»Welches der Wörter ist ein Verb (Tunwort)? Kreuze an!« Zur Auswahl stehen
»zehn«, »scharf«, »rückwärts«, »auslei-
richts werden durch die Satzdiktate des
Tests nicht erfasst, weil die zehn Minuten
Orthografie-Test und die Auswertungstechnik dies ausschlössen. Statt im Teil
Sprachbetrachtung Kinder über Sprache
reflektieren zu lassen, werden Wortarten
abgefragt, weil »Nachdenken« zu »zeitaufwändig und eine objektive Auswertung sehr schwierig« sei. »Lehrplanvalide«
ist etwas anderes.
Natürlich wären Tests zu entwickeln,
die dies alles besser könnten. Sie wären
aber aufwändiger in Testmethodik, Personal und Zeit. Die Politik drängt und die
Wissenschaft spielt mit.
Die Ergebnisse werden aber von
den VERA-Machern wie von den Auftraggebern so gehandelt, als seien sie
Generalaussagen über Leistungsprofile
von Klassen und sogar von einzelnen
Schülern. Diese völlige Überschätzung
des Aussagewertes über jedes vertretbare
Maß hinaus ist das Kernübel.
Horst Bartnitzky
Autor zahlreicher Veröffentlichungen
zur Deutschdidaktik
GSV aktuell 90 • Mai 2005
5
Thema: VERA – Die Diskussion geht weiter
Bartnitzkys Stil entsprechend, negativ
formuliert ist, lässt sich auch anders fassen. Es geht darum, Fehlerschwerpunkte
auszumachen, eine qualitative Diagnose
als Voraussetzung für eine gezielte Förderung zu leisten.
2.5 Ein knappes Fazit
hen« und »neu«.) bemängelt Bartnitzky,
hier werde »nichts von dem (gezeigt),
was für den Lernbereich Sprachbetrachtung […] wichtig ist. Dies nämlich sind
die Denkleistungen der Kinder, die hinter den Entscheidungen für eine Wortart
stehen.« (S. 12) – Zunächst: Nach wie vor
ist jedenfalls auch wichtig, ob die Kinder
zu richtigen oder falschen Ergebnissen
kommen. Darüber hinaus ist gar nicht
ausgemacht, ja eher unwahrscheinlich,
dass Kinder im Rahmen eines Tests ihre
Entscheidungen angemessen verbalisieren können. Sollen sie etwa einen kleinen
Text schreiben? Das wäre zeitaufwändig und eine objektive Auswertung sehr
schwierig. Wie seinem Anliegen im Rahmen eines Tests Rechnung getragen werden könnte, erörtert Bartnitzky leider mit
keinem Wort. Vielmehr wendet er sich
generell gegen das »rasch Angekreuzte«
und »reines Abfragen« (S. 12), so dass erneut der Eindruck entsteht, es gehe nicht
speziell um VERA, sondern um die Kritik
an standardisierten Tests überhaupt.
6
Der außerordentlich scharfe Ton der Kritik
Bartnitzkys an VERA erweist sich als völlig
unangemessen. So blendet er Restriktionen, die mit einem standardisierten Test
nun mal gegeben sind, systematisch aus
und seine Lesart von Aufgaben sind zum
Teil tendenziös, zum Teil auch (im Fall des
Textes »Christian«) rational nicht mehr
nachvollziehbar. Was Details angeht, so
sind einige seiner Hinweise allerdings
durchaus hilfreich.
Wir finden es sehr bedauerlich, dass
Bartnitzky auf die im Kontext von VERA
formulierten Hypothesen über Fähigkeitsniveaus in den Kompetenzbereichen
Lesen, Schreiben, Sprachbetrachtung und
Orthografie nicht genauer eingegangen
ist. Darüber hinaus erwähnt er mit keinem Wort, dass im Rahmen von VERA
versucht wurde, Gesichtspunkten eines
fairen Vergleichs Rechnung zu tragen.
Es ist zu hoffen, dass seine Darstellung
nicht das letzte Wort des Grundschulverbandes ist.
2.4 Aufgaben zur Orthografie
3 Zu Selters Kritik
der VERA-Aufgaben
im Fach Mathematik
Bartnitzky mutmaßt, die Testkonstrukteure wären auf Satzdiktate gekommen,
weil sie aus ihrer eigenen Schulzeit nichts
anderes kennen würden. Für die Orthografie stand nur sehr wenig Zeit zur Verfügung. Statt irgendeiner Version von
Diktat hätte man z. B. auf orthografische
Aspekte von »freien« Texten setzen können. Diese Option verbietet sich aber aus
nahe liegenden Gründen. Daraus, dass
jemand einen orthografisch einfachen
Text richtig schreibt, folgt ja nicht, dass er
leistungsfähiger ist als jemand, der einen
orthografisch anspruchsvollen Text mit
vielen Fehlern schreibt. Und: Dass unter
den restriktiven Bedingungen eines standardisierten Tests auf eine Diktatversion
gesetzt wird, impliziert nicht, dass nun
auch in »normalen« Lernsituationen Diktate als Königsweg der Überprüfung von
Rechtschreibwissen zu verstehen wären.
»Jeder Satz hat seine Tücken, deshalb
wurde er so konstruiert.« – Was hier,
Auch Selter hat in seinem Artikel eine
Reihe von Kritikpunkten genannt, die
wir als konstruktive Hinweise zur Kenntnis nehmen. Dies heißt jedoch keineswegs, dass wir mit allen genannten Aspekten einverstanden sind. Erneut kann
aus Platzgründen nur auf einige wenige
Punkte eingegangen werden.
Selter bemängelt in Bezug auf Aufgabe 2 (Arithmetik), dass »in manchen
Bundesländern […] die Vorrangregel
›Klammer vor Punkt- vor Strichrechnung‹
erst Inhalt des 4. Schuljahres« sei und
weiter, bezogen auf alle Arithmetikaufgaben: »Die Aufgabenanforderung entstammt zudem nicht dem Kernbereich
des Arithmetikunterrichts der Klassen 1
bis 4, so wie ihn die einzelnen Lehrpläne
und die bundesweiten Bildungsstandards
vorsehen.«
Dies ist so nicht korrekt: Im Lehrplan
Schleswig-Holsteins ist bereits für Klasse
3 die Behandlung des Stoffes vorgesehen
GSV aktuell 90 • Mai 2005
(S. 84). Für alle übrigen Bundesländer sind
die Inhalte des Mathematik-Unterrichts
der Klassen 3/4 im Lehrplan/Rahmenplan
zusammengefasst, z. B. in der Lehrplanversion für Brandenburg (S. 36). Selbstverständlich werden nicht alle Kinder zu
Beginn der vierten Klasse den gesamten
Stoff kennen gelernt haben. Dass daraus
nicht gefolgert werden kann, dass nur
Inhalte der Klassenstufen 1/2 in einem
solchen Test abgefragt werden dürfen,
war oben schon dargelegt worden.
Bezüglich der zentralen Aufgabe 9
(Geometrie) kritisiert Selter: »… dass
vernünftige Leistungen von Kindern
nicht immer angemessen berücksichtigt
werden. Die Figur beispielsweise durch
das Anzeichnen eines zweiten Rechtecks
zu erweitern und eine Symmetrieachse
einzuzeichnen, ist eine produktive Leistung. […] Nirgendwo steht aber explizit,
dass man die vorgegebenen Figuren nicht
verändern darf.« Die Aufgabenstellung
ist jedoch eindeutig: Alle Spiegelachsen
sollen (in die abgebildete Figur) eingetragen werden. Dem Arbeitsauftrag
entsprechend wird es nur als vollständig
richtige Lösung gewertet, wenn alle Spiegelachsen eingetragen wurden. Anders
ist eine objektive Auswertung nicht zu
realisieren. Wenn man erlaubt, dass die
Figur verändert werden darf: Was ist dann
eine richtige Lösung? Die Einzeichnung
aller (also unendlich vieler) Spiegelachsen
außerhalb der Figur? Der geneigte Leser
ist eingeladen, selbst eine Korrekturanweisung hierzu zu entwerfen, die alle
möglichen Antworten der Kinder umfasst
und kategorisiert. Selter schreibt zur zentralen Aufgabe 10 (Sachrechnen/Größen):
»Die Antwort C anzukreuzen, würde der
(häufig in der Schule vermittelten) Alltagserfahrung entsprechen, dass große
Mengen relativ gesehen günstiger sind.«
Dies ist korrekt. Allerdings soll in der
Schule auch über Alltagserfahrungen
Hinausgehendes erlernt werden, z. B. die
situationsangemessene
Überprüfung
solcher Erfahrungen unter Nutzung
mathematischer Hilfsmittel.
Abschließend ist noch anzumerken,
dass die Aufgaben unter Mitarbeit von
Lehrkräften und Fachdidaktikern entwickelt und auf Konformität mit den Lehrplänen und Standards überprüft wurden.
Albert Bremerich-Vos, Jana Groß
Ophoff, Andreas Helmke, Ingmar
Hosenfeld, Sonja Wagner
Thema: VERA – Die Diskussion geht weiter
»SMS-Mathematik«?
Zur Stellungnahme der VERA-Gruppe zur Kritik an VERA
Auf die Replik der VERA-Gruppe möchte
ich mit drei grundsätzlichen Bemerkungen eingehen, die meine Anmerkungen zu den VERA-Mathematikaufgaben (H. 89) in einen größeren Rahmen
stellen.
Steigerung der Aufgabenqualität
Mir scheint, dass die Notwendigkeit der
Steigerung der Aufgabenqualität durchaus gesehen wird. Hierzu nur ein Punkt:
Ich bin mir aber nicht sicher, ob bei VERA
systematisch angelegte Interviewstudien
mit Kindern durchgeführt wurden, denen
man die Aufgaben vorlegte, die man bei
der Bearbeitung der Aufgaben beobachtete und die man dazu befragte. Aus
solchen Studien kann man häufig mindestens ebenso viel über Verbesserungsnotwendigkeiten und -möglichkeiten lernen
als durch Vorab-Einschätzungen von Lehrerinnen und Fachdidaktikern. Fachdidaktisch ausgerichtete Testent-wicklungsforschung testet in diesem Sinn zunächst
die Aufgaben mit Hilfe der Kinder, erst
dann die Kinder mit Hilfe der Aufgaben.
Ich sehe in einem gleichberechtigten
Prozess der Annäherung der Standards
der Testpsychologie einerseits und der
Fachdidaktik andererseits eine schwierige, aber auch lohnenswerte Aufgabe,
die beispielsweise für ein regelmäßiges
und auch für die Praxis aussagekräftiges,
hilfreiches System-Monitoring absolut
erforderlich ist. Nur: Die Verbesserung
der Aufgabenqualität ist notwendig, aber
m. E. nicht hinreichend.
Erweiterung des Repertoires
Denn es ist offenkundig, dass zentrale
schriftliche Tests in ihrer Aussagekraft
durchaus beschränkt sind (vgl. Brügelmann in H. 89). Mit einer individuellen
Diagnose der Kompetenzen der einzelnen Kinder sind sie – zumindest in der
gegenwärtigen Form – überfordert. Zudem werden durch die knappe für die
Bearbeitung zur Verfügung stehende Zeit
und das Streben nach Vergleichbarkeit
zahlreiche Kompetenzen nicht erhoben,
die für zeitgemäßen Mathematikunterricht und auch die späteren Erfordernisse
der Arbeitswelt von zentraler Bedeutung
sind. Wittmann spricht hier von »SMSMathematik«.
Um die Aussagekraft und den Nutzen für die Lehrerin und ihre Schüler zu
erhöhen, wäre es daher wünschenswert
und hilfreich, dass zentrale Lernstandserhebungen vermehrt auch Elemente enthielten, die nicht primär auf unmittelbare
Vergleichbarkeit ausgerichtet sind, also
etwa offenere Aufgaben, Aufgaben, die
in Kooperation bearbeitet werden, oder
solche, die die Selbsteinschätzungen
der Schüler anregen (vgl. die zentralen
Abschlussprüfungen in Schweden, www.
grundschulverband.de).
Dazu brauchen wir m. E. auch in
Deutschland eine wissenschaftlich fundierte Entwicklung und Erforschung von
solchen ›alternativen‹ Formen der fachbezogenen Leistungsfeststellung und -beurteilung. Der Grundschulverband leistet
hier mit seinem Projekt »Pädagogische
Leistungskultur« wichtige Beiträge. Auch
in den verschiedenen Fachdidaktiken gibt
es hierzu viel versprechende Ansätze. Das
ist umso wichtiger, als es nach meinem
Dafürhalten eine sehr offene Frage ist,
ob durch die angestrebte Operationalisierung der Bildungsstandards und
die damit einhergehende Entwicklung
von passgenauen Testaufgaben, wie es
Aufgabe des neu gegründeten Instituts
für Qualitätsentwicklung im Bildungs-
wesen ist, nicht auch viele der positiven
Entwicklungen in unseren Grundschulen
gefährdet werden.
Stärkung der fachdidaktischen
Entwicklungsforschung
In diesem Zusammenhang ist offenkundig, dass die u. a. Wagenschein zugeschriebene Feststellung, man wachse
nicht durch Messen, keineswegs nur auf
Einzelindividuen zutrifft, sondern auch
auf das System Schule. So hilfreich eine
qualitätvolle Outputorientierung sein
mag; bedeutsamer scheinen mir die von
der wissenschaftlichen Fachdidaktik begleiteten bzw. angeregten Prozesse der
Qualitätsentwicklung vor Ort.
Brauchen wir dafür neben dem MaxPlanck-Institut für Bildungsforschung
nicht auch ein gut ausgestattetes, konstruktiv ausgerichtetes Max-Planck-Institut für Fachdidaktik, dessen Forschungsund Entwicklungstätigkeit die konkrete,
die tägliche Arbeit der Lehrerinnen und
Lehrer unterstützt?
Ein Institut, das nicht nur Unterricht
analysiert und bewertet, sondern adressaten- und berufsbezogen vorrangig
Unterrichtskonzeptionen und Lernumgebungen für die Schule, aber auch für
die Lehreraus- und Lehrerweiterbildung
mit den Möglichkeiten der Wissenschaft
entwickelt und erforscht. Und wenn das
zu groß dimensioniert sein sollte: außer
dem IPN in Kiel wenigstens weitere, an
Universitäten angebundene nationale
Expertisezentren für fachdidaktische Unterrichtsentwicklung?
Christoph Selter
Professor für Mathematik
und ihre Didaktik
an der Päd. Hochschule Heidelberg
GSV aktuell 90 • Mai 2005
7

Documents pareils