Stellungnahme zur Kritik an VERA in
Transcription
Stellungnahme zur Kritik an VERA in
Thema: VERA – Die Diskussion gehtThema: weiter Stellungnahme zur Kritik an VERA in »Grundschule aktuell«, Heft 89 In Heft 89 von »Grundschule aktuell« wurde VERA in scharfer Form kritisiert (»ungeeignet«, »bildungsfern«, »zum Teil skandalöse Aufgaben«, »schulpolitisches Desaster«, »Bedienung eines zynischen Menschenbildes« u. a.; ebd., S. 6, S. 10, S. 16). Im Folgenden skizzieren wir zunächst einige der mit VERA verbundenen Ziele und deuten den Kontext an, in dem dieses Projekt angesiedelt ist. Anschließend gehen wir in Ausschnitten auf Bartnitzkys Kritik ausgewählter Deutschaufgaben sowie Selters’ Kritik an Mathematikaufgaben ein. Aus Platzgründen werden nicht alle kritisierten Punkte an dieser Stelle behandelt: Eine ausführlichere Kommentierung zu allen thematisierten Inhaltsbereichen stellen wir auf der Internetseite des Projekts zur Verfügung (www.uni-landau.de/vera). 1 Zu einigen Zielen und zum Kontext von VERA Mit VERA werden wichtige Kompetenzen der Fächer Deutsch und Mathematik erhoben und zwar auf der Ebene von Ländern, Schulen und Schulklassen. Auf mittlere Sicht soll ein Beitrag zur Entwicklung und empirischen Absicherung von Kompetenzmodellen geleistet werden. Erst dann ist ein inhaltlich begründeter Konsens über Standards möglich, die über die einzelne Klasse bzw. Schule hinaus Geltung beanspruchen können. Bislang hängt – auch in der Grundschule – die Bewertung der Schülerleistungen stark von der Klassenzugehörigkeit ab: Mit derselben Leistung kann man also z. B. eine gute Note, aber auch nur ein »Ausreichend« bekommen. Dass dies unbefriedigend ist, liegt auf der Hand. Darüber hinaus ist VERA ein Baustein zur »Umsetzung«, aber auch Überprüfung der Lehrpläne und (künftig) Bildungsstandards für die Grundschule. Für die Lehrkräfte vor Ort soll VERA auch ein (nicht das) Mittel sein, den Lern- und Förderbedarf der Kinder, ihre Stärken und Schwächen zu ermitteln. Dabei kann man die Ergebnisse der eigenen Klasse mit den Leistungen von Klassen ähnlicher sozialer Zusammensetzung vergleichen (»fairer Vergleich«). Damit bietet VERA zugleich Ansatzpunkte für die schulinterne Fortbildung und die Weiterentwicklung der diagnostischen Kompetenz der Lehrkäfte. Aus vielen Untersuchungen weiß man, dass diagnostische Lehrerurteile häufig ungenau sind, wenn man sie mit den Ergebnissen von Leistungstests vergleicht. Dies gilt insbesondere hinsichtlich der Leistungsfähigkeit der gesamten Klasse, weniger für die Rangordnung einzelner Kinder innerhalb der Klasse. Lässt man sich auf die Testergebnisse ein, fallen vielleicht bestimmte Fehlerschwerpunkte auf, auf die man früher nicht geachtet hat oder man bemerkt z. B., dass die Streuung der Leistungen größer ist, als man bislang dachte. Das könnte dazu anregen, für eigene »blinde Flecken« sensibel zu werden und den Unterricht ein Stück weit anders zu gestalten. Genau zu solchen Aspekten der Unterrichtsentwicklung möchte VERA Impulse liefern. VERA ist ein standardisierter Leistungstest und sollte insofern »lehrplanvalide« sein, sich also auf Bereiche und Themen beziehen, die laut Lehrplan auch vorgesehen sind. Das ist der Fall (vgl. »Lehrplanbezüge« unter www.unilandau.de/vera/aufgaben.htm). Inwiefern VERA aber auch »unterrichtsvalide« ist, also mit dem zu tun hat, was in sieben Bundesländern in den ersten drei Schuljahren tatsächlich unterrichtet wurde, lässt sich verständlicherweise nicht sagen. Wäre dieses Kriterium aber das Entscheidende, so dürfte der Test angesichts der sehr großen Unterschiede und der Vielzahl beteiligter Schulen nur noch Stoff der ersten zwei Jahrgangsstufen umfassen und somit kaum geeignet sein, nennenswert zwischen den Schülerinnen und Schülern einzelner Klassen zu differenzieren. Ob VERA reliabel (zuverlässig) ist, hängt sehr stark davon ab, in welchem Ausmaß die Durchführung dem Kriterium der Objektivität genügt. Dabei geht es darum, dass für alle Schülerinnen und Schüler gleiche Bedingungen herrschen (ein zentrales Gebot der Fair- ness). Dies bezieht sich sowohl auf die Durchführung des Tests als auch auf die Auswer-tung. Daher ist es im Rahmen eines Tests individueller Fähigkeiten unfair, wenn die Schüler miteinander sprechen dürfen. Denn die dadurch im Test gezeigte Leistung ist nicht nur von den Fähigkeiten des einzelnen Kindes abhängig, sondern auch von den Fähigkeiten des Tischnachbarn. Wer also neben dem oder der Klassenbesten sitzt, wäre gegenüber anderen Kindern im Vorteil. Allein deshalb gelten in einem Testverfahren »Klassenarbeits- oder Klausurbedingungen«. Gleiches gilt für die Verwendung von Hilfsmitteln wie z. B. dem Wörterbuch: Die VERA-Aufgabenentwickler/innen hät- ten die Fähigkeiten im Umgang mit dem Wörterbuch gerne im Rahmen von VERA erfasst. Aber solange nicht sicher gestellt ist, dass alle gut 300 000 an VERA beteiligten Kinder am Testtag tatsächlich ein Wörterbuch zur Verfügung haben (idealerweise auch noch alle das gleiche), führen entsprechende Aufgaben zu unfairen Resultaten, die insbesondere Schülerinnen und Schüler aus einkommensschwachen Familien benachteiligen dürften. Es ist daher ein Gebot der Fairness, zum gegenwärtigen Zeitpunkt auf vergleichbare Aufgaben zu verzichten. Auch für die Auswertung ist zu fordern, dass sie möglichst objektiv und reliabel erfolgt. Die Reliabilität gibt Hinweise auf die Zuverlässigkeit des Tests, also z.B. in Bezug darauf, ob zwei voneinander unabhängige Beurteiler/innen bei ausgewählten Schülerinnen und Schülern zu identischen Ergebnissen kommen. Voraussetzung dafür ist, dass die Korrekturanweisungen möglichst präzise sind und wenig Spielraum für subjektive Interpretationen lassen. Dies gelingt für Mathematik insgesamt besser als für Deutsch und ist bei den Schreibaufgaben am wenigsten gegeben. In welchem Umfang VERA diese Testgütekriterien erfüllt, hängt nicht zuletzt von den durchführenden Lehrkräften ab. Manche Lehrpersonen werden sich anders verhalten haben als von den Testautoren gewünscht, z. B. deshalb, weil Die Autor/-innen Albert Bremerich-Vos, Professor für deutsche Sprache und Literatur und ihre Didaktik an der Universität Hildesheim, fachdidaktischer Berater des VERA- Projektes Jana Groß Ophoff (Dipl.-Psych.), wissenschaftliche Mitarbeiterin an der Universität Koblenz-Landau, Campus Landau. Forschungsschwerpunkte: Lehr-/ Lernpsychologie, Empirische Bildungs forschung. Betreuung des Inhaltsbereiches Deutsch im Projekt VERA Ingmar Hosenfeld, Junior-Professor an der Universität KoblenzLandau, Campus Landau. Forschungsschwerpunkte: Empirische Bildungs forschung, Unterrichtsforschung. Leitung des Projektes VERA Andreas Helmke, Professor an der Universität Koblenz-Landau, Campus Landau. Forschungsschwerpunkte: Unterrichtsforschung, Empirische Bildungs forschung, Kultur vergleich. Leitung des Projektes VERA Sonja Wagner (Dipl.-Psych.), wissenschaftliche Mitarbeiterin an der Universität Koblenz-Landau, Campus Landau. Forschungsschwerpunkte: Empirische Bildungsforschung. Betreuung des Inhaltsbereiches Mathematik im Projekt VERA http://www.uni-landau. de/vera/ GSV aktuell 90 • Mai 2005 3 Thema: VERA – Die Diskussion geht weiter sie »ihren« Kindern helfen wollten. Derlei Maßnahmen gefährden jedoch die Fairness und den Nutzwert des Verfahrens. Bartnitzky betont emphatisch die diagnostische Kompetenz der Lehrkräfte. Nur sie seien in der Lage, die Leistungen eines Schülers heute mit seinen früheren Leistungen kompetent zu vergleichen. Wir bestreiten das überhaupt nicht. Es ist aber nicht sinnvoll, diese Orientierung an einer individuellen Bezugsnorm gegen eine Orientierung an einer sozialen Norm und an inhaltlichen Kriterien auszuspielen. Ein Teil seiner Argumente betrifft offensichtlich nicht VERA speziell, sondern Tests im Allgemeinen. So räumt er zwar einerseits ein, dass ein Blick von außen auf die eigene Klasse oder Schule, den ein landesweiter Test ermöglicht, im Prinzip sinnvoll sei. Andererseits heißt es: »Nur führt der ›fremde Blick‹ bei VERA und Vergleichbarem zugleich zu einem verfremdeten Unterricht mit fremden Inhalten und Aufgabenstellungen. Da wird den Kindern ein Text vorgegeben, den sie nicht selbst gewählt haben, der im unterrichtlichen Zusammenhang keine Rolle spielt.« (Ebd., 4) In der Tat: So verhält es sich bei jedem professionellen Test und wer das kritisiert, wendet sich gegen Tests schlechthin. Das sollte man dann auch sagen. Darüber hinaus wird hier unterstellt, dass sämtliche Testformate automatisch und offensichtlich von der Lehrerschaft völlig unreflektiert in den Unterricht integriert werden. Dabei dürfte auch den meisten Grundschullehrkräften bekannt sein, dass gute Testaufgaben einerseits und gute Unterrichtsaufgaben andererseits ganz unterschiedlichen Kriterien Genüge leisten müssen und sich Aufgaben deshalb selten für beide Zwecke gleichermaßen eignen. Ein sehr zentrales Kriterium für Testaufgaben ist beispielsweise die Ökonomie, d. h. wie viel diagnostisch relevante Informationen pro Zeiteinheit gewonnen werden können, weshalb in der Testkonstruktion u. a. darauf geachtet werden muss, dass die Schülerinnen und Schüler möglichst wenig selbst schreiben müssen (stattdessen: Ankreuzen, Unterstreichen etc.). 4 GSV aktuell 90 • Mai 2005 2 Zu Bartnitzkys Kritik der VERA-Aufgaben im Fach Deutsch 2.1 Eine Wetterkarte als diskontiniuierlicher Text Alle Schülerinnen und Schüler sollten Aufgaben zu einer Wetterkarte (diskontinuierlicher Text) bearbeiten (vgl. ebd., S. 10). Ein Teil der Instruktion lautet: »Eine Wetterkarte findest du täglich in allen Tageszeitungen.« Bartnitzky schreibt dazu, dass viele Kinder diese Karten in Tageszeitungen eben nicht fänden. »Grundschulkinder sind keine Zeitungsleser und viele Elternhäuser halten gar keine Tageszeitung. Schon der Einleitungssatz zeigt die Kindferne der Ansprache.« (S. 10f) – Gemeint ist, dass man eine solche Karte in den Zeitungen finden kann. Die Instruktion unterstellt keineswegs, dass die Kinder jeden Tag Zeitung lesen. Man hätte auch einen Hinweis auf täglich im Fernsehen gezeigte Wetterkarten geben können. Bartnitzky moniert darüber hinaus, dass diejenigen Kinder schlechte Karten hätten, in deren Klassen Wetterkarten bis zum Testbeginn noch nicht behandelt worden seien. VERA ist aber, wie gesagt, nicht unterrichtsvalide. Anders als mit einer Klassenarbeit wird mit VERA nicht nur überprüft, was vorher gelehrt wurde – ebenso wenig wie bei PISA oder IGLU. Eine Aufgabe: »Du verbringst deine Ferien in Norddeutschland. Kannst du einen Grillabend draußen planen? Begründe deine Entscheidung.« Die Kinder sollen hier verstreute Informationen aus der Abbildung und dem Vorhersagetext integrieren. Während in der Wetterkarte nur für Bremen Schauer angezeigt werden, gibt es unter der Überschrift »Reisewetter« einen verbalen Hinweis, dass es abends in Norddeutschland kräftige Regenschauer geben wird. Bartnitzky kritisiert: »Für die Testkonstrukteure zählt offenbar nur Bremen zu Norddeutschland. (…) die Leute in Schleswig-Holstein, (…) werden sich über solche eigenartige Geographie wundern.« (S. 11) Diese Kritik ist hinfällig, da hier entscheidende Textstellen übersehen wurden. »Du möchtest den Sonnenaufgang beobachten. Wann musst du aufstehen?« Die relevante Information lautet »Sonnenaufgang: 05:34«, als korrekte Lösung wird verlangt »jeder Zeitpunkt bis einschließlich 5.34 Uhr«, wobei vage Angaben wie »morgens« als Fehler zählen sollen. Bartnitzky führt aus, was »das Kind zu recht (denkt)« (S. 11), z. B. »Wo kann Wer ist hier maßlos? Zur Stellungnahme der VERA-Macher auf meine Kritik an den Deutschaufgaben Die Stellungnahme der VERA-Macher zu meiner Kritik an den Deutschaufgaben ist auf den vorigen Seiten zu lesen. Interessierten empfehle ich, beim Lesen meinen Text und die dokumentierten Beispiele aus den Tests dagegen zu halten (GRUNDSCHULE AKTUELL Heft 89 S. 10 ff.). Ich will hier nur auf einige Punkte eingehen. Maßlose Kritik? Den Text »Christian« hatte ich als Schlag gegen die Friedenserziehung bewertet. Da kommt ein Neuer in die Klasse, groß und stark, der sich gern prügelt. Der Text: »Reihum probiert er aus, ob er der Stärkere bleibt.« Also gibt es wohl jede Menge Prügelszenen. Dann gerät er an den Helden der Geschichte, an Jakob. Im ersten Zweikampf unterliegt Jakob durch einen Zufall. Im zweiten Zweikampf feuern die Kinder ihn an: »Gib’s ihm, Jakob! Zahl’s ihm zurück!« Jakob obsiegt. Nach Mei- nung der Testkonstrukteure ist dies ein Text für Gewaltfreiheit. Das verstehe, wer wolle. Die Textauswahl ist für das in diesem Test nur mögliche affirmative Lesen skandalös. Kritik hinfällig? Am Beispiel der Wetterkarte hatte ich moniert, dass richtige Antworten der Kinder als Fehler gerechnet würden. Es ging darum, ob es in Norddeutschland regnet. Im Text rechts steht unter Norddeutschland: »In den Abendstunden kräftige Regenschauer.« In der Karte sind Regenschauer nur bei Bremen markiert, nicht aber bei Hamburg, Kiel und Rostock, also im größten Teil Norddeutschlands. Diesen offensichtlichen Widerspruch können die Testkonstrukteure nicht beseitigen. Übersehen habe ich »entscheidende Textstellen« nicht, sondern ich hab sie miteinander verglichen. Meine Kritik ist mithin Thema: VERA – Die Diskussion geht weiter man die niedrig stehende Sonne sehen?« und er weiß: »Wer um 5:34 aufsteht, wird den Sonnenaufgang schwerlich erleben.« (Ebd.) Folgt man seiner Logik, liegt ein Widerspruch auf der Hand: Was ist z. B. mit dem Kind, das ein Bett direkt am Fenster nach Osten hat? Wir halten es allerdings nicht für ratsam, dieser Logik zu folgen. Wir wissen nicht, was »das« Kind denkt, sondern haben nur eine Hypothese zu bieten. Demnach haben Kinder bis zum Beginn des 4. Schuljahres in der Regel gelernt, den Gehalt von Aufgaben »dekontextualisiert« zu erfassen. Wie sie 2 und 2 Eisbällchen zu 4 addieren, ohne zu fragen, wie lange man sie – vielleicht noch in der Sonne – in der Hand gehalten hat, so können sie auch hier von spezifischen Kontexten absehen, von denen es im Übrigen unendlich viele gibt. 2.2 Ein kontinuierlicher Text Für den Kritiker ist die Wahl des Textes »Christian« (abgedruckt ebd., S. 13) ein »Skandal«. Die Begründung dieser These sei etwas ausführlicher zitiert: »Die Situation des Neuen in der Klasse wird genutzt, um ihn sogleich als rüpelhaften Außenseiter zu brandmarken. Genau so werden Vorurteile gegen Minderheiten gestärkt und die Aggressivität der Mehr- nicht »hinfällig«, wie die VERA-Macher behaupten. Die Vorlage ist fehlerhaft und leitet Kinder in die Irre statt zu klären. Lehrplanvalide, nicht unterrichtsvalide? Zur Wetterkarte hatte ich festgestellt, dass sie zu Beginn der 4. Klasse nicht in allen Klassen schon Thema war. Das schaffe ungleiche Voraussetzungen. Die VERA-Macher halten dagegen: Der Test solle lehrplanvalide sein, unterrichtsvalide aber könne er nicht sein. Nun gibt es aber keine Lehrplanvorgabe, dass Wetterkarten bis Ende Klasse 3 zu behandeln seien. Kennen die Kinder solche Karten, dann wird ihre Anwendungsfähigkeit am selben Format geprüft. Kennen die Kinder solche Karten nicht, dann wird ihre Kombinationsgabe am neuen Format geprüft. Das sind zwei unterschiedlich zu gewichtende Leistungen. Es kann also für die Ergebnisse gar nicht gleichgültig sein, ob die Kinder Vorwissen haben oder nicht. Lehrplanvalide können solche Tests übrigens auch nur sein, wenn sie auf einer heit begründet: Minderheiten sind unsympathisch, passen nicht in die Gruppe, sind aggressiv und so weiter. Die Rollen sind klar verteilt. […] Am Ende muss der Besiegte die Gruppengesetze bedingungslos akzeptieren. Dies ist eine Konstellation, wie sie aus Kriegs-, Wild-Westund Blut-und-Boden-Filmen hinlänglich bekannt ist. In der Geschichte wird dieser für einen Grundschultext skandalöse Plot dadurch legitimiert, dass der Neue, also Christian, eben gerne ›rauft‹. Kein Gedanke aber daran, dass man mit einem Neuen anders umgehen kann und muss, um ihn zu integrieren, anstatt sich gleich mit ihm zu prügeln. […] Friedenserziehung sieht wahrlich anders aus.« (Ebd., S. 13f) Angesichts dessen, was hier gesagt wird, fällt es schwer, sachlich zu bleiben. Denn die Kritik wird maßlos. Was bringt Bartnitzky dazu, diesen Text auf Blut-und-Boden-Filme zu beziehen, auf faschistische Vorbilder also? Christian wird anfänglich in der Tat als aggressiv dargestellt. Darf das nicht sein? Muss etwa gleich eine Erklärung z. B. in Form der Frustrations-Aggressions-Hypothese geliefert werden? Doch wohl nicht. Geht aus dem Text etwa hervor, dass er für irgendeine Minderheit steht? Nein. Muss didaktisch begründeten repräsentativen Auswahl beruhen. Das sind sie nicht. Sie sind aus rein testpragmatischen Gründen so entstanden, siehe den nächsten Punkt. Restriktive Bedingungen eines standardisierten Tests? Kritik an der didaktischen Qualität der Aufgaben weisen die Testkonstrukteure zurück mit dem Hinweis der »restriktiven Bedingungen«. Standardisierte Tests seien nun einmal »restriktiv«, sprich: Die Aufgaben müssten so gestellt werden, dass sie in knapper Zeit lösbar und mit den testmetrischen Mitteln auch gut auswertbar seien. Möglichst also keine freien Antworten, sondern »Ankreuzen, Unterstreichen etc.«. Genau dies ist aber auch das Problem. Der Text Christian ist durchaus didaktisch tauglich, dann müssten die Verhaltensweisen aber kritisch hinterfragt werden. Dies geschieht nicht, weil die Aufgabenkonstruktion und die Auswertung für die Testbedingungen nicht zu leisten seien. Wesentliche Ziele des Rechtschreibunter- in diesem Text der »Besiegte« am Ende die Gesetze einer gewalttätigen Gruppe akzeptieren? Nein, er lernt, dass es hier offensichtlich gerade auf Gewaltfreiheit ankommt. Wird gesagt, dass er nicht integrierbar ist? Nein, denn er wird nicht als tumber Schläger charakterisiert, sondern als jemand, der intelligent ist und am Ende verstanden hat. Dieses Ende ist offen, aber nur partiell. Der Leser bzw. die Leserin kann den Schluss ziehen, dass das »Raufen« keine Rolle mehr spielen wird, denn es wäre eine »neue Mode«, die man nicht einführen möchte. Die Kinder in der Geschichte werden jenseits von Gewaltausübung einen Weg finden (müssen), miteinander auszukommen. Bartnitzky missversteht diesen Text also auf eine befremdliche Art. Auf die Kritik an einzelnen Aufgaben dazu kann hier im Detail nicht eingegangen werden. 2.3 Aufgaben zur Sprachbetrachtung Diesmal lautet das Verdikt, die Aufgaben unter »Sprachbetrachtung« zu fassen, laufe auf »eine didaktische Hochstapelei« (S. 11) hinaus. An einer Wortarten-Aufgabe (»Welches der Wörter ist ein Verb (Tunwort)? Kreuze an!« Zur Auswahl stehen »zehn«, »scharf«, »rückwärts«, »auslei- richts werden durch die Satzdiktate des Tests nicht erfasst, weil die zehn Minuten Orthografie-Test und die Auswertungstechnik dies ausschlössen. Statt im Teil Sprachbetrachtung Kinder über Sprache reflektieren zu lassen, werden Wortarten abgefragt, weil »Nachdenken« zu »zeitaufwändig und eine objektive Auswertung sehr schwierig« sei. »Lehrplanvalide« ist etwas anderes. Natürlich wären Tests zu entwickeln, die dies alles besser könnten. Sie wären aber aufwändiger in Testmethodik, Personal und Zeit. Die Politik drängt und die Wissenschaft spielt mit. Die Ergebnisse werden aber von den VERA-Machern wie von den Auftraggebern so gehandelt, als seien sie Generalaussagen über Leistungsprofile von Klassen und sogar von einzelnen Schülern. Diese völlige Überschätzung des Aussagewertes über jedes vertretbare Maß hinaus ist das Kernübel. Horst Bartnitzky Autor zahlreicher Veröffentlichungen zur Deutschdidaktik GSV aktuell 90 • Mai 2005 5 Thema: VERA – Die Diskussion geht weiter Bartnitzkys Stil entsprechend, negativ formuliert ist, lässt sich auch anders fassen. Es geht darum, Fehlerschwerpunkte auszumachen, eine qualitative Diagnose als Voraussetzung für eine gezielte Förderung zu leisten. 2.5 Ein knappes Fazit hen« und »neu«.) bemängelt Bartnitzky, hier werde »nichts von dem (gezeigt), was für den Lernbereich Sprachbetrachtung […] wichtig ist. Dies nämlich sind die Denkleistungen der Kinder, die hinter den Entscheidungen für eine Wortart stehen.« (S. 12) – Zunächst: Nach wie vor ist jedenfalls auch wichtig, ob die Kinder zu richtigen oder falschen Ergebnissen kommen. Darüber hinaus ist gar nicht ausgemacht, ja eher unwahrscheinlich, dass Kinder im Rahmen eines Tests ihre Entscheidungen angemessen verbalisieren können. Sollen sie etwa einen kleinen Text schreiben? Das wäre zeitaufwändig und eine objektive Auswertung sehr schwierig. Wie seinem Anliegen im Rahmen eines Tests Rechnung getragen werden könnte, erörtert Bartnitzky leider mit keinem Wort. Vielmehr wendet er sich generell gegen das »rasch Angekreuzte« und »reines Abfragen« (S. 12), so dass erneut der Eindruck entsteht, es gehe nicht speziell um VERA, sondern um die Kritik an standardisierten Tests überhaupt. 6 Der außerordentlich scharfe Ton der Kritik Bartnitzkys an VERA erweist sich als völlig unangemessen. So blendet er Restriktionen, die mit einem standardisierten Test nun mal gegeben sind, systematisch aus und seine Lesart von Aufgaben sind zum Teil tendenziös, zum Teil auch (im Fall des Textes »Christian«) rational nicht mehr nachvollziehbar. Was Details angeht, so sind einige seiner Hinweise allerdings durchaus hilfreich. Wir finden es sehr bedauerlich, dass Bartnitzky auf die im Kontext von VERA formulierten Hypothesen über Fähigkeitsniveaus in den Kompetenzbereichen Lesen, Schreiben, Sprachbetrachtung und Orthografie nicht genauer eingegangen ist. Darüber hinaus erwähnt er mit keinem Wort, dass im Rahmen von VERA versucht wurde, Gesichtspunkten eines fairen Vergleichs Rechnung zu tragen. Es ist zu hoffen, dass seine Darstellung nicht das letzte Wort des Grundschulverbandes ist. 2.4 Aufgaben zur Orthografie 3 Zu Selters Kritik der VERA-Aufgaben im Fach Mathematik Bartnitzky mutmaßt, die Testkonstrukteure wären auf Satzdiktate gekommen, weil sie aus ihrer eigenen Schulzeit nichts anderes kennen würden. Für die Orthografie stand nur sehr wenig Zeit zur Verfügung. Statt irgendeiner Version von Diktat hätte man z. B. auf orthografische Aspekte von »freien« Texten setzen können. Diese Option verbietet sich aber aus nahe liegenden Gründen. Daraus, dass jemand einen orthografisch einfachen Text richtig schreibt, folgt ja nicht, dass er leistungsfähiger ist als jemand, der einen orthografisch anspruchsvollen Text mit vielen Fehlern schreibt. Und: Dass unter den restriktiven Bedingungen eines standardisierten Tests auf eine Diktatversion gesetzt wird, impliziert nicht, dass nun auch in »normalen« Lernsituationen Diktate als Königsweg der Überprüfung von Rechtschreibwissen zu verstehen wären. »Jeder Satz hat seine Tücken, deshalb wurde er so konstruiert.« – Was hier, Auch Selter hat in seinem Artikel eine Reihe von Kritikpunkten genannt, die wir als konstruktive Hinweise zur Kenntnis nehmen. Dies heißt jedoch keineswegs, dass wir mit allen genannten Aspekten einverstanden sind. Erneut kann aus Platzgründen nur auf einige wenige Punkte eingegangen werden. Selter bemängelt in Bezug auf Aufgabe 2 (Arithmetik), dass »in manchen Bundesländern […] die Vorrangregel ›Klammer vor Punkt- vor Strichrechnung‹ erst Inhalt des 4. Schuljahres« sei und weiter, bezogen auf alle Arithmetikaufgaben: »Die Aufgabenanforderung entstammt zudem nicht dem Kernbereich des Arithmetikunterrichts der Klassen 1 bis 4, so wie ihn die einzelnen Lehrpläne und die bundesweiten Bildungsstandards vorsehen.« Dies ist so nicht korrekt: Im Lehrplan Schleswig-Holsteins ist bereits für Klasse 3 die Behandlung des Stoffes vorgesehen GSV aktuell 90 • Mai 2005 (S. 84). Für alle übrigen Bundesländer sind die Inhalte des Mathematik-Unterrichts der Klassen 3/4 im Lehrplan/Rahmenplan zusammengefasst, z. B. in der Lehrplanversion für Brandenburg (S. 36). Selbstverständlich werden nicht alle Kinder zu Beginn der vierten Klasse den gesamten Stoff kennen gelernt haben. Dass daraus nicht gefolgert werden kann, dass nur Inhalte der Klassenstufen 1/2 in einem solchen Test abgefragt werden dürfen, war oben schon dargelegt worden. Bezüglich der zentralen Aufgabe 9 (Geometrie) kritisiert Selter: »… dass vernünftige Leistungen von Kindern nicht immer angemessen berücksichtigt werden. Die Figur beispielsweise durch das Anzeichnen eines zweiten Rechtecks zu erweitern und eine Symmetrieachse einzuzeichnen, ist eine produktive Leistung. […] Nirgendwo steht aber explizit, dass man die vorgegebenen Figuren nicht verändern darf.« Die Aufgabenstellung ist jedoch eindeutig: Alle Spiegelachsen sollen (in die abgebildete Figur) eingetragen werden. Dem Arbeitsauftrag entsprechend wird es nur als vollständig richtige Lösung gewertet, wenn alle Spiegelachsen eingetragen wurden. Anders ist eine objektive Auswertung nicht zu realisieren. Wenn man erlaubt, dass die Figur verändert werden darf: Was ist dann eine richtige Lösung? Die Einzeichnung aller (also unendlich vieler) Spiegelachsen außerhalb der Figur? Der geneigte Leser ist eingeladen, selbst eine Korrekturanweisung hierzu zu entwerfen, die alle möglichen Antworten der Kinder umfasst und kategorisiert. Selter schreibt zur zentralen Aufgabe 10 (Sachrechnen/Größen): »Die Antwort C anzukreuzen, würde der (häufig in der Schule vermittelten) Alltagserfahrung entsprechen, dass große Mengen relativ gesehen günstiger sind.« Dies ist korrekt. Allerdings soll in der Schule auch über Alltagserfahrungen Hinausgehendes erlernt werden, z. B. die situationsangemessene Überprüfung solcher Erfahrungen unter Nutzung mathematischer Hilfsmittel. Abschließend ist noch anzumerken, dass die Aufgaben unter Mitarbeit von Lehrkräften und Fachdidaktikern entwickelt und auf Konformität mit den Lehrplänen und Standards überprüft wurden. Albert Bremerich-Vos, Jana Groß Ophoff, Andreas Helmke, Ingmar Hosenfeld, Sonja Wagner Thema: VERA – Die Diskussion geht weiter »SMS-Mathematik«? Zur Stellungnahme der VERA-Gruppe zur Kritik an VERA Auf die Replik der VERA-Gruppe möchte ich mit drei grundsätzlichen Bemerkungen eingehen, die meine Anmerkungen zu den VERA-Mathematikaufgaben (H. 89) in einen größeren Rahmen stellen. Steigerung der Aufgabenqualität Mir scheint, dass die Notwendigkeit der Steigerung der Aufgabenqualität durchaus gesehen wird. Hierzu nur ein Punkt: Ich bin mir aber nicht sicher, ob bei VERA systematisch angelegte Interviewstudien mit Kindern durchgeführt wurden, denen man die Aufgaben vorlegte, die man bei der Bearbeitung der Aufgaben beobachtete und die man dazu befragte. Aus solchen Studien kann man häufig mindestens ebenso viel über Verbesserungsnotwendigkeiten und -möglichkeiten lernen als durch Vorab-Einschätzungen von Lehrerinnen und Fachdidaktikern. Fachdidaktisch ausgerichtete Testent-wicklungsforschung testet in diesem Sinn zunächst die Aufgaben mit Hilfe der Kinder, erst dann die Kinder mit Hilfe der Aufgaben. Ich sehe in einem gleichberechtigten Prozess der Annäherung der Standards der Testpsychologie einerseits und der Fachdidaktik andererseits eine schwierige, aber auch lohnenswerte Aufgabe, die beispielsweise für ein regelmäßiges und auch für die Praxis aussagekräftiges, hilfreiches System-Monitoring absolut erforderlich ist. Nur: Die Verbesserung der Aufgabenqualität ist notwendig, aber m. E. nicht hinreichend. Erweiterung des Repertoires Denn es ist offenkundig, dass zentrale schriftliche Tests in ihrer Aussagekraft durchaus beschränkt sind (vgl. Brügelmann in H. 89). Mit einer individuellen Diagnose der Kompetenzen der einzelnen Kinder sind sie – zumindest in der gegenwärtigen Form – überfordert. Zudem werden durch die knappe für die Bearbeitung zur Verfügung stehende Zeit und das Streben nach Vergleichbarkeit zahlreiche Kompetenzen nicht erhoben, die für zeitgemäßen Mathematikunterricht und auch die späteren Erfordernisse der Arbeitswelt von zentraler Bedeutung sind. Wittmann spricht hier von »SMSMathematik«. Um die Aussagekraft und den Nutzen für die Lehrerin und ihre Schüler zu erhöhen, wäre es daher wünschenswert und hilfreich, dass zentrale Lernstandserhebungen vermehrt auch Elemente enthielten, die nicht primär auf unmittelbare Vergleichbarkeit ausgerichtet sind, also etwa offenere Aufgaben, Aufgaben, die in Kooperation bearbeitet werden, oder solche, die die Selbsteinschätzungen der Schüler anregen (vgl. die zentralen Abschlussprüfungen in Schweden, www. grundschulverband.de). Dazu brauchen wir m. E. auch in Deutschland eine wissenschaftlich fundierte Entwicklung und Erforschung von solchen ›alternativen‹ Formen der fachbezogenen Leistungsfeststellung und -beurteilung. Der Grundschulverband leistet hier mit seinem Projekt »Pädagogische Leistungskultur« wichtige Beiträge. Auch in den verschiedenen Fachdidaktiken gibt es hierzu viel versprechende Ansätze. Das ist umso wichtiger, als es nach meinem Dafürhalten eine sehr offene Frage ist, ob durch die angestrebte Operationalisierung der Bildungsstandards und die damit einhergehende Entwicklung von passgenauen Testaufgaben, wie es Aufgabe des neu gegründeten Instituts für Qualitätsentwicklung im Bildungs- wesen ist, nicht auch viele der positiven Entwicklungen in unseren Grundschulen gefährdet werden. Stärkung der fachdidaktischen Entwicklungsforschung In diesem Zusammenhang ist offenkundig, dass die u. a. Wagenschein zugeschriebene Feststellung, man wachse nicht durch Messen, keineswegs nur auf Einzelindividuen zutrifft, sondern auch auf das System Schule. So hilfreich eine qualitätvolle Outputorientierung sein mag; bedeutsamer scheinen mir die von der wissenschaftlichen Fachdidaktik begleiteten bzw. angeregten Prozesse der Qualitätsentwicklung vor Ort. Brauchen wir dafür neben dem MaxPlanck-Institut für Bildungsforschung nicht auch ein gut ausgestattetes, konstruktiv ausgerichtetes Max-Planck-Institut für Fachdidaktik, dessen Forschungsund Entwicklungstätigkeit die konkrete, die tägliche Arbeit der Lehrerinnen und Lehrer unterstützt? Ein Institut, das nicht nur Unterricht analysiert und bewertet, sondern adressaten- und berufsbezogen vorrangig Unterrichtskonzeptionen und Lernumgebungen für die Schule, aber auch für die Lehreraus- und Lehrerweiterbildung mit den Möglichkeiten der Wissenschaft entwickelt und erforscht. Und wenn das zu groß dimensioniert sein sollte: außer dem IPN in Kiel wenigstens weitere, an Universitäten angebundene nationale Expertisezentren für fachdidaktische Unterrichtsentwicklung? Christoph Selter Professor für Mathematik und ihre Didaktik an der Päd. Hochschule Heidelberg GSV aktuell 90 • Mai 2005 7