deux decades pour brouiller les frontieres entre l
Transcription
deux decades pour brouiller les frontieres entre l
Journal of Educational Measurement and Applied Cognitive Sciences 1 http://www.jemacs.uni.lu/ 2007 volume 1, No 1 DEUX DECADES POUR BROUILLER LES FRONTIERES ENTRE L’EVALUATION FORMATIVE ET L’EVALUATION SOMMATIVE Aldina Silveira Lobo, FCPE Portugal La question Au début tout était simple. Le mot évaluation n’existait pas, même si le concept, lié à la classification, le remettait hors processus enseignement/apprentissage. L’expression évaluation formative (EF), née de Scriven et adoptée par les behavioristes Bloom, Hastings et Madaus (1971), s’est intégrée dans une autre famille. Les cognitivistes et constructivistes l’ont adoptée, eux aussi. Maintenant, elle habite les classes avec l’évaluation sommative (ES) et on a du mal à comprendre cette relation: qui est le responsable de quoi? Quel espace occupent l’une et l’autre? Quelles fonctions, outils, procédures alimentent chacune? Leurs frontières sont brouillées! C’est vrai qu’on a toujours dissocié les deux, mais avec l’élargissement progressif du glossaire évaluatif, la reconnaissance des pressions des examens sur l’évaluation interne et la diversification du rôle du maître, il devient évident que, les deux évaluations, elles cohabitent, en tension, l’espace classe. Voyons le sens du mot formative appliqué à l’évaluation des apprentissages. Allal (1991) fait une très bonne comparaison entre l’EF des neo-behavioristes et celle des cognitivistes. Pour les premiers l’enseignement était organisé dans des petites unités qui surgissaient par des étapes séquentielles. A la fin de chacune on faisait une EF de régulation rétroactive, pour qu’on pût prendre des décisions dans l’avenir. Le présent était complètement comprimé entre le passé et le futur. Le modèle défendu par Allal était un modèle de régulation interactive, un modèle du présent qui donne au professeur et à l’élève un rôle actif, de gestion des apprentissages. Dans cette mesure, il est encore aujourd’hui très vivant. Dans les années 80, on soulignait le caractère formative de l’évaluation ; elle devrait être continue, descriptive, qualitative… les chiffres n’appartenaient qu’au monde sommatif. De ceci, on parlait très peu, car il était déjà connu et identifié avec l’évaluation hors classe. Les professeurs essayaient de mettre en place la nouvelle A. Silveira Lobo 2 Évaluation formative et sommative évaluation, la méconnue. C’était très difficile de le faire ; en général, ils ne réussissaient pas. Voilà pourquoi d’autres expressions sont parues. Les coordonnées de l’apprentissage assisté par l’évaluation (Hadji, 1990) ou de l’évaluation formatrice (Nunziati, 1990) révèlent des réflexions concernant l’application de l’EF. L’évaluation formatrice stressait encore plus vivement le rôle de l’élève, comme le fait Earl (2003), qui, plus récemment, a présenté son concept d’évaluation comme apprentissage. Cependant, on s’aperçoit, dans cette dernière décennie, que la spécification ce fait par rapport à l’ES, soit-elle interne ou externe. Je parle de l’évaluation alternative (Gipps & Stobart, 2003) – alternative à la sommative –, de l’évaluation pour les apprentissages (Black & Wiliam, 1998a) – par opposition à celle des apprentissages –, de l’évaluation authentique (Wiggins, 1989), de la contextuelle (Berlak et al., 1992), de la formative alternative (Fernandes, 2005) – par opposition à celle faite exprès, à un moment donné. Le problème, c’est qu’en regardant les classes et en écoutant les professeurs qui sont sur le terrain, on se rend compte qu’ils doivent accomplir plusieurs fonctions : former, aider à comprendre, réguler, informer, certifier, sélectionner. C’est-à-dire, il y a des fonctions qui se lient soit à l’EF soit à l’ES. Ainsi, surtout dans ce siècle, on reconnaît l’inévitabilité de la cohabitation de ces deux systèmes, même si quelques uns veulent donner plus d’importance à l’EF, car son développement permet de réussir les deux évaluations (Biggs, 1998), (Black, 2003), (Brookhart, 2001), (Fernandes, 2005), (Gipps, 2004), (Harlen, 2006), (Perrenoud, 1999), (Roegiers, 2004), (Shepard, 2001), (Stiggins, 2002), (Wiliam, 2000). Alors, la question qu’on se pose aujourd’hui, c’est comment se rapportent les deux évaluations ? En classe, où termine l’une et où commence l’autre ? En réalité, ce qui intéresse, c’est d’avoir des réponses pour quelques questions : pour accomplir les différentes fonctions, peut-on s’en servir des mêmes outils ? des mêmes techniques ? des mêmes données ? Comment sait-on si on travaille l’une ou l’autre ? A. Silveira Lobo 3 Évaluation formative et sommative Définition de termes Commençons par l’éclaircissement des concepts. Si on prend les définitions données par plusieurs auteurs, on obtient ce qui suit : • EF – c’est « un type d’évaluation menée par l’enseignant, qui, en cours d’apprentissage, vise à détecter les difficultés de l’élève en vue d’y remédier » (Roegiers, 2004, p.58). Elle inclut toutes les activités menées par professeurs et élèves qui fournissent des donnés utilisés comme feedback, avec le but de modifier les activités d’enseignement et d’apprentissage de façon à raccourcir le gap entre la situation actuelle de l’élève et les niveaux de référence désirables (Black & Wiliam, 1998a). • ES – celle qui « arrive à la fin d’une période ou d’un cours et qui est usée pour donner de l’information sur combien les élèves ont appris et sur la qualité du fonctionnement du cours » (Gipps, 2004, p.vii). « C’est une réponse à des pressions externes et au besoin d’accountability » (Brookhart, 2001, p.157). • Evaluation interne (EI) – « celle qui est de la responsabilité totale des écoles et des professeurs » (Fernandes, 2005, p.20). • Evaluation externe (EE) – « celle qui est de la responsabilité et initiative totale d’une entité extérieur à l’école » (Fernandes, 2005, p.21). • Evaluation en classe (EC) – « celle soutenue par des activités appartenant aux programmes éducatifs suivis par les élèves. Ces activités peuvent être développées soit dans soit hors la salle de classe » (Crooks, 1988, p.439). On y inclut des tâches pour résoudre des tests formels, des questionnaires oraux, etc. On y inclut aussi l’évaluation des variables attitudinales et motivationnelles des apprentissages. Cela veut dire que la correspondance classique n’est plus valable : l’EF n’est pas synonyme d’EC car celle-ci correspond à l’EF plus une partie de l’ES ; et l’ES n’est pas synonyme d’EE car celle-ci ne correspond qu’à une partie de l’ES. Même l’EI n’est pas forcément pareil à l’EC, une fois que les décisions venant des conseils A. Silveira Lobo 4 Évaluation formative et sommative de gestion ou des conseils pédagogiques sont exclues de l’EC. La figure 1 peut éclaicir ce raisonnement. La question, donc, c’est de savoir ce qui se passe en classe. Maintenant, c’est clair qu’il y en a deux sortes d’évaluations : l’EF et l’ESI (évaluation sommative interne), qui sont prises en tension. Cependant, l’EE exerce aussi sa pression sur les deux. Plusieurs études l’assurent (Aitken, 2000), (Atkin, Black, & Coffey, 2001), (Black, 2003), (Borko & Elliott, 1998), (Clinciu, Cocorada, Luca, & Pavalache-Ilie, 2005), (Gipps & Stobart, 2003), (McMillan, Myran, & Workman, 1999), (Wiliam, 2000)... Mais comment jouent-elles ? Y en a-t-il des frontières bien définis ? Y en a-til des outils adéquats à chacune ? Y en a-t-il des moments express à chacune ? E C E ≠ EI EF Evaluation pour les apprentissages E ? ES Evaluation des apprentissages E EC – évaluation en classe EF – évaluation formative sommative externe EI – évaluation interne interne E EE – évaluation externe ESE – évaluation ESI – évaluation sommative Figure 1- Relation entre les différents concepts A. Silveira Lobo 5 Évaluation formative et sommative Cohabitation inévitable Traditionnellement, le contrôle des apprentissages se faisait après le processus enseignement, mais surtout dès l’existence des constructivistes que l’importance de l’évaluation en classe est stressée. Ils ont fait anticiper ce contrôle en le poussant vers le moment des apprentissages. L’évaluation est même devenue le soutien de l’apprentissage (Crooks, 1988), (Hadji, 1990). Et pourquoi ce changement ? Parce qu’il faut profiter l’EF pour augmenter la qualité des acquis. En accord avec Natriello (1987), l’évaluation des acquis des élèves a quatre fonctions générales : certification, sélection, direction et motivation. La première sert à identifier le niveau atteint par l’élève ; la deuxième pour le faire accéder à des parcours scolaires et professionnels ; la troisième pour que l’évaluateur communique ses désirs à l’évalué et refasse son diagnostique de façon à mieux planifier ; et, la motivation implique les évalués dans la tâche. Cardinet (1994) aussi, il trouve quatre fonctions principales de l’évaluation pédagogique : a) améliorer les décisions sur l’apprentissage de chaque élève ; b) informer l’élève et ses parents de ses progrès ; c) passer des certificats réclamés par l’élève et la société ; d) améliorer la qualité générale de l’enseignement. Comme l’auteur précédent, deux des fonctions exigent une EF et deux autres une ES. Cependant, chez Cardinet la participation des parents et de la société à l’école est plus évidente. Task Group on Assessment and Testing, dans un rapport présenté en 1988 (Harlen, 2006), a mis en évidence quatre fonctions de l’évaluation : a) la formative, qui facilite l’apprentissage pour permettre de préparer les pas suivants ; b) la diagnostique, qui identifie les difficultés d’apprentissage ; c) la sommative, qui offre des synthèses des réussites à chaque moment ; d) l‘évaluative, qui utilise l’évaluation des élèves pour des différents rapports de classe, d’école ou du système éducatif. Cette conceptualisation de l’évaluation a été reprise par plusieurs auteurs dont Wiliam (2000) et Harlen (2006) sont exemple. A. Silveira Lobo 6 Évaluation formative et sommative Black (2003) relève trois fonctions de l’enseignement : la formative, pour aider à l’apprentissage ; la sommative interne pour certifier et permettre les déplacements ; c) la sommative pour accountability. Il croit que les trois interagissent et que, même si l’existence des tensions est inévitable, leur cohabitation peut apporter des synergies. Earl (2003) aussi les a prises en identifiant l’évaluation : a) à des fins sommatives (liée à l’évaluation des apprentissages) pour certifier et informer les parents et les élèves des progrès, en signalant sa position relative par comparaison à ses copains ; à des fins formatives (l’évaluation pour les apprentissages) pour faire des descriptions qui permettent de définir les pas suivants ; c) à des fins encore plus formatives (évaluation comme apprentissage) pour inciter l’apprenant à sentir sa perspective critique face à l’évaluation et à l’apprentissage. Cette évaluation comme apprentissage de Earl me fait rappeler l’évaluation formatrice que Scallon et Nunziati (Nunziati, 1990) ont trouvé pour relever le rôle de l’élève dans le processus. En dépit de l’intérêt de l’équilibre de la pyramide de Earl, j’interprète le concept évaluation pour les apprentissages comme ayant forcément la participation active de l’élève. Voilà pourquoi je préfère la distinction qu’on a commencé à généraliser à partir des travaux de Black et Wiliam (1998a), (1998b) et des membres de Assessment Reform Group (ARG, 1999), (ARG, 2002), (ARG, 2002) : l’évaluation pour les apprentissages et l’évaluation des apprentissages. En bref, le professeur doit aider l’élève à comprendre les informations recueillies à travers d’un feedback qui lui permet de mieux gérer ses acquis. Face à des diagnostiques fréquents il est possible de mieux définir les compétences à développer, sélectionner les outils adéquats aux circonstances, délimiter des contenus curriculaires, évaluer des stratégies d’enseignement, motiver, contrôler des frustrations… Ainsi, on détache trois phases cruciales : la cueillette des évidences d’apprentissage (il faut bien choisir les méthodes et techniques), l’interprétation de ces données (il faut trouver les critères de référence par rapport au groupe, aux critères définis ou à la personne) et la dévolution de l’information traitée (il faut faire attention à la communication du feedback). Généralement, le professeur doit signaler la différence entre l’accomplissement de l’élève et le désirable, attribuer le succès à son effort et expliciter à nouveau le concept à apprendre. Comme atout, on relève les A. Silveira Lobo 7 Évaluation formative et sommative moments de réflexion critique, de construction de portfolios, des tâches qui exigent des réponses longues, des opinions etc. Malheureusement, les recherches rendent compte de pratiques peu approfondies et routinières où prédomine la fonction classificatrice de l’évaluation. Du côté de l’évaluation des apprentissages, il faut retenir la pensée de Harlen, Gipps, Broadfoot et Nuttal qui la partage en deux : l’ES cumulative (summing-up) et l’ES de contrôle (checking-up). La première offre une image du succès de l’évalué venant de l’addition de différents données tout au long du chemin parcouru à des fins formatives ; la seconde prend place avec la résolution des tests ou d’autres tâches avec le but spécifique d’enregistrer les acquis à un moment donné (Gipps, 2004). L’ES peut, donc, être appliquée à l’aide de l’EF. Le problème c’est que dans la plupart des Etats, l’EE (qui est sommative de contrôle) a un effet très lourd sur la décision de certification et de sélection, même au Portugal où elle ne pèse que 30%. Il est facile de se laisser influencer par la pression de l’entraînement à l’examen, avec les mêmes types de questions et de buts. Les professeurs se plaignent de la manque de temps pour tout faire et optent, en général, par privilégier la préparation à l’EE en dépit des tâches plus formatives comme le développement des apprentissages approfondies. La tension vécue par les professeurs réside sur le fardeau de l’option EF/ES comme plusieurs recherches l’attestent (Aitken, 2000), (McMillan et al., 1999)... La présence de l’ES de contrôle en classe reste incontestable. Avec cette évolution du concept de l’ES, les frontières entre l’EF et l’ES (I) sont devenues diffuses. L’ES continue à être ponctuelle mais plus fréquente. Elle augmente ses fonctions pour assister l’apprentissage. Par contre, sa fonction d’accountability, chaque fois plus exigeante, appuyé sur des tests ou des examens externes, s’isole en gardant ses caractéristiques traditionnelles. On conclue, donc, que l’EF et l’ES cohabitent inévitablement en classe. A. Silveira Lobo 8 Évaluation formative et sommative Relation intime En reconnaissant l’existence, en classe, des deux évaluations, certains auteurs les considèrent des systèmes indépendants, parallèles, mais la plupart d’entre eux, surtout depuis le virement du siècle, défendent son interaction où l’EF peut même prendre le devant (Biggs, 1998), (Black, 2003), (Gipps, 2004), (Harlen, 2006), (Stiggins, 2002), (Wiliam, 2000). Un des modèles de cohabitation est celui de Harlen (2006). Elle considère qu’une même activité de l’élève conduit à des évidences qui peuvent être traitées différemment selon le but désiré: formatif ou sommatif. Si seul le professeur utilise les évidences en les comparant avec les critères de classe définis préalablement et il s’y arrête en synthétisant son appréciation dans un numéro ou une lettre, il travaille sur l’ES. Si le professeur les utilise en les comparant soit avec ces mêmes critères de classe soit avec les critères spécifiques de l’élève et les deux définissent les pas à suivre, il est dans le formatif. Dans ce cas, il est souhaitable que l’élève et son professeur soient complices dans tout le parcours. Le danger c’est de changer de l’un à l’autre sans refaire la lecture des données. Il faut en faire attention ! Mais ce n’est pas si simple. Parfois on les mélanges et il est difficile à dire où on est. En effet, Harlen croit que l’EF et l’ES évoluent dans une dimension qui va de l’EF informelle à l’ES formelle, en passant par l’EF formelle et l’ES informelle. Le problème c’est d’identifier les frontières entre ces deux dernières. Si on regarde le tableau 1, on trouve beaucoup de cases pareilles. Le professeur prend part dans toutes les situations, mais, pour ces deux, c’est un seul jugé (le professeur) qui organise son travail de façon à recueillir des évidences naturelles, c’est-à-dire, intégrées dans les activités d’enseignement/apprentissage. Il s’en sert aussi pour refaire ses plans. Ce sont surtout le focus et le but qui changent, en accord avec ce qu’on a déjà vu sur l’EF: l’EF formelle concerne des décisions sur le futur, l’ES informelle sur les acquis, sur le passé, mais les deux opèrent au présent, pour informer et réguler. Ici elles se mélangent : l’information appartient à l’EF ; la régulation, normalement attribuée à l’EF, surgit dans le domaine de l’ES. Cependant, elles ne s’appliquent pas directement A. Silveira Lobo 9 Évaluation formative et sommative aux apprentissages mais aux plans de l’enseignement, ayant un but formatif. Il semble que la traditionnelle action prévue chez l’EF, surtout quand on parle d’interaction et de régulation, s’est perdue, en cédant de l’espace à l’ES. De quelque façon, il y a toujours (ou presque) un feedback fondamental. Tableau 1 : Une dimension possible des buts et pratiques évaluatives (Harlen, 2006) EF Formative Formative informelle formelle Quels sont les pas suivants.? ES Sommative Sommative informelle formelle Focus Qu’est-ce qui a été achevé jusqu’à maintenant? Objectif Informer sur les Informer sur les Réguler le Enregistrer les pas d’apprentissage pas d’enseignement processus en fonction réussites des qui suivent qui suivent des plans personnes Evidence Appartenant au Introduite dans le Introduite dans le Tâche ou test à recueillie travail habituel de travail habituel de travail habituel de part classe classe classe Bases/reference Par référence à Par référence à Par référence à des Par référence à du jugement l’élève l’élève et à des critères des critères critères Jugé par Élève et Professeur Professeur Professeur ou professeur évaluateur externe Action prise Feedback aux Feedback pour les Feedback pour les Rapport aux élèves e au plans du professeur plans du professeur élèves, parents, professeur autres profs... Epithète evaluation pour Combinaison Plongée ? Evaluation des les apprentissages (Matching) (Dip stick) apprentissages Ainsi, à partir des mêmes données, on peut faire appliquer soit une EF soit une ES dépendant des critères de comparaison et de l’usage qu’on donne à son interprétation. Selon Harlen, cela dépend aussi du fait d’impliquer (ou pas) l’élève dans les décisions pendant le processus. Le brouillard s’est installé A. Silveira Lobo 10 Évaluation formative et sommative En résumé, l’ancien axe d’analyse temporel n’est plus déterminant. En gros, la question ne se pose pas sur quand fait-on l’évaluation, mais à quoi servent les données obtenus, car une partie de l’ES s’est déplacée vers la salle de classe, en créant ainsi, dans beaucoup d’Etats (où il y a des examens), trois dimensions de l’évaluation : la formative, la sommative interne et la sommative externe. L’ESI peut être formelle ou informelle. L’informelle envahit l’espace de l’EF, en lui prêtant même ses verbes identificateurs d’action. Il est curieux de voir que l’envers était autrefois valable. Au Portugal, par exemple, vers la fin du siècle XIX et le début du XXème, les enfants étaient obligés de passer des examens mais, pour la plupart des niveaux scolaires, la classification finale devrait surgir de la moyenne des notes des épreuves écrites, des oraux et aussi des notes de comportement et de l’avancement dans les études enregistrées pendant l’année scolaire. La relation EF/ES qui, dans le plan théorique, était nette il y a 20 ans, reste aujourd’hui à l’intérieur d’un brouillard épais. Il se peut que, en réalité, rien n’aie changé, mais, en théorie, et en ayant la préoccupation de la transparence en évaluation, l’EC est devenue beaucoup plus complexe. A nous de pénétrer les classes et d’en déceler les frontières. Références Aitken, R. (2000). Teacher perceptions of the use and value of formative assessment in secondary English programmes. 15-20. Allal, L. (1991). Stratégies d'Evaluation Formative: Conceptions Psicopedagogiques et modalités d'aplication. L. Allal, J. Cardinet, & P. Perrenoud L'évaluation formative dans un enseignement différencié - Actes du colloque ŕ l'Université de Genčve, mars 1978 (6.a. ed., ). Berna: Peter Lang SA. ARG, A. R. G. (1999). Assessment for Learning - Beyond the black box. Cambridge : University of Cambridge Faculty of Education. ARG, A. R. G. (2002). Assessment for Learning: 10 principles. 2. ARG, Assessment Reform Group. Atkin, J. M., Black, P., & Coffey, J. E. (2001). The Relationship Between Formative and Summative Assessment - In the Classroom and Beyond. Classroom assessment and the National Science Education Standards, 1-14. National A. Silveira Lobo 11 Évaluation formative et sommative Research Council. Berlak , N., Newmann, F., Adams, E., Archbald, D., Burgess, T., Raven, J., & Romberg, T. E. (1992). Toward a new science of educational testing and assessment. New York: State University of New York Press. Biggs, J. (1998). Assessment and Classroom Learning: a role for summative assessment? Assessment in Education, 5(1), 103-110. Black, P. (2003). Testing: Friend or Foe? Routledge Falmer. Black, P., & Wiliam, D. (1998a). Assessment and Classroom Learning. Assessment in Education, 5(1), 7-74. Black, P., & Wiliam, D. (1998b). Inside the Black Box: Raising Standards Through Classroom Assessment . Londres: nferNelson. Bloom, B., Hastings, J., & Madaus, G. (1971). Handbook of Formative and Sumative Evaluation of Student Learning. E.U.A.: McGraw-Hill. Borko, H., & Elliott, R. (1998). Tensions between Competing Pedagogical and Accountability Commitments for Exemplary Teachers of Mathematics in Kentucky. 1-13. National Center for Research on Evaluation, Standards, and Student Testing (CRESST) - UCLA. Brookhart, S. M. (2001). Successful Students' Formative and Summative Uses of Assessment Information. Assessment in Education, 8(2), 58-65. Cardinet, J. (1994). Pour apprécier le travail des élèves. Bruxelas: DeBoeck Université. Clinciu, I., Cocorada, E., Luca, M., & Pavalache-Ilie, M. (2005). Effets pervers des évaluations sommatives. Comment évaluer? Outils, dispositifs et acteurs actes du 18čme Colloque International de l'ADMEE-Europe Reims: ADMEE-Europe//IUFM Champagne Ardenne. Crooks, T. (1988). The Impact of Classroom Evaluation Practices on Students. Review of Educational Research, 58(4), 438-481. Earl, L. (2003). Assessment as Learning: Using Classroom Assessment to Maximise Student Learning. Thousand Oaks, CA: Corwin Press. Fernandes, D. (2005). Avaliaçăo das Aprendizagens: desafios as teorias, práticas e políticas. Cacém: Texto Editores. Gipps, C., & Stobart, G. (2003). Alternative Assessment. T. Kellaghan, & D. E. A. Silveira Lobo 12 Évaluation formative et sommative Stufflebeam International handbook of educational evaluation, 549-576. Dordrecht: Kluwer. Gipps, C. (2004). Beyond Testing: Towards a Theory of Educational Assessment. Oxon: Routledge Falmer. Hadji, C. (1990). L'apprentissage assisté par l'évaluation (A.A.E.) mythe ou réalité. Cahiers Pédagogiques , 281 (Fev.), 20-23. Harlen, W. (2006). On the Relationship Between Assessment for Formative and Summative Purposes. J. Ed. Gardner Assessment and Learning, 103-117. Londres: Sage Publ. McMillan, J., Myran, S., & Workman, D. (1999). The Impact of Mandated Statewide Testing on Teacher's Classroom Assessment and Instructional Practices. Natriello, G. (1987). The Impact of Evaluation Processes on Students. Educational Psychologist, 22(2), 155-175. Nunziati, G. (1990). Pour construire un dispositif d'évaluation formatrice. Cahiers Pédagogiques, 280, 47-64. Perrenoud, P. (1999). L'évaluation des élèves. De la fabrication de l'excellence à la régulation des apprentissages. Entre deux logiques. Bruxelas: DeBoeck Université. Roegiers, X. (2004). L'école et l'évaluation, des situations pour évaluer les compétences des élčves. Bruxelas: De Boeck. Shepard, L. A. (2001). The Role of Classroom Assessment in Teaching and Learning . V. Ed. Richardson The Handbook of Research on Teaching (4ª. ed., 10661101). Washington, DC: American Educational Research Association. Stiggins, R. (2002). Assessment Crisis: The Absence Of Assessment FOR Learning. Phi Delta Kappan, 1-11. Wiliam, D. (2000). Integrating formative and summative functions of assessment. 113. Notes: Texto sapresentado ao Grupo de Trabalho 10 do Congresso Internacional sobre Educação Matemática, Makuhari, Tokyo, Agosto 2000