Une fois n’est pas coutume, voici un petit article rédigé dans « l’urgence » au vu de cette fin de trimestre qui approche. Il s’agit de parler d’évaluation. Depuis que j’enseigne, on a toujours parlé d’évaluation par compétences, mais je sais que ce n’est pas toujours très clair pour tout le monde. D’ailleurs, la définition que je m’en suis faite n’est peut-être pas aussi académique et officielle qu’on pourrait me le demander. On a aussi supprimé les notes, ou plutôt les notes chiffrées, pour les remplacer par des lettres. Cela dit, les pratiques n’ont pas forcément beaucoup changé pour tout le monde. On reste souvent attaché à ce qu’on connait déjà et on essaye de s’adapter avec plus ou moins de succès.

Je vais donc essayer de partager ici ma réflexion. Elle est personnelle, fruit de mes petites années d’expérience et donc sujette à caution, bien sûr. Il est intéressant d’évoquer ce sujet avec des collègues ou encore mieux, avec l’équipe de circonscription. Il peut aussi sembler pertinent de se renseigner sur ce qu’en disent les spécialistes. J’aurais bien pris le temps de le (re)faire pour approfondir mon propos mais à quelques jours des vacances, je n’en ai pas le temps. J’espère en trouver plus tard, en espérant pouvoir consolider cet article.

Evaluer avec des lettres, pas des notes

La question qui revient souvent et qui m’a fait réagir ici, après de nombreuses réponses sur les réseaux, est du type :

Vous mettez « A » (Acquis) à partir de quelle note ?

S’en suivent des réponses du type « 15/20 » ou encore « 75 % de réussite » parfois. D’autres réponses s’orientent vers tout à fait autre chose. Je voulais, ici, proposer une réponse aussi complète que je le peux.

Les lettres ne sont pas des notes

C’est peut-être la première chose à préciser. Si quelqu’un, un jour, a proposé de recourir aux lettres, ce n’est pas pour rien. Ce n’est pas non plus pour brouiller les pistes car passer d’une échelle de onze (ou vingt-et-un) échelons à une échelle de quatre échelons, on en verrait mal l’intérêt. De toute évidence, une copie qui a 16 ne vaut pas une copie qui a 20, n’est-ce pas ?

Qui plus est, les transpositions proposées me laissent souvent perplexe. Par exemple, on dira parfois qu’un élève qui a entre 5/20 et 9/20 (ou 10/20) aura C. C correspond souvent à « acquisition débutée » ou « acquisition à renforcer », quelque chose de cet ordre. Et que dire de l’élève qui a 10, ou 11 ? Peut-on vraiment parler d’acquisition lorsque l’élève à moins de la moitié de juste ou tout juste la moitié de correcte ? N’y a-t-il pas un risque élevé de réponses données au hasard ou basées sur des stratégies de compensation, qui exploitent la mémoire le plus souvent.

Certains élèves n’ont pas du tout compris ce qu’est le verbe conjugué d’une phrase et comment le reconnaitre de manière sure mais ils ont mémorisé un stock très important de verbes conjugués. Ils peuvent donc en retrouver un certain nombre et faire illusion. Cette stratégie peut permettre un résultat correct sans pour autant garantir une acquisition débutée dans la reconnaissance des verbes conjugués. L’élève peut très bien rester bloqué à ce stade.
Une note chiffrée, c’est un score. Cela permet de faire des statistiques aisément, de classer, de trier. C’est le rapport de réponses justes par rapport au nombre de réponses demandées. Si on acceptais l’idée qu’une lettre est la transposition d’une note, alors on partirait du principe que :
  • les lettres diminuent la précision de l’évaluation et donc brouillent les pistes
  • les lettres pourraient alors servir à gommer les différences, en apparence seulement
  • les lettres sont le résultat d’une évaluation plus quantitative que qualitative

Or, il me semble que ce n’était pas du tout l’idée derrière ces lettres. C’est là, d’ailleurs, qu’entrera en scène l’évaluation par compétence.

Les notes ne sont pas objectives

Alors on voit encore parfois apparaitre l’idée qu’une note, c’est plus objectif. On prépare un barème, on applique le même pour tous et alors on serait plus juste, car chacun est évalué au regard de la même grille. Seulement voilà, dans les faits, de nombreuses études démontrent qu’on est loin de cet idéal, même avec la note. Alors même si je ne suis plus capable de vous les citer avec précision maintenant, une rapide recherche confirmera mon propos sans trop de difficultés.

On observe déjà des différences entre professeurs : deux professeurs qui corrigent les mêmes copies ne donneront pas les mêmes notes, malgré l’existence d’un barème. De même, le même professeur confronté à deux publics différents ne donnera pas les mêmes notes à des copies ayant les mêmes réponses. On ne donnera pas non plus toujours la même note à deux copies similaires si elles ne sont pas présentées avec le même soin (les premières impressions ont un lourd pouvoir).

Bon, certes, on cherche avant tout à être juste dans les limites de notre propre classe. Oui, sauf que là encore, la présentation de la copie joue. Nos a priori sont toujours présents. Souvent, l’anonymat favorise la diminution du facteur subjectif mais nous ne pouvons nous l’appliquer à nous-mêmes : très vite, nous reconnaissons les écritures de nos élèves. Selon le moment de la journée où nous corrigeons la copie, le jour où nous le faisons, le moment dans l’année, la place de la copie dans la pile, la qualité de la copie précédente, notre note pourra varier malgré l’existence d’un barème. La précision du barème et surtout la complexité de la tâche (donc la multiplicité des réponses potentielles) n’est pas à oublier.

Et le plus grand risque, dans cette histoire, serait de croire que nous ne sommes pas sujets à tous ces biais ! Car oui, si on nie l’existence de ces biais, alors on ne cherche plus à les contrer. Ce n’est que dans la conscience que, comme tout être humain et tout professeur, nous pouvons être influencés par un nombre important de ces facteurs que nous pouvons en diminuer la force. La note, elle, ne garantie en rien « l’objectivité » ou la « justesse » de notre évaluation.

Dans l’ouvrage L’évaluation à l’école pour la réussite des élèves, de la collection « Questions d’Enseignants » chez Nathan, vous trouverez des pages 15 à 24, un détail de quelques recherches menées et des différents biais de la note.

L’évaluation par compétences

On a pour habitude de dire qu’avant, on évaluait les connaissances et qu’aujourd’hui, on évalue pas compétences. Ce n’est pas tout à fait exact. Sans parler d’avant, aujourd’hui, nous évaluons en général les deux, selon le domaine et le niveau. On ne peut pas vraiment dire que toutes nos évaluations sont des évaluations de compétences, même si on s’y efforce.

Si on veut schématiser, la connaissance, ce serait la capacité de réciter et reformuler une leçon ou un élément de celle-ci. La leçon réunit des connaissances. Celles-ci sont nécessaires, le plus souvent, à l’acquisition d’une compétence. On acquiert une compétence quand on est capable de la mettre en oeuvre. Si la connaissance était le « dire », la compétence serait le « faire ».

Etre capable de dire que le verbe est un mot qui désigne le plus souvent une action ou permet d’introduire un état est une connaissance. De même, ajouter qu’il se conjugue en fonction du temps et du sujet est une connaissance. Par contre, cela ne garantit pas qu’on soit capable de retrouver le verbe, son sujet, le temps et de conjuguer le verbe. En être capable, c’est avoir acquis la compétence qui consiste à « conjuguer un verbe » ou encore à « respecter la chaine d’accord sujet-verbe ».
La compétence est donc difficile à évaluer. Celle-ci nécessite la mise en place de stratégies ou de processus, qui peuvent différer d’un élève à un autre. Elle s’appuie sur une ou plusieurs connaissances mais aussi sur l’entrainement. Enfin, elle se révèle dans son transfert dans le cadre de situations de plus en plus complexes et de plus en plus éloignées de la situation de découverte.

Les lettres témoignent d’un degré d’acquisition

Quand on parle de compétence, on évoque le « degré d’acquisition« . Et des degrés d’acquisition, il y en a une infinité pour une même compétence. Paradoxal, alors qu’on a réduit le nombre d’échelons à notre échelle d’évaluation ? Pas tant que ça.

C’est, selon moi, notamment lié au fait qu’on n’évalue pas au regard du dernier degré d’acquisition théoriquement atteignable mais au regard de celui attendu à la fin de la période (ou au moment de l’évaluation). D’un coup, on ressent moins le besoin d’une multitude d’échelons.

Quand il s’agit de respecter les chaines d’accord dans le groupe nominal, je n’attends pas la même chose de mes élèves de CE2 en novembre qu’en juin. En novembre, nous avons revu le déterminant, le nom, le groupe nominal minimal et le pluriel des noms régulier (avec -s). J’attends donc qu’un élève soit capable d’accorder « les tables », « des chaises », « trois stylos » mais pas forcément « les oiseaux » ou encore « les gentilles petites filles ». Par contre, si, durant le trimestre prochain, il n’acquiert pas les accords du pluriel avec « -x » ou si, en juin, il ne sait pas reconnaitre un adjectif et l’accorder, ce qui donnait lieu à un « A » en novembre sera un « PA » (voire « NA » en cas extrême) en fin d’année. Ça ne veut pas dire qu’il a oublié ce qu’il savait mais qu’il n’a pas su progresser suffisamment dans sa maitrise de la compétence « respecter les chaines d’accord dans le groupe nominal ».

Qui plus est, nous sommes dans une évaluation qualitative. Nous observons les processus et les stratégies mis en oeuvre par l’élève pour réussir une tâche. Ni une note, ni une lettre, ne saurait résumer cela. C’est tout l’importance du commentaire, dans le cahier d’entrainement, sur l’évaluation comme dans le dossier scolaire. La lettre est un repère simple et rapide, le commentaire est un appui précieux pour l’apprentissage. La lettre permet de se situer par rapport aux attendus et le commentaire permet de préciser ce qui est bon ou ce qui doit être retravaillé et approfondi.

On pourra donc dire qu’un élève fait des progrès et fournit des efforts formidables sans qu’il n’ait pour autant un « A » (Atteint). On reste précis (et honnête) : l’élève n’est pas au niveau attendu ; mais on valorise, on encourage voire on précise : l’élève doit encore travailler telle ou telle situation.

Les lettres peuvent encourager une évaluation plus positive

Cette idée d’évaluation positive n’est pas évidente. Certains la résument parfois à « compter les réussites ». Sauf que, bien souvent, les erreurs sont plus instructives que les réussites pour l’enseignant qui cherche à comprendre le raisonnement de son élève. Ces dernières peuvent d’ailleurs être le fruit d’une stratégie de compensation, d’un « coup de chance » ou encore d’une copie efficace d’un voisin bien choisi. Les erreurs, elles, permettent de trouver la limite de ce qui est acquis et là où ça coince.

Cependant, cela ne veut pas dire pour autant que nous devons fonctionner par « retrait de points », à l’image des dictées de notre enfance. Selon moi, l’évaluation positive est liée à une évaluation qualitative avant tout. On cherche à savoir ce que l’élève arrive à faire et où s’arrête son degré d’acquisition d’une compétence. L’erreur est alors un indice parmi tant d’autres, qui vaut autant qu’une réussite.

Avec la lettre, on ne cherche plus à établir un score mais à situer l’élève sur le chemin qu’il s’est construit et qui le mènera à la maitrise d’une compétence (au niveau attendu). On se demandera donc : « Est-ce acquis ? » au lieu de chercher le nombre d’erreurs ou de réussites. « L’élève sait-il faire ? » au lieu de « Combien de fois a-t-il réussi ? » ou « Combien de fois a-t-il échoué ? ».

Quelle lettre choisir ?

C’est là qu’on arrive à l’exercice le plus difficile pour l’enseignant. Si on veut garder le souci de justice et d’équité entre les élèves, on est obligé de mener un questionnement en amont. On est contraint de se demander ce qu’on attend précisément de nos élèves dans notre évaluation. Il faut réussir à analyser les situations proposées pour en évaluer la difficulté mais aussi graduer les erreurs avec précision.

Je poursuis avec mon exemple des accords dans le GN. Si l’élève arrive à m’accorder « des voitures » mais pas « une collection de voitures » et que tout est juste par ailleurs, je considère tout de même qu’il a atteint le niveau que j’attendais en début d’année. Je corrige « de voitures » et je mets une annotation pour expliquer. Nous reviendrons sur ce point en classe. Si un élève a su accorder « des chats » dans une phrase simple avec un ou deux GN minimaux mais pas « des voitures » dans une phrase avec cinq GN (mais les quatre autres sont justes), je ne considère pas que cette dernière erreur suffise à mettre en doute, à elle seule, l’acquisition de l’élève. C’est la multiplication des erreurs ou la présence d’erreurs dans les cas les plus simples qui risquent de m’orienter vers « PA » au lieu de « A ».
Le plus dur, c’est d’être précis avant de se lancer dans la correction. Cela dit, c’est aussi très important. Certains formateurs disent même qu’il faut être au clair avec nos attendus avant même de se lancer dans sa séquence. Je suis parfaitement d’accord même si c’est assez difficile en début de carrière car on a un peu de mal à estimer ce dont sont capables les élèves. Néanmoins, il ne faudrait pas trop s’inquiéter : quand on se fixe un objectif et qu’on s’en donne les moyens, on réussit en général à mener les élèves plus loin qu’on ne l’espérait vraiment. Il ne faut pas non plus hésiter à regarder ce qui se fait dans les manuels, chez les collègues ou sur le net pour se donner une idée. Les programmes restent une référence incontournable, bien sûr.
Pendant la correction, le problème peut être que, souvent, on en vient à douter de notre choix « d’échelle » en cours de correction. Je vois alors deux solutions possibles :
  1. Je corrige mais ne note pas tout de suite.
  2. A la fin de ma correction, je revois mon tas de copies pour réévaluer mon choix initial.

Attention, cependant : le risque est alors d’évaluer au regard des résultats du groupe et non au regard des attendus. Ces derniers ayant été choisis en fonction des attendus des programmes, c’est problématique. Si une évaluation est vraiment trop peu réussie par mes élèves, je vais préférer proposer une deuxième chance après remédiation plutôt que de « surnoter » l’évaluation elle-même.

Quelle lettre pour quelle évaluation ?

Si on regarde le cadre plus large de l’ensemble de nos évaluations, toutes ne se valent pas. Par exemple, pour estimer le « niveau global » en étude de la langue de mes élèves, je vais multiplier les supports d’observation. Il y a, bien sûr, le cahier du jour ou d’entrainement : vers la fin d’une séquence, je regarde (et parfois note) le degré d’acquisition de mes élèves en fonction des derniers exercices. C’est un premier indicateur, notamment utile en cas de situation exceptionnelle pendant l’évaluation : élève très fatigué, malade, alerte incendie en plein milieu, etc.

Ensuite, en évaluation, je propose deux types de situations :

  • des situations « simples » : le contexte est épuré au possible, il s’agit d’utiliser nos acquis pour réussir une tâche avec le moins de « parasites » possibles
  • des situations complexes : j’évalue une ou plusieurs compétences en même temps, dans une tâche complexe
Restons avec notre exemple des accords dans le GN. Je peux faire une évaluation simple avec des phrases où il faut retrouver les GN et ses composants, puis un exercice où il faut accorder les noms soulignés et enfin un dernier où il faut faire les deux : trouver les noms et les accorder. Tout est très décomposé mais je peux ainsi être plus fine dans mon analyse. Par contre, je couple cette évaluation avec des dictées (où d’autres notions d’EDL sont requises aussi et la charge cognitive plus importante) et des productions d’écrit autonomes (où les mots sont choisis par les élèves mais où la charge est aussi importante). Aussi, faire trois erreurs dans le premier exercice de mon évaluation « simple » n’équivaut pas à faire trois erreurs en dictée non-préparée, par exemple. De même, un « A » dans l’évaluation simple ne vaut pas un « A » dans l’évaluation complexe. Avoir « tout juste » dans la première ne garantit pas forcément un « tout juste » dans le seconde.

Quelle lettre pour le LSU ?

Tout au long de la période, on se sera donc évertué à prendre des notes sur les acquis des élèves. Là, chacun fonctionne à sa façon. Les sources d’évaluation sont nombreuses :

  • cahier du jour ou d’entrainement
  • interrogations à l’oral
  • bilans intermédiaires et évaluations finales, simples et complexes
  • système de ceintures
  • fonctionnement en plan de travail
  • cahier de réussite, portfolio
  • etc.

De ce fait, toutes les lettres ne se vaudront pas forcément. Les résultats obtenus avec un étayage plus important ou dans le cadre de tâches plus simples ne valent pas ceux obtenus en parfaite autonomie, par exemple. Ce sera donc à chacun d’estimer la valeur de ces notes (dans le sens « prise de notes »).

Cela dit, j’attache une attention toute particulière aux tâches les plus complexes : productions d’écrits dictées ou autonomes, résolution de problèmes, situations de recherche en sciences, etc. En effet, il me semble que ce sont les meilleurs indicateurs pour estimer la profondeur et la solidité des acquis. Savoir appliquer une technique de manière rigoureuse est généralement un élément essentiel dans la maitrise d’une compétence mais il ne me semble pas encore suffisant pour valider une acquisition solide. Une compétence acquise devrait être transférable dans des situations problèmes ou, au moins, complexes. L’élève devrait être capable de sélectionner la bonne compétence et l’adapter au contexte pour réussir (parfois avec un peu de temps bien sûr).

A = objectifs d’apprentissages Atteints

Je trouve intéressant de noter qu’on a choisi de parler d’un objectif atteint plutôt que d’une compétence acquise. Ainsi, on me conforte dans l’idée qu’il s’agit d’évaluer en fonction de ce qui peut être attendu de l’élève, en vue de ce qui a été travaillé en classe.

Une compétence acquise est quelque chose d’ancré et de solide. Et pour cause, ce seront les fondations d’autres compétences ou d’un degré de maitrise supérieur visé pendant les années suivantes. Si la maitrise de la compétence risque de s’étioler avec le temps, alors, l’acquis n’est pas encore assez solide. Cela dit, acquis ne veut pas dire « sans erreurs ». Les élèves ont de longues journées, sont énormément sollicités et ne sont pas toujours dans des conditions optimales. Qui plus est, comme je l’ai dit précédemment, certaines erreurs peuvent être liées au contexte de la tâche. Cependant, on peut s’accorder pour dire que la case « A » équivaut à peu d’erreurs, globalement.

PA = objectifs d’apprentissages Partiellement Atteints

L’élève est sur le chemin de la maitrise suffisante d’une compétence. Il a commencé à comprendre, est parti dans la bonne direction mais son degré acquisition est encore trop incertain. Il faudra renforcer les acquis et poursuivre sur le chemin entamé.

Le commentaire est alors essentiel : il ciblera les acquis et ce qui reste à travailler. Les parents auront alors un retour qualitatif sur les progrès de leur enfant.

NA = objectifs d’apprentissages Non Atteints

C’est peut-être la case la plus difficile. D’abord émotionnellement, elle semble « punitive ». Ensuite parce que « non atteint » renvoie à une sorte de néant, comme s’il n’y avait rien du tout. Or, on sait tous qu’aucun élève n’a « rien du tout ». Néanmoins, je ne l’utilise pas comme ça. J’utilise la case « NA » quand l’élève est beaucoup trop loin des attendus et qu’il n’a pas encore réussi à se mettre en chemin. Je parle ici du cheminement attendu au niveau où se trouve l’élève. Il se peut aussi qu’il soit parti dans une mauvaise direction et qu’il soit trop difficile pour lui, pour le moment, d’acquérir la compétence ciblée. Parfois, ce sont même des prérequis qui viennent à manquer.

La case « NA » ne nie pas les progrès et les efforts. Je rappelle juste qu’il s’agit, selon moi, de situer les acquisitions de l’élève par rapport aux attendus de la période. Or, ce n’est pas parce qu’un élève de CM1 arrive à lire et comprendre une phrase simple qu’on va mettre « PA » dans la lecture et compréhension de texte. Le niveau est vraiment beaucoup trop faible.

Un autre avantage du LSU, d’ailleurs, est de pouvoir signaler les différents suivis et dispositifs facilement (RASED, PPRE, etc.) : une information qui sera complétée par le commentaire.

Et la case « objectifs dépassés » ?

Celle-ci, elle en a fait couler, de l’encre. La case fait peur, déjà. Beaucoup ont craint voir débarquer des parents, livret scolaire à la main, scandant à qui veut l’entendre que leur enfant est un génie et qu’il devrait sauter une classe, puisqu’il a dépassé les attendus !

Oui mais non. D’abord, quoiqu’il arrive, je doute que la plupart des élèves aient « objectif dépassé » partout. Ensuite, une petite avance en début d’année peut justifier qu’on coche cette case mais ne signifie pas pour autant que l’élève sera en avance toute l’année, car il peut très bien bloquer sur un point ou l’autre. Cela dit, s’il s’avère effectivement qu’un élève a une avance large et risque de s’ennuyer tout au long de l’année, s’il présente la maturité nécessaire et l’envie : on devrait envisager le passage anticipé, n’est-ce pas ?

Comme Charivari, j’aime cette case. J’apprécie, tout d’abord, cette invitation à repenser notre évaluation. Pour pouvoir cocher cette case, je dois pouvoir laisser aux élèves potentiellement capables de l’obtenir une opportunité de montrer l’étendue de leurs capacités. Et si je fais cela, cela signifie aussi que je dois, dans ma séquence d’enseignement, anticiper que certains élèves auront atteint le niveau attendu rapidement et qu’il faudrait pouvoir leur apporter plus. J’ai donc fait une place pour cette case sur mes évaluations et dans ma façon de faire.

Mieux, toujours inspirée par Charivari, je me suis mise aux ceintures (ou plutôt aux étoiles) afin de permettre aux élèves, dans certains domaines, de progresser à leur rythme, même quand celui-ci va très vite ! C’est très appréciable car je n’ai ni l’impression d’abandonner les élèves les plus en difficulté, ni celle de laisser de côté les plus efficaces. On ne s’intéresse plus uniquement à la différenciation pour les plus fragiles mais aussi pour les plus rapides.

Maintenant, avoir la case « D » (dépassés) cochée une fois dans une évaluation est plus une valorisation. Cela ne suffira pas à me faire cocher la case « D » dans le LSU. Là encore, la fréquence et la difficulté ou complexité des tâches entre en compte.

  • Aucun de mes partages n'a la prétention d'être parfait (et surtout pas les longs articles). N'hésitez pas à me signaler les coquilles via le formulaire de contact.
  • Vous aussi vous pouvez partager : une expérience, une réflexion, une question ou des éléments de réponse. Et tout ça, c'est dans la partie commentaire que ça se passe !