Remerciez-le!

Remerciez @Admin pour avoir partagé cet document gratuitement, de la manière la plus simple, en partageant sur les réseaux sociaux.

La validation des épreuves d’évaluation selon l’approche par les compétences Je

La validation des épreuves d’évaluation selon l’approche par les compétences Jean-Marie De Ketele UCL – BIEF François-Marie Gerard BIEF MOTS CLÉS: Évaluation des acquis, évaluation des compétences, pertinence, validité, fiabilité, approche par les compétences L’approche par les compétences conduit à évaluer les acquis des élèves à travers des situations complexes nécessitant une production complexe de la part de l’élève. Les techniques classiques de validation des épreuves d’évaluation ne peu- vent dès lors pas être utilisées telles quelles. D’autres approches de validation, qu’elles soient a priori ou a posteriori, devraient être adoptées, dans le respect des exigences de validité et de fiabilité, mais aussi et avant tout de pertinence. KEY WORDS: Evaluation of achievements, evaluation of competences, relevance, validity, fiability, competence approach The competence approach leads to the assessment of students achievements through complex situations that require a complex production (response) from them. The classic techniques in evaluation tests validation can no longer be used as it has been done until now. Other validations approaches, either a priori or a pos- teriori, should be implemented respecting the validity and fiability requirements. PALAVRAS-CHAVE: Avaliação dos conhecimentos, avaliação das competências, pertinência, validade, fiabilidade, abordagem por competências A abordagem por competências conduz a avaliar os conhecimentos dos alunos através das situações complexas sendo necessária uma produção complexa por parte do aluno. Isto implica que as técnicas clássicas de validação das provas de avaliação não possam continuar ser utilizadas como até então. Outras abordagens de validação, seja a priori, seja a posteriori, deverão ser adoptadas, no respeito pelas exigências de validade e fiabilidade, mas também e acima de tudo pela pertinência. Note des auteurs: Toute correspondance peut être adressée par courriel à l’adresse suivante: [jean-marie.deketele@psp.ucl.be] MESURE ET ÉVALUATION EN ÉDUCATION, 2005, VOL. 28, N O 3, 1-26 1 3•06-29-01_V28 N3_INT 3/13/06 14:07 Page 1 Un peu partout dans le monde, les pratiques pédagogiques se réfèrent de plus en plus à une approche par compétences se différenciant d’une approche par contenus ou par objectifs: • l’approche par contenus considère l’enseignement en termes de liste de matières et de contenus-matières à enseigner, c’est-à-dire à transmettre; • l’approche par objectifs a comme porte d’entrée des comportements observables structurés, mais séparés les uns des autres, qui sont à déve- lopper chez les apprenants; • l’approche par compétences cherche à développer la possibilité par les apprenants de mobiliser un ensemble intégré de ressources1 pour résoudre une situation-problème appartenant à une famille de situations (De Ketele, 2000, 2001 a et b; Dolz & Ollagnier, 2002; Fourez, 1999; Gerard, 2005; Jonnaert, 2002; Lasnier, 2000; Le Boterf, 1994; Legendre, 2001; Perrenoud, 1997; Poirier Proulx, 1999; Rey, 1996; Rey, Carette, Defrance & Kahn, 2003; Roegiers, 2000, 2003; Scallon, 2004; Tardif & al., 1995; Tilman, 2000). Ces différentes approches entraînent des pratiques d’évaluation différentes (De Ketele & Dufays, 2003): • dans l’optique des contenus, évaluer consiste à prélever un échantillon de contenus représentatif de l’univers de référence des contenus enseignés; • dans l’optique des objectifs, évaluer consiste à prendre un échantillon représentatif d’objectifs spécifiques et opérationnels et à générer un échan- tillon de questions qui traduisent au mieux cet échantillon d’objectifs; • dans l’optique des compétences, évaluer consiste à proposer une ou des situations complexes, appartenant à la famille de situations définie par la compétence, qui nécessiteront, de la part de l’élève, une production elle- même complexe pour résoudre la situation. JEAN-MARIE DE KETELE ET FRANÇOIS-MARIE GERARD 2 3•06-29-01_V28 N3_INT 3/13/06 14:07 Page 2 Entre pertinence, validité et fiabilité Les épreuves élaborées à des fins d’évaluation selon chacune de ces approches seront inévitablement différentes. Néanmoins, les questions qui se posent par rapport à ces épreuves sont les questions classiques relatives à tout recueil d’information: sont-elles pertinentes, valides et fiables (De Ketele & Roegiers, 1993)? • La pertinence est le caractère plus ou moins approprié de l’épreuve, selon qu’elle s’inscrit dans la ligne des objectifs visés (De Ketele, Chastrette, Cros, Mettelin & Thomas, 1989). C’est son degré de «compatibilité» avec les autres éléments du système auquel elle appartient (Raynal & Rieunier, 2003). • La validité est le degré d’adéquation entre ce que l’on déclare faire (évaluer telle ou telle dimension) et ce que l’on fait réellement, entre ce que l’outil mesure et ce qu’il prétend mesurer (Laveault & Grégoire, 2002). • La fiabilité est le degré de confiance que l’on peut accorder aux résultats observés: seront-ils les mêmes si on recueille l’information à un autre moment, avec un autre outil, par une autre personne, etc.? Elle nous renseigne sur le degré de relation qui existe entre la note obtenue et la note vraie (Cardinet & Tourneur, 1985; Laveault & Grégoire, 2002). Il ne faut cependant pas perdre de vue que la note vraie est une abstraction, un point de convergence souhaité indépendant des évaluateurs et des circonstances. Ces dimensions, théoriquement indépendantes les unes des autres, forment ensemble des conditions nécessaires pour disposer d’une épreuve d’évaluation digne de ce nom. Mais, prises isolément, elles ne sont jamais suffisantes: un outil fiable peut très bien n’être ni valide, ni pertinent, ou un outil pertinent ni valide ni fiable, etc. En adaptant l’exemple du tir à l’arc proposé par Laveault et Grégoire (2002), imaginons qu’on souhaite évaluer la compétence d’un trappeur à chasser du gibier grâce à son arc. Il doit pour ce faire être capable de réaliser un tir groupé sur une cible mouvante. Deux épreuves sont mises en place: d’une part, un tir de cinq flèches sur une cible classique, et, d’autre part, un tir de cinq flèches sur une cible mouvante semblable à du gibier. Les situations suivantes peuvent dès lors exister: Validation des épreuves d’évaluation 3 3•06-29-01_V28 N3_INT 3/13/06 14:07 Page 3 Dans la situation A, le tir est non fiable parce que dispersé sur toute la surface de la cible fixe. Il est non valide, parce que la mesure manque de précision et ne peut attester l’atteinte de l’objectif. Il est enfin non pertinent puisqu’il ne correspond pas à l’objectif recherché et ne mesure donc pas, de toute façon, ce que je déclare vouloir mesurer. Dans la situation B, le tir est groupé mais rate systématiquement la cible. Il est fiable (la mesure montre que le tireur sait faire un tir groupé), mais non valide parce que cette mesure ne me permet pas de vérifier qu’il est capable d’atteindre la cible. Dans la situation C, le centre de la cible, c’est-à-dire l’objectif, est atteint et la mesure est donc valide, mais elle n’est pas fiable parce qu’on ne peut certifier que ce sera toujours le cas. Dans la situation D, le tir est groupé et touche le mille, mais la cible n’est pas la bonne (par rapport à la compétence visée). La mesure est donc fiable et valide, mais non pertinente. Les situations E à H présentent des situations pertinentes par rapport à la compétence visée. Les situations E, F et G ont cependant des problèmes de validité ou de fiabilité, alors que la situation H détermine une mesure à la fois fiable, valide et pertinente. Elle seule permet de certifier que le trappeur est compétent. JEAN-MARIE DE KETELE ET FRANÇOIS-MARIE GERARD 4 A. Non pertinent Non valide Non fiable B. Non pertinent Non valide Fiable C. Non pertinent Valide Non fiable D. Non pertinent Valide Fiable E. Pertinent Non valide Non fiable F. Pertinent Non valide Fiable G. Pertinent Valide Non fiable H. Pertinent Valide Fiable 3•06-29-01_V28 N3_INT 3/13/06 14:07 Page 4 La situation D est intéressante parce qu’elle reflète ce que sont les épreuves classiques, notamment celles utilisées dans les grandes enquêtes internationales du type TIMMS ou PISA, du moins lorsqu’elles s’inscrivent dans un système éducatif fondé sur l’approche par les compétences. Ces épreuves proposent un ensemble d’items selon une structure très élaborée issue principalement d’une approche par les contenus ou par les objectifs. Elles sont fiables et valides, mais ne sont pas pertinentes par rapport à l’appro- che par compétences et donc par rapport aux finalités des systèmes éducatifs conçus dans cet esprit. Si elles permettent bien d’évaluer les ressources jugées nécessaires (savoir-reproduire et savoir-faire), elles ne permettent pas (ou peu) d’évaluer la faculté de mobiliser celles qui sont pertinentes pour résoudre des problèmes ou effectuer des tâches complexes. Il faudrait donc pouvoir disposer d’épreuves correspondant à la situation H, mais il est vraisemblable que de nombreuses épreuves actuellement éla- borées sont plutôt proches des situations E ou F: elles devraient être perti- nentes parce qu’elles proposent une situation complexe, mais il est difficile d’en attester la validité parce que les méthodes pour assurer cette validation ne sont pas évidentes ou tout simplement pas connues. Il n’est, en tous cas, pas possible de se servir telles quelles des méthodes utilisées dans la théorie clas- sique des scores. Nous sommes conscients que cette position, et certaines propositions émises dans la suite de cet article, risquent de soulever quelques polémiques. Mais nous espérons que les questions que nous soulevons feront l’objet de travaux de la part des experts en évaluation. Les limites de la théorie classique des scores Comme l’a montré Cardinet, dès uploads/Management/ validcomp-070221.pdf