Les hommes sont comme les plantes, qui ne croissent jamais heureusement, si elles ne sont bien cultivées.
  Autres documents :
 
COMMENT ELABORER UNE EPREUVE SCOLAIRE ?

Introduction

   Dans l’enseignement, les tests d’évaluation jouent plusieurs rôles.  Cependant, l’instrument de mesure est composé diversement selon la fonction à laquelle on le destine.  Voici quelques usages courants des instruments de mesure en contexte scolaire :

  1. dresser un bilan des acquis scolaires de chaque élève pour octroyer une certification
  2. sélectionner les élèves selon certaines caractéristiques particulières
  3. prendre une décision d’orientation des élèves,
  4. identifier les transferts qui n’ont pas eu lieu,
  5. préparer une révision de la matière à partir des points sur lesquels certains élèves éprouvent des difficultés,
  6. faire prendre conscience aux élèves de certains points majeurs de la matière
  7. identifier les candidats susceptibles d’être promus, récompensés.

Cette liste n’est pas exhaustive, mais elle illustre deux grands ensembles de situations dans lesquelles la mesure joue un rôle important en situation scolaire : celle de l’évaluation dite sommative et celle de l’évaluation formative.
On parle de l’évaluation sommative, quand on cherche à construire un instrument de mesure qui permet d’évaluer un échantillon de toute la matière enseignée. Un bon bilan nécessite un échantillonnage du contenu qui soit exhaustif et représentatif. Pour ce faire, une mesure fondée sur les objectifs d’apprentissage est nécessaire.
Dans le cas de l’évaluation formative, on cherche à construire un outil qui permet une prise d’information focalisée et compréhensive. En fait, l’intérêt n’est pas de couvrir toute la matière, mais un aspect bien particulier de celle-ci. Alors que quelques objectifs peuvent être couverts dans un bilan, l’évaluation formative peut ne porter que sur un seul objectif. L’évaluation formative a pour fonction de fournir à l’enseignant et à l’élève une information pertinente sur le déroulement des apprentissages. C’est pourquoi l’enseignant veut contrôler plusieurs aspects de la tâche qu’il soumet à l’élève pour tester la stabilité des apprentissages dans différents contextes. C’est ce qu’une mesure critériée lui permet d’accomplir.
Autrement dit, dans une situation d’apprentissage, la qualité de l’instrument de mesure doit s’accorder avec le type d’information recherchée et les buts poursuivis. Dans bien des cas, une simple interrogation écrite ou orale peut suffire, mais dans des situations plus complexes où l’on doit articuler un plan d’intervention, cette prise d’information devra être complète pour rendre possible l’élaboration des stratégies d’enseignement adaptées. L’évaluation sera formative, cependant tout dépend de ce que l’on entend par « information complète ». Dans le cas d’un bilan (évaluation sommative), elle signifie que le questionnaire couvre la totalité des contenus scolaires. Dans le cas d’une évaluation formative ou diagnostique, elle signifie que le questionnaire couvre l’ensemble des processus d’apprentissage en jeu. Dans les lignes qui suivent, nous tenterons de présenter la méthodologie à suivre pour élaborer aussi bien des instruments sommatifs que formatifs et diagnostiques.

L’évaluation sommative

La mesure fondée sur les objectifs

 Pour dresser un bilan représentatif des apprentissages des élèves, il faut que celui-ci reflète les objectifs du programme scolaire et de l’enseignement proprement dit en salle de classe. 
En effet, les programmes d’étude comportent généralement plusieurs catégories d’objectifs. Ceux-ci peuvent être regroupés selon leur spécificité (objectif global, général, spécifique) ou selon leur position dans une séquence d’apprentissage (objectif intermédiaire ou terminal).  Quelle que soit la catégorie à laquelle il appartient, l’objectif possède des caractéristiques essentielles et des caractéristiques accessoires.
Lors de la composition d’un objectif, les deux caractéristiques essentielles sont :

  1. un verbe d’action et un seul,
  2. un contenu (complément d’objet) et un seul.

Le verbe d’action doit décrire un comportement observable directement (par ex. cocher, souligner, écrire, barrer, compléter, etc.) ou indirectement (par ex. choisir, etc.). Il ne doit y avoir qu’un seul verbe par objectif, sinon les attentes exprimées peuvent donner lieu à interprétation. Pour accroître la spécificité des objectifs, il conviendrait d’ajouter généralement les composantes suivantes à l’objectif :

  1. le contexte dans lequel sera réalisé la performance attendue
  2. le critère d’acceptation de la performance
  3. le seuil d’acceptation de la performance.

On ne s’attend pas à retrouver ces caractéristiques accessoires parmi les objectifs généraux. Par contre, elles sont essentielles à des objectifs dits spécifiques.
Le contexte décrit dans quelles conditions l’élève réalisera sa performance et ce qui sera à sa disposition.  Dans le cas des mathématiques, ça peut être une latte, un compas, une calculatrice, dans le cas des langues, ça peut être un dictionnaire, etc.  Le critère d’acceptation de la performance décrit le niveau de qualité de la performance attendue. Enfin le seuil de réussite fournit un critère quantitatif pour considérer l’objectif comme atteint. Il établit combien de fois l’élève doit répéter sa performance au critère d’acceptation fixé pour que l’on considère qu’il maîtrise le contenu de l’objectif. Les seuils les plus courants oscillent généralement entre 80% et 100%. Mais le seuil peut dépendre des élèves en présence.
Il existe plusieurs façons de déterminer un seuil de réussite.  Nous pouvons signaler que les composantes accessoires des objectifs sont parfois précisées dans les programmes d’études en fonction du niveau d’enseignement. Si elles ne sont pas précisées, elles peuvent souvent être déduites à partir des informations complémentaires et à partir du jugement des enseignants.
Le contexte, le seuil et les conditions d’acceptation de la performance sont également des moyens de graduer les attentes en termes d’exigences et d’établir une progression dans les apprentissages. Ils permettent d’assurer une certaine continuité dans l’enseignement par objectif.

Les taxonomies d’objectifs

Les objectifs spécifiques permettent de préciser la forme que prendra l’évaluation des apprentissages et les attentes que les enseignants ont envers les élèves. Toutefois, ils peu pratiques pour considérer un programme d’étude dans son ensemble. Lorsqu’il s’agit de planification à long terme de l’enseignement et d’intégration des matières, les objectifs spécifiques peuvent devenir encombrants. L’intérêt doit alors se porter sur l’organisation de grandes parties de la matière et sur les processus cognitifs en jeu dans les apprentissages visés.
Deno et Jenkins (1969) ont élaboré un modèle qui tient compte de la spécificité nécessaire des objectifs à différents niveaux d’intervention allant de l’objectif global à la tâche d’examen. Il s’agit d’un modèle hiérarchique où chaque niveau supérieur contient les objectifs des niveaux inférieurs.
Le niveau A est celui des objectifs globaux qui sert à préciser les choix politiques, institutionnels, les grandes lignes du projet éducatif et de la mission de l’enseignement. Le niveau B cherche à préciser les objectifs globaux en situant le type de connaissances et d’habiletés au niveau cognitif ou le niveau d’intériorisation au niveau affectif de l’objectif : c’est le niveau des objectifs généraux. Il ne s’agit pas à ce niveau d’indiquer de façon précise les attentes vis-à-vis des élèves. Il s’agit plutôt d’une première indication du degré d’approfondissement visé, tant au niveau cognitif qu’au niveau affectif. Les objectifs généraux sont particulièrement utiles pour dresser les grandes lignes d’un programme d’études et articuler entre eux des objectifs qui peuvent, par leur nature et leur contenu, être fort différents.
Au niveau C, les intentions se précisent à un tel point qu’on peut y indiquer les conditions précises d’évaluation : catégorie de comportements attendus, contenus précis, contexte de réalisation de la performance et conditions d’acceptation de la performance. C’est le niveau des objectifs dits spécifiques.
 Enfin, au niveau D, on retrouve les tâches d’examen elles-mêmes. C’est le niveau le plus spécifique des quatre niveaux du modèle. Ce n’est pas à proprement parler un objectif, mais comme le mentionne Ebel (1956), la tâche d’examen est la meilleure manière de connaître la façon dont s’opérationnalisent les objectifs pédagogiques.
Le modèle de Deno et Jenkins permet de catégoriser les objectifs en fonction de leur spécificité, mais aussi en fonction de leur rôle dans un programme d’études. Les objectifs spécifiques (niveau C) permettent de préciser ce qui est évalué. Les objectifs généraux (niveau B) articulent les différents contenus d’un programme d’études et précisent les processus visés par chaque grande catégorie d’apprentissage.
C’est au niveau B qu’interviennent les taxonomies d’objectifs généraux. On distingue trois grandes catégories taxonomiques :

  1. Objectifs cognitifs (Bloom, 1956),
  2. Objectifs affectifs (Krathwohl, 1964),
  3. Objectifs psychomoteurs  (Harrow, 1972).

Dans le cas des objectifs cognitifs, l’objectif général permet de définir de manière suffisamment  précise les connaissances et habiletés visées par le programme d’études. La taxonomie des objectifs cognitifs de Bloom fait la distinction entre six niveaux d’habiletés et d’acquisition de connaissances. Cette taxonomie joue un double rôle :

  1. au niveau des programmes d’études,
  2. au niveau de l’évaluation des apprentissages.

Au niveau des programmes d’études, la taxonomie apporte plus de rigueur dans la définition de ce que l’on entend généralement par « connaissance », « compréhension », etc. De plus, elle permet de s’assurer que les attentes vis-à-vis des apprentissages des élèves sont conformes à leurs capacités et à leur développement cognitif. On peut ainsi établir une progression des habiletés intellectuelles impliquées dans l’apprentissage de mêmes contenus, mais à des niveaux scolaires différents. Par exemple, « établir une classification du contenu de son herbier à partir d’un modèle fourni par l’enseignant » constitue un objectif cognitif différent de celui qui consiste à « élaborer une classification originale du contenu de son herbier à partir des échantillons des plantes recueillies ».
Au niveau de l’évaluation des apprentissages, la taxonomie permet de s’assurer que les processus de pensée activés lors de l’apprentissage seront mesurés lors de l’examen. Bloom et ses collaborateurs ont élaboré leur taxonomie après avoir constaté que les examens produits par les enseignants portaient habituellement sur la seule restitution des connaissances. Selon Bloom (1956), il était important de mesurer autre chose que les processus faisant intervenir principalement la mémorisation. Malheureusement, 30 ans plus tard, Bloom (1984) constate que la situation n’a guère changé et que peu d’enseignants s’efforcent de mesurer les habiletés supérieures.
Les objectifs généraux ont également une incidence directe sur l’interprétation des objectifs spécifiques, et par ricochet, sur l’évaluation des apprentissages. Prenons une situation concrète assez répandue. Supposons que nous demandions à un étudiant de « fournir un exemple de renforcement positif ». S’il s’agit d’un objectif de connaissance, il suffira à l’étudiant de « répéter «  un exemple qu’il a entendu en classe ou lu dans le manuel obligatoire du cours. Si, par contre, il s’agit d’un objectif de compréhension, nous nous attendons à ce que l’étudiant « fournisse un exemple original ». La réitération d’un exemple connu n’est pas du tout suffisante pour parler de compréhension. De ce dernier exemple, nous pouvons conclure qu’une même tâche peut être employée pour mesurer des niveaux taxonomiques fort différents.
La condition d’acceptation de la performance permet dans ce cas-ci de s’assurer que la question d’examen mesure effectivement bien le niveau taxonomique qu’il est censé mesurer. Pour que les choses soient claires pour l’élève, il faudra que l’énoncé de la question soit sans équivoque à propos de cette condition d’acceptation. Par exemple, « Ecrivez un exemple original de renforcement positif. Les exemples du manuel du cours ou du prof ne seront pas acceptés ».

Objectifs terminaux et objectifs intermédiaires

Dans un autre ordre d’idée, il est parfois nécessaire d’aborder l’articulation des objectifs dans la séquence d’apprentissage.  La taxonomie des objectifs permet de décrire une hiérarchisation des processus de pensée, mais cette articulation est fort générale. De plus, le type de relation décrite par la taxonomie des objectifs se limite à l’inclusion. D’autres relations entre objectifs d’apprentissage sont possibles.
Lorsqu’on souhaite préciser l’enchaînement de plusieurs objectifs dans un programme d’études, on peut distinguer les objectifs terminaux des objectifs intermédiaires.
L’objectif terminal décrit la finalité ultime d’un apprentissage, c’est-à-dire son point d’arrivée. L’objectif intermédiaire énumère les étapes nécessaires qui doivent jalonner le cheminement de l’élève du point de départ au point d’arrivée. Sans la maîtrise de ces jalons, la maîtrise de l’objectif terminal est compromise. Par contre, lorsque l’objectif terminal est atteint, on peut conclure que les objectifs intermédiaires ont été maîtrisés.
Les objectifs terminaux conviennent particulièrement à l’évaluation sommative, dans la mesure où ils permettent de couvrir une grande étendue de contenu. De plus, il est normal qu’un bilan porte sur les apprentissages complétés plutôt que sur ceux qui sont en voie de réalisation. Enfin lorsqu’il s’agit d’établir un bilan, il est généralement trop tard pour se demander à quel moment de l’apprentissage l’étudiant a éprouvé des difficultés. Par contre, cette dernière information peut être utile dans le cas d’une évaluation formative ou encore de ce qu’il est convenu d’appeler une « évaluation micro-sommative » (Scallon, 1992).

La manière de classer les formats d’item varie d’un auteur à l’autre. Généralement, on distingue les questions fermées et les questions ouvertes.  Celles-ci demandent aux sujets de produire la réponse. Cependant, cette réponse peut être la reproduction de ce que le maître a enseigné, mais elle peut aussi, dans le cas de la composition ou de la dissertation, être originale. Les questions fermées demandent de faire un choix parmi un certain nombre d’alternatives déjà données. Ce format a été développé pour répondre à un certain nombre de problèmes liés aux exigences de la théorie traditionnelle des tests. La nécessité de réduire la part de la subjectivité du correcteur a conduit à standardiser au maximum les modalités de passation d’examens et de cotation des items…           à suivre !

                                                                 Max Kupelesa

Max KUPELESA © 2006
    Webmaster