Cardinet_Evaluer Sans Juger

7/23/2019 Cardinet_Evaluer Sans Juger

1/13

Jean Cardinet

Evaluer sans jugerIn: Revue franaise de pdagogie. Volume 88, 1989. pp. 41-52.

Abstract

Evaluation without judgment. - From a formative point of view, it remains possible to organise the class so that pupils individually

receive a lot of feedback information, enabling them to correct their mistakes and at the same time increasing their familiarity with

those characteristics associated with a good performance. From of summative point of view, the school should take account of

the varied curricular and extra-curricular achievements of individual pupils instead of simply comparing them globally with one

another or merely with reference to the academic programme. Such descriptive evaluation (records of achievement) is an

approach which should be most compatible with the teacher's helping role.

Citer ce document / Cite this document :

Cardinet Jean. Evaluer sans juger. In: Revue franaise de pdagogie. Volume 88, 1989. pp. 41-52.

doi : 10.3406/rfp.1989.1412

http://www.persee.fr/web/revues/home/prescript/article/rfp_0556-7807_1989_num_88_1_1412
http://www.persee.fr/web/revues/home/prescript/author/auteur_rfp_493http://dx.doi.org/10.3406/rfp.1989.1412http://www.persee.fr/web/revues/home/prescript/article/rfp_0556-7807_1989_num_88_1_1412http://www.persee.fr/web/revues/home/prescript/article/rfp_0556-7807_1989_num_88_1_1412http://dx.doi.org/10.3406/rfp.1989.1412http://www.persee.fr/web/revues/home/prescript/author/auteur_rfp_493


2/13

REVUE

FRANAISE DE

PDAGOGIE

N 88

]uillet-aot-septembre

1989,

41-52

VALUER SANS

JUGER

par

Jean CARDINET

On

a

cherch

rsoudre les

problmes

de

l valua

tion

colaire

par

l'emploi de

tests

pdagogiques.

Plu

sieurs modles

ont t

proposs

pour

les construire.

L'approche psychomtrique,

d'abord,

se rvle insatisfai

sante,arce qu'elle

repose

sur la

mise en

comptition

des lves. L'valuation par objectifs manque de thorie

statistique. La mesure de l'cart au

seuil

de

russite

demande un

nombre

excessif d'observations. H faut donc

se

rsigner ne

pas

pouvoir situer

exactement la position

de

chaque

lve,

ce qui d'ailleurs vite

le

danger

d'une

catgorisation

dshumanisante.

Du

point de vue formatif,

il

reste possible

d'organiser la classe pour que l'lve

reoive de nombreuses informations en

retour,

l'aidant

corriger

ses reprsentations et comprendre les critres

d'une

performance correcte. Du point

de vue

sommatif,

l'cole

doit rendre compte des diverses acquisitions de

l'lve, au lieu de

le comparer

aux autres, ou au pro

gramme. Cette valuation descriptive est la seule qui soit

compatible

avec

une

relation

d aide de la part de

l ensei

gnant.

(*) Confrence

prsente l 'Universit Catholique

de

Louvain,

Louvain-la-Neuve, le 4 octobre

1988.

I. - LE

PROBLME A RSOUDRE

1.1. La demande des enseignants

Dans une

enqute

effectue

en Suisse

(Roth et

Schellhammer, 1974), les

enseignants

interrogs ont

dsign

l'valuation comme

leur difficult

principale.

Ils

pensaient

sans

doute au rle qu'ils devaient

jouer

dans

la

slection ou

la

promotion de leurs lves, mais

la

mise de

notes toute occasion leur pose tout autant de pro

blmes En effet,

rien

ne prcise aux enseignants ce

qu'ils doivent rellement

exiger. Mme

si les objectifs

taient bien dfinis, il resterait difficile pour

eux

de situer

chacun

de leurs lves par rapport cette norme.

1.2. La rponse des scientifiques

Les spcialistes en

sciences de

l'ducation

ont

tent

de

rpondre

ces

besoins.

D'abord, ils ont propos des cadres

thoriques pour

analyser

les

tches d'apprentissage et ainsi

faciliter

la

dfinition

des objectifs ducatifs

viss. Les chercheurs

universitaires belges

ont t

particulirement actifs dans

ce

domaine

(De

Block,

1970;

De

Ketele, 1982;

G.

et

V.

De Landsheere, 1975

; V.

De Landsheere, 1987

;

D'Hai-

naut,

1985

; Stievenart et Tourneur,

1983

; Vandevelde,

1982).

Ensuite,

les

scientifiques ont dvelopp des

mthodes de mesure permettant d'obtenir des informa

tions

rcises

et

fidles.

On

pourrait

citer un

grand nomb

re

e ces tentatives, depuis

les

premires recherches

en

docimologie, jusqu au

dveloppement

actuel

des

banques

d'items

informatises,

surtout aux

Etats-Unis.

Etait-ce

la

bonne solution

? On verra

ci-dessous les raisons d'en

douter.

1.3.

Plan de l'expos

Les pages qui

suivent

vont d'abord retracer

brive

ment

es

tapes

logiques de cet

effort

de

quantification.

Sans

nier l'intrt de tels

dveloppements,

qui trouvent

dj

de

multiples applications,

la

conclusion

de

ce rapide

survol

sera

pourtant ngative,

la

solution

tant

attendue

par les matres ne semblant

pas

atteignable par cette

voie.

Pour rorienter

la recherche,

il

faudra

tudier

alors

l'origine

de cette difficult,

c'est--dire les raisons

qui

amnent consacrer un

temps

excessif au contrle.

Sur

cette base, des

propositions

seront

faites pour

une valuation qui ne

cherche plus

reprer constam

ment

a position des

lves, ni mme

se

prononcer

sur

leurs

comptences particulires.

41


3/13

En

conclusion seront explicits les principes psycho

logiques

et philosophiques qui justifient de dvelopper

une valuation qui ne juge pas l'lve.

II.

-

L'ESPOIR DANS

LA

MESURE

2.1.

Bases

thoriques

L'tude exprimentale de

la

notation des

copies

du

baccalaurat, ralise d'abord par Laugier et Weinberg

(1938), mais confirme ensuite plusieurs reprises par

Piron (1963),

puis

Reuchlin

et

Bcher (1968),

entre

autres,

conclut

l'insuffisance radicale des

mthodes

d'valuation couramment

utilises,

puisque les notes don

nes un mme travail pouvaient prsenter, selon

les

correcteurs,

un cart de 13

points

sur une chelle de 20.

Les diffrences entre les moyennes des notes donnes

par des jurys parallles pouvaient atteindre

4

5

points,

mme

dans les

branches

objectives

comme

la

mathmati

que

t

la

physique.

Pour

proposer des

solutions,

ces chercheurs se sont

naturellement tourns vers la psychologie

diffrentielle.

Les tests

d'aptitudes

offraient le

modle

d'une quantifica

tionontrle.

Il fallait

crer paralllement des tests de

connaissances, en utilisant les mthodes de

la

psychom-

trie.

Mais, sur le

plan

conceptuel, ces mthodes

elles-

mmes

ont beaucoup volu tout au long de ce sicle. La

thorie de la gnralisabiht en

offre

actuellement la fo

rmulation

la

plus

englobante.

C'est

en

se

rfrant

elle

que quatre conceptions

successives

des tests de

con

naissances

vont tre dcrites ci-dessous. Les deux

pre

mires

relvent encore

de la psychologie diffrentielle,

alors

que les

deux autres visent

spcifiquement

la mesure

en

ducation.

2.2. L'approche

psychomtrique

2.2.1. La

diffrenciation

des

sujets

Au tout

dbut de la

psychologie,

la

mesure

portait

directement sur

les performances

observes :

on

estimait

des

seuils

perceptifs ou

des

temps de

raction.

Ce

fut

le

coup de gnie de

Binet

de proposer une chelle

mtrique

diffrente, applicable

n'importe

quel comportement (au

dessin comme

la rcitation, par

exemple),

et qui repos

ait

ssentiellement

sur le

classement

des performances

des sujets.

C'est

pourquoi

la psychomtrie

a

toujours

pris

comme rfrence, pour

interprter un

rsultat,

la distribu

tione l'ensemble des autres

rsultats

obtenus. La

mesure est exprime, en consquence, en

termes

d'cart

leur moyenne

gnrale,

ce qui

fournit

ce qu'on appelle

une mesure relative.

2.2.2. La thorie classique des tests utilisant la

mesure relative

Exemple

II

est inutile de rappeler la dmarche bien connue de

construction

d'un

test

standardis

(dfinition des objectifs

ducatifs

viss

et des conditions de leur observation).

D'innombrables

ouvrages

les ont donnes

en

modle aux

enseignants en formation. Une rflexion plus pousse sur

la

finalit

de la

mesure en ducation aurait

sans doute

permis

de

nuancer

ce

souci

de prcision.

Il faut nanmoins reconnatre aux psychomtriciens le

mrite de s'tre

donn le

moyen

de

contrler

la

qualit

de

telles

preuves.

A

l'aide

de l'analyse statistique de la

variance,

ils

peuvent estimer

quelle

part

de

variation

revient aux diffrences relles entre lves et quelle part

revient l'erreur d'chantillonnage. La fidlit de

la

mesure est alors

calcule

comme

la

proportion de

variance systmatique dans

la

variance totale

des

scores

observs.

Un exemple rel va permettre de

comparer

les

rsul

tats que fournissent les

quatre

conceptions annonces

pour les

tests

de connaissances. Une enseignante, pro

fesseur de physique

Genve (Zimmermann, en

prparat

ion),

construit

une

preuve

sur la chaleur,

en

abordant

les trois domaines

: thermomtrie, changements d'tat, et

diffrence

entre

chaleur

et

temprature,

l'aide

de

sept

questions

par domaine.

Une tude de fidlit habituelle

(Cardinet, 1988)

aboutit un

coefficient

de

0,851.

Ainsi, plus des

quatre

cinquimes

de la

variance

des scores

observs

n'est

pas

due au

hasard.

Cette enseignante

peut

se considrer

satisfaite de son

preuve, qui classe

ses lves d'une

faon

qui

serait tout fait rptable partir d'autres

chantillons de questions.

Discussion

Doit-elle pourtant

vraiment

se

rjouir

?

La

seule

info

rmation

que

fournit son preuve,

en

tant

que test psycho

mtrique,

est

l'cart de chaque lve la moyenne de

l'cole. Cette

mesure relative fait totalement

abstraction

de la performance d'ensemble de

l'cole,

qui pourrait tre

insuffisante.

De

plus, il est absolument impossible d util

iseres carts

la moyenne

pour savoir si les

rsultats

sont meilleurs,

ou

moins

bons que l'anne

prcdente.

En admettant que ce

ne soit pas

le but premier de

l'preuve,

qui

s adresse

surtout

aux lves,

ceux-ci

ont-

42


4/13

ils

lieu d'tre satisfaits ? Peut-tre s'apercevront-ils que si

l'un d'entre eux a progress depuis la dernire preuve,

ce

fut en

forant un de ses camarades

chouer

sa

place,

puisque

le

nombre

d checs reste

toujours

const

ant.

Pourquoi

travailleraient-ils ensemble dans ces condi

tions

?

Pourquoi

ne dcideraient-ils

pas plutt

de

cesser

tous

d'tudier,

puisque

la

distribution

des

notes

resterait

de toute

faon

la mme

?

On voit que le principe de la mesure relative, aussi

ingnieux

ait-il t au

dpart

en psychologie, n'est

pas

acceptable en

pdagogie.

Depuis longtemps, les cher

cheurs ont tent de rsoudre ce

problme,

en particulier

Cronbach et ses collaborateurs (Cronbach,

Gleser,

Nanda

et

Rajaratnam,

1972).

2.2.3. L'cart au

seuil

de matrise, utilisant une

mesure absolue

Exemple

Une faon claire de

poser

le problme est de se

placer dans l'optique d'une valuation par objectifs, qui

prcise que l'lve doit rpondre correctement au

moins 70 des

questions,

par exemple, pour recevoir

son crdit. Cronbach considre que le but de l'valuation

pdagogique est d'estimer o

se

situe chaque lve par

rapport

ce

seuil.

La distribution d'ensemble est alors

sans intrt. Seule doit tre connue la marge

d'erreur

dans la mesure de la distance ces 70 .

Supposons qu'un lve se

situe

juste

la

limite. Cet

lve

pourrait, lors

de tirages

successifs

de sries

de

questions

plus

ou

moins

difficiles, russir 65 , ou

75

,

par exemple. La thorie statistique

permet

de

pr

ciser cette marge de

variation.

Dans

le

cas

du test de

physique, les fluctuations attendre iraient de

51

89 .

Il serait

donc

possible

d'affirmer

que les lves qui

donnent

moins de

51

de rponses correctes n'ont pas

atteint l'objectif,

alors

que ceux qui

rpondent

juste

9

fois

sur

10 ont

acquis la

matrise demande. L'interprtation

reste

incertaine

entre ces deux

limites.

Discussion

L'enseignante

peut-elle tre satisfaite de ce

rsultat

?

Certainement pas, parce que la marge d'incertitude est

nettement trop

grande. La majeure partie des rsultats

vont tomber dans cette

zone.

La pratique scolaire oblige

pourtant

prendre

des dcisions.

Il serait possible,

bien

sr, de rduire l'erreur, mais condition d'allonger le

test. En doublant

le

nombre de questions,

la marge

d'er

reur autour de

70 passerait

de plus

ou

moins

1

9

plus

ou

moins

14 . Il ne semble pas que cette amliorat

ionn vaille

la

peine.

Le chercheur qui examine cette solution

est-il, lui,

satisfait ?

Pas

vraiment

non

plus, car

il

est difficile d vi

ter

a

question

de la fidlit de la mesure des rsultats

des lves. Ds

que

l'on

veut

mettre une

variance vraie

en

relation avec

la

vanance-erreur

ci-dessus,

la

question

se pose de savoir quelle est cette variance vraie. Si c est

la

variance

entre

lves,

le

modle

devient contradictoire

avec

le

principe de la pdagogie par objectifs qu'il

pr

tendait

servir,

car il

rintroduit la comptition et pnalise

un enseignement o tous

les

lves russiraient :

comme

il

n'y aurait plus de

variance,

la fidlit de l'valuation

paratrait nulle

Bien

que

le modle de Cronbach fasse

avancer

la

thorie d'un grand pas, il semble encore insuffisant pour

fonder la mesure en

pdagogie.

2.3. L'approche dumtrique

2.3.1. L'tude d'un

autre

continuum:

le

progrs

individuel

Une

solution

au

problme

consiste

prendre

en

compte d'autres dimensions de variation que la dimension

inter-lves.

Dj certains

chercheurs (par exemple

Cardi-

net, 1973) avaient not que lorsqu'on mesurait les rsul

tats d'un curriculum, les questions devenaient objets

d tudes et les lves, instruments d'observation.

Si

l'on

considre un

plan factoriel

crois trois

facteurs,

(Sujets,

Questions, Phases d'apprentissage,

par

exemple, comme

la figure

1), les diffrences

entre

phases d apprentis

s gent exactement le mme

statut que les

diffrences

entre

sujets.

Il

est

donc possible

d'estimer

avec

quelle

fidlit les niveaux d'apprentissage sont diffrencis,

mme s'il n'y en a que deux. Il suffit de

transposer

les

indices

des

formules

de fidlit

classiques.

L'un des

avantages

de la symtrisation de la

thorie

de la gnralisabilit, introduite par Cardinet, Tourneur et

Allai

(1976) est de faire apparatre une multitude de

cas

de

figures

diffrents, correspondant toutes

les

direc

tions de gnralisation (ou au contraire de fixation) possi

bles. On

peut tudier, en particulier, avec quelle fidlit

se

diffrencient

le niveau initial de performance

d'un

lve

et son niveau final.

Il est galement

possible de

calculer

quelle

est

la

marge d'erreur moyenne, pour

l'ensemble

des lves

d'un

groupe, autour d'une valeur

thorique quelconque sur ce continuum de progrs.

2.3.2. La mesure absolue du progrs et de l'cart au

seuil

Exemple

L'tude a t

effectue

pour les donnes du test de

physique. Il

avait

en

effet

t prsent deux fois aux

43


5/13

Figure

1

Dispositif

crois

trois

facteurs

PHASES

D'APPRENTISSAGE

F in ^^

^

n(s)

QUESTIONS

lves, avant et

aprs l'tude

du thme de la chaleur

(Cardinet,

Zimmermann,

Bain et Muller,

1988).

Dans ces

conditions, une

autre

variance peut tre

calcule,

celle

due au

progrs

individuel de

chaque lve.

On

notera

qu'elle est totalement

indpendante

des

diffrences exis

tant

entre

lves (plus

prcisment

de

la

variance de

leurs rsultats au total

du

pr-test

et du

post-test).

Un

coefficient

de

fidlit

peut maintenant

mettre

en

rapport,

pour

chaque lve sparment, la

variance

due

son progrs

et la

variance d'chantillonnage correspon

dante. partir

d'une

analyse

de la variance,

on trouve

facilement quelle est

la moyenne de tous ces

coefficients

de

fidlit

individuels. On

obtient pour

le

test

de physique

une

valeur trs faible,

gale

0,674, ce qui

signifie qu'un

tiers de

la variance

que l'on attribue aux progrs indiv

iduels est due en fait au hasard.

Cette

fidlit est insuff

isante pour permettre

une

mesure

assure

de l'cart au

seuil de

matrise

dsir.

La source

du problme

est facile localiser. C'est

la

variance d'chantillonnage

des

difficults

des

questions

qui est trop grande.

C'tait

elle qui

avait caus une

marge

d'erreur

excessive

au cas

prcdent. La

variance

d'erreur reste la mme dans cette troisime conception,

mme si la

variance

vraie

est diffrente. Il faudrait dou

bler la longueur de l'preuve (qui comporte

pourtant

dj

21

problmes) pour

atteindre une fidlit de 0,80.

Discussion

Si le thoricien

apprcie, dans cette troisime

ception des tests de connaissances,

d'avoir

pu complter

le modle de Cronbach, en donnant une base

thorique

aux tests d'objectifs, l'enseignante n'a gure de raison

d'tre

plus

satisfaite

qu'avant.

La fidlit de l'preuve

se

rvle faible et la marge d'incertitude autour du seuil de

russite demeure excessive. En thorie,

il

suffirait de

multiplier

les

observations

pour

obtenir

une

information

plus prcise. En pratique, cette

solution est

irralisable,

parce

qu'elle

serait trop coteuse en temps d cole :

il

faut bien garder un moment pour l'tude

2.3.3. Le contrle du progrs,

avec

une mesure

relative

Exemple

Devant

cette impossibilit,

une position de repli

est

de rduire

la

porte de

la

gnralisation

effectue.

Au

lieu

de

faire

comme

si

l'on

tirait

chaque

fois

un

chantillon

de

questions diffrent, en dbut et en fin d'apprentissage,

pour mesurer

la russite sur une

chelle

absolue,

on peut

conserver

les

mmes

questions

et se

contenter de com

parer les

performances initiale et

finale

la

mme

preuve.

On

peut

ainsi

contrler

le progrs individuel,

mais

sans

pouvoir situer dans l'absolu les deux niveaux

observs,

parce qu'on n'assure plus l'quivalence de dif

ficult des

preuves que

l'on

utilise.

En renonant ainsi un bilan par objectif, en faveur

d'un simple

contrle

du progrs individuel ( finalit plu

tt

formative), on devrait obtenir une fidlit

meilleure.

C'est

bien

ce

qu'on observe dans

l'exemple

du test

de

physique

:

les

coefficients

individuels atteignent

cette fois

une

moyenne

de 0,879. La diffrenciation des deux

niveaux (initial et final) est donc excellente avec l'preuve

actuelle.

Discussion

Le prix payer pour

cette

prcision de la mesure

est

l'troitesse de l'information que l'on obtient.

L ensei

gnante

qui

a prpar cette

preuve peut contrler l'effet

positif de son

action,

mais

ne peut pas

vrifier si ses

rsultats sont

suffisants

ou non dans

l'absolu.

Reste

savoir

si

le

problme

est nouveau. Les

tudes

de docimologie montrent qu'il

en

a toujours t

ainsi dans les

examens.

Jusqu'ici les chercheurs ont cha

que fois conclu que cette

situation tait inacceptable

et

ils

ont propos d'amliorer

les procdures d'valuation

pour

galiser

les exigences.

C'tait

bien dans

ce

but que

la

thorie

de la gnralisabilit avait t dveloppe

in

iti lement (Cardinet et Tourneur, 1985).

Une solution

plus raliste

ne

serait-elle pas,

pourtant,

e

tirer les

consquences,

dans

la pratique

sociale,

de l

44


6/13

non-quivalence

des niveaux ?

Cette diversit

va subsist

er,

n

effet, parce qu'elle a une fonction pdagogique

essentielle

: elle

correspond

au fait que chaque ensei

gnant doit

prendre

ses lves o ils sont

pour les

mener

o

il

peut.

Former

tous

les

lves de la mme faon est

impossible.

Comment

pourrait-on,

et pourquoi devrait-on,

donner

tous

un

diplme

quivalent

?

Une rflexion s'impose

pourtant

avant d'avancer des

propositions de solution. O

se

situent les obstacles qu'il

faudra contourner

?

qui

permettait d'en

maintenir l'effet

constant.

C'est ainsi

qu'ils ont cr les

tests.

Enfin leur effort de quantification visait, comme tou

j ours

en science,

rendre

leurs donnes

plus facilement

intgrables dans des modles

thoriques.

Pour faciliter

les comparaisons

entre

tests,

ils ont

choisi

de

travailler

avec

des rangs

plutt qu avec

des valeurs

concrtes,

autrement dit

avec une

chelle

relative,

en abandonnant

toute

information

concernant

la moyenne ou la

dispersion

des

rsultats

des sujets.

III.

-

LES OBSTACLES A LA MESURE EN PDAGOGIE

3.1.

Attraits et

dangers

d'une

mesure

absolue

Pour passer du fait

observ

(la

faible gnralisabilit

de

nos mesures)

la

loi

que

l'on pressent

(l'impossibilit

de tout contrler), il faut possder un cadre conceptuel

explicatif qui rende compte de cette difficult. Une

faon

de le dcouvrir est de s'interroger sur ce qui distingue la

mesure

en

psychologie (apparemment satisfaisante) et

en

pdagogie (o

les

exigences de la quantification

ne

semb

lent

pas

satisfaites).

3.1.1. En

psychologie

On peut rsumer l'histoire du dveloppement des

tests

en

disant

que les psychologues

ont cherch

dcrire

les caractristiques

de la personnalit des

sujets

de

faon

exhaustive (mais parcimonieuse),

stable,

fidle

et quantifiable.

n ce qui concerne leur premier but, une

description

exhaustive, mais

parcimonieuse, ils suivaient un

principe

universel

de la mthode scientifique,

qui

cherche tra

vailler avec le

nombre

minimum de paramtres. Pour y

parvenir, ils ont utilis l'analyse factorielle, qui

permet

de

dterminer des variables exprimant chacune la mme

information que tout un ensemble d'autres. Ils ont admis

que quelques preuves typiques pouvaient mesurer ainsi

les traits fondamentaux de la personnalit.

Le souci

d'obtenir

des

caractristiques

stables

est

justifi

par

le

mme principe de parcimonie. Il

s'agit

d'obtenir des informations qui

soient

valables pour tout

un ensemble d occasions. Les psychologues y sont par

venus

en proposant des

tches

artificielles, ainsi nces

sairement

nouvelles

pour les

sujets, et donc

l'abri

d'un

apprentissage incontrl.

Si

les psychologues voulaient obtenir aussi

des

observations fidles,

c'est

bien

sr qu'ils

dsiraient

rduire

l'erreur d'observation. Ils ont pour cela

standar

dis

igoureusement

leurs conditions d'observation, ce

3.1.2.

En pdagogie

Ce rappel historique

n'a

d'intrt que parce qu'il per

met

de mettre

en vidence

combien le contexte de la

mesure est diffrent en

pdagogie.

Si une description exhaustive du

domaine est

bien

fournie

par

les

diverses taxonomies d'objectifs

ducatifs,

cites en introduction,

la

recherche

de

parcimonie est,

par contre,

totalement

inexistante dans cette discipline.

Pour

l'cole,

ce

n'est

pas

la

mme

comptence de

raisonner logiquement

en mathmatique,

ou

en philoso

phie.

ous

les contenus

sont

essentiels.

Toutes

les

dmarches

de pense le sont

aussi,

puisque ce n'est

pas

le

mme objectif ducatif

de connatre la

loi

d'Ohm et de

savoir l'appliquer. En fait, toutes les combinaisons

possi

bles de contenus, de dmarches cognitives

et

de situa

tions d'observation

(telles

qu'elles

apparaissent

dans les

cellules

de

la

figure

2)

constituent

des

objectifs

indpen

dants

t

irrductibles.

Le dsir d'obtenir des

caractristiques

stables est

bien absent galement

de l'cole.

Les

enseignants veu

lent

au

contraire voir

voluer la performance de

leurs

lves et souhaiteraient pouvoir

suivre leurs progrs de

faon continue.

La standardisation laquelle

les

psychologues ont eu

recours parat, elle aussi, inacceptable en

pdagogie.

C'est la capacit

d'effectuer

tous

les

calculs possibles,

de

lire

toutes

les

sortes de textes, de traiter toutes

les

formes

d'quations, etc. qu'ils veulent

contrler,

et

il

n'est

par

consquent

pas

possible

de

contrler une

forme

d'preuve par une autre.

Quant

la

quantification, les pdagogues

la

ralisent

au

moyen

d chelles absolues

plutt

que relatives. C'est

que l'erreur n'est

pas

admise

l'cole

: qu'une

opration

soit longue

ou non, elle doit tre juste.

A

un examen, il

n'est

pas

indiffrent de recevoir une

question

facile ou

difficile,

alors

que dans un test

psychologique

le niveau

d'exigence

est

contrl par

l'utilisation d'un

talonnage.

On

voit

qu'en

tous points,

la

conception de

la

mesure

45


7/13

est diffrente dans les

deux

disciplines, ce qui ne peut

manquer d'avoir

des

consquences pratiques.

3.1.3. Consquences

en ducation

Faute d'une

description

parcimonieuse

des objectifs

ducatifs,

les

pdagogues

sont

obligs

de

mesurer

tous

ces savoir-faire sparment. Ils

essayent

bien

avec

De

Ketele

(1983), de dterminer

des

objectifs terminaux

d'intgration, mais le

refus

de la standardisation et

l'emploi d'une chelle absolue empchent de contrler le

niveau d'exigence de ces preuves et les

rend

donc

difficilement

interprtables.

Pour bien faire,

chaque

object

ifevrait donc tre contrl pour

lui-mme.

La masse d'examens

que

ce

projet ncessite est

multiplie

par l'ambition de suivre en temps rel la pro

gression de chacun de ces

apprentissages.

Plus

le

contrle

se

veut

troit,

plus

les preuves

doivent

tre

nombreuses.

Puisque la comptence dsire doit tre gnrale,

il

faut prvoir

galement

l'examen au moins un

certain

chantillon de chaque type de tches, pour pouvoir s'en

assurer.

Enfin,

du fait de l'emploi

d'une

chelle absolue,

l'influence

du choix des

questions,

ou

si

l'on prfre, de

leur

formulation, se rvle norme.

Il

faut,

pour

rduire ce

facteur d'erreur, augmenter

considrablement

le nombre

de

questions

poses dans

les

preuves.

Ainsi, sur tous les

plans

la

conclusion

est la mme : il

faut

toujours

multiplier

les preuves.

On

comprend

alors

pourquoi les enseignants croulent sous

le nombre

de

contrles et estiment en mme temps qu'il leur en fau

drait encore plus : ils souhaitent un

contrle

total de leur

classe. Pourtant, ils poursuivent une chimre

s'ils

s imagi

nent

arvenir

un jour, tels des

contrleurs

du ciel,

suivre leurs lves

sur

leur

cran-radar.

Ne

vaudrait-il

pas

mieux admettre, une fois

pour

toutes, que les possibilits de mesure seront

toujours

radicalement

insuffisantes

par

rapport

nos besoins et

qu'il est

plus sage de modifier nos attentes et notre

conception de l'valuation ?

Ne

serait-ce pas,

d'ailleurs,

une raction

de

toute faon

ncessaire

devant cet

autre

danger de l'valuation

actuelle

: l'explication pseudos

cientifique par

les

traits de personnalit ?

3.2. Attraits

et

dangers

des

traits personnels

3.2.1. L'attribution

de

proprits

aux

objets:

ncessit

et

risque en

science

Face

au nombre infini d'informations

que

nous

trans

mettent nos organes des sens, nous avons recours un

processus

simplificateur :

la

catgorisation. Nous pouvons

ainsi

identifier les objets en les rattachant

des

classes,

et c'est ce

qui

nous

permet

de

les

utiliser.

S'il est en

effet

essentiel de savoir que

tel

type de

champignons est

vnneux, et tel

autre comestible, cette

dmarche

de

catgorisation

devient

problmatique

lor

squ on veut en faire un principe

explicatif.

Cet enfant ne

russit pas parce qu'il est peu dou est un jugement

aussi tautologique que L'opium fait

dormir

parce qu'il a

la

vertu

dormitive

.

L'explication scientifique

progresse lorsqu'elle peut

remplacer

les

proprits attribues

aux objets

par des

relations dans lesquelles ces derniers sont

insrs.

Par

exemple,

Aristote

pensait que

les

corps

lourds

avaient la

proprit de tomber et

les

corps lgers

celle

de

s'lever.

Archimde dcouvrit

que c'tait

le rapport des masses

spcifiques qui expliquait

ce phnomne et Galile donna

la

loi

de

la

chute

des

corps

en

fonction

du

temps.

3.2.2. En

psychologie

Jacques-Philippe

Leyens

(1983), dans

Sommes-nous

tous des psychologues

?

dmontre

la tendance

sponta

nees hommes (et les psychologues en font

partie...)

mettre en

cause

la personnalit d'autrui.

Pour rendre compte

du comportement d'une per

sonne, on

suppose chez cette dernire une structure

sta

ble, un trait permanent, qui sous-tend et explique cette

raction.

Si nous voyons

un

lve

en

frapper

un

autre,

par exemple, nous

le

jugeons agressif... et nous lui

attr

ibuons mme toutes sortes d'autres caractristiques que

nous croyons

en

corrlation avec ce trait.

Les nombreuses expriences cites par cet auteur

montrent que nous faisons

la

mme erreur

qu'Aristote,

et

que nous sous-estimons

l'influence

de

la

situation

et

celle

des

circonstances

locales,

qui

peuvent

tout aussi bien

expliquer

le

comportement observ.

Lee

Ross (1977),

psychologue amricain, dnomme cette tendance

gnr

ale l'erreur fondamentale .

On peut

citer

titre

d'exemple

la

fameuse exprience

de

soumission l'autorit, o

des sujets,

mis dans

le rle

de

professeurs,

avaient

t

amens

donner des chocs

lectriques

dangereux

aux

lves

avec qui ils travaillaient.

La raction la plus

courante

des

personnes informes

des

rsultats de cette

recherche a

t de mettre

en

cause la

personnalit de ces

sujets,

ou

la

culture d'o ils prove

naient. En fait, l'analyse

des

observations montre qu'il

suffit de changer

la situation sur des points

mineurs

(que

la

victime soit dans

la

pice,

par exemple,

ou que ce soit

l'exprimentateur

qui

tienne

ce rle) pour que

le compor

tement

des

sujets change

du

tout

au

tout.

46


8/13

Puisqu'on peut passer de presque 100 0 de

soumission

selon

les

cas, comment peut-on invoquer

massivement la personnalit de ces sujets, demande

Leyens

(p.

101) au lieu de

s'attacher

aux dterminants

communs

qui influencent leur

comportement

?

C'est

justement

le but

de

la

psychologie

scientifique

de mettre

en vidence

des

lois gnrales,

au heu d'avoir

recours

l'hypothse

ad hoc de traits personnels. On

pourra ainsi expliquer de faon plus satisfaisante

les

ractions individuelles, de la mme

faon

que la

loi

de la

chute des corps suffit

rendre

compte des vitesses

diffrentes de billes roulant sur des plans plus ou

moins

inclins.

3.2.3. En pdagogie

Chacun sait

que

l'erreur fondamentale

mise

en

vidence

par

les

psychologues

est, dans les coles, r

ige

en

systme

:

la

russite

ou

l'chec

sont attribus

l'lve, pour l'essentiel, que

l'on mette

en avant

son

intelligence, son travail,

ou

son milieu socio-culturel. Les

bulletins et les notes

imposent le

strotype du bon et du

mauvais

lve.

D'ailleurs les russites ou les checs

se

rptent tellement systmatiquement qu'on voit mal, sou

vent, comment

remettre

en

cause

cette classification. En

fait,

c'est

parce qu'ils n'examinent qu'un ensemble extr

mement

troit

de

situations

que les enseignants ont cette

illusion de stabilit.

D'abord,

les

activits

d'apprentissage,

et donc

les

objectifs

pdagogiques

correspondants,

varient

beaucoup

moins

l'intrieur

d'une

classe que

d'un professeur

l'autre.

La preuve

en est que les preuves de

contrle

d'une

classe ne

sont

pas

applicables

une

autre classe

:

les

lves y

chouent, ne retrouvant pas les

exercices

auxquels

ils

sont

habitus.

Que

mesurent

alors ces

preuves,

si

elles

sont

si

spcifiques ? Des

savoirs

beau

coup plus troits

que ceux que les

enseignants croyaient

mesurer.

Ensuite, la

tradition

scolaire

restreint les

questions

d'examen

quelques

formes

devenues habituelles, parce

qu'elles suscitent le taux de russite

moyen

ncessaire,

dit-on,

la

diffrenciation

des

lves.

Mais

il

suffit

de

changer

la

forme

de

ces

questions

pour

faire

russir ou

chouer

tous

les

lves.

Pour

l'objectif

savoir calculer

la

surface

d'un triangle,

par exemple (Bodin,

1985), pres

que tous

les

lves savent noncer la

rgle. L'appliquer

un

triangle dont on

donne la base et la hauteur

est

possible

pour

70 des lves de 12

ans. L'appliquer

au

mme triangle

dessin sur une

feuille, en utilisant

une

rgle

gradue pour

obtenir

les

dimensions, n'est dj plus

ralisable que

par

46

d'entre

eux.

Si la

verticale issue

du

sommet ne coupe

plus la base,

seuls 20 russis

sent.t si

la figure

est prsente

la pointe

en

bas,

un

bon

nombre

d'enfants n'y reconnaissent plus un

triangle.

Qui peut dcider

alors si

les

lves savent, ou

ne

savent

pas, calculer cette surface

?

En fait, c'est l'examinateur

qui

les

fait russir, ou

chouer,

selon la

question qu'il

choisit.

On

pourrait

vouloir

prendre

comme

critre

de

con

naissance vritable la capacit d'appliquer le savoir scol

aire dans un

autre

contexte, plus significatif. En ralit, le

transfert d'un

contexte

un autre est

extrmement

faible.

On

savait depuis

longtemps

que les

rsultats

scolaires

avaient

trs

peu de

rapport

avec la russite au sein d'une

profession

(Ghiselli, 1966). Des

expriences rcentes

de

psychologie sociale

(Capon

et

Kuhn,

1979) ont

montr

pourquoi

:

les dmarches

de pense utilises

pour

com

parer des prix, par exemple, varient totalement selon

que

les

adultes interrogs se trouvent dans une

cole

ou dans

un supermarch. Les

comptences

scolaires ne sont pas

utilises dans la vie pratique. Inversement, des enfants du

Brsil (Carraher, Carraher

et

Schliemann, 1985),

qui

savent rsoudre

de tte des problmes

arithmtiques

au

march,

chouent

le

lendemain lorsque les mmes ques

tions

leur

sont poses

l'cole. Quelle

est leur

connais

sance

ritable ?

Pour

une

bonne

part,

ces incohrences apparentes

proviennent

de la

dynamique de

la situation

d'examen.

Les personnes

interroges

cherchent

rpondre

aux

demandes de l'examinateur, telles

qu elles les peroivent

(Lave,

1987).

Le contexte de l'examen

va donc induire

telle ou telle

orientation

des stratgies d'attaque du

pro

blme

et

modifier

les

probabilits de

rponse

correcte

des sujets

(Dumont,

1989,

en

a donn de

nombreux ex

emples .

Mais ce contexte, son tour, peut tre apprhend

diffremment,

comme

les recherches de psychologie

sociale

de

l'ducation

issues des premiers travaux de

Perret-Clermont (1979) l'ont

dmontr rcemment.

La

signification

que la situation revt

pour

le sujet joue le

rle

de mdiateur entre ce sujet et la tche (Grossen,

1988, p. 453).

Il

devient donc

impossible

de dfinir

les

capacits cognitives ou

les

connaissances du sujet

en

soi. De son ct, l'objet d'tude

ne

se dfinit plus

non

plus

par

ses

caractristiques

propres,

mais par

la signif

ication

qu'il reoit. Examinateur

et

examin

se

caractri

sent

lors l'un par

l'autre.

Toute

rponse est donc indis

sociable

de

ses

conditions de production, c'est--dire

des

aspects

relationnels et sociaux de la situation

(idem,

p.

455).

De plus, comme

chaque

situation

sociale

est cratrice

de

nouveaux

savoirs,

chaque

situation de

test

est aussi

situation d'apprentissage : l'valu volue... En cons

quence,

la

recherche d'un niveau

de performance

vrai

semble

une entreprise dnue de sens.

47


9/13

Il faut donc admettre que la russite ou l'chec

observs en classe ne permettent

pas

de porter un juge

ment sur la russite ou l'chec du

mme

lve

devant

d'autres

questions,

formules diffremment, dans un

autre

contexte, ou dans des

conditions

de

motivation diff

rentes.

Il

n'existe

pas

plus

d lves capables

ou

incapables

que de

corps

lgers ou

lourds.

Comme en psychologie,

nous

sous-estimons toujours,

en

ducation,

l'influence

des

conditions d'observation.

IV.

- UNE

VALUATION

QUAND MME

4.1.

Pourquoi

il faut

valuer:

les

vises

formative

et

sommative

La

difficult

de raliser

une

valuation

quantitative

satisfaisante

ne doit pourtant pas

nous faire renoncer

compltement

toute

valuation. Nous

avons toujours

besoin d'informations

en

retour

pour

ajuster notre action,

ou

pour

modifier plus fondamentalement nos objectifs.

A l'cole, ces deux vises correctives,

court

ou

moyen terme, correspondent au besoin de guider la

pro

gression de

l'tude,

ou de la contrler. On distingue ainsi

deux

formes d'valuation

trs diffrentes, dites

formative

et

sommative.

La premire vise

amliorer

les conditions

d'apprentissage

de l'lve, la seconde tablir un bilan

de leurs rsultats.

Mais comment

effectuer ces

valuations

si

l'on ne

peut

pas savoir o

se situe

chaque lve ?

4.2. Ce qui reste possible du point de vue formatif

Pour comprendre pourquoi les obstacles voqus

plus haut n'affectent en

rien la

dmarche d'valuation

formative, il faut

se reprsenter

l'ensemble

du

domaine

des objectifs

ducatifs.

La figure 2

en montre les

dimensions principales :

les

contenus

d'abord,

tels qu'ils figurent dans

les

pr

ogrammes

scolaires,

puis

les

qualifications,

c'est--dire

ce

que les lves

doivent faire par

rapport ces contenus

(les mmoriser,

les

appliquer, les analyser, etc.) et enfin

les

situations

o

ces tches sont

effectuer (cole,

vie

professionnelle, etc.).

Un objectif ducatif, s'il est formul correctement,

renvoie ces trois dimensions, et correspond donc

une

seule

cellule. Une mesure correcte de la matrise d'un

objectif

particulier

est certainement possible,

mais

ne

nous renseigne

pas

sur

la

connaissance qu'aurait l'lve

de ce mme contenu dans d'autres situations, ni

sur sa

Figure 2

Dimensions principales de

classement

des

objectifs

CONTENUS

(ou

reprsentations)

Classe

Institutions

autres

Profession

Famille

de

jeux

SITUATIONS

(ou rles)

Trans-

disciph-

naires

Converg.

Personn.

Diverg.

Sociales

QUALIFICATIONS

(ou dmarches)

GNRALES

capacit appliquer la mme

dmarche

dans d'autres

disciplines, par exemple. L'extrapolation d'une cellule

toute une colonne, ou toute une range, est impossible.

C'est l que se situe l'obstacle principal la mesure,

parce que le contrle spar de

chacun

des objectifs

particuliers devient trop lourd pour tre praticable.

Par

contre, il

reste

possible

et

minemment

souhaita

ble

ue l'exercice d'un objectif particulier, dans

une

cel

lule donne, soit

l'occasion

pour

l'lve

d'acqurir les

contenus, d'exercer les dmarches,

etc.,

qui correspon

dentux ranges en question. Les

situations

d apprentis

s gee sont pas

soumises

aux

mmes

contraintes que

les

situations

d'valuation.

En particulier,

en

traitant un problme de physique,

l'lve

pourra

dcouvrir

que

sa reprsentation initiale du

concept avec lequel

il travaille (disons

le poids)

tait

fausse

et qu'il doit la modifier.

Il pourra

s'apercevoir

que

la

faon

dont

il

a

formul

sa rponse

n'est

pas

comprise

par d'autres et qu'il doit s'habituer anticiper

les ques

tions de ses lecteurs, etc. Toutes sortes de retours

d'information

seront

possibles

dans tous

les domaines,

et

cela

d'autant plus

que

l'activit

sera

plus riche,

c est--

dire

plus

complexe

et

significative.

La

situation de mesure,

par opposition,

doit tre

troite et dpouille, si l'on veut pouvoir analyser ce que

l'on

mesure.

Sans doute pourrait-elle galement donner

lieu un retour

d'information

l'lve,

mais

pourquoi

passer par un lourd bilan pour

le

faire

? Si

un jeune

48


10/13

enfant

fait

une

faute

de franais

en parlant, on corrige

son expression

; on ne

cherche

pas juger

sa

compt

ence.

En

rsum,

l'valuation

formative souhaitable est

un

retour

d'information

multidirectionnel, s'adressant

l'lve,

au

lieu

de

porter sur

l'lve.

4.3.

Ce qui reste possible du point de vue

sommatif

Des bilans d'apprentissage

restent

nanmoins souhai

tables, en

particulier

pour guider des ajustements plus

long terme, concernant les objectifs viser et la

faon

de

les poursuivre. Mais

la

conception de ces

bilans

doit tre

soigneusement

rflchie, car ils ont des rpercussions

majeures sur tout le fonctionnement du systme

scolaire.

une valuation

non

comparative

Pour

les

raisons

dj

indiques

propos

de

la

psy-

chomtrie, l'habitude de comparer

les

lves

les

uns aux

autres,

pour dcider

si un apprentissage est suffisant ou

non,

ne

peut se justifier

que

par sa facilit. Psychologi

quementt

socialement,

cette procdure est dangereuse.

Juridiquement,

elle est indfendable, parce

que

contradict

oire

vec

les

finalits

dclares

de l'entreprise ducative.

Enfin elle est

absurde, puisqu'elle

value

ce

que

sait

l'lve

partir de ce

que

savent

les autres.

sans

gabarit prtabli

L'habitude

trs

gnrale

de

dfinir

un

programme

d'examen

et

de

contrler

si

l'lve

matrise

suffisamment

l'ensemble

de

ce

programme

parat galement criticable.

Qu'on songe seulement la perte

d'information

que

reprsente l'alternative unique laisse au

jury de tels

exa

mens : accorder ou non

le

diplme Il se peut qu'un lve

reu ait t admis par

le

jeu de compensations qui trom

peront ensuite ceux qui feront confiance au diplme.

Inversement, un lve qui

choue

n'est pas pour autant

dnu de comptences, qui pourraient trs

bien

tre

mises profit dans

le monde du

travail.

C'est

pourquoi les milieux

professionnels

approuvent

le

principe

du

nouveau

certificat

de

fin

d'tudes

secon

daires de Grande-Bretagne.

Son but est de rendre

compte

de toutes

les

comptences de l'lve, y compris

dans les domaines extra-scolaires. Son ambition est

d al

ler

aussi

loin

que

possible

dans

la description des

rus

sites de

chacun,

sans

se

rfrer

un gabarit prtabli de

connaissances

requises.

Il ne fait aucun

doute,

vu l'explosion des connais

sances,

que l'ducation

de l'avenir devra tre

diversifie,

les

lves

se dveloppant chacun

dans la

direction

de

leur choix. Seul un systme ouvert de ce

genre permettra

de

rendre compte

de

ce

qu'ils

auront acquis, plutt que

de

ce qu'ils

ignoreront ncessairement.

simplement descriptive

Si

l'on veut

valoriser

les acquis, il

importe

de

rassemb

leres

informations

qui les mettent en vidence. La

pratique

des

portefeuilles

de

comptences

va

dans

ce

sens. A l'image

du

portefeuille dans lequel les

artistes

prsentent leurs productions,

la

pratique

se rpand

dans

l'ducation

des

adultes de rassembler dans un dossier les

documents qui

peuvent

manifester ce qu'un tudiant est

capable

de faire. La mme ide est parfois applique

l cole

lorsqu'un lve doit changer de classe,

le

pre

mier enseignant transmet son

successeur

l'ensemble

des travaux dj effectus par cet

lve.

L'intrt vident

de

cette

faon de faire

est d'viter

que ne se

perdent

les informations qui

sont essentielles

pour

l'tablissement

du

bilan

recherch.

Son

intrt

majeur est

pourtant autre

: elle permet d'viter les erreurs

d'un

double transcodage, celui du premier valuateur qui

doit quantifier

la performance

qu'il a observe,

et

celui

du

second qui doit

redonner

un sens

concret

la

note qu'il

reoit, en

imaginant

quelles productions elle

peut cor

respondre.

sans jugement de valeur

Indpendamment

de son incertitude

bien

connue,

l'valuation chiffre d'une performance

pose un problme

fondamental : elle oblige

choisir une

chelle de

valeur.

Donner une note

une

dissertation

ou

un

expos

suppose

en

effet

que

l'on

pondre d'une

certaine

faon

chacune de

leurs caractristiques. Ceci

implique

qu'il

existe

une faon optimale, et une

seule, de

valoriser ces

caractristiques. L'existence

de styles

diffrents,

de

faons contraires de

parvenir

au mme

but,

est difficil

ement ompatible avec cette conception : il est

pourtant

admis,

par

exemple, qu'on peut tre un

bon

enseignant

de faons trs diffrentes

Rien

ne

prouve

non

plus

que

la personne qui recevra

l'information chiffre attribue la mme importance relative

que

^'valuateur chacune des

caractristiques que

ce

dernier

a

prises

en

compte.

Or,

si

ce

n'est

pas

le

cas,

la

transformation

quantitative

a dfinitivement

perdu toute

l'information

initiale et

rendu impossible

sa rcupration.

C'est l

ce qui justifie

le

plus fondamentalement

une

valuation descriptive : en ne prenant pas

position

au

dpart, l'cole

rserverait

le

jugement

de

valeur celui

qui devrait prendre effectivement

plus

tard

une

dcision

impliquant ces

valeurs. Elle permettrait

ainsi

diverses

personnes de porter des regards diffrents sur la

mme

ralit. Ce minimum de tolrance parat indispensable

dans

la

socit pluriculturelle dans laquelle nous entrons.

49


11/13

V.

-

VALUER

N'EST

PAS

NCESSAIREMENT

JUGER

En

conclusion

de ces

rflexions, il

parat

utile

d expli

citera

conception gnrale de l'ducation qui

fonde

ces

propositions.

L'argumentation,

pour

tre plus rigoureuse,

prendra la

forme d'un syllogisme.

5.1.

L'enseignement

est

une

relation

d'aide

Notre sicle a vu

se

dvelopper le secteur tertiaire,

celui des activits de service, et parmi celles-ci une

cat

gorie d'activits professionnelles nouvelle, celle des

assistants, des conseillers, des thrapeutes, par exemple

les

assistants sociaux,

les conseillers en

orientation

pro

fessionnelle les psychologues scolaires, les

logopdistes,

les ergothrapeutes, etc.

Ces

professions

ont une srie de caractristiques

communes. Leurs membres :

possdent des

connaissances spcialises,

relat

ivement un type de problmes, qui font justement

dfaut

leur partenaire ;

ne prennent pas de

responsabilit directe, mais

aident les autres exercer leur responsabilit ;

ont pour rle d'analyser

la situation et

d'en g

ger

es

traits

pertinents, pour que leur

partenaire puisse

choisir plus

consciemment l'action

la plus

efficace

par

rapport ses propres

valeurs

;

conoivent

leur intervention comme

temporaire,

limite

la

priode

o leur

partenaire

ne

pourrait pas

faire

face seul

la

complexit

des

problmes qu'il ren

contre ;

visent donc

communiquer

leur comptence, pour

rendre leur

partenaire

capable

d'assumer seul ses respons

abilits par la suite ;

doivent matriser

les

problmes de relations

humaines, pour que

la communication ncessaire cette

collaboration

soit

optimale.

Toutes ces caractristiques s'appliquent, sans restric

tion, ceux qui

s'occupent

d'ducation des adultes. La

thse de tous les

promoteurs

de l'ducation permanente,

depuis

les

annes

70,

est

qu elles

s'appliquent

galement

aux enseignants

de

l'cole

de

base.

Il s'agit en fait

d'une description

valable pour

toute

relation ducative

et

qu'acceptent maintenant les mdec

ins t

les infirmires, les

ecclsiastiques,

les juristes, les

ditticiens, etc.

pour

la

part

de

formation

du public

que

leur activit comporte.

5.2.

Toute

relation

d aide exclut le

jugement

La vrit du deuxime terme du syllogisme a t

dmontre plus particulirement par Carl Rogers dans le

cadre de sa

pratique

psychothrapeutique, mais cette

affirmation a une porte beaucoup plus gnrale.

Il est vident d'abord que

le conseiller

doit viter de

prendre des dcisions

la

place de son client.

Si c'est

l'autonomie

de ce dernier qui est vise, tout ce qui

ren

forcera it

sa

dpendance

est

exclure.

Il est clair aussi que

le conseiller

ne doit pas

expri

mer

de

jugement

de

valeur personnel, si cette prise

de

position risque d'interfrer avec le processus de

dcision

de

son client,

dont

la

hirarchie

de

valeur peut

tre

diffrente.

Une

cole

pluri-culturelle est inconcevable

sans

ce

respect

des

diffrences

existant entre

personnes

et entre groupes.

Rogers va plus loin

encore. Il

souligne

que

le simple

fait de situer

le

client dans une catgorie nosologique, ou

de lui attribuer un trait

psychologique,

est dj une

atteinte sa

libert

et un obstacle son dveloppement.

Le

jugement d'autrui

est

en

effet

rducteur.

Il

enferme

dans un rle.

Les psychologues

sociaux

ont montr que les tu

diants

construisaient une image

de leurs

capacits

part

ir de

l'attribution d'une seule

note,

et

que cette

image

persistait mme aprs qu'on leur ait

expliqu

que cette

note

avait t en ralit tire au hasard (Ross, Lepper

et

Hubbard,

1975).

Les psychothrapeutes considrent

que mme

l'auto-

valuation peut tre

dangereuse

: si elle conduit la

construction d'une

image

de soi

rigide,

aboutissant une

dmarche

d'attribution

soi-mme

de

caractristiques

stables,

voire

irrmdiables,

elle peut

constituer un

pro

cessus nvrotique.

L'auto-valuation doit plutt correspondre une prise

de conscience librante. En apercevant ses erreurs,

l'ind

ividu se dissocie

d'elles.

Le

fait mme qu'il prenne de

la

distance

transforme

sa

situation

et

introduit

une ouvert

ure,

une

possibilit

de renouveau. C'est l

que s'insre

sa

libert.

La confiance accorde par

l'ducateur est galement

l'expression

de

ce refus

de

juger

l'autre,

d'enfermer

son

avenir

dans

son

prsent.

C'est

sur

cette

ngation

du

simple constat et sur

cet

appel au dpassement

que peut

alors

s'appuyer

le dveloppement de sa

personne.

5.3. Donc

l'cole doit

valuer les lves sans les juger

Dire que l'enseignement, en tant que dmarche du

cative,

doit viter le jugement, c'est suggrer une nou

velle

dfinition du terme

valuation

.

Classiquement, en effet, valuer un objet consiste

en

estimer la valeur. C'est

donc

attribuer

cet

objet

une

50


12/13

classe

d'quivalence,

celle de tous les objets valant

autant, si l'valuation est quantitative, ou bien celle de

tous les objets ayant un attribut semblable, si l'valuation

est

qualitative.

On

a

beaucoup

discut de l'aspect

rducteur

de

la

notation

chiffre

pour

proposer de

la

remplacer par une

apprciation

verbale,

respectant la

multidimensionnalit

de

la performance de

l'lve.

La

diffrence est en

effet

notable, mais du

point

de vue du

respect

de

l'enfant,

l'une

comme

l'autre paraissent inadmissibles, parce

qu elles transforment l'lve en objet. Il faut

rejeter

l va

luation en troisime

personne,

pour chercher une valuat

ion ompatible avec

la relation ducative,

c'est--dire

une

valuation en

deuxime,

voire en premire personne.

La nouvelle dfinition propose

pour

l'valuation est

issue de l'analyse de systme, qui fait d'un processus

d'valuation efficace la condition de fonctionnement

essentielle

de

tout

ensemble

rgul

:

l'valuation

est

l'ap

port

d'information

en retour sur le rsultat des actions

passes,

qui permet

au sujet d'adapter la suite de ses

actions par rapport son but.

Vue dans cette perspective, l'information concernant

la russite ou l'chec de son projet est, pour

l'enfant,

une

valuation essentielle, celle sur laquelle

se

construit

sa

connaissance du monde, selon Piaget. Aucun

adulte,

aucun instrument, aucun jugement de valeur mme, ne

sont ncessaires cette valuation

par le succs

.

Une

autre

valuation

la

deuxime

personne,

mais

dveloppant

le

dialogue

de

l'enfant

avec

le

monde,

est

l'valuation

par la rponse

.

La simple raction de ses

partenaires

lui

apporte

en

effet une

information en

retour,

soit

sur ses reprsentations, que ses

partenaires peuvent

contester,

soit

sur l'expression de son message, qu'ils

peuvent

avoir mal compris (Weiss, 1979). Un ajustement

de

sa

part est

sans doute

ncessaire, en cas de percept

ionivergente, mais ce

conflit

ne met pas

directement

en cause sa personnalit.

L'valuation en

miroir

est

le retour

d'information

que chacun reoit quand il a l'occasion de s'observer de

l'extrieur

:

partir

d'un

enregistrement

vido,

par

exemp

le,

ais

mme travers l'image de lui-mme que

fournit

son

curriculum

vitae ou son portefeuille de comptences.

C'est la base de

l'auto-valuation,

ou valuation

en pre

mire

personne.

Une valuation ainsi comprise,

comme

apport d info

rmation en

retour,

ne

prsuppose

ni jugement de valeur, ni

chelle de

valeur.

C'est celui qui reoit cette

information

qui

peut l'utiliser comme

il

lui

plat.

L cole n'a

pas

prendre

parti

par rapport aux donnes qu'elle

transmet.

5.4. Finalit de cette prise de

position

Travailler rduire

les

activits d'tiquetage, l int

rieur de

l'cole,

c'est

redonner

son sens premier

cette

institution,

qui

se

veut ducative.

Refuser le

classement

et la

slection, pour rendre

possible la

promotion

des

lves,

c'est

opter pour

le droit de tous la culture, dans

l'esprit

des

Dclarations

Universelles des Droits de

l'Homme

et de

l'Enfant, dont on

fte l'anniversaire

en

1988

et

en 1989.

N'est-ce

pas galement

chercher

appliquer,

au

milieu

journalier

des classes et des coles, ce prcepte

esquiv,

tant

il semble

exigeant :

Ne

jugez

pas

(Mat

thieu

VII 1)

?

Jean CARDINET

Institut romand de

recherches

et de documentation

pdagogiques

Neuchtel,

Suisse

Rfrences

BODIN

A. (1985),

Problmes

de l'valuation

des

savoirs

mathmat

iques,

Petit X

n 7, p. 5-28.

CAPON

N.,

KUHN

D.

(1979),

Logical

reasoning

in

the

supermark

etAdult

females'

use of a

proportional

reasoning

strategy

in an everyday context, Developmental Psychology, vol. 15,

n

4, p.

450-452.

CARDINET J.

(1973),

L'adaptation

des

tests aux finalits de

l va

luation,

Sciences

de l'Education, n* 2-3, p. 148-182.

CARDINET

J.,

Le

biais

social dans les tests et les critres,

Bulletin

de la Commission internationale

des

tests, n 9 (juin 1978),

Pans

:

Editions du

Centre

de

Psychologie Applique, p.

3-22.

CARDINET J. (1988), La mesure d'un

apprentissage

en physique,

Compte rendu

des

sances

du Groupe

de Travail

Edum-

trie ,

Neuchtel

: Institut romand de Recherches et de Docu

mentation Pdagogiques.

CARDINET J.

TOURNEUR

Y. (1985), Assurer la mesure: Guide

pour

les

tudes

de

gnralisabiltte, Berne : Peter Lang.

CARDINET

J., TOURNEUR

Y.

ALLAL L.

(1976),

The symmetry

of

generalizabihty theory : applications

to

educational measure

ment, ournal of

Educational

Measurement, vol. 13, n

2,

p. 119-135.

CARDINET

J.,

ZIMMERMANN

M.L. (1988),

Pour mesurer

les pro

grs des lves en physique,

Neuchtel

: Institut romand de

Recherches et de Documentation Pdagogiques.

CARRAHER T.N., CARRAHER D.W.

SCHLIEMANN

A.D.

(1985),

Mathematics in the streets

and

in schools, British Journal of

Developmental Psychology, vol.

3,

p. 21-29.

CRONBACH L., GLESER G., NANDA H. RAJARADNAM N.

(1972),

The dependability of behavioral measurements : theory

51


13/13

of

generalizability for

scores

and profiles, New York : J.

Wiley.

DE

BLOCK A. (1970),

Voorstel

van

taxonomie, Onderwijs

en

Media,

vol.

2, n1,

p. 56-61.

DE KETELE J.M. (1983),

Evaluation

des objectifs d'intgration. In :

INRAP,

Actes de la session Evaluation

du

27

au

30

septembre

1983,

Dijon

:

Institut

National

de

Recherches

et

d'Applications

Pdagogiques,

Tome

1,

p.

87-112.

DE KETELE J.M.

(dcembre 1982), Les

objectifs

intgrs,

Commun

ication

au Colloque international

sur

la Dfinition des ob

jectifs ducatifs et socio-culturels dans

la perspective

d'une

meilleure

prparation des jeunes la vie active , Mons :

Universit de l'Etat.

DE LANDSHEERE G. DE LANDSHEERE V. (1975),

Dfinir

les

objectifs de l'ducation, Lige : Georges Thone.

DE LANDSHEERE

V. (1987), La

problmatique

de

la

comptence

minimale, Thse

de

doctorat

en

Sciences

de l'Education,

Lige

: Universit

de

l'Etat.

D'HAINAUT L. (1985), Des fins

aux

objectifs,

Bruxelles: Labor

4e

dition).

DUMONT B. (1989), Questionnements et interprtation des erreurs

en mathmatiques, Pans : Universit de

Pans

VII (Thse de

doctorat).

GHISELLI E.

(1966),

The

validity

of

occupational aptitude tests,

New York :

John

Wiley.

GROSSEN

M.

(1988), La construction sociale de l'intersubjectivit

entre adulte et

enfant

en situation de

test,

Cousset (Fn-

bourg)

: Delval.

LAUGIER

H. WEINBERG

D.

(1938), Recherches

sur

la solidarit

et l'indpendance

des

aptitudes intellectuelles d'aprs les

notes

des

examens

crits du baccalaurat, Pans :

Chantenay

(Imprimeur).

LAVE

J.

(1987),

Arithmetic

practice

and

cognitive

theory,

New

York

:

Cambridge

University

Press.

LEYENS

J.Ph.

(1983), Sommes-nous tous des

psychologues?

Bruxelles :

Mardaga.

PERRET-CLERMONT A.N.

(1979),

La construction de l'intelligence

dans

l ' interaction

sociale,

Berne :

Peter Lang.

PERRET-CLERMONT A.N.

NICOLET M. (1988), Interagir et

conn

atre. Enjeux et rgulations sociales dans

le

dveloppement

cognitif,

Cousset

(Fribourg) : Delval.

PIRON H. (1963), Examens et docimologie, Paris : Presses

Uni

versitaires de France.

REUCHLIN

M.

BACHER

F.

(1968),

L'apprciation

des

lves

par

leurs professeurs, Revue Franaise de Pdagogie,

n2,

p. 19-

25.

ROSS

L. (1977),

The

intuitive

psychologist

and

his short-comings,

in : L. Berkowitz (Ed.), Advances in Experimental Social Psy

chology, vol.

10,

New York: Academic Press.

ROSS L,

LEPPER

M.R. HUBBARD

M.

(1975),

Perseverance

in

self perception and social perception : Biased attributional

processes in the debriefing paradigm, Journal of Personality

and Social

Psychology, vol. 32, p. 880-892.

ROTH P. SCHELLHAMMER E. (1974),

Entscheidungssftuationen

im

Berufsfeld des Lehrers, Basel : Beltz.

STIEVENART M. TOURNEUR

Y.

(1983),

Conception d'un pr

ogramme de

comptences

fondamentales

en

vue

d'une

meil

leure

prparation

des

jeunes

la

vie

:

mthodologie

et

rsul

tats, Rapport d'une recherche commandite par la

direction

gnrale de l'Organisation des

Etudes,

Mons : Universit de

l'Etat.

VANDEVELDE L.

(1982),

Aider devenir, Bruxelles : Labor.

WEISS J. (1979), L'valuation formative dans

un enseignement

diffrenci

du franais : une conception de la formation

dpasser, in : L. Allai, J. Cardinet Ph. Perrenoud, L'valua

tion

ormative dans un enseignement diffrenci, Berne : Pe

ter Lang, p. 194-202.

WILLIAMS F. NAREMORE R. (1969), On the functional analysis

of

social class differences

in modes of

speech. Speech

Monogr. ,

vol.

36,

p. 77-102.

ZIMMERMANN M.L., Contribution l'tude des conceptions

d'lves

et

de

leurs

utilisations

dans un processus

d'apprent

issage,Thse

de

doctorat (en prparation), Genve : Univers

ite

Genve, Facult

de

Psychologie

et des

Sciences

de

l'Education.

52

Documents

Cardinet_Evaluer Sans Juger