65
Séminaire organisé par l’école doctorale thématique PSYCEDUC et le GIRSEF Louvain-La-Neuve: 10-11 mars 2011 L’analyse de données L’analyse de données longitudinales: les longitudinales: les modèles multiniveaux modèles multiniveaux de croissance de croissance Pascal BRESSOUX Pascal BRESSOUX Université Pierre-Mendès-France Université Pierre-Mendès-France Grenoble Grenoble Laboratoire des Sciences de Laboratoire des Sciences de

Bruxelles: De Boeck 2008 (2 e éd. Nov. 2010)

Embed Size (px)

DESCRIPTION

Séminaire organisé par l’école doctorale thématique PSYCEDUC et le GIRSEF Louvain-La-Neuve: 10-11 mars 2011 L’analyse de données longitudinales: les modèles multiniveaux de croissance Pascal BRESSOUX Université Pierre-Mendès-France Grenoble Laboratoire des Sciences de l’Education. - PowerPoint PPT Presentation

Citation preview

Séminaire organisé par l’école doctorale thématique PSYCEDUC et le GIRSEFLouvain-La-Neuve: 10-11 mars 2011

L’analyse de données L’analyse de données longitudinales: les longitudinales: les

modèles multiniveaux de modèles multiniveaux de croissancecroissancePascal BRESSOUXPascal BRESSOUX

Université Pierre-Mendès-France GrenobleUniversité Pierre-Mendès-France GrenobleLaboratoire des Sciences de l’EducationLaboratoire des Sciences de l’Education

Bruxelles: De Boeck2008

(2e éd. Nov. 2010)

Analyses contextuelles et problèmes posés par les

moindres carrés ordinaires

Données sur plusieurs « niveaux » :

- Un effet-classe sur les acquis des élèves ?

- Un effet-juge sur les condamnations des prévenus ?

- Un effet-quartier sur la délinquance des jeunes ?

- Un effet-pays sur les résultats des élèves à PISA ?

- Etc.

Souvent, structure hiérarchisée.

Exemple : des élèves (niveau 1) dans des classes (niveau 2), etc.

Modèles multiniveaux (ou modèles hiérarchiques linéaires)

Nés des avancées des modèles de contexte et des modèles mixtes.

But : étudier les effets de l’environnement sur le « comportement » individuel.

Principes de l’analyse multiniveau

Académie 1 Académie 2

Ecole 1 Ecole 2

Classe 1 Classe 2

Ecole 3 Ecole 4

Classe 3 Classe 4

él. 1 él. 2 él. 3 él. 4 él. 5 él. 6 él. 7 él. 8 Niveau 1(élèves)

Niveau 2(classes)

Niveau 3(Ecoles)

Niveau 4(Académies)

Exemple d’une structure hiérarchisée à quatre niveaux

… / …

Non-indépendance des résidus

Agrégation vs désagrégation

(voir aussi diapo suivante)

Hétérogénéité des relations

Effets aléatoires et effets fixes

Problèmes posés par l’analyse de données hiérarchisées

Le modèle de régression par les MCO

Droite de régression simple (sans distinction de classes)

yij

xij

x

eij

0

1

x

x

x

x

x

ijijij XY 10

où i = individus (unités d’analyse) et j = macro-unités (indistinctes)

n

4

3

2

1

2

2

2

2

2

00000

0

0000

0000

0000

0000

,

0

0

0

0

0

N~

2,0 Ni ~

Hypothèses sur les erreurs

Admettons maintenant qu’on y inclue une variable de niveau 2, qu’on nommera Z.

Si l’on raisonne sur les individus, on travaille sur des données désagrégées au niveau 1 (N = I):

Estimation MCO des effets-classes (les gammas représentent des effets fixes) (N = I):

Si l’on raisonne sur les groupes, on travaille sur des données agrégées au niveau 2 (N = J):

ijijijij ZXY 210

jjjj ZXY ... 210

ijijJJijijijijij CCCCXY 1133221110 ...

Le modèle multiniveau

ijjij eY 0

jj u0000

ijjij euY 000

Au niveau 1

Au niveau 2

Equation complète

Le modèle « vide » équivalant à une ANOVA avec effets aléatoires

220

20

eu

u

Coefficient de corrélation intra-classe

= mesure du degré de « ressemblance » des individus i qui appartiennent à une même macro unité j.

516 élèves d’âge élémentaire appartenant à 24 classes.

Acquis des élèves mesurés à l’aide d’épreuves standardisées en début et en fin d’année scolaire dans la discipline du français.

On cherche à savoir ce qui fait varier les acquis des élèves en cours d’année.

Les scores d’acquisitions des élèves ont été normalisés, centrés et réduits

Un exemple : étude de la variance des acquis en français à l’école élémentaire

Modèle vide décomposant les parts de variance inter et intra-classes du score final en français

Paramètres Modèle 1 (vide)

Effets fixes

Constante 0,007 (0,078)

Effets aléatoires

Variance inter-classes 0,103 (0,042)

Variance inter-élèves 0,890 (0,057)

–2 log V 1434,071

104,0890,0103,0

103,0

Le modèle multiniveau à constantes aléatoires

Les composants de la variance :

Variance totale :

Niveau 1

Niveau 2

Equation complète

2

00

2

uj

eij

uVar

eVar

20

2ueijyVar

ijijjij eXY 10

101

0000

jj u

ijjijij euXY 01000

220

20

20

20

220

20

20

20

220

220

20

20

20

220

20

20

20

220

220

20

20

20

220

20

20

20

220

000000

000000

000000

000000

000000

000000

000000

000000

000000

euuu

ueuu

uueu

euuu

ueuu

uueu

euuu

ueuu

uueu

V

ije 2e

u j020u

N(0,

)

N(0, )

)

Une matrice de variance-covariance des erreurs « bloc-diagonale »

Un exemple d’estimation avec constantes aléatoires

Modèles expliquant le score final en français (données aménagement du temps scolaire 1997-98)

Paramètres Modèle 1 Modèle 2

Effets fixes

Constante 0,007 (0,078) 0,007 (0,078)

Score initial en français 0,690 (0,031)

Effets aléatoires

Variance des constantes 0,103 (0,042) 0,096 (0,034)

Variance inter-élèves 0,890 (0,057) 0,442 (0,028)

–2 log L 1434,071 1084,083

N = 516

Le score initial (modèle 2) « n’explique » quasiment pas la variance des constantes (variance interclasses), mais il « explique » environ la moitié de la variance inter-élèves (intraclasse).

Le modèle multiniveau complet :constantes et pentes aléatoires

Niveau 1

Niveau 2

Equation complète

ijijjjij eXY 10

jj

jj

u

u

1101

0000

ijijjjijij eXuuXY 101000

Les composants de la variance :

Variance de Y devient fonction quadratique de X

1010

211

200

2

, ujj

uj

uj

eij

uuCov

uVar

uVar

eVar

ijuijuueijij XXXY 0122

120

2 2var

j

j

u

u

1

0

2110

0120,

0

0

uu

uuN

2e

au niveau 2~

au niveau 1, eij ~ N(0, )

Structure des erreurs

Un exemple d’estimation avec constantes et pentes aléatoiresModèles expliquant le score final en français (données aménagement du temps scolaire 1997-98)

Paramètres Modèle 1 Modèle2 Modèle 3

Effets fixes

Constante 0,007 (0,078) 0,007 (0,078) 0,008 (0,069)

Score initial en français 0,690 (0,031) 0,690 (0,041)

Effets aléatoires

Niveau 2 (classes) :

Variances des constantes 0,103 (0,042) 0,096 (0,034) 0,092 (0,033)

Covariance constantes-pentes 0,014 (0,014)

Variance des pentes 0,016 (0,011)

Niveau 1 : variance inter-élèves 0,890 (0,057) 0,442 (0,028) 0,441 (0,025)

–2 log L 1434,071 1084,083 1079,525

N = 516

Calcul de la décroissance de la déviance avec 2 paramètres supplémentaires à estimer :

D = 1084,083 – 1079,525 = 4,558

Pour atteindre p < 0,05, le Khi2 à 2 ddl devrait au moins être égal à 5,99.

Il n’y a donc pas d’évidence ici que la relation entre le score initial et le score final varie en fonction des classes.

37,0016,0092,0

014,0

r

Le tableau montre la covariance constantes-pentes. La corrélation (en fait, ici, elle n’est pas significativement différente de 0) peut être calculée de la manière suivante :

En ce cas, le calcul de la décroissance de la déviance avec 1 paramètre supplémentaire à estimer : D = 1084,083 – 1080,548 = 3,54.

On est proche alors du seuil de significativité

(pour atteindre p < 0,10 ; Khi2 à 1 ddl > 2,71 ;

pour atteindre p < 0,05 ; le Khi2 à 1 ddl > 3,84).

On peut contraindre la covariance constantes pentes à être nulle. Par rapport au modèle sans pentes aléatoires, il n’y a alors qu’un seul paramètre supplémentaire à estimer.

Exemple (mêmes données) :

Variance des constantes = 0,094 (erreur-type = 0,033)

Variance des pentes = 0,017 (erreur-type = 0,011)

Variance de niveau 1 = 0,427 (erreur-type = 0,028)

–2 log L = 1080,548

Un exemple d’estimation avec constantes et pentes aléatoiresModèles expliquant le score final en maths (données aménagement du temps scolaire 1997-98)

Paramètres Modèle 1 Modèle2 Modèle 3 Modèle 4

Effets fixes

Constante 0,010 (0,072) 0,003 (0,064) 0,016 (0,064) 0,016 (0,064)

Score initial en maths 0,711 (0,031) 0,713 (0,042) 0,713 (0,042)

Effets aléatoires

Niveau 2 (classes) :

Variances des constantes 0,080 (0,036) 0,077(0,028) 0,077(0,029) 0,077(0,029)

Covariance constantes-pentes 0,004 (0,013)

Variance des pentes 0,019 (0,012) 0,019 (0,012)

Niveau 1 : variance inter-élèves 0,920 (0,059) 0,442 (0,028) 0,425 (0,028) 0,425 (0,028)

–2 log L 1446,170 10079,990 10074,956 10075,028

N = 516∆(2 – 3) = 5,034 (pour 2 ddl) ; ∆(2 – 4) = 4,962 (pour 1 ddl)

ATTENTION!

Une question de méthode d’estimation :

-Maximum de vraisemblance complet (ML ou FML)

Ou

-Maximum de vraisemblance restreint, ou résiduel (RML)

ijijjjij eXY 10

jjj uZ 001000

jjj uZ 111101

ijijjjijjijjij eXuuXZXZY 1011100100

au niveau 1

au niveau 2

Equation complète

Interaction inter-niveaux

Ajoutons une variable Z de niveau 2

Le modèle multiniveau de croissance

x

y

y

t t1 t2 t3

Relation entre les scores initial et final pour un échantillon d’individus

Relation entre le temps et les scores pour un individu donné

Classe 1

Elève 1 Elève 2

mes. 1 Niveau 1(Mesures)

Niveau 2(Elèves)

Niveau 3(Classes)

Exemple d’une structure hiérarchisée de croissance

mes. 2 mes. 3 mes. 1 mes. 2 mes. 3

Classe 2

Elève 3 Elève 4

… /…

Niveau 1 :

Formalisation du modèle de croissance

Niveau 2 :

En intégrant dans une même équation :

titiitiiiti eXTEMPSY 210

202

111101

001000

i

iii

iii

uZ

uZ

tiiititiitiiti eTEMPSuuXTEMPSZTEMPSZY 102011100100 *

Rythme de croissance fonction aussi de Z

Caractéristique qui varie avec le temps

Caractéristique interindividuelle stable dans le temps

Niveau initial moyen

Rythme de croissance moyen

Variance de Y fonction du temps (= gestion de l’hétéroscédasticité des erreurs)

Une mesure du déroulement du temps est nécessaire (âge, durée…)

Modèle très souple

Fonctionne pour données non équilibrées (ne nécessite pas le même nombre de mesures par sujet)

Fonctionne pour des mesures prises à différents moments et dont l’espacement diffère (ne nécessite pas que tous les sujets soient mesurés au même moment).

Permet de prendre en compte des environnements « macro » pour les individus:

- classes, écoles, etc. pour les élèves

- ateliers, usines, etc. pour les ouvriers

- quartiers, villes, etc. pour les jeunes

- Circonscription, canton, etc. pour les électeurs

- Etc.

1er exemple : Une étude empirique

L’évolution des perceptions de soi dans le passage CM2-6e

Méthode

Participants

62 élèves appartenant à 6 classes de CM2 en t1 et 9 classes de 6e en t2 et t3

Matériel

Echelle SPP de Harter traduite et validée par Nurra et Pansu (perceptions de soi, importance accordée aux domaines, soutien social perçu)

Jugement des enseignants (score de 0 à 10 en français et en maths)

Fiches de renseignements sociodémographiques (âge, sexe…)

Procédure

Echelle SPP (perceptions de soi, importance aux domaines, soutien social perçu) passée à 3 temps.

Jugement des enseignants (français + maths) récolté à 3 temps.

T1: fin CM2 (mai 2005)

T2 : début 6e (octobre-novembre 2005)

T3 : fin 6e (mai 2006)

Elève 1

1

1,5

2

2,5

3

3,5

4

0 2 4 6 8 10 12

Elève 2

1

1,5

2

2,5

3

3,5

4

0 2 4 6 8 10 12

Elève 12

0

0,5

1

1,5

2

2,5

3

3,5

4

0 2 4 6 8 10 12

Elève 14

0

0,5

1

1,5

2

2,5

3

3,5

4

0 2 4 6 8 10 12

Elève 51

0

0,5

1

1,5

2

2,5

3

3,5

4

0 2 4 6 8 10 12

Elève 41

0

0,5

1

1,5

2

2,5

3

3,5

4

0 2 4 6 8 10 12

Quelques cas individuels de croissance

Peut-on établir un modèle de tout cela?

Moyennes observées

0 6 12

3,05 2,97 2,92

Evolution moyenne des perceptions de soi scolaires

Une spécification linéaire semble adaptée : de toute façon, impossible de spécifier une fonction

d’ordre plus élevé (seulement 3 points)

La structure des données peut être considérée comme complexe :

Niveau 1 : mesures

Niveau 2 : les élèves

Niveau 3 : les classes de CM2 et de 6e (structure aléatoire croisée).

Variables intégrées dans le modèle :

Variable TEMPS mesurée en nombre de mois (0, 6, 12)

Des caractéristiques stables dans le temps (sexe, à l’heure ou en avance)

Des caractéristiques qui varient dans le temps (importance du domaine de l’école, jugement des enseignants, soutien des camarades)

Modèle à tester (différent de celui de Harter)

Sentiment de compétence scolaire

Soutien social perçu

Jugement de l’enseignant

Etude de la croissance du sentiment de compétence scolaire

Paramètres Modèle 1 Modèle 2 Modèle 3

Effets fixes

Constante 2,981 (0,074)* 3,044 (0,076)* 1,226 (0,298)*

Temps –0,011 (0,005)* –0,073 (0,032)*

Heure –0,074 (0,142)

Avance 0,159 (0,218)

Garçon –0,065 (0,086)

Soutien camarades 0,035 (0,075)

Jugement enseignant 0,098 (0,010)*

Importance de l’Ecole 0,096 (0,044)*

Temps × Soutien camarades

0,025 (0,010)*

Effets aléatoires

Niveau 2 : Constante Temps Cov constante*temps

0,306 (0,062) 0,290 (0,060)0,0005 (0,0003)

0,075 (0,024)0,0000 (0,0002)

Niveau 1 : 0,108 (0,014) 0,086 (0,014) 0,099 (0,017)

–2 log L (Full ML) 252,93 245,33 171,34

Effets fixes : * p < .05

Epstein :Dans modèle hiérarchique de soi, les schémas de haut degré (e.g. l’estime de soi) sont plus résistants aux changements que les conceptions d’ordre inférieur (e.g. la perception de soi dans des domaines spécifiques).

Peut-on tester cette hypothèse ?

Si hypothèse vraie, on devrait observer que la part de variance interindividuelle est plus forte pour l’estime de soi que pour la perception de soi dans des domaines spécifiques.

Certaines hypothèses pourraient facilement être testées avec les modèles multiniveaux de croissance

Estime de soi (Valeur

propre)

Scolaire Conduite Apparence Physique Social

Part de variance interindividuelle(Rho)

64,9 % 74,0 % 69,9 % 79,8 % 67,1 % 59,2 %

Fonction de variance interindividuelle

ns Tendance signif

(p < .10)Augmente

avec le temps

ns SignifAugmente

avec le temps

ns ns

Rythme de croissance moyen

ns significatif(décroît dans le temps)

ns ns ns ns

L’estime de soi mesurée avec l’échelle de Rosenberg donne les valeurs suivantes :- Part de variance interindividuelle : Rho = 68,1 %- Fonction de variance interindividuelle : ns- Rythme de croissance : nsATTENTION, il faudrait aussi tenir compte de la fidélité des mesures.

2e exemple : Modèle de croissance des effets à long terme de la réduction des

effectifs au CP

Méthode

Participants

100 classes expérimentales (8 à 12 élèves par classe dans les faits avec une moyenne égale à 10,45)

100 classes témoins (15 à 27 élèves par classe dans les faits avec une moyenne égale à 21,29).

Toutes dans des milieux défavorisés (écoles en zone d’éducation prioritaire)

Le Ministère de l’Education Nationale français a lancé en 2002-2003 une expérimentation d’envergure visant à réduire la taille des classes de CP (1ère

année élémentaire) à 10 élèves dans les zones défavorisées.

Les élèves ont été suivis jusqu’à la fin de la 2e année élémentaire (en fait jusqu’au début de la 3e année mais les scores ne peuvent pas être mis sur la même échelle que les scores précédents).

Leurs acquisitions en français-lecture ont été testées 5 fois (avec items d’ancrage).

-Début, milieu et fin CP

-Début et fin CE1

(Dans les écoles témoins, ces évaluations n’ont porté que sur 10 élèves choisis aléatoirement.)

Modèles de réponse à l’item ont permis de mettre tous les scores sur une même échelle de mesure.

Structure des données :

Niveau 1 : mesures (Nt = 5433)

Niveau 2 : les élèves (Ni = 1163)

Niveau 3 : les écoles (Nj = 69)

Variables intégrées dans le modèle :

Variable TEMPS mesurée en nombre de mois (0, 5, 8, 12, 20)

Des caractéristiques stables dans le temps (origine sociale, sexe)

Des caractéristiques de niveau supérieur (ancienneté enseignant, expérimentation)

1163 élèves retenus pour les analyses (i.e. ceux qui étaient présents à la première et à la dernière évaluation).

Figure 1 : Evolution des résultats bruts

Variable d'analyse : score_francais 

N time Obs N Moyenne Ecart-type Minimum Maximum

ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 0 1163 1163 -0.7470158 1.1387861 -3.6658400 3.5490100

  5 1163 1095 1.0424832 0.9507920 -1.4529400 5.8454600

  8 1163 999 1.8025968 1.0972123 -2.5008300 5.7569900

  12 1163 1013 1.9704838 1.1691808 -0.9668000 5.7569900

  20 1163 1163 2.8968559 1.1230747 -0.3306000 6.3903300

ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ

-1

-0,5

0

0,5

1

1,5

2

2,5

3

3,5

0 5 10 15 20 25

Temps

Sco

re e

n f

ran

çais

Gpe contrôle

Gpe expé

Figure 2 : Evolution des résultats bruts en fonction du groupe expérimental

Quelle spécification adopter?

Une spécification cubique?

-1

-0,5

0

0,5

1

1,5

2

2,5

3

3,5

0 5 10 15 20 25

Temps

Sco

re f

ran

çais

Figure 3 : Spécification cubique des résultats (sans variables de contrôle)

Finalement, choix pour une spécification piecewise avec

deux ruptures de pente

Paramètres Modèle 1(inconditionnel =

« vide »)

Modèle 2(inconditionnel de

croissance)Effets fixes    Constante 0,379 (0,047)*** -0,147 (0,049)**Temps   0,170 (0,002)***(Temps – 8)*post-CP    (Temps – 12)*CE1    Effets aléatoires    Variance inter-écoles (niveau 3)Variance constantesCovariance Constantes/tempsVariance temps

 0,090 (0,027)***

 0,094 (0,027)***

Variance inter-élèves (niveau 2)Variance constantesCovariance Constantes/tempsVariance temps

 0,335 (0,037)***

 0,703 (0,035)***

Variance intra-élèves (niveau 1) 2,370 (0,051)*** 0,610 (0,013)***–2 log L (déviance) 20760,97 14951,46

Nt = 5433 (mesures)

Ni = 1163 (élèves)

Nj = 69 (écoles)

Modèle 2 inconditionnel de croissance :Variance totale = 0,094 + 0,703 + 0,610 = 1,407

Variance inter-écoles = 0,094/1,407 = 0,0688 (6,88 % de la variance totale)

Variance inter-élèves = 0,703/1,407 = 0,4996 (49,96 % de la variance totale)

Variance intra-élèves = 0,610/1,407 = 0,4336 (43,36 % de la variance totale)

Paramètres Modèle 3 Modèle 4Effets fixes    Constante -0,684 (0,049)*** -0,683 (0,056)***Temps 0,323 (0,003)*** 0,323 (0,004)***(Temps – 8)*post-CP -0,304 (0,009)*** -0,305 (0,007)***(Temps – 12)*CE1 0,097 (0,009)*** 0,098 (0,008)***Effets aléatoires    Variance inter-écoles (niveau 3)Variance constantesCovariance Constantes/tempsVariance temps

 0,090 (0,026)***

 0,144 (0,037)***-0,0052 (0,0017)**0,0005 (0,0001)***

Variance inter-élèves (niveau 2)Variance constantesCovariance Constantes/tempsVariance temps

 0,749 (0,036)***

 0,791 (0,041)***-0,0062 (0,0016)***0,0011 (0,0001)***

Variance intra-élèves (niveau 1) 0,379 (0,013)*** 0,282 (0,007)***–2 log L (déviance) 12907,32 12468,15

Nt = 5433 (mesures)

Ni = 1163 (élèves)

Nj = 69 (écoles)

Modèle 3 :Variance totale = 0,090 + 0,749 + 0,379 = 1,218

Variance inter-écoles = 0,090/1,218 = 0,0739 (7,39 % de la variance totale)

Variance inter-élèves = 0,749/1,218 = 0,6149 (61,49 % de la variance totale)

Variance intra-élèves = 0,379/1,218 = 0,3112 (31,12 % de la variance totale)

Paramètres Modèle 5Effets fixes  Constante -0,361 (0,141)*Temps 0,297 (0,007)***(Temps – 8)*post-CP -0,243 (0,014)***(Temps – 12)*CE1 0,067 (0,014)***Profession du père (référence = cadre sup.)  

Agriculteur/artisan -0,399 (0,175)*Prof. intermédiaire -0,1575 (0,151)Employé -0,319 (0,143)*Ouvrier -0,556 (0,127)***Autre -0,602 (0,128)***

Fille 0,240 (0,053)***CP réduit 0,023 (0,097) nsAncienneté CP 0,006 (0,006) nsTemps*CP réduit 0,0295 (0,0075)***(Temps – 8)*post-CP*CP réduit -0,0641 (0,0154)***(Temps – 12)*CE1*CP réduit 0,0225 (0,0158) nsTemps*Ancienneté CP 0,0019 (0,0005)***(Temps – 8)*post-CP*Ancienneté CP -0,0050 (0,0011)***(Temps – 12)*CE1*Ancienneté CP 0,0034 (0,0011)**Effets aléatoires  Variance inter-écoles (niveau 3)Variance constantesCovariance Constantes/tempsVariance temps

 0,140 (0,037)***-0,0054 (0,0017)**0,0005 (0,0001)***

Variance inter-élèves (niveau 2)Variance constantesCovariance Constantes/tempsVariance temps

 0,751 (0,039)***-0,0065 (0,0015)***0,0011 (0,0001)***

Variance intra-élèves (niveau 1) 0,277 (0,007)***–2 log L (déviance) 12353,10

-1

-0,5

0

0,5

1

1,5

2

2,5

3

3,5

0 5 10 15 20 25

Temps

Sco

re f

ran

çais

Gpe contrôle

Gpe expé

Figure 4 : Evolution des scores de français selon le groupe expérimental ou contrôle (la figure est tirée du modèle 5)

Pour explorer d’autres possibilités de ce genre de

modèles

-1,5

-1

-0,5

0

0,5

1

1,5

2

2,5

3

3,5

0 5 10 15 20 25

Temps

Sco

re f

ran

çais

Défavorisés

Favorisés

Figure 5 : Evolution des scores de français selon la catégorie socioprofessionnelle du père

Les pentes sont parallèles pendant les périodes de scolarisation. Les défavorisés

« perdent » par rapport aux favorisés durant la période de vacances.

Figure 6 : Evolution de l’effet de l’ancienneté sur les score de français

MERCI POUR VOTRE ATTENTION

… « Qui s’assemble se ressemble »

- Destin commun (partage d’un même environnement)

- interactions (influence mutuelle)

« Qui se ressemble s’assemble »…

- Eventuelle sélection par les écoles- Eventuel choix des parents

- Ségrégation spatiale en cas de carte scolaire

« Similarité » des individus au sein des contextes

Illustration du biais d’agrégation (Cf. observations classes DEP 95 : Relation entre jugement des enseignants et scores des élèves)

ijij SJ

007,0020,047,2ˆ

jj SJ .022,016,4.ˆ

006,0

Jugement

Score

M1

M2M3

jijij SSJ .080,0060,003,4ˆ

011,0008,0

contexte inter intra

Corrélation (toutes classes confondues) = 0,28 (p = 0,003).

Corrélation inter-classes = –0,77 (p = 0,002).

Corrélation médiane intra-classes = 0,73.

Approche par la régression :

L’estimation de la part de variance inter-groupes

Simulation…

Groupe Nombres aléatoires Moyenne Ecart-type

123456789

10

39 65 76 45 45 19 90 69 64 6173 71 23 70 90 65 97 60 12 1172 20 47 33 84 51 67 47 97 1975 17 25 69 17 17 95 21 78 5837 48 79 88 74 63 52 06 34 3002 89 08 16 94 85 53 83 29 9587 18 15 70 07 37 79 49 12 3898 83 71 70 15 89 09 39 59 2410 08 58 07 04 76 62 16 48 6847 90 56 37 31 71 82 13 50 41

57.3057.2053.7047.2051.1055.4041.2055.7035.7051.80

20.4931.0526.1830.7625.3638.2729.2331.0029.1623.71

Total 50.63 28.50

ρ = 0,059 (Proc ANOVA).

Donc, part de variance inter-groupes = 5,9 %

Données issues de tables de nombres aléatoires, groupées dans des macro-unités(extrait de Wonnacott & Wonnacott, 1991, p. 867)

yij

xij

u j0

Classe j

Moyenne

Droites de régression avec constantes aléatoires

y i j

x i j

1 1 u j

C l a s s e j

M o y e n n e

Droites de régression avec constantes et pentes aléatoires

Fonction de la variance interindividuelle de la perception de soi scolaire

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

0 2 4 6 8 10 12 14

Temps (en nombre de mois)

Var

ian

ce i

nte

rin

div

idu

elle

de

la

per

cep

tio

n d

e so

i sc

ola

ire

Effet du soutien des camarades sur le sentiment de compétence scolaire

(Soutien faible = M – 1s ; soutien moyen = M ; soutien fort = M + 1s)

1

1,5

2

2,5

3

3,5

4

0 2 4 6 8 10 12

Temps

Sen

tim

ent

de

com

pét

ence

sco

lair

e

Soutien faible

Soutien moyen

Soutien fort