28
Introduction Cas de deux groupes Cas de plusieurs groupes ind´ ependants Tests d’´ egalit´ e des variances A. Jebrane Universit´ e de Bourgogne, Master 1 psychologie 5 octobre 2017 A. Jebrane Tests d’´ egalit´ e des variances

tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

  • Upload
    vankiet

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

Page 1: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Tests d’egalite des variances

A. Jebrane

Universite de Bourgogne, Master 1 psychologie

5 octobre 2017

A. Jebrane Tests d’egalite des variances

Page 2: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

MotivationContexte et conditions d’utilisationEstimateurs de la variance

Pourquoi comparer des variances ?

+ L’une des conditions a satisfaire pour effectuer un testparametrique, est l’egalite des variances des populations dontsont extraits les echantillons pour realiser son planexperimental.

+ On parle aussi de condition d’Homoscedasticite.

+ Les tests de comparaison des variances peuvent etre utilisesaussi pour comparer les variabilites sur differentes populations.Par exemple comparer les variations de temperatures dansdifferents points du globe.Comparer les dispersions de niveaux entre plusieurs groupesd’etudiants. les variations de salaires entre plusieurs pays,etc....

A. Jebrane Tests d’egalite des variances

Page 3: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

MotivationContexte et conditions d’utilisationEstimateurs de la variance

Contexte general

+ On considere une variable X definie sur plusieurs populationsP1, . . . ,Pk .

+ Notons par µ1, . . . , µk les moyennes (en general inconnues) deX sur ces populations.

+ Notons egalement par σ21, . . . , σ

2k les variances (inconnues) de

X sur ces populations.

+ La question posee est de savoir si ces variances sont toutesegales ou bien s’il y a au moins deux d’entre elles qui different.

A. Jebrane Tests d’egalite des variances

Page 4: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

MotivationContexte et conditions d’utilisationEstimateurs de la variance

Conditions

+ On suppose que la variable X est gaussienne sur chacune deces populations.

+ Cette condition est particulierement necessaire pour certainstests.

+ Les echantillons choisis dans ces populations doivent etreindependants.

A. Jebrane Tests d’egalite des variances

Page 5: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

MotivationContexte et conditions d’utilisationEstimateurs de la variance

Estimateurs

+ Si nous considerons une loi normale X ↪→ N (µ, σ), Les deuxestimateurs classiques de la variance σ2 sont :

la variance de l’echantillon

s2 =1

n

n∑i=1

(xi − x)2 =

∑x2i − n(x)2

n.

C’est un estimateur biaise de la variance : E(s2) = n−1n σ2.

La variance corrigee de l’echantillon

s2 =1

n − 1

n∑i=1

(xi − x)2 =

∑x2i − n(x)2

n − 1.

C’est un estimateur sans biais de la variance : E(s2) = σ2.

A. Jebrane Tests d’egalite des variances

Page 6: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Statistique du testExemple

Test de Fisher Snedecor : Deux groupes independants

+ On dispose des donnees numeriques d’une variable X pourdeux groupes independants G1 et G2 de tailles n1 et n2 issusde deux populations P1 et P2 de variances σ2

1 et σ22 inconnues.

+ Designons par S21 et S2

2 les variances des deux echantillons et

S12

et S22

les variances corrigees.

+ Les hypotheses du test sont

{H0 : σ2

1 = σ22

H1 : σ21 6= σ2

2

A. Jebrane Tests d’egalite des variances

Page 7: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Statistique du testExemple

Statistique du test

+ Si H1 est σ21 > σ2

2, alors la statistique du test F est le rapportentre les deux variances corrigees

F (n1 − 1, n2 − 1) =S1

2

S22

=n1(n2 − 1)

n2(n1 − 1

S21

S22

qui suit une loi de Fisher-Snedecor a (n1 − 1, n2 − 1) ddl

+ Si H1 est σ22 > σ2

1,

F (n2 − 1, n1 − 1) =S2

2

S12

=n2(n1 − 1)

n1(n2 − 1

S22

S21

qui suit une loi de Fisher-Snedecor a (n2 − 1, n1 − 1) ddl

A. Jebrane Tests d’egalite des variances

Page 8: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Statistique du testExemple

Statistique du test : suite

+ Si l’hypothese H1 est bilaterale, on utilisera la table desvaleurs limites de Fisher- Snedecor en prenant comme rapportF la plus grande variance corrigee sur la plus petite et on tientcompte de ce choix pour les degres de liberte.

A. Jebrane Tests d’egalite des variances

Page 9: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Statistique du testExemple

Exemple

+ Reprenons les donnees des 3 groupes

Groupe 1 12 15 14 16 22 17 25 9 18

Groupe 2 7 18 9 9 18 27 12 10 32 6 37

Groupe 3 10 13 13 15 17 10 10 15 4 24

+ Est ce que le groupe 2 est plus heterogene que le groupe 1 ?

A. Jebrane Tests d’egalite des variances

Page 10: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Statistique du testExemple

Exemple : suite

+ Les hypotheses du test sont

{H0 : σ2

1 = σ22

H1 : σ22 > σ2

1

+ Statistique : Les echantillons sont de tailes n1 = 9 et n2 = 11.La statistique est alors

F (10; 8) =S2

2

S12

avec (10; 8) ddl.

+ La valeur critique donnee par la table est Fα = 3.35.

A. Jebrane Tests d’egalite des variances

Page 11: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Statistique du testExemple

Exemple : fin

+ On a les resultats experimentaux suivants

groupe effectif moyenne S2 S2

Groupe 1 9 16,44 21,14 23,78

Groupe 2 11 16,82 104,51 114,96

Groupe 3 10 13,1 25,29 28,1

+ La valeur experimentale est

F exp =114.96

23.78= 4.835 > 3.35

+ Conclusion :il y a une difference significative entre lesvariances des deux groupes.

+ Remarque : les logiciels de statistiques indiqueront une p-valuep = 0.0176 < 0.05

A. Jebrane Tests d’egalite des variances

Page 12: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Plan equilibre ou non

+ Si tous les groupes sont de meme taille, on peut utiliser desstatistiques relativement simples qui sont :

Soit le test de Hartley .Soit le test de Cochran .

+ Si les groupes ne sont pas de meme taille, on doit utiliser lestest de Bartlett ou de Levene

A. Jebrane Tests d’egalite des variances

Page 13: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Cadre :Plan equilibre

+ On dispose des donnees de k groupes de taille n chacun.

+ On designe par S12, . . . Sk

2les variances corrigees de ces

groupes.

+ On designe par S2max = max(S1

2, · · · , Sk

2) la plus grande

variance corrigee de ces groupes.

+ On designe par S2min = min(S1

2, · · · , Sk

2) la plus petite

variance corrigee de ces groupes.

A. Jebrane Tests d’egalite des variances

Page 14: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Test de Hartley

+ La statistique du test consiste a prendre le rapport entre laplus grande variance corrigee et la plus petite :

Fmax =S2max

S2min

=max(S1

2, · · · , Sk

2)

min(S12, · · · , Sk

2)

+ La valeur experimentale de Fmax est a comparer au seuilcritique donne par la table de Hartley. On rejettera l’egalitedes variances si cette valeur experimentale est trop grande.

A. Jebrane Tests d’egalite des variances

Page 15: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Test du Cochran

+ Cette fois-ci la statistique du test consiste a prendre commerapport la plus grande variance divisee par la somme de toutesles variances.

C =S2max∑k

i=1 Si2

=max(S1

2, · · · , Sk

2)∑k

i=1 Si2

+ La valeur experimentale de C est a comparer au seuil critiqueCα donne par la table de Hartley. On rejettera l’egalite desvariances si cette valeur experimentale est trop grande.

A. Jebrane Tests d’egalite des variances

Page 16: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Tests a eviter

+ Remarque : les deux tests de Hartley et de Cochran sontpeu recommandes meme s’ils apparaissent tres simples autiliser. Il est recommande d’utiliser le test De Bartlettou de Levene

A. Jebrane Tests d’egalite des variances

Page 17: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Test de Bartlett : Cadre

+ On considere une variable statistique definie sur k populationsP1, . . . ,Pk de moyennes µ1, . . . , µk et de variances σ2

1, . . . , σ2k .

+ On suppose que la variable X est gaussienne sur chacune deces populations.

+ On souhaite comparer les variances des populations enutilisant k echantillons independants de tailles n1, . . . , nkchoisis dans ces populations. n = n1 + . . . nk est l’effectif totaldes k groupes.

+ Les hypotheses a tester sont alors{H0 : σ2

1 = σ22 = · · · = σ2

k

H1 : ∃i , j : σ2i 6= σ2

j

A. Jebrane Tests d’egalite des variances

Page 18: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Test de Bartlett : Statistique

+ On designe par S12, . . . Sk

2les variances corrigees de ces

groupes.

+ On note par S2intra ou CMintra la variance intra groupe des k

echantillons.

S2intra = CMintra =

∑ki=1(ni − 1)Si

2

n − k

=

∑ki=1 niSi

2

n − k

A. Jebrane Tests d’egalite des variances

Page 19: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Test de Bartlett : Statistique suite

+ Notons par Num et Den les deux expressions suivantes

Num = (n−k) ln(S2intra)−

((n1−1) ln(S1

2)+. . . (nk−1) ln(Sk

2))

= (n − k) ln(S2intra)−

( k∑i=1

(ni − 1) ln(Si2))

Den = 1 +1

3(k − 1)

( k∑i=1

1

ni − 1− 1

n − k

)+ La statistique du test est donnee par le rapport

Y =Num

Den

A. Jebrane Tests d’egalite des variances

Page 20: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Test de Bartlett : Statistique

+ Sous l’hypothese de normalite de la VD sur chacune de cespopulations, on demontre que sous l’hypothese H0 la variableY suit une loi du χ2 a k − 1 ddl.

+ On comparera alors la valeur experimentale de Y au seuilcritique yα donnee par la loi du χ2. On rejettera l’hypotheseH0 d’egalite des variances si cette valeur experimentale esttrop grande ( superieure au seuil crtique).

A. Jebrane Tests d’egalite des variances

Page 21: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Test de Bartlett : Exemple

+ Nous allons reprendre l’exemple pour les 5 groupes degouteurs dont on rappelle les statistiques descriptives.

G1 G2 G3 G4 G5 Tous les groupes

ni 9 8 7 10 8 42

s2i 3, 75 5, 8393 9, 3333 14 24, 2679 S2

intra = 11, 4257

A. Jebrane Tests d’egalite des variances

Page 22: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Test de Bartlett : Exemple suite

+ Dans notre exemple ,on obtient les calculs suivants :

(42− 5) ln(11, 426) = 90, 127,∑5

i=1(ni − 1) ln(s2i ) =

82, 05 =⇒ Num = 90.127− 82.05 = 7, 7236.

Den = 1 + 13×(5−1)

(1

9−1 + 18−1 + 1

7−1 + 110−1 + 1

8−1 −1

42−5

)=

1.055.On obtient Yexp = 7.7236

1.055 ≈ 7.32.La valeur critique donnee par la loi du χ2 a 5− 1 = 4 ddl esty0.05 = 9.488 qui est superieure a la valeur experimentale.

+ Conclusion : On retient H0. Nous decidons alors d’unedifference non significative entre les 5 variances.

+ Remarquons que la p-value donnee par un calculateur deprobailites est p = P[Y ≥ 7.32] = 0.1199.

A. Jebrane Tests d’egalite des variances

Page 23: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Test de Levene : Cadre

+ Le test de Levene est aussi utilise pour analyser l’hypothesed’homocedasticite relative a une variable statistique definie surplusieurs populations.

+ On part des memes notations que dans le cas du test deBartlett.

+ On doit disposer des donnees detaillees de tous les groupes.

A. Jebrane Tests d’egalite des variances

Page 24: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Test de Levene : Notations

+ Pour chaque groupe Gi avec i = 1, 2, · · · , k on designera parxi ,j la j eme observation avec j = 1, 2, · · · , ni .

+ Notons par Xi = mi la moyenne du groupe Gi

+ par Ei ,j l’ecart absolu de la j eme observation a la moyenne Xi ,

+ par Ei l’ecart absolu moyen du groupe Gi . soit

Eij = |xi ,j − Xi |; Ei =1

ni

ni∑i=1

Ei ,j .

+ Designons enfin par E la moyenne globale de tous les ecartsEi ,j , soit

E =1

n

k∑i=1

ni∑j=1

Ei ,j =1

n

k∑i=1

niEi .

A. Jebrane Tests d’egalite des variances

Page 25: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Test de Levene : Principe

+ Le principe du test de Levene part de l’idee suivante :Si les variances des groupes ne different pas significativement,c’est que les ecarts absolus moyens des differents groupes nedoivent pas differer significativement non plus.

+ D’ou l’idee de comparer les ecarts absolus moyens avec uneprocedure d’analyse de la variance.

+ La Variable dependante associe a chaque sujet, son ecartabsolu par rapport a la moyenne de son propre groupe.

A. Jebrane Tests d’egalite des variances

Page 26: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Statistique du test

+ La variation intergroupes est alors la variations entre les ecartsabsolus moyens des groupes

SCF =k∑

i=1

ni (Ei − E )2; ddl = k − 1.

+ La variation intragroupes est alors la somme des variationsentre les ecarts a l’interieur de chaque groupe

SCR =k∑

i=1

ni∑j=1

(Ei ,j − Ei )2; ddl = n − k.

A. Jebrane Tests d’egalite des variances

Page 27: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Test de Levene : statistique

+ La statistique de Levene est alors le rapport entre les variancesintergroupes et intragroupes

F (k − 1; n − k) =SCFk−1SCRn−k

=(n − k)

∑ki=1 ni (Ei − E )2

(k − 1)∑k

i=1

∑nij=1(Ei ,j − Ei )2

+ On utilisera alors la loi de Fisher-Snedecor pour prendre ladecision.

A. Jebrane Tests d’egalite des variances

Page 28: tests D'égalité Des Variances - Jebrane.perso.math.cnrs.frjebrane.perso.math.cnrs.fr/m1psy/Tests_ egalite_ variances.pdf · 1 est ˙2 1 >˙ 2 2, alors la statistique du test F est

IntroductionCas de deux groupes

Cas de plusieurs groupes independants

Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene

Test de Levene : Cadre

+ Merci pour votre attention

A. Jebrane Tests d’egalite des variances