Upload
vankiet
View
214
Download
0
Embed Size (px)
Citation preview
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Tests d’egalite des variances
A. Jebrane
Universite de Bourgogne, Master 1 psychologie
5 octobre 2017
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
MotivationContexte et conditions d’utilisationEstimateurs de la variance
Pourquoi comparer des variances ?
+ L’une des conditions a satisfaire pour effectuer un testparametrique, est l’egalite des variances des populations dontsont extraits les echantillons pour realiser son planexperimental.
+ On parle aussi de condition d’Homoscedasticite.
+ Les tests de comparaison des variances peuvent etre utilisesaussi pour comparer les variabilites sur differentes populations.Par exemple comparer les variations de temperatures dansdifferents points du globe.Comparer les dispersions de niveaux entre plusieurs groupesd’etudiants. les variations de salaires entre plusieurs pays,etc....
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
MotivationContexte et conditions d’utilisationEstimateurs de la variance
Contexte general
+ On considere une variable X definie sur plusieurs populationsP1, . . . ,Pk .
+ Notons par µ1, . . . , µk les moyennes (en general inconnues) deX sur ces populations.
+ Notons egalement par σ21, . . . , σ
2k les variances (inconnues) de
X sur ces populations.
+ La question posee est de savoir si ces variances sont toutesegales ou bien s’il y a au moins deux d’entre elles qui different.
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
MotivationContexte et conditions d’utilisationEstimateurs de la variance
Conditions
+ On suppose que la variable X est gaussienne sur chacune deces populations.
+ Cette condition est particulierement necessaire pour certainstests.
+ Les echantillons choisis dans ces populations doivent etreindependants.
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
MotivationContexte et conditions d’utilisationEstimateurs de la variance
Estimateurs
+ Si nous considerons une loi normale X ↪→ N (µ, σ), Les deuxestimateurs classiques de la variance σ2 sont :
la variance de l’echantillon
s2 =1
n
n∑i=1
(xi − x)2 =
∑x2i − n(x)2
n.
C’est un estimateur biaise de la variance : E(s2) = n−1n σ2.
La variance corrigee de l’echantillon
s2 =1
n − 1
n∑i=1
(xi − x)2 =
∑x2i − n(x)2
n − 1.
C’est un estimateur sans biais de la variance : E(s2) = σ2.
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Statistique du testExemple
Test de Fisher Snedecor : Deux groupes independants
+ On dispose des donnees numeriques d’une variable X pourdeux groupes independants G1 et G2 de tailles n1 et n2 issusde deux populations P1 et P2 de variances σ2
1 et σ22 inconnues.
+ Designons par S21 et S2
2 les variances des deux echantillons et
S12
et S22
les variances corrigees.
+ Les hypotheses du test sont
{H0 : σ2
1 = σ22
H1 : σ21 6= σ2
2
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Statistique du testExemple
Statistique du test
+ Si H1 est σ21 > σ2
2, alors la statistique du test F est le rapportentre les deux variances corrigees
F (n1 − 1, n2 − 1) =S1
2
S22
=n1(n2 − 1)
n2(n1 − 1
S21
S22
qui suit une loi de Fisher-Snedecor a (n1 − 1, n2 − 1) ddl
+ Si H1 est σ22 > σ2
1,
F (n2 − 1, n1 − 1) =S2
2
S12
=n2(n1 − 1)
n1(n2 − 1
S22
S21
qui suit une loi de Fisher-Snedecor a (n2 − 1, n1 − 1) ddl
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Statistique du testExemple
Statistique du test : suite
+ Si l’hypothese H1 est bilaterale, on utilisera la table desvaleurs limites de Fisher- Snedecor en prenant comme rapportF la plus grande variance corrigee sur la plus petite et on tientcompte de ce choix pour les degres de liberte.
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Statistique du testExemple
Exemple
+ Reprenons les donnees des 3 groupes
Groupe 1 12 15 14 16 22 17 25 9 18
Groupe 2 7 18 9 9 18 27 12 10 32 6 37
Groupe 3 10 13 13 15 17 10 10 15 4 24
+ Est ce que le groupe 2 est plus heterogene que le groupe 1 ?
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Statistique du testExemple
Exemple : suite
+ Les hypotheses du test sont
{H0 : σ2
1 = σ22
H1 : σ22 > σ2
1
+ Statistique : Les echantillons sont de tailes n1 = 9 et n2 = 11.La statistique est alors
F (10; 8) =S2
2
S12
avec (10; 8) ddl.
+ La valeur critique donnee par la table est Fα = 3.35.
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Statistique du testExemple
Exemple : fin
+ On a les resultats experimentaux suivants
groupe effectif moyenne S2 S2
Groupe 1 9 16,44 21,14 23,78
Groupe 2 11 16,82 104,51 114,96
Groupe 3 10 13,1 25,29 28,1
+ La valeur experimentale est
F exp =114.96
23.78= 4.835 > 3.35
+ Conclusion :il y a une difference significative entre lesvariances des deux groupes.
+ Remarque : les logiciels de statistiques indiqueront une p-valuep = 0.0176 < 0.05
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Plan equilibre ou non
+ Si tous les groupes sont de meme taille, on peut utiliser desstatistiques relativement simples qui sont :
Soit le test de Hartley .Soit le test de Cochran .
+ Si les groupes ne sont pas de meme taille, on doit utiliser lestest de Bartlett ou de Levene
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Cadre :Plan equilibre
+ On dispose des donnees de k groupes de taille n chacun.
+ On designe par S12, . . . Sk
2les variances corrigees de ces
groupes.
+ On designe par S2max = max(S1
2, · · · , Sk
2) la plus grande
variance corrigee de ces groupes.
+ On designe par S2min = min(S1
2, · · · , Sk
2) la plus petite
variance corrigee de ces groupes.
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Test de Hartley
+ La statistique du test consiste a prendre le rapport entre laplus grande variance corrigee et la plus petite :
Fmax =S2max
S2min
=max(S1
2, · · · , Sk
2)
min(S12, · · · , Sk
2)
+ La valeur experimentale de Fmax est a comparer au seuilcritique donne par la table de Hartley. On rejettera l’egalitedes variances si cette valeur experimentale est trop grande.
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Test du Cochran
+ Cette fois-ci la statistique du test consiste a prendre commerapport la plus grande variance divisee par la somme de toutesles variances.
C =S2max∑k
i=1 Si2
=max(S1
2, · · · , Sk
2)∑k
i=1 Si2
+ La valeur experimentale de C est a comparer au seuil critiqueCα donne par la table de Hartley. On rejettera l’egalite desvariances si cette valeur experimentale est trop grande.
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Tests a eviter
+ Remarque : les deux tests de Hartley et de Cochran sontpeu recommandes meme s’ils apparaissent tres simples autiliser. Il est recommande d’utiliser le test De Bartlettou de Levene
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Test de Bartlett : Cadre
+ On considere une variable statistique definie sur k populationsP1, . . . ,Pk de moyennes µ1, . . . , µk et de variances σ2
1, . . . , σ2k .
+ On suppose que la variable X est gaussienne sur chacune deces populations.
+ On souhaite comparer les variances des populations enutilisant k echantillons independants de tailles n1, . . . , nkchoisis dans ces populations. n = n1 + . . . nk est l’effectif totaldes k groupes.
+ Les hypotheses a tester sont alors{H0 : σ2
1 = σ22 = · · · = σ2
k
H1 : ∃i , j : σ2i 6= σ2
j
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Test de Bartlett : Statistique
+ On designe par S12, . . . Sk
2les variances corrigees de ces
groupes.
+ On note par S2intra ou CMintra la variance intra groupe des k
echantillons.
S2intra = CMintra =
∑ki=1(ni − 1)Si
2
n − k
=
∑ki=1 niSi
2
n − k
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Test de Bartlett : Statistique suite
+ Notons par Num et Den les deux expressions suivantes
Num = (n−k) ln(S2intra)−
((n1−1) ln(S1
2)+. . . (nk−1) ln(Sk
2))
= (n − k) ln(S2intra)−
( k∑i=1
(ni − 1) ln(Si2))
Den = 1 +1
3(k − 1)
( k∑i=1
1
ni − 1− 1
n − k
)+ La statistique du test est donnee par le rapport
Y =Num
Den
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Test de Bartlett : Statistique
+ Sous l’hypothese de normalite de la VD sur chacune de cespopulations, on demontre que sous l’hypothese H0 la variableY suit une loi du χ2 a k − 1 ddl.
+ On comparera alors la valeur experimentale de Y au seuilcritique yα donnee par la loi du χ2. On rejettera l’hypotheseH0 d’egalite des variances si cette valeur experimentale esttrop grande ( superieure au seuil crtique).
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Test de Bartlett : Exemple
+ Nous allons reprendre l’exemple pour les 5 groupes degouteurs dont on rappelle les statistiques descriptives.
G1 G2 G3 G4 G5 Tous les groupes
ni 9 8 7 10 8 42
s2i 3, 75 5, 8393 9, 3333 14 24, 2679 S2
intra = 11, 4257
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Test de Bartlett : Exemple suite
+ Dans notre exemple ,on obtient les calculs suivants :
(42− 5) ln(11, 426) = 90, 127,∑5
i=1(ni − 1) ln(s2i ) =
82, 05 =⇒ Num = 90.127− 82.05 = 7, 7236.
Den = 1 + 13×(5−1)
(1
9−1 + 18−1 + 1
7−1 + 110−1 + 1
8−1 −1
42−5
)=
1.055.On obtient Yexp = 7.7236
1.055 ≈ 7.32.La valeur critique donnee par la loi du χ2 a 5− 1 = 4 ddl esty0.05 = 9.488 qui est superieure a la valeur experimentale.
+ Conclusion : On retient H0. Nous decidons alors d’unedifference non significative entre les 5 variances.
+ Remarquons que la p-value donnee par un calculateur deprobailites est p = P[Y ≥ 7.32] = 0.1199.
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Test de Levene : Cadre
+ Le test de Levene est aussi utilise pour analyser l’hypothesed’homocedasticite relative a une variable statistique definie surplusieurs populations.
+ On part des memes notations que dans le cas du test deBartlett.
+ On doit disposer des donnees detaillees de tous les groupes.
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Test de Levene : Notations
+ Pour chaque groupe Gi avec i = 1, 2, · · · , k on designera parxi ,j la j eme observation avec j = 1, 2, · · · , ni .
+ Notons par Xi = mi la moyenne du groupe Gi
+ par Ei ,j l’ecart absolu de la j eme observation a la moyenne Xi ,
+ par Ei l’ecart absolu moyen du groupe Gi . soit
Eij = |xi ,j − Xi |; Ei =1
ni
ni∑i=1
Ei ,j .
+ Designons enfin par E la moyenne globale de tous les ecartsEi ,j , soit
E =1
n
k∑i=1
ni∑j=1
Ei ,j =1
n
k∑i=1
niEi .
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Test de Levene : Principe
+ Le principe du test de Levene part de l’idee suivante :Si les variances des groupes ne different pas significativement,c’est que les ecarts absolus moyens des differents groupes nedoivent pas differer significativement non plus.
+ D’ou l’idee de comparer les ecarts absolus moyens avec uneprocedure d’analyse de la variance.
+ La Variable dependante associe a chaque sujet, son ecartabsolu par rapport a la moyenne de son propre groupe.
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Statistique du test
+ La variation intergroupes est alors la variations entre les ecartsabsolus moyens des groupes
SCF =k∑
i=1
ni (Ei − E )2; ddl = k − 1.
+ La variation intragroupes est alors la somme des variationsentre les ecarts a l’interieur de chaque groupe
SCR =k∑
i=1
ni∑j=1
(Ei ,j − Ei )2; ddl = n − k.
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Test de Levene : statistique
+ La statistique de Levene est alors le rapport entre les variancesintergroupes et intragroupes
F (k − 1; n − k) =SCFk−1SCRn−k
=(n − k)
∑ki=1 ni (Ei − E )2
(k − 1)∑k
i=1
∑nij=1(Ei ,j − Ei )2
+ On utilisera alors la loi de Fisher-Snedecor pour prendre ladecision.
A. Jebrane Tests d’egalite des variances
IntroductionCas de deux groupes
Cas de plusieurs groupes independants
Plan equilibre : k groupes de taille n chacun.Test de BartlettTest de Levene
Test de Levene : Cadre
+ Merci pour votre attention
A. Jebrane Tests d’egalite des variances