Upload
ozanne-mercier
View
103
Download
0
Embed Size (px)
Citation preview
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
1
ANOVA à critères multiplesANOVA à critères multiples
Définition et utilisation
Types d’ANOVA
Plan factoriel et hiérarchique
Modèle général d'une ANOVA à critères multiples
Test d’hypothèses et comparaisons multiples:
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
2
QuestionsQuestions
• Quel est le principe fondamental de l’ANOVA?• Quand utilise-t-on les comparaisons multiples?• Est-il possible de trouver des différences
significatives entre deux groupes mais que l'ANOVA ne détecte aucune différence? Pourquoi?
• Est-il possible que l’ANOVA détecte des différences entre les groupes mais que ces différences ne soit pas détectées par comparaisons multiples? Pourquoi?
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
3
Qu’est-ce qu'une ANOVA à critères Qu’est-ce qu'une ANOVA à critères multiples?multiples?
• C'est l'extension d'une ANOVA à un critère de classification. On regarde l'effet de plusieurs facteurs (au lieu de un) indépendants.
• Ex: une ANOVA à deux critères de classification permet de déterminer l'effet de l'addition d'azote (facteur 1) et de phosphore (facteur 2) sur la récolte de maïs.
• Contrairement à l'ANOVA à un critère de classification, on doit tester plusieurs H0
Phosphore
Azote Témoin Bas Élevé
Témoin 2.8 3.0 3.3
Bas 3.6 3.8 4.0
Élevé 4.4 4.5 4.5
Les valeurs représentent des moyennes
N = 5 champs, en tonnes/hectare.
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
4
Les avantages de l'ANOVA à plusieurs Les avantages de l'ANOVA à plusieurs critères de classificationcritères de classificationI: l'ajustement de I: l'ajustement de ee
• Une seule expérience est nécessaire afin de déterminer l'effet de plusieurs facteurs et ce, sans augmenter e
• Ex: avec un désign à un seul critère, on aurait besoin de trois expériences pour déterminer l'effet de l'azote; une pour chaque concentration de phosphore.
• La probabilité d'accepter H0 pour toutes les expériences est (.95)3 = .86, alors la probabilité de rejeter au moins une H0 qui est vraie est e = .14.
Phosphore
Azote Témoin Bas Élevé
Témoin 2.8 3.0 3.3
Bas 3.6 3.8 4.0
Élevé 4.4 4.5 4.5
Expérience 1
Expérience 2
Expérience 3
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
5
Les avantages de l'ANOVA à plusieurs Les avantages de l'ANOVA à plusieurs critères de classification critères de classification II: test des interactionsII: test des interactions
• Une seule expérience est nécessaire afin de déterminer si l'effet d'un facteur dépend d'un autre facteur
• Ex: l'ANOVA à un seul critère permet de déterminer l'effet de l'azote pour une certaine concentration de phosphore mais on ne peut déterminer si cet effet varie selon les différentes concentrations de phosphore
Phosphore
Azote Témoin Bas Élevé
Témoin 2.8 3.0 3.3
Bas 3.6 3.8 4.0
Élevé 4.4 4.5 4.5
Expérience 1
Expérience 2
Expérience 3
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
6
ANOVA à critères multiples de type I : effet de la ANOVA à critères multiples de type I : effet de la température et du pH sur la croissance des température et du pH sur la croissance des truitestruites
• Le pH et la température sont réglés par l'expérimentateur.
• La variable dépendante est le taux de croissance (), les facteurs sont la température et le pH.
• Comme les facteurs sont contrôlés, on peut estimer l'effet de l'accroissement d'une unité de température ou de pH sur
• et prédire pour d'autrestruites
Température (ºC)
16 20 24 280.00
0.04
0.08
0.12
0.16
0.20
Ta
ux
de
cro
iss
anc
e
(cm
/jou
r)pH = 6.5pH = 4.5
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
7
ANOVA à critères multiples type II: variation ANOVA à critères multiples type II: variation de la taille des de la taille des Norops townsendiNorops townsendi de de l'archipel de Cocosl'archipel de Cocos
• La variable dépendante est la distance entre les narines, les facteurs sont l'île (aléatoire) et l'altitude (aléatoire).
• Même si la taille est différente entre les îles ou l'altitude, on ne peut déterminer quel facteur est responsable de cette variabilité...
• … alors il est impossible de prédire la taille pour une autre île ou une autre altitude. Ile
Cocos Isla ManuelitaDis
tan
ce e
ntr
e le
s n
arin
es (
mm
)
35
40
45
50
55
60
MerMi-altitudePic le plus élevé
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
8
ANOVA à critères multiples Type III: ANOVA à critères multiples Type III: Variation géographique et des sexes chez Variation géographique et des sexes chez l'ours noirl'ours noir
• La variable dépendante est la taille, les facteurs sont le sexe (fixe) et la localité (aléatoire).
• Même si la masse varie entre les sites, on ne peut dire quel facteur est responsable de cette variabilité.
• Alors, on ne peut prédire la taille des ours de chaque sexe pour d'autres localités...
• …mais on peut prédire (peut-être) la différence entre les sexes.
Ma
ss
e (k
g)
120
160
200
240
280
RidingMountain
Kluane Algonquin
mâlesfemelles
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
9
Les facteurs fixes versus les facteurs Les facteurs fixes versus les facteurs aléatoires pour l'ANOVAaléatoires pour l'ANOVA
Facteur fixe Facteuraléatoire
Manipulation parl’expérimentateur?
Oui Non
Estimation de l’effet destraitements?
Oui Non
Prédiction? Oui Non Calcul de l’ANOVA à un
critère de classificationIdentique
Calcul de l’ANOVA àplusieurs critères declassification
Différent (très!)
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
10
Types d'ANOVA à plusieurs critères de Types d'ANOVA à plusieurs critères de classification I: plan factorielclassification I: plan factoriel
• Les niveaux de chacun des facteurs sont communs à tous les niveaux de tous les autres facteurs.
• Ex: effet de l'âge (facteur 1) et du sexe (facteur 2) sur la taille des lézards.
Sexe
Age Femelle Mâle
Juvénile
Adulte
Observation
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
11
Type II: plan hiérarchiqueType II: plan hiérarchique
• Un des facteurs est aléatoire, les autres peuvent être de type I ou II.
• Ex: effet de l'île (A, B) sur la taille des lézards. On a deux sites (aléatoire) pour chaque île.
Île
A B
Site 1 Site 2 Site 1 Site 2
Observation
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
12
Île
A B
Site 1 Site 2 Site 1 Site 2
Types d'ANOVA III: plan équilibré Types d'ANOVA III: plan équilibré versus plan non-équilibréversus plan non-équilibré
Observation ÉquilibréNon-équilibré
Île
A B
Site 1 Site 2 Site 1 Site 2
Île
A B
Site 1 Site 2 Site 1 Site 2
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
13
Types d'ANOVA IV: plan avec Types d'ANOVA IV: plan avec réplication versus sans réplicationréplication versus sans réplication
Mesures de température Sans réplicationAvec réplication
Season
Prof.(m)
Print. Été Automne
1
2
5
10
Saison
Prof.(m)
Print. Été Automne
1
2
5
10
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
14
Le choix d'un design/typeLe choix d'un design/type
• Type I, II ou III• Plan factoriel vs hiérarchique• Plan équilibré vs non-équilibré• Plan avec réplication vs sans réplication• Note: les calculs sont différents selon le plan
choisi, assurez vous de choisir le bon!
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
15
Modèle général d’une ANOVA Modèle général d’une ANOVA à critères multiplesà critères multiples
• Le modèle général d'une ANOVA à deux critères de classification:
• L ’ANOVA ajuste le modèle ci-dessus (par les moindres carrés) afin d'estimer i, j et ()ij
• H01: tous les i = 0
H02: tous les j = 0
H03: (ij = 0
• pour les effets aléatoires, remplacer i, j par Ai, Bj
• Pour une ANOVA à trois facteurs, le modèle est:
ijk i j
ij ijk
Y
( )ijkl i j
k ij ik
jk ijk ijkl
Y
( ) ( )
( ) ( )
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
16
Le modèle à deux facteurs: effets du Le modèle à deux facteurs: effets du sexe et de l’âge sur la taille des lézardssexe et de l’âge sur la taille des lézards
ijk i j ij ijkY ( )T
aill
e
Femelles, jeunes
Mâles, jeunes
Femelles, adultes
Mâles, adultes
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
17
Le modèle à deux facteurs: effets du Le modèle à deux facteurs: effets du sexe et de l’âge sur la taille des lézardssexe et de l’âge sur la taille des lézards
ijkY
Tai
lle
Femelles, adultesFemelles, jeunes
Mâles, jeunesMâles, adultes
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
18
Le modèle à deux facteurs: effets du Le modèle à deux facteurs: effets du sexe et de l’âge sur la taille des lézardssexe et de l’âge sur la taille des lézards
ijk iY T
aill
e
Femelles, jeunes
Mâles, jeunes
Femelles, adultes
Mâles, adultes
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
19
Le modèle à deux facteurs: effets du Le modèle à deux facteurs: effets du sexe et de l’âge sur la taille des lézardssexe et de l’âge sur la taille des lézards
ijk i jY T
aill
e
Femelles, jeunes
Mâles, jeunes
Femelles, adultes
Mâles, adultes
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
20
Le modèle à deux facteurs: effets du Le modèle à deux facteurs: effets du sexe et de l’âge sur la taille des lézardssexe et de l’âge sur la taille des lézards
ijk i j ijY ( )T
aill
e
Femelles, jeunes
Mâles, jeunes
Femelles, adultes
Mâles, adultes
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
21
Le modèle à deux facteurs: effets du Le modèle à deux facteurs: effets du sexe et de l’âge sur la taille des lézardssexe et de l’âge sur la taille des lézards
ijk i j ij ijkY ( )T
aill
e
Femelles, jeunes
Mâles, jeunes
Femelles, adultes
Mâles, adultes
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
22
Épreuves d'hypothèses en ANOVA à Épreuves d'hypothèses en ANOVA à critères multiplescritères multiples
• On procède de la même façon qu’avec l'ANOVA à un critère de classification: on répartit la somme des carrés totale en somme des carrés partielles associées à chacun des facteurs et aux interactions.
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
23
Tableau d'ANOVA à un critère de Tableau d'ANOVA à un critère de classificationclassification
Source devariabilité
Somme des carrés
CarréMoyen
Degrés deliberté
F
Totale
Erreur
n - 1
n - k
SC/dl
SC/dl
Groupes k - 1 SC/dlCMgroupes
CMerreur
i 1
k
ijj 1
n2(Y Y)
i
i ii
k
n Y Y( )
1
2
i 1
k
ij 1
n2(Y Yi)
i
j
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
24
Source devariabilité
Somme des carrés
Carrémoyen
Degrés de liberté
F
Totale
Erreur
abn- 1
ab(n-1)
A a - 1
b - 1B
(a-1)(b-1)
Y Yijkk
n
j
b
i
a
c h2
111
nb Y Yii
a
b g2
1
na Y Yjj
b
c h2
1
n Y Y Y Yij i jj
b
i
a
c h2
11
Y Yijk ijk
n
j
b
i
a
c h2
111
Interaction
CMA /CMESCA /dl
SCT /dl
SCB /dl
SCI /dl
CMB /CME
CMI /CME
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
25
Épreuves d'hypothèses en ANOVA Épreuves d'hypothèses en ANOVA factorielle à deux critères de factorielle à deux critères de classificationclassification
• H01: l'âge n'a aucun effet sur la taille: tous les i = 0
• H02: le sexe n'a aucun effet sur la taille: tous les j = 0
• H03: Les effet de l'âge et du sexe sont indépendants (pas d'interaction) : ()ij = 0
Sexe
Âge Mâle Femelle
Jeune
Adulteijk i j
ij ijk
Y
( )
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
26
Résultats possibles d'une ANOVA à Résultats possibles d'une ANOVA à deux critères de classificationdeux critères de classification
• Décision: accepter toutes les H0.
• Inférence: la taille n’est pas influencée par l'âge ou le sexe. T
aill
e
Jeune Adulte
Mâle
Femelle
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
27
Résultats possibles d'une ANOVA à Résultats possibles d'une ANOVA à deux critères de classificationdeux critères de classification
• Décision: rejeter H01, accepter les autres H0.
• Inférence: la taille des lézards dépend de l’âge mais n’est pas influencée par le sexe.
Tai
lle
Jeune Adulte
Mâle
Femelle
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
28
Résultats possibles d'une ANOVA à Résultats possibles d'une ANOVA à deux critères de classificationdeux critères de classification
• Décision: rejeter H02, accepter les autres H0.
• Inférence: la taille des lézards dépend du sexe mais pas de l'âge. T
aill
e
Jeune Adulte
Mâle
Femelle
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
29
Résultats possibles d’une ANOVA à Résultats possibles d’une ANOVA à deux critères de classificationdeux critères de classification
• Décision: rejeter toutes les H0.
• Inférence: taille des lézards est influencée par l’âge et le sexe, mais l’effet de l’âge varie d’un sexe à l’autre (ou l’effet du sexe varie selon l’âge).
Tai
lle
Jeune Adulte
Mâle
Femelle
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
30
Résultats possibles d’une ANOVA à Résultats possibles d’une ANOVA à deux critères de classificationdeux critères de classification
• Décision: rejeter H03, accepter les autres H0 .
• Inférence: il y a un effet du sexe, mais il dépend de l’âge (ou vice versa) T
aill
e
Jeune Adulte
Mâle
Femelle
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
31
Résultats possibles d’une ANOVA à Résultats possibles d’une ANOVA à deux critères de classificationdeux critères de classification
• Décision: rejeter H02 et H03, accepter H01
• Inférence: il y a un effet du sexe mais ça dépend de l’âge T
aill
e
Jeune Adulte
Mâle
Female
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
32
Résultats possibles d’une ANOVA à Résultats possibles d’une ANOVA à deux critères de classificationdeux critères de classification
• Aucun effet des facteurs• effet du sexe seulement• effet de l’âge seulement• effet du sexe et de l’âge, sans interaction• effet du sexe et de l’interaction, pas d’effet de l’âge• effet de l’âge et de l’interaction, pas d’effet du sexe• effet du sexe, de l’âge et de l’interaction• effet de l’interaction mais pas d’effet du sexe ou de
l’âge
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
33
Test de signification pour l’ANOVA à Test de signification pour l’ANOVA à deux critères de classification: Plan deux critères de classification: Plan factoriel, modèle Ifactoriel, modèle I
• test CMeffet sur CMerreur
• Comparer les valeurs de F aux valeurs critiques aux degrés de liberté correspondants
Tableau d’ANOVA
Effet SC dl CM F p
Total SCT dlT CMT
Facteur 1
SC1 dlf1 CM1 CM1/CME ?
Facteur2
SC2 dl2 CM2 CM2/ CME ?
1 X 2 SC1X2 dl1X2 CM1X2 CM1X2/ CME ?
Erreur SCE dlE CME
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
34
Test de signification pour l’ANOVA à Test de signification pour l’ANOVA à deux critères de classification: Plan deux critères de classification: Plan factoriel, modèle II, III factoriel, modèle II, III
• Tester CMinteraction
sur CMerreur
• Si on rejette H0interaction , tester CMeffet sur CMinteraction
Tableau d’ANOVA
Effet SC dl CM F p
Total SCT dlT CMT
Facteur 1
SC1 dl1 CM1 CM1/ CM1X2 ?
Facteur2
SC2 dl2 CM2 CM2/ CM1X2 ?
1 X 2 SC1X2 dl1X2 CM1X2 CM1X2/ CME ?
Erreur SCE dlE CME
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
35
Test de signification pour l’ANOVA à Test de signification pour l’ANOVA à deux critères de classification: Plan deux critères de classification: Plan factoriel, modèle II, IIIfactoriel, modèle II, III
• Tester CMinteraction
sur CMerreur
• Si H0interaction est acceptée, alors tester soit: (1) CMeffet sur CMinteraction ou (2) combiner CMerreur et CMinteraction afin d’obtenir CME
combiné, et augmenter le nombre de dl.
Tableau d’ANOVA
Effet SC dl CM F p
Total SCT dlT CMT
Facteur 1
SC1 dl1 CM1 CM1/ CME’ ?
Facteur2
SC2 dl2 CM2 CM2/ CME’ ?
1 X 2 SC1X2 dl1X2 CM1X2 CM1X2/ CME ?
Erreur SCE dlE CME
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
36
Note importanteNote importante
• En présence d’interaction, on peut remettre en question la pertinence de tester l’effet des facteurs principaux
• Cette décision dépend des hypothèses biologiques testées, PAS des résultats statistiques!
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
37
Exemple: effet du sexe et du site sur la Exemple: effet du sexe et du site sur la taille des esturgeonstaille des esturgeons
Note: Le test de F assume (incorrectement) une ANOVA de type I!
Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F) SEX 1 1745.36 1745.358 17.72204 0.0000405 LOCATION 1 8.78 8.778 0.08913 0.7656296SEX:LOCATION 1 48.69 48.692 0.49441 0.4828844 Residuals 178 17530.36 98.485
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
38
Comparaisons multiples: plan factorielComparaisons multiples: plan factoriel• En présence
d’interaction, il faut comparer les moyennes entre les niveaux d’un facteur (ex: A) pour chaque niveau de l'autre facteur (ex: B)
• Ex: pour une ANOVA à 2 critères de classification. Chacun des facteurs a trois niveaux, donc 9 comparaisons possibles
Facteur B
FacteurA
Niveau1
Niveau2
Niveau3
Niveau 1
Niveau 2
Niveau 3
11X
21X 22X 23X
31X 32X 33X
12X 13X
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
39
Comparaisons multiples: plan factorielComparaisons multiples: plan factoriel
• S’il n’y a pas d'interaction significative, on compare les moyennes de chaque niveau d’un facteur (A) en regroupant les données de chaque niveau de l’autre facteur (B)
• Ex: comparer les moyennes de B regroupées au facteur A (3 comparaisons possibles).
Facteur B
FacteurA
Niveau1
Niveau2
Niveau3
Niveau 1
Niveau 2
Niveau 3
Moyennedes
colonnes
11X
21X
31X
22X
32X
12X
23X
33X
13X
1X 2X 3X
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
40
AA Aa aa
GENOTYPE
30
40
50
60
SU
RV
IVA
LAA Aa aa
GENOTYPE
30
40
50
60
SU
RV
IVA
L
ANOVA hiérarchique: effets du génotype sur ANOVA hiérarchique: effets du génotype sur la résistance à la déshydratation chez les la résistance à la déshydratation chez les mouches à fruitsmouches à fruits
• 3 génotypes (groupes, facteur fixe).
• 3 chambres par groupe (sous-groupes, facteur aléatoire).
• 5 larves par chambres, la survie (en heures) est la variable dépendante.
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
41
Test de signification de l'ANOVA à Test de signification de l'ANOVA à deux critères de classification: Modèle deux critères de classification: Modèle II, III, plan hiérarchiqueII, III, plan hiérarchique
• Tester CMsous-
groupes sur CMerreur
• tester CMgroupes
sur CMsous-groupes
• Note: Il n’y a que deux hypothèses à tester pour une ANOVA hiérarchique (versus trois pour le plan factoriel)
Tableau d’ANOVA
Effet SC dl CM F p
Total SCT dlT CMT
Facteur 1(sous-groupes)
SC1 dl1 CM1 CM1/ CME ?
Facteur2 (groupes)
SC2 dl2 CM2 CM2/ CM1 ?
Erreur SCE dlE CME
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
42
Test de signification de l'ANOVA à Test de signification de l'ANOVA à deux critères de classification: Modèle deux critères de classification: Modèle II, III, plan hiérarchiqueII, III, plan hiérarchique
Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F)
GENOTYPE 2 2952.220 1476.110 292.6081 0.0000000CHAMBER %in% GENOTYPE
6 40.655 6.776 1.3432 0.2638893Residuals 36 181.608 5.045
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
43
Comparaisons multiples: plan Comparaisons multiples: plan hiérarchiquehiérarchique
• Si on accepte H0sous-groupes, on compare les groupes en regroupant les sous-groupes
• Si on rejette H0sous-groupes, attention!
• Ex: si un facteur A (sous-groupes) n’est pas significatif, on compare les données regroupées (sous-groupes), les moyennes des groupes (3 comparaisons possibles).
Facteur B (groupes)
Facteur A(sous-groupes)
Niveau1
Niveau2
Niveau3
1
2
3
Moyenne dugroupe
11X
21X
31X
22X
32X
12X
23X
33X
13X
1X 2X 3X
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
44
ANOVA sans réplicationANOVA sans réplication
• Chaque cellule n'a qu'une observation, il est impossible de calculer la CM ( CMerreur pour l'ANOVA avec réplication)
• Alors CMinteraction devient CMerreur
• Alors il n’y a aucune façon de tester la présence d’interaction: les inférences statistiques sont basées sur l’hypothèse qu’il n’y a pas d’interaction (ce qui peut ne pas être valide).
Observation
Season
Depth(m)
Spring Summer Fall
1
2
5
10
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
45
Test de signification d’une ANOVA à deux Test de signification d’une ANOVA à deux critères de classification: sans réplication, critères de classification: sans réplication, modèle I, plan factorielmodèle I, plan factoriel
• Tester CMeffet sur CMerreur...
• … mais, souvenez vous que toute inférence dépend et doit tenir compte de la condition de l’absence d’interaction!
Tableau d’ANOVA
Effet SC dl CM F p
Totale SCT dlT CMT
Facteur 1
SC1 dl1 CM1 CM1/CME ?
Facteur2
SC2 dl2 CM2 CM2/CME ?
Erreur SCE dlE CME
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
46
Test de signification d’une ANOVA à deux Test de signification d’une ANOVA à deux critères de classification: sans réplication, critères de classification: sans réplication, modèle II, plan factorielmodèle II, plan factoriel
• Tester CMeffet sur CMerreur
• Les inférences sont valides même s’il y a présence d’interaction.
Tableau d’ANOVA
Effet SC dl CM F p
Totale SCT dlT CMT
Facteur 1
SC1 dl1 CM1 CM1/CME ?
Facteur2
SC2 dl2 CM2 CM2/CME ?
Erreur SCE dlE CME
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
47
Test de signification d’une ANOVA à deux Test de signification d’une ANOVA à deux critères de classification: sans réplication, critères de classification: sans réplication, modèle III, plan factorielmodèle III, plan factoriel
• Tester CMeffet sur CMerreur
• Pour le facteur fixe, les inférences sont valides même s’il y a interaction
• Pour un facteur aléatoire, les inférences ne sont valides que s’il n’y a pas d’interaction.
Tableau d’ANOVA
Effet SC dl CM F p
Totale SCT dlT CMT
Facteur 1
SC1 dl1 CM1 CM1/CME ?
Facteur2
SC2 dl2 CM2 CM2/CME ?
Erreur SCE dlE CME
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
48
ANOVA à critères multiples, alternative ANOVA à critères multiples, alternative non-paramétriquenon-paramétrique
• Effet de la température (fixe) et du type de plant (fixe) sur la production primaire nette (gC m-2 j-1), 4 réplicats (parcelle) par traitements
• Calculer les rangs et procéder à une ANOVA à deux critères de classification de type I sur les rangs.
C3 C4
Temp. Taux Rang Taux Rang
20 ºC .75.63.81.79
61034
.61
.66
.58
.52
128.51516
28 ºC .55.59.66.62
14138.511
.76
.71
.84
.92
5721
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
49
Test de signification d’une ANOVA à Test de signification d’une ANOVA à deux critères de classification non-deux critères de classification non-paramétriqueparamétrique
• Tester H = SCeffet sur CMtotale
• Comparer H à la distribution du 2 avec le nombre de degrés de liberté correspondant.
Tableau d’ANOVA
Effet SC dl CM H p
Totale SCT dlT CMT
Facteur 1
SC1 dl1 CM1 SC1/ CMT ?
Facteur2
SC2 dl2 CM2 SC2/ CMT ?
1 X 2 SC1X2 dl1X2 CM1X2 SC1X2/ CMT ?
Erreur SCE dlE CME
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
50
Effet du sexe et du site sur le poids de Effet du sexe et du site sur le poids de l’esturgeonl’esturgeon
Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F) SEX 1 58393.6 58393.63 22.49791 0.0000042 LOCATION 1 1128.2 1128.21 0.43468 0.5105359SEX:LOCATION 1 1229.8 1229.82 0.47383 0.4921091 Residuals 182 472383.5 2595.51
Hsex = 58393.63/2881.27 = 20.3 (p = 6.620058e-006)
Hlocation = 1128.2/2881.27 = 0.39 (p = 0.5322994)
Hsex:location = 1229.8/2881.27 = 0.43 (p = 0.5119889)
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
51
ANOVA à critères multiples: plan à ANOVA à critères multiples: plan à blocs aléatoiresblocs aléatoires
• Pour les plans factoriels (entièrement aléatoire) chaque observation est indépendante des autres.
• Dans certains plans (plan à blocs aléatoires), une observation pour un traitement est reliée d’une certaine façon à une observation des autres traitements.
• L’ensemble des observations reliées constitue un “bloc”.
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
52
Plans entièrement aléatoire Plans entièrement aléatoire versus blocs aléatoiresversus blocs aléatoires
• On choisit au hasard, un porcelet d’une portée de chacune des 20 truies. On assigne à ces porcelets une diète spéciale.
• Les observations recueillies sont entièrement aléatoires et le modèle que l’on devrait choisir serait l’ANOVA à un critère de classification de type I.
Diet
1 2 3 4
Diète
1 2 3 4
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
53
Plans entiérement aléatoire Plans entiérement aléatoire versus blocs aléatoiresversus blocs aléatoires
• Pour chaque truie, on choisit 4 porcelets au hasard. Chaque porcelet est assigné aléatoirement à une des 4 diètes spéciales.
• Comme les 4 porcelets d’une même portée sont reliés, ils constituent un bloc et le plan approprié serait une ANOVA à deux critères de classification de type III (diète, fixe), portée (blocs, aléatoire).
Diète
1 2 3 4
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
54
Blocs aléatoires: ANOVA à deux critères de Blocs aléatoires: ANOVA à deux critères de classification de type IIIclassification de type III
• Le plan à deux facteurs et blocs aléatoires se calcule comme une ANOVA à deux critères de classification de type III sans réplication. Le facteur 1 (fixe) et le facteur 2 (blocs) est toujours aléatoire.
Tableau d’ANOVA
Effet SC dl CM F p
Totale SCT dlT CMT
Facteur 1 SC1 dl1 CM1 CM1/CME ?
Facteur 2(blocs)
SC2 dl2 CM2 CM2/CME ?
Restes SCR dlR CMR
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
55
Exemple: la croissance des plantes Exemple: la croissance des plantes avec différents traitements de avec différents traitements de fertilisationfertilisation
• Des gradients de température, d’humidité, de lumière, etc… sont instaurés dans une serre ou un champs. Cinq blocs sont créés, 4 parcelles pour chacun. On assigne à chacune des parcelles un fertilisant différent (1,2,3,4).
1 4 2 3
2 1 3 4
4 3 1 2
31 24
43 1 2
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
56
Exemple: la Exemple: la croissance des croissance des plantes avec différents plantes avec différents traitements de traitements de fertilisationfertilisation• H0: le taux de
croissance est le même pour tous les traitements
• rejeter H0: p(traitement) = .0007
• p(blocs) = .08, attention, c’est peut-être l’indication d’une certaine variabilité environnementale entre les champs.
Fertilisant
Bloc 1 2 3 4
1 7.0 5.3 4.9 8.82 9.9 5.7 7.6 8.93 8.5 4.7 5.5 8.14 5.1 3.5 2.8 3.35 10.3 7.7 8.4 9.1
Tableau d’ANOVA
Source devariabilité
SC dl CM F
Totale 99.35 19 5.23
Traitement 27.43 3 9.14 11.8
Blocs 62.65 4 15.66 3.92
Restes 9.28 12 0.77
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
57
Blocs aléatoires, alternative Blocs aléatoires, alternative non-paramétriquenon-paramétrique
• Si les données ne respectent pas les conditions d’application d’une ANOVA paramétrique, utiliser le test de Friedman.
• Pour un nombre de groupes (traitements) a et un nombre de blocs b, le test statistique est le suivant:
• Ri est la somme des rangs pour le groupe I, et le test statistique suit
environ la distribution du 2
Diète
1 2 3 4
r ii
a
ba aR b a2 2
1
121
3 1
( )
( )
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
58
Exemple: la Exemple: la croissance des croissance des plantes avec différents plantes avec différents traitements de traitements de fertilisationfertilisation• H0: Ri est identique pour
tous les traitements
• Alors, on rejette H0: p(traitement) = .008
Fertilisant
Bloc 1 2 3 4
1 7.0(3)
5.3(2)
4.9(1)
8.8(4)
2 9.9(4)
5.7(1)
7.6(2)
8.9(3)
3 8.5(4)
4.7(1)
5.5(2)
8.1(3)
4 5.1(4)
3.5(3)
2.8(1)
3.3(2)
5 10.3(4)
7.7(1)
8.4(2)
9.1(3)
Sommedes
rangs(Ri)
19 8 8 15
a b r 4 5 10 682, , .
. , , .05 4 52 7 8
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
59
Puissance et taille de l’effectif pour Puissance et taille de l’effectif pour l’ANOVA à deux critères de l’ANOVA à deux critères de classification de type Iclassification de type I
• La puissance maximale pour un effectif donné N est obtenue avec un plan équilibré (on a le même nombre d’observations dans chaque cellule).
Phosphore
Azote Témoin Bas Élevé
Témoin 2.8 3.0 3.3
Bas 3.6 3.8 4.0
Élevé 4.4 4.5 4.5
Les valeurs représentent les moyennesN = 5 champs, en tonnes/hectare
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
60
Power with G*PowerPower with G*PowerANOVA (Type I)ANOVA (Type I)
• metric of effect size : – f – f2
2
1
k
ii
kf
22
21p
error
Rf
R
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
61
ANOVA à critères ANOVA à critères multiplesmultiples
• En principe, les procédures de calculs d’une ANOVA à deux critères de classification peuvent s’appliquer pour une ANOVA à 3 facteurs ou plus. Ex: l’effet de l’espèce (facteur 1), la température (facteur 2) et du sexe sur le taux de respiration de crabes.
• Toutefois, en pratique, les résultats d’ANOVAs à plus de 2 facteurs sont difficiles à interpréter étant donné le nombre élevé d’hypothèses nulles.
Espèce 1ºT basse ºT élevéeM F M F
Espèce 2ºT basse ºT élevéeM F M F
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
62
ANOVA à trois critères de ANOVA à trois critères de classification de type I, plan factorielclassification de type I, plan factoriel
• Pour une ANOVA à trois critères de classification de type I, plan factoriel, on a 7 hypothèses nulles
• Tous les CM des effets sont testés sur CMerreur.
Tableau d'ANOVA
Effet SC dl CM F p
Totale SCT dlT CMT
Facteur 1 SC1 dl1 CM1 CM1/ CME ?
Facteur 2 SC2 dl2 CM2 CM2/CME
Facteur 3 SC3 dl3 CM3 CM3/ CME ?
1 X 2 SC1X2 dl1X2 CM1X2 CM1X2/ CME ?
1 X 3 SC1X3 dl1X3 CM1X3 CM1X3/ CME ?
2 X 3 SC2X3 dl2X3 CM2X3 CM2X3/ CME ?
1 X 2 X 3 SC1X2X3 dl1X2X3 CM1X2X3 CM1X2X3/ CME ?
Erreur SCE dlE CME
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
63
Nombre d’hypothèses que l’on peut Nombre d’hypothèses que l’on peut tester avec une ANOVA à critères tester avec une ANOVA à critères multiples, plan factorielmultiples, plan factoriel
• Quand le nombre de facteur augmente, le nombre d’hypohèses possibles augmente aussi
Nombre de facteurs
2 3 4 5
Facteurprincipal 2 3 4 5
Interactions 2 critères
1 3 6 10
Interactions3 critères
1 4 10
Interactions4 critères 1 5
Interactions5 critères
1
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
64
Questions critiques sur l’ANOVA à Questions critiques sur l’ANOVA à critères multiplescritères multiples
• Combien de facteurs?• Quel type (I, II, or III)?• Quel plan
– factoriel?– nested?– bloc?– À mesures répétées?– mixte?
• Réplication– équilibré/ non-équilibré?– Sans réplication?
• Paramétrique ou non-paramétrique?
• Les réponses à ces questions déterminent quelles hypothèses peuvent être testées et quel test est le plus approprié. Attention à vos réponses!