Upload
madeline-miquel
View
113
Download
0
Embed Size (px)
Citation preview
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
1
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
2
Comparaisons multiples: plan factorielComparaisons multiples: plan factoriel• En présence
d’interaction, il faut comparer les moyennes entre les niveaux d’un facteur (ex: A) pour chaque niveau de l'autre facteur (ex: B)
• Ex: pour une ANOVA à 2 critères de classification. Chacun des facteurs a trois niveaux, donc 9 comparaisons possibles
Facteur B
FacteurA
Niveau1
Niveau2
Niveau3
Niveau 1
Niveau 2
Niveau 3
11X
21X 22X 23X
31X 32X 33X
12X 13X
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
3
Comparaisons multiples: plan factorielComparaisons multiples: plan factoriel
• S’il n’y a pas d'interaction significative, on compare les moyennes de chaque niveau d’un facteur (A) en regroupant les données de chaque niveau de l’autre facteur (B)
• Ex: comparer les moyennes de B regroupées au facteur A (3 comparaisons possibles).
Facteur B
FacteurA
Niveau1
Niveau2
Niveau3
Niveau 1
Niveau 2
Niveau 3
Moyennedes
colonnes
11X
21X
31X
22X
32X
12X
23X
33X
13X
1X 2X 3X
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
4
AA Aa aa
GENOTYPE
30
40
50
60
SU
RV
IVA
LAA Aa aa
GENOTYPE
30
40
50
60
SU
RV
IVA
L
ANOVA hiérarchique: effets du génotype sur ANOVA hiérarchique: effets du génotype sur la résistance à la déshydratation chez les la résistance à la déshydratation chez les mouches à fruitsmouches à fruits
• 3 génotypes (groupes, facteur fixe).
• 3 chambres par groupe (sous-groupes, facteur aléatoire).
• 5 larves par chambres, la survie (en heures) est la variable dépendante.
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
5
Test de signification de l'ANOVA à Test de signification de l'ANOVA à deux critères de classification: Modèle deux critères de classification: Modèle II, III, plan hiérarchiqueII, III, plan hiérarchique
• Tester CMsous-
groupes sur CMerreur
• tester CMgroupes
sur CMsous-groupes
• Note: Il n’y a que deux hypothèses à tester pour une ANOVA hiérarchique (versus trois pour le plan factoriel)
Tableau d’ANOVA
Effet SC dl CM F p
Total SCT dlT CMT
Facteur 1(sous-groupes)
SC1 dl1 CM1 CM1/ CME ?
Facteur2 (groupes)
SC2 dl2 CM2 CM2/ CM1 ?
Erreur SCE dlE CME
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
6
Test de signification de l'ANOVA à Test de signification de l'ANOVA à deux critères de classification: Modèle deux critères de classification: Modèle II, III, plan hiérarchiqueII, III, plan hiérarchique
Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F)
GENOTYPE 2 2952.220 1476.110 292.6081 0.0000000CHAMBER %in% GENOTYPE
6 40.655 6.776 1.3432 0.2638893Residuals 36 181.608 5.045
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
7
Comparaisons multiples: plan Comparaisons multiples: plan hiérarchiquehiérarchique
• Si on accepte H0sous-groupes, on compare les groupes en regroupant les sous-groupes
• Si on rejette H0sous-groupes, attention!
• Ex: si un facteur A (sous-groupes) n’est pas significatif, on compare les données regroupées (sous-groupes), les moyennes des groupes (3 comparaisons possibles).
Facteur B (groupes)
Facteur A(sous-groupes)
Niveau1
Niveau2
Niveau3
1
2
3
Moyenne dugroupe
11X
21X
31X
22X
32X
12X
23X
33X
13X
1X 2X 3X
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
8
Exemple: la croissance des plantes Exemple: la croissance des plantes avec différents traitements de avec différents traitements de fertilisationfertilisation
• Des gradients de température, d’humidité, de lumière, etc… sont instaurés dans une serre ou un champs. Cinq blocs sont créés, 4 parcelles pour chacun. On assigne à chacune des parcelles un fertilisant différent (1,2,3,4).
1 4 2 3
2 1 3 4
4 3 1 2
31 24
43 1 2
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
9
Exemple: la Exemple: la croissance des croissance des plantes avec différents plantes avec différents traitements de traitements de fertilisationfertilisation• H0: le taux de
croissance est le même pour tous les traitements
• rejeter H0: p(traitement) = .0007
• p(blocs) = .08, attention, c’est peut-être l’indication d’une certaine variabilité environnementale entre les champs.
Fertilisant
Bloc 1 2 3 4
1 7.0 5.3 4.9 8.82 9.9 5.7 7.6 8.93 8.5 4.7 5.5 8.14 5.1 3.5 2.8 3.35 10.3 7.7 8.4 9.1
Tableau d’ANOVA
Source devariabilité
SC dl CM F
Totale 99.35 19 5.23
Traitement 27.43 3 9.14 11.8
Blocs 62.65 4 15.66 3.92
Restes 9.28 12 0.77
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
10
Distinguer plans factoriels, Distinguer plans factoriels, hiérarchiques et avec blocs aléatoireshiérarchiques et avec blocs aléatoires
• Hiérarchique– 3 génotypes, chaque génotype est isolé dans une chambre
de croissance, 5 larves par chambre, 3 chambres par génotype (9 chambres, 45 mouches)
• Factoriel– 3 génotypes, 3 chambres, chaque génotype est testé dans
chaque chambre, 5 larves par combinaison chambre*génotype (3 chambres, 45 mouches)
• Bloc aléatoires– 3 génotypes, 15 chambres, chaque génotype est testé dans
chaque chambre, 1 larve par combinaison (15 chambres, 45 mouches)
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
11
Blocs aléatoires, alternative Blocs aléatoires, alternative non-paramétriquenon-paramétrique
• Si les données ne respectent pas les conditions d’application d’une ANOVA paramétrique, utiliser le test de Friedman.
• Pour un nombre de groupes (traitements) a et un nombre de blocs b, le test statistique est le suivant:
• Ri est la somme des rangs pour le groupe I, et le test statistique suit
environ la distribution du 2
Diète
1 2 3 4
r ii
a
ba aR b a2 2
1
121
3 1
( )
( )
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
12
Exemple: la Exemple: la croissance des croissance des plantes avec différents plantes avec différents traitements de traitements de fertilisationfertilisation• H0: Ri est identique pour
tous les traitements
• Alors, on rejette H0: p(traitement) = .008
Fertilisant
Bloc 1 2 3 4
1 7.0(3)
5.3(2)
4.9(1)
8.8(4)
2 9.9(4)
5.7(1)
7.6(2)
8.9(3)
3 8.5(4)
4.7(1)
5.5(2)
8.1(3)
4 5.1(4)
3.5(3)
2.8(1)
3.3(2)
5 10.3(4)
7.7(1)
8.4(2)
9.1(3)
Sommedes
rangs(Ri)
19 8 8 15
a b r 4 5 10 682, , .
. , , .05 4 52 7 8
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
13
ANOVA à critères ANOVA à critères multiplesmultiples
• En principe, les procédures de calculs d’une ANOVA à deux critères de classification peuvent s’appliquer pour une ANOVA à 3 facteurs ou plus. Ex: l’effet de l’espèce (facteur 1), la température (facteur 2) et du sexe sur le taux de respiration de crabes.
• Toutefois, en pratique, les résultats d’ANOVAs à plus de 2 facteurs sont difficiles à interpréter étant donné le nombre élevé d’hypothèses nulles.
Espèce 1ºT basse ºT élevéeM F M F
Espèce 2ºT basse ºT élevéeM F M F
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
14
ANOVA à trois critères de ANOVA à trois critères de classification de type I, plan factorielclassification de type I, plan factoriel
• Pour une ANOVA à trois critères de classification de type I, plan factoriel, on a 7 hypothèses nulles
• Tous les CM des effets sont testés sur CMerreur.
Tableau d'ANOVA
Effet SC dl CM F p
Totale SCT dlT CMT
Facteur 1 SC1 dl1 CM1 CM1/ CME ?
Facteur 2 SC2 dl2 CM2 CM2/CME
Facteur 3 SC3 dl3 CM3 CM3/ CME ?
1 X 2 SC1X2 dl1X2 CM1X2 CM1X2/ CME ?
1 X 3 SC1X3 dl1X3 CM1X3 CM1X3/ CME ?
2 X 3 SC2X3 dl2X3 CM2X3 CM2X3/ CME ?
1 X 2 X 3 SC1X2X3 dl1X2X3 CM1X2X3 CM1X2X3/ CME ?
Erreur SCE dlE CME
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
15
Nombre d’hypothèses que l’on peut Nombre d’hypothèses que l’on peut tester avec une ANOVA à critères tester avec une ANOVA à critères multiples, plan factorielmultiples, plan factoriel
• Quand le nombre de facteur augmente, le nombre d’hypohèses possibles augmente aussi
Nombre de facteurs
2 3 4 5
Facteurprincipal 2 3 4 5
Interactions 2 critères
1 3 6 10
Interactions3 critères
1 4 10
Interactions4 critères 1 5
Interactions5 critères
1
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
16
Problème 3 2004Problème 3 2004
• Certaines cellules cancéreuses survivent en conditions hypoxiques
• H: Surexpression de gène HIF1 et HIF2 sont nécessaires à survie des cellules cancéreuses
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
17
ExpérienceExpérience
• 4 lignées cellulaires– HIF 1+/2+ (normal forms of both genes); – HIF 1-/2+ (HIF1 silenced, HIF2 normal); – HIF 1+/2- (HIF1 normal, HIF2 silenced) – HIF 1-/2- (both HIF1 and HIF2 silenced)
• 10 cultures de chaque lignée sont cultivées en labo dans conditions normoxiques et hypoxiques, on mesure taux de croissance (r)
• Expérience répliquée dans 2 universités (Ottawa et McGill)
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
18
HIF1+/HIF2+ HIF1-/HIF2+ HIF1+/HIF2+ HIF1-/HIF2+
genotype
-0.5
0.0
-0.5
0.0
r
environment: hypoxic environment: normoxic
environment: hypoxic environment: normoxic
ottawa ottawa
mcgill mcgill
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
19
HIF1+/HIF2+ HIF1-/HIF2+ HIF1+/HIF2+ HIF1-/HIF2+
genotype
-0.1
0.2
-0.1
0.2
r
environment: hypoxic environment: normoxic
environment: hypoxic environment: normoxic
mcgill mcgill
ottawa ottawa
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39
20
Anova factorielle à 3 facteursAnova factorielle à 3 facteurs
Df Sum of Sq Mean Sq F Value Pr(F) environment 1 0.2473605 0.2473605 54.01562 0.0000000 genotype 3 0.0695620 0.0231873 5.06337 0.0023128 institution 1 0.0048912 0.0048912 1.06809 0.3031223 environment:genotype 3 0.0858673 0.0286224 6.25023 0.0005120 environment:institution 1 0.0147779 0.0147779 3.22702 0.0745434 genotype:institution 3 0.0145109 0.0048370 1.05624 0.3698023environment:genotype:institution 3 0.0283669 0.0094556 2.06481 0.1075434 Residuals 143 0.6548577 0.0045794
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
21
Test Levene sur résidusTest Levene sur résidus
mycode Residuals Sum of Squares 0.0523783 0.2125091Deg. of Freedom 15 143 Residual standard error: 0.03854968 Estimated effects may be unbalanced Df Sum of Sq Mean Sq F Value Pr(F) mycode 15 0.0523783 0.003491887 2.349734 0.004848747Residuals 143 0.2125091 0.001486078
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
22
Tests Levene, résidus de 2 Anovas à 2 Tests Levene, résidus de 2 Anovas à 2 facteursfacteurs
Call: aov(formula = absres ~ mycode, data = hypoxia.minus.aberrant, subset = institution == "mcgill", na.action
= na.exclude) Terms: mycode Residuals Sum of Squares 0.0178188 0.1528642Deg. of Freedom 7 71 Residual standard error: 0.04640061 Estimated effects may be unbalanced Df Sum of Sq Mean Sq F Value Pr(F) mycode 7 0.0178188 0.002545544 1.182315 0.3239774Residuals 71 0.1528642 0.002153016 *** Analysis of Variance Model *** Short Output:Call: aov(formula = absres ~ mycode, data = hypoxia.minus.aberrant, subset = institution == "ottawa", na.action
= na.exclude) Terms: mycode Residuals Sum of Squares 0.00444259 0.05964492Deg. of Freedom 7 72 Residual standard error: 0.02878197 Estimated effects are balanced Df Sum of Sq Mean Sq F Value Pr(F) mycode 7 0.00444259 0.0006346557 0.7661208 0.6174257Residuals 72 0.05964492 0.0008284016
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
23
Ottawa: Anova à 2 facteursOttawa: Anova à 2 facteurs
Df Sum of Sq Mean Sq F Value Pr(F) genotype 3 0.0569403 0.01898010 8.18834 0.00009216928 environment 1 0.0691029 0.06910285 29.81215 0.00000064337genotype:environment 3 0.0627419 0.02091397 9.02264 0.00003789527 Residuals 72 0.1668919 0.00231794
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
24
McGill: Anova à 2 facteursMcGill: Anova à 2 facteurs
Df Sum of Sq Mean Sq F Value Pr(F) genotype 3 0.0299865 0.0099955 1.45436 0.2343536 environment 1 0.1915967 0.1915967 27.87770 0.0000013genotype:environment 3 0.0500292 0.0166764 2.42645 0.0726023 Residuals 71 0.4879658 0.0068728 Sans la donnée possiblement aberrante Df Sum of Sq Mean Sq F Value Pr(F) genotype 3 0.014835 0.0049449 0.34729 0.7911993 environment 1 0.275524 0.2755242 19.35089 0.0000369genotype:environment 3 0.045543 0.0151811 1.06622 0.3689004 Residuals 72 1.025159 0.0142383
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
25
Ottawa: Comparaisons multiplesOttawa: Comparaisons multiples
Estimate Std.Error Lower Bound Upper Bound HIF1+/HIF2+-HIF1+/HIF2- 0.12200 0.0194 0.0674 0.1760 ****HIF1+/HIF2+-HIF1-/HIF2+ 0.12900 0.0194 0.0746 0.1830 ****HIF1+/HIF2+-HIF1-/HIF2- 0.12700 0.0194 0.0725 0.1810 ****HIF1+/HIF2--HIF1-/HIF2+ 0.00719 0.0194 -0.0470 0.0614 HIF1+/HIF2--HIF1-/HIF2- 0.00514 0.0194 -0.0491 0.0594 HIF1-/HIF2+-HIF1-/HIF2- -0.00205 0.0194 -0.0563 0.0522
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
26
Puissance et taille de l’effectif pour Puissance et taille de l’effectif pour l’ANOVA à deux critères de l’ANOVA à deux critères de classification de type Iclassification de type I
• La puissance maximale pour un effectif donné N est obtenue avec un plan équilibré (on a le même nombre d’observations dans chaque cellule).
Phosphore
Azote Témoin Bas Élevé
Témoin 2.8 3.0 3.3
Bas 3.6 3.8 4.0
Élevé 4.4 4.5 4.5
Les valeurs représentent les moyennesN = 5 champs, en tonnes/hectare
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
27
Power with G*PowerPower with G*PowerANOVA (Type I)ANOVA (Type I)
• metric of effect size : – f – f2
2
1
k
ii
kf
22
21p
error
Rf
R
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40
28
Questions critiques sur l’ANOVA à Questions critiques sur l’ANOVA à critères multiplescritères multiples
• Combien de facteurs?• Quel type (I, II, or III)?• Quel plan
– factoriel?– nested?– bloc?– À mesures répétées?– mixte?
• Réplication– équilibré/ non-équilibré?– Sans réplication?
• Paramétrique ou non-paramétrique?
• Les réponses à ces questions déterminent quelles hypothèses peuvent être testées et quel test est le plus approprié. Attention à vos réponses!