28
Université d’Ottawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 22-06-26 15:21 1

Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Embed Size (px)

Citation preview

Page 1: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

1

Page 2: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

2

Comparaisons multiples: plan factorielComparaisons multiples: plan factoriel• En présence

d’interaction, il faut comparer les moyennes entre les niveaux d’un facteur (ex: A) pour chaque niveau de l'autre facteur (ex: B)

• Ex: pour une ANOVA à 2 critères de classification. Chacun des facteurs a trois niveaux, donc 9 comparaisons possibles

Facteur B

FacteurA

Niveau1

Niveau2

Niveau3

Niveau 1

Niveau 2

Niveau 3

11X

21X 22X 23X

31X 32X 33X

12X 13X

Page 3: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

3

Comparaisons multiples: plan factorielComparaisons multiples: plan factoriel

• S’il n’y a pas d'interaction significative, on compare les moyennes de chaque niveau d’un facteur (A) en regroupant les données de chaque niveau de l’autre facteur (B)

• Ex: comparer les moyennes de B regroupées au facteur A (3 comparaisons possibles).

Facteur B

FacteurA

Niveau1

Niveau2

Niveau3

Niveau 1

Niveau 2

Niveau 3

Moyennedes

colonnes

11X

21X

31X

22X

32X

12X

23X

33X

13X

1X 2X 3X

Page 4: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

4

AA Aa aa

GENOTYPE

30

40

50

60

SU

RV

IVA

LAA Aa aa

GENOTYPE

30

40

50

60

SU

RV

IVA

L

ANOVA hiérarchique: effets du génotype sur ANOVA hiérarchique: effets du génotype sur la résistance à la déshydratation chez les la résistance à la déshydratation chez les mouches à fruitsmouches à fruits

• 3 génotypes (groupes, facteur fixe).

• 3 chambres par groupe (sous-groupes, facteur aléatoire).

• 5 larves par chambres, la survie (en heures) est la variable dépendante.

Page 5: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

5

Test de signification de l'ANOVA à Test de signification de l'ANOVA à deux critères de classification: Modèle deux critères de classification: Modèle II, III, plan hiérarchiqueII, III, plan hiérarchique

• Tester CMsous-

groupes sur CMerreur

• tester CMgroupes

sur CMsous-groupes

• Note: Il n’y a que deux hypothèses à tester pour une ANOVA hiérarchique (versus trois pour le plan factoriel)

Tableau d’ANOVA

Effet SC dl CM F p

Total SCT dlT CMT

Facteur 1(sous-groupes)

SC1 dl1 CM1 CM1/ CME ?

Facteur2 (groupes)

SC2 dl2 CM2 CM2/ CM1 ?

Erreur SCE dlE CME

Page 6: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

6

Test de signification de l'ANOVA à Test de signification de l'ANOVA à deux critères de classification: Modèle deux critères de classification: Modèle II, III, plan hiérarchiqueII, III, plan hiérarchique

Type III Sum of Squares Df Sum of Sq Mean Sq F Value Pr(F)

GENOTYPE 2 2952.220 1476.110 292.6081 0.0000000CHAMBER %in% GENOTYPE

6 40.655 6.776 1.3432 0.2638893Residuals 36 181.608 5.045

Page 7: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

7

Comparaisons multiples: plan Comparaisons multiples: plan hiérarchiquehiérarchique

• Si on accepte H0sous-groupes, on compare les groupes en regroupant les sous-groupes

• Si on rejette H0sous-groupes, attention!

• Ex: si un facteur A (sous-groupes) n’est pas significatif, on compare les données regroupées (sous-groupes), les moyennes des groupes (3 comparaisons possibles).

Facteur B (groupes)

Facteur A(sous-groupes)

Niveau1

Niveau2

Niveau3

1

2

3

Moyenne dugroupe

11X

21X

31X

22X

32X

12X

23X

33X

13X

1X 2X 3X

Page 8: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

8

Exemple: la croissance des plantes Exemple: la croissance des plantes avec différents traitements de avec différents traitements de fertilisationfertilisation

• Des gradients de température, d’humidité, de lumière, etc… sont instaurés dans une serre ou un champs. Cinq blocs sont créés, 4 parcelles pour chacun. On assigne à chacune des parcelles un fertilisant différent (1,2,3,4).

1 4 2 3

2 1 3 4

4 3 1 2

31 24

43 1 2

Page 9: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

9

Exemple: la Exemple: la croissance des croissance des plantes avec différents plantes avec différents traitements de traitements de fertilisationfertilisation• H0: le taux de

croissance est le même pour tous les traitements

• rejeter H0: p(traitement) = .0007

• p(blocs) = .08, attention, c’est peut-être l’indication d’une certaine variabilité environnementale entre les champs.

Fertilisant

Bloc 1 2 3 4

1 7.0 5.3 4.9 8.82 9.9 5.7 7.6 8.93 8.5 4.7 5.5 8.14 5.1 3.5 2.8 3.35 10.3 7.7 8.4 9.1

Tableau d’ANOVA

Source devariabilité

SC dl CM F

Totale 99.35 19 5.23

Traitement 27.43 3 9.14 11.8

Blocs 62.65 4 15.66 3.92

Restes 9.28 12 0.77

Page 10: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

10

Distinguer plans factoriels, Distinguer plans factoriels, hiérarchiques et avec blocs aléatoireshiérarchiques et avec blocs aléatoires

• Hiérarchique– 3 génotypes, chaque génotype est isolé dans une chambre

de croissance, 5 larves par chambre, 3 chambres par génotype (9 chambres, 45 mouches)

• Factoriel– 3 génotypes, 3 chambres, chaque génotype est testé dans

chaque chambre, 5 larves par combinaison chambre*génotype (3 chambres, 45 mouches)

• Bloc aléatoires– 3 génotypes, 15 chambres, chaque génotype est testé dans

chaque chambre, 1 larve par combinaison (15 chambres, 45 mouches)

Page 11: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

11

Blocs aléatoires, alternative Blocs aléatoires, alternative non-paramétriquenon-paramétrique

• Si les données ne respectent pas les conditions d’application d’une ANOVA paramétrique, utiliser le test de Friedman.

• Pour un nombre de groupes (traitements) a et un nombre de blocs b, le test statistique est le suivant:

• Ri est la somme des rangs pour le groupe I, et le test statistique suit

environ la distribution du 2

Diète

1 2 3 4

r ii

a

ba aR b a2 2

1

121

3 1

( )

( )

Page 12: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

12

Exemple: la Exemple: la croissance des croissance des plantes avec différents plantes avec différents traitements de traitements de fertilisationfertilisation• H0: Ri est identique pour

tous les traitements

• Alors, on rejette H0: p(traitement) = .008

Fertilisant

Bloc 1 2 3 4

1 7.0(3)

5.3(2)

4.9(1)

8.8(4)

2 9.9(4)

5.7(1)

7.6(2)

8.9(3)

3 8.5(4)

4.7(1)

5.5(2)

8.1(3)

4 5.1(4)

3.5(3)

2.8(1)

3.3(2)

5 10.3(4)

7.7(1)

8.4(2)

9.1(3)

Sommedes

rangs(Ri)

19 8 8 15

a b r 4 5 10 682, , .

. , , .05 4 52 7 8

Page 13: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

13

ANOVA à critères ANOVA à critères multiplesmultiples

• En principe, les procédures de calculs d’une ANOVA à deux critères de classification peuvent s’appliquer pour une ANOVA à 3 facteurs ou plus. Ex: l’effet de l’espèce (facteur 1), la température (facteur 2) et du sexe sur le taux de respiration de crabes.

• Toutefois, en pratique, les résultats d’ANOVAs à plus de 2 facteurs sont difficiles à interpréter étant donné le nombre élevé d’hypothèses nulles.

Espèce 1ºT basse ºT élevéeM F M F

Espèce 2ºT basse ºT élevéeM F M F

Page 14: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

14

ANOVA à trois critères de ANOVA à trois critères de classification de type I, plan factorielclassification de type I, plan factoriel

• Pour une ANOVA à trois critères de classification de type I, plan factoriel, on a 7 hypothèses nulles

• Tous les CM des effets sont testés sur CMerreur.

Tableau d'ANOVA

Effet SC dl CM F p

Totale SCT dlT CMT

Facteur 1 SC1 dl1 CM1 CM1/ CME ?

Facteur 2 SC2 dl2 CM2 CM2/CME

Facteur 3 SC3 dl3 CM3 CM3/ CME ?

1 X 2 SC1X2 dl1X2 CM1X2 CM1X2/ CME ?

1 X 3 SC1X3 dl1X3 CM1X3 CM1X3/ CME ?

2 X 3 SC2X3 dl2X3 CM2X3 CM2X3/ CME ?

1 X 2 X 3 SC1X2X3 dl1X2X3 CM1X2X3 CM1X2X3/ CME ?

Erreur SCE dlE CME

Page 15: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

15

Nombre d’hypothèses que l’on peut Nombre d’hypothèses que l’on peut tester avec une ANOVA à critères tester avec une ANOVA à critères multiples, plan factorielmultiples, plan factoriel

• Quand le nombre de facteur augmente, le nombre d’hypohèses possibles augmente aussi

Nombre de facteurs

2 3 4 5

Facteurprincipal 2 3 4 5

Interactions 2 critères

1 3 6 10

Interactions3 critères

1 4 10

Interactions4 critères 1 5

Interactions5 critères

1

Page 16: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

16

Problème 3 2004Problème 3 2004

• Certaines cellules cancéreuses survivent en conditions hypoxiques

• H: Surexpression de gène HIF1 et HIF2 sont nécessaires à survie des cellules cancéreuses

Page 17: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

17

ExpérienceExpérience

• 4 lignées cellulaires– HIF 1+/2+ (normal forms of both genes); – HIF 1-/2+ (HIF1 silenced, HIF2 normal); – HIF 1+/2- (HIF1 normal, HIF2 silenced) – HIF 1-/2- (both HIF1 and HIF2 silenced)

• 10 cultures de chaque lignée sont cultivées en labo dans conditions normoxiques et hypoxiques, on mesure taux de croissance (r)

• Expérience répliquée dans 2 universités (Ottawa et McGill)

Page 18: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

18

HIF1+/HIF2+ HIF1-/HIF2+ HIF1+/HIF2+ HIF1-/HIF2+

genotype

-0.5

0.0

-0.5

0.0

r

environment: hypoxic environment: normoxic

environment: hypoxic environment: normoxic

ottawa ottawa

mcgill mcgill

Page 19: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

19

HIF1+/HIF2+ HIF1-/HIF2+ HIF1+/HIF2+ HIF1-/HIF2+

genotype

-0.1

0.2

-0.1

0.2

r

environment: hypoxic environment: normoxic

environment: hypoxic environment: normoxic

mcgill mcgill

ottawa ottawa

Page 20: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:39

20

Anova factorielle à 3 facteursAnova factorielle à 3 facteurs

Df Sum of Sq Mean Sq F Value Pr(F) environment 1 0.2473605 0.2473605 54.01562 0.0000000 genotype 3 0.0695620 0.0231873 5.06337 0.0023128 institution 1 0.0048912 0.0048912 1.06809 0.3031223 environment:genotype 3 0.0858673 0.0286224 6.25023 0.0005120 environment:institution 1 0.0147779 0.0147779 3.22702 0.0745434 genotype:institution 3 0.0145109 0.0048370 1.05624 0.3698023environment:genotype:institution 3 0.0283669 0.0094556 2.06481 0.1075434 Residuals 143 0.6548577 0.0045794

Page 21: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40

21

Test Levene sur résidusTest Levene sur résidus

mycode Residuals Sum of Squares 0.0523783 0.2125091Deg. of Freedom 15 143 Residual standard error: 0.03854968 Estimated effects may be unbalanced  Df Sum of Sq Mean Sq F Value Pr(F) mycode 15 0.0523783 0.003491887 2.349734 0.004848747Residuals 143 0.2125091 0.001486078

Page 22: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40

22

Tests Levene, résidus de 2 Anovas à 2 Tests Levene, résidus de 2 Anovas à 2 facteursfacteurs

Call: aov(formula = absres ~ mycode, data = hypoxia.minus.aberrant, subset = institution == "mcgill", na.action

= na.exclude) Terms: mycode Residuals Sum of Squares 0.0178188 0.1528642Deg. of Freedom 7 71 Residual standard error: 0.04640061 Estimated effects may be unbalanced  Df Sum of Sq Mean Sq F Value Pr(F) mycode 7 0.0178188 0.002545544 1.182315 0.3239774Residuals 71 0.1528642 0.002153016  *** Analysis of Variance Model *** Short Output:Call: aov(formula = absres ~ mycode, data = hypoxia.minus.aberrant, subset = institution == "ottawa", na.action

= na.exclude) Terms: mycode Residuals Sum of Squares 0.00444259 0.05964492Deg. of Freedom 7 72 Residual standard error: 0.02878197 Estimated effects are balanced  Df Sum of Sq Mean Sq F Value Pr(F) mycode 7 0.00444259 0.0006346557 0.7661208 0.6174257Residuals 72 0.05964492 0.0008284016

Page 23: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40

23

Ottawa: Anova à 2 facteursOttawa: Anova à 2 facteurs

Df Sum of Sq Mean Sq F Value Pr(F) genotype 3 0.0569403 0.01898010 8.18834 0.00009216928 environment 1 0.0691029 0.06910285 29.81215 0.00000064337genotype:environment 3 0.0627419 0.02091397 9.02264 0.00003789527 Residuals 72 0.1668919 0.00231794  

Page 24: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40

24

McGill: Anova à 2 facteursMcGill: Anova à 2 facteurs

Df Sum of Sq Mean Sq F Value Pr(F) genotype 3 0.0299865 0.0099955 1.45436 0.2343536 environment 1 0.1915967 0.1915967 27.87770 0.0000013genotype:environment 3 0.0500292 0.0166764 2.42645 0.0726023 Residuals 71 0.4879658 0.0068728  Sans la donnée possiblement aberrante Df Sum of Sq Mean Sq F Value Pr(F) genotype 3 0.014835 0.0049449 0.34729 0.7911993 environment 1 0.275524 0.2755242 19.35089 0.0000369genotype:environment 3 0.045543 0.0151811 1.06622 0.3689004 Residuals 72 1.025159 0.0142383

Page 25: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40

25

Ottawa: Comparaisons multiplesOttawa: Comparaisons multiples

Estimate Std.Error Lower Bound Upper Bound HIF1+/HIF2+-HIF1+/HIF2- 0.12200 0.0194 0.0674 0.1760 ****HIF1+/HIF2+-HIF1-/HIF2+ 0.12900 0.0194 0.0746 0.1830 ****HIF1+/HIF2+-HIF1-/HIF2- 0.12700 0.0194 0.0725 0.1810 ****HIF1+/HIF2--HIF1-/HIF2+ 0.00719 0.0194 -0.0470 0.0614 HIF1+/HIF2--HIF1-/HIF2- 0.00514 0.0194 -0.0491 0.0594 HIF1-/HIF2+-HIF1-/HIF2- -0.00205 0.0194 -0.0563 0.0522

Page 26: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40

26

Puissance et taille de l’effectif pour Puissance et taille de l’effectif pour l’ANOVA à deux critères de l’ANOVA à deux critères de classification de type Iclassification de type I

• La puissance maximale pour un effectif donné N est obtenue avec un plan équilibré (on a le même nombre d’observations dans chaque cellule).

Phosphore

Azote Témoin Bas Élevé

Témoin 2.8 3.0 3.3

Bas 3.6 3.8 4.0

Élevé 4.4 4.5 4.5

Les valeurs représentent les moyennesN = 5 champs, en tonnes/hectare

Page 27: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40

27

Power with G*PowerPower with G*PowerANOVA (Type I)ANOVA (Type I)

• metric of effect size : – f – f2

2

1

k

ii

kf

22

21p

error

Rf

R

Page 28: Université dOttawa - Bio 4518 - Biostatistiques appliquées © Antoine Morin et Scott Findlay 2014-06-05 09:08 1

Université d’Ottawa - Bio 4518 - Biostatistiques appliquées© Antoine Morin et Scott Findlay23-04-11 04:40

28

Questions critiques sur l’ANOVA à Questions critiques sur l’ANOVA à critères multiplescritères multiples

• Combien de facteurs?• Quel type (I, II, or III)?• Quel plan

– factoriel?– nested?– bloc?– À mesures répétées?– mixte?

• Réplication– équilibré/ non-équilibré?– Sans réplication?

• Paramétrique ou non-paramétrique?

• Les réponses à ces questions déterminent quelles hypothèses peuvent être testées et quel test est le plus approprié. Attention à vos réponses!