Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou...

Preview:

Citation preview

L’analyse de varianceL’analyse de variance

L’analyse de varianceL’analyse de variance

L’analyse de variance: ANOVA (ANalysis Of L’analyse de variance: ANOVA (ANalysis Of VAriance)VAriance)

Utilité: tester 2 ou plusieurs hypothèses sur des Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantespopulation indépendantes

ExempleExemple

Acrophobie: Acrophobie: groupe 1: contrôlegroupe 1: contrôlegroupe 2: behavioralgroupe 2: behavioralgroupe 3: rogériengroupe 3: rogérien

0 1 2 3

1 1 2 3

:

:

H

H

Hypothèses: (Les hypothèses directionnelles ne font Hypothèses: (Les hypothèses directionnelles ne font pas de sens lorsqu’il y a plus de deux groupes)pas de sens lorsqu’il y a plus de deux groupes)

Tests Tests tt

Pourquoi ne pas faire 3 tests Pourquoi ne pas faire 3 tests tt ? ?

0 1 2

0 1 3

0 2 3

:

:

:

H

H

H

Comme les Comme les teststests ne sont pas indépendants les uns des autres, ne sont pas indépendants les uns des autres, cela augmente l’erreur commune (familywise error)cela augmente l’erreur commune (familywise error)

Probabilité=(1-)c

Probabilité=(1-)3=0.14

Donc, si on fait trois comparaisons l’erreur de type I sera de 14%.

LogiqueLogiqueEst-ce que les différences entre les moyennes est la conséquence Est-ce que les différences entre les moyennes est la conséquence

d’un effet de traitement? Ou est-ce uniquement de l’erreur ?d’un effet de traitement? Ou est-ce uniquement de l’erreur ?

2

Contrôle Behavioral Rogérien

5 1 3

6 2 3

8 3 4

6.33 2 3.33

1.53 1 0.57

2.34 1 0.33

x

s

s

LogiqueLogiquePour répondre à la question:

- Variabilité à l’intérieur des groupes (erreur d’échantillonnage) « within error »

- Variabilité entre les groupes (erreur d’échantillonnage + effet de traitement ?) « between error »

Si la variabilité intergroupe est largement supérieur a variabilité intragroupe, alors nous aurons un indice de l’effet de traitement.

2

2

2

2

variabilité de l'erreur

variabilité de l'erreur + effet de traitement

intra

inter

interobs

intra

s

s

sF

s

LogiqueLogiqueDegrés de liberté:

Il y a deux degrés de liberté

1- dlinter = nombre de groupes -1 = k-1

2- dlintra = nombre de participants -1 = n-k

Hypothèses:

0 1 2

1 1 2

: ...

: ... (pour au moins un groupe)k

k

H

H

LogiqueLogiquePostulats de base:1- Indépendance

2- Normalité

3- Homogénéité des variances

2

2

max( )0.5 2

min( )i

i

s

s

CalculCalculVariabilité totale = variabilité inter + variabilité intra

le groupe

la grande moyenne

la moyenne d'un groupe

le participant

G

i

i

x

x

p =

Les sommes des carrés

2

1 1

2

1 1

2

1

( )

( )

( )

k n

Total pi Gi p

k n

intra pi ii p

k

inter i i Gi

SC x x

SC x x

SC n x x

Total intra interSC SC SC

CalculCalcul

Les degrés de liberté

1

1

total

intra

inter

dl n

dl n k

dl k

total intra interdl dl dl

Les carrés moyens

2

2

( )

( )

intraintra intra

intra

interinter inter

inter

SCCM s

dl

SCCM s

dl

F

intra

inter

CMF

CM

Table d’ANOVATable d’ANOVA

2

2 1

1

2

1 12

1 1

2

1 1

Source de variation

( )( ) 1

1

( )

( ) ( )

( ) 1

k

i i Gki Inter

i i Gi Intra

k n

pi ik ni p

pi ii p

k n

pi Gi p

SC dl CM F

n x xCM

Inter n x x kk CM

x x

Intra erreur x x n kn k

Total x x n

ExempleExemple

2

Contrôle Behavioral Rogérien

5 1 3

6 2 3

8 3 4

6.33 2 3.33

1.53 1 0.57

2.34 1 0.33

x

s

s

(5 6 8 1 2 3 3 3 4) / 9 3.889Gx

ExempleExemple

32 2

1 1

2 2 2

( ) ( )

3(6.33 3.889) 3(2.00 3.889) 3(3.33 3.889)

17.88 10.70 0.94 29.52

k

inter i i G i i Gi i

inter

inter

SC n x x n x x

SC

SC

3 32

1 1

2 2 2

2 2 2

2 2 2

( )

(5 6.33) (6 6.33) (8 6.33)

(1 2) (2 2) (3 2)

(3 3.33) (3 3.33) (4 6.33)

4.67 2 0.67 7.34

intra pi ii p

intra

intra

SC x x

SC

SC

3 3

2 2

1 1 1 1

2 2 2

2 2 2

2 2 2

( ) ( )

(5 3.889) (6 3.889) (8 3.889)

(1 3.889) (2 3.889) (3 3.889)

(3 3.889) (3 3.889) (4 3.889)

22.59 12.71 1.59 36.89

k n

total pi G pi Gi p i p

total

total

SC x x x x

SC

SC

Les sommes des carrés

7.34 29.52 36.86Total intra interSC SC SC

ExempleExemple

Les degrés de liberté

1 9 1 8

9 3 6

1 3 1 2

total

intra

inter

dl n

dl n k

dl k

6 2 8total intra interdl dl dl

Les carrés moyens

29.5214.76

2

7.341.22

6

interinter

inter

intraintra

intra

SCCM

dl

SCCM

dl

F

14.7612.1

1.22intra

inter

CMF

CM

Table d’ANOVATable d’ANOVA

( , , ) (0.05,2,6) 5.14crit inter intra critF dl dl F

Puisque le Fobs(2,6)=12.1, p<0.05 nous rejetons l’hypothèse nulle. Par conséquent, il y a au moins une différence significative entre les groupes par rapport au traitement d’acrophobie.

Source de variation

29.52 2 14.76 12.1

( ) 7.34 6 1.22

36.89 8

SC dl CM F

Inter

Intra erreur

Total

Mesure de la force d’associationMesure de la force d’association

2 ( 1) 29.52 (3 1)1.22 27.080.71

36.89 1.22 38.11inter intra

total intra

SC k CM

SC CM

Idée: Semblable au r2ajusté

Proportion de la variation totale des données qui peuvent être expliquée par les niveaux des variables indépendantes.

Quelle quantité de la variance peut être expliqué par les différences dans les groupes de traitements?

Donc, 71% de la variance de la variable dépendante (peur des hauteurs) est déterminé par les différences dans les traitements thérapeutique (contrôle, behav. et rogér.)

PuissancePuissance Mesure de la force Mesure de la force

d’associationd’association2

Comparaisons post hocsComparaisons post hocs

Test de SchefféTest de SchefféC’est bien beau savoir qu’il y a une différence significative globale, mais ce que l’on veut savoir c’est quels sont les groupes qui se distinguent des uns et des autres ?

Planification des hypothèses alternatives

1

2

3

:

:

:

C B

C R

B R

H

H

H

4 :2

B CCH

De plus

Test de SchefféTest de SchefféUtilisation des contrastes

1 : C BH

Exemple

1 1 2 2

1

ˆ ...

les "w" peuvent prendre n'importe quelle valeur en autant que

0

k k

k

ii

c w x w x w x

w

1

2

3

1

1

0

0

w

w

w

ˆ (1)6.33 ( 1)2.00 (0)3.33

ˆ 4.33

c

c

Test de SchefféTest de SchefféStatistique utilisée

2 2 222 21 2

1 2

ˆ 4.334.8

(1) ( 1) (0)1.22...

3 3 3

obs

kintra

k

ct

ww wCM

n n n

' 1 ( , , ) 3 1 5.14 3.21crit crit inter intrat k F dl dl

Puisque le tobs>t’crit, on rejette l’hypothèse nulle et nous concluons que le groupe contrôle est significativement (= 0.05) plus élevé que le groupe ayant suivi une thérapie behavioriste.

Test de TukeyTest de TukeyHSD (honestly significant difference)

Planification des hypothèses alternatives

0

1

: 0

: 0

où = , i j ij

H c

H c

c

( , , ) intraintra

CMHSD q dl k

n

Attention, n = nombre de sujet dans un groupe (n1~ n2~ …~ nk)

Si les le nombre de sujet diffère trop, il faut faire la moyenne harmonique

Test de TukeyTest de Tukey

Supposons que vous faites une balade à vélo : vous commencez par escalader une côte de 1km à 20km/h, puis vous redescendez cette même côte à 30km/h. Quelle est votre vitesse moyenne???

Vous avez répondu 25?? Faux!!!

Pour monter : 1km à 20km/h cela me prendra 3 minutes pour gravir la côte.

Pour descendre : 1km à 30km/h cela me prendra 2 minutes pour gravir la côte.

Pour calculer la vitesse moyenne il faut tenir compte du temps.

Distance totale=2 km, par conséquent la vitesse moyenne = 2/t.

Or, le temps total (t) = t1+t2, où t1=1/v1 et t2=1/v2

Donc si on remplace,

vitesse moyenne = 2/(1/v1+1/v2)

vitesse moyenne = 2/(1/20+1/30)=2/5 /60=120/5=24km/h

Moyenne harmonique

Test de TukeyTest de Tukey

Exemple: n1= 4; n2=6 et n3=6

1

3 3 365.143

1 1 1 71 74 6 6 12

4 6 6 165.3333

3 3

H k

i i

kx

n

x

Moyenne harmonique

1

1H k

i i

kx

n

Test de TukeyTest de TukeyTable des différences

1 2

1 1 2 1

2 2

... k

k

k

k

x x x

x x x x x

x x x

x

0Si , on rejette i jx x HSD H

Test de TukeyTest de TukeyExemple

2.00 3.33 6.33

2.00 1.33 4.33

3.33 3.00

6.33

B R C

B

R

C

x x x

x

x

x

0.05

1.22

6

3

3

inter

inter

CM

dl

k

n

(0.05,6,3) 4.34

1.22( , , ) 4.34 2.78

3intra

intra

q

CMHSD q dl k

n

****

* * pp<0.05<0.05

Recommended