26
L’Analyse de Covariance Modèle complet Le modèle d’ANCOVA Le modèle de la régression commune

LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Embed Size (px)

Citation preview

Page 1: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

L’Analyse de Covariance

Modèle completLe modèle d’ANCOVALe modèle de la régression commune

Page 2: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Modèles linéaires simples

Procédure Variable dépendante

Variable(s) independante(s)

Régression simple

1 continue 1 continue

ANOVA à un facteur

1 continue 1 discrète

ANOVA à facteurs multiples

1 continue 2 ou plus discrètes

ANCOVA 1 continue Au moins 1 discrète et au moins une 1 continue

Régression multiple

1 continue 2 ou plus continues

L’Analyse de Covariance

Page 3: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Utilisation de l’ANCOVA

Afin de comparer une relation entre une variable dépendante (Y) et une variable indépendante (X1) pour différents niveaux d’une variable discrète (X2)

ex: la relation entre le poids (Y) et la taille (X1) pour différents groupes taxonomiques (oiseaux et mammifères, X2)

Taille

Ma

ss

e

Taille

L’Analyse de Covariance

Page 4: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Lorsque l’on fait ces comparaisons, on suppose que les modèles sont qualitativement similaires pour tous les niveaux de la variable discrète...

…autrement ce serait comme comparer des pommes et des oranges!

X1

Y

Modèles qualitativement différents

Y

Modèles qualitativement similaires

L’Analyse de Covariance

Utilisation de l’ANCOVA

Page 5: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Le modèle de la régression simple

Le modèle de la régression:

toutes les régressions simples sont décrites par 2 paramètres: l’ordonnée à l’origine (a) et la pente (b)

Y a bX ei i i

X X

Y

b =YX(pente)

a(ordonnée à l’origine)

ei

Xi

Yi

ObservéesPrédites

L’Analyse de Covariance

Page 6: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

X1

Ya diffèrentmêmeb

X1

Ya & b diffèrent

X1

Y

même a,mêmeb

X1

Y

même adifférents b

L’Analyse de Covariance

Page 7: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Ajustement au modèle

Commencer par un modèle d’ordre supérieur en incluant le plus de termes possible.

Ajuster un modèle réduit

Tester la signification du terme exclus

Modèle d’ordre supérieur

Modèle réduit

F

Terme exclus(p)

Terme inclus(p)

L’Analyse de Covariance

Page 8: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Le modèle complet

i est la pente de la régression de Y sur X1 estimée pour le niveau i de la variable discrète X2

i est la différence entre les moyennes de la variable discrète X2 pour chaque niveau i et la moyenne générale.

Le modèle complet

Y X Xij i i ij i ij ( )

L’Analyse de Covariance

Niveau 1 de la variable X2

Niveau 2 de la variable X2

Y1

Y2

X1 X2

1

1 j

X j1

X Xj1 1

2

1 2

Page 9: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Le modèle complet

Pour le modèle complet contenant 2 variables indépendantes, on a 3 hypothèses nulles:

0:

constante,:

, les pour tous 0:

03

02

01

i

i

i

H

H

iH

Niveau 1 de la variable X2

Niveau 2 de la variable X2

Y1

Y2

X1 X2

1

1 j

X j1

X Xj1 1

2

1 2

hypothèses nulles

L’Analyse de Covariance

Page 10: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

H

H constante

H

i

i

i

01

02

03

0

0

: ,

:

:

,

H

H constante

H

i

i

i

01

02

03

0

0

: ,

:

:

,

H

H constante

H

i

i

i

01

02

03

0

0

: ,

:

:

, Y

Y

Y

L’Analyse de Covariance

Le modèle complet

Page 11: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Conditions d’application

Les résidus sont indépendants et distribués normalement

La variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable discontinue (homoscedasticité)

pas d’erreur sur les variables indépendantes

L’Analyse de Covariance

Le modèle complet

Page 12: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Ajuster le modèle complet, tester la différence entre les pentes

Si H02 est rejetée, faire des régressions séparées pour chaque niveau de la variable catégorique

Si H02 est acceptée, ajuster le modèle d’ ANCOVA.

Niveau 1 de la variable X2

Niveau 2 de la variable X2

X1

Y

ANCOVARégressions

séparées

H02 acceptée H02 rejetéee

H i02: constante

L’Analyse de Covariance

Le modèle complet

Page 13: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Exemple

Q1: la pente de la régression de LFKL sur LAGE est la même pour les deux sexes?

1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7LAGE

1.5

1.6

1.7

1.8

LFK

L

1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8LAGE

1.5

1.6

1.7

1.8

1.9

LFK

L

Femelles

Mâles

age, sexe et longueur de l’esturgeon

L’Analyse de Covariance

Le modèle complet

Page 14: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

SEX$*LAGE 0.000 1 0.000 0.337 0.563

Conclusion 1: la pente est la même pour les deux sexes (accepter H02 ) p(SEX$*LAGE) > 0.05

Q2: l’ordonnée à l’origine est-elle la même?

Exemple

L’Analyse de Covariance

Dep Var: LFKL N: 92 Multiple R: 0.835 Squared multiple R: 0.697

Analysis of Variance

Source Sum-of-Squares df Mean-Square F-ratio P

LAGE 0.143 1 0.143 176.650 0.000SEX$ 0.000 1 0.000 0.504 0.479

Error 0.071 88 0.001

Le modèle complet

Page 15: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Décomposition de la variation

TAij SCEryy )1()ˆ( 22

( ˆ y A B ˆ y A )2

( ˆ y AxB

ˆ y A B )2

(y ij ˆ y AxB

)2

( y ij y )2

(n-2)

(différence des ordonnées à l’origine)

Interaction A et B

(non parallélisme des droites)

Résidus autour des droites

Totale (n-1)

1

Effet facteur B/A

(var continue A)

Hors régression

Sources de variation

Modèle linéaire simple

SCE ddl

2)ˆ( yyA

(p-1)

(p-1)

(n-2p)

L’Analyse de Covariance

Le modèle complet

Page 16: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Le modèle:

est la pente de la régression de Y sur X1 regroupée pour tous les niveaux de la variable catégorique X2.

i est la différence entre la moyenne pour chaque niveau i et la moyenne générale

Y X Xij i ij i ij ( )

Y1

Y2

X1 X2

1

1 j

X j1

X Xj1 1

2

ˆ int ra ( (x ij x i)(y ij y i)

j

i

( (x ij x i)

2

j

i

L’Analyse de Covariance

Le modèle additif

Page 17: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Pour une ANCOVA avec 2 variables indépendantes, deux hypothèses nulles:

H pour tous les i

Hi

i

01

02

0

0

: ,

:

Niveau 1 de la variable X2

Niveau 2 de la variable X2

Y1

Y2

X1 X2

1

1 j

X j1

X Xj1 1

2

Le modèle additif

L’Analyse de Covariance

hypothèses nulles

Page 18: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

H pour tous les i

Hi

i

01

02

0

0

: ,

:

H pour tous les i

Hi

i

01

02

0

0

: ,

:

Y

Y

Y

H pour tous les i

Hi

i

01

02

0

0

: ,

:

L’Analyse de Covariance

Le modèle additif

Page 19: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Conditions d’application du modèle additif

les résidus sont indépendants et distribués normalement

la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable catégorique (homoscedasticité)

les pentes des régressions de Y sur X sont les mêmes pour tous les niveaux de la variable catégorique (ce n’est pas une condition d’application du modèle complet!!)

L’Analyse de Covariance

Le modèle additif

Page 20: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Procédure

Niveau 1 de la variable X2

Niveau 2 de la variable X2

X1

Y

Régression commune

Régressionsséparées

H01 acceptée H01 rejetée

Ajuster le modèle d’ANCOVA, tester:

Si H01 est rejetée, séparer les régressions pour chaque niveau de la variable discontinue

Si H01 est acceptée, ajuster une régression commune.

0 :01 iH

L’Analyse de Covariance

Le modèle additif

Page 21: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Exemple

Conclusion 2: Ordonnée à l’origine est la même pour les deux sexes. H01 est acceptée. p(SEX$ > .05),

le meilleur modèle est la régression commune.la réduction du R2 est négligeable (.697 to .696).

L’Analyse de Covariance

Le modèle additif

LAGE 0.143 1 0.143 178.163 0.000

Dep Var: LFKL N: 92 Multiple R: 0.834 Squared multiple R: 0.696

Analysis of Variance

Source Sum-of-Squares df Mean-Square F-ratio P

SEX$ 0.001 1 0.001 1.851 0.177

Error 0.072 89 0.001

Page 22: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Le modèle à droites confondues

Le modèle:

est la pente de la régression de Y sur X1 , regroupée pour tous les niveaux de la variable discrète X2.

est la moyenne groupée de X1.

X

L’Analyse de Covariance

Niveau 1 de la variable X2

Niveau 2 de la variable X2

X

1 j

X j1

X Xj1

Y X Xij i ij i ij ( )

Page 23: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

On a deux hypothèses nulles pour la régression commune:

H

H01

02

0: ,

: .

0

Le modèle à droites confondues

L’Analyse de Covariance

hypothèses nulles

Niveau 1 de la variable X2

Niveau 2 de la variable X2

X

1 j

X j1

X Xj1

Page 24: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

1.211 0.031 0.0 . 39.191 0.000LAGE 0.336 0.024 0.830 1.000 14.144 0.000

Exemple

Le modèle à droites confondues

L’Analyse de Covariance

Dep Var: LFKL N: 92 Multiple R: 0.830 Squared multiple R: 0.690

Adjusted squared multiple R: 0.686 Standard error of estimate: 0.029 Effect Coefficient Std Error Std Coef Tolerance t P(2 Tail) CONSTANT

Page 25: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Conditions d’application du modèle à droites confondues

Les résidus sont indépendants et distribués normalement

la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable discrète (homoscédasticité)

Le modèle à droites confondues

L’Analyse de Covariance

Page 26: LAnalyse de Covariance Modèle complet Le modèle dANCOVA Le modèle de la régression commune

Conclusion

Aller du modèle complexe au modèle simple

Donc choisir a priori les variables explicatives

L’Analyse de Covariance