Upload
louis-lefort
View
112
Download
0
Embed Size (px)
Citation preview
L’Analyse de Covariance
Modèle completLe modèle d’ANCOVALe modèle de la régression commune
Modèles linéaires simples
Procédure Variable dépendante
Variable(s) independante(s)
Régression simple
1 continue 1 continue
ANOVA à un facteur
1 continue 1 discrète
ANOVA à facteurs multiples
1 continue 2 ou plus discrètes
ANCOVA 1 continue Au moins 1 discrète et au moins une 1 continue
Régression multiple
1 continue 2 ou plus continues
L’Analyse de Covariance
Utilisation de l’ANCOVA
Afin de comparer une relation entre une variable dépendante (Y) et une variable indépendante (X1) pour différents niveaux d’une variable discrète (X2)
ex: la relation entre le poids (Y) et la taille (X1) pour différents groupes taxonomiques (oiseaux et mammifères, X2)
Taille
Ma
ss
e
Taille
L’Analyse de Covariance
Lorsque l’on fait ces comparaisons, on suppose que les modèles sont qualitativement similaires pour tous les niveaux de la variable discrète...
…autrement ce serait comme comparer des pommes et des oranges!
X1
Y
Modèles qualitativement différents
Y
Modèles qualitativement similaires
L’Analyse de Covariance
Utilisation de l’ANCOVA
Le modèle de la régression simple
Le modèle de la régression:
toutes les régressions simples sont décrites par 2 paramètres: l’ordonnée à l’origine (a) et la pente (b)
Y a bX ei i i
X X
Y
b =YX(pente)
a(ordonnée à l’origine)
ei
Xi
Yi
ObservéesPrédites
L’Analyse de Covariance
X1
Ya diffèrentmêmeb
X1
Ya & b diffèrent
X1
Y
même a,mêmeb
X1
Y
même adifférents b
L’Analyse de Covariance
Ajustement au modèle
Commencer par un modèle d’ordre supérieur en incluant le plus de termes possible.
Ajuster un modèle réduit
Tester la signification du terme exclus
Modèle d’ordre supérieur
Modèle réduit
F
Terme exclus(p)
Terme inclus(p)
L’Analyse de Covariance
Le modèle complet
i est la pente de la régression de Y sur X1 estimée pour le niveau i de la variable discrète X2
i est la différence entre les moyennes de la variable discrète X2 pour chaque niveau i et la moyenne générale.
Le modèle complet
Y X Xij i i ij i ij ( )
L’Analyse de Covariance
Niveau 1 de la variable X2
Niveau 2 de la variable X2
Y1
Y2
X1 X2
1
1 j
X j1
X Xj1 1
2
1 2
Le modèle complet
Pour le modèle complet contenant 2 variables indépendantes, on a 3 hypothèses nulles:
0:
constante,:
, les pour tous 0:
03
02
01
i
i
i
H
H
iH
Niveau 1 de la variable X2
Niveau 2 de la variable X2
Y1
Y2
X1 X2
1
1 j
X j1
X Xj1 1
2
1 2
hypothèses nulles
L’Analyse de Covariance
H
H constante
H
i
i
i
01
02
03
0
0
: ,
:
:
,
H
H constante
H
i
i
i
01
02
03
0
0
: ,
:
:
,
H
H constante
H
i
i
i
01
02
03
0
0
: ,
:
:
, Y
Y
Y
L’Analyse de Covariance
Le modèle complet
Conditions d’application
Les résidus sont indépendants et distribués normalement
La variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable discontinue (homoscedasticité)
pas d’erreur sur les variables indépendantes
L’Analyse de Covariance
Le modèle complet
Ajuster le modèle complet, tester la différence entre les pentes
Si H02 est rejetée, faire des régressions séparées pour chaque niveau de la variable catégorique
Si H02 est acceptée, ajuster le modèle d’ ANCOVA.
Niveau 1 de la variable X2
Niveau 2 de la variable X2
X1
Y
ANCOVARégressions
séparées
H02 acceptée H02 rejetéee
H i02: constante
L’Analyse de Covariance
Le modèle complet
Exemple
Q1: la pente de la régression de LFKL sur LAGE est la même pour les deux sexes?
1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7LAGE
1.5
1.6
1.7
1.8
LFK
L
1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8LAGE
1.5
1.6
1.7
1.8
1.9
LFK
L
Femelles
Mâles
age, sexe et longueur de l’esturgeon
L’Analyse de Covariance
Le modèle complet
SEX$*LAGE 0.000 1 0.000 0.337 0.563
Conclusion 1: la pente est la même pour les deux sexes (accepter H02 ) p(SEX$*LAGE) > 0.05
Q2: l’ordonnée à l’origine est-elle la même?
Exemple
L’Analyse de Covariance
Dep Var: LFKL N: 92 Multiple R: 0.835 Squared multiple R: 0.697
Analysis of Variance
Source Sum-of-Squares df Mean-Square F-ratio P
LAGE 0.143 1 0.143 176.650 0.000SEX$ 0.000 1 0.000 0.504 0.479
Error 0.071 88 0.001
Le modèle complet
Décomposition de la variation
TAij SCEryy )1()ˆ( 22
( ˆ y A B ˆ y A )2
( ˆ y AxB
ˆ y A B )2
(y ij ˆ y AxB
)2
( y ij y )2
(n-2)
(différence des ordonnées à l’origine)
Interaction A et B
(non parallélisme des droites)
Résidus autour des droites
Totale (n-1)
1
Effet facteur B/A
(var continue A)
Hors régression
Sources de variation
Modèle linéaire simple
SCE ddl
2)ˆ( yyA
(p-1)
(p-1)
(n-2p)
L’Analyse de Covariance
Le modèle complet
Le modèle:
est la pente de la régression de Y sur X1 regroupée pour tous les niveaux de la variable catégorique X2.
i est la différence entre la moyenne pour chaque niveau i et la moyenne générale
Y X Xij i ij i ij ( )
Y1
Y2
X1 X2
1
1 j
X j1
X Xj1 1
2
ˆ int ra ( (x ij x i)(y ij y i)
j
i
( (x ij x i)
2
j
i
L’Analyse de Covariance
Le modèle additif
Pour une ANCOVA avec 2 variables indépendantes, deux hypothèses nulles:
H pour tous les i
Hi
i
01
02
0
0
: ,
:
Niveau 1 de la variable X2
Niveau 2 de la variable X2
Y1
Y2
X1 X2
1
1 j
X j1
X Xj1 1
2
Le modèle additif
L’Analyse de Covariance
hypothèses nulles
H pour tous les i
Hi
i
01
02
0
0
: ,
:
H pour tous les i
Hi
i
01
02
0
0
: ,
:
Y
Y
Y
H pour tous les i
Hi
i
01
02
0
0
: ,
:
L’Analyse de Covariance
Le modèle additif
Conditions d’application du modèle additif
les résidus sont indépendants et distribués normalement
la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable catégorique (homoscedasticité)
les pentes des régressions de Y sur X sont les mêmes pour tous les niveaux de la variable catégorique (ce n’est pas une condition d’application du modèle complet!!)
L’Analyse de Covariance
Le modèle additif
Procédure
Niveau 1 de la variable X2
Niveau 2 de la variable X2
X1
Y
Régression commune
Régressionsséparées
H01 acceptée H01 rejetée
Ajuster le modèle d’ANCOVA, tester:
Si H01 est rejetée, séparer les régressions pour chaque niveau de la variable discontinue
Si H01 est acceptée, ajuster une régression commune.
0 :01 iH
L’Analyse de Covariance
Le modèle additif
Exemple
Conclusion 2: Ordonnée à l’origine est la même pour les deux sexes. H01 est acceptée. p(SEX$ > .05),
le meilleur modèle est la régression commune.la réduction du R2 est négligeable (.697 to .696).
L’Analyse de Covariance
Le modèle additif
LAGE 0.143 1 0.143 178.163 0.000
Dep Var: LFKL N: 92 Multiple R: 0.834 Squared multiple R: 0.696
Analysis of Variance
Source Sum-of-Squares df Mean-Square F-ratio P
SEX$ 0.001 1 0.001 1.851 0.177
Error 0.072 89 0.001
Le modèle à droites confondues
Le modèle:
est la pente de la régression de Y sur X1 , regroupée pour tous les niveaux de la variable discrète X2.
est la moyenne groupée de X1.
X
L’Analyse de Covariance
Niveau 1 de la variable X2
Niveau 2 de la variable X2
X
1 j
X j1
X Xj1
Y X Xij i ij i ij ( )
On a deux hypothèses nulles pour la régression commune:
H
H01
02
0: ,
: .
0
Le modèle à droites confondues
L’Analyse de Covariance
hypothèses nulles
Niveau 1 de la variable X2
Niveau 2 de la variable X2
X
1 j
X j1
X Xj1
1.211 0.031 0.0 . 39.191 0.000LAGE 0.336 0.024 0.830 1.000 14.144 0.000
Exemple
Le modèle à droites confondues
L’Analyse de Covariance
Dep Var: LFKL N: 92 Multiple R: 0.830 Squared multiple R: 0.690
Adjusted squared multiple R: 0.686 Standard error of estimate: 0.029 Effect Coefficient Std Error Std Coef Tolerance t P(2 Tail) CONSTANT
Conditions d’application du modèle à droites confondues
Les résidus sont indépendants et distribués normalement
la variance des résidus est égale pour toutes les valeurs de X et indépendantes des valeurs de la variable discrète (homoscédasticité)
Le modèle à droites confondues
L’Analyse de Covariance
Conclusion
Aller du modèle complexe au modèle simple
Donc choisir a priori les variables explicatives
L’Analyse de Covariance