Upload
maha-ben-brahim
View
215
Download
0
Embed Size (px)
Citation preview
7/24/2019 chap2_eco_ief_lamac.pdf
1/12
CHAPITRE 2
MODELES DE REGRESSION MULTIPLES
2.1 Prsentation
Un modle de rgressions multiple est un modle linaire avec une variale ! e"pli#uer et plusieurs
variales e"plicatives$ %&est une gnralisation des modles simples$ %ette gnralisation permet
de se rapproc'er plus des ralits conomi#ues comple"es$ Pour (aciliter l&induction statisti#ue)
ces modles et leurs '*pot'ses sont mis sous (orme matricielle$
2.1.1 Ecriture Matricielle du Modle
yi=1+ 2xi2+ 3xi2+ ...kxik+ ei i= 1, 2...n
y1 = 1+ 2x12+ 3x13+ . . . kx1k+ e1
y2 = 1+ 2x22+ 3x23+ . . . kx2k+ e2
y3 = 1+ 2x32+ 3x33+ . . . kx3k+ e3$$$
yn= 1+ 2xn2+ 3xn3+ . . . kxnk+ en
y1
y2
y3$$$
yn
(n,1)
=
1 x12 x13 x1k
1 x22 x23 x2k
1 x32 x33 $$$ x3k$$$
$$$ $$$
$$$ $$$
1 xn2 xn3 . . . xnk
(n,k)
1
2
3$$$
k
(k,1)
+
e1
e2
e3$$$
en
(n,1)
Y =X +
+,
7/24/2019 chap2_eco_ief_lamac.pdf
2/12
+- CHAPITRE 2. MODELES DE REGRESSION MULTIPLES
. o/ Y =
y1
y2
y3$$$
yn
0vecteur de dimension(n, 1) des oservations de la variale ! e"pli#uer
. X =
1 x12 x13 ... x1j ... x1k
1 x22 x23 ... x2j ... x2k
1 x32 x33 ... x3j ... x3k$$$
$$$ $$$
$$$ $$$
1 xi2 xi3 ... xij ... xik$$$
$$$ $$$
$$$ $$$
1 xn2 xn3 ... xnj ... xnk
=matrice de dimension (n, k) des variales e"pli1
catives
. =
1
2
3$$$
k
=vecteur des paramtres de dimension (k, 1)
. =
e1
e2
e3$$$
n
vecteur des erreurs de dimension (n, 1)
. k=nomre des paramtres ! estimer etn=nomre d&oservations$
2.1.2 Hypothses du Modle
On considre les m2me '*pot'ses des modles simples #u&on met sous (orme matricielle et on
a3out l&'*pot'se #ue les variales e"plicatives ne sont pas corrles$
Hypothse-1 4H1)'*pot'se de linarit 5 Le vecteur des oservations de la variale ! e"pli#u
est une (onction linaire des de la matrice des variales e"plicative 5 Y =X +
7/24/2019 chap2_eco_ief_lamac.pdf
3/12
2.2. ESTIMATION : MTHODE MCO +6
Hypothse-24H2)Le terme d&erreur est un ruit lanc E() =
E(e1)
E(e2)
$$$
E(en)
=0
Hypothses4H3) & (H4) 5 var() =2 In =
2 0 0 ... 0 ... 0
0 2 0 ... 0 ... 0
0 0 2 ... 0 ... 0
$$$ $$$
$$$ $ $ $
$$$ $$$
0 0 0 ...
2
... 0$$$ $$$
$$$ $$$
$ $ $ $$$
0 0 0 0 ... 2
avecIn est la matrice identit d&ordre n
Hypothse-5 (H5)Les variales e"plicative X2, X3...Xk sont non alatoires
Hypothse- (H)5le vecteur des erreurs est un vecteur normale 5 N(0, 2In)
Hypothse-! (H!) " Les variales e"plicatives X2, X3...Xk sont linairement indpendantes$
%et asence de colinarit impli#ue essentiellement #ue la matriceX X est de plein rang et donc
inversile$ Si cet '*pot'se n&est pas vri7e on parle de multicolinarit ##
2.2 Esti$ation " Mthode M%
2.2.1 'ecteur des Para$tres Esti$s
Le principe de la mt'ode M%O consiste tou3ours ! Min
ni=1e2i ,la rsolution du prolme sur laase de l&criture matricielle du modle donne 5
= (X X)1 X Y 48$+9Proprits Math$atiues
. X
= 0
. X j= 0, j = 1, 2...k o/Xj est la 3ime colonne de la matrice X et #ui correspond au"oservations de la 3me variale e"plicative$
. Le premier vecteur de X estX 1 = (1, 1, 1...) = o/ est le vecteur unitaire
7/24/2019 chap2_eco_ief_lamac.pdf
4/12
+: CHAPITRE 2. MODELES DE REGRESSION MULTIPLES
.Y =Y
. X X(k,k)=
n
xi2
xi3 ...
xij ...
xik
xi2 x2i2 xi2xi3 ... xi2xij ... xi2xikxi3
xi2xi3
x2i3 ...
xijxi3 ...
xi3xik
$$$ $$$
$$$ $ $ $
$$$ $$$
xij
xi2xij
xijxi3 ...
x2ij ...
xijxik$$$
$$$ $$$
$$$ $ $ $
$$$xik
xi2xik
xi3xik
xijxik ...
x2ik
. X Y(k,1)=
yixi2yixi3yi$$$
xijyi$$$
xikyi
.c = (XcXc)1 XcYc et1 = Y k
j=2
jXjavec
c(k1,1) =
2
3$$$
k
. Ycn,1 =
y1 Yy2 Y
y3 Y
$$$
yn Y
=
yc
1
yc2
yc3$$$
ycn
7/24/2019 chap2_eco_ief_lamac.pdf
5/12
2.2. ESTIMATION : MTHODE MCO +;
Xc(n,k1)==
x12 X2 x13 X3 ... x1j Xj ... x1k Xk
x22 X2 x23 X3 ... x2j Xj ... x2k Xk
x32 X2 x33 X3 ... x3j Xj ... x3k Xk$$$
$$$ $$$
$$$
xi2 X2 xi3 X3 ... xij Xj ... xik Xk$$$
$$$ $$$
$$$
xn2 X2 xn3 X3 ... xnj Xj ... xnk Xk
=
xc12 xc13 ... x
c1j ... x
c1k
xc
22
xc
23
... xc
2j
... xc
2k
xc32 xc33 ... x
c3j ... x
c3k
$$$ $$$
$$$ $$$
xci2 x
ci3 ... x
cij
... xcik
$$$ $$$
$$$ $$$
xcn2 xcn3 ... x
cnj ... x
cnk
avecY et Xj, j= 2, 3...k sont les mo*ennes des variales
. (XcXc)(k1,k1)=
xc2i2 xci2xci3 ... xci2xcij ... xci2xcikxi2xi3
xc2i3 ...
xcijx
ci3 ...
xci3x
cik
$$$ $$$
$ $ $ $$$
$$$xci2x
cij
xcijx
ci3 ...
xc2ij ...
xcijx
cik
$$$ $$$
$$$ $ $ $
$$$xci2x
cik
xci3x
cik
xcijx
cik ...
xc2ik
. XcYc(k1,1)=
xci2y
cixci3yci
$$$xcijy
ci
$$$xciky
ci
2.2.2 Proprits des Esti$ateurs M%
Le t'orme de Gauss1Mar
7/24/2019 chap2_eco_ief_lamac.pdf
6/12
8= CHAPITRE 2. MODELES DE REGRESSION MULTIPLES
modles multiples par la mt'ode M%O donne des estimateurs linaires) sans iais convergents et
relativement e>caces 4?LUE9$
inarit 5 Le vecteur estim est (onction linaire de @ 5 = AY ou la matrice est A =(X X)
1X
*on +iais5 E() =E,cacit " On considre un autre estimateur linaire sans iais de :
=CYE() = :
On dmontre #uevar() var() est une matrice semi1d7nie positive alorsest plus e>cace
#ueOn note #ue
var() =2 (X X)1 48$89var(c ) =2 (XcXc)1 48$A9
2.3 'alidation tatistiue
2.3.1 est de i/ni0catiit ndiiduelle et nteralle de %on0ance
%omme pour les modles simples) on a les rsultats suivants 5
.j N(j, 2j ) pourj = 1, 2...k
.
e2i2
2(n k)
.j j j T(n k)
. Pour le test
H0 : j = 0H1 : j = 0 la rgle de dcision 5 on re3ette H0 si
j j
> t1/2. L&intervalle de con7ance est IC1(j) =
j t1/2 j
2.3.2 nalyse de la 'ariance
La variation totale de Y est mesure par la somme des carrs des carts ! sa mo*enne 5
SC T =n
i=1
yi Y
2$ La variation e"pli#ue par X correspond ! la variation deY) c&est la
7/24/2019 chap2_eco_ief_lamac.pdf
7/12
2.3. VALIDATION STATISTIQUE 8+
somme des carrs des carts des valeurs estimes ! la mo*enne estime 5SC E=
ni=1
(yiY)2$ La
variance e"pli#ue par l&alea correspond ! la variance du vecteur des rsidus 5
. SC T =n
i=1
yi Y
2=YcYc =Y Y nY
2
. SC E=n
i=1
(yi Y)2 =YcYc =YY nY2 =cXcXcc. SC R=
ni=1
e2i =. SC T =SCE+ SCR
2.3.3 est de i/ni0catiit loale
Le test de signi7cativit gloale consiste ! tester la validit du modle dans son ensemle$ Il
s&agit de tester s&il e"iste au moins une variale signi7cative$ %eci revient ! tester 5 H0 :
c = 0
H1 : c = 0
H0 : 2= 3=...k = 0H1 : j {2...k} tq j = 0
%e test est un cas particulier des tests de s*stmes de contraints Linaires sur les paramtres$
Binsi on prsent d&aord ces tests de contraints pour dduire ensuite la rgle de dcision pour le
test de signi7cativit gloale$
est d6un yst$e de %ontraints inaires sur les Para$tres
On considre le modleyi= 1 + 2xi2 + 3xi2 + ...kxik + ei i= 1, 2...n) et soitR une matrice !
qlignes etk colonnes etr est un vecteur !qlments) on c'erc'e ! tester le s*stme ! qcontraints
suivant 5
H0:R=r
Sous l&'*pot'se de normalit des erreurs) l&estimateur M%O du vecteurest un vecteur normale 5
N(,2 (X X)1) 48$C9Il dcoule #ue sous l&'*pot'seH0 : R=r
W =
R r R2 (X X)1 R1 R r 2(q) 48$,9
7/24/2019 chap2_eco_ief_lamac.pdf
8/12
88 CHAPITRE 2. MODELES DE REGRESSION MULTIPLES
la variance 2 tant inconnue) on ne peut pas utiliser la (onction de luation##) mais) sac'ant
#ue
e2i2
=SC R
2 2(n k) alors on dduit
Wq
SC R
2 (n k)
!(q, n k) d&o/
! =
R r R (XX)1 R1 R r q
SCR(n k) !(q, n k) 48$-9
Lors#ue on considre le modle centr 5Yc = Xcc + , pour tester H0:Rc =r la rgle de
dcision au ris#ue ", consiste ! re3eterH0 si ! > #1(q, n k)
est de i/ni0catiit loale
L&'*pot'se de ase pour le test de signi7cativit gloale est 5 H0 :c = 0 H0 :R
c =r) o/
R= Ik1) r= 0et q= k 1$ Blors on peut utiliser la statisti#ue par luation##en remplaant
ces lments 5
! =
Rc r R (XcXc)1 R1 Rc r q
SCR(n k) =
c (XcXc)c(k 1)SCR(n k)
= SCE(k 1)
SCR(n k)
Binsi) pour tester la signi7cativit gloale d&un modle de rgression on re3ette H0 4le modle
est gloalement signi7cati(9) si !cal = SCE(k 1)
SCR(n k)> #1(k 1, n k)$
Pouoir E7plicatie des $odles $ultiples
80nition-1 5 Le pouvoir e"plicative d&un modle multiple est la part de la variance de @
e"pli#uer par le modle) il est mesure par le coe>cient de dtermination R2 =SC E
SC T
80nition-2 "Le coe>cient de dtermination a3ustR2
= 1 (n 1)(1 R2)
(n k)
tient compte du
nomre de variales$ En eet) le principal d(aut du R2est de croFtre avec le nomre de variales
e"plicatives$ Or) on sait #u&un e"cs de variales produit des modles peu roustes$ Le coe>cient de
dtermination a3ust tient compte du nomre de variales$ %&est pour#uoi on s&intresse davantage
! cet indicateur #u&auR2 notamment pour comparer deu" modles #ui n&ont pas le m2me nomre
de variales e"plicatives$
9e$arues "
+$ !cal = R2
1 R2(n k)
(k 1)
8$ R2
a3ust est tou3ours in(rieur au R2
7/24/2019 chap2_eco_ief_lamac.pdf
9/12
2.4. PRVISION 8A
2.4 Prision
La valeur de Y ! la priode t > T est donne par 5yp
t =
1
+2
xp
t
2
+3
xp
t
3
+...k
xp
t
k
+
ept =Xpt+ e
pt ou X
pt = [1, x
pt2, x
pt3...x
ptk] . La valeur prvisionnelle de Y et l&erreur de prvision
sont respectivement 5
ypt = Xpt 48$69ept =ypt ypt 48$:9
Si le modle est estim par la mt'ode M%O) les prvisions seront sans iais 5 E(ept) = 0E(ept) =E(ypt ypt) =EXpt ept= 0La prvision par intervalle de con7ance utilise) comme pour les modles simples le (ait #ue 5
yptypt2ep
t
T(n 2) alors
IC1(ypt) =
ypt t1/22ept
48$;9
o/2ept =var(ept) =varXpt ept= var Xpt + var (ept)=Xptvar
(Xpt) + var (ept) =2 Xpt(XX)1 (Xpt) + 1 .
7/24/2019 chap2_eco_ief_lamac.pdf
10/12
7/24/2019 chap2_eco_ief_lamac.pdf
11/12
2.4. PRVISION 8,
Exercice 3
On considre le modle& 5yi = 1 + 2xi2 + +3xi3 + i i= 1, 2....100) o/Y =salaire nominal H
X2 = e"prience pro(essionnelle X3 = niveau d&instruction$ Les donnes relatives au" variales
e"plicatives sont rsumes parXcXc =
64 44 1
HLuation estime du modle & estM :yi= 258, 5
(13,01)
+ 25, 4(1,30)
xi2+ 185, 9(10,41)
xi3 i= 1, 2...100
Les valeurs entre parent'ses sont les carts1t*pes estims des paramtres
+$ Donner une interprtation conomi#ue de la valeur estime de 1$
8$ Estimer la variance des rsidus$
A$ %alculer le coe>cient de dtermination du modle$
C$ uelle est la valeur anticipe du salaire d&un emplo*er #ui a += ans d&e"prience pro(ession1
nelle et dont le niveau d&instruction est gale ! A 4niveau suprieur9
Exercice 3
Partie
On se propose d&identi7er les (acteurs dterminants dans l&volution de la consommation d&es1
sence$ On utilise des donnes annuelles allant de +;:= ! 8==- relatives au" variales suivantes 5
. Y 5 La consommation d&essence en terme rel H
. X2 5 L&indice du pri" de l&essence H
. X3 5 L&indice des pri" des nouvelles voitures H
. X4 5 L&indice des pri" des iens durales 5JC
. X5 5 Revenue relle disponile H
Les donnes relatives ! ses variales son rsumes par (XcXc)1 = 102
0, 708 2, 555 10, 233
30, 482 84, 730
259, 490
) XcYc =
846
339
193
1560
) YcYc = 50000
7/24/2019 chap2_eco_ief_lamac.pdf
12/12
8- CHAPITRE 2. MODELES DE REGRESSION MULTIPLES
+$ Estimer et tester au ris#ue de , la signi7cativit des coe>cients des variales e"plicatives
8$ Kuger conomi#uement ces coe>cients
A$ Tester l&'*pot'se #u&une augmentation des pri" des iens durales est #uivalente ! une
aise de revenue disponile
C$ Tester au ris#ue de += le s*stme des contraints suivant 5H0:
3= 42
73+4 = 1
2+ 3=4
Partie
On se propose de savoir si les pri" du transport pulic ont un eet sur la consommation
d&essence H on a3oute l&indice des pri" du transport pulic 4X69 comme variale e"plicative
au modle prcdent$ Le rsultat d&estimation est
c,$ 4a9 Tester la signi7cativit gloale du modle
49 %alculer le coe>cient de dtermination de la deu"ime rgression
4c9 Dresser le taleau d&anal*se de la variance
-$ %alculer la part de X5 dans l&e"plication du modle
6$ Est1ce #ue l&a3out de la varialeX5 amliore la #ualit d&a3ustement du modle
:$ Tester si cette amlioration est signi7cative