chap2_eco_ief_lamac.pdf

Embed Size (px)

Citation preview

  • 7/24/2019 chap2_eco_ief_lamac.pdf

    1/12

    CHAPITRE 2

    MODELES DE REGRESSION MULTIPLES

    2.1 Prsentation

    Un modle de rgressions multiple est un modle linaire avec une variale ! e"pli#uer et plusieurs

    variales e"plicatives$ %&est une gnralisation des modles simples$ %ette gnralisation permet

    de se rapproc'er plus des ralits conomi#ues comple"es$ Pour (aciliter l&induction statisti#ue)

    ces modles et leurs '*pot'ses sont mis sous (orme matricielle$

    2.1.1 Ecriture Matricielle du Modle

    yi=1+ 2xi2+ 3xi2+ ...kxik+ ei i= 1, 2...n

    y1 = 1+ 2x12+ 3x13+ . . . kx1k+ e1

    y2 = 1+ 2x22+ 3x23+ . . . kx2k+ e2

    y3 = 1+ 2x32+ 3x33+ . . . kx3k+ e3$$$

    yn= 1+ 2xn2+ 3xn3+ . . . kxnk+ en

    y1

    y2

    y3$$$

    yn

    (n,1)

    =

    1 x12 x13 x1k

    1 x22 x23 x2k

    1 x32 x33 $$$ x3k$$$

    $$$ $$$

    $$$ $$$

    1 xn2 xn3 . . . xnk

    (n,k)

    1

    2

    3$$$

    k

    (k,1)

    +

    e1

    e2

    e3$$$

    en

    (n,1)

    Y =X +

    +,

  • 7/24/2019 chap2_eco_ief_lamac.pdf

    2/12

    +- CHAPITRE 2. MODELES DE REGRESSION MULTIPLES

    . o/ Y =

    y1

    y2

    y3$$$

    yn

    0vecteur de dimension(n, 1) des oservations de la variale ! e"pli#uer

    . X =

    1 x12 x13 ... x1j ... x1k

    1 x22 x23 ... x2j ... x2k

    1 x32 x33 ... x3j ... x3k$$$

    $$$ $$$

    $$$ $$$

    1 xi2 xi3 ... xij ... xik$$$

    $$$ $$$

    $$$ $$$

    1 xn2 xn3 ... xnj ... xnk

    =matrice de dimension (n, k) des variales e"pli1

    catives

    . =

    1

    2

    3$$$

    k

    =vecteur des paramtres de dimension (k, 1)

    . =

    e1

    e2

    e3$$$

    n

    vecteur des erreurs de dimension (n, 1)

    . k=nomre des paramtres ! estimer etn=nomre d&oservations$

    2.1.2 Hypothses du Modle

    On considre les m2me '*pot'ses des modles simples #u&on met sous (orme matricielle et on

    a3out l&'*pot'se #ue les variales e"plicatives ne sont pas corrles$

    Hypothse-1 4H1)'*pot'se de linarit 5 Le vecteur des oservations de la variale ! e"pli#u

    est une (onction linaire des de la matrice des variales e"plicative 5 Y =X +

  • 7/24/2019 chap2_eco_ief_lamac.pdf

    3/12

    2.2. ESTIMATION : MTHODE MCO +6

    Hypothse-24H2)Le terme d&erreur est un ruit lanc E() =

    E(e1)

    E(e2)

    $$$

    E(en)

    =0

    Hypothses4H3) & (H4) 5 var() =2 In =

    2 0 0 ... 0 ... 0

    0 2 0 ... 0 ... 0

    0 0 2 ... 0 ... 0

    $$$ $$$

    $$$ $ $ $

    $$$ $$$

    0 0 0 ...

    2

    ... 0$$$ $$$

    $$$ $$$

    $ $ $ $$$

    0 0 0 0 ... 2

    avecIn est la matrice identit d&ordre n

    Hypothse-5 (H5)Les variales e"plicative X2, X3...Xk sont non alatoires

    Hypothse- (H)5le vecteur des erreurs est un vecteur normale 5 N(0, 2In)

    Hypothse-! (H!) " Les variales e"plicatives X2, X3...Xk sont linairement indpendantes$

    %et asence de colinarit impli#ue essentiellement #ue la matriceX X est de plein rang et donc

    inversile$ Si cet '*pot'se n&est pas vri7e on parle de multicolinarit ##

    2.2 Esti$ation " Mthode M%

    2.2.1 'ecteur des Para$tres Esti$s

    Le principe de la mt'ode M%O consiste tou3ours ! Min

    ni=1e2i ,la rsolution du prolme sur laase de l&criture matricielle du modle donne 5

    = (X X)1 X Y 48$+9Proprits Math$atiues

    . X

    = 0

    . X j= 0, j = 1, 2...k o/Xj est la 3ime colonne de la matrice X et #ui correspond au"oservations de la 3me variale e"plicative$

    . Le premier vecteur de X estX 1 = (1, 1, 1...) = o/ est le vecteur unitaire

  • 7/24/2019 chap2_eco_ief_lamac.pdf

    4/12

    +: CHAPITRE 2. MODELES DE REGRESSION MULTIPLES

    .Y =Y

    . X X(k,k)=

    n

    xi2

    xi3 ...

    xij ...

    xik

    xi2 x2i2 xi2xi3 ... xi2xij ... xi2xikxi3

    xi2xi3

    x2i3 ...

    xijxi3 ...

    xi3xik

    $$$ $$$

    $$$ $ $ $

    $$$ $$$

    xij

    xi2xij

    xijxi3 ...

    x2ij ...

    xijxik$$$

    $$$ $$$

    $$$ $ $ $

    $$$xik

    xi2xik

    xi3xik

    xijxik ...

    x2ik

    . X Y(k,1)=

    yixi2yixi3yi$$$

    xijyi$$$

    xikyi

    .c = (XcXc)1 XcYc et1 = Y k

    j=2

    jXjavec

    c(k1,1) =

    2

    3$$$

    k

    . Ycn,1 =

    y1 Yy2 Y

    y3 Y

    $$$

    yn Y

    =

    yc

    1

    yc2

    yc3$$$

    ycn

  • 7/24/2019 chap2_eco_ief_lamac.pdf

    5/12

    2.2. ESTIMATION : MTHODE MCO +;

    Xc(n,k1)==

    x12 X2 x13 X3 ... x1j Xj ... x1k Xk

    x22 X2 x23 X3 ... x2j Xj ... x2k Xk

    x32 X2 x33 X3 ... x3j Xj ... x3k Xk$$$

    $$$ $$$

    $$$

    xi2 X2 xi3 X3 ... xij Xj ... xik Xk$$$

    $$$ $$$

    $$$

    xn2 X2 xn3 X3 ... xnj Xj ... xnk Xk

    =

    xc12 xc13 ... x

    c1j ... x

    c1k

    xc

    22

    xc

    23

    ... xc

    2j

    ... xc

    2k

    xc32 xc33 ... x

    c3j ... x

    c3k

    $$$ $$$

    $$$ $$$

    xci2 x

    ci3 ... x

    cij

    ... xcik

    $$$ $$$

    $$$ $$$

    xcn2 xcn3 ... x

    cnj ... x

    cnk

    avecY et Xj, j= 2, 3...k sont les mo*ennes des variales

    . (XcXc)(k1,k1)=

    xc2i2 xci2xci3 ... xci2xcij ... xci2xcikxi2xi3

    xc2i3 ...

    xcijx

    ci3 ...

    xci3x

    cik

    $$$ $$$

    $ $ $ $$$

    $$$xci2x

    cij

    xcijx

    ci3 ...

    xc2ij ...

    xcijx

    cik

    $$$ $$$

    $$$ $ $ $

    $$$xci2x

    cik

    xci3x

    cik

    xcijx

    cik ...

    xc2ik

    . XcYc(k1,1)=

    xci2y

    cixci3yci

    $$$xcijy

    ci

    $$$xciky

    ci

    2.2.2 Proprits des Esti$ateurs M%

    Le t'orme de Gauss1Mar

  • 7/24/2019 chap2_eco_ief_lamac.pdf

    6/12

    8= CHAPITRE 2. MODELES DE REGRESSION MULTIPLES

    modles multiples par la mt'ode M%O donne des estimateurs linaires) sans iais convergents et

    relativement e>caces 4?LUE9$

    inarit 5 Le vecteur estim est (onction linaire de @ 5 = AY ou la matrice est A =(X X)

    1X

    *on +iais5 E() =E,cacit " On considre un autre estimateur linaire sans iais de :

    =CYE() = :

    On dmontre #uevar() var() est une matrice semi1d7nie positive alorsest plus e>cace

    #ueOn note #ue

    var() =2 (X X)1 48$89var(c ) =2 (XcXc)1 48$A9

    2.3 'alidation tatistiue

    2.3.1 est de i/ni0catiit ndiiduelle et nteralle de %on0ance

    %omme pour les modles simples) on a les rsultats suivants 5

    .j N(j, 2j ) pourj = 1, 2...k

    .

    e2i2

    2(n k)

    .j j j T(n k)

    . Pour le test

    H0 : j = 0H1 : j = 0 la rgle de dcision 5 on re3ette H0 si

    j j

    > t1/2. L&intervalle de con7ance est IC1(j) =

    j t1/2 j

    2.3.2 nalyse de la 'ariance

    La variation totale de Y est mesure par la somme des carrs des carts ! sa mo*enne 5

    SC T =n

    i=1

    yi Y

    2$ La variation e"pli#ue par X correspond ! la variation deY) c&est la

  • 7/24/2019 chap2_eco_ief_lamac.pdf

    7/12

    2.3. VALIDATION STATISTIQUE 8+

    somme des carrs des carts des valeurs estimes ! la mo*enne estime 5SC E=

    ni=1

    (yiY)2$ La

    variance e"pli#ue par l&alea correspond ! la variance du vecteur des rsidus 5

    . SC T =n

    i=1

    yi Y

    2=YcYc =Y Y nY

    2

    . SC E=n

    i=1

    (yi Y)2 =YcYc =YY nY2 =cXcXcc. SC R=

    ni=1

    e2i =. SC T =SCE+ SCR

    2.3.3 est de i/ni0catiit loale

    Le test de signi7cativit gloale consiste ! tester la validit du modle dans son ensemle$ Il

    s&agit de tester s&il e"iste au moins une variale signi7cative$ %eci revient ! tester 5 H0 :

    c = 0

    H1 : c = 0

    H0 : 2= 3=...k = 0H1 : j {2...k} tq j = 0

    %e test est un cas particulier des tests de s*stmes de contraints Linaires sur les paramtres$

    Binsi on prsent d&aord ces tests de contraints pour dduire ensuite la rgle de dcision pour le

    test de signi7cativit gloale$

    est d6un yst$e de %ontraints inaires sur les Para$tres

    On considre le modleyi= 1 + 2xi2 + 3xi2 + ...kxik + ei i= 1, 2...n) et soitR une matrice !

    qlignes etk colonnes etr est un vecteur !qlments) on c'erc'e ! tester le s*stme ! qcontraints

    suivant 5

    H0:R=r

    Sous l&'*pot'se de normalit des erreurs) l&estimateur M%O du vecteurest un vecteur normale 5

    N(,2 (X X)1) 48$C9Il dcoule #ue sous l&'*pot'seH0 : R=r

    W =

    R r R2 (X X)1 R1 R r 2(q) 48$,9

  • 7/24/2019 chap2_eco_ief_lamac.pdf

    8/12

    88 CHAPITRE 2. MODELES DE REGRESSION MULTIPLES

    la variance 2 tant inconnue) on ne peut pas utiliser la (onction de luation##) mais) sac'ant

    #ue

    e2i2

    =SC R

    2 2(n k) alors on dduit

    Wq

    SC R

    2 (n k)

    !(q, n k) d&o/

    ! =

    R r R (XX)1 R1 R r q

    SCR(n k) !(q, n k) 48$-9

    Lors#ue on considre le modle centr 5Yc = Xcc + , pour tester H0:Rc =r la rgle de

    dcision au ris#ue ", consiste ! re3eterH0 si ! > #1(q, n k)

    est de i/ni0catiit loale

    L&'*pot'se de ase pour le test de signi7cativit gloale est 5 H0 :c = 0 H0 :R

    c =r) o/

    R= Ik1) r= 0et q= k 1$ Blors on peut utiliser la statisti#ue par luation##en remplaant

    ces lments 5

    ! =

    Rc r R (XcXc)1 R1 Rc r q

    SCR(n k) =

    c (XcXc)c(k 1)SCR(n k)

    = SCE(k 1)

    SCR(n k)

    Binsi) pour tester la signi7cativit gloale d&un modle de rgression on re3ette H0 4le modle

    est gloalement signi7cati(9) si !cal = SCE(k 1)

    SCR(n k)> #1(k 1, n k)$

    Pouoir E7plicatie des $odles $ultiples

    80nition-1 5 Le pouvoir e"plicative d&un modle multiple est la part de la variance de @

    e"pli#uer par le modle) il est mesure par le coe>cient de dtermination R2 =SC E

    SC T

    80nition-2 "Le coe>cient de dtermination a3ustR2

    = 1 (n 1)(1 R2)

    (n k)

    tient compte du

    nomre de variales$ En eet) le principal d(aut du R2est de croFtre avec le nomre de variales

    e"plicatives$ Or) on sait #u&un e"cs de variales produit des modles peu roustes$ Le coe>cient de

    dtermination a3ust tient compte du nomre de variales$ %&est pour#uoi on s&intresse davantage

    ! cet indicateur #u&auR2 notamment pour comparer deu" modles #ui n&ont pas le m2me nomre

    de variales e"plicatives$

    9e$arues "

    +$ !cal = R2

    1 R2(n k)

    (k 1)

    8$ R2

    a3ust est tou3ours in(rieur au R2

  • 7/24/2019 chap2_eco_ief_lamac.pdf

    9/12

    2.4. PRVISION 8A

    2.4 Prision

    La valeur de Y ! la priode t > T est donne par 5yp

    t =

    1

    +2

    xp

    t

    2

    +3

    xp

    t

    3

    +...k

    xp

    t

    k

    +

    ept =Xpt+ e

    pt ou X

    pt = [1, x

    pt2, x

    pt3...x

    ptk] . La valeur prvisionnelle de Y et l&erreur de prvision

    sont respectivement 5

    ypt = Xpt 48$69ept =ypt ypt 48$:9

    Si le modle est estim par la mt'ode M%O) les prvisions seront sans iais 5 E(ept) = 0E(ept) =E(ypt ypt) =EXpt ept= 0La prvision par intervalle de con7ance utilise) comme pour les modles simples le (ait #ue 5

    yptypt2ep

    t

    T(n 2) alors

    IC1(ypt) =

    ypt t1/22ept

    48$;9

    o/2ept =var(ept) =varXpt ept= var Xpt + var (ept)=Xptvar

    (Xpt) + var (ept) =2 Xpt(XX)1 (Xpt) + 1 .

  • 7/24/2019 chap2_eco_ief_lamac.pdf

    10/12

  • 7/24/2019 chap2_eco_ief_lamac.pdf

    11/12

    2.4. PRVISION 8,

    Exercice 3

    On considre le modle& 5yi = 1 + 2xi2 + +3xi3 + i i= 1, 2....100) o/Y =salaire nominal H

    X2 = e"prience pro(essionnelle X3 = niveau d&instruction$ Les donnes relatives au" variales

    e"plicatives sont rsumes parXcXc =

    64 44 1

    HLuation estime du modle & estM :yi= 258, 5

    (13,01)

    + 25, 4(1,30)

    xi2+ 185, 9(10,41)

    xi3 i= 1, 2...100

    Les valeurs entre parent'ses sont les carts1t*pes estims des paramtres

    +$ Donner une interprtation conomi#ue de la valeur estime de 1$

    8$ Estimer la variance des rsidus$

    A$ %alculer le coe>cient de dtermination du modle$

    C$ uelle est la valeur anticipe du salaire d&un emplo*er #ui a += ans d&e"prience pro(ession1

    nelle et dont le niveau d&instruction est gale ! A 4niveau suprieur9

    Exercice 3

    Partie

    On se propose d&identi7er les (acteurs dterminants dans l&volution de la consommation d&es1

    sence$ On utilise des donnes annuelles allant de +;:= ! 8==- relatives au" variales suivantes 5

    . Y 5 La consommation d&essence en terme rel H

    . X2 5 L&indice du pri" de l&essence H

    . X3 5 L&indice des pri" des nouvelles voitures H

    . X4 5 L&indice des pri" des iens durales 5JC

    . X5 5 Revenue relle disponile H

    Les donnes relatives ! ses variales son rsumes par (XcXc)1 = 102

    0, 708 2, 555 10, 233

    30, 482 84, 730

    259, 490

    ) XcYc =

    846

    339

    193

    1560

    ) YcYc = 50000

  • 7/24/2019 chap2_eco_ief_lamac.pdf

    12/12

    8- CHAPITRE 2. MODELES DE REGRESSION MULTIPLES

    +$ Estimer et tester au ris#ue de , la signi7cativit des coe>cients des variales e"plicatives

    8$ Kuger conomi#uement ces coe>cients

    A$ Tester l&'*pot'se #u&une augmentation des pri" des iens durales est #uivalente ! une

    aise de revenue disponile

    C$ Tester au ris#ue de += le s*stme des contraints suivant 5H0:

    3= 42

    73+4 = 1

    2+ 3=4

    Partie

    On se propose de savoir si les pri" du transport pulic ont un eet sur la consommation

    d&essence H on a3oute l&indice des pri" du transport pulic 4X69 comme variale e"plicative

    au modle prcdent$ Le rsultat d&estimation est

    c,$ 4a9 Tester la signi7cativit gloale du modle

    49 %alculer le coe>cient de dtermination de la deu"ime rgression

    4c9 Dresser le taleau d&anal*se de la variance

    -$ %alculer la part de X5 dans l&e"plication du modle

    6$ Est1ce #ue l&a3out de la varialeX5 amliore la #ualit d&a3ustement du modle

    :$ Tester si cette amlioration est signi7cative