39
Econométrie des données de panel: Rappels Guillaume Horny * * Banque de France Master 2 MASERATI Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 1 / 39

New Econométrie des données de panel: Rappelshorny.economics.free.fr/panel_I/2_Rappels.pdf · 2020. 6. 16. · Econométriedesdonnéesdepanel:Rappels GuillaumeHorny Banque de France

  • Upload
    others

  • View
    1

  • Download
    1

Embed Size (px)

Citation preview

  • Econométrie des données de panel: Rappels

    Guillaume Horny∗

    ∗Banque de France

    Master 2 MASERATI

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 1 / 39

  • Rappels

    Rappels

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 2 / 39

  • Rappels

    Plan

    1 Outils mathématiques

    2 Espérance conditionnelle

    3 Le modèle de régression linéaire

    4 Propriétés d’estimateurs

    5 Propriétés de l’estimateur OLS

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 3 / 39

  • Outils mathématiques

    Plan

    1 Outils mathématiques

    2 Espérance conditionnelle

    3 Le modèle de régression linéaire

    4 Propriétés d’estimateurs

    5 Propriétés de l’estimateur OLS

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 4 / 39

  • Outils mathématiques

    Les sommesSoit {xi : i = 1, . . . , n} une suite de n nombres. Leur somme s’écrit :

    n∑i=1

    xi ≡ x1 + x2 + . . .+ xn,

    La somme a les propriété suivantes :Pour toute constante c , on a :

    n∑i=1

    c = nc ,

    n∑i=1

    cxi = cn∑

    i=1

    xi

    Pour a et b constants et {(xi , yi ) : i = 1, . . . , n}n∑

    i=1

    (axi + byi ) = an∑

    i=1

    xi + bn∑

    i=1

    yi

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 5 / 39

  • Outils mathématiques

    La moyenneLeur moyenne s’écrit :

    x. ≡1n

    n∑i=1

    xi

    Propriétés :la somme des écarts à la moyenne est nulle :∑

    i

    (xi − x.) =∑

    i

    xi −∑

    i

    x. =∑

    i

    xi − nx. = nx. − nx. = 0.

    on peut aussi montrer :∑i

    (xi − x.)2 =∑

    i

    x2i − nx2.

    ou encore : ∑i

    (xi − x.)(yi − y.) =∑

    i

    xiyi − nx.y.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 6 / 39

  • Espérance conditionnelle

    Plan

    1 Outils mathématiques

    2 Espérance conditionnelle

    3 Le modèle de régression linéaire

    4 Propriétés d’estimateurs

    5 Propriétés de l’estimateur OLS

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 7 / 39

  • Espérance conditionnelle

    EspéranceSoit X une variable discrète prenant les valeurs {x1, . . . , xk}. Sa densité deprobabilité est fX (). Son espérance est :

    E(X ) = x1fX (x1) + x2fX (x2) + . . .+ xk fX (xk) ≡K∑

    j=1

    xj fX (xj).

    Lorsque X est continue :

    E(X ) =∫ +∞−∞

    xfX (x)dx .

    Pour toute fonction g(.) de X , on a :

    E[g(X )] =∫ +∞−∞

    g(x)fX (x)dx .

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 8 / 39

  • Espérance conditionnelle

    Densité conditionnelle

    On s’intéresse généralement aux relations entre une variable aléatoire Y etune ou plusieurs autres. Supposons qu’il n’y ait qu’une seule autre variablealéatoire appelée X . L’influence de X sur Y est visible dans la distributionconditionnelle de Y sachant X .

    La densité de probabilité de Y conditionnellement à X est :

    fY |X (y |x) =fX ,Y (x , y)fX (x)

    ,∀x tel que fX (x) > 0.

    Lorsque X et Y sont discrètes :

    fY |X (y |x) = P(Y = y |X = x).

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 9 / 39

  • Espérance conditionnelle

    Densité conditionnelle : Illustration

    Source : Angrist and Pischke (2009) : Mostly Harmless Econometrics,Princeton University Press.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 10 / 39

  • Espérance conditionnelle

    Espérance conditionnelleSupposons que l’on connaisse fY /X (.) et la valeur x prise par X . On peutalors calculer E(Y |X = x), souvent notée E(Y |X ). Généralement, lorsque xchange, E(Y |X ) change également.

    Pour Y continue :

    E(Y |X ) =∫ +∞−∞

    yfY |X (y |x)dy .

    Pour Y discrète, on a :

    E(Y |X ) =K∑

    j=1

    yj fY |X (yj |x).

    ⇒ moyenne pondérée des yj , dont les poids dépendent ici de la valeur prisepar X .

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 11 / 39

  • Espérance conditionnelle

    Espérance conditionnelle : Exemple

    Supposons que (X ,Y ) représente l’ensemble des salariés, avec X unemesure des années d’étude et Y le niveau de salaire. Le salaire moyen despersonnes ayant atteint le bac (étudié 12 ans) est mesuré parE(Y |X = 12).

    On peut calculer le salaire moyen pour différentes valeurs de X et voir ainsicomment le salaire est relié au niveau d’études, et reporter les résultatsdans un tableau avec une ligne par niveau d’étude.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 12 / 39

  • Espérance conditionnelle

    Espérance conditionnelle : ExempleOn peut parfois supposer que l’espérance conditionnelle prend la formed’une fonction linéaire en X .

    Source : Angrist and Pischke (2009) : Mostly Harmless Econometrics,Princeton University Press.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 13 / 39

  • Espérance conditionnelle

    Espérance conditionnelle : Exemple

    Supposons que l’espérance conditionnelle est linéaire :

    E(salaire|etudes) = β0 + β1etudes.

    Si cette hypothèse est raisonnable, alors chaque année supplémentaired’étude rapporte en moyenne β1. Le salaire moyen après 17 ans d’étudesest β0 + 17β1.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 14 / 39

  • Espérance conditionnelle

    Propriétés des espérances conditionnelles

    E(Y |X ) = E(Y ) ssi X et Y sont indépendantsLoi des espérances itérées : EX [EY |X (Y |X )] = EY (Y ).

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 15 / 39

  • Espérance conditionnelle

    Preuve de la loi des espérances itérées

    EX [EY |X (Y |X )] =∫ +∞−∞

    EY |X (Y |X = u)fX (u)du.

    =

    ∫ +∞−∞

    [∫ +∞−∞

    tfY (t|X = u)dt]fX (u)du

    =

    ∫ +∞−∞

    ∫ +∞−∞

    tfY (t|X = u)fX (u)dudt

    =

    ∫ +∞−∞

    t[∫ +∞−∞

    fY (t|X = u)fX (u)du]dt

    =

    ∫ +∞−∞

    t[∫ +∞−∞

    fXY (u, t)du]dt

    =

    ∫ +∞−∞

    tfY (t)dt

    = E(Y ).

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 16 / 39

  • Espérance conditionnelle

    Illustration de la loi des espérances itéréesSoit Y = salaire et X = etudes. Supposons que :

    E(salaire|etudes) = 1130+ 50etudes.

    La loi des espérances itérées implique :

    E(salaire) = E(1130+ 50etudes)= 1130+ 50E(etudes).

    On a de plus E(etudes) = 12. Alors :

    E(salaire) = 1130+ 50 ∗ 12 = 1730.

    Note : E(salaire|etudes) = g(etudes). Elle dépend de etude et pas desalaire !

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 17 / 39

  • Espérance conditionnelle

    La décomposition en espérance conditionnelle

    Grâce à loi des espérances itérées, on peut décomposer n’importe quellevariable aléatoire de la manière suivante :

    Y = E(Y |X ) + �,

    où :1 E(�|X ) = 0,2 � est sans corrélation avec toute fonction de X .

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 18 / 39

  • Espérance conditionnelle

    Preuve des propriétés des résidus dans la décomposition enespérance conditionnelle

    1 Preuve de E(�|X ) = 0

    E(�|X ) = E [Y − E(Y |X )|X ] = E(Y |X )− E(Y |X ) = 0.

    2 Preuve de l’absence de corrélationPour toute fonction h(.) quelconque, on a :

    E(h(X )�) = E [E(h(X )�|X )] (loi des espérances itérées)= E [h(X )E(�|X )]= 0 (car E(�|X ) = 0)

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 19 / 39

  • Le modèle de régression linéaire

    Plan

    1 Outils mathématiques

    2 Espérance conditionnelle

    3 Le modèle de régression linéaire

    4 Propriétés d’estimateurs

    5 Propriétés de l’estimateur OLS

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 20 / 39

  • Le modèle de régression linéaire

    Modèle

    Partant de la décomposition d’une variable en son espérance conditionnelle(Y = E(Y |X ) + �), le modèle linéaire revient à considérer que l’espéranceconditionnelle est une fonction linéaire de X.

    Le modèle linéaire s’écrit pour l’individu i(i = 1, . . . ,N) :

    yi = β0 + β1xi1 + . . .+ βKxiK + �it .

    En empilant les N observations, on obtient son écriture matricielle :

    Y = Xβ + �,

    où Y est un vecteur (Nx1), X une matrice Nx(K + 1), β un vecteur dedimension ((K + 1)x1) et � un vecteur (Nx1).

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 21 / 39

  • Le modèle de régression linéaire

    Estimateur OLS

    Comment trouver les valeurs de β permettant de minimiser∑

    i (yi − xiβ)2 ?

    La condition de premier ordre de la minimisation par rapport à β de∑i (yi − xiβ)2 s’écrit sous forme matricielle :

    X ′(Y − X β̂) = 0.

    Elle a pour solution :β̂ = (X ′X )−1X ′Y .

    Note : c’est uniquement lorsque X est une matrice carrée qu’on peut écrire

    β̂ = (X ′X )−1X ′Y = X−1(X ′)−1X ′Y = X−1Y .

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 22 / 39

  • Le modèle de régression linéaire

    Estimateur OLS

    β̂ = (X ′X )−1X ′Y

    =

    ∑N

    i=1(x1i )

    2 ∑Ni=1 x

    1i x

    2i . . .

    ∑Ni=1 x

    1i x

    Ki∑N

    i=1 x2i x

    1i∑N

    i=1(x2i )

    2 ......∑N

    i=1 xKi x

    1i . . .

    ∑Ni=1(x

    Ki )

    2

    −1

    ∑Ni=1 x

    1i yi∑N

    i=1 x2i yi

    ...∑Ni=1 x

    Ki yi

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 23 / 39

  • Le modèle de régression linéaire

    Propriété : absence de corrélation après estimation entre lesX et les résidusPar la décomposition de toute variable aléatoire en Y = E(Y |X ) + �, onsait déjà que les résidus sont sans corrélation avec X .

    On peut le vérifier également avec les conditions de premier ordre pourβ = β̂, qui s’écrivent :

    X ′(Y − X β̂) = 0.⇔ X ′�̂ = 0.

    i x1i �̂i

    ...∑i x

    Ki �̂i

    = 0⇔ cov(X , �̂) = 0.

    Après estimation, la covariance entre n’importe quelle variable explicativeet les résidus OLS est toujours nulle, par construction.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 24 / 39

  • Propriétés d’estimateurs

    Plan

    1 Outils mathématiques

    2 Espérance conditionnelle

    3 Le modèle de régression linéaire

    4 Propriétés d’estimateurs

    5 Propriétés de l’estimateur OLS

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 25 / 39

  • Propriétés d’estimateurs

    Propriétés à distance finie d’un estimateur

    un estimateur est sans biais (unbiased) ssi :

    E(β̂) = β.

    Si on évalue β̂ avec différents échantillons, chacun comprenant unnombre fini d’observation, la moyenne des estimations correspondra àla vraie valeur du paramètre.un estimateur sans biais est efficace (efficient) s’il est de varianceminimale.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 26 / 39

  • Propriétés d’estimateurs

    Illustration de l’absence de biais

    On demande au hasard à des gens dans la rue le prix d’une voiture quevous leur montrez. Le prix de la voiture est X , et on note Xn la moyennedes prix donnés par les différentes personnes. Cette moyenne se rapprocherade X au fur et à mesure que vous interrogez de plus en plus de personnes

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 27 / 39

  • Propriétés d’estimateurs

    Pourquoi distinguer à distance finie et propriétésasymptotiques ?

    Certains estimateurs sont biaisés mais convergent, avec un biais négligeableen présence de grands échantillons. Lorsqu’ils sont (beaucoup) plus précisque des estimateurs sans biais, ils méritent qu’on s’y intéresse.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 28 / 39

  • Propriétés d’estimateurs

    Propriétés asymptotiques : convergence en probabilité

    Convergence en probabilités : Une suite {Xn} de variables aléatoiresconverge en probabilité vers une constante (non-aléatoire) X si, pour tout� > 0 :

    limn→∞

    Pr(|Xn − X | ≥ �) = 0.

    La constante X est appelée la probabilité limite de Xn, que l’on noteégalement :

    p limn→∞

    Xn = X .

    L’intuition est que la probabilité d’un événement inhabituel se rapproche de0 au fur et à mesure que l’on augmente le nombre de tirages.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 29 / 39

  • Propriétés d’estimateurs

    Illustration de la convergence en probabilité

    Exemples : Une personne s’entraine avec un ballon de basket à marquerdes paniers à 3 points. On note Xn son score au n-ème tire. Au fil desentraînements, son adresse augmente et il en marque de plus en plussouvent. La probabilité qu’il ne marque pas 3 points diminue au fil dutemps, et Xn converge en probabilité vers X = 3 (après des années depratique !).

    Note : on retrouve la convergence en probabilité dans des contextes qui nesont pas nécessairement reliés à la loi des grands nombres.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 30 / 39

  • Propriétés d’estimateurs

    Propriétés asymptotiques d’un estimateur

    un estimateur est convergent (consistent) ssi :

    p limn→∞

    (β̂ − β) = 0,

    où p lim est la convergence en probabilitésIl existe différente notions de convergence. On se concentre ici sur laconvergence en probabilité, car lorsqu’un estimateur converge enprobabilité vers la vraie valeur, il est asymptotiquement sans biaisun estimateur asymptotiquement sans biais est efficace (efficient) s’ilest de variance minimale.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 31 / 39

  • Propriétés de l’estimateur OLS

    Plan

    1 Outils mathématiques

    2 Espérance conditionnelle

    3 Le modèle de régression linéaire

    4 Propriétés d’estimateurs

    5 Propriétés de l’estimateur OLS

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 32 / 39

  • Propriétés de l’estimateur OLS

    Propriété : Absence de biais de l’estimateur OLS

    β̂ = (X ′X )−1X ′Y

    = (X ′X )−1X ′(Xβ + �)

    = (X ′X )−1X ′Xβ + (X ′X )−1X ′�

    = β + (X ′X )−1X ′�.

    Si on suppose E(�|X ) = 0, alors :

    E(β̂|X ) = β + (X ′X )−1X ′E(�|X )= β.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 33 / 39

  • Propriétés de l’estimateur OLS

    Variance de l’estimateur OLS (1/3)Sous l’hypothèse d’homoscédasticité (E(�2i |Xi ) = σ2,∀i) :

    var(β̂|X ) = var[(X ′X )−1X ′Y |X ]= var[β + (X ′X )−1X ′�̂|X ]= var[(X ′X )−1X ′�̂|X ]= (X ′X )−1X ′var(�̂|X )X (X ′X )−1

    = (X ′X )−1X ′(σ̂2Id)X (X ′X )−1

    = σ̂2(X ′X )−1X ′X (X ′X )−1

    = σ̂2(X ′X )−1.

    Un estimateur sans biais de la variance est :

    σ̂2 =�̂′�̂

    N − K − 1.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 34 / 39

  • Propriétés de l’estimateur OLS

    Variance de l’estimateur OLS (2/3)

    La variance de l’estimateur OLS :diminue avec Ndiminue avec

    ∑i (x

    ki )

    2

    augmente avec �augmente avec K

    Voilà pourquoi l’estimateur est plus précis avec de grands échantillons, etlorsqu’on ajoute des explicatives qui séparent fortement les observations.À l’inverse, ajouter des variables qui ne distinguent pas vraiment lesobservations les unes des autres, ou qui ne permettent pas de réduire leserreurs, n’améliore pas la précision. Elles peuvent même la réduire via lahausse de K .

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 35 / 39

  • Propriétés de l’estimateur OLS

    Variance de l’estimateur OLS (3/3)

    L’hypothèse d’hétéroscédasticité est E(�2i |Xi ) = σ2i 6= σ2j pour i 6= j .Intuitivement, si l’espérance conditionnelle n’est pas linéaire mais qu’onl’approche avec un modèle linéraire, alors la qualité de l’approximation vadépendre de Xi . Les résidus seront plus grands là où l’approximation serade moins bonne qualité.

    En présence d’hétéroscédasticité, σ2Id n’est plus un estimateur convergentde var(�).

    White (1980) montre qu’un estimateur convergent de var(�) est :

    1N − K − 1

    ∑i

    �2i xix′i ,

    où xi est (Kx1). On l’appelle l’estimateur robuste.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 36 / 39

  • Propriétés de l’estimateur OLS

    Qu’est ce que l’autocorrélation des erreurs ?On a une autocorrélation des erreurs lorsqu’elles tendent à être corréléesentre elles dans le temps.Exemple d’autocorrélation positive des résidus :

    Source : Greene (2003), Econometric analysis, Prentice Hall.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 37 / 39

  • Propriétés de l’estimateur OLS

    Théorème de Gauss-Markov

    Sous les hypothèses E(�|X ) = 0 et d’homoscédasticité, on a :

    Théorème : L’estimateur OLS est l’estimateur linéaire sans biais de pluspetite variance.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 38 / 39

  • Propriétés de l’estimateur OLS

    Propriété : Normalité asymptotique

    Sous l’hypothèse :� ∼ N(0, σ2).

    On a :β̂|X ∼ N(β, σ2(X ′X )−1).

    Sous l’hypothèse de modèle linéaire à erreurs gaussienneshomoscédastiques, on peut montrer que l’estimateur OLS est un estimateurdu maximum de vraisemblance.

    Guillaume Horny (Banque de France) Econométrie des panels (rappels) 2018 39 / 39