29
Econométrie des données de panel Guillaume Horny * * Banque de France Master 2 MASERATI Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 1 / 29

Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

  • Upload
    others

  • View
    4

  • Download
    1

Embed Size (px)

Citation preview

Page 1: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Econométrie des données de panel

Guillaume Horny∗

∗Banque de France

Master 2 MASERATI

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 1 / 29

Page 2: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Chapitre 3

Chapitre 3

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 2 / 29

Page 3: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Chapitre 3

Plan

1 Introduction

2 Estimateurs de classe λ

3 Modèle à erreurs corrélées

4 Repérer le problème

5 Les solutions au problème

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 3 / 29

Page 4: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Introduction

Plan

1 Introduction

2 Estimateurs de classe λ

3 Modèle à erreurs corrélées

4 Repérer le problème

5 Les solutions au problème

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 4 / 29

Page 5: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Introduction

Variable aléatoire ou paramètre ?

Modèle de base :yit = x

′itβ + αi + εit ,

On a vu que les αi peuvent être considérés comme des paramètres (modèleà effets fixes, chapitre 1) ou bien comme les réalisation d’une variablealéatoire (modèle à effets aléatoires, chapitre 2). Ce choix de modélisationconduit à faire des hypothèses différentes, aboutissant à des estimateursdifférents.

On va voir ici que tous les estimateurs vus précédemment appartiennent àune même famille : celle des estimateurs de classe λ.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 5 / 29

Page 6: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Estimateurs de classe λ

Plan

1 Introduction

2 Estimateurs de classe λ

3 Modèle à erreurs corrélées

4 Repérer le problème

5 Les solutions au problème

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 6 / 29

Page 7: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Estimateurs de classe λ

Estimateurs de classe λ

Un estimateur de classe λ est tel que :

β̂(λ) =[X′(W + λB)X

]−1X′(W + λB)Y ,

où :W = INT − X1(X

′1X1)

−1X′1. Cette matrice était notée MX1 dans le

chapitre 1, avec X1 les indicatrices d’individus,λ est un scalaire,B = X1(X

′1X1)

−1X′1.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 7 / 29

Page 8: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Estimateurs de classe λ

Retour sur l’estimateur de classe λ

Estimateur de classe λ :

β̂(λ) =[X′(W + λB)X

]−1X′(W + λB)Y .

On a :β̂(0) = β̂Within,β̂(1) = β̂OLS , car W = INT − B ,β̂(∞) = β̂Between,

β̂(

σ2w

σ2w+Tσ2

α

)= β̂GLS ,

β̂(

σ̂2w

σ̂2w+T σ̂2

α

)= β̂FGLS .

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 8 / 29

Page 9: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Estimateurs de classe λ

Estimateurs de classe λ : le cas between

Lorsque λ→∞, W devient négligeable par rapport à B . D’où :

β̂(λ) =[X′(λB)X

]−1X′(λB)Y

=[X′BX]−1

X′BY .

L’écriture ci-dessus n’est pas ce qu’on a fait de plus propremathématiquement. L’idée est juste que la composante intra-individuelleest écrasée par la composante inter-individuelle.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 9 / 29

Page 10: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Estimateurs de classe λ

Estimateurs de classe λ : les cas FGLS et GLS

Estimateur FGLSOn a vu dans le chapitre 2 que l’estimateur FGLS est équivalent àl’estimateur OLS du modèle transformé :

yit − λ̂yi . = (1− λ̂)β0 + (xit − λ̂xi .)′β + vit ,

où λ̂ est un estimateur convergent de λ = 1− σ2w/(Tσ

2α + σ2

w ).Estimateur GLSL’estimateur GLS est obtenu lorsqu’on dispose de la vraie valeur de λ.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 10 / 29

Page 11: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Modèle à erreurs corrélées

Plan

1 Introduction

2 Estimateurs de classe λ

3 Modèle à erreurs corrélées

4 Repérer le problème

5 Les solutions au problème

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 11 / 29

Page 12: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Modèle à erreurs corrélées

Principe général

On a vu que :sous l’hypothèse de modèle à effet fixe, c’est-à-dire de corrélationpotentielle entre les caractéristiques observables et inobservables, ondispose d’estimateurs basés sur des transformations des données quisont convergents mais pas efficacessous l’hypothèse de modèle à effet aléatoire, c’est-à-dire sousl’hypothèse d’absence de corrélation entre les caractéristiquesobservables et inobservables, on dispose d’un estimateur FGLSconvergent et efficace.

On cherche maintenant des estimateurs qui, lorsque les caractéristiquesinobservables sont corrélées avec les observables, resteront toujoursefficaces.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 12 / 29

Page 13: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Modèle à erreurs corrélées

Le problème

On repart du modèle à effets aléatoires :

yit = x′itβ + αi + wit .

On suppose cette fois-ci que les αi sont corrélés avec les variablesexplicatives :

E(αi |xi1, . . . , xiT ) 6= E(αi ).

Attention, il ne s’agit en aucune manière d’une conséquence des espérancesitérées !

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 13 / 29

Page 14: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Modèle à erreurs corrélées

Les hypothèses (1/2)

Les autres hypothèses sont valides, à quelques ajustements près :1 H1b : E(wit |xi1, . . . , xiT ) = 0, t = 1, . . . ,T ,

remplace H1a : E(εit |xi1, . . . , xiT , αi ) = 0, t = 1, . . . ,T .2 H2b : E(αi ) = 0,

remplace H2a : E(αi |xi1, . . . , xiT ) = E(αi ) = 03 H3 :

I E(α2i |xi1, . . . , xiT ) = σ2

α,I E

[(wi1, . . . ,wiT )(wi1, . . . ,wiT )

′ |xi1, . . . , xiT , αi

]= σ2

w IT .

On retrouve donc toujours la structure si spécifique de la matrice devariance du modèle à effet aléatoire.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 14 / 29

Page 15: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Modèle à erreurs corrélées

Les hypothèses (2/2)

La spécificité du modèle à erreurs corrélées est que :

E(yit |xi1, . . . , xiT ) = x′itβ + E(εit |xi1, . . . , xiT )

= x′itβ + E(αi |xi1, . . . , xiT ) + E(wit |xi1, . . . , xiT )

= x′itβ + E(αi |xi1, . . . , xiT )

6= x′itβ

Les caractéristiques inobservables affectent ici l’espérance conditionnelle deyit ainsi que sa variance (cette dernière par H3). Les inobservablesintroduisent :

des écarts dans les moyennes individuellesune surdispersion

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 15 / 29

Page 16: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Modèle à erreurs corrélées

Les conséquences du problème (1/4)

β̂(λ) =[X′(W + λB)X

]−1X′(W + λB)Y ,

D’où :

E[β̂(λ)] =E[[

X′WX + λX

′BX]−1

(X′W + λX

′B)(Xβ + ε)

]=E[[

X′WX + λX

′BX]−1

(X′W + λX

′B)Xβ

]+ E

[[X′WX + λX

′BX]−1

(X′W + λX

′B)ε

]=β + E

[[X′WX + λX

′BX]−1

(X′W + λX

′B)ε

].

Comme ε est corrélé avec X , on ne peut pas écrire E[f (X )ε] = E[f (X )]E[ε].

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 16 / 29

Page 17: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Modèle à erreurs corrélées

Les conséquences du problème (2/4)Poursuivons les calculs :

E[[X′WX + λX

′BX ]−1(X

′W+λX

′B)ε] =

E[[X′WX + λX

′BX ]−1X

′W (α+ w)

]+ E

[[X′WX + λX

′BX ]−1λX

′B(α+ w)

].

W est l’expression matricielle de la transformation within. Le produit Wαrevient donc à calculer pour chaque observation l’écart entre αi et samoyenne pour l’individu i (qui vaut αi ). Ainsi, Wα = 0. De plus,E(w) = 0. D’où la simplification :

E[[X′WX + λX

′BX ]−1(X

′W + λX

′B)ε]

=E[[X′WX + λX

′BX ]−1λX

′B(α+ w)

]=E[[X′WX + λX

′BX ]−1λX

′Bα]

+ E[[X′WX + λX

′BX ]−1λX

′Bw].

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 17 / 29

Page 18: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Modèle à erreurs corrélées

Les conséquences du problème (3/4)

Comme w est supposé sans corrélation avec les X :

E[[X′WX + λX

′BX ]−1λX

′Bw]= 0.

Ainsi :

E[[X′WX + λX

′BX ]−1(X

′W + λX

′B)ε]= E

[[X′WX + λX

′BX ]−1λX

′Bα].

Au final, on a :

E[β̂(λ)] = β + E[[X′WX + λX

′B]−1λX

′Bα].

Pour qu’un estimateur de la famille de classe λ soit sans biais, il faut que ledernier terme soit nul, ce qui arrive lorsque λ = 0.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 18 / 29

Page 19: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Modèle à erreurs corrélées

Convergence de β̂

Modèle supposéEffets fixes Effets aléatoires

Estimateur de β corr(α,Xk) 6= 0 corr(α,Xk) = 0Empilé Non-convergent ConvergentWithin Convergent ConvergentDifférence première Convergent ConvergentBetween Non-convergent ConvergentEffet aléatoire Non-convergent Convergent

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 19 / 29

Page 20: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Repérer le problème

Plan

1 Introduction

2 Estimateurs de classe λ

3 Modèle à erreurs corrélées

4 Repérer le problème

5 Les solutions au problème

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 20 / 29

Page 21: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Repérer le problème

Le test d’Hausman

L’objectif est de tester une hypothèse d’absence de corrélation. Selon sonacceptation ou son rejet, on va privilégier certains estimateurs plutôt qued’autres.

Jerry Hausman (1946-), actuellement professeurd’Economie au MIT. A étudié le secteur destélécommunication et les questions deconcurrence, de régulation et de taxation, entreautres. Sa contribution la plus connue est le testqui porte son nom, publié en 1978.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 21 / 29

Page 22: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Repérer le problème

Le test d’Hausman : l’idée générale

Nous sommes dans un cas de figure où il existe plusieurs manières d’estimerun modèle. Si une des hypothèses du modèle n’est pas vérifiée, certainsestimateurs seront convergents tandis que d’autres ne le seront plus. On vamesurer l’écart qu’il y a entre les deux estimations. Deux possibilités :

les deux estimations sont similaires, l’écart est proche de 0,l’hypothèse testée semble raisonnable,les deux estimations sont différentes, l’écart est significativementdifférent de 0, l’hypothèse testée ne semble pas satisfaite.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 22 / 29

Page 23: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Repérer le problème

Application à des données de panel

Sous l’hypothèse de corrélation entre les caractéristiques inobservables etles variables explicatives, l’estimateur FGLS n’est plus convergent alors quel’estimateur within reste convergent. On peut donc comparer les deuxestimations.

Si elles sont voisines, on peut accepter l’hypothèse d’exogénéité des Xpar rapport à α. On n’a donc pas de problème d’endogénéité des Xpar rapport au terme d’erreur composé.A l’inverse, si les deux estimations son très différentes, au moins l’unedes estimations n’est pas convergente et on rejette l’hypothèsed’exogénéité des X par rapport à α.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 23 / 29

Page 24: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Repérer le problème

Statistique de test

Dans le cas des panels, la statistique de test originelle est :

SH = (β̂within − β̂FGLS)[Var(β̂within)− Var(β̂FGLS)

]−1(β̂within − β̂FGLS).

Elle suit un χ2 à dim(β) degrés de libertés. Une statistique alternative a étéproposée par Hausman et Taylor en 1981 :

SHT = (β̂between−β̂within)[Var(β̂between) + Var(β̂within)

]−1(β̂between−β̂within).

Elle suit un χ2 à autant de degrés de libertés qu’il y a de variablesexplicatives dans le modèle après transformation within.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 24 / 29

Page 25: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Les solutions au problème

Plan

1 Introduction

2 Estimateurs de classe λ

3 Modèle à erreurs corrélées

4 Repérer le problème

5 Les solutions au problème

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 25 / 29

Page 26: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Les solutions au problème

Les solutions au problème

La présence de corrélation entre les αi et les xit implique une corrélationentre l’erreur composée et les variables explicatives. De ce point de vue, ils’agit d’un problème classique d’endogénéité. Différentes approches ont étéproposées :

“corriger” le modèle pour évacuer cette corrélation (différencepremière, transformation within...)avoir recours à des techniques de variables instrumentales

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 26 / 29

Page 27: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Les solutions au problème

Principe général des variables instrumentales

Y = Xβ + ε,E(X′ε) 6= 0.

Les erreurs sont corrélées avec les explicatives et les estimateurs habituelssont biaisés. L’idée est de trouver des variables Z , que l’on va appeler“instruments” telles que :

E(Z′ε) = 0, les instruments sont sans corrélation avec le terme

d’erreur. On dira alors qu’ils sont valides,E(Z

′X ) 6= 0, les instruments sont corrélés avec les variables

endogènes. S’ils ne le sont pas, on parlera d’instruments faibles.Chacune de ces deux propriétés peut être testée (test de Sargan, de Stocket Yogo...). Dans la pratique, trouver des variables Z satisfaisant ces deuxpropriétés est difficile et demande souvent de tester des centainesd’ensembles de variables candidates...

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 27 / 29

Page 28: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Les solutions au problème

Mise en oeuvre (1/2)Des dizaines de possibilités existent : doubles moindres carrés (2SLS),Hausman et Taylor (1981), Arellano et Bond (1991), Blundell et Bond(1998)...

Les 2SLS restent la méthode la plus intuitive, constituée de deux étapes :dans une première étape, on régresse les variables explicativesendogènes sur les instruments et les variables explicatives exogènes.On calcule les valeurs prédites des endogènes,dans une seconde étape, on régresse Y sur les valeurs prédites desendogènes et les variables exogènes.

Intuitivement, on remplace les variables problématiques par des valeursprédites avec les instruments. Si les instruments sont valides, les prévisionsseront sans corrélation avec ε. Si les instruments sont faibles, on peutmontrer que les résultats de deuxième étape seront peu précis et peurobustes (vraisemblance “plate” pour le modèle de la deuxième étape).

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 28 / 29

Page 29: Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf · 2020. 6. 16. · Econométrie des données de panel GuillaumeHorny Banque de France

Les solutions au problème

Mise en oeuvre (2/2)

Les subtilités sont nombreuses (correction de la matrice de variance lors dela deuxième étape, gestion des variables incluses/excluses, plusieurs testspossibles d’instruments faibles...). Dans le cas des variables instrumentales,le mieux est de ne jamais se lancer dans la programmation manuelle de cetype d’estimateurs et de toujours utiliser des routines préprogrammées etdéjà testées. A ma connaissance, Stata est le seul logiciel à proposer desfonctions pour un grand nombre de modèles, qui fournissent de surcroittous les critères et tests appropriés (routines ivreg2 et xtivreg2, àinstaller manuellement).

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 29 / 29