Econométrie des données de panel - Guillaume Hornyhorny.economics.free.fr/panel_I/5_chap_3.pdf ·...

Preview:

Citation preview

Econométrie des données de panel

Guillaume Horny∗

∗Banque de France

Master 2 MASERATI

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 1 / 29

Chapitre 3

Chapitre 3

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 2 / 29

Chapitre 3

Plan

1 Introduction

2 Estimateurs de classe λ

3 Modèle à erreurs corrélées

4 Repérer le problème

5 Les solutions au problème

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 3 / 29

Introduction

Plan

1 Introduction

2 Estimateurs de classe λ

3 Modèle à erreurs corrélées

4 Repérer le problème

5 Les solutions au problème

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 4 / 29

Introduction

Variable aléatoire ou paramètre ?

Modèle de base :yit = x

′itβ + αi + εit ,

On a vu que les αi peuvent être considérés comme des paramètres (modèleà effets fixes, chapitre 1) ou bien comme les réalisation d’une variablealéatoire (modèle à effets aléatoires, chapitre 2). Ce choix de modélisationconduit à faire des hypothèses différentes, aboutissant à des estimateursdifférents.

On va voir ici que tous les estimateurs vus précédemment appartiennent àune même famille : celle des estimateurs de classe λ.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 5 / 29

Estimateurs de classe λ

Plan

1 Introduction

2 Estimateurs de classe λ

3 Modèle à erreurs corrélées

4 Repérer le problème

5 Les solutions au problème

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 6 / 29

Estimateurs de classe λ

Estimateurs de classe λ

Un estimateur de classe λ est tel que :

β̂(λ) =[X′(W + λB)X

]−1X′(W + λB)Y ,

où :W = INT − X1(X

′1X1)

−1X′1. Cette matrice était notée MX1 dans le

chapitre 1, avec X1 les indicatrices d’individus,λ est un scalaire,B = X1(X

′1X1)

−1X′1.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 7 / 29

Estimateurs de classe λ

Retour sur l’estimateur de classe λ

Estimateur de classe λ :

β̂(λ) =[X′(W + λB)X

]−1X′(W + λB)Y .

On a :β̂(0) = β̂Within,β̂(1) = β̂OLS , car W = INT − B ,β̂(∞) = β̂Between,

β̂(

σ2w

σ2w+Tσ2

α

)= β̂GLS ,

β̂(

σ̂2w

σ̂2w+T σ̂2

α

)= β̂FGLS .

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 8 / 29

Estimateurs de classe λ

Estimateurs de classe λ : le cas between

Lorsque λ→∞, W devient négligeable par rapport à B . D’où :

β̂(λ) =[X′(λB)X

]−1X′(λB)Y

=[X′BX]−1

X′BY .

L’écriture ci-dessus n’est pas ce qu’on a fait de plus propremathématiquement. L’idée est juste que la composante intra-individuelleest écrasée par la composante inter-individuelle.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 9 / 29

Estimateurs de classe λ

Estimateurs de classe λ : les cas FGLS et GLS

Estimateur FGLSOn a vu dans le chapitre 2 que l’estimateur FGLS est équivalent àl’estimateur OLS du modèle transformé :

yit − λ̂yi . = (1− λ̂)β0 + (xit − λ̂xi .)′β + vit ,

où λ̂ est un estimateur convergent de λ = 1− σ2w/(Tσ

2α + σ2

w ).Estimateur GLSL’estimateur GLS est obtenu lorsqu’on dispose de la vraie valeur de λ.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 10 / 29

Modèle à erreurs corrélées

Plan

1 Introduction

2 Estimateurs de classe λ

3 Modèle à erreurs corrélées

4 Repérer le problème

5 Les solutions au problème

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 11 / 29

Modèle à erreurs corrélées

Principe général

On a vu que :sous l’hypothèse de modèle à effet fixe, c’est-à-dire de corrélationpotentielle entre les caractéristiques observables et inobservables, ondispose d’estimateurs basés sur des transformations des données quisont convergents mais pas efficacessous l’hypothèse de modèle à effet aléatoire, c’est-à-dire sousl’hypothèse d’absence de corrélation entre les caractéristiquesobservables et inobservables, on dispose d’un estimateur FGLSconvergent et efficace.

On cherche maintenant des estimateurs qui, lorsque les caractéristiquesinobservables sont corrélées avec les observables, resteront toujoursefficaces.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 12 / 29

Modèle à erreurs corrélées

Le problème

On repart du modèle à effets aléatoires :

yit = x′itβ + αi + wit .

On suppose cette fois-ci que les αi sont corrélés avec les variablesexplicatives :

E(αi |xi1, . . . , xiT ) 6= E(αi ).

Attention, il ne s’agit en aucune manière d’une conséquence des espérancesitérées !

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 13 / 29

Modèle à erreurs corrélées

Les hypothèses (1/2)

Les autres hypothèses sont valides, à quelques ajustements près :1 H1b : E(wit |xi1, . . . , xiT ) = 0, t = 1, . . . ,T ,

remplace H1a : E(εit |xi1, . . . , xiT , αi ) = 0, t = 1, . . . ,T .2 H2b : E(αi ) = 0,

remplace H2a : E(αi |xi1, . . . , xiT ) = E(αi ) = 03 H3 :

I E(α2i |xi1, . . . , xiT ) = σ2

α,I E

[(wi1, . . . ,wiT )(wi1, . . . ,wiT )

′ |xi1, . . . , xiT , αi

]= σ2

w IT .

On retrouve donc toujours la structure si spécifique de la matrice devariance du modèle à effet aléatoire.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 14 / 29

Modèle à erreurs corrélées

Les hypothèses (2/2)

La spécificité du modèle à erreurs corrélées est que :

E(yit |xi1, . . . , xiT ) = x′itβ + E(εit |xi1, . . . , xiT )

= x′itβ + E(αi |xi1, . . . , xiT ) + E(wit |xi1, . . . , xiT )

= x′itβ + E(αi |xi1, . . . , xiT )

6= x′itβ

Les caractéristiques inobservables affectent ici l’espérance conditionnelle deyit ainsi que sa variance (cette dernière par H3). Les inobservablesintroduisent :

des écarts dans les moyennes individuellesune surdispersion

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 15 / 29

Modèle à erreurs corrélées

Les conséquences du problème (1/4)

β̂(λ) =[X′(W + λB)X

]−1X′(W + λB)Y ,

D’où :

E[β̂(λ)] =E[[

X′WX + λX

′BX]−1

(X′W + λX

′B)(Xβ + ε)

]=E[[

X′WX + λX

′BX]−1

(X′W + λX

′B)Xβ

]+ E

[[X′WX + λX

′BX]−1

(X′W + λX

′B)ε

]=β + E

[[X′WX + λX

′BX]−1

(X′W + λX

′B)ε

].

Comme ε est corrélé avec X , on ne peut pas écrire E[f (X )ε] = E[f (X )]E[ε].

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 16 / 29

Modèle à erreurs corrélées

Les conséquences du problème (2/4)Poursuivons les calculs :

E[[X′WX + λX

′BX ]−1(X

′W+λX

′B)ε] =

E[[X′WX + λX

′BX ]−1X

′W (α+ w)

]+ E

[[X′WX + λX

′BX ]−1λX

′B(α+ w)

].

W est l’expression matricielle de la transformation within. Le produit Wαrevient donc à calculer pour chaque observation l’écart entre αi et samoyenne pour l’individu i (qui vaut αi ). Ainsi, Wα = 0. De plus,E(w) = 0. D’où la simplification :

E[[X′WX + λX

′BX ]−1(X

′W + λX

′B)ε]

=E[[X′WX + λX

′BX ]−1λX

′B(α+ w)

]=E[[X′WX + λX

′BX ]−1λX

′Bα]

+ E[[X′WX + λX

′BX ]−1λX

′Bw].

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 17 / 29

Modèle à erreurs corrélées

Les conséquences du problème (3/4)

Comme w est supposé sans corrélation avec les X :

E[[X′WX + λX

′BX ]−1λX

′Bw]= 0.

Ainsi :

E[[X′WX + λX

′BX ]−1(X

′W + λX

′B)ε]= E

[[X′WX + λX

′BX ]−1λX

′Bα].

Au final, on a :

E[β̂(λ)] = β + E[[X′WX + λX

′B]−1λX

′Bα].

Pour qu’un estimateur de la famille de classe λ soit sans biais, il faut que ledernier terme soit nul, ce qui arrive lorsque λ = 0.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 18 / 29

Modèle à erreurs corrélées

Convergence de β̂

Modèle supposéEffets fixes Effets aléatoires

Estimateur de β corr(α,Xk) 6= 0 corr(α,Xk) = 0Empilé Non-convergent ConvergentWithin Convergent ConvergentDifférence première Convergent ConvergentBetween Non-convergent ConvergentEffet aléatoire Non-convergent Convergent

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 19 / 29

Repérer le problème

Plan

1 Introduction

2 Estimateurs de classe λ

3 Modèle à erreurs corrélées

4 Repérer le problème

5 Les solutions au problème

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 20 / 29

Repérer le problème

Le test d’Hausman

L’objectif est de tester une hypothèse d’absence de corrélation. Selon sonacceptation ou son rejet, on va privilégier certains estimateurs plutôt qued’autres.

Jerry Hausman (1946-), actuellement professeurd’Economie au MIT. A étudié le secteur destélécommunication et les questions deconcurrence, de régulation et de taxation, entreautres. Sa contribution la plus connue est le testqui porte son nom, publié en 1978.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 21 / 29

Repérer le problème

Le test d’Hausman : l’idée générale

Nous sommes dans un cas de figure où il existe plusieurs manières d’estimerun modèle. Si une des hypothèses du modèle n’est pas vérifiée, certainsestimateurs seront convergents tandis que d’autres ne le seront plus. On vamesurer l’écart qu’il y a entre les deux estimations. Deux possibilités :

les deux estimations sont similaires, l’écart est proche de 0,l’hypothèse testée semble raisonnable,les deux estimations sont différentes, l’écart est significativementdifférent de 0, l’hypothèse testée ne semble pas satisfaite.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 22 / 29

Repérer le problème

Application à des données de panel

Sous l’hypothèse de corrélation entre les caractéristiques inobservables etles variables explicatives, l’estimateur FGLS n’est plus convergent alors quel’estimateur within reste convergent. On peut donc comparer les deuxestimations.

Si elles sont voisines, on peut accepter l’hypothèse d’exogénéité des Xpar rapport à α. On n’a donc pas de problème d’endogénéité des Xpar rapport au terme d’erreur composé.A l’inverse, si les deux estimations son très différentes, au moins l’unedes estimations n’est pas convergente et on rejette l’hypothèsed’exogénéité des X par rapport à α.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 23 / 29

Repérer le problème

Statistique de test

Dans le cas des panels, la statistique de test originelle est :

SH = (β̂within − β̂FGLS)[Var(β̂within)− Var(β̂FGLS)

]−1(β̂within − β̂FGLS).

Elle suit un χ2 à dim(β) degrés de libertés. Une statistique alternative a étéproposée par Hausman et Taylor en 1981 :

SHT = (β̂between−β̂within)[Var(β̂between) + Var(β̂within)

]−1(β̂between−β̂within).

Elle suit un χ2 à autant de degrés de libertés qu’il y a de variablesexplicatives dans le modèle après transformation within.

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 24 / 29

Les solutions au problème

Plan

1 Introduction

2 Estimateurs de classe λ

3 Modèle à erreurs corrélées

4 Repérer le problème

5 Les solutions au problème

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 25 / 29

Les solutions au problème

Les solutions au problème

La présence de corrélation entre les αi et les xit implique une corrélationentre l’erreur composée et les variables explicatives. De ce point de vue, ils’agit d’un problème classique d’endogénéité. Différentes approches ont étéproposées :

“corriger” le modèle pour évacuer cette corrélation (différencepremière, transformation within...)avoir recours à des techniques de variables instrumentales

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 26 / 29

Les solutions au problème

Principe général des variables instrumentales

Y = Xβ + ε,E(X′ε) 6= 0.

Les erreurs sont corrélées avec les explicatives et les estimateurs habituelssont biaisés. L’idée est de trouver des variables Z , que l’on va appeler“instruments” telles que :

E(Z′ε) = 0, les instruments sont sans corrélation avec le terme

d’erreur. On dira alors qu’ils sont valides,E(Z

′X ) 6= 0, les instruments sont corrélés avec les variables

endogènes. S’ils ne le sont pas, on parlera d’instruments faibles.Chacune de ces deux propriétés peut être testée (test de Sargan, de Stocket Yogo...). Dans la pratique, trouver des variables Z satisfaisant ces deuxpropriétés est difficile et demande souvent de tester des centainesd’ensembles de variables candidates...

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 27 / 29

Les solutions au problème

Mise en oeuvre (1/2)Des dizaines de possibilités existent : doubles moindres carrés (2SLS),Hausman et Taylor (1981), Arellano et Bond (1991), Blundell et Bond(1998)...

Les 2SLS restent la méthode la plus intuitive, constituée de deux étapes :dans une première étape, on régresse les variables explicativesendogènes sur les instruments et les variables explicatives exogènes.On calcule les valeurs prédites des endogènes,dans une seconde étape, on régresse Y sur les valeurs prédites desendogènes et les variables exogènes.

Intuitivement, on remplace les variables problématiques par des valeursprédites avec les instruments. Si les instruments sont valides, les prévisionsseront sans corrélation avec ε. Si les instruments sont faibles, on peutmontrer que les résultats de deuxième étape seront peu précis et peurobustes (vraisemblance “plate” pour le modèle de la deuxième étape).

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 28 / 29

Les solutions au problème

Mise en oeuvre (2/2)

Les subtilités sont nombreuses (correction de la matrice de variance lors dela deuxième étape, gestion des variables incluses/excluses, plusieurs testspossibles d’instruments faibles...). Dans le cas des variables instrumentales,le mieux est de ne jamais se lancer dans la programmation manuelle de cetype d’estimateurs et de toujours utiliser des routines préprogrammées etdéjà testées. A ma connaissance, Stata est le seul logiciel à proposer desfonctions pour un grand nombre de modèles, qui fournissent de surcroittous les critères et tests appropriés (routines ivreg2 et xtivreg2, àinstaller manuellement).

Guillaume Horny (Banque de France) Econométrie des panels (chap 3) 2020 29 / 29

Recommended