161
Ch 1. Modèles Linéaire Non Dynamiques Économétrie des Données de Panel Ch 1. Modèles Linéaires Non Dynamiques Pr. Philippe Polomé, Université Lumière Lyon 2 M1 APE Analyse des Politiques Économiques M1 RISE Gouvernance des Risques Environnementaux 2016 – 2017

Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

  • Upload
    others

  • View
    9

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Économétrie des Données de PanelCh 1. Modèles Linéaires Non Dynamiques

Pr. Philippe Polomé, Université Lumière Lyon 2

M1 APE Analyse des Politiques Économiques

M1 RISE Gouvernance des Risques Environnementaux

2016 – 2017

Page 2: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Next year (2016/17) improvements : Present starting from FE,then get more restricted. Discuss the Breushc Pagan test & theusefulness of testing Het & autocrrel

Page 3: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Plan du Ch 1

Les données de panelModèles à Données de Panel

Effets Fixes & Effets AléatoiresEstimateurs pour données de panel

Efficience et ErreursEstimateurs appropriés pour leMRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication : Convergence desémissions de CO2

Inférence en données de panelMatrice des erreurs en panelInférence robuste en panel :WhiteInférence robuste en panel :BootstrapApplication : Emissions de CO2

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Données de panel non-cylindré(Unbalanced)

Page 4: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Les données de panel

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence en données de panel

Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré (Unbalanced)

Page 5: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Les données de panel

Les données de panel

I i = 1, ...,N : agent (individu, firme, pays...)I t = 1, ...,T : temps

I En général Ti : nombre de périodes diffère d’agent à agentI Panel “non-cylindré” (unbalanced)I Attrition, on y reviendra en fin de chapitre

I Pour simplifier la notation, la théorie utilise TI Les logiciels gèrent Ti

I yit une observation de la variable dépendante yI xit une observation du vecteur K ⇥ 1 des variables

indépendantesI “régresseurs”I Possiblement endogènes – Ch. 2

Page 6: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Les données de panel

Organisation des données

obs agent i temps t y x1

. . . xK1 1 1 y

11

x111

xK11

......

t 1 t y1t x

11t xK1t...

...T 1 T y

1T x11T xK1T

T+1 2 1 y21

x121

xK21

......

it i t yit x1it xKit

......

NT N T yNT x1NT xKNT

Page 7: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence en données de panel

Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré (Unbalanced)

Page 8: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Modèles & Estimateurs

I Plus grand choix de modèles et d’estimateurs qu’avec lescoupes transversales

I 3 modèles standards dans la présente SectionI 5 estimateurs dans la prochaine SectionI On fera cette distinction modèle / estimateur dans chaque

chapitreI Chaque estimateur “peut” être appliqué à chaque modèle

I Avec des résultats diversI On ne sait jamais quel modèle s’applique

I Table 5x3 des propriétés des estimateurs dans chaque modèle

Page 9: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Modèle Général

I Le modèle linéaire le plus général pour un panelI intercept & pente changent sur i & t

yit = ↵it + x0

it�it + uit

I uit un élément scalaire du vecteur du terme d’erreur uI Identification des paramètres

I Est-il possible de les estimer ?I Ce modèle yit = ↵it + x

0it�it + uit est trop général

I Non estimable : + de paramètres à estimer que d’observationsI Restrictions supplémentaires requises sur

I la manière dont ↵it et �it varient avec i & tI le comportement de l’erreur uit

Page 10: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Modèle 1. MRL - Modèle de régression linéaire classique

I Le modèle le + restricifI impose des coefficients constants entre i

yit = ↵+ x0it� + uit (1)

I Si ce modèle est le bon (correctement spécifié)I et si les régresseurs ne sont pas corrélés à l’erreurI Alors il pourra être estimé, de façon consistante, comme une

coupe transversale

Page 11: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Dichotomiques Individuelles et Temporelles

I Une variante simple du MRL (1)I Intercepts qui changent entre individus et entre période

I Mais pas les deux à la foisI Pentes constantes

yit = ↵i + �t + x0it� + uit (2)

ou yit =NX

j=1

↵jdj ,it +TX

s=2

�sds,it + x0it� + uit

où les N dichotomiques individuelles dj ,it = 1 si i = j & = 0 sinon

les T � 1 dichotomiques temporelles ds,it = 1 si t = s & = 0 sinon

Page 12: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Données de panel avec dichotomiques

obs i i = 1 . . . i = N t t = 1 . . . t = T � 1 y x1

. . . xK1 1 1 0 1 1 0 y

11

x111

xK11

......

t 1 1 0 t 0 0 y1t x

11t xK1t...

...T 1 1 0 T 0 0 y

1T x11T xK1T

T+1 2 0 0 1 1 0 y21

x121

xK21

......

it i 0 0 t 0 0 yit x1it xKit

......

NT N 0 1 T 0 0 yNT x1NT xKNT

Page 13: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Dichotomiques Individuelles et TemporellesI xit n’inclut pas d’intercept

I Si on en met unI alors une des N dichotomiques individuelles doit être retirée

I Beaucoup de logiciels font çaI Focus sur les panels courts où N ! 1 mais pas T

I Alors � (coef. des dich. temp.) peuvent être estimés de façonconsistante

I Au moins au sens où il y a un nombre fini de ces dich. temp.I T � 1 dich. temp. sont simplement incorporées aux

régresseurs xitI Par contre, si on insérait l’ensemble des N dich. individuelles

dj,itI Ça poserait un problème lorsque N ! 1I On ne peut estimer de façon consistante un nombre 1 de

paramètresI L’information ne croît pas sur ↵i lorsque N croît

I Challenge : estimer les paramètres �I en contrôlant pour les N dich. indiv. ↵i

Page 14: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Sommaire

Les données de panelModèles à Données de Panel

Effets Fixes & Effets AléatoiresEstimateurs pour données de panel

Efficience et ErreursEstimateurs appropriés pour leMRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication : Convergence desémissions de CO2

Inférence en données de panelMatrice des erreurs en panelInférence robuste en panel :WhiteInférence robuste en panel :BootstrapApplication : Emissions de CO2

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Données de panel non-cylindré(Unbalanced)

Page 15: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Modèle à Effets IndividuelsI Chaque agent i a son intercept, mais toutes les pentes sont

les mêmes entre agents

yit = ↵i + x0it� + ✏it (3)

où ✏it est iid sur i et t

I = une façon plus parcimonieuse d’exprimer le précédentmodèle (2)

I Les dic. temp. sont incluses dans les régresseurs xitI C’est le modèle linéaire, non-dynamique, à données de panel

“standard”I ↵i variables aléatoires

I Capture hétérogénéité inobservée invariante dans le tempsI = caractéristiques individuelles inobservées

I En fait : un modèle à paramètres aléatoires

Page 16: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Rappel : l’hétérogénéité inobservée

I Modèle correct : Y = �0

+ �1

x1

+ �2

x2

+ ✏

I Modèle estimé : Y = �0

+ �1

x1

+ ⌫I L’effet du régresseur manquant x

2

sur Y est implicite dans leterme d’erreur du modèle estimé : ⌫ = �

2

x2

+ ✏I = hétérogénéité inobservée : Des facteurs (individuels)

inobservés influent sur YI Si x

2

n’est pas corrélé avec x1

I Pas de souciI Si x

2

est corrélé avec x1

,I l’erreur ⌫ est corrélée avec x1

I MC inconsistant

Page 17: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Rappel : l’hétérogénéité inobservée

Mêmes pentes

Page 18: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Exogénéité

I Dans ce Ch. 1 : on assume l’exogénéité forte/stricte

E [eit |ai , xi1, ..., xiT ] = 0, t = 1, ...,T (4)

I C’est-à-dire : hypothèse que ✏itI Espérance de zéro conditionnellement aux valeurs passées,

présentes et futures des régresseursI Équivalent à zéro covarianceI Rien n’est supposé entre la variable aléatoire ↵i et les

régresseurs xiI Exclut des modèles avec une variable dépendante retardée

I Pas de yi(t�s) dans xit = Modèle dynamiqueI Comme yit�1 = ↵i + x

0

it�1� + ✏it�1 : il est diffcile d’affirmerque E (✏it✏it�1) = 0

I Et aussi avec des régresseurs endogènes (Ch. 2)

Page 19: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Modèle à Effets Fixes

I 2 variantes du modèle (3) yit = ↵i + x0it�+ ✏it selon hyp. sur ↵i

I Toutes deux ont “2” erreurs ↵i et ✏itI

Modèles à erreurs composées

I Toutes deux traitent ↵i comme une v.a. inobservéeI Variante 1 : modèle à effets fixes (EF)

I ↵i est corrélé avec (la partie invariante au temps) desrégresseurs observés xit

I C’est une forme d’hétérogénéité inobservée

I “fixe” parce que, anciennement, ↵i était traité comme unparamètre (non-aléatoire) à estimer

Page 20: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Modèle à Effets Aléatoires

I Variante 2 : modèle à effets aléatoires (EA)I ↵i distribué indépendamment de xI Habituellement, assume de plus que les effets aléatoires ↵i et

les termes d’erreurs ✏it dans (3) sont iid :

↵i ⇠�↵,�2

✏it ⇠�0,�2

� (5)

I Pas d’hyp. sur la distribution de ces v.a. dans (5)I ✏it peut présenter de l’autocorrélation

I Souvent, il est supposé que cov (✏it , ✏is) 6= 0I Mais aussi que cov (✏it , ✏jt) = 0 et cov (↵i ,↵j) = 0

I Sauf dans les modèles spatiaux

I Dans le modèle EA, ↵ est vu comme l’intercept

Page 21: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Autres noms des modèles EF/EA (3)

I Modèle à effets individuels une voie (One-way)I Deux voies (Two-way) = inclusion de dich. de temps ou

d’effets aléatoires de tempsI Modèle à intercept aléatoire

I Pour distinguer de modèles plus généraux, p.e. à pentesaléatoires

I Modèles à composants aléatoires

Page 22: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Modèle EA équicorrélé

I Le modèle EA yit = ↵i + x0it� + ✏it

I peut être vu comme la régression de yit sur xitI avec erreur composée uit = ↵i + "it

I Les hyp. EA usuelles (5) (↵i et ✏it iid) impliquent que

Cov [(ai + eit), (ai + eis)] =⇢sv2a, t 6= ssv2a + sv

2

e , t = s(6)

I Le modèle EA impose donc que l’erreur composée uit soitéquicorrelée

I Car Cor [uit , uis ] = �2↵/[�

2↵ + �2

" ] pour t 6= s ne change pasavec la durée t � s

I Le modèle EA est aussi appelé équicorrélé ou à erreursinterchangeables

Page 23: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Modèles à Données de Panel

Effets Fixes & Effets Aléatoires

Synthèse des modèles à données de panel

MRL (1) yit = ↵+ x0it� + uit uit ⇠

�0,�2

u

EFyit = ↵i + x

0it� + ✏it (3)

Cov (↵i , xit) 6= 0

EA ↵i ⇠�↵,�2

✏it ⇠�0,�2

� (5)

I Ces 3 modèles supposent l’hétérogénéité stricte 4I D’autres modèles panel existent, en particulier dynamiques

Page 24: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence en données de panel

Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré (Unbalanced)

Page 25: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

IntroductionI Il y a 5 estimateurs utilisés couramment pour � en données de

panelI Dans ce contexte non-dynamique, sans endogénéité : variantes

MCI Diffèrent selon leurs utilisations des variations transversales

(entre i) et temporellesI Leurs propriétés dépendent de quel est le modèle approprié

(MRL - EF - EA)I Un régresseur xit peut être soit

I invariant dans le temps, xit = xi pour t = 1, ...,T ,I ou variable dans le tempsI Certains estimateurs ne peuvent identifier que les coefficients

des régresseurs variables dans le tempsI On va voir les estimateurs du plus simple au plus complexe

I On regarde la consistance et l’efficience

Page 26: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Efficience et Erreurs

Sommaire

Les données de panelModèles à Données de Panel

Effets Fixes & Effets AléatoiresEstimateurs pour données de panel

Efficience et ErreursEstimateurs appropriés pour leMRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication : Convergence desémissions de CO2

Inférence en données de panelMatrice des erreurs en panelInférence robuste en panel :WhiteInférence robuste en panel :BootstrapApplication : Emissions de CO2

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Données de panel non-cylindré(Unbalanced)

Page 27: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Efficience et Erreurs

Efficience des Estimateurs

I L’efficience n’est pertinente que pour les estimateursconsistants

I L’efficience est la précision de l’estimateurI Essentiellement l’inverse de sa matrice de var-cov ⌃�

I Qui donc dépend de la matrice de var-cov des erreurs ⌃u

Page 28: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Efficience et Erreurs

Hypothèses sur les erreursI Les modèles à données de panel ont différents types d’erreur

I uit pour MRLI ↵i + "it pour EF et EA

I Dans beaucoup d’applications de microéconomieI raisonnable de supposer indépendance entre i

I Sauf en spatialI Pas le cas en macro

I Toutes ces erreurs sont potentiellement1. Autocorrélées (corrélées sur t pour un certain i )

I Corrélation sérielle, temporelle2. Hétéroscédastiques entre les i

I L’inférence (tests) stat. valide requiert de prendre en compteces caractéristiques

I Section suivanteI Dans cette section-ci

I structure de la mat. de var-cov des erreursI Efficience

Page 29: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Efficience et Erreurs

Matrice ⌃u de variance-covariance des erreurs en panel

I Sans distinguer entre les trois modèlesI On écrit l’erreur du modèle uit

I Peut être ↵i + ✏it ou pasI Entre i on a Cor [uit , ujs ] = 0

I pour i 6= j et t = ou 6= s

I Pour un certain iI Cor [uit , uis ] = �its : corrélation quelconque dans le tempsI t = s, �its = �2

it : hétérocédasticité quelconqueI Ça donne la matrice var-cov des erreurs ⌃u suivante

Page 30: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Efficience et Erreurs

Matrice ⌃u bloc-diagonale de var-cov des erreurs panel

0

BBBBBBBBBBBBBBBBBBBBBB@

sv211 sv112 · · · sv11T

sv212. . .

......

. . .. . . sv1(T � 1)T

SYM · · · sv21T

0 · · · 0

0. . .

. . ....

.... . .

. . . 0

0 · · · 0

sv2N1 svN12 · · · svN1T

sv2N2. . .

......

. . .. . . svN(T � 1)T

SYM · · · sv2NT

1

CCCCCCCCCCCCCCCCCCCCCCA

Page 31: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Efficience et Erreurs

Modèle EA

I Le modèle EA met plus de structure dans la matrice ⌃u

I Modèle EA yit = ↵i + x0it� + ✏it avec

I ↵i iid (donc non-corrélés à xit)I ✏it iidI Corrélations comme dans l’hyp. EA (5)

↵i ⇠�↵,�2

✏it ⇠�0,�2

I La matrice ⌃u prend la forme suivante

Page 32: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Matrice ⌃u Bloc-Diagonale de Var-Cov des Erreurs Panel EA

0

BBBBBBBBBBBBBBBBBBBBBBB@

sv2a + sv2e sv2a · · · sv2a

sv2a sv2a + sv2e.

.

.

.

.

.

.

.

.

.

.

.

.

.

. sv2asv2a · · · sv2a sv2a + sv2e

0 · · · 0

0

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

0

0 · · · 0

sv2a + sv2e sv2a · · · sv2a

sv2a sv2a + sv2e.

.

.

.

.

.

.

.

.

.

.

.

.

.

. sv2asv2a · · · sv2a sv2a + sv2e

1

CCCCCCCCCCCCCCCCCCCCCCCA

Page 33: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Efficience et Erreurs

En mots

I La matrice s’organise en blocs carrés autour de la diagonaleprincipale

I Chaque carré tient en 2 chiffresI Hors de sa diagonale principale, une corrélation entre périodes

�2↵I la même pour tous les i

I Sur sa diagonale principale, une variance �2↵ + �2

homoscédastiqueI Entre différentes i , toutes les corrélations sont nulles

I Hors des blocs diagonaux

Page 34: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour le MRL

Sommaire

Les données de panelModèles à Données de Panel

Effets Fixes & Effets AléatoiresEstimateurs pour données de panel

Efficience et ErreursEstimateurs appropriés pour leMRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication : Convergence desémissions de CO2

Inférence en données de panelMatrice des erreurs en panelInférence robuste en panel :WhiteInférence robuste en panel :BootstrapApplication : Emissions de CO2

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Données de panel non-cylindré(Unbalanced)

Page 35: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour le MRL

Estimateur MCO

I MCO estime ↵ et � dans yit = ↵+ x 0it� + uitI MCO est consistant (pour N ! 1, t constant) si

I Cov [uit , xit ] = 0 etI MRL (1) est approprié, ou siI EA est approprié

I La mat ⌃u n’est pas diagonaleI MCO inefficient

I L’estimateur MCO de la matrice ⌃� �2 (X 0X )�1 est biaiséI MCO est inconsistant si EF est approprié

I Ré-écrire EF yit = ↵i + x0

it� + ✏it comme

yit = a+ x�itb+ (ai−a+ eit)

I Donc l’erreur MCO, uit = ↵i � ↵+ ✏it , est corrélé à xit par ↵i

Page 36: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour le MRL

Estimateur Between

I Étapes1. Prendre les moyennes sur le temps par individu

I yi =1T

TX

t=1

yit , idem pour xi

2. Estimer par MCO yi = ↵+ x 0i � + "iI Régresser yi sur un intercept et le vecteur xi

I Pour estimer �, MCO utilise toutes les donnéesI Donc les variations à la fois sur le temps et en transversal

I Between n’utilise que les variations transversalesI Entre (between) différents individus

I Analogue à une régression en coupe transversaleI Les variations internes (within) à chaque individu sont écartées

Page 37: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour le MRL

Propriétés de l’estimateur Between

I Le modèle implicite derrière l’estimateur between est

yi = ↵+ x0i � + ui i = 1, ...,N (7)

I Between est consistant si les régresseurs xi sont indépendantsde l’erreur ui

I C’est le cas pour le MRL (1)I Si par contre le modèle est à erreurs composées (3)

yit = ↵i + x0

it� + ✏itI Alors, ui = (↵i � ↵+ ✏i )

I Dans EA, ↵i est indépendant de xI Donc Between est consistant pour EA

I Dans EF, ↵i est corrélé à xit et donc à xiI Between est donc inconsistant

Page 38: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour le MRL

Propriétés de l’estimateur Between

I Between gaspille beaucoup d’informationsI C’est un estimateur didactiqueI Ne pas l’utiliser dans vos applications

I Sans regarder formellementI between est très inefficient à cause du gaspillage d’information

Page 39: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Sommaire

Les données de panelModèles à Données de Panel

Effets Fixes & Effets AléatoiresEstimateurs pour données de panel

Efficience et ErreursEstimateurs appropriés pour leMRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication : Convergence desémissions de CO2

Inférence en données de panelMatrice des erreurs en panelInférence robuste en panel :WhiteInférence robuste en panel :BootstrapApplication : Emissions de CO2

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Données de panel non-cylindré(Unbalanced)

Page 40: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Estimateur Within

I Principe : Les déviations individuelles de la variabledépendante de ses moyennes temporelles

I sont expliquées parI les déviations individuelles des régresseurs de leurs moyennes

temporellesI Soit le modèle à effets individuels 3 yit = ↵i + x

0it� + ✏it

I Prendre le moyenne sur t : yi = ↵i + x 0i � + "iI Soustraire : les termes ↵i s’annulent = la transformation

within

yit � yi = (xit � xi )0� + (✏it � ✏i )

1, ...,N, t = 1, ...,T(8)

Page 41: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Estimateur Within

I Estimateur Within = MCO sur les données transformées

yit � yi = (xit � xi )0� + (✏it � ✏i )

I Comme ↵i a disparu par différence, Within est consistant dansEF, EA et MRL

I En tout cas quand l’hyp d’exogénéité forte tient

I Within est aussi appelé estimateur Effets FixesI Chaque i doit être observé au moins deux fois dans

l’échantillonI sinon xit � xi = 0

Page 42: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Consistance de l’estimateur Within / Effets FixesI Within traite ↵i comme des paramètres dits nuisance

I que l’on peut ignorer si notre intérêt porte sur les pentes �I qui n’ont pas besoin d’être estimés de façon consistante pour

obtenir une estimation consistante des �I Ce résultats ne se propage généralement pas aux modèles

non-linéairesI La consistance requiert plus précisément

E (✏it � ✏i |xit � xi ) = 0

dans le modèle transformé

yit � yi = (xit � xi )0� + (✏it � ✏i )

I À cause des moyennes, cela exige plus que E (✏it |xit) = 0I Il faut l’exogénéité stricte (4)

E [eit |ai , xi1, ..., xiT ] = 0, t = 1, ...,T

Page 43: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Estimations des effets fixesI Si les effets fixes ↵i sont d’intérêt , ils peuvent être estimés

par ↵i = yi � x0i �

I Cet estimateur de ↵i non-biaiséI Dans des panels courts (petit T ), cet estimateur est

inconsistantI Parce que l’information ne s’accumule pas (T ne croît pas)I Par contre, la distribution des ↵i , par rapport à une variable

clef ou pas, peut être informativeI Si N n’est pas trop grand, une alternative pour estimer Within

est l’estimateur MC à dichotomiquesI On définit N dich. di , une par individu, di = 1 pour iI Ensuite, estimer yit =

X

i

↵idi + x0

it� + ✏it par MCO

I Régression de yit sur xit et N dich. individuelles

I Cela produit l’estimation Within pour �, ainsi que lesestimations des N effets fixes

I Dans les limites des capacités de l’ordinateur

Page 44: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Within et les régresseurs invariants dans le temps

I Une limitation majeure de WithinI les coefficients des régresseurs invariants dans le temps ne sont

pas identifiésI Puisque si xit = xi alors xi = xi et (xit � xi ) = 0

I Beaucoup d’études ont précisément pour objet des régresseursinvariants dans le temps

I P.e. les effets du genre ou de l’origine ethnique sur le salaireI Pour cette raison, des praticiens évitent d’utiliser withinI MCO et l’estimateur Effets Aléatoires (ci-dessous) permettent

d’estimer ces coefficientsI mais sont inconsitants si EF est le modèle appropriéI On verra un estimateur qui permet parfois de les identifier

Page 45: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Estimateur différences premières

I Principe : Les changements individuels d’une période àl’autre de la variable dépendante

I sont expliqués parI les changements individuels d’une période à l’autre des

régresseursI Soit le modèle à effets individuels (3) yit = ↵i + x

0it� + ✏it

I retarder d’une période yi,t�1 = ↵i + x 0i,t�1� + "i,t�1I Soustraire = la transformation différences premières

yit � yi ,t�1

= (xit � xi ,t�1

)0� + (✏it � ✏i ,t�1

)i = 1, ...,N, t = 2, ...,T

(9)

Page 46: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Estimateur différences premières

I L’estimateur différences premières (D1) est MCO appliqué à latransformation différences premières (9)

I Cet estimateur est consistant pour � dans tous les modèlesI Pour les mêmes raisons que WithinI Pareillement, les coefficients des régresseurs invariants dans le

temps ne sont pas identifiésI D1 est moins efficient que within

I si "it est iid (pour T > 2)I car une période d’obsevation est écartée

I Cependant, D1 peut préserver contre des variables I(1)I Qui amènerait sinon à des résultats spurieux

Page 47: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateurs appropriés pour EF

Efficience des estimateurs pour EF

I Ces estimateurs font peu d’hypothèses sur la structure duterme d’erreur

I Leur efficience n’est généralement pas discutéeI Car la priorité est l’estimation consistante

Page 48: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Sommaire

Les données de panelModèles à Données de Panel

Effets Fixes & Effets AléatoiresEstimateurs pour données de panel

Efficience et ErreursEstimateurs appropriés pour leMRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication : Convergence desémissions de CO2

Inférence en données de panelMatrice des erreurs en panelInférence robuste en panel :WhiteInférence robuste en panel :BootstrapApplication : Emissions de CO2

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Données de panel non-cylindré(Unbalanced)

Page 49: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Rappel du modèle EA

I Modèle à effets individuels (3) yit = ↵i + x0it� + ✏it avec

I ↵i iid (donc non-corrélés à xit)I ✏it iidI Corrélations comme dans l’hyp. EA (5)

↵i ⇠�↵,�2

✏it ⇠�0,�2

I Dans ce cas, MCO consistant (car ↵i non-corrélés à xit)I Mais Moindres Carrés Généralisés MCG sera plus efficient

Page 50: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Rappel : MCG en coupe transversaleI Quand toutes les hyp. du modèle linéaire sont satisfaites

I sauf que la matrice var-cov ⌃ des erreurs n’est pas l’identité,alors

I MCO consistantI mais pas efficient (Gauss-Markov ne s’applique plus)

I Si on connait ⌃, on peut retrouver l’efficienceI Soit le MRL en coupe transversale y = x

0� + ✏ avec

E⇣✏✏

0⌘= ⌃ 6= �2I

I On peut montrer qu’il existe toujours P telle que P0P = ⌃�1

I Décomposition de Cholesky, non-unique pour les matricesréelles sdp

I Prémultiplier le modèle linéaire par P : Py = Px� + P✏I y⇤ = x⇤� + ✏⇤

I Alors Var (✏⇤) = E⇣P✏✏

0P

0⌘= PE

⇣✏✏

0⌘P

0

I = P⌃P0= P

⇣P

0P⌘�1

P0= PP�1

⇣P

0⌘�1

P0= I

Page 51: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Rappel : MCG en coupe transversale

I Donc, le modèle transformé a des erreurs dites sphériquesI Donc, MCO sur les données transformées est efficientI C’est MCG

I En pratique, ⌃ est inconnue, il nous en faut un estimateurconsistant

I Tout estimateur consistant de ⌃, ⌃, définit l’estimateur MCGfaisables (consistant)

I En panel, le modèle EA implique une matrice ⌃ comme dansla diapo suivante

I Comme détaillé précédemment

Page 52: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Matrice ⌃ bloc-diagonale de var-cov des erreurs panel EA

0

BBBBBBBBBBBBBBBBBBBBBB@

sv2a + sv2e sv2a · · · sv2a

sv2a sv2a + sv2e. . .

......

. . .. . . sv2a

sv2a · · · sv2a sv2a + sv2e

0 · · · 0

0. . .

. . ....

.... . .

. . . 0

0 · · · 0

sv2a + sv2e sv2a · · · sv2a

sv2a sv2a + sv2e. . .

......

. . .. . . sv2a

sv2a · · · sv2a sv2a + sv2e

1

CCCCCCCCCCCCCCCCCCCCCCA

Page 53: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Estimateur EA

I On appelle estimateur EA l’estimateur MCGI dans lequel la matrice ⌃ des erreurs est celle de la diapo

précédenteI La version faisable de cet estimateur est MCO

I appliqué aux données transformées de la façon suivante :

yit � �yi =⇣1 � �

⌘µ+

⇣xit � �xi

⌘0

� + ⌫it (10)

où ⌫it = (1 � �)↵i + ("it � �"i ) est asymptotiquement iid, et

I � est un estimateur consistant pour

� = 1 � �✏p�2

✏ + T�2

(11)

Page 54: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Estimateur EA

I On ajoute l’intercept (non-aléatoire) scalaire µ afin denormaliser les effets aléatoires ↵i à une espérance nulle

I et ainsi faire coincider l’estimateur avec l’hypothèse EA (5)I C’est-à-dire µ correspond à ↵ dans (5)

I La dérivation de cet estimateur (10) et des manières d’estimer�2

↵ et �2

" , et donc �,I sont détaillés dans Cameron & Trivedi

I RemarqueI � = 0 correspond à l’estimateur MCOI � = 1 correspond à l’estimateur withinI � ! 1 lorsque T ! 1 (regardez la formule)

I Il s’agit d’un estimateur en deux étapes de �1. estimer �2. estimer � à partir des données transformées

Page 55: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Estimateur approprié pour EA

Propriétés de l’estimateur EA

I Consistant et efficient si le modèle EA est le bonI Le gain d’efficience par rapport à l’estimateur MCO n’est pas

nécessairement élevéI Probablement inefficient si l’hypothèse d’équicorrélation

n’est pas vraieI Dans un processus AR (1)I Si le MRL est le bon

I Inconsistant si le modèle EF est le bon car alors ↵i est corréléavec xit

Page 56: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Interprétation : EF vs. EA

Sommaire

Les données de panelModèles à Données de Panel

Effets Fixes & Effets AléatoiresEstimateurs pour données de panel

Efficience et ErreursEstimateurs appropriés pour leMRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication : Convergence desémissions de CO2

Inférence en données de panelMatrice des erreurs en panelInférence robuste en panel :WhiteInférence robuste en panel :BootstrapApplication : Emissions de CO2

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Données de panel non-cylindré(Unbalanced)

Page 57: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Interprétation : EF vs. EA

Discussion sur EA et EF

I La plupart des disciplines de stat appliquéesI traitent l’hétérogénéité inobservée (individuelle) ↵i comme

distribuée indépendamment des régresseursI Sauf la microéconométrie

I Cette hyp d’indépendanceI a l’avantage de permettre une estimation consistante de tous

les paramètresI y-compris ceux invariants dans le tempsI si l’hyp est vraie

I est souvent considérée par les économistes comme nonsupportée par les données

I Les deux modèles ont des intérêts distinctsI EA : Précise la structure temporelle ! EfficienceI EF : Endogénéité de l’hétérogénéité inobservée ! Consistance

Page 58: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Interprétation : EF vs. EA

Prédictions et effets individuels

I Le modèle est yit = ↵i + x0it� + ✏it aussi bien pour EA que

pour EFI L’effet individuel ↵i est une v.a. dans les deux modèles

I On prend l’espérance conditionnelle aux régresseursI E [yit |xit ] = E [↵i |xit ] + x 0it�I Que peut-on en dire ? (prochaine dia)

Page 59: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Interprétation : EF vs. EA

Prédictions et effets individuels

I Dans le modèle EA, il est supposé que E [↵i |xit ] = ↵I Donc E [yit |xit ] = ↵+ x 0it�I Si EA est le bon modèle, ↵ peut être estimé de façon

consistanteI Donc on peut prédire yit par E [yit |xit ]

I Dans EF, E [↵i |xit ] varie avec xit et on ne sait pas commentI C’est raisonnable car ↵i comprend des characteristiques

inobservéesI Donc E [yit |xit ] ne peut être identifié : pas de prédictionI Malgré cela, on peut estimer les � de façon consistante

I Et donc les effets marginaux sont identifiés� = @E [yit |↵i , xit ]/@xit

I Par exemple, l’effet d’un changement de population sur lesémissions

I Mais seulement pour les régresseurs variant dans le temps

Page 60: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Interprétation : EF vs. EA

Résumé estimateurs et modèles linéaires communs pourpanel

ModèleEstimateur de � MRL (1) EA (3) & (5) EF (3)MCO (1) Consistant Consistant InconsistantBetween (7) Consistant Consistant InconsistantWithin (EF) (8) Consistant Consistant ConsistantD1 (9) Consistant Consistant ConsistantEA (10) Consistant Consistant Inconsistant

Cette table ne considère que la consistance des estimateurs de �I L’estimation des ↵i est toujours inconsistante, sauf lorsque

↵i = ↵8i .Le seul estimateur efficient est EA lorsque le bon modèle est aussiEA.

Page 61: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Sommaire

Les données de panelModèles à Données de Panel

Effets Fixes & Effets AléatoiresEstimateurs pour données de panel

Efficience et ErreursEstimateurs appropriés pour leMRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication : Convergence desémissions de CO2

Inférence en données de panelMatrice des erreurs en panelInférence robuste en panel :WhiteInférence robuste en panel :BootstrapApplication : Emissions de CO2

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Données de panel non-cylindré(Unbalanced)

Page 62: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Émissions de CO2

I Convergence dans ce contexte est 2 choses1. Dans le temps vers un “État stationnaire” (Steady State)

I Non testé ici2. En supposant la convergence dans le temps,

I Des groupes de pays convergent-ils à la même vitesse

I C’est ce qui est testé iciI Importance de la convergence lors de négociations

internationalesI Si les émissions tendent à se rapprocher entre pays ou non

I les négociations ne sont pas les mêmesI Émissions par habitant ou par travailleur effectif, pas au total

I On peut essayer de comprendre les différences entre vitesse deconvergence

I Technologie ? Politique ? Ressources naturelles ? Niveau dedéveloppement ?

Page 63: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Théorie en état stationnaireI La croissance du stock de capital est déterminée par

I la croissance de la population nI le taux d’épargne sI le progrès technique g (paramètre inconnu)I un paramètre exogène de dépréciation �I Les auteurs posent g + � = .05, constant

I On ne va pas explorer cette question, on oublieI Il est supposé que les émissions per capita E/L croissent de la

même manière que le stock de capitalI Ceci permet d’obtenir une équation pour les émissions en état

stationnaire

ln (E/L) = lnA+ �t + ↵ ln✓

s

n + g + �

◆(12)

I A est le niveau technologiqueI permettra de définir une constante pays-spécifique

Page 64: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

DynamiqueI L’économie n’est pas à l’état stationnaireI Soit

I ✏⇤ les émissions E/L à l’état stationnaireI ✏ les émissions à l’instant t

I L’équation de convergence dans le temps est

d ln ✏tdt

= ⇢ [ln ✏⇤ � ln ✏t ] (13)

I Équation différentielleI Dit essentiellement que le mouvement vers l’état stationnaire

est une proportion de la distance actuelleI Théorie sans fondement empirique, l’existence même d’un état

stationnaire n’étant pas certaineI Résolution (intégration)

ln ✏t2 =�1 � e�⇢⌧

�ln ✏⇤ + e�⇢⌧ ln ✏t1 (14)

Page 65: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Dynamique

I En substituant ✏⇤ selon l’équation 12 dans la solution 14I et en notant � = e�⇢⌧ , on a

ln ✏t2 = (1 � �)↵ ln⇣

sn+g+�

⌘+ (1 � �)A+ g (t

2

� �t1

) + � ln ✏t1I Le progrès technologique g (t

2

� �t1

)I modélisé (ad hoc) comme un jeu de dummies temporelles de

coefficients ⇡t

I Les différences de technologie A entre paysI donnent naissance à des intercepts par pays ✓i

I Il est supposé queI les coefficients de ln s et de ln (n + g + �) peuvent être

différentsI comme g + � = 0.05 par faute de données, on n’a que s et n

Page 66: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Modèle estimé

I Le modèle opérationnel est donc

ln ✏t2 = � ln ✏t1 + �1

ln s + �2

ln n + ⇡t + ✓i + ⌫it (15)

I Le paramètre d’intérêt est ⇢ = �15

ln �I Puisque ce paramètre indique la vitesse de convergence vers

l’état stationnaire selon eq. 13I Modèle dynamique par la présence de ✏t1

I que l’on traite en statique dans ce chapitreI Les régresseurs ln s et ln n

I aident à limiter (“contrôler”) l’hétérogénéité inobservéeI Il pourrait y en avoir d’autres : prix du pétrole, température en

hiver...

Page 67: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Penn World Table PWTI Jeu de données

I maintenu conjointement par des chercheurs deI U Californie à DavisI Growth Development Centre de U Groningen

I Données de comptes nationauxI PIB réel au cours du tempsI dans 189 pays dans la version utilisée (7)I Non-cylindré 1950-2009

I Semblables à celles de la Banque MondialeI Plus long pour certains paysI Beaucoup moins de variables

I “Extended Penn World Tables” EPWTI Ajoute quelques variables et change certaines définitionsI Émissions nationales de CO2

I Combustion de combustibles fossiles, fabrication de ciment etrejet de gaz naturel

I “CO2 pur” vs. “CO2 - équivalent”

Page 68: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Retard

I Le retard considéré est 5 ansI Pour un effet long terme selon les auteursI ⌧ = t2 � t1 = 5 ansI Différents ⌧ influencent-ils les résultats ?I Les données post 2005 ne sont pas dans la EPWT pour

plusieurs pays

Page 69: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Stata

I Charger les donnéesI .dta : double-clickI capacité d’import très limitée : .csv

I pas de méta-donnée

I Suivre le fichier 20160727CvgceCO2.doI Ci-dessous

I présentation des donnéesI Graphique temporel par paysI menu graphics ! panel data line plots

Page 70: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques
Page 71: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques
Page 72: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques
Page 73: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques
Page 74: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques
Page 75: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques
Page 76: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques
Page 77: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques
Page 78: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques
Page 79: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Qualité des donnéesI 2009 n’est en fait pas renseignéI Var. qualn

I NA, 4, 3, 2, 1I summarize em if (qualn<4)&(year<2009)

year<2009 # Moy Éc.ty. min MaxTout y compris NA 5 660 2 487 3 315 .4

32 615qualn<5 5 352 2 478 3 280 4.3qualn<4 4 397 2 783 3 442 9.1qualn<3 1 364 5 305 3 366 637 27 359qualn<2 818 6 385 3 695 1 404

I Restreint beaucoup l’échantillonI Les états qui tiennent bien les comptes pourraient être ceux

qui font plus d’effort sur les émissionsI

Biais de sélection

I Les résultats sont-ils sensibles à la qualité des données ?

Page 80: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Échantillons

I Cfr papier : Sélection préalableI "118 countries for which information from 1970 to 2008 was

available"I “Cylindrage” du panel - quelle justification ?

I Les pays sont regroupés dans différents sous-ensemblesI peu explicites dans le papierI La question principale est de voir si différents sous-ensembles

ont des convergences différentesI En supposant qu’il y ait convergence dans le temps

Page 81: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Échantillons

I NOILI tous les pays de l’échantillon sauf les gros producteurs de

pétroleI INTER - ok (je crois)

I tous les pays de l’échantillon saufI ceux de moins d’un million d’habitantsI les données douteuses selon EPWT (qualn)

I OECD - okI ASIA - okI LAC

I pays d’Amérique Latine / Caraïbe

Page 82: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Régression dans Stata

I Principe englobantI Du modèle général vers le plus restrictif

I Modèle + général : effets fixesI Estimateur WithinI Estimateur Diff 1ere

I Second modèle : effets aléatoiresI Modèle plus restrictif : MRL

I Estimateur MCOI Estimateur Between

Page 83: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Estimateur Within

I Stata présente un intercept - pourquoi ?I Stata réécrit le modèle 3 yit = ↵i + x

0it� + ✏it comme

yit = ↵+ ↵i + x0it� + ✏it

I Cela amène la multicollinéaritéI Il faut normaliser

I Dans la théorie, on a pris ↵ = 0 pour simplifier la notationI Stata prend

Pi ↵i = 0 par analogie avec l’hyp. EA :

E (↵i )� ↵ = 0I Dans aucun cas, cela n’a de conséquence sur les estimations de

Page 84: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Estimateurs D1, EA

I Diff. 1eresI Pas disponible directement dans StataI Construire les Diff. 1eres puis appliquer MCOI Retards 1 période dans Stata : by idn : gen lnem1 =

lnem[_n-1]I n indice les observations, by idn indique de retarder par

individuI Ensuite by idn : gen lnemD1 = lnem-lnem1I Par conséquent : intercept nul en théorie

I EA : 2 versionsI GLS = MCG faisable comme présenté plus avantI ML = maximum de vraisemblance

I Je ne détaille pas - on laisse tomber

Page 85: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Estimateurs MCO, Between

I Between - directement dans StataI Nombre d’observations réellement utilisées = nombre de

groupesI MCO

I Utiliser la commande/menu regress

Page 86: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Estimations

I Rappel du modèle 15 :ln ✏t2 = � ln ✏t1 + �

1

ln s + �2

ln n + ⇡t + ✓i + ⌫it

I Le paramètre d’intérêt est ⇢ = �15

ln �I indique la vitesse de cvgce à l’ES

I C’est le modèle “conditionnel”I Le modèle ln ✏t2 = � ln ✏t1 + ⇡t + ✓i + ⌫it est dit “absolu”I Il n’est pas clair si les auteurs mettent des dich. de temps dans

tous les modèlesI calculs dans do file 20160727CvgceCO2.do

I Ne pas double-cliquer, sinon exécute tout d’un coup

Page 87: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Résultats Qualn<3 & n>1000 & year<2009

EF - Within EF - Diff 1ere EA - MCG MCO BetweenAbs. Cond. Abs. Cond. Abs. Cond. Abs. Cond. Abs. Cond.

✓ 3.13 6.6 .0001 .006 2.3 2.09 1 .45 .63 .03� .63 .63 .057 .07 .73 .71 .88 .85 .93 .89⇢ .092 .092 .57 .53 .063 .07 .025 .033 .015 .023�

1

– -.32 – -.6 – -0.014 – .014 – .017�2 – .17 – .15 – .062 – .07 – .072

# obs 1209 1178 1209 1209 31# pays 31 non précisé 31 non précisé –

Sans dich. de temps

Page 88: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Convergence à l’état stationnaire

I À partir de ⇢ (ou de �)I possible de calculer une durée jusqu’à la convergence avec les

émissions de long termeI éq. (13) d ln ✏t

dt = ⇢ [ln ✏⇤ � ln ✏t ]I durée proportionnelle à ⇢

I Donc, en général, une convergence vers l’état stationnaire plusrapide en EF qu’en EA

I Peut s’explique par les effets spécifiques ↵i

I contiennent en particulier le mix énergétique et la politiquecarbone du pays

I alors même qu’on a pas de données sur ces variablesI La différence la plus spectaculaire reste entre D1 et le reste

I Prochaine diaI Between & MCO semblables entre eux

Page 89: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

D1 vs. EF et les autresI D1 et EF sont consistants dans les 3 modèles panelI Si T = 2, D1 et EF identiquesI Si ⌫it (terme d’erreur) n’a pas de corrélation sérielle

I EF est en principe meilleur car EF n’élimine pas de donnéesI Si ⌫it est une marche aléatoire

I D1 est en principe meilleur car la transformation D1 ramène lasérie à un ordre 0

I S’il y a corrélation entre ⌫it et un régresseur (p.e. ✏1t , les

émissions retardées de 5 ans)I Alors EF et D1 sont inconsistants

I Tester est hors du champ de ce coursI Compliqué avec des séries courtes

I Cette différence entre D1 et le resteI Indique sans doute une forte dimension temporelle (intégration

I(1))I Non prise en cpte par les auteurs

Page 90: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Analyse conditionnelle

I Rappel : “convergence conditionnelle”I Lorsque l’on conditionne à d’autres variables

I Coefficients de s et de nI Forte différence (EF D1) vs. (EA MCO Between)I Révèle endogénéité : ↵i corrélé à s et/ou nI Mais coefficient � stable à l’inclusion de ces 2 variables

I Rassurant

Page 91: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Dichotomiques de temps

I Le modèle théorique suggère des dich. temporellesI Il faut créer ces variables

I Stata permet de le faire en une foisI quietly tabulate year, generate(D_)

I Lorsque toutes les dich de temps sont introduitesI Les coefficients � dans FE et RE sont plus prochesI Par contre, D1 ne semble pas se rapprocher

Page 92: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Comparer les groupes de pays

I 2 variables ont été crééesI OECDI ASIA

I On répète l’analyseI Seulement sur “absolu”I Entre groupes de pays

Page 93: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Résultats Qualn<3 et & n>1000 & year<2009

EF - Within EF - Diff 1ere EA - MCG MCO BetweenTous ocde Asie Abs. ocde Asie Abs. ocde Asie Abs. ocde Asie Abs. ocde Asie

✓ 3.13 4.33 2.59 t 0 t 0 t 0 2.3 3.4 1.8 1 2.22 1.4 .63 1.72 .88� .63 .49 .70 .057 .085 .26 .73 .60 .80 .88 .74 .84 .93 .80 .90

# obs 1209 312 257 1178 304 250 1209 312 257 1209 312 257 31 13 11# pays 31 13 11 non précisé 31 13 11 non précisé – – –

Sans dich. de temps ; &(OECD==1) ; &(ASIA==1)

Page 94: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Comparer les groupes de pays

I Rappel : cvgce inversément proportionnelle à �I Conclusion robuste à l’ensemble des estimateurs

I OCDE converge + vite que AsieI Et que l’ensemble de tous les pays

I Sauf selon D1I Dans la mesure où les pays de l’OCDE

I Ont un plus grand historique d’émissionsI on peut prendre cela pour une confirmation d’une convgce vers

un ES ?I à débattreI D1 discordant avec cette interprétation

Page 95: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Estimateurs pour données de panel

Application : Convergence des émissions de CO2

Analyse de sensibilité

I Principe : répéter en changeant certains choixI Lag de 5 ans pourquoi pas 2 ou 10 ?I Niveau de qualité de la donnée 1, 2,...

I Laissé comme exercice

Page 96: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence en données de panel

Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré (Unbalanced)

Page 97: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Matrice des erreurs en panel

Sommaire

Les données de panelModèles à Données de Panel

Effets Fixes & Effets AléatoiresEstimateurs pour données de panel

Efficience et ErreursEstimateurs appropriés pour leMRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication : Convergence desémissions de CO2

Inférence en données de panelMatrice des erreurs en panelInférence robuste en panel :WhiteInférence robuste en panel :BootstrapApplication : Emissions de CO2

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Données de panel non-cylindré(Unbalanced)

Page 98: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Matrice des erreurs en panel

Inférence

I L’inférence consiste enI la prédictionI les tests d’hypothèses

I L’inférence classique fait des tests d’hyp.I dont la significativité des coefficientsI à partir de la matrice ⌃� de variance-covariance des �

I Donc : essentiel de disposer d’une estimationI au minimum consistanteI de cette matrice ⌃�

I Celle-ci s’appuie sur la matrice ⌃u

I Var-Cov des erreurs uit = ↵i + ✏itI Prochaine dia

Page 99: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Matrice des erreurs en panel

Rappel sur la matrice var-cov des erreurs panel en général

0

BBBBBBBBBBBBBBBBBBBBBB@

sv211 sv112 · · · sv11T

sv212. . .

......

. . .. . . sv1(T � 1)T

SYM · · · sv21T

0 · · · 0

0. . .

. . ....

.... . .

. . . 0

0 · · · 0

sv2N1 svN12 · · · svN1T

sv2N2. . .

......

. . .. . . svN(T � 1)T

SYM · · · sv2NT

1

CCCCCCCCCCCCCCCCCCCCCCA

Page 100: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Rappel 2 : Matrice ⌃u dans le modèle EA avechétéroscédasticité

0

BBBBBBBBBBBBBBBBBBBBBBBB@

sv2a + sv2e1 sv2a · · · sv2a

sv2a sv2a + sv2e1.

.

.

.

.

.

.

.

.

.

.

.

.

.

. sv2asv2a · · · sv2a sv2a + sv2e1

0 · · · 0

0

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

0

0 · · · 0

sv2a + sv2eN sv2a · · · sv2a

sv2a sv2a + sv2eN.

.

.

.

.

.

.

.

.

.

.

.

.

.

. sv2asv2a · · · sv2a sv2a + sv2eN

1

CCCCCCCCCCCCCCCCCCCCCCCCA

Page 101: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Matrice des erreurs en panel

Estimateur MCI Tous les estimateurs panel sont MC sur données transforméesI MC traite chacune des T années comme de l’information

indépendante, maisI Le contenu informationnel est moindre

I puisque les erreurs (et donc les obs.) sont corréléesI Ceci tend à surestimer la précision

I Le modèle qui fait le plus d’hypothèses sur ⌃u est EAI Si ce modèle est exact, on peut procéder à l’inférence

habituelleI à partir des données transformées MCG

I Dans les autres cas,I On utilise des corrections panel des écarts-types (et) quand on

applique MCOI Beaucoup de corrections sont possibles, selon les hyp. sur la

corrélation et l’hétéroscédasticitéI Et aussi selon la longueur du panel – mais on ne verra pas

Page 102: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Matrice des erreurs en panel

Inférence statistique Panel-robusteI Des écarts-types Panel-robuste peuvent être estimés

I sans supposer de forme fonctionnelle spécifique pour lacorrélation ou l’hétéroscédasticité des erreurs individuelles

I au moyen de 2 techniquesI

l’estimateur robuste de White

Ile bootstrap

I En panel, donc, on utilise des estimateurs inefficientsI mais au moins on calcule leur matrice de var-cov ⌃�

correctementI Seul estimateur EA est efficient dans le modèle EA

I Tous les autres estimateurs dans tous les modèles sontinefficients

I Des estimateurs plus efficients s’obtiennent par la MéthodesGénéralisée des Moments GMM : Ch. 2

I Les estimateurs EF, EA et D1 tendent à réduire la corrélationsérielle

I mais pas à l’éliminer

Page 103: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Matrice des erreurs en panel

Inférence Panel-robuste et logiciels

I Dans beaucoup de packages économétriques, les et calculéspar défaut assument des erreurs iid

I Donc une matrice ⌃u diagonaleI incohérente avec Panel

I Cette inférence est erronéeI En général, elle sous-estime les et, donc sur-estime les t-stat

Page 104: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Inférence robuste en panel : White

Sommaire

Les données de panelModèles à Données de Panel

Effets Fixes & Effets AléatoiresEstimateurs pour données de panel

Efficience et ErreursEstimateurs appropriés pour leMRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication : Convergence desémissions de CO2

Inférence en données de panelMatrice des erreurs en panelInférence robuste en panel :WhiteInférence robuste en panel :BootstrapApplication : Emissions de CO2

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Données de panel non-cylindré(Unbalanced)

Page 105: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Inférence robuste en panel : White

Rappel : l’estimateur de ⌃� hétéroscédastique-consistant deWhite

I MRL classique en coupe transversaleI y = x

0� + ✏ avec E

⇣✏✏

0⌘= ⌃✏ 6= �2I

I MCO est non-biaisé et consistantI Var

⇣�OLS

⌘= ⌃�MCO

=⇣X

0X⌘�1

X0⌃✏X

⇣X

0X⌘�1

6=

�2⇣X

0X⌘�1

I En cas d’hétéroscédasticité pure, White (1980) montre que

S =1N

NX

i=1

✏2i XiX0i

I est un estimateur consistant de 1NX

0⌃✏X sous des conditions

généralesI ✏i est le résidu MCO ✏ = y � x

0�MCO

Page 106: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Inférence robuste en panel : White

L’estimateur de ⌃� hétéroscédastique-consistant de Whiteen panel

I L’estimateur de White peut être étendu pour l’autocorrélationI mais souvent on ne le fait pas

I car on cherche à étudier les propriétés temporelles dans plusde détails

I Sauf en panel courtI où la série est trop courte pour la tester en détailI On va voir brièvement comment White est appliqué au Panel

Page 107: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Inférence robuste en panel : White

L’estimateur de ⌃� hétéroscédastique-consistant de Whiteen panel

I Réécrire tout estimateur panel comme un estimateur MC de ✓dans

yit = w0it✓ + uit (16)

I yit est une fonction connue de seulement yi1, ..., yiTI Pareil pour w

0

it et w 0it =

⇥1 x

0

it

⇤; uit et uit

I p.e. MCO : pas de transformation, ✓ =⇥↵ �

0 ⇤0

I Within : yit = yit � yi , wit = xit−xi uniquement pour lesrégresseurs variant dans le temps

I ✓ : coefficients des régresseurs variant dans le tempsI ...

I / Ces transformations induiront de la corrélation sérielleI même si les erreurs originelles n’en ont pas

Page 108: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Inférence robuste en panel : White

Notation

I Empiler les observations selon les périodes pour un individu i :I ~yi = ~W

0

i ✓ +~ui oùI ~yi : T ⇥ 1

I Pour D1, (T � 1)⇥ 1I ~Wi : T ⇥ q

I MCO ✓MCO =

"NX

i=1

~W0i~Wi

#�1 X

i

~W0i~yi

I pour tous les estimateurs panel

Page 109: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Inférence robuste en panel : White

Variance MCOI Variance de ✓MCO dans le modèle avec un ~ :

⌃✓MCO=

"NX

i=1

~W0i~Wi

#�1 X

i

~W0iE

h~ui~u

0i |~Wi

i~Wi

"NX

i=1

~W0i~Wi

#�1

I Même formule sandwich que dans le rappelI Sauf qu’on a un vecteur ui plutôt qu’un scalaire uiI Pour un seul individu, T obs : un bloc de var-cov

Ehui u

0

i

i=

0

BBBB@

sv211 sv112 · · · sv11T

sv212. . .

......

. . . . . . sv1(T � 1)TSYM · · · sv21T

1

CCCCA

où il faudrait tout écrire en conditionnel à WiI Hors cette matrice, tous les éléments sont zéro

Page 110: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Inférence robuste en panel : White

L’estimateur de ⌃� hétéroscédastique-consistant de Whiteen panel

I Donc : Variance de ✓MCO dans le modèle avec un ~ :

⌃✓MCO=

"NX

i=1

~W0i~Wi

#�1 X

i

~W0iE

h~ui~u

0i |~Wi

i~Wi

"NX

i=1

~W0i~Wi

#�1

I White :I On a pas besoin d’un estimateur consistant de cette matrice

pour l’inférenceI Il suffit d’un estimateur de

X

i

~W0

iEh~ui~u

0

i |~Wi

i~Wi

I La partie du milieu

Page 111: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Inférence robuste en panel : White

Estimateur Panel-robuste de la matrice de var-cov ⌃✓MCO

I Estimateur consistant “Panel-robuste” de ⌃✓MCOen panel

I C’est essentiellement le même problème qu’en coupetransversale comme dans le rappel

I Sauf qu’on a un vecteur ui plutôt qu’un scalaire uiI La formule suivante permet à la fois hétérodasticité et

autocorrélation

\⌃✓MCO=

"NX

i=1

~W0

i~Wi

#�1 X

i

~W0

i ~ui~u0

i~Wi

"NX

i=1

~W0

i~Wi

#�1

(17)

où ~ui =~yi � ~W0i ✓

I C’est l’estimateur de ⌃� de WhiteI étendu pour le panelI L’information accumule car la mat. ⌃u de var-cov des erreurs

est de dimensions finies T ⇥ T lorsque N ! 1

Page 112: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Inférence robuste en panel : White

DétailI On cherche

X

i

~W0iE

h~ui~u

0i |~Wi

i~Wi

I On prendX

i

~W0

i ~ui~u0

i~Wi

I simplification de notation

I Wi = Zi =

0

B@zi11 · · · zik1...

. . ....

zi1T · · · zikT

1

CA, ˆui = ei =

0

[email protected]

1

CA

X

i

Z0i eie

0iZi =

X

i

0

B@zi11

· · · zik1

... . . . ...zi1T · · · zikT

1

CA

0 0

B@ei1...

eiT

1

CA

0

B@ei1...

eiT

1

CA

0 0

B@zi11

· · · zik1

... . . . ...zi1T · · · zikT

1

CA

(k ⇥ T )⇥ (T ⇥ 1)⇥ (1 ⇥ T )⇥ (T ⇥ k) = (k ⇥ k)

Page 113: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Inférence robuste en panel : White

DétailX

i

Z0i eie

0iZi =

X

i

0

B@zi11

· · · zi1T... . . . ...

zik1

· · · zikT

1

CA

0

B@e2

i1 · · · ei1eiT...

...sym · · · e2

iT

1

CA

0

B@zi11

· · · zik1

... . . . ...zi1T · · · zikT

1

CA

=

X

i

0

B@ei1

Pt zi1teit · · · eiT

Pt zi1teit

... . . . ...ei1

Pt zikteit · · · eiT

Pt zikteit

1

CA

0

B@zi11

· · · zik1

... . . . ...zi1T · · · zikT

1

CA

=X

i

0

B@

Pt zi1teit

Pt zi1teit · · ·

Pt zikteit

Pt zi1teit

... . . . ...sym · · ·

Pt zikteit

Pt zikteit

1

CA

On voit comment on se rapproche d’une matrice de var-cov

Page 114: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Inférence robuste en panel : White

Estimateur Panel-robuste de la matrice de var-cov ⌃✓MCO

I Cet estimateur (17) assume l’indépendance entre i et N ! 1I mais permet que V [uit ] et Cov [uit , uis ] change avec i , t, et sI ce qui est le cas pour des panels courts

I Des et Panel-robustes basés sur cet estimateur (17)I peuvent être calculés en utilisant une commande MCO

habituelleI si cette commande a une option “cluster-robust” pour le

calcul des etI comme dans Stata, cluster sur i

I Erreur fréquente :I utiliser l’option standard robust des et dans MCO de

yit = w0

it✓ + uitI Ajuste uniquement pour hétéroscédasticité

I En Panel, en pratique, plus important de corriger pour lacorrélation sérielle

Page 115: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Inférence robuste en panel : Bootstrap

Sommaire

Les données de panelModèles à Données de Panel

Effets Fixes & Effets AléatoiresEstimateurs pour données de panel

Efficience et ErreursEstimateurs appropriés pour leMRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication : Convergence desémissions de CO2

Inférence en données de panelMatrice des erreurs en panelInférence robuste en panel :WhiteInférence robuste en panel :BootstrapApplication : Emissions de CO2

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Données de panel non-cylindré(Unbalanced)

Page 116: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Rappel : le Bootstrap

I Hyp. Bootstrap :I Si on pouvait ré-échantillonner la pop. dans les mêmes

conditions, on obtiendrait un échantillon semblable à celuiqu’on a déjà

I “Principe de médiocrité”I Pas la même chose que représentativité

I Principe (et 2nde hyp.)I Échantillonner l’échantillon de taille n avec remplacement

I soit n tirages, chaque i a une probabilité 1/n de sortirI S’appelle “Bootstrap par paire” car y et X sont tirésI On obtient un échantillon Bootstrap (de taille n)I Hyp. : semblable à ce qu’on aurait obtenu en

ré-échantillonnant la pop.I Repliquer ce processus B fois

I B pseudo-échantillons différentsI Pour chaque pseudo-échantillon < Yb,Xb >

I un vecteur ✓b

Page 117: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Inférence robuste en panel : Bootstrap

Rappel : le BootstrapI Pour construire un intervale de confiance pour un élément ✓k

de ✓I On a B estimations ✓kb p.e. B = 10 000I Ordonner ces estimations de la plus petite à la plus grandeI Alors l’intervale de confiance à 95% est délimité par

I l’estimation numéro 250, borne inférieureI l’estimation numéro 9750, borne supérieure

Pourquoi est-ce intéressant ?1. Pas d’hypothèse sur la distribution des erreurs

1.1 Mais il ne peut y avoir de corrélation entre observations1.2 Dès lors, en panels, on ré-échantillonne seulement sur i , en

utilisant toutes les T périodes de chaque i sélectionné2. On peut calculer des intervales de confiance

2.1 pour toute fonction des paramètres estimés, y-comprisnon-linéaire

2.2 pour des paramètres estimés de modèles sans propriétésd’échantillons finis connues

Page 118: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Inférence robuste en panel : Bootstrap

Estimateur Bootstrap (Panel-robuste) de la matrice devar-cov ⌃✓MCO

en panel

I Pour chaque pseudo-échantillon BI MCO de yit sur witI B estimations ✓b, b = 1, ...,B

I Estimateur Bootstrap “empirique” de la matrice de var-cov ⌃✓ :

[⌃boot✓

=1

B � 1

BX

b=1

⇣✓b � ¯✓

⌘⇣✓b � ¯✓

⌘0

(18)

où ¯✓ = B�1

Pb ✓b

Page 119: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Inférence robuste en panel : Bootstrap

Estimateur Bootstrap (Panel-robuste) de la matrice devar-cov ⌃✓MCO

en panel

I Bootstrap s’applique à toutes les techniques économétriquesI Peut être lent

I Pour autant que les i soient indépendants :I Consistant quand N ! 1I Asymptotiquement équivalent au “Sandwich” Panel-robuste de

WhiteI 8 forme d’hétéroscédasticité ou d’autocorrélation

I Accessible comme White dans Stata : option de calcul des et

Page 120: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Application : Emissions de CO2

Sommaire

Les données de panelModèles à Données de Panel

Effets Fixes & Effets AléatoiresEstimateurs pour données de panel

Efficience et ErreursEstimateurs appropriés pour leMRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication : Convergence desémissions de CO2

Inférence en données de panelMatrice des erreurs en panelInférence robuste en panel :WhiteInférence robuste en panel :BootstrapApplication : Emissions de CO2

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Données de panel non-cylindré(Unbalanced)

Page 121: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Application : Emissions de CO2

Rappel

I Jeu de données “Extended Penn World Tables” EPWTI Données de comptes nationaux

I Non-cylindré 1950-2009I Émissions nationales de CO2

I Modèle “conditionnel” 15 :ln ✏t2 = � ln ✏t1 + �

1

ln s + �2

ln n + ⇡t + ✓i + ⌫it

I Le paramètre d’intérêt est ⇢ = �15

ln �I indique la vitesse de cvgce à l’ES

I Le modèle “absolu” ln ✏t2 = � ln ✏t1 + ⇡t + ✓i + ⌫itI Effets individuels ✓i simplifient à ✓ (intercept) pour quelques

estimateursI ⌫it supposé indépendant sur i , mais (auto)corrélé sur t pour un

i donnéI calculs dans do file 20160727CvgceCO2.do

Page 122: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Application : Emissions de CO2

Inférence

I On va illustrer des calculs de t-statI Selon White & bootstrap

I Mais aussi aborder la décomposition de la variance desémissions

I Pour comprendre le R2 dans panel

Page 123: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Application : Emissions de CO2

Décomposition de la variance des émissions

I La variance totale s2 d’une série panel xit peut êtredécomposée en

1

NT

NX

i=1

TX

t=1

(xit � x)2 = 1

NT

NX

i=1

TX

t=1

[(xit � xi ) + (xi � x)]2

= 1

NT−N

NX

i=1

TX

t=1

(xit � xi )2 + 1

N�1

NX

i=1

TX

t=1

(xi � x)2

car les produits croisés somment à zéro.

Page 124: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Application : Emissions de CO2

Décomposition de la variance des émissions

I Donc Variance totale s2 =I s2

w variance withinI [moyenne sur les i des déviations individuelles autour des

moyennes individuelles]I + s2

b variance betweenI [déviations des moyennes individuelles autour de la moyenne

générale]I Les R2 within et between sont définis de façon similaire

I note. R2 souvent petit en panel

Page 125: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Application : Emissions de CO2

Décomposition de la variance des émissionsI Commande directe dans Stata xtsum

s sw sb s sw sbtoutes les obs (qualn<3)&(n>1000)&(year<2009)

ln ✏t2 1.71 .40 1.67 .60 .25 .55ln ✏t1 1.71 .39 1.72 .62 .24 .57ln n 1.82 .29 1.77 1.50 .20 1.51ln i 1.50 .46 1.44 .55 .34 .49

I InterprétationI Les variations d’émissions par h sont presque complètement

des différences entre paysI Les retards des émissions et les régresseurs exogènes suivent la

même décompositionI Plus d’homogénéité entre pays en se restreignant comme dans

les régressions

Page 126: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Application : Emissions de CO2

Résultats et & t-stat

Pour Qualn<3 & n>1000 & year<2009

EF - Within EF - Diff 1ere EA - MCG MCO Between

✓ 3.13 .0001 2.3 1 .63� .63 .057 .73 .88 .93

Default .016 / 40.7 .03 / 1.92 .013 / 55 .007 / 118 .022 / 42.1Robust .053 / 11.8 .036 / 1.59 .036 / 20.1 .01 / 92 non dispo

Cluster robust idem robust .041 / 1.40 idem robust .03 / 29 non dispoBootstrap (500) .054 / 11.75 .036 / 1.59 .042 / 17.3 .01 / 91 .028 / 33

et / t-stat Sans dich. de temps, sans autre régresseursR2 overall .92 .0031 .92 .92 .92R2 within .58 non-dispo .58 non-dispo .58R2 between .98 non-dispo .98 non-dispo .98

Page 127: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Application : Emissions de CO2

ET de �

I Default : assume erreurs iidI Robust

I Dialogue xtreg, choisir l’onglet SE/robust, sélectionner “robust”I Clustered robust (clustered by idn) comme dans eq. 17

I Dialogue xtreg, choisir “cluster-robust se”I Cluster sur idn mais Stata n’est pas très clair sur ce qu’il fait

(cfr aide)I Apparement Stata comprend qu’avec des données de panel il

faut faire ClusterI En tout cas, pour une commande panelI L’aide n’est pas explicite

Page 128: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Application : Emissions de CO2

ET de �

I bootstrap comme dans eq. 18 avec 500 replicationsI Les et bootstrap changent un peu chaque fois qu’on les calculeI Stata ne permet pas de spécifier la variable clusterI donne des résultats proches de cluster robust

I ou de robust dans le cas de MCO/betweenI Ça n’est pas le même bootstrap que celui qu’on a vu

I Ces 2 derniers et sont dits panel-robustesI robuste à la fois à l’hétéroscédasticité et à la corrélation sérielle

I Du moins dans une certaine mesure (cfr. p.e. intégration àl’ordre 1)

I Ils sont très proches

Page 129: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Inférence en données de panel

Application : Emissions de CO2

Comparaison des et & R2

I Dans cet exemple, les et “robustes” peuvent être 3 à 4 foisplus grands que les “default”

I EF est un peu moins précis que EAI en principe toujours comme ça

I EA moins précis que MCOI Surprenant, peut-être dû au fait que EA ne rend pas bien

compte de la corrélation des erreurs dans ce cas-ciI Autrement dit, l’hyp d’équicorrélation ne s’applique pas ici

I Différence très substantielle avec D1I indicatrice de questions de séries temporelles, sans doute I(1)

I Sur R2

I Le plus frappant est la 6= entre D1 et les autresI Typique d’intégration I(1)

I On pourrait calculer R2 within & between pour D1 et MCO

Page 130: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence en données de panel

Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré (Unbalanced)

Page 131: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests

Sommaire

Les données de panelModèles à Données de Panel

Effets Fixes & Effets AléatoiresEstimateurs pour données de panel

Efficience et ErreursEstimateurs appropriés pour leMRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication : Convergence desémissions de CO2

Inférence en données de panelMatrice des erreurs en panelInférence robuste en panel :WhiteInférence robuste en panel :BootstrapApplication : Emissions de CO2

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Données de panel non-cylindré(Unbalanced)

Page 132: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests

CausalitéI Le modèle EF peut établir la causalité avec moins d’hyp.

que pourI des données de coupe transversaleI le MRL ou les EA

I Dans quelques cas, la causalité est claire, donc EA estapproprié

I p.e. dans une expérience contrôlée, la causalité est claire, ils’agit plus de mesurer sa force

I des rendements de culture causés par 6= quantités d’engrais,en labo

I dans ce cas, le traitement xit est alloué aléatoirement, doncnon-corrélé à ↵i

I Parfois, on ne veut mesurer que la corrélation, pas la“causation”

I p.e. pour de la prédictionI EA est alors suffisant

Page 133: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests

Causalité

I Les économistes sont inhabituelsI ils préfèrent une approche EF car ils veulent mesurer la

causalitéI avec des données observationnelles

I plutôt qu’expérimentalesI Dans ce cas, utiliser EA ou MCO n’aboutit qu’à une corrélation

spurieuse souvent due à une hétérogénéité inobservéeI “facteurs confondants” : variables non-incluses corrélées avec

régresseursI EF élimine l’hétérogénéité inobservée

I due aux variables inobservées qui sont invariantes dans letemps

I L’effet causal de x sur y est mesuré par la corrélation entre deschangements individuels dans y et dans x

Page 134: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Éléments du choix hors tests

Faiblesse des EF en pratiqueI L’estimation des coef. des régresseurs invariant dans le

temps n’est pas possible avec EFI Les coef. des régresseurs peu variables dans le temps sera

impréciseI sb (variation entre unités) forte par rapport à sW (variation

dans le temps)I La prédiction de la moyenne conditionnelle n’est pas

consistanteI car les effets individuels ↵i ne sont pas estimés de façon

consistanteI Seuls les changements de cette moyenne conditionnelle, causés

par des changement de régresseurs variants dans le temps,peuvent être prédits

I EF fait moins d’hyp que EA sur l’hétérogénéité inobservéeI mais il faut que celle-ci soit invariante au temps

I ↵i , pas ↵it

Page 135: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Sommaire

Les données de panelModèles à Données de Panel

Effets Fixes & Effets AléatoiresEstimateurs pour données de panel

Efficience et ErreursEstimateurs appropriés pour leMRLEstimateurs appropriés pour EFEstimateur approprié pour EAInterprétation : EF vs. EAApplication : Convergence desémissions de CO2

Inférence en données de panelMatrice des erreurs en panelInférence robuste en panel :WhiteInférence robuste en panel :BootstrapApplication : Emissions de CO2

Effets Fixes vs. Effets AléatoiresÉléments du choix hors testsTest de Hausman

Données de panel non-cylindré(Unbalanced)

Page 136: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Rappel : le test de Hausman

I PrincipeI Soit 2 estimateurs ✓ et ✓ (dans le même modèle)I S’ils sont tous 2 consistants

I alors leur différence⇣✓ � ✓

⌘ne devrait pas être

statistiquement 6= 0, asymptotiquement

I On teste H0

: plim⇣✓ � ✓

⌘= 0 , Ha : plim

⇣✓ � ✓

⌘6= 0

I Sous H0, la différence entre ces 2 estimateurs converge à unenormale d’espérance zéro

IpN⇣✓ � ✓

⌘! N [0,VH ]

I VH est la matrice de var-cov de la distribution limite

Page 137: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Rappel : le test de Hausman

I Statistique du test de Hausman

H =⇣✓ � ✓

⌘0 ⇣1

N VH

⌘�1

⇣✓ � ✓

I PrincipeI H est au fond une valeur normalisée du carré de la différence⇣

✓ � ✓⌘

I Donc, des valeurs élevées de H amènent à rejeter l’hyp. nulleI On peut montrer que H asymptotiquement �2 (q) sous H0

I donc rejeter H0 au niveau ↵ si H > �2↵ (q)

I avec q le nombre d’éléments de ✓I et donc : un des 2 estimateurs ✓, ✓ au moins est inconsistant

I La difficulté en pratique est de trouver un estimateur VH deVH

I On va voir comment on fait en panel

Page 138: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Test de Hausman sur la présence d’effets fixes en donnéesde panel

I Si les effets individuels ↵i sont fixesI L’estimateur within �W est consistantI L’estimateur EA �EA est inconsistant

I Avec � le vecteur des coefficients des régresseurs variant dansle temps

I puique seuls ces coefficients sont estimables avec WithinI Tandis que si les effets sont aléatoires

I Les 2 sont consistantsI H

0

: pas de différence systématique entre les 2 estimations

I Si H0 vraie : on préfère EA car plus efficientI en principe, pas si clair si les erreurs sont I(1)

I Hausman fonctionne sur toutes paires d’estimateurs avec despropriétés semblables

I p.e. D1 vs. MCO

Page 139: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Test de Hausman sur la présence d’effets fixes en donnéesde panel

I Si le test amène à rejeter l’égalité des 2 vecteurs �W et �EAI On infère que puisque �W est consistant,

I si �EA est différent, il doit être inconsistantI Et donc que les effets individuels ↵i sont corrélés avec les

régresseurs xitI Remarque : On peut encore éviter d’utiliser un estimateur EF

I Si les régresseurs sont corrélés aux ↵i à cause de variablesomises

I il peut être possible de rajouter des régresseursI Il peut être possible d’utiliser un estimateur EA avec variables

instrumentales (Ch. 2)I À présent on regarde le calcul de la mat. de var-cov de⇣

�EA � �W⌘

I pour calculer la stat de Hausman en panelI 2 cas

Page 140: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Calcul du test de Hausman quand �EA EST pleinementefficient

I Si le modèle vrai est EA avec Equicorrélation, doncI ↵i iid

⇥0,�2

⇤non-corrélé aux régresseurs

I l’erreur "it iid⇥0,�2

"

I Alors �EA pleinement efficient,I la stat de Hausman se simplifie

H =⇣�EA � �W

⌘0

\Vh�W

i� \

Vh�EA

i��1 ⇣bEA−bW

I Avec � le vecteur des coefficients des régresseurs variant dansle temps comme d’habitude

I Cette stat de test est asymptotiquement �2 (dim [�]) sous H0I Très facile à calculer

I puisque les matrices\

Vh�W

i,

\Vh�EA

isont fournies lors de

l’estimation

Page 141: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Calcul du test de Hausman quand �EA N’EST PASpleinement efficient

I La forme simplifiée de la stat de Hausman n’est pas valable si↵i ou "it ne sont pas iid

I p.e. lorsqu’il y a hétéroscédasticitéI Car dans ce cas l’estimateur EA �EA n’est pas pleinement

efficient sous H0

I L’expression\

VhbW

i� \VhbEA

idans la formule de H doit être

remplacée par

I\

VhbEA � bW

iqui est + générale

I Estimation de la matrice de var-cov de⇣�EA � �W

I Ceci N’EST PAS implémenté dans StataI Mais peut être estimé de façon consistante par bootstrap sur

i (pas t)

Page 142: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Calcul du test de Hausman quand �EA N’EST PASpleinement efficient

I Une version panel-robuste de la stat de Hausman est

HRobuste =⇣bEA−bW

⌘�

\

Vboot

hbEA � bW

i�−1 ⇣bEA−bW

I avec\

Vboot

hbEA � bW

i= 1

B�1

BX

b=1

⇣�b � ¯�

⌘⇣�b � ¯�

⌘0

I b est le beme de B replications bootstrap et � = bEA � bWI Cette stat de test peut

I être appliquée à des sous-vecteurs de �I utiliser d’autres estimateurs tels que �MCO à la place de �EA et

�D1 à la place de �W

Page 143: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Application du test de Hausman

I Exemple de la convergence des émissions de CO2

Page 144: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Rappel

I Jeu de données “Extended Penn World Tables” EPWTI Données de comptes nationauxI “Unbalanced” 1950-2009I Émissions nationales de CO2

I Modèle “conditionnel” 15 :ln ✏t2 = � ln ✏t1 + �

1

ln s + �2

ln n + ⇡t + ✓i + ⌫it

I Le paramètre d’intérêt est ⇢ = �15

ln �I indique la vitesse de cvgce à l’ES

I Le modèle “absolu” ln ✏t2 = � ln ✏t1 + ⇡t + ✓i + ⌫itI Effets individuels ✓i simplifient à ✓ (intercept) pour quelques

estimateursI ⌫it supposé indépendant sur i , mais (auto)corrélé sur t pour un

i donnéI calculs dans do file 20160727CvgceCO2.do

Page 145: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Application du test de HausmanI Dans le modèle “absolu” on n’a qu’un régresseur variable dans

le tempsEF - Within EF - Diff 1ere EA - MCG MCO Between

� .63 .057 .73 .88 .93Default .016 / 40.7 .03 / 1.92 .013 / 55 .007 / 118 .022 / 42.1Robust .053 / 11.8 .036 / 1.59 .036 / 20.1 .01 / 92 non dispo

Cluster robust idem robust .041 / 1.40 idem robust .03 / 29 non dispoet / t-stat Sans dich. de temps, sans autre régresseurs

I On pourrait calculer directement H si EA était pleinementefficient

I On compare les estimations EF et EA sur la base desécarts-types par défaut

I Car si EA est le bon modèle, la transformation des données parMCG rend les résidus sphériques

H ' (0.73−0.63)2 /�0.0162−0.0132� t 115 > �2

.05(1) = 3.84I donc le modèle EA est rejeté

I 1 ddl parce que un seul régresseur variable dans le temps

Page 146: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Illustration du calcul habituel du test de Hausman dansStata

I exécuter xtreg lnem lnem5, feI estimates store EstimEFI exécuter xtreg lnem lnem5, reI hausman EstimEF .

I Attention au petit point final qui veut dire “dernier vecteurestimé”

Page 147: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Illustration du calcul habituel du test de Hausman dansStata

I C’est la procédure du test entre EF (fe dans Stata) et EA (redans Stata)

I Stata produit une p-valeurI Ligne “Prob>chi2 =”I si cette p-valeur est < 5%, on R H0, donc les EF ↵i sont

corrélés avec les régresseurs xitI EF est préférable

I Cette procédure ne marche que avec les et par défautI vce(cluster i) renvoie un message d’erreurI Ce qui est correct puisque la formule utilisée par Stata n’est

pas valable s’il faut utiliser vce(cluster i)

Page 148: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Application du test de Hausman

I Le calcul utilisé par Stata n’est pas approprié cependantI La stat H est biaisée parce que les et par défaut sont biaisés

vers le basI par rapport aux et clusterI Il faudrait donc utiliser la formule bootstrap du test de

HausmanI Cela demande de programmer Stata

I Vous pouvez le faire pour votre dossier

Page 149: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Protocole pratique1. Estimateurs pour EF

1.1 Within1.2 Différences premières

I S’il y a des différences notables entre ces deux estimateurs, ily a probablement des racines unitaires

I Section sur dynamique, différences premières est plusprobablement correct

2. Estimateur EAI HausmanI En principe, ça s’arrête là et on interprêteI En économie, si on préfère un modèle sans EF, il faut le

justifier en passant un test de Hausman3. (optionel) Estimateurs pour MRL

I SII Hausman & la théorie rejette EFI On a de bonnes raisons de soupçonner qu’il pourrait ne pas y

avoir d’EAI Test de Breusch-Pagan, mais il en existe d’autres

Page 150: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Effets Fixes vs. Effets Aléatoires

Test de Hausman

Protocole pratique

I Souvent les étudiants procède comme dans le cours :1. Estimer MCO2. Estimer EA3. Tester (Breusch-Pagan ou autre) EA contre MCO4. Si ¬R EA, alors estimer EF5. Test de Hausman EF contr EA

I Problème avec cette approcheI Si le modèle correct est EF, alors les estimateurs MCO et EA

sont inconsistantsI Les tests à l’étape 3 ne peuvent être utilisés

Page 151: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Données de panel non-cylindré (Unbalanced)

Sommaire

Les données de panel

Modèles à Données de Panel

Estimateurs pour données de panel

Inférence en données de panel

Effets Fixes vs. Effets Aléatoires

Données de panel non-cylindré (Unbalanced)

Page 152: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Données de panel non-cylindré (Unbalanced)

Attrition

I Panel cylindré (balanced)I Les données existent pour chaque i chaque t

I Lorsque les données de certains i n’existent pas pour certains tI On dit qu’il y a attrition

I p.e. avec des individus qui abandonnent le panelI Généralement définitivement

I Le panel est alors non-cylindré (unbalanced)I ou incomplet

I Panel rotatifI un sous-échantillon d’individus est remplacé chaque année

Page 153: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Données de panel non-cylindré (Unbalanced)

Consistance

I Soit dit = 1 si i observé au temps t, = 0 sinonI alors T devient Ti

I Within est consistant si l’hyp d’exogénéité forte devient

E [✏it |↵i , xi1, . . . , xiTi , di1, . . . , diTi ] = 0

I C’est-à-dire : présence ou absence (dit) dans l’échantillon nepeut être corrélée aux erreurs ✏it

Page 154: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Données de panel non-cylindré (Unbalanced)

Consistance

I Lorsque ça n’est pas le cas, on aI un exemple classique de sélection de l’échantillon

I Les estimateurs vus sont généralement inconsistantsI On parle de biais d’attrition

I Des caractéristiques inobservées gouvernent l’attritionI p.e. dans une enquête sur le salaire, il est plus probable que les

personnes à bas salaires quittent l’échantillonI Dans l’application, les pays à très basses émissions sont sans

doute les plus pauvres et donc ceux ne disposant pas d’unsystème stat

I EA est consistant si de plusI l’effet individuel ↵i est indépendant des régresseurs xit

Page 155: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Données de panel non-cylindré (Unbalanced)

Cylindrage (Balancing)

I Opération consistant à convertir un panel non-cylindré encylindré

I En excluant de l’échantillon tous les individus dont les donnéesne sont pas disponibles tous les ans

I Ou en rejetant les années pour lesquelles tous les individus nesont pas observés

I En général, cela réduit beaucoup l’efficienceI D’un autre côté, dans la pratique,

I Il arrive que seules certaines variables ne sont pas observéestous les ans

I p.e. les questions sur le revenuI Plutôt que de cylindrer le panel à cause de ça, des méthodes

d’imputation de données sont souvent préférables

Page 156: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Données de panel non-cylindré (Unbalanced)

Conclusions

I Un panel permet deI traiter l’hétérogénéité inobservée constante dans le temps

I et donc établir la causation plus facilementI Il existe plusieurs modèles linéaires non-dynamiques en panel

I selon les hyp. sur les ↵iI Et plusieurs estimateurs

I Tous basés sur MCI On souligne EF, EA et D1

Page 157: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Données de panel non-cylindré (Unbalanced)

Conclusions

I Hétéroscédasticité & autocorrélation sont normalementprésentes ensemble

I Souvent on ne va pas traiterI Mais utiliser une version robuste du calcul des et

I White ou bootstrapI Les estimateurs EF et D1 sont toujours consistants

I Mais ne peuvent prédire ou estimer les coef. des régresseursconstants dans le temps

I Ce que peut EAI qui de + est + efficientI Mais repose sur une absence de corrélation en ↵i et xi

I Le choix entre EF et EA peut être justifié par un test deHausman

I Dont le calcul a fréquemment recours à bootstrap

Page 158: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Données de panel non-cylindré (Unbalanced)

Annexe 1. Sur la consistance de MCO dans les modèles àdonnées de Panel

Page 159: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Données de panel non-cylindré (Unbalanced)

Compacter la notation

I Empiler les observations sur le temps pour un i donné :I ~yi = ~W

0

i ✓ +~ui oùI ~yi : T ⇥ 1

I pour le modèle en diff. 1ères, (T � 1)⇥ 1

I ~Wi : T ⇥ q

I Estimateur MCO ✓MCO =

"NX

i=1

~W0i~Wi

#�1 X

i

~W0i~yi

Page 160: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Données de panel non-cylindré (Unbalanced)

Consistance de MCO dans un modèle ~I Si le modèle est correctement spécifié :

✓MCO = ✓ +

"NX

i=1

~W0i~Wi

#�1 X

i

~W0i~ui

I Comme l’indépendance entre i n’est pas remise en cause,I la condition essentielle pour la consistance de MCO est

Eh~W

0

i~ui

i= 0

I c’est-à-dire pas de corrélation des erreurs avec les régresseurs“à l’intérieur (within)” de chanque individu

I Eh~W0

i~ui

i= 0 est + forte que is E [uit |wit ] = 0 (exogénéité

contemporaine)I parce que la transformation ~ implique plus d’une période p.e.

wit = xit−xiI Exogénéité forte (4) E [uit |wi1, ..., wiT ] = 0 est suffisanteI Ch. 2 : hyp. + faibles – donc matrice de var-cov + compliquée

Page 161: Économétrie des Données de Panel - UDLrisques-environnement.universite-lyon.fr/IMG/pdf/pan_ch1...Ch 1. Modèles Linéaire Non Dynamiques Modèles à Données de Panel Dichotomiques

Ch 1. Modèles Linéaire Non Dynamiques

Données de panel non-cylindré (Unbalanced)

Annex 2. Abréviations courantesI D1 estimateur différences premièresI ddl degré de liberté (dof)I dich. DichotomiqueI v.a. Variable aléatoire (random variable)I EF Effets fixes (fixed effects)I EA Effets aléatoire (random effects)I ES état stationnaireI et Écart-type (se standard errors)I iid Indépendamment et identiquement distribuéI MC Moindres carrés

I MCO Moindres Carrés OrdinairesI MCG Moindres Carrés Généralisés

I MRL Modèle de Régression LinéaireI p.e. par exemple