68
Ecole Doctorale Edocif Séminaire Méthodologique L’Econométrie des Données de Panel Modèles Linéaires Simples Christophe HURLIN

L'Econom©trie des Donn©es de Panel

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: L'Econom©trie des Donn©es de Panel

Ecole Doctorale Edocif

Séminaire Méthodologique

L’Econométrie des Données de Panel

Modèles Linéaires Simples

Christophe HURLIN

Page 2: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 2

Figure 0.1:

Présentation

Le but de ce séminaire est de proposer une initiation, tant sur le plan théoriqueque sur le plan appliqué, à l’économétrie des données de panel. Sur le plan théorique,le séminaire débutera par une présentation des problèmes de spéci…cations de base enéconométrie de panel et par les méthodes d’estimation traditionnelles. Cette premièrepartie insistera en particulier sur les stratégies de tests de spéci…cation du modèle. Laseconde partie du séminaire sera consacrée à l’étude des panels dynamiques et pro-posera une introduction aux concepts de non stationnarité stochastique en panel etnotamment à la spéci…cation des tests de non stationnarité et de cointégration. Cesconcepts théoriques seront appliqués à di¤érentes problématiques économiques, commepar exemple la problématique de la convergence des PIB par tête, que ce soit au traversde commentaires de travaux empiriques ou par la programmation d’exemples illustratifssous un logiciel d’économétrie (TSP ou SAS à préciser)

Page 3: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 3

Table des Matières

Introduction 2

Chapitre 1 : Modèles Linéaires Simples 5

Introduction 6

1. Tests de spéci…cation ou tests d’homogénéité 81.1. L’exemple d’une fonction de production 81.2. Procédure de tests de spéci…cation 10

1.2.1. Procédure générale 101.2.2. Construction des statistiques de test 13

1.3. Application 17

2. Modèles à e¤ets individuels 202.1. Empilement par pays 21

2.1.1. Exemple 222.2. Empilement par dates 23

2.2.1. Exemple 23

3. Modèles à e¤ets …xes 253.1. Estimateur Within ou LSDV 263.2. Application 283.3. Ecriture vectorielle 31

4. Modèles à e¤ets aléatoires 334.1. Modèle à variance composée 344.2. Estimateurs du modèle à e¤ets aléatoires 354.3. Estimateur des Moindres Carrés Généralisés 374.4. Application 42

5. Tests de spéci…cation des e¤ets individuels 445.1. Corrélation des e¤ets individuels et des variables explicatives 455.2. Test de spéci…cation d’Hausman 496.3. Application 51

6. Modèles à coe¢cients …xes et aléatoires 536.1. Modèle MFR de Hsiao (1989) 536.2. Méthode d’estimation des paramètres 566.3. Application 57

Page 4: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 4

Annexes 62A.1. Equivalence entre les estimateurs Within et pooled : Ã = 1 62A.2. Programme TSP : Modèle MFR 63

Bibliographie 67

Page 5: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 5

Chapitre I

Modèles Linéaires Simples

Page 6: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 6

Introduction

Dans ce premier chapitre, nous nous restreindrons à l’étude des modèles linéaires sim-ples sur données de panel, ces derniers étant dé…nis par opposition aux modèles dy-namiques faisant intervenir des variables endogènes retardées. Dans toute la suite de cechapitre, on considère des processus strictement stationnaires au sens de la stationnaritédu second ordre1.

L’objectif des cinq premières sections de ce chapitre est de faire en sorte que lelecteur puisse interpréter, de façon exhaustive et relativement approfondie, les résultatsde base que donnent les principaux logiciels d’économétrie lorsque l’on envisage desmodèles de panel. Nous prendrons ici comme référence le logiciel TSP 4.3, mais ilest bien entendu évident que ces résultats de base sont sensiblement identiques si l’onconsidère d’autres logiciels comme Eviews, SAS ou Rats.

Quelles sont les connaissances minimales nécessaires à l’économètre appliqué pourpouvoir interpréter un tableau de résultats d’estimation de panel ? Prenons commeexemple la commande panel de TSP. A l’issue de cette procédure, l’utilisateur disposedes réalisations des estimateurs Pooled, Between, des estimateurs du modèle à e¤etsindividuels …xes (Within), du modèle à e¤ets individuels aléatoires (Error ComponentModel), des résultats de trois tests de Fischer, d’un estimateur de la variance dese¤ets individuels, d’un estimateur de la variance totale, de l’estimateur d’un paramètrede pondération et de la statistique du test d’Hausman. Voilà ainsi résumés tous lesélements que nous nous proposons d’étudier tout au long des cinq premières sections.

Ainsi, la première section est consacrée aux tests de spéci…cation qui correspondenten fait aux trois tests de Fischer du …chier de résultat des estimations TSP. Il s’agit ici dedéterminer la manière dont doit être spéci…é un modèle de panel, si tant que l’hypothèsede panel puisse être acceptée. Nous verrons alors que toute l’analyse repose alorssur la notion d’homogénéité des paramètres du modèle envisagé. Les tests présentésvisent ainsi à porter un diagnostic sur l’éventuelle nécessité d’intégrer une dimensionhétérogène et sur la manière dont cette hétérogénéité doit être spéci…ée. Une desmanières simples pour ne pas supposer l’existence d’un modèle totalement identiqueconsiste ainsi à introduire des e¤ets individuels sous la forme de constantes spéci…ques,propres à chaque individu du panel. Nous proposerons ainsi une procédure générale detests de spéci…cation des modèles linéaires simples.

1La dé…nition de la stationnarité fera l’objet du chapitre suivant.

Page 7: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 7

Dans une seconde section, nous présenterons le modèle à e¤ets individuels. Cemodèle suppose l’existence de coe¢cients identiques pour tous les individus et de con-stantes spéci…ques. Ainsi, la relation économique mise en évidence à travers ce type demodélisation n’est censée di¤érer pour tous les individus qu’au niveau des constantesintroduites dans le modèle. Nous insisterons alors sur la construction du modèle et enparticulier sur sa représentation sous forme vectorielle. Il s’agit ici de présenter les deuxprincipales méthodes de construction des échantillons de données, à savoir la méthoded’empilement par date et la méthode d’empilement par individus.

La troisième section est consacré au modèle à e¤ets individuels …xes. On supposedans cette section que les e¤ets individuels sont des paramètres déterministes. Nousserons alors amener à présenter la construction et les propriétés de l’estimateur Withindes coe¢cients du modèle. Une application sur les relations entre le nombre de grèvesdans le secteur industriel et les déterminants macroéconomiques sera proposée. Nousnous appuierons sur les résultats et les di¤érents tests proposés sous TSP.

Une quatrième section sera consacrée au modèle à e¤ets individuels aléatoires. Onsuppose dans cette section que les e¤ets individuels ne sont plus des paramètres, maisdes variables aléatoires possédant une distribution commune pour tous les individus.Nous commencerons par étudier la structure des résidus de ce modèle à variance com-posée. Nous étudierons ensuite les di¤érents estimateurs des coe¢cients du modèle àe¤ets aléatoires et plus particulièrement l’estimateur des Moindres Carrés Généralisés.

En…n, la cinquième section sera consacrée aux tests de spéci…cation des e¤ets indi-viduels. La question est alors de savoir quel modèle, parmi les modèles à e¤ets aléatoireset e¤ets …xes, doit être retenu. Ceci nous conduira à présenter le test d’Hausman (1978)qui constitue le test standard de spéci…cation des e¤ets individuels.

Nous conclurons en…n en introduisant un sixième section consacrée à la présentationd’un type de modèle de plus en plus utilisé en économétrie appliqué : le modèle aveccoe¢cients …xes et coe¢cients aléatoires. Ce modèle, introduit notamment par Hsiao(1989), permet de réaliser di¤érents exercices de modélisation économique particulière-ment intéressants.

Page 8: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 8

1. Tests de spéci…cation ou tests d’homogénéité

Lorsque l’on considère un échantillon de données de panel, la toute première chose qu’ilconvient de véri…er est la spéci…cation homogène ou hétérogène du processus générateurde données. Sur le plan économétrique, cela revient à tester l’égalité des coe¢cientsdu modèle étudié dans la dimension individuelle. Sur le plan économique, les testsde spéci…cation reviennent à déterminer si l’on est en droit de supposer que le modèlethéorique étudié est parfaitement identique pour tous les pays, ou au contraire s’il existedes spéci…cités propres à chaque pays.

Nous commencerons par présenter un petit exemple illustratif construit à partird’une fonction de production agrégée. Dans une seconde section, nous généraliseronsla procédure de tests de spéci…cation en introduisant les notions de variances intra-classes (Within) et inter-classes (Between). En…n, nous proposerons une applicationde ces tests de spéci…cation à l’estimation d’une relation entre le nombre de grèves etun ensemble de variables explicatives.

1.1. L’exemple d’une fonction de production

Prenons l’exemple d’une fonction de production. Supposons que l’on dispose d’unéchantillon de données de PIB et de facteurs (travail et capital) sur une durée de Tpériodes pour un ensemble de N pays. Si l’on note yi;t le logarithme du PIB, ki;t lelogarithme du stock de capital privé et ni;t le logarithme de l’emploi et que l’on supposeune fonction de production de type Cobb Douglass, le modèle général s’écrit sous laforme 8 i 2 [1; N ] ; 8 t 2 [1; T ] :

yi;t = ®i + ¯iki;t + °ini;t + "i;t

Les innovations "i;t sont supposées être i:i:d: de moyenne nulle et de variance égale à¾2"; 8 i 2 [1; N ] :

Dans un premier temps, la phase de test de spéci…cation, revient sur le planéconomique, à déterminer s’il est en droit de supposer une fonction de productiontotalement identique pour tous les pays (modèle pooled). Dans ce cas, les élasticités del’emploi et du capital sont identiques pour tous les pays (¯i = ¯; °i = °; 8 i 2 [1; N ] ) etle niveau moyen de la productivité totale des facteurs, représenté ici par les constantes®i; est lui aussi identique pour tous les pays. Le modèle s’écrit alors sous la forme :

yi;t = ® + ¯ki;t + °ni;t + "i;t

Page 9: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 9

Toutefois, lorsque l’on travaille sur des séries agrégés, il est relativement peu prob-able que la fonction de production macroéconomique soit strictement identique pourtous les pays étudiés. Si l’hypothèse d’homogénéité totale est rejetée, il convient alorsde tester si les élasticités des di¤érents facteurs sont identiques. Si ce n’est pas le cas, iln’existe a priori aucune structure de production commune entre les pays. Dans ce cas,l’utilisation des données de panel ne se justi…e pas et peut même conduire à des biaisd’estimation. On doit donc estimer les fonctions de production pays par pays.

Si en revanche, il s’avère qu’il existe bien une relation identique entre la productionet les facteurs pour tous les pays, la source d’hétérogénéité du modèle peut alors provenirdes constantes ®i: Dans notre exemple, ces constantes représentent la moyenne de laproductivité totale des facteurs de production (résidu de Solow). Or, rien ne garan-tit que les pays étudiés possèdent le même niveau de productivité structurelle. Aucontraire, il se peut parfaitement que des facteurs a-temporels ou structurels, comme laposition géographique, le climat, l’éloignement par rapport au grands axes commerciauxetc... aient pu conduire à des di¤érences structurelles de niveau de productivité entreles pays. Il convient donc de tester l’hypothèse d’une constante commune à tous lespays. Si cette hypothèse est rejetée, on obtient alors un modèle avec e¤ets individuelsqui s’écrit sous la forme :

yi;t = ®i + ¯ki;t + °ni;t + "i;t

Dans ce cas, le niveau moyen de la productivité totale des facteurs, déterminé parE (®i + "i;t) = ®i; varie selon les pays, même si la structure de production (les élasticitésdes deux facteurs travail et capital) est identique.

Cet exemple, que nous allons à présent généraliser, montre bien que la phase detest de spéci…cation revient à déterminer si le processus générateur de données peutêtre considéré comme homogène, c’est à dire unique pour tous les individus, ou si aucontraire il apparaît totalement hétérogène, auquel cas l’utilisation des techniques depanel ne peut se justi…er. Entre ces deux cas extrêmes, il convient de précisémentidenti…er la source d’hétérogénéité pour bien spéci…er le modèle.

Page 10: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 10

1.2. Procédure de tests de spéci…cation

On considère un échantillon de T observations de N processus individuels fyi;t; t 2 Z; i 2 Nget fxi;t; t 2 Z; i 2 Ng : Par la suite, on notera fyi;tg et fxi;tg ces deux processus. Onsuppose que le processus fyi;tg est dé…ni de façon générale par le relation linéaire suiv-ante, 8 i 2 N, 8 t 2 Z :

yi;t = ®i + ¯0ixi;t + "i;t (1.1)

où ®i 2 R,¯i =¡¯1;i¯2;i::::¯K;i

¢0 est un vecteur de dimension (K; 1). On considèreainsi un vecteur de K variables explicatives :

xi;t = (x1;i;t; x2;i;t; :::; xK;i;t)0 (1.2)

Les innovations "i;t sont supposées être i:i:d: de moyenne nulle et de variance égaleà ¾2"; 8 i 2 [1;N ] : Ainsi on suppose que les paramètres ®i et ¯i du modèle (1.1) peuvent

di¤érer dans la dimension individuelle2, mais l’on suppose qu’ils sont constants dans letemps.

1.2.1. Procédure générale

Si l’on considère le modèle (1.1), plusieurs con…gurations sont alors possibles :

1. Les N constantes ®i et les N vecteurs de paramètres ¯i sont identiques : ®i = ®;¯i = ¯ 8 i 2 [1; N ]. On quali…e alors le panel de panel homogène.

2. Les N constantes ®i et les N vecteurs de paramètres ¯i sont di¤érents selon lesindividus. On a donc N modèles di¤érents, on rejette la structure de panel.

3. Les N constantes ®i sont identiques, ®i = ® 8 i 2 [1;N ] ; tandis que les vecteursde paramètres ¯i di¤èrent selon les individus. Dans ce cas, tous les coe¢cientsdu modèle, à l’exception des constantes, sont di¤érents selon les individus. On adonc N modèles di¤érents.

4. Les N vecteurs de paramètres ¯i sont identiques, ¯i = ¯ 8 i 2 [1; N ] ; tandisque les constantes ®i di¤èrent selon les individus. On obtient un modèle à e¤etsindividuels.

Pour discriminer ces di¤érentes con…gurations et pour s’assurer du bien fondé de lastructure de panel, il convient d’adopter une procédure de tests d’homogénéité emboîtés.La procédure générale de test présentée dans Hsiao (1986) est décrite sur la …gure (1.1).

2A l’exception de la variance des innovations que l’on supposera identique pour tous les individus.

Page 11: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 11

Figure 1.1: Procédure Générale de Tests d’Homogénéité

[ ]NiHTest ii ,1:10 ∈∀β=βα=α

vraieH10rejetéeH1

0

tititi xy ,,, ' ε+β+α=[ ]NiHTest i ,1:20 ∈∀β=β

vraieH20rejetéeH 2

0

titiiiti xy ,,, ' ε+β+α= [ ]NiHTest i ,1:30 ∈∀α=α

vraieH30 rejetéeH3

0

titiiti xy ,,, ' ε+β+α=tititi xy ,,, ' ε+β+α=

Dans une première étape, on teste l’hypothèse d’une structure parfaitement ho-mogène (constantes et coe¢cients identiques) :

H10 : ¯i = ¯ ®i = ® 8 i 2 [1;N ]

H1a : 9 (i; j) 2 [1;N ] = ¯i 6= ¯j ou ®i 6= ®j

On utilise alors une statistique de Fischer pour tester ces (K + 1) (N ¡ 1) restric-tions linéaires3. Si l’on suppose que les résidus "i;t sont indépendamment distribuésdans les dimensions i et t; suivant une loi normale d’espérance nulle et de variance…nie ¾2

"; cette statistique suit une distribution de Fischer avec (K + 1) (N ¡ 1) etNT ¡ N (K + 1) degrés de liberté. Les conclusions de ce test sont les suivantes. Sil’on accepte l’hypothèse nulle H0

1 d’homogénéité, on obtient alors un modèle de pooledtotalement homogène.

yi;t = ® + ¯0xi;t + "i;t (1.3)

Si en revanche, on rejette l’hypothèse nulle, on passe à une seconde étape qui consisteà déterminer si l’hétérogénéité provient des coe¢cients ¯i.

3Dans notre modèle, chaque vecteur ¯i comprend K paramètres. Pour les N individus du panel, onobtient KN paramètres. L’égalité des N vecteurs ¯i revient donc à imposer KN ¡K restrictions. Dela même façon, l’égalité des N constantes revient à imposer N ¡ 1 restrictions. Au total, l’hypothèseH1

0 revient à imposer (K + 1) (N ¡ 1) restrictions linéaires.

Page 12: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 12

La seconde étape consiste à tester l’égalité pour tous les individus des K com-posantes des vecteurs ¯i.

H20 : ¯i = ¯8 i 2 [1;N ]

H2a : 9 (i; j) 2 [1; N ] = ¯i 6= ¯j

Sous l’hypothèse nulle, on n’impose ici aucune restriction sur les constantes indi-viduelles ®i: De la même façon, on construit une statistique de Fischer pour testerces (N ¡ 1)K restrictions linéaires. Toujours sous l’hypothèse d’indépendance et denormalité des résidus, cette statistique suit une loi de Fischer avec (N ¡ 1)K et NT ¡N (K + 1) degrés de liberté. Si l’on rejette l’hypothèse nulle H0

2 d’homogénéité des coef-…cients ¯i, on rejette alors la structure de panel, puisque au mieux seules les constantes®i peuvent être identiques entre les individus :

yi;t = ® + ¯0ixi;t + "i;t (1.4)

On estime alors les paramètres vectoriels ¯i en utilisant les modèles di¤érents payspar pays. Si en revanche, on accepte l’hypothèse nulle H0

2 d’homogénéité des coe¢cients¯i; on retient la structure de panel et l’on cherche alors à déterminer dans une troisièmeétape si les constantes ®i ont une dimension individuelle.

La troisième étape de la procédure consiste à tester l’égalité des N constantes indi-viduelles ®i; sous l’hypothèse de coe¢cients ¯i communs à tous les individus :

H30 : ®i = ® 8 i 2 [1;N ]

H3a : 9 (i; j) 2 [1;N ] = ®i 6= ®j

Sous l’hypothèse nulle, on impose ¯i = ¯: Sous l’hypothèse d’indépendance et denormalité des résidus, on construit une statistique de Fischer pour tester ces N ¡1 restrictions linéaires. Cette statistique suit une loi de Fischer avec (N ¡ 1)K etN (T ¡ 1)¡K degrés de liberté. Si l’on rejette l’hypothèse nulle H0

3 d’homogénéité desconstantes ®i, on obtient alors un modèle de panel avec e¤ets individuels :

yi;t = ®i + ¯0xi;t + "i;t (1.5)

Dans le cas où l’on accepte l’hypothèse nulle H03 , on retrouve alors une structure de

panel totalement homogène (modèle pooled). Le test H03 ne sert alors qu’à con…rmer

ou in…rmer les conclusions du tests H01 ; étant donné que le fait de réduire le nombre de

restrictions linéaires permet d’accroître la puissance du test du Fischer.

Page 13: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 13

1.2.2. Construction des statistiques de test

Nous allons à présent, présenter les méthodes de construction des di¤érents tests deFischer utilisés dans cette procédure. On considère le modèle (1.1) et l’on suppose queles résidus "i;t sont indépendamment distribués dans les dimensions i et t; suivant uneloi normale d’espérance nulle et de variance …nie ¾2

". On suppose que la variance ¾2" est

connue.

Test d’homogénéité globale On considère tout d’abord, le test de l’hypothèsed’homogénéité totale H1

0 :

H10 : ¯i = ¯ ®i = ® 8 i 2 [1;N ]

Soit F1 la statistique de Fischer associée à ce test. Ce test revient à imposer(K + 1) (N ¡ 1) restrictions linéaires sur les coe¢cients du modèle (1.1). De plus,sous l’hypothèse alternative H2

a ; il existe au plus NK coe¢cients di¤érents pour lescomposantes des N vecteurs ¯i (de dimension K) et N constantes individuelles. Ondispose donc de NT ¡ N (K + 1) degrés de liberté.

De…nition 1.1. La statistique de Fischer F1 associée au test d’homogénéité totale H10

dans le modèle (1.1) :

H10 : ¯i = ¯

(K;1)®i = ® 8 i 2 [1;N ]

s’écrit sous la forme suivante et suit un Fischer avec (N ¡ 1) (K + 1) et NT ¡N (K + 1)degrés de liberté :

F1 =(SCR1;c ¡ SCR1) = [(N ¡ 1) (K + 1)]

SCR1= [NT ¡ N (K + 1)](1.6)

où SCR1 désigne la somme des carrés des résidus du modèle (1.1) et SCR1;c la sommedes carrés des résidus du modèle contraint :

yi;t = ® + ¯0xi;t + "i;t

Ainsi, si la réalisation de la statistique de Fischer pour l’échantillon considéré estsupérieure au seuil théorique à ®%; on rejette l’hypothèse nulle d’homogénéité. Reste àprésent à déterminer la formule générale des sommes de carrés des résidus des modèlescontraint et non contraint. Considérons tout d’abord le modèle non contraint :

yi;t = ®i + ¯0ixi;t + "i;t

Les estimateurs bi et b®i des paramètres individuels sont obtenus équation par équa-

tion pour chaque individu. Soit SCR1;i la somme des carrés des résidus obtenue pour

Page 14: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 14

chaque équation. La somme des carrés des résidus du modèle (1.1) non contraint estalors tout simplement dé…nie comme la somme des N somme des carrés des résidusobtenues pour les N équations individuelles.

SCR1 =NX

i=1

SCR1;i =NX

i=1

hSyy;i ¡ S0xy;iS

¡1xx;iSxy;i

i(1.7)

où les sommes Sk;i sont dé…nies de la façon suivante 8 i 2 [1; N ] :

Syy;i =TX

t=1

(yi;t ¡ yi)2 (1.8)

Sxx;i =TX

t=1

(xi;t ¡ xi) (xi;t ¡ xi)0 (1.9)

Sxy;i =TX

t=1

(xi;t ¡ xi) (yi;t ¡ yi)0 (1.10)

Les moyennes xi et yi sont dé…nies, pour chaque individu, dans la dimension tem-porelle de façon traditionnelle par 8 i 2 [1; N ] :

xi =1T

TX

t=1

xi;t

yi =1T

TX

t=1

yi;t

L’expression de SCR1 fait ainsi apparaître la somme des variances individuellesdes résidus obtenues à partir des N régressions individuelles. L’expression Syy;i ¡S0xy;iS

¡1xx;iSxy;i correspond ainsi (à une transformée linéaire près) à la variance intra-

groupe (Within variance) des résidus.

Le modèle (1.1) contraint sous l’hypothèse H10 s’écrit :

yi;t = ® + ¯0xi;t + "i;t (1.11)

On dispose ainsi d’un échantilon de TN observations pour identi…er les paramètrescommuns ® et ¯ de cette relation. On applique alors les Moindres Carrés Ordinairessur les données empilées (modèle pooled). La somme des carrés s’écrit sous la forme :

SCR1;c = Syy ¡ S0xyS¡1xx Sxy (1.12)

où les sommes Sk sont dé…nies de la façon suivante :

Syy =NX

i=1

TX

t=1

(yi;t ¡ yi)2 (1.13)

Page 15: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 15

Sxx;i =NX

i=1

TX

t=1

(xi;t ¡ xi) (xi;t ¡ xi)0 (1.14)

Sxy;i =NX

i=1

TX

t=1

(xi;t ¡ xi) (yi;t ¡ yi)0 (1.15)

Les moyennes x et y sont alors dé…nies sur l’ensemble des TN observations :

x =1

NT

NX

i=1

TX

t=1

xi;t

y =1

NT

NX

i=1

TX

t=1

yi;t

L’expression SCR1;c correspond à une transformée de la variance totale des résidus(total variance) obtenus à partir de l’estimation d’un modèle unique sur les NT donnéesempilées.

Test d’homogénéité des coe¢cients ¯iConsidérons à présent le test de l’hypothèse d’homogénéité des coe¢cients ¯i, notée

H20 :

H20 : ¯i = ¯ 8 i 2 [1;N ]

Soit F2 la statistique de Fischer associée à ce test. Sous l’hypothèse nulle, on n’im-pose aucune restriction sur les constantes individuelles ®i: Toujours sous l’hypothèsed’indépendance et de normalité des résidus, on construit une statistique de Fischerpour tester ces (N ¡ 1)K restrictions linéaires. Sous l’hypothèse alternative H2

a ; onretrouve le modèle (1.1) et NT ¡ N (K + 1) degrés de liberté.

De…nition 1.2. La statistique de Fischer F2 associée au test d’homogénéité totale H20

dans le modèle (1.1) :H2

0 : ¯i = ¯(K;1)

8 i 2 [1;N ]

s’écrit sous la forme suivante et suit un Fischer avec (N ¡ 1)K et NT ¡ N (K + 1)degrés de liberté :

F2 =¡SCR1;c0 ¡ SCR1

¢= [(N ¡ 1)K]

SCR1= [NT ¡ N (K + 1)](1.16)

où SCR1 désigne la somme des carrés des résidus du modèle (1.1) et SCR1;c0 la sommedes carrés des résidus du modèle contraint (modèle à e¤ets individuels) :

yi;t = ®i + ¯0xi;t + "i;t

Page 16: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 16

La somme des carrés des résidus du modèle non contraint, SCR1; est donnée parl’équation (1.7). Sous l’hypothèse H2

0 ; la somme des carrés des résidus dans le modèleà e¤ets individuels est donnée par :

SCR1;c0 =NX

i=1

Syy;i ¡Ã NX

i=1

Sxy;i

!0 Ã NX

i=1

Sxx;i

!¡1 Ã NX

i=1

Sxy;i

!(1.17)

où les sommes Sk;i ont été dé…nies par les équations (1.8), (1.9) et (1.10). Cette écrituresigni…e que dans le modèle à e¤ets individuels, les estimateurs (Within) des paramètres¯i et ®i sont obtenus en centrant les variables sur leurs moyennes individuelles respec-tives. Nous reviendrons par la suite sur cette propriété.

Test d’homogénéité des constantes ®iConsidérons en…n le dernier test d’homogénéité des constantes ®i, notée H3

0 :

H30 : ®i = ® 8 i 2 [1; N ]

Soit F3 la statistique de Fischer associée à ce test. Sous l’hypothèse nulle, onimpose l’égalité des paramètres ¯i: Sous l’hypothèse d’indépendance et de normalitédes résidus, on construit une statistique de Fischer pour tester ces N ¡ 1 restrictionslinéaires. Sous l’hypothèse alternative H3

a ; les coe¢cients ¯i sont tous égaux, mais lesconstantes di¤èrent selon les individus. On a donc NT ¡ N ¡ K degrés de liberté.

De…nition 1.3. La statistique de Fischer F3 associée au test d’homogénéité totale H30

dans le modèle (1.1) :H3

0 : ®i = ® 8 i 2 [1; N ]

s’écrit sous la forme suivante et suit un Fischer avec N ¡ 1 et N (T ¡ 1) ¡ K degrés deliberté :

F3 =¡SCR1;c ¡ SCR1;c0

¢= (N ¡ 1)

SCR1;c0= [N (T ¡ 1) ¡ K](1.18)

où SCR1;c0 désigne la somme des carrés des résidus du modèle (1.1) sous l’hypothèse¯i = ¯ (modèle à e¤ets individuels) et SCR1;c la somme des carrés des résidus dumodèle contraint (modèle de pooled) :

yi;t = ® + ¯0xi;t + "i;t

Les sommes des carrés des résidus SCR1;c0 et SCR1;c ont été respectivement dé…niespar les équations (1.17) et (1.12).

Il est en outre possible de tester la constance dans le temps des di¤érents paramètresdu panel suivant une procédure sensiblement identique (voir Hsiao 1986). Mais cetteproblématique relève plus de la notion traditionnelle de stabilité des coe¢cients dans letemps que de la pure application des techniques économétriques de données de panel.

Page 17: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 17

1.3. Application

Considérons à présent une application simple de ces tests d’homogénéité à partir dedonnées de panel relatives au nombre de grèves dans le secteur industriel4. Les donnéesannuelles couvrent 17 pays5 de l’OCDE et sont disponibles de 1951 à 1985. Soit si;t lenombre de jours chômés pour cause de grève, pour 1000 salariés du secteur industriel,du pays i observé à la date t. Nous cherchons à relier cette variable d’une part au tauxde chômage de l’économie, noté ui;t; et d’autre au niveau de l’in‡ation, notée pi;t; selonla relation linéaire suivante :

si;t = ®i + ¯iui;t + °ipi;t + "i;t 8 i = 1; ::; 17 (1.19)

Appliquons la stratégie de test d’homogénéité à ce modèle. Pour ce faire, nousutiliserons directement les résultats des tests programmés sous TSP (version 4.3A ouversions ultérieures). Les commandes TSP sont donc les suivantes :

load(file=’’strikes.wks’’);panel (id=i,time=t,byid) srt u p;

La première ligne du programme sert tout simplement à lire les données du …chierstrike.wks. La seconde ligne du programme permet d’obtenir l’ensemble des estima-teurs de base (pooled, between, e¤ets …xes et e¤ets aléatoires) ainsi que les résultatsdes principaux tests de spéci…cation (tests d’homogénéité et test d’Hausman). L’optionid = i indique le nom de l’indicatrice pays et l’option time = t indique le nom de l’indi-catrice temporelle. L’option byid est nécessaire pour a¢cher l’ensemble des résultatsdes tests de spéci…cation6. Les variables sont respectivement nommées srt , u et p.

Sur la …gure (1.2) sont reportés les résultats d’estimation de cette procédure TSP.Nous allons nous concentrer plus particulièrement sur l’analyse des résultats des testsd’homogénéité. TSP propose, avec l’option byid, les trois tests de Fischer présentésprécédemment.

On observe tout d’abord le panel est cylindré (balanced), c’est à dire qu’il comportele même nombre de points dans la dimension temporelle pour tous les individus. Ona ici N = 17 et T = 35; soit 595 observations. Commençons tout d’abord par le test

4Les données ont été collectées par Bruce Western et proviennent du sitehttp://lib.stat.cmu.edu/datasets/

5Le panel comporte initialement 18 pays, mais pour le pays 3, les données ne sont disponibles quejusqu’en 1980. C’est pourquoi a…n de travailler sur un panel cylindré nous avons choisi de retirer cepays de notre échantillon.

6Pour plus de détails sur l’instruction panel sous TSP, se reporter au manuel de programmation dulogiciel.

Page 18: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 18

Figure 1.2: Résultats des Tests de Spéci…cation sous TSP 4.3A

Page 19: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 19

de l’hypothèse d’homogénéité totale (test H10 dans nos notations). Ce dernier est noté

sous la forme F test of A;B = Ai; Bi dans le …chier résultat de TSP. La lettre Adésigne ici les constantes, tandis que la lettre B désigne le vecteur des coe¢cients desvariables explicatives. Dans le cadre de notre échantillon, la réalisation de la statistiquede Fischer associée au test H1

0 , notée F1; est de 3:8320. Le logiciel indique en outre lenombre de degré de liberté de cette statistique. Nous avons vu précédemment que F1

suivait un Fischer avec (N ¡ 1) (K + 1) et NT ¡ N (K + 1) degrés de liberté. Comptetenu des dimensions de notre panel et du nombre de variables explicatives (K = 2),on doit donc comparer la valeur de cette réalisation au seuil d’un Fischer F (48; 544) :Le logiciel nous donne directement la pvalue associée à ce test. En l’occurrence ici,cette pvalue est très largement inférieure au seuil de 5%, donc pour ce seuil, on rejettel’hypothèse nulle H0 d’égalité des constantes ®i et des coe¢cients ¯i et °i:

Il convient alors de tester l’hypothèse H20 ; d’égalité des coe¢cients ¯i et °i (co-

e¢cients associés aux variables explicatives) entre les pays. Ce test est noté sous laforme F test of Ai; B = Ai; Bi dans le …chier résultat de TSP. Dans le cadre denotre échantillon, la réalisation de la statistique de Fischer associée au test H2

0 , notéeF2; est de 1:1845. Cette valeur est à comparer au seuil d’un Fischer avec (N ¡ 1)K etNT ¡ N (K + 1) degrés de liberté , c’est à dire ici un F (32; 544) : La pvalue indiqueici que jusqu’au seuil de 25%, l’hypothèse nulle ne peut pas être rejetée. A 5%, on con-…rme donc ici la structure de panel, puisque l’on est en droit de supposer qu’il existedes coe¢cients communs pour tous les pays entre le volume des grèves et les variablesexplicatives que sont le chômage et l’in‡ation.

Reste en…n à tester l’hypothèse H30 de constantes individuelles ®i: Ce test est noté

sous la forme F test of Ai; B = Ai; B dans le …chier résultat de TSP. Dans le cadrede notre échantillon, la réalisation de la statistique de Fischer associée au test H3

0 ,notée F3; est de 9:0342. Cette valeur est à comparer au seuil d’un Fischer avec N ¡ 1et N (T ¡ 1) ¡ K degrés de liberté , c’est à dire ici un F (16; 576) : La pvalue est trèslargement inférieure au seuil de 5%. Pour ce seuil, on rejette l’hypothèse nulle H0

d’égalité des constantes ®i: Il est nécessaire d’introduire ici des e¤ets individuels. Laspéci…cation …nale de notre modèle est donc :

si;t = ®i + ¯ui;t + °pi;t + "i;t 8 i = 1; ::; 17 (1.20)

Reste à présent à étudier les di¤érentes méthodes d’estimation des modèles incluantdes constantes individuelles.

Page 20: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 20

2. Modèles à e¤ets individuels

Nous allons à présent nous à des modèles de panel hétérogènes, où la seule sourced’hétérogénéité provient des constantes individuelles. On suppose ainsi que les coe¢-cients des di¤érentes variables stochastiques explicatives sont identiques pour tous lesindividus du panel (¯i = ¯). On suppose en outre que ces coe¢cients sont des con-stantes déterministes. Les constantes individuelles ®i; quant à elles, di¤èrent selon lesindividus.

Hypothèse (H1) On suppose que les N vecteurs de paramètres ¯i sont identiques,¯i = ¯ 2 R; 8 i 2 [1; N ] ; tandis que les constantes ®i peuvent di¤érer selon lesindividus. En particulier, il existe au moins un couple (j; i) 2 [1;N ]2 tel que®j 6= ®i

Sous l’hypothèse (H1), le modèle (1.1), s’écrit sous la forme suivante :

yi;t = ®i + ¯0xi;t + "i;t (2.1)

où ®i 2 R et ¯0 = (¯1¯2::::¯K ) 2 RK est un vecteur de constantes. Les innovations "i;tsont supposées être i:i:d: de moyenne nulle, de variance égale à ¾2

"; 8 i 2 [1; N ] et sontsupposées non corrélées que ce soit dans la dimension individuelle ou dans la dimensiontemporelle.

Dès lors, dans ce contexte, on doit distinguer deux cas : le cas où les paramètres ®isont des constantes déterministes (modèle à e¤ets …xes) et le cas où les paramètres ®isont des réalisations d’un variable aléatoire d’espérance et de variance …nie (modèle àe¤ets aléatoires). Nous allons donc successivement envisager ces deux types de modèle(sections 3 et 4). Toutefois, avant de présenter ces deux modèles, nous commenceronstout d’abord par introduire les di¤érentes méthodes d’empilement de données de panelqui autorisent une écriture vectorielle du modèle à e¤et individuel.

En e¤et, il existe deux possibilité d’écriture vectorielle du modèle (2.1). Autrementdit, il existe deux façons d’empiler les données :

1. Empilement par individus : pour une variable donnée, les T réalisations his-toriques de chaque individu sont stockées dans un vecteur colonne, et les Nvecteurs colonnes ainsi obtenus sont ensuite empilés à la suite des uns des autresdans l’ordre des individus.

Page 21: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 21

2. Empilement par dates : pour une variable donnée, les N réalisations individuellespour une date donnée sont stockées dans un vecteur colonne, et les T vecteurscolonnes ainsi obtenus pour toutes les dates sont ensuite empilés à la suite desuns des autres.

Il est très important de noter que les principaux logiciels d’économétrie (notammentTSP) optent généralement pour une méthode d’empilement par pays. Si le logicieln’empile pas lui même les données, les séries utilisées dans le cadre des applicationsdoivent, de façon impérative, être ordonnées sous la forme préconisée par les concepteursdu logiciel.

2.1. Empilement par pays

Considérons tout d’abord la méthode d’empilement par pays. On considère un échan-tillon de N individus sur T périodes, et un modèle avec K variables explicatives. Onpose :

yi(T;1)

=

0BB@

yi;1yi;2:::yi;T

1CCA Xi

(T;K)=

0BB@

x1;i;1 x2;i;1 ::: xK;i;1x1;i;2 x2;i;2 ::: xK;i;2::: ::: ::: :::x1;i;T x2;i;T ::: xK;i;T

1CCA "i

(T;1)=

0BB@

"i;1"i;2:::"i;T

1CCA

On dé…nit en outre un vecteur unitaire, noté e; tel que :

e(T;1)

=

0BB@

11:::1

1CCA

De…nition 2.1. Dans le cas de l’empilement par pays, pour chaque individu 8i 2[1;N ] ; le modèle (2.1) peut s’écrire sous la forme :

yi = e®i + Xi¯ + "i 8 i = 1; ::;N (2.2)

C’est principalement cette expression du modèle (2.1) que l’on utilisera par la suitepour étudier les estimateurs du modèle linéaire simple. On peut toutefois écrire lemodèle de façon totalement vectorielle en empilant les vecteurs yi et les matrices Xi:Pour cela on pose :

Y(TN;1)

=

0BB@

y1y2:::yN

1CCA X

(TN;K)=

0BB@

X1X2:::XN

1CCA "

(TN;1)=

0BB@

"1"2:::"N

1CCA

Page 22: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 22

On dé…nit 0T le vecteur nul de dimension (T; 1) :

ee(TN;N)

=

0BB@

e 0T ::: 0T0T e ::: 0T::: ::: ::: 0T0T 0T ::: e

1CCA e®

(N;1)=

0BB@

®1®2:::®N

1CCA

On obtient alors la représentation vectorielle suivante :

Y = eee® + X¯ + " (2.3)

2.1.1. Exemple

Considérons un panel de 2 pays (N = 2), dont les données annuelles sont disponiblessur 3 ans (T = 3). On cherche à estimer une fonction de production log-linéaire (Cobb-Douglass), supposée commune à ces deux pays. Soit yi;t le logarithme du PIB, ki;t lelogarithme du stock de capital privé et ni;t le logarithme de l’emploi. On suppose quecette fonction de production s’écrit sous la forme :

yi;t = ®i + ¯kki;t + ¯nni;t + "i;t 8 i 2 [1; 2] ;8 t 2 [1; T ]

où ¯k et ¯n désignent respectivement les élasticités (supposées communes aux deuxpays) de la production par rapport au capital et à l’emploi. L’e¤et individuel ®i mesureici les spéci…cités a-temporelles de la productivité totale des facteurs qui corresponddans cette régression, aux résidus "i;t: Ce modèle s’écrit sous forme vectorielle de lafaçon suivante :

0@

yi;1yi;2yi;3

1A =

0@

111

1A®i +

0@

ki;1 ni;1ki;2 ni;2ki;3 ni;3

1A

µ¯k¯n

¶+

0@

"i;1"i;2"i;3

1A

() yi = e®i + Xi¯ + "i 8 i = 1; ::;N

L’écriture vectorielle complète du modèle est la suivante :0BBBBBBB@

y1;1y1;2y1;3y2;1y2;2y2;3

1CCCCCCCA

=

0BBBBBB@

1 01 01 00 10 10 1

1CCCCCCA

µ®1®2

¶+

0BBBBBBB@

k1;1 n1;1k1;2 n1;2k1;3 n1;3

k2;1 n2;1k2;2 n2;2k2;3 n2;3

1CCCCCCCA

µ¯k¯n

¶+

0BBBBBBB@

"1;1"1;2"1;3"2;1"2;2"2;3

1CCCCCCCA

() Y = eee® + X¯ + "

Page 23: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 23

2.2. Empilement par dates

De façon parallèle, il est possible de représenter de façon symétrique le modèle (2.1)en utilisant la méthode d’empilement par dates. Pour ce faire, il su¢t de poser lesdé…nitions suivantes :

yt(N;1)

=

0BB@

y1;ty2;t:::yN;t

1CCA Xt

(N;K)=

0BB@

x1;1;t x2;1;t ::: xK;1;tx1;2;t x2;2;t ::: xK;2;t::: ::: ::: :::x1;N;t x2;N;t ::: xK;N;t

1CCA "t

(T;1)=

0BB@

"1;t"2;t:::"N;t

1CCA

De…nition 2.2. Dans le cas de l’empilement par dates, pour chaque date t 2 [1; T ] ;le modèle (2.1) peut s’écrire sous la forme :

yt = e® + Xt¯ + "t 8 t = 1; ::; T (2.4)

De la même façon, il est possible d’exprimer le modèle (2.1) sous une forme vecto-rielle complète. On pose :

Y(TN;1)

=

0BB@

y1y2:::yT

1CCA X

(TN;K)=

0BB@

X1X2:::XT

1CCA "

(TN;1)=

0BB@

"1"2:::"T

1CCA

Soit IN la matrice identité de dimension (N;N) : On dé…nit la matrice suivante :

eee(TN;N)

=

0BB@

ININ:::IN

1CCA

Il vient alors :Y = eeee® + X¯ + " (2.5)

2.2.1. Exemple

Reprenons l’exemple présenté précédemment. Lorsque les données sont empilées pardates, ce modèle s’écrit sous forme vectorielle de la façon suivante :

µy1;ty2;t

¶=

µ®1®2

¶+

µk1;t n1;tk2;t n2;t

¶µ¯k¯n

¶+

µ"1;t"2;t

() yt = e® + Xt¯ + "t 8 t = 1; ::; T

Page 24: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 24

L’écriture vectorielle complète du modèle est la suivante :

0BBBBBBB@

y1;1y2;1y1;2y2;2y1;3y2;3

1CCCCCCCA

=

0BBBBBB@

1 00 11 00 11 00 1

1CCCCCCA

µ®1®2

¶+

0BBBBBBBB@

k1;1 n1;1k2;1 n2;1

k1;2 n1;2k2;2 n2;2

k1;3 n1;3k2;3 n2;3

1CCCCCCCCA

µ¯k¯n

¶+

0BBBBBBB@

"1;1"2;1"1;2"2;2"1;3"2;3

1CCCCCCCA

() Y = eeee® + X¯ + "

Maintenant que nous avons présenté l’écriture vectorielle des modèles de panelà e¤ets individuels, nous allons à présent étudier les propriétés des estimateurs desparamètres de ces modèles suivant la spéci…cation des e¤ets individuels. Nous dis-tinguerons pour cela deux cas : le cas des e¤ets …xes et le cas des e¤ets aléatoires.

Page 25: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 25

3. Modèle à e¤ets …xes

On fait maintenant l’hypothèse que les e¤ets individuels ®i sont représentés par desconstantes (d’où l’appellation modèle à e¤ets …xes). Nous allons déterminer la formegénérale des estimateurs des paramètres ®i et ¯ dans ce modèle à e¤ets …xes. Onconsidère donc le modèle (1.1) sous l’hypothèse (H1) :

yi;t = ®i + ¯0xi;t + "i;t 8 i 2 [1; N ] ; 8 t 2 [1; T ] (3.1)

où ®i 2 R, ¯0 = (¯1¯2::::¯K ) 2 RK . Tous les paramètres du modèle sont des constanteset l’on suppose pour simpli…er qu’il n’existe pas d’e¤et temporel. On dé…nit le vecteur"i tel que :

"i(T;1)

"i;1 "i;2 ::: "i;T¢0

Pour étudier les propriétés des estimateurs du modèle à e¤ets …xes, nous allonsfaire une hypothèse supplémentaire sur la nature du processus des résidus "i;t: Cettehypothèse constitue tout simplement la généralisation dans la dimension de panel dela dé…nition d’un bruit blanc.

Hypothèse (H2) On suppose que les résidus "i;t sont i:i:d: et satisfont les conditionssuivantes, 8 i 2 [1; N ] ; 8 t 2 [1; T ]² E ("i;t) = 0

²E ("i;t"i;s) =½

¾2"

0t = s

8t 6= s ; ce qui implique que E ("i"0i) = ¾2"IT où It désigne

la matrice identité (T; T ) :² E ("i;t"j;s) = 0;8j 6= i; 8 (t; s)

La première condition impose tout simplement que l’espérance des résidus du mod-èle (3.1) soit nulle. La seconde condition, standard en économétrie des séries tem-porelles, impose que le processus "i;t soit un processus ”sans mémoire” (dans la di-mension temporelle). Pour chaque individu, il n’existe ainsi aucune corrélation entrele niveau présent du processus "i;t et les réalisations passées. Seule la variance duprocessus "i;t est non nulle. L’introduction d’une dimension individuelle, nous obligeici à dé…nir une seconde contrainte qui est que tous les processus individuels "i;t ontla même variance ¾2

" quel que soit l’individu considéré. Autrement dit, la matrice devariance covariance du processus "i est proportionnelle, à un scalaire près, à la matriceidentité. En…n, la troisième condition stipule qu’il n’existe aucune corrélation entreles processus d’innovation pour deux individus distincts et cela quelle que soit la dateconsidérée.

Page 26: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 26

3.1. Estimateur Within ou LSDV

Considérons l’écriture vectorielle du modèle obtenue par un empilement des donnéespar pays.

yi(T;1)

= e(T;1)

®i+ Xi(T;K)

¯(K;1)

+ "i(T;1)

8 i = 1; ::;N (3.2)

L’estimateur des Moindres Carrés Ordinaires (MCO) des paramètres ®i et ¯ dansle modèle à e¤ets …xes est appelé estimateur Within; ou estimateur à e¤ets …xes ouestimateur LSDV (Least Square Dummy Variable). Comme nous l’avons vu, le termeWithin s’explique par le fait cet estimateur tient compte de la variance intra groupe dela variable endogène. La troisième appellation LSDV tient au fait que cet estimateurconduit à introduire des variables dummies, qui dans la spéci…cation (3.2) correspondentaux vecteurs colonnes de e:

On peut démontrer que sous l’hypothèse (H2), l’estimateur des Moindres CarrésOrdinaires (MCO) des paramètres ®i et ¯ du modèle (3.2) est le meilleur estimateurlinéaire sans biais (BLUE7). Si l’on suppose que ¾" est connu, cet estimateur estobtenu en minimisant la variance des résidus empiriques, notée S; par rapport auxseuls paramètres ®i et ¯:

minf®i;¯gNi=1

S =NX

i=1

"0i"i =NX

i=1

(yi ¡ e®i ¡ Xi¯)0 (yi ¡ e®i ¡ Xi¯)

La première condition nécessaire de ce programme; nous donne immédiatementl’expression de l’estimateur de la constante ®i, 8 i 2 [1;N ] :

b®i = yi ¡ b0LSDV xi (3.3)

où les termes yi et xi désignent les moyennes individuelles des variables endogènes etexogènes.

yi(1;1)

=1T

TX

t=1

yi;t xi(K;1)

=1T

TX

t=1

xi;t 8 i 2 [1;N ] (3.4)

Ces moyennes sont donc calculées de façon traditionnelle dans la dimension tem-porelle, et cela pour chaque individu de l’échantillon. C’est pourquoi elles sont indicéesen i:

A partir de la seconde condition nécessaire du programme de minimisation, onmontre que l’estimateur du paramètre vectoriel ¯ est donné par la relation suivante :

bLSDV =

" NX

i=1

TX

t=1

(xi;t ¡ xi) (xi;t ¡ xi)0#¡1 " NX

i=1

TX

t=1

(xi;t ¡ xi) (yi;t ¡ yi)

#(3.5)

7Best Linear Unbiased Estimator

Page 27: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 27

Proposition 3.1. L’estimateur Within ou LSDV de ¯; obtenu dans le modèle à e¤etsindividuels …xes (3.2) est identique à l’estimateur des MCO obtenu à partir d’un modèletransformé où les variables expliquées et explicatives sont centrées sur leur moyennesindividuelles respectives :

(yi;t ¡ yi) = b0 (xi;t ¡ xi) + "i;t 8 i 2 [1; N ] ; 8 t 2 [1; T ] (3.6)

Les réalisations des estimateurs des constantes ®i sont alors déduits de la relation :

b®i = yi ¡ b0xi

En e¤et, on voit d’après l’équation (3.5), que l’estimateur Within des coe¢cientsde ¯ peut être obtenu en centrant les di¤érentes (variables endogène et exogènes) surles moyennes individuelles respectives. Ainsi, on peut obtenir le même estimateur enutilisant le modèle transformé suivant 8 i 2 [1;N ] ; 8 t 2 [1; T ] :

eyi;t = ¯0exi;t + "i;t

avec eyi;t = (yi;t ¡ yi) et exi;t = (xi;t ¡ xi). En e¤et, dans ce cas on obtient :

b =

"NX

i=1

TX

t=1

exi;tex0i;t

#¡1 "NX

i=1

TX

t=1

exi;teyi;t#

=

"NX

i=1

TX

t=1

(xi;t ¡ xi) (xi;t ¡ xi)0#¡1 "

NX

i=1

TX

t=1

(xi;t ¡ xi) (yi;t ¡ yi)

#

On reconnaît ici l’expression générale de l’estimateur Within bLSDV : Reste alors à

obtenir les réalisations des estimateurs des constantes individuelles selon la formule :

b®1 = y1 ¡ b0x1b®2 = y2 ¡ b0x2

::::

b®N = yN ¡ b0xN

Le fait qu’il soit équivalent d’estimer les paramètres du modèle (3.2) directement àpartir de cette spéci…cation incluant des dummies individuelles ou à partir d’un modèletransformé où les variables sont centrées sur leurs moyennes individuelles respectivesest particulièrement important. Cela illustre la notion de variance intra-classes quiest fondamentale dans la construction de l’estimateur Within. Nous allons à présent,proposer une illustration de cette propriété de l’estimateur Within:

Page 28: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 28

3.2. Application

Considérons à nouveau l’exemple du modèle de grèves dans le secteur industriel. Nousavons établi précédemment que le modèle de panel comportait des e¤ets individuels etpouvait s’écrire sous la forme:

si;t = ®i + ¯ui;t + °pi;t + "i;t 8 i = 1; ::; 17 (3.7)

où si;t désigne le nombre de jours chômés pour cause de grève, pour 1000 salariésdu secteur industriel, ui;t désigne le taux de chômage de l’économie et pi;t le tauxd’in‡ation. On suppose que l’on peut spéci…er les e¤ets individuels ®i sous la formed’e¤ets …xes. Dans le programme ci-dessous, on cherche à comparer l’estimateur Withinet l’estimateur des MCO du modèle transformé :

(si;t ¡ si) = ¯ (ui;t ¡ ui) + ° (pi;t ¡ pi) + "i;t (3.8)

L’instruction panel de TSP avec les options notot, nobet et novar permet d’obtenirdirectement et uniquement les résultats de l’estimation Within: Pour construire les es-timateurs du modèle transformé, on doit au préalable centrer les variables sur leurmoyennes individuelles respectives. Pour réaliser cette opération on construit uneboucle sur les N = 17 individus, avec un compteur j et à chaque étape on sélectionneun pays dont le code pays (variable i) est égal à la valeur du compteur j (instruc-tion select i = j). Pour le sous échantillon sélectionné, l’instruction msd [Nom dela Variable] permet alors de calculer di¤érents moments de la variable considérée sansles a¢cher (si l’on ajoute l’option noprint). En particulier, la moyenne empirique eststockée dans la variable réservée @mean. Dès lors, pour chaque individu, on construitde nouvelles variables en centrant sur les moyennes individuelles correspondantes. En-…n, il ne reste plus qu’à e¤ectuer la régression par les MCO sur le modèle transformé(instruction ls ou ols)

load(file=’’strikes.wks’’);?---- Estimation Within ----panel (id=i,time=t,notot,nobet,novar) srt u p;?---- Centrer les Données ---do j=1 to 17;

select (i=j);msd(noprint) srt;srtc=srt-@mean;msd(noprint) u;uc=u-@mean;msd(noprint) p;

Page 29: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 29

pc=p-@mean;enddo;?---- Estimation Modèle Transformé----ls srtc uc pc;?---- Affichage des Effets Fixes (Instruction Panel) ----print @fixed;

Les résultats de ce programme sont reproduits sur la …gure (3.1). On véri…e quel’estimateur Within est totalement équivalent à l’estimateur des MCO appliqué surun modèle transformé où les variables endogènes et exogènes ont été centrées sur leursmoyennes individuelles respectives. Dans les deux cas, les réalisations des estimateursdes coe¢cients des deux variables explicatives (respectivement ui;t et pi;t) sont stricte-ment identiques (respectivement ¡21:5968 et 16:2729).

Dans le cas où l’on utilise la commande panel de TSP, on peut a¢cher les esti-mations des e¤ets …xes en utilisant la commande print @fixed. Dans le cas où l’onutilise le modèle transformé, il convient alors de reconstruire les estimateurs des ef-fets …xes selon la formule (3.3) en utilisant les moyennes individuelles des variables(cf. programme ci-dessus) et les réalisations des estimateurs des coe¢cients ° et ¯.Essayons à présent de commenter les estimations ainsi obtenues. Il s’avère ainsi quele pays 9 a, de façon structurelle, le plus de journées chômées pour cause de grève.Pour ce pays, di¤érents facteurs historiques (législation sur le droit de grève) ou soci-ologique (représentation des syndicats par exemple) expliquent que toutes choses égalespar ailleurs (chômage et in‡ation), la fréquence des grève soit particulièrement élévée.A l’inverse, les pays 15 et 2 ont des e¤ets …xes négatifs. Pour un même niveau de chô-mage et d’in‡ation, ces deux pays auront le nombre de jours chômés le plus faible detout notre échantillon. Il faut bien comprendre que les estimations des e¤ets individu-els ne peuvent s’analyser qu’en niveau relatif (c’est à dire en comparant les di¤érentesréalisations individuelles) et non en niveau absolu.

Page 30: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 30

Figure 3.1: Comparaison des Estimateurs Whithin et OLS sur Modèle Transformé

Page 31: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 31

3.3. Ecriture vectorielle

Une façon équivalente d’obtenir l’estimateur Within et de montrer l’équivalence avec lemodèle transformé où les variables sont centrées, consiste à travailler directement avecl’écriture vectorielle (3.2). Par la suite, nous adopterons souvent cette notation vecto-rielle qui permet d’alléger particulièrement les notations du modèle et des estimateurscorrespondants. On considère donc le modèle vectoriel suivant :

yi = e®i + Xi¯ + "i 8 i = 1; ::;N (3.9)

Nous allons à présent introduire un opérateur matriciel qui permet de centrer lesvariables sur leurs moyennes individuelles respectives.

De…nition 3.2. Le modèle (3.9) à e¤et individuels …xes peut s’écrire sous la formevectorielle suivante 8 i = 1; ::; N :

Qyi = QXi¯ + Q"i

où la matrice Q de dimension (T; T ) est telle que :

Q = IT ¡ 1T

ee0 (3.10)

L’estimateur Within du vecteur ¯ est alors dé…ni de la façon suivante :

bLSDV =

"NX

i=1

X 0iQXi

#¡1 "NX

i=1

X 0iQyi

#(3.11)

En e¤et, on peut montrer que les processus transformés Qyi et QXi correspondentaux variables centrées sur leurs moyennes respectives. En e¤et, on montre que :

Qyi =µ

IT ¡ 1T

ee0¶

yi = yi ¡ eµ

1T

e0yi¶

=

0BB@

yi;1yi;2:::yi;T

1CCA ¡

Ã1T

TX

t=1

yi;t

!0BB@

11:::1

1CCA

De la même façon, on peut montrer que :

QXi = Xi ¡1T

ee0Xi

QXi =

0BB@

x1;i;1 x2;i;1 ::: xK;i;1x1;i;2 x2;i;2 ::: xK;i;2::: ::: ::: :::x1;i;T x2;i;T ::: xK;i;T

1CCA¡ 1

T

0BB@

11:::1

1CCA

³ PTt=1 x1;i;t

PTt=1 x2;i;t :::

PTt=1 xK;i;t

´

Page 32: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 32

Dès lors, a…n d’éliminer les e¤ets individuels de l’équation (3.9), il su¢t de prémul-tiplier les membres de cette équation par Q. Ainsi 8 i = 1; ::;N

Qyi = Qe®i + QXi¯ + Q"i

() Qyi = QXi¯ + Q"i

En appliquant les MCO à cette expression on obtient donc une écriture équivalentede b

LSDV :

bLSDV =

"NX

i=1

X 0iQXi

#¡1 "NX

i=1

X 0iQyi

#(3.12)

Page 33: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 33

4. Modèle à e¤ets aléatoires

Dans la pratique standard de l’analyse économétrique, on suppose qu’il existe un grandnombre de facteurs qui peuvent a¤ecter la valeur de la variable expliquée et qui pour-tant ne sont pas introduits explicitement sous la forme de variables explicatives. Cesfacteurs sont alors approximés par la structure des résidus. Le problème se pose dela façon similaire en économétrie de panel. La seule di¤érence tient au fait que troistypes de facteurs omis peuvent être envisagés. Il y a tout d’abord les facteurs qui af-fectent la variable endogène di¤éremment suivant la période et l’individu considéré. Ilpeut en outre exister des facteurs qui a¤ectent de façon identique l’ensemble des indi-vidus, mais dont l’in‡uence dépend de la période considérée (e¤ets temporel). En…n,d’autres facteurs peuvent au contraire re‡éter des di¤érences entre les individus de typestructurelles, c’est à dire indépendantes du temps (e¤ets individuel).

Dès lors le résidu, noté "i;t; d’un modèle de panel peut être décomposé en troisprincipales composantes de la façon suivante (Hsiao 1986) 8 i 2 [1;N ] ; 8 t 2 [1; T ] :

"i;t = ®i + ¸t + vi;t (4.1)

Les variables ®i désignent ici les e¤ets individuels qui représentent l’ensemble desspéci…cités structurelles ou a-temporelles de la variable endogène, qui di¤érent selonles individus. On suppose ici que ces e¤ets sont aléatoires. Les variables aléatoires¸t représentent quant à elle les e¤ets temporels strictement identiques pour tous lesindividus. En…n, le processus stochastique vi;t désigne la composante du résidu total "i;torthogonale aux e¤ets individuels et aux e¤ets temporels. Généralement, on est conduità faire un certain nombre d’hypothèses techniques sur cette structure de résidus.

Hypothèses (H3) On suppose que les résidus "i;t = ®i+¸t+vi;t sont i:i:d: et satisfontles conditions suivantes, 8 i 2 [1; N ] ; 8 t 2 [1; T ]² E (®i) = E (¸t) = E (vi;t) = 0² E (®i¸t) = E (¸tvi;t) = E (®ivi;t) = 0

² E (®i®j) =½

¾2®0

i = j8i 6= j

² E (¸t¸s) =½

¾2¸0

t = s8t 6= s

² E (vi;tvj;s) =½

¾2v0

t = s; i = j8t 6= s; 8i 6= j

² E³®ix0i;t

´= E

³¸tx0i;t

´= E

³vi;tx0i;t

´= 0

Page 34: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 34

Sous ces hypothèses, la variance de la variable endogène yi;t conditionnellement auxvariables explicatives xi;t est alors égale à ¾2

y = ¾2® + ¾2

¸ + ¾2v. Les variances ¾2

®, ¾2¸ et

¾2v correspondent aux di¤érentes composantes de la variance totale. C’est pourquoi, le

modèle à e¤ets aléatoires est aussi appelé modèle à erreurs composés (error componentmodel).

Dans une première étape, nous allons présenter le modèle simple à e¤ets individuelsaléatoires. Nous supposerons ainsi, pour simpli…er l’analyse, qu’il n’existe pas d’e¤ettemporel. Nous proposerons alors une écriture vectorielle du modèle à e¤ets aléatoires.Dans une seconde étape nous étudierons les estimateurs des di¤érents coe¢cients de cemodèle.

4.1. Modèle à variance composée

On se limite au cas où il n’existe pas d’e¤et temporel (¸t = 0; 8t). On considère doncle modèle suivant 8 i 2 [1; N ] ; 8 t 2 [1; T ] :

yi;t = ¹ + ¯0xi;t + "i;t (4.2)

"i;t = ®i + vi;t (4.3)

où ¯0 = (¯1 ¯2::::¯K ) est un vecteur de constantes et le processus f"i;tg satisfait leshypothèses (H3). La constante ¹ désigne ici l’espérance inconditionnelle du processusy;i;t puisque on suppose que E (®i) = 0;8 i 2 [1; N ] :

Proposition 4.1. Le modèle à e¤ets individuels aléatoires s’écrit vectoriellement sousla forme :

yi(T;1)

= eXi(T;K+1)

°(K+1;1)

+ "i(T;1)

8 i = 1; ::;N (4.4)

avec "i = ®ie + vi; eXi = (e; Xi) et °0 =¡¹; ¯0

¢: Sous les hypothèses (H3), la matrice

de variance covariance de "i; notée V; est alors dé…nie par :

V = E¡"i"0i

¢= E

£(®ie + vi) (®ie + vi)0

¤= ¾2

®ee0 + ¾2

vIT (4.5)

L’inverse de cette matrice de variance covariance est dé…nie comme :

V ¡1 =1¾2v

·IT ¡

µ¾2®

¾2v + T¾2

®

¶ee0

¸(4.6)

Donnons ici une démonstration possible de ce résultat8. On pose eV = V ¡1: Pardé…nition on a eV V = V eV = IT : On en déduit que :

V eV = ¾2®ee

0 eV + ¾2veV = IT () ¾2

veV = IT ¡ ¾2

®ee0 eV

8Pour une démonstration plus élégante voir Graybill (1969), Nerlove (1971), Wallace et Hussain(1969)

Page 35: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 35

Reste alors à déterminer l’expression de ee0 eV : Raisonnons par une méthode decoe¢cient indéterminé. On suppose que ee0 eV peut s’écrire sous la forme µee0 où µ 2 R+.Considérons l’expression de ee0 eV V en substituant ee0 eV par son expression, il vient :

ee0eV V = µee0V

= µee0¡¾2®ee

0 + ¾2vIT

¢

= µ¾2®

£e¡e0e

¢e0

¤+ µ¾2

v¡ee0

¢

Par dé…nition de eV ; on a ee0eV V = ee0: Sachant que e (e0e) e0 = Tee0; on obtientalors la relation suivante :

ee0eV V = ee0

() µee0¡¾2®T + ¾2

= ee0

On en déduit immédiatement la valeur du paramètre µ :

µ =1

¾2®T + ¾2

v2 R+

On obtient ainsi :ee0 eV =

µ1

¾2®T + ¾2

v

¶ee0

Dès lors, en reprenant l’expression de eV , il vient :

¾2veV = IT ¡

µ¾2®

¾2®T + ¾2

v

¶ee0

Ainsi, l’inverse de la matrice de variance covariance des "i s’écrit sous la forme :

V ¡1 =1¾2v

·IT ¡

µ¾2®

¾2v + T¾2

®

¶ee0

¸

L’écriture vectorielle du modèle à e¤ets aléatoires de la proposition (4.1) nous seraparticulièrement dans la section suivante pour construire les estimateurs des di¤érentsparamètres de ce modèle.

4.2. Estimateurs du modèle à e¤ets aléatoires

Nous allons à présent nous intéresser aux propriétés des estimateurs du modèle aléa-toire. Pour bien comprendre ces propriétés, il est nécessaire de bien appréhender lesconséquences de la structure des résidus.

Page 36: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 36

Remark 1. Dans le modèle de la proposition (4.1), le fait que les e¤ets individuels®i constituent l’une des composantes des résidus "i du modèle (4.4), induit une cor-rélation entre le niveau de ces résidus lorsque l’on considère un individu donné. Enrevanche, sous (H3), il n’existe pas de corrélation de ces résidus dans la dimensioninter individuelle.

Quelles sont alors les conséquences de cette structure des résidus ? Si l’on raisonneen termes de biais d’estimation, il n’y en a aucune dès lors que l’on centre les variables dumodèle sur leur moyenne respective. En e¤et, dans ce cas la composante individuelle desrésidus disparaît et les corrélations inter-individuels des résidus du modèle transformédisparaissent par la même occasion. Pour le vecteur ¯; on retrouve alors la formegénérale de l’estimateur du modèle à e¤ets …xes. Pour preuve, appliquons l’opérateurQ au modèle à e¤et aléatoire :

Qyi = Qe¹ + QXi¯ + Qe®i + Qvi

Or, on sait par dé…nition de l’application que Qe =¡IT ¡ T¡1ee0

¢e = 0: Dès lors,

on obtient le modèle 8 i 2 [1; N ] :

Qyi = Qe¹ + QXi¯ + Qvi (4.7)

Dans ce modèle, sous (H3), l’estimateur bLSDV du vecteur ¯ est non biaisé et

convergent9. L’estimateur de la constante ¹ est alors construit sous la forme :

b¹ = y ¡ b0LSDV x (4.8)

avec :

yi(1;1)

=1

NT

NX

i=1

TX

t=1

yi;t x(K;1)

=1

NT

NX

i=1

TX

t=1

xi;t (4.9)

Ainsi, il n’existe pas de problème de biais lorsque l’on envisage les techniques d’es-timation utilisées dans les modèles à e¤ets …xes, c’est à dire lorsque l’on centre lesvariables sur leurs moyennes individuelles respectives. Toutefois, l’estimateur b

LSDV

ainsi obtenu n’est pas un estimateur à variance minimale : c’est pas l’estimateur BLUE:

Proposition 4.2. Dans un modèle à e¤ets aléatoires, l’estimateur Within bLSDV ;

obtenu sous l’hypothèse d’e¤ets …xes, est un estimateur sans biais et convergent duvecteur de paramètres ¯: Toutefois, ce n’est pas l’estimateur BLUE. Un estimateurBLUE est alors donné par l’estimateur de Moindres Carrés Généralisés (MCG).

9On a en e¤et :bLSDV

p¡!NT!1

¯

où l’indice p désigne la convergence en probabilité (voir section précédente pour une démonstration).

Page 37: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 37

Nous ne donnerons pas ici de démonstration de cette propriété. Si l’on résume, quelleque soit la nature des e¤ets individuels (…xes ou aléatoires), l’estimateur Within est unestimateur sans biais et convergent. Toutefois, cette estimateur n’est pas un estimateurà variance minimale lorsque les e¤ets individuels sont aléatoires. Un estimateur BLUEpossible du vecteur ¯ est alors donné par l’estimateur de Moindres Carrés Généralisés(MCG). Cette propriété sera particulièrement intéressante lorsqu’il sera nécessaire dediscriminer les deux modèles et de construire les tests de spéci…cation appropriés (testd’Hausman 1978, en particulier).

4.3. Estimateur des Moindres Carrés Généralisés

Nous avons vu que dans un modèle à e¤ets aléatoires, un estimateur BLUE peut êtreconstruit à partir de l’estimateur des Moindres Carrés Généralisés (MCG). Considéronsle modèle vectoriel de la proposition (4.1) :

yi = eXi° + "i 8 i = 1; ::;N (4.10)

avec "i = ®ie+vi; eXi = (e;Xi) et °0 =¡¹; ¯0

¢: Soit V la matrice de variance covariance

du vecteur des résidus "i : V = E ("i"0i) : On suppose, dans un premier temps, que Vest connue. Le problème est que, du fait de la structure du modèle, la matrice V n’estpas diagonale en raison de la présence de corrélations intra-individuelles des résidus.Tout comme en séries temporelles, c’est pourquoi on applique alors les MCG.

De…nition 4.3. Si la matrice V est connue, l’estimateur des MCG du vecteur °; notéb°MCG; est alors dé…ni par la relation :

b°MCG =

"NX

i=1

eX 0iV

¡1 eXi#¡1 "

NX

i=1

eX 0iV

¡1yi

#(4.11)

Cette dé…nition de l’estimateur b°MCG correspond à la dé…nition générale (iden-tique à celle utilisée en série temporelle, cf. Bourbonnais 2000) des Moindres CarrésGénéralisés. Bien entendu, lorsque la matrice V n’est pas connue, l’estimateur b°MCGest obtenu en deux étapes. La première étape consiste à appliquer l’estimateur Withinpour obtenir une première estimation sans biais et convergente des paramètres ¯ et¹: A partir de ces estimations, on construit les séries de résidus individuels "i et l’onconstruit un estimateur bV de la matrice de variance covariance V: La seconde étapeconsiste alors à appliquer l’estimateur des MCG selon la formule (4.11) en utilisantl’estimateur bV de V:

Il existe une autre façon d’obtenir l’estimateur des MCG. En e¤et, dans la pratique,la procédure en deux étapes, utilisée dans les principaux logiciels d’économétrie, n’est

Page 38: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 38

pas exactement similaire à celle que nous venons de décrire10. L’estimateur des MCGest construit à partir d’une relation existant entre cet estimateur et les estimateursBetween et Within (Maddala 1971).

Sous les hypothèses (H3), nous avons vu (proposition 4.1) que l’inverse de la matricede variance covariance V pouvait s’écrire sous la forme :

V ¡1 =1¾2v

·IT ¡

µ¾2®

¾2v + T¾2

®

¶ee0

¸

De…nition 4.4. On pose que la matrice V ¡1 peut être exprimée sous la forme alter-native suivante :

V ¡1 =1¾2v

·Q + Ã

1T

ee0¸

(4.12)

avec Q = (IT ¡ ee0=T ) et où le paramètre à est dé…ni par la relation :

à =µ

¾2v

¾2v + T¾2

®

¶(4.13)

Reprenons alors l’expression de l’estimateur des MCG (4.11) et substituons cettenouvelle expression de V ¡1: On obtient alors :

b°MCG =

" NX

i=1

eX 0i

µQ + Ã

1T

ee0¶

eXi#¡1 " NX

i=1

eX 0i

µQ + Ã

1T

ee0¶

yi

#

() b°MCG =

"NX

i=1

eX 0iQ eXi + Ã

1T

NX

i=1

eX 0iee

0 eXi#¡1 "

NX

i=1

eX 0iQyi + Ã

1T

NX

i=1

eX 0iee

0yi

#

Sachant que eXi = (e Xi) et °0 =¡¹ ¯0

¢; on peut montrer que ces di¤érents termes

peuvent se réécrire sous la forme suivante :

· b¹MCGbMCG

¸=

2664

ÃNT ÃTNPi=1

x0i

ÃTNPi=1

xiNPi=1

X 0iQXi + ÃT

NPi=1

xix0i

3775

¡1 24

ÃNTyNPi=1

X 0iQyi + ÃT

NPi=1

xiyi

35

A partir de la formule de l’inverse d’une matrice partitionnée, on montre que :

bMCG =

"1T

NX

i=1

X 0iQXi + Ã

NX

i=1

(xi ¡ x) (xi ¡ x)0#¡1 "

1T

NX

i=1

X 0iQyi + Ã

NX

i=1

(xi ¡ x) (yi ¡ y)0#

(4.14)Introduisons à présent l’estimateur Between, qui est construit à partir des N moyennes

individuelles des variables endogènes et exogènes, centrées sur la moyenne totale (dufait de la présence d’une constante).

10Mais sur le fond, les deux procédures sont strictement identiques. Seules leurs mises en oeuvrepratique et l’expression utilisée pour l’estimateur des MCG di¤èrent.

Page 39: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 39

De…nition 4.5. L’estimateur inter-classe Between, est l’estimateur des Moindres Car-rés Ordinaires obtenu dans la spéci…cation 8 i 2 [1;N ] :

yi = c + ¯0xi + "i (4.15)

Soit bBE l’estimateur Between du vecteur ¯ :

bBE =

" NX

i=1

(xi ¡ x) (xi ¡ x)0#¡1 " NX

i=1

(xi ¡ x) (yi ¡ y)0#

(4.16)

A partir de l’équation (4.14), on montre immédiatement que l’estimateur des MCGdu modèle à e¤ets aléatoires est une moyenne pondérée de l’estimateur Between b

BE

(équation 4.16) et de l’estimateur Within bLSDV (équation 3.11).

Proposition 4.6. Sous les hypothèses (H3), l’estimateur des MCG des coe¢cients ¯du modèle à e¤ets aléatoires, noté b

MCG; est une moyenne pondérée des estimateursBetween b

BE et Within bLSDV :

bMCG = ¢b

BE + (IK ¡ ¢) bLSDV (4.17)

où les poids déterminés par la matrice ¢ sont dé…nis par la relation :

¢ = ÃT

"NX

i=1

X 0iQXi + ÃT

NX

i=1

(xi ¡ x) (xi ¡ x)0#¡1 "

NX

i=1

(xi ¡ x) (xi ¡ x)0#

(4.18)

Essayons à présent d’interpréter ces pondérations et en particulier l’in‡uence duparamètre Ã: Revenons à l’équation (4.14) de l’estimateur des MCG :

bMCG =

"1T

NX

i=1

X 0iQXi + Ã

NX

i=1

(xi ¡ x) (xi ¡ x)0#¡1 "

1T

NX

i=1

X 0iQyi + Ã

NX

i=1

(xi ¡ x) (yi ¡ y)0#

On peut montrer que si le paramètre à est égal à 1, l’estimateur des MCG corre-spond exactement à l’estimateur des MCO du modèle pooled (voir annexe A.1). Dansle cas, où à = 0, l’estimateur des MCG correspond à l’estimateur du modèle à e¤ets…xes :

bMCG = b

LSDV =

" NX

i=1

X 0iQXi

#¡1 " NX

i=1

X 0iQyi

#

Remark 2. Ainsi, le paramètre à qui intervient dans la construction de la matrice depoids ¢ mesure le poids qui doit être attribué à la variance inter classe (Between). Dansle cas, où à = 0 on retrouve l’estimateur Within fondé uniquement sur la variance intraindividuelle.

bMCG ¡!

Ã!0bLSDV (4.19)

Page 40: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 40

Dans le cas complémentaire, Ã = 1; on retrouve l’estimateur du modèle pooled qui tientcompte de la variance totale c’est à dire à la fois de la variance intra individuelle etinter individuelle.

bMCG ¡!

Ã!1bpooled (4.20)

Si l’on reprend la dé…nition du paramètre Ã; on montre que :

à =µ

¾2v

¾2v + T¾2

®

¶limT!1

à = 0 (4.21)

Dès lors, à N …xé, lorsque la dimension temporelle du panel tend vers l’in…ni lesestimateurs MCG et Within sont confondus :

bMCG ¡!

T!1bLSDV

Cette propriété sera particulièrement utile pour comprendre la construction du testde spéci…cation d’Hausman.

On constate ainsi, que lorsque à 2 ]0; 1[, la structure avec e¤ets individuels aléa-toires constitue une solution intermédiaire entre le modèle sans e¤et individuel (totale-ment homogène) et le modèle avec e¤ets …xes (totalement hétérogène).

Remark 3. L’introduction d’e¤ets individuels aléatoires permet d’obtenir une spéci…-cation intermédiaire entre le modèle sans e¤et individuel et le modèle avec e¤ets …xes.L’hypothèse d’une distribution commune des e¤ets individuels permet une d’adopter unestructure ni totalement homogène ni totalement hétérogène, dans les e¤ets individuelsont en commun une distribution identique.

On peut en…n démontrer que la di¤érence entre la matrice de variance de l’esti-mateur MCG et matrice de variance de l’estimateur Within est égale à une matricedé…nie positive (Rao 1972, Thiel 1971). En e¤et :

var³bMCG

´= ¾2

v

"NX

i=1

X 0iQXi + ÃT

NX

i=1

(xi ¡ x) (xi ¡ x)0#¡1

(4.22)

On suppose que les quantités (1=NT )PNi=1 X 0

iQXi et (1=NT )PNi=1 X 0

iXi conver-gent vers des matrices dé…nies positives. Puisque le paramètre à > 0; on véri…e quel’estimateur des MCG (estimateur BLUE) a toujours une variance inférieure à celle del’estimateur Within.

var³bMCG

´· var

³bLSDV

´

Page 41: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 41

Ce résultat con…rme le fait que sous les hypothèses (H3); dans un modèle à e¤etsaléatoires, l’estimateur MCG est toujours préférable à l’estimateur Within. Sachantque le paramètre à tend vers 0 lorsque T ! 1; on en déduit immédiatement que ladi¤érence disparaît pour des panels de dimension temporelle in…nie :

bMCG ¡!

T!1bLSDV

Dans le cas où la matrice de variance covariance V n’est pas connue, il est nécessairecomme nous l’avons dit précédemment de procéder en deux étapes. Dans une premièreétape on estime les variances des di¤érentes composantes des résidus. Pour cela onestime le modèle à e¤ets …xes b

LSDV , et l’on construit les estimateurs des variancesintra et inter individuelles :

De…nition 4.7. Les estimateurs des variances des composantes intra classe et interclasse des résidus du modèle à e¤ets aléatoires sont respectivement donnés par :

b¾2v =

NPi=1

TPt=1

h(yi;t ¡ yi) ¡ b0

LSDV (xi;t ¡ xi)i2

N (T ¡ 1) ¡ K(4.23)

b¾2® =

NPi=1

³yi ¡ b0

LSDV xi ¡ ¹´2

N ¡ K ¡ 1¡ 1

Tb¾2v (4.24)

On en déduit alors l’estimateur bà du paramètre à selon :

bà =µ b¾2

v

b¾2v + Tb¾2

®

¶(4.25)

A l’aide des réalisations de l’estimateur Between on construit la matrice de poids¢: Dans une seconde étape, on applique directement la formule (4.11) des MCG oul’on utilise la somme pondérée (4.17).

Proposition 4.8. L’estimateur des MCG construit en deux étapes converge asymp-totiquement (NT ! 1) vers l’estimateur des MCG obtenu dans le cas où la matricede variance covariance V est connue. Même dans le cas de petits échantillons (T ¸ 3et N ¡ (K + 1) ¸ 9), la procédure en deux étapes reste plus e¢cace que l’estimateurWithin; dans le sens où la di¤érence entre la matrices de variances covariances desMCG et celle de l’estimateur reste une matrice dé…nie positive.

Nous ne proposerons pas ici de démonstration de cette proposition (cf. Fuller andBattese 1974, Taylor 1980). Mais cela con…rme l’idée que quelle que soit la taille dupanel, l’estimateur des MCG est plus e¢cace que l’estimateur Within. Proposons àprésent une application de ces di¤érents résultats.

Page 42: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 42

4.4. Une application

Reprenons l’application proposée à la section précédente. On considère le modèle suiv-ant :

si;t = c + ¯ui;t + °pi;t + vi;t 8 i = 1; ::; 17 (4.26)

"i;t = ®i + vi;t (4.27)

où si;t désigne le nombre de jours chômés pour cause de grève, pour 1000 salariésdu secteur industriel, ui;t désigne le taux de chômage de l’économie et pi;t le tauxd’in‡ation. On suppose ici que l’on peut spéci…er les e¤ets individuels ®i sous la formed’e¤ets aléatoires et que les résidus "i;t = vi;t+®i satisfont les hypothèses (H3). Si l’onne désire que les réalisations de l’estimateur des MCG du modèle aléatoire, à l’exclusionde tout autre estimateur, le programme TSP est alors le suivant :

load(file=’’strikes.wks’’);?---- Estimation Modèle à Effets Aléatoires ----panel (id=i,time=t,nowhit,nobet,nowithin) srt u p;

Les résultats de ce programme, reproduits sur la …gure (4.1) sont bien entendutotalement identiques à ceux de la …gure (1.2).

Figure 4.1: Estimation Modèle à E¤ets Aléatoires

Page 43: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 43

Contrairement au cas de l’estimateur Within où il n’y avait que deux coe¢cients(en dehors des e¤ets …xes), les résultats de l’estimation du modèle à e¤ets aléatoires fontapparaître 3 réalisations d’estimateurs des coe¢cients du chômage (u), de l’in‡ation (p)et d’une constante (c): Le coe¢cient associé à cette constante correspond à l’estimateurde la moyenne des e¤ets individuels.

E (®i) = c (4.28)

On peut véri…er d’ailleurs que cette réalisation est approximativement égale à lamoyenne des réalisations des estimateurs de e¤ets individuels dans le cas du modèle àe¤ets …xes (…gure 3.1).

On dispose en outre de trois informations supplémentaires :

1. une réalisation de l’estimateur de la variance intra classe b¾2v.

2. une réalisation de l’estimateur de la variance inter classe b¾2® ou variance des

e¤ets individuels.

3. une réalisation de l’estimateur bà du paramètre Ã.

On peut véri…er numériquement que ces estimations satisfont les conditions de ladé…nition (4.7) puisque :

b¾2v =

NPi=1

TPt=1

h(yi;t ¡ yi) ¡ b0

LSDV (xi;t ¡ xi)i

N (T ¡ 1) ¡ K= 0:2551E + 06

b¾2® =

NPi=1

yi ¡ b0LSDV xi ¡ ¹

N ¡ K ¡ 1¡ 1

Tb¾2v = 55 401

On en déduit alors une estimation du paramètre à :

bà =µ b¾2

v

b¾2v + Tb¾2

®

¶=

µ0:2551E + 06

0:2551E + 06 + 37 £ 55 401

¶' 0:11628

Rappelons que si le paramètre à tend vers 0, l’estimateur des MCG converge versl’estimateur Within et que si au contraire à tend vers 1, l’estimateur des MCG convergevers l’estimateur du modèle pooled. Dans le cas de notre échantillon, on observe quel’estimateur des MCG est plus ”près” de l’estimateur Within que de celui du modèletotalement homogène. Ceci signi…e que dans notre panel, la variance temporelle pourchaque pays (intra classe) domine la variance internationale (inter classe).

Page 44: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 44

5. Tests de spéci…cation des e¤ets individuels

En présence d’un modèle à e¤ets individuels, la question qui se pose immédiatementest de savoir comment ces e¤ets individuels doivent être spéci…és : doit on adopterl’hypothèse d’e¤ets …xes ou au contraire l’hypothèse d’e¤ets aléatoires ? Nous avonsvu dans la section précédente que l’estimateur des MCG, utilisé dans le cas du modèle àe¤ets aléatoires, est asympotiquement (sous l’hypothèse T ! 1) identique à l’estima-teur Within. Toutefois, pour des panels de dimension temporelle réduite (typiquementle cas des panels macroéconomiques), il peut exister de fortes di¤érences entre les réal-isations des deux estimateurs (Hausman 1978). Dès lors, au delà de l’interprétationéconomique, le choix de la spéci…cation, et par là même de la méthode d’estimation,est particulièrement important pour ce type de panels.

Une des principaux problèmes qui peut se poser dans le cadre du modèle à e¤etsaléatoires provient de l’éventuelle corrélation entre les variables explicatives xi;t et lese¤ets individuels ®i: Sur le plan économique, cette corrélation traduit l’in‡uence desspéci…cités individuelles structurelles (ou a-temporelles) sur la détermination du niveaudes variables explicatives. Reprenons l’exemple de la fonction de production. Supposonsque l’on dispose d’un échantillon de données de PIB et de facteurs (travail et capital)sur une durée de T périodes pour un ensemble de N pays. Si l’on note yi;t le logarithmedu PIB, ki;t le logarithme du stock de capital privé et ni;t le logarithme de l’emploi etque l’on suppose une fonction de production de type Cobb Douglass, le modèle générals’écrit sous la forme 8 i 2 [1;N ] ; 8 t 2 [1; T ] :

yi;t = ¯iki;t + °ini;t + ®i + vi;t

Les innovations vi;t sont supposées être i:i:d: de moyenne nulle et de variance égale à¾2v; 8 i 2 [1; N ] : On suppose que les e¤ets individuels sont aléatoires et qu’il existe une

corrélation entre ces e¤ets et le niveau des variables explicatives :

E (®iki;t) > 0 E (®ini;t) > 0

Rappelons en…n que dans ce modèle, le résidu total "i;t = ®i + vi;t s’apparente à laproductivité totale des facteurs ou au résidu de Solow. Dès lors, ces deux corrélationstraduisent tout simplement le fait que plus un pays est structurellement productif (plusson e¤et individuel est élevé), plus le niveau de facteur utilisé sera lui même important.Il y a tout lieu de penser qu’une telle corrélation puisse être observée sur donnéeshistoriques.

Page 45: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 45

Sur le plan plus technique, la présence d’un corrélation entre les e¤ets individuelset les variables explicatives viole la sixième condition des hypothèses (H3) puisque :

yi;t = ¹ + ¯0xi;t + "i;t (5.1)

"i;t = ®i + vi;t (5.2)

E¡®ix0i;t

¢6= 0 (5.3)

En présence d’une telle corrélation, nous allons montrer que l’estimateur des MCGest un estimateur biaisé des paramètres du vecteur ¯; alors l’estimateur Within nel’est pas. Ce biais s’assimile tout simplement à un biais d’endogénéité, puisque lesrésidus totaux "i;t = ®i + vi;t sont corrélés avec les variables explicatives. Toute lastratégie de test de spéci…cation des e¤ets individuels repose alors sur la comparaisondes deux estimateurs, dont la divergence traduit la présence d’une corrélation et doncla nécessaire adoption du modèle à e¤ets …xes et de l’estimateur Within. Dans lecas contraire où les deux estimateurs donnent des résultats sensiblement identiques, leshypothèses (H3) sont satisfaites et l’on peut spéci…er le modèle avec des e¤ets individuelsaléatoires. L’estimateur des MCG est alors l’estimateur BLUE.

5.1. Corrélation des e¤ets individuels et des variables explicatives

Considérons le modèle à e¤ets aléatoires suivant 8 i 2 [1; N ] ; 8 t 2 [1; T ] :

yi;t = ¹ + ¯0xi;t + "i;t

"i;t = ®i + vi;t

où ¯0 = (¯1 ¯2::::¯K ) est un vecteur de constantes: On suppose ici que les e¤ets indi-viduels aléatoires ®i sont corrélés aux variables explicatives :

E (®ijXi) 6= 0

Cette corrélation peut être exprimée sous di¤érentes formes. Nous retiendrons laformulation de Mundlak (1978a) qui postule une approximation linéaire de cette es-pérance.

De…nition 5.1. Dans la formulation de Mundlak (1978a), on suppose ainsi que lese¤ets individuels peuvent s’écrire sous la forme de la somme d’une combinaison linéairedes moyennes individuelles des variables explicatives et d’une composante orthogonalei:i:d: ®¤i .

®i = x0ia + ®¤i (5.4)

Page 46: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 46

avec a 2 RK : Sous cette hypothèse, le modèle devient :

yi;t = ¹ + ¯0xi;t + x0ia + "i;t (5.5)

"i;t = ®¤i + vi;t (5.6)

On obtient ainsi une structure de résidus "i;t + x0ia faisant apparaître trois termes: la composante orthogonale des e¤ets individuels ®¤i ; la projection linéaire11 des e¤etsindividuels sur l’espace des variables explicatives x0ia; et un terme d’erreur i:i:d: dansles dimensions temporelle et individuelle, vi;t: On suppose que les résidus globaux "i;tsatisfont les hypothèse (H4) :

Hypothèses (H4) On suppose que les résidus "i;t = ®¤i + vi;t satisfont les conditionssuivantes, 8 i 2 [1; N ] ; 8 t 2 [1; T ]² E (®¤i ) = E (vi;t) = 0² E (®¤i vi;t) = 0

² E³®¤i®

¤j

´=

½¾2®¤

0i = j

8i 6= j

² E (vi;tvj;s) =½

¾2v0

t = s; i = j8t 6= s; 8i 6= j

² E³vi;tx0i;t

´= E

³®¤i x

0i;t

´= 0

De la même façon que pour le modèle à e¤ets aléatoires standard, on construit lamatrice de variance covariance des résidus globaux "i;t, son inverse et l’on construit lemodèle vectoriel.

Le modèle à e¤ets individuels aléatoires, sous les hypothèses (H4), s’écrit vecto-riellement sous la forme :

yi(T;1)

= eXi(T;K+1)

°(K+1;1)

+ ex0i(T;K)

a(K;1)

+ "i(T;1)

8 i = 1; ::;N (5.7)

avec "i = ®¤i e + vi; eXi = (e;Xi) et °0 =¡¹; ¯0

¢: Sous les hypothèses (H4), la matrice

de variance covariance de "i; notée V; est alors dé…nie par :

E¡"i"0j

¢= E

h(®¤i e + vi)

¡®¤je + vj

¢0i =½

¾2®¤ee0 + ¾2

vIT = V ¤

0i = ji 6= j (5.8)

L’inverse de cette matrice de variance covariance est dé…nie comme :

V¤¡1 =

1¾2v

·IT ¡

µ¾2®¤

¾2v + T¾2

®¤

¶ee0

¸(5.9)

11La projection linéaire étant adaptée au schéma de corrélation proposé.

Page 47: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 47

Si l’on applique les Moindres Carrés Généralisés au modèle (5.7), en tenant comptede la matrice de variance covariance V ¤ qui possède les bonnes propriétés, on obtiendraalors des estimateurs convergents des di¤érents paramètres :

b¹¤MCG = y ¡ x0bBE (5.10)

ba¤MCG = bBE ¡ b

LSDV (5.11)

b¤MCG = ¢b

BE + (IK ¡ ¢) bLSDV (5.12)

Nous ne présenterons pas ici la forme générale de la matrice de poids ¢. Toute-fois, en reprenant la formule générale de l’estimateur des MCG, on peut montrer quel’estimateur b¤

MCG est un estimateur non biaisé du paramètre ¯ :

bMCG ¡!

T!1bLSDV

bMCG ¡!

NT!1¯

Mais un problème se pose lorsque l’on applique, à tort, l’estimateur des MCG, aumodèle initial, c’est à dire au modèle dans lequel on n’a pas pris le soin de décomposerles e¤ets individuels en deux composantes, dont une est strictement orthogonale auxvariables explicatives. Ainsi, supposons à présent que le modèle (5.7) soit le bon, et quel’on applique à tort les Moindres Carrés Généralisés à la spéci…cation suivante :

yi;t = ¹ + ¯0xi;t + "i;t (5.13)

"i;t = ®i + vi;t (5.14)

Soit bMCG l’estimateur des MCG appliqué à ce modèle, sous l’hypothèse que les

données sont générées par le modèle de (5.7). On part de la relation suivante :

bMCG = ¢b

BE + (IK ¡ ¢) bLSDV

Dans ce contexte, on peut montrer que l’estimateur Between bBE converge vers

¯ + a; puisque le vecteur a relie les moyennes individuelles xi aux e¤ets individuels ®i:Dès lors, il peut apparaître un biais dans l’estimateur b

MCG à taille T …nie.

Proposition 5.2. Lorsque les e¤ets individuels et les variables explicatives sont cor-rélées, lorsque les résidus satisfont les hypothèses (H4) et le modèle (5.7), l’applicationà tort des MCG au modèle (5.13)

yi;t = ¹ + ¯0xi;t + "i;t

"i;t = ®i + vi;t

Page 48: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 48

conduit à un biais semi asymptotique dans l’estimateur du vecteur ¯ à taille T …nie :

bMCG

p¡!N!1

¯ + ¢a (5.15)

Ce biais disparaît asymptotiquement :

bMCG

p¡!T!1

¯ (5.16)

La démonstration de ce résultat est très simple. Admettons que les deux résultatssuivants :

bBE

p¡!NT!1

¯ + a

bLSDV

p¡!NT!1

¯

Dès lors, à taille T d’échantillon …nie, on montre que facilement l’existence d’unbiais ¢a dans l’estimateur des MCG de ¯ :

plimN!1

bMCG = ¢ plim

N!1bBE + (IK ¡ ¢) plim

N!1bLSDV

= ¢(¯ + a) + (IK ¡ ¢)¯

= ¯ + ¢a

On sait cependant que lorsque la taille d’échantillon T tend vers l’in…nie, la matricede poids ¢ tend vers 0, et l’estimateur des MCG converge vers l’estimateur Within:Le biais disparaît :

plimT!1

bMCG = plim

T!1bLSDV = ¯

Remark 4. Ce résultat signi…e qu’en présence d’une corrélation entre les e¤ets indi-viduels et les variables explicatives, l’estimateur des MCG est biaisé à taille d’échantil-lon T …nie, et ce même si le nombre d’individus N tend vers l’in…ni. Par oppositionl’estimateur Within, dont la construction permet la suppression des e¤ets individuels,est asymptotiquement non biaisé.

Tout le problème repose sur le fait, que si les e¤ets individuels et les variablesexplicatives ne sont pas corrélées, l’estimateur des MCG est dans ce cas l’estimateurBLUE, c’est à dire l’estimateur convergent, non biaisé à variance minimale. Ainsi, leproblème de la spéci…cation des e¤ets individuels est un problème particulièrement im-portant de l’économétrie de panel appliquée. Pour s’en convaincre, il su¢t de considérerles résultats de l’estimation de notre modèle sur les grèves (…gure 1.2), dans lesquels lesestimateurs des MCG et les estimateurs Within donnent des résultats très di¤érentssur le plan quantitatifs, notamment en ce qui concerne la variable du chômage.

Page 49: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 49

5.2. Test de spéci…cation d’Hausman

Le test de spéci…cation d’Hausman (1978) est un test général qui peut être appliqué àdes nombreux problèmes de spéci…cation en économétrie. Mais son application la plusrépandue est celle des tests de spéci…cation des e¤ets individuels en panel. Il sert ainsià discriminer les e¤ets …xes et aléatoires.

L’idée générale du test d’Hausman est la fois simple et géniale. Supposons quel’on cherche à tester la présence éventuelle d’une corrélation ou d’un défaut de spéci-…cation. Admettons que l’on dispose de deux types d’estimateurs pour les paramètresdu modèle étudié. Le premier estimateur est supposé être l’estimateur non biaisé àvariance minimale sous l’hypothèse nulle de spéci…cation correcte du modèle (absencede corrélation). En revanche, sous l’hypothèse alternative de mauvaise spéci…cation,cet estimateur est supposé être biaisé. On suppose que le second estimateur est nonbiaisé dans les deux cas. Dès lors, il su¢t de comparer une distance, pondérée par unematrice de variance covariance, entre les deux estimateurs pour pouvoir déterminer sila spéci…cation est correcte ou non. Si la distance est statistiquement nulle, la spéci…-cation est correcte, on choisit le premier estimateur. Si la distance est importante, lemodèle est mal spéci…é.

L’application technique de ce principe suppose tout de même que l’on construise lamatrice de variance covariance de l’écart entre les deux estimateurs. De façon générale,il devrait alors apparaître des termes de covariance entre les deux estimateurs. A…n deles éliminer, on considère le lemme suivant :

Lemma 5.3. On considère deux estimateurs b1 et b

2; d’un vecteur de paramètres¯ 2 RK, que l’on suppose convergent et asymptotiquement normalement distribués.On suppose que b

1 atteint la borne asymptotique de Cramer Rao. Pour un échantillonde taille N; les quantités

pN

³b1 ¡ ¯

´et

pN

³b2 ¡ ¯

´sont asymptotiquement dis-

tribuées selon des lois normales de matrice de variance covariance respectives V0 et V1:Sous ces hypothèses, les distributions asymptotiques de

pN

³b1 ¡ ¯

´et la di¤érence

pN

³b1 ¡ b

2

´ne sont pas corrélées, ce qui implique :

var³b1 ¡ b

2

´= var

³b1

´¡ var

³b2

´(5.17)

Dès lors, en appliquant ce lemme, Hausman préconise de fonder le test de spéci…-cation sur la statistique suivante :

H =³b1 ¡ b

2

´0 hvar

³b1 ¡ b

2

´i¡1 ³b1 ¡ b

2

´(5.18)

Sous l’hypothèse nulle de spéci…cation correcte, cette statistique est asymptotique-ment distribuée selon un chi deux à K degrés de liberté.

Page 50: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 50

Appliquons à présent le test d’Hausman au problème de la spéci…cation des e¤etsindividuels dans un panel.

De…nition 5.4. L’hypothèse testée concerne la corrélation des e¤ets individuels et desvariables explicatives :

H0 : E (®ijXi) = 0 (5.19)

H1 : E (®ijXi) 6= 0 (5.20)

Ce test peut être interpréter comme un test de spéci…cation. Sous H0; le modèle peutêtre spéci…é avec des e¤ets individuels aléatoires et l’on doit alors retenir l’estimateurdes MCG (estimateur BLUE): Sous l’hypothèse alternative H1, le modèle doit êtrespéci…é avec des e¤ets individuels …xes et l’on doit alors retenir l’estimateur Within(estimateur non biaisé).

On peut ici appliquer le lemme (5.3) en considérant l’estimateur des MCG (estima-teur b

1) et l’estimateur Within (estimateur b2). En e¤et, nous avons vu que sous H0;

dans un modèle à e¤ets aléatoires, l’estimateur des MCG bMCG est l’estimateur BLUE:

Sous l’hypothèse de normalité des résidus, les deux estimateurs bMCG et b

LSDV sontconvergents et asymptotiquement distribués selon une loi normale. On en déduit que :

var³bMCG ¡ b

LSDV

´= var

³bMCG

´¡ var

³bLSDV

´(5.21)

Dès lors, sous l’hypothèse nulle H0; la distance entre les deux estimateur est nullepuisque tous deux convergent vers la vraie valeur ¯: En revanche, sous l’hypothèsealternative, la présence de la corrélation entre les e¤ets individuels et les variablesexplicatives conduit à un biais de l’estimateur des MCG et cette distance devient alorsimportante.

De…nition 5.5. La statistique du test d’Hausman appliqué au test de la spéci…cationdes e¤ets individuels est la suivante :

H =³bMCG ¡ b

LSDV

´0 hvar

³bMCG ¡ b

LSDV

´i¡1 ³bMCG ¡ b

LSDV

´(5.22)

Sous l’hypothèse nulle H0; la statistique H suit asympotiquement (N tend vers l’in…ni)un chi deux à K degrés de liberté.

Ainsi, si la réalisation de la statistique H est supérieure au seuil à ®%; on rejettel’hypothèse nulle et l’on privilégie l’adoption d’e¤ets individuels …xes et l’utilisation del’estimateur Within non biaisé.

Page 51: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 51

Il faut noter que la statistique du test de Hausman est dégénérée lorsque l’on consid-ère que la dimension T tend vers l’in…ni. En e¤et, dans ce cas, l’estimateur des MCGconverge vers l’estimateur Within12, ce qui implique que le numérateur et le dénomina-teur de la statistique d’Hausman tendent vers 0. Toutefois, on sait que lorsque T tendvers l’in…ni, les modèles à e¤ets aléatoires et à e¤ets …xes ne peuvent être distinguéset sont parfaitement similaires. Dès lors, la question de la spéci…cation de ces e¤etsimporte peu.

5.3. Application

Reprenons l’application sur les journées de grèves proposée à la section précédente.Si l’on désire obtenir les réalisations des estimateurs MCG et Within, ainsi que lastatistique du test d’Hausman, à l’exclusion des estimateurs Between et Pooled, leprogramme TSP est alors le suivant :

load(file=’’strikes.wks’’);?---- Test Hausman, Within et VarComp----panel (id=i,time=t,nowhit,nobet) srt u p;

Les résultats de ce programme, reproduits sur la …gure (5.1), sont bien entendutotalement identiques à ceux de la …gure (1.2).

Pour l’échantillon considéré, la réalisation de la statistique du test d’Hausman est de13; 924. Etant donné que le modèle comporte deux variables explicatives (K = 2); cettestatistique suit un chi deux à deux degrés de liberté. A 95%, le seuil est de 5:99; doncici on rejette l’hypothèse nulle d’absence de corrélation entre les e¤ets individuels et lesvariables explicatives. Le chômage et l’in‡ation sont corrélés au spéci…cités structurelleset a-temporelles du volume des jours chômés pour cause de grève. Plus un pays, touteschoses égales par ailleurs, connaît de jours de grèves, plus son niveau de chômage etd’in‡ation sont élevés (ou faibles suivant le signe de la corrélation). Ainsi, on doit iciprivilégier l’adoption d’un modèle à e¤ets …xes et retenir l’estimateur Within.

On peut véri…er la validité de cette conclusion, en comparant de façon heuristiqueles réalisations des estimateurs des modèles à e¤ets …xes et à e¤ets aléatoires. On

12Contrairement au cas où N tend vers l’in…ni où l’on a :

plimN!1

bMCG =plim

N!1bLSDV = ¯

dans le cas où la dimension T tend vers l’in…ni, on a :

plimN!1

bMCG = b

LSDV

Dès lors, les deux estimateurs tendent à être identiques.

Page 52: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 52

Figure 5.1: Résultats Test d’Hausman (1978)

observe que pour l’échantillon étudié , les coe¢cients estimés notamment pour le chô-mage sont sensiblement di¤érents dans les deux cas (¡21pour l’estimateur Within et¡12 pour l’estimateur des MCG). Rappelons, que sous l’hypothèse nulle d’absence decorrélation ces deux estimateurs devraient converger vers la même valeur. Cette obser-vation con…rme donc notre diagnostic quant à la présence d’une corrélation entre lese¤ets individuels et les deux variables explicatives du modèle. On doit ainsi privilégierles résultats de l’estimateur Within.

Page 53: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 53

6. Modèle à coe¢cients …xes et aléatoires

On peut envisager plusieurs variantes du modèle linéaire standard. La plupart de cesvariantes sont construites en levant progressivement les di¤érentes hypothèses (H3) surla structure des résidus. On peut d’abord introduire une autocorrélation des résidus(dans la dimension temporelle). On utilise alors des méthodes d’estimation proches decelles de Cochrane Orcut (1949), utilisée en séries temporelles. Une seconde variantepossible, et par ailleurs souvent utilisée, consiste à supposée à supposer une structure devariance covariance arbitraire pour les résidus (méthode de Chamberlain 1982 et 1984).Il est dans ce cas possible de traiter des problèmes d’autocorrélation et d’hétéroscé-dasticité. Mais nous allons ici nous concentrer sur un autre type de modèle linéaire: les modèles avec un mélange de coe¢cients …xes et aléatoires. En particulier, nousallons étudier le modèle MFR (Mixed Fixed and Random Coe¢cient) proposé par Hsiao(1989).

6.1. Modèle MFR de Hsiao (1989)

Commençons par présenter la structure générale des modèle à e¤ets individuels …xeset à coe¢cients aléatoires.

De…nition 6.1. On considère le modèle MFR suivant :

yi;t = ®i + ¯0ixi;t + vi;t 8 i 2 [1;N ] ; 8 t 2 [1; T ] (6.1)

où ®i 2 R,¯0i =¡¯i;1¯i;2::::¯i;K

¢2 RK : On suppose ici que les e¤ets individuels ®i

sont …xes et que les coe¢cients ¯i des exogènes sont distribués selon une distributioncommune de moyenne E (¯i) = ¯ et de matrice de variance covariance :

E£(¯i ¡ ¯) (¯i ¡ ¯)0

¤= ¢(K;K)

=

0BBB@

¾2¯1

¾¯1;¯2 ::: ¾¯1;¯K¾¯2;¯1 ¾2

¯2::: ¾¯2;¯K

::: ::: ::: :::¾¯K ;¯1 ¾¯K ;¯2 ::: ¾2

¯K

1CCCA (6.2)

Le modèle (6.1) peut s’écrire sous la forme vectorielle suivante :

yi = e®i + Xi¯i + vi 8 i 2 [1; N ] (6.3)

où e désigne un vecteur unitaire de dimension (T; 1) et où l’on suppose que les résidus vi;tsatisfont les hypothèses (H1); avec en particulier E (viv0i) = ¾2

viIT . L’hypothèse selonlaquelle le paramètre ¯i est un coe¢cient aléatoire implique une nouvelle structure desrésidus qui peut s’exprimer sous la forme suivante :

yi = e®i + Xi¯ + "i (6.4)

Page 54: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 54

avec 8 i 2 [1;N ]"i = Xiei + vi (6.5)

où les coe¢cients aléatoires ei = ¯i ¡ ¯; sont tels que E

³ei

´= 0; E

³Xiei

´= 0

et E³eie0i

´= ¢: A partir de l’équation (6.4), on obtient ainsi un modèle où les

coe¢cients ®i et ¯ sont …xes, mais où la structure des résidus ne satisfait pas leshypothèses standards. Pour le montrer, établissons la forme de la matrice de variancecovariance des résidus individuels, noté ©i; est alors dé…nie par13 :

©i = E¡"i"0i

¢= E

·³Xiei + vi

´³Xiei + vi

´0¸= XiE

³eie0i

´X 0i + E

¡viv0i

¢

On montre ainsi que :©i = Xi¢X 0

i + ¾2viIT (6.6)

La matrice de variance covariance est ainsi conditionnelle aux individus et de plusn’est pas diagonale. On doit donc appliquer une méthode de Moindres Carrés Général-isés sur un modèle transformé excluant les e¤ets individuels.

Supposons que l’on connaisse la matrice de variance covariance ©i et que celle-cisoit une matrice dé…nie positive, on cherche alors à construire un modèle transforméoù les résidus satisfont les hypothèses (H1) : Pour cela, on introduit une transformée Pitelle que :

©¡1i = P 0iPi 8 i 2 [1; N ] (6.7)

On dé…nit alors les variables transformées suivantes :

X¤i = PiXi y¤i = Piyi e¤i = Pie "¤i = Pi"i (6.8)

Dès lors, le modèle (6.4), s’écrit sous la forme :

Piyi = Pie®i + PiXi¯ + Pi"i

ou encorey¤i = ®ie¤i + X¤

i ¯ + "¤i (6.9)

Dans ce modèle transformé, les résidus "¤i satisfont les hypothèses H1 puisque :

E£"¤i ("

¤i )0¤ = PiE

¡"i"0i

¢P 0i = Pi

¡P 0iPi

¢¡1 P 0i = IT (6.10)

Reste en…n à appliquer un opérateur permettant d’éliminer les e¤ets individuelstransformés. Pour cela on construit une application Q¤

i telle 8 i 2 [1;N ] :

Q¤i e¤i = Q¤

iPie = 013Si Xi est non stochastique.

Page 55: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 55

On montre alors que Q¤i est telle :

Q¤i = IT ¡ Pie

¡e0©¡1i e

¢¡1 eP 0i (6.11)

La preuve est la suivante :

Q¤Pie =hIT ¡ Pie

¡e0©¡1i e

¢¡1 eP 0i

iPie

= Pie ¡ Pie¡e0©¡1i e

¢¡1 eP 0iPie

= Pie ¡ Pie¡e0P 0iPie

¢¡1 eP 0iPie

= Pie ¡ Pie

= 0

Appliquons à présent cette seconde transformation au modèle transformé (6.9), ilvient :

Q¤i y¤i = Q¤

i e¤i®i + Q¤

iX¤i ¯ + Q¤

i "¤i

() Q¤y¤i = Q¤iX

¤i ¯ + Q¤

i "¤i (6.12)

A partir de cette expression, on peut …nalement proposer un estimateur de lamoyenne des coe¢cients ¯i; c’est un estimateur du paramètre ¯. Soit b

MFR cet esti-mateur :

bMFR =

"NX

i=1

(X¤i )0 Q¤iX

¤i

#¡1 "NX

i=1

(X¤i )0 Q¤i y¤i

#(6.13)

En développant cette expression on obtient :

bMFR =

(NX

i=1

X 0iP

0i

hIT ¡ Pie

¡e0©¡1i e

¢¡1 eP 0i

iPiXi

)¡1

( NX

i=1

X 0iP

0i

hIT ¡ Pie

¡e0©¡1i e

¢¡1 eP 0i

iPiyi

)

Proposition 6.2. L’estimateur BLUE de la moyenne des coe¢cients aléatoires ¯i;i = 1; ::N du modèle (6.1) à coe¢cients …xes et aléatoires (MFR) :

bMFR =

"NX

i=1

X 0i©

¡1i Xi ¡

NX

i=1

X 0i©

¡1i e

¡e0©¡1i e

¢¡1 e©¡1i Xi

#¡1

" NX

i=1

X 0i©

¡1i yi ¡

NX

i=1

x0i©¡1i e

¡e0©¡1i e

¢¡1 e©¡1i yi

#(6.14)

Un estimateur convergent de la matrice de variance covariance de ces paramètres estalors dé…ni par (Swamy 1970) :

b¢(K;K)

=1

N ¡ 1

NX

i=1

24Ã

bi ¡

1N

NX

i=1

bi

!Ãbi ¡

1N

NX

i=1

bi

!035 (6.15)

Page 56: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 56

où les estimateurs bi; 8 i 2 [1;N ] ; sont les estimateurs des MCO obtenus équation par

équation pour chaque individu.

On retrouve ici la formule générale de l’estimateur de la moyenne des coe¢cientsaléatoires ¯i dans un modèle MFR. Cette formule di¤ère légèrement de celle proposéedans l’article de Hsiao (1989)14, dans le sens où nous nous sommes limités ici à unmodèle avec uniquement des e¤ets individuels …xes. Dans l’article de Hsiao, l’auteurintroduit non pas des e¤ets individuels, mais des variables dichotomiques individuellesdi¤érentes selon les mois de l’année et selon les individus.

6.2. Procédure d’estimation des paramètres du modèle MFR

La procédure générale permettant d’obtenir les estimateurs de l’espérance et de lavariance des coe¢cients aléatoires du modèle de Hsiao est la suivante :

1. Etape 1 : on estime le modèle (6.1) pour chaque individu, en séries temporelles.Soient b

i et ¾2vi les estimateurs des MCO des paramètres ¯i et de la variance des

résidus 8 i 2 [1; N ] :yi;t = b®i + b0

ixi;t + bvi;t (6.16)

b¾2vi =

1T ¡ K

TX

t=1

bvi;t (6.17)

2. Etape 2 : on construit l’estimateur de Swamy (1970) de la matrice de variancecovariance des paramètres ¯i; noté b¢ , selon la formule :

b¢(K;K)

=1

N ¡ 1

NX

i=1

24Ã

bi ¡

1N

NX

i=1

bi

!Ãbi ¡

1N

NX

i=1

bi

!035 (6.18)

3. Etape 3 : on construit l’estimateur de la moyenne ¯ des paramètres aléatoires¯i de la façon suivante :

bMFR =

"NX

i=1

X 0ib©¡1i Xi ¡

NX

i=1

X 0ib©¡1i e

³e0b©¡1i e

´¡1eb©¡1i Xi

#¡1

" NX

i=1

X 0ib©¡1i yi ¡

NX

i=1

x0ib©¡1i e³e0b©¡1i e

´¡1eb©¡1i yi

#(6.19)

où e désigne le vecteur unitaire de dimension (T; 1) et la matrice b©i; 8 i 2 [1;N ]est dé…nie par :

b©i = Xi b¢X 0i + b¾2

viIT (6.20)

14Formule (3.3) page 578.

Page 57: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 57

A la …n de ces trois étapes on dispose d’un estimateur bMFR du vecteur des

moyennes des paramètres ¯i et d’un estimateur b¢ de la matrice de variance covari-ance associée. On peut alors construire les statistiques de Student.

6.3. Une application

Considérons une application de la technique d’estimation d’un modèle MFR à la prob-lématique de la convergence proposée dans Gaulier, Hurlin et Jean-Pierre (2000). Oncherche à estimer une équation de convergence conditionnelle du type :

¢(yi;t ¡ yt) = ®i + ½i¡yi;t¡1 ¡ yt¡1

¢+ "i;t (6.21)

avec 8 t 2 [1; T ]

yt =1N

NX

i=1

yi;t (6.22)

Ce modèle de convergence est construit à partir de l’écart du PIB par tête yi;t àla moyenne internationale yt des PIB par tête. On cherche à déterminer si le taux decroissance de cet écart est lié négativement au niveau de l’écart observé à la périodeprécédente. Si pour tous les pays, les constantes ®i sont nulles et les coe¢cients ½isont négatifs cela signi…e que l’on observe un phénomène de convergence des PIB partête. Dans ce cas, un écart positif du PIB par tête à la moyenne international induitun diminution de la croissance de cet écart à la date suivante. Autrement dit les écartsdes PIB par tête de tous les pays à la moyenne internationale tendent à se resserrer età par là même à disparaître. On dit alors qu’il y a convergence absolue des niveaux dePIB par tête.

¢(yi;t ¡ yt) = ½i¡yi;t¡1 ¡ yt¡1

¢+ "i;t

ce qui implique que :

limp!1

¡yi;t+p ¡ yt+p

¢= 0 8 i 2 [1; N ] (6.23)

Mais de tels phénomènes sont rarement observés sur des échantillons internationaux,c’est pourquoi généralement on introduit des e¤ets individuels ®i dans la spéci…cationsdes modèles. Ces e¤ets individuels permettent d’envisager la notion de convergenceconditionnelle. Supposons en e¤et que les constantes ®i soient non nulles, dans ce cason montre que :

limp!1

¡yi;t+p ¡ yt+p

¢= ®i 8 i 2 [1;N ] (6.24)

Les PIB par tête des di¤érents pays convergent ainsi vers des sentiers réguliersparallèles mais non confondues : les taux de croissance sont identiques mais les niveauxdemeurent di¤érents.

Page 58: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 58

Dans cette étude, nous montrons à l’aide de tests de non stationnarité en panel(Evans et Karras 1996), qu’il existe un processus de convergence conditionnel sur unéchantillon de 27 pays de l’OCDE (1960-1990). Pour cet échantillon, nous proposonsalors une estimation par la méthode MFR de la moyenne de la vitesse de convergencedes PIB par tête. On considère donc le modèle suivant :

¢(yi;t ¡ yt) = ®i + ½i¡yi;t¡1 ¡ yt¡1

¢+ °i¢

¡yi;t¡1 ¡ yt¡1

¢+ "i;t (6.25)

Tout comme en séries temporelles, on introduit ici un terme de type ADF ¢¡yi;t¡1 ¡ yt¡1

¢

de façon à blanchir la structure des résidus. On suppose que les e¤ets individuels ®isont …xes et que les paramètres ½i et °i sont des coe¢cients aléatoires. On a doncune structure de type MFR identique à celle présentée précédemment avec N = 27;T = 31et K = 2: On s’intéresse ici plus particulièrement aux vitesses de convergence½i dont la distribution, supposée commune, à une espérance ½ et une variance ¾2

½. Onpose ainsi :

¯i(2;1)

½i°i

¶8 i 2 [1;N ] (6.26)

E (¯i) = ¯ =µ

½°

¶E

£(¯i ¡ ¯) (¯i ¡ ¯)0

¤= ¢ =

µ¾2½ ¾½°

¾½° ¾2°

¶(6.27)

Faisons abstraction ici des problèmes liés à la structure dynamique du modèle (cf.Hsiao 1989 pour une application avec endogène retardée). Le problème consiste àestimer les paramètres ½; °, ¾2

½; ¾2° et ¾½° : Le programme TSP qui reprend les 3 étapes

de la procédure d’estimation des paramètres du modèle MFR est fourni en annexe(A.2).

Tout d’abord, commençons par présenter les résultats des estimations des 27 équa-tions individuelles (étape 1 ). Les résultats …gurent dans le tableau (6.1).

Ces résultats ont été stockés dans un …chier Excel grâce aux commandes suivantes:

smpl 1 N;unmake ls_alpha alpha_i;unmake ls_rho rho_i gam_i;unmake sigls sig_i;write(file=’’dea.xls’’) alpha_i rho_i gam_i sig_i;

Le …chier Excel a ensuite été importé dans un Work…le sous Eviews, ce qui nous per-met d’utiliser l’interface graphique, relativement pratique, de ce logiciel pour présenterles résultats. On peut en particulier étudier la distribution des vitesses de convergence

Page 59: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 59

Figure 6.1: Résultat des Estimations Individuelles

Obs Alpha_I Rho_I Gam_I Sig_I1 0,13376594 -0,3052974 0,02715862 0,000323692 -0,0893829 -0,1493948 0,47335094 0,001375223 0,02164255 -0,0482918 0,15210068 0,000471724 0,02181379 -0,0713512 0,08023112 0,000587035 0,05501872 0,01829461 0,13963646 0,001528466 0,03200307 -0,2798161 -0,1547206 0,000147657 0,03007381 -0,1644535 -0,2663595 0,000210048 -0,0968696 -0,1697266 0,22403599 0,001235839 0,01394913 -0,0702855 0,01103817 0,00068135

10 0,0468125 -0,2748415 0,30987847 0,0006922211 0,00018522 -0,0081573 0,08217304 0,0001375512 0,03381594 -0,1308573 0,17844738 0,0002492713 -0,06906 -0,1506083 -0,1468081 0,0007466114 0,04178007 -0,2517085 0,35072318 0,0017377715 -0,0555896 -0,176831 0,27316603 0,000786316 0,0280554 -0,3224786 0,18986426 0,000375417 0,08583123 -0,2657224 0,20064856 0,0010441618 -0,0022626 -0,0062728 0,19309539 0,0001909419 0,02389198 -0,0916293 0,51222789 0,0003884820 -0,0432805 -0,0772415 0,14977539 0,0011373221 -0,020066 -0,1200527 0,52000779 0,0003210222 0,00564093 -0,0314211 0,32853037 0,0002989423 0,01507706 -0,0447503 0,23266649 0,0003985924 -0,5000802 -0,4479339 0,33779788 0,0012342525 0,01952289 -0,1447489 0,15997526 0,000633926 -0,0074825 -0,0072746 -0,250526 0,0005993727 -0,0061079 -0,0305862 0,18348967 0,00073227

individuelles ½i: A partir de l’histogramme (6.2), on constate que la moyenne simple desréalisations des estimateurs des MCO b½i est de ¡0:1416; et que la dispersion est rela-tivement importante puisque l’écart type des b½i est de 0:117. De plus, les statistiques dela Kurtosis, de la Skewness et de Jarque-Bera semble indiquer que la distribution n’estpas normale. En particulier, il semble que la distribution des b½i soit non symétrique(Kurtosis) et décalée vers la droite par rapport à la moyenne.

Cette première analyse est con…rmée par l’examen de l’estimateur à noyau de ladensité des b½i et ce quel que soit le bandwitch parameter choisi, comme le montre la…gure (6.3). On observe que l’estimateur de la distribution des b½i n’est pas symétriqueautour de la moyenne et tend à être décalé vers la droite. Economiquement, cela signi…eque la probabilité que les réalisations individuelles des vitesses de convergence soientsupérieures à la moyenne ¡0:1416 est elle même supérieure à la probabilité que cesvitesses de convergence soient inférieures à la moyenne. On observe en outre qu’ilexiste une probabilité non nulles, mais faible, que les paramètres ½i soient positifs ou

Page 60: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 60

Figure 6.2: Histogramme des b½i

0

2

4

6

8

-0.4 -0.3 -0.2 -0.1 0.0

Series: RHO_ISample 1 27Observations 27

Mean -0.141609Median -0.130857Maximum 0.018295Minimum -0.447934Std. Dev. 0.117664Skewness -0.733074Kurtosis 2.881545

Jarque-Bera 2.434072Probability 0.296106

nuls, ce qui traduirait une hypothèse de non convergence. Il serait possible de calculercette probabilité.

Pour autant jusqu’à présent nous nous sommes contentés d’étudier la distributiondes b½i sans tenir compte de la précision des estimations individuelles, c’est à dire desvariances des résidus ¾2

v: C’est pourquoi, nous avons construit l’estimateur MFR con-struit à partir d’une correction faisant intervenir la matrice de variance des di¤érentescomposantes des résidus. Ainsi, dans le programme, nous avons construit l’estima-teur de Swamy (1970) de cette matrice de variance covariance (étape 2 de la procéduregénérale). Les résultats obtenus sont les suivants :

b¢ =µ b¾2

½ b¾½°b¾½° b¾2

°

¶=

µ0:013845 ¡0:0024814¡0:0024814 0:042026

¶(6.28)

Bien entendu, on retrouve l’écart type des paramètres ½i que nous avions calculéprécédemment puisque b¾p =

p0:013845 = : 11766: Mais nous tenons compte ici des

éventuelles covariances pouvant exister entre les coe¢cients °i et ½i:

En…n, dans une dernière étape, nous avons construit l’estimateur MFR associé auxmoyennes des paramètres °i et ½i (étape 3 de la procédure générale). Les résultatsobtenus sont les suivants :

b =µ b½

¶=

µ ¡0:113950:15865

¶(6.29)

On constate ainsi que la réalisation de l’estimateur MFR de la moyenne b½ est in-férieure à la simple moyenne des b

i individuels. Cela signi…e que l’estimateur MFRpeut être envisagé comme une moyenne pondérée des estimations individuelles b

i; dont

Page 61: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 61

Figure 6.3: Estimateur Kernel de la Densité des b½i

0

1

2

3

4

-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1

RHO_I

h = 0.0595h = 0.1190h = 0.1785

Kernel Density (Epanechnikov)

les pondérations sont fonctions de la précisions des estimations individuelles (de lavariance des résidus).

Page 62: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 62

A. Annexes

A.1. Equivalence entre les estimateurs Within et pooled dans le cas à = 1

Revenons à l’équation (4.14) de l’estimateur des MCG :

bMCG =

"1T

NX

i=1

X 0iQXi + Ã

NX

i=1

(xi ¡ x) (xi ¡ x)0#¡1 "

1T

NX

i=1

X 0iQyi + Ã

NX

i=1

(xi ¡ x) (yi ¡ y)0#

(A.1)On suppose pour simpli…er qu’il n’existe qu’une variable explicative (K = 1) et l’on

suppose que à = 1. L’estimateur des MCG s’écrit alors sous la forme :

bMCG =

"1T

NX

i=1

X 0iQXi +

NX

i=1

(xi ¡ x)2#¡1 "

1T

NX

i=1

X 0iQyi +

NX

i=1

(xi ¡ x) (yi ¡ y)

#

(A.2)Considérons tout d’abord le dénominateur de cette expression :

D =1T

NX

i=1

X 0iQXi +

NX

i=1

(xi ¡ x)2 =1T

NX

i=1

TX

t=1

(xi;t ¡ xi)2 +NX

i=1

(xi ¡ x)2

Développons cette expression, il vient :

D =NX

i=1

"1T

TX

t=1

(xi;t ¡ xi)2 + (xi ¡ x)2#

=NX

i=1

"1T

TX

t=1

x2i;t ¡ 2xi1T

TX

t=1

xi;t + 2x2i ¡ 2xix + x2#

Rappelons que :TX

t=1

xi;t = Txi

On obtient ainsi :

D =NX

i=1

"1T

TX

t=1

x2i;t ¡ 2xix + x2#

=NX

i=1

TX

t=1

(xi;t ¡ x)2

De la même façon, on montre que le numérateur peut s’écrire sous la forme :

N =NX

i=1

TX

t=1

(xi;t ¡ x) (yi;t ¡ y)

Ainsi, on retrouve l’expression du l’estimateur du modèle pooled :

bMCG = b

pooled =

"NX

i=1

TX

t=1

(xi;t ¡ x)2#¡1 "

NX

i=1

TX

t=1

(xi;t ¡ x) (yi;t ¡ y)

#

Le même résultat peut être démontré dans le cas général (K ¸ 1).

Page 63: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 63

A.2. Programme TSP : Modèle MFR

Le programme TSP ci-dessous reprend les 3 étapes de la procédure d’estimation desparamètres du modèle MFR appliqué à la problématique de convergence de Hurlin,Gaulier et Jean Pierre (2000). Toutes les lignes de commandes en italique doivent êtremodi…ées dans le cas d’une autre application.

?******************************?**** ESTIMATEUR MFR *******?**** HSIAO (1989) *******?******************************?--- Options ----------------OPTIONS(LIMWARN=0,LIMERR=10);SUPRES SMPL;?----------------------------

?******************************?**** Paramètres du Modèle ****?******************************set N=27; ? Nombre d’Individus Nset l=31; ? Nombre de Périodes Tset K=2; ? Nombre de Variables Explicatives Kset nobs=N*l; ? Nombre Total d’Observations NTset t0=60; ? Date de Début d’Echantillonset t1=90 ; ? Date de Fin d’Echantillonset retard=2; ? Nombre de Retards (Modèle Dynamique)smpl 1 nobs;

?*****************************?***** Variables *************?*****************************?—- Base de données ——–load(…le=”ocde.wks”);?— Données Centrées sur la Moyenne Internationale —y=log(y);do j=t0 to t1;

select (t=j);msd(noprint) Y;YB=Y-@MEAN;

Page 64: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 64

enddo;?— Construction des Séries —–smpl 1 nobs;y=yb;select i=i(-1);dy=y-y(-1);?*****************************

?------------------------------------------------?---- ETAPE 1 : Estimations pays par pays ----?------------------------------------------------mform(nrow=N,ncol=1) ls_alpha=0;mform(nrow=N,ncol=K) ls_rho=0;mform(nrow=N,ncol=1) sigls=0;do j=1 to N;

?--- Régressions Individuelles ---smpl 1 nobs;select (i=j)&(i=i(-2));ls(silent) dy c y(-1) dy(-1);?--- Construction des Vecteurs des Coefficients ---set ls_alpha(j,1)=@coef(1);do p=1 to K;

set pf=p+1;set ls_rho(j,p)=@coef(pf);

enddo;set sigls(j,1)=@s2;

enddo;print ls_alpha ls_rho sigls;

?-----------------------------------------------------?---- ETAPE 2 : Swamy (1970) ----?---- Estimateur de la variance du parametre rho ----?-----------------------------------------------------?--- Calcul de la Moyenne des Coefficients Alatoires ---mform(nrow=N,ncol=1) en=1;mat sum_rho=((en’)*ls_rho)/N;?--- Construction du Vecteur des Moyennes ---if K=1; then; do;

Page 65: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 65

mat vsum_rho=sum_rho*en;enddo;if K>1; then; do;

mat vsum_rho=sum_rho(1,1)*en;do j=2 to K;

mat sum_rhoi=sum_rho(1,j)*en;mmake vsum_rho vsum_rho sum_rhoi;

enddo;enddo;?--- Construction du l’estimateur de Delta ---mat Delta=(1/(N-1))*((ls_rho-vsum_rho)’)*(ls_rho-vsum_rho);

?-------------------------------------?-- ETAPE 3 : Construction de Beta ---?-- Construction des Phi_i ---?-------------------------------------smpl 1 nobs;set l1=l-retard;mform(nrow=l1,ncol=l1,type=diag) unite=1;mform(nrow=l1,ncol=1) z=1;mform(nrow=K,ncol=K) T1=0;mat T2=T1;mform(nrow=K,ncol=1) T3=0;mat T4=T3;

do j=1 to N;smpl 1 nobs;?*********************************?**** Construction des séries ****?*********************************select (i=j)&(i=i(-2));y1=y(-1);dy1=dy(-1);mmake x y1 dy1;mmake yy dy;?-- Construction de la matrice (Phi)-1mform(nrow=l1,ncol=l1) Phi=0;mat Phi=x*Delta*x’+sigls(j,1)*unite;

Page 66: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 66

mat Phi=(Phi)’’;?-- Premier Terme : T1 ---mat t1_i=(x’)*Phi*x;mat T1=T1+t1_i;?-- Deuxime Terme : T2 ---mat t2_i=(x’)*Phi*z*(((z’)*Phi*z)’’)*(z’)*Phi*x;mat T2=T2+t2_i;?-- Troisime Terme : T3 ---mat t3_i=(x’)*Phi*yy;mat T3=T3+t3_i;

?-- Quatrime Terme : T4 ---mat t4_i=(x’)*Phi*z*(((z’)*Phi*z)’’)*(z’)*Phi*yy ;mat T4=T4+t4_i;smpl 1 nobs;

enddo;

?----------------------------------------?-- Estimateur de rho_bar ------?----------------------------------------mat rhols_m=(sum_rho)’;mat rho_mfr=((T1-T2)’’)*(T3-T4);print rhols_m rho_mfr;print delta;

?--------------------------?--- Calcul des T-stats ---?--------------------------if K=1; then; do;

set T_stat=rho_mfr/sqrt(Delta);enddo;if K>1; then; do;

mform(nrow=K,ncol=1) T_stat=0;do j=1 to K;

set T_stat(j,1)=rho_mfr(j,1)/sqrt(Delta(j,j));enddo;

enddo;print t_stat;

Page 67: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 67

Bibliographie

Ahn, S.C., et Schmidt, P., (1995), ”E¢cient Estimation of Models for DynamicPanel Data”, Journal of Econometrics, 68, 5-27.

Bernard, A., et Jones, C., (1996), ”Productivity Across Industries and Countries :Times Series Theory and Evidence”, The Review of Economics and Statistics,135-146.

Bernard A.B., et Durlauf S.N., (1995), ”Convergence of International Output”,Journal of Applied Econometrics, 10, 97-108.

Blundell, R., et Schmidt, R., (1991), ”Conditions Initiales et Estimation E¢cacedans les Modèles Dynamiques sur Données de Panel : Une Application au Comporte-ment d’Investissement des Entreprises”, Annales d’Economie et de Statistique, 20/21,109-123.

Gaulier G, Hurlin C et Jean–Pierre P. (1999), ”Testing Convergence : A Panel DataApproach”, Annales d’Economie et de Statistiques, 55-56, 411-427.

Harris, R.D.F. et Tzavalis, E., (1996), ”Inference for Unit Root in Dynamic Panels”,Working Paper, University of Exeter, UK.

Hausman J.A., (1978) ”Speci…cation Tests in Econometrics”, Econometrica, 46,1251-1271

Hsiao, C., (1986), ”Analysis of Panel Data”, Econometric society Monographs N011. Cambridge Universirty Press.

Hsiao C. (1989), ”Modelling Ontrario Regional Electricity System Demand Usinga Mixed Fixed and Random Coe¢cient Approaoch”, Regional Science and Urban Eco-nomics, 19, 565-587

Im, K.S., Pesaran, M.H., et Shin, Y., (1995), ”Testing for Unit Roots in Heteroge-nous Panels”, DAE, Working Paper 9526, University of Cambridge.

Islam, N., (1995), ”Gowth Empirics : A Panel Data Approach”, Quarterly Journalof Economics.

Levin, A., et Lin, C-F., (1992), ”Unit Root Test in Panel Data: Asymptotic andFinite-Sample Properties”, Discussion Paper 92-23, Department of Economics, Uni-versity of California, San Diego.

Quah, D., (1994), ”Exploiting Cross-Section Variations for Unit Root Inference inDynamic Data”, Economics Letters, 44, 9-19.

Page 68: L'Econom©trie des Donn©es de Panel

L’Econométrie des Données de Panel 68

Mundlak Y. (1978), ”On the Pooling of Time Series and Cross Section Data”,Econometrica, 46, 69-85

Nickell S. (1981), ”Biases in Dynamic Models with Fixed E¤ects”, Econometrica,49, 1399-1416

Sevestre, P., et Trognon, A., (1992), ”Linear Dynamic Models”, in Matyas and P.Sevestre (eds), Ch. 6., 94-116.

Swamy P.A. (1970), ”E¢cient Inference in a Random Coe¢cient Regression Model”,Econometrica, 38, 311-323

Taylor W.E. (1980), ”Small Sample Consideration in Estimation from Panel Data”,Journal of Econometrics, 13, 203-223