59
Économétrie II Économétrie II L3 Économétrie – L3 MASS Prof. Philippe Polomé, U. Lyon 2 Année 2013-2014

Économétrie II...Économétrie II Ch. 5. 9i :E (eixi)6= 0 : Endogénéité Source 1. Hétérogénéité inobservée Variable omise I Le modèle correctement spécifié est Y =b0

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

  • Économétrie II

    Économétrie IIL3 Économétrie – L3 MASS

    Prof. Philippe Polomé, U. Lyon 2

    Année 2013-2014

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : Endogénéité

    Rappel

    1. E (ei ) = 0 8i : Espérance nulle2. X var (ei ) = s2 8i : Homoscédasticité3. X cov (et ,es) = 0 8t 6= s : Pas d’autocorrélation4. E (eixi ) = 0 8i : Exogénéité5. X La matrice X est de plein rang : Pas de multicolinéarité6. Le modèle est correctement spécifié7. La variable dépendante Y est continue

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : Endogénéité

    Table des matières

    Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéDéfinition & conséquences

    Table des matières

    Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéDéfinition & conséquences

    Définition

    I Exogénéité :I Coupe transv. E (eiXi ) = 0

    I Pas de corrélation entre l’erreur et chaque régresseur pour unmême i

    I On écrit aussi E (ei |Xi ) = 0 : espérance conditionnelle nulle

    I Série temp : E (etxt) = 0 8t 8x pas de corrélationcontemporaine

    I Lorsque E (et |xs) = 0s = 1, . . . ,T , x est strictement exogène

    I Rupture de cette hypothèse = endogénéitéI Interprétation : Un choc aléatoire e induit un choc sur Y et sur X

    pour un même iI Donc difficile de séparer les effets “confondants”

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéDéfinition & conséquences

    Conséquence : Inconsistance de l’estimateur MCOI Corrélation positive : à des valeurs élevées (basses) de e

    correspondent des valeurs élevées (basses) de XI e grand : Y > Xb et e petit : Y < XbI Donc : droite estimée par MCO pente plus forte que la réalité

    I Monte Carlo : fichier tableur en ligne Endogeneite.ods

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéDéfinition & conséquences

    Pourquoi l’endogénéité est-elle un problème ?

    I Ne vaut-il pas mieux prédire Y le mieux possible ?I Trois cas

    I Prédiction : on veut prédire Y conditionnellement à XI Si on connait X “e inclus”, x (e), ce qui n’est pas évident,I Dans ce cas, l’effet de l’erreur sur X est inclus, donc prédiction

    MCO Ŷ correcte

    I Contrôle : on choisit X , quel sera Y ? [p.e. effet d’une politique]I Si on choisit X , l’erreur n’y est pas, donc prédiction MCO

    incorrecte

    I Si l’on souhaite comprendre la relation entre Y et X il faut traiterl’endogénéité

    I Dans les 2 derniers cas : ce n’est pas une bonne idée “d’ajusterune droite au mieux” dans le nuage de points

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéDéfinition & conséquences

    5 sources de l’endogénéité

    1. Hétérogénéité inobservée2. Erreur de mesure3. Simultanéité4. Échantillonnage endogène5. Autocorrélation en séries temporelles

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 1. Hétérogénéité inobservée

    Table des matières

    Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 1. Hétérogénéité inobservée

    2 cas d’hétérogénéité inobservée

    I Variable omiseI Coefficients aléatoires

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 1. Hétérogénéité inobservée

    Variable omise

    I Le modèle correctement spécifié est Y = b0+b1x1+b2x2+ eI Mais le modèle estimé est Y = b0+b1x1+n

    I L’effet du régresseur manquant se retrouve dans l’erreur dumodèle estimée : n = b2x2+ e

    I = hétérogénéité inoberservée : Des facteurs inobservés affectent àla fois la variable expliquée et un régresseur

    I Si le régresseur manquant est corrélé à un régresseur présentI Alors le terme d’erreur du modèle estimé est corrélé avec au

    moins un régresseur présentI De plus vraisemblablement :

    I Hétéroscédasticité si var (x2t) 6= var (x2s) ,t 6= sI Autocorrélation si corr (x2t ,x2s) 6= 0,t 6= sI

    E (n) 6= 0 l’intercept du modèle est biaisé

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 1. Hétérogénéité inobservée

    Que faire en cas de variable omise ?

    1. Ignorer le problème : inconsistance des estimateurs2. Essayer de trouver un proxy acceptable pour la variable

    inobservéeI Proxy = mesure approximative de la variable inoberservée

    (ci-dessous)

    3. Si données de panel et si la variable inobservée ne change pasdans le temps (mais seulement entre les agents)

    I Modèle “à effets fixes” (programme de M2)

    4. Laisser la variable inobservée dans le terme d’erreur mais utiliserun estimateur qui reconnait sa présence

    I Estimateur Variable Instrumentale ci-dessous

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 1. Hétérogénéité inobservée

    Proxy

    I Variable inobservée : on sait que le modèle devrait inclure unrégresseur, mais on n’a pas de donnée

    I Modèle Y = b0+b1x1+b2x2+ eI

    x2 pas observée

    I Proxy z pour x2 :I

    z observée mais pas explicative dans le modèleI

    z corrélée à x2 : x2 = d0+d1z+µI On ne peut tester cette corrélation puisque x2 pas observée

    I P.e. éducation x2 et nombre d’années d’étude z

    I La proxy n’est pas une erreur de mesureI Ni un instrument (plus loin)

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 1. Hétérogénéité inobservée

    Utilisation d’une proxy

    I La variable proxy est substituée à la variable inobservée dansY = b0+b1x1+b2x2+ e

    I On peut estimer Y = p0+p1x1+p2z+xI Que dit ce modèle sur le précédent ?

    Y = b0+b1x1+b2 (d0+d1z+µ)+ e= b0+b2d0+b1x1+b2d1z+b2µ + e= p0 +p1x1+p2z +x

    I Donc si µ n’est pas corrélé avec x1, estimerY = p0+p1x1+p2z+x par MCO

    I Sans bias et consistant pour b1 = p1I Les autres coef. p0 et p2 n’ont pas d’interprétation directe

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 1. Hétérogénéité inobservée

    Coefficients aléatoires

    I Autre forme d’hétérogénéité inobservéeI Modèle vrai Yi = b0+x1ix1i +hi avec x1i aléatoire t.q.

    Ix1i = g1+µ1i

    Ig1 pas aléatoire (pourrait dépendre de régresseurs)

    Iµ1i est un bruit blanc

    I On estime Yi = b0+b1x1i + ei doncI

    ei = µ1ix1i +hiI

    b1 = g1

    I SolutionI Variable instrumentale (ci-dessous)I Modélisation explicite par Maximum de Vraisemblance (on ne

    voit pas)

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 2. Erreurs de mesure

    Table des matières

    Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 2. Erreurs de mesure

    Définition & traitementI Modèle y = b0+b1x⇤1 + e

    I On n’observe pas x⇤1 mais bien x1 = x⇤1 +nI

    n est une erreur de mesure

    I “Classical Error-in-Variables” (CEV)

    I Équation estimée : avec x1I

    y = b0+b1 (x⇤1 +n)+(e �b1n) = b0+b1x1+µI Donc, cov (x1,µ) = cov (x⇤1 +n ,e �b1n) =�b1s2n 6= 0

    I Pour autant que erreur de mesure n pas corrélée avec x⇤1I Les erreurs de mesure sont la norme

    I Endogénéité pas toujours préoccupante

    I Solution : variable instrumentale ci-dessousI Une erreur de mesure sur y accroît la variance des erreurs mais

    ne cause pas d’endogénéité

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 3. Simultanéité

    Table des matières

    Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 3. Simultanéité

    Définition & exemples

    I 2 variables sont causales l’une de l’autreI

    y = b0+b1x+ e (x cause y ) et x = g0+ g1y +µ (y cause x)I Donc : x (y) mais y (e) donc x (e)

    I d’où corrélation entre x et l’erreur dans y = b0+b1x+ e

    I ExemplesI Publicité et vente :

    I La publicité accroît/soutient les ventesI Le budget publicité est calculé en proportion aux ventes

    I Fonction de coût C (Q,W ), Q = production, W vecteur des prixd’intrants

    I Lemme de Sheppard ∂C/∂W = d (Q,W ) : demande d’intrantsest fonction de la production mais production est fonction desintrants utilisés

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 3. Simultanéité

    Exemple de simultanéité : modèle keynésien

    I Deux équations : forme structurelle = forme économiqueI Consommation Ct = b0+b1Yt + et avec Y le PIBI Identité comptable Yt = Ct + It avec I l’investissement, ici

    exogèneI Économie fermée sans état

    I La consommation et le revenu sont donc déterminéssimultanément

    IC et Y sont deux endogènes

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 3. Simultanéité

    Forme réduite

    I Forme réduite = toutes les endogènes à gauche

    ICt =

    11�b1

    [b0+b1It + et ] = d0+d1It +µt

    IYt =

    11�b1

    [b0+ It + et ] = g0+ g1It +nt

    I Clairement, Y est corrélé à eI DONC : Endogénéité dans le modèle structurel en estimant

    l’équation de consommation, même seule

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 3. Simultanéité

    Moindres Carrés Indirects

    I MCO toujours consistant pour forme réduiteI Identification : coef. forme structurelle peuvent-ils être

    récupérés de la forme réduite ?I Ici, en estimant chaque équation de la FR : d̂0, d̂1, ĝ0, ĝ1I On calcule les coef. structurels par b1 =

    d1

    1+d1ect

    I Si une seule manière de récupérer tous les coef. structurels :système exactement identifié

    I Moindres Carrés Indirects MCI = appliquer MCO à la formeréduite & résoudre pour obtenir les coef. structurels

    I Si certains coef. ne peuvent être ainsi retrouvés : sous-identifiéI Si certains coef. retrouvés de plus d’une manière : sur-identifié

    I “Bonne” manière ? Variable Instrumentale

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité

    Table des matières

    Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité

    Méthode des Moments MM

    I Interprétation d’inversion de MCO dite “méthode des moments”I Soit A un estimateur de b , alors on peut écrire Y �XA= êI Hypothèse exogénéité E (X e) = 0I Stratégie “méthode des moments”

    I Cette condition sur les moments de la population est imposéeaux moments de l’échantillon

    I C’est-à-dire on veut A tel que X 0 ê = 0I Donc : X 0 (Y �XA) = 0 : ce sont les CPO de moindres carrés

    A= (X0X )�1X

    0Y = b̂

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité

    Variables instrumentales

    I Hypothèse exogénéité E (X e) = 0 ne tient plusI Supposons qu’on puisse trouver un ensemble de variables Z ou

    “instruments”telles queI

    Z et X soient de mêmes dimensionsI

    E (e|Z ) = 0I

    Corr (Z ,X ) soit élevée

    I Donc Z permet d’inverser la relation Y = Xb + e viaZ

    0Y = Z

    0XA+Z

    0e

    I Si on a PlimZ 0e = 0 (à la limite Z et e ne sont pas corrélés)I Alors : Estimateur Méthodes des Moments (⌘ Variables

    Instrumentales VI) : A t.q. Z 0 (Y �XA) = 0I

    A= (Z 0X )�1Z0Y = b̂VI

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité

    Propriétés de b̂VI

    I Il s’agit d’un estimateur alternatif à MCOI En général biaiséI consistant (si les instruments sont valides, voir ci-dessous)

    I On peut démontrer que ⌃b̂VI

    = s2e

    ⇣Z

    0X

    ⌘�1⇣Z

    0Z

    ⌘⇣Z

    0X

    ⌘�1

    I Cette variance est d’autant plus faible que la corrélation entre Zet X est forte

    I À la limite si Z et X non-corrélés, alors Z 0X ! 0 et ⌃b̂VI

    ! •I MCO peut être vu comme VI avec Z = X

    ICorr (Z ,X ) = 1

    I Donc : si pas endogénéité, MCO plus efficient que VI

    I 6= remplacer X par Z dans Y = Xb + e [cfr. proxy]I Si on le faisait, le modèle serait Y = Zg +µI Et l’estimateur MCO serait ĝMCO =

    ⇣Z

    0Z

    ⌘�1Z

    0Y

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité

    Instruments & Tests

    I La difficulté fondamentale est de trouver des instrumentsI On verra quelques casI En séries temporelles & panels : valeurs passées (retards)I En systèmes d’équations : régresseurs dans d’autres équations

    I Il faut exactement un instrument par variable de X (identificationexacte)

    I Les variables non-endogènes sont leurs propres instrumentsI Lorsqu’on dispose de plus d’un instrument pour une variable, il

    faut généraliser la méthode

    I Les tests d’inférence n’ont plus de valeur qu’asymptotiquementI Le bootstrap reste valideI Le R2 n’a plus de sens

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité

    Validité des instruments

    I Difficile de tester l’exogénéité des instruments cov (Z ,e) = 0I Si Z n’est pas exogène, VI sera inconsistant (par construction)I ) VI ne s’applique pas en cas d’échantillonnage endogène

    I On peut mesurer la corrélation entre Z et XI Soit Y = b0+b1x+ e

    Ix est endogène, on a un instrument z

    I Si cov (z ,e) 6= 0 on peut montrer que Plim b̂1VI = b1+cov (z ,e)

    cov (z ,x)

    I Donc que si cov (z ,e) 6= 0 alors b̂VI est inconsistant

    I De plus Plim b̂1VI = b1+s

    e

    corr (z ,e)

    sxcorr (z ,x)

    I Donc, si corr (z ,e) 6= 0 même faible, alors si corr (z ,x) est faible(mauvais instrument), Plim b̂1VI ne sera pas proche de b1

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité

    Devoir #6 : VI

    I Reprenez de ma feuille Tableur l’exemple avec un régresseurendogène

    I Générez un instrumentI Valide (= non-corrélé avec le terme d’erreur)I Bon (= corrélation élevée avec le régresseur endogène)I Basez-vous directement sur la façon dont le régresseur a été

    généré

    I Estimez les coefficients du modèle par VII Examinez comment les coefficients estimés varient en fonction

    de la corrélation de l’instrument avec le régresseurI Illustrez qu’un instrument non-valide amène à l’inconsistance

    I Examinez le degré d’inconsistance en fonction de la corrélationde l’instrument avec le régresseur

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité

    Doubles moindres carrés MC2E (2SLS)

    I Application particulière de VII Soit l’équation structurelle Y = Xb + e

    I Supposons que dans X , xk soit endogène et qu’on dispose d’uninstrument z pour xk

    I La matrice d’instruments serait Z , identique à X sauf pour ladernière colonne dans laquelle on a remplacé xk par z

    I Équation d’instrumentationxk = d0+d1x1+ . . .+dk�1xk�1+dkz+µ = Zd +µ

    I Estimation MCO, valeurs ajustées de xk sontx̂k = d̂0+ d̂1x1+ . . .+ d̂k�1xk�1+ d̂kz = Z d̂

    I On voit que x̂k est un instrument valide pour xk si z est uninstrument valide pour xk

    IX̂ la matrice X dans laquelle on a remplacé xk par x̂k

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité

    MC2E (2)

    I Estimateur VI est b̂VI =⇣X̂

    0X

    ⌘�1X̂

    0Y

    I Meilleur que (Z 0X )�1Z 0Y car la corrélation entre x̂k et xkdevrait être plus élevée que entre z et xk

    I L’estimateur VI est équivalent à une estimation MCO en deuxétapes (MC2E) :

    1. Estimation de l’équation d’instrumentation xk = Zd +µ2. Remplace X par X̂ dans l’équation structurelle : Y = pX̂ +n

    (régression de 2nde étape) et on estime par MCO

    Ip̂MC2E =

    ⇣X̂

    0X̂

    ⌘�1X̂

    0Y : c’est

    ⇣X̂

    0X̂

    ⌘�1et pas

    ⇣X̂

    0X

    ⌘�1

    comme dans b̂VII On peut montrer que p̂MC2E = b̂VI =

    ⇣X̂

    0X

    ⌘�1X̂

    0Y

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité

    Preuve

    I On note qu’on peut écrire X̂ = Z⇣Z

    0Z

    ⌘�1Z

    0X

    I Pour la dernière colonne de X̂ , c’est Z d̂I Pour les autres, ce sont les colonnes de X (exogènes)

    p̂MC2E =⇣X̂

    0X̂

    ⌘�1X̂

    0Y

    =

    ✓X

    0Z

    ⇣Z

    0Z

    ⌘�1Z

    0✓Z

    ⇣Z

    0Z

    ⌘�1Z

    0X

    ◆◆�1X̂

    0Y

    =

    ✓X

    0Z

    ⇣Z

    0Z

    ⌘�1Z

    0X

    ◆�1X̂

    0Y

    =⇣X̂

    0X

    ⌘�1X̂

    0Y = b̂VI

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité

    Plusieurs instruments

    I Il faut au moins un instrument par variable explicativeI Les exogènes sont leurs propres instruments

    I Dans certains cas, on dispose de plus d’un instrument pourcertains régresseurs

    I MC2E : on voit tout de suite comment intégrer ces instrumentssupplémentaires via la (ou les) équations d’instrumentation

    I On peut démontrer que parmi toutes les manièresd’utiliser/combiner ces différents instruments, MC2E est la plusefficiente

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité

    Notes MC2E

    I Ne pas faire la régression en 2 étapes explicitementI utiliser la commande MC2E (2SLS)I sinon à la 2ème étape le logiciel va calculer une matrice de var

    cov selon la formule MCO et pas VI

    I Des estimations robustes à l’hétéroscédasticité sontgénéralement disponibles pour MC2E et VI

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéEstimation en présence d’endogénéité

    Résumé

    I Identification Exacte : 1 ! instrument par régresseur endogèneI Utiliser Variable Instrumentale ⌘ MMI MC2E = + efficient des estimateurs VI

    I Sous-identification : manque au moins un instrumentI Estimation consistante impossible

    I Sur-identificaiton : plus d’un instrument pour au moins unrégresseur endogène

    I MC2E avec eq d’instrumentation à pls instrumentsI = un cas de MM Généralisée : GMM

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests

    Table des matières

    Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests

    Test 1. Hausman : EndogénéitéMCO MC2E

    Aucun régresseur endogène consistant consistantefficient inefficientAu moins 1 régresseur endogène inconsistant consistant

    I Donc : si endogénéité : MC2E – mais sinon : MCOI Idée du test de Hausman : tester l’égalité des deux estimateurs

    I Si égaux, alors pas endogénéité : on préfère MCOI Sinon, on prend MC2E

    I Test disponible sur tous les logiciels économétriquesI Valable entre n’importe quelle paire d’estimateurs avec un

    consistantI VI contre MCGF par exemple

    I Aussi une bonne idée de comparer directement b̂MCO et b̂MC2E

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests

    2 autres tests : Définitions

    Equation structurelle : y1 = b0+b1y2+b2x1+b3x2+µ1I

    x1 et x2 sont exogènesI On a aussi 2 autres exogènes x3 et x4

    I Qui ne sont pas dans l’équation structurelleI Qui sont corrélés à y2

    I On veut tester l’endogénéité de y2Forme réduite pour y2 : y2 = p0+p1x1+p2x2+p3x3+p4x4+n2

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests

    Test 2. Test de régression / de corrélation des erreurs /Durbin–Wu–Hausman

    I On veut tester l’endogénéité de y2I Chaque xj est non-corrélé avec µ1

    Iy2 non-corrélé avec µ1 ssi n2 non-corrélé avec µ1

    I Estimer y2 = p0+p1x1+p2x2+p3x3+p4x4+n2 par MCO(consistant)

    I On obtient n̂2 : une approximation à n2

    I Estimer y1 = b0+b1y2+b2x1+b3x2+d1n̂2+ erreur par MCOI

    n̂2 significatif (t-stat) =) n2 et µ1 corrélés, donc y2 endogèneI

    n̂2 non-significatif n’implique rien

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests

    Test de régression : remarque

    I On peut montrer queI

    b̂MCO de y1 = b0+b1y2+b2x1+b3x2+d1n̂2+ erreur estidentique à

    Ib̂MC2E de y1 = b0+b1y2+b2x1+b3x2+µ1

    I C’est une 2ème interprétation de MC2EI inclure n̂2 dans la régression MCO “nettoie” l’endogénéité de y2

    I Test sur plusieurs variables endogènesI tester conjointement (test F) la significativité des résidus de

    chaque équation d’instrumentation

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests

    Test 3. “OverID” Restrictions sur-identifiées : Exogénéitéde l’instrument

    I Si l’on a un seul instrument pour un régresseur endogèneI Impossible de tester l’absence de corrélation entre l’instrument et

    le terme d’erreur : corr (z ,e) = 0I Modèle “juste / exactement” identifié

    I Si l’on dispose de plusieurs instruments,I Possible de tester l’exogénéité d’un instrumentI Le modèle est “sur-identifié”

    I Dans notre exemple : x3 et x4 peuvent servir d’instruments poury2 dans l’équation structurelle y1 = b0+b1y2+b2x1+b3x2+µ1

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests

    Étapes du test OverID

    1. Estimer l’équation structurelle par VI en utilisant seulement x3comme instrument1.1 Construire résidu empirique

    µ̂1MC2E = y1� b̂0+ b̂1y2+ b̂2x1+ b̂3x22. Régresser résidu µ̂1MC2E sur toutes les variables exogènes du

    modèle (explicatives + instruments)2.1 µ̂1MC2E = g0+ g1x1+ g2x2+ g3x3+ g4x4+x2.2 Calculer le R2 de cette régression

    3. Sous l’hypothèse nulle (exogénéité de x4) : nR2a⇠ c2q

    Iq : nombre d’instruments en excès (nombre d’instruments totaldans le modèle moins nombre de régresseurs endogènes)

    I “Over-identification”, ici q = 1 car 2 instruments x3 et x4 et unrégresseur endogène y2

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéTests

    OverID : remarques

    I Il faut faire l’hypothèse que x3 est exogène : on ne peut la testerI Si nR2 > c2q;0.95 on rejette que x4 est exogène OU que x3 est

    exogèneI Hypothèse de un instrument valide par régresseur endogène

    I Test implémenté directement dans beaucoup de logiciels

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéApplications

    Table des matières

    Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéApplications

    Equation de salaire 1

    I Fonction mincérienne de salaire :lnw = b0+b1educ+b2exper +b3exper2+ e

    Iw le salaire ; educ nbr années d’études ; exper nbr annéesexpérience

    I Les Capacités Intellectuelles Intrinsèques (CII) de l’individu(“ability”) sont

    I Inobservées / inobservablesI Positivement corrélées avec le niveau d’éducation atteint :

    educ = a0+a1CII +nI Positivement corrélées avec le niveau de salaire :

    ln(w) = d0+d1CII +µ

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéApplications

    Equation de salaire 2

    I Le rendement de l’éducation estimé parlnw = b0+b1educ+b2exper + e

    I Est-il sur- ou sous-estimé ?

    I Données card.gdt de WooldridgeI Instruments : Education de la mère et du pèreI Equation d’instrumentation

    educ =�cst,exper ,exper2,Meduc ,Feduc

    I 2SLS : automatisé et “à la main” en mettant [educ commerégresseur dans l’équation de salaire

    I Mêmes coefficients, pas les mêmes t-tests

    I Test d’endogénéité : résidu de l’équation de d’instrumentationdans MCO sur équation de salaire

    I Autre instrument possible proximité à un “college4”

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéApplications

    Poids à la naissance

    I Illustration d’un mauvais instrumentI Données bwght.gdt Wooldridge

    I Poids de l’enfant à la naissance (bwght) en log en fonction deI consommation de tabac (packs)I revenu familial (faminc) prix comme mesure d’autres facteurs

    (accès aux soins, ...)I On peut rajouter d’autres régresseurs

    I La consommation de tabac pourrait être endogèneI P.e. stress (pas observé)

    I Instrument : cigprice prix des cigarettesI Équation d’instrumentation : on voit que c’est un mauvais

    instrument

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage

    Table des matières

    Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage

    4º source d’endogénéité : Échantillonnage

    I Si on n’observe pas un échantillon “purement” aléatoire(“simple”)

    I mais plutôt un échantillon sélectionné dans lequel seuls certainsindividus sont admis

    I ou bien avec des données manquantes

    I 3 casI Sélection – ou attrition – purement aléatoire, ou basée sur des

    variables aléatoires exogènesI Pas de problème

    I Sélection basée sur un régresseur xj corrélé à la dépendante yI Sélection basée sur dépendante y

    I Un problème d’échantillon sélectionné ou troncature se pose

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage

    Sélection basée sur un régresseur xj

    corrélé à y

    I Exemple : On estime des fonctions de salaires, mais on observeplus d’attrition pour les niveaux d’éducation faibles

    I Sans que cette attrition soit corrélée au revenu (salaire) par classed’éducation

    I Les statistiques descriptives sont biaiséesI par exemple, le salaire moyen sera plus élevé que dans la réalité

    I Les MCO restent sans biais et consistantsI Les estimations “contrôlent” les dimensions des variables

    explicatives

    I Pas de problème tant qu’il y a assez de variabilité dans lesvariables explicatives pour identifier les effets mesurés

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage

    Sélection sur y cas 1. Troncature (Truncation)

    I Inclusion dans l’échantillon est yi ci (sélection de troncature)I Alors ei ci �Xib : la sélection de troncature introduit une

    corrélation contemporaine entre l’erreur et les régresseur(s)I Notes

    I On n’observe aucun yi > ci ni aucun Xi correspondantI La sélection peut aussi être yi � ci

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage

    Sélection sur y cas 2. Troncature accidentelle

    I Modèle bivarié de sélection de l’échantillon (MBSE)

    I Équation de participation Y1 =

    (1 si Y ⇤1 > 00 sinon

    I Équation de résultat Y2 =

    (Y

    ⇤2 si Y

    ⇤1 > 0

    � sinonI Donc : On n’observe Y ⇤2 que si Y ⇤1 > 0, c’est-à-dire que si on

    observe Y1 = 1

    I On suppose que la réalité est Y⇤1 = X1b1+ e1

    Y

    ⇤2 = X2b2+ e2

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage

    Troncature accidentelle : origine du biais

    I Il semble raisonnableI de supposer que le terme d’erreur e1 de l’équation de

    participation peut être corrélé au terme d’erreur e2 de l’équationde résultat : e1 (e2)

    I que certains régresseurs au moins soient communs entre X1 et X2I

    X1\X2 = X21I Le reste X22 et X11

    I On peut écrire l’équation de participation commeX11b11+X21b12 > e1 (e2)

    I Donc, la troncature accidentelle provoque une corrélation entreX2 et e2 : endogénéité dans l’équation de résultat

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage

    Autre interprétation : moyenne conditionnelle de Y2

    I La moyenne de Y2 conditionnellement à X2 dépend de Y ⇤1 car siY

    ⇤1 0, on n’observe pas Y2I On suppose pour simplifier que X2 est non-endogène

    E (X2|e1) = E (X2|e2) = X2I

    E (Y2|X2,Y ⇤1 > 0) = E (X2b + e2|X1b1+ e1 > 0)= X2b2+E (e2|e1 >�X1b1)

    I DoncI Si e2 et e1 sont indépendants, le dernier terme est nulI Sinon, il faut corriger la moyenne conditionnelle pour le biais de

    sélection (ou troncature accidentelle)I Et en particulier MCO de Y2 sur X2 sera biaisé et inconsistant

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage

    Exemple : Equation de salaire

    I Le salaire dépend de caractéristiques comme le niveau d’étude,l’age, le sexe, le nombre d’enfants...

    I On n’observe un salaire que pout ceux/celles qui participent aumarché du travail

    I La décision de participer au marché du travail dépendcertainement de facteurs similaires à ceux expliquant le salaire

    I Donc équation de sélection : participationI Équation de résultat : salaireI Corrélation entre les deuxI MCO équation de salaire : biaisé et inconsistant

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 4. Échantillonnage

    Estimation

    I Rappel : Sources 1 (hétérogénéité inobservée), 2 (erreurs demesure) et 3 (simultanéité) peuvent être adressées par VariableInstrumentale / MC2E

    I Source 4 Sélection d’échantillonnageI VI inutile car VI a le même problème d’échantillonnageI La solution passe par une modélisation du processus de sélection :

    I Plusieurs estimateurs alternatifs – on regardera en M1

    I En résuméI Toujours se poser la question de l’échantillonnageI Pourquoi certaines données sont manquantes

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 5 : Autocorrélation en séries temporelles

    Table des matières

    Ch. 5. 9 i : E (eixi ) 6= 0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d’endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5 : Autocorrélation en séries temporelles

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 5 : Autocorrélation en séries temporelles

    5º source : Autocorrélation en séries temporelles

    I Exogénéité en série temp : E (etxt) = 0 8t 8x pas decorrélation contemporaine

    I On écrit aussi E (et |xt) = 08t 8x : espérance conditionnellenulle

    I Ce qui est la même chose

    I Lorsque E (et |xs) = 0s = 1, . . . ,T on dit que x est strictementexogène

    Iet n’est corrélé à aucun régresseur à aucune période

    I En série temp., on ne fait pas l’hypothèse d’absenced’autocorrélation

    I L’absence de corrélation contemporaine suffit à ce que MCO soitconsistant

    I Pour que MCO soit non-biaisé il faut l’exogénéité stricte

  • Économétrie II

    Ch. 5. 9 i : E (ei xi ) 6= 0 : EndogénéitéSource 5 : Autocorrélation en séries temporelles

    Implication de l’exogénéité stricte

    Soit le modèle statique du taux de meurtre en fonction du nombre depoliciers / habitant

    TxMeurtret = b0+b1Pol/ht + et

    1. Pol/h ne peut avoir aucun effet retardé sur TxMeurtre1.1 Sinon, Pol/ht�1 serait dans et ce qui romperait l’exogénéité

    stricte

    2. et ne peut causer aucun changement futur de Pol/h2.1 Supposons que la ville ajuste Pol/h sur base des valeurs passées

    de TxMeurtre, alors Pol/ht+1 est corrélée avec et

    I Facile que l’exogénéité sricte ne tienne pas

    Ch. 5. i:E(ixi)=0 : EndogénéitéDéfinition & conséquencesSource 1. Hétérogénéité inobservéeSource 2. Erreurs de mesureSource 3. SimultanéitéEstimation en présence d'endogénéitéTestsApplicationsSource 4. ÉchantillonnageSource 5: Autocorrélation en séries temporelles