52
MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 3 Modèles à Variable Dépendante Limitée Modèles Tobit Simples et Tobit Généralisés Christophe Hurlin Polycopié de Cours Master Econométrie et Statistique Appliquée (ESA) Université d’Orléans Faculté de Droit, d’Economie et de Gestion Bureau A 224 Rue de Blois – BP 6739 45067 Orléans Cedex 2 www.univ-orleans.fr/deg/masters/ESA/

MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)

Université d’Orléans

Econométrie des Variables Qualitatives

Chapitre 3

Modèles à Variable Dépendante Limitée

Modèles Tobit Simples et Tobit Généralisés

Christophe Hurlin

Polycopié de Cours

Master Econométrie et Statistique Appliquée (ESA) Université d’Orléans Faculté de Droit, d’Economie et de Gestion Bureau A 224 Rue de Blois – BP 6739 45067 Orléans Cedex 2 www.univ-orleans.fr/deg/masters/ESA/

Page 2: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Contents

1 Le Modèle Tobit Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.1 Estimation par les Moindres Carrés Ordinaires . . . . . . . . . . . . . . . . . . . 9

1.1.1 Application des MCO à l’ensemble des observations . . . . . . . . . . . . 91.1.2 Application des MCO aux observations pour lesquelles y∗i > 0 . . . . . . . 12

1.2 Estimation par la méthode en deux étapes : Heckman (1976) . . . . . . . . . . . 141.3 Estimation par le Maximum de Vraisemblance . . . . . . . . . . . . . . . . . . . . 16

1.3.1 Log Vraisemblance dans un modèle Tobit simple . . . . . . . . . . . . . . 161.3.2 Re-paramétrisation d’Olsen (1978) . . . . . . . . . . . . . . . . . . . . . . 18

1.4 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211.5 Effets marginaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.6 Propriétés de l’estimateur du MV sous des hypothèses non standard . . . . . . . 27

1.6.1 Hétéroscédasticité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271.6.2 Non normalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

1.7 Extensions du modèle Tobit Simple : modèles à censure multiples . . . . . . . . . 351.7.1 Modèle Tobit simple à censures multiples . . . . . . . . . . . . . . . . . . 351.7.2 Modèle Tobit simple à double censure : Rosett et Nelson (1975) . . . . . 371.7.3 Application modèle à double censure . . . . . . . . . . . . . . . . . . . . . 39

2 Les Modèles Tobit Généralisés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402.1 Modèle Tobit Généralisé Type 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

2.1.1 Définition du Tobit généralisé de type II . . . . . . . . . . . . . . . . . . . 412.1.2 Estimation par Maximum de Vraisemblance . . . . . . . . . . . . . . . . . 422.1.3 Estimation en deux étapes : Heckman (1976) . . . . . . . . . . . . . . . . 452.1.4 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472.1.5 Modèle de Troncature Auxiliaire ou Modèle Heckit . . . . . . . . . . . . . 48

2.2 Autres Modèles Tobit Généralisés . . . . . . . . . . . . . . . . . . . . . . . . . . . 502.2.1 Modèle Tobit Généralisé Type 3 . . . . . . . . . . . . . . . . . . . . . . . 502.2.2 Modèle Tobit Généralisé Type 4 . . . . . . . . . . . . . . . . . . . . . . . 502.2.3 Modèle Tobit Généralisé Type 5 . . . . . . . . . . . . . . . . . . . . . . . 50

3 Les Modèles à régimes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503.1 Modèle à régimes observables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503.2 Modèle à régimes inobservables . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

A Annexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51A.1 Concavité de la log-vraisemblance . . . . . . . . . . . . . . . . . . . . . . . . . . . 51A.2 Programme de simulation d’un probit simple . . . . . . . . . . . . . . . . . . . . 51

Page 3: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 3

Introduction

Nous allons à présent envisager le cas desmodèles à variable dépendante limitée :ce sontdes modèles pour lesquels la variable dépendante est continue mais n’est observableque sur un certain intervalle. Ainsi, ce sont des modèles qui se situent à mi cheminentre les modèles de régression linéaires où la variable endogène est continue et observableet les modèles qualitatifs. En effet, les modèles à variable dépendante limitée dérivent desmodèles à variables qualitatives, dans le sens où l’on doit modéliser la probabilité que la variabledépendante appartienne à l’intervalle pour lequel elle est observable. Nous verrons que lastructure de base des modèles à variable dépendante limitée est représentée par le modèleTobit. Avant de présenter plus en détail les modèles à variable dépendante limitée, et plusspécifiquement le modèle Tobit, il convient au préalable de préciser les termes que nous allonsutilisés par la suite dans le cadre de ce chapitre.

Les modèle Tobit se réfèrent de façon générale à des modèles de régressionsdans lesquels le domaine de définition de la variable dépendante est contraint sousune forme ou une autre. En économie, de tels modèles ont été initiés par James Tobin(1958). Son analyse portait sur les dépenses de consommation en biens durables et reposaitsur une régression tenant compte spécifiquement du fait que ces dépenses ne peuvent pas êtrenégatives. La variable dépendante était ainsi assujettie à une contrainte de non négativité.Tobin qualifia son modèle de modèle à variable dépendante limitée1 (limited dependentvariables model) d’où le titre de ce chapitre. Ce modèle et ses généralisations sont plus connusparmi les économistes sous le nom de modèle Tobit. Ce terme a été introduit par Goldberger(1964) en raison des similarités avec le modèle probit.

Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censoredregression models) ou modèle de régression tronquée (truncated regression models). Cetteterminologie plus précise permet en effet d’introduire la distinction entre des échantillons tron-qués et des échantillons censurés :

1. Un modèle de régression est dit tronqué lorsque toutes les observations des variablesexplicatuves et de la variable dépendante figurant en dehors d’un certain intervalle sonttotalement perdues.

2. Un modèle de régression est dit censuré lorsque l’on dispose au moins des observationsdes variables explicatives sur l’ensemble de l’échantillon.

Nous verrons par la suite que le modèle Tobit est ainsi un modèle de régressioncensurée. Les modèles censurés et tronqués ont été utilisés dans d’autres disciplines indépen-damment de leur utilisation et développement en économie, et ce notamment en biologie et dans

1Tobin J. (1958), ”Estimation of Relationships for Limited Dependent Variables”, Econometrica, 26, 24-36.

Page 4: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 4

les sciences de l’ingénieur. En biologie, de tels modèles furent utilisés pour représenter le tempsde survie des patients en fonction de certaines caractéristiques : les échantillons étaient en effetcensurés ou tronquées dès lors que le patient reste en vie à la dernière date d’observation del’échantillon ou si il ne peut pas être ausculté à cette date pour une raison quelconque. De lamême façon en ingénierie, les modèles censurés et tronqués sont utilisés pour analyser le tempsde survie d’un matériel ou d’un système en fonction de ses caractéristiques. De tels modèlessont alors qualifiés demodèles de survie (survival models). Les économistes et les sociologuesont aussi utilisés des modèles de survie pour évaluer la durée de phénomènes comme le chômage,le mariage, la durée de résidence dans certains lieux etc... Mathématiquement, les modèles dedurée appartiennent à la même classe que les modèles Tobit, mais font souvent l’objet d’untraitement à part.

Entre 1958, date de parution de l’article de Tobin et les années 70, les modèles Tobit ont étéutilisés très fréquemment en économie sous l’effet de la conjonction de deux phénomènes : d’unepart la plus grande disponibilité de bases micro-économiques et d’autre part le développementdes capacités informatiques qui a permis de traiter des modèles Tobit de grande taille. Du faitde ces très nombreuses applications, différentes extensions et généralisations ont été proposéespour le Tobit : modèle Tobit généralisé,modèles à seuils stochastiques... C’est pourquoion a introduit la caractérisation de modèle Tobit simple pour désigner le modèle développépar Tobin et le distinguer des autres extensions. Amemiya (1983) identifie ainsi 5 typesde modèle de Tobit, le Tobit simple étant qualifié de modèle Tobit Type I.

Plus formellement, considéronsN couples de variables (xi, y∗i ) où la variable y∗i est engendrée

par un processus aléatoire tel que E (y∗i /xi) = xiβ, où β ∈ RK est un vecteur de paramètres.On suppose que la variable y∗i n’est pas toujours observable : on ne l’observe que si sa valeurest supérieure à un certain seuil ci. On peut ainsi construire une variable yi, qui est égale à y∗ilorsque celle-ci est observable et qui vaut ci par convention lorsque y∗i n’est pas observable.

yi =y∗ici

si y∗i > cisinon

∀i = 1, ..N (0.1)

La constante ci peut être identique pour tous les individus. Deux cas peuvent alors se présentersuivant la nature des observations :

1. Si le vecteur xi est observable pour tous les individus et cela indépendamment du fait quela variable y∗i soit observable ou non, on un échantillon censuré. Seule la variable y

∗i

est observable sur un intervalle [ci,+∞[2. Si le vecteur xi est observable uniquement pour les individus pour lesquels la variable y∗iest observable, on un échantillon tronqué. On ne dispose d’observations (xi, y∗i ) quepour les individus pour lesquels y∗i > ci.

On a par exemple un échantillon tronqué dans le cadre d’une enquête où les ménages nerépondent à l’enquête que s’ils répondent à la question permettant de déterminer y∗i . Ceuxpour lesquels y∗i ≤ ci ne répondent pas à l’enquête ou sont éliminés de l’échantillon par lesenquêteurs.

Page 5: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 5

L’utilisation de modèles Tobit suppose que soient particulièrement connus les résultats relat-ifs aux moments et aux moments conditionnels d’une variable distribuée selon une loi normaletronquée. C’est pourquoi, avant de présenter ces modèles, nous proposons les résultats suiv-ants. Soit Φ (.) la fonction de répartition de la loi normale centrée réduite N (0, 1) et soit φ (.)la fonction de densité associée.

Proposition 0.1. Considérons une variable y suivant une loi normale tronquée telleque :

y =y∗

0si y∗ > 0sinon

(0.2)

où y∗ est distribuée selon une loi normale N m,σ2 . On admet alors les propriétéssuivantes :

1. Espérance de y :E (y) = mΦ

m

σ+ σ φ

m

σ(0.3)

2. Espérance conditionnelle de y :

E (y/y > 0) = m+ σφ m

σ

Φ mσ

= m+ σ λm

σ(0.4)

où λ (x) = φ (x) /Φ (x) désigne le ratio de Mill.

3. Variance de y :

V (y) = σ2 Φm

σ+m

σW

m

σ−W 2 m

σ(0.5)

avec W (x) =x

−∞Φ (t) dt = xΦ (x) + φ (x) . Par conséquent :

V (y) = m2Φm

σ+mσ φ

m

σ+ σ2 Φ

m

σ−m2Φ2

m

σ

−2mσ φm

σΦ

m

σ− σ2 φ2

m

σ

4. Variance conditionnelle de y :

V (y/y > 0) = σ2 1− mσλm

σ− λ2

m

σ(0.6)

Notons simplement que puisque le ratio de Mill λ (x) joue un grand rôle dans l’analyse desmoments d’une loi normale tronquée, il est intéressant de vérifier qu’il s’agit d’une fonctiondécroissante de x :

∂λ (x)

∂x=−λ (x)W (x)

Φ (x)(0.7)

Page 6: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 6

La forme générale du ratio de Mill est reproduite sur la figure (0.1).

Figure 0.1: Ratio de Mill : λ (x) = φ (x) /Φ (x)

-5 -4 -3 -2 -1 0 1 2 3 4 50

1

2

3

4

5

6

Ratio de Mill

Etudions à présent le modèle Tobit Simple ou modèle Tobit de type 1 suivant la terminologied’Amemiya (1983).

Page 7: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 7

1. Le Modèle Tobit Simple

Comme nous l’avons dit en introduction le modèle Tobit2 a été développé par Tobin (1958),même si le terme de modèle Tobit n’est apparu qu’en 1964 dans un article de Goldberger. Dansson étude, Tobin cherche à modéliser la relation entre le revenu d’un ménage et les dépensesen biens durables. Il dispose pour cela d’un échantillon de N = 735 consommateurs tiré duSurvey of Consumer Finances. Tobin observe que lorsque l’on représente les couples revenus- dépenses des N consommateurs, la relation obtenue ressemble au graphique (1.1) ci-dessous.Une des caractéristiques essentielles des données étant que plusieurs observations pour lemontant des dépenses de consommation sont nulles. En effet, ces observations sontnulles pour tous les ménages n’ayant pas acheté de biens durables sur la période. Pour cesindividus, on dispose ainsi d’observations sur le revenu mais pas d’observations sur les dépensesde consommation : on un échantillon censuré.

Figure 1.1: Nuage de Points : Modèle Tobit Simple

0 0.5 1 1.5 2 2.5 3 3.5 4 4.50

1

2

3

4

5

6

Cette propriété remet en cause l’hypothèse de linéarité et montre que les moindres carrésordinaires ne sont pas la méthode pertinente pour estimer une telle relation. De façon plusgénérale, on peut pas ici utiliser une densité continue pour expliquer la distributionconditionnelle des dépenses par rapport au revenu : en effet, une distribution continueest incompatible avec le fait que plusieurs observations des dépenses soient nulles. C’est doncdans ce contexte que Tobin propose son modèle à variable dépendante limitée (limited dependentvariable model).

2Dans cette section nous parlerons de modèle Tobit en réference au Tobit simple pour alléger les notations.

Page 8: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 8

L’histoire que propose Tobin est alors la suivante. Considérons un agent qui a le choix entredeux biens x et y, qui cherche à maximiser son utilité U (x, y) sous sa contrainte de budget de laforme x+ py ≤ R, où p est le prix relatif et R le revenu. On suppose que le prix du bien x sertde numéraire. On admet parallèlement que la consommation de bien x satisfait une contraintede non négativité x ≥ 0, mais que la consommation de bien y vérifie une contrainte du typey ≥ y0 ou y = 0. Cette contrainte traduit simplement une indivisibilité des premières unités debiens y. Supposons que y∗ soit la solution du programme de maximisation de l’utilité sous lacontrainte de budget et la contrainte x ≥ 0.

(x∗, y∗) = arg maxx,y

U (x, y)

sc : x+ py ≤ R.sc : x ≥ 0

Dès lors, deux cas sont à considérer : soit le niveau de consommation potentielle du bieny∗ est suffisamment élevé par rapport au seuil y0 et l’agent consomme effectivement du bieny en quantité y∗, soit il n’est pas suffisamment élevé et l’agent ne consomme pas de bien y.Formellement on a :

y =y∗

0si y∗ > y0

Si l’on suppose que la solution non contrainte y∗ est fonction d’un certains nombres decaractéristiques x et d’une perturbation ε sous la forme y∗ = β0 + β1x + ε et si l’on supposela normalité des perturbations ε , alors on peut reproduire des valeurs de la consommation ysemblables à celles du graphiques (1.1). Il suffit pour cela de supposer que les seuils y0 sont lesmêmes pour tous les individus et que y0 = 0.

Ainsi, le modèle originellement proposé par Tobin (1958) est le suivant :

Definition 1.1. Un modèle Tobit Simple ou modèle Tobit de type I est défini par :

y∗i = xiβ + εi ∀i = 1, ..N (1.1)

yi =y∗i0

si y∗i > 0si y∗i ≤ 0 (1.2)

où xi = x1i ..xKi , ∀i = 1, .., N désigne un vecteur de caractéristiques observables et où

β = (β1...βK) ∈ RK est un vecteur de paramètres inconnus et où les perturbationsεi sont distribués selon une loi N 0,σ2ε .

On suppose ainsi que les variables yi et xi sont observées pour tous les individus, maisque les variables y∗i sont observables uniquement si elles sont positives. On note X la matricede dimension (N,K) telles que les lignes de cette matrice correspondent aux vecteurs xi. Onsuppose en outre que

limN→∞

X X = QX

où QX est une matrice définie positive.

Remarquons que l’écriture d’un seuil nul y∗i > 0 peut parfaitement être changé en un seuily∗i > y0 sans que le modèle soit changé. Il suffit pour cela d’absorber dans le vecteur des

Page 9: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 9

caractéristiques xi une constante et de lui associer un coefficient égal à y0. Le cas où les seuilsyi,0 diffèrent selon les individus nécessite toutefois de modifier le modèle.

Essayons à présent de comprendre pourquoi l’application d’une méthode de moindres carrésordinaires ne permet pas d’estimer de façon convergente le vecteur des paramètres β associésaux variables explicatives.

1.1. Estimation par les Moindres Carrés Ordinaires

Au delà des calculs, on observe immédiatement sur l’exemple de la figure (1.1) que l’applicationdes Moindres Carrés Ordinaires n’est pas la méthode adéquate pour révéler la relation entreconsommation et revenu pour au moins eux raisons :

1. Le nuage de point sera alors mal décrit par une relation du type consommation = a+ b ∗revenu puisque le nuage de points comporte deux parties distinctes.

2. L’hypothèse de loi continue généralement faite sur les perturbations n’est pas adaptéedans ce cas puisque la valeur nulle de la consommation est observée de nombreuses foisdans l’échantillon et a donc sans doute une probabilité d’apparition nettement différentede zéro.

Nous allons toutefois montrer l’application des MCO à l’ensemble des observations ou l’ap-plication des MCO aux seules observations pour lesquelles on observe la variable y∗ conduit àune estimation biaisée des paramètres du vecteur β.

On suppose que les N observations de l’échantillon sont générées à partir du processusgénérateur de données suivant :

yi =y∗i0

si y∗i = xiβ + εi > 0sinon

∀i = 1, ..N

avec xi = x1i ..xKi , ∀i = 1, .., N, β = (β1...βK) ∈ RK et où les perturbations εi sont distribués

selon une loi N 0,σ2ε . On cherche ici à estimer le vecteur de paramètre β par le méthode desMoindres Carrés Ordinaires. Deux solutions sont alors envisageables :

1. Soit on applique les MCO à l’ensemble des observations (xi, yi) de l’échantillon

2. Soit on applique les MCO aux seules observations (xi, yi) pour lesquels y∗i > 0.

Commençons tout d’abord par appliquer lesMCO à l’ensemble des observations de l’échan-tillon.

1.1.1. Application des MCO à l’ensemble des observations

L’estimateur des MCO appliqué à l’ensemble des N couples d’observations (yi, xi) est définipar la relation suivante :

βLS =N

i=1

xixi

−1 N

i=1

xiyi (1.3)

Page 10: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 10

Supposons pour commencer que les variables exogènes xi sont déterministes et déterminons

alors l’expression de E βLS , comme suit :

E βLS =N

i=1

xixi

−1 N

i=1

xiE (yi) (1.4)

Cette expression dépend de la quantité E (yi) qui correspond à l’espérance d’une variablenormale tronquée. En appliquant la formule de l’espérance d’une loi normale tronquée, onmontre que :

E (yi) = xiβΦxiβ

σε+ σε φ

xiβ

σε

On en déduit immédiatement que l’estimateur des moindres carrés β est biaisé : en effet la

quantité E βLS est une fonction non linéaire de β et ne peut donc pas être égale à β. Lebiais peut être positif ou négatif et pour le caractériser, considérons le cas où K = 1, on a alors

βLS =Ni=1 x

2i

−1Ni=1 xiyi et l’on en déduit que :

E βLS =Ni=1 xiE (yi)

Ni=1 x

2i

=1Ni=1 x

2i

N

i=1

x2i βΦxiβ

σε+ xiσε φ

xiβ

σε

Si l’on admet quelimn→∞ V βLS = 0

alors, on en déduit que l’estimateur βLS converge vers E βLS qui dans le cas général diffère

de la vraie valeur β des paramètres :

βLSp−→

N→∞β = β (1.5)

L’estimateur des MCO de β appliqué sur l’ensemble des observations est non con-vergent. Il est alors relativement difficile dans le cas de variables déterministes de donner unrésultat général sur la forme du biais, c’est à dire sur le fait que l’estimateur βLS sur-estime ousous estime la vraie valeur β des paramètres. C’est pourquoi, nous allons à présent envisagerle cas de variables explicatives stochastiques.

Envisageons à présent le cas où les variables xi sont des variables aléatoires. Goldberger(1981) a étudié les biais asymptotiques de l’estimateur des MCO dans ce cas en supposant queles toutes les variables explicatives xi, à l’exception du terme constant, étaient distribuées selonune loi normale. Goldberger réécrit ainsi le modèle sous la forme :

yi =y∗i0

si y∗i = α+ xiβ + εi > 0sinon

∀i = 1, ..N

avec xi = x1i ..xKi , ∀i = 1, .., N, β = (β1...βK) ∈ RK et γ ∈ R. Les résidus εi sont distribués

selon une loi normale N 0,σ2ε .

Hypothèse On suppose que les variables explicatives xi sont distribuées selon une loi normaleN (0,Ω) avec cov εix

(k)i = 0, ∀k = 1, ..,K.

Page 11: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 11

L’hypothèse de nullité de l’espérance des variables explicatives xi n’est pas gênante icipuisque si l’on considère des variables non centrées, on peut sans problème intégrer cette quan-tité dans le terme constant α.

Proposition 1.2. Sous les hypothèses de Goldberger (1981), l’estimateur βLS desMoindres Carrés Ordinaires obtenu sur l’ensemble des observations (xi, yi) vérifie :

βLSp−→

N→∞β ×Φ α

σy(1.6)

où α correspond à la constante de l’équation y∗i = α+ xiβ + εi et σ2y = σ2ε + β Ωβ, oùΩ désigne la matrice de variance covariance des variables explicatives xi.

La démonstration de cette proposition figure dans Greene (1981)Exemple : Considérons le cas où α = 0. Etant donné que Φ (0) = 0.5, lorsque il n’y pas

de constante dans la définition de la variable latente y∗i (α = 0), alors on obtient une relationdu type plim βLS = 0.5× β. Dans ce cas, l’estimateur obtenu sur la totalité de l’échantillon

converge asymptotiquement vers la moitié de la vraie valeur β des paramètres. En effet, sousl’hypothèse de normalité avec E (xi) = 0, si la constante α est nulle, on a alors E (y∗i ) = 0. Lavariable y∗i est centrée et distribuée selon une loi symétrique, la loi normale N xiβ,σ

2ε . Dès

lors sous l’hypothèse de Goldberger lorsque α = 0, on a Prob (y∗i > 0) = Prob (y∗i ≤ 0) = 0.5.

Pour un échantillon de taille N suffisante, on a donc approximativement autant d’observationsnulles de yi que d’observations strictement positives : N1 N/2. Dès lors, la prise en comptede l’ensemble des observations dans l’estimation des MCO va conduire à un estimateur de βconvergeant vers la moitié de la vraie valeur du vecteur β. Dans le cas K = 1, la pente de ladroite d’ajustement linéaire associée à la régression sur l’ensemble des observations (c’est à direβLS) correspond dans ce cas à la moitié de la pente β associée à la vraie relation linéaire entrey∗i et xi.************************************* Insérer Graphique avec α = 0 *************************************

Une des conséquences remarquables de cette proposition est la suivante :

Remark 1. Sous les hypothèses de Goldberger (1981), l’estimateur défini par laquantité β

c

LS = (N/N1) × βLS, où N1 est le nombre d’observations pour lesquellesy∗i > 0, est un estimateur convergent de β. Un estimateur convergent de α peut êtreobtenu de façon similaire.

βc

LS =N

N1βLS

p−→N→∞

β (1.7)

De la même façon pour l’estimateur corrigé αcLS de la constante α, on a :

αcLS =N

N1αLS

p−→N→∞

α (1.8)

Reprenons l’exemple du cas où le terme constant est nul : α = 0. On a vu alors quel’estimateur des MCO était biaisé et convergeait vers la moitié de la vraie valeur des paramètres:

βLSp−→

N→∞β ×Φ 0

σy=

β

2

Page 12: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 12

Or sous les hypothèses de Goldberger et en particulier sous l’hypothèse E (xi) = 0, imposerla nullité de α revient à imposer la nullité de E (y∗i ) . Comme nous l’avons dit la variable y

∗i est

alors centrée et distribuée selon une loi symétrique, la loi normale N xiβ,σ2ε . Dès lors, lorsque

α = 0, on a Prob (y∗i > 0) = Prob (y∗i ≤ 0) = 0.5. Pour un échantillon de taille N suffisante,on a donc approximativement autant d’observations nulles de yi que d’observations strictementpositives :

N1p−→

N→∞N

2

Ainsi l’estimateur corrigé βc

LS est convergent puisque :

βc

LS =N

N1× βLS

p−→N→∞

2 plim βLS = β

Greene (1983) dérive les matrices de variance covariance asymptotiques de cet estimateur.Malheureusement, on peut utiliser cet estimateur que dans la mesure où l’on est sur que les hy-pothèses de Goldberger sont satisfaites et en particulier l’hypothèses selon laquelle les variablesexplicatives sont distribuées selon des lois normales. Rien n’est spécifié sur les propriétés decet estimateur lorsque les variables explicatives ne sont pas distribuées selon une loi normale.Il faudra donc utiliser une autre méthode pour estimer β dans le cas général.*********************************************************** Illustrer par simulation biais sur βLS et convergence de β

c

LS ***********************************************************

Appliquons à présent la méthode des MCO aux seules observations pour lesquelles y∗i > 0afin d’estimer le vecteur de paramètres β.

1.1.2. Application des MCO aux observations pour lesquelles y∗i > 0

Compte tenu du graphique (1.1), il était clair que l’application des MCO à l’ensemble desobservations (xi, yi) de l’échantillon devait conduire à une estimation biaisée du coefficient quilie le revenu à la consommation. C’est ce que nous avons démontré dans la section précédente.Mais lorsque l’on restreint l’échantillon aux seules observations pour lesquelles la variable latentey∗i est positive, ce résultat est beaucoup moins évident à illustrer graphiquement.

Appliquons ainsi les MCO aux seules observations pour lesquelles y∗i > 0. L’estimateur desMCO, noté βy>0, est défini par la relation :

βy>0 =yi>0

xixi

−1

yi>0

xiyi (1.9)

où yi>0désigne la sommation sur les indices i = 1, ..,N pour lesquels on a yi > 0. Supposons

que les variables exogènes xi sont déterministes et déterminons alors l’expression de E βy>0 ,comme suit :

E βy>0 =yi>0

xixi

−1

yi>0

xiE (yi/yi>0) (1.10)

Cette expression dépend de la quantité E (yi/yi>0) qui correspond à l’espérance condition-nelle d’une variable normale tronquée. En appliquant la formule correspondante, on montre

Page 13: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 13

que :

E (yi/yi>0) = xiβ + σεφ xiβ

σε

Φ xiβσε

= xiβ + σε λxiβ

σε(1.11)

où λ (x) = φ (x) /Φ (x) désigne le ratio de Mill. Dans ce cas encore, l’estimateur des MCO estdonc biaisé et le biais peut être positif et négatif :

E βy>0 =yi>0

xiE (yi/yi>0)

yi>0x2i

= β + σεyi>0

xiλ (xiβ/σε)

yi>0x2i

(1.12)

Envisageons à présent le cas où les variables xi sont distribuées selon une loi normale. On seplace alors dans le cadre des hypothèses de Goldberger (1981) décrites à la section précédente.On suppose que les variables explicatives xi sont distribuées selon une loi normale N (0,Ω) avec

cov εix(k)i = 0, ∀k = 1, ..,K. Sous ces hypothèses, Goldberger obtient le résultat suivant :

Proposition 1.3. Sous les hypothèses de Goldberger (1981), l’estimateur βy>0 desMoindres Carrés Ordinaires obtenu sur les seules observations (xi, yi) pour lesquellesy∗i > 0 vérifie :

βy>0p−→

N→∞1− γ

1− ρ2γβ (1.13)

les paramètres γ et ρ étant respectivement définis par :

γ =1

σyλ

α

σyα+ σyλ

α

σy(1.14)

ρ2 =1

σ2yβ Ωβ (1.15)

où α correspond à la constante de l’équation y∗i = α+ xiβ + εi et où σ2y = σ2ε + β Ωβ,

avec Ω matrice de variance covariance des variables explicatives xi.

La démonstration de cette proposition figure dans Goldberger (1981). On peut montrer queles paramètres γ et ρ vérifient :

0 ≤ γ ≤ 1 0 ≤ ρ2 ≤ 1

Dés lors, de façon générale on montre que l’estimateur des MCO appliqué aux seules observa-tions yi > 0 sous estime l’ensemble des composantes du vecteur β.

plimN→∞

βy>0 ≤ β (1.16)

Une des conséquences remarquable de cette proposition est la suivante :

Remark 2. Sous l’hypothèse de normalité des variables xi, le degré de sous estima-tion est totalement uniforme pour tous les éléments de β.

1

β(k)plimN→∞

β(k)

y>0 = ξ ∀k = 1, ..,K (1.17)

Page 14: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 14

Ainsi le biais affecte de façon symétrique l’ensemble des paramètres estimés. Ce résultatn’est plus valable dès lors que l’on lève l’hypothèse de normalité.

*** Déterminer le cas particulier où l’estimateur βy>0 n’est pas biaisé c’est à dire lorsque

γ = σ−1y λα

σyα+ σyλ

α

σy=

α

σyλ

α

σy+ λ2

α

σy= 1

********************************************************* Insérer Simulations Biais + Graphique pour le cas particulier ********************************************************

1.2. Estimation par la méthode en deux étapes : Heckman (1976)

Puisque la méthode des Moindres Carrés Ordinaires ne peut conduire qu’à des estimationsbiaisées des paramètres dans le cas d’un modèle Tobit simple, sauf dans des cas très particuliers,différentes méthodes d’estimation alternatives ont été proposées. La méthode d’estimation quiest la plus utilisée aujourd’hui est celle du maximum de vraisemblance (Goldberger 1981, Olsen1978). Toutefois cette méthode est relativement ”gourmande” en termes de capacités de calcul,notamment dans la phase d’optimisation. C’est pourquoi, dans les années 70, du fait descontraintes informatiques, d’autres méthodes d’estimation ont souvent été privilégiées parcequ’elles nécessitaient moins de capacités de calcul : tel est le cas de la méthode d’estimation endeux étapes d’Heckman (1976).

Heckman (1976), suivant une suggestion de Gronau (1974), propose un estimateur en deuxétapes dans un modèle Tobit généralisé à deux équations (modèle que nous aborderons dansles sections suivantes). Cet estimateur peut aussi être utilisé pour estimer les paramètres d’unmodèle Tobit simple ou modèle Tobit de type I. Pour comprendre cette méthode, considéronsla formule de l’espérance conditionnelle de yi sachant que yi > 0 :

E (yi/yi>0) = xiβ + σε λxiβ

σε(1.18)

où λ (x) = φ (x) /Φ (x) désigne le ratio de Mill. Ainsi, l’espérance conditionnelle de yi sachantyi > 0 peut être décomposée en une composante linéaire en β et une composante non linéaire enβ. Considérons à présent la partie quantitative du modèle Tobit, c’est à dire celle qui correspondà l’observation de yi > 0. Pour ces observations on a une relation du type :

yi = E (yi/yi>0) + vi

où vi est de moyenne nulle. On remplace alors l’espérance conditionnelle par son expression, etl’on obtient la relation suivante.

Proposition 1.4. Le modèle Tobit simple, pour yi > 0, peut être représenté par larégression non linéaire hétéroscédastique suivante :

yi = xiβ + σε λ (xiδ) + vi (1.19)

avec δ = β/σε et vi = yi −E (yi/yi>0) et E (vi) = 0 etV ar (vi) = σ2ε − σ2εxiδλ (xiδ)− σ2ελ (xiδ)

2 (1.20)

Page 15: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 15

Ainsi, pour estimer les paramètres β, il suffit de considérer la régression non linéaire (1.19)et d’en déduire un estimateur βH à partir des N1 observations pour lesquelles yi > 0. La seuledifficulté provenant de l’hétéroscédasticité des perturbations vi, puisque V ar (vi) dépend descaractéristiques xi via le ratio de Mill λ (xiδ) et directement dans l’expression xiδλ (xiδ) . Telleest l’idée de la procédure d’Heckman.

Proposition 1.5. La procédure d’estimation d’Heckman (1976) comporte deuxétapes :

1. Etape 1 : Estimer le ratio δ = β/σε à partir du modèle probit dichotomiquesuivant par une méthode de maximum de vraisemblance

zi =10

si yi > 0sinon

∀i = 1, ..N (1.21)

avec Prob (zi = 1) = Φ (xiβ/σε) = Φ (xiδ) . Soit δ l’estimateur du MV de δ.

2. Etape 2 : Régresser yi sur xi et λ xiδ par une méthode de Moindres Carrésen ne considérant uniquement les N1 valeurs positives de yi

yi = xiβH + σε λ xiδ + vi (1.22)

On note alors γH = βH σε l’estimateur des paramètres du modèle Tobitainsi obtenu.

En effet sous la forme (1.19), le modèle quantitatif apparaît comme un modèle linéaire enβ et σε.

Réécrivons le modèle sous forme vectorielle pour dériver les lois asymptotiques. On pose Z =X λ où X désigne la matrice de dimension (N1,K) dont les lignes correspondent aux vecteur

de variables explicatives xi pour lesquelles yi > 0 et où λ désigne un vecteur de dimension (N1, 1)

dont le jeme élément est donné par l’estimateur du ratio de Mill λ xjδ . Soit γ = β σε le

vecteur des K + 1 paramètres à estimer. Le modèle (1.19) s’écrit alors sous la forme :

y = Zγ + w (1.23)

où y désigne le vecteur des N1 observations de yi pour lesquelles yi > 0 et où les résidusw = (w1...wN1) sont tels que :

wi = vi + ηi = vi + σε λ (xiδ)− λ xiδ (1.24)

Le résidu se décompose ainsi en la somme du résidu vi de la représentation (1.19) et d’un termeprovenant de l’erreur d’estimation du paramètre δ = β/σε dans la phase n1 d’estimation duprobit. L’estimateur de Heckman en deux étapes est alors défini par :

γH = Z Z−1

Z y

Amemiya (1983) établit alors lé résultat suivant en ce qui concerne la distribution asymp-totique de γH (cas particulier de Heckman 1979) :

Page 16: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 16

Proposition 1.6. L’estimateur en deux étapes de Heckman (1976) est asympto-tiquement normalement distribué :

N− 12

1 (γH − γ)p−→

N→∞N (0, Vγ) (1.25)

où N1 désigne le nombre d’observations telles que yi > 0, avec

Vγ = σ2ε (Z Z)−1Z Σ+ σ2ε (I − Σ)X (X D1X)

−1X (I − Σ) Z (Z Z)−1 (1.26)

Il faut noter que dans cette expression de Vγ , la seconde matrice dans les crochets provientdu fait que le ratio de Mill λ a du être estimé dans une première étape. Si la valeur de ce ratioétait connu, la matrice de variance covariance asymptotique deviendrait simplement :

Vγ = σ2ε (Z Z)−1Z ΣZ (Z Z)

−1

Au delà de ces résultats, on vérifie que l’estimateur de Heckman en deux étapes estasymptotiquement convergent :

γHp−→

N1→∞γ (1.27)

On dispose ainsi d’un estimateur convergent et qui ne nécessite dans la première étape quel’utilisation d’un estimateur du maximum de vraisemblance pour un probit simple. Cet estima-teur représente donc un gain de capacités de calculs par rapport à l’estimateur du maximum devraisemblance appliqué directement au modèle Tobit. Remarquons toutefois, que cet es-timateur est biaisé à distance finie en raison de la corrélation entre la perturbationwi = ηi + vi et la variable explicative λ xiδ .

1.3. Estimation par le Maximum de Vraisemblance

La procédure d’estimation la plus utilisée aujourd’hui est celle du maximum de vraisemblance.En effet, les capacités informatiques sont désormais suffisantes pour envisager l’optimisation desfonctions de vraisemblance associées directement aux modèles Tobit et non plus uniquementaux probit dichotomiques comme dans le cas de la procédure d’Heckman (1976). Commençonspar définir la log-vraisemblance associée au modèle Tobit simple :

yi =y∗i0

si y∗i = xiβ + εi > 0sinon

∀i = 1, ..N

avec xi = x1i ..xKi , ∀i = 1, .., N, β = (β1...βK) ∈ RK et où les perturbations εi sont distribués

selon une loi N 0,σ2ε .

1.3.1. Log Vraisemblance dans un modèle Tobit simple

Considérons un échantillon de N observations yi, noté y = (y1, .., yN ) . La vraisemblance de cemodèle est définie par :

L y,β,σ2ε =i: yi=0

1− Φ xiβ

σε i: yi>0

1

σεφ

yi − xiβσε

(1.28)

En effet, on sait que si l’on définit une variable dichotomique probit zi telle que

zi =10

si y∗i = xiβ + εi > 0sinon

∀i = 1, ..N (1.29)

Page 17: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 17

alors on peut écrire la probabilité que la variable yi prenne des valeurs positives sous la formeProb (zi = 1) = Prob (εi/σε < xiβ/σε) = Φ (xiβ/σε) . Par conséquent, la probabilité que yiprenne une valeur nulle s’écrit comme la probabilité complémentaire :

Prob (yi = 0) = Prob (zi = 0) = 1− Φ xiβ

σε

Ce qui explique le terme du premier produit de la fonction de vraisemblance (1.28). Lesecond terme de cette expression correspond tout simplement au produit des lois marginalesdes variables yi positives. On sait que si yi > 0, on a part définition yi = y∗i = xiβ + εi oùles perturbations εi sont distribués selon une loi N 0,σ2ε . On en déduit que les variables yisont distribuées selon une loi normale N xiβ,σ

2ε . Ainsi, la loi marginale d’une observation yi

positive est définie par la quantité :

1

σε√2πexp −1

2

yi−xiβσε

2

=1

σεφ

yi − xiβσε

où φ (.) désigne la fonction de densité associée à loi normale centrée réduite.

On en déduit l’écriture de la log-vraisemblance :

Proposition 1.7. La log-vraisemblance concentrée associée à un échantillon y =

(y1, .., yN ) dans un modèle Tobit simple s’écrit :

logL y,β,σ2ε =i: yi=0

log 1− Φ xiβ

σε− N12log σ2ε −

1

2σ2ε i: yi>0(yi − xiβ)2 (1.30)

où N1 désigne le nombre d’observations pour lesquelles yi > 0.

En effet, on sait que la log-vraisemblance est définie par :

logL y,β,σ2ε =i: yi=0

log 1− Φ xiβ

σε+i: yi>0

log1

σεφ

yi − xiβσε

=i: yi=0

log 1− Φ xiβ

σε−i: yi>0

log (σε) +i: yi>0

log φyi − xiβ

σε

=i: yi=0

log 1− Φ xiβ

σε−N1 log (σε) +

i: yi>0

log1√2πe− (yi−xiβ)

2

2σ2ε

=i: yi=0

log 1− Φ xiβ

σε−N1 log (σε)− 1

2σ2ε i: yi>0(yi − xiβ)2

−N12log (2π)

En omettant les termes constants (log-vraisemblance concentrée), il vient :

logL y,β,σ2ε =i: yi=0

log 1− Φ xiβ

σε−N1 log (σε)− 1

2σ2ε i: yi>0(yi − xiβ)2

Sachant que N1 log (σε) = (N1/2) log σ2ε , on retrouve l’expression (1.30) de la fonction de logvraisemblance.

On en déduit alors l’expression des dérivées premières par rapport à β et à σ2ε :

Page 18: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 18

Definition 1.8. Dans le cas d’un modèle Tobit, le gradient associé à la log-vraisemblances’écrit sous la forme suivante :

∂ logL y,β,σ2ε∂β

= − 1σε i: yi=0

φ xiβσε

xi

1− Φ xiβσε

+ 1

σ2ε i: yi>0(yi − xiβ)xi (1.31)

∂ logL y,β,σ2ε∂σ2ε

=1

2σ3ε i: yi=0

xiβ φ xiβσε

1− Φ xiβσε

− N12σ2ε

+1

2σ4ε i: yi>0(yi − xiβ)2 (1.32)

Amemiya (1973) démontre que l’estimateur γ = β σε du maximum de vraisemblance

satisfaisant :γ =argmax

γ[logL (y, γ)] =argmax

β,σεlogL y,β,σ2ε (1.33)

est convergent et asymptotiquement distribué selon une loi normale de moyenne nulle et devariance égale à l’inverse de la matrice d’information de Fischer :

√N (γ − γ0)

L−→N→∞

N 0, I (γ0)−1 (1.34)

avec

I (γ) = −E ∂2 log L (y, γ)

∂γ∂γ γ=γ0

(1.35)

où γ0 désigne la varie valeur du vecteur de paramètres3. Nous allons à présent proposer un

changement de paramètre permettant d’obtenir une expression de la log-vraisemblance globale-ment concave, comme dans le cas des modèles logit et probit dichotomiques.

1.3.2. Re-paramétrisation d’Olsen (1978)

Nous avons montré que les estimateurs du maximum de vraisemblance des paramètres d’unmodèle Tobit simple, notées respectivement β et σε, sont solution du programme :

maxβ,σε

logL y,β,σ2ε

et vérifient donc par conséquent les conditions nécessaires suivant, correspondant à l’annulationdu vecteur gradient de la log-vraisemblance :

∂ logL y,β,σ2ε∂β

β=β

= − 1σε i: yi=0

φ xiβσε

1− Φ xiβσε

xi

+ 1

σ2ε i: yi>0yi − xiβ xi = 0

∂ logL y,β,σ2ε∂σ2ε

σ2ε=σ2ε

=1

2σ3ε i: yi=0

φ xiβσε

1− Φ xiβσε

xiβ

− N1

2σ2ε+

1

2σ4ε i: yi>0yi − xiβ

2

= 0

Pour déterminer les estimateurs β et σε, il convient donc de résoudre ce système de K +

1 équations non linéaires. Comme dans le cas des modèles probit et logit, il n’existe pasd’expression analytique des solutions de ce programme. La résolution d’un tel système ne peut

3La formule de la matrice de variance covariance asympotoique des estimateurs du MVC dans la paramétri-sation (β,σε) est donnée dans Amemiya (1973).

Page 19: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 19

donc se faire qu’en utilisant une procédure d’optimisation numérique. Nous avons vu dans lepremier chapitre, que généralement on recours alors à des algorithmes d’optimisation fondésnotamment sur la méthode du gradient (comme l’algorithme de Newton Raphson par exemple).

Amemiya (1973) a démontré que la fonction de vraisemblance du modèle Tobitparamétrée en β et σε n’est pas globalement concave. Cette propriété est alorsparticulièrement gênante puisque nous savons que les solutions des algorithmesd’optimisation numérique sont alors extrêmement sensibles au problème du choixdes conditions initiales.S’il existe des extrema locaux de la fonction à optimiser, en l’occurrence ici la fonction de

log-vraisemblance, il peut arriver que l’algorithme converge vers ces extrema locaux. En effet,si l’on utilise des conditions initiales dans l’algorithme d’optimisation relativement proches desextrema locaux de la fonction de log-vraisemblance, alors il y a des risques que l’algorithmed’optimisation s’arrête en ces points pour lesquels le gradient est nul, mais qui ne maximisentpas de façon globale la fonction de log-vraisemblance. On risque alors d’obtenir des estimateursnon convergents des vrais paramètres du modèle Tobit, non pas en raison de mauvaises pro-priétés de la méthode économétrique utilisée (maximum de vraisemblance), mais simplement enraison de la défaillance de l’algorithme d’optimisation numérique utilisé pour maximiser la log-vraisemblance. Plusieurs solutions, non exclusives les unes des autres, peuvent être apportéesà ce problème :

1. La première solution consiste à modifier les valeurs des conditions initiales de l’algorithmesd’optimisation4 de sorte à vérifier la robustesse des estimations obtenues à la modificationde ces valeurs. Si le changement des valeurs initiales ne conduit à aucune modificationdes estimations des paramètres, cela tend à montrer que l’algorithme a convergé versun extremum global. Si en revanche, les estimations sont modifiées, cela prouve que lasolution précédente n’était pas un extremum global de la fonction de vraisemblance. Maisse pose alors la question de savoir ce qu’il en est pour les nouvelles estimations obtenues? Correspondent elles à un extremum global de la fonction de la vraisemblance ?

2. La deuxième solution consiste à vérifier la robustesse des estimations au choix de l’algo-rithme d’optimisation. Généralement, plusieurs algorithmes sont proposés sous les logi-ciels usuels : simplex, Newton Raphson, Marquadt etc.. Ces algorithmes, fondées surdes méthodes différentes, n’ont pas la même sensibilité au choix des conditions initiales.Ainsi, si pour différents algorithmes, on obtient des estimations relativement proches, celatend à prouver que ces estimations correspondent au maximum global de la fonction delog-vraisemblance. Si, en revanche, on obtient des estimations sensiblement différentespour différents algorithmes ayant convergés, cela tend à montrer que certains de ces algo-rithmes, pour les conditions initiales posées, ne permettent pas d’identifier le maximumglobal de la vraisemblance. La question qui se pose est alors de savoir quel algorithmedoit être privilégié en fonction du problème posé ?

3. La troisième solution proposée par Olsen (1978) consiste à reparamétriser la fonctionde vraisemblance de sorte à garantir sa concavité globale. Dès lors, on supprime le prob-lème de la sensibilité des solutions des algorithmes au choix des conditions initiales surles paramètres puisqu’il n’existe qu’un seul extremum global pour la fonction de log-vraisemblance. Le choix des conditions initiales et de l’algorithme n’affecte alors que la

4 Sous Eviexs, cliquez pour cela sur l’onglet options dans la fenêtre d’estimation.

Page 20: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 20

vitesse de convergence des procédure d’optimisation, et ne doit pas théoriquement affecterles résultats.

La solution d’Olsen (1978) est ainsi particulièrement habile puisqu’elle supprime le problèmeen reformulant la log-vraisemblance du modèle Tobit en des paramètres transformés θ = β/σεet h = σ−1ε de sorte à obtenir une nouvelle expression de la log-vraisemblance re-paramétréeglobalement concave.

Proposition 1.9 (Olsen 1978). La log-vraisemblance d’un modèle Tobit re-paramétréeen θ = β/σε et h = σ−1ε est globalement concave :

logL (y, θ, h) =i: yi=0

log [1− Φ (xiθ)] +N1 log (h)− 12i: yi>0

(hyi − xiθ)2 (1.36)

où N1 désigne le nombre d’observations pour lesquelles yi > 0.

Preuve : la matrice hessienne associée à la log-vraisemblance logL (y, θ, h) s’écrit sous laforme suivante :

H (θ, h)(K+1,K+1)

=∂2 log L(y,θ,h)

∂θ∂θ∂2 log L(y,θ,h)

∂θ∂h∂2 log L(y,θ,h)

∂h∂θ∂2 log L(y,θ,h)

∂h2

(1.37)

Olsen (1978) démontre alors que la matrice hessienne H (θ, h) est égale à la somme de deuxmatrices telles que :

H (θ, h) = ∆+ Γ =Ψ (θ, h) 00 −N1

h2+

− i: yi>0xixi i: yi>0

xiyi

i: yi>0yixi i: yi>0

y2i

où le bloc Ψ (θ, h) de dimension (K,K) est défini par ::

Ψ (θ, h) =i: yi=0

φ (xiθ)

1− Φ (xiθ) xiθ − φ (xiθ)

1− Φ (xiθ) xixi

avec xiθ−φ (xiθ) [1− Φ (xiθ)]−1 < 0. En effet, on sait que la quantité φ (z)+zΦ (z) correspondà la primitive de la fonction Φ (z) :

φ (z) + zΦ (z) =z

−∞Φ (t) dt > z ∀z ∈ R

On en déduit que ∀z ∈ R :

φ (z) > z [1− Φ (z)]⇐⇒ z − φ (z) [1− Φ (z)]−1 < 0

Dès lors, puisque xixi est une matrice définie positive, les deux matrices ∆ et Γ sont des ma-trices définies négatives (cf annexe A.1) : dès lors, la matrice hessienne est égale à la somme dedeux matrices définies négatives, elle est donc définie négative. La fonction de log-vraisemblanceest donc globalement concave.

Lorsque la log-vraisemblance est paramétrée en h et θ, le gradient s’écrit sous la formesuivante :

Page 21: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 21

Definition 1.10. Le gradient associé à la log-vraisemblance d’un modèle Tobit re-paramétrée en θ = β/σε et h = σ−1ε est :

∂ logL (y, θ, h)

∂θ=

i: yi=0

φ (xiθ)

1− Φ (xiθ)xi −1

2i: yi>0

(hyi − xiθ)xi (1.38)

∂ logL (y, θ, h)

∂h=N1h− 12i: yi>0

(hyi − xiθ) yi (1.39)

Compte tenu du résultat d’Olsen, il est possible en utilisant des algorithmes d’optimisationusuels de déterminer les estimateurs du maximum de vraisemblance des paramètres transformésθ et h. Ces estimateurs sont solutions du programme suivant :

θ h =maxθ,h

logL (y, θ, h)

et vérifient naturellement les conditions nécessaires suivantes :

∂ logL (y, θ, h)

∂θ θ=θ

=∂ logL (y, θ, h)

∂h h=h

= 0

On en déduit alors les estimateurs des paramètres du modèles Tobit originel puisque l’on aθ = β/σε et h = σ−1ε :

σε = h β = θ σε (1.40)

La matrice de variance covariance asymptotique des estimateurs σε et β se déduit alors de

celle de θ et β, qui s’exprime en fonction de la matrice hessienne H θ, h selon les formules

usuelles.

1.4. Application

Considérons tout d’abord une application sur données simulées qui nous permettra par la suited’évaluer la portée des biais. On simule un échantillon de 1000 points satisfaisant les propriétéssuivantes :

yi =y∗i0

si y∗i = α+ βxi + εi > 0sinon

∀i = 1, ..N

avec xi ∈ R, ∀i = 1, ..,N, pour une taille d’échantillon N = 1000 et où les perturbations εi sontdistribués selon une loi N 0,σ2ε . On pose la valeur suivante des paramètres :

α = 1 β = 0.8 σ2ε = 1

On suppose ici que la variable explicative xi satisfait l’hypothèse de Goldberger (1981): la variable explicative xi est distribuée selon une loi normale N (0,Ω) , avec Ω = 1, et estindépendante du résidu, cov (εixi) = 0. Le programme permettant de simuler la série observableyi est fourni en annexe (A.2). Commençons par estimer les paramètres α,β et σ2ε par uneméthode de maximisation de la vraisemblance standard. Les résultats sont représentés dans lafigure (1.2) :Eviews indique tout d’abord que l’échantillon simulé comporte 781 observations pour lesquelles

yi > 0 et 219 observations censurées à gauche, c’est à dire pour lesquels yi = 0. On vérifie toutd’abord que l’algorithme d’optimisation numérique de la maximisation de la vraisemblance aconvergé après 5 itérations.. Compte tenu de la taille d’échantillon N relativement importante,

Page 22: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 22

Figure 1.2: Estimation Modèle Tobit Simple par Maximum de Vraisemblance

les réalisations des estimateurs α = 0.965 et β = 0.793 sont très proches des vraies valeurs α = 1et β = 0.8. Eviews fournit en outre un estimation de la variance résiduelle, comme tenu de ladistribution choisie (en l’occurrence une loi normale dans le cas d’un modèle Tobit simple) : laréalisation de l’estimateur σ2ε est alors égale à 0.97, valeur relativement proche de la vraie valeurde la variance σ2ε = 1. Les z statistiques correspondant aux tests de nullité des paramètres nouspermettent de rejeter l’hypothèse nulle au seuil de 5% pour les trois paramètres α,β et σ2ε.

Comparons la réalisation de ces estimateurs du maximum de vraisemblance à celles obtenuespar les estimateurs desMCO appliqués à l’échantillon complet, notés αLS , βLS et σ

2ε,LS reportés

sur la figure (1.3).On vérifie que l’estimation par les MCO sur les 1000 points des paramètres α et β donne

des résultats largement moins bons que ceux obtenus par maximum de vraisemblance, puisquenous avons vu précédemment que ces estimateurs sont biaisés. En effet pour une vraie valeurβ = 0.8, la réalisation de l’estimateur des MCO est, dans notre expérience, de 0.6253.

Nous avions vu que sous l’hypothèse de normalité des variables xi (hypothèse de Goldberger1981), l’estimateur des MCO du paramètre β vérifie :

βLSp−→

N→∞β ×Φ α

σy(1.41)

Dans le cas de notre expérience, sachant que α = 1 et que :

σ2y = σ2ε + β Ωβ = σ2ε + β2Ω = 1 + 0.82 × 1 = 1. 64

Page 23: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 23

Figure 1.3: Estimation par les MCO sur l’échantillon complet

on en déduit que

βLSp−→

N→∞0.8×Φ 1√

1.64= 0.8×Φ (0. 78087) = 0.6260

Ainsi, on sait que théoriquement l’estimateur βLS converge en probabilité vers la valeur0.6260. On vérifie en effet sur la figure (1.3), pour une taille d’échantillonN = 1000 relativementimportante, que la réalisation de βLS = 0.6253 est très proche de cette valeur asymptotique.

Nous avions vu en outre, toujours sous l’hypothèse de normalité des variables explicativesxi, que l’estimateur des MCO corrigé β

c

LS = (N/N1)× βLS est convergent :

βc

LS =N

N1× βLS

p−→N→∞

β

Dans le cas de notre simulation, la réalisation de cette estimateur vaut :

βc

LS =N

N1× βLS =

1000

781× 0.6253 = . 80064

Cette réalisation est en effet très proche de la vraie valeur β = 0.8. On remarque que pournotre échantillon simulé, la réalisation de l’estimateur des MCO corrigé est plus proche de lavraie valeur que l’estimateur du MV.

************************** 1) Faire estimation MCO sur partie positive de la distribution**** 2) Introduire N simulations sur βLS , β

c

LS , βy>0, βMV et βHec en contrôlant le pour-centage de données censurées : Matlab**** 3) Répartir les applications Eviews ou Limdep sur les différentes sections ?**********************

1.5. Effets marginaux

Supposons que l’on dispose d’un estimateur convergent β des paramètres β et d’un estimateurconvergent σ2ε de la variance des résidus. On cherche à mesurer les effets marginaux.

Page 24: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 24

Definition 1.11. Les effets marginaux dans un modèle de régression censuré corre-spondent à la déformation des prévisions sur une variable continue engendrée parune variation d’une unité d’une des variables explicatives.

Il y alors plusieurs prévisions possible dans le cas du modèle Tobit suivant que l’on s’intéresseà la variable censurée yi ou à la variable latente y∗i . En effet, trois cas peuvent apparaître :

1. Soit l’on considère la prévision sur la variable latente représentée par l’espérance con-ditionnelle ∀i = 1, .., N :

E (y∗i /xi) = xiβ (1.42)

2. Soit l’on considère la prévision sur la variable dépendante représentée par l’espéranceconditionnelle ∀i = 1, .., N :

E (yi/xi) = Φxiβ

σεxiβ + σεφ

xiβ

σε(1.43)

3. Soit l’on considère la prévision sur la variable dépendante censurée représentée parl’espérance conditionnelle ∀i = 1, .., N :

E (yi/xi, yi > 0) = E (y∗i /xi, , y

∗i > 0) = xiβ + σελ

xiβ

σε(1.44)

On peut ainsi déterminer différents effets marginaux suivant que l’on considère l’une oul’autre de ces prévisions. Tout d’abord si l’on considère la prévision sur la variable latente,on obtient tout simplement un effet marginal mesuré par la dérivé partielle de l’espéranceconditionnelle E (y∗i /xi) par rapport à une composante quelconque du vecteur des variablesexplicatives xi.

Definition 1.12. L’effet marginal d’une variation unitaire de la keme variable ex-plicative x(k)i , ∀k = 1, ..,K, sur la prévision de la variable latente y∗i est mesuré parla quantité :

∂E (y∗i /xi)

∂x(k)i

= β(k) ∀i = 1, .., N (1.45)

ou par l’élasticité εy∗i /x

[k]i:

εy∗i /x

[k]i=

∂E (y∗i /xi)

∂x(k)i

x(k)i

E (y∗i /xi)=x(k)i β(k)

xiβ∀i = 1, .., N (1.46)

Ainsi, une variation de 1% de la keme variable explicative x(k)i pour le ieme individu, modifiela prévision de la variable latente y∗i pour ce même individu de εy∗i /x[k]i

pour cent. On peutalors calculer une élasticité moyenne ε

y∗i /x[k]isur l’ensemble des N individus telle que :

εy∗i /x

[k]i=1

N

N

i=1

εy∗i /x

[k]i=1

N

N

i=1

x(k)i β(k)

xiβ

Considérons à présent la prévision sur la variable dépendante non censurée. De la mêmefaçon, l’effet marginal est mesuré par la dérivé partielle de l’espérance conditionnelle E (yi/xi)par rapport à une composante quelconque du vecteur des variables explicatives xi.

Page 25: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 25

Definition 1.13. L’effet marginal d’une variation unitaire de la keme variable ex-plicative x(k)i , ∀k = 1, ..,K, sur la prévision de la variable dépendante yi est mesurépar la quantité :

∂E (yi/xi)

∂x(k)i

= Φxiβ

σεβ(k) ∀i = 1, ..,N (1.47)

ou par l’élasticité εyi/x

[k]i:

εyi/x

[k]i=

∂E (yi/xi)

∂x(k)i

x(k)i

E (yi/xi)=

x(k)i β(k)

xiβ + σελxiβσε

∀i = 1, .., N (1.48)

Preuve : A partir de l’espérance conditionnelle E (yi/xi) déterminons l’effet marginal as-socié à x(k)i .

∂E (yi/xi)

∂x(k)i

=∂

∂x(k)i

Φxiβ

σεxiβ + σεφ

xiβ

σε

=∂Φ xiβ

σε

∂x(k)i

β(k)

σεxiβ +Φ

xiβ

σεβ(k) + σε

∂φ xiβσε

∂x(k)i

β(k)

σε

= β(k)

∂Φ xiβσε

∂x(k)i

xiβ

σε+Φ

xiβ

σε+

∂φ xiβσε

∂x(k)i

Si l’on pose z = xiβ/σε, on obtient :

∂E (yi/xi)

∂x(k)i

= β(k)∂Φ (z)

∂x(k)i

z +∂φ (z)

∂x(k)i

+Φ (z)

Or, on sait que la quantité φ (z) + zΦ (z) correspond à la primitive de la fonction Φ (z) :

φ (z) + zΦ (z) =z

−∞Φ (t) dt ∀z ∈ R

Dès lors, par dérivation par rapport à une composante z(k) on obtient :

∂φ (z)

∂z(k)+

∂ [zΦ (z)]

∂z(k)= Φ (z)

⇐⇒ ∂φ (z)

∂z(k)+

∂z

∂z(k)Φ (z) + z

∂Φ (z)

∂z(k)=

∂z

∂z(k)Φ (z)

⇐⇒ ∂φ (z)

∂z(k)+ z

∂Φ (z)

∂z(k)= 0

Ainsi, on obtient finalement que :

∂E (yi/xi)

∂x(k)i

= β(k)Φ (z) = β(k)Φxiβ

σε

En ce qui concerne l’élasticité εyi/x

[k]ion montre que celle-ci est définie par la quantité

suivante :

εyi/x

[k]i

= Φxiβ

σεβ(k)

x(k)i

Φ xiβσε

xiβ + σεφxiβσε

=1

xiβ + σελxiβσε

x(k)i β(k)

Page 26: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 26

Ainsi, une variation de 1% de la keme variable explicative x(k)i pour le ieme individu, modifiela prévision de la variable dépendante yi pour ce même individu de εyi/x[k]i

pour cent. On peutalors calculer une élasticité moyenne ε

yi/x[k]isur l’ensemble des N individus telle que :

εyi/x

[k]i=1

N

N

i=1

εyi/x

[k]i=1

N

N

i=1

x(k)i β(k)

xiβ + σελxiβσε

De façon générale, on montre que ε

y∗i /x[k]i> ε

yi/x[k]i.

McDonald et Moffit (1980) ont proposé une décomposition particulièrement intéressante del’effet marginal associé à la prévision sur la variable dépendante yi. Cette décomposition est lasuivante :

∂E (yi/xi)

∂x(k)i

= Φxiβ

σεβ(k) 1− λi

xiβ

σε

xiβ

σε+ λi

xiβ

σε

+β(k)φxiβ

σε

xiβ

σε+ λi

xiβ

σε

Dès lors, l’effet marginal d’une variation unitaire de la keme variable explicative x(k)i , ∀k =1, ..,K, sur la prévision de la variable dépendante yi peut se décomposer comme la somme dedeux éléments :

Remark 3. La variation de x(k)i a deux effets sur la prévision de la variable dépen-dante yi représentés par la décomposition de McDonald et Moffit (1980):

∂E (yi/xi)

∂x(k)i

= Prob (yi > 0)∂E (yi/xi, yi>0)

∂x(k)i

+E (yi/xi, yi>0)∂Prob (yi > 0)

∂x(k)i

1. D’une part, la variation de x(k)i modifie l’espérance conditionnelle de yi dansla partie positive de la distribution.

2. D’autre part, la variation de x(k)i affecte la probabilité que l’observation yiappartienne à cette partie de la distribution.

Au passage, cette décomposition nous donne la 3eme mesure de l’effet marginal : cellerelative à la prévision de la variable dépendante sur la partie positive de la distribution :

∂E (yi/xi, yi>0)

∂x(k)i

= β(k) 1− λixiβ

σε

xiβ

σε+ λi

xiβ

σε

où λ (x) = φ (x) /Φ (x) désigne le ratio de Mill.

*************Application : construire les différentes EM et commentez (exemple éco)Utiliser la simulation ou Utiliser exemple Eco :

1. calculer EM1 et élasticité sur y∗

2. calculer EM2 et élasticité sur y

3. Décomposer EM2 par McDonald et Moffit

*************

Page 27: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 27

1.6. Propriétés de l’estimateur du MV sous des hypothèses non standard

Nous allons à présent nous intéresser aux propriétés de l’estimateur du MV sous principaleshypothèses en présentant chaque fois les tests appropriés :

1. Hypothèse d’hétéroscédasticité

2. Hypothèse de non normalité

Commençons par évoquer les problèmes d’hétéroscédasticité.

1.6.1. Hétéroscédasticité

De nombreuses études ont été consacrées au problème de l’hétéroscédasticité dans le cadre desmodèles Tobit simple. Hurd (1979) a ainsi évalué les biais asymptotiques de l’estimateur duMV d’un modèle Tobit simple tronqué en présence de différentes formes d’hétéroscédas-ticité. Rappelons que dans le cas d’un modèle Tobit simple tronqué , on ne dispose qued’observations pour les individus pour lesquels y∗i > 0. La vraisemblance s’écrit alors sous laforme :

L y,β,σ2ε =N

i=1

Φxiβ

σε

−11

σεφ

xiβ

σε(1.49)

Hurd considère une certaine forme d’hétéroscédasticité en générant deux sous échantillons: un échantillon de taille rN, avec r ∈ [0, 1] , d’observations pour lesquelles σ2ε = σ21 et unsecond échantillon de taille (1− r)N d’observations pour lesquelles σ2ε = σ22 = σ21. Il étudiealors la déformation de la limite en probabilité de l’estimateur du MV, noté plimβ, en fonctiondes valeurs de σ21 en considérant σ

22 = 1 et r = 0.5. Hurd démontre ainsi l’existence de biais

asymptotiques sur l’estimateur du MV en présence d’hétéroscédasticité et il constate que cesbiais peuvent être très importants pour certaines valeurs de σ21. Reprenant la même approche,Arabmazar et Schmidt (1981) montre que les biais asymptotiques de l’estimateurdu MV sont beaucoup moins important dans le cadre d’un modèle Tobit simplecensuré, tel que celui que l’on a vu jusqu’à présent. Les résultats de ces deux études illustrentparfaitement le sens général des résultats de cette littérature.

Proposition 1.14. De façon générale, on montre que l’estimateur duMV en présenced’hétéroscédasticité est asymptotiquement biaisé. L’importance des biais asymp-totiques croît avec le degré de censure des données.

Il est toutefois difficile d’aboutir à une conclusion plus précise que cette proposition dansla mesure où les différentes études proposées sur ce thème diffèrent très sensiblement sur lareprésentation retenue de l’hétéroscédasticité. Les modèles utilisés sont en effet très spécifique.Il faut ainsi simplement retenir que l’hétéroscédasticité pose un sérieux problème d’estimationdes modèles Tobit simples.

La question qui se pose est alors de savoir comment tester l’hétéroscédasticité ? Considéronstout d’abord une forme particulière d’hétéroscédasticité.

Hypothèses Soit un modèle Tobit hétéroscédastique tel que ∀i = 1, .., N :

σ2ε,i = σ2ε,i (α) = σ2ε exp (wiα) (1.50)

où α = (α1.. αP ) et où wi = w(1)i ...w

(P )i ∈ RP est un vecteur de caractéristiques.

Page 28: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 28

Cette spécification est suffisamment générale pour englober différentes configurations d’hétéroscé-dasticité. En particulier, lorsque α = 0, on retrouve le modèle Tobit simple homoscédastique.Sous cette hypothèse, la log-vraisemblance concentrée du modèle Tobit simple s’écrit alors :

logL y,β,σ2ε,α =i: yi=0

log 1− Φ xiβ

σε,i (α)

−N12log σ2ε,i (α) −

1

2σ2ε,i (α) i: yi>0(yi − xiβ)2

Les estimateurs duMV des paramètres du Tobit hétéroscédastique, notés β,σ2ε et α vérifientalors respectivement les conditions suivantes :

∂ logL y,β,σ2ε,α

∂γγ=γ

= 0 ∀γ = β,σ2ε,α

où les composantes du gradient de la fonction de log-vraisemblance en β et σ2ε correspondent àcelles définies pour le modèle Tobit simple (cf. proposition 1.8) lorsque α = 0, c’est à dire dansle cas homoscédastique.

∂ logL y,β,σ2ε,α

∂βα=0

= − 1σε i: yi=0

φ xiβσε

xi

1− Φ xiβσε

+ 1

σ2ε i: yi>0(yi − xiβ)xi =

N

i=1

aixi

∂ logL y,β,σ2ε,α

∂σ2εα=0

=1

2σ3ε i: yi=0

xiβ φ xiβσε

1− Φ xiβσε

− N12σ2ε

+1

2σ4ε i: yi>0(yi − xiβ)2 =

N

i=1

bi

Sous ces hypothèses, un test naturel de l’hypothèse d’hétéroscédasticité consiste donc àtester la nullité du vecteur α, puisque si α = 0, on a σ2ε,i = σ2ε ∀i = 1, .., N . Ainsi sous leshypothèses précédentes, le test de l’hypothèse nulle d’homoscédasticité revient au test bilatéralsuivant :

H0 : α = 0 (1.51)

Ha : α = 0 (1.52)

Plusieurs méthodes sont envisageable pour mener à bien ce test sur les paramètres. Greene(1997) propose d’utiliser un test du multiplicateur de Lagrange5 (cf. chapitre 1).

Definition 1.15. La statistique LM du test de l’hypothèse nulle d’homoscédasticitéH0 : α = 0 est définie par :

LM =

∂ logL y,β,σε,α

∂αα=0

Qα α

∂ logL y,β,σε,α

∂αα=0

(1.54)

5La statistique LM du multiplicateur de Lagrange associée au test unidirectionnel H0 : γ = a ∈ Rk contreH1 : γ = a admet la loi suivante sous H0 :

LM =∂ logL (y, γ)

∂γ γ=γcI−1

∂ logL (y, γ)

∂γ γ=γc

L−→N→∞

χ2 (k) (1.53)

où γet γcdésignent respectivement les estimateurs non contraint et contraint de γ.

Page 29: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 29

où β et σε désignent les estimateurs du MV des paramètres β et σ2ε obtenus sousl’hypothèse nulle α = 0, et où la matrice Qα α désigne le bloc de dimension (P,P )correspondant au vecteur de paramètre α de la matrice inverse de la matrice d’in-formation de Fischer estimée sous H0 :

I β,σ2ε,α

(K+P+1,K+P+1)

−1

α=0

=

Qββ(K,K)

Qβσ2ε(K,1)

Qβ α(K,P )

Qβ σ2ε(1,K)

Qσ2ε(1,1)

Qα σ2ε(1,P )

Qα β(P,K)

Qασ2ε(P,1)

Qαα(P,P )

(1.55)

On montre alors que sous H0 cette statistique converge en loi :

LML−→

N→∞χ2 (P ) (1.56)

où P rappelons-le désigne la dimension du vecteur de varaibles explicatives wi expliquant lavariance indivudelle σ2ε,i (α) . Ainsi, si la réalisation de la statistique LM est supérieure au frac-tile de la loi du chi-2 à P degrés de liberté, alors on rejette l’hypothèse nulle d’homoscédasticité.Les résidus du modèle Tobit sont hétéroscédastiques : les estimateurs du MV des paramètresβ et σ2ε sont asymptotiquement biaisés selon les résultats d’Arabmazar et Schmidt (1981).

Quelle que soit la nature du modèle, il existe une autre façon de construire la statistique LM.Celle-ci peut en effet s’écrire en fonction de la matrice G β,σ2ε,α de dimension (N,K + P + 1)

contenant les dérivés de la log-vraisemblance évaluées pour chaque observation sous l’hypothèseH0.Soit G β,σ2ε,α le vecteur du gradient évalué sous H0 :

G β,σ2ε,α(N,K+1+P ) α=0

=

g1 β,σ2ε,α(1,K+P+1)

...gN β,σ2ε,α(1,K+P+1)

(1.57)

où les vecteurs gi correspondent au gradient de la fonction de la log-vraisemblance évalués sousl’hypothèse nulle α = 0 et pour chaque observation individuelle yi :

gi β,σ2ε,α(1,K+P+1)

=∂ logL(yi,β,σ2ε,α)

∂βα=0

∂ logL(yi,β,σ2ε,α)∂σ2ε

α=0

∂ logL(yi,β,σ2ε,α)∂α

α=0

Greene (1997) montre que les vecteurs gi (.) s écrivent sous la forme :

gi β,σ2ε,α(1,K+P+1)

= aixi(1,K)

bi(1,1)

σ2εbiwi(1,P )

(1.58)

où les scalaires ai et bi sont définies par les composantes du gradient associé à la log-vraisemblancedu modèle Tobit simple (cf. proposition 1.8) d’une observation donnée yi, ∀i = 1, ..N .

ai = − 1σε(1− zi) λ xiβ

σε+ziσε(yi − xiβ) (1.59)

bi =1

2σ3ε(1− zi)xiβ λ xiβ

σε− zi2σ2ε

+zi2σ4ε

(yi − xiβ)2 (1.60)

Page 30: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 30

avec λ (z) = φ (z) / [1− Φ (z)] = λ (−z) et où la quantité zi correspond à la variable di-chotomique simple suivante :

zi =10

si yi > 0sinon

(1.61)

Naturellement un estimateur de ce vecteur du gradient de la log-vraisemblance sous H0 :α = 0 peut être obtenu en remplaçant dans les expressions de ai et de bi les paramètres β etσ2ε par leurs estimateurs du MV respectifs β et σ2ε obtenus sous l’hypothèse nulle α = 0.

G β,σ2ε, 0

(N,K+1+P ) α=0

=

g1 β,σ2ε, 0

(1,K+P+1)

...

gN β,σ2ε, 0

(1,K+P+1)

=

a1x1 b1 σ2εb1w1...

aNxN bN σ2εbNwN

Reste alors à construire la matrice d’information de Fischer. Greene (1997) montre que sousH0 l’inverse de la matrice d’information de Fischer peut s’écrire sous la forme :

I β,σ2ε,α−1

(K+P+1,K+P+1) α=0

= G β,σ2ε, 0(K+P+1,N)

G β,σ2ε, 0(N,K+P+1)

=N

i=1

a2ixixi aibixi σ2εaibixiwiaibixi b2i σ2εb

2iwi

σ2εaibiwixi σ2εb2iwi σ2εb

2iwiwi

(1.62)

Un estimateur de la matrice d’information de Fischer est alors donné par :

I β,σ2ε,α−1

α=0

=N

i=1

a2ixixi aibixi σ2εaibixiwiaibixi b2i σ2εb

2iwi

σ2εaibiwixi σ2εb2iwi σ2εb

2iwiwi

A partir de ces différents éléments on peut alors construire la statistique LM de la façon

suivante :

Definition 1.16. Une autre expression de la statistique LM du test de l’hypothèsenulle d’homoscédasticité H0 : α = 0 est :

LM(1,1)

= eN(1,N)

G β,σ2ε, 0

(N,K+P+1)

G β,σ2ε, 0

(K+P+1,N)

G β,σ2ε, 0

(N,K+P+1)

−1 G β,σ2ε, 0

(K+P+1,N)

eN(N,1)

(1.63)

où eN désigne un vecteur unitaire de dimension (N, 1) et où β et σε désignent lesestimateurs du MV des paramètres β et σ2ε obtenus sous l’hypothèse nulle α = 0.

On peut montrer que cette expression de la statistique LM est identique à celle proposéedans la définition (1.15). La loi asymptotique et la règle de décision sont évidemment les mêmesque celles évoquées précédemment.

Il existe enfin une troisième façon d’obtenir la statistique LM :

Page 31: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 31

Definition 1.17. Une autre expression de la statistique LM du test de l’hypothèsenulle d’homoscédasticité H0 : α = 0 est :

LM = N R2 (1.64)

où N désigne le nombre d’oibservations et où R2 est le coefficient de déterminationde la régression du vecteur unitaire eN = (1, ...1) de dimension (N, 1) sur les K+P+1colonnes de la matrice G β,σ2ε, 0 .

En effet, une fois que l’on a construit la matrice G β,σ2ε, 0 , on peut montrer que le

coefficient de détermination de la régression de eN sur les colonnes G1, G2, .., GK+P+1 de cettematrice fournit au coefficient N près la valeur de la statistique LM. Si l’on pose y = eN etX = G (.) , on sait que le coefficient de la régression linéaire de y sur les colonnes de X estdonné par la formule :

R2 =1

Ny X (X X)

−1X y

où N désigne le nombre d’observation. On reconnaît ici la forme de la statistique LM auscalaire N près.

***** ****************************************************1) Simulation : simuler biais à distance finie avec Hétéro à la Hurd.2) Application : Construire un test sous LIMDEP et application***** ****************************************************

1.6.2. Non normalité

La seconde principale hypothèse qui peut affecter de façon sensible les propriétés de l’estimateurdu MV est l’hypothèse de non normalité des perturbations. Alors quelles sont le propriétésde l’estimateur du MV sous cette hypothèse de non normalité ? Nous admettrons le résultatsuivant :

Proposition 1.18. De façon générale, on montre que l’estimateur du MV n’est pasconvergent lorsque la vraie distribution des perturbations εi n’est pas normale.

Goldberger (1980) a en effet démontré dans le cas d’un modèle Tobit simple tronqué, l’ex-istence de biais asymptotique de l’estimateur du MV lorsque la vraie distribution des εi estune loi de Student, de Laplace ou une loi logistique. Pour démontrer ce résultat, Goldbergersupposait que la variance des perturbations était toutefois connue. Arabmazar et Schmidt(1982) ont quant à eux montré que les biais étaient particulièrement accrus lorsque l’on levaitcette hypothèse et que l’on supposait la variance des perturbations étaient inconnues. Intu-itivement on conçoit qu’une erreur sur la distribution des perturbations et donc sur la formede vraisemblance, peut conduire à l’apparition d’un biais dans les estimateurs du MV.********************************************************************Effectuer Simulation Tobit Simple avec loi Student, de Laplace ou loi logistiqueEstimation MV fonction de la censure et de N********************************************************************

Page 32: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 32

Partant du résultat que l’application de la procédure du MV à des perturbations de loi nonnormale conduit à un biais asymptotique, il convient donc de proposer un test permettant derepérer les cas où les perturbations du modèle sont distribuées selon une loi non normale. Deuxprincipales stratégie de test sont proposés pour détecter la non normalité des perturbationsdans un modèle censuré ou tronqué :

1. Une stratégie de test à la Hausman (1978) : Nelson (1981), Melenberg et Van Soest(1996)

2. Un test de spécification à la Hansen (1982) : Pagan et Vella (1989)

Nous n’évoquerons ici que le premier type de test. Pour les tests de spécification reposantsur les conditions sur les moments voir Pagan et Vella (1989). Considérons la démarcheretenue par Melenberg et Van Soest (1996) fondée sur un test d’Hausman (1978)avec esstiamteur LAD de Powell (1984).

Commençons par définir de façon général le principe d’un test de Hausman (1978). Cetest admet pour hypothèse nulle la normalité des résidus εi. Soit β l’estimateur du MV duvecteur des paramètres β. On sait que cet estimateur est (i) convergent, (ii) asymptotiquementefficace et (iii) asymptotiquement biaisé sous l’hypothèse alternative H1 de non normalité desperturbations.. Considérons un second estimateur, noté β, du vecteur des paramètres β. Onchoisit cet estimateur de sorte à ce qu’il soit (i) moins efficace que l’estimateur du MV sousH0 mais (ii) qu’il soit convergent sous H0 et sous l’hypothèse alternative H1. Il ne reste plusalors qu’à étudier la ”distance” entre les deux estimateurs β et β. En effet :

• Si les deux estimateurs sont ”proches” : cela signifie que les deux estimateurs sont nonbiaisés : l’hypothèse H0 est acceptée

• Si les deux estimateurs sont suffisamment ”éloignés” : cela signifie que l’estimateur γ estbiaisé : l’hypothèse H0 est rejetée.

Reste alors à construire une mesure de la ”distance” entre les deux estimateurs. Hausmandans son article de 1978 montre que de façon générale, sous ces hypothèses, la quantité définieconverge une loi du Chi deux admettant pour degré de liberté le nombre de paramètre estiméssous l’hypothèse H0 .

HN = β − β V −1 β − βL−→

N→∞χ2 (K) (1.65)

où V = V β − V β désigne la différence entre les matrices de variance covariances asymp-totiques des deux estimateurs obtenues sous H0. Ce qui est remarquable c’est que sous H0, iln’est pas nécessaire de connaître les termes de covariances des deux estimateurs pour construirela statistique de test.

Proposition 1.19. Soit β l’estimateur du MV du vecteur des paramètres β. Soit βun estimateur convergent sous l’hypothèse de non des perturbations εi. Un test del’hypothèse nulle de normalité peut être réalisé à partir de la statistique du testde Hausman (1978) :

HN = β − β V β − V β−1

β − β (1.66)

Page 33: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 33

où V β et V β désignent les matrices de variance covariances asymptotiques desestimateurs sous H0. Sous l’hypothèse nulle de normalité :

HNL−→

N→∞χ2 (K) (1.67)

Ainsi, si la réalisation de la statistique HN est supérieur au fractile à α% de la loi du Chi-deux, la distance entre les deux estimateurs est grande : on rejette l’hypothèse nulle H0 denormalité. L’estimateur du MV est alors asymptotiquement biaisé.

Pour construire ce test, reste à définir un estimateur convergent du vecteur de paramètresβ sous l’hypothèse de non normalité. Il y a là aussi deux optiques :

1. Soit on spécifie la distribution non normale des perturbations et l’on construit un es-timateur du maximum de vraisemblance : Amemiya et Boskin (1974) utilisent ainsi unestimateur du MV avec une distribution log-normale

2. Soit on construit un estimateur convergent pour des formes très générales de distributionsdes perturbations à la fois normale et non normale : Powell (1984), Melenberg et VanSoest (1996).

La première approche est à la fois risquée et relativement compliquée à mettre en oeuvre.Elle peut apparaître compliquée dans la mesure où pour certaines formes de distributions, ilpeut être délicat de construire la fonction de vraisemblance. De plus, rien ne garantit alors laconcavité globale de cette fonction, ce qui peut poser des problèmes d’optimisation numérique.Mais elle de plus risquée dans la mesure où l’on rejette a priori la distribution normale pourspécifier une forme alternative de distribution : log-normale, Student, Laplace etc.. Or, rienne garantit que les perturbations soient effectivement engendrées par cette distribution. Uneerreur sur la forme de la distribution peut alors conduire à une évaluation biaisée des paramètres.C’est pourquoi, dans la littérature on privilégie généralement la seconde approche : l’approchenon paramétrique ou semi-paramétrique. Melenberg et Van Soest (1996) proposent d’utiliserl’estiamteur LAD.

L’estimateur de Powell (1984) ou estimateur des Moindres Valeurs Absolues (LAD LeastAbsolute Deviations) est un exemple d’estimateur non paramétrique convergent sous l’hypothèsede non normalité.

Definition 1.20. L’estimateur des Moindres Valeurs Absolues (LAD Least AbsoluteDeviations) de Powell (1984) des paramètres β du modèle Tobit simple est définipar :

βP =argminβ

N

i=1

yi −max (0, xiβ) (1.68)

Powell montre que cet estimateur est asymptotiquement normal :√N βP − β

L−→N→∞

N 0, V βP (1.69)

où la matrice de variance covariance asymptotique est donnée par :

V βP(K,K)

= 4f (0)2limN→∞

1

Ni:xiβ>0

xixi (1.70)

Page 34: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 34

où f (.) désigne la fonction de densité des perturbations.

Paarsch (1984) a proposé différentes simulations de Monte Carlo de cet estimateur, del’estimateur en deux étapes d’Heckman et de l’estimateur du MV obtenu sous l’hypothèse denormalité pour des modèles Tobit avec des distributions normal, exponentielle et de Cauchy.Sur de larges échantillons, l’estimateur de Powell est toujours meilleur (au sens du biais moyen)que l’estimateur d’Heckman et est meilleur que l’estimateur du MV dans le cas de distributionde Cauchy. Powell (1984) note en outre que l’estimateur βP est convergent y compris sousl’hypothèse d’hétéroscédasticité.

Ainsi, en utilisant la définition précédente du test d’Hausman et la définition de l’estimateurLAD on peut construire aisément un test particulier de l’hypothèse de non normalité fondé surl’estimateur de Powell. Si l’on note β l’estimateur duMV obtenu sous l’hypothèse de normalitéet βP l’estimateur de Powell, la statistique du test d’Hausman devient :

HN = β − βP V β − V βP−1

β − βP (1.71)

où V β et V βP désignent les matrices de variance covariances asymptotiques des estima-teurs sous H0 :

V βP = 4f (0)2 limN→∞

1

Ni:xiβ>0

xixi (1.72)

V β = I (β)−1 (1.73)

avec

I (β) = −E ∂2 log L (β,β)

∂β∂β(1.74)

Naturellement si le test conduit à rejeter l’hypothèse nulle de normalité, il convient deprivilégier un estimateur convergent sous l’hypothèse de non normalité : l’estimateur LAD dePowell en est un, mais il existe de nombreux autres estimateur non paramétriques applicablesdans ce cas.

******* ***************************Application Eviews ou Limdep ou Matlab******* ***************************

Page 35: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 35

1.7. Extensions du modèle Tobit Simple : modèles à censure multiples

Différentes extensions du modèle Tobit simple ont été proposées sans pour autant remettre encause sa structure générale : une variable dépendante correspondant à une variable latenteobservée sur un certain intervalle. Ces extensions portent finalement sur la définition de l’in-tervalle sur lequel est observé la variable latente y∗i . En effet dans certaines applications, lavariable dépendante peut être censurée à la fois à droite et à gauche. C’est par exemple le cassur un marché de cotation où il existerait une limite inférieure et supérieure aux cours, auxquelscas la valeur du cours est fixée soit à un cours plancher soit à un cours plafond. On parle alorsde modèle Tobit à censures multiples. Lorsque les seuils de censure sont identiques à tousles individus, on parle alors de modèle Tobit à double censures. Naturellement le modèleà double censure est un cas particulier du modèle à censures multiples, c’est pourquoi nousdébuterons notre analyse par ce dernier.

1.7.1. Modèle Tobit simple à censures multiples

Le modèle Tobit simple à censures multiples s’écrit sous la forme suivante :

Definition 1.21. Un modèle Tobit simple à censures multiples est défini par :

yi =

ci,1y∗ici,2

si y∗i ≤ ci,1si ci,1 < y∗i ≤ ci,2si y∗i ≥ ci,2

(1.75)

où (ci,1, ci,2) ∈ R2 désigne les bornes de censure et où :y∗i = xiβ + εi ∀i = 1, ..N (1.76)

où xi = x1i ..xKi , ∀i = 1, .., N désigne un vecteur de caractéristiques observables et où

β = (β1...βK) ∈ RK est un vecteur de paramètres inconnus et où les perturbationsεi sont distribués selon une loi N 0,σ2ε .

Considérons un échantillon de N observations yi, noté y = (y1, .., yN ) . La la fonction devraisemblance d’un modèle à censures multiples s’écrit sous la forme :

L y,β,σ2ε, c1,1, c1,2, ..., cN,1, cN,2

=i: yi=ci,1

Φci,1 − xiβ

σε i: yi=ci,2

1− Φ ci,2 − xiβσε

i: yi=y∗i

1

σεφ

yi − xiβσε

(1.77)

Le premier terme désigne le produit des probabilités que les observations yi prennent lesvaleurs de censures inférieures ci,1 :

Prob (yi = ci,1) = Prob (y∗i ≤ ci,1) = Φ

ci,1 − xiβσε

Le second terme désigne le produit des probabilités que les observations yi prennent lesvaleurs de censures supérieures ci,2 :

Prob (yi = ci,2) = Prob (y∗i ≥ ci,2) = Φ

ci,2 − xiβσε

Page 36: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 36

Enfin, le troisième terme représente tout simplement le produit des lois marginales desvariables yi lorsque ces dernières appartiennent à l’intervalle compris entre les deux bornesde censure. On sait que si ci,1 < y∗i ≤ ci,2, on a part définition yi = y∗i = xiβ + εi où lesperturbations εi sont distribués selon une loi N 0,σ2ε . On en déduit que les variables yi sontalors distribuées selon une loi normale N xiβ,σ

2ε . Ainsi, la loi marginale d’une observation yi

sur cet intervalle est définie par la quantité :

1

σε√2πexp −1

2

yi−xiβσε

2

=1

σεφ

yi − xiβσε

où φ (.) désigne la fonction de densité associée à loi normale centrée réduite. On peut en déduirela log-vraisemblance dans un modèle à censures multiples :

Definition 1.22. La log-vraisemblance concentrée associée à un échantillon y =

(y1, .., yN ) dans un modèle Tobit simple à censures multiples s’écrit :

logL y,β,σ2ε, c1,1, c1,2, ..., cN,1, cN,2

=i: yi=ci,1

log Φci,1 − xiβ

σε+i: yi=ci,2

log 1− Φ ci,2 − xiβσε

−N12log σ2ε −

1

2σ2ε i: yi=y∗i

(yi − xiβ)2 (1.78)

où N1 désigne le nombre d’observations pour lesquelles yi = y∗i .

Il est souvent utile dans ces modèles de déterminer les espérances conditionnelles de lavariable dépendante limitée et de la variable non censurée, notamment pour calculer les effetsmarginaux. On pose ∀i = 1, ..N :

Φ1,i = Φci,1 − xiβ

σεΦ2,i = Φ

c2,1 − xiβσε

Dès lors, on montre (Alban 2000) que l’espérance de la variable dépendante limitée est :

E (yi/xi, ci,1 < y∗i ≤ ci,2) = xiβ + σε

φ1,i − φ2,iΦ2,i − Φ1,i (1.79)

En effet dans le cas du modèle Tobit simple on a uniquement une censure à gauche, ce quise traduit par des seuils de censure égaux à c1,i = 0 et c2,i = +∞. On obtient alors :

φ1,i = φ−xiβσε

φ2,i = limc2,i→∞

φc2,1 − xiβ

σε= 0

Φ1,i = Φ−xiβσε

Φ2,i = limc2,i→∞

Φc2,1 − xiβ

σε= 1

Ainsi, on montre que l’espérance conditionnelle se ramène à l’expression suivante dans lecas du modèle Tobit simple :

E (yi/xi, ci,1 < y∗i ≤ ci,2) = xiβ + σε

φ1,i1− Φ1,i

= xiβ + σεφ (xiβ/σε)

Φ (xiβ/σε)

= xiβ + σελ−xiβσε

Page 37: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 37

On retouve ainsi l’expression standard d’une espérance conditionnelle d’une loi normalecensurée.

Revenons au cas général, c’est à dire au cas du modèle Tobit à censurs multiples. L’espérancede la variable dépendante non censurée est alors :

E (yi/xi) = Prob (yi = ci,1)× ci,1 + Prob (yi = ci,2)× ci,2+Prob (ci,1 < y

∗i ≤ ci,2)×E (yi/xi, ci,1 < y∗i ≤ ci,2)

On obtient alors la formule suivante :

E (yi/xi) = Φ1,i ci,1 + (1− Φ2,i) ci,2 + xiβ (Φ2,i − Φ1,i)+σε φ1,i − φ2,i (1.80)

1.7.2. Modèle Tobit simple à double censure : Rosett et Nelson (1975)

Comme nous l’avons dit précédemment le modèle Tobit simple à double censure est un casparticulier du modèle Tobit simple à censures multiples. C’est un modèle dans lequel on supposeque les seuils de censure à droite et gauche sont identiques pour tous les individus.

ci,1 = c1 ci,2 = c2 ∀i = 1, ..N (1.81)

Definition 1.23. Un modèle Tobit simple à double censure (modèle de friction ou deRosett) est un modèle où les seuils de censures à gauche et à droite sont identiquespour tous les individus.

yi =

c1y∗ic2

si y∗i ≤ c1si c1 < y∗i ≤ c2si y∗i ≥ c2

(1.82)

où (c1, c2) ∈ R2.Ce modèle est aussi parfois appelé modèle de Rosett ou modèle de friction du fait de

l’application proposée par cet auteur. C’est en effet Rosett et Nelson (1975) qui ont proposé lapremière modélisation Tobit simple à double censure. La log-vraisemblance concentrée associéeà un échantillon y = (y1, .., yN ) dans un modèle Tobit simple à double censure s’écrit :

logL y,β,σ2ε, c1, c2

=i: yi=c1

log Φc1 − xiβ

σε+i: yi=c2

log 1− Φ c2 − xiβσε

−N12log σ2ε −

1

2σ2ε i: yi=y∗i

(yi − xiβ)2 (1.83)

où N1 désigne le nombre d’observations pour lesquelles yi = y∗i .

Ce modèle est utilisé dans des applications où la variable dépendante ne répond qu’à defortes variations (ou de fortes valeurs) des variables explicatives. Nous allons à présent évoquerdeux exemples de modèle Tobit simples à double censure :

1. Modèle de distributions de dividendes : Maddala (1977)

2. Modèle d’investissement financier avec coût de transaction : Rosett (1959)

Commençons par le modèle de Maddala (1977).

Page 38: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 38

Politique de Dividendes : Maddala (1977) Maddala (1977) remarque que le modèleTobit simple à double censure ou modèle de friction est particulièrement adapté pour modéliserla politique de dividendes des entreprises, les variations des salaires offerts par les firmes ou toutautre décisions pour lesquelles les firmes répondent par saut après un certain effort cumulatif.

Considérons une société par action qui distribue des dividendes à ses actionnaires. Soit y∗tle montant désiré de dividende qui dépend d’un ensemble de caractéristiques de l’entreprise :montant des bénéfices, décisions d’autofinancement, montant des investissements etc..On poseque ces caractéristiques peuvent être représentées par un vecteur xt et qu’elles sont liées audividende potentiel par une relation du type y∗t = xtβ + εt où εt est distribué selon une loiN 0,σ2ε . Si l’on suppose que le mécanisme de distribution des dividendes est coûteux, onsuppose que l’entreprise limite leur distribution dans le temps (au plus une fois par an) maisaussi suivant leur montant :

• L’entreprise ne verse des dividendes que si le montant potentiel de ces dividendes estsupérieur à un certain seuil c1

• L’entreprise limite le montant de ces dividendes à un niveau c2 afin de maintenir unemarge de manoeuvre financière.

Dès lors, si l’on note yt le montant des dividendes effectivement versés on a :

yt =

0y∗tc2

si y∗t ≤ c1si c1 < y∗t ≤ c2si y∗t ≥ c2

Investissements financiers et coûts de transaction : Rosett (1959) Rosett (1959)avait déjà proposé une application dans laquelle apparaissait une version particulière du modèleTobit simple à double censure. Ce n’est qu’en 1975 que Rosett et Nelson donneront la formegénérale du modèle, mais c’est pourquoi le nom de modèle de Rosett ou modèle de friction estgénéralement attribué à ce modèle.

Dans son application Rosett(1959) considère un modèle d’investissement dans des actifsfinanciers où les coûts de transaction peuvent limiter le volume des transactions par rapportau niveau désiré. Le modèle suppose que les modifications dans la position de l’investisseur,c’est à dire la décision d’achat ou de vente, dépend des variations du rendement. Soit y∗t lavariation désirée de la position du titre (montant acheté ou vendu), yt la variation de la positioneffective et xt la variation du rendement du titre. L’investisseur n’effectuera une transactionque si les variations du rendement sont suffisamment importantes. La position réelle du titrene change donc pas pour de petites variations à la hausse ou à la baisse du rendement et doncde la position désirée. Supposons que la position désirée soit liée à la variation du rendementpar la relation y∗t = xtβ + εt où εt est distribué selon une loi N 0,σ2ε . Le modèle est alorsdéfini par :

yt =

y∗t − c10y∗t − c2

si y∗t ≤ c1si c1 < y∗t ≤ c2si y∗t ≥ c2

où c1 est le niveau de baisse de la position désiré déclenchant la vente et c2 > 0 le niveaudéclenchant l’achat.

Page 39: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 39

1.7.3. Application modèle à double censure

***************************Application Eviews ou Limdep***************************

Page 40: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 40

2. Les Modèles Tobit Généralisés

Nous allons à présent envisager des modèles Tobit incluant au moins deux variables y1 et y2.Cette classe de modèle s’appelle la classe des modèles Tobit généralisés. Comme nousl’avons dit en introduction, Amemiya (1983) propose de classer les différents modèle Tobitgénéralisés en 5 principales classes. Le modèle Tobit simple étant par convention défini commele modèle Tobit de type I. L’auteur propose la classification suivante en fonction de la forme dela vraisemeblance et des propriétés des variables introduites dans le modèle :

Tableau 2.1: Fonctions de Vraisemblance des Modèles Tobit Généralisés

Modèle Forme de la Vraisemblance y1 y2 y3Tobit Type I P (y1 < 0)× P (y1) C – –Tobit Type II P (y1 < 0)× P (y1 > 0, y2) D C –Tobit Type III P (y1 < 0)× P (y1, y2) C CTobit Type IV P (y1 < 0, y3)× P (y1, y2) C C CTobit Type V P (y1 < 0, y3)× P (y1 > 0, y2) D C C

S o u r c e : A m em iya ( 1 9 8 3 ) , Ta b le s 1 e t 2 , p a g e 3 0 , D : va r ia b le d i ch o t om iq u e , C : c e n s u r é e

Ainsi dans le cas du modèle standard, la notation P (y1 < 0)×P (y1) d’Amemiya désigne unefonction de vraisemblance de la forme yi=0

P y∗1,i ≤ 0 . yi>0f (y1,i) où f (y1,i) désigne la

densité marginale de la variable y1,i distribuée selon une loi N xiβ,σ2ε . Les notations pour les

autres modèles sont similaires, sachant que P (y1, y2) désigne la densité jointe des variables y1 ety2. L’autre façon de distinguer les différents modèles Tobit consiste à distinguer les propriétésdes variables du système en différentiant les variables dichotomiques D et les variables censuréesC. En effet dans ces modèles on a deux types de modélisation de la variable y1 :

1. Soit le signe de la variable y1 (par exemple dans le Tobit II) conditionne la modélisation (lacensure ou la troncation) d’une autre variable : on a alors une modélisation dichotomiqueD sur cette variable.

2. Soit la variable y1 joue un double rôle : son signe détermine le modèle (la censure ou latroncation) d’une autre variable mais elle est en outre elle même une variable censurée.

Nous allons dans un premier temps nous intéresser au modèle Tobit généralisé de typeII qui est très souvent utilisé et dont la structure est très similaire à celle des modèles deselection (ou modèles à troncature auxiliaire) popularisés par Heckman et Gronau. Enfin,nous étudierons plus succintement les autres modèles Tobit généralisés recencés par Amemiya(1983).

Page 41: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 41

2.1. Modèle Tobit Généralisé Type 2

Reprenons l’exemple des dépenses de consommation en biens durables. Dans le modèle Tobitsimple (ou modèle Tobit de type I), nous avons supposé que le consommateur décide simul-tanément (i) du fait qu’il va ou non consommer et (ii) du montant de revenu qu’il va affecter àcette consommation. Un modèle alternatif consisteriat à supposer un comportement séquentiel.Dans une première étape l’individu décide ou non de consommer : cette décision peut êtrereprésentée par un modèle qualititatif dichotomique basée sur un certain critère y∗1,i.

si y∗1,i > 0 l’individu i décide de consommersi y∗1,i ≤ 0 l’individu i décide de ne pas consommer

Dans une seocnde étape, s’il a décidé de consommer, l’individu décide du montant qu’il vaconsacrer à l’achat du bien. On a alors un modèle de données censurées puisque, si l’on notey2,i la consommation effective de l’agent i, celle-ci est définie par ∀i = 1, ..N :

y2,i =y∗2,i0

si y∗1,i > 0si y∗1,i ≤ 0 (2.1)

Cette formulation généralise le modèle Tobit simple dans la mesure om l’on retouvele modèle Tobit simple en posant y∗1,i, = y∗2,i. L’avantage de cette modélisation est qu’ellepermet notamment de faire apparaître la plus ou moins forte corrélation pouvant exister entreles deux décisions (i) décision de consommation (ii) décision du montant consommé. On a bienun modèle Tobit généralisé de type II puisque seul le signe de la variable y∗1,i représentépar la variable dichotomique y1,i = I y∗1,i > 0 importe (y1,i est une variable D) tandis que lavariable y2 est censurée (y2,i est une variable C).

2.1.1. Définition du Tobit généralisé de type II

Ainsi, un modèle Tobit généralisé de type II est définie de la façon suivante :

Definition 2.1. Un modèle Tobit généralisé de type II est défini par ∀i = 1, ..N :

y2,i =y∗2,i0

si y∗1,i > 0si y∗1,i ≤ 0 (2.2)

y∗1,i = x1,iβ1 + ε1,i (2.3)

y∗2,i = x2,iβ2 + ε2,i (2.4)

où xj,i = x1j,i..xKj

j,i avec j = 1, 2 désignent deux vecteurs de caractéristiques ob-

servables, où les vecteurs βj = βj,1...βj,Kj∈ RKj , j = 1, 2 sont des vecteurs

de paramètres inconnus et où les perturbations εj,i sont distribués selon une loiN 0,σ2j , j = 1, 2 avec E (ε1,iε2,i) = σ12, ∀i = 1, ..N .

Ainsi, seul le signe de la variable y∗1,i est observable et la variable y∗2,i est observable unique-

ment lorsque y∗1,i > 0. On suppose que les variables x1,i sont observables pour tous les individusde l’échantillon, tandis qu’il n’est pas nécessaire que les variables x2,i soient observables pour

Page 42: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 42

les individus pour lesquels y∗1,i ≤ 0. Par la suite, on supposera tout de même que ces caractéris-tiques sont observables pour tous les individus, ce qui confère un statut de variable censurée àla variable y2,i. Enfin, pour simplifier les notations, on introduit la variable dichotomique z1,itelle que :

z1,i =10

si y∗1,i > 0si y∗1,i ≤ 0 (2.5)

En d’autres termes, les couples de variables (z1,i, y2,i) constituent les variables dépendantesobservées du système. Il convient en outre de noter la propriété suivante :

Remark 4. Contrairement au cas du modèle Tobit simple, dans un modèle Tobit généraliséde type II, la variable dépendante y2,i peut prendre des valeurs négatives.

Une telle propriété peut dans certains problèmes économiques être génante, c’est pourquoiCragg (1971) a proposé des modèles qui assure la non-négativité de y2,i.

2.1.2. Estimation par Maximum de Vraisemblance

Naturellement, tout comme dans le cas du modèle Tobit simple, les paramètres du modèle Tobitgénéralisé peuvent être estimés par maximum de Vraisemblance (MV ). Commençons par définirla vraisemblance dans un tel modèle. D’après la forme générique donnée par Amemiya (1983),pour le modèle de type II, on a une vraisemblance de la forme P (y1 < 0) × P (y1 > 0, y2) .On pose θ = β1,β2,σ

21,σ

22,σ12 l’ensemble des paramètres du modèle. Formellement, si l’on

considère un échantillon y2 = (y2,1, .., y2,N ) et un ensemble d’observations z1 = (z1,1, .., z1,N ) ,la vraisemblance s’écrit sous la forme :

L (y2, z, θ) =i: y2,i=0

Prob y∗1,i ≤ 0i: y2,i=y∗2,i

f y2,i y∗1,i > 0 Prob y∗1,i > 0 (2.6)

où f y2,i y∗1,i > 0 désigne la densité conditionnelle de y2,i sachant y∗1,i > 0. Réécrivons laseconde partie de cette fonction. On note fy1 (.) la fonction de densité marginale associée à y

∗1,i,

il vient :

Prob y∗1,i > 0 =∞

0

fy1 (z) dz

Dès lors, on peut érécrire le second membre de la fonction de vraisemblance sous la formed’une intégrale simple définie sur la fonction de densité jointe des variables y∗1,i et y

∗2,i, notée

fy1,y2 (., .). En effet, en omettant les indices i pour simplifier les notations, il vient :

f (y2/ y∗1 > 0)Prob (y

∗1 > 0) =

0

f (y2/ z) fy1 (z) dz

=∞

0

fy1 ,y2 (y2, z) dz (2.7)

=∞

0

fy1 ,y2 (y2, y∗1) dy

∗1 (2.8)

Car en effet, on a par définition f (y2/ z) fy1 (z) = fy1 ,y2 (y2, z) . Toute l’astuce consistealors à réécrire la densité jointe fy1 ,y2 (y2, y

∗1) en fonction de la densité conditionnelle de y

∗1

par rapport à y2. En effet, on peut écrire cette quantité sous la forme suivante :

fy1 ,y2 (y2, y∗1) = f (y

∗1/ y2) fy2 (y2)

Page 43: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 43

où fy2(.) la densité marginale de la variable y∗2 . On obtient ainsi l’expression suivante :

f (y2/ y∗1 > 0)Prob (y

∗1 > 0) =

0

f (y∗1/ y2) fy2 (y2) dy∗1

= fy2 (y2)∞

0

f (y∗1/ y2) dy∗1 (2.9)

Quel est l’avantage de cette expression ? Cette expression fait apparaître la densité condi-tionnelle de y∗1 sachant que y

∗2 = y2, notée f (y

∗1/ y2) , qu’il est relativement facile de calculer.

On utilise pour cela le résultat suivant :

Proposition 2.2. Soit (y1, y2) un couple de v.a.r. distribuées selon des lois normalesrespectives N µ1,σ

21 et N µ2,σ

22 , telles que E (y1y2) = σ12, la loi conditionnelle de

y1 sachant que y2 = y2, est une loi normale d’espérance E (y1/ y2 = y2) avec

E (y1/ y2 = y2) = µ1 +σ12σ22

(y2 − µ2) (2.10)

et de variance V (y1/ y2 = y2) avec :

V (y1/ y2 = y2) = σ21 −σ212σ22

(2.11)

Ainsi, dans le cadre du modèle Tobit, la loi conditionnelle de y∗1 sachant que y∗2 = y2, est

une loi normale d’espérance E (y∗1/ y2 = y2) et de variance V (y∗1/ y2 = y2) avec

E (y∗1/ y∗2 = y2) = x1β1 +

σ12σ22

(y2 − x2β2) (2.12)

V (y∗1/ y∗2 = y2) = σ21 −

σ212σ22

(2.13)

On en déduit la relation suivante :

0

f (y∗1/ y2) dy∗1 = 1−

0

−∞f (y∗1/ y2) dy

∗1

= 1− Φ 0−E (y∗1/ y∗2 = y2)V (y∗1/ y∗2 = y2)

= ΦE (y∗1/ y

∗2 = y2)

V (y∗1/ y∗2 = y2)

On en déduit finallement que :

0

f (y∗1/ y2) dy∗1 = Φ

x1β1 + σ12/σ22 (y2 − x2β2)

σ21 − (σ212/σ22)(2.14)

où Φ (.) désigne la fonction de répartition de la loi N (0, 1) . Sachant que y∗2 suit une loiN x2β2,σ

22 , on montre alors que :

fy2 (y2)∞

0

f (y∗1/ y2) dy∗1 =

1

σ2φ

y2 − x2β2σ2

Φx1β1 + σ12/σ

22 (y2 − x2β2)

σ21 − (σ212/σ22)

Page 44: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 44

Sachant que f (y2/ y∗1 > 0)Prob (y

∗1 > 0) =

∞0f (y∗1/ y

∗2) fy2 (y

∗2) dy

∗2 , on montre donc fi-

nallement que :

f (y2/ y∗1 > 0)Prob (y

∗1 > 0) =

1

σ2φ

y2 − x2β2σ2

Φx1β1 + σ12/σ

22 (y2 − x2β2)

σ21 − (σ212/σ22)

Il est alors immédiat d’écrire la vraisemblance du modèle Tobit généralisé à partir de l’équa-tion (2.6).

Definition 2.3. La vraisemblance associée à un échantillon y2 = (y2,1, .., y2,N) et unensemble d’observations z1 = (z1,1, .., z1,N ) dans un modèle Tobit généralisé de typeII de paramètres θ = β1,β2,σ

21,σ

22,σ12 s’écrit :

L (y2, z, θ) =i:y2,i=0

1− Φ x1,iβ1σ1

(2.15)

×i:y2,i=y∗2,i

1

σ2φ

y2 − x2β2σ2

Φx1β1 + σ12/σ

22 (y2 − x2β2)

σ21 − (σ212/σ22)

On constate que cette fonction de vraisemblance ne dépend de σ1 que par l’intermédiairedu ratio β1/σ1 : il y a donc un problème d’identifiabilité. Seules sont identifiables lesfonctions de σ12, σ2, β2 et β1/σ1. On peut donc sans perte de généralité poser σ1 = 1 ce quipermet d’identifier le reste des paramètres. Dans le cas où β1 et β2 comportent des élémentsen commun, le paramètre σ1 est de nouveau identifiable.

De la même façon que pour le modèle tobit simple, la fonction de vraisemblance associéeà un modèle tobit généralisée n’est pas globalement concave. C’est pourquoi, il est souventintéressant d’utiliser la re-parmétrisation d’Olsen :

h2 =1

σ2θ1 =

β1σ1

θ2 =β2σ2

(2.16)

Si l’on note ρ la corrélation entre les deux perturbations telle que :

σ12 = ρ σ1 σ2 (2.17)

alors on montre le résultat suivant.

Proposition 2.4. Pour un niveau de corrélation ρ des chocs donnés, la log-vraisemblanced’un modèle tobit généralisé re-paramétré en h2 = σ−12 , θ1 = β1/σ1 et θ2 = β2/σ2 estglobalement concave :

logL (y2, z, h2, θ1, θ2, ρ) =i:y2,i=0

log [1− Φ (x1,iθ1)] +N1 log (h2)

+i:y2,i=y∗2,i

log (h2y2 − x2θ2)

+i:y2,i=y∗2,i

logΦx1θ1 + ρ (h2y2 − x2θ2)

1− ρ2

Page 45: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 45

Ainsi il peut être intéressant de modifier la méthode du maximum de vraisemblance pourtenir compte de la concavité partielle de la log-vraisemblance en h2, θ1 et θ2 à ρ fixé. On peut parexemple faire un balayage sur ρ et maximiser pour chauqe valeur de ρ retenue la vraisemblancepar rapport à h2, θ1 et θ2. Il n’y a alors aucun problème de choix dans les conditions initialesen raison de la propriété de concavité. Puis dans un second temps, on retient la valeur de ρqui maximise la valeur de la vraisemblance et l’on en déduit les estimateurs correspondant desautres paramètres.

2.1.3. Estimation en deux étapes : Heckman (1976)

Généralement les paramètres des modèles Tobit généralisés sont estimés par MV . Toutefois, ilpeut être utile de recourir à d’autres méthodes d’estimation simples, qui même si elles ne sontpas efficaces, permettent d’avoir une première idée de l’échelle de grandeur des paramètres etqui peuvent en outre servir dans les phases de détermination des conditions initiales dans lesalgorithmes d’optimisation numérique de la vraisemblance. Parmi ces méthodes d’estimationsimples, on retrouve bien évidemment la méthode d’estimation en deux étapes proprosée parHeckman (1976) et présentée précédemment dans le cas du modèle Tobit simple.

On considère le modèle suivant :

y2,i =y∗2,i0

si y∗1,i > 0si y∗1,i ≤ 0 (2.18)

y∗1,i = x1,iβ1 + ε1,i (2.19)

y∗2,i = x2,iβ2 + ε2,i (2.20)

où les perturbations εj,i sont distribués selon une loi N 0,σ2j , j = 1, 2 avec E (ε1,iε2,i) =σ12, ∀i = 1, ..N . Pour construire l’estimateur en deux étapes d’Heckman, on cherche toutd’abord à construire l’espérance conditionnelle E y∗2,i y

∗1,i > 0 . Pour cela, considérons l’-

expression de y∗2,i et exprimons là en fonction de la projectioon linéire des résidus ε2,i surles résidus ε1,i. Compte tenu des hypothèses faites sur les pertubations, on a par hypothèseε2,i = σ12σ

−21 ε1,i+µ2,i où µ2,i est indépendant de ε1,i et normallement distribué de moyenne

nulle de de variance égale à σ22 − σ212σ−11 . Ainsi, on obtient :

y∗2,i = x2,iβ2 + ε2,i = x2,iβ2 + σ12σ−21 y∗1,i − x1,iβ1 + µ2,i

On en déduit alors l’expression E y∗2,i y∗1,i > 0 en fonction de celle de E y∗1,i y∗1,i > 0que l’on avait déjà construit dans le chapitre précédent. En effet, sachant :

E y∗1,i y∗1,i > 0 = x1,iβ1 + σ1λ (x1,iθ1)

on montre que :

E y∗2,i y∗1,i > 0 = x2,iβ2 + σ12σ−21 E y∗2,i y

∗1,i > 0 − x1,iβ1 + µ2,i

= x2,iβ2 + σ12σ−11 λ (x1,iθ1) + µ2,i

avec µ2,i = ε2,i − σ12σ−21 ε1,i.

Ainsi, pour les observations y2,i positives, on montre que l’on a un modèle décrit par larelation non linéaire suivante.

y2,i = E y∗2,i y∗1,i > 0 + vi

Page 46: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 46

avec vi = y2,i −E y∗2,i y∗1,i > 0 ou encore :

y2,i = x2,iβ2 + σ12σ−11 λ (x1,iθ1) + µ2,i (2.21)

où les perturbations µ2,i vérifient

µ2,i = µ2,i + vi = ε2,i − σ12σ−21 ε1,i + y2,i −E y∗2,i y∗1,i > 0 (2.22)

On obtient ainsi la proposition suivante.

Proposition 2.5. Le modèle Tobit généralisé de type II, pour les observations y2,i >0, peut être représenté par la relation non linéaire hétéroscédastique suivante :

y2,i = x2,iβ2 + σ12σ−11 λ (x1,iθ1) + µ2,i (2.23)

avec θ1 = β1/σ1 et où les perturbations µ2,i vérifient E µ2,i = 0 et :

V ar µ2,i = σ22 − σ12σ−21 x1,iθ1λ (x1,iθ1) + λ (x1,iθ1)

2 (2.24)

Dans le cas du modèle Tobit généralisé de type II, la méthode d’estimation d’Heckman, diteaussi méthode d’estimation en deux étapes, en comporte en fait trois.

• Etape 1 : On commence par estimer le ratio θ1 = β1/σ1 en utilisant la partie di-chotomique du modèle, c’est à dire en modélisant la probabilité d’obtenir une valeur y∗1,ipositive.

z1,i =10

si y∗1,i > 0si y∗1,i ≤ 0 y∗1,i N x1β1,σ

21 (2.25)

Pour cela, on considère le modèle probit dichotmique suivant :

Prob (zi,1 = 1) = Prob y∗1,i > 0 = Φ (x1θ1) (2.26)

Soit θ1 un estimateur convergent de θ1 obtenu à partir de ce modèle probit.

• Etape 2 : A partir de l’estimateur θ1 on constuit le ratio de Mill λ x1,iθ1 pour chaque

observation x1,i. Soit λ x1,iθ1 l’estimateur ainsi obtenu. On effectue alors la régressionlinéaire suivante par la méthode des MCO :

y2,i = x2,iβ2 + σ λ x1,iθ1 + µ2,i (2.27)

et l’on obtient alors un estimateur asymptotiquement convergent des paramètresβ2, noté β2 et un estimateur asymptotiquement convergent σ du ratio deparamètres σ12σ

−11 . Si l’on impose une contrainte sur σ1 (par exemple σ1 = 1) cela

permet alors d’identifier la covariance σ12. Toutefois, ces deux estimateurs ne sont effi-caces en rtaison de de l’hétéroscédascticité :

V ar µ2,i = σ22 − σ σ−11 x1,iθ1 λ x1,iθ1 + λ x1,iθ12

Page 47: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 47

• Etape 3 : Reste alors à estimer le paramètre σ2. Pour cela, considérons le résidu µ2,i dela régression (2.27). Pour une valeur donnée de σ1, on obtient alors par construction unestimateur convergent de σ22 :

σ22 =1

N1 i: y2,i>0µ2,i +

σ

σ1

1

N1 i: y2,i>0x1,iθ1 λ x1,iθ1 + λ x1,iθ1

2

(2.28)

où N1 désigne le nombre d’observations pour lesquelles y2,i > 0.

On montre que les estimateurs β2, σ22 et σ12 ainsi obtenus sont asymptotiquement convergent

et normalement distribuées (Olsen 1980).

Proposition 2.6. La convergence des estimateurs β2, σ22 et σ12 de Heckman ne néces-

site pas de supposer la normalité jointe des variables y∗1,i et y∗2,i. Il suffit de supposer

que la variable y∗1,i est distribuée selon une loi normale et que la composante desrésidus µ2,i telle que

y∗2,i = x2,iβ2 + ε2,i = x2,iβ2 + σ12σ−21 y∗1,i − x1,iβ1 + µ2,i

est indépendamment distribuée par rapport à y∗1,i.

Ainsi, contrairement à l’estimateur du MV, la convergence de l’estimateur de Heckman nerecquiert pas la normalité jointe des deux variables latentes.

2.1.4. Exemples

Un des exemples les plus célébres de modèle Tobit généralisés de type II est l’application deGronau (1974) sur le travail des femmes. Son modèle d’offre de travail est fondé sur la théoriedu salaire de réservation et sera repris par la suite de très nombreuses fois, notamment parHeckman avec des modèles de biais de sélection.

Le travail de Gronau (1974) consiste à déterminer sous quelles conditions les femmes décidentde travailler ou de ne pas travailler. Gronau suppose que le taux de salaire réel effectivementoffert aux femmes, noté W s, est indépendant du nombre d’heures travaillées H. La femmemaximise son utilité U (C,X) où C désigne le temps passé à s’occuper des enfants et X levecteur des autres biens de consommation. Etant donné le salaire W s offert, la femme cherchedonc le panier (C,X) qui maximise son utilité sous la contrainte de temps C + H = T où Tdésigne temps disponible total et sous la contrainte de revenu X = W sH + V où V désigne lemontant de ses revenus autres que les revenus salariaux. Le programme est donc :

maxC,X

U (C,X) (2.29)

sc : C +H = T

sc : X =W sH + V

Dès lors la femme n’acceptera de travailler que si le TMS du bien C au bien X évalué aupoint H = 0 (c’est à dire sans travailler) est inférieur le taux de salaire W s.

∂U (C,X) /∂C

∂U (C,X) /∂X H=0

< W s

Page 48: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 48

Intuitivement, sans travailler, la réduction d’une unité du temps consacré aux enfants im-plique pour maintenir le niveau d’utilité une augmentation de la consommation égale au termede gauche. Si en travaillant une unité la femme, gagne W s et que ce salaire réel est supérieurà cette augmentation nécessaire de la consommation, la femme décidera de travailler. Si elledécide travailler, le nombre d’heures travaillées H sera défini par l’égalité :

∂U (C,X) /∂C

∂U (C,X) /∂X(H) =W s

Gronau qualifie le terme de gauche de ”housewife’s value of time”, mais plusgénéralemnt il s’agit ici d’un salaire de réservation, noté W r. Si W r > W s, l’agentaccepte de travailler, sinon il refuse.

En supposant que W r et W s peuvent s’écrire comme la somme de combinaisons linéairesdes variables explicatives indépendantes et d’un terme d’erreur, le modèle devient :

W si = x1,iβ1 + ε1,i (2.30)

W ri = x2,iβ2 + ε2,i (2.31)

Wi =W si

0si W s

i > Wri

sinon(2.32)

où Wi désigne le salaire effectif. Pour les femmes ayant un salaire de réservation supérieur ausalaire offert, le salaire effectif est nul puisque ces dernières refusent de travailler. En posant quey∗1,i =W

si −W r

i et y∗1,i =W

si , en supposant que les perturbations ε1,i et ε2,i sont normallement

dsitribuées on retrouve un modèle tobit généralisé de type II. C’est un tel modèle qui donnalieu plus tard à l’extension des modèles à troncature auxiliaire ou modèles Heckit.

2.1.5. Modèle de Troncature Auxiliaire ou Modèle Heckit

Parfois, on appele modèle de Troncature Auxiliaire ou modèle Heckit, en hommage àHeckman, oumodèles de biais de sélection, les modèles Tobit généralisés de type II. Les ex-emples sont multiples : caractéristiques des demandeurs d’emploi connues que s’ils sont inscritsà l’ANPE, notes des étudiants connues que s’ils ont décidé de passer l’examen, réponses aux en-quêtes connues que si les individus ont décidé de les fournir, etc... Tous ces exmples cachentun processus de selction des individus observés dans lequel ceux-ci interviennentde façon déterminante : on a donc un problème d’auto-sélection.

Considérons un modèle Tobit généralisé :

y2,i =y∗2,i0

si y∗1,i > 0si y∗1,i ≤ 0 (2.33)

y∗1,i = x1,iβ1 + ε1,i (2.34)

y∗2,i = x2,iβ2 + ε2,i (2.35)

Il est tentant alors d’appliquer les MCO à l’ensemble des observations pour déterminer lesparamètres β2.

Page 49: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 49

Proposition 2.7. On montre que l’estimateur β2 des MCO ne sera pas biaisé qu’àpartir du moment où le processus de sélection sera totalement indépendant de lavariable auxiliaire y∗1,i :

E β2 = β2 ⇐⇒ ρσ1λ (x1,iβ1) = 0⇐⇒ ρ = 0 (2.36)

Dès que le processus de sélevction dépend, même partiellement de y∗1,i, le biais s’introduit :il s’agit d’un biais de sélection. Le biais apparaît parce que certaines variables explicatives,celles contenues dans x1,i, ont été oubliées : il s’agit encore une fois d’un biais de variable omise.On parle parfois de modèle Heckit, en hommage à Heckman, la spécification de ce dernier étantdonnée par :

z∗i = wiγ + µi (2.37)

yi = xiβ + εi (2.38)

où yi n’est observée que si z∗i > 0 ou encore si zi = 1 avec :

zi =10

si z∗i > 0si z∗i ≤ 0

Page 50: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 50

2.2. Autres Modèles Tobit Généralisés

2.2.1. Modèle Tobit Généralisé Type 3

2.2.2. Modèle Tobit Généralisé Type 4

2.2.3. Modèle Tobit Généralisé Type 5

3. Les Modèles à régimes

3.1. Modèle à régimes observables

3.2. Modèle à régimes inobservables

Page 51: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 51

A. Annexes

A.1. Concavité de la log-vraisemblance

Soit les matrices ∆ et Γ respectivement définies par :

∆ =Ψ (α, h) 00 −N1

h2(A.1)

Γ =− i: yi>0

xixi i: yi>0xiyi

i: yi>0yixi i: yi>0

y2i(A.2)

avec

Ψ (α, h) =i: yi=0

φ (xiα)

1− Φ (xiα) xiα− φ (xiα)

1− Φ (xiα) xixi

et xiα− φ (xiα) [1− Φ (xiα)]−1 < 0. Sachant que la matrice xixi est définie positive.*** A finir ***a bb c

, eigenvalues:

12a+

12c+

12 (a2 − 2ac+ c2 + 4b2), 12a+ 1

2c− 12 (a2 − 2ac+ c2 + 4b2)

A.2. Programme de simulation d’un probit simple

Le programme permettant de simuler la série observable yi est le suivant :

’ Tirage des Epsilon dans une loi N(0,1)scalar sigeps=1genr eps=nrnd*sigeps’ Construction de la Variable Exogène Xscalar sigx=1genr x=nrnd*sigx’ Construction de la Variable Latente y*scalar beta=0.8scalar alpha=1genr ystar=alpha+beta*x+eps’ Construction de la Variable Observale ygenr y=0genr y= (ystar>0)*ystar

Page 52: MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA)€¦ · Toutefois, ces modèles sont aussi appelés modèles de régression censurées (censored regression models)oumodèle de régression

Econométrie des Variables Qualitatives. Cours C. Hurlin 52

Bibliographie

Alban T. (2000), ”Econométrie des Variables Qualitatives”, Dunod.

Goldberger (1964)Gourieroux C. (1989), ”Econométrie des Variables Qualitatives”, Economica.

Greene W.H. (1997), ”Econometric Analysis”, Londres, Prentice Hall.

McDonald, J. and R. Moffitt (1980) The Uses of Tobit Analysis, Review of Economic andStatistics, 62, 318321

Maddala. G.S. (1983), ”Limited-dependent and Qualitative Variables in Econometrics”, Econo-metric Society Monographs, 3, Cambrige University Press.

Tobin J. (1958), ”Estimation of Relationships for Limited Dependent Variables”, Econometrica,26, 24-36.