43
Econométrie des modèles de durée Soit T une variable aléatoire continue positive, représentant la durée passée dans un certain état (par exemple: chômage, vie en couple, durée de survie) 1. Caractérisations de la loi de la durée T Fonction de répartition : Ft PrT J t, t 0. 1

1. Caractérisations de la loi de la durée T - CREST...Econométrie des modèles de durée Soit T une variable aléatoire continue positive, représentant la durée passée dans un

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

  • Econométrie des modèles dedurée

    Soit T une variable aléatoire continue positive, représentant la duréepassée dans un certain état (par exemple: chômage, vie en couple,durée de survie)

    1. Caractérisations de la loi dela durée T

    Fonction de répartition :

    F�t� � Pr�T � t�, t � 0.

    1

  • Propriétés :� F�t� � �0,1�, t � 0� F est continueàdroite, i.e. F�t�� � F�t�, t � 0� F est monotonenon-décroissante, i.e. t1 � t2 � F�t1� � F�t2�� F�0�� � 0 et limt�� F�t� � 1

    Fonction de survie :

    S�t� � Pr�T � t� � 1 � F�t�

    Propriétés :� S�t� � �0,1�, t � 0� S est continueàgauche, i.e. S�t�� � S�t�, t � 0� S est monotonedécroissante, i.e. t1 � t2 � S�t1� � S�t2�� S�0�� � 1 et limt�� S�t� � 0

    2

  • Fonction de densité :

    f�t� � lim��0

    Pr�t � T � t � ���

    soit

    F�t� � �0

    tf�u� du

    ou encore

    S�t� � �t

    f�u� du � 1 � �0

    tf�u� du

    Fonction de hasard :

    h�t� � lim��0

    Pr�t � T � t � � � T � t��

    3

  • soit

    h�t� � f�t�S�t�

    � �d lnS�t�

    dt

    Propriétés :� h : R� � R�

    � �0

    th�u� du � �, t � 0, mais�

    0

    h�u� du � �

    � h n’est pas nécessairement monotone

    Fonction de hasard cumulée :

    H�t� � �0

    th�u� du

    4

  • Relations entre ces différentes fonctions :

    H�t� � � ln S�t� � �0

    th�u� du

    S�t� � exp � H�t� � exp- �0

    th�u� du

    f�t� � h�t� S�t� � h�t� exp��H�t�� � h�t� exp - �0

    th�u� du

    F�t� � 1 � S�t� � 1 � exp��H�t�� � 1 � exp - �0

    th�u� du

    5

  • 2. Exemples de loisparamétriques usuelles

    2.1 Loi exponentielleT suit une loi exponentielle de paramètre � � 0 si :� fonction dehasard :

    h�t� � �, t � 0

    � fonction dehasard cumulée :

    H�t� � �t

    � fonction desurvie :

    S�t� � exp���t�

    6

  • � fonction dedensité :

    f�t� � � exp���t�

    Remarques :� E�T� � ��1 et V�T� � ��2

    � � lnS�t� � �t � la courbe �t,� ln�S�t�� est approximativement une

    droite

    2.2 Loi de WeibullT suit une loi de Weibull de paramètres � � 0 et � � 0 si :� fonction dehasard :

    h�t� � �� t��1, t � 0

    � fonction dehasard cumulée :

    H�t� � � t�

    7

  • � fonction desurvie :

    S�t� � exp��� t��

    � fonction dedensité :

    f�t� � �� t��1 exp��� t��

    Remarques :� exp��� � Weibull��,1�� dh�t�/dt � ���� � 1� t��2 � la fonction dehasard de la loi deWeibull

    est monotonecroissanteou monotonedécroissanteselon que � � 1 ou� � 1

    � ln�� lnS�t�� � ln� � � lnt � la courbe lnt, ln � ln�S�t� est

    approximativement unedroite

    8

  • 2.3 Loi log-normaleT suit une loi log-normale de paramètres � et � � 0 si :� fonction dedensité :

    f�t� � 1�t �

    lnt � ��

    � fonction desurvie :

    S�t� � 1 � �lnt � �

    � fonction dehasard :

    h�t� � 1�t

    �lnt � �

    1 � �lnt � �

    9

  • où � et � sont respectivement la fonction dedensitéet la fonction derépartition de la loi normaleN�0,1�

    Remarques:� limt�0 h�t� � 0 et limt�� h�t� � 0� la fonction dehasard est non monotoneet unimodale (croissantepuis

    décroissante)

    2.4 Loi log-logistiqueT suit une loi log-logistique de paramètres � � 0 et � � 0 si:� fonction dedensité :

    f�t� � �� ��t���1�1 � ��t�� ��2

    � fonction desurvie :

    S�t� � 11 � ��t��

    10

  • � fonction dehasard :

    h�t� ��� ��t���1

    1 � ��t��

    Remarques :� La fonction dehasard est monotonedécroissantesi � � 1 (avec

    limt�0 h�t� � ��� Elleest monotonecroissantesi � � 1 (avec limt�0 h�t� � ��� Elleest non monotoneet unimodale (croissantepuis décroissante) si

    � � 1 (avec limt�0 h�t� � 0 et limt�� h�t� � 0�. Elleatteint sonmaximum pour t � �� � 1�1/�/�.

    11

  • 3. Modèles de duréeconditionnels

    Soient :� Zt un vecteur decovariables exogènes dont lavaleur peut évoluer dans

    le temps� � un vecteur deparamètres associéà Zt, en général demême

    dimension que Zt.

    Problème : spécification (paramétrique) de la loi conditionnelle de Tsachant �Zt � t�0

    12

  • 3.1 Modèles à hasards proportionnelsForme générale :

    h�t � Zt,�� � h0�t � �� exp�� �Zt�

    avec

    � � ��, ��

    Fonction de hasard de base:

    h0�t � �� � h�t � Zt � 0, ��

    Spécifications équivalentes :� fonction dehasard cumulée:

    H�t � �Zu�u�0� , �� � �

    0

    th0�u � �� exp�� �Zu�du

    13

  • � fonction de survie:

    S�t � �Zu �u�0� , �� � exp � �

    0

    th0�u � �� exp�� �Zu�du

    � fonction dedensité:

    f�t � �Zu�u�0� , �� � h0�t � �� exp�� �Zt�

    � exp � �0

    th0�u � �� exp�� �Zu�du

    Remarques :

    a) Si Zt � Z (covariables constantes) :� fonction dehasard cumulée:

    H�t � Z, �� � exp�� �Z� �0

    th0�u � ��du � exp�� �Z�H0�t � ��

    14

  • � fonction desurvie:

    S�t � Z, �� � exp � �exp�� �Z�H0�t � ���

    � �exp � �H0�t � ����exp���

    Z�

    � S0�t � ��exp��

    Z�

    � fonction dedensité:

    f�t � Z, �� � h0�t � �� exp�� �Z� S0�t � ��exp��

    Z�

    b) Forme paramétrique de h0�t � �� :� loi de Weibull :

    h0�t � �� � � t��1

    15

  • � hasard constant “par intervalles” (piecewise constant) :

    h0�t � �� � � l � 1�t � � l, l�1��,

    avec l � 0,. . . ,L, 0 � 0 et L�1 � �

    où 1� � est la fonction indicatriceprenant lavaleur 1 si l’expressionentrecrochets est vraie, 0 sinon.

    � Si h0�t� est traitécommeun paramètredenuisance (i.e. non spécifié),lemodèleàhasards proportionnels est alors semi-paramétrique(modèledeCox). Son estimation peut êtreobtenuepar maximisationd’une fonction devraisemblancepartiellepour la loi des rangs (cf.Cox, 1975)

    16

  • 3.2 Modèles avec hasards accélérésForme générale (pour Zt � Z�:

    h�t � Z,�� � exp�� �Z� h0�texp�� �Z� � ��

    avec

    � � ��,��

    Représentation log-linéaire :� Changement devariables:

    T0 � Texp�� �Z�, soit lnT � lnT0 � � �Z

    Posons

    �0 � E�ln�T0�� et � � lnT0 � E�ln�T0��

    Donc

    lnT � �0 � � �Z � �

    17

  • � Si lnT0 � N��,��, alors � � N�0,��. On obtient un modèlederégression log-normal.

    3.3 Modèles à hasards proportionnelsavec hétérogénéité non observableHypothèse. La fonction de hasard dépend d’une composantealéatoire spécifique à l’individu (non observable) de loi paramétréeL�� :

    h�t � �,Zt,�� � h0�t � ��exp�� �Zt� �

    avec

    � � L��et

    � � ��,�,�

    18

  • Hypothèses usuelles sur L�� :1. � � Gamma�,�, � 0 (Lancaster, 1979)

    E��� � 1 et V��� � �2 � 1/

    Densité de �:

    g��� � ���1 exp����

    ��1 ��

    ���

    Survie de T conditionnelle à Zt et � :

    S�t � �Zu �u�0� , �� � �

    0

    S�t � �, �Zu �u�0� , �� g��� d�

    soit

    S�t � �Zu �u�0� , �� � 1 � 1

    H�t � �Zu �u�0

    � , ����

    19

  • Densité de T conditionnelle à Zt et � :f�t � �Zu �u�0

    � , �� � h0�t � �� exp�� �Zt�

    � 1 � 1

    H�t � �Zu �u�0� , ��

    ���1

    Remarque: si h0�t � �� est monotone en t, l’oubli de � biaisevers le bas l’estimation de la fonction de hasard de base.

    2. � prend l’une des valeurs ��1, �2. . . , �J � avec probabilité�p1,p2. . . ,pJ �, J étant fixé et pJ � 1 ��

    j�1

    J�1pj (Heckman et

    Singer, 1984)Survie de T conditionnelle à Zt et � :

    S�t � �Zu �u�0� , �� � �

    j�1

    JS�t � � j, �Zu �u�0

    � , �� pj

    20

  • soit

    S�t � �Zu �u�0� , �� � �

    j�1

    Jexp �� j �

    0

    th0�u � �� exp�� �Zu�du pj

    Densité de T conditionnelle à Zt et � :

    f�t � �Zu �u�0� , �� � �

    j�1

    Jh0�t � �� exp�� �Zt� � j

    � exp �� j �0

    th0�u � �� exp�� �Zu� du pj

    21

  • 4. Modèles de durée avecrisques concurrents

    Exemple: plusieurs issues possibles au chômage (CDI, CDD, stage,inactivité).

    4.1 Cas sans covariablesFormalisme :� àchaque issue k �k � 1,. . . ,K�, est associéeunedurée latente Tk

    � pour chaque individu i de l’échantillon, on observe le minimum deces K durées:

    Ti � min�T1i� , . . . ,TKi

    � �

    et le typed’ issue ki, soit ki � argk��1,..K� min�T1i� , . . . ,TKi

    � �

    22

  • � fonction desurvie jointedes durées latentes :

    S�t1, . . . , tK� � Pr�T1i�

    � t1, . . . ,TKi�

    � tK�

    � fonctions desurvie, dedensitéet dehasard marginales:

    Sk�tk� � S�0,. . . ,0, tk,0, . . .0�

    fk�tk� � � ddtkSk�tk�

    hk�tk� � fk�tk� /Sk�tk�

    23

  • � fonctions desurvieconditionnelles:

    S�k�t1, . . . , tk�1, tk�1, . . . , tK � Tk � tk� �S�t1, . . . , tK�

    Sk�tk�

    S�k�t1, . . . , tk�1, tk�1, . . . , tK � Tk � tk� � �

    ��tk

    S�t1, . . . , tK�

    fk�tk�

    � contribution de l’ individu i à la fonction devraisemblance:

    l�ti,ki � � fki �ti� � S�ki �ti, . . . , ti, ti, . . . , ti � Tki � ti�

    � � ��tk

    S�ti, . . . , ti�

    24

  • 4.2 Risques concurrents indépendantsHypothèse:

    S�t1, . . . , tK� � �k�1

    KSk�tk�

    Conséquence:

    l�ti,ki � � fki �ti� � �k�ki Sk�ti� � hki �ti� � �k�1K

    Sk�ti�

    25

  • 4.3 Théorème de non-identifiabilitéThéorème:

    Soient:

    S � S�t1, . . . , tK� : S fonction de survie jointe continûment différentiable

    SI � S � S � S�t1, . . . , tK� � �k�1

    KSk�tk� ,

    lS�t,k� la vraisemblance d’un modèle dans S,

    lSI �t,k� la vraisemblance d’un modèle dans SI,

    alors:

    �S � S, �!SI � SI, tel que lSI �t,k� � lS�t,k�.

    Preuve: voir Florens, Fougère et Mouchart (1996)

    26

  • 4.4 Cas avec covariables et hétérogénéit énon observableFonction de hasard marginale:

    hk�tk � �k,Zt, �k� � h0k�t � �k� exp��k� Zt� �k, k � 1, . . .K

    Hypothèse maintenue:�k � � k, Tk

    � Tk � ��Zu �u�0� ,�k,�k

    � �

    Notations:� � � ��1,�2, . . .�K �� fonction dedensitéde �: g�� � �� � g��1,�2, . . .�K � ��

    27

  • Fonction de vraisemblance conditionnelle à l’hétérogénéité nonobservée:

    l�t,k � �Zu �u�0� , �� � hk�t � �k,Zt, �k �

    � �k

    �1

    KSk

    � �t � �Zu �u�0� , �k

    � , �k� �

    Fonction de vraisemblance non conditionnelle:

    l�t,k � �Zu �u�0� � � �

    �1�0

    . .��K�0

    hk�t � �k,Zt, �k �

    � �k

    �1

    KSk

    � �t � �Zu �u�0� , �k

    � , �k

    � �

    � g��1, �2, . . . �K � ��d�1. .d�K

    Méthode d’estimation: maximum de vraisemblance simulé si K � 3(cf. Gouriéroux et Monfort, 1996)

    28

  • Cas bivarié: ��1, �2� � �expw1, expw2� et �w1,w2� N�0, ��

    Hypothèse simplificatrice dans le cas multivarié: �k � exp��kw� avecw N�0,1� (cf. Flinn et Heckman, 1982)

    5. Censure à droiteObservation:

    Y � min�T,C� et D � 1�T � C�

    Hypothèse:T C � ��Zu �u�0

    � , �, ��

    Remarque: le modèle avec censure à droite est un modèle à deuxrisques concurrents indépendants.Fonction de vraisemblance:

    l�y,d� � �fT�y�SC�y��d � �fC�y�ST�y��1�d

    29

  • doncmax

    �l�y,d� max

    ��fT�y��

    d� �ST�y��

    1�d

    Généralisation au cas multivarié �T1�, . . . ,TK� ,C�: immédiate sousl’hypothèse

    �k, Tk�

    C

    30

  • 6. Rappels sur la méthode dumaximum de vraisemblance

    6.1 Fonction de vraisemblance� Soit unev.a. X àvaleurs dans R, dont on possèdeun échantillon

    indépendant de taille n, noté �x1, . . . ,xn � � Rn, et de loi P� indicéeparun paramètre réel ou multidimensionnel � � � � Rp

    � Définition: On appelle vraisemblance en � de l’échantillonx � �x1, . . . ,xn �, et on note l�x;��, l’ application qui à� faitcorrespondre:1. l�x;�� � fX�x1, . . . ,xn � si X1, . . . ,Xn sont n v.a. réelles de

    fonction de densité jointe fX

    2. l�x;�� � PX�X1 � x1, . . . ,Xn � xn � si X1, . . . ,Xn sont n v.a.discrètes de probabilité jointe PX

    31

  • � Remarque: Si les v.a. �X1, . . . ,Xn � sont iid, demême loi dedensité f,alors

    l�x;�� � �i�1

    n

    f�xi �

    � Exemples :1. Pour une v.a. normale Xi

    iid

    N�m, �2�, i � 1, . . . ,n, la

    vraisemblance de l’échantillon x � �x1, . . . ,xn � est :

    l�x;m, �2� � 1�

    n 2�nexp �

    ��xi � m�2

    2�2

    2. Pour une v.a. de Poisson Xiiid

    Poisson���, i � 1, . . . ,n, la

    vraisemblance de l’échantillon est:

    l�x;�� � e�n� �� xi

    � xi!

    32

  • 6.2 Estimateur du maximum devraisemblance (EMV)� Définition. Soit x � �x1, . . . ,xn � une réalisation de l’échantillon

    �X1, . . . ,Xn �. Un estimateur du maximum devraisemblancede� estunesolution du problèmedemaximisation

    ���

    max l�x;��

    � Condition suffisanted’existence:Si l’ ensembledes paramètres � est compact et si lavraisemblancel�x;�� est continueen �, il existeun estimateur du maximum devraisemblance

    � Condition d’unicité:Lorsqu’en outre la fonction de log-vraisemblanceL�x,�� � ln l�x;��est une fonction globalement concaveen �, l’ estimateur du maximumdevraisemblance (EMV) est unique.

    33

  • � Propr iété:Si � � ��1, . . . ,�p�

    �� � � Rp, si la log-vraisemblance ln l�x;�� est

    dérivableen � et si l’EMV�� appartient à l’ intérieur de �,

    �� satisfait

    �Ln x;��

    ���

    � ln l x;��

    ��� 0

    Ces équations sont appelées les équations devraisemblance

    6.3 Propriétés asymptotiques de l’EMV� Conditions de régular ité:

    H1. les v.a. Xi , i � 1,. . . ,n, sont iid, de même loi de densitéf�x,��,� � � � Rp

    H2. l’espace � des paramètres est compactH3. la vraie valeur inconnue �0 est identifiable, i.e. il n’existe

    pas d’autre valeur �1 telle que

    f�x,�0� � f�x,�1�,�x

    34

  • H4. la log-vraisemblance

    Ln�x;�� ��i�1

    n

    ln f�xi;��

    est continue en �H5. E�0 ln f�Xi;�� existeH6. la log-vraisemblance est telle que

    1n Ln�x;��

    ps� E�0 ln f�Xi;��, �� � �

    � Propr iété:Sous les hypothèses H1-H6, il existeunesuited’estimateurs dumaximum devraisemblanceconvergeant presquesûrement vers lavraievaleur �0

    35

  • � Conditions supplémentaires:H7. �0 appartient à l’intérieur de �H8. la log-vraisemblance Ln�x;�� est deux fois continûment

    dérivable dans un voisinage ouvert de �0H9. la matrice d’information de Fisher en �0

    I1��0� � E�0 ��2 lnf�Xi;��

    ���� �

    existe et est inversible� Propr iété:

    Sous les hypothèses H1-H9, il existeunesuite�� n demaxima locaux

    de la log-vraisemblanceconvergeant presquesûrement vers�0, telleque

    n�� n � �0

    loi� N 0,I 1��0��1

    36

  • � Remarque: Lamatriced’ information deFisher I1��0� dépend duparamètre inconnu �0, mais ellepeut facilement êtreestiméedemanièreconvergente, si elleest continueen �, par les estimateurssuivants

    I 1�� n

    ou

    �1n

    �2 lnl x;�� n

    ���� �

    ou

    1n �

    i�1

    n� ln f xi,

    �� n

    ��

    � ln f xi,�� n

    �� �

    37

  • � Rappel:

    �1n

    �2 ln l�x;�0 ����� �

    ps� E�0 �

    �2 lnf�Xi;������ �

    � I 1��0�

    et

    I 1��0� � E�0 ��2 lnf�Xi;��

    ���� �

    � E�0� lnf�Xi;��

    ��

    � lnf�Xi;���� �

    38

  • 6.4 Tests fondés sur la vraisemblance� Formegénéraledu test:

    H0 : g��� � 0 �

    g1��� � 0

    gr��� � 0

    Les fonctions g1, . . . ,gr sont àvaleurs dans R, dérivables, et telles que

    lamatrice�g ����

    ��dedimension �p,r� soit de rang r,�� � �

    � Ln�x;�� log-vraisemblancedu modèleet�� n EMV de �

    � Si g�� n est “proche” de0, on aura tendanceàaccepter H0 (test de

    Wald)

    39

  • Test de Wald. Sous les conditions de régularité H1-H9, le testdéfini par la région critique

    W � ��nW � �1��2 �r��

    avec

    �nW

    � n

    dim��1,r�

    g ��� n

    dim��r,p�

    �g�

    � n

    �� �

    dim��p,p�

    I�

    � n�1

    dim��p,r�

    �g ��

    � n

    ��

    �1

    dim��r,1�

    g�

    � n

    est de niveau asymptotique � et est convergent. Ce test estappelé test de Wald

    40

  • � Soit�� n

    0l’EMV de � contraint par

    g��� � 0

    � Lagrangien associéau problèmed’optimisation sous contrainte:

    dim��1,1�

    Ln��� �

    dim��1,r�

    g ����dim��r,1�

    � Conditions du 1er ordre:

    dim��p,1�

    �Ln x;�� n

    0

    ���

    dim��p,r�

    �g ��� n

    0

    ��dim��r,1�

    ��n � 0

    en notant��n la valeur prisepar levecteur � des multiplicateurs de

    Lagrange

    41

  • Test du score. Sous les conditions de régularité H1-H9, le testdéfini par la région critique

    W � ��nS � �1��2 �r��

    avec

    �nS

    �1n

    dim��1,p�

    �Ln x;�� n

    0

    �� �

    dim��p,p�

    I�� n

    0 �1

    dim��p,1�

    �Ln x;�� n

    0

    �� �

    �1n

    �1,r�

    ��n

    dim��r,p�

    �g�� n

    0

    �� �

    dim��p,p�

    I�� n

    0 �1

    dim��p,r�

    �g ��� n

    0

    ���r,1�

    ��n

    est de niveau asymptotique �. Ce test est appelé test du score(ou test du multiplicateur de Lagrange)

    42

  • En outre, sous H0,p lim��nW � �nS �

    �n���� 0

    Test du ratio des vraisemblances. Sous les conditions derégularité H1-H9, le test défini par la région critique

    W � ��nR � �1��2 �r��

    avec

    �nR� 2 Ln x;

    �� n � Ln x;

    �� n

    0

    est de niveau asymptotique � et est convergent. Ce test estappelé test du rapport des vraisemblances. En outre, sous H0,

    p lim��nR � �nS � � p lim��nR � �nW � � 0

    43