UnitRoot_V10

  • Upload
    fouad

  • View
    224

  • Download
    0

Embed Size (px)

Citation preview

  • 7/24/2019 UnitRoot_V10

    1/47

    Une Synthse des Tests de Racine Unitaire sur Donnesde Panel

    Christophe Hurlin et Valrie Mignony

    Janvier 2005

    Rsum

    Cet article propose une synthse de la littrature concernant les tests de racine uni-

    taire en panel. Deux principales volutions peuvent tre mises en vidence dans cette voiede recherche depuis les travaux fondateurs de Levin et Lin (1992). Dune part, on a puassister depuis la n des annes 90 une volution tendant prendre en compte unehtrognit des proprits dynamiques des sries tudies, avec notamment les travauxdIm, Pesaran et Shin (1997) et de Maddala et Wu (1999). Dautre part, un second type dedveloppements rcents dans cette littrature tend introduire une dichotomie entre deuxgnrations de tests : la premire gnration repose sur une hypothse dindpendance entreles individus, ce qui apparat peu plausible notamment dans le cas de certaines applicationsmacro-conomiques. La seconde gnration, actuellement en plein dveloppement, intgrediverses formes possibles de dpendances inter-individuelles (Bai et Ng (2001), Phillips etSul (2003a), Moon et Perron (2004), Choi (2002), Pesaran (2003) et Chang (2002)). Cesdeux gnrations de tests sont prsentes dans cette revue de la littrature.

    Mots-Cl : Donnes de panel non stationnaires, racine unitaire, htrognit, d-pendances inter-individuelles.

    J.E.L Classication : C23, C33

    LEO, Universit dOrlans. Facult de Droit, dEconomie et de Gestion. Rue de Blois - BP6739. 45067Orlans Cedex 2. Email : [email protected].

    yTHEMA, Universit Paris X - Nanterre. 200 Avenue de la Rpublique, 92001 Nanterre Cedex. Tel :01.40.97.58.60. Em ail : [email protected]

    1

  • 7/24/2019 UnitRoot_V10

    2/47

    1 Introduction

    Ltude des sries temporelles non stationnaires est devenue aujourdhui incontournable dans

    la pratique conomtrique courante. Les travaux empiriques dbutent ainsi frquemment parune analyse de la stationnarit des sries temporelles considres avec lapplication de diverstests de racine unitaire. Dans un contexte multivari, les tudes cherchent souvent mettre envidence des relations dquilibre de long terme entre les variables par lapplication de tests decointgration. En revanche, lanalyse des donnes de panel non stationnaires ne sest dveloppeque trs rcemment, depuis les travaux pionniers de Levin et Lin (1992). Elle sest en particulierdveloppe avec lutilisation croissante des bases de donnes macro-conomiques prsentant unedimension temporelle susante (suprieure vingt ans) pour que cette problmatique prsenteun intrt appliqu. Les champs dapplication des tests de racine unitaire en panel couvrentaujourdhui ltude de la parit des pouvoirs dachat (PPA), les problmes de croissance etde convergence, les dynamiques de lpargne et de linvestissement, les activits de recherche-dveloppement au niveau international, etc.

    Pourquoi tester la racine unitaire en panel ?Lajout de la dimension individuelle la dimension temporelle usuelle prsente un intrt

    important pour lanalyse des sries non stationnaires. Les tests de racine unitaire et de coint-gration sur donnes de panel temporelles sont en eet plus puissants que leurs analogues sursries temporelles individuelles en petit chantillon. A titre dexemple, lorsque lon tudie dessries de taux de change, on dispose gnralement de 20 ou 30 ans de donnes. Or, pour detelles tailles dchantillon, les tests de racine unitaire sont en gnral trs peu puissants pourdistinguer des sries non stationnaires et des sries stationnaires mais fortement persistantes(voir Salani 1999 pour une synthse). Ltendue de la priode dtude tant plus importanteque la frquence des donnes (Pierce et Snell, 1995), une solution consisterait lorsque celaest possible accrotre cette priode. Mais, dune part, cela est rarement possible et, dautrepart, une telle procdure augmente le risque de faire face des ruptures structurelles. Si lonreprend lexemple des taux de change, la n du systme de Bretton Woods a engendr une rup-ture structurelle telle quil est peu pertinent de travailler sur une longue priode mlant diversrgimes de change. Plutt que dtendre la priode dtude, une alternative consiste alors accrotre le nombre de donnes en incluant linformation relative des pays dirents. Il est eneet naturel de penser que les proprits de long terme des sries, de mme que leurs caractris-tiques en termes de stationnarit, ont une forte probabilit dtre communes plusieurs pays.Le recours aux donnes de panel permet ainsi de travailler sur des chantillons de taille rduite(dans la dimension temporelle) en augmentant le nombre de donnes disponibles (dans la di-mension individuelle), diminuant ainsi la probabilit de faire face des ruptures structurelleset palliant le problme de la faible puissance des tests en petit chantillon. Ainsi que le notentBaltagi et Kao (2000), lconomtrie des donnes de panel non stationnaires vise combiner lemeilleur des deux mondes : le traitement des sries non stationnaires laide des mthodesdes sries temporelles et laugmentation du nombre de donnes et de la puissance des tests avec

    le recours la dimension individuelle.

    Quelles sont les dirences fondamentales entre les tests de racine unitaire enpanel et en sries temporelles ?

    Il existe deux principales dirences entre les deux approches. La premire concerne lesdistributions asymptotiques. Dans le cas des sries temporelles, les statistiques de tests usuelspossdent des distributions asymptotiques non standard (point a) et conditionnelles au modleutilis pour tester la racine unitaire (point b). Ainsi, par exemple, sous lhypothse nulle deracine unitaire, la t-statistique de Dickey-Fuller admet une distribution asymptotique qui estune fonction de mouvements Browniens. Cette distribution est en outre dirente suivant laspcication de la composante dterministe du modle dans lequel on teste la racine unitaire :

    2

  • 7/24/2019 UnitRoot_V10

    3/47

    modle avec une constante, une constante et une tendance, ou ni constante ni tendance. Dans lecadre des modles de panel, les statistiques des tests de racine unitaire ( lexception des testsde Fisher) admettent pour loi asymptotique des lois normales (point a). Les premiers mettre

    en vidence ce rsultat furent Levin et Lin (1992). Nous donnerons lintuition de ce rsultatdans le cadre des tests de premire gnration en voquant au passage les direntes notions deconvergence en panel (Phillips et Moon, 1999). En revanche, tout comme dans le cas des sriestemporelles, ces lois asymptotiques demeurent conditionnelles au modle utilis pour tester laracine unitaire (point b) : les lois asymptotiques, et donc les seuils, ne sont pas les mmessuivant que lon considre un modle avec ou sans constante, avec ou sans tendance. Mais,contrairement aux sries temporelles, les lois asymptotiques restent des lois normales : seulesla variance et lesprance sont modies suivant le modle utilis. Ainsi, la premire direncerside dans le fait que lconomtre appliqu qui utilisait des tables de lois particulires dans lecadre des sries temporelles pour mener bien ses tests, devra utiliser pour eectuer des testssimilaires en panel les tables de la loi normale.

    Mais la dirence essentielle rside dans le problme de lhtrognit du modle qui ne se

    pose pas dans le contexte des sries temporelles. Dans le cas univari, on se donne un modlepour tester la prsence dune racine unitaire dans la dynamique dune variable pour un individudonn. Lorsque lon passe en panel, la question qui vient immdiatement lesprit est la sui-vante : peut-on considrer un mme modle pour tester la prsence dune racine unitaire dansla dynamique dune variable observe sur plusieurs individus ? Si lon rpond par larmative cette question, cela implique lexistence de proprits dynamiques strictement identiques pourla variable quel que soit le pays considr : on parle alors de panel homogne. Prenons unexemple : si lon teste la prsence dune racine unitaire dans la dynamique du chmage des 30pays membres de lOCDE partir dun mme modle, cela revient tester lhypothse de racineunitaire en imposant, sans doute tort, que la dynamique du chmage puisse tre dcrite pourles 30 pays par le mme modle. Le test de racine unitaire ainsi construit en panel peut alorsconduire des rsultats fallacieux. Ds lors, de faon gnrale, la premire question centrale destests de racine unitaire en panel devient celle de la forme de lhtrognit du modle utilispour tester la racine unitaire. Cette question rejoint celle de la spcication mme du test deracine unitaire comme nous le verrons par la suite.

    Cette notion dhtrognit du modle est une notion centrale de lconomtrie des panels(Hsiao, 1986, et Sevestre, 2002). La forme la plus simple dhtrognit est celle qui consiste postuler lexistence de constantes spciques chaque individu. Il sagit bien entendu du modle eets individuels (spcis de faon xe ou alatoire), qui traduit une htrognit unique-ment du niveau moyen mais qui conserve lhypothse dhomognit des autres paramtres dumodle et en particulier de la racine autorgressive. Cest notamment ce type de modlisationquutiliseront les premiers tests de racine unitaire de Levin et Lin (1992). Mais trs rapide-ment, cette conception de lhtrognit limite aux seuls eets individuels ou aux tendancesdterministes est apparue peu plausible dans le cas des applications macro-conomiques.

    Ainsi, un premier mouvement sest dessin dans le contexte des tests de premire gnration

    allant vers une prise en compte dune plus grande htrognit de la dynamique de la srietudie. Ce mouvement sinscrit dans le contexte plus large de la littrature du milieu desannes 90 consacre aux panels dynamiques dits htrognes (Pesaran et Smith, 1995). Lespremiers tests de racine unitaire sur panels htrognes ont alors t proposs par Im, Pesaranet Shin (1997) et Maddala et Wu (1999). Ces tests autorisent sous lhypothse alternative nonseulement une htrognit de la racine autorgressive, mais aussi une htrognit quant la prsence mme dune racine unitaire dans le panel. Par exemple, si lon raisonne sur un panelinternational, sous lhypothse alternative la variable tudie peut tre non stationnaire dans unpremier groupe de pays et stationnaire pour un autre groupe non vide de pays de lchantillon.

    3

  • 7/24/2019 UnitRoot_V10

    4/47

    Lhypothse dindpendance inter-individuelle : vers une nouvelle gnration detests

    Cette premire volution vers des spcications htrognes se double depuis trois ans dune

    seconde volution allant dans le sens de la prise en compte des corrlations de la variable entreindividus. En eet, au del du problme de lhtrognit des paramtres du modle, uneautre problmatique spcique aux donnes de panel est aujourdhui devenue centrale dansla littrature sur les tests de racine unitaire : il sagit de la prise en compte des ventuellesdpendances inter-individuelles. La question est tout simplement de savoir si lon autorise laprsence dventuelles corrlations entre les rsidus des dirents individus du panel. Selon larponse cette question, on peut opposer deux gnrations de tests comme lindique le tableaurcapitulatif 1.

    Tab.1 Tests de Racine Unitaire en Panel

    Tests 1ere Gnration Indpendance entre individus

    1- Spcication homogne de la racine autorgressive sous H1Levin et Lin (1992, 1993)

    Levin, Lin et Chu (2002)

    Harris et Tzavalis (1999)

    2- Spcication htrogne de la racine autorgressive

    Im, Pesaran et Shin (1997, 2002 et 2003)

    Maddala et Wu (1999)

    Choi (1999, 2001)

    Hadri (2000)

    3- Test squentiel Hnin, Jolivaldt et Nguyen (2001)

    Tests 2eme Gnration Dpendances entre individus

    1- Tests fonds sur des modles factoriels

    Bai et Ng (2001)

    Moon et Perron (2004)

    Phillips et Sul (2003a)

    Pesaran (2003)

    Choi (2002)

    2- Autres approches

    OConnell (1998)Chang (2002, 2004)

    La premire gnration de tests repose sur lhypothse dindpendance inter-individuelledes rsidus. Cest prcisment cette hypothse dindpendance qui, comme nous allons le voir,permet dtablir trs simplement les distributions statistiques de test et dobtenir gnralementdes distributions asymptotiques ou semi-asymptotiques normales. Dans cette perspective, lesventuelles corrlations entre individus constituent des paramtres de nuisance. Cette hypothsedindpendance inter-individuelle est particulirement gnante dans la plupart des applicationsmacro-conomiques des tests de racine unitaire, que ce soit dans le domaine des tests de conver-gence (Phillips et Sul, 2003) ou dans le domaine des tests de la PPA (OConnell, 1998). Orlapplication tort des tests de premire gnration dans un contexte avec dpendances inter-

    4

  • 7/24/2019 UnitRoot_V10

    5/47

    individuelles conduit des distorsions de taille et des puissances de tests trs faibles (Banerjee,Marcellino et Osbat, 2000, Strauss et Yigit, 2003).

    La seconde gnration de tests, plus rcents, tend lever cette hypothse dindpendance.Ces tests renversent totalement la perspective jusqualors adopte car, plutt que de considrerles corrlations entre individus comme des paramtres de nuisance, ils proposent dexploiter cesco-mouvements pour dnir de nouvelles statistiques de test. Tout le problme consiste alors proposer le test permettant la prise en compte la plus gnrale des direntes formes possibles dedpendances entre individus. Comme le souligne Quah (1994), la modlisation des dpendancesinter-individuelles est dlicate dans la mesure o il nexiste pas a priori dordre naturel dansles observations individuelles. Cest pourquoi de nombreux tests sont aujourdhui proposs. Laplupart sinscrivent dans la ligne des travaux fondateurs de Bai et Ng (2001, 2004) et retiennentle cadre dun modle facteurs communs. Mais si Bai et Ng (2004) proposent deux tests sparsde racine unitaire sur les composantes commune et individuelle de la srie, les autres tests neconsidrent uniquement que la composante idiosyncratique. Les approches dirent alors suivantla mthode retenue pour extraire de la srie brute la composante idiosyncratique inobservable.

    Ainsi, nous illustrerons successivement ces approches en tudiant les tests de Moon et Perron(2004), Choi (2002) et Pesaran (2003). Nous voquerons enn des tests alternatifs (Chang 2002,2004) dans lesquels aucune forme particulire de dpendance inter-individuelle nest postule,et qui ne ncessitent donc pas par consquent lidentication de facteurs communs.

    Dans le cadre de cette revue de la littrature, nous prsenterons tout dabord quatre tests deracine unitaire en panel de premire gnration an de bien comprendre les enjeux de lhypothsedindpendance inter-individuelle. Puis nous prsenterons cinq approches des tests de deuximegnration. Ces dirents tests selon illustrs au travers dune application sur les sries de PNBrels des pays de lOCDE.

    2 Les tests de Levin et Lin

    Andrew Levin et Chien-Fu Lin dans une srie de contributions (Levin et Lin 1992, Levinet Lin 1993 et Levin, Lin et Chu 2002) ont propos le premier test de racine unitaire en panel.Leur dmarche est directement inspire de celle des tests de racine unitaire en sries temporellesde Dickey et Fuller (1979). Par consquent, les auteurs considrent trois modles pour tester laracine unitaire1 suivant la forme que revt la composante dterministe :

    Modle 1 : yi;t= yi;t1+ "i;t (1)

    Modle 2 : yi;t= i+ yi;t1+ "i;t (2)

    Modle 3 : yi;t= i+ i t + yi;t1+ "i;t (3)

    o i = 1; : : ;N et t = 1; : : ;T et o les termes derreur "i;t sont distribus indpendamment

    entre les individus i et suivent un processus ARMA stationnaire et inversible admettant unereprsentationAR (1)du type :

    "i;t=1Xk=1

    i;k"i;tk+ i;t (4)

    1 Nous ne prsentons ici que les trois modles retenus dans la version nale de larticle (Levin, Lin et Chu,2002). Ces trois modles excluent notamment la prsence deets temporels communs qui guraient dans lesversions de 1992 et 1993 du papier.

    5

  • 7/24/2019 UnitRoot_V10

    6/47

    Les processus i;t pour i = 1; : : ;N sont i:i:d:

    0; 2;i

    . On peut faire deux remarques ce

    niveau2 . La premire est que les trois modles de Levin et Lin supposent lindpendance destermes derreur dans la dimension individuelle. Cette hypothse, bien que particulirement forte,

    est adopte dans tous les tests de racine unitaire en panel de premire gnration : cest en eetcette hypothse qui, comme nous le verrons par la suite, permet dutiliser un thorme centrallimite pour obtenir de faon relativement simple les distributions asymptotiques (normales) desstatistiques de tests.

    La seconde remarque porte sur la question de lhtrognit du processus gnrateur desdonnes retenu par les auteurs. Comme nous lavons mentionn en introduction, il sagit dunproblme fondamental en conomtrie de panel. Dans le cas prsent, les trois modles de Levinet Lin imposent lhypothse dhomognit de la racine autorgressive (i = j = ;8i; j) etpar consquent lhomognit de la conclusion quant la prsence dune racine unitaire dans ladynamique de la variable y : soit lon accepte lhypothse dune racine unitaire pour lensembledes individus du panel, soit lon rejette lhypothse dune racine unitaire pour lensemble desindividus. Cest prcisment la principale limite de ce test. En eet, mme si dans les modles 2et 3, Levin et Lin autorisent la prsence dune htrognit du processus gnrateur via lintro-

    duction deets individuels xes (i6=j pour i 6=j ) et dventuelles tendances dterministesindividuelles (i6= j pour i6= j ); il nen demeure pas moins que le degr de persistance deschocs3 de"i;tsur la variableyi;test suppos tre le mme pour tous les individus du panel. Dansle cas de panels macro-conomiques, on conoit videmment que cette hypothse dhomognitpose problme.

    A partir de ces trois modles, Levin et Lin proposent de tester les hypothses suivantes :

    Modle 1 : H0 : = 0

    H1 :

  • 7/24/2019 UnitRoot_V10

    7/47

    2.1 Des lois asymptotiques normales : illustration dans un cas simple

    Considrons le modle 1 de Levin et Lin sans eet individuel, en labsence dautocorrlationdes rsidus(i;k = 0).

    yi;t = yi;t1+ i;t

    avec = 1 + 2 Ret o, pour simplier, on suppose que les rsidus i;t pouri = 1; : : ;N sonti:i:d:

    0; 2

    et indpendamment distribus dans la dimension individuelle. On cherche tester

    lhypothse nulle H0 : = 1 contre H1 : < 1: Dans ce cas simple, la statistique de test deLevin et Lin, identique celle du test de Dickey-Fuller, correspond la t-statistique associeau test = 1; note t=1 :

    t=1=

    b 1b

    =b 1 1

    s2

    NXi=1

    TXt=1

    y2i;t1

    ! 12

    (5)

    o

    b dsigne lestimateur des MCO du paramtre obtenu partir des N T observations

    empiles. Sous lhypothse nulle H0; le biais de cet estimateur peut scrire sous la formesuivante :

    b 1 = NXi=1

    TXt=1

    y2i;t1

    !1 NXi=1

    TXt=1

    yi;t1i;t

    ! (6)

    Lestimateur de la variance des rsidus s est dni de faon usuelle par :

    s2 = 1

    N T

    NXi=1

    TXt=1

    b2i;t= 1NNXi=1

    1

    T

    TXt=1

    b2i;t!

    = 1

    N

    NXi=1

    s2i

    En conomtrie de panel, il existe plusieurs concepts de distribution asymptotique. Ondistingue tout dabord ce que lon qualie parfois de distribution semi-asymptotique ; cest lecas o lune des dimensions (N ouT) est xe et lautre tend vers linni (voir Hsiao, 1986). En

    ce qui concerne la distribution asymptotique au sens propre (o les deux dimensions tendentvers linni), on doit distinguer dirents modes de convergence qui ont t clairement dnispar Phillips et Moon (1999). La premire approche, dite convergence squentielle, consiste supposer que les dimensions convergent dans un certain ordre. On raisonne Nxe (ou T) etlon fait tendreT (ouN) vers linni, puis lon fait tendreN (ouT)vers linni. Cest souventlapproche la plus simple pour driver les lois asymptotiques, mais il convient dtre prudentavec ce type de rsultats car ils peuvent parfois tre dirents lorsque lon renverse lordrede convergence ou lorsque les deux dimensions tendent simultanment vers linni4 . Dans laseconde approche, dite convergence le long dune diagonale, on fait tendre N etTvers linnisimultanment sous lhypothse queT =T(N)est une fonction monotone de N : Par exemple,on peut supposer que le ratio T =Nconverge vers une constante c non nulle. Bien videmment,linconvnient de cette approche rside, dune part, dans le caractre spcique de la fonctionT(N)qui peut conditionner les rsultats et, dautre part, dans le fait que les dimensions(N; T)dun panel peuvent ne pas correspondre, et de loin, la relation T = T(N) : La troisimeapproche, la plus gnrale mais aussi la plus dicile utiliser, consiste supposer que N etTtendent vers linni sans supposer une quelconque relation entre T etN :

    Dans le cas de la littrature sur les tests de racine unitaire en panel, et plus particuli-rement dans le cas des tests de premire gnration, les modes de convergence adopts sont

    4 Il convient de noter que ce mode de convergence joue un rle fondamental dans la dtermination des loisasymptotiques des tests de racine unitaire. En eet, le fait que les statistiques des tests de racine unitaire enpanel sont asymptotiquement distribues selon des lois normales, impose une convergence, N x, de T verslinni. Ceci peut paratre quelque peu contradictoire avec lapproche des tests de racine unitaire en panel dansla mesure o lattrait pour ceux-ci rside notamment dans la faiblesse de la dimension temporelle de lchantillondisponible.

    7

  • 7/24/2019 UnitRoot_V10

    8/47

    essentiellement squentiels et le long dune diagonale. Nous ne considrerons ici que le cas leplus simple de la distribution asymptotique squentielle, lorsque T tend vers linni, puis Ntend vers linni son tour.

    Raisonnons tout dabord Nx. On note d! la convergence en loi fonctionnelle et l!

    la convergence en loi. Sous lhypothse nulle de racine unitaire, pour chaque individu du panelles moments empiriques

    PTt=1 yi;t1i;t et

    PTt=1 y

    2i;t;nots respectivementAi et Bi, convergent

    en distribution respectivement vers des fonctions de mouvements Browniens do lon dduitles distributions usuelles des tests de Dickey-Fuller (voir par exemple Hamilton 1994, chapitre17). Ainsi, sous lhypothse nulle = 1 :

    Ai = 1

    T2

    TXt=1

    y2i;t1d!

    T!12

    Z 10

    [Wi(r)]2 dr 8i= 1; : : ;N

    Bi= 1

    T

    T

    Xt=1 yi;t1i;td

    !T!12

    2 hWi(1)2 1i 8i= 1; : : ;No les variables Wi(r) ;pouri = 1;::;N; dsignent des mouvements Browniens standards ind-pendants. On admet paralllement que les estimateurs individuels s2i ;convergent en probabilitvers la variance de la population des rsidus :

    s2i = 1

    T

    TXt=1

    b2i;t p!T!1

    2 8i= 1; : : ;N

    Le fait de raisonner en panel nous amne prsent considrer des statistiques de tests(quations 5 et 6) qui sexpriment en fonction des moyennes des moments empiriques individuelsAi etBi. En contrlant les vitesses de convergence, la statistique de test de Levin et Lin peutainsi se rcrire sous la forme suivante :

    t=1=h

    Tp

    Nb 1i 1

    s

    vuut 1N

    NXi=1

    Ai (7)

    avec

    Tp

    Nb 1 = 1

    N

    NXi=1

    Ai

    !1 1p

    N

    NXi=1

    Bi

    ! (8)

    Cest ce niveau quintervient lhypothse fondamentale dindpendance des rsidus entreindividus. En eet, sous cette hypothse dindpendance, il convient de dterminer la loi asymp-totique de moyennes (sur N) de moments empiriques individuels indpendants, savoir les

    quantits N1PNi=1 Ai et N

    1=2

    PNi=1 Bi: Or, ds lors que la dimension T tend vers linni,

    les moments Ai pour i = 1; : : ;N (ou Bi) sont (i) indpendamment distribus, (ii) despranceet de variance nie, et dans notre cas trs simple ( iii) identiquement distribus5 . Ne reste plusalors qu faire tendre la dimension Nvers linni, et appliquer le thorme central limite deLindberg-Levy (voir Amemiya, 1985). Pour un Nx, lorsque la dimension Ttend vers linnion montre que :

    1pN

    NXi=1

    [Bi E(Bi)] d!T!1

    1pN

    NXi=1

    (22

    hWi(1)

    2 1i

    2

    2 E

    hWi(1)

    2 1i)

    5 Cette dernire condition nest pas essentielle lapplication du thorme central limite et nest dailleursplus valide ds lors que lon lve lhypothse dhomoscdasticit inter-individuelle 2;i=

    2:

    8

  • 7/24/2019 UnitRoot_V10

    9/47

    Sous nos hypothses, quand T! 1 les moments Bi convergent vers une distribution dontlespranceE(Bi)est nulle puisqueE

    hWi(1)

    2 1i

    = 0. Ce rsultat provient tout simplement

    du fait que Wi(1)2 est distribu selon un 2 (1) : Lorsque N tend vers linni, lapplication du

    thorme central limite de Lindberg-Levy, nous permet de montrer que le terme de droite (quiest une moyenne surNde termesi:i:d:)converge son tour vers une loi normale. La variance de

    cette loi normale correspond tout simplement la variance de la quantit

    2=2h

    Wi(1)2 1

    i:

    Sachant que V arh

    Wi(1)2i

    = 2; on obtient par consquent :

    1pN

    NXi=1

    (22

    hWi(1)

    2 1i)

    l!N!1

    N

    0;

    42

    !

    Ainsi, on montre que la quantit N1=2PN

    i=1[Bi E(Bi)]converge squentiellement lorsqueT puis Ntendent vers linni vers une loi normale.

    1pN

    NXi=1

    Bi = 1pN

    NXi=1

    1TTXt=1

    yi;t1i;t! l!(T;N!1)

    seq

    N0; 42 ! (9)o (T; N! 1)seq dsigne la convergence squentielle lorsque T puis N tendent vers linni.Cest ainsi par ce type de raisonnement (dans le cas dune convergence squentielle) que lontablit lexistence de distributions asymptotiques normales, contrairement aux distributionsasymptotiques non standard que lon obtenait traditionnellement en sries temporelles lorsqueT! 1:

    Paralllement, on peut tablir la convergence en probabilit de la quantit N1PN

    i=1 Ai dela mme faon. Pour un Nx, on a :

    1

    N

    N

    Xi=1 Ai p!T!11

    N

    N

    Xi=1 2 Z 1

    0

    Wi(r)2 dr

    LorsqueNtend vers linni, la loi faible des grands nombres nous donne :

    1

    N

    NXi=1

    2

    Z 10

    Wi(r)2 dr

    p!N!1

    2 E

    Z 10

    Wi(r)2 dr

    Sachant que cette esprance est gale 1=2, on en dduit alors la convergence en probabilit

    squentielle du moment 1NPN

    i=1 Ai.

    1

    N

    NXi=1

    Ai = 1

    N

    NXi=1

    1

    T2

    TXt=1

    y2i;t1

    ! p!

    (T;N!1)seq

    22

    (10)

    Ainsi, partir des rsultats (9) et (10), on tablit immdiatement la distribution asympto-

    tique squentielle de lestimateurb de la racine autorgressive (quation 8).T

    pNb 1 = 1

    N

    NXi=1

    Ai

    !1 1p

    N

    NXi=1

    Bi

    ! l!

    (T;N!1)seq

    2

    2 N

    0;

    42

    !

    On retrouve ainsi le rsultat de Levin et Lin (1992) dans le cas du modle sans eet individuel.

    Tp

    Nb 1 l!

    (T;N!1)seq

    N(0; 2) (11)

    9

  • 7/24/2019 UnitRoot_V10

    10/47

    Notons la vitesse de convergence Tp

    Nde lestimateurb que lon retrouvera dans le cadre delapplication que ce soit des tests de premire ou de deuxime gnration.

    Il ne reste plus alors qu dterminer la distribution asymptotique squentielle de la statis-tique de test de Levin et Lin donne par lquation (7). Sachant que lestimateur s2 convergesquentiellement en probabilit vers la variance des rsidus 2; on a :

    t=1=h

    Tp

    Nb 1i 1

    s

    vuut 1N

    NXi=1

    Ail!

    (T;N!1)seq

    N(0; 2) 1

    r

    22

    On vrie alors que sous H0 la statistique de test de racine unitaire t=1 de Levin et Linconverge squentiellement vers une loi normale centre rduite :

    Modle 1 : t=1l!

    (T;N!1)seq

    N(0; 1) (12)

    Ainsi, contrairement au cas des sries temporelles o les statistiques de Dickey-Fuller suiventdes distributions non standard, la statistique de Levin et Lin en panel est asymptotiquementnormalement distribue. Le mme rsultat peut tre tabli dans le cas dune convergence lelong dune diagonale. En ce sens, on peut dire que le panel contribue rhabiliter lusagedes tables de la loi normale dans le cadre des tests de racine unitaire. On retrouve de lamme faon des distributions normales dans les modles avec eets individuels et/ou tendancedterministe. Seules les esprances et les variances de ces lois normales changent. Ainsi, Levinet Lin obtiennent les rsultats suivants en labsence dautocorrlation des rsidus :

    Modle 2 :p

    1:25t=1+p

    1:875N l!

    (T;N!1)seq

    N(0; 1)

    Modle 3 : r448277 t=1+ p3:75 N l!(T;N!1)seq N(0; 1)Pour nir, citons les travaux de Harris et Tzavalis (1999) qui proposent une extension des

    tests de Levin et Lin (1992), toujours sous lhypothse dabsence dautocorrlation des rsidus,pour des panels de taille T nie. Toutefois, ces premiers tests ne prennent pas en comptelventuelle autocorrlation des rsidus. Cest pourquoi prsent, nous allons nous intresser la mise en oeuvre des tests de Levin et Lin dans un cas gnral.

    2.2 Mise en oeuvre du test de Levin et Lin dans le cas gnral

    Dans le cas gnral, en prsence dune ventuelle autocorrlation des rsidus (i;k6= 0), letest de Levin et Lin est construit partir de modles de type Dickey-Fuller Augments (ADF)permettant de blanchir les rsidus et de se ramener des distributions connues pour les t-

    statistiques individuelles.

    Modle 1 : yi;t= yi;t1+

    piXs=1

    i;syi;ts+ i;t (13)

    Modle 2 : yi;t= i+ yi;t1+

    piXs=1

    i;syi;ts+ i;t (14)

    Modle 3 : yi;t= i+ i t + yi;t1+

    piXs=1

    i;syi;ts+ i;t (15)

    10

  • 7/24/2019 UnitRoot_V10

    11/47

    o i;t est i:i:d:

    0; 2;i

    : Etant donn que lordre des retards pi permettant de purger lau-tocorrlation des rsidus est a priori inconnu, Levin et Lin proposent une procdure de testen trois tapes applicable dans chacun des modles 1, 2 et 3. La manire dont Levin et Lin

    ont construit leur test implique que ces trois tapes ne ncessitent nalement aucune techniquedestimation propre aux donnes de panel : on peut donc utiliser les commandes de base delconomtrie des sries temporelles de tout logiciel pour le mettre en oeuvre.

    Etape 1 Construction dun estimateur de la racine autorgressive

    Lobjectif de cette premire tape consiste construire un estimateurb de la racine auto-rgressive commune: Pour cela, il convient tout dabord de dterminer, pour chaque individu,lordre des retards optimal pi:Puisque ce niveau, on raisonne sur la base de rgressions indivi-duelles indpendantes les unes des autres, les mthodes de slection du retard pi sont les mmesquen sries temporelles. La mthode la plus simple, dite du pmax, consiste se donner un ordremaximum de retard admissible pmax conditionnellement la dimension T des observations et tester la signicativit du dernier retard partir de la statistique de Student qui admet dansce cas une distribution standard (voir Salani, 1999). Il est galement possible de recourir une

    technique de vraisemblance pnalise consistant estimer plusieurs processus pour direntesvaleurs dep et retenir le modle minimisant les critres dinformation tels que ceux dAkaikeou de Schwarz.

    Une fois que lon dispose pour tous les individus du panel de lordre optimal des retards pi;i= 1;::;N; on peut alors estimer le paramtre . Levin et Lin nestiment pas directement cetteracine autorgressive partir des modles ADF. La raison de ce choix technique tient simplementau fait que la spcication dun paramtre de retardpidirent selon les individus rend malaiselapplication sous les logiciels usuels (Eviews, TSP, Limdep, Rats,...) des estimateurs de panels(estimateur MCO, communment appel estimateur Within dans ce cas). Ainsi, plutt quedestimer directement les modles (13), (14) ou (15), Levin et Lin estiment de faon quivalentedeux rgressions auxiliaires individu par individu. Par exemple, si lon considre le modle 2, ilconvient destimer pour chaque individu i = 1;::;N; les deux quations suivantes par MCO :

    Equation auxiliaire n1 : yi;t=bai+ piXs=1

    bbi;syi;ts+bei;t 8t= pi+ 2; : : ;T (16)Equation auxiliaire n2 : yi;t1 =bci+ piX

    s=1

    bdi;syi;ts+bvi;t 8t= pi+ 2; : : ;T (17)Dans le cas du modle 1, les quations auxiliaires sont identiques la dirence prs quil

    ny a pas de constante dans la rgression. Dans le cas du modle 3, il convient au contraire derajouter une tendance aux rgressions (16) et (17). On dispose alors de Nsries de ralisations

    des rsidus individuels f

    bei;tgTit=1 et f

    bvi;tgTit=1 o Ti= Tpi1dsigne le nombre dobservations

    disponibles pour lindividu i: On peut alors construire un estimateur convergent du paramtre

    en projetant directement lesPNi=1 Ti ralisations des rsidusbei;t sur lesPNi=1 Ti ralisationsdes rsidusbvi;t: Toutefois, an de contrler lhtroscdasticit inter-individuelle, on construitau pralable des sries de rsidus normaliss :

    eei;t=bei;tb;i evi;t=bvi;tb;i 8i= 1;::;N;8t = pi+ 2; : : ;T (18)o lestimateur de la variance individuelle des rsidusb2;i correspond lestimateur standardde la variance des rsidus du modle ADF (quation 13, 14 ou 15 suivant les cas). Pour unindividu i donn, cet estimateur peut tre simplement obtenu sans procder lestimation du

    11

  • 7/24/2019 UnitRoot_V10

    12/47

    modle ADF, de la faon suivante :

    b2;i= 1Tpi 1T

    Xt=pi+2 (bei;t bibvi;t)2 8t= pi+ 2; : : ;T (19)obidsigne lestimateur des MCO du paramtreidans la rgressionbei;t =bibvi;t1+i;tpourlindividui: Ainsi, partir des

    PNi=1 Ti ralisations des rsidus normaliss feei;tgTit=1 et fevi;tgTit=1

    pour i = 1;::;N; on construit alors un estimateur convergentb de la racine autorgressivecommune en appliquant les MCO aux observations empiles dans le modle :

    eei;t =b evi;t+ "i;t 8i= 1;::;N;8 t = pi+ 2; : : ;T (20)Etape 2 Estimation des ratios de variances individuelles

    Lobjectif de la deuxime tape consiste estimer la moyenne desNratiossi de la variancede long terme 2i du modle sur la variance de court terme des rsidus individuels

    2;i, pour

    i= 1; : : ;N :

    bSN= 1N

    NXi=1

    bsi = 1N

    NXi=1

    bib;i (21)Cest prcisment cette moyenne des ratios de variances individuelles qui va nous servir dans

    la dernire tape ajuster la moyenne de la distribution de la statistique de Student du test deracine unitaire.

    Etape 3 Construction de la statistique de test de Levin et Lin

    A partir de lestimateur des MCO

    b obtenu ltape 1, on construit la statistique associe

    au testH0 : = 0:De faon traditionnelle, on devrait utiliser pour cela la statistique de Student

    dnie par :t=0=

    bbb (22)ob2b dsigne un estimateur de la variance deb dni de faon standard par la quantit :

    b2b =b2e"" NXi=1

    TXt=pi+2

    ev2i;t#1

    Lestimateurb2e" de la variance des perturbations "i;t supposes tre homoscdastiques, estdni de faon usuelle par la quantit :

    b2e" = N

    Xi=1

    Ti!1

    "N

    Xi=1

    T

    Xt=pi+2

    (eei;t b evi;t)2# (23)Levin et Lin proposent dapproximer le nombre total dobservations

    PNi=1 Ti par la quantit

    NeT =N(Tp 1).Dans le cas du modle 1 (sans constante), Levin et Lin dmontrent que la statistique de

    test t=0 a une distribution asymptotique normale centre rduite sous lhypothse nulle deracine unitaire H0 : = 0: Toutefois, ds lors que la composante dterministe du modle estnon nulle (cas des modles 2 ou 3), cette statistique de test diverge vers1 sous H0: Il estdonc ncessaire pour ces deux modles de construire une statistique corrige centre et rduite

    12

  • 7/24/2019 UnitRoot_V10

    13/47

    permettant de se ramener dans tous les cas sous H0 une distribution normale centre rduite.Ainsi, de faon gnrale, la statistique de test de racine unitaire de Levin et Lin scrit commeune statistique de Student modie :

    Statistiques LL : t=0= 1

    m;eT

    t=0 NeTbSNb2e" bb m;eT

    ! 8m= 1; 2; 3 (24)

    o pour chaque modle (m = 1; 2 ou 3) suivant la dimensioneT = T p 1 avec p =(1=N)

    PNi=1pi; les auteurs proposent une valeur de la composante dajustement de la moyenne

    m;eT

    et de la composante dajustement de la variance m;eT

    : Ces valeurs sont reportes dans le

    tableau 2.

    Tab.2 Facteurs dAjustement de la t-Statistique Corrige

    eT q

    1;eT

    1;eT

    2;eT

    2;eT

    3;eT

    3;eT

    25 9 0:004 1:049 0:554 0:919 0:703 1:00330 10 0:003 1:035 0:546 0:889 0:674 0:94935 11 0:002 1:027 0:541 0:867 0:653 0:90640 11 0:002 1:021 0:537 0:850 0:637 0:87145 11 0:001 1:017 0:533 0:837 0:624 0:84250 12 0:001 1:014 0:531 0:826 0:614 0:81860 13 0:001 1:011 0:527 0:810 0:598 0:78070 13 0:000 1:008 0:524 0:798 0:587 0:75180 14 0:000 1:007 0:521 0:789 0:578 0:72890 14 0:000 1:006 0:520 0:782 0:571 0:710

    100 15 0:000 1:005 0:518 0:776 0:566 0:695250 20 0:000 1:001 0:509 0:742 0:533 0:603

    1 0:000 1:000

    0:500 0:707

    0:500 0:500

    S o u r c e : T a b l e 2 , p a g e 1 4 , L e v i n e t L i n ( 2 0 0 2 )

    Dans la premire colonne gure lapproximation moyenne de la dimension temporelle desobservationseT = (Tp 1) o p = (1=N)PNi=1pi: Pour une tailleeT donne, gure dansla deuxime colonne la valeur du paramtre de troncature qi retenu par Levin et Lin dans laprocdure destimation par noyau de la variance de long terme des rsidus (tape 2). Rappelonsque les auteurs nadoptent pas la dmarche dAndrews (1991) applique individu par individu,et imposent le mme paramtre de troncature pour tous les individus du panel qi = q;8i =1; : : ;N. On peut retrouver les valeurs des auteurs en retenant lentier le plus proche de la valeurq= 3:21eT1=3: Dans les colonnes suivantes gurent les facteurs dajustement de lesprance etde la variance de la statistique de Student pour les modles 1, 2 et 36 .

    Tout dabord, dans le cas du modle 1 (sans constante ni tendance), comme nous lavons pr-cis, la statistique de Student standardt=0(quation 22) converge asymptotiquement vers uneloi normale centre rduite : ds lors, il ny a pas besoin dapporter une quelconque correction cette statistique de test pour obtenir une distribution asymptotique normale :

    Modle 1: 1;eT

    p!eT!1

    0 et 1;eT

    p!eT!1

    1

    6 Il convient de souligner que les rsultats gurant dans ce tableau sont obtenus sous lhypothse de nullitdes pi, ce qui ne nous permet donc pas dapprhender linuence des retards sur les rsultats. De mme, le faitde retenir une valeur unique pour le paramtre de troncature q ne permet pas dapprcier limpact du choixde ce paramtre sur les rsultats. Nous reviendrons sur ces problmes par la suite en voquant notamment lasensibilit du test de Levin et Lin au nombre de retards retenus.

    13

  • 7/24/2019 UnitRoot_V10

    14/47

    Par consquent, dans ce modle, la statistique corrige t=0 converge asymptotiquement vers lastatistique de Student non corrige t=0; cette dernire statistique convergeant elle mme vers

    une loi normale centre rduite. Toutefois, pour des tailles dchantillonseTnies, Levin et Linproposent de corriger la statistique de Student, bien que les termes de correction soient trsfaibles pour lesprance et proches de lunit pour la variance, comme on peut le voir dans lestroisime et quatrime colonnes du tableau 1.

    En revanche, dans les modles 2 (avec eets individuels) et 3 (avec tendance) la statistiquede Studentt=0diverge ngativement. Les termes de correction de lesprance

    2;eT

    et3;eT

    sont

    donc asymptotiquement non nuls et les termes de correction de la variance 2;eT

    et 3;eT

    sont

    asymptotiquement dirents de lunit contrairement au cas prcdent.

    Sous lhypothse que lordre maximal des retards admissibles pmax (tape 1) crot unevitesse Tp avec 0 < p 1=4 et sous lhypothse que le paramtre de troncature qi (tape 2)crot une vitesse7 Tq avec 0 < q < 1, Levin et Lin tablissent la distribution asymptotiquede la statistique corrige t=0: Ils montrent que, sous lhypothse nulle de racine unitaire, cette

    statistique converge squentiellement et le long dune diagonale vers une loi normale centrerduite quel que soit le modle retenu :

    t=0l!

    T;N!1N(0; 1) avec

    pN =T! 0 (25)

    Ainsi, si la ralisation de la statistique corrige de Levin et Lin t=0est infrieure au seuil dela loi normale centre rduite (pour un test non symtrique 5% de risque de premire espcece seuil est gal 1:64), on rejette lhypothse nulle de racine unitaire pour lensemble desindividus du panel.

    Quel gain de puissance peut-on esprer dun test de racine unitaire en panel comparative-ment aux tests eectus sur sries temporelles ? Comme le montrent Levin et Lin, pour deschantillons de petite taille T on peut atteindre des puissances sensiblement plus importantes

    que celles obtenues dans le cas de tests mens sur sries temporelles individuelles. Tout dabord,la taille du test en panel est correcte, mme si elle est lgrement sous-estime dans des panelsde taille N modre. En labsence deets xes individuels (modle 1), on sait que pour depetites tailles dchantillon (T 50), la puissance des tests de Dickey-Fuller est relativementfaible (27% pour un risque de premire espce de 5% pour T= 25): Or, pour une mme tailleT; lapplication du test de Levin et Lin conduit des niveaux de puissance beaucoup plus im-portants et ce mme si le panel a une faible dimension individuelle N :Ainsi, avec seulement 10individus pourT = 25, la puissance du test de Levin et Lin est de lordre de 99% dans lexp-rience simule par les auteurs. Ces quelques expriences8 montrent quel point, pour une tailleempirique peu prs similaire, les gains de puissance peuvent tre importants dans le passage des tests de racine unitaire en panel lorsque la dimension temporelle est modre (T

  • 7/24/2019 UnitRoot_V10

    15/47

    3 Les tests dIm, Pesaran et Shin

    Comme nous lavons voqu, une des principales limites du test de Levin et Lin rside dans le

    caractre homogne de la racine autorgressive sous lhypothse alternative. Il est peu probableen eet quen cas de rejet de lhypothse de racine unitaire on puisse accepter lhypothsedune racine autorgressive i commune tous les individus si lon applique des tests usuels despcication9 . Les tests proposs par Im, Pesaran et Shin dans une srie de contributions (1997,2002 et 2003) permettent de rpondre cette critique. En eet, ces auteurs furent les premiers dvelopper un test autorisant sous lhypothse alternative non seulement une htrognitde la racine autorgressive

    i6=j

    , mais aussi une htrognit quant la prsence dune

    racine unitaire dans le panel.

    Im, Pesaran et Shin (IPS par la suite) considrent un modle avec eets individuels et sanstendance dterministe (quivalent du modle 2 chez Levin et Lin). En labsence dautocorrla-tion des rsidus, ce modle scrit :

    Modle IPS: yi;t= i+ iyi;t1+ "i;t (26)

    o leet individuel i est dni par i =ii avec i2 R et o "i;t s N:i:d:

    0; 2";i

    : Letest dIPS, tout comme le test de Levin et Lin est un test joint de lhypothse nulle de racineunitaire(i = 0)et de labsence deets individuels puisque sous lhypothse nulle i= 0:

    Test IPS : H0 : i= 0;8i= 1; : : ;NH1 : i< 0;8i= 1; 2; : : ;N1

    i= 0;8i= N1+ 1; N1+ 2; : : ;N

    Sous lhypothse alternative peuvent coexister deux types dindividus : des individus indicsi = 1; : : ;N1 pour lesquels la variable yi;t est stationnaire et des individus indics i = N1 +1; : : ;Npour lesquels la dynamique de la variable yi;t admet une racine unitaire:La tailleN1 de

    lensemble des individus stationnaires est a priori inconnue mais vrie 0 < N1 N, puisquesi N1 = 0 on retrouve alors lhypothse nulle. On admet en outre que le ratio N1=N vrielimN!1 N1=N=avec0 < 1:

    Ainsi, le premier avantage de lapproche dIPS par rapport Levin et Lin tient la priseen compte de lhtrognit de la racine autorgressive sous lalternative. Mais ce nest pasle seul avantage. Comme nous allons le voir, les auteurs proposent une statistique de test trssimple fonde sur la moyenne des statistiques de Dickey-Fuller ou de Dickey-Fuller Augmentesindividuelles.

    Sous lhypothse dabsence dautocorrlation des rsidus, IPS drivent la loi asymptotiquede leur statistique moyenne (lorsque T etNconvergent vers linni) mais aussi la loi semi-asymptotique lorsque T est xe et N converge vers linni. Dans ce cas, il est en eetpossible de driver la loi exacte de la statistique de test de racine unitaire pour une taille

    Tquelconque, contrairement la statistique de Levin et Lin. IPS proposent mme dansce cas des approximations des seuils de rejet distance nie pourT etN xes.

    En revanche, sous lhypothse dautocorrlation des rsidus, on ne peut plus caractriserla loi exacte de la statistique moyenne pour une taille Tdonne : IPS drivent dans cecas les lois asymptotiques pour T et Ntendant vers linni (soit de faon squentielle,soit le long dune diagonale) et proposent deux statistiques moyennes standardises. Onretrouve encore une fois une distribution normale.

    9 Voir Hurlin (2001) pour les tests dhomognit dans le cas dun modle linaire et Phillips et Sul (2003a)pour un test dhomognit de la racine autorgressive.

    15

  • 7/24/2019 UnitRoot_V10

    16/47

    3.1 Une moyenne de statistiques individuelles

    Considrons le cas le plus simple o les rsidus "i;tdu modle (26) sontN:i:d:

    0; 2";i

    et o la

    taille dchantillon disponible pour lestimation de chaque quation individuelle est identique10

    pour tous les pays: Ti= Tj =T :Tout comme Levin et Lin, IPS supposent que les rsidus sontindpendants dans la dimension individuelle. Dans ce cas, ils proposent une statistique de testnotet_barNT dnie par la moyenne des Nstatistiques individuelles de Dickey-Fuller :

    t_barNT = 1

    N

    NXi=1

    tiT (27)

    o tiT correspond la statistique de Student associe11 lhypothse nulle i = 0 dans lemodle (26).

    Quelle est la loi de cette statistique moyenne t_barNT sous H0? Commenons par voquerle cas de la distribution asymptotique lorsque les deux dimensions N etTtendent vers linni.

    Pour ce faire, nous considrerons le cas le plus simple de la convergence squentielle lorsque Tpuis N tendent vers linni. On sait que sous lhypothse nulle de non stationnarit i = 0; lastatistique du test joint de Dickey-Fuller de lindividu i converge lorsque T tend vers linnivers une distribution non standard (Dickey et Fuller, 1979) dnie par :

    tiTd!

    T!1

    12

    hWi(r)

    2 1i

    Wi(1)R10

    Wi(r)drR10 Wi(r)

    2 dr hR1

    0 Wi(r)dri2 12 8i= 1; : : ;N (28)

    o les variables Wi(r) ; pour i = 1;::;N; dsignent des mouvements Browniens standard in-dpendants. On sait en outre que cette distribution asymptotique admet des moments dordredeux nis (Nabeya, 1999), avec E(tiT) =1:533 et V ar (tiT) = 0:706 quand T! 1: Deplus, sous lhypothse dindpendance inter-individuelle des rsidus, on peut montrer que lesstatistiques individuellestiTsont indpendantes. Ainsi, en rsum, lorsque la dimension T tendvers linni, les statistiques individuelles tiT sont (i) identiquement et (ii) indpendammentdistribues selon une distribution admettant (iii) des moments dordre deux nis. Or, la sta-tistique de test dIPS nest rien dautre que la moyenne sur Nde ces statistiques individuelles.Il sut donc, dans un second temps de faire tendre Nvers linni et dappliquer le thormecentral limite de Lindberg-Levy an de montrer que la moyenne de ces N statistiques indi-viduelles converge vers une loi normale. En dnitive, lorsque T puis N tendent vers linni,t_barNT converge vers une loi normale. On dnit alors une variable moyenne standardiseZtbar convergeant une loi normale centre rduite.

    Ztbar =

    pN(t_barNT+ 1:533)p

    0:706

    l!(T;N!1)

    seq

    N(0; 1) (29)

    En outre, par ce mme raisonnement, IPS peuvent tablir la loi exacte (sous lhypothsedabsence dautocorrlation des rsidus) de leur statistique pour une taille T xe lorsque Ntend vers linni. Ce rsultat est particulirement intressant pour les applications dans le casdes panels macro-conomiques o la taille est gnralement faible, de lordre de 30 points.

    10 Dans le cas contraire, on conserve les mmes lois asymptotiques et semi-asymptotiques, mais la dmonstra-tion de ce rsultat requiert lapplication du thorme limite de Lyapunov et non plus celui de Lindberg-Levy.En eet, dans ce cas, les statistiques individuelles ne sont plus identiquement distribues Ti ni.

    11 IPS considrent deux dnitions notesetiT et tiT de la statistique de Student suivant la dnition delestimateur de la variance des rsidus. Nous considrerons ici la statistique tiT programme sous les logicielsusuels.

    16

  • 7/24/2019 UnitRoot_V10

    17/47

    Contrairement au cas o T tend vers linni, on ne connat pas la distribution exacte de lastatistique individuelle tiT pour une taille Tdonne. Pour autant, il est possible de montrerque la distribution de la moyenne t_barNT converge vers une loi normale lorsque N tend vers

    linni en utilisant toujours le thorme central limite de Lindberg-Levy. Pour ce faire, il convientde montrer les points (i), (ii) et (iii) sans connatre la distribution exacte des tiT pour un Txe. Lastuce dIPS consiste alors exprimer les statistiques de Dickey-Fuller sous la forme dunproduit de ratios de formes quadratiques dnies dans un vecteur normal, puis appliquer lethorme de Magnus (1986). Ce thorme permet, sous des conditions trs gnrales, de driverles moments exacts dun ratio de formes quadratiques dnies dans un vecteur normal, ainsi queles conditions dexistence de ces moments. Ainsi, en utilisant une ingalit de Cauchy-Schwarz,on peut driver trs simplement une condition12 qui garantit que les moments dordre deuxdes statistiques individuelles sont nis : cette condition se ramne tout simplement lingalitT 6. Ds lors sous cette condition, lapplication du thorme central limite13 nous permetdtablir la loi exacte de la statistique moyenne standardise, note Ztbar :

    Ztbar

    =

    pN[t_barNT E(tiT)]pV ar (tiT) l!N!1 N(0; 1) si T 6 (30)

    o E(tiT) et V ar (tiT) dsignent respectivement lesprance et la variance de la statistiquede Dickey-Fuller. Lorsque T tend vers linni, ces moments tendent vers les moments de ladistribution asymptotique de Dickey-Fuller et lon retrouve la statistique standardise (29).Toutefois, pour des tailles dchantillon Tplus petites, lutilisation des moments de la distri-bution asymptotique de Dickey-Fuller peut conduire une perte de puissance des tests. Cestpourquoi IPS proposent des valeurs simules pour ces deux moments pour direntes taillesT (voir tableau 3). Prenons par exemple le cas dun panel de taille T = 10 avec N = 5: Onconstruit la statistique moyenne standardise Ztbar partir de la statistique moyenne t_barNTen utilisant E(tiT) =1:504 et V ar (tiT) = 1:069. Pour un risque de premire espce de %;on compare alors la ralisation de Ztbar au seuil z de la loi normale centre rduite obtenuesous lhypothseN

    ! 1. Pour un risque de 5%, si la ralisation de Ztbar est infrieure au seuil

    1:64on rejette lhypothse nulle de racine unitaire pour lensemble des individus du panel.

    Enn, partir de la loi exacte de la statistique standardise Ztbar obtenue sous lhypothseN! 1; IPS proposent des approximations des seuils pour la statistique moyenne t_barNTdansle cas dchantillons de petite dimension N. Ces valeurs critiques approximes notes cT(),pour un niveau de risque de premire espce de %; peuvent tre obtenues par la formulesuivante :

    cT() = zp

    N1V ar (tT) + E(tT) (31)

    o z dsigne la valeur critique associe une distribution normale centre rduite pour unniveau de risque de %: Reprenons lexemple dun panel de taille T = 10 avec N = 5: Onpeut tester la racine unitaire partir de la statistique Ztbar: Toutefois, lutilisation de la loisemi-asymptotique obtenue sous lhypothse N! 1 pour un panel de cette dimension peutconduire une faible puissance ou des distorsions de taille. Une autre solution consiste comparer directement la ralisation de la statistique moyenne t_barNT au seuil approxim

    12 Il convient de prciser que cette condition thorique ne peut tre drive qu partir des statistiques in-dividuelles non corrigesetiT: Mais la mme condition est obtenue par simulation dans le cas des statistiquescorrigestiT.

    13 Dans le cas dun panel non cylindr o les tailles Ti dirent selon les individus, on obtient le mme rsultatasymptotique ds lors que Ti 10;8i= 1; : : ;Navec :

    Ztbar =

    pNht_barNT N1

    PNi=1E(tiT)

    iq

    N1PN

    i=1V ar (tiT)

    l!N!1

    N(0; 1)

    puisque les moments individuels E(tiT) et V ar (tiT) varient selon la taille Ti (tableau 3).

    17

  • 7/24/2019 UnitRoot_V10

    18/47

    Tab.3 Moments des Statistiques Individuelles tiT

    T E(tiT) V ar (tiT)

    6 1:520 1:74510 1:504 1:06915 1:514 0:92320 1:522 0:85125 1:520 0:80930 1:526 0:78940 1:523 0:77050 1:527 0:760

    100 1:532 0:735500 1:531 0:7151 1:533 0:706

    S o u r c e : T a b l e 1 , p a g e 6 0 , I P S ( 2 0 0 3 )

    cT() pour une taille N = 5: Dans notre exemple, pour un risque de premire espce de 5%,en utilisant les moments simuls du tableau 3, on montre que le seuil approxim est gal cT() =1:64

    p51 1:069 1:504 =2: 2623: Si la ralisation de la statistique moyenne

    t_barNT est infrieure ce seuil, on rejette lhypothse nulle. IPS montrent que les seuilsapproxims sont trs proches des seuils de la vraie loi N ni de la statistique moyennet_barNT obtenus par simulation.

    En rsum, en labsence dautocorrlation des rsidus, ds lors que T 6 pour un panelcylindr, la statistique standardise Ztbar suit sous lhypothse nulle de racine unitaire une loinormale lorsqueNtend vers linni. Cest encore une fois lune des principales dirences avecles tests sur sries temporelles, o les distributions asymptotiques des statistiques sont non

    standard.

    3.2 Mise en oeuvre du test dans le cas gnral

    A prsent plaons nous dans le cas gnral o il existe une ventuelle autocorrlation desrsidus. On considre un modle de type Dickey-Fuller Augment (ADF) pour chaque individui= 1; : : ;Ndu panel :

    Modle IPS: yi;t= i+ iyi;t1+

    piXj=1

    i;jyi;tj+ "i;t (32)

    o leet individueliest dni pari = iiaveci2 R et o"i;test N:i:d:

    0; 2i

    :Commepour tous les tests de premire gnration, les rsidus sont indpendamment distribus dans la

    dimension individuelle. On remarque quIPS autorisent la prsence dune autocorrlation desrsidus dordre dirent pour chaque individu du panel. Ceci implique que le nombre de termesADF dire a priori suivant les individus pi6= pj comme dans le test de Levin et Lin. Leshypothses nulle et alternative du test sont les mmes que dans le cas prcdent. Pour mener bien ce test, IPS proposent nouveau dutiliser la moyenne des statistiques individuelles ADF :

    t_barNT = 1

    N

    NXi=1

    tiT(pi; i) (33)

    o tiT(pi; i) correspond la statistique individuelle de Student associe lhypothse nulleH0;i: i= 0dans le modle (32) pour un nombre de retards piet un vecteur de paramtres ADF

    18

  • 7/24/2019 UnitRoot_V10

    19/47

    i=

    i;1; : : ;i;pi0

    :Il sagit de la statistique ADF standard obtenue partir dun modle avecconstante et qui est programme dans la plupart des logiciels usuels pour un retard pi donn.Pour chaque individu, le choix du retard optimalpi permettant de purger lautocorrlation des

    rsidus peut tre choisi de la mme faon que dans le cas des tests de Levin et Lin.

    A partir des N statistiques ADF individuelles tiT(pi; i), on construit la statistique stan-dardiseZtbar(p; ) centre sur lesprance de la distribution asymptotique de la statistiqueindividuelle ADF et rduite par la variance de cette mme distribution :

    Ztbar(p; ) =

    pN [t_barNT E()]p

    V ar ()(34)

    o les moments E()et V ar ()correspondent lesprance et la variance de la distributionasymptotique (quand T! 1) dune statistique ADF sous lhypothse nulle de racine unitaire(i= 0) dans un modle avec constante. Comme nous lavons prcis, ces moments sont respec-tivement gaux E(tiT) =

    1:533et V ar (tiT) = 0:706. Ainsi, on peut trs facilement montrer

    que la statistique Ztbar(p; ) converge squentiellement vers une loi normale centre rduitelorsqueT puis Ntendent vers linni.

    Il est vident toutefois que cette approche fonde sur la distribution asymptotique peutposer problme dans des panels de petite taille T. Cest pourquoi IPS proposent une secondestatistique standardise, noteWtbar(p; ) ;qui asymptotiquement possde la mme distributionqueZtbar(p; ) ;mais qui en outre possde lavantage dtre beaucoup plus puissante distancenie. Cest gnralement la statistique de test dIPS que lon retient14 , puisque cest la plusgnrale (elle tient compte de lautocorrlation des rsidus) et la plus puissante. Cette statistiquestandardise est dnie de la mme faon que Ztbar(p; ) la dirence prs que lon centre etlon rduit partir des moments de la statistique ADF obtenue sous lhypothse nulle de racineunitaire (comme pourZtbar(p; )) et sous lhypothse que les paramtres i des termes ADFsont nuls pour tous les individus. Ces moments sont respectivement notsE[ tiT(pi; 0)

    ji= 0]et

    V ar [ tiT(pi; 0)j i = 0]. Il convient de noter que ces moments tiennent compte de linformationcontenue dans le nombre de retardspi:Asymptotiquement, cette statistique dIPS standardiseconverge vers la mme distribution que la statistique Ztbar(p; ):

    Wtbar(p; ) =

    pN

    ht_barNT N1

    PNi=1 E[ tiT(pi; 0)j i = 0]

    iq

    N1PN

    i=1 V ar [ tiT(pi; 0)j i= 0]l!

    T;N!1N(0; 1) (35)

    Les moments E [ tiT(pi; 0)j i = 0] et V ar [ tiT(pi; 0)j i= 0] ont t tabuls pour direntsordres de retards pi et direntes tailles Tpar les auteurs. Certaines valeurs pour le modlesans tendance sont reportes dans le tableau 4. Tout comme pour les rsultats de la sectionprcdente, ces rsultats peuvent tre tendus au cas de panels non cylindrs prsentant destaillesTi direntes selon les individus.

    Les simulations menes par IPS montrent quen labsence de corrlation, la statistique Ztbar(quation 30) conduit de trs bons rsultats en termes de taille et de puissance et ce mmeen petit chantillon (T = 10). Lorsque le nombre de retards est correctement choisi ou sur-estim, la taille du test Ztbar est trs satisfaisante, mme pour T = 10. De plus, la puissanceest largement suprieure celle dun test de Dickey-Fuller men sur sries temporelles. Un telrsultat illustre lapport de la dimension individuelle comparativement la prise en compte

    14 Cest le cas dans la prsentation de Banerjee (1999), mais pas dans celle de Baltagi et Kao (2000) quiprivilgient la statistique Ztbar(p; ) : Toutefois, IPS (2003) nvaluent la puissance de leur test qu partir dela statistique Wtbar(p; ) :

    19

  • 7/24/2019 UnitRoot_V10

    20/47

    Tab.4 Moments des Statistiques Individuelles tiT(pi; 0)

    pi = 0 pi = 1 pi= 2 pi= 3 pi= 4

    T Mean Var Mean Var Mean Var Mean Var Mean Var 10 1:504 1:069 1:488 1:255 1:319 1:421 1:306 1:759 1:171 2:08015 1:514 0:923 1:503 1:011 1:387 1:078 1:366 1:181 1:260 1:27920 1:522 0:851 1:516 0:915 1:428 0:969 1:413 1:037 1:329 1:09725 1:520 0:809 1:514 0:861 1:443 0:905 1:433 0:952 1:363 1:00530 1:526 0:789 1:519 0:831 1:460 0:865 1:453 0:907 1:394 0:94640 1:523 0:770 1:520 0:803 1:476 0:830 1:471 0:858 1:428 0:88650 1:527 0:760 1:524 0:781 1:493 0:798 1:489 0:819 1:454 0:84260 1:519 0:749 1:519 0:770 1:490 0:789 1:486 0:802 1:458 0:81970 1:524 0:736 1:522 0:753 1:498 0:766 1:495 0:782 1:470 0:801

    100 1:532 0:735 1:530 0:745 1:514 0:754 1:512 0:761 1:495 0:771S o u r c e : I m , P e s a r a n e t S h i n ( 2 0 0 3 ) , T a b l e 3 , p a g e 6 6

    de la seule dimension temporelle. Des rsultats allant dans le mme sens sont obtenus par lesauteurs dans le cas dune autocorrlation des rsidus sur la base de la statistique Wtbar(p; ),mais il convient alors que T etNsoient susamment importants.

    Par ailleurs, ces simulations montrent que le choix du nombre de retards pi dans les r-gressions ADF individuelles est crucial. On connat traditionnellement ce problme en sriestemporelles (Ng et Perron, 1995 ou Lopez, 1997). Si lon surestime le nombre de retards, lapuissance du test ADF est dtriore, mais le problme est plus fondamental si le nombre deretards est sous valu : dans ce cas la paramtrisation du modle ne permet pas de blanchirtotalement les rsidus, en consquence de quoi les distributions asymptotiques de Dickey-Fullerne sont plus valides. Il est donc vident quen panel, la puissance de la statistique Ztbar(p; )

    dIPS fonde sur une moyenne de statistiques ADF et standardise partir des moments E()etV ar ()de la distribution asymptotique de Dickey-Fuller est extrmement sensible au choixdes retardspi:Si lorsqueTtend vers linni, une ou plusieurs statistiques ADF individuelles neconvergent plus vers parce que lon a sous estim pi;la statistique standardiseZtbar(p; )naplus de sens. Il en va de mme pour Wtbar(p; ). A titre dexemple, les auteurs montrent quelorsque lon retient de manire errone un nombre de retards gal zro, la taille du test tendvers zro. Notons que ce problme se pose avec autant dacuit dans le cas du test de Levin etLin.

    4 Le test de Maddala et Wu

    Le troisime test de cette premire gnration est un test non paramtrique de Fisher (1932)initialement appliqu ltude de la PPA par Choi15 (2001) et prsent de faon gnrale parMaddala et Wu (1999). Le principe est simple et repose sur une combinaison des niveaux designicativit (cest--dire des p-values) deNtests individuels de racine unitaire indpendants.Soitpi= FTi(Gi)la p-value associe une statistique de testGi de lhypothse nulle de racineunitaire pour un individu i donn o FTi(:) dsigne la fonction de rpartition associe lastatistique individuelle Gi pour un chantillon de taille Ti: La statistique de test Gi peut trechoisie comme la t-statistique dun test ADF; o la statistique de nimporte quel autre testde lhypothse nulle de racine unitaire (Phillips et Perron, 1988, Elliott, Rothenberg et Stock,1996,etc.). Il existe alors de trs nombreuses faons de combiner les p-values an de construire

    15 La version document de travail date de 1999 : Choi I. (1999), Unit Root Tests for Panel Data, Manuscript,Kookmin University, Core.

    20

  • 7/24/2019 UnitRoot_V10

    21/47

    un test de racine unitaire en panel (en utilisant le minimum, la somme, etc.). Maddala et Wu(1999) retiennent la statistique de test dnie par la quantit :

    PMW = 2NXi=1

    ln (pi) (36)

    Si les statistiques individuelles de test sont continues, les p-values sont distribues selon deslois uniformes sur [0; 1] et ln (pi) est distribue selon un

    2 (1) ;8i = 1;::;N: Maddala et Wu(1999) considrent le cas o les statistiques individuelles sont indpendantes. Tout comme IPSou Levin et Lin, ce test est donc un test de premire gnration reposant sur lexclusion dunequelconque relation entre les statistiques individuelles et plus gnralement sur labsence decorrlation inter-individuelle. Sous cette hypothse, la statistique PMW suit, sous lhypothsenulle de racine unitaire, un 2 (2N)quelle que soit la taille Nde lchantillon. Pour un risquede premire espce donn, si la ralisation de PMW est suprieure au seuil dun 2 (2N) onrejette lhypothse nulle de racine unitaire pour les individus du panel.

    Pour des valeurs leves de N, Choi (2001) suggre dutiliser la statistique standardisesuivante :

    ZMW =

    pN

    N1PMW E[2 l n (pi)]p

    V ar [2 l n (pi)]=

    1

    2p

    N

    NXi=1

    [2 l n (pi) 2] (37)

    En eet, sous lhypothse de continuit de la statistique Gi; on sait que E[2 l n (pi)] = 2 etV ar [2 l n (pi)] = 4: La statistique de Choi correspond ainsi tout simplement une statistiquemoyenne de type N1PMW centre et rduite. Si lon suppose que les p-values sont i:i:d:,lutilisation du thorme de Lindberg-Levy nous permet de conclure que la statistique rduiteZMWsuit sous H0 une loi N(0; 1) lorsque N tend vers linni.

    Tout comme le test propos par IPS, le test de Maddala et Wu (1999) ne retient pas lhypo-thse alternative restrictive du test de Levin et Lin selon laquelle le coecient autorgressifiest le mme pour tous les individus. Ce test est donc directement comparable au test IPS et luiest trs similaire. Les deux tests reposent sur une combinaison de statistiques individuelles : desstatistiques ADF chez IPS et des seuils de signicativit chez Maddala et Wu. Les deux testspeuvent tre appliqus sur des panels non cylindrs16 et on peut ventuellement tablir soit laloi exacte (chez Maddala et Wu), soit une approximation des seuils (chez IPS) de la statistiquede test pour une tailleN xe.

    Quels sont donc les avantages respectifs des deux tests ? Les deux tests peuvent tout dabordtre compars en termes de taille empirique et de puissance (contrairement au test de Levinet Lin qui nadmet pas la mme hypothse alternative). Maddala et Wu considrent une sriedexpriences dans lesquelles leur statistique de Fisher est construite partir des p-values dest-statistiques des tests ADF individuels. Il ressort que ce test de Fisher domine lgrement le

    test dIPS, puisque pour des tailles empiriques similaires la puissance du test est lgrementaugmente. Lorsque T est susamment grand (T = 50 ou 100); les puissances sont compa-rables, mais les distorsions de taille sont moins importantes avec le test de Maddala et Wu.Un autre avantage traditionnel dune approche non paramtrique comme celle de Maddala etWu rside dans la robustesse notamment une erreur de spcication sur la distribution desrsidus (supposs normalement distribus chez IPS). En revanche, le principal inconvnientempirique de lapproche de Maddala et Wu provient de la ncessit de simuler par Bootstrap

    16 Contrairement ce qui est avanc dans la synthse de Baltagi et Kao (2000) fonde sur la version de 1997du papier dIPS.

    21

  • 7/24/2019 UnitRoot_V10

    22/47

    les distributions des statistiques individuelles an de construire les p-values individuelles17 . Alinverse, on a vu que les statistiques standardises des tests dIPS peuvent tre construites partir des moments fournis par les auteurs, ce qui en facilite dautant la mise en oeuvre.

    5 Le test de stationnarit de Hadri (2000)

    Se dmarquant des trois tests de racine unitaire de premire gnration prsents prcdem-ment qui reposaient sur lhypothse nulle de non stationnarit, le test de Hadri (2000) est bassur lhypothse nulle de stationnarit. Ce test consiste en une extension du test de stationnaritpropos par Kwiatkowski et al. (1992) dans le cadre de lconomtrie des sries temporelles. Ilsagit dun test du multiplicateur de Lagrange visant tester lhypothse nulle de stationnaritdes sriesyi;t (pouri = 1;:::;N) contre lhypothse alternative de racine unitaire. Hadri (2000)considre les deux modles suivants :

    yi;t= ri;t+ "i;t (38)

    etyi;t= ri;t+ it + "i;t (39)

    o ri;t est une marche alatoire : ri;t = ri;t1 + ui;t, ui;t est i:i:d:

    0; 2u

    , ui;t et "i;t tantindpendants. Lhypothse nulle peut alors scrire 2u = 0. Par ailleurs, dans la mesure o les"i;t sont supposs i.i.d., alors, sous lhypothse nulle, yi;t est stationnaire en niveau pour lemodle (38) et stationnaire autour dune tendance dterministe pour le modle (39). Le modle(38) peut encore scrire :

    yi;t= ri;0+ ei;t (40)

    et le modle (39) :yi;t= ri;0+ it + ei;t (41)

    avec ei;t =Ptj=1 ui;j +"i;t, ri;0 tant des valeurs initiales jouant le rle de constanteshtrognes.

    Il convient de remarquer que si 2u = 0, alors ei;t "i;t est stationnaire (ri;t est uneconstante). Si 2u6= 0, ei;t est non stationnaire (ri;t est une marche alatoire). Plus spci-quement, Hadri (2000) teste lhypothse nulle = 0 contre lhypothse alternative > 0 o = 2u=

    2": En notant ei;t les rsidus estims de (40) ou (41), la statistique LM est donne

    par :

    LM= 1

    2"

    1

    N T2

    NXi=1

    TXt=1

    S2i;t

    ! (42)

    o Si;t dsigne la somme partielle des rsidus : Si;t =

    Ptj=1ei;j et

    2" est un estimateur

    convergent de 2

    "

    . Sous lhypothse nulle de stationnarit en niveau (modle (38)), la statis-tique de test :

    Z=

    pNn

    LM EhR1

    0 V(r)2dr

    ior

    VhR1

    0V(r)2dr

    i (43)suit une loi normale centre rduite, o V(r)est un pont brownien standard, pour T! 1 suivide N! 1. Les cumulants de la fonction caractristique de R1

    0V2 donnent respectivement

    17 Nous faisons gurer inconvnient empirique entre guillemets dans la mesure o il va de soi que cet argumentpurement empirique ne doit pas constituer un frein la mise en oeuvre du test de Maddala et Wu et ne constitueen aucun cas un critre de choix entre les tests.

    22

  • 7/24/2019 UnitRoot_V10

    23/47

    la moyenne et la variance deR10

    V(r)2 intervenant dans (43) : 1=6 (cumulant dordre 1) pourlesprance et1=45 (cumulant dordre 2) pour la variance (voir Hadri, 2000 pour les dtails).

    Sous lhypothse nulle de stationnarit autour dune tendance dterministe (modle (39)),

    la statistique de test :

    Z=

    pN

    LM EhR1

    0V2(r)

    2dri

    rVhR1

    0 V2(r)2dr

    i (44)suit une loi normale centre rduite, oV2(r) = W(r)+(2r3r2)W(1)+6r(r1)

    R10

    W(s)ds

    (voir Kwiatkowski et al. (1992)). La moyenne et la variance deR10

    V22 sont donnes par les deuxpremiers cumulants soit, respectivement, 1/15 et 11/6300.

    Pour nir, notons que Hadri (2000) a propos une extension de son test consistant relcherlhypothse selon laquelle les erreurs "itsontiidan de tenir compte de la prsence de corrlationsrielle.

    An dtudier les performances de son test, Hadri (2000) a men des simulations de MonteCarlo. Celles-ci font globalement ressortir que la prcision du test est dautant plus importanteque T et N sont susamment importants. Plus spciquement, la taille du testZ est prochede la taille thorique de 5% pour T > 10 et la taille du test Z est correcte pour T > 25.Concernant la puissance, il ressort que celle-ci augmente avec la valeur de pour toutT etN.

    6 Comparaison et bilan des tests de premire gnration

    Les simulations de Im et al. ont pour objet de comparer les performances des tests de Levinet Lin (LL) et dIPS (Ztbar). Les principaux rsultats peuvent snoncer comme suit :

    En labsence de corrlation srielle, et comparativement au testZtbar, le test LL a tendance rejeter trop frquemment lhypothse nulle lorsque Naugmente. Par ailleurs, pour defaibles valeurs de T, le testZtbar donne de meilleurs rsultats que le test LL en termes depuissance.

    En prsence de corrlation srielle, le test LL tend nouveau rejeter trop frquemmentlhypothse nulle, ceci tant dautant plus marqu que Nest lev. Il ressort galement quele test Ztbar est plus puissant que le test LL. De manire gnrale, lorsque le nombre deretards dans les rgressions ADF est correctement choisi ou sur-estim, les performancesdu test Ztbar sont meilleures que celles du test LL.

    Les simulations eectues par Breitung (2000) ont galement pour objet de comparer lesperformances des testsZtbar et LL. Celles-ci font ressortir que la puissance de ces deux tests esttrs sensible la spcication des termes dterministes et tend diminuer fortement lorsquedes tendances spciques individuelles sont inclues.

    Selon Maddala et Wu (1999) et Levin et al. (2002), les comparaisons directes entre lestests LL et Ztbar ne sont pas valides car, mme si les deux tests reposent sur une hypothse

    nulle identique, lhypothse alternative est dirente. On rappelle en eet que, sous lhypothsealternative, le coecient autorgressif est le mme pour tous les individus pour le test LL, alorsque ce mme coecient peut direr entre les individus pour le testZtbar. Par ailleurs, Maddalaet Wu (1999) ont men des simulations an de comparer leur test (MW), le test LL et le testZtbar. Selon ces auteurs, le test Ztbar et le test MW sont directement comparables ds lorsque le test de racine unitaire utilis est le test ADF. Leurs simulations mettent en vidence lesrsultats suivants :

    Pour des tailles dchantillon gales entre les individus, lorsque le coecient autorgressifi nest pas trop variable et proche de 1, le test Ztbar est plus puissant que le test MW.Lorsque, sous lhypothse alternative,inest pas trop proche de 1 (par exemplei = 0; 8),

    23

  • 7/24/2019 UnitRoot_V10

    24/47

    le test MW est plus puissant que le test Ztbar. Dans tous les cas, les tests Ztbar et MWsont plus puissants que le test LL.

    Pour des tailles dchantillon ingales, le test MW est plus performant que les testsZtbar

    et LL. En prsence de corrlation dans les termes derreur entre les individus, le test MW est plus

    performant en termes de taille que le test Ztbar, pour T grand et un nombre dindividusmodr. LorsqueT etNsont grands, la taille du test MW est comparable celle du testZtbar.

    Maddala et Wu (1999) concluent alors de manire gnrale que leur test est plus performantque les testsZtbar et LL. Les simulations menes par Choi (1999), visant galement comparerles performances des tests Ztbar et de MW, montrent que la taille des deux tests est proche dela taille thorique de 5% lorsque N est faible et que la taille du test Ztbar est plus stable quecelle du test MW. En termes de puissance (corrige par la taille), il ressort que le test MWdonne de meilleurs rsultats que le test Ztbar. Enn, la puissance des deux tests diminue defaon trs importante lorsquest introduite une tendance dterministe.

    Concernant le test de Hadri (2000), on peut simplement noter quun de ses avantages rside

    dans des considrations purement empiriques : les moments de sa distribution asymptotiquesont drivs de manire exacte et nont donc pas tre drivs de simulations.

    Au del de leurs spcicits, ces tests de premire gnration butent sur deux problmesidentiques : le problme du caractre htrogne de la racine unitaire et le problme de lindpen-dance inter-individuelle. Le premier problme concerne uniquement les tests dIPS et Maddalaet Wu et tient au fait que lhypothse alternative autorise la prsence dun sous ensemble din-dividus (de taille N1 chez IPS) dont la variable dintrt suit un processus stationnaire. Or,lajout ou le retrait dun pays dans le panel peut dans ce cas modier radicalement la conclu-sion des tests en faveur ou en dfaveur de lhypothse nulle de racine unitaire. Cest par exemplele cas dans ltude de Choi (2001) sur la validit de la PPA dont les rsultats dirent suivantlinclusion ou non du Japon. Ceci indique clairement que lhypothse nulle de ces tests, savoirla prsence dune racine unitaire pour lensemble des individus du panel, nest sans doute pas

    lhypothse qui prsente le plus grand intrt pour les conomistes dans de nombreuses probl-matiques. Dans une dmarche proche du data mining, on aimerait tre en mesure didentierdeux ensembles dindividus : un ensemble avec racine unitaire (absence de convergence des PIBpar exemple) et un ensemble pour lesquels la variable est stationnaire (convergence des PIB).Cest le cas sous lhypothse alternative dIPS mais lon ne connat pas la taille N1 du groupedindividus stationnaires, ni les individus appartenant cet ensemble. Lidentication de cesdeux groupes suppose ladoption dune dmarche squentielle. Il sagirait alors deectuer untest de racine unitaire avec par exemple le Japon, puis de refaire le test sur le mme chantillonsans le Japon. Toutefois, il convient alors de contrler le risque de premire espce. Cette ap-proche squentielle est notamment adopte par Hnin, Jolivaldt et NGuyen (2001) qui utilisentune statistique minimum dnie un ordre n par :

    tm (n) = minfi>Nng

    tiT

    o tiTcorrespond la statistique ADF pour le pays i et o les indices i sont classs selon lesralisations croissantes debtiT: A un ordre n; on teste la prsence dune racine unitaire pour lesn derniers individus du panel. En supposant que les statistiques ADF sont identiquement etindpendamment distribues dans la dimension individuelle, on peut alors contrler le risquede premire espce un ordre n de la faon suivante18 :

    Pr

    tm (n)< tDF

    = 1 (1 )n

    1 Pr (tm (n)< tn)n

    18 Cette ingalit est fonde sur lingalit de Bonferroni qui joue un rle important dans les tests de secondegnration en ce qui concerne la dtection de sous ensembles dindividus stationnaires ou non dans le panel.

    24

  • 7/24/2019 UnitRoot_V10

    25/47

    o tDF correspond au seuil % de la loi de Dickey-Fuller et tn correspond la t-statistiqueADF du pays exclu ltape n 1: Les auteurs proposent de la mme faon une statistique deFisher itre, ainsi quune statistique IPS itre.

    La seconde principale limite de ces tests de racine unitaire rside dans lhypothse dindpen-dance entre individus : indpendance des rsidus chez Levin et Lin ou chez IPS, indpendancedes p-values chez Maddala et Wu. Nous avons vu que cest prcisment cette hypothse quipermet de driver trs simplement les lois asymptotiques normales des statistiques de tests.Ds lors que cette hypothse est viole, ces lois asymptotiques ne son plus valides. Or, cette hy-pothse dindpendance pose problme notamment pour des applications macro-conomiques.Prenons par exemple le cas des nombreux tests de convergence en panel construits partirdes tests de racine unitaire de premire gnration (Evans et Karras, 1996, Gaulier, Hurlin etJean-Pierre, 1999). Ces tests reposent ainsi sur lhypothse dindpendance inter-individuelledes carts de PIB par tte la moyenne internationale, ventuellement contrls par des eetstemporels censs capter les eets de conjoncture internationale. Or rien ne garantit a prioriquelintroduction des eets temporels ou le fait de centrer les donnes sur la moyenne internationale

    permette de purger les ventuelles dpendances inter-individuelles des revenus par tte.

    Les auteurs de ces tests de premire gnration taient pleinement conscients de cette limite.Ds la premire version de leur document de travail, IPS (1997) envisagent ainsi la prsencedune corrlation inter-individuelle de la variable endogne, mais ils limitent leur analyse lin-troduction deets temporels dans la perspective dun modle erreurs composes (voir Sevestre,2002). Le rsidu "i;t du modle (32) se dcompose alors en une composante commune stricte-ment identique pour tous les individus t et une composante idiosyncratique vi;t. Dune part,cette formulation des dpendances inter-individuelles est trs restrictive puisque tous les payssont inuencs de faon symtrique par le facteur commun. Dautre part, Strauss et Yigit (2003)montrent quune telle approche ne fait que repousser le problme en abaissant lventuelle cor-rlation inter-individuelle si la composante idiosyncratique prsente elle-mme des corrlationsentre individus. De mme, Maddala et Wu (1999) dans un exercice de simulation envisagentla prsence de co-mouvements inter-individuels en considrant une forme trs particulire decorrlations retenue par OConnell (1998) dans ltude de la PPA. Au del de la forme spci-que des corrlations, cette approche pose un certain nombre de problmes techniques puisquilconvient de tenir compte de ces corrlations dans la simulation par Bootstrap des p-values.Mais, que ce soit chez IPS ou chez Maddala et Wu, les corrlations inter-individuelles restentnalement considres comme des paramtres de nuisance. Les tests de deuxime gnrationvont totalement renverser cette perspective.

    7 Lhypothse de dpendances inter-individuelles : versune deuxime gnration de tests

    La littrature actuelle se dveloppe autour de lide quil convient de prendre en comptede faon explicite les dpendances entre les individus du panel. Ainsi, ces tests de deuximegnration renversent totalement la perspective jusqualors adopte, car plutt que de considrerles corrlations entre individus comme des paramtres de nuisance, ils proposent dexploiter cesco-mouvements pour dnir de nouvelles statistiques de test. Contrairement aux approchesdveloppes dans le cadre des tests de premire gnration, les tests de deuxime gnrationne considrent pas ncessairement que les corrlations inter-individuelles de la variable yi;tsontuniquement dues une corrlation inter-individuelle des rsidus. Ils envisagent notamment le caso les corrlations deyi;tproviennent de la prsence dune ou plusieurs composantes communes.Tout le problme consiste alors proposer le test permettant la prise en compte la plus gnraledes direntes formes possibles de dpendance entre individus. Il convient en eet dviter de

    25

  • 7/24/2019 UnitRoot_V10

    26/47

    construire un test pour une forme trop particulire de corrlation des rsidus, de composantecommune ou de cointgration entre individus, qui naurait pas de bonnes proprits en termesde taille ou de puissance pour des formes alternatives.

    De nombreux tests sont aujourdhui dvelopps dans cette perspective. La plupart sins-crivent dans la ligne du test de Bai et Ng (2001, 2004) fond sur un modle facteurs com-muns. Mais, dans ce cadre, direntes approches sont proposes. Si Bai et Ng (2001) considrentdeux tests spars de racine unitaire sur les composantes commune et individuelle de la srie,les autres tudes sont gnralement fondes sur un test unique de racine unitaire de la srietudie ; le point commun tant de tester la racine unitaire uniquement sur la composante idio-syncratique de la srie. Les tests dirent alors suivant la mthode retenue pour extraire de lasrie brute la composante idiosyncratique inobservable. Ainsi, nous tudierons successivementles tests de Moon et Perron (2004), Choi (2002) et Pesaran (2003). Nous prsenterons ennle test de Chang (2002) qui lui nest pas fond sur un modle factoriel et qui permet ainsi deconsidrer une forme gnrale de dpendance inter-individuelle.

    7.1 Le test de Bai et Ng (2004)

    Bai et Ng (2001, 2004) ont propos le premier test de lhypothse nulle de racine unitaireprenant en compte la prsence possible dune corrlation inter-individuelle des sries testes.Le problme consiste alors spcier une forme particulire de ces dpendances. Bai et Ngadoptent une dmarche trs simple et considrent un modle factoriel :

    yi;t = Di;t+ 0iFt+ ei;t (45)

    oDi;test une fonction polynomiale du temps dordret; Ftest un vecteur de dimension(r; 1)defacteurs communs et i un vecteur de paramtres. Ainsi, la srie individuelle yi;t se dcomposeen une composante dterministe htrogne Di;t, une composante commune

    0iFt et un terme

    derreur ei;t idiosyncratique. Cest donc la prsence des facteurs communs Ft; par rapportauxquels chaque individu a une lasticit i propre, qui est lorigine des dpendances inter-individuelles.

    Dans ce cas, la variable yi;t est dite non stationnaire ds lors quau moins un des facteurscommuns du vecteur Ft est non stationnaire et/ou le terme idiosyncratique ei;t est non sta-tionnaire. Rien ne garantit de faon gnrale que ces deux termes aient les mmes propritsdynamiques : lun peut tre stationnaire, lautre pas, certaines composantes de Ft peuventtre I(0) dautres I(1) ; Ft et ei;t peuvent tre intgres dordre dirents, etc. Or, on saitquune srie dnie par la somme de deux composantes aux proprits dynamiques direntesa elle-mme des proprits dynamiques trs direntes des entits qui la constituent. Ainsi, ilpeut tre trs dicile de diagnostiquer la non stationnarit de yi;t si cette srie admet unecomposante stationnaire importante. Cest pourquoi, plutt que de tester la non stationnaritdirectement partir de la srie yi;t; lide de Bai et Ng (2001) consiste tester sparment laprsence dune racine unitaire dans les composantes commune et individuelle. Cette procdureest dnomme PANIC (Panel Analysis of Nonstationarity in the Idiosyncratic and Commoncomponents) par les auteurs. Quel est lavantage de cette procdure au regard du problmedes dpendances inter-individuelles ? Cest principalement que la composante idiosyncratiqueei;t peut tre considre comme faiblement corrle entre individus alors que paralllement lasrie totaleyi;t peut prsenter de fortes corrlations entre individus. On lve ainsi une des prin-cipales critiques adresses aux tests de la premire gnration, notamment dans le cadre desapplications macro-conomiques.

    Supposons que la composante dterministe Di;t soit au plus dordre 1. Le modle scritalors sous la forme suivante :

    yi;t= i+ it + 0iFt+ ei;t; t= 1;:::;T (46)

    26

  • 7/24/2019 UnitRoot_V10

    27/47

    Fm;t= mFm;t1+ vm;t; m= 1;:::;r (47)

    ei;t = iei;t1+ "i;t; i= 1;:::;N (48)

    Le meme

    facteur commun Fm;t est stationnaire si m < 1. La composante idiosyncratiqueei;test stationnaire pour le i

    eme individu sii< 1. Lobjectif est dapprhender la stationnaritde Fm;t et ei;t sachant que ces composantes ne sont pas observes et doivent tre estimes.Toute la validit de PANIC repose ainsi sur le fait quil soit possible dobtenir des estimateursde Fm;t et ei;t prservant leur degr dintgration, et ce que ei;t soit I(0) ou I(1) : Pour celales auteurs adoptent une analyse en composantes principales partir des donnes direncies.On suppose ici que le nombre de facteurs communs r est connu19 .

    Considrons le cas du modle sans tendance (i = 0) en dirences premires :

    yi;t= 0i ft+ zi;t (49)

    o zi;t= ei;t et oft = Ft vrieE(ft) = 0. On pose les dnitions suivantes :

    (N;r)

    =

    0BBB@01(1;r)

    ::0N(1;r)

    1CCCA f(T1;r) =0BBBBBB@

    f02(1;r)

    f03(1;r)

    ::f0T(1;r)

    1CCCCCCA X(T1;N) =0BB@

    y1;2 :: yN;2y1;3 yN;3:::y1;T yN;T

    1CCA

    La procdure de test peut alors tre dcompose en deux tapes. Dans une premire tape,on estime ft = Ft et i dans le modle (49) par une analyse en composantes principales.

    Lestimateurbfde la matrice fcorrespond alors au produit du scalaire pT 1par une matricedont les colonnes sont dnies par les r vecteurs propres associs aux r plus grandes valeurspropres de la matrice XX0: Lestimateurb est dni parb = X

    0

    bf = (T 1) : On note alorsbzi;t= yi;t 0ift.Dans une deuxime tape, connaissant le vecteur des variations de la composante commune

    ft = bFt ainsi quebzi;t, on dtermine les variables cumules dnies par :Fm;t=

    tXs=2

    bFm;s= tXs=2

    fm;s ei;t=tX

    s=2

    bzi;s (50)avec t = 1;:::;T, m = 1;:::;r et i = 1;:::;N. On teste alors lhypothse nulle de racine

    unitaire dans la composante idiosyncratique ei;t et dans les facteurs communs Ft laide des

    variables estimesei;t et Fm;t.An de tester la non stationnarit de la composante idiosyncratique, Bai et Ng ont propos

    dempiler les t-statistiques des tests ADF calcules sur la base des composantes estimes ei;tdans le cadre dun modle ne contenant pas de terme dterministe :

    ei;t = i;0ei; t1+ i;1ei; t1+ :: + i;pei;tp+ i;t (51)

    Soit ADFcbe(i) la t-statistique du test ADF de la composante idiosyncratique du i

    eme in-dividu. La distribution asymptotique de la statistique ADFc

    be(i) est identique celle de lastatistique usuelle de Dickey-Fuller du modle sans constante. Un test de racine unitaire peutalors tre eectu sur chacune des composantes idiosyncratiques du panel. La principale di-rence par rapport aux tests de racine unitaire en sries temporelles rside dans le fait que lesfacteurs communs ont t limins des donnes.

    19 Pour une estimation de r; voir Bai et Ng (2002) ou Moon et Perron (2004).

    27

  • 7/24/2019 UnitRoot_V10

    28/47

    Naturellement, ces tests mens sur sries temporelles sont peu puissants pour des chantillonsTde petite taille. Cest pourquoi Bai et Ng proposent dutiliser soit une statistique moyenne la IPS, soit une statistique la Maddala et Wu construite comme suit :

    Zc = 1p

    4N

    "2

    NXi=1

    logpc (i) 2N#

    (52)

    opc (i)dsigne la p-value associe la statistique de Dickey-Fuller ADFce (i):Bai et Ng sont ce moment l obligs de supposer lindpendance entre individus des composantes individuellesinobservables ei;t(thorme 3, page 8) pour driver la loi de cette statistique. Cela peut paratreparadoxal puisque le test de Bai et Ng est justement cens prendre en compte ces dpendancesinter-individuelles. Mais il faut bien comprendre ici que Bai et Ng ne supposent lindpendanceque des composantes individuelles ei;t de la variable yi;t dnie par exclusion des composantescommunes. On est bien loin dans ce cas de lhypothse dindpendance inter-individuelle retenuepar IPS ou Maddala et Wu qui portait sur la srie totale yi;t. Cest