16

Click here to load reader

Econométrie I

Embed Size (px)

Citation preview

Page 1: Econométrie I

1

INTRODUCTION A L’ECONOMETRIE I 1. En guise d’introduction a) Economie et économétrie Pour étudier un phénomène économique, on essaie de représenter celui-ci par le comportement d’une variable. Cette variable économique dépend elle-même d’autres variables que l’on relie entre elles par une relation mathématique. Cette relation définit ce qu’on appelle un modèle théorique. Par exemple, si on se propose d’étudier la consommation d’un certain bien par les ménages, la théorique économique postule que

)(RfC = . Toutefois, la théorie économique se contente en général d’indiquer les variables économiques qui permettent d’expliquer le phénomène et suggère le signe probable des dérivées partielles. Elle ne nous renseigne pas sur un certain nombre de choses dont la forme exacte des fonctions (f) intervenant dans le modèle (spécification du modèle), et la définition et la mesure des variables qui la composent. L’objet de l’économétrie est de tester la validité empirique des modèles théoriques énoncés. Pour cela elle doit postuler d’abord une forme pour les fonction intervenant dans le modèle. Cette fonction mathématique restant bien entendu compatible avec les hypothèses a priori du modèle théorique. Ensuite, elle doit disposer d’un échantillon d’unités sur lesquelles ont été observées les variables du modèles. Enfin, elle a recours aux tests statistiques afin de juger de la validité du modèle qui a été spécifié. Ces tests portent entre autres sur la forme fonctionnelle du modèle, test sur les paramètres, test sur les hypothèses théoriques etc. b) Exemple de spécification et vocabulaires La théorie économique postule une relation linéaire entre la consommation et le revenu. Cette relation peut s’écrire aRcC o += (fonction de consommation Keynésienne). Dans cette relation, C (la consommation) est la variable expliquée. On dit aussi variable endogène. R (le revenu) est la variable qui permet d’expliquer le niveau de la consommation. On dit que c’est une variable explicatives ou encore variable exogène. Les paramètres oc et a sont des coefficients interprétables appelés coefficients de régression. oc et a représentent respectivement la consommation incompressible et la propension marginale à consommer. L’objectif du cours d’économétrie est de fournir des estimations de ces paramètres à partir d’un échantillon d’observations. Il existe en général deux types d’échantillons en économétrie - Echantillon en données temporelles ou séries chronologiques : les variables représentent des phénomènes

observés à intervalle réguliers

tot aRcC += Tt ,....,1=∀ - Echantillon en coupe instantanée ou coupes transversales : les variables représentent des phénomènes

observés au même instant sur plusieurs individus (au sens statistique)

ioi aRcC += Ni ,....,1=∀

c) Introduction d’un terme aléatoire La relation précédente suppose que le nuage des couples (C,R) s’aligne parfaitement sur une droite de pente a et d’ordonnée à l’origine égale à oc . Or en pratique, cette forme parfaitement linéaire n’est pas observée ; la consommation s’écarte légèrement de la droite. Autrement dit il y a une différence entre les valeurs réellement observées de la consommation et les valeurs qui auraient été rigoureusement observées si la relation linéaire avait été rigoureusement exacte. Cette différence peut provenir de trois sources : soit la relation qui lie C et R n’est pas linéaire, on parle dans ce cas d’erreur de spécification , soit d’une erreur de mesure sur les variables C et R, soit enfin d’une erreur dans la constitution même de l’échantillon, on parle alors d’erreur d’échantillonnage. Ces différentes erreurs peuvent alors être prises en compte à travers une variable aléatoire et le modèle s’écrit

iioi aRcC ε++= .,..,1 Ni =∀

Page 2: Econométrie I

2

Conséquence : la présence d’un terme aléatoire implique que les estimations des paramètres oc et a seront aussi des variables aléatoires. 2. Le modèle linéaire multiple a) Motivation ? Le modèle précédent est un modèle de régression simple parce qu’il permet d’expliquer les variations d’une variable (la consommation) en fonction des variations d’une autre variable (le revenu). Or, il est rare, dans la réalité économique, que l’on puisse expliquer correctement les fluctuations d’une variable par celles d’une seule autre variable. En général, une réalité économique met en jeu plusieurs variables explicatives d’un phénomène donné. Par exemple, si l’on considère notre fonction de consommation ci-dessus, il semble naturelle de rajouter, comme variable explicative de la consommation, le prix. En effet, si le revenu peut largement influencer le niveau de la consommation d’un individu ou d’un ménage, celui-ci n’en reste pas moins influencé par le niveau du prix. On peut même penser que le nombre d’enfants influence considérablement le niveau de consommation des ménages. Dans ces conditions, la relation devient tenfttot ucnbPaRcC

t++++= .,..,1 Tt =∀

Pourquoi tu au lieu de tε ? En effet, puisque la relation économétrique change, alors l’erreur que l’on fait n’est plus la même que celle faite dans la spécification précédente. Cependant, elle n’est pas forcement plus petite : elle est tout simplement différente ! Cependant il n’est pas possible de disposer de façon exhaustive de tous les facteurs déterminant la variable endogène. L’essentiel en économétrie est de construire à partir des variables disponibles une approximation acceptable de la réalité économique étudiée. b) Le modèle linéaire multiple Le modèle linéaire multiple généralise le modèle linéaire simple en augmentant le nombre de variables explicatives. De façon générale, le modèle linéaire multiple s’écrit :

iKiKiioi uXaXaXaaY +++++= ...2211 Ni ;...;1=∀ (Eq3) La variable endogène est matérialisée ici par Y, et les variables explicatives, au nombre de K, sont

KXXX ;.....;; 21 . On entend ici par modèle linéaire un modèle dans lequel la variable endogène s’exprime comme fonction linéaire des paramètres à estimer. On fait les hypothèses suivantes : Hypothèses sur les variables : (H0) 1. les toutes les variables KXXX ;.....;; 21 , Y, sont observées sans erreur. Les variables explicatives ne sont pas aléatoires (mais Y est aléatoire à travers le terme d’erreur). 2. QNXX =/'lim matrice finie et non singulière.

3. NKXXXRang K ≤+= 1),...,,;1( 21 : il n’y a pas de colinéarité parfaite ou forte entre les variables explicatives. En d’autres termes, certaines variables explicatives ne sont pas redondantes. Cela permet en effet d’inverser facilement la matrice X’X. On peut en pratique contrôler cette hypothèse. En cas de colinéarité entre un groupe de variables, on prend une seule variable du groupe, celle-ci étant censé représentée les autres. On peut utiliser à cet effet efficacement l’ACP. Hypothèse sur le terme d’erreur :

iuEH i ∀= 0)()1( Cela signifie que tous ce qui a été omis de l’explication de Y est d’espérance nulle. Donc, en moyenne, on ne se trompe pas.

Page 3: Econométrie I

3

kiXuEH kii ,0).()2( ∀= : les erreurs sont non corrélées aux variables explicatives.

. 22 )()()4( uii uEuVarH σ== i∀ : les perturbations ont la même variance. On dit qu’elles sont homoscedastiques (c-à-d distribuées de la même façon autour de leur moyenne commune). On parle aussi de perturbations sphériques.

0)(),()5( '' == iiii uuEuuCovH les termes d’erreurs sont indépendantes ou non corrélées les unes aux autres.

),0()6( 2uiuH σΝ→

3. Estimation du modèle par la méthode des Moindres Carrées Ordinaires (MCO) Estimer le modèle (Eq3) c’est donner une estimation des paramètres du modèles i.e. Ko aaa ;...;; 1 . (On rappelle qu’un estimateur est une formule mathématique qui permet de calculer une approximation (estimation) d’une grandeur à partir des données observées). La méthode d’estimation par les MCO cherche à minimiser la moyenne des carrés des erreurs. Ceci revient donc à résoudre le programme suivant :

( )211),...,,(

...1

∑ −−−−i

KiKioiaaaXaXaaYMin

Ko

)( MCOP

Il s’agit d’un programme d’optimisation simple. La résolution de ce programme donne des estimateurs des paramètres Ko aaa ;...;; 1 , que nous notons Ko aaa ˆ;...;ˆ;ˆ 1 . Ces estimateurs sont bien évidemment fonction de Y

et des )..1( KkX k = . L’expression analytique des estimateurs est cependant plus aisée à donner si l’on présente au préalable l’équation (Eq3) sous forme matricielle. a) Ecrire matricielle du modèle L’équation (Eq3) peut s’écrire facilement sous forme matricielle en empilant les N observations de Y dans un vecteur colonne.

Ainsi, en posant

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

=

N

i

Y

Y

Y

Y.

.1

, vecteur (N,1) ;

⎥⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢⎢

=

KNNN

Kiii

K

K

XXX

XXX

XXXXXX

X

.........

1.

.....

..1

....1

21

21

22212

12111

, matrice (N, K+1) ;.

⎟⎟⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜⎜

=

K

k

o

a

a

aa

a

.

.1

, vecteur (K+1,1) ; et

⎟⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜

=

N

i

u

u

u

u.

.1

, vecteur (N,1)

L’équation (Eq3) s’écrit matriciellement

uXaY += (Eq.3’) Les hypothèses (H1), (H4) et (H5) se ramènent aux deux hypothèses suivantes :

Page 4: Econométrie I

4

0)()'1( =uEH ; Nu IuVaruuEH 2)()'()'4( σ== .(homoscédacticité et non autocorrélation résiduelle) b) Résolution du programme et estimateurs des MCO Le programme des Moindres Carrées Ordinaire )( MCOP se repose ainsi

( ) ( )[ ]XaYXaYMina

−− ' )'( MCOP

Il est plus facile de manipuler ce programme. Posons ( ) ( )XaYXaYaf −−= ')( En développant cette expression, il vient que =)(af

Les conditions de premier ordre pour le programme )'( MCOP s’écrivent 0)(=

∂∂

aaf

, ce qui donne pour solution

)'()'( 1 YXXXa −= . Cette solution est l’estimateur des MCO du vecteur a. On le notera mcoa .

)'ˆ,...,ˆ,ˆ(ˆ 10 mcomco Kmcomco aaaa = on a alors les résidus estimés qui s’écrivent mcoaXYYYu ˆˆˆ −=−= A retenir )'()'(ˆ 1 YXXXamco

−= 4. Estimation par la méthode du maximum de vraisemblance. Comparaison avec les MCO La vraisemblance en économétrie est définie comme la probabilité d’observer un échantillon, étant donné les paramètres du processus ayant engendré les données. Si on observe un vecteur de variables aléatoires

),..,2,1( xkxxx = indépendantes et identiquement distribuées suivant une loi ),( θxf , alors la probabilité

de l’échantillon est le produit des probabilités associées à chaque variable : ∏=

=Ni

xfxL..1

),(),( θθ .

L’estimation par la méthode du maximum de vraisemblance cherche à trouver les valeurs du paramètre vectoriel θ qui rendent l’observation de l’échantillon le plus vraisemblable. Intuitivement, puisque l’on a effectivement observé l’échantillon, c’est que sa probabilité d’apparition était forte. Son on maximise la vraisemblance associée à l’échantillon, on peut remonter au processus générateur des données. Toutefois, deux conditions limitent le sens pratique de cette méthode. En effet le principe du maximum de vraisemblance suppose d’abord de bien spécifier la forme fonctionnelle de la distribution f des observations. Si la loi des variables est mal choisie, alors le processus générateur des données ne correspondra pas à celui choisi par l’économètre. on parle de biais de spécification et des choix alternatifs devront être recherchés (méthodes des moments par exemple).Ensuite, il, faut qu’un seul paramètre 0θ maximise la vraisemblance. Si on suppose donc que les termes d’erreurs suivent une loi normale ),( 2

uii aXNY σ≈ et la vraisemblance de

l’échantillon s’écrit ∏=i

uiYfaYf )ˆ,(),( 2σ avec ⎭⎬⎫

⎩⎨⎧

−−= 22

2 )(2

1exp2

1),( aXYYf iiu

ui σπσσ .

On a ⎭⎬⎫

⎩⎨⎧

−−= ∑ 22 )(

21exp

)2(1),( aXYaYf iiN σπσ

. En remarquant que

)()'(')( 22 XaYXaYuuuaXYi

ii

ii −−===− ∑∑ alors la log-vraisemblance du modèle s’écrit

)()'(ln2/)2ln(),,( 2 XaYXaYNNYal −−−−−= σπσ .

On constate que la méthode de vraisemblance donne le même estimateur que celle des MCO : MVmco aa ˆˆ = .

Page 5: Econométrie I

5

5. Juger de la qualité d’ajsutement du modèle Une fois estimés les paramètres du modèle, l’on doit se poser la question de savoir si notre regression est assez bonne ou non. Il existe une façon simple de repondre à cette préoccupation: c’est de comparer les iY à leurs

valeurs estimées imcoi aXY )ˆ(ˆ = . En pratque on compare plutot la variance des imcoi aXY )ˆ(ˆ = à celle des iY .

Plus explicitement on établit que ∑∑∑ +=i

ii

ii

i uYY 222 ˆˆ .

On définit alors le rapport ∑∑

∑∑

−==

ii

ii

ii

ii

Y

u

Y

YR 2

2

2

2

2

ˆ1

ˆ . Ce coefficient est appélé coefficient de detrmenination

ou encore coefficienr de correlation multiple. Il determine la part de la variance des iY expliquée par les iY . (Ecrire le r2 sans les sigma, c-à-d avec les matrices, faire ressorte SCR et SCE) Un mauvais R2 peut venir de l’oublie de variables explicatives, mauvaise spécification du modèle (Box-Cox), ces m^mes causes peuvent etre à l’origine de l’autocorrelation de sresidus. Interprétation géométrique de R2 Remarque: le R2 n’a pas une bonne interprétation si le modèle ne comporte pas de terme constant. Le R2 n’est pas vraiement un critère suffisant pour juger de la qualité d’une régression. En effet il est aisément manipulable et augmente artificiellement avec K et avec la forme sous laquelle les variables sont introduites dans le modèle. Donc R2 ne permet pas de comparer des modèles avec un nombre différents d’explicatives ou spécifiées différement.

Solution : on corrige le R2 des degrés de libertés. On obtient un R2 ajusté tel que )1(1)1( 22 RKN

NR −−−

=−

Le R2 ajsuté tient compte du nombre d’observation (N) et du nombre de variables (K) Défaut du R2 ajusté: il peut être négatif, il est aussi manipulable par une transformation de y (on entre y en taux de croissance au lieu de l’entrer en niveau). Il peut dimunuer lors de l’introduction d’une nouvelle variable exogène dans le modèle. 6. Propriétés des estimateurs des MCO. Comme les estimateurs des paramètres du modèle sont des variables aléatoires, il peut alors être intéressant d’étudier certaines de leurs propriétés à distance finie et à distance infinie. 6.1 Propriétés à distance finie a) Estimateur sans biais de a. On vérifie facilement que mcoa est un estimateur sans biais de a : aaE mco =)ˆ(

Cela signifie donc qu’en moyenne le résultat fourni par l’estimateur mcoa est égal à la grandeur qu’on cherche à estimer,a. c) Variance de mcoa

))'ˆ)(ˆ(()ˆ( aaaaEaVar mcomcomco −−= avec uXXXaamco ')'(ˆ 1−=− d’où 12 )'()ˆ( −= XXaV umco σ

Si u2σ n’est pas connu, ce qui est le cas en général, on l’estime par

- Si on fait MCO alors on a 11

'ˆ 2

−−=

−−=

KNSCR

KNuu

mcoσ comme un estimateur sans biais de u2σ ( a

démontrer)

Page 6: Econométrie I

6

- Si on fait MV, alors on obtient directement un estimateur de 2σ : NSCRMV /ˆ 2 =σ . Mais on voit que cet

estimateur est biaisé, car 222 )/1()ˆ()ˆ( uuMVuMV NKEN

KNE σσσσ ≠−=−

= . La méthode du MV

sous-estime la variance 2uσ Cependant, asymptotiquement, NSCRMV /ˆ 2 =σ est un estimateur sans biais

de 2uσ ( le biais égale à –K/N tend vers o).

12 )'( −XXuσ est la matrice de variance covariance estimée de mcoa , et les termes diagonaux de cette matrices

sont les variances estimées des paramètres ; soit kkua XXk

))'((ˆ 122 −= σσ c) Efficacité de l’estimateur des MCO Théorème de Gauss-Markov

mcoa est le meilleur (de variance minimale )estimateurs linéaire sans biais de a. on dit que mcoa est BLUE (Best Linear Unbiased Estimator) 3.2 Propriétés à distance infinie a). Etude de la convergence des estimateurs des MCO

)'1()'1()'()'(ˆ 11 uXn

XXn

aYXXXamco−− +==

si XVnXX =/)'lim( matrice finie et définie positive ou 0)'lim( 1 =−XX (cette hypothèse est moins forte que la première puisque la première exclut que une Variable égale au temps figure dans les explicatives), , alors

mcoa tend en probabilité vers a. plim( mcoa )=a.

mcoa est donc un estimateur convergent de a. d) Normalité asymptotique L’application du théorème central limite de Linsdberg- montre que sous les hypothèses du modèle l’estimateur centré dilaté ),0()ˆ( 12 −

∞Ν→− Xumco VaaN σ

Mots clés: test unilateral, test bilateral, region de confiance, estimation par maximum de vrais, notion de covariance, coeff de corelation, independance entre variable, existence de la racine carré dune matrice definie positive, dérivée de fonction écrite sous forme matricielle. estimateur sans biais, estimateur convergent, efficace. Matrice de variance covariance d’un vecteur aléatoire. Loi normale, loi de Student, loi de Fisher. d) Test sur les paramètres Rappel sur les tests paramétriques d’hypothèses: procédure et remarques Un test statistique est une procédure de décision sur une hypothèse contre une autre (son alternative) à partir d’un échantillon expérimental de taille connu. C’est n’est pas une démonstration à proprement dit. Un test statistique est, par nature, négatif. Accepter l’hypothèse nulle (H0) ne signifie pas qu’elle est vraie, mais seulement que les observations disponibles ne sont pas compatibles avec cette hypothèse et que l’on n’a pas de raison suffisante de lui préférer l’hypothèse l’alternative compte tenu des résultats expérimentaux obtenus sur l’échantillon L’hypothèse de normalté des residus permet d’effectuer un certain nombre de tests statistiques sur les paramètres du modèles. En effet, si ),0( 2

Nu Iu σΝ→ alors ))'(,( 12 −Ν→ XXaa umco σ . Même si cette hypothèse de

Page 7: Econométrie I

7

normalité s’avérait violée en pratique, les tests restent valables asymptotiquement grâce au théorème central limite!

On a ),(ˆ 2ˆ kakk aa σΝ→ donc )1,0(

ˆΝ→

ka

kk aaσ

avec kkua XXk

))'(( 122 −= σσ inconnue

)(ˆ)( 2

2

2

KNKN

u

u −→−

χσ

σ, mcoa et u

2σ sont des variables indépendantes. Pour le montrer, il suffit de

montrer que les variables gaussiennes mcoa et u sont non corrélées (i.e. )0)ˆ,ˆ( =uaCov mco (deux variables gaussiennes indépendantes sont non corrélées). Et de remarquer que les deux statistiques sont fonction de ces variables indépendantes. On a donc

)1(ˆ

))'((ˆ

ˆ

/ˆ)(

)))'(()(

ˆ122

2/11

−−→−

=−

=

−−

=−

KNStaa

XX

aa

KNKN

XXaa

tka

kk

kku

kk

uu

kku

kk

σσσσ

σ

a) Test de significativité (significativité golbale du modèle (test de Fisher: écrire Le F de Fisher avec les R2,

, et signficativié des coeffocient) i) Siginficativité d’un coefficient Tester la siginficativement d’un coefficient ka revient à poser la stratégie de test 00 =kaH contre

01 ≠kaH .

On sait que sous 0H , )1(ˆˆ

−−→= KNSta

tk

kk σ

. kt est couramment appélé t de Student.

On choisit un niveau de risque de prémière espèce α (c’est la proba de rejeter Ho alors qu’elle est vrai). α est encore appélé seuil de significativité dans le cas des test de significativité. On peut donc construire un intervalle

de confiance pour ka : ασ α −=⎟

⎟⎠

⎞⎜⎜⎝

⎛≤ 1

ˆˆ

Pr ta

obu

k , αt se lit dans une table de student à (N-K-1) dégré de

libertés. αt est appélée valeur critique. Exemple pour 05.0=α , St(13)=2.16

Ainsi si αttk ≤ on accepte l’hypothèse nulle: le coefficient ka n’est pas signifiactif, ou encore la variable

kX n’est pas explicative , c’est-à-dire qu’elle n’a pas d’influence sur Y.

Si αttk on rejette l’hypthèse nulle: le coefficient ka est signifiactivement différent de zero. Rq : L’unité de mesure d’un variable explicative n’affecte sa siginficativité ii) Test de significativité globale du modèle Après avoir estimer les paramètres du modèle on peut se demander si tous les coefficient sauf la constante peuvent être considérés comme nuls. Cela reveint à se demander si aucuen des variables explicatives du modèle n’explique Y. On dira que le modèle est globalement significatif s’il existe au moins une variable qui soit significative. Pour tester cela, on test 0...210 ==== KaaaH contre 0/1 ≠∃ iaiH - Test de fisher

)1,(1)1( 2

2

−−→−−

−= KNKF

KKN

RRF

on compare ce F au F tabulé.

Page 8: Econométrie I

8

- Test du ratio de vraisemblance (Likelihood Ratio) Ce test compare au fait le modèle estimé avec l’ensemble des K variables explicatives au modèle estimé avec la constante seule. Cela permet de voir si les explicatives apportent quelque chose de significatif à l’explication de Y. La statistqiue de est est donnée par )()(2 2

10 KllLR χ→−−= 0l est la log-vraisemblance du modèle sous H0. b) Test d’égalité à un valeur donnée

α=kaH 0 contre α≠kaH1 sous H0, on sait que )1(ˆ

ˆ

−−→−

= KNSta

tka

k

σα

c) Test de r contraines L’hypthèse de nulité de l’ensemble des coefficients n’est pas toujours la plus intéréssante. On peut en effet être améner à tester, par exemple, dans une fonction de production si les rendement d’échelle sont constants. Cela revient à effectuer un test de contrainte linéaire sur les paramètres. De façon générale, on peut tester l’existence de r contraintes linéaires indépendantes sur les K paramètres du modèle en posant

)1,()1,1()1,( rKKrcaC =

++avec rCRang =)( (on suppose que les r contraintes linéaires sont

indépendantes: il faut éliminer toutes les équations redondantes) et 1+Kr ≺ (si r=K+1alors l’estimation n’a plus son sens puisque les contraintes permetternt d’obtenir les paramètres: cCa 1−= ) Exemple : on se demande si 14321 =+= aaetaa on a

⎟⎟⎠

⎞⎜⎜⎝

⎛=

⎟⎟⎟⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜⎜⎜

⎟⎟⎠

⎞⎜⎜⎝

⎛ −00

.

.0........11000.......0110 2

1

0

Ka

aaa

On afit un test de Wald )1,(1)1()(

21

20

21 −−→

−−−−

= KTrFrkT

RRR

W

20R et 2

1R désigne respectivement le coefficient de determination des estimations sous 0H et 1H . Rq: le test de Fisher est un cas particulier du test de Wald. Donner l’expression de C et c et retrouver la statistique de Fisher. e) Test sur les Hypothèses de Base du modèle a) Test de moyenne nulle des résidus On fait un test de student classique b) Test de normalité de residu Tests graphques: Histogrammes, Q-Q plot Test non paramétriques (Shapiro-Wilks, Shapiro-Francia, Kolmogorov-Smirnov ) Tests paramétriques : ils sont basés sur les caractéristiques de la distribution normale) (Jarque-Bera, Anderson-Darling

Page 9: Econométrie I

9

Le Jarque-Bera est calculé à partir skewnesset du kurtosis

. ( ) 99.5)2(341

6222 =→⎥⎦

⎤⎢⎣⎡ −+

−= χKSkNJB à 5%.

où S est le coefficient de skewness, K le kurtosis, and k represente le nombre de coefficients. c’est pas trop grave si’elle n’est vérifiée, on fait des tests asymptotqes de Wald si N est grand. Dans ce cas, le t de student suit asymptotiquement une loi centrée-réduite! c) Test d’Homoscedasticie résiduelle Phénomène courant en coupe instantanée et sur des données groupées.

iuVarH uii ∀== 22)(0 σσ Test de White (1980) On estime le modèle (*) iKiKiKiKii XbXbXaXaau η++++++= 22

111102 ......

)2(22 KpNRLM =→= χ quand ∞→N , p et R2 sont respectivement le nombre de variable explicatives et le R2 du modèle (*) A cette statistqiue du LM on peut associer un test de Fisher de nullité des coefficients (sauf la

constante). )12,2()12/()1(

2/2

2

−−→−−−

= KNKFKNR

KRF .

Ce test est disponlible sur Eviews. Test ARCH (pour des séries temporelles) Les modèles classiques de prévision de type ARMA supposent des series temporelles de variance constante (hypothèse d’homoscédascticité). Cette modelisation néglige donc, eventuellement, l’information contenue dans le facteur residuel de la chronique. Les modèles ARCH (AutoRegressive Conditional Heteroskedasticity ) permettent de modéliser des chroniques qui ont une volatilité (ou variance ou variablité) instantanée qui depend du passé. tttt xhupARCHu ε=⇔≈ )( , )1,0(Nt ≈ε et ptpttth −−− ++++= εαεαεαα ..22110

2 Soit 0..: 210 ==== pH ααα

Si Ho est acceptée, alors la variance de tu est constante, dans le cas contarire tu suit un ARCH(p). Le test est fondé soit sur un test de Fisher classique, soit sur le test du Multiplicateur de Lagrange (LM). De manière pratique, on procède comme suit: on regresse le modèle ipipii uauaau η+++= −−

22110

2 .... (soit

)(2 pARut ≈ ). La statistique de test est )(TR 22 pLM χ→= quand ∞→T . Ce test est disponlible sur Eviews. Test de Chow Ce test consiste à effectuer un un test de comparaison des variances des résidus des sous-périodes de la série. Ce test est disponlible sur Eviews. Test de Goldfeld-Quandt (1965) Applicable si on connaît la variable responsable de l’hetéroscedacticité . on test alors )(0 22

jii XfH σσ =

où jX est la variable qui introduit l’hétéroscédacticité. pour dectecter cette variable on regresse le résidu sur chaque variable explicative. Une fois la varaible responsable trouvée on effectue les étapes suivantes: - on classe les observations par ordre croissant des jX ;

Page 10: Econométrie I

10

- on divise l’échantillon en 3 sous échantillons - on effectue la regression sur les 2 sous échantillon extrêmes

- on forme ),()/()/(

1211

22 KNKNFKNSCRKNSCR

F −−→−−

= SCR2 est la somme des carrées des résidus

sur le sous-échantillon 2, on calcul F en mettent le plus grand de SCR1 et SCR2 au numérateur. - Limite de ce test: n’est plus applicable si plusieurs variables sont responsables de l’hétéroscédasticité. Ce test n’est pas disponlible sur Eviews. Mais est facile à mettre en œuvre. Test de Breusch et Pagan (1979) On test )(0 0

22 αασσ ii ZfH += où Z est la matrice des explicatives. 0=⇒αticitéHomoscédas Si f(x)= x i.e on adopte une forme linéaire. Pour metter en œuvre ce test, on regresse iu 2ˆ sur les jZ , et on utilse la statistique )(22 lNR χη →= quand

∞→N . 2R est celui du modèle de regression des iu 2ˆ sur les jZ . Ce test n’est pas disponlible sur Eviews. Test de Glejer C’est un test très simple qui permet de detecter l’hétéroscedacticité des residus. Son principe est de regresser la valeur absolue ou le carrés des residus sur l’ensemble des explicatives. On s’interrsesse alors à la significativité globale des coefficients. Si les coefficients sont tous significativement nuls, il y a homoscedasticité; sinon il y a hétéroscedasticité, et les coefficients significatifs indiqueront les variables explicatives qui sont responsables de l’hétéroscédasticité. Ainsi le test de Glejer permet de detecter l’hétéroscedasticité ainsi que la cause de cette hétéroscedasticité. RQ: Les resultats du test de Glejer peuvent etre le contraire de ce que donne un autre test (White par exmple). En effet le test de Glejer ne detecte que les forme linéaires de l’hétéroscedasticité. Si cette hétéroscedasticité n’est pas linéaire (i.e. f non linéaire) alors le test de Glejer concluera à l’homoscedasticité. d) Test d’autocorrealtion résiduelle à l’ordre p phénomène courant en série temporelle Definition de l’autocorrélation On appele coefficient d’autocorrélation d’ordre p, le coefficient pρ définit par

)var(),cov(

)var()var(

),cov(

t

ptt

ptt

pttp u

uu

uu

uu −

− ==ρ avec

ppttptt mumuEuu γ=−−= −− )))(((),cov( (fonction d’autocovariance), m étant la moyenne de tu . On a

supposé ici que le procesus u est stationnaire ( la moyenne et la variance de tu existent et sont constantes, (independante de t), et les autocovarinces ne dependent pas du du nombre dedecalage, i.e. ppltltptt uuuu γ== −++− ),cov(),cov( ). On montre que lorsque le procesus est stationaire, les coefficients d’autocorrélation diminue assez rapidement et tendent vers 0 et reciproquement. On peut tester cette decroissante rapide des coefficients. ⇒ test de Box et Pierce, test de Ljung et Box.

⇒= 01ρ il n’ y a pas d’autocorrélation à l’ordre 1

⇒= 0pρ il n’ y a pas d’autocorrélation à l’ordre p.

Page 11: Econométrie I

11

L’ensemble ..,...,, 21 pρρρ est appélé fonction d’autocorrélation ou corrélogramme. Cette fonction s’exprime en fonction de p. Defintion de l’autocorrelation partielle On definit le coefficient d’autocorrelation partielle d’ordre p (PAC en anglais) de la serie tu comme étant le

coefficient de ptu − dans la regression de tu sur 1, 11 ,....; +−− ptt uu , ptu − . Test graphique à partir du corrélogramme, test de Bartlett

Un estimateur de pρ est ∑

=

+=−

−−=

1

21

)(

))((ˆ

tt

ptptt

p uu

uuuuρ ( car un estimateur de l’autocovarince d’ordre p,

)))(((),cov( mumuEuu pttpttp −−== −−γ ,est ∑+=

− −−−

=1

))((1

1ˆpt

pttp uuuuT

γ et un estimateur de

)var(0 tu=γ est ∑=

−−

=1

20 )(

11ˆ

tt uu

Tγ )

Bartlett a cherché à tester si les coefficients d’autocorrélation successifs sont significativement différent de 0. pH p ∀= 00 ρ

Si le processus est stationnaire et de moyenne nulle (ce qui une hypothèse faite sur les résidus) alors sous 0H ,

Bartlett montre que )/1,0(ˆ TNp →ρ quand T devient grand.

Ainsi on rejette l’hypothèse de non autocorrélation des erreurs au seuil de 5 % dès que Tp /2ˆ ≥ρ . Si on

trace le corrélagramme (c’est-à-dire les kρ pou k=1….p) on doit observer que les kρ ne sortent pas de la bande

Horizontale de largeur T/2 autour de 0. Test de Box-Pierce Box et pierce testent la significativité des p premiers coefficients d’autocorrélation. Le test est le suivant

0....0 21 ==== pH ρρρ .

La statistique de test établit à partir de la statistique de Quenouille .ˆ)(.1

2∑=

=pk

kBP TpQ ρ Sous H0,

*)()( 2 ppQBP χ→ quand ∞→T . P*=p-nombre de est le nombre de paramètres à estimés. Accepter H0 c’est dire que les coefficients d’autocorrélation ne sont pas significativement différents de 0. Rq: Ce test ne pose pas de condition sur la moyenne des tu . Mais il est peu performant sur pétits échantillons. Test de Ljung-Box (1979) Ljung et Box ont constaté que la distribution de BPQ deviait sensiblement de celle d’un 2χ . Ils ont attribué ces écarts à l’approximation retenue pour claculer la variance des autocorrélations. Sur ce constat, ils proposent la statistique de ce test :

∑≤≤ −

+=pk

kJB kT

TTpQ1

2ˆ)2()(

ρ sous H0: non autocorrélation des erreurs, *)()( 2 ppQJB χ→ quand

∞→T .

Page 12: Econométrie I

12

S’il n’y a aucune autoccorélation des erreurs à l’ordre p, les kρ sont proches de 0 et les Q-stat de Ljung-Box sont non significatifs avec des probabilités élévées ( supérieures à 0.05). Ce test sert à tester si un processus est un bruit blanc (i.e. un processus stationnaire de moyenne nulle et dont les autocovariances sont nulles (sauf la variance)). En pratique, on prend TTMinp 3;2/= . Remarque : L ‘examen des PAC permet de detecter si la serie est autocorrélée et l’ordre de cette autocorrelation.

En effet les PAC sont les coefficients de la relation tptptt uauaau ε++++= −− ..110 . C’est l’écriture formelle d’un AR(p). Donc )( kPAC significativement non nul signifie qu’il y a autocorrélation à l’odre k. Un PAC nulle indique qu’il n’y a pas d’autocorrélation. Tester la nullité des PAC s’est aussi tester la nullité des ρ .

Pour un AR(p), les PAC (k) sont significativment nuls pour pk . Les kρ sont géometriquement decroisants

au délà de pk = , (on a une exponentielle et/ou une sinusoidale amortie); mais les kρ restent differents de 0

k∀ . Autrement dit un AR(p) a une memoire infinie. Pour un MA(q)(i.e. qtqttt aaau −− −−−+= εεε ...110 ,où tε est un bruit blanc), les kρ sont signicativement

nuls à partir de qk . Un MA a une memoire d’odre q. Remarque ( à propos d’Eview) Tous ces tests sont disponibles sur Eview. Mais la formule du coefficient de corrélation qui est utilisée est

∑∑

=

+=− −

=

Ttt

Tptptt

p Tu

pTuu

..1

2..1

/

)/(ρ . Ainsi en petits échantillon, cette formule sur estime le coefficient de corrélation,

mais le biais s’évanouit pour de grands échantillons. Test de Durbin-Watson On suppose que les explicative ne sont pas aléatoires, donc la variable endogène retardée ne figure pas dans les explicatives (sinon elle serait corrélée à )iu . Le modèle doit être spécifié avec un terme constant

(**) ttt uu νρ += −1

on test 00 =ρH contre 01 ≠ρH

on estime par MCO le modèle (**), on obtient ∑∑

=−

=−

=

2

21

21ˆˆ

ˆ

tt

ttt

u

uuρ , on a )ˆ1(2

ˆ

)ˆˆ(

1

22

21

ρ−≈−

=∑

=

=−

tt

ttt

u

uuDW

les valeurs limites de cette statistique de Durbin-Watson sont tabulées. Si ldDW < on rejette H0, il y a corréralion positive ( )0>ρ

Si ldDW −> 4 , on rejet H0, il y a corréralion négative ( )0<ρ

Si uu dDWd −<< 4 on accepte H0 Dans les autres cas, il y adoute , mais il vaut mieux rejetter H0. La statistqiue de Durbin-Watson est disponible sour Eviews. Mais ce test n’est pas applicable si le modèle ne comporte pas de terme constant.

Page 13: Econométrie I

13

Si la variable 1−ty figure dans les explicatives, on utilise le h de Durbin definit par:

)ˆ(.var1)

21(

bestTTDWh

−−= où b est le coefficient de 1−ty dans le modèle initial. Sous H0, h suit une

loi normale centrée reduite. Test de Breusch-Godfrey (1978) (Serial correlation test- LM) Ce test permet de detecter une autocorréation d’ordre p, quelconque. On regresse les residus sur les variables explicatives et le p variables retardées de ce residu

ptptt uuuaXau −− +++++= ρρρ ...22110 soit 2R le R2 associé. )(22 pNRLM χ→=

On peut aussi faire un test de nullité des iρ (Wald ou Fisher). Ce test est disponible sur Eviews. f) Estimation en présence d’autocoorelation ou d’hétéroscédasticité résiduelle: les Moindres Carrées

Généralisées (MCG) Eviter de recourir au R2 s’il ya autocorrelation. En présence d’ heteroscédasticité ou d’autocorrélation residuelle, on a Ω== 2)var()'( uuuuE σ avec

NI≠Ω

En effet: si )1(ARut ≈ ( ttt uu ερ += −1 ) et les tu sont stationnaires (i.e. )( tuE et )var( tu existent et sont indépendantes de t)

Alors on monte que ρ

σσ ε

−==

1)(

222utuE et

ρσρ ε

−== ++ 1

).(),cov(2p

pttptt uuEuu . (Ecrire la forme de

Ω ) Dans ce cas, on a 112 )'(')'()ˆ( −− Ω= XXXXXXaV umco σ , ce qui diffère de l’expression habituelle

12 )'()ˆ( −= XXaV umco σ . Donc en présence d’heteroscédasticité ou d’autocorrélation residuelle, les MCO donnent des estimateurs non efficaces, mais toujours sans biais. Les tests d’hypothèse, les intervalles de confiances utilisant les erreurs sont alors biaisés (on surestime le test de student c-à-d on accepte des coefficient qui ne sont pas significatifs). Solution ? On fait les MCG c’est-à-dire on fait les MCO sur le modèle *** uaXy += avec XX 2/1* −Ω= et

yy 2/1* −Ω= .

Ainsi mcga va minimser uuaf 1')( −Ω= . On a yXXXamcg111 ')'( −−− ΩΩ=

112 )'()( −−Ω= XXaV umcg σ

Comme dans le modèle transformé, IuV u2*)( σ= alors

1ˆ'ˆˆ

**2

−−=

KNuu

mcgσ est un estimateur sans biais de

2uσ . Et l’estimateur de la matrice de variance-covariance de mcga est 112 )'(ˆ)ˆ(ˆ −−Ω= XXaV mcgmcg σ .

Remarque: Les MCG en présence d’hétéroscedasticité sont les Moindres Carrés Pondérés (MCP). En effet en présence d’hétéroscédasticité, le modèle transformé *** uaXy += s’obtient en divisant les

observations par iσ : iii zz σ/* = , de sorte que le modèle s’écrit en instantanée

iiikikiiiii uXaXaay σσσσσ /...)/(...)/(// 110 +++++=

Page 14: Econométrie I

14

⇒Tout ceci supose que Ω est connu!!. Cas particuliers: 1) Hétéroscedasticité du type 22

02

kii Xσσ = ( seule la variable kX est responsable de l’hétéroscedasticité, on peut detecter cette forme par une simple regression des carrés des residus sur les carrés des explicatives) - On divivise les observations par kiX suivant le principe des MCP. 2) Autocorrélation d’ordre 1

ttt ubaXY ++= (1) et )1(ARu ≈ ttt uu ερ += −1 (2) Alors on cherche à éliminer le terme d’erreur u du modèle(1) on obtient

ttttt bXXaYY ερρρ +−+−=− −− )1()( 11 (3) Méthode simple d’estimation - on estime par MCO le modèel initial (1) sans tenir compte de l’autocorrelation des erreurs mcou

- on recupère les mcou et on estime le modèle (2). On obtient ρ

- on remplace ρ par ρ dans (3) et on estime par MCO le modèle (3). Méthode de Durbin (2 étapes) - on écrit le modèle (3) sous la forme (4) ttttt bXaaXYY ερρρ +−+−+= −− )1(11 - on estime par l’équation (4) par MCO et on obtient les estimations des paramètres ρ , a , ρa et b. ces estimateurs sont liés entre et rien ne nous garantit que ces contraintes sont cohérentes entre elles. On ne peut donc pas retenir tous ces estimateurs. On retient un seul: ρ l’estimateur de ρ .

- on remplace ρ par ρ dans (3) et on estime par MCO le modèle

ttttt bXXaYY ερρρ +−+−=− −− )ˆ1()ˆ(ˆ 11 Notes finales 1) La prise en compte de phonémène non linéaires par le modèle linéaire Le modèle linéaire permet de traiter une diversité de situations de non linéarité. Il suffit dans certains cas d’introduire une variable supplémantaire. Exemple 1: Estimation d’une fonction de Cout moyen On veut estimer le cout moyen (C.M) de la production (Q). On sait d’après la théorie économique que cette relation n’est pas linéaire en Q, la courbe a une forme en U. Pour prendre en compte ce caractère non linéaire de la rélation on pose que 2cQbQaCM ++= . Exemple 2: Fonction de gains On veut étudier la rélation entre le salaire d’un individu et ses caractéristiques individuelles, comme le nombre d’années d’études ( )iA et l’ expérience professionnelle ( )iEp . Il est clair qu’une rélation du type

iiii uEpaAaaS +++= 210 ne donnera pas de resualts satisfaisants. En effet, ce modèle revient à considérer que, toutes choses égales par ailleurs, une année d’expérience supplémentaire a le même effet sur le

Page 15: Econométrie I

15

salaire d’un individu en debut de carrière que sur celui d’un autre qui a déjà fait 20 années d’expérience. Or la théorie économique nous suggère que le rendement marginal de l’expérience professionnelle est decroissant. Autrement dit, les salaires croissent rapidement avec l’expérience en début de carrière, et beaucoup plus lentement par la suite ( faire graphique). Ainsi la rélation réaliste entre le salaire et l’expérience est loin d’être linéaire. Pour tenir compte de cette non linéarité on peut écrire le modèle sous la forme iiiii uEpaEpaAaaS ++++= 2

3210 . On s’attend à ce

que le paramètre 3a soit significatif et négatif. 2) les variables indicatrices Les variables indicatrices jouent un grand rôle dans les modélisations éconmétriques. En particuleir, elles permettent de prendre en compte dans les changements de comportements ou les changements structurels dans l’évolution d’un phénomène. Exemple 1: Estimation d’une fonction de consommation en données temporelles On dispose de la consommation des ménages de la CI sur la période 1975-2000. Un modèle simple de consommation serait ttt uRaaC ++= 10 . On peut se demander si la devaluation a eu un effet sur la consommation. Autrement est-ce qu’il ya eu changement de la consommation des ménages depuis la dévaluation. Le modèle tel qu’il est spécifié ne nous permet pas de donner une réponse à cette question. On va donc introduire une variable qui capte le changement conjoncturel.

⎭⎬⎫

⎩⎨⎧ ≤

=ontsi

Dt sin119940

Le modèle de consommation s’écrit donc tttt uDaRaaC +++= 210

On s’attend à ce que le coefficient 2a soit significatif et positif. Dans ce cas on peut dire que la devaluation a un effet sur la consommation. Exemple 2:Fonction de consommation en coupe instantanée Considérons la fonction de consommation des ménages iii uRaaC ++= 10 . Il y a bien des raisons de penser que le nombre d’enfants du ménage influence considérablement le niveau de la consoamation du ménage. On peut alors penser à estimer un modèle du type iiii uNenfaRaaC +++= 210 . Mais un tel modèle est insatisfaisant. Il suppose en effet que l’impact sur la consommation d’un ménage d’un enfant supplémantaire est identique que le ménage comporte 1 ou 6 enfants! Ce modèle ne prend pas en compte l’économie d’échelle. La relation ne peut pas etre linéaire. Peut-elle etre quadratique? En effet on peut penser comme la rélation est linéaire que le modèle s’écrirait

iiiii uNenfaNenfaRaaC ++++= 22210 .

Toutefois, cette forme ne prend pas en compte la discontinuité dans l’effet marginal d’un enfant supplémantaire. En effet on sait par exemple que la naissance d’un troisième enfants apporte un changement important dans les depenses: il faut déménager, acheter une voiture plus grande etc. Pour tenir compte de la non linéarité et de la discontinuité dans l’effet du nombre d’enfants, on transforme la variable nombre d’enfants en trois variable indicatrices.

⎩⎨⎧

=on

enfantdpasanménagelesiN i sin0

'....'....11

⎩⎨⎧

=0

3....2.........12

enfantsouaménagelesiN i

⎩⎨⎧

=on

enfantsdeplusaleménagesiN i sin0

...3........13

Page 16: Econométrie I

16

(A completer; probleme de multicolinéraité:soit on estime sans la constante et on garde les 3 Variable indicatrice, soit on estime avec la constante, mais on élimine l’une des 3 varaiables indicatrices) Exemple 3: Comparaisons de deux fonction de gains On dispose sur un échantillon d’individus d’un modèle de gains du type iiiii uEpaEpaAaaS ++++= 2

3210 . On se demande si le fait d’étre homme ou femme a un effet sur le salaire. Pour cela on va introduire dans le modèle la variable sexe valant 1 pour un sexe et 0 pour l’autre. On s’attend à ce que le coefficient de cette variable soit significatif. On peut aller plus loin et se demander, si à expérience professionnelles égales, les femmes ont les mêmes salaires que les hommes. On ajoutes aux variables explicatives, la variable EpSexe* . On peut aussi faire un test de CHOW. Le probléme de la multicolinéarité Pour detecter la multocolinaérité entre les explicatives on peut régresser chaque explicative sur les autres. Si le R2 est bon alors il ya multicolinéarité. La matrice de coorélation ne permet devoir que les corrélation entre les Variable deux à deux, la colinéarité n’est pas transitive. S’il ya colinéarité entre X1 et X2,on choisit le bon des deux. Pour cela on regresse le modèle sans X1, puis sans X2, et on retient le modèle qui a le plus pétit AIC. Pour detecter la multicolinéarité, on peut penser à une ACP. Choix du nombre d’explicatives: la méthode de régression pas à pas (méthode descendante/ méthode ascendante) Test de SHOW Le test de Show permet d’examiner si les coefficients d’une régression sont stables par rapport aux observations utilisées. Il compare donc les estimations deux sous-échantillons d’observation afin d’examiner si les coefficients sont significativement différents. Sur des données temporelles, ce test est appelé test de stabilité temporelle. Sur des données en coupe le test de show est qualifié de test d’homogénéité des comportements. Le test de Show permet donc de répondre à des question du genre : la productivité du capital s’est-elle améliorée dans la période récente ? Est-elle la même en Côte d’Ivoire qu’au Gabon ? A qualification égale, les femmes ont-elles des salaires inférieurs aux hommes ? etc. CE TEST UTILISE EN FAIT LES DUMMY VARIABLES.