Upload
mohammed-jabrane
View
216
Download
0
Embed Size (px)
Citation preview
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
1/60
La rgression multipleEconomtrie applique
Cours de M1 deuxime partie
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
2/60
Quand utiliser la rgressionmultiple
Pour estimer la relation entre une variabledpendante (Y) et plusieurs variablesindpendantes (X1,X2, )
Exemples Expliquer le prix dun appartement par la
superficie, les prestations, lemplacement,
Expliquer les ventes dun magasin par lemarch total, le prix, linvestissement, la
publicit, Expliquer la consommation des vhicules par le
prix, la cylindre, la puissance et le poids.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
3/60
Le modle linaire de rgressionmultiple
Equation de rgression multiple
Cette quation prcise la faon dont la variabledpendante est relie aux variables explicatives :
o b0, b1, b2, . . . , bp sont les paramtres et eest unbruit alatoire reprsentant le terme derreur.
ebbbb ppXXXY ...22110
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
4/60
Le modle linaire de rgressionmultiple
Les termes de lquation
ipipiii xxxy ebbbb ...22110
ime observation
de Y
Terme constant
Influence de la
variableX1
Influence de
la variableXp
Rsidu de la ime
observation
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
5/60
Le modle linaire de rgressionmultiple
Ecriture matricielle du modle
eb
e
e
b
b
b
Xy
xx
xx
y
y
n
p
pnn
p
n
1
1
0
,,1
,11,11
1
1
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
6/60
Le modle linaire de rgressionmultiple
Les hypothses du modle Les hypothses de nature probabiliste
Les variables Xi sont alatoires
E(ei)=0 pour tout iV(ei)=s2pour tout 1ip (homoscdasticit des
erreurs)
Cov(ei , ei)=0 pour tout ij
Le vecteur alatoire e suit une loi normale n
dimensions N(0, s2In) Les hypothses structurelles
Det(XTX)0 (absence de colinarit entre lesvariables explicatives).
n>p+1
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
7/60
Le modle linaire de rgressionmultiple
Interprtation gomtriqueLe modle gnral dfinit un hyperplan de dimension
p. Nous illustrons le cas p=2.
X1
X2
Y
b0
(X1i,X2i)
E(Yi
|X1i
, X2i
) =b0
+b1
X1i
+b2
X2
e
i
Yi: observation
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
8/60
Le processus destimation
Modle de rgression multiple
Y=b0+b1X1+b2X2+. . .+bpXp+eHyperplan de rgression multiple
E(Y|X1,,Xp) =b0+b1X1+b2X2+. . .+bpXp
Paramtres inconnus
b0,b1,b2, . . . ,bp
Donnes:x1 x2 . . . xp y
. . . .
. . . .
Estimateursde
b0,b1,b2, . . . ,bp
pbbbb ,...,,, 210
pbbbb,...,,, 210
ppXXXY bbbb... 22110
Equation estime
Estimateurs
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
9/60
Le processus destimation
Interprtation gomtriqueIllustration du cas p=2.
X1
X2
Y
(X1i,X2i)
yi: observation
iii XXy 22110
bbb 0
b
iii yy e
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
10/60
Le processus destimation
Estimation des coefficients de rgression La mthode : les moindres carrs ordinaires
Le principe de lestimation des coefficients dergression :
consiste minimiser la somme des carrs desrsidus :
Le calcul numrique lui-mme (calcul matriciel)peut seffectuer laide de logiciels statistiques(SAS, SPSS, S+, R, Gretl,).
n
i
ii
n
i
i yy1
2
1
2
)
(e
pbbbb ,...,,, 210
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
11/60
Le processus destimation
Estimation des coefficients du modleLa mthode des moindres carrs donne pourrsultat :
suit une loi
est sans biais :Parmi les estimateurs de b linaires par rapport
X, sans biais, les lments de ont la plus petitevariance.
YXXXTT 1
b
b 12,0N XXTes
b bb )
(E
b
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
12/60
Le processus destimation
Interprtation des coefficients dergression estims La pente (k0)
Lestime de Yvarie dun facteur gal lorsque Xkaugmente dune unit, les autres
variables tant maintenues constantes.
Lordonne lorigine
Cest la valeur moyenne de Y lorsque toutes lesXi sont nulles.
kb
kb
0
b
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
13/60
Le processus destimation
Estimation de la variance des rsidus
1
1
2
2
pn
n
i
ie
s
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
14/60
Le processus destimation
Les intervalles de confianceOn peut calculer pour chaque coefficient dumodle un intervalle de confiance de niveau (1-a)
donn par :
o ta/2 se calcule partir de :
Tsuivant une de Student n-p-1 d.d.l.
abbbbaba
1)(2/2/ii
ststP iii
2/1)( 2/ aa tTP
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
15/60
Le processus destimation
Les donnes Taille de lchantillon
Les donnes doivent tre suffisamment
nombreuses : 15 20 par variable au moins. La nature des variables
Dans la pratique, Yest une variablequantitative et les Xi peuvent tre quantitatives
ou binaires.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
16/60
Qualit de la rgression
Dcomposition de la somme des carrstotale
SCT : somme des carrs totale
SCR : somme des carrs des rsidusSCE : somme des carrs expliqus par le modle
n
i
ii
n
i
i
n
i
i yyYyYy1
22
1
2
1
)(
SCT = SSE + SCR
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
17/60
Qualit de la rgression
Interprtation gomtrique de ladcomposition en somme de carrs
y y
y222
yyyyyy
Thorme de Pythagore
ny
yy
1
Y
Yy
ny
yy
1
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
18/60
Qualit de la rgression
Les coefficients de dtermination Le coefficient de dtermination R2
Il exprime le pourcentage de la variance de Yexplique par le modle. Il donne une ideglobale de l'ajustement du modle.
Le R2 ajust se calcule en fonction du R2 :
Il traduit la fois la qualit de lajustement(liaison entre Yet les Xi) et la complexit dumodle (nombre de variables explicatives).
R2 = SCE/SCT
)1(1
11 22 R
pn
nRa
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
19/60
Qualit de la rgression
Remarques sur le R2 0R21
Lorsque le R2 est proche de 1, cela se signifie que lavariable dpendante Yest bien explique par les
variablesXi. La racine carre de R2, R, porte le nom de coefficient de
corrlation multiple entre Yet lesXi.
Lorsque lon ajoute de nouvelles variables explicativesau modle, le R2 augmente (mme dans le cas o les
nouvelles variables explicatives sont trs lies lavariable dpendante).
Cest la raison pour laquelle on introduit le R2 ajust.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
20/60
Qualit de la rgression
Le test global de FisherIl permet de rpondre la question : la liaisonglobale entre Yet les Xi est-elle significative ?
HypothsesH0: b1 = b2 = ... = bp = 0
Yne dpend pas des variables Xi .
H1: Au moins un coefficient est non nulYdpend dau moins une variable Xi .
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
21/60
Qualit de la rgression
Statistique utilise
Rgle de dcision
Au risque a, on rejette H0 si : a p-value
(calcule avec une loi de Fisher p et n-p-1degrs de libert)
1
SCR
SCE
MSR
MSEF
pn
p
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
22/60
Qualit de la rgression
R2 et test de Fisher
F bon, R mauvais F bon, R bon
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
23/60
Qualit de la rgression
Le test de Student sur un coefficient dergressionIl permet de rpondre la question suivante :
lapport marginal dune variable Xj est-ilsignificatif ?
Hypothses
H0 : bj = 0 (j0)
On peut supprimer la variableXjH1 : bj 0
Il faut conserver la variableXj
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
24/60
Qualit de la rgression
Statistique utilise sous lhypothse H0
Rgle de dcision
Au risque a, on rejette H0 si : a p-value(calcule partir dune loi de Student
n-p-1 degrs de libert).
i
i
ii
i
ss
t bb
b
b
deestimtype-cart:,
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
25/60
Analyse des rsidus
Normalit QQ plot
Tests de normalit
Homoscdasticit La variance des rsidus nest pas stable.
Transformation des donnes
Indpendance des rsidus Test de Durbin-Watson
Dtection des valeurs atypiques
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
26/60
Les variables indicatrices
Variable muette ou indicatrice (dummyvariable)Variable prenant les valeurs 0 ou 1 pour indiquer
que lobservation prsente une certainecaractristique, par exemple une priodicit(trimestre, mois,).
Exemple : la consommation de fuel trimestrielle
di = 1 pour le ime trimestre
di = 0 sinon
tt dddtX ebbbbb 44231210
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
27/60
Multicolinarit
DfinitionCest lexistence de corrlations leves (au delde 0.70) entre les variables indpendantes(variables explicatives).
La multicolinarit a notamment pourconsquences :
- de fausser la prcision de lestimation descoefficients de rgression
- de rendre sensible lestimation des coefficients de petites variations des donnes.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
28/60
Multicolinarit
X1
Variablesindpendantes
X3
X2
Variablescolinaires
X2
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
29/60
Multicolinarit
Dtection Examen de la matrice de variance covariance
ou de corrlation.
R2
lev mais peu de variables significatives. Fortes corrlations entre les Xi Fortes corrlations partielles entre les variables
indpendantes.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
30/60
Slection des variables
ProblmatiqueComment choisir le modle comportant lameilleure combinaison de variables indpendantesexpliquant la variable dpendante ?
Stratgies Examiner tous les modles possibles
Slection progressive
Rgression pas pas descendante
Rgression pas pas ascendante
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
31/60
Slection des variables
Examiner tous les modles possiblesCette stratgie consiste envisager tous lesmodles et retenir le meilleur.
InconvnientsLenteur (2p modles si p est le nombre de variablesexplicatives) et cot de cette approche
Cest quoi le meilleur modle ?
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
32/60
Slection des variables
Le test de FisherIl permet de tester si le fait dajouter unevariable indpendante un modle comportantdj une variable (ou de supprimer une variable
dun modle comportant deux variables) eststatistiquement significatif.
La p-value correspondante est utilise commecritre de dcision pou ajouter ou supprimer unevariable.
)1/(),(
),()(
21
211
pnXXSCE
XXSCEXSCEF
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
33/60
Rgression pas pas
Calcul de Fet de lap-value pour chaque Xi
du modle
Dbut
p-value > seuil
?
Arrt
La variableXiayant laplus grandep-value estsupprime du modle
Calcul de Fet de lap-value pour chaqueXine se trouvant pas
Dans le modle
p-value < seuil
?
La variableXiayant laplus petitep-value estentre dans le modle
Non
Non Oui
Oui
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
34/60
Rgression pas pas descendante
Arrt
Calcul de F et de lap-value pour chaqueXi
p-value > seuil?
La variableXiayantla plus grandep-value estsupprime du modle
Non
Oui
Au dparttoutes les variablesXisont dans le modle
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
35/60
Exemples
Deux exemples sont traits en cours
laide du logiciel SPSS :
lun dentre eux illustre la mise en uvre
dune rgression multiple et lautre laslection des variables dans un modle laide de la mthode de rgressiondescendante.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
36/60
Une tude empirique
Titre de larticle : Reliving the 50s: the BigPush, Poverty Traps, and Take-offs inEconomic Development, William Easterly
(2005)
Donnes utilises : Maddison, Angus. TheWorld Economy : Historical Statistics.OECD 2003.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
37/60
Une tude empirique
Lauteur William Easterly Expert reconnu du dveloppement conomique
et de l'Afrique
Professeur lUniversit de New York
Chercheur au Center for Global Development(Washington)
Il a travaill en tant quconomiste pendant 16ans la Banque Mondiale. Il a d quitter
linstitution la suite de la parution de sonouvrage : Les pays pauvres sont-ilscondamns le rester ? (juin 2006).
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
38/60
Une tude empirique
Termes importants dans le titre de larticle conomie du dveloppement
Big Push
Poverty traps Take-offs
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
39/60
Economie du dveloppement
Quest ce que lconomie du dveloppement ?
Branche de lconomie qui applique les mthodesmacroconomiques et microconomiques ltudedes problmes conomiques, sociaux,
environnementaux et institutionnels rencontrs parles PVD (Pays en Voie de Dveloppement).
Points focaux
Dterminants de la pauvret et du sous
dveloppement
Politiques mettre en uvre pour sortir les PVDde leur sous-dveloppement.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
40/60
Une tude empirique
Le big push Les conomistes du dveloppement des annes50 prconisaient la thorie du "Big Push":
les pays les plus pauvres se trouvent enfermsdans une trappe pauvret. Daprs eux, seul uneffort massif d'investissement financ par l'aideinternationale peut leur permettre de dcoller.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
41/60
Une tude empirique
La problmatique de larticleLe rapport des Nations unies sur les objectifs dumillnaire de janvier 2005 et celui de laCommission britannique pour l'Afrique de mars
2005 sont marqus par le retour de lidequunecombinaison dinvestissements peut permettreaux conomies africaines de sortir des trappes pauvret.
William Easterly a voulu tester cette approche du
big push comme rponse aux trappes pauvret en utilisant des rgressions sur le tauxde croissance.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
42/60
Une tude empirique
Comment tester lexistence de trappes pauvret ? Revue de la littrature
Les pays pauvres ont-ils une croissance partte significativement infrieure celle desautres pays et cette croissance est-elle nulle ?
Donnes : revenu par tte de 1950 2001pour 137 pays.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
43/60
Une tude empirique
Test de stationnarit sur le taux decroissance par tte
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
44/60
Une tude empirique
Que signifie la stationnarit ?Si lhypothse dune trappe pauvret est vraie,alors le Log du revenu par tte pour les pays lesplus pauvres doit tre stationnaire. Le revenu vafluctuer dune faon alatoire autour de sonniveau moyen.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
45/60
Une tude empirique
Formulation dun test de stationnarit
Hypothse H0 : le Log du revenu par tteest stationnaire.
Hypothse H1 : le Log du revenu par ttenest pas stationnaire.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
46/60
Une tude empirique
Divergence Big Time (Pritchett,1996) Le creusement considrable de lcart de
revenu entre les pays les plus riches et les pluspauvres du monde.
Le ratio de revenu par habitant entre le pays leplus riche et le plus pauvre du monde a tmultipli par 6 au cours du dernier demi-sicle.
Selon la Banque Mondiale, le revenu moyendans les 20 pays les plus riches est 37 fois pluslev que le revenu moyen dans les 20 paysles plus pauvres, et ce ratio a doubl depuis1960.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
47/60
Une tude empirique
Big time divergenceUtilisation dune rgression :
pour expliquer le taux de croissance par tte par
le revenu initial et des indicateurs de dmocratiedes institutions politiques.
U t d i i
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
48/60
Une tude empirique
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
49/60
Une tude empirique
Les indicateurs de dmocratie
Lindicateur de Freedom House (ONG) attribue:deux notes, lune relative aux droits politiques etlautre aux droits civils.
une lettre dpendant de la moyenne des deux notesprcdentes.
Lindicateur Polity IVCe coefficient (qui va de 1, niveau de contrainte le plusfaible, 7) rend compte de la qualit initiale desinstitutions politiques, mesure par les contraintespesant sur le pouvoir excutif.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
50/60
Une tude empirique
Take-off (dcollage) Une suite continue de rgimes croissance
nulle suivie dune suite continue de rgimes croissance positive.
La croissance sera considre comme nulle dsque le taux de croissance se trouve danslintervalle [-0.5%,0.5%].
La croissance par tte est considre commepositive et stable lorsquelle est au-dessus de1.5% su une priode suffisamment longue.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
51/60
Une tude empirique
Situation de dcollage
t
Taux de croissance
0.5%
-0.5%
1.5%
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
52/60
Take-offs dans les pays riches
Take-offs in rich countries (data from Maddison 2003)
1600-1700 1700-1820- 1820-1870 1870-1913 1913-1960 1960-2001 1820-2001
Australia 3.7% 0.9% 1.1% 1.8% 2.1%
Austria 0.2% 0.2% 0.8% 1.4% 1.3% 2.8% 1.6%
Belgium 0.2% 0.1% 1.4% 1.0% 1.1% 2.7% 1.5%
Canada 0.6% 1.3% 2.2% 1.4% 2.3% 1.6%
Denmark 0.2% 0.2% 0.9% 1.6% 1.7% 2.4% 1.8%
Finland 0.2% 0.2% 0.8% 1.4% 2.3% 2.9% 1.6%
France 0.1% 0.2% 1.0% 1.4% 1.6% 2.5% 1.6%
Germany 0.1% 0.1% 1.1% 1.6% 1.6% 2.2% 1.6%Greece 0.1% 0.2% 0.6% 1.4% 1.4% 3.4% 1.8%
Ireland 0.2% 0.2% 1.4% 1.0% 1.0% 4.1% 1.6%
Italy 0.0% 0.0% 0.6% 1.2% 1.8% 2.9% 1.9%
Japan 0.1% 0.1% 0.2% 1.5% 2.2% 4.0% 1.4%
Netherlands 0.4% -0.1% 0.8% 0.9% 1.5% 2.4% 1.7%
New Zealand 1.2% 1.4% 1.2%
Norway 0.2% 0.2% 0.5% 1.3% 2.3% 3.0% 1.5%Portugal 0.1% 0.1% 0.1% 0.6% 1.8% 3.8% 1.5%
Spain 0.0% 0.1% 0.4% 1.2% 0.9% 4.0% 1.6%
Sweden 0.2% 0.2% 0.7% 1.4% 2.2% 2.1% 1.7%
United Kingdom 0.2% 0.3% 1.3% 1.0% 1.2% 2.1% 1.4%
United States 0.7% 1.3% 1.8% 1.5% 2.3% 1.7%
median growth of rich
countries 0.2% 0.2% 0.8% 1.3% 1.6% 2.7% 1.6%
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
53/60
Une tude empirique
Take-offs dans les pays riches Parmi les pays riches, seul le Japon rpond la
dfinition donne du dcollage.
Pour tous les autres pays on observe pluttune acclration graduelle de la croissanceplutt quun dcollage.
Cela nest pas compatible avec la notion dun
big push entranant une transitionsoudaine dune stagnation vers une croissancevigoureuse.
T k ff d l i
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
54/60
Take-offs dans les rgions endveloppement
Rgion 1820-1870 1870-1913 1913-1950 1950-1975 1975-2001
Africa 0.3% 0.6% 0.9% 1.8% 0.2%
Caribbeancountries (24) -0.3% 1.8% 1.4% 3.2% 1.0%
East Asiancountries (16)
-0.1% 0.5% -0.1% 3.5% 3.4%
East EuropeanCountries (7)
0.6% 1.4% 0.6% 3.7% 0.4%
Latin America 0.0% 1.8% 1.4% 2.5% 0.8%
West Asiancountries (15)
0.4% 0.9% 1.3% 4.4% 0.2%
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
55/60
Une tude empirique
Take-offs dans les rgions en dveloppement Seule la rgion du sud est asiatique satisfait la
dfinition propose du take-off.
LAmrique latine et les Carabes ont connupendant la priode 1870-1913 un pr-dcollagemais il na pas t soutenu.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
56/60
Une tude empirique
Take-offs dans les pays Sur les 44 pays tudis, seuls 5 dentre eux
satisfont la dfinition dEasterly dun take-off.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
57/60
Une tude empirique
Sur lexistence des trappes pauvretEasterly rejette lhypothse de lexistence destrappes pauvret sur la base des deuxarguments suivants :
- il y a trs peu de pays taux de croissance surlintervalle [-0.5, 0.5] pour la priode 1950 2000
- le logarithme du revenu par tte nest passtationnaire.
Cependant sur le premier point, on peutargumenter que cette conclusion est dpendantedes priodes ou sous priodes considres.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
58/60
Une tude empirique
Conclusions de larticle Aucun des pays tests dans ltude nest dans
une trappe pauvret (dfinie par uneabsence totale et durable de croissance).
L'influence de l'aide sur l'investissement et lacroissance nest pas vidente. Il ne semble pasnon plus que l'aide soit un facteurdterminant pour les rares pays avoirdcoll.
Pour Easterly, la qualit des institutions
politiques est un facteur bien plus importantpour le dveloppement que lapport duned'aide massive et soudaine.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
59/60
Une tude empirique
Remarque importante
Ce working paper est controvers sur un certainnombre de points par dautres conomistes. Doncprudence dans les conclusions quen tire lauteur.
Dans ce cours, cela a surtout servi introduireune problmatique de recherche et mettre envidence un certain nombre de mthodes etoutils.
7/29/2019 cours_m1_econometrie_appliquee_slide34.ppt
60/60
Une tude empirique
Mthodes et outils
Cet article montre la ncessit dutiliser, entreautres, des mthodes de rgression et des testspour valider des hypothses dans les tudesempiriques.
La rgression et les tests dhypothses sont deuxoutils fondamentaux dans les tudes empiriques.