6
M1 2013/2014 Implémentation des procédures statistiques Introduction aux régressions linéaires

M1 2013/2014 Implémentation des procédures statistiques Introduction aux régressions linéaires

Embed Size (px)

Citation preview

Page 1: M1 2013/2014 Implémentation des procédures statistiques Introduction aux régressions linéaires

M1 2013/2014

Implémentation des procédures statistiques Introduction aux régressions linéaires

Page 2: M1 2013/2014 Implémentation des procédures statistiques Introduction aux régressions linéaires

Compléments en statistiques

Covariance

Coefficient de corrélation linéaire

On décrit un lien. Corrélation n’est pas cause.

Page 3: M1 2013/2014 Implémentation des procédures statistiques Introduction aux régressions linéaires

Les données utilisées

Cross section data (transversales): observation des caractéristiques (âge, salaires, nombre d’années d’étude) de plusieurs individus statistiques (pays, entreprises, personnes) à un instant t.

Pooled cross section data : on combine plusieurs données transversales observées sur des individus différents à des instants différents.

Time series data (séries temporelles): observation de l’évolution dans le temps des caractéristiques des individus. Ex : le PIB, le taux de chômage, l’indice des prix.

Panel data (longitudinales): on observe les caractéristiques des mêmes individus sur plusieurs périodes.

Page 4: M1 2013/2014 Implémentation des procédures statistiques Introduction aux régressions linéaires

Econométrie

Exemple. On s’intéresse à l’effet de l’éducation, de l’expérience professionnelle et de la formation continue sur les salaires

Modèle :Salaires = β0 + β1 educ + β2 exp + β3 form +υ

υ représente tous les autres facteurs inobservés qui déterminent le salaire -> on l’appelle le terme d’erreur

On mesure un effet causal. L’effet de l’éducation sur le salaire est étudié toute chose égale par ailleurs (ceteris paribus).

Importance du choix des variables explicatives. Littérature économique.

Biais de sélection.

Page 5: M1 2013/2014 Implémentation des procédures statistiques Introduction aux régressions linéaires

Régressions linéaires

On s’intéresse à la liaison entre les deux variables. Deux variables numériques (continues quantitatives).

On effectue une régression de Y en X, ie on cherche à expliquer Y par X.

La régression fournit une expression de cette liaison sous forme d’une fonction. La régression linéaire est un cas particulier où la liaison est représentée par une fonction linéaire. Exemple : cas où la covariance est nulle car la liaison est non linéaire (parabolique, hyperbolique, etc).

La corrélation renseigne sur l’intensité de la liaison linéaire

Généralisation à une variable expliquée et plusieurs variables explicatives

Page 6: M1 2013/2014 Implémentation des procédures statistiques Introduction aux régressions linéaires

Régression linéaire simple & méthode des moindres carrés

On cherche la relation entre y et x. La RLS suppose qu’il existe une relation de la forme,

Le terme d’erreur u capture tous les facteurs inobservés !

MCO

On peut généraliser au modèle

Interprétation du modèle