2
Auteur : Sylvain Hanneton (26/09/08) Régression linéaire simple Définition proposée La régression linéaire est une procédure consistant à rechercher la droite qui passe  «     au plus    près     »    d'un nuage de points   . Identification du modèle Considérons un nuage de n points M i  ( i ∈[ 1..n ] ) de coordonnées x i  et y i correspondant à deux variables aléatoires X et Y.. On cherche la pente a  et l'ordonnée à l'origine b  de la droite tels que les valeurs prédites   y i = a x i b , soient « les plus proches possibles » des valeurs observées y i . En fait, a et b sont calculés de façon à minimiser le critère suivant : C a,b = i n y i y i ² La pente de la droite de régression est donnée par le rapport de la covariance entre X et Y sur la variance X  de X. a = cov X ,Y x L'ordonnée à l'origine b  est donnée par la formule suivante : b = Y–a X où  Y  et  X  sont les moyennes de Y et X. Qualité du modèle La qualité de la régression linéaire, c'est à dire sa capacité à modéliser le nuage de points peut être quantifiée en utilisant le calcul du coefficient de détermination obtenu à partir du calcul du coefficient de corrélation r  entre X et Y. Le coefficient de détermination donne une idée du pourcentage de variance expliquée (PVE) par le modèle. Coefficient de détermination cd = Pourcentage de variance expliquée PVE =100 Par exemple un PVE de 10% indique que le modèle linéaire n'explique que 10% de la variance du nuage de points. Tests statistiques associés La régression linéaire permet de modéliser la relation entre deux variables aléatoires quantitatives. Elle permet notamment d'obtenir une prédiction concernant la valeur d'une variable en fonction de l'autre. Cependant, cette procédure ne dit rien quant à l'existence d'une liaison statistique entre ces deux variables. Pour quantifier la qualité de ce modèle ou déterminer si les  Sauf mention contraire, le contenu du site est placé sous la protection de cette  licence Creative Commons.  1

régression linéaire simple

Embed Size (px)

DESCRIPTION

Short note concerning linear regression (french)

Citation preview

Page 1: régression linéaire simple

Auteur : Sylvain Hanneton (26/09/08)

Régression linéaire simple

Définition proposée

La régression linéaire est une procédure consistant à rechercher la droite qui passe    «     au plus    près      »   d'un nuage de points   .

Identification du modèle

Considérons un nuage de n points   M i   ( i∈[1..n] ) de coordonnées   xi   et   yi

correspondant  à  deux variables  aléatoires  X et  Y..  On cherche   la  pente  a   et  l'ordonnée  à l'origine  b  de la droite tels que les valeurs prédites    yi=a⋅x ib , soient « les plus proches possibles » des valeurs observées  yi . En fait, a et b sont calculés de façon à minimiser le critère suivant :

C a ,b =∑i

n

yi−yi ²

La pente de la droite de régression est donnée par le rapport de la covariance entre X et Y sur la variance  s² X  de X.

a=cov X ,Y

s² x

L'ordonnée à l'origine  b  est donnée par la formule suivante :b=Y – a⋅X

où  Y  et  X  sont les moyennes de Y et X.

Qualité du modèle

La qualité de la régression linéaire, c'est à dire sa capacité à modéliser le nuage de points peut être quantifiée   en   utilisant   le   calcul   du   coefficient   de   détermination   obtenu   à   partir   du   calcul   du coefficient de corrélation   r   entre X et Y. Le coefficient de détermination donne une idée du pourcentage de variance expliquée (PVE) par le modèle.

Coefficient de détermination  cd=r²Pourcentage de variance expliquée PVE=100⋅r²

Par exemple un PVE de 10% indique que le modèle linéaire n'explique que 10% de la variance du nuage de points.

Tests statistiques associés

La   régression   linéaire   permet   de   modéliser   la   relation   entre   deux   variables   aléatoires quantitatives. Elle permet notamment d'obtenir une prédiction concernant la valeur d'une variable en   fonction  de   l'autre.  Cependant,  cette  procédure  ne  dit   rien  quant  à   l'existence  d'une   liaison statistique entre ces deux variables. Pour quantifier la qualité  de ce modèle ou déterminer si les 

 Sauf mention contraire, le contenu du site est placé sous la protection de cette licence Creative Commons.  1

Page 2: régression linéaire simple

Auteur : Sylvain Hanneton (26/09/08)

variables X et Y sont liées, il est nécessaire d'effectuer un test de corrélation.

Statut de la fiche : 

fiche provisoire à revoir 

 Sauf mention contraire, le contenu du site est placé sous la protection de cette licence Creative Commons.  2