Transcript
Page 1: régression linéaire simple

Auteur : Sylvain Hanneton (26/09/08)

Régression linéaire simple

Définition proposée

La régression linéaire est une procédure consistant à rechercher la droite qui passe    «     au plus    près      »   d'un nuage de points   .

Identification du modèle

Considérons un nuage de n points   M i   ( i∈[1..n] ) de coordonnées   xi   et   yi

correspondant  à  deux variables  aléatoires  X et  Y..  On cherche   la  pente  a   et  l'ordonnée  à l'origine  b  de la droite tels que les valeurs prédites    yi=a⋅x ib , soient « les plus proches possibles » des valeurs observées  yi . En fait, a et b sont calculés de façon à minimiser le critère suivant :

C a ,b =∑i

n

yi−yi ²

La pente de la droite de régression est donnée par le rapport de la covariance entre X et Y sur la variance  s² X  de X.

a=cov X ,Y

s² x

L'ordonnée à l'origine  b  est donnée par la formule suivante :b=Y – a⋅X

où  Y  et  X  sont les moyennes de Y et X.

Qualité du modèle

La qualité de la régression linéaire, c'est à dire sa capacité à modéliser le nuage de points peut être quantifiée   en   utilisant   le   calcul   du   coefficient   de   détermination   obtenu   à   partir   du   calcul   du coefficient de corrélation   r   entre X et Y. Le coefficient de détermination donne une idée du pourcentage de variance expliquée (PVE) par le modèle.

Coefficient de détermination  cd=r²Pourcentage de variance expliquée PVE=100⋅r²

Par exemple un PVE de 10% indique que le modèle linéaire n'explique que 10% de la variance du nuage de points.

Tests statistiques associés

La   régression   linéaire   permet   de   modéliser   la   relation   entre   deux   variables   aléatoires quantitatives. Elle permet notamment d'obtenir une prédiction concernant la valeur d'une variable en   fonction  de   l'autre.  Cependant,  cette  procédure  ne  dit   rien  quant  à   l'existence  d'une   liaison statistique entre ces deux variables. Pour quantifier la qualité  de ce modèle ou déterminer si les 

 Sauf mention contraire, le contenu du site est placé sous la protection de cette licence Creative Commons.  1

Page 2: régression linéaire simple

Auteur : Sylvain Hanneton (26/09/08)

variables X et Y sont liées, il est nécessaire d'effectuer un test de corrélation.

Statut de la fiche : 

fiche provisoire à revoir 

 Sauf mention contraire, le contenu du site est placé sous la protection de cette licence Creative Commons.  2


Recommended