Classeur : "COREG" - Feuille "cours" Page 1
Régression et corrélation
Plan
1 Description de 2 variables quantitatives 1
2 Régression simple 2
2.1 Rappels sur l'ajustement linéaire 2
2.2 Autres types d'ajustement 4
2.3 Mesure de la qualité de la régression 5
2.4 Jugement sur échantillon 6
3 Exemples 8
4 Régression multiple 14
Dans le chapitre sur le test du khi-deux, nous avons étudié les liaisons entre
deux caractères qualitatifs.
Ici, nous nous intéresserons aux liaisons entre des caractères quantitatifs :
(d'abord 2 : c'est la régression simple ; puis plus de 2 : c'est la régression multiple)
Tout d'abord, nous essaierons de décrire ces liaisons, puis nous proposerons des
modèles explicatifs.
1. Description de 2 variables quantitativesExemple 1
Une companie pétrolière décide d'implanter de nouvelles stations-service.
On mesure sur 6 stations le trafic observé (Variable X =nombre moyen de voitures
par heure) ainsi que le C.A. moyen réalisé en une heure (variable Y).
Station Trafic CA1 150 2200 2 55 750 3 220 2500 4 130 1450 5 95 1800 6 110 1500
Classeur : "COREG" - Feuille "cours" Page 2
Nuage de points
2. Régression simple
2.1 Rappels sur l'ajustement linéaire
Lorsque l'allure du nuage de points le commande, on réalise un "ajustement linéaire"
On fait passer une droite "au mieux" dans un nuage de points.
Y = b0 + b1 X
Chaque point correspond à un couple (xi, yi) de valeurs des variables X et Y.
yci est la valeur calculée à l'aide de la droite à partir de xi
yci = b0 + b1 xi
L'écart entre yci et yi est appelé écart résiduel ou résidu , on le note : ei
La méthode des moindres carrés minimise la somme des ei2
40 60 80 100 120 140 160 180 200 220 240
0
500
1000
1500
2000
2500
3000
Description des C.A. en fonction du trafic
,
Classeur : "COREG" - Feuille "cours" Page 3
On trouve
Exemple : Station Trafic CA CA calc résidu
1 150 2200 ### ###
2 55 750 ### ###
3 220 2500 ### ###
4 130 1450 ### ###
5 95 1800 ### ###
6 110 1500 ### ###
40 60 80 100 120 140 160 180 200 220 240 0
500
1000
1500
2000
2500
3000
f(x) = 9.80340063761956 x + 458.235919234856R² = 0.791219342800003
CA en fonction du trafic
CALinear ( CA)CA calc
Ces 2 graphiques sont des nuages de points. Dans les 2 cas, le trafic est en abscisse. Dans le premier cas, le CA est en or -donnée et on ne représente que les points, Dans le second, le CA calculé est en ordonnée et on représente aussi les lignes.
b1 = cov (X,Y )var (X )
=∑i=1
n
( x i - { x )( y i - { y )
∑i=1
n
( x i - { x )2¿ ¿b 0 = { y¿ -b1 x ¿ ¿ x est la moyenne des x i ¿ y est la moyenne des y i ¿¿
Classeur : "COREG" - Feuille "cours" Page 4
Usage de la fonction matricielle : DROITEREG
La plage ci-dessous, (nommée : RESULT), contient certains résultats importants
fournis par EXCEL
La première cellule (en haut à gauche), correspond à la pente de la droite.
La deuxième (en haut, à droite), correspond au second membre.
### ### les autres cellules sont expliquées par des
### ### commentaires, nous y reviendrons par la suite.
### ###
### 4 ### ###
2.2Autres types d'ajustements
SAVOIR-FAIRE EXCELLa droite des moindres carrés peut être déterminée par EXCEL avec les fonctions matricielles : TENDANCE et DROITEREG
Le moyen le plus simple est cependant de "coller directement" la droite sur le graphique (sélectionner la série de données et choisir l'option "ajouter une courbe de tendance" dans le menu contextuel) et d'afficher l'équation et le coefficient de détermination (options).Il existe aussi un utilitaire d'analyse : Régression linéaire
SAVOIR-FAIRE EXCELIl existe aussi une fonction CROISSANCE qui est l'équivalent de TENDANCE pour l'ajustement exponentiel.L'équivalent de la fonction DROITEREG est dans ce cas : LOGREG.Mais là encore, le moyen le plus simple est de coller directement la fonction sur le graphique.
Classeur : "COREG" - Feuille "cours" Page 5
2.3Mesure de la qualité de la régression
Variance totale = Variance expliquée + Variance résiduelle
Le coefficient de détermination
mesure la part de la variance totale qui est expliquée par la régression
Le coefficient de corrélation
est égale à la racine carrée du coefficient de corrélation.
Le coefficient de corrélation (tout comme le coefficient de détermination)
Plus il est proche de -1, plus l'intensité de la relation est négativement forte
Plus il est proche de 1, plus l'intensité de la relation est positivement forte
Plus il est proche de 0, plus l'intensité de la relation est faible.
Attention à l'utilisation et à l'interprétation !
permet de juger de l'intensité de la relation existant entre les variables.
Attention, il peut être négatif ! (il est du signe de b1).
Ve r² = ----- Vt
Ve r² = ----- Vt
Vt = ∑i
( y i− y )2
nVe = ∑
i
( y ci− y )2
nVr = ∑
i
( y i -y ci )2
n=∑
i
e i2
n
SAVOIR-FAIRE EXCEL utiliser les fonctions COEFFICIENT.CORRELATION COEFFICIENT.DETERMINATION Il existe aussi un utilitaire d'analyse : Analyse de corrélation
Classeur : "COREG" - Feuille "cours" Page 6
2.4 Jugement sur échantillon
L'équation de régression est obtenue à partir d'un ensemble d'observations que
l'on doit considérer comme un échantillon à partir du moment où les résultats de
l'étude ont un objectif qui dépasse la simple description d'une liaison observable
sur un ensemble (par exemple : prévision).
Les hypothèses à respecter :
Ce modèle peut être testé de différentes manières :
nous en présenterons deux ici : le test de Student sur la pente et le test de
Fischer.
Echantillon
Y = b1 X + b0
yi = b1 xi + b0 + ei
Population
Y = b1 X + b0
yi = b1 xi + b0 + ei
Population
Y = b1 X + b0
yi = b1 xi + b0 + ei
Les ei doivent être des variables aléatoires indépendantes , normalement distribuées - de moyennes nulles (absence de biais) E(ei) = 0 - de variances égales (homoscédacité) V(ei) est estimé par S ei² /(n-2)
Classeur : "COREG" - Feuille "cours" Page 7
2.4. Test sur la pente
calculs
###
###
seuil : 0.05 borne inf. ###
t = ### borne sup ###
décision
c'est à dire avec au plus 5.00% de risque d'erreur
Variante méthodologique
###
et en appliquant le fonction STUDENT, déterminer la p-valeur
p = ### pour un test bilatéral.
Décision: Puisque la p-valeur est inférieure au seuil de 5%,
on peur rejeter (H0)
test associé : on peut tester l'hypothèse (H0) : "b1 = 0"
b1 =
Sb1 =
0 n'est pas dans l'intervalle, donc on peut rejeter (H0) au seuil choisi.
On peut directement calculer le rapport b1 / Sb1 =
b1 ± t sb1
sb1 étant l'estimation de l'écart-type de b1
valeur donnée par EXCEL (lig.2, col.1)t correspond à la loi de Student à n-2 d.d.l
b1 ± t sb1
sb1 étant l'estimation de l'écart-type de b1
valeur donnée par EXCEL (lig.2, col.1)t correspond à la loi de Student à n-2 d.d.l
s b1 = √ ∑
i
e i2
(n-2 )∑i
( x i− x )2
Classeur : "COREG" - Feuille "cours" Page 8
2.4. Test de FISCHER
La valeur du F de FISCHER est donnée dans le tableau RESULT (lig. 4, col. 1)
Remarque
Avec Excel, on peut également utiliser l'utilitaire d'analyse qui donne directement
tous les tests.
Outils / Utilitaire d'Analyse / Régression linéaire
RAPPORT DÉTAILLÉ
Statistiques de la régression
Coefficient de détermination multiple ###
Coefficient de détermination R^2 ###
Coefficient de détermination R^2 ###
Erreur-type ###
Observations 6
ANALYSE DE VARIANCE
F
Régre 1 ### ### ### ###
Résid 4 ### ###
Total 5 1905000
Coefficients Erreur-type Statistique t Probabilité
Consta ### ### ### ### ### ### ### ###
Trafic ### ### ### ### ### ### ### ###
Exemples
Exemple 2
Les coûts de crédit
Degré de liberté
Somme des carrés
Moyenne des carrés
Valeur critique de
F
Limite inférieure pour seuil de confiance = 95%
Limite supérieure pour seuil de confiance = 95%
Limite inférieure pour seuil de confiance = 95,0%
Limite supérieure pour seuil de confiance = 95,0%
Classeur : "COREG" - Feuille "cours" Page 9
Lorsque vous contractez un emprunt auprès d'une banque, il y a différents types de coûts.
Nous considérons ici :
- le taux d'intérêt (un pourcentage)
- le coût d'entrée (un pourcentage du montant emprunté)
On désire étudier la relation entre ces deux pourcentages à partir d'un échantillon de 66 banques.
Taux d'intérêt frais
Alaska USA FCU 10.25 2
Amco Mortgage 10.125 1.95
American Builders 10.25 2
ARCS Mortgage 10.2 2
Bay Mortgage 10.25 2
Benjamin Franklin 10.25 1.5
Cambelco Motgage 10.125 2
Cascade Pacific Mort 10.125 2
Cascade S&L 10.25 1.5
Center Mortgage 10.125 2.5
Centrust Mortgage 10.5 1.125
Chase Manhattan 10.875 2
Citified Mortgage 10.25 2
Coast Exchange 10.25 2
Columbia Federal 10.5 2
r = -0.441
0 2 4 6 8 10 12
0
2
4
6
8
10
12
Comparaison de prêts
frais d'entrée
tau
x d
'inté
rêt
Classeur : "COREG" - Feuille "cours" Page 10
Exemple 3
L'effet "mémoire" des marchés financiersOn souhaite savoir si un marché financier a une "mémoire", autrement dit s'il existe
une liaison entre les variations d'un jour et les variations de la veille.
Les données suivantes représente la variation (en relatif)
du Dow Jones sur une durée de 2 mois.
Aujourd'hui Hier
July 2 -0.29 1.12
0.83 -0.29
0.58 0.83
-0.52 0.58
0.2 -0.52
-0.12 0.2
1.16 -0.12
0.1 1.16
0.53 0.1
0.52 0.53
-0.89 0.52
-0.8 -0.89
0.09 -0.8
0.07 0.09
0.54 0.07
0.35 0.54
1.04 0.35
0.78 1.04
1.1 0.78
0.18 1.1
-0.58 0.18
-0.41 -0.58
r = 0.043
0 2 4 6 8 10 12
0
2
4
6
8
10
12
L'effet mémoire d'un marché financier
Hier
Au
jou
rd'h
ui
Classeur : "COREG" - Feuille "cours" Page 11
Exemple 4
Les options
Acheter une option revient à acquérir un droit d'acheter (par exemple une action),
à un certain prix appelé prix d'exercice. Ce droit peut être exercé à toute date
antérieure à la date d'expiration de l'option.
Les données suivantes correspondent à un échantillon de 10 options.
230 34
245 19.25
250 15.875
255 11.625
260 8.125
265 5.25
270 3.25
275 1.8125
280 0.9375
285 0.5
Les données sont issues de
The Wall Street Journal, November 9, 1988, p.C15. r = -0.962
Prix d'exercic
ePrix de l'option
220 270 320 370 420 470
0
2
4
6
8
10
12
Les options
Prix d'exercice
Pri
x d
e l
'op
tio
n
Classeur : "COREG" - Feuille "cours" Page 12
Exemple 5
Température et rendement d'un process industriel
Les données suivantes correspondent à une expérience destinée à trouver la température
donnant le meilleur rendement pour un process industriel.
Rendement
600 127
625 139
650 147
675 147
700 155
725 154
750 153
775 148
800 146
825 136
850 129
r = ###
Températur
e
580 680 780 880 980 1080 1180
120
140
160
180
200
220
240
Rendement et température
Classeur : "COREG" - Feuille "cours" Page 13
Exemple 6
Quantité produite et coût
On souhaite étudier la liaison entre le nombre de pièces produites chaque semaine
dans une usine, et le coût total de la production.
Coût
22 3.47
30 3.783
26 3.856
31 3.91
36 4.489
30 3.876
22 3.221
45 4.579
38 4.325
3 14.131
30 3.589 r = ###38 3.999
41 4.158
27 3.666
28 3.885
31 3.574
37 4.495
Quantité
0 2 4 6 8 10 12
0
2
4
6
8
10
12
Quantité produite et coût
0 2 4 6 8 10 12
0
2
4
6
8
10
12
Même graphique sans le "point aberrant"
Classeur : "COREG" - Feuille "cours" Page 14
32 3.814
41 4.43
r = ###
0 2 4 6 8 10 12
0
2
4
6
8
10
12
Même graphique sans le "point aberrant"
Classeur : "COREG" - Feuille "cours" Page 15
Exemple 7
Location d'appartements
Voici un ensemble de données qui semble contredire tous les principes économiques !
Airport 4.80% 378
Auburn 5.30% 368
Ballard 1.30% 348
Beacon Hill 4.90% 391
Bellevue-East 4.20% 463
Bellevue-West 3.60% 581
Bothel/juanita 4.40% 483
Burien 3.50% 363
Capitol Hill/Eastlake 5.00% 395
Central 10.10% 301
Des Moines 4.80% 406
Downtown Seattle 8.30% 449
Federal Way 4.50% 403
First Hill 6.30% 400
Greenlake/Wall 2.30% 429
Kent 4.40% 424
Kirkland 1.50% 561
Madison/leschi 0.40% 572
Magnolia 1.40% 443
Mercer Island 6.40% 472 r = ###North King Co. 3.70% 433
North Seattle 3.20% 423
Queen Anne 3.30% 428
Rainnier Valley 15.70% 341
Redmond 3.90% 501
Renton 6.00% 416
Riverton/tukwila 4.70% 381
Universty 4.30% 430
West Seattle 3.90% 355
White Center 6.10% 381
King Country 4.70% 428
Pourcentage de non-
occupationLoyer
mensuel
300 350 400 450 500 550 600
0
2
4
6
8
10
12
Les appartements
loyer mensuel en dollars
taux de non-occupation
Classeur : "COREG" - Feuille "cours" Page 16
4. Régression multiple
Lorsqu'un phénomène quantifiable s'explique en faisant appel à plus d'un facteur
explicatif, on peut utiliser la régression multiple.
Exemple 8
Une entreprise a organisé une campagne promotionnelle sur un territoire divisé
en 8 secteurs.
Le directeur, voulant tester l'efficacité du mix promotionnel, se fait communiquer
le volume des ventes et le budget de publicité de chacun des 8 secteurs.
Il obtient le tableau suivant :
VENTES PUB VISITES
1 75 110 26
2 76 95 28
3 82 75 34
4 82 90 31
5 76 85 29
6 83 80 36
7 76 105 25
8 74 120 23
Utilisation de DROITEREG
### ### ###
### ### ###
### ### #N/A
### 5 #N/A
### ### #N/A
L'équation du "plan de régression est :
Ventes = 1,02 Visites + 0,082 Pub + 40,67
Exemple 1
Page 17
Exemple 1Une companie pétrolière décide d'implanter de nouvelles stations-service.On mesure sur 6 stations le trafic observé (Variable X =nombre moyen de voiture par heure)ainsi que le C.A. moyen réalisé en une heure (variable Y).
Station Trafic CA1 150 2200 2 55 750 3 220 2500 4 130 1450 5 95 1800 6 110 1500
Exemple 1
Page 18
Une companie pétrolière décide d'implanter de nouvelles stations-service.On mesure sur 6 stations le trafic observé (Variable X =nombre moyen de voiture par heure)
Exemple 2
Page 19
Exemple 2Les coûts de créditLorsque vous contractez un emprunt auprès d'une banque, il y a différents types de coûts.Nous considérons ici :- le taux d'intérêt (un pourcentage)- le coût d'entrée (un pourcentage du montant emprunté)On désire étudier la relation entre ces deux pourcentages à partir d'un échantillon de 66 banques.
Taux d'intérêt fraisAlaska USA FCU 10.25 2Amco Mortgage 10.125 1.95American Builders 10.25 2ARCS Mortgage 10.2 2Bay Mortgage 10.25 2Benjamin Franklin 10.25 1.5Cambelco Motgage 10.125 2Cascade Pacific Mortgage 10.125 2Cascade S&L 10.25 1.5Center Mortgage 10.125 2.5Centrust Mortgage 10.5 1.125Chase Manhattan 10.875 2Citified Mortgage 10.25 2Coast Exchange 10.25 2Columbia Federal 10.5 2Columbia Services 10.5 2Commonwealth Mortgage 10.25 1.5Continental Motgage 10.25 2Crossland Mortgage 10.25 2.75Direct Mortgage Services 10.25 2Family Savings 10.375 2Far West Mortgage 10.125 2First Fed Savings of WA 10.375 1.5First Interstate 10.375 2Fireman's Fund Mortgage 10.125 2.25First Mutual 10.25 2First Union Mortgage 10.25 2.25Fleet Mortgage Corp 10.375 2.5GMAC Mortgage 10.125 2.5Goldome Rainier 9.875 3.375Great American Bank 10.5 1.5Great NW Federal S&L 10.25 2Great Pacific Mortgage 10.25 2Great Western Bank 10.7 2Hallmark Mortgage 10.25 2Hoover Mortgage 10.125 2ICA Mortgage 10.25 2
Exemple 2
Page 20
Key Pacific Mortgage 10.25 2Metropolitan Federal 10.125 2
Mornet of WA 10.25 2
Mortgage Brokers 10.25 2Mt. Baker Bank 10.375 2Norwest Mortgage 10.25 2.5Old Stone Bank 10 3.5Olympic Savings bank 10.25 2Pacific First Mortgage 10.25 2.5Pacific R.E. Mortgage 10.375 2Pioneer Federal Savings 10.375 2Principal Financial 10.25 2Pacific West Mortgage 10.125 2.25Rainier Bank 10.5 2Seafirst Home Loans 10.375 2Sears Mortgage 10.25 2Summit Savings 10.5 2Security Pacific N.B. 10.5 2Shearson Lehman 10.375 1.5Standard Green Mortgage 10.25 1.625Sterling Mortgage 10.125 2U.S. Bankcorp Mortgage 10.375 1.875United Pacific Mortgage 10.125 2.25University Fed Savings 10.25 2University Mortgage 10.25 2Valley Mortgage 10.25 2Washington Mutual 10.5 2Weyerhaeuser 10.25 2Willamette Financial 10.375 2
Les données sont issues de "How the Summer rates" Seattle Times, July 3 1988, p. D1.Sources : Scotsman Publishing's Electronic Bulletin et Western Wahington Bulletin.
Exemple 2
Page 21
Lorsque vous contractez un emprunt auprès d'une banque, il y a différents types de coûts.
On désire étudier la relation entre ces deux pourcentages à partir d'un échantillon de 66 banques.
Exemple 3
Page 22
Exemple 3L'effet "mémoire" des marchés financiersOn souhaite savoir si un marché financier a une "mémoire", autrement dit s'il existeune liaison entre les variations d'un jour et les variations de la veille.Les données suivantes représente la variation (en relatif)du Dow Jones sur une durée de 2 mois.
Aujourd'hui HierJuly 2, 1987 -0.29 1.12
0.83 -0.290.58 0.83
-0.52 0.580.2 -0.52
-0.12 0.21.16 -0.12
0.1 1.160.53 0.10.52 0.53
-0.89 0.52-0.8 -0.890.09 -0.80.07 0.090.54 0.070.35 0.541.04 0.350.78 1.04
1.1 0.780.18 1.1
-0.58 0.18-0.41 -0.580.78 -0.411.07 0.78
-0.09 1.071.69 -0.091.69 1.69
-0.42 1.690.83 -0.42
-0.23 0.830.56 -0.23-1.7 0.560.42 -1.71.54 0.42
0.1 1.54-0.46 0.10.94 -0.46
-0.76 0.94-0.99 -0.76-1.33 -0.99
August 31, 198 0.89 -1.33
Exemple 4
Page 23
Exemple 4Les optionsAcheter une option revient à acquérir un droit d'acheter (par exemple une action),à un certain prix appelé prix d'exercice. Ce droit peut être exercé à toute dateantérieure à la date d'expiration de l'option.Les données suivantes correspondent à un échantillon de 10 options.
Prix d'exercice Prix de l'option230 34245 19.25250 15.875255 11.625260 8.125265 5.25270 3.25275 1.8125280 0.9375285 0.5
Les données sont issues de The Wall Street Journal, November 9, 1988, p.C15.
Exemple 5
Page 24
Exemple 5Température et rendement d'un process industrielLes données suivantes correspondent à une expérience destinée à trouver la températuredonnant le meilleur rendement pour un process industriel.
Température Rendement600 127625 139650 147675 147700 155725 154750 153775 148800 146825 136850 129
Exemple 5
Page 25
Les données suivantes correspondent à une expérience destinée à trouver la température
Exemple 6
Page 26
Exemple 6Quantité produite et coûtOn souhaite étudier la liaison entre le nombre de pièces produites chaque semainedans une usine, et le coût total de la production.
Production hebdomadaire
Quantité Coût
22 3.47
30 3.783
26 3.856
31 3.91
36 4.489
30 3.876
22 3.221
45 4.579
38 4.325
30 3.589
38 3.999
41 4.158
27 3.666
28 3.885
31 3.574
37 4.495
32 3.81441 4.43
x
Exemple 7
Page 27
Exemple 7Les locations d'appartement le taux d'occupation
Loyer mensuelAirport 4.80% 378Auburn 5.30% 368Ballard 1.30% 348Beacon Hill 4.90% 391Bellevue-East 4.20% 463Bellevue-West 3.60% 581Bothel/juanita 4.40% 483Burien 3.50% 363Capitol Hill/Eas 5.00% 395Central 10.10% 301Des Moines 4.80% 406Downtown Seatt 8.30% 449Federal Way 4.50% 403First Hill 6.30% 400Greenlake/Wall 2.30% 429Kent 4.40% 424Kirkland 1.50% 561Madison/leschi 0.40% 572Magnolia 1.40% 443Mercer Island 6.40% 472North King Co. 3.70% 433North Seattle 3.20% 423Queen Anne 3.30% 428Rainnier Valley 15.70% 341Redmond 3.90% 501Renton 6.00% 416Riverton/tukwil 4.70% 381Universty 4.30% 430West Seattle 3.90% 355White Center 6.10% 381King Country 4.70% 428
Pourcentage de non-
occupation
Exemple 8
Page 28
Exemple 8Une entreprise a organisé une campagne promotionnelle sur un territoire diviséen 8 secteurs.Le directeur, voulant tester l'efficacité du mix promotionnel, se fait communiquerle volume des ventes et le budget de publicité de chacun des 8 secteurs.Il obtient le tableau suivant :
VENTES PUB VISITES
1 75 110 26 2 76 95 28 3 82 75 34 4 82 90 31 5 76 85 29 6 83 80 36 7 76 105 25 8 74 120 23
RAPPORT DÉTAILLÉ
Statistiques de la régressionCoefficient de ###Coefficient d ###Coefficient d ###Erreur-type ###Observations 34
ANALYSE DE VARIANCEDegré de libertéSomme des carrésMoyenne des carrés F Valeur critique de F
Régression 2 ### ### ### ###Résidus 31 ### ###Total 33 ###
Coefficients Erreur-type Statistique t ProbabilitéLimite inférieure pour seuil de confiance = 95%Constante ### ### ### ### ###Price ### ### ### ### ###Promotion ### ### ### ### ###
ANALYSE DES RÉSIDUS RÉPARTITION DES PROBABILITÉS
ObservationPrévisions Sales Résidus Résidus normalisés Centile1 ### ### ### ###2 ### ### ### ###3 ### ### ### ###4 ### ### ### ###5 ### ### ### ###6 ### ### ### ###7 ### ### ### ###8 ### ### ### ###9 ### ### ### 25
10 ### ### ### ###11 ### ### ### ###12 ### ### ### ###13 ### ### ### ###14 ### ### ### ###15 ### ### ### ###16 ### ### ### ###17 ### ### ### ###18 ### ### ### ###19 ### ### ### ###20 ### ### ### ###21 ### ### ### ###22 ### ### ### ###23 ### ### ### ###24 ### ### ### ###25 ### ### ### ###26 ### ### ### 75 27 ### ### ### ###28 ### ### ### ###29 ### ### ### ###
55 60 65 70 75 80 85 90 95 100 105
-2000
-1500
-1000
-500
0
500
1000
1500
2000
Price Graphique des résidus
PriceR
és
idu
s
30 ### ### ### ###31 ### ### ### ###32 ### ### ### ###33 ### ### ### ###34 ### ### ### ###
Valeur critique de F
Limite supérieure pour seuil de confiance = 95%Limite inférieure pour seuil de confiance = 95,0%Limite supérieure pour seuil de confiance = 95,0%### ### ###### ### ###### ### ###
RÉPARTITION DES PROBABILITÉS
Sales675 761 820
1096 1602 1882 1916 2088 2114 2159 2295 2618 2730 2927 3056 3224 3354 3507 3519 3532 3636 3746 3754 3825 3842 4011 4113 4141 4226
55 60 65 70 75 80 85 90 95 100 105
-2000
-1500
-1000
-500
0
500
1000
1500
2000
Price Graphique des résidus
Price
Ré
sid
us
150 200 250 300 350 400 450 500 550 600 650
-2000
-1000
0
1000
2000
Promotion Graphique des résidus
Promotion
Rés
idu
s
55 60 65 70 75 80 85 90 95 100 105 0
2000
4000
6000
Price Courbe de régression
Sales
Prévisions Sales
Price
Sal
es
150 200 250 300 350 400 450 500 550 600 650 0
2000
4000
6000
Promotion Courbe de régression
Sales
Prévisions Sales
Promotion
Sal
es
4421 4630 5000 5015 5120
150 200 250 300 350 400 450 500 550 600 650
-2000
-1000
0
1000
2000
Promotion Graphique des résidus
Promotion
Rés
idu
s
55 60 65 70 75 80 85 90 95 100 105 0
2000
4000
6000
Price Courbe de régression
Sales
Prévisions Sales
Price
Sal
es
150 200 250 300 350 400 450 500 550 600 650 0
2000
4000
6000
Promotion Courbe de régression
Sales
Prévisions Sales
Promotion
Sal
es
0 20 40 60 80 100 120 0
2000
4000
6000
Répartition des probabilités
Centile
Sal
es
150 200 250 300 350 400 450 500 550 600 650 0
2000
4000
6000
Promotion Courbe de régression
Sales
Prévisions Sales
Promotion
Sal
es
0 20 40 60 80 100 120 0
2000
4000
6000
Répartition des probabilités
Centile
Sal
es
Sales Price Promotion Constante4141 59 200 ### ### Price3842 59 200 ### ### Promotion3056 59 200 ### ###3519 59 200 ### ###4226 59 400 ### ###4630 59 400 ### ###3507 59 400 ### ###3754 59 400 ### ###5000 59 600 ### ###5120 59 600 ### ###4011 59 600 ### ###5015 59 600 ### ###1916 79 200 ### ###
675 79 200 ### ###3636 79 200 ### ###3224 79 200 ### ###2295 79 400 ### ###2730 79 400 ### ###2618 79 400 ### ###4421 79 400 ### ###4113 79 600 ### ###3746 79 600 ### ###3532 79 600 ### ###3825 79 600 ### ###1096 99 200 ### ###
761 99 200 ### ###2088 99 200 ### ###
820 99 200 ### ###2114 99 400 ### ###1882 99 400 ### ###2159 99 400 ### ###1602 99 400 ### ###3354 99 600 ### ###2927 99 600 ### ###
55 60 65 70 75 80 85 90 95 100 105
-1500
-1000
-500
0
500
1000
1500
2000
Column E
#########
55 60 65 70 75 80 85 90 95 100 105
-2000
-1500
-1000
-500
0
500
1000
1500
2000
Price Graphique des résidus
Price
Ré
sid
us
55 60 65 70 75 80 85 90 95 100 105
-1500
-1000
-500
0
500
1000
1500
2000
Column E
55 60 65 70 75 80 85 90 95 100 105
-2000
-1500
-1000
-500
0
500
1000
1500
2000
Price Graphique des résidus
Price
Ré
sid
us
Exercice
Page 38
Exercice
On a pris un échantillon de 24 voitures de même modèle, mais d'âges différents, qui on été vendues récemment. Les données suivantes correspondent aux âges des 24 véhicules,et à leurs prix de vente.
Age Prix1 119,4003 73,2005 51,0002 91,8008 36,6002 102,0003 73,8001 120,6006 42,6007 39,6004 61,8008 31,2005 48,6001 126,0005 52,8003 70,2006 43,2006 53,4007 40,8004 63,4007 36,0008 33,0004 64,8002 93,000
1 Décrire ces données
2 Proposez un ajustement linéaire
Testez l'hypothèse d'absence de liaison
Exercice
Page 39
3 Proposez un ajustement exponentiel
Comparez ces deux ajustements
Recommended