View
6
Download
0
Category
Preview:
Citation preview
A. Mattei 1
Mesures de tendance centrale
• Moyenne arithmétique• Médiane• Mode• Moyenne géométrique• Moyenne harmonique• Quantiles
A. Mattei 2
Moyenne arithmétique (MA)
48
65554331 =+++++++
xn
xi =∑ µ=∑N
X i
A. Mattei 3
Propriétés
• Dépend de toutes les valeurs
• Facile à calculer• C’est la valeur attendue (voir plus tard)
∑ = xccxn i
1
cxcxn i
±=±∑ )(1
∑ =− 0)( xxi
A. Mattei 4
Moyenne pondérée
∑ ∑∑∑ =→=
i
iiii
i
ii
w
wx
w
xwωω
413121
6153413211 =++++
×+×+×+×+×
468
15
8
34
8
13
8
21
8
1 =++++
A. Mattei 5
Défauts
• Peut ne correspondre à aucune des valeurs• Peut donner une fausse image d’une
majorité de valeurs• Est influencée par les valeurs extrêmes:
9 x 1000 + 1 x 20000 donne 2900• Prendre alors la moyenne tronquée (sans les
valeurs extrêmes). On obtient 1000
A. Mattei 6
Commande TI-83/84• Introduire les valeurs dans la liste L1 et les
fréquences dans L2 en utilisant la commande STAT / EDIT.
• Aller dans CALC et choisir 1-Var Stats• Presser ENTER et taper L1,L2• En pressant ENTER vous obtenez la
moyenne (x) et d’autres mesures.• Si vous voulez uniquement la moyenne,
choisissez LIST /MATH et ensuite 3:mean(.• Introduire L1,L2) et presser ENTER.
A. Mattei 7
Commandes MINITAB et EXCEL
• Pour MINITAB, aller dans CALC / Statistiques par colonne et choisir Moyenne. Si vous allez dans Stat / Statistiques élémentaires / Afficher les statistiques descriptives, vous obtenez aussi la moyenne tronquée (Moyenne TR), sans le 5% des valeurs les plus petites et 5% des valeurs les plus grandes).
• Pour EXCEL, chercher Moyenne dans les fonctions statistiques ou taper par exemple, dans une cellule: =MOYENNE(A1:A20)
A. Mattei 8
Médiane
• Sépare les valeurs en deux parties égales lorsqu’elles sont ordonnées (de manière croissante ou décroissante)
• Meilleur indice pour les valeurs asymétriques• Correspond à une des valeurs dans le cas
d’un nombre impair d’éléments• 1 3 5 7 9• 1 3 5 7 9 12 : médiane 6 = (5+7)/2
A. Mattei 9• Médiane 7522 , Moyenne 8387
0 10000 20000
0
500
1000
REVENU
Effe
ctif
REVENU MENSUEL DES MENAGES
A. Mattei 10
Propriétés
• N’est pas influencée par les valeurs extrêmes
• La somme des écarts absolus par rapport à une valeur est minimale lorsque cette valeur est la médiane:
• Min
• Min
médianeccxabs i =⇒−∑ )(
∑ =⇒− moyenneccxi2)(
A. Mattei 11
A. Mattei 12
Commande TI-83/84• Introduire les valeurs dans la liste L1 en
utilisant la commande STAT / EDIT.• Aller dans CALC et choisir 1-Var Stats• Presser ENTER et taper L1• En pressant ENTER vous obtenez la
médiane (Med) et d’autres mesures.• Si vous voulez uniquement la médiane,
choisissez LIST /MATH et ensuite 4:median(.• Introduire L1) et presser ENTER.
A. Mattei 13
Commandes MINITAB et EXCEL
• Pour MINITAB, aller dans CALC / Statistiques par colonne et choisir Médiane. Si vous allez dans Stat / Statistiques élémentaires / Afficher les statistiques descriptives, vous obtenez aussi la médiane.
• Pour EXCEL, chercher MEDIANE dans les fonctions statistiques ou taper par exemple, dans une cellule: =Mediane(A1:A20)
A. Mattei 14
Mode
• C’est la valeur la plus fréquente• C’est le sommet d’une distribution de
fréquence• Distribution unimodale: un seul sommet• Distribution bimodale: deux sommets• Défaut: valeur pas très stable
A. Mattei 15
Distribution bimodale
10 20 30 40 50 60 70 80
0.000
0.005
0.010
0.015
0.020
0.025
0.030
0.035
Den
sity
Kernel density plot
A. Mattei 16
Commande TI-83/84
• Introduire les valeurs dans la liste L1 en utilisant la commande STAT / EDIT.
• Aller dans PRGM et choisir MODE• Presser ENTER et taper L1• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez le télécharger (voir page du cours).
A. Mattei 17
Commandes MINITAB et EXCEL
• Pour MINITAB, aller dans Stat / Tableaux / Tri à plat. Choisir Dénombrements. Le mode est la valeur qui a la fréquence la plus élevée.
• Pour EXCEL, chercher MODE dans les fonctions statistiques ou taper par exemple, dans une cellule: =MODE(A1:A20)
A. Mattei 18
Moyenne géométrique
• C’est la n-ième racine des valeurs:
• Uniquement pour des valeurs positives• A utiliser pour le calcul du taux moyen de variation
nnxxxMG ×⋅⋅⋅××= 21
∑= )ln(1
)ln( ixn
MG
A. Mattei 19
Commande TI-83/84
• Introduire les valeurs dans la liste L1 en utilisant la commande STAT / EDIT.
• Aller dans PRGM et choisir MGEO• Presser ENTER et taper L1• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez le télécharger (voir page du cours).
A. Mattei 20
Commandes MINITAB et EXCEL
• Pour MINITAB: taper, dans la fenêtre Session %MGEO C1 (Ce programme ne fait pas partie des commandes MINITAB standard)
• Pour EXCEL, chercher MOYENNE GEOMETRIQUE dans les fonctions statistiques ou taper par exemple, dans une cellule: =MOYENNE.GEOMETRIQUE(A1:A20)
A. Mattei 21
Calcul du taux moyen de variation
• Taux moyen: MG-1
11
−=−t
tt p
pr
nnrrrMG )1()1()1( 21 +⋅⋅⋅+×+=
no
non MGpmoyentauxpp =+= ).1(
12
3
1
21
−
⋅⋅⋅=n
n
oon p
p
p
p
p
p
p
ppp
A. Mattei 22
Exemple
• Rendement SPI en 2002: -25.95%
• Rendement SPI en 2003: 22.06%• Rendement SPI en 2004: 6.86%
• Rendement SPI en 2005: 35.65%• Rendement moyen:
• SPI en 2001: 4382.94. En 2005:
%99.60699.13565.10686.12206.17405.04 →=×××
99.57420699.194.4382 4 =×
A. Mattei 23
(1+r)5 = 2.8357 ���� r = 0.2318 (23.18%)
5 ln(1+r)=ln(2.8357) ���� ln(1+r)=ln(2.8357)/5 = 0.2085
e0.2085 = 1.2318
A. Mattei 24
MG≤MA
• MA≥MG
[ ] 02 2121
2
21 ≥−+=− xxxxxx
2121 2 xxxx ≥+
A. Mattei 25
Moyenne harmonique
• Peu utilisée
• Formule des moyennes:• avec α=-1,0,1
• Inégalités:
∑=
+⋅⋅⋅++=
in x
n
xxx
nMH
1111
21αα
1
.
= ∑
n
xM
i
MAMGMH ≤≤
A. Mattei 26
Vitesse moyenne
• 120 Km à 80 km/h � 1.5 h• 120 Km à 120 Km/h � 1.0 h
• 240 Km et 2.5 h �(240/2.5) = 96 Km/h
96
1201
801
2 =+
=MH
A. Mattei 27
MH ≤ MG
•
012111
2211
2
21
≥+−=
−
xxxxxx
2121
211
xxxx≥+
MHMG
xx
xx ≥⇒+
≥
21
21 112
A. Mattei 28
Quantiles • Quartiles: division de la série ordonnée en 4
parties égales• Qk=(1-Ө)xs + Өxs+1 k=1,2,3 ; r=k(n+1)/4 ;
s=ent(r) ; Ө=r-s ; médiane: k=2• 1 3 5 7 9 12 14 15 17 18 25• Q1 = 5 ; Q2 =ME=12 ; Q3 = 17• Quintiles: division en 5 parties• Déciles: division en 10 parties• Centiles: division en 100 parties
A. Mattei 29
Exemple
• Qk = (1-Ө)xs + Өxs+1; r=k(n+1)/4 ;s=ent(r) ; Ө=r-s
• 5 6 10 14 15 17 19 22 26 30 (n=10)• k=1�r=(11/4)=2.75 ; s=2 ;Ө=0.75
Q1=0.25 x 6 + 0.75 x 10 = 9• k = 2�r=(2x11/4)=5.5 ; s=5 ; Ө=0.5
Q2 = 0.5 x 15 + 0.5 x 17 = 16 (médiane)• k=3�r=(33/4)=8.25 ; s=8 ; Ө=0.25
Q3= 0.75 x 22+0.25 x 26 = 23
A. Mattei 30
•
Revenu des nouveaux diplômés universitaires en 2001
Quartile inférieur Médiane
Quartile supérieur
Hommes 60'000 76'500 90'000Femmes 55'000 72'000 83'000Total 56'000 74'000 86'000Hommes 75'000 83'000 91'000Femmes 70'000 80'000 86'500Total 72'000 80'000 90'000Hommes 30'000 60'000 80'000Femmes 28'000 60'000 78'000Total 30'000 60'000 80'000Hommes 50'000 62'000 80'000Femmes 43'000 60'000 74'000Total 49'000 60'000 78'000Hommes 62'000 73'000 80'000Femmes 60'000 73'000 80'000Total 60'500 73'000 80'000Hommes 60'000 73'000 85'000Femmes 54'000 61'500 75'000Total 58'000 71'000 83'000Hommes 57'500 66'500 74'000Femmes 62'000 72'000 83'000Total 60'000 70'000 80'000Hommes 56'000 74'000 85'000Femmes 53'000 70'000 80'000Total 55'000 72'000 84'000
Interdisciplinaire + autre
Total
Médecine + pharmacie
Sciences techniques
salaire brut annuel pondéré
Droit
Sciences exactes + naturelles
Sciences humaines + sociales
Sciences économiques
A. Mattei 31
A. Mattei 32
•
A. Mattei 33
Commande TI-83/84
• Introduire les valeurs dans la liste L1 en utilisant la commande STAT / EDIT.
• Aller dans PRGM et choisir QUARTILE• Presser ENTER et taper L1• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez le télécharger (voir page du cours).
• Les quartiles obtenus avec CALC / 1-var Stat peuvent ne pas être correctes.
A. Mattei 34
Commandes MINITAB et EXCEL• Pour MINITAB, aller dans Stat / Statistiques
élémentaires / Afficher les statistiques descriptives. Les quartiles sont Q1 et Q3
• Pour EXCEL, chercher Quartile dans les fonctions statistiques ou taper par exemple, dans une cellule: =QUARTILE(A1:A20;1)
• Même commande pour CENTILE.• On peut aussi obtenir les quantiles en utilisant
la commande Kième minimum et Kièmemaximum avec Utilitaire d’analyse / Statistiques descriptives.
A. Mattei 35
Indices de dispersion
• Etendue (range): valeur la plus grande – valeur la plus petite
• Intervalle interquartile: IR = Q3 – Q1
contient le 50% des valeurs• Diagramme en forme de boîte (boxplot)• Variance• Ecart-type , erreur absolue• Coefficient de variation
A. Mattei 36
Boxplot• Lignes verticales: quartiles• Ligne horizontale: moustaches (Qk±1.5 IR) ou fin
(sans valeurs exentriques: *)
10 20 30 40 50 60 70 80
age
AGE DES ASSUREES POUR LES FRAIS DE MATERNITE
A. Mattei 37
•
A. Mattei 38
Commande TI-83/84
• Introduire les données dans la liste L1 en utilisant la commande STAT / EDIT.
• Ajuster les dimensions du graphique avec la touche WINDOW. En pressant la touche Stat Plot, choisir 1:Plot1 et le quatrième type de graphique. Mettre L1 dans Xlist. Presser GRAPH.
A. Mattei 39
Commande MINITAB
• Pour MINITAB, aller dans Graphique / Boîte à moustaches. Dans Variables du graphique, sélectionner le vecteur C1 pour Y. Cliquer sur Options et cocher Transposer X et Y.
• Il n’y a pas de commande Boxplot pour EXCEL.
A. Mattei 40
Variance
• Population: σ2 = (1/N)Σ (Xi – µ)2
• Echantillon:
• Unité de mesure: u2 → prendre √ : σ ou s • Principale mesure de dispersion
• Ne peut pas être négative
∑ −−
= 22 )(1
1xx
ns i
A. Mattei 41
•
A. Mattei 42
Exemple
• Q1=2 ; ME=5 ; Q3=10.5, µ=6 ;σ2 = 20; s2 = 25
100030Σ
64814x5
117x4
1-15x3
9-33x2
25-51x1
(X-µ)2(X-µ)X
A. Mattei 43
Propriétés
• Soit x={x1,x2,…,xn}• Var(cx) = c2 Var(x)• Var(x+c) = Var(x)• Var[(x-µ)/σ]=1• Var(c)=0• Dépend des unités de mesure• Prendre alors le coefficient de variation:
CV = σ/µ
A. Mattei 44
Commande TI-83/84• Introduire les valeurs dans la liste L1 en utilisant la
commande STAT / EDIT.• Aller dans CALC et choisir 1-Var Stats
• Presser ENTER et taper L1• En pressant ENTER vous obtenez l’écart-type de
l’échantillon (Sx) et de la population (σx).
• Si vous voulez uniquement l’écart-type de l’échantillon, choisissez LIST /MATH et ensuite 7:stdDev(L1).
• Pour la variance de l’échantillon, presser ensuite la touche x2.
A. Mattei 45
Ecart-type et variance de la population
• Si vous voulez uniquement l’écart-type de la population, après la commande Calc 1-Var Stats, presser la touche Vars. Choisir 5:Statistics et ensuite 4:σx.
• Si vous voulez la variance de la population, il suffit d’élever au carré l’écart-type obtenu ci-dessus (touche x2).
A. Mattei 46
Commandes MINITAB et EXCEL
• Pour MINITAB, aller dans CALC / Statistiques par colonne et choisir Ecart-type. Vous obtenez s. Si vous allez dans Stat / Statistiques élémentaires / Afficher les statistiques descriptives, vous obtenez aussi s (EcarType).
• Pour EXCEL, chercher ECARTYPE dans les fonctions statistiques ou taper, dans une cellule: =ECARTYPE(A1:A20). Pour σ, choisir ECARTYPEP. Pour la variance, choisir Var pour s2 ou Var.P pour σ2 .
A. Mattei 47
La semi-variance
• La variance prend le carré des différences positives et négatives par rapport à la moyenne. Parfois, les différences positives n’ont pas la même valeur que les différences négatives. On peut alors calculer la semi-variance qui ne considère que les différences négatives.
A. Mattei 48
Exemple• Rendement de deux titres:• A: 0 0 0 0 50• B: -11.103 -10 10 18.103 43• Dans les deux cas, µ=10% ,σ=20%• En finance, σ représente le risque. Or, on
pourrait préférer A qui n’a pas de rendement négatif. Si l’on prend la semi-variance, on obtient un écart-type de 8.94 pour A et 13 pour B. Résultat équivalent avec la moyenne géométrique pour les rendements.
A. Mattei 49
Indices de forme
• Le moments• Le coefficient d’asymétrie• Le coefficient d’aplatissement
A. Mattei 50
Les moments
• Moments
• Moments centrés
moyenneXN
rir =→= ∑ 1
1 µµ
∑ =→−= 22)(
1 σµµµ cri
cr X
N
A. Mattei 51
Coefficient d’asymétrie
• Distribution symétrique: moments d’ordre impair =0
• Coefficient pour un échantillon
• Distribution étalée vers la droite: g1 >0 mode < médiane < moyenne
• Distribution étalée vers la gauche: g1<0 moyenne < médiane < mode
∑
−−−
=3
1 )2)(1( s
xx
nn
ng i
A. Mattei 52
Distributions asymétriques
• Etalée vers la:
• droite (g1 > 0) gauche (g1 < 0)• MO<ME<MA MA<ME<MO
0 10000 20000 30000 40000
0.00000
0.00005
0.00010
Den
sity
Kernel density plot
0 10000 20000 30000 40000
0.00000
0.00005
0.00010
Den
sity
Kernel density plot
A. Mattei 53
Commande TI-83/84
• Introduire les valeurs dans la liste L1 en utilisant la commande STAT / EDIT.
• Aller dans PRGM et choisir ASYM• Presser ENTER et taper L1• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez le télécharger (voir page du cours).
• La valeur obtenue est le coefficient d’asymétrie pour un échantillon.
A. Mattei 54
Commandes MINITAB et EXCEL• Pour MINITAB, aller dans Stat / Statistiques
élémentaires / Afficher les statistiques descriptives. Cliquer sur Graphiques et choisir récapitulatif graphique.
• Pour EXCEL, choisir Outils / Utilitaire d’analyse / Statistiques descriptives. Introduire la plage et choisir rapport détaillé.
• Vous pouvez aussi taper, dans une cellule: =COEFFICIENT.ASYMETRIE(A1:A9).
• Il s’agit des coefficients pour un échantillon.
A. Mattei 55
Coefficient d’aplatissement
• Kurtosis:
• Mesocurtique (normale): g2=0• Platicurtique (aplatie): g2<0
• Leptocurtique (mince): g2>0
−
−−+
−−−= ∑ 3
)1(
)1(
)3)(2(
)1(4
3
2
2 s
xx
n
nn
nn
ng i
A. Mattei 56
Kurtosis
• Platicurtique (g2<0) Leptocurtique (g2>0)
• Mesocurtique (g2=0)
-4 -3 -2 -1 0 1 2 3 4
0.0
0.1
0.2
Den
sity
Kernel density plot
-4 -3 -2 -1 0 1 2 3 4
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Den
sity
Kernel density plot
-4 -3 -2 -1 0 1 2 3 4
0.0
0.1
0.2
0.3
0.4D
ensi
ty
Kernel density plot
A. Mattei 57
Commande TI-83/84
• Introduire les valeurs dans la liste L1 en utilisant la commande STAT / EDIT.
• Aller dans PRGM et choisir KURTOSIS• Presser ENTER et taper L1• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez le télécharger (voir page du cours).
A. Mattei 58
Commandes MINITAB et EXCEL• Pour MINITAB, aller dans Stat / Statistiques
élémentaires / Afficher les statistiques descriptives. Cliquer sur Graphiques et choisir récapitulatif graphique.
• Pour EXCEL, choisir Outils / Utilitaire d’analyse / Statistiques descriptives. Introduire la plage et choisir rapport détaillé.
• Vous pouvez aussi taper, dans une cellule: =KURTOSIS(A1:A9).
• Il s’agit des coefficients pour un échantillon.
A. Mattei 59
Relations entre les variables
• Graphique: nuage de points (scatterplot)• Covariance• Corrélation • Corrélation des rangs
A. Mattei 60
100 200 300 400
50
70
90
110
130
150
170
190
210
230
PIB
CO
NS
OM
MA
TIO
NLIEN ENTRE PIB ET CONSOMMATION (1949-2005)
A. Mattei 61
Commande TI-83/84
• Introduire les données de X et Y dans les listes L1 et L2 en utilisant la commande STAT / EDIT.
• Ajuster les dimensions du graphique avec la touche WINDOW. En pressant la touche Stat Plot, choisir 1:Plot1 et le premier type de graphique. Mettre L1 et L2 dans Xlist et Ylist. Presser GRAPH.
A. Mattei 62
Commandes MINITAB et EXCEL
• Pour MINITAB, aller dans Graphique / Diagramme. Introduire les deux variables. Cliquer sur OK.
• Pour EXCEL, introduire les données dans les colonnes A et B. Cliquer sur Assistant graphique. Choisir nuage de points dans sous-type de graphique et cliquer sur Terminer.
A. Mattei 63
Covariance
• Lien positif � Cov > 0• Lien négatif � Cov < 0• Pas de lien � Cov = 0
∑ −−= ))((1
),( YiXi YXN
YXCov µµ
∑ −−−
= ))((1
1),cov( yyxx
nyx ii
A. Mattei 64
Exemple
• µx=6;σx=4.47;µy=7;σy=4.05 ;σxy=12.8 ;ρ=0.707
64003530Σ
486813145
-4-41374
-22-1953
-31-3832
25-5-5211
(X-µx)(Y-µy)(Y-µy)(X-µx)YXi,j
A. Mattei 65
Propriétés
• Dépend des unités de mesure• Lien entre les variables• cov(ax,by)=ab cov(x,y)• cov(x+a,y+b)=cov(x,y)• cov(ax+by,z)=a cov(x,z) + b cov(y,z)• var(ax+by)=a2 var(x)+b2var(y)+2ab cov(x,y)• var(x+y)+var(x-y)=2 var(x)+2 var(y)
A. Mattei 66
Commande TI-83/84
• Introduire les valeurs de X dans la liste L1, celles de Y dans L2 et les fréquences dans L3 en utilisant la commande STAT / EDIT.
• Aller dans PRGM et choisir COV• Presser ENTER• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez le télécharger (voir page du cours).
A. Mattei 67
Commandes MINITAB et EXCEL• Pour MINITAB, aller dans Stat / Statistiques
élémentaires / Covariance. On obtient la matrices des variances-covariances de l’échantillon.
• Pour EXCEL, chercher covariance dans les fonctions statistiques.
• Vous pouvez aussi taper, dans une cellule: =COVARIANCE(A1:A9;B1:B9).
• Il s’agit des covariances pour un échantillon.
A. Mattei 68
Exemple
84.11;36.47;8.1;96.2;8.5 22 −===== xyyyxx σσµσµ
02.08.0284.1136.472.096.28.0 222 =×××−×+×=Pσ
5165
5-784
51333
5552
5-371
P=0.8X+0.2YYjXii,j
A. Mattei 69
Corrélation ρ= cov(X,Y)/(σxσy)=cov(x,y)/(sxsy)• Ne dépend pas des unités de mesure• Entre -1 et +1• lien linéaire positif parfait: ρ=1• lien linéaire négatif parfait: ρ=-1• approximation si lien non linéaire parfait• ρ(ax,by)=ρ(x,y)• ρ(x+a,y+b)=ρ(x,y)• var(ax+by)=a2var(x)+b2var(y)+2ab ρ σxσy
A. Mattei 70
│ρ(x,y)│≤ 1
• Soient les variables standardisées:
• on a:
1 ; ; ==−
=−=yx ZZ
y
yy
x
xx
YZ
XZ σσ
σµ
σµ
∑∑
==−−
=yxzzyx
yx
yixi
ZZN
YXNYX σ
σσ
µµρ 1))((
1
),(
02)()()( ≥±+=±yxZZyxyx ZVarZVarZZVar σ
10)1(2 ≤→≥± ρρ
A. Mattei 71
• Corrélation positive
• Corrélation négative0 1 2 3 4 5 6 7 8
1
2
3
4
5
6
7
8
X
Y
RHO=0.568
0 1 2 3 4 5 6 7 8
0
1
2
3
4
5
6
7
8
X
Y
RHO=-0.764
A. Mattei 72
Pas de corrélation
0 1 2 3 4 5 6 7 8
0
5
10
15
C1
C2
RHO=0
1 2 3 4 5 6 7 8
0
1
2
3
4
5
6
7
8
C4
C3
RHO=0
A. Mattei 73
Corrélation parfaite
0 1 2 3 4 5 6 7 8
0
5
10
x
y
RHO=1
0 1 2 3 4 5 6 7 8
-30
-20
-10
0
10
20
X
Y
RHO=-1
A. Mattei 74
A. Mattei 75
A. Mattei 76
Commande TI-83/84
• Introduire les valeurs de X dans la liste L1, celles de Y dans L2 et les fréquences dans L3 en utilisant la commande STAT / EDIT.
• Mettre des 1 dans L3 si les valeurs ne sont pas regroupées.
• Aller dans PRGM et choisir CORR• Presser ENTER• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez le télécharger (voir page du cours).
A. Mattei 77
Commandes MINITAB et EXCEL• Pour MINITAB, aller dans Stat / Statistiques
élémentaires / Corrélation.• Pour EXCEL, chercher
COEFFICIENT.CORRELATION dans les fonctions statistiques.
• Vous pouvez aussi taper, dans une cellule: =COEFFICIENT.CORRELATION(A1:A9;B1:B9)
• Il y a un seul coefficient de corrélation (population ou échantillon).
A. Mattei 78
Le rang
• Classer les données par ordre croissant• Calculer ensuite le rang• Si les données xs,…,xt sont identiques, leur
rang sera (t+s)/2• Exemple:
xi 1 2 3 4 5 6 7 8 9 10 11
• 3 7 9 10 10 10 12 14 19 19 20 • rang: 1 2 3 5 5 5 7 8 9.5 9.5 11
A. Mattei 79
Corrélation des rangs
• Spearman: ranger les données (mettre un rang aux données) et ensuite calculer la corrélation
• N’est pas influencée par les valeurs extrêmes:• x: 1 3 5 6 ; y: 5 2 7 8 � ρ= 0.653 ; ρR =0.8• x: -5 3 5 6 ; y: 5 2 7 8 � ρ= 0.366 ; ρR=0.8• Meilleur résultat pour des valeurs non linéaires• Ex: y=x2 �ρ<1 ; Spearman=1• Peut être utilisée pour des données ordinales
A. Mattei 80
•
A. Mattei 81
Exemple: ρR = 0.976
181-H
293*G
3.5133*F
3.5133*E
5155.5**D
6175.5**C
7187***B
8198****A
rangGault-M.rangMichelinRest.
A. Mattei 82
Commande TI-83/84
• Introduire les valeurs de X et de Y en utilisant la commande STAT / EDIT.
• Aller dans PRGM et choisir RCORR• Introduire les valeurs de X et de Y• Presser ENTER• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez le télécharger (voir page du cours).
A. Mattei 83
Commandes MINITAB et EXCEL• Dans MINITAB, introduire les données dans C1 et C2• Aller dans Manip et choisir RANG.
• Calculer le rang des données et mettre le résultat dans deux colonnes différentes (C3 et C4).
• Calculer le coefficient de corrélation de ces rangs (C3 et C4)
• EXCEL a la commande RANG dans les formules statistiques mais elle donne un même rang, supérieur d’une unité à celui de la donnée précédante, lorsqu’il y a des données identiques.
A. Mattei 84
Les indices statistiques
• Une seule valeur pour résumer des phénomènes souvent très complexes:
• indices des prix, indice de confiance des consommateurs, indice de compétitivité des nations, indice de développement humain, indice des cours, indice de masse corporelle, etc.
• Indice élémentaire et indice synthétique
A. Mattei 85
Indice élémentaire
• Rapport entre deux valeurs: it/0=pt/po
• Ex. cours de la livre sterling en francs• iCH/£ = 2.5/1• Réversibilité : cours du franc en £
i£/CH=0.4=1/2.5• Circularité: i£/€ =0.64 ; i€/CH = 0.625
i£/€ x i€/CH = i£/CH
0.64 x 0.625=0.4
A. Mattei 86
Indice synthétique
• Combinaison d’indices élémentaires
• Carli (1764): moyenne de 3 prix pour le calcul du taux d’inflation (blé, huile, vin)
• Soit it un indice élémentaire par rapport à la période de base (it/0). On a:
• où ωj est la pondération
∑= tjj
t iI ω
A. Mattei 87
Exemples
• SMI: indice du cours de 20 titres. Pondération: capitalisation boursière (Novartis 15%, UBS 12%, Nestlé 19%, etc.)
• ISPC: indice suisse des prix à la consommation. Pondération: 220 groupes de dépense (loyer 19.5%, repas dans les restaurants 3.6%, etc.)
• HDI: indice de développement humain. Trois indices: taux d’alphabétisation, espérance de vie, PIB par tête.
A. Mattei 88
Indice de Laspeyres
• Indice de prix (pondération période de base)
• Indice de quantité
∑ ∑∑∑ ====
oj
oj
oj
ojo
joj
tjt
jtj
ojo
joj
oj
tjt
L qp
qp
p
pii
qp
qpP ωω ;;
⟩=⟨== ∑∑∑
oj
tjt
jtj
ojo
joj
oj
tjt
L q
qii
pq
pqQ ;ω
A. Mattei 89
Indice Paasche
• Indice de prix (pondération variable)
• Indice de quantité
∑∑=
tj
oj
tj
tjt
P qp
qpP
∑∑=
tj
oj
tj
tjt
P pq
pqQ
A. Mattei 90
165125200100
80408020440104
45406015430103
40456020330152
po.q1p1.qop1.q1q1p1po.qoqopo
65.1100
165 ; 25.1
100
125 ==== LL QP
6.1125
200...; 21.1
165
200 ==== PP QP
A. Mattei 91
Indice Fisher
• hausse nominale
• Réversibilité satisfaite (contrairement à Laspeyresqui devient Paasche ou Paasche qui devient Laspeyres)
PLF III ×=6248.1..;23.121.125.1 ==×= FF QP
:100
2002 HQP FF ===×
A. Mattei 92
Relations entre les indices
• Soit H la hausse nominale. On a:• PL x QP = H• PP x QL = H• PF x QF = H• Si on connaît la hausse nominale et un
indice, on peut obtenir l’autre en utilisant ces formules
A. Mattei 93
Faiblesse de Laspeyres
• En utilisant la pondération de base, l’indice Laspeyres ne tient pas compte des possibilités de substitution
• Indice-chaîne: on change la pondération chaque année:
0.101;2.104 04.12/05.1200.5/04.12 == LL PP
2.1050.1012.10400.5/05.1204.12/05.1200.5/04.12 =×==× LLL PPP
A. Mattei 94
Valeur nominale et réelle
• Inflation = hausse généralisée des prix• Si tous les prix augmentent de 5% on dit que
le taux d’inflation est de 5%• Dans le cas d’une hausse différenciée des
prix on calcule le taux d’inflation en prenant un indice de prix
• Valeur réelle=valeur nominale/indice des prix• Quantité=valeur réelle
A. Mattei 95
160200100
643.28020440104
483.26015430103
482.46020330152
x .q1p1/PLp1.q1q1p1po.qoqopo
PQ→= 6.1100
160
A. Mattei 96
• (+15.5%: hausse nominale)
• (+10% hausse réelle)• taux réel= taux nominal – taux d’inflation • 1 + taux d’inflation• taux réel ~ taux nominal - taux inflation=10.5%
48.5142
27.724.46.32446
9.242.24.2824
11.555.52.11052
p1.q1q1=1.1qop1=1.05popo.qoqopo
155.142
51.48 =
10.105.1
155.1 =
A. Mattei 97
Illusion monétaire
• Difficulté à saisir le concept de valeur réelle (consommateurs, syndicats, hommes politiques)
• Taux d’intérêt nominal et taux réel• Hausse de salaire nominale ou réelle• 4% avec 2% inflation ou 3% avec 1%?• Turquie, 03: taux intérêt 37.7%, inflation 25.2%• Déflation: baisse généralisée des prix
A. Mattei 98
-2
0
2
4
6
8
10
1950 1960 1970 1980 1990 2000
TAUX D'INFLATION EN SUISSE
A. Mattei 99
Indice des prix à la consommation
• Calculé depuis 1922 en Suisse• Indice Laspeyres avec pondération tirée des
budgets des ménages, changée chaque année
• Prix relevés chaque mois pour alimentation et produits pétroliers, autres 3 ou 6 mois
• 1046 biens et services• 12 groupes principaux, 83 groupes• Pondération pour 218 biens (ERC 2005)
A. Mattei 100
A. Mattei 101
• 11 régions (Genève, Lausanne, Sion en Suisse romande)
• 2200 points de vente• Décembre 2005=100• Problème en cas de changement de qualité• Indice « plutocratique »• Pas de substitution � surestimation du coût
de la vie• Moyenne géométrique pour les prix des
variétés. Ex: citrons et oranges pour les agrumes
A. Mattei 102
Indice plutocratique et démocratique
• Pondération autres biens:• plutocratique 0.304 ; démocratique 0.248
12500050000Total
0.68850000.210000Autres
0.16200000.420000Loyer
0.16200000.420000Alimentation
DépenseDépense
%1%9Ménages:
A. Mattei 1039.17.28.33.11.61.1autres
4.65.16.87.07.05.0équipement
1.72.02.02.43.12.0boissons al.
8.99.59.35.52.50.3restaurants
9.210.37.713.85.03.0loisirs
10.89.49.713.17.43.9transports
15.913.410.27.07.02.0santé
4.65.16.58.013.015.0habillement
25.426.525.223.023.027.0logement
11.011.514.317.130.440.7alimentation
200720001993197719661939
A. Mattei 10410.517.911.7autres
2.90.30.7enseignement
2.43.91.7boissons alcoolisées
8.17.78.9restaurants
5.98.69.2loisirs
16.616.010.9transports
6.09.115.9santé
4.25.84.6habillement
33.714.425.4logement
9.716.311.0alimentation
Etats-UnisFranceSuisse
A. Mattei 105
Budgets des ménages
• Environ 20000 adresses tirées au sort• Demande téléphonique de participation• 70% ne sont pas d’accord• Échantillon aléatoire de 3300 ménages• Relevé des dépenses quotidiennes
pendant 1 mois (gros travail)
A. Mattei 106
•
A. Mattei 107
•
A. Mattei 108
A. Mattei 109
Septembre 2007
• ISPC=101.1 (décembre 05=100)• +0.7% par rapport à septembre 06• Alimentation: -0.7%• Habillement: +3.2%• Communications: -3.4%• Marchandises: +0.3%• Services: +1.1%• Biens importés: +0.7%
A. Mattei 110
Indices de concentration
• Distribution des revenus: courbe de Lorenz• Egalité parfaite: diagonale• Inégalité parfaite: axe horizontal jusqu’à la fin
et ensuite rejoint la diagonale• Pas d’ambiguïté si pas de croisement• Indice de Gini• Indice d’Atkinson• Indice d’Herfindahl
A. Mattei 111
•
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
COURBE DE LORENZ
INEGALITE PARFAITE
EGALITE PARFAITE
A. Mattei 112100%100%
100%35%100%10%
65%40%90%40%
25%25%50%50%
% cumulés% revenu% cumulés%
100010
3503501
4001004
250505
totalrevenunombre
A. Mattei 113
0
10
20
30
40
50
60
70
80
90
100
0 10 20 30 40 50 60 70 80 90 100
COURBE DE L0RENZB
C
D
E
A
G=ABDE/ABC
A. Mattei 114
•
0
20
40
60
80
100
25 50 75 100
COURBES DE LORENZ
IQ
TAILLE
REVENUFORTUNE
A. Mattei 115
A. Mattei 116
A. Mattei 117
A. Mattei 118
Coefficient de Gini
• µ=moyenne, n=nombre individus• G=0 � égalité parfaite; G=1� inégalité parfaite• 0 ≤ G ≤ 1 (avantage par rapport au CV)
11
)32(2
3212−−+⋅⋅⋅+++=
nnyyyy
nG nµ
nyyyy ≤⋅⋅⋅≤≤≤ 321
∑∑ −=j
jii
yyn
Gµ22
1
A. Mattei 119
Quelques coefficients de Gini
• Suède: G=0.22• France: G=0.30• Suisse: G=0.32• Irlande: G=0.33• Etats-Unis: G=0.34• Taille: G=0.1• IQ: G=0.15
A. Mattei 120
Une faiblesse de cet indice
• A B C• 100 50 100• 200 250 200• 300 300 250• 400 400 450
• Gini: 0.250 0.275 0.275• Atkinson (ε=1.5) 0.175 0.344 0.190
A. Mattei 121
Commande TI-83/84
• Introduire les données par ordre croissant dans L1 et les fréquences dans L2 en utilisant la commande STAT / EDIT.
• Aller dans PRGM et choisir GINI• Presser ENTER• Ce programme ne fait pas partie des
programmes standard de la TI. Vous devez le télécharger (voir page du cours).
A. Mattei 122
Commande MINITAB
• Introduire les données dans C1• Taper, dans la fenêtre Session %GINI C1 • (Ce programme ne fait pas partie des
commandes MINITAB standard)
• Il n’y a pas de commande spéciale dans EXCEL
A. Mattei 123
Indice d’Atkinson
• fi=proportion d’individus avec le revenu yi
• Différence entre inégalité dans les bas et les hauts revenus
• Dépend de l’importance attribuée à l’inégalité (ε=0� aucune I=0)
)1/(11
1
εε
µ
−−
−= ∑ ii f
yI
A. Mattei 124
Indice d’Herfindahl
• Herfindahl: concentration industrielle
• 1200-1700: doutes sur la concurrence• > 1700 � la concurrence est en danger
Q
qH i
ii == ∑ ωω ; 10000 2
A. Mattei 125
Indices pour la Suisse
• Industrie chimique: 2571• Banques: 1781• Industrie textile: 1655• Industrie du papier: 1220• Commerce de gros: 570• Commerce de détail: 374• Restauration: 125
Recommended