View
80
Download
0
Category
Preview:
Citation preview
Exercices Covariance Indicateurs de concentration
Statistiques I
Alexandre Caboussatalexandre.caboussat@hesge.ch
Classe : Mercredi 8h15-10h00Salle: C114
http://campus.hesge.ch/caboussata
A. Caboussat, HEG STAT I, 2010 1 / 27
Exercices Covariance Indicateurs de concentration
Exercice 8.2
1 Nuage de points
2 Relation?3 Covariance:
cov(x , y) = −60.
4 Correlationrxy = −0.9688.
A. Caboussat, HEG STAT I, 2010 2 / 27
Exercices Covariance Indicateurs de concentration
Exercice 8.2
1 Nuage de points
2 Relation?3 Covariance:
cov(x , y) = −60.
4 Correlationrxy = −0.9688.
A. Caboussat, HEG STAT I, 2010 2 / 27
Exercices Covariance Indicateurs de concentration
Exercice 8.2
1 Nuage de points
2 Relation?3 Covariance:
cov(x , y) = −60.
4 Correlationrxy = −0.9688.
A. Caboussat, HEG STAT I, 2010 2 / 27
Exercices Covariance Indicateurs de concentration
Exercice 8.2
1 Nuage de points
2 Relation?3 Covariance:
cov(x , y) = −60.
4 Correlationrxy = −0.9688.
A. Caboussat, HEG STAT I, 2010 2 / 27
Exercices Covariance Indicateurs de concentration
Exercice 8.3
50
70
90
110
130
150
170
190
210
15 17 19 21 23 25 27 29 31 33 35
Nbre glaces
Température
Nombre de glaces
1 R2 = 0.996
2 Si xi = 24, yi = ...
3 Si xi = 5, yi = ...
A. Caboussat, HEG STAT I, 2010 3 / 27
Exercices Covariance Indicateurs de concentration
Exercice 8.3
50
70
90
110
130
150
170
190
210
15 17 19 21 23 25 27 29 31 33 35
Nbre glaces
Température
Nombre de glaces
1 R2 = 0.996
2 Si xi = 24, yi = ...
3 Si xi = 5, yi = ...
A. Caboussat, HEG STAT I, 2010 3 / 27
Exercices Covariance Indicateurs de concentration
Exercice 8.3
50
70
90
110
130
150
170
190
210
15 17 19 21 23 25 27 29 31 33 35
Nbre glaces
Température
Nombre de glaces
1 R2 = 0.996
2 Si xi = 24, yi = ...
3 Si xi = 5, yi = ...
A. Caboussat, HEG STAT I, 2010 3 / 27
Exercices Covariance Indicateurs de concentration
Donnees groupees
Definition
La covariance de donnees groupees d’une population est
cov(x , y) =1
n
∑i=1
c∑j=1
nij (xi − µx) (yj − µy )
=1
n
∑i=1
c∑j=1
nij xi yj − µxµy
ou xi et yj sont les centres des classes et ou µx et µy sont lesmoyennes des donnees groupees.
A. Caboussat, HEG STAT I, 2010 4 / 27
Exercices Covariance Indicateurs de concentration
Donnees groupees
Correlation lineaire de Pearson : formule identique a celle desdonnees non-groupees.
Population Echantillon
ρxy =σxy
σxσyrxy =
sxysx sy
A. Caboussat, HEG STAT I, 2010 5 / 27
Exercices Covariance Indicateurs de concentration
Exemple
Relation entre les quantites d’aluminium et d’or achetees. Donneesgroupees en deux categories pour l’aluminium et 3 categories pourl’or.
Aluminium[0;10[ [10;20] Total
Or [0;2000[ 20 2 22[2000;4000[ 5 2 7[4000;6000] 0 3 3
Total 25 7 32
A. Caboussat, HEG STAT I, 2010 6 / 27
Exercices Covariance Indicateurs de concentration
Exemple (suite)
Notons X pour l’or et Y pour l’aluminium.
µx = 3·5000+7·3000+22·100032 = 1812.5
µy = 25·5+7·1532 = 7.1875
var(x) = 3·50002+7·30002+22·10002
32 − 1812.52 = 1′714′843.75
var(y) = 25·52+7·152
32 − 7.18752 = 17.09
cov(x , y) = 0·5000·5+...+2·1000·1532 − 1812.5 · 7.1875 = 3222.66
corr(x , y) = 3222.66√1′714′843.75·17.09
= 0.5953
A. Caboussat, HEG STAT I, 2010 7 / 27
Exercices Covariance Indicateurs de concentration
Indicateurs de Concentration
A. Caboussat, HEG STAT I, 2010 8 / 27
Exercices Covariance Indicateurs de concentration
Objectifs
Comprendre un indicateur de concentration
Savoir construire la courbe de Lorenz
Savoir calculer et interpreter l’indice de Gini
A. Caboussat, HEG STAT I, 2010 9 / 27
Exercices Covariance Indicateurs de concentration
Indicateurs de concentration
Comment mesurer la repartition de richesse?
Y a-t-il des inegalites ou equite?
Exemples
Patrimoine culturel.
Salaire des employes.
Imposition des citoyens.
Peuplement d’un pays.
Offres d’emploi.
. . .
A. Caboussat, HEG STAT I, 2010 10 / 27
Exercices Covariance Indicateurs de concentration
Exemple
Bonus distribues dans l’entreprise.
Bonus en milliers de Frs 0.8 3 4 6 10
Effectifs 10 6 4 3 2
Cette repartition est-elle egalitaire?
A. Caboussat, HEG STAT I, 2010 11 / 27
Exercices Covariance Indicateurs de concentration
Rappel: Positionnement
1 observation vs les autres observations
valeur la plus frequente: mode ou classe modale
valeur qui divise en deux parties egales l’ensemble d’une seriestatistique classee par ordre croissant (statistique d’ordre):mediane
situation par rapport a une tendance centrale: variablescentrees reduites
A. Caboussat, HEG STAT I, 2010 12 / 27
Exercices Covariance Indicateurs de concentration
Repartition egalitaire ou inegalitaire?
Frequence relative cumulee
Representation graphique en ogive
A. Caboussat, HEG STAT I, 2010 13 / 27
Exercices Covariance Indicateurs de concentration
Exemple
xi = Bonus en milliers de Frs 0.8 3 4 6 10 Totalni = Effectifs 10 6 4 3 2 25
Effectifs cumules 10 16 20 23 25Effectif relatif cumule 0.4 0.64 0.8 0.92 1
Richesse par classe 8 18 16 18 20 80Richesse cumulee 8 26 42 60 80Richesse relative cumulee 0.1 0.325 0.525 0.75 1
Attention: Bonus classes par ordre croissant.
A. Caboussat, HEG STAT I, 2010 14 / 27
Exercices Covariance Indicateurs de concentration
Exemple
A. Caboussat, HEG STAT I, 2010 15 / 27
Exercices Covariance Indicateurs de concentration
Courbe de Lorenz
Considerons les parts de richesse par ordre croissant, avec leurseffectifs associes.
La representation graphique en une ogive comprenant:
en abscisse les effectifs relatifs cumules
en ordonnee les parts de richesse relatives cumulees
une courbe de concentration en joignant par des segments dedroites les points (effectif relatif cumule, part relativecumulee)
est la representation graphique de la courbe de Lorenz
A. Caboussat, HEG STAT I, 2010 16 / 27
Exercices Covariance Indicateurs de concentration
Courbe de Lorenz
A. Caboussat, HEG STAT I, 2010 17 / 27
Exercices Covariance Indicateurs de concentration
Aire de concentration
A. Caboussat, HEG STAT I, 2010 18 / 27
Exercices Covariance Indicateurs de concentration
Indice de Gini
Definition
L’indice de concentration de Gini, ou plus communement l’indicede Gini, est defini par le rapport entre l’aire de concentration parl’aire du triangle sous la ligne d’equipartition. Il est note IG .
IG = Aire de concentrationAire du triangle sous la ligne d’equipartition
= 2× Aire de concentration
Equipartition → 0 ≤ IG ≤ 1← Inegalite maximale
Equite ↓ ⇔ IG ↑
A. Caboussat, HEG STAT I, 2010 19 / 27
Exercices Covariance Indicateurs de concentration
Indice de Gini
Definition
L’indice de concentration de Gini, ou plus communement l’indicede Gini, est defini par le rapport entre l’aire de concentration parl’aire du triangle sous la ligne d’equipartition. Il est note IG .
IG = Aire de concentrationAire du triangle sous la ligne d’equipartition
= 2× Aire de concentration
Equipartition → 0 ≤ IG ≤ 1← Inegalite maximale
Equite ↓ ⇔ IG ↑
A. Caboussat, HEG STAT I, 2010 19 / 27
Exercices Covariance Indicateurs de concentration
Indice de Gini
Definition
L’indice de concentration de Gini, ou plus communement l’indicede Gini, est defini par le rapport entre l’aire de concentration parl’aire du triangle sous la ligne d’equipartition. Il est note IG .
IG = Aire de concentrationAire du triangle sous la ligne d’equipartition
= 2× Aire de concentration
Equipartition → 0 ≤ IG ≤ 1← Inegalite maximale
Equite ↓ ⇔ IG ↑
A. Caboussat, HEG STAT I, 2010 19 / 27
Exercices Covariance Indicateurs de concentration
Concentration faible - forte
Concentration faible Concentration forte
50% detient 40% de la richesse 95% detient 15% de la richesse50% detient 60% de la richesse 5% detient 85% de la richesse
A. Caboussat, HEG STAT I, 2010 20 / 27
Exercices Covariance Indicateurs de concentration
Exemples
10% detient 90% de la richesse 30% detient 90% de la richesse
10% detient 70% de la richesse 30% detient 70% de la richesse
10% detient 50% de la richesse 30% detient 50% de la richesse
A. Caboussat, HEG STAT I, 2010 21 / 27
Exercices Covariance Indicateurs de concentration
Calcul de l’indice de Gini: Methode 1
1 Calculer l’aire A sous la courbe de Lorenz en additionnant lesaires des trapezes (trapeze degenere en un triangle pour lepremier calcul).
2 Soustraire de 0.5 l’aire trouvee: Aire de concentration = 0.5-A3 Multiplier par 2 l’aire de concentration: IG = 2(0.5− A)
A. Caboussat, HEG STAT I, 2010 22 / 27
Exercices Covariance Indicateurs de concentration
Exemple de calcul: methode 1
1 Aire du triangle = 0.5 · 0.4 · 0.1 = 0.02Aire du trapeze = 0.5(0.1+0.325)(0.64-0.4)=0.051Aire du trapeze = 0.5(0.325+0.525)(0.8-0.64)=0.068Aire du trapeze = 0.5(0.535+0.75)(0.92-0.8)=0.0765Aire du trapeze = 0.5(0.75+1)(1-0.92)=0.07Aire sous la courbe = 0.2855
2 Aire de concentration = 0.5− A = 0.21453 IG = 2(0.5− A) = 0.429
A. Caboussat, HEG STAT I, 2010 23 / 27
Exercices Covariance Indicateurs de concentration
Exemple de calcul: methode 1
1 Aire du triangle = 0.5 · 0.4 · 0.1 = 0.02Aire du trapeze = 0.5(0.1+0.325)(0.64-0.4)=0.051Aire du trapeze = 0.5(0.325+0.525)(0.8-0.64)=0.068Aire du trapeze = 0.5(0.535+0.75)(0.92-0.8)=0.0765Aire du trapeze = 0.5(0.75+1)(1-0.92)=0.07Aire sous la courbe = 0.2855
2 Aire de concentration = 0.5− A = 0.21453 IG = 2(0.5− A) = 0.429
A. Caboussat, HEG STAT I, 2010 23 / 27
Exercices Covariance Indicateurs de concentration
Calcul de l’indice de Gini: Methode 2
F = frequence relative cumulee des individusG = part relative cumulee de la richesse.
Fi =1
n
i∑j=1
nj ; Gi =
i∑j=1
njxj
c∑j=1
njxj
IG =c−1∑i=1
FiGi+1 −c−1∑i=1
Fi+1Gi
Courbe de Lorenz = lieu des points (Fi ,Gi ) relies par des segmentsde droite
A. Caboussat, HEG STAT I, 2010 24 / 27
Exercices Covariance Indicateurs de concentration
Exemple de calcul: methode 2
Bonus en milliers de Frs 0.8 3 4 6 10Effectifs 10 6 4 3 2
Fi = Effectif relatif cumule 0.4 0.64 0.8 0.92 1Gi = Richesse relative cumulee 0.1 0.325 0.525 0.75 1
IG = (0.4 · 0.325 + 0.64 · 0.525 + 0.8 · 0.75 + 0.92 · 1)−(0.64 · 0.1 + 0.8 · 0.325 + 0.92 · 525 + 1 · 0.75)
= 1.986− 1.557= 0.429
A. Caboussat, HEG STAT I, 2010 25 / 27
Recommended