34
Exercices Covariance Indicateurs de concentration Statistiques I Alexandre Caboussat [email protected] Classe : Mercredi 8h15-10h00 Salle: C114 http://campus.hesge.ch/caboussata A. Caboussat, HEG STAT I, 2010 1 / 27

Stat i cours11

Embed Size (px)

Citation preview

Exercices Covariance Indicateurs de concentration

Statistiques I

Alexandre [email protected]

Classe : Mercredi 8h15-10h00Salle: C114

http://campus.hesge.ch/caboussata

A. Caboussat, HEG STAT I, 2010 1 / 27

caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Exercice 8.2

1 Nuage de points

2 Relation?3 Covariance:

cov(x , y) = −60.

4 Correlationrxy = −0.9688.

A. Caboussat, HEG STAT I, 2010 2 / 27

caboussata
Droite

Exercices Covariance Indicateurs de concentration

Exercice 8.2

1 Nuage de points

2 Relation?3 Covariance:

cov(x , y) = −60.

4 Correlationrxy = −0.9688.

A. Caboussat, HEG STAT I, 2010 2 / 27

caboussata
Crayon
caboussata
Crayon
caboussata
Droite
caboussata
Droite
caboussata
Crayon
caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Exercice 8.2

1 Nuage de points

2 Relation?3 Covariance:

cov(x , y) = −60.

4 Correlationrxy = −0.9688.

A. Caboussat, HEG STAT I, 2010 2 / 27

Exercices Covariance Indicateurs de concentration

Exercice 8.2

1 Nuage de points

2 Relation?3 Covariance:

cov(x , y) = −60.

4 Correlationrxy = −0.9688.

A. Caboussat, HEG STAT I, 2010 2 / 27

Exercices Covariance Indicateurs de concentration

Exercice 8.3

50

70

90

110

130

150

170

190

210

15 17 19 21 23 25 27 29 31 33 35

Nbre glaces

Température

Nombre de glaces

1 R2 = 0.996

2 Si xi = 24, yi = ...

3 Si xi = 5, yi = ...

A. Caboussat, HEG STAT I, 2010 3 / 27

caboussata
Droite
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Exercice 8.3

50

70

90

110

130

150

170

190

210

15 17 19 21 23 25 27 29 31 33 35

Nbre glaces

Température

Nombre de glaces

1 R2 = 0.996

2 Si xi = 24, yi = ...

3 Si xi = 5, yi = ...

A. Caboussat, HEG STAT I, 2010 3 / 27

caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Droite
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Exercice 8.3

50

70

90

110

130

150

170

190

210

15 17 19 21 23 25 27 29 31 33 35

Nbre glaces

Température

Nombre de glaces

1 R2 = 0.996

2 Si xi = 24, yi = ...

3 Si xi = 5, yi = ...

A. Caboussat, HEG STAT I, 2010 3 / 27

caboussata
Crayon
caboussata
Crayon
caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Donnees groupees

Definition

La covariance de donnees groupees d’une population est

cov(x , y) =1

n

∑i=1

c∑j=1

nij (xi − µx) (yj − µy )

=1

n

∑i=1

c∑j=1

nij xi yj − µxµy

ou xi et yj sont les centres des classes et ou µx et µy sont lesmoyennes des donnees groupees.

A. Caboussat, HEG STAT I, 2010 4 / 27

Exercices Covariance Indicateurs de concentration

Donnees groupees

Correlation lineaire de Pearson : formule identique a celle desdonnees non-groupees.

Population Echantillon

ρxy =σxy

σxσyrxy =

sxysx sy

A. Caboussat, HEG STAT I, 2010 5 / 27

Exercices Covariance Indicateurs de concentration

Exemple

Relation entre les quantites d’aluminium et d’or achetees. Donneesgroupees en deux categories pour l’aluminium et 3 categories pourl’or.

Aluminium[0;10[ [10;20] Total

Or [0;2000[ 20 2 22[2000;4000[ 5 2 7[4000;6000] 0 3 3

Total 25 7 32

A. Caboussat, HEG STAT I, 2010 6 / 27

caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Rectangle

Exercices Covariance Indicateurs de concentration

Exemple (suite)

Notons X pour l’or et Y pour l’aluminium.

µx = 3·5000+7·3000+22·100032 = 1812.5

µy = 25·5+7·1532 = 7.1875

var(x) = 3·50002+7·30002+22·10002

32 − 1812.52 = 1′714′843.75

var(y) = 25·52+7·152

32 − 7.18752 = 17.09

cov(x , y) = 0·5000·5+...+2·1000·1532 − 1812.5 · 7.1875 = 3222.66

corr(x , y) = 3222.66√1′714′843.75·17.09

= 0.5953

A. Caboussat, HEG STAT I, 2010 7 / 27

caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Indicateurs de Concentration

A. Caboussat, HEG STAT I, 2010 8 / 27

Exercices Covariance Indicateurs de concentration

Objectifs

Comprendre un indicateur de concentration

Savoir construire la courbe de Lorenz

Savoir calculer et interpreter l’indice de Gini

A. Caboussat, HEG STAT I, 2010 9 / 27

Exercices Covariance Indicateurs de concentration

Indicateurs de concentration

Comment mesurer la repartition de richesse?

Y a-t-il des inegalites ou equite?

Exemples

Patrimoine culturel.

Salaire des employes.

Imposition des citoyens.

Peuplement d’un pays.

Offres d’emploi.

. . .

A. Caboussat, HEG STAT I, 2010 10 / 27

Exercices Covariance Indicateurs de concentration

Exemple

Bonus distribues dans l’entreprise.

Bonus en milliers de Frs 0.8 3 4 6 10

Effectifs 10 6 4 3 2

Cette repartition est-elle egalitaire?

A. Caboussat, HEG STAT I, 2010 11 / 27

Exercices Covariance Indicateurs de concentration

Rappel: Positionnement

1 observation vs les autres observations

valeur la plus frequente: mode ou classe modale

valeur qui divise en deux parties egales l’ensemble d’une seriestatistique classee par ordre croissant (statistique d’ordre):mediane

situation par rapport a une tendance centrale: variablescentrees reduites

A. Caboussat, HEG STAT I, 2010 12 / 27

Exercices Covariance Indicateurs de concentration

Repartition egalitaire ou inegalitaire?

Frequence relative cumulee

Representation graphique en ogive

A. Caboussat, HEG STAT I, 2010 13 / 27

Exercices Covariance Indicateurs de concentration

Exemple

xi = Bonus en milliers de Frs 0.8 3 4 6 10 Totalni = Effectifs 10 6 4 3 2 25

Effectifs cumules 10 16 20 23 25Effectif relatif cumule 0.4 0.64 0.8 0.92 1

Richesse par classe 8 18 16 18 20 80Richesse cumulee 8 26 42 60 80Richesse relative cumulee 0.1 0.325 0.525 0.75 1

Attention: Bonus classes par ordre croissant.

A. Caboussat, HEG STAT I, 2010 14 / 27

caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Rectangle
caboussata
Rectangle
caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Exemple

A. Caboussat, HEG STAT I, 2010 15 / 27

caboussata
Crayon
caboussata
Crayon
caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Courbe de Lorenz

Considerons les parts de richesse par ordre croissant, avec leurseffectifs associes.

La representation graphique en une ogive comprenant:

en abscisse les effectifs relatifs cumules

en ordonnee les parts de richesse relatives cumulees

une courbe de concentration en joignant par des segments dedroites les points (effectif relatif cumule, part relativecumulee)

est la representation graphique de la courbe de Lorenz

A. Caboussat, HEG STAT I, 2010 16 / 27

Exercices Covariance Indicateurs de concentration

Courbe de Lorenz

A. Caboussat, HEG STAT I, 2010 17 / 27

caboussata
Droite
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Aire de concentration

A. Caboussat, HEG STAT I, 2010 18 / 27

caboussata
Crayon
caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Indice de Gini

Definition

L’indice de concentration de Gini, ou plus communement l’indicede Gini, est defini par le rapport entre l’aire de concentration parl’aire du triangle sous la ligne d’equipartition. Il est note IG .

IG = Aire de concentrationAire du triangle sous la ligne d’equipartition

= 2× Aire de concentration

Equipartition → 0 ≤ IG ≤ 1← Inegalite maximale

Equite ↓ ⇔ IG ↑

A. Caboussat, HEG STAT I, 2010 19 / 27

caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Indice de Gini

Definition

L’indice de concentration de Gini, ou plus communement l’indicede Gini, est defini par le rapport entre l’aire de concentration parl’aire du triangle sous la ligne d’equipartition. Il est note IG .

IG = Aire de concentrationAire du triangle sous la ligne d’equipartition

= 2× Aire de concentration

Equipartition → 0 ≤ IG ≤ 1← Inegalite maximale

Equite ↓ ⇔ IG ↑

A. Caboussat, HEG STAT I, 2010 19 / 27

Exercices Covariance Indicateurs de concentration

Indice de Gini

Definition

L’indice de concentration de Gini, ou plus communement l’indicede Gini, est defini par le rapport entre l’aire de concentration parl’aire du triangle sous la ligne d’equipartition. Il est note IG .

IG = Aire de concentrationAire du triangle sous la ligne d’equipartition

= 2× Aire de concentration

Equipartition → 0 ≤ IG ≤ 1← Inegalite maximale

Equite ↓ ⇔ IG ↑

A. Caboussat, HEG STAT I, 2010 19 / 27

Exercices Covariance Indicateurs de concentration

Concentration faible - forte

Concentration faible Concentration forte

50% detient 40% de la richesse 95% detient 15% de la richesse50% detient 60% de la richesse 5% detient 85% de la richesse

A. Caboussat, HEG STAT I, 2010 20 / 27

caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Exemples

10% detient 90% de la richesse 30% detient 90% de la richesse

10% detient 70% de la richesse 30% detient 70% de la richesse

10% detient 50% de la richesse 30% detient 50% de la richesse

A. Caboussat, HEG STAT I, 2010 21 / 27

caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Calcul de l’indice de Gini: Methode 1

1 Calculer l’aire A sous la courbe de Lorenz en additionnant lesaires des trapezes (trapeze degenere en un triangle pour lepremier calcul).

2 Soustraire de 0.5 l’aire trouvee: Aire de concentration = 0.5-A3 Multiplier par 2 l’aire de concentration: IG = 2(0.5− A)

A. Caboussat, HEG STAT I, 2010 22 / 27

caboussata
Droite
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Exemple de calcul: methode 1

1 Aire du triangle = 0.5 · 0.4 · 0.1 = 0.02Aire du trapeze = 0.5(0.1+0.325)(0.64-0.4)=0.051Aire du trapeze = 0.5(0.325+0.525)(0.8-0.64)=0.068Aire du trapeze = 0.5(0.535+0.75)(0.92-0.8)=0.0765Aire du trapeze = 0.5(0.75+1)(1-0.92)=0.07Aire sous la courbe = 0.2855

2 Aire de concentration = 0.5− A = 0.21453 IG = 2(0.5− A) = 0.429

A. Caboussat, HEG STAT I, 2010 23 / 27

caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Exemple de calcul: methode 1

1 Aire du triangle = 0.5 · 0.4 · 0.1 = 0.02Aire du trapeze = 0.5(0.1+0.325)(0.64-0.4)=0.051Aire du trapeze = 0.5(0.325+0.525)(0.8-0.64)=0.068Aire du trapeze = 0.5(0.535+0.75)(0.92-0.8)=0.0765Aire du trapeze = 0.5(0.75+1)(1-0.92)=0.07Aire sous la courbe = 0.2855

2 Aire de concentration = 0.5− A = 0.21453 IG = 2(0.5− A) = 0.429

A. Caboussat, HEG STAT I, 2010 23 / 27

caboussata
Crayon
caboussata
Droite
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon
caboussata
Crayon

Exercices Covariance Indicateurs de concentration

Calcul de l’indice de Gini: Methode 2

F = frequence relative cumulee des individusG = part relative cumulee de la richesse.

Fi =1

n

i∑j=1

nj ; Gi =

i∑j=1

njxj

c∑j=1

njxj

IG =c−1∑i=1

FiGi+1 −c−1∑i=1

Fi+1Gi

Courbe de Lorenz = lieu des points (Fi ,Gi ) relies par des segmentsde droite

A. Caboussat, HEG STAT I, 2010 24 / 27

Exercices Covariance Indicateurs de concentration

Exemple de calcul: methode 2

Bonus en milliers de Frs 0.8 3 4 6 10Effectifs 10 6 4 3 2

Fi = Effectif relatif cumule 0.4 0.64 0.8 0.92 1Gi = Richesse relative cumulee 0.1 0.325 0.525 0.75 1

IG = (0.4 · 0.325 + 0.64 · 0.525 + 0.8 · 0.75 + 0.92 · 1)−(0.64 · 0.1 + 0.8 · 0.325 + 0.92 · 525 + 1 · 0.75)

= 1.986− 1.557= 0.429

A. Caboussat, HEG STAT I, 2010 25 / 27

Exercices Covariance Indicateurs de concentration

Pour le 15 decembre: test en blanc.

Pour le 23 decembre: exercices 9.1 et 9.2

A. Caboussat, HEG STAT I, 2010 27 / 27

caboussata
Crayon