25
1 1 1 M éthodesstatistiques. Etape 2: D ispersion.

1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

Embed Size (px)

Citation preview

Page 1: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

1

1

1

Méthodes statistiques.

Etape 2:

Dispersion.

Page 2: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

2

1. Les caractéristiques de dispersion.11. Utilité.

• Etude de l’étalement des modalités d ’une variable par rapport à une valeur de position.

• Mesure de l ’homogénéité d ’une population par rapport à une variable.

• Analyse de la variance.

• Choix de la variable la plus discriminante.

Page 3: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

3

On peut utiliser 4 types de nombres pour mesurer la dispersion des modalités

d ’une variable, chacun étant associé à l ’une des caractéristiques de position

définies dans l ’étape précédente.

12. Principales caractéristiques.

Page 4: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

4

121. L ’étendue.

C ’est la différence entre la modalité la plus élevée et la modalité la plus faible.

• Elle correspond au mode;

• Elle permet d ’estimer l’écart type, en gestion de projet, lorsque les temps opératoires ne sont pas connus;

• Avec les notations passées : 1xxe p

Page 5: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

5

122. L ’écart inter quartiles.C ’est la différence entre le quartile 3 (il

représente 75 % des observations) et le quartile 1 ( il représente 25 % des observations)

• Correspond à la médiane;

• représente 50 % des observations centrées sur la médiane:

13 QQI

Page 6: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

6

123. Ecart absolu moyen.Théoriquement l ’une des meilleures

caractéristiques; mais se prête mal au calcul algébrique.

• Permet de gérer les erreurs de prévision;

• Avec les notations passées, il est défini par:

n

pi

ixixin

E

1

Page 7: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

7

124. L ’écart-type.C ’est la caractéristique la plus usuelle.

• Elle correspond à la moyenne arithmétique;

• Elle est définie par:

2

12

1

n

xxnpi

iii

Page 8: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

8

13. Propriétés de l ’écart-type.

• C ’est la racine carrée de la variance;

• Sa forme développée est donnée par:

21

21

2

xn

pi

iixin

Page 9: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

9

xi ni x ni i n xi i

2

x1 n1 x n1 1 n x1 1

2

... ... ... ...

xi ni x ni i n xi i

2

... ... ... ...

x p np x ni i n xp p

2

n x nii

i p

i

1

n xi ii

i p

1

2

• Une relation importante:

• Calcul de l ’écart-type sous forme de tableau.

ni

iixnxXV

1

22 )(

Page 10: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

10

• Le changement de variable.

inix ,

inix ,'

XVx

XVx

0

xix

ix

XVXV

xxx

2

.

Page 11: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

11

14. Notion d ’homogénéité d ’une population.

On peut mesurer l ’homogénéité d ’une population par un nombre que l ’on appelle coefficient de variation. Ce nombre est défini par :

x

Page 12: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

12

Règle d ’utilisation:

• Si ce nombre est proche de 0, alors la population peut-être considérée homogène en ce qui concerne la variable utilisée; il n ’y a pas lieu de stratifier.

• Dans le cas contraire, la population est hétérogène et doit être stratifiée avant étude.

Page 13: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

13

15. Exemples.151. Communauté urbaine.

On dispose des renseignements suivantsrelatifs aux finances locales de communes del’agglomération bordelaise et de deux autresvilles du département de la Gironde(source : bulletin municipal de Villenaved’Ornon).

Page 14: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

14

Villes

Population (arrondie au millier inférieur)

Dépense moyenne par

habitant en euros

Impôt moyen par habitant en euros

Bordeaux 226 328,2 106,2 Libourne 22 282,7 111,5

St Médard 16 220,8 136,0 Arcachon 14 382,2 132,2

Blanquefort 9 332,2 276,6 Bruges 7 186,9 113,4

Mérignac 53 214,6 128,5 Talence 34 154,2 64,3 Cenon 27 180,1 85,0 Bègles 25 176,6 91,2

Villenave 23 166,0 77,8

Page 15: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

15

On ne peut calculer moyennes et écarts sans pondérer par la taille de la ville exprimée en nombre d ’habitants.

L ’agglomération est constituée de 456 000 habitants. C ’est l ’effectif total.

• L ’impôt moyen est égal à 107,73 et la dépense moyenne est égale à 270,36.

• Les écart-types sont respectivement égaux à 72,10 et à 29,88.

Page 16: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

16

Les divers coefficients de variation sont égaux à:

• 0,26 pour l ’impôt • 0,27 pour la dépense.

Ainsi, la population de la communauté des communes concernée est plus homogène en ce qui concerne l ’impôt par habitant que la dépense moyenne par habitant.La variable « dépense » ferait la meilleure variable de stratification.

Page 17: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

17

152. Demandes d ’emploi.

En 1998, la répartition des demandes d’emploi enregistrées en fin de mois, selon le sexe et la classe d’âge était la suivante :

Age Hommes Femmes [18 - 25[ 310 440 [25 - 40[ 265 375 [40 - 45[ 110 60 [45 - 55[ 165 110 [55 - 60[ 50 25

Page 18: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

18

Age moyen

ix

Hommes in

Femmes in

iinx

iinx

ii nx

2 ii nx

2

21,5 310 440 6665 9460 143297,5 203390 32,5 265 375 8612,5 12187,5 279906,25 396093,75 42,5 110 60 4675 2550 198687,5 108375 50 165 110 8250 5500 412500 275000

57,5 50 25 2875 1437,5 165312,5 82656,25 Sommes 900 1010 31077,5 31135 1199703,75 1065515

L ’âge moyen d ’un demandeur d ’emploi homme est égal à 34, 53 ans; alors que chez les femmes il n ’est que de 30,83 ans.

Chez les hommes la variation est plus forte, ce qui signifie que cette population est plus hétérogène.

Page 19: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

19

2. La concentration.La concentration permet de mettre en

relation le poids d’individus ou de groupesd’individus et la part qu’ils représentent.Par exemple si la variable étudiéereprésente les salaires des employés d’uneentreprise, la part sera identifiée à unepartie de la masse salariale servie. Si lavariable étudiée représente le prix d’achatdes produits d’un stock, la part seraidentifiée à une partie de la valeur d’achatdu stock .

Page 20: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

20

On représente la concentration par une courbe appelée courbe de GINI. On mesure la concentration par un indice appelé indice de GINI.

Exemple.

Dans une entreprise, on a calculé le salaire moyen mensuel par catégorie d’employés. Les résultats sont présentés dans le tableau suivant avec en deuxième colonne, le nombre de salariés de la catégorie.

Catégorie A B C D E F Salaire moyen 5750 8222 9800 12200 13429 16333

Nombre de salariés 11 22 33 22 11 11

Page 21: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

21

Le poids de chacune des catégories peut être calculéde la manière suivante :

Poids descatégories en

%10 20 30 20 10 10

La part de chaque catégorie peut-être définie par le produit du nombre d’individus de la catégorie et du salaire moyen de la catégorie. Les résultats sont présentés dans le tableau suivant :

Part en valeur

63250 180884 323400 268400 147719 179663

Part en % de la

valeur.

5,44

15,55

27,80

23,08

12,70

15,44

Page 22: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

22

Ainsi, peut on mettre en relation les deux pourcentages obtenus. C’est ce qui figure dans le tableau suivant :

Catégorie A B C D E F Poids des catégories en % 10 20 30 20 10 10

Part en % de la valeur 5,44 15,55 27,80 23,08 12,70 15,44

Nous pouvons constater dans ce tableau que 20 %des individus de la catégorie B représentent 15,55% de la masse salariale, alors que les 20 % de lacatégorie D en représente 23, 08 %. Les catégoriesont le même poids ; mais pas la même part.

Page 23: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

23

Pour représenter cette notion, nous utilisons la courbe de Gini. Celle-ci, est obtenue de la manière suivante :

On cumule le poids et la part exprimés en pourcentage ; On représente graphiquement la part cumulée en fonction

du poids cumulé.

Poids cumulé ( j ) 0 10 30 60 80 90 100

Part cumulée ( j ) 0 5,44 20,99 48,79 71,87 84,57 100

Page 24: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

24

21. La courbe de concentration.

0 50 100

100

50

Le poids en %

La part en %.

S

Page 25: 1. 2 1. Les caractéristiques de dispersion. 11. Utilité. Etude de létalement des modalités d une variable par rapport à une valeur de position. Mesure

25

C o m m e o n p e u t l ’ i m a g i n e r , l ’ i n d i c e d ec o n c e n t r a t i o n e s t u n n o m b r e c o m p r i s e n t r e 0 e t 1 . I ls ’ o b t i e n t e n f a i s a n t l e q u o t i e n t d e l a s u r f a c e S p a r5 0 0 0 ( = 1 0 0 * 1 0 0 / 2 ) . A p r è s t r a n s f o r m a t i o n , o no b t i e n t l e n o m b r e s u i v a n t :

100001

*1001

j jjjfi