54
Statistique descriptive à une dimension PREMIERE PARTIE STATISTQUE DESCRIPTIVE A UNE DIMENSION M.ACHRIT Page 1

Cours stat. achrit tsge1

  • Upload
    ma-ac

  • View
    2.698

  • Download
    5

Embed Size (px)

Citation preview

Page 1: Cours stat. achrit tsge1

Statistique descriptive à une dimension

PREMIERE PARTIE

STATISTQUE DESCRIPTIVE A UNE

DIMENSION

M.ACHRIT Page 1

Page 2: Cours stat. achrit tsge1

Statistique descriptive à une dimension

SOMMAIRE

1. Introduction :

Objet de la statistique

Termes statistiques de base

2. Distributions statistiques :

2.1. Les séries statistiques

2.2. Le caractère qualitatif et le caractère quantitatif discret

2.3. Le caractère quantitatif continu

3. Représentations graphiques :

3.1. Représentation d’un caractère qualitatif

3.2. Représentation d’un caractère quantitatif discret

3.3. Représentation d’un caractère quantitatif continu

4. Paramètre :

4.1. Introduction4.2. Paramètres

de position 4.3. Paramètres

de dispersion

5. Exercices d’application 

M.ACHRIT Page 2

Page 3: Cours stat. achrit tsge1

Statistique descriptive à une dimension

INTRODUCTION

Objet de la statistique descriptive   :

La statistique descriptive a pour but de résumer et de présenter les données observées d’une manière telle que l’on puisse en prendre connaissance facilement, par exemple sous forme de tableaux et de graphiques.

Terminologie

1. Statistique :La statistique est une méthode scientifique dont l’objet est de recueillir, d’organiser, de résumer et d’analyser les données d’une enquête, d’une étude ou d’une expérience, aussi bien que de tirer les conclusions logiques et de prendre les décisions qui s’imposent à partir des analyses effectuées.2. Population :Ensemble d'individus définis par une propriété commune donnée.Exemple : si l’on veut étudier la taille des plantes par zone dans une ville, la population considérée est l’ensemble de toutes les plantes de la ville.3. Échantillon :Sous-ensemble de la population.Exemple : pour établir la taille des plantes d’une ville donnée, on peutPrélever au hasard un certain nombre de plante - un échantillon- dans un quartier parmi celles qui existe dans la ville.4. Individu ou unité statistique :Chaque élément de la population ou de l’échantillon.Exemple : dans l’exemple précédant, chaque plante constitue un individu ou une unitéStatistique.5. La taille :Représente le nombre d’individus d’un échantillon ou d’une population. Elle est symbolisée par « n » dans le cas d’un échantillon et par « N » dans le cas d’une population.6. Le caractère :C’est l’aspect particulier que l’on désire étudier pour une variable statistique.il peut être soit qualitatif ou bien quantitatif.Exemple : concernant un groupe de personnes, on peut s’intéresser à leur âge, leur sexe, leur taille…7. Les modalités :Les différentes manières d’être que peut présenter un caractère.Exemple 1 : le sexe est un caractère qui présente deux modalités : Féminin ou masculinExemple 2 : quant au nombre d’enfants par famille, les modalités de ce caractère peuvent être 0, 1, 2, 3…,20.8. Caractère qualitatif :Ses modalités ne s’expriment pas par un nombre mais par des mots.

M.ACHRIT Page 3

Page 4: Cours stat. achrit tsge1

Statistique descriptive à une dimension

Exemple : la religion, la couleur, la situation patrimoniale…9. Caractère quantitatif :Ses modalités sont numériques.Exemple : l’âge, la taille, le poids…10. Caractère quantitatif discretL’ensemble des valeurs que peut prendre le caractère est fini ou dénombrable. Le plusSouvent, ces valeurs sont des nombres entiers positifs.Exemple : le nombre d’enfant dans une famille, le nombre de téléviseurs par foyer.11. Caractère quantitatif continu :Le caractère peut prendre théoriquement n’importe quelle valeur dans un intervalle donné de nombres réels.Exemple : la taille d’un individu, le poids…12. Série statistique :L’ensemble des différentes données associées à un certain nombre d’individus.Exemple : la série suivante résulte d’une courte enquête auprès de quelques personnes pour connaître leur âge :18 21 19 19 17 22 27 18 18 17 20 20 23

La statistique descriptive peut faire l’objet d’une variable, et on parlera de statistique descriptive à une variable ou à une dimension. Elle peut concerner deux variables, on parle alors de statistique descriptive à deux variables ou à deux dimensions.

STATISTIQUE DESCRIPTIVE À UNE DIMENSION

Le but de simplification de la statistique descriptive peut être atteint en condensant les observations sous trois formes distinctes :

Les tableaux statistiques   : Permettent de présenter les données sous la forme numérique de distributions de fréquences.

Les diagrammes   : Permettent de représenter graphiquement ces distributions.

Les paramètres   : Les données peuvent être condensées sous forme de quelques paramètres statistiques.

1. DISTRIBUTIONS STATISTIQUES:

1.1. Les séries de statistiques :

Une série statistique est une simple énumération des observations :

X1, X2, X 3,………, Xi, ………, Xn

Ces observations étant rangées par ordre croissant :

X1 ≤ X2 ≤ X3 ≤ ......... ≤ Xi ≤ ……… ≤ Xn

M.ACHRIT Page 4

Page 5: Cours stat. achrit tsge1

Statistique descriptive à une dimension

*Effectif : n est le nombre total d’observations.

*Étendue : La différence entre la valeur la plus grande et la valeur la plus petite est appelée étendue.

Exemple : Soit la série statistique suivante des poids (en Kg) de 12 paquets.

20,4 ; 25,4 ; 25,6 ; 26,6 ; 28,6 ; 28,7 ; 28,7 ; 29 ; 29,8 ; 30,5 ; 31,1 ; 31,2

Les caractéristiques de la série :

Unité de base : Un paquet Population : 12 paquets Caractère : Le poids Sa nature : Un caractère quantitatif continu. Effectif : n = 12 Étendue = X max – X min =31,2 - 20,4 = 10,8

2.2. Les distributions non groupées en classe :

Lorsque les observations sont nombreuses, il est nécessaire de les condenser sous forme d’un tableau statistique appelé distribution de fréquences.

2.2.1. le caractère qualitatif :

Modalités

Fréquences absolues ni

Fréquences relatives fi

C1

C2

.

.

Ci

.

.

Ck

n1

n2

ni

nk

f1

f2

fi

fk

Total n 1

M.ACHRIT Page 5

Page 6: Cours stat. achrit tsge1

Statistique descriptive à une dimension

n1 est le nombre de fois qu’on a observé la modalité C1

ni est dite fréquence absolue de la modalité Ci

n = n1 + n2 + …. + ni + …. + nk

f i=ni

nest dite fréquence relative de lamodalité C i

∑i=1

k

f i=¿ f 1+f 2+…+f i+…f K=

n1

n+

n2

n+…+

ni

n+

nk

n¿

∑i=1

k

f i=¿¿ n1+n2+…+ni+…+nk

n=n

n

∑i=1

k

f i=¿1¿

Exemple :

On a observé dans un jardin la couleur de 100 roses. Population : 100 roses Effectif  : n=100 Caractère : La couleur Sa nature  : C’est un caractère qualitatif Ses modalités : Jaune, blanche, rouge k=3

Modalité

Fréquence absolue (ni )

Fréquence relative (fi)

Jaune

Blanche

Rouge

29

38

33

0,29

0,38

0,33

Total 100 1

2.2.3. le caractère quantitatif discret  :

Caractère

Fréquence

absolue

Fréquence cumulée

croissante

Fréquence

cumulée décroiss

Fréquence

relative

M.ACHRIT Page 6

Page 7: Cours stat. achrit tsge1

Statistique descriptive à une dimension

ante

Xi ni F.c.c F.c.d Fi

X1

X2

.

.

Xi

.

.

Xk

n1

n2

.

.

ni

.

.

nk

n1

n1 + n2

.

.

n1 + n2 + ….+ni

.

.

n

n

nk +…. + n2

.

.

nk + …. +ni

.

.

nk

F1

F2

.

.

Fi

.

.

Fk

TOTAL n 1

Exemple : Distribution du nombre de pièces pour 750 appartements

Population  : 750 appartements Caractère   : nombre de pièces Sa nature  : c’est un caractère quantitatif discontinu

Nombre de

pièces Xi

Nombre d’appartemen

ts ni

Fréquence cumulée

croissante

Fréquence cumulée

décroissante

Fréquence relative

1

2

3

4

5

90

110

240

210

70

90

200

440

650

720

750

660

550

310

100

0,12

0,15

0,32

0,28

0,09

M.ACHRIT Page 7

Page 8: Cours stat. achrit tsge1

Statistique descriptive à une dimension

6 30 750 30 0,04

Total 750 1

Le tableau peut se lire comme suit :

-Le nombre d’appartements comportant une seule pièce est 90 -La colonne des fréquences absolues cumulées croissantes : permet de répondre aux questions du genre : quel est le nombre d’appartements ayant au plus 1 pièce,2 pièces….etc -La colonne des fréquences absolues cumulées décroissantes : permet de répondre aux questions du genre : quel est le nombre d’appartements ayant au moins 1 pièce, 2pièce….etc

Remarque : De la même manière que pour les fréquences absolues on peut calculer les fréquences relatives cumulées croissantes et les fréquences relatives cumulées décroissantes.

2.2.3. Le caractère quantitatif continu :

Quand le nombre des valeurs observées (Xi) est élevé, il est nécessaire de condenser encore les tableaux statistiques, en groupant les observations en classes, on obtient ainsi une distribution de fréquence groupée. C’est généralement le cas des variables quantitatives continues. Chaque classe [a – b] est caractérisée par :

une borne inférieure a , une borne supérieure b une amplitude qui est l’écart entre les deux bornes

amplitude (ai ) = b-a un point central correspondant au milieu de cette classe et

s’obtient en ajoutant la borne inférieure et supérieure de la classe et en divisant par deux.Ci= (a+b)/2

M.ACHRIT Page 8

Page 9: Cours stat. achrit tsge1

Statistique descriptive à une dimension

Exemple : Répartition de 300 salaries d’une entreprise selon l’âge

Population : 3000 entreprises Caractère   : l’âge Sa nature  : C’est un caractère quantitatif continu.

Âges Nombre de salaries (ni)

[20 à 25[

[25 à 30[

[30 à 35[

[35 à 40[

[40 à 45[

172

61

39

11

17

Total 300

Lecture du tableau :

-Le nombre de salaries ayant leur âge inférieur à 25 est 172. -La première classe a comme borne inférieure 20 et comme borne supérieure 25. -L’amplitude de la première classe est 5.

De la même manière que pour les distributions non groupées ( caractère qualitatif et caractère quantitatif discret), on peut calculer les fréquences absolues cumulées croissantes, les fréquences absolues cumulées décroissantes, les fréquences relatives, les fréquences relatives cumulées croissantes et les fréquences relatives cumulées décroissantes :

Âges Fréquences

absolues

Fréquences

absolues

cumulée

Fréquences

absolues cumulées décroissa

Fréquences

relatives

Fréquences

relatives cumulée

s

Fréquences

relatives cumulées décroissa

Amplitudes

Point centra

l

M.ACHRIT Page 9

Page 10: Cours stat. achrit tsge1

Statistique descriptive à une dimension

s croissan

tes

ntes croissantes

ntes

Xi Ni Ni cc Ni cd Fi Fi cc Fi cd Ai Ci

[20 à 25[

[25 à 30[

[30 à 35[

[35 à 40[

[40 à 45[

172

61

39

11

17

172

233

272

283

300

300

128

67

28

17

0,57

0,20

0,13

0,04

0,06

0,57

0,77

0,90

0,94

1

1

0,43

0,23

0,10

0,06

5

5

5

5

5

22,5

27,5

32,5

37,5

42,5

Total 300 ≠ ≠ 1 ≠ ≠ ≠ ≠

3. LES REPRÉSENTATIONS GRAPHIQUES :

M.ACHRIT Page 10

Page 11: Cours stat. achrit tsge1

Statistique descriptive à une dimension

Bien qu’un tableau statistique renferme toute l’information rassemblée, il est très utile de le traduire par un graphique. La représentation graphique d’une distribution statistique permet de visualiser et de déceler ses principales caractéristiques. Suivant la nature du caractère étudié on utilise différents modes de représentations graphiques.

3.1. Représentation du caractère qualitatif :

Il existe deux modes de représentation d’une distribution à caractère qualitatif : diagramme en barres ou en tuyaux d’orgue et le diagramme circulaire

3.1.1. Diagramme en ‘’Tuyaux d’orgue’’ :

Ce diagramme consiste à représenter chaque modalité du caractère qualitatif par un rectangle dont la hauteur est proportionnelle à l’effectif correspondant et dont la base est constante.

Exemple : un agriculteur a compté l’ensemble de ses animaux selon leur espèce.

Espèce EffectifBovinsOvinsCaprins

3346135155335

Total 22196

Représentation graphique :

M.ACHRIT Page 11

0

2000

4000

6000

8000

10000

12000

14000

16000

Bovins

ovins

Caprins

EspèceEffectif

Especes d’animaux

Page 12: Cours stat. achrit tsge1

Statistique descriptive à une dimension

3.1.2. Diagramme circulaire (graphique à secteurs) :

Dans le diagramme circulaire chaque modalité est représentée par un secteur dont l’angle est proportionnel à l’effectif correspondant. La totalité de la circonférence correspond à l’effectif total.

Exemple : le même tableau des espèces d’animaux peut se présenté graphiquement par un diagramme circulaire

Espèce EffectifBovinsOvinsCaprins

3346135155335

Total 22196

Méthode de calcul des degrés de chaque angle (ou secteur) du cercle   :

Effectif total : 221961 correspond à 360°

Effectif bovins : 3346 Correspond à l’angle a1

a1=3346 × 360

22196=54,3 °

Effectif ovins : 13515 Correspond à a2

a2=13515 × 360

22196=219,2°

Effectif caprins : 5335 correspond à a3

a3=5335 × 360

22196=86,5 °

M.ACHRIT Page 12

Page 13: Cours stat. achrit tsge1

Statistique descriptive à une dimension

Bovins

Ovins

Caprins

Espece d'animaux

Diagramme circulaire

3.2. Représentation d’une variable discrète :

3.2.1. Diagramme en bâtons : Le diagramme en bâtons consiste à représenter chaque valeur de la variable statistique par un bâton dont la hauteur est proportionnelle à l’effectif correspondant.

Exemple : Pour un ensemble de 147 ménages, le nombre d’enfants se répartit comme suit :

M.ACHRIT Page 13

Nombre D’enfants(Xi)

Nombre deMénages (ni)

ni cumulée croissante

ni cumulée décroissante

012345678

1520221031281245

1535576798

126138142147

1471321129080492195

Total 147

Page 14: Cours stat. achrit tsge1

Statistique descriptive à une dimension

0 1 2 3 4 5 6 7 8 90

5

10

15

20

25

30

35

Nombre d'enfants par ménages

xi nombre d'enfant

ni n

ombr

e de

mén

ages

Diagramme en bâtons

3.2.2. Polygone de fréquences

Les polygones de fréquences sont construits en joignant par une ligne les sommets des bâtons du diagramme en bâtons.

0 1 2 3 4 5 6 7 8 90

5

10

15

20

25

30

35Nombre d'enfant par ménage

Polygone de fréquences

3.2.3. Histogramme et Polygone de fréquences :Le polygone de fréquences cumulées est construit en escalier. On dessine des

segments de droites de longueurs proportionnelles aux fréquences cumulées mais décalant progressivement vers le haut ensuite on joint les bâtons par des segments horizontaux.

M.ACHRIT Page 14

Page 15: Cours stat. achrit tsge1

Statistique descriptive à une dimension

0 1 2 3 4 5 6 7 80

20

40

60

80

100

120

140

160

Nombre d'enfants (xi)

nom

bre

de m

énag

es (n

i cc)

Polygone de fréquences cumulées

3.3. Représentation d’un caractère quantitatif continu :

Pour représenter une variable continue on utilise le plus souvent ce qu’on appelle Histogramme. Les histogrammes se composent de rectangles dont les amplitudes des classes sont les bases et les fréquences sont les hauteurs, de telle sorte que la surface du rectangle soit proportionnelle à l’effectif correspondant.

Exemple : Considérons la distribution des salaires horaires d’un groupe de 91 ouvriers :

Salaires horaires Xi

(en 10 DRH)Effectif

(ni)[1 – 2[[2 – 3[[3 – 4[[4 – 5[[5 – 6[[6 – 7[[7 – 8[

71322281452

TOTAL 91

M.ACHRIT Page 15

Page 16: Cours stat. achrit tsge1

Statistique descriptive à une dimension

[1-2[ [2-3[ [3-4[ [4-5[ [5-6[ [6-7[ [7-8[0

5

10

15

20

25

30

Salaires horaires de 91 ouvriers

salaires horaires en 10 dh

effec

tif n

i

4. LES PARAMÈTRES :

4.1. Introduction :

Les paramètres permettent de caractériser de façon simple les séries statistiques et les distributions observées. Les paramètres les plus utilisés sont :

Les paramètres de position Les paramètres de dispersion

4.2. Paramètres de tendance centrale :

Appelés valeurs de tendance central. Les principaux paramètres de position sont :

La moyenne arithmétique, La moyenne géométrique, La moyenne harmonique, La moyenne quadratique, La médiane, La médiale et Le mode.

Ces paramètres statistiques doivent satisfaire à plusieurs conditions définies par le statisticien YULE

M.ACHRIT Page 16

Page 17: Cours stat. achrit tsge1

Statistique descriptive à une dimension

4.2.1. Moyenne arithmétique :* Définition : La moyenne arithmétique, qu’on appelle tout simplement moyenne, est égale à la somme des valeurs observées divisée par le nombre d’observations.*Interprétation : Le ‘’caractère’’ moyen est égale à…

*Cas d’une série statistique :

Soit série suivante : X1, X2, X3, …. , X1, ….. , Xn

x=1n∑i=1

n

x i

* Cas d’un caractère discret :

x=1n∑i=1

k

ni x i

K est le nombre de valeurs distinctes que peut prendre la variable xi et de la valeur absolue

ni.*Moyenne d’un caractère continu :

x=1n∑i=1

n

ni ci

Ci est le point central des classes.

4.3.2. Moyenne arithmétique pondérée : Il s’agit de la moyenne d’une série d’observation affectées chacune d’un certain coefficient appelé coefficient de pondération :α i

x=∑i=1

n

α i x i

∑i=1

n

αi

Exemple : α i : est le poids affecté à l’obervation i.

1 kg de pomme coûte 10 Dhs

M.ACHRIT Page 17

Prix x i en dh Poids α i en kg α i x i

10 1 104 1 4

14 1 14Total 3 28

Page 18: Cours stat. achrit tsge1

Statistique descriptive à une dimension

1 kg d’orange coûte 4 Dhs1 kg de bananes coûte 14 Dhs

Prix moyen d ' 1 kg=∑i=1

n

αi xi

n=28

3=9,33 Dhs

Gardons les mêmes prix mais pour des poids différents :

Prix x i en dh Poids α i en kg α i x i

10 2 204 4 16

14 3 42Total 9 78

2 kg de pommes coûtent 10 Dhs4 kg d’oranges coûtent 4 Dhs3 kg de bananes coûtent 14 Dhs

Prix moyen d ' 1 kg=∑i=1

n

αi xi

n=¿

789

=8,67 Dhs

4.3.3. Moyenne géométrique :La moyenne géométrique, notée xg est calculée pour des observations positives.

*Cas d’une série statistique : xg=¿ ou

xg=n√x1 , x2 …. xn

*Cas d’un caractère quantitatif discret :

xg=n√x1

n1 x2n2 xk

nk

Cas d’un caractère quantitatif continu : La moyenne géométrique et aussi égale à l’exponentielle de la moyenne arithmétique des logarithmes népérien.

xg=exp(1 /n∑i=1

k

ni ln x i) 4.3.4. Moyenne quadratique et harmonique :

Moyenne quadratique

M.ACHRIT Page 18

Page 19: Cours stat. achrit tsge1

Statistique descriptive à une dimension

La moyenne quadratique et la moyenne d’ordre 2 :

xq=√[1n∑i=1

k

ni x i2]

La moyenne quadratique, c’est la racine carrée de la moyenne arithmétique des carrés.

Moyenne harmonique :La moyenne harmonique est la moyenne d’ordre -1 :

xh=n

∑i=1

k ni

x i

La moyenne harmonique, c’est aussi l’inverse de la moyenne arithmétique des inverses.

On montre que la moyenne harmonique est inférieure ou égale à la moyenne géométrique qui est inférieure ou égale à la moyenne arithmétique qui est inférieure ou égale à la moyenne quadratique.

xh≤ xg ≤ x≤ xq

Exemple : Salaires horaires de 91 employés.

Salaire horaire

(en 10dh)

ni Ci ni ci ni ln ci ni Ci2 ni/ci

1 - 22 - 33 - 44 - 55 - 66 - 77 - 8

71322281452

1,52,53,54,55,56,57,5

10,532,577,0

126,077,032,515,0

2,83811,91227,56142,11423,8669,3594,030

15,7581,25

269,50567,00423,50211,25112,50

4,6675,2006,2866,2222,5450,7690,267

Total 91 370,5 121,68 1680,75 25,956

x=1n∑i=1

7

ni ci=¿ 370,591

−−−→ x=4,07¿

xg=exp(1/n∑i=1

7

ni ln x i)

xg=exp( 121,6891 )−−→ x g=3,81

xq=√ 1n∑ ni x i

2

M.ACHRIT Page 19

Page 20: Cours stat. achrit tsge1

Statistique descriptive à une dimension

xq=√ 168091

−−→ xq=4,30

xh=n

∑i=1

7 ni

c i

= 9125,956

−−→ xh=3,51

⟺ xh≤ xg ≤ x ≤ xq

4.3.5. Mode :a- Cas d’une série statistique :

Le mode d’une série statistique est le nombre que l’on rencontre le plus fréquemment. Le mode peut ne pas exister et s’il exister, il peut ne pas être unique.Exemple : Série 1 : 2 2 5 7 9 9 9 10 10 11 12 le mode est 9Série 2 : 3 5 8 10 12 15 16 n’a pas de mode Série 3 : 2 3 4 4 4 5 5 7 7 7 9 a deux modes 4 et 7 b- Cas d’un caractère quantitatif discret :

Le mode correspond à ni le plus grand et au maximum du diagramme en bâton.

Exemple : Nombre d’enfant Effectif

012345

121614251310

Total 90

Le mode de cette distribution du nombre d’enfant est Mo= 3 : C'est à dire, la plupart des familles ont 3 enfants.

c- Cas du caractère quantitatif continu :

Le mode correspond à ni le plus grand qui correspond à la classe modale

M.ACHRIT Page 20

Page 21: Cours stat. achrit tsge1

Statistique descriptive à une dimension

On peut déterminer la valeur du mode à l’aide de la formule de calcul suivante :

Mode = B0 + (N i−N i−1)

( N i−N i−1 )+(N i−N i+1)∗a

Tel que :B0 : borne inferieur de la classe modaleA : amplitude de la classe modaleNi : l’effectif le plus grand

Exemple :

Salaire horaire Effectif[20 – 40[[40 – 60[

Mo ϵ [60 – 80[[80 – 100[[100– 120[

5 8 Ni-1

12 Ni 10 Ni+1

8Total 43

La classe modale de cette distribution des salaires horaires est la classe [60 – 80[.

Donc : Mode = 60 + (12−8)

(12−8 )+(12−10)∗20

Mode = 60+4∗20

6

Mode=73,34 dh

4.3.6. Médiane :

Définition : La médiane d’une variable statistique est la valeur pour laquelle la moitié des observations lui sont inférieures ou égales et la moitié supérieure ou égales.Interprétation : Il y a autant de caractère inferieur à la Me que de caractère supérieur à Me.

*Cas d’une statistique : Pour une série de valeurs rangées par ordre croissant :X1, X2, X3, …. , XI, …., XN

M.ACHRIT Page 21

Page 22: Cours stat. achrit tsge1

Statistique descriptive à une dimension

Si n est impair, le rang de la médiane est : Rang = (n+1)/2, donc : Me = X (n+1)/2

Si n est pair, le rang de la médiane est : Rang = n/2, donc : Me=X n/2+ X (n+1)/2

2

Exemple : Soit la série : 8 10 11 12 18

n = 5 (impair) −−→ Me = X (5+1)/2=X3= 11

Soit la série : 8 10 11 12 14 18

n=6 ( pair )−−→ Me=12

( X3+ X4 )=11+122

=11,5

*Cas d’un caractère quantitatif discret :

Si le Rang Me = 50% voir Ficc Me

Si le Rang Me proche de 50% voir Ficc Interpolation linéaire MeExemple : Soit la valeur des exportations des entreprises d’une région au Maroc : Exportations En 1000 dh

ni fi Fi cumulées croissantes

[50 – 100[[100 – 150[[150 – 200[[200 – 250[[250 – 300[

71346 1430

0,060,120,410,120,29

0,060,18 0,59 0,71

1Total 110 1

Rang Me proche de 0,50 Par interpolation linéaire :150 Me 2000,18 0,5 0,59

Me−1500,5−0,18

= 200−1500,59−0,18

Me−150=50 × 0,320,41

Me = 189,02 (en 1000Dh)

M.ACHRIT Page 22

Page 23: Cours stat. achrit tsge1

Statistique descriptive à une dimension

*Cas d’un caractère quantitatif continu :Pour des données en classe, la classe médiane est la classe qui contient la

médiane. On détermine par interpolation linéaire.

Salaire horaireEn 10 dh

ni ni cumulées croissantes

[2 – 4[[4 – 6[

Me ϵ [6 – 8[[8 – 10[

[10 – 12[

58

12 nc

108

5 13 ncc-1

25 ncc

34 ncc+1

43Total 43

Méthode de calcul :

n=43 n est impair Rang de la médiane = n+1

2 = 43+1

2=22 13<Rang

Me=22<25 Me se trouve dans la classe médiane [6-8[.

La Me se trouve dans la classe médiane [6-8], pour déterminer sa valeur exacte on utilise deux méthodes, l’Interpolation linéaire ou la formule de calcul:

Méthode 1 : Par interpolation linéaire :6 Me 813 22 25

Me−622−13

= 8−625−13

Me−6=2× 912

Me = 7,5 DhInterprétation : Il y a autant de salaires inférieurs à 7,5 Dhs que de salaires supérieurs à 7,5 Dhs.Méthode 2 : la formule :Dans le cas d’une variable groupée en classes, on peut calculer la médiane par la formule suivante (si n est impair) sinon on met n/2

M.ACHRIT Page 23

Page 24: Cours stat. achrit tsge1

Statistique descriptive à une dimension

Me=B 0+ai(

n+12

−NCC−1⬆ )

nC

Me=6+2(43−13)

12=6+

2(22−13)12

Me=6+ 2 ×912

−−→ Me=7,5 dh

B0=6 : Borne inférieure de la classe médianeai =2 : Amplitude de la classe médianen =43 : Nombre total des observationsNCC−1⬆

=13: Fréquence absolue cumulée croissante de la classe inférieure à la classe médianeNc=12 : Fréquence absolue de la classe médiane

4.3.7. Médiale :

Définition : La médiane est une valeur telle que la somme des observations qui lui sont inférieures est égale à la somme des observations qui lui sont supérieures.

La médiale partage la masse total ∑ ni xi en deux parties égale :∑n i x i

2

Interprétation : La moitié de la somme totale du caractère est distribuée sous forme de caractère inférieur à Ml.

Cas d’un caractère quantitatif discret et continu :

RangMl =∑n i x i

2 NIXI CC Classe médiale par interpolation linéaireMl

Dans le cas du caractère quantitatif continu : on remplace Xi par Ci

Exemple :

M.ACHRIT Page 24

Page 25: Cours stat. achrit tsge1

Statistique descriptive à une dimension

RangMl =∑ N i C i

2=317

2=158,5 NIXI CC : 139<158,5<229 médiale ϵ[8 -10[

Par interpolation linéaire :La médiale est la valeur pour laquelle la somme des observations qui lui sont inférieures est égale à 158,5. Elle se trouve dans la classe médiale [8 – 10[.

8 Ml 10

139 158,5 229

10−8229−139

= Ml−8158,5−139

Ml−8=2׿¿

Me = 8 ,43 en 10Dhs Interprétation :La moitié de la somme totale des salaires est distribuée sous

forme de salaires inférieurs à 84,3 Dhs. Remarque : Parmi les différents paramètres de tendance centrale, la moyenne arithmétique est le paramètre qui répond le mieux aux conditions de YULE, c’est le paramètre statistique le plus utilisé.

4.4. Les paramètres de dispersion :

Ces paramètres permettent de chiffrer la variabilité (les écarts de xi par rapport à la moyenne). Les principaux paramètres de dispersion sont :

La variance, L’écart-type, Le coefficient de variation, L’écart moyen absolu, L’écart interdécile, L’écart interquartile, L’étendue,

M.ACHRIT Page 25

Salaire horaire en 10 dh

CI NI NI CI NI CI cumulées croissantes

[2 – 4[[4 – 6[[6 – 8[

[8 – 10[[10 – 12[

357911

5812108

1540849088

1555139229317

Total 43 317

Page 26: Cours stat. achrit tsge1

Statistique descriptive à une dimension

Le coefficient de concentration.

4.4.1. Variance et Ecart-type :

Définition : La variance est la moyenne arithmétique des écarts des observations par rapport à leur moyenne.

V (x )=1n∑i=1

k

n i¿¿

L’écart –type est la racine carrée de la variance.σ (x)=√V (x )

Formule développée de la variance :

V (x )=1n∑ n i¿¿

V (x )=1n∑ n i(xi

2−2¿x i x+x2)¿

V (x )=1n∑ n i x i

2−2 xn∑ ni x i+

x2

n∑ ni

V (x )=1n∑ n i x i

2−¿2 x2+x2 ¿

V (x )=1n∑ n i x i

2−¿2 x2+x2 ¿

V (x )=1n∑ n i x i

2−¿ x2¿

La variance est égale à la différence entre la moyenne des carrés et le carré de la moyenne.

Interprétation : L’écart type n’a pas un sens très concret. Il ne prend de signification que pour comparer deux distributions.

Si par exemple dans une entreprise, la distribution des salaires des fonctionnaires a pour écart-type 400Dhs alors que la distribution des salaires des ouvriers a pour écart-type 200 Dhs. On dira que les salaires des fonctionnaires sont deux fois plus dispersés que les salaires des ouvriers.

M.ACHRIT Page 26

Page 27: Cours stat. achrit tsge1

Statistique descriptive à une dimension

4.4.2. Coefficient de variation :Le coefficient de variation est le rapport de écart-type par rapport à la

moyenne.

CV =σ ( x )

x×100

Le coefficient de variation est le plus souvent exprimé sous la forme d’un pourcentage. Le coefficient de variation est indépendant des unités choisies, il est utile pour comparer des distributions qui ont des unités différentes.

Exemple :Entreprise 1 :

Salaire horaire en 10 dh

ni xi ni xi ni xi2

[1 – 3[[3 – 5[[5 – 7[[7 – 9[[9 - 11[

2018201415

246810

4072120112150

802887208961500

Total 87 494 3484

Entreprise 2 :Salaire horaire En 10 dh

ni xi ni xi ni xi2

[3 – 5[[5 – 7[[7 – 9[

333519

468

132210152

52812601216

TOTAL 87 494 3004

Constatation :-Les 2 entreprises ont la même masse salariale horaire totale qui est de 494 Dhs.

- Les deux entreprises ont Le même nombre d’ouvriers 87, donc le salaire moyen est le même.

Si cette valeur centrale qui est la moyenne donne la même grandeur concernant le salaire pour les deux entreprises, on peut constater que les salaires ne sont pas

M.ACHRIT Page 27

Page 28: Cours stat. achrit tsge1

Statistique descriptive à une dimension

distribués de la même manière. Les paramètres de dispersion résument la manière dont sont distribués les caractères.Entreprise 1 :

x=1n∑ ni x i=

49487

=5,68

V (x )=348487

−¿

σ (x)=√7,8=2,79

CV 1=2,795,68

×100=49 %

Entreprise 2 :

x=1n∑ ni x i=

49487

=5,68

V (x )=300487

−¿

σ (x)=√2,28=1,51

CV 2=1,515,68

×100=27 %

Les salaires sont plus dispersés dans l’entreprise 1 que dans l’entreprise

4.4.3. L’écart absolu moyen :Définition : L’écart absolu moyen est la moyenne des valeurs absolues des

écarts par rapport à la moyenne. Interprétation : En moyenne, les valeurs Xi s’écartent de la moyenne de EAM

Cas d’une série statistique :

EAM=1n|x i−x|

Cas d’une distribution de fréquences :

EAM=1n∑i=1

k

ni|x i−x|

Exemple : Trouver l’écart absolu moyen des nombres suivants :

M.ACHRIT Page 28

Page 29: Cours stat. achrit tsge1

Statistique descriptive à une dimension

2 3 6 8 11

x=2+3+6+8+115

=6

E AM=|2−6|+|3−6|+|6−6|+|8−6|+|11−6|

5=2,8

En moyenne, ces valeurs s’écartent de la moyenne de 2,8

4.4.4. Quartiles et Déciles :a. Les quartiles q1, q2 et q3 :

Définition :q1 : est la valeur de la variable telle que un quart des observations lui sont inférieures ou égales et trois quarts des observations lui sont supérieures ou égale.

q2 : est la valeur de la variable telle que deux quarts des observations lui sont inférieures ou égales et deux quarts des observations lui sont supérieures ou égale. C’est aussi égal à la médiane.

q3 : est la valeur de la variable telle que trois quarts des observations lui sont inférieures ou égales et un quart des observations lui sont supérieures ou égales.

Effectif

q1 q2 q3

50% 75%

b. Ecart interquartile :

Ecart interquartile = q3 – q1

L’intervalle interquartile [q1, q3] contient 50% des observations qui se situent au centre de la distribution en laissant 25% des observations à droite et 25% à gauche.

Effectif 25% 50% 25%

q1 q3

Pour la détermination des quartiles et des déciles on utilise la même méthode de calcul que pour la médiane.

c. Les déciles :

M.ACHRIT Page 29

25% 25% 25% 25%

Page 30: Cours stat. achrit tsge1

Statistique descriptive à une dimension

En procédant comme pour la médiane et les quartiles, il est possible de définir

et de calculer les déciles d1 à d9 par interpolation linéaire.

d1 : est la valeur de la variable telle qu’un 1/10 des observations lui sont inférieures ou égales et 9/10 des observations lui sont supérieures ou égales.

di : est la valeur de la variable telle que i /10 des observations lui sont inférieures ou égales et (10 - i)/10 des observations lui sont supérieures ou égales.

Effectif 10% 10% 10% 10% 10% 10% 10% 10% 10% 10%

d1 d2 d3 d4 d5 d6 d7 d8 d9

d. Ecart interdecile :

Ecart interquartile = d9 – d1

L’intervalle interquartile [d1, d9] contient 80% des observations qui se situent au centre de la distribution en laissant 10% des observations à droite et 10% à gauche. Pour la détermination des quartiles et des déciles on utilise la même méthode de calcul que pour la médiane.

4.4.5. L’étendue :L’étendue est l’écart entre la valeur maximale et la valeur minimale de la variable statistique.

E =Xmax - Xmin

4.4.6. L’indice de concentration :*Courbe de concentration :

Cette courbe est obtenue en calculant les fréquences relatives cumulées croissante des observations après les avoir classé par ordre croissant et les masses relatives cumulées croissantes.

ni / n cumulées croissantesn i x i

∑ ni xi

cumuléescroissantes

La courbe de concentration ou courbe de LORENZ s’inscrit toujours dans un carré de côté unitaire dont les abscisses sont les fréquences relatives cumulées croissantes et les ordonnées sont les masses relatives cumulées croissantes.

M.ACHRIT Page 30

Page 31: Cours stat. achrit tsge1

Statistique descriptive à une dimension

Dans le cas où toutes les observations seraient égales entre, la courbe de concentration correspond à la bissectrice. Plus la courbe s’éloigne de la bissectrice plus la concentration n’est élevée.

* Coefficient de concentration : On mesure la concentration par la surface comprise entre la courbe de

LORENZ et la bissectrice. Le coefficient de concentration ou coefficient de GINI est égale à deux fois cette surface. y = 2A

*Indice de concentration : On peut étudier la concentration directement à partir de la diffèrence entre

la médiale et la médiane d’une distribution.

Indice de concentration= Médiale−MédianeEtendue

× 100

4.4.7. Utilisation des différents de dispersion :La variance, l’écart-type et le coefficient de variation sont les paramètres de dispersion les plus utilisés. En particulier le coefficient de variation qui permet de comparer la variabilié relative de plusieurs qui différent fortement par leur ordre de grandeur et éventullement même par leur unité de mesure.

EXERCICES : STATISTIQUE DESCRIPTIVE A UNE DIMENSION

Exercices 1 :Spécifier la nature des caractères suivants :

1- Nombre d’actions vendues chaque jour à la bourse.2- Durée de vie des tubes de télévision fabriqués par une société.3- Salaires annuels des employés d’une société.

M.ACHRIT Page 31

Page 32: Cours stat. achrit tsge1

Statistique descriptive à une dimension

4- Nationalité des résidents dans une cité universitaire internationale.5- Nombre de millimétres de pluie qui tombent sur une ville pendant différents mois

de l’année.6- Vitesse d’une voiture.

Exercice 2 :

Le tableau suivant présent la siituation familiale d’un échanllon de 500 personnes choisies au hasard parmi les habitants d’une ville.

Situations familiales Nombre de personnes

Célibataire

Marié

Divorcé

Veuf

séparé

223

187

32

55

3

TOTAL 500

1- Quelle est la population étudiée ?2- De quel type d’enquêtes s’agit-il ?3- Quel est le caractère étudié ? Quelle est sa nature ?4- Quelle est la proportion des personnes mariées ?5- Représenter graaphiquement cette distribution.

Exercice 3 :

Le nombre d’enfants dans 300 familles est réparti comme suit :

T.A.F :

M.ACHRIT Page 32

Nombre d’enfant Nombre de familles01234567

1322464958423931

TOTAL 300

Page 33: Cours stat. achrit tsge1

Statistique descriptive à une dimension

1- Quel est le caractére étudié ? Quelle est sa nature ?2- Quel est le nombre de familles qui ont au moins un enfant ?3- Quel est le nombre de familles qui ont au plus 4 enfants ?4- Quelle est la proportion des familles qui ont moins de 5 enfants ?5- Quelle est la proportion des familles qui ont plus de 2 enfants ?6- Représenter grahiquement cette distribution.

Exercice 4 :

L’étude de la répartition des personnes d’un échantillon a donné les résultats suivants :

Classes de revenus Effectifs1 à 151 à 301 à 45

46 à 6061 à 7576 à 90

91 à 105106 à 120

32481412101662

T.A.F :

1- Quel est le caractère étudié ? Quelle est sa nature ?2- Représenter graphiquement cette distibution.3- Calculer les indicateurs de tendence suivants :

Moyenne arithmétique Médiane Médiale

Interpréter les résultts obtenus.4- Calculer les indicateurs de dispersion suivants :

Variance Ecart-type Coefficient de variation L’écart absolu moyen L’écart interquartile

Interpréter les résultats obtenus.5- Donner une mesure de concentration.

Exercice 5 :

Un autombiliste a roulé sur trajet de 100 Km/à une vitesse de 90 Km/h sur les 10 premiers kilomètres ; 100 Km/h sur un trajet de 30 Km et 120 Km/h sur les 60 derniers kilomètres. Quelle est la vitesse moyenne avec laquelle l’automobilite a parcouru les 100 kilomètres ?

M.ACHRIT Page 33

Page 34: Cours stat. achrit tsge1

Statistique descriptive à une dimension

Exercice 6 :

Le tableau suivant donne la répartition d’âge de 120 résidents dans une maison de retraite :

Age Nombre de personnes

90 – 10080 - 8970 - 7960 - 6950 - 5940 - 4930 - 39

93243211131

TOTAL 120

1- Quel est l’âge moyen des résidents de cette maison de retraite ?2- Calculer un indicateur de dispersion de l’âge ?3- Quelle est la tranche d’âge centrale qui regroupe 60% de personnes ?

Exercice 7 :

Les recettes journalières de 80 magasins d’un centre commercial répartissent comme suit :

Recettes (DH) Nombre de magasins90 – 100100 – 110110 – 120120 – 130130 – 140140 – 150150 – 160160 – 170

59162513732

TOTAL 80

1- Calculer la recette moenne journalière.2- Calculer le coefficient de variation des recettes journalières.3- Si toutes les recettes journalières ont augmenté de 20% ; calculrer la nouvelle

moyenne et le nouveau coefficient de variation.

Exercice 8

M.ACHRIT Page 34

Page 35: Cours stat. achrit tsge1

Statistique descriptive à une dimension

Le poids moyen et la variance du poids de 10 colis sont respectivement 5,9 et 4,83. On a remplacé un colis pesant 8,5 Kg par un autre colis qui pèse 6,5 Kg. Quelle sont les nouvelles valeurs de la moyenne et la variance ?

SOLUTIONS DES EXERCICES :

Exercice 1 :

1- Le nombre d’actions, vendues chaque jour à la bourse, est un caractère mesurable, il ne prend par de valeurs décimales. C’est donc un caractère quantitatif discret.

2- Durée de vie des tubes de télévision, c’est une caractéristique mesurqble, généralement exprimée en heures, elle peut prendre des valeurs décimales. Il s’agit donc d’un caractère quantitatif continu.

3- Les salaires annuels sont mesurables et peuvent prendre des valeurs décimales. C’est un caractère quantitatif continu

4- La nationalité est une caractéristique non mesurable, c’est un caractére qualitatifa.

5- Le nombre de millimètres de pluie est une caractéristique mesurable et peut prendre des valeurs décimales, c’est un caractère quantitatif continu.

6- La vitesse d’une voiture est une caractéristique mesurable et peut prendre des valeurs décimles, c’est un caractère quantitatif continu.

Exercice 2 :

1- La population étudieé est constituée est l’ensemble des habitants de laville.2- Seulement une partie de la population (500 personnes) a été

réellement.observée, il s'agit donc d’une enquête partielle ou enquête par échantillonnage.

3- Le caractère étudié est la sitution familiale, il n’est pas mesurable, c’est un caractère qualitatif.

4- Les proportions correspondent aux fréquences relatives fi.

Fi=Fréquence absolueEffectif total

Situation familiale Fréquences absolue Fréquences relativesCélibataireMariéDivorcéVeufséparé

22318732553

0,4460,3740,0640,110

M.ACHRIT Page 35

Page 36: Cours stat. achrit tsge1

Statistique descriptive à une dimension

0,006TOTAL 500 1,000

La proportion des personnes mariées est donc :

f2× 100 = 0,374 × 100 = 37,4%

5- La situation familiale est un caractère qualitatif, on peut la représenter graghiquement par un diagramme en tuyaux d’orgue ou par un diiagramme circulair.

Exercice 3 :

1- Le nombre d’enfant est un caractère mesurable, il ne peut pas prendre des valeurs décimmales, c’est un ccaractère quantitatif discontinu.Le tableau suivant regroupe les fréquences absolues (ni), les fréquences absolues cumulées croissantes (ni cum Décrois.), les fréquences absolues cumulées décroissantes (ni cum Décrois.), les fréquences relatives (fi), les fréquences relatives cumulées croissantes (fi cum Décrois.) et les fréquences (fi cum Décrois.)

M.ACHRIT Page 36

0 1 2 3 40

10

20

30

40

50

60

70

1 2 3 4 50

10

20

30

40

50

60

70

Series1

Page 37: Cours stat. achrit tsge1

Statistique descriptive à une dimension

Ndre d’enfant

Ni Ni cum. Crois.

Fi cum. Décrois.

Fi Fi cum. Crois.

Fi cum. Décrois.

0123456Plus de 6

1322464958423931

13 3581130188230269300

3002872652191701127031

0,0430,730,1530,163 0,1940,4100,1300,104

0,0430,1160,2690,4320,6260,766 0,8961,000

1,0000,9570,8840,7310,5690,3740,2340,104

TOTAL 300 - - 1,000 - -

2- Nombre de familles qui ont au moins 1 enfant est égale à la deuxième fréquence cumulée décroissante, c'est à dire 287.

3- Nombre de familles qui ont au plus 4 enfants est égale à la cinquième fréquence absolue cumulée croissante, c'est-à-dire 188.

4- Propportion des familles qui ont moins de 5 enfants est égale à la cinquième fréquence relative cumulée croissante, c'est à dire 0,626 ou 62,6%.

5- Proportion des familles qui ont plus de 2 enfants est égale à la quatrième relative cumulée décroissante, c'est à dire 0,731 ou 73,1%.

6- Le nombre d’enfants est un caractère quantitatif discontinu, ou peut le représenter graphiquement par un diagramme en bâtons.

M.ACHRIT Page 37

0 1 2 3 4 5 6 7 8 90

10

20

30

40

50

60

70

Page 38: Cours stat. achrit tsge1

Statistique descriptive à une dimension

Exercice 4 :

1- Le revenu est une caractéristique mesurable qui peut prendre des valeus décimali, c’est un caractére quantitatif continu.

2- Une variable statistique continue est représentée graphiquement, le plus souvent, par un histogramme.

3- Pour le calcul des paramètres statistiques, le tableau suivant regroupe le détail des calculs.

Point central ci

ni ni ci ni cumCrois

ni ci cumCrois

ni ci2 |ci−c| n i|c i−c|

8233853688398113

32481412101662

25611045326366801328588226

328094106116132138140

2561360189225283208453651245350

2048253922021633708462401102245764225538

30,215,20,214,829,844,859,874,8

966,4729,62,8177,6289716,8358,8149,6

TOTAL 140 5350 - - 320990 - 3399,6

Moyenne arithmétique :

c=∑ ni c i

∑ ni

=5350140

=38,2

Le revenu moyen d’une personne est égal à 38,2

Médiane :

La médiane se situe entre l’observation de ranga 70 et l’obervation de rang 71, elle se trouve dans la classe 16 à 30.

Me=l0+a i¿

= 16+14[(70,5 -32)/48] =27,22

M.ACHRIT Page 38

Page 39: Cours stat. achrit tsge1

Statistique descriptive à une dimension

La moitié de personnes de ont revenu inférieur ou égal à 27,22.

médiale :

La médiale est l’observation qui partager la masse total 5350 en deux partiés-égales dont le totale des revenus est égal à (5350 /2) c'est à dire 2675.

La médiale appartient à la classe 61 à 75.

2528 2675 3208

61 Ml 75

M 1−612675−2528

= 75−613208−2528

Ml=61+14 ×147680

=64,02

La moitié du total des revenus de l’ensemble des personnes de l’échantillon sont distribués sous forme de revenus inférieurs ou égales à 64,02.

La concentration est de 31%.

Exercice 5 :

L’automobiliste a parcouru les 100 Km avec 3 vitesses différentes :

vitesse trajet

V1 = 90

V2 =100

V3 =120

N1 = 10

N2 = 30

N3 = 60

total 100

Une vitesse est un rapport entre la distance parcourue et le temps mispour parcourir cette distance.

M.ACHRIT Page 39

Page 40: Cours stat. achrit tsge1

Statistique descriptive à une dimension

La vitesse moyenne avec laquelle l’automobiliste a parcouru les 100 Km est égale au raport de la distance parcouru sur le temps mis pour parcourir les 100 Km.

Le temps mis pour parcourir les 100 Km est égale à la somme des temps mis pour parcourir chaque trajet.

Le temps mis pour parcourir un trajet est égale au rapport de la distance du trajet sur la vitesse.

Vitessemoyenne= Distance totalTemps total

=n1+n2+n3

n1

v1

+n2

v2

+n3

v3

∑i=1

n

ni

∑i=1

n ni

v i

=110Kmh

Il s’agit d’une moyenne harmonique de la vitesse et non par la moyenne arithmétique.

Exercice 6

Tranched’âge

Point Central ci

ni ni cumu.Crois.

Ci ni Ni ci2

30 - 4040 - 5050 - 6060 - 7070 - 8080 - 9090 - 100

35455565758595

13112143329

14153679111120

35135605136532253720855

12256075332758872524187523120081225

Total - 120 - 8940 683600

1- L’âge moyen des résidents :

M.ACHRIT Page 40

Page 41: Cours stat. achrit tsge1

Statistique descriptive à une dimension

C=∑ ni c i

∑ ni

=8940120

=74,5 ans

2- La variance est un indicateur de dispersion

S2=∑ ni c i2

∑ ni

C2=683600120

−74,52

= 146,41

3- La tranche d’âge centrale qui regroupe 60% des personnes a 20% de personnes à sa gauche et 20% à sa droite.

10% 10% 60% 10% 10%

d1 d2 d8 d9

C’est donc la tranche comprise entre le deuxième décile et le huitième décile.

d2 Correspond à l’âge du 24ème personne, il appartient à la tranche d’âge 60 – 70 ans.

15 24 36

60 d2 70

d2−60

24−15=70−60

36−15

D2=60+10×9

21=64,28 ans

d8 correspond à l’âge du 96ème personne, il appartient à la tranche 80 – 90

79 96 111

M.ACHRIT Page 41

Page 42: Cours stat. achrit tsge1

Statistique descriptive à une dimension

80 d8 90

d8−80

96−79= 90−80

111−79

D8=80+10 ×1732

=85,31 ans

La tranche d’âge centrale qui regroupe 60% des résidqnts est donc lq trqnche 64 - 85 ans

Exercice 7 :

1- Pour simplifier les calculs on peut effectuer un changement de variable, en remplacant la variable étudiée ( x points centraux ) par une autre variable y.

y= X−ab

2- On choisit a et b de telle sorte que les valeurs de y soient les plus simples possible. La valeur la plus simple est la valeur zéro, on préfère qu’elle soit au centre de la distribution, a doit donc être égale au point central qui est au centre de la distribution, b est le plus grand diviseur commun généralement c’est l’amplitude des classes.

y= X−12510

ci y ni ni yi ni yi2

95105115125135145155165

-3-2-101234

59162513732

-15-18-160131498

453616013282732

TOTAL 80 -5 197

y=∑ n i y i

∑ ni

=−580

=−0,0625

x=10 y+125

x=10 y+125

x=10 × (−0,0625 )+125

x=124,375

M.ACHRIT Page 42

Page 43: Cours stat. achrit tsge1

Statistique descriptive à une dimension

2−CV =SX

X

S2x=102 y

Sy2=∑ n i y i

2

ni

− y2=19780

−¿

¿2,4625−0,0039=2,4586

S2x=100× 2,4586=245,86

CV =√245,86124,375

=0,13 ou 13 %

3- Toutes les recettes ont augmenté de 20%, la nouvelle variable x’ est donc :

x '=x+0,2 x=1,2 xx=1,2 x=149,25

S2x=1,22× S2

x=354,0384

CV X'=s x'

x '=√354,0384

149,25=0,13ou 13 %

Toutes les observations ont augmenté d’une même proportion par conséquent, le coefficient de variation n’a pas changé.

Exercice 8 :Soit x la variable statistique qui représente le poids des colis.

x=5,9 et s2=4,83

1- Eléminons l’observation qui a la valeur 8,5 Kg.

∑i=1

10

x i=10 × X=59

∑i=1

9

x i=59−8,5=50,5

∑i=1

9

x i2=( s2+s−2 ) ×10= (4,83 ×5,92 ) ×10=396,4

∑i=1

9

x i2=396,4−8,52=324,15

M.ACHRIT Page 43

Page 44: Cours stat. achrit tsge1

Statistique descriptive à une dimension

2- Ajoutons la nouvelle observation qui a la valeur 6,5 Kg.

∑i=1

10

x i=50,5+6,5=57

∑i=1

10

x i2=324,15+6,52=366,4

Les nouvelles valeurs de la moyenne et la variance sont :

x=∑i=1

10

x i

10=57

10=5,7

S2=∑i=1

10

x i2

10−x−2=366,4

10−5,72=4,15

M.ACHRIT Page 44

Page 45: Cours stat. achrit tsge1

Statistique descriptive à une dimension

M.ACHRIT Page 45