Upload
salmael
View
8
Download
0
Embed Size (px)
Citation preview
5/24/2018 Chapitre1(1)
1/11
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY 3
CHAPITRE 1 : Distribution statistique une dimension
Section 1 : Vocabulaire lmentaire de la statistique descriptive
1. Population et individu
Dfinition
On appelle population statistique, tout ensemble d'units statistiques constituant les
units
observes.
On appelle individu (ou unit statistique), tout lment de la population tudie.
Remarque
La dtermination avec prcision de la population et des individus qui la composentconditionne l'homognit des units observe et la fiabilit des rsultats.
2. Variable statistique
2.1. Dfinition
On appelle variable statistique (ou caractre), une application (relation) qui associe chaque
individu de la population, une observation particulire.
2.2. Type d'une variable statistique
a) Variable qualitative
Une variable est qualitative si elle est lie un ensemble d'observations non mesurables.
Exemple : La population active tunisienne peut tre caractrise par :
- Le sexe (masculin ou fminin)
- La catgorie professionnelle (cadres, employs, ouvriers, etc...)
La nature qualitative d'une variable s'exprime donc par l'appartenance une catgorie ou
rubrique d'un ensemble fini.
b) Variable quantitative
Une variable est quantitative si l'ensemble des observations est un ensemble de nombres. Ces
observations expriment donc des valeurs numriques (quantitatif = mesurable).
Exemple : La Catgorie Htelire, La Capacit en lits,
Les variables quantitatives peuvent tre discrtes ou continues :
Une variable quantitative est dite discrte lorsqu'elle prend un nombre fini ou dnombrable
de valeurs (La Catgorie Htelire).
La variable nombre d'enfants par mnage est une variable quantitative discrte.
5/24/2018 Chapitre1(1)
2/11
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY 4
Une variable quantitative est dite continue, lorsqu'elle prend toutes les valeurs d'un
intervalle rel.
La variable La Capacit en lits peut tre envisage comme une variable quantitative
continue. Ses valeurs sont le plus souvent regroupes par intervalle.
3. Effectifs
Dfinition
On appelle effectif d'une valeur (ou rubrique) donnexile nombre de fois ou cette valeur (ou
rubrique), apparait dans la population statistique tudie. Ce nombre est note ni. L'effectif est
parfois appel frquence absolue.
On appelle effectif total de la population tudie, notn, la somme despeffectifs particuliers
nicorrespondant chacune des valeurs (ou rubriques), soit :
n = n1 +n2+.+np=
p
iin
1
Le symbole (lu somme) permet une criture synthtique de la somme despeffectifs
n1, n2.... np. On lit alors n = somme des ni(pourivariant de1 p) .
4. Frquences
On appelle frquence de la valeur (ou modalit) xi, notefi, le rapport de l'effectif nicorrespondant a
la valeurxiet de l'effectifn de la population observe.
nf ii
Ce rapport est gal au pourcentage d'individus prsentant la valeur (ou modalit)x ipar rapport
l'ensemble de la population observe.fiest toujours comprise entre 0 et 1.
Pour une srie statistique prsentantp valeurs (ou modalits), on a :
1...........211
p
p
i i
ffff
Remarque :
Parfois on peut rencontrer le terme de frquence relative pour les frquences.
Lemploi des frquences ou frquences relatives savre utile pour comparer deux
distributions de frquences tablies partir dchantillons de taille diffrente.
On appelle frquences cumules ou frquences relatives cumules en xi, le nombrefi cum tel
que
i
p
pij fcumfF1
5/24/2018 Chapitre1(1)
3/11
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY 5
Section 2 : Reprsentation des donnes
Il existe plusieurs niveaux de description statistique : la prsentation brute des donnes, des
prsentations par tableaux numriques, des reprsentations graphiques et des rsums
numriques fournis par un petit nombre de paramtres caractristiques.
1. Sries statistiques
Une srie statistique correspond aux diffrentes modalits dun caractre sur un
chantillon
dindividus appartenant une population donne.
Le nombre dindividus qui constituent lchantillon tudi sappelle la taille de lchantillon.
2. Tableaux statistiques
Le tableau de distribution de frquences est un mode synthtique de prsentation des donnes.Sa constitution est immdiate dans le cas dun caractre discret mais ncessite en revanche
une transformation des donnes dans le cas dun caractre continu.
2.1 Caractre qualitatif
Modalit
Numro i
Effectif
n
Frquence
f
1
2
..
p
n1n2
.
n
f1f2
fOn a les relations suivantes:
p
i
inn1 n
nf ii 1
1
p
i
if
Remarque : les frquences peuvent tre exprimes dans le tableau en pourcentage, dans ce
cas : 1001
p
iif
2.2 Caractre quantitatif
a) Caractre quantitatif discret
Valeurs observes
x
Effectifs
n
Frquences
f
Frquences cumules
croissantes F
x1x2
.
xP
n1n2
..
n
f1f2
.
f
F1F2
F
5/24/2018 Chapitre1(1)
4/11
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY 6
b) Caractre quantitatif continu
Classes
numro i
[b ; b +1[
Centres
ci
Effectifs
ni
Frquences
fi
Frquences
cumules
croissantes F
[b1 ; b2 [[b2 ; b3 [
..
[bP; bP+1[
c1c2
c
n1n2
.
nP
f1f2
fP
F1F2
FP
Remarque:
- Une classe est un intervalle ferm gauche et ouvert droite, du type [bi ; bi+1
[.
- Le centre d'une classe est 1
iiibb
c
- L'amplitude d'une classe est iii bba 1
3. Reprsentations graphiques
3.1 Caractres qualitatifs
a) Diagrammes bandes
On appelle diagramme bandes un graphique qui, chaque modalit de la variable qualitative
associe un rectangle de base constante dont la hauteur est proportionnelle l'effectif.
Figure 1-1 : Diagramme bandes (verticales) :
nombre darrive aux frontires des scandinaves par nationalit pour l'anne 2005
0
5 000
10 000
15 000
20 000
25 000
30 000
35 000
40 000
Sudois Danois Norvgiens Finlandais
Nationalits
b) Diagrammes secteurs
On appelle diagramme sect eurs un graphique qui divise un disque en secteurs angulaires
dont les angles au centre sont proportionnels aux effectifs de chaque modalit.
5/24/2018 Chapitre1(1)
5/11
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY 7
Pour une modalit donne Mi, d'effectifni, l'angle au centre i, correspondant est donn (en
degr) par : 360360 ii
i fn
n
Figure 1-2 : Diagramme secteurs :
nombre darrive aux frontires des scandinaves par nationalit pour l'anne 2005
Sudois
Danois
Norvgiens
Finlandais
3.2 Caractres quantitatifs
3.2.1 Caractre quantitatif Discret
a) Diagramme en btons
On appelle diagramme en btons un graphique qui associe chaque valeur de la variable un
segment (bton) dont la hauteur est proportionnelle l'effectif.
Remarque
On suppose les valeurs observes de la variable quantitative discrte, ordonnes par ordre
croissant.
Figure 1-3 : Diagramme en btons :
Nombre de nuites des non rsidants par nombre dtoile en 2005
5/24/2018 Chapitre1(1)
6/11
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY 8
b) Diagrammes cumulatifs
On appelle diagramme cumulatif, la courbe reprsentative de la fonction de rpartition.
On appelle fonction de rpartition d'un caractreX, l'application noteF, dont l'ensemble de
dpart est Ret l'ensemble d'arrive, l'intervalle[0,1].
F : R [0,1]
X F(x) = P(X
5/24/2018 Chapitre1(1)
7/11
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY 9
Classes d'amplitudes gales:
Lorsque les classes sont d'amplitudes gales (ai= a)
Figure 1-5 : Histogramme (amplitude gales) :
Capacit Htelire en lits pour la rgion de Nabeul-Hammamet
0,00
0,05
0,10
0,15
0,20
0,25
0,30
101 201 301 401 501
apacit htelire en lits
Frquences
Classes d'amplitudes ingales :
Lorsqu'au moins deux classes ont des amplitudes diffrentes, la hauteur proportionnelle
l'effectif ne permet plus de construire un histogramme. En effet, la surface de chaque
rectangle n'est plus proportionnelle l'effectif (conformment la dfinition).
Do la ncessit de corrig les frquences (ou les effectifs).
i
ic
ia
ff ou
i
ic
ia
nn
Avec: cif : frquence corrig ; c
in : effectif corrig
Figure 1-6: Histogramme (amplitude ingales) : Chmeurs par groupe d'ges
5/24/2018 Chapitre1(1)
8/11
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY 10
b) Polygone des frquences
On obtient un polygone de frquences en joignant les milieux des segments suprieurs de
chaque rectangle de lhistogramme (laire du polygone des frquences est laire de la surface
par la ligne polygonale et laxe des abscisses).
Figure 1-7 : Polygone des frquences (amplitude gales) :
Capacit Htelire en lits pour la rgion de Nabeul-Hammamet
c) Courbe des frquences cumules
croissantes
Dfinition
On appelle courbe des frquences cumules croissantes la reprsentation graphique de la
fonction de rpartition de la variablex.
Les donnes tant groupes en classes, la frquence cumule croissanteFiassocie la classe
n : ireprsente la proportion d'individus de la population pour lequel la variable prend une
valeur inferieure (strictement) la limite suprieurebide la classen : i.En pratique, la courbe des frquences cumules croissantes est obtenue en joignant, dans un
systme d'axes orthogonaux, les points d'abscisse bi(extrmit de la classen : i) et
d'ordonneFi (frquence cumule croissante correspondante) [Remarque : Joindre les points
de coordonnes (bi, Fi) par des segments revient faire lhypothse dune rpartition
uniforme des individus lintrieur des classes].
5/24/2018 Chapitre1(1)
9/11
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY 11
Figure 1-8 : Courbe des frquences cumules croissantes : Capacit Htelire en lits pour la
rgion de Sousse-Kairouan
Courbe des frquences cumules
croissantes
0,00
20,00
40,00
60,00
80,00
100,00
101 201 301 401 501 601
Capacit Htelire en lits
fr
quencescumules
croissantesen%
3.3 Graphiques spcialises
a) Pyramide des ges
Exemple : Pyramide des ges en Tunisie en 1994 :
La pyramide est une version particulire de l'histogramme, uti lis e pour rep art ir une
pop ul ati on en fon cti on de l ge (va ri abl e qu ant ita tiv e con tin ue) et du sex e des
ind ivi dus (va riable quali tative secondaire).
Le graphique se prsente comme un histo gramme double, les valeurs de la va ri ab le
pr in ci pa le ( l g e) t an t po rt e s su r l' ax e ve rt ic al .
Fi gu re 1- 9 : Py ra mi de de s g es (e n% ) 19 94
5/24/2018 Chapitre1(1)
10/11
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY 12
b) Diagramme cartographique (ou cartogramme)
Lorsqu'une tud e stat ist ique concerne des donnes gographiques, les individus ou les
modalits de la variable tudie sont des units spatiales (des rgions par exemple).
On petit alors utili ser une carte pour visualiser les valeu rs associes a un caractre et a
une unit spatiale.
La population tudie est l'ensemble des gouvernorats de la Tunisie . La variable
tudie est l'cart global en taux (L'cart global en taux, reprsente ici le
dif fr ent iel de croissance de l'emploi un gouvernor at donn et la nat ion tou t e ent ir e
sur la priod e 198 4 -1989. Un cart global pos iti f (n gat if) , signif ie que le tau x de
croissance de lemploi du gouvernorat considr est suprieur (inferieur), au taux do
croissance moyen au niv eau nat ion a l). Elle est qua nti tat ive con tin ue. Une
dc omp osi tio n des val eur s de la var iab le en 5 cla sse s di ng ale amp lit ude con dui t
la figure suivante :
Fig ure 1-10 : Dia gra mme Car tog rap hiq ue
Eca rt glo bal en tau x (Tr ) par gou ver nor at (19 84- 198 9)
5/24/2018 Chapitre1(1)
11/11
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY 13
c) Diagramme polaire
Ce diagramme (figure 1-10) est utilise lorsqu'on cherche comparer, pour une variable
donne, des observations relatives plusieurs sous populations (d'une mme population).
On suppose que la variable (qualitative ou quantitative) tudie prsente p modalits. Le plan
est divis en psecteurs dlimits par des axes associes aux diffrentes modalits de la
variable. On reporte sur chaque axe la valeur correspondant la modalit concerne ; la
distance du point l'origine est proportionnelle la valeur correspondante. Les points
correspondants une mme sous population peuvent tre joints (figure 1-10).
Les donnes du tableau prcisent le nombre de chmeurs selon la dure du chmage (en mois)
et le niveau d'instruction enregistres en 1997(Source : enqute national sur l'emploi, 1999).
Tableau: Nombre de chmeurs en Tunisie, enregistrs en 1997
Dure dechmage
en mois
nant primaire secondaire suprieur total
[0,1[ 1880 5089 2453 138 9560
[1,3[ 12616 39895 16193 731 69435
[3,6[ 12108 43318 16346 1072 72844
[6,9[ 4002 19797 13263 1657 38719
[9,12[ 2112 8419 8582 1816 20929
[12,24[ 16224 93402 83346 11708 204680
Figure 1 -10 : Diagramme Polaire