View
230
Download
3
Category
Preview:
Citation preview
STATISTIQUE DESCRIPTIVE
CHAPITRE 1 : LES TABLEAUX ET
REPRÉSENTATIONS
GRAPHIQUES
Facebook : https://www.facebook.com/pages/Economie/232025116887158
OBJECTIFS DE CE MODULE
Savoir décrire et
représenter une série
statistique par un
tableau et un ou
plusieurs graphiques
adaptés.
On fera des choix des
représentations
différents selon la nature
du caractère.
Statistiques descriptives à une variable : représentations
INTRODUCTION
La représentation tabulaire est préalable à toute
analyse statistique.
Elle fait suite au travail préliminaire de collecte des
données.
La représentation graphique d’un seul caractère
repose sur une règle de proportionnalité des hauteurs
ou aires des graphiques aux effectifs (ou fréquences).
Le choix d’un type de graphique dépendra de la nature
du caractère étudié.
PLAN DU CHAPITRE 1
I. Caractères qualitatifs.
II. Caractères
quantitatifs discrets.
III. Caractères
quantitatifs continus.
Voici les parties que nous allons aborder :
PLAN DE LA PARTIE
1. Représentation tabulaire.
2. Diagramme à bande.
3. Diagramme circulaire.
Voici les chapitres que nous allons aborder :
Ⅰ. Caractères qualitatifs
1. REPRÉSENTATION TABULAIRE
Tableau à simple entrée, sans hiérarchie (sauf si
le caractère est ordinal).
La première colonne renseigne les modalités et
les deux suivantes les effectifs et fréquences.
Si le caractère est ordinal, on pourra rajouter une
dernière colonne avec les fréquences cumulées.
Ⅰ. Caractères qualitatifs
Noms Situation de famille
M.Azim Marié
MFarid Veuf
Mme Latifi Mariée
Melle Fatiha Célibataire
M. Ahmed Divorcé
M. Salih Marié
M. Berrada Divorcé
Mme Réda Divorcée
Melle Fatiha Célibataire
M. Halim Marié
M. Chadi Veuf
Mme Faouzi Mariée
... ...
Exemple: On a noté la situation familiale des
150 employés d'une
entreprise.
1. Représentation tabulaire
Ⅰ. Caractères qualitatifs
On ne s'intéresse pas à la situation personnelle
de M. Azim ou de M. Farid, mais à la
répartition du caractère "situation familiale"
dans la population des 150 employés.
Pour cela il faut, pour chacune des modalités de
la variable, déterminer l'effectif correspondant,
c'est-à-dire le nombre de personnes ayant cette
modalité : il faut dénombrer le nombre de
célibataires, le nombre de mariés, etc..
Cela peut se résumer par :
Modalités Effectifs
Marié 80
Célibataire 30
Veuf 20
Divorcé 20
On notera x1, x2, ..., xk les différentes modalités, et
n1, n2, ... , nk les effectifs associés.
Dans le tableau ci-dessus, x1 = "marié",
n1 =
k =
La somme des effectifs vaut :
La variable que nous venons de voir
est…
On aurait pu tout aussi bien présenter les résultats sous la
forme ci-dessus, par exemple.
Modalité Effectif
Célibataire 30
Marié 80
Divorcé 20
Veuf 20
Par contre, s'il s'agit d'une variable ordinale, les modalités
sont toujours présentées dans l'ordre :
x1 < x2 < .... < xk , comme dans l'exemple ci-dessous.
Modalités = tailles
Effectifs = Nombre de personnes de
cette taille
XS 10
S 25
M 40
L 32
XL 23
XXL 20
L'ensemble des couples
{ (xi , ni ), i = 1, ... , k }
est une série statistique (ordonnée), ou distribution observée de la variable.
La somme de tous les ni est-elle toujours égale à n, nombre des observations ?
On notera ceci :
effectif total
On appellera fréquence relative la valeur
que l'on peut aussi exprimer en pourcentage par fi x
100, c'est le pourcentage d'individus pour lesquels la
variable a pris la valeur xi.
COMPLÉTEZ LE TABLEAU :
Modalités xi Effectif ni Fréquence relative fi %
Célibataire 30 0.2 20
Marié 80
Divorcé 20
Veuf 20
Effectif total : 150
A quoi est égal ici le total de la colonne fréquence ?
Et celui de la colonne "pourcentage" ?
Il y a, parmi les 150 employés, …….% qui sont mariés.
2. DIAGRAMME À BANDES
Aussi appelé représentation par « tuyaux d’orgue ».
Les modalités sont placées sur un axe horizontal.
Les effectifs (ou fréquences) sont placés sur un axe vertical.
La hauteur de chaque tuyau est proportionnelle à l’effectif correspondant.
Permet de comparer d’un « coup d’œil » les différentes modalités.
Ⅰ. Caractères qualitatifs
0
10
20
30
40
50
60
70
80
90
cadres ouvriers employés ouvriers
Série1
CSP ni fi
Cadres 10 0,05
Agents de maîtrise 40 0,2
Employés 60 0,3
Ouvriers 90 0,45
3. DIAGRAMME CIRCULAIRE
L’aire, et donc l’angle au centre d’un secteur, est
proportionnelle à la fréquence (ou l’effectif) de la
modalité considérée (d’où un angle de fi x 360°
pour la modalité i).
Permet de bien visualiser la part relative de
chaque modalité.
Ⅰ. Caractères qualitatifs
Ⅱ. CARACTÈRES QUANTITATIFS
DISCRETS
Statistiques descriptives à une variable : représentations
PLAN DE LA PARTIE
1. Représentation tabulaire.
2. Diagramme bâton.
3. Courbe des fréquences cumulées.
Voici les chapitres que nous allons aborder :
Ⅰ. Caractères quantitatifs discrets
1. REPRÉSENTATION TABULAIRE
Tableau à simple entrée, où les données sont
classées par ordre croissant.
La première colonne renseigne les différentes
valeurs du caractère, et les trois suivantes les
effectifs, fréquences et fréquences cumulées.
Ⅰ. Caractères quantitatifs discrets
De même, pour une variable discrète, on notera
x1 , x2 , ... , xk les valeurs rangées par ordre
croissant, et n1 , n2 , ... , nk les effectifs
correspondants.
Noms Nombre d'enfants
M.Azim 2
MFarid 3
Mme Latifi 0
Melle Fatiha 0
M. Ahmed 1
M. Salih 0
M. Berrada 1
Mme Réda 0
Melle Fatiha 2
M. Halim 4
M. Chadi 1
Mme Faouzi 3
M. Ali 2
Melle Loubna 0
M Fatih 0
M. Said 1
M. Radi 2
Mme Faraj 2
Ainsi, à partir de la série brute ci-dessus,
construisez le tableau :
Nombre d'enfants xi Effectifs ni
0 6
Nombre d'enfants xi Effectif ni Fréquence relative fi
0 6 0.33
1 4 0.22
2 5 0.28
3 2 0.11
4 1 0.06
Total : 18 1
Voyons un autre exemple : Pour étudier les appels
téléphoniques arrivant à un central, on a noté, sur
96 jours comparables, le nombre d'appels reçus
entre 9 h et 9 h 10. Les résultats sont consignés
dans ce tableau :
QUELLE EST LA PROPORTION DE JOURS OÙ
LE NOMBRE D'APPELS A ÉTÉ DE 2 ?
Nombre
d'appels xi
Nombre de
jours ni
Fréquence
relative fi % fi 100
0 2 0.0208 2.08
1 14 0.1458 14.58
2 23 0.2396 23.96
3 24 0.2500 25.00
4 18 0.1875 18.75
5 9 0.0938 9.38
6 6 0.0625 6.25
Total : 96 1 100
QUELLE EST LA PROPORTION DE JOURS OÙ LE NOMBRE
D'APPELS A ÉTÉ SUPÉRIEUR OU ÉGALE À 3?
Nombre
d'appels x i
Nombre de
jours n i
Fréquence
relative fi % fi 100
0 2 0.0208 2.08
1 14 0.1458 14.58
2 23 0.2396 23.96
3 24 0.2500 25.00
4 18 0.1875 18.75
5 9 0.0938 9.38
6 6 0.0625 6.25
Total : 96 1 100
COMBIEN Y-A-T-IL EU DE JOURS OÙ LE NOMBRE D'APPELS
A ÉTÉ INFÉRIEUR OU ÉGAL À 2 ?
Nombre
d'appels xi
Nombre de
jours ni
Fréquence
relative fi % fi 100
0 2 0.0208 2.08
1 14 0.1458 14.58
2 23 0.2396 23.96
3 24 0.2500 25.00
4 18 0.1875 18.75
5 9 0.0938 9.38
6 6 0.0625 6.25
Total : 96 1 100
Plus généralement, si
{ (xi , ni ), i = 1, ..., K }
est la distribution observée d'une variable discrète, n1
+ n2 + ... + ni = Ni est le nombre d'individus pour lesquels la variable a été inférieure ou égale à xi..
On peut calculer Ni de proche en proche :
N1 = n1, N2 = N1 + n2, N3 = N2 + n3, etc ...
Les Ni sont les effectifs cumulés croissants.
De même ni + ni+1 + ... + nk = N'i est le nombre
d'individus pour lesquels la variable a été
supérieure ou égale à xi.
Il peut se calculer de proche en proche :
N'k = nk , N'k-1 = nk + nk-1 ,
Les N'i sont les effectifs cumulés décroissants.
On peut définir de même :
Fi = f1 + f2 + ... + fi , fréquences relative
cumulées croissantes obtenues de proche en
proche par Fi+1 = fi+1 + Fi
F'i = fi + fi+1 + ... + fk , fréquences relative
cumulées décroissantes obtenues de proche
en proche par F'i = F'i+1 + fi
Fi et F'i peuvent s'exprimer aussi en
pourcentage (en multipliant tout par 100).
COMPLÉTEZ LE TABLEAU :
Nombre
d'appels
Fréquence
relative en %
Fréquences relative
cumulées croissantes
Fréquences relative cumulées
décroissantes
0 2.08 2.08
1 14.58 16.66 97.92
2 23.96 83.34
3 25.00 65.62 59.38
4 18.75 84.37
5 9.38 93.75 15.63
6 6.25 6.25
2. DIAGRAMME BÂTON
Diagramme bâton des effectifs
A chaque valeur du caractère portée en abscisse, on associe un « bâton » vertical dont la hauteur est proportionnelle à l’effectif.
Cette représentation permet de comparer les effectifs de chaque valeur du caractère.
Ⅰ. Caractères quantitatifs discrets
3. COURBE DES FRÉQUENCES CUMULÉES
Représente l’évolution des fréquences cumulées.
Le caractère étant discret, la courbe est en
« escalier ».
En effet, les valeurs étant séparées, entre
chacune d’elle la fréquence cumulée est
inchangée, d’où ces paliers.
Ⅰ. Caractères quantitatifs discrets
3. COURBE DES FRÉQUENCES
CUMULÉES
Diagramme en Escalier
0
20
40
60
80
100
120
0 1 2 3 4 5 6 7
Fré
qu
en
ce r
ela
tive c
um
ulé
e
Ⅰ. Caractères quantitatifs discrets
Ⅱ. CARACTÈRES QUANTITATIFS
CONTINUS
Statistiques descriptives à une variable : représentations
PLAN DE LA PARTIE
1. Représentation tabulaire.
2. Histogramme des densités de fréquence.
3. Polygone de fréquences
4. Courbe des fréquences cumulées.
Voici les chapitres que nous allons aborder :
Ⅰ. Caractères quantitatifs continus
1. REPRÉSENTATION TABULAIRE
Tableau à simple entrée, où les classes de données sont triées par ordre croissant.
La première colonne renseigne les différentes classes de valeurs du caractère, et les trois suivantes les effectifs, fréquences relatifs et fréquences cumulées.
Si les classes ne sont pas toutes de même amplitude, on rajoute une colonne contenant les densités de fréquence, i.e. la fréquence de la classe divisée par son amplitude.
Ⅰ. Caractères quantitatifs continus
1. REPRÉSENTATION TABULAIRE
Lorsque la variable est continue, ou que la variable peut prendreun grand nombre de valeurs différentes, même si celle-ci est unevariable discrète, il convient de regrouper ces valeurs en classes.
À chaque classe on fait correspondre une fréquence ou unefréquence relative, et l’on obtient alors une distribution defréquence ou de fréquence relative pour valeurs groupées.
Pour construire une distribution de fréquence, de fréquencerelative ou de fréquence relative cumulée pour valeurs groupéeson doit procéder de la manière suivante :
1. Déterminer le nombre de classes2. Déterminer l’amplitude des classes3. Déterminer les différentes classes
1. REPRÉSENTATION TABULAIRE
EXEMPLE 1
Voyons l'exemple d'une série brute de 60
valeurs du CA mensuelle d’une entreprise
(en 1000dh), et le tableau des effectifs
obtenus.
L'inconvénient est que, comme on aura toujours
un grand nombre de valeurs différentes, on
obtiendra un grand nombre de petits effectifs,
ne résumant finalement pas grande chose !
CA (1000dh) Effectifs CA (1000dh) Effectifs
159 1 169 7
160 0 170 7
161 0 171 9
162 0 172 6
163 2 173 5
164 3 174 2
165 3 175 1
166 0 176 2
167 5 177 1
168 6 Total : 60
Une variable continue ne prend pas des valeurs
isolées, mais des valeurs appartenant à des
intervalles. C'est pourquoi, au lieu de définir des
effectifs par valeurs, on définira des effectifs par
intervalles, appelés classes.
Afin de simplifier la présentation on peut,
quitte à perdre un peu d'information, regrouper
les effectifs proches, par exemple
175 d’ effectif 1
176 d’ effectif 2
177 d’ effectif 1
peut être remplacé par [ 175 ; 178 [ d’ effectif 4.
On découpera ainsi l'intervalle des valeurs en
classes contiguës, de la forme :
[ e1 ; e2 [ [ e2 ; e3 [ [ e3 ; e4 [ ....
[ ek ; ek+1 [
et on notera n1, n2, ... , nk les effectifs associés.
ni est le nombre d'individus appartenant à la classe
[ ei ; ei+1 [.
EXEMPLE 1
Classes de CA ( en 1000dh) Effectifs
[159 - 165 [ 6
[165 - 168 [ 8
[168 - 171 [ 20
[171 - 174 [ 20
[174 - 177 [ 5
[177 - 179 [ 1
EXEMPLE 1
Classes de CA ( en 1000dh) Effectifs
moins de 160 1
[160 - 165 [ 5
[165 - 170 [ 21
[170 - 175 [ 29
175 et plus 4
Quel que soit le type de variable on a finalement,
pour toute modalité, valeur xi , ou classe [ ei , ei+1 [,
un effectif ni , tel que
Il est parfois utile, surtout pour faire des
comparaisons entre plusieurs séries, de raisonner
plutôt avec des fréquences relatifs.
Les définitions d'effectifs et de
fréquences cumulés restent les
mêmes dans le cas d'une variable
continue.
1. REPRÉSENTATION TABULAIRE
1. Déterminer le nombre de classes :
1) (règle de Sturges)
2)
)(3.31 nLogNC
nNC
Nombre d’observations
dans la série statistique
1. REPRÉSENTATION TABULAIRE
2. Calculer l’amplitude des classes :
1) D’une façon plus ou moins arbitraire
2) En utilisant l’étendue
minmax xxE
C
CN
EA
Des classes d’amplitudes
égales
(Plus grande valeur de la série statistique
– Plus petite valeur de la série statistique)
1. REPRÉSENTATION TABULAIRE
3. Déterminer les différentes classes :
cc AxClasseAx 2min2min <
ckc kAxClasseAkx < minmin )1(
cAxClassex < min1min
ccNcc ANxClasseANxc
< minmin )1(
EXEMPLE 2 : LE TABLEAU STATISTIQUE (VALEURS GROUPÉES)
Pour les trois dernières années, le débit mensuel moyen d'une rivière,exprimé en milliers de mètres cubes par seconde, a été le suivant :
Posons X = la variable statistique représentant le débit mensuel moyend’une rivière.
Variable continue
EXEMPLE 2 : LE TABLEAU STATISTIQUE (VALEURS GROUPÉES)
(1) Nombre de classes :
classesLogNC 1358.6)36(3.31
classesNC 636
(2) L’amplitude des classes :
97.008.005.1 E
17.01617.06
97.0CA
)( 3mdemilliersen
10.193.0
93.076.0
76.059.0
59.042.0
42.025.0
25.008.0
6
5
4
3
2
1
<
<
<
<
<
<
Classe
Classe
Classe
Classe
Classe
Classe
(3) Détermination des classes :
Débit D
EXEMPLE 2 : LE TABLEAU STATISTIQUE (VALEURS GROUPÉES)
Distribution de fréquence, de fréquence relative et defréquence relative cumulée :
2. HISTOGRAMME DES DENSITÉS DE
FRÉQUENCE.
Ensemble de rectangles contigus.
Pour chaque classe on trace un rectangle :
de base B proportionnelle à l’amplitude de la classe
de hauteur h proportionnelle à la densité de
fréquence de la classe
L’aire du rectangle sera alors proportionnelle à la
fréquence de la classe.
Ⅰ. Caractères quantitatifs continus
2. HISTOGRAMME DES DENSITÉS DE
FRÉQUENCE.
Double interprétation :
On comparera les densités de fréquence des
classes en comparant les hauteurs des rectangles.
On comparera les fréquences des classes en
comparant les aires des rectangles.
Ⅰ. Caractères quantitatifs continus
Age (ans)
Nombre de personnes dans cette
tranche d'âge
20 à 30 100
30 à 40 150
40 à 50 90
50 à 65 20
Histogramme de fréquence pour valeurs groupées (exemple 2)
Histogramme de fréquence
0
5
10
15
20
25
0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus
Débit D (en milliers m3/sec)
Fré
qu
en
ce
Histogramme de fréquence relative pour valeursgroupées (exemple 2)
Histogramme de fréquence relative
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus
Débit D (en milliers de m3/sec)
Fré
qu
en
ce r
ela
tive
3. Polygone de fréquences pour valeursgroupées (exemple 2)
Polygone de fréquence
0
5
10
15
20
25
moins de
0,08
0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus
Débit D (en milliers de m3/sec)
Fré
qu
en
ce
3. Polygone de fréquence relative pourvaleurs groupées
Polygone de fréquence relative
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
moins de
0,08
0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus
Débit D ( en milliers m3/sec)
Fré
qu
en
ce r
ela
tive
4. COURBE DES FRÉQUENCES CUMULÉES
Représente l’évolution des fréquences cumulées.
Le caractère étant continu, la courbe l’est également.
Pour la construire, on joint les points de coordonnées
(bi,Fi) où bi désigne l’extrémité supérieure de la ième
classe.
Ⅰ. Caractères quantitatifs continus
Ogive de fréquence relative cumulée pour valeursgroupées
Ogive de fréquence relative cumulée
,00%
20,00%
40,00%
60,00%
80,00%
100,00%
120,00%
moins de
0,08
0,08 -
0,249
0,25 -
0,419
0,42 -
0,589
0,59 -
0,759
0,76 -
0,929
0,93 et
plus
Débit D (en milliers m3/sec)
Fré
qu
en
ce r
ela
tive c
um
ulé
e
SYNTHÈSE
En plus des tableaux et graphiques, on résume
l'observation d'une variable quantitative par un
petit nombre de paramètres.
https://www.facebook.com/pages/Economie/232025116887158
Recommended