Upload
aitazziabdo
View
217
Download
0
Embed Size (px)
Citation preview
7/30/2019 Les Statistiques dscriptives
1/30
STATISTIQUES DESCRIPTIVES
A)
B)
Cest la prsentation la plus commode du point de vue statistique.
Un tableau statistique est un tableau regroupant tous les chiffres obtenus partir dune Enqute ou tout untravail de collecte de linformation chiffre sur un phnomne quelconque.
a) Tableau statistique simple entre (ou une entre) :
Le tableau le plus simple sera celui o figureront deux colonnes rserves respectivement :- La premire, linscription des valeurs du caractre dsign par Xi.- La seconde, linscription des effectifs correspondants dsigns par ni ;
Exemple : distribution statistique de 40 agents de la division administrative Casablanca daprs le nombredenfants charge.
Nombre denfants charge x i Effectifs ni
0123456
271410421
Somme de ni = N= 40Dans cet exemple la variable est discrte ( ou discontinue) et prend les 7 valeurs :X1 =0 ; X 2 = 1 ; X3 =2 ; X4 = 3 ; X5 = 4 ; X6=5 ;X7=6
A chacune des valeurs correspond un effectif :N1=2 ; n2=7 ; n3=14 ; n4=10 ; n5=4 ; n6=2 ; n7=1
La srie statistique (ou distribution statistique) est donc lensemble des 7 couples :(x1 , n1) ; (x2 , n2) (x7 , n7)et nous dirons la srie (xi, ni) , lindice i prenant les valeurs 1,2,3,4,5,6 et 7. La somme des effectifs niest leffectif total N de la population tudie.
N = n1 + n2 + n3..+ n7Ce que lon note N = ni
Et ce qui ce lit somme de i galant 7 des n indice i Dans le cas dune variable continu on procde un regroupement des donnes par classes. Cecidans le but de simplifier aussi bien la reprsentation de la srie que les calculs.Exemple : Si on tudie la population des 40 agents de DA/AC de point de vue leur salaire (tauxhoraire) on obtient la srie suivante.
4,75 6,46 4,35 7,75 5,19 9,40 5,62 4,96 5,01 4,55 5,10 7,75 6,81 5,79 5,19
5,12 8,14 7,31 7,10 5,54 4,35 4,55 5,80 5,17 6,28 8,27 4,96 5,15 6,37 4,745,45 4,35 6,64 ; 6,64 4,90 7,95 6,28 7,31 5,62 6,37Les valeurs ont t arrondies 2 chiffres aprs la virgule
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 1 sur 30
7/30/2019 Les Statistiques dscriptives
2/30
STATISTIQUES DESCRIPTIVES
Il est bien certain que dans pareil cas, pour pouvoir dresser une statistique, il faudra diviser le domainede la variable, ici de 4,35 9,40 en classes de prfrence damplitude constante.
On appelle effectif dune classe de valeurs comprises dans cette classe.
ClassesAmplitude 1 DH
Effectif
3,50 4,50
4,50 5,505,50 6,506,50 7,507,50 8,508,50 9,50
3
1510651
Total 40
On a pralablement dcid que la limite suprieure de la classe ne fait pas partie de la classe. Lesclasses sont donc :
3,50 moins de 4,504,50 moins de 5,50
.etc.
Le choix du nombre de classe et de lamplitude dune classe, varie avec la statistique quon doit tablir.Un nombre trop petit de classes conduit regrouper des valeurs observes de la variable queprsentent entre elles des diffrences sensibles et donc enlverait beaucoup de prcision lastatistique obtenue.
Un trop grand nombre de classes donnerait sans doute des renseignements assez prcis, maisentranerait aussi un grand nombre de calculs.En rgle gnral il peut tre recommand de ne pas dpasser si possible, 15 20 classes et de ne pasdescendre au del de 6 classes.
Les lments dune classe : (exemple la classe 3,50 4,50)
- On appelle limite (ou borne) dune classe le nombre entre lesquels on renonce tudiersparment les valeurs du caractre :
Ici : limite infrieure = 3,50limite suprieure = 4,50
- On appelle amplitude (ou intervalle) dune classe la longueur du segment form par ses limitesIci : lamplitude = 4,50 3,50 = 1
- On appelle centre de classe le milieu du segment form par ses limitesIci : le centre de classe = (3,50 + 4,50) / 2 = 4
Le tableau des effectifs ou distribution statistique
SalaireClasse(Amplitude 1 DH )
Centre declasses
Effectifs
3,50 4,504,50 5,505,50 6,506,50 7,507,50 8,508,50 9,50
456789
31510651
Total - 40
Remarque :Dans le tableau prcdent on a incorpor le centre de classe, ceci est dans le but de
reprsenter chaque classe par son centre.
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 2 sur 30
7/30/2019 Les Statistiques dscriptives
3/30
STATISTIQUES DESCRIPTIVES
Frquence (frquence relative)Le rapport de leffectif ni attach la valeur xi du caractre, leffectif total est la frquence de lavaleur xi du caractre :
fi = ni/N = ni/niPar exemple au tableau prcdent, nous ajoutons une colonne frquence o seront portes lesfrquences de chaque classe, cest dire les nombres :3/40 = 0,075 ; 15/40 = 0,38 ; 10/40 = 0,25 ; 6/40 = 0,15 ; 5/40 = 0,12 ;1/40 = 0,025
dont la somme est 1 car3/40 + 15/40 + 10/40 + 6/40 + 5/40 + 1/40 = 1En multipliant la frquence ni par 100 on obtient le taux du pourcentage de N que reprsente n i
Effectifs cumuls :Les effectifs peuvent donner lieu la prsentation de colonnes deffectifs cumuls (cumulscroissants ou dcroissants) permettant de rpondre aux deux types de questions suivantesdans le cas prcdents :
- Quel est le nombre dagents touchant moins de 6,50 DH ?- Quel est le nombre dagents touchant au moins de 6,50 DH (6,5 dh ou plus de6,5dh) ?
On aura le tableau suivant :
Colonne 1 Col 2 Col 3 Col 4 Col 5 Col 6 Col 7 Col 8SalaireClasse(unit 1 dh)
Effectifni
Frquencefi =ni/N
%Frquencesni/N 100
Effectifscumulscroissants
Frquenceen %cumulescroissantes
Effectifscumulsdcroissants
Frquenceen %cumulesdcroiss
3,50 4,504,50 5,505,50 6,506,50 7,507,50 8,508,50 9,50
31510651
0,0750,3800,2500,1500,1200,025
7,5382515122,5
31828343940
7,545,570,585,597,5100
4037221261
10092,554,529,514,52,5
TOTAL = N 40 1,000 100 - - - -
Interprtation des cumuls figurant dans les colonnes 5,6,7 et- Colonne 5 : ses cumuls donnent les rponses aux questions du premier type :
3 agents touchant moins de 4,50 dh18 agents touchants moins de 5,50 dh28 agents touchants moins de 6,50 dh
- Colonne 6 : 8% des agents touchant moins de 4,50dh- Colonne 7 : ses cumuls donnent les rponses aux questions du second type :
40 agents touchent au moins de 3,50dh37 agents touchent au moins de 4,50dh12 agents touchent au moins de 6,50dh
- Colonne 8 : 55% des agents touchent au moins 5,50 dhb) Tableau statistique double entre (2 caractres)
Nous nous sommes jusquici limit dans ltude des units statistiques lobservation sur chaque unit,dun seul caractre . Or, il est souvent possible sur une mme unit dobserver deux ou plusieurs caractres.La traduction, par un tableau, de lobservation de deux caractres sur uni unit statistique se fera laide
dun tableau double entre :Exemple : Rpartition des 40 agents de DA/AC selon leur salaire et le nombre denfants charge.
Interprtation des nombres ports dans le tableau :
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 3 sur 30
7/30/2019 Les Statistiques dscriptives
4/30
STATISTIQUES DESCRIPTIVES
- 1 agent dont le salaire est compris entre 3,50 et 4,50 a 0 enfants charge.- 8 agents dont le salaire est compris entre 4,50 et 5,50 ont 2 enfants charge.
C)
Les lments dun tableau statistique sont les suivants :- Le titre il indique lobjet du tableau, le titre gnralement utilis est le suivant : cest la
rpartition dun ensemble statistique selon un ou plusieurs caractres .- Titres des lignes et des colonnes : il prcise le contenu du tableau cest dire les donnes fournies
par ce tableau ( les effectifs ou frquences absolues, les donns en pourcentage ou frquences
relatives).- Des notes ou remarques pour faciliter la lecture des chiffres aux non statisticiens.- La source : elle indique lorigine ou la rfrence de linformation chiffre fourni par un tableau.
Cette indication permet au lecteur du tableau qui dsirerait un complment dinformation de sereporter lorigine des informations.
- Prsentation : la prsentation matrielle du tableau statistique dpend pour beaucoup de sesdimensions. (nombre de lignes ou de colonnes). On veillera la clart, qualit essentielle. Onrendra la lecture facile laide dune typographie soigne.
II- Reprsentation graphique :Lune des mthodes de prsentation des rsultats est la prsentation graphique qui consiste schmatiser
les donnes numriques obtenues par de grandeurs ou des figures gomtriques. Lintrt de cette mthode deprsentation est de fournir, par simple examen visuel une ide gnrale sur la variation du phnomne tudi.
Un graphique permet aussi de faire un contrle des rsultats partir des anomalies ou discontinuit quipeut se prsenter cest aussi un moyen de comparaison de variation dun mme caractre entre deux ensemblediffrents. Par ailleurs son inconvnient est quil nglige certains dtails et ne permet pas de donner avec prcisionle mme enseignement que peut fournir un tableau statistique ; ce qui limite lutilisation des graphiques dans desanalyses trs pousses.
Un bon graphique doit tre simple et claire pour ne pas donner une fausse impression visuelle donc unefausse interprtation. Un graphique doit porter les lments suivants :
- Un titre indiquant la nature du phnomne quil reprsente .- Des indications ( lgende, chelle, etc .) prcisant la correspondance entre les lments du
graphique et la nature du caractre. Selon cette nature nous distinguons diffrentes reprsentationsgraphiques :
DIFFERENTES CATEGORIES DE GRAPHIQUES
Types de variablesou caractres de distribution Graphiques utilisables
Distributions- Caractre qualitatif
barres verticales, horizontalesdiagrammes en btonssecteurfigurescartes
- Caractre quantitatif Discontinu (ou discret)
Continu
diagrammes en btonsdiagrammes en segments cumulatifshistogrammes, pyramidespolygones de distributionPolygones de cumuls
Sries chronologiques barres verticalesgraphiques cartsiensgraphiques semi-logarithmiques
A/1- Graphiques en barre et diagrammes en btonsRpartition du chiffre d'affaires de la Socit VENTOUT au 31/12/1988
NordEst
CentreSudOuest
2 0001 200
1 4006001 200
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 4 sur 30
7/30/2019 Les Statistiques dscriptives
5/30
STATISTIQUES DESCRIPTIVES
Rgions Btons horizontaux
Ouest-
Sud-
Centre-
Est-
Nord-
0 500 1000 1500 2000 Montants (en milliers de DH)
Montant(en milliers de DH)2000 - Btons verticaux
1500 -
1000 -
500 -
0
Nord Est Centre Sud Ouest Rgions
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 5 sur 30
Barres horizontal
0 500 1000 1500 2000 2500
Nord
Centre
Ouest
Rgions
M ontant ( m il liers de
Barres verticales
0
500
1000
1500
2000
2500
Nord Est Centre Sud Ouest
Rgions
Mont
ant(millie
DH)
7/30/2019 Les Statistiques dscriptives
6/30
STATISTIQUES DESCRIPTIVES
Les graphiques en btons sont bien adapts au tableau de rpartition. La langueur dun bton est proportionnelleau chiffre daffaires correspondant.Les graphiques en barres sont moins bien reprsentatifs du cas tudi ; en effet, une barre doit tre interprtepar la surface et non par la longueur ; pourtant les graphiques en barres, tant plus esthtiques, sont davantageutiliss. Pour quils significatifs, il faut prendre la prcaution dattribuer la mme largeur chaque barre. Cetteprcaution nest cependant pas suffisante : pour que les chiffres daffaires puissent tre interprts parlintermdiaire de la longueur des barres, il faut que la largeur de chaque barre soit gale lunit de mesure
(souvent 1 centimtre, 1 millimtre).
Les graphiques en secteurs font partie de la famille des graphiques ferms, cest dire des graphiques associs un ensemble fini dont les sous-ensembles sont reprsents par des zones proportionnelles leffectifcorrespondant.Un secteur est un sous-ensemble centr sur le milieu dun cercle (graphique circulaire) ou dun demi-cercle(graphique semi-circulaire), dont la profondeur (rayon) est constante (rayon du cercle ou du demi-cercle) et dontla longueur de la larc est proportionnelle un angle et une surface dfinissant un sous-ensemble.B
Rayons du secteur(8,5 cm)
Trac dun secteur Longueur de larc(5,47cm)
40,97grAngle AOB= 36,873
(ou i ) 0,643555rd0 B A
Profondeur du secteur = OA = OB (= 8,5 cm sur le schma) Angle AOB : dpend de limportance dun sous-ensemble reprsenter et du choix entre le cercle et le
demi-cercle.
Conseils pratiques pour tracer un secteur- calculer la frquence relative de la classe statistique reprsenter (ou effectif relatif particulier dfini
antrieurement).
Frquence absolue (ou effectif absolu particulier)Frquence relative =
Effectif absolu total
ni nifi = =
N n1+n2+..+nk ni
fi =k
njj=1
- calculer la valeur de langle du secteur (en grades ou en degrs ou en radians) partir de fi et de la valeur delangle du demi-cercle ( ou du cercle selon le type dhypothse choisie).
A= 180 ou 200gr ou radians, pour un demi-cercle i = fi x A avec
A= 360 ou 400gr ou 2 radians, pour un cercle
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 6 sur 30
7/30/2019 Les Statistiques dscriptives
7/30
STATISTIQUES DESCRIPTIVES
- Tracer le rayon infrieur du secteur ( OA par exemple) dont la longueur est de prfrence un nombre entierdunits de mesure (choix proposs : 10 centimtres ou 5 centimtres).
- Utiliser un rapporteur permettant de tracer le point suprieur du secteur partir du point infrieur ( point B partir du point A dont le secteur AOB).
Application au chiffre d'affaires de la Socit VENTOUT, au 31/12/1988 :
Nord
EstCentreSudOuest
n1 = 2 000
n2 = 1 200n3 = 1 400n4 = 600n5 = 1 200
f1 = 2 000/ 6 400 = 0,31250
f2 = 1 200/6 400 = 0,18750f3 = 1 400/6 400 = 0,21875f4 = 600/ 6 400 = 0,09375f5 = 1 200/6 400 = 0,18750
1 = 200 x 0,31250 = 692,5 gr
2 = 200 x 0,18750 = 37,5 gr3 = 200 x 0,21875 = 43,75 gr4 = 200 x 0,09375 = 18,75 gr5 = 200 x 0,18570 = 37,5 gr
662,5 x 0,9 = 56,25
37,5 x 0,9 = 33,7543,75 x 0,9 = 39,37518,75 x 0,9 = 16,87537,5 x 0,9 = 33,75
Totaux N= 6 400 1 200gr 180
*0,9 = 180/200.Pour calculer les angles i dans un cercle, il suffit de multiplier les frquences (fi) par 400 grades ou 360degrs, ce qui reprsente deux fois les valeurs des angles (i) calcules en demi-cercle. Le rayon dessecteurs tracs ci-aprs mesure 5 cm ( demi-cercle) ou 2,5 cm (cercle).Les secteurs peuvent tre coloris, hachurs, etc.
Les graphiques en barres sont ralisable en effectifs absolus ou relatifs et permettent des comparaisons
Chronologiques en valeurs absolues se qui nest ralisable quen valeurs relatives en graphiques circulairesou semi-cerculaires. deux barres adjacenttes donnent une vision compartive mieux perceptible que deuxcercles cte cte.
Nord
31%
Est
19%
Centre
22%
Sud
9%
Ouest
19%
Nord
Est
Centre
Sud
Ouest
B/ :
Diagramme en btonsRparation des notes sur 20 dun devoir de mathmatiques dans une classe de 25 lves.
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 7 sur 30
7/30/2019 Les Statistiques dscriptives
8/30
STATISTIQUES DESCRIPTIVES
Notes Nombre dlves8910111318
258532
Total : 25
8 Frquences absoluesNombredlves
5-
3-
2-
1-
8 9 10 11 12 13 14 15 16 17 18 19 20 Notes
Passage aux segments cumulatifs(fonction de rparation)
Alors que le diagramme en btons permet de connatre le nombre dlve ayant obtenu une note prcise, lafonction en segments cumulatifs rpond la question : combien dlves ont obtenu une note infrieure telle note ? .Le tableau prcdent peut apporter la rponse moyennant un calcul. Ainsi, le nombre dlves ayant obtenuune note strictement infrieure 10 est gal : 2 + 5 = 7. La plupart des fonctions en segmentscumulatifs sont associes des frquences cumules croissantes.
8910111318
258532
2/25 = 0,085/25 = 0,208/25 = 0,325/25 = 0,203/25 = 0,122/25 = 0,08
0,080,08 + 0,20 = 0,280,28 + 0,32 = 0,600,60 + 0,20 = 0,800,80 + 0,12 = 0,920,92 + 0,08 = 1
00 + 0,08 = 0,080,08 + 0,20 = 0,280,28 + 0,32 = 0,600,60 + 0,20 = 0,800,80 + 0,12 = 0,92
25 1
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 8 sur 30
7/30/2019 Les Statistiques dscriptives
9/30
STATISTIQUES DESCRIPTIVES
Frquences FrquencesRelatives relatives cumules
0,32 - Diagramme en btons Fonction cumulativestricte (FCS)
Frquences relatives 1-
0,90-
0,80-0,20- 0,70-
0,60-0,50- Frquences
cumules0,40- croissantes
strictes0,12- 0,30-
0,20-0,08- 0,10-
8 9 10 11 13
18 19 208 9 10 11 12 13 14 15 16 17 18 Notes
Notes: Les ordonnes des deux graphiques ci-dessous sont construites avec deux chelles diffrentes.
Chaque segment horizontal contient le correspondant la borne suprieure, sans contenir le point de la borneinfrieure :Signification : Point infrieur excluLa FCS permet de connatre la frquence de notes infrieures une valeur ; soit la frquence relative de notesinfrieures :
9 est gale 0,08 9,5 est gale 0,28 15 est gale 0,92
19 est gale 1Pour connatre ces frquences, il suffit de reprer labscisse et de dtecter lordonne correspondante grce laFCS.Caractres continus
Il sagit des caractres pouvant prendre toutes valeurs entre des limites finies.
Lhistogramme est sans doute le mode de reprsentation le plus pratiqu. Il sadapte des classes statistiquesdfinies quantitativement par deux bornes numriques (minimum et maximum) dont la diffrence sappelle
Un lment quelconque de lensemble tudi ne peut appartenir qu une seule classe. Les classesstatistiques sont des sous-ensembles formant une partition de lensemble.
Les tailles (en centimtres) des 25 lves sont les suivantes :161,5 166 167 181 171 184 177 182 171 178,5171 178 178,5 169,5 179 171 164 172 179 167174 173 162 172 169
Tableau ralis partir dune amplitude de classe gale 5 cmTailles (en cm) Nombre dlves
correspondants[160 ; 165[
[165 ; 170[
[170 ; 175[
[175 ; 180[
[180 ; 185[
35
86
3Total 25
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 9 sur 30
7/30/2019 Les Statistiques dscriptives
10/30
STATISTIQUES DESCRIPTIVES
8-Nombre Histogrammedlves
6-5-
3-
160 165 170 175 180 185 tailles en cm
Remarque :- Lhistogramme se compose de rectangles adjacents. La base dun rectangle reprsente lamplitude de
la classe statistique correspondante.- Sur le graphique et dans le tableau prcdent, les classes ont toutes la mme amplitude.
Lhistogramme ne doit surtout pas tre interprt comme un diagramme en btons, cest--dire partir deshauteurs.
Les rectangles sont tracs de telle faon que leurs surfaces sont proportionnelles aux effectifscorrespondants. En consquence, leffectif total est reprsent par la somme des surfaces des rectangles.
A partir des tailles des 25 lves, un autre tableau statistique peut tre construit :
[161; 165[ 165 - 161 = 4 3
[165; 177[ 177 - 165 = 12 13
[177; 185[ 185 - 177 = 8 9
25
HistogrammeNombreDlves
4,5------------------------------4,1/3---------
3--- S=13 S=9
1- S=3
0 161 165 177 185 tailles en cm
u 3u 2u
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 10 sur 30
7/30/2019 Les Statistiques dscriptives
11/30
STATISTIQUES DESCRIPTIVES
Explications :U est une unit de mesure des bases des rectangles de lhistogramme ; u est gale PGSD (Plus GrandCommun Diviseur) des amplitudes :
4= 2 x 2 = 4U= PGSD (4 ;12 ;8) = 4 puisque 12= (2 x 2) x 3 = 4 x 3
8 = (2 x 2) x 2 = 4 x 2( la recherche du PGSD ncessite la dcomposition de chaque amplitude sous forme dun produit defacteurs premiers, puis la recherche des facteurs communs).
S signifie surface. Dans le premier rectangle : S = 3 et base = 1 ( puisque 1x u), donc la hauteur h slve :S = b x h h = S/b = 9/2 = 4,5.
Polygones de distributionIls se tracent partir dun diagramme en btons ou dun histogramme :- en reliant les sommets des btons ;- en reliant les centres des sommets des rectangles dun histogramme amplitudes de classes
constantes.
Frquences
Polygone
Valeur du
Caractre
Polygone
Valeur du CaractreLe total des surfaces hacures ( au-dessus du plygone) est au total des surfaces colories ( en dessous dupolygone).Donc: la surface entre le polygone et laxe des abscisses est gale celle de lhistogramme, cest--dire leffectif total.Que faire, face des amplitudes ingales?
FrquencesPolygone
u u 3u 2u u u u Valeurs du caractre
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 11 sur 30
7/30/2019 Les Statistiques dscriptives
12/30
STATISTIQUES DESCRIPTIVES
Les polygones de cumuls se construisent partir dhistogrammes de cumuls eux-mmes btis partir de tableaux de frquences (absolues ou relatives) cumules ( croissantes ou dcroissantes).
A partir du tableau des tailles (cf. histogramme) avec amplitudes constamment gales 5 cm, le tableausuivant des frquences est dtermin :
[160; 165[[165; 170[[170; 175[[175; 180[[180; 185[
n1 = 3n2 = 5n3 = 8n4 = 6n5 = 3
F1 = 3/25 = 0,12F2 = 5/25 = 0,20F3 = 8/25 = 0,32F4 = 6/25 = 0,24F5 = 3/25 = 0,12
33 + 5 = 88 + 8 = 1616 + 6 = 2222 + 3 = 25
2525 - 3 = 2222 - 5 = 1717 - 8 = 99 - 6 = 3
3/25 = 0,128/25 = 0,3216/25 = 0,6422/25 = 0,8825/25 = 1
25/25 = 122/25 = 0,8817/25 = 0,689/25 = 0,363/25 = 0,12
N = 25 1
Il s'agit de frquences larges au sens tudi au diagramme en btons.
Les frquences cumules croissantes strictes seraient calcules comme suit:
n1 = 3n2 = 5n3 = 8n4 = 6n5 = 3
f1 = 0,12f2 = 0,20f3 = 0,32f4 = 0,24f5 = 0,12
00 + 3 = 33 + 5 =88 + 8 = 1616 + 6 = 22
00 + 0,12 = 0,120,32 + 0,20 = 0,320,32 + 0,32 = 0,640,64 + 0,24 = 0,88
N = 25 1Les frquences cumules croissantes relatives sont gales aux frquences cumules croissantes absoluesdivises par N = 25.
Les frquences cumules croissantes strictes (FCCS) sont gales, aprs dcalage d'une ligne, auxfrquences cumules croissantes larges (FCCS):fccs = fccsi-1, i >1fccs = 0La surface trame reprsente l'histogramme des frquences cumules croissantes (cf. p. 170).Les points A1, A2, A3, A4, A5 reprsentent les frquences cumules croissantes larges.Les points A0, A1, A2, A3, A4, concernant les frquences cumules croissantes strictes.Les points B0, B1, B2, B3, B4, sont associs aux frquences cumules dcroissantes.Les polygones sont construits d'aprs l'hypothse d'une rpartition rgulire des informations dans chaqueclasse statistique.
FrquencesCumules
- 1 --------25- -----B0----------------------------------------------------A5B1
- 0,80----- 20- ---------- A4
-0,60 ----- 15- ---------- A30,50-- 12,5 ------------------->---------------
-0,40 ----- 10- B3Cumul ----------- A2 Cumul
-0,20 ---- 5 - croissant dcroissant
-----------A1 B40 0 A0 B5160 165 170 175 180 185 Tailles (en cm)
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 12 sur 30
7/30/2019 Les Statistiques dscriptives
13/30
STATISTIQUES DESCRIPTIVES
Mdiane = 172,8125
Comment lire un polygone de frquences cumules? Cumul croissant:1- Interprtation du points A3 de coordonnes: taille = 175 cm, frquence cumule croissante = 16 (ou
0,64): 16 lves (ou 64% des lves) ont une taille strictement infrieure 175 cm.2- Au point A4: 22 lves (ou 88 % des lves) ont une taille strictement infrieure 180 cm.3- Au point A0: aucun lve n'a une taille strictement infrieure 160 cm.
Cumul dcroissant:1- Interprtation du point B2 de coordonnes: taille = 170 cm, frquence cumule = 17 (ou 0,68): 17
lves (ou 68% des lves) ont une suprieure ou gale 170 cm.2- Au point B3: 9 lves (ou 36 % des lves) ont une taille suprieure ou gale 175 cm.3- Au point B5: aucun lves n'a une taille suprieure ou gale 185 cm.
Montant(en milliers de DH)
2000 - Btons verticaux
1500 -
1000 -
500 -
0
Nord Est Centre Sud Ouest Rgions
Les graphiques en btons sont bien adapts au tableau de rpartition. La langueur dun bton est proportionnelle
au chiffre daffaires correspondant.Les graphiques en barres sont moins bien reprsentatifs du cas tudi ; en effet, une barre doit tre interprtepar la surface et non par la longueur ; pourtant les graphiques en barres, tant plus esthtiques, sont davantageutiliss. Pour quils significatifs, il faut prendre la prcaution dattribuer la mme largeur chaque barre. Cetteprcaution nest cependant pas suffisante : pour que les chiffres daffaires puissent tre interprts parlintermdiaire de la longueur des barres, il faut que la largeur de chaque barre soit gale lunit de mesure(souvent 1 centimtre, 1 millimtre).
Une srie statistique est labore en vue dtre analyse ou compare dautre srie. Cette comparaisonou cette analyse se fait laide de certains caractristiques parmi lesquelles nous retenons pour linstant lescaractristiques de tendance centrale. Pour se faire il faut caractriser chaque srie statistique par un nombreunique qui rsume la srie en question et donne une ide sur lordre de grandeur ou le niveau gnral du caractretudi.
Le choix de ce nombre unique appel valeur type peut tre fait arbitrairement. Seulement dans ce cas il nepermet pas de donner un bon jugement du caractre tudi. Cest ainsi quune valeur type doit rpondre certainsnombre de conditions connues sous le nom de conditions de YULE.
1/ La valeur type doit tre objective.2/ Elle doit tenir compte de toutes les observations.
3/ Avoir une signification concrte, simple concevoir.4/ Etre simple calculer.5/ Etre peu sensible aux fluctuations dchantillonnages.
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 13 sur 30
7/30/2019 Les Statistiques dscriptives
14/30
7/30/2019 Les Statistiques dscriptives
15/30
STATISTIQUES DESCRIPTIVES
B1 + B2
X1 X2 X3 X4 La classe modale est 15 20X2 = 15B1 = 7 3 = 4B2 = 7 6 = 1
Donc Mo = 15 + ( 4 ) x 5 = 194 + 1
Ce qui est diffrent du centre
du classe = 17,5
-
La dtermination est immdiate aussi bien par le graphique qu laide du tableau statistique. Sasignification est vidente car il est intressant ce connatre la valeur de la variable qui revient le plussouvent au cours dobservation.
-
- Le calcul du mode ncessite les classes de mmes amplitudes
- Lorsque la rpartition est multi - modale (plusieurs modes).Le mode perd alors toute signification, il est rejet comme mesure de tendance centrale.- La classe modale doit correspondre un effectif nettement plus lev que les autres effectifs.
Pour ces raisons le mode est peu utilis comme caractristique de tendance centrale.
La mdiane dune srie est la valeur Me du caractre tel que ; les observations classes dans un ordre, lenombre dunits statistiques prsentant des valeurs infrieures Me est gale au nombre dunit statistiqueprsentant des valeurs suprieures Me.
:
Un candidat un examen a obtenu les notes suivantes, sur 20 au cours despreuves quils a d subir :
Rangeons dans lordre croissant les notes obtenues par ce candidat, la note 7 (coefficient 2) tant critedeux fois et la note 12 (coefficient 3) tant crite 3 fois :
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 15 sur 30
7/30/2019 Les Statistiques dscriptives
16/30
STATISTIQUES DESCRIPTIVES
7 - 7 - 8 - 10 - 11 - 12 - 12 - 12 - 14
Dans la srie ainsi crite et qui compte neuf termes, 9 tant la somme des coefficients, on dira que la notemdiane est 11 car les notes infrieures 11 sont au nombre de quatre et les notes suprieures 11 sontgalement au nombre de quatre.
Si le candidat en question avait subi une preuve supplmentaire avec coefficient 1, et obtenu cette
preuve la note 6 lordre des notes :
6 - 7 -7 - 8 - 10 - 11 - 12 - 12 - 12 - 14
Les notes tant cette fois au nombre de 10 on aura un intervalle mdian (10, 11) , o la rigueur unemdiane gale 10,5 centre de lintervalle mdian ( 10 + 11 ) = 10,5
2
supposons maintenant que le candidat ait subi une autre preuve, avec coefficient 3, ce qui porte 13 lasomme des coefficients et quil ait obtenu cette preuve la note 17. la srie des notes se prsentent alors commesuit :
6 - 7 - 7 - 8 - 10 - 11 - 12 - 12 - 12 - 14 - 17 - 17 - 17
Le nombre des notes tant 13, nous sommes conduits chercher la note de 7 me rang, qui laisse 6 notes gauche et 6 notes droite. Cette note est 12.Cependant 12 nes pas la note mdiane car si nous avons bien 6 notes infrieures 12 nous navons pas 6 notessuprieures 12, en effet parmi les notes crites droite de 12 seules 4 notes sont suprieures 12.
Nous pouvons en conclure que, lorsque la variable statistique est discontinue, il ny a pas, en gnral, devaleur mdiane.
Ainsi dans lexemple des enfants charge, les nombres denfants peuvent tre crits.
Le 20me est un 2, nombre qui ne rpond pas la dfinition de la mdiane.
:
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 16 sur 30
7/30/2019 Les Statistiques dscriptives
17/30
STATISTIQUES DESCRIPTIVES
nous allons reprendre lexemple de 40 agents de DA/AC classs saprs leur salaire, et utiliser dabord lacolonne des coefficients cumuls croissants.
La lecture de ce tableau nous montre que 18 agents ont un salaire infrieur 5,5 DH, et 28 ont un salaire
infrieur 6,5 DH ; pour chercher le salaire du 20me agent ( 20 = 40 / 2 ).Nous pouvons dj affirmer que lesalaire mdian cherch se situe entre 5,5 et 6,5.
Pour donner un rsultat plus prcis ; formulons lhypothse que les salaires des 10 agents qui touchent auplus 6,5 DH se rpartissent uniformment sur lintervalle 5,5 6,5Nous avons alors le schma suivant :
La valeur mdiane sera alors donne par interpolation par parties proportionnelles ou interpolation linaire lintrieur de lintervalle 5,5 6,5 et nous obtenons :
Nous pouvons schmatiser le calcul de la mdiane de la faon suivante :10
Effectifs Cumuls 18 20 28 10 = 1
2 x2
1x
x= 2x1 Valeurscorrespondantes 5,5 6,5 10
x = 0,2
fic nicen %
100 % 40
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 17 sur 30
7/30/2019 Les Statistiques dscriptives
18/30
STATISTIQUES DESCRIPTIVES
90 %
75 % 30
50 % 20
25 % 10
10 %
3,5 4,5 5,5 6,5 7,5 8,5 9,5
La mdiane est dun calcul assez facile, puisque en fait elle rsulte presque dune lecture aprs classementdes observations.
Elle donne une ide statistique de la tendance centrale dune srie statistique, elle nest pas influence parles valeurs aberrantes qui pourraient figurer dans la srie.
La mdiane a des inconvnients de ses avantages. Dpendant plus de rang des units statistiquesobserves que des valeurs de la variable elle nest pas calcule suivant une formule mathmatique.
Soient, rangs par ordre croissant , les salaires horaires de 10 agents de DA/AC :4,35 4,55 4,75 4,36 5,01 5,12 5,19 6,46 7,75 9,40
La moyenne arithmtique des salaires ci-dessus est :4,35,+ 4,55 + 4,75 + 4,36 + 5,01+5.12 + 5,19 + 6,46 + 7,75 + 9,40 = 5,694
10dans lanalyse statistique les termes dune srie statistique sont habituellement prsents par le symboles :
x1, x2, x3 xi, xn.ntant le nombre de termes de la srie.La moyenne arithmtique de ces termes est alors reprsente par le symbole et la somme x1 + x2 + x3 +
.. + xi xn par le symbole xi ou de faon plus prcise par xi (somme des xi pour ivariant de 1 n )
avec ces conventions on peut crire :
x = xin
A partir de la srie statistique portant sur le nombre denfants charge de 40 agents de DA/AC ;cherchons calculer le nombre moyen denfants par agent.
Le raisonnement est le suivant :2 agents ont chacun 0 enfant, soit en tout 0 enfant7 agents ont chacun 1 enfant, soit en tout 7 enfants
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 18 sur 30
7/30/2019 Les Statistiques dscriptives
19/30
STATISTIQUES DESCRIPTIVES
14 agents ont chacun 2 enfants, soit en tout 28 enfants10 agents ont chacun 3 enfants, soit en tout 30 enfants
4 agents ont chacun 4 enfants, soit en tout 16 enfants2 agents ont chacun 5 enfants, soit en tout 10 enfants1 agents ont chacun 6 enfants, soit en tout 6 enfants
40 agents ont ensemble 97 enfants
le nombre moyen denfant charge est donc : 97 = 2,4240
le raisonnement qui vient dtre fait se traduit par le tableau de calculs suivants :
0123456
271410421
07283016106
Le nombre moyen cherch est :x = xi ni = 97 = 2,425
ni 40
Reprenons le tableau de la page 13 relatif aux salaires horaires des 40 agents de DA/AC et calculons lesalaire moyen de cette srie.
Dans ce cas les valeurs sont reprsentes sous forme de classes, pour calculer la moyenne arithmtique ;on prend les centres de classes comme valeurs observes.
3,5 4,5
4,5 5,55,5 6,56,5 7,57,5 8,58,5 9,5
4
56789
3
1510651
12
757042409
Nous venons de calculer les moyennes arithmtiques sur deux exemples de sries statistiques en utilisantla formule :
x = xi ni ni
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 19 sur 30
7/30/2019 Les Statistiques dscriptives
20/30
STATISTIQUES DESCRIPTIVES
dans la quelle chaque xi observe de la variable x tait pondre par leffectif ni qui lui correspondait. Cest--direque chaque valeur de x intervenait dans le calcul de la moyenne un nombre de fois gal au nombre de fois ocette valeur avait t observe. La moyenne arithmtique est dite moyenne arithmtique pondre.
Le salaire moyen est donc :
x = 238 = 5,95 DH
40
y = ni xi = ni (xi + c) = ( ni xi + ni c )N N N
= ni xi + ni c = ni xi + c nini ni ni ni
y = x + c
(x + c ) = x + c
Somme des carts par rapport la moyenne arithmtique est gal zro.
Calcul de la moyenne arithmtique par changement de variableLe calcul de la moyenne arithmtique peut tre simplifi normment si on utilise un changement de
variable judicieuse permis par les proprits de la moyenne arithmtique que nous avons vu prcdemment.On adopte une moyenne provisionne x0 qui peut tre gale au centre de lune quelconque des intervalles.(ce calcul est utilis uniquement dans le cas de classes de mmes intervalles ).Utilisant les proprits de la moyenne arithmtique.
x = xi-x0 (K tant lamplitude de classes )k
_ _ _on a x = x x0 k x = x - xo
k
Tableau de calcul (exemple des salaires des 40 agents de DA/AC).k = i on prend xo = 6
3,5 - 4,54,5 - 5,55,5 - 6,56,5 - 7,57,5 - 8,58,5 - 9,5
456789
31510651
-2-10123
-2-10123
-6-1506103
_x = - 2
40_ = -0,05x = ( -0,05 x 1 ) + 6
_x = 5,95
La moyenne arithmtique prsente linconvnient dentraner des calculs parfois longs, et dtre influencepar les valeurs aberrantes de la variable ( valeurs exagrment faibles ou fortes ).
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 20 sur 30
_
x = k x + xo
7/30/2019 Les Statistiques dscriptives
21/30
7/30/2019 Les Statistiques dscriptives
22/30
STATISTIQUES DESCRIPTIVES
.
Notesxi
151297
3
2322
1
1,1761,0790,9540,845
0,477
2,3523,2371,9081,690
0,477
Log G = 9,66 = 0,966410
G = 9,255Le calcul de la moyenne gomtrique prsente toujours un intrt et a toujours une signification lorsque
les valeurs observes de la variable, mises on ordre croissant ou dcroissant sont en progression gomtrique.
Montrons dabord dans quels problmes on peut tre conduit calculer une moyenne harmonique.
Supposons quune entreprise dispose de 2 voitures automobiles dont la consommation respectives decarturant, pour une distance de 10 Km, sont de 20 titres et 10 titres lentreprise se propose de calculer laconsommation moyenne de carturant, pour 100 Kilomtres, des deux voitures en question.
Nous pouvons, bien entendu, calculer la moyenne arithmtique des consommations qui sera gale 30/2=15 : aux 100 Km.
Mais nous pouvons aussi tenir le raisonnement suivant :Le premier vhicule permet de couvrir avec 1 L de carburant 100/20 = 5KmLe second vhicule permet de couvrir avec 1 L de carburant 100/20 = 10Km
En moyenne, les deux automobiles permettent donc de parcourir avec 1 L de carburant5 + 10 = 7 Km 500
2Et en moyenne, la consommation de carburant aux 100 Km sera donc de 100/7,5 = 13,33 litres. Rsultat diffrentdes 15 L prcdemment obtenu.Nous venons de calculer la moyenne harmonique des deux quantits 20 et 10 moyenne qui satisfait la relation :N = n1 + n2 +.nk ( avec N= ni ).
H x1 x2 xk
Ce qui peut aussi dcrire :1
1 = ni . xi etH ni
snonce " Linverse de la moyenne harmonique est gale la moyenne arithmtiques des inverses des valeurs dela variable" .
Soient deux pays voisins dgale population, dans le premier il y a 4 habitants pour une voiture , dans lesecond il y a 12 habitants pour une voiture .
Quel est le taux dquipement ?La rponse nest pas la moyenne arithmtique de 4 et 12 (4 + 12 = 8)
2
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 22 sur 30
7/30/2019 Les Statistiques dscriptives
23/30
STATISTIQUES DESCRIPTIVES
Mais leur moyenne harmonique 1 = 1 ( 1 + 1 ) = 1 donc H + 6H 2 4 12 6
En effet, les deux pays tant galement peupls, il y a 3 voitures pour 12 habitants dans le premier et unevoiture pour 12 habitants dans le second, soit 4 voitures pour 24 habitants do 1 voiture pour 6 habitants.
123456
2231201141
1,000,500,330,250,200,167
22,0015,506,672,750,800,17
Nous aurons 1 / H = 47,89 / 89 do H = 89 / 47,89 = 1,86Le calcul de la moyenne harmonique sera intressant chaque fois que lon pourra donner un sens aux nombresinverses des valeurs de la variable statistique.
Toutes les moyennes que nous venons de rencontrer remplissent leur rle, qui est de donner en un seulchiffre ide de la valeur centrale dune srie statistique.
Cependant leurs dfinitions ; leurs modes de calcul nous conduisent donner la prfrence la moyennearithmtique.
Indiquons encore, que les trois moyennes retenues satisfont toujours aux conditions dingalit :H < G < X
Rappelons enfin que ces moyennes dont le rle est de rsumer une srie statistique, sexpriment dans lamme unit que la variable tudie.
La moyenne et sauf exception, la moyenne arithmtique est gnralement la meilleure caractristique
de tendance centrale.- Elle dpend de la valeur de toutes les observations.- Elle est dfinie sans ambigut, et correspond une notion bien comprise du public.- Elle se prte aux calculs algbrique et nest que relativement peu sensible aux fluctuations dchantillonnage.
La mdiane est facile dterminer, puisquelle nexige aucune opration arithmtique mais un simpleclassement des termes.
Mais elle est moins connue du public, et sensible que la moyenne aux fluctuations dchantillonnage . Ellese prte assez mal aux calculs algbriques et ne convient gure la reprsentation des caractres discontinus.
Elle limine leffet des valeurs aberrantes ce qui lui confre un avantage sur la moyenne si du moins, lasrie comporte des valeurs effectivement aberrantes.
Sa valeur descriptive est toujours intressante puisquelle exprime le cas qui a autant de chances dtredpass que de ne pas dtre.
Lintrt pratique du mode est incontestable, puisquil reprsente le cas le plus courant, la valeur-type quimrite dtre particulirement tudie. Cette notion est parfaitement comprise du public.
Mais sa dtermination est souvent ambigu, surtout si le caractre tudi est continu, et elle nest gureaccessible par voie dchantillonnage :
Le mode de lchantillon risque dtre trs diffrent de celui de lensemble dont il a t extrait.Lapparition de plusieurs modes correspondant aux diverses varits dmontrera lheterogeneit de
lensemble tudi dcoulant elle mme dune dfinition insuffisante de lunit statistique.Lorsque la distribution est parfaitement symtrique les trois paramtres X, Me, Mo, sont alors gaux .Si la distribution est uni modale et modrment asymtrique les trois caractristiques se trouvent lies,
approximativement par la relation :(x - Mo ) = 3(x - Me)
qui permet, lorsque deux caractristiques sont connues destimer la troisime.
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 23 sur 30
7/30/2019 Les Statistiques dscriptives
24/30
STATISTIQUES DESCRIPTIVES
La valeur centrale ne fournie quune reprsentation trs insuffisante de lensemble tudi, si lonignore comment les termes se groupent autour de cette valeur.
Deux sries de rpartition peuvent avoir la mme moyenne est tre diffrentes lune de lautre.
cette diffrence peut tre remarquer dans la dispersion de chacune des 2 rpartition. Pour celanous nous posons la question suivante : Dans quel cas la moyenne calcule dans les deuxrpartitions est significative (a un sens) ?
:Srie 1 srie 2X1 = 2 y1 = 48X2 = 98 y2 = 52X = 50 y = 50
X nest pas significative les valeurs y plus sens car les valeurs sont prochesSont trs diffrentes, elles sont trs lune de lautre
Disperses lune de lautre.
Nous sentons alors le besoin de caractriser toute rpartition par une mesure de dispersion pour ainsipouvoir comparer des sries, pour la comparaison desquelles les caractristiques de tendance centrale sesoit avres tre des instruments insuffisants.Nous nous limiterons tudier la variance et lcart-type .
Calcul de la variance
La variance est la moyenne arithmtique des carrs des carts des valeurs de la variable leurmoyenne arithmtique.
V = ( xi x )2 ni ni
La variation des 10 salaires est donc
V = 1,412 + 1,202 + 1,002 + 0,792 + 0,742 + 0,632 + 0,562 + 0,702 + 1,992 + 3,64210
= 23,77 = 2,37710
mais ce rsultat sexprime en dirhams au carr unit dont la comprhension est videmment peuaccessible et, pour retrouver un nombre sexpriment en dirhams, comme les termes mme de la srie lon
se trouve naturellement amen prendre la racine carr de la variance . On dfinit ainsi une nouvellecaractristique de la dispersion, appele cart-type (dsign gnralement par la lettre grecque sigma)et dont limportance en analyse est primordiale.
= 2,377= 1,54
En effet lcart type et la variation se prtent bien aux combinaisons algbriques.Tableau de calcul de lcart type pour une srie classe (exemple de la srie des 40 salaires)
3,5 4,54,5 5,55,5 6,5
456
31510
127560
-1,95-0,950,05
3,80250,90250,0025
11,407513,53750,0250
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 24 sur 30
7/30/2019 Les Statistiques dscriptives
25/30
STATISTIQUES DESCRIPTIVES
6,5 7,57,5 8,58,5 9,5
789
651
42409
1,052,053,05
1,10254,20259,3025
6,615021,01259,3025
Il est vident que la somme algbrique des carts avec la moyenne (pris avec leur signe) seratoujours nulle, aussi additionne t-on les carts absolus.
Lcart absolu moyen est gal la moyenne arithmtique des carts absolus de toutes les valeurs
par rapport la moyenne :
e = xi xN
Exemple : soit la srie dix salaires4,35 4,55 4,75 4,96 5,01 5,12 5,19 6,46 7,75 9,4005,754 5,754 5,754 5,754 5,754 5,754 5,754 5,754 5,754 5,754
- 1,414 -1,204 -1,004 -0,794 -0,744 -0,634 -0,564 + 0,706 + 1,996 + 3,646
e = 1,414 + 1,204 + 1,004 +0,794 + 0,744 + 0,634 + 0,564 + 0,706 + 1,996 + 3,646
10= 12,706 = 1,27
10
Dans le cas des observations groupes par classe lcart moyen est calcul comme moyenne arithmtiquepondre.Exemple de la srie classe des salaires des 40 agents de DA/AC.
3,5 4,54,5 5,55,5 6,5
6,5 7,57,5 8,58,5 9,5
456
789
31510
651
127560
42409
-1,95-0,950,05
1,052,053,05
5,8514,250,50
6,3010,253,05
e = xi x .ni = 40,20 = 1,005 ni 40
v = 61,9/40 = 1,5475
= 1,24
Lcart type mesure la dispersion autour de x , et plus que sa valeur est grande plus la dispersion desobservations autour de la moyenne est importante.
Le calcul de la variation nous a conduit calculer la quantit . (xi x )2 nisi on dveloppe lidentit ( xi x )2 on obtient :( xi - x ) 2 ni = xi2 ni 2 x xi ni + x 2 niOr nous savons que :
x = xi ni do xi ni = x ni ni
Alors (xi x )2 ni = xi2 ni 2 x 2 ni + x 2 ni= xi2 ni - x 2 ni
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 25 sur 30
7/30/2019 Les Statistiques dscriptives
26/30
STATISTIQUES DESCRIPTIVES
do v = (xi x )2 ni = xi ni2 - x 2 ni ni ni
v = ( xi2 ni/ ni ) - x 2 = vFormule dvelopp du calcul de la variance
3,5 4,54,5 5,55,5 6,56,5 7,57,5 8,58,5 9,5
456789
31510651
12756042409
4837536029432081
V = 1478/40 (238/40)V = 1,5475
= 1,5475 = 1,24
Prenons le tableau de calcul de la moyenne arithmtique par changement de variable et calculons lavariance par la formule dveloppe : K= 1 , xo = 6
3,5 4,54,5 5,58,5 - ,56,5 7,57,5 8,58,5 9,5
456789
31510651
-2-10123
--10123
-6-1506103
121506209
x = -2 /40 = -0 ,05
x = ( -0 .05 x 1) + 6 = 5.95
= K xi ni / ni - x
=
Le coefficient de variation
Toutes les mesures de dispersion que nous avons vu sont des mesures absolues car elle sexpriment enunit de caractre et dpendent du niveau gnral de ce mme caractre . Cest ainsi que nous introduisons desmesures de dispersion relatives en prenant le rapport des mesures absolues tudies sur la mesure de tendancecentrale .
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 26 sur 30
7/30/2019 Les Statistiques dscriptives
27/30
STATISTIQUES DESCRIPTIVES
La mesure la plus utilise est : lcart type relatif appel coefficient de variation :
Cv = / x
Si les deux populations ont le mme niveau gnral ( peu prs la mme moyenne ) on utilise lesmesures absolues pour faire la comparaison de la dispersion .
La mesure de la dispersion relative sera utilise uniquement lorsque les deux populations ont deux niveaux
diffrents . De mme que ces mesures seront utilises lorsqu il sagit de comparer la dispersion de deuxcaractres diffrents pour une mme population .
Ainsi et ds ce premier contact, le lecteur aura pu prendre conscience des possibilits, des sujtions, et des limitesde loutil statistique :
La statistique se propose de rsoudre des problmes qui, rigoureusement parlant , sont insolubles ; elle nepeut le faire que grce ladoption de certaines conventions. La plus part de ces conventions ne sont pas absurdeet sont recueillies .
La valeur des rsultats obtenus en statistiques est fonction des conventions adoptes et leur interprtation
doit toujours se faire fonction de la nature du domaine ex
A un examen on a relev pour 100 candidats les notes suivantes :
1. Tracer l'histogramme des effectifs et le polygone des effectifs cumuls croissants.
2. Calculer la mdiane et la moyenne de cette srie.
On donne le tableau statistique suivant :
1. Quel est le mode et la mdiane de cette distribution ?
2. calculer la moyenne, la variance et l'cart type.
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 27 sur 30
7/30/2019 Les Statistiques dscriptives
28/30
STATISTIQUES DESCRIPTIVES
1- Pour la population tudie : 100 candidats.Le caractre statistique retenu (note obtenue lexamen) est un caractre quantitatif.
La variable statistique (valeur de la note) est continue et par consquent les classes sont dfinies pardes intervalles
.Daprs les donnes, les classes ont t choisies damplitude gale 2.Compltons le tableau statistique par la colonne des effectifs cumuls dcroissants.
[ 0, 2 [[ 2, 4 [[ 4, 6 [[ 6, 8 [[ 8,10 [
[10,12[[12,14[[14,16[[16,18[[18,20[
32151420
231255
1
35203454
77899499100
- Ne confondez pas le polygone des effectifs cumul et le polygone des effectifs figur enpointill sur lhistogramme
-
n= 100 n/2 =50Daprs le calcul des effectifs cumuls, nous savons que leffectif 50 est atteint dans la classe [8,10[
8 correspondant leffectif 3410 correspondant leffectif 54
Donc pour leffectif 50=34+16m=8+2x16/20=9,6
On peut considrer que 50 candidats ont obtenus une note infrieure 9,6 et 50 candidats ontobtenu une note suprieur 9,6.
Daprs le polygone des effectifs cumuls, m est labscisse du point dordonne 50.
Calcul de la moyenne
On dtermine au pralable les centres des classes xi, puis on calcule les produits ni xi .
13579
11131517
32151420
231255
367598180
2531567585
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 28 sur 30
7/30/2019 Les Statistiques dscriptives
29/30
STATISTIQUES DESCRIPTIVES
19 1 19
x = 950/100 =9.59.5 est la note moyenne obtenue sur lensemble des 100 candidats.
1 . Le monde est la valeur de la variable d effectif maximum.m =25
La mdiane partage la srie en deux groupes de mme effectifs.
20253035
4045
1015108
52
10253543
4850
Or, on constate que :- pour les valeurs de la variable infrieures ou gales 25 le nombre dobservations releves
est :10 + 15 =25
- pour les valeurs de la variable suprieurs ou gales 30 le nombre dobservations est :10 + 8 + 5 + 2 =25
Il y a donc deux valeurs possibles de la mdiane :m=25 ou m=30
On peut aussi prendre pour mdiane le milieu de lintervalle mdian [25,30[.Soit, m=27,5
ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 29 sur 30
HISTOGRAMME
0
5
10
15
20
25
de2
4
de6
8
de10
12
de14
16
de1820
NOTE
EFFECTIFS
Nombre de
candidats
Polygone des e ffectifs cumuls
0
20
40
60
80
100
120
Notes
moinsde2
de4
6
de810
de12
14
de16
18 note
effectifscummuls
Srie1
7/30/2019 Les Statistiques dscriptives
30/30
STATISTIQUES DESCRIPTIVES
202530354045
101510852
400625900122516002025
400093759000980080004050
20037530028010090
La moyenne est : x = 1/n ni .xi1
Soit : x = 1445/50 =28,9
La variance est donne par la formule :k
V= 1/n ni.xi- x 1
Do : V = 1/50 x 44225 (28,9)
Lcart-type est la racine carr positive de v .
Do : = 49,29 = 7,02
Remarque : Pour allge les calculs, on pouvait effectuer le changement de repre dfini par : xi =30 + ui ( par exemple).
Sachant que , dans ce cas :
X = 30 + u et V = 1/nni.ui - u
20
2530354045
10
1510852
- 10
- 5051015
100
25025100225
1000
3750200500450
- 100-175
- 7504050 + 12030
u = - 55/ 50 = - 1,1 ; x = 30 1,1 = 28,9V = 2525 /50 =