Les Statistiques déscriptives

Embed Size (px)

Citation preview

  • 7/30/2019 Les Statistiques dscriptives

    1/30

    STATISTIQUES DESCRIPTIVES

    A)

    B)

    Cest la prsentation la plus commode du point de vue statistique.

    Un tableau statistique est un tableau regroupant tous les chiffres obtenus partir dune Enqute ou tout untravail de collecte de linformation chiffre sur un phnomne quelconque.

    a) Tableau statistique simple entre (ou une entre) :

    Le tableau le plus simple sera celui o figureront deux colonnes rserves respectivement :- La premire, linscription des valeurs du caractre dsign par Xi.- La seconde, linscription des effectifs correspondants dsigns par ni ;

    Exemple : distribution statistique de 40 agents de la division administrative Casablanca daprs le nombredenfants charge.

    Nombre denfants charge x i Effectifs ni

    0123456

    271410421

    Somme de ni = N= 40Dans cet exemple la variable est discrte ( ou discontinue) et prend les 7 valeurs :X1 =0 ; X 2 = 1 ; X3 =2 ; X4 = 3 ; X5 = 4 ; X6=5 ;X7=6

    A chacune des valeurs correspond un effectif :N1=2 ; n2=7 ; n3=14 ; n4=10 ; n5=4 ; n6=2 ; n7=1

    La srie statistique (ou distribution statistique) est donc lensemble des 7 couples :(x1 , n1) ; (x2 , n2) (x7 , n7)et nous dirons la srie (xi, ni) , lindice i prenant les valeurs 1,2,3,4,5,6 et 7. La somme des effectifs niest leffectif total N de la population tudie.

    N = n1 + n2 + n3..+ n7Ce que lon note N = ni

    Et ce qui ce lit somme de i galant 7 des n indice i Dans le cas dune variable continu on procde un regroupement des donnes par classes. Cecidans le but de simplifier aussi bien la reprsentation de la srie que les calculs.Exemple : Si on tudie la population des 40 agents de DA/AC de point de vue leur salaire (tauxhoraire) on obtient la srie suivante.

    4,75 6,46 4,35 7,75 5,19 9,40 5,62 4,96 5,01 4,55 5,10 7,75 6,81 5,79 5,19

    5,12 8,14 7,31 7,10 5,54 4,35 4,55 5,80 5,17 6,28 8,27 4,96 5,15 6,37 4,745,45 4,35 6,64 ; 6,64 4,90 7,95 6,28 7,31 5,62 6,37Les valeurs ont t arrondies 2 chiffres aprs la virgule

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 1 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    2/30

    STATISTIQUES DESCRIPTIVES

    Il est bien certain que dans pareil cas, pour pouvoir dresser une statistique, il faudra diviser le domainede la variable, ici de 4,35 9,40 en classes de prfrence damplitude constante.

    On appelle effectif dune classe de valeurs comprises dans cette classe.

    ClassesAmplitude 1 DH

    Effectif

    3,50 4,50

    4,50 5,505,50 6,506,50 7,507,50 8,508,50 9,50

    3

    1510651

    Total 40

    On a pralablement dcid que la limite suprieure de la classe ne fait pas partie de la classe. Lesclasses sont donc :

    3,50 moins de 4,504,50 moins de 5,50

    .etc.

    Le choix du nombre de classe et de lamplitude dune classe, varie avec la statistique quon doit tablir.Un nombre trop petit de classes conduit regrouper des valeurs observes de la variable queprsentent entre elles des diffrences sensibles et donc enlverait beaucoup de prcision lastatistique obtenue.

    Un trop grand nombre de classes donnerait sans doute des renseignements assez prcis, maisentranerait aussi un grand nombre de calculs.En rgle gnral il peut tre recommand de ne pas dpasser si possible, 15 20 classes et de ne pasdescendre au del de 6 classes.

    Les lments dune classe : (exemple la classe 3,50 4,50)

    - On appelle limite (ou borne) dune classe le nombre entre lesquels on renonce tudiersparment les valeurs du caractre :

    Ici : limite infrieure = 3,50limite suprieure = 4,50

    - On appelle amplitude (ou intervalle) dune classe la longueur du segment form par ses limitesIci : lamplitude = 4,50 3,50 = 1

    - On appelle centre de classe le milieu du segment form par ses limitesIci : le centre de classe = (3,50 + 4,50) / 2 = 4

    Le tableau des effectifs ou distribution statistique

    SalaireClasse(Amplitude 1 DH )

    Centre declasses

    Effectifs

    3,50 4,504,50 5,505,50 6,506,50 7,507,50 8,508,50 9,50

    456789

    31510651

    Total - 40

    Remarque :Dans le tableau prcdent on a incorpor le centre de classe, ceci est dans le but de

    reprsenter chaque classe par son centre.

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 2 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    3/30

    STATISTIQUES DESCRIPTIVES

    Frquence (frquence relative)Le rapport de leffectif ni attach la valeur xi du caractre, leffectif total est la frquence de lavaleur xi du caractre :

    fi = ni/N = ni/niPar exemple au tableau prcdent, nous ajoutons une colonne frquence o seront portes lesfrquences de chaque classe, cest dire les nombres :3/40 = 0,075 ; 15/40 = 0,38 ; 10/40 = 0,25 ; 6/40 = 0,15 ; 5/40 = 0,12 ;1/40 = 0,025

    dont la somme est 1 car3/40 + 15/40 + 10/40 + 6/40 + 5/40 + 1/40 = 1En multipliant la frquence ni par 100 on obtient le taux du pourcentage de N que reprsente n i

    Effectifs cumuls :Les effectifs peuvent donner lieu la prsentation de colonnes deffectifs cumuls (cumulscroissants ou dcroissants) permettant de rpondre aux deux types de questions suivantesdans le cas prcdents :

    - Quel est le nombre dagents touchant moins de 6,50 DH ?- Quel est le nombre dagents touchant au moins de 6,50 DH (6,5 dh ou plus de6,5dh) ?

    On aura le tableau suivant :

    Colonne 1 Col 2 Col 3 Col 4 Col 5 Col 6 Col 7 Col 8SalaireClasse(unit 1 dh)

    Effectifni

    Frquencefi =ni/N

    %Frquencesni/N 100

    Effectifscumulscroissants

    Frquenceen %cumulescroissantes

    Effectifscumulsdcroissants

    Frquenceen %cumulesdcroiss

    3,50 4,504,50 5,505,50 6,506,50 7,507,50 8,508,50 9,50

    31510651

    0,0750,3800,2500,1500,1200,025

    7,5382515122,5

    31828343940

    7,545,570,585,597,5100

    4037221261

    10092,554,529,514,52,5

    TOTAL = N 40 1,000 100 - - - -

    Interprtation des cumuls figurant dans les colonnes 5,6,7 et- Colonne 5 : ses cumuls donnent les rponses aux questions du premier type :

    3 agents touchant moins de 4,50 dh18 agents touchants moins de 5,50 dh28 agents touchants moins de 6,50 dh

    - Colonne 6 : 8% des agents touchant moins de 4,50dh- Colonne 7 : ses cumuls donnent les rponses aux questions du second type :

    40 agents touchent au moins de 3,50dh37 agents touchent au moins de 4,50dh12 agents touchent au moins de 6,50dh

    - Colonne 8 : 55% des agents touchent au moins 5,50 dhb) Tableau statistique double entre (2 caractres)

    Nous nous sommes jusquici limit dans ltude des units statistiques lobservation sur chaque unit,dun seul caractre . Or, il est souvent possible sur une mme unit dobserver deux ou plusieurs caractres.La traduction, par un tableau, de lobservation de deux caractres sur uni unit statistique se fera laide

    dun tableau double entre :Exemple : Rpartition des 40 agents de DA/AC selon leur salaire et le nombre denfants charge.

    Interprtation des nombres ports dans le tableau :

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 3 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    4/30

    STATISTIQUES DESCRIPTIVES

    - 1 agent dont le salaire est compris entre 3,50 et 4,50 a 0 enfants charge.- 8 agents dont le salaire est compris entre 4,50 et 5,50 ont 2 enfants charge.

    C)

    Les lments dun tableau statistique sont les suivants :- Le titre il indique lobjet du tableau, le titre gnralement utilis est le suivant : cest la

    rpartition dun ensemble statistique selon un ou plusieurs caractres .- Titres des lignes et des colonnes : il prcise le contenu du tableau cest dire les donnes fournies

    par ce tableau ( les effectifs ou frquences absolues, les donns en pourcentage ou frquences

    relatives).- Des notes ou remarques pour faciliter la lecture des chiffres aux non statisticiens.- La source : elle indique lorigine ou la rfrence de linformation chiffre fourni par un tableau.

    Cette indication permet au lecteur du tableau qui dsirerait un complment dinformation de sereporter lorigine des informations.

    - Prsentation : la prsentation matrielle du tableau statistique dpend pour beaucoup de sesdimensions. (nombre de lignes ou de colonnes). On veillera la clart, qualit essentielle. Onrendra la lecture facile laide dune typographie soigne.

    II- Reprsentation graphique :Lune des mthodes de prsentation des rsultats est la prsentation graphique qui consiste schmatiser

    les donnes numriques obtenues par de grandeurs ou des figures gomtriques. Lintrt de cette mthode deprsentation est de fournir, par simple examen visuel une ide gnrale sur la variation du phnomne tudi.

    Un graphique permet aussi de faire un contrle des rsultats partir des anomalies ou discontinuit quipeut se prsenter cest aussi un moyen de comparaison de variation dun mme caractre entre deux ensemblediffrents. Par ailleurs son inconvnient est quil nglige certains dtails et ne permet pas de donner avec prcisionle mme enseignement que peut fournir un tableau statistique ; ce qui limite lutilisation des graphiques dans desanalyses trs pousses.

    Un bon graphique doit tre simple et claire pour ne pas donner une fausse impression visuelle donc unefausse interprtation. Un graphique doit porter les lments suivants :

    - Un titre indiquant la nature du phnomne quil reprsente .- Des indications ( lgende, chelle, etc .) prcisant la correspondance entre les lments du

    graphique et la nature du caractre. Selon cette nature nous distinguons diffrentes reprsentationsgraphiques :

    DIFFERENTES CATEGORIES DE GRAPHIQUES

    Types de variablesou caractres de distribution Graphiques utilisables

    Distributions- Caractre qualitatif

    barres verticales, horizontalesdiagrammes en btonssecteurfigurescartes

    - Caractre quantitatif Discontinu (ou discret)

    Continu

    diagrammes en btonsdiagrammes en segments cumulatifshistogrammes, pyramidespolygones de distributionPolygones de cumuls

    Sries chronologiques barres verticalesgraphiques cartsiensgraphiques semi-logarithmiques

    A/1- Graphiques en barre et diagrammes en btonsRpartition du chiffre d'affaires de la Socit VENTOUT au 31/12/1988

    NordEst

    CentreSudOuest

    2 0001 200

    1 4006001 200

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 4 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    5/30

    STATISTIQUES DESCRIPTIVES

    Rgions Btons horizontaux

    Ouest-

    Sud-

    Centre-

    Est-

    Nord-

    0 500 1000 1500 2000 Montants (en milliers de DH)

    Montant(en milliers de DH)2000 - Btons verticaux

    1500 -

    1000 -

    500 -

    0

    Nord Est Centre Sud Ouest Rgions

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 5 sur 30

    Barres horizontal

    0 500 1000 1500 2000 2500

    Nord

    Centre

    Ouest

    Rgions

    M ontant ( m il liers de

    Barres verticales

    0

    500

    1000

    1500

    2000

    2500

    Nord Est Centre Sud Ouest

    Rgions

    Mont

    ant(millie

    DH)

  • 7/30/2019 Les Statistiques dscriptives

    6/30

    STATISTIQUES DESCRIPTIVES

    Les graphiques en btons sont bien adapts au tableau de rpartition. La langueur dun bton est proportionnelleau chiffre daffaires correspondant.Les graphiques en barres sont moins bien reprsentatifs du cas tudi ; en effet, une barre doit tre interprtepar la surface et non par la longueur ; pourtant les graphiques en barres, tant plus esthtiques, sont davantageutiliss. Pour quils significatifs, il faut prendre la prcaution dattribuer la mme largeur chaque barre. Cetteprcaution nest cependant pas suffisante : pour que les chiffres daffaires puissent tre interprts parlintermdiaire de la longueur des barres, il faut que la largeur de chaque barre soit gale lunit de mesure

    (souvent 1 centimtre, 1 millimtre).

    Les graphiques en secteurs font partie de la famille des graphiques ferms, cest dire des graphiques associs un ensemble fini dont les sous-ensembles sont reprsents par des zones proportionnelles leffectifcorrespondant.Un secteur est un sous-ensemble centr sur le milieu dun cercle (graphique circulaire) ou dun demi-cercle(graphique semi-circulaire), dont la profondeur (rayon) est constante (rayon du cercle ou du demi-cercle) et dontla longueur de la larc est proportionnelle un angle et une surface dfinissant un sous-ensemble.B

    Rayons du secteur(8,5 cm)

    Trac dun secteur Longueur de larc(5,47cm)

    40,97grAngle AOB= 36,873

    (ou i ) 0,643555rd0 B A

    Profondeur du secteur = OA = OB (= 8,5 cm sur le schma) Angle AOB : dpend de limportance dun sous-ensemble reprsenter et du choix entre le cercle et le

    demi-cercle.

    Conseils pratiques pour tracer un secteur- calculer la frquence relative de la classe statistique reprsenter (ou effectif relatif particulier dfini

    antrieurement).

    Frquence absolue (ou effectif absolu particulier)Frquence relative =

    Effectif absolu total

    ni nifi = =

    N n1+n2+..+nk ni

    fi =k

    njj=1

    - calculer la valeur de langle du secteur (en grades ou en degrs ou en radians) partir de fi et de la valeur delangle du demi-cercle ( ou du cercle selon le type dhypothse choisie).

    A= 180 ou 200gr ou radians, pour un demi-cercle i = fi x A avec

    A= 360 ou 400gr ou 2 radians, pour un cercle

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 6 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    7/30

    STATISTIQUES DESCRIPTIVES

    - Tracer le rayon infrieur du secteur ( OA par exemple) dont la longueur est de prfrence un nombre entierdunits de mesure (choix proposs : 10 centimtres ou 5 centimtres).

    - Utiliser un rapporteur permettant de tracer le point suprieur du secteur partir du point infrieur ( point B partir du point A dont le secteur AOB).

    Application au chiffre d'affaires de la Socit VENTOUT, au 31/12/1988 :

    Nord

    EstCentreSudOuest

    n1 = 2 000

    n2 = 1 200n3 = 1 400n4 = 600n5 = 1 200

    f1 = 2 000/ 6 400 = 0,31250

    f2 = 1 200/6 400 = 0,18750f3 = 1 400/6 400 = 0,21875f4 = 600/ 6 400 = 0,09375f5 = 1 200/6 400 = 0,18750

    1 = 200 x 0,31250 = 692,5 gr

    2 = 200 x 0,18750 = 37,5 gr3 = 200 x 0,21875 = 43,75 gr4 = 200 x 0,09375 = 18,75 gr5 = 200 x 0,18570 = 37,5 gr

    662,5 x 0,9 = 56,25

    37,5 x 0,9 = 33,7543,75 x 0,9 = 39,37518,75 x 0,9 = 16,87537,5 x 0,9 = 33,75

    Totaux N= 6 400 1 200gr 180

    *0,9 = 180/200.Pour calculer les angles i dans un cercle, il suffit de multiplier les frquences (fi) par 400 grades ou 360degrs, ce qui reprsente deux fois les valeurs des angles (i) calcules en demi-cercle. Le rayon dessecteurs tracs ci-aprs mesure 5 cm ( demi-cercle) ou 2,5 cm (cercle).Les secteurs peuvent tre coloris, hachurs, etc.

    Les graphiques en barres sont ralisable en effectifs absolus ou relatifs et permettent des comparaisons

    Chronologiques en valeurs absolues se qui nest ralisable quen valeurs relatives en graphiques circulairesou semi-cerculaires. deux barres adjacenttes donnent une vision compartive mieux perceptible que deuxcercles cte cte.

    Nord

    31%

    Est

    19%

    Centre

    22%

    Sud

    9%

    Ouest

    19%

    Nord

    Est

    Centre

    Sud

    Ouest

    B/ :

    Diagramme en btonsRparation des notes sur 20 dun devoir de mathmatiques dans une classe de 25 lves.

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 7 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    8/30

    STATISTIQUES DESCRIPTIVES

    Notes Nombre dlves8910111318

    258532

    Total : 25

    8 Frquences absoluesNombredlves

    5-

    3-

    2-

    1-

    8 9 10 11 12 13 14 15 16 17 18 19 20 Notes

    Passage aux segments cumulatifs(fonction de rparation)

    Alors que le diagramme en btons permet de connatre le nombre dlve ayant obtenu une note prcise, lafonction en segments cumulatifs rpond la question : combien dlves ont obtenu une note infrieure telle note ? .Le tableau prcdent peut apporter la rponse moyennant un calcul. Ainsi, le nombre dlves ayant obtenuune note strictement infrieure 10 est gal : 2 + 5 = 7. La plupart des fonctions en segmentscumulatifs sont associes des frquences cumules croissantes.

    8910111318

    258532

    2/25 = 0,085/25 = 0,208/25 = 0,325/25 = 0,203/25 = 0,122/25 = 0,08

    0,080,08 + 0,20 = 0,280,28 + 0,32 = 0,600,60 + 0,20 = 0,800,80 + 0,12 = 0,920,92 + 0,08 = 1

    00 + 0,08 = 0,080,08 + 0,20 = 0,280,28 + 0,32 = 0,600,60 + 0,20 = 0,800,80 + 0,12 = 0,92

    25 1

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 8 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    9/30

    STATISTIQUES DESCRIPTIVES

    Frquences FrquencesRelatives relatives cumules

    0,32 - Diagramme en btons Fonction cumulativestricte (FCS)

    Frquences relatives 1-

    0,90-

    0,80-0,20- 0,70-

    0,60-0,50- Frquences

    cumules0,40- croissantes

    strictes0,12- 0,30-

    0,20-0,08- 0,10-

    8 9 10 11 13

    18 19 208 9 10 11 12 13 14 15 16 17 18 Notes

    Notes: Les ordonnes des deux graphiques ci-dessous sont construites avec deux chelles diffrentes.

    Chaque segment horizontal contient le correspondant la borne suprieure, sans contenir le point de la borneinfrieure :Signification : Point infrieur excluLa FCS permet de connatre la frquence de notes infrieures une valeur ; soit la frquence relative de notesinfrieures :

    9 est gale 0,08 9,5 est gale 0,28 15 est gale 0,92

    19 est gale 1Pour connatre ces frquences, il suffit de reprer labscisse et de dtecter lordonne correspondante grce laFCS.Caractres continus

    Il sagit des caractres pouvant prendre toutes valeurs entre des limites finies.

    Lhistogramme est sans doute le mode de reprsentation le plus pratiqu. Il sadapte des classes statistiquesdfinies quantitativement par deux bornes numriques (minimum et maximum) dont la diffrence sappelle

    Un lment quelconque de lensemble tudi ne peut appartenir qu une seule classe. Les classesstatistiques sont des sous-ensembles formant une partition de lensemble.

    Les tailles (en centimtres) des 25 lves sont les suivantes :161,5 166 167 181 171 184 177 182 171 178,5171 178 178,5 169,5 179 171 164 172 179 167174 173 162 172 169

    Tableau ralis partir dune amplitude de classe gale 5 cmTailles (en cm) Nombre dlves

    correspondants[160 ; 165[

    [165 ; 170[

    [170 ; 175[

    [175 ; 180[

    [180 ; 185[

    35

    86

    3Total 25

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 9 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    10/30

    STATISTIQUES DESCRIPTIVES

    8-Nombre Histogrammedlves

    6-5-

    3-

    160 165 170 175 180 185 tailles en cm

    Remarque :- Lhistogramme se compose de rectangles adjacents. La base dun rectangle reprsente lamplitude de

    la classe statistique correspondante.- Sur le graphique et dans le tableau prcdent, les classes ont toutes la mme amplitude.

    Lhistogramme ne doit surtout pas tre interprt comme un diagramme en btons, cest--dire partir deshauteurs.

    Les rectangles sont tracs de telle faon que leurs surfaces sont proportionnelles aux effectifscorrespondants. En consquence, leffectif total est reprsent par la somme des surfaces des rectangles.

    A partir des tailles des 25 lves, un autre tableau statistique peut tre construit :

    [161; 165[ 165 - 161 = 4 3

    [165; 177[ 177 - 165 = 12 13

    [177; 185[ 185 - 177 = 8 9

    25

    HistogrammeNombreDlves

    4,5------------------------------4,1/3---------

    3--- S=13 S=9

    1- S=3

    0 161 165 177 185 tailles en cm

    u 3u 2u

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 10 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    11/30

    STATISTIQUES DESCRIPTIVES

    Explications :U est une unit de mesure des bases des rectangles de lhistogramme ; u est gale PGSD (Plus GrandCommun Diviseur) des amplitudes :

    4= 2 x 2 = 4U= PGSD (4 ;12 ;8) = 4 puisque 12= (2 x 2) x 3 = 4 x 3

    8 = (2 x 2) x 2 = 4 x 2( la recherche du PGSD ncessite la dcomposition de chaque amplitude sous forme dun produit defacteurs premiers, puis la recherche des facteurs communs).

    S signifie surface. Dans le premier rectangle : S = 3 et base = 1 ( puisque 1x u), donc la hauteur h slve :S = b x h h = S/b = 9/2 = 4,5.

    Polygones de distributionIls se tracent partir dun diagramme en btons ou dun histogramme :- en reliant les sommets des btons ;- en reliant les centres des sommets des rectangles dun histogramme amplitudes de classes

    constantes.

    Frquences

    Polygone

    Valeur du

    Caractre

    Polygone

    Valeur du CaractreLe total des surfaces hacures ( au-dessus du plygone) est au total des surfaces colories ( en dessous dupolygone).Donc: la surface entre le polygone et laxe des abscisses est gale celle de lhistogramme, cest--dire leffectif total.Que faire, face des amplitudes ingales?

    FrquencesPolygone

    u u 3u 2u u u u Valeurs du caractre

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 11 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    12/30

    STATISTIQUES DESCRIPTIVES

    Les polygones de cumuls se construisent partir dhistogrammes de cumuls eux-mmes btis partir de tableaux de frquences (absolues ou relatives) cumules ( croissantes ou dcroissantes).

    A partir du tableau des tailles (cf. histogramme) avec amplitudes constamment gales 5 cm, le tableausuivant des frquences est dtermin :

    [160; 165[[165; 170[[170; 175[[175; 180[[180; 185[

    n1 = 3n2 = 5n3 = 8n4 = 6n5 = 3

    F1 = 3/25 = 0,12F2 = 5/25 = 0,20F3 = 8/25 = 0,32F4 = 6/25 = 0,24F5 = 3/25 = 0,12

    33 + 5 = 88 + 8 = 1616 + 6 = 2222 + 3 = 25

    2525 - 3 = 2222 - 5 = 1717 - 8 = 99 - 6 = 3

    3/25 = 0,128/25 = 0,3216/25 = 0,6422/25 = 0,8825/25 = 1

    25/25 = 122/25 = 0,8817/25 = 0,689/25 = 0,363/25 = 0,12

    N = 25 1

    Il s'agit de frquences larges au sens tudi au diagramme en btons.

    Les frquences cumules croissantes strictes seraient calcules comme suit:

    n1 = 3n2 = 5n3 = 8n4 = 6n5 = 3

    f1 = 0,12f2 = 0,20f3 = 0,32f4 = 0,24f5 = 0,12

    00 + 3 = 33 + 5 =88 + 8 = 1616 + 6 = 22

    00 + 0,12 = 0,120,32 + 0,20 = 0,320,32 + 0,32 = 0,640,64 + 0,24 = 0,88

    N = 25 1Les frquences cumules croissantes relatives sont gales aux frquences cumules croissantes absoluesdivises par N = 25.

    Les frquences cumules croissantes strictes (FCCS) sont gales, aprs dcalage d'une ligne, auxfrquences cumules croissantes larges (FCCS):fccs = fccsi-1, i >1fccs = 0La surface trame reprsente l'histogramme des frquences cumules croissantes (cf. p. 170).Les points A1, A2, A3, A4, A5 reprsentent les frquences cumules croissantes larges.Les points A0, A1, A2, A3, A4, concernant les frquences cumules croissantes strictes.Les points B0, B1, B2, B3, B4, sont associs aux frquences cumules dcroissantes.Les polygones sont construits d'aprs l'hypothse d'une rpartition rgulire des informations dans chaqueclasse statistique.

    FrquencesCumules

    - 1 --------25- -----B0----------------------------------------------------A5B1

    - 0,80----- 20- ---------- A4

    -0,60 ----- 15- ---------- A30,50-- 12,5 ------------------->---------------

    -0,40 ----- 10- B3Cumul ----------- A2 Cumul

    -0,20 ---- 5 - croissant dcroissant

    -----------A1 B40 0 A0 B5160 165 170 175 180 185 Tailles (en cm)

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 12 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    13/30

    STATISTIQUES DESCRIPTIVES

    Mdiane = 172,8125

    Comment lire un polygone de frquences cumules? Cumul croissant:1- Interprtation du points A3 de coordonnes: taille = 175 cm, frquence cumule croissante = 16 (ou

    0,64): 16 lves (ou 64% des lves) ont une taille strictement infrieure 175 cm.2- Au point A4: 22 lves (ou 88 % des lves) ont une taille strictement infrieure 180 cm.3- Au point A0: aucun lve n'a une taille strictement infrieure 160 cm.

    Cumul dcroissant:1- Interprtation du point B2 de coordonnes: taille = 170 cm, frquence cumule = 17 (ou 0,68): 17

    lves (ou 68% des lves) ont une suprieure ou gale 170 cm.2- Au point B3: 9 lves (ou 36 % des lves) ont une taille suprieure ou gale 175 cm.3- Au point B5: aucun lves n'a une taille suprieure ou gale 185 cm.

    Montant(en milliers de DH)

    2000 - Btons verticaux

    1500 -

    1000 -

    500 -

    0

    Nord Est Centre Sud Ouest Rgions

    Les graphiques en btons sont bien adapts au tableau de rpartition. La langueur dun bton est proportionnelle

    au chiffre daffaires correspondant.Les graphiques en barres sont moins bien reprsentatifs du cas tudi ; en effet, une barre doit tre interprtepar la surface et non par la longueur ; pourtant les graphiques en barres, tant plus esthtiques, sont davantageutiliss. Pour quils significatifs, il faut prendre la prcaution dattribuer la mme largeur chaque barre. Cetteprcaution nest cependant pas suffisante : pour que les chiffres daffaires puissent tre interprts parlintermdiaire de la longueur des barres, il faut que la largeur de chaque barre soit gale lunit de mesure(souvent 1 centimtre, 1 millimtre).

    Une srie statistique est labore en vue dtre analyse ou compare dautre srie. Cette comparaisonou cette analyse se fait laide de certains caractristiques parmi lesquelles nous retenons pour linstant lescaractristiques de tendance centrale. Pour se faire il faut caractriser chaque srie statistique par un nombreunique qui rsume la srie en question et donne une ide sur lordre de grandeur ou le niveau gnral du caractretudi.

    Le choix de ce nombre unique appel valeur type peut tre fait arbitrairement. Seulement dans ce cas il nepermet pas de donner un bon jugement du caractre tudi. Cest ainsi quune valeur type doit rpondre certainsnombre de conditions connues sous le nom de conditions de YULE.

    1/ La valeur type doit tre objective.2/ Elle doit tenir compte de toutes les observations.

    3/ Avoir une signification concrte, simple concevoir.4/ Etre simple calculer.5/ Etre peu sensible aux fluctuations dchantillonnages.

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 13 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    14/30

  • 7/30/2019 Les Statistiques dscriptives

    15/30

    STATISTIQUES DESCRIPTIVES

    B1 + B2

    X1 X2 X3 X4 La classe modale est 15 20X2 = 15B1 = 7 3 = 4B2 = 7 6 = 1

    Donc Mo = 15 + ( 4 ) x 5 = 194 + 1

    Ce qui est diffrent du centre

    du classe = 17,5

    -

    La dtermination est immdiate aussi bien par le graphique qu laide du tableau statistique. Sasignification est vidente car il est intressant ce connatre la valeur de la variable qui revient le plussouvent au cours dobservation.

    -

    - Le calcul du mode ncessite les classes de mmes amplitudes

    - Lorsque la rpartition est multi - modale (plusieurs modes).Le mode perd alors toute signification, il est rejet comme mesure de tendance centrale.- La classe modale doit correspondre un effectif nettement plus lev que les autres effectifs.

    Pour ces raisons le mode est peu utilis comme caractristique de tendance centrale.

    La mdiane dune srie est la valeur Me du caractre tel que ; les observations classes dans un ordre, lenombre dunits statistiques prsentant des valeurs infrieures Me est gale au nombre dunit statistiqueprsentant des valeurs suprieures Me.

    :

    Un candidat un examen a obtenu les notes suivantes, sur 20 au cours despreuves quils a d subir :

    Rangeons dans lordre croissant les notes obtenues par ce candidat, la note 7 (coefficient 2) tant critedeux fois et la note 12 (coefficient 3) tant crite 3 fois :

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 15 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    16/30

    STATISTIQUES DESCRIPTIVES

    7 - 7 - 8 - 10 - 11 - 12 - 12 - 12 - 14

    Dans la srie ainsi crite et qui compte neuf termes, 9 tant la somme des coefficients, on dira que la notemdiane est 11 car les notes infrieures 11 sont au nombre de quatre et les notes suprieures 11 sontgalement au nombre de quatre.

    Si le candidat en question avait subi une preuve supplmentaire avec coefficient 1, et obtenu cette

    preuve la note 6 lordre des notes :

    6 - 7 -7 - 8 - 10 - 11 - 12 - 12 - 12 - 14

    Les notes tant cette fois au nombre de 10 on aura un intervalle mdian (10, 11) , o la rigueur unemdiane gale 10,5 centre de lintervalle mdian ( 10 + 11 ) = 10,5

    2

    supposons maintenant que le candidat ait subi une autre preuve, avec coefficient 3, ce qui porte 13 lasomme des coefficients et quil ait obtenu cette preuve la note 17. la srie des notes se prsentent alors commesuit :

    6 - 7 - 7 - 8 - 10 - 11 - 12 - 12 - 12 - 14 - 17 - 17 - 17

    Le nombre des notes tant 13, nous sommes conduits chercher la note de 7 me rang, qui laisse 6 notes gauche et 6 notes droite. Cette note est 12.Cependant 12 nes pas la note mdiane car si nous avons bien 6 notes infrieures 12 nous navons pas 6 notessuprieures 12, en effet parmi les notes crites droite de 12 seules 4 notes sont suprieures 12.

    Nous pouvons en conclure que, lorsque la variable statistique est discontinue, il ny a pas, en gnral, devaleur mdiane.

    Ainsi dans lexemple des enfants charge, les nombres denfants peuvent tre crits.

    Le 20me est un 2, nombre qui ne rpond pas la dfinition de la mdiane.

    :

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 16 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    17/30

    STATISTIQUES DESCRIPTIVES

    nous allons reprendre lexemple de 40 agents de DA/AC classs saprs leur salaire, et utiliser dabord lacolonne des coefficients cumuls croissants.

    La lecture de ce tableau nous montre que 18 agents ont un salaire infrieur 5,5 DH, et 28 ont un salaire

    infrieur 6,5 DH ; pour chercher le salaire du 20me agent ( 20 = 40 / 2 ).Nous pouvons dj affirmer que lesalaire mdian cherch se situe entre 5,5 et 6,5.

    Pour donner un rsultat plus prcis ; formulons lhypothse que les salaires des 10 agents qui touchent auplus 6,5 DH se rpartissent uniformment sur lintervalle 5,5 6,5Nous avons alors le schma suivant :

    La valeur mdiane sera alors donne par interpolation par parties proportionnelles ou interpolation linaire lintrieur de lintervalle 5,5 6,5 et nous obtenons :

    Nous pouvons schmatiser le calcul de la mdiane de la faon suivante :10

    Effectifs Cumuls 18 20 28 10 = 1

    2 x2

    1x

    x= 2x1 Valeurscorrespondantes 5,5 6,5 10

    x = 0,2

    fic nicen %

    100 % 40

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 17 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    18/30

    STATISTIQUES DESCRIPTIVES

    90 %

    75 % 30

    50 % 20

    25 % 10

    10 %

    3,5 4,5 5,5 6,5 7,5 8,5 9,5

    La mdiane est dun calcul assez facile, puisque en fait elle rsulte presque dune lecture aprs classementdes observations.

    Elle donne une ide statistique de la tendance centrale dune srie statistique, elle nest pas influence parles valeurs aberrantes qui pourraient figurer dans la srie.

    La mdiane a des inconvnients de ses avantages. Dpendant plus de rang des units statistiquesobserves que des valeurs de la variable elle nest pas calcule suivant une formule mathmatique.

    Soient, rangs par ordre croissant , les salaires horaires de 10 agents de DA/AC :4,35 4,55 4,75 4,36 5,01 5,12 5,19 6,46 7,75 9,40

    La moyenne arithmtique des salaires ci-dessus est :4,35,+ 4,55 + 4,75 + 4,36 + 5,01+5.12 + 5,19 + 6,46 + 7,75 + 9,40 = 5,694

    10dans lanalyse statistique les termes dune srie statistique sont habituellement prsents par le symboles :

    x1, x2, x3 xi, xn.ntant le nombre de termes de la srie.La moyenne arithmtique de ces termes est alors reprsente par le symbole et la somme x1 + x2 + x3 +

    .. + xi xn par le symbole xi ou de faon plus prcise par xi (somme des xi pour ivariant de 1 n )

    avec ces conventions on peut crire :

    x = xin

    A partir de la srie statistique portant sur le nombre denfants charge de 40 agents de DA/AC ;cherchons calculer le nombre moyen denfants par agent.

    Le raisonnement est le suivant :2 agents ont chacun 0 enfant, soit en tout 0 enfant7 agents ont chacun 1 enfant, soit en tout 7 enfants

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 18 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    19/30

    STATISTIQUES DESCRIPTIVES

    14 agents ont chacun 2 enfants, soit en tout 28 enfants10 agents ont chacun 3 enfants, soit en tout 30 enfants

    4 agents ont chacun 4 enfants, soit en tout 16 enfants2 agents ont chacun 5 enfants, soit en tout 10 enfants1 agents ont chacun 6 enfants, soit en tout 6 enfants

    40 agents ont ensemble 97 enfants

    le nombre moyen denfant charge est donc : 97 = 2,4240

    le raisonnement qui vient dtre fait se traduit par le tableau de calculs suivants :

    0123456

    271410421

    07283016106

    Le nombre moyen cherch est :x = xi ni = 97 = 2,425

    ni 40

    Reprenons le tableau de la page 13 relatif aux salaires horaires des 40 agents de DA/AC et calculons lesalaire moyen de cette srie.

    Dans ce cas les valeurs sont reprsentes sous forme de classes, pour calculer la moyenne arithmtique ;on prend les centres de classes comme valeurs observes.

    3,5 4,5

    4,5 5,55,5 6,56,5 7,57,5 8,58,5 9,5

    4

    56789

    3

    1510651

    12

    757042409

    Nous venons de calculer les moyennes arithmtiques sur deux exemples de sries statistiques en utilisantla formule :

    x = xi ni ni

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 19 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    20/30

    STATISTIQUES DESCRIPTIVES

    dans la quelle chaque xi observe de la variable x tait pondre par leffectif ni qui lui correspondait. Cest--direque chaque valeur de x intervenait dans le calcul de la moyenne un nombre de fois gal au nombre de fois ocette valeur avait t observe. La moyenne arithmtique est dite moyenne arithmtique pondre.

    Le salaire moyen est donc :

    x = 238 = 5,95 DH

    40

    y = ni xi = ni (xi + c) = ( ni xi + ni c )N N N

    = ni xi + ni c = ni xi + c nini ni ni ni

    y = x + c

    (x + c ) = x + c

    Somme des carts par rapport la moyenne arithmtique est gal zro.

    Calcul de la moyenne arithmtique par changement de variableLe calcul de la moyenne arithmtique peut tre simplifi normment si on utilise un changement de

    variable judicieuse permis par les proprits de la moyenne arithmtique que nous avons vu prcdemment.On adopte une moyenne provisionne x0 qui peut tre gale au centre de lune quelconque des intervalles.(ce calcul est utilis uniquement dans le cas de classes de mmes intervalles ).Utilisant les proprits de la moyenne arithmtique.

    x = xi-x0 (K tant lamplitude de classes )k

    _ _ _on a x = x x0 k x = x - xo

    k

    Tableau de calcul (exemple des salaires des 40 agents de DA/AC).k = i on prend xo = 6

    3,5 - 4,54,5 - 5,55,5 - 6,56,5 - 7,57,5 - 8,58,5 - 9,5

    456789

    31510651

    -2-10123

    -2-10123

    -6-1506103

    _x = - 2

    40_ = -0,05x = ( -0,05 x 1 ) + 6

    _x = 5,95

    La moyenne arithmtique prsente linconvnient dentraner des calculs parfois longs, et dtre influencepar les valeurs aberrantes de la variable ( valeurs exagrment faibles ou fortes ).

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 20 sur 30

    _

    x = k x + xo

  • 7/30/2019 Les Statistiques dscriptives

    21/30

  • 7/30/2019 Les Statistiques dscriptives

    22/30

    STATISTIQUES DESCRIPTIVES

    .

    Notesxi

    151297

    3

    2322

    1

    1,1761,0790,9540,845

    0,477

    2,3523,2371,9081,690

    0,477

    Log G = 9,66 = 0,966410

    G = 9,255Le calcul de la moyenne gomtrique prsente toujours un intrt et a toujours une signification lorsque

    les valeurs observes de la variable, mises on ordre croissant ou dcroissant sont en progression gomtrique.

    Montrons dabord dans quels problmes on peut tre conduit calculer une moyenne harmonique.

    Supposons quune entreprise dispose de 2 voitures automobiles dont la consommation respectives decarturant, pour une distance de 10 Km, sont de 20 titres et 10 titres lentreprise se propose de calculer laconsommation moyenne de carturant, pour 100 Kilomtres, des deux voitures en question.

    Nous pouvons, bien entendu, calculer la moyenne arithmtique des consommations qui sera gale 30/2=15 : aux 100 Km.

    Mais nous pouvons aussi tenir le raisonnement suivant :Le premier vhicule permet de couvrir avec 1 L de carburant 100/20 = 5KmLe second vhicule permet de couvrir avec 1 L de carburant 100/20 = 10Km

    En moyenne, les deux automobiles permettent donc de parcourir avec 1 L de carburant5 + 10 = 7 Km 500

    2Et en moyenne, la consommation de carburant aux 100 Km sera donc de 100/7,5 = 13,33 litres. Rsultat diffrentdes 15 L prcdemment obtenu.Nous venons de calculer la moyenne harmonique des deux quantits 20 et 10 moyenne qui satisfait la relation :N = n1 + n2 +.nk ( avec N= ni ).

    H x1 x2 xk

    Ce qui peut aussi dcrire :1

    1 = ni . xi etH ni

    snonce " Linverse de la moyenne harmonique est gale la moyenne arithmtiques des inverses des valeurs dela variable" .

    Soient deux pays voisins dgale population, dans le premier il y a 4 habitants pour une voiture , dans lesecond il y a 12 habitants pour une voiture .

    Quel est le taux dquipement ?La rponse nest pas la moyenne arithmtique de 4 et 12 (4 + 12 = 8)

    2

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 22 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    23/30

    STATISTIQUES DESCRIPTIVES

    Mais leur moyenne harmonique 1 = 1 ( 1 + 1 ) = 1 donc H + 6H 2 4 12 6

    En effet, les deux pays tant galement peupls, il y a 3 voitures pour 12 habitants dans le premier et unevoiture pour 12 habitants dans le second, soit 4 voitures pour 24 habitants do 1 voiture pour 6 habitants.

    123456

    2231201141

    1,000,500,330,250,200,167

    22,0015,506,672,750,800,17

    Nous aurons 1 / H = 47,89 / 89 do H = 89 / 47,89 = 1,86Le calcul de la moyenne harmonique sera intressant chaque fois que lon pourra donner un sens aux nombresinverses des valeurs de la variable statistique.

    Toutes les moyennes que nous venons de rencontrer remplissent leur rle, qui est de donner en un seulchiffre ide de la valeur centrale dune srie statistique.

    Cependant leurs dfinitions ; leurs modes de calcul nous conduisent donner la prfrence la moyennearithmtique.

    Indiquons encore, que les trois moyennes retenues satisfont toujours aux conditions dingalit :H < G < X

    Rappelons enfin que ces moyennes dont le rle est de rsumer une srie statistique, sexpriment dans lamme unit que la variable tudie.

    La moyenne et sauf exception, la moyenne arithmtique est gnralement la meilleure caractristique

    de tendance centrale.- Elle dpend de la valeur de toutes les observations.- Elle est dfinie sans ambigut, et correspond une notion bien comprise du public.- Elle se prte aux calculs algbrique et nest que relativement peu sensible aux fluctuations dchantillonnage.

    La mdiane est facile dterminer, puisquelle nexige aucune opration arithmtique mais un simpleclassement des termes.

    Mais elle est moins connue du public, et sensible que la moyenne aux fluctuations dchantillonnage . Ellese prte assez mal aux calculs algbriques et ne convient gure la reprsentation des caractres discontinus.

    Elle limine leffet des valeurs aberrantes ce qui lui confre un avantage sur la moyenne si du moins, lasrie comporte des valeurs effectivement aberrantes.

    Sa valeur descriptive est toujours intressante puisquelle exprime le cas qui a autant de chances dtredpass que de ne pas dtre.

    Lintrt pratique du mode est incontestable, puisquil reprsente le cas le plus courant, la valeur-type quimrite dtre particulirement tudie. Cette notion est parfaitement comprise du public.

    Mais sa dtermination est souvent ambigu, surtout si le caractre tudi est continu, et elle nest gureaccessible par voie dchantillonnage :

    Le mode de lchantillon risque dtre trs diffrent de celui de lensemble dont il a t extrait.Lapparition de plusieurs modes correspondant aux diverses varits dmontrera lheterogeneit de

    lensemble tudi dcoulant elle mme dune dfinition insuffisante de lunit statistique.Lorsque la distribution est parfaitement symtrique les trois paramtres X, Me, Mo, sont alors gaux .Si la distribution est uni modale et modrment asymtrique les trois caractristiques se trouvent lies,

    approximativement par la relation :(x - Mo ) = 3(x - Me)

    qui permet, lorsque deux caractristiques sont connues destimer la troisime.

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 23 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    24/30

    STATISTIQUES DESCRIPTIVES

    La valeur centrale ne fournie quune reprsentation trs insuffisante de lensemble tudi, si lonignore comment les termes se groupent autour de cette valeur.

    Deux sries de rpartition peuvent avoir la mme moyenne est tre diffrentes lune de lautre.

    cette diffrence peut tre remarquer dans la dispersion de chacune des 2 rpartition. Pour celanous nous posons la question suivante : Dans quel cas la moyenne calcule dans les deuxrpartitions est significative (a un sens) ?

    :Srie 1 srie 2X1 = 2 y1 = 48X2 = 98 y2 = 52X = 50 y = 50

    X nest pas significative les valeurs y plus sens car les valeurs sont prochesSont trs diffrentes, elles sont trs lune de lautre

    Disperses lune de lautre.

    Nous sentons alors le besoin de caractriser toute rpartition par une mesure de dispersion pour ainsipouvoir comparer des sries, pour la comparaison desquelles les caractristiques de tendance centrale sesoit avres tre des instruments insuffisants.Nous nous limiterons tudier la variance et lcart-type .

    Calcul de la variance

    La variance est la moyenne arithmtique des carrs des carts des valeurs de la variable leurmoyenne arithmtique.

    V = ( xi x )2 ni ni

    La variation des 10 salaires est donc

    V = 1,412 + 1,202 + 1,002 + 0,792 + 0,742 + 0,632 + 0,562 + 0,702 + 1,992 + 3,64210

    = 23,77 = 2,37710

    mais ce rsultat sexprime en dirhams au carr unit dont la comprhension est videmment peuaccessible et, pour retrouver un nombre sexpriment en dirhams, comme les termes mme de la srie lon

    se trouve naturellement amen prendre la racine carr de la variance . On dfinit ainsi une nouvellecaractristique de la dispersion, appele cart-type (dsign gnralement par la lettre grecque sigma)et dont limportance en analyse est primordiale.

    = 2,377= 1,54

    En effet lcart type et la variation se prtent bien aux combinaisons algbriques.Tableau de calcul de lcart type pour une srie classe (exemple de la srie des 40 salaires)

    3,5 4,54,5 5,55,5 6,5

    456

    31510

    127560

    -1,95-0,950,05

    3,80250,90250,0025

    11,407513,53750,0250

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 24 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    25/30

    STATISTIQUES DESCRIPTIVES

    6,5 7,57,5 8,58,5 9,5

    789

    651

    42409

    1,052,053,05

    1,10254,20259,3025

    6,615021,01259,3025

    Il est vident que la somme algbrique des carts avec la moyenne (pris avec leur signe) seratoujours nulle, aussi additionne t-on les carts absolus.

    Lcart absolu moyen est gal la moyenne arithmtique des carts absolus de toutes les valeurs

    par rapport la moyenne :

    e = xi xN

    Exemple : soit la srie dix salaires4,35 4,55 4,75 4,96 5,01 5,12 5,19 6,46 7,75 9,4005,754 5,754 5,754 5,754 5,754 5,754 5,754 5,754 5,754 5,754

    - 1,414 -1,204 -1,004 -0,794 -0,744 -0,634 -0,564 + 0,706 + 1,996 + 3,646

    e = 1,414 + 1,204 + 1,004 +0,794 + 0,744 + 0,634 + 0,564 + 0,706 + 1,996 + 3,646

    10= 12,706 = 1,27

    10

    Dans le cas des observations groupes par classe lcart moyen est calcul comme moyenne arithmtiquepondre.Exemple de la srie classe des salaires des 40 agents de DA/AC.

    3,5 4,54,5 5,55,5 6,5

    6,5 7,57,5 8,58,5 9,5

    456

    789

    31510

    651

    127560

    42409

    -1,95-0,950,05

    1,052,053,05

    5,8514,250,50

    6,3010,253,05

    e = xi x .ni = 40,20 = 1,005 ni 40

    v = 61,9/40 = 1,5475

    = 1,24

    Lcart type mesure la dispersion autour de x , et plus que sa valeur est grande plus la dispersion desobservations autour de la moyenne est importante.

    Le calcul de la variation nous a conduit calculer la quantit . (xi x )2 nisi on dveloppe lidentit ( xi x )2 on obtient :( xi - x ) 2 ni = xi2 ni 2 x xi ni + x 2 niOr nous savons que :

    x = xi ni do xi ni = x ni ni

    Alors (xi x )2 ni = xi2 ni 2 x 2 ni + x 2 ni= xi2 ni - x 2 ni

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 25 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    26/30

    STATISTIQUES DESCRIPTIVES

    do v = (xi x )2 ni = xi ni2 - x 2 ni ni ni

    v = ( xi2 ni/ ni ) - x 2 = vFormule dvelopp du calcul de la variance

    3,5 4,54,5 5,55,5 6,56,5 7,57,5 8,58,5 9,5

    456789

    31510651

    12756042409

    4837536029432081

    V = 1478/40 (238/40)V = 1,5475

    = 1,5475 = 1,24

    Prenons le tableau de calcul de la moyenne arithmtique par changement de variable et calculons lavariance par la formule dveloppe : K= 1 , xo = 6

    3,5 4,54,5 5,58,5 - ,56,5 7,57,5 8,58,5 9,5

    456789

    31510651

    -2-10123

    --10123

    -6-1506103

    121506209

    x = -2 /40 = -0 ,05

    x = ( -0 .05 x 1) + 6 = 5.95

    = K xi ni / ni - x

    =

    Le coefficient de variation

    Toutes les mesures de dispersion que nous avons vu sont des mesures absolues car elle sexpriment enunit de caractre et dpendent du niveau gnral de ce mme caractre . Cest ainsi que nous introduisons desmesures de dispersion relatives en prenant le rapport des mesures absolues tudies sur la mesure de tendancecentrale .

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 26 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    27/30

    STATISTIQUES DESCRIPTIVES

    La mesure la plus utilise est : lcart type relatif appel coefficient de variation :

    Cv = / x

    Si les deux populations ont le mme niveau gnral ( peu prs la mme moyenne ) on utilise lesmesures absolues pour faire la comparaison de la dispersion .

    La mesure de la dispersion relative sera utilise uniquement lorsque les deux populations ont deux niveaux

    diffrents . De mme que ces mesures seront utilises lorsqu il sagit de comparer la dispersion de deuxcaractres diffrents pour une mme population .

    Ainsi et ds ce premier contact, le lecteur aura pu prendre conscience des possibilits, des sujtions, et des limitesde loutil statistique :

    La statistique se propose de rsoudre des problmes qui, rigoureusement parlant , sont insolubles ; elle nepeut le faire que grce ladoption de certaines conventions. La plus part de ces conventions ne sont pas absurdeet sont recueillies .

    La valeur des rsultats obtenus en statistiques est fonction des conventions adoptes et leur interprtation

    doit toujours se faire fonction de la nature du domaine ex

    A un examen on a relev pour 100 candidats les notes suivantes :

    1. Tracer l'histogramme des effectifs et le polygone des effectifs cumuls croissants.

    2. Calculer la mdiane et la moyenne de cette srie.

    On donne le tableau statistique suivant :

    1. Quel est le mode et la mdiane de cette distribution ?

    2. calculer la moyenne, la variance et l'cart type.

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 27 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    28/30

    STATISTIQUES DESCRIPTIVES

    1- Pour la population tudie : 100 candidats.Le caractre statistique retenu (note obtenue lexamen) est un caractre quantitatif.

    La variable statistique (valeur de la note) est continue et par consquent les classes sont dfinies pardes intervalles

    .Daprs les donnes, les classes ont t choisies damplitude gale 2.Compltons le tableau statistique par la colonne des effectifs cumuls dcroissants.

    [ 0, 2 [[ 2, 4 [[ 4, 6 [[ 6, 8 [[ 8,10 [

    [10,12[[12,14[[14,16[[16,18[[18,20[

    32151420

    231255

    1

    35203454

    77899499100

    - Ne confondez pas le polygone des effectifs cumul et le polygone des effectifs figur enpointill sur lhistogramme

    -

    n= 100 n/2 =50Daprs le calcul des effectifs cumuls, nous savons que leffectif 50 est atteint dans la classe [8,10[

    8 correspondant leffectif 3410 correspondant leffectif 54

    Donc pour leffectif 50=34+16m=8+2x16/20=9,6

    On peut considrer que 50 candidats ont obtenus une note infrieure 9,6 et 50 candidats ontobtenu une note suprieur 9,6.

    Daprs le polygone des effectifs cumuls, m est labscisse du point dordonne 50.

    Calcul de la moyenne

    On dtermine au pralable les centres des classes xi, puis on calcule les produits ni xi .

    13579

    11131517

    32151420

    231255

    367598180

    2531567585

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 28 sur 30

  • 7/30/2019 Les Statistiques dscriptives

    29/30

    STATISTIQUES DESCRIPTIVES

    19 1 19

    x = 950/100 =9.59.5 est la note moyenne obtenue sur lensemble des 100 candidats.

    1 . Le monde est la valeur de la variable d effectif maximum.m =25

    La mdiane partage la srie en deux groupes de mme effectifs.

    20253035

    4045

    1015108

    52

    10253543

    4850

    Or, on constate que :- pour les valeurs de la variable infrieures ou gales 25 le nombre dobservations releves

    est :10 + 15 =25

    - pour les valeurs de la variable suprieurs ou gales 30 le nombre dobservations est :10 + 8 + 5 + 2 =25

    Il y a donc deux valeurs possibles de la mdiane :m=25 ou m=30

    On peut aussi prendre pour mdiane le milieu de lintervalle mdian [25,30[.Soit, m=27,5

    ISTA Beni Mellal STATISTIQUES DESCRIPTIVES I Page 29 sur 30

    HISTOGRAMME

    0

    5

    10

    15

    20

    25

    de2

    4

    de6

    8

    de10

    12

    de14

    16

    de1820

    NOTE

    EFFECTIFS

    Nombre de

    candidats

    Polygone des e ffectifs cumuls

    0

    20

    40

    60

    80

    100

    120

    Notes

    moinsde2

    de4

    6

    de810

    de12

    14

    de16

    18 note

    effectifscummuls

    Srie1

  • 7/30/2019 Les Statistiques dscriptives

    30/30

    STATISTIQUES DESCRIPTIVES

    202530354045

    101510852

    400625900122516002025

    400093759000980080004050

    20037530028010090

    La moyenne est : x = 1/n ni .xi1

    Soit : x = 1445/50 =28,9

    La variance est donne par la formule :k

    V= 1/n ni.xi- x 1

    Do : V = 1/50 x 44225 (28,9)

    Lcart-type est la racine carr positive de v .

    Do : = 49,29 = 7,02

    Remarque : Pour allge les calculs, on pouvait effectuer le changement de repre dfini par : xi =30 + ui ( par exemple).

    Sachant que , dans ce cas :

    X = 30 + u et V = 1/nni.ui - u

    20

    2530354045

    10

    1510852

    - 10

    - 5051015

    100

    25025100225

    1000

    3750200500450

    - 100-175

    - 7504050 + 12030

    u = - 55/ 50 = - 1,1 ; x = 30 1,1 = 28,9V = 2525 /50 =