Chapitre1(1)

Embed Size (px)

Citation preview

  • 5/24/2018 Chapitre1(1)

    1/11

    Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif

    Cours Statistique descriptive Mahmoud BABAY 3

    CHAPITRE 1 : Distribution statistique une dimension

    Section 1 : Vocabulaire lmentaire de la statistique descriptive

    1. Population et individu

    Dfinition

    On appelle population statistique, tout ensemble d'units statistiques constituant les

    units

    observes.

    On appelle individu (ou unit statistique), tout lment de la population tudie.

    Remarque

    La dtermination avec prcision de la population et des individus qui la composentconditionne l'homognit des units observe et la fiabilit des rsultats.

    2. Variable statistique

    2.1. Dfinition

    On appelle variable statistique (ou caractre), une application (relation) qui associe chaque

    individu de la population, une observation particulire.

    2.2. Type d'une variable statistique

    a) Variable qualitative

    Une variable est qualitative si elle est lie un ensemble d'observations non mesurables.

    Exemple : La population active tunisienne peut tre caractrise par :

    - Le sexe (masculin ou fminin)

    - La catgorie professionnelle (cadres, employs, ouvriers, etc...)

    La nature qualitative d'une variable s'exprime donc par l'appartenance une catgorie ou

    rubrique d'un ensemble fini.

    b) Variable quantitative

    Une variable est quantitative si l'ensemble des observations est un ensemble de nombres. Ces

    observations expriment donc des valeurs numriques (quantitatif = mesurable).

    Exemple : La Catgorie Htelire, La Capacit en lits,

    Les variables quantitatives peuvent tre discrtes ou continues :

    Une variable quantitative est dite discrte lorsqu'elle prend un nombre fini ou dnombrable

    de valeurs (La Catgorie Htelire).

    La variable nombre d'enfants par mnage est une variable quantitative discrte.

  • 5/24/2018 Chapitre1(1)

    2/11

    Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif

    Cours Statistique descriptive Mahmoud BABAY 4

    Une variable quantitative est dite continue, lorsqu'elle prend toutes les valeurs d'un

    intervalle rel.

    La variable La Capacit en lits peut tre envisage comme une variable quantitative

    continue. Ses valeurs sont le plus souvent regroupes par intervalle.

    3. Effectifs

    Dfinition

    On appelle effectif d'une valeur (ou rubrique) donnexile nombre de fois ou cette valeur (ou

    rubrique), apparait dans la population statistique tudie. Ce nombre est note ni. L'effectif est

    parfois appel frquence absolue.

    On appelle effectif total de la population tudie, notn, la somme despeffectifs particuliers

    nicorrespondant chacune des valeurs (ou rubriques), soit :

    n = n1 +n2+.+np=

    p

    iin

    1

    Le symbole (lu somme) permet une criture synthtique de la somme despeffectifs

    n1, n2.... np. On lit alors n = somme des ni(pourivariant de1 p) .

    4. Frquences

    On appelle frquence de la valeur (ou modalit) xi, notefi, le rapport de l'effectif nicorrespondant a

    la valeurxiet de l'effectifn de la population observe.

    nf ii

    Ce rapport est gal au pourcentage d'individus prsentant la valeur (ou modalit)x ipar rapport

    l'ensemble de la population observe.fiest toujours comprise entre 0 et 1.

    Pour une srie statistique prsentantp valeurs (ou modalits), on a :

    1...........211

    p

    p

    i i

    ffff

    Remarque :

    Parfois on peut rencontrer le terme de frquence relative pour les frquences.

    Lemploi des frquences ou frquences relatives savre utile pour comparer deux

    distributions de frquences tablies partir dchantillons de taille diffrente.

    On appelle frquences cumules ou frquences relatives cumules en xi, le nombrefi cum tel

    que

    i

    p

    pij fcumfF1

  • 5/24/2018 Chapitre1(1)

    3/11

    Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif

    Cours Statistique descriptive Mahmoud BABAY 5

    Section 2 : Reprsentation des donnes

    Il existe plusieurs niveaux de description statistique : la prsentation brute des donnes, des

    prsentations par tableaux numriques, des reprsentations graphiques et des rsums

    numriques fournis par un petit nombre de paramtres caractristiques.

    1. Sries statistiques

    Une srie statistique correspond aux diffrentes modalits dun caractre sur un

    chantillon

    dindividus appartenant une population donne.

    Le nombre dindividus qui constituent lchantillon tudi sappelle la taille de lchantillon.

    2. Tableaux statistiques

    Le tableau de distribution de frquences est un mode synthtique de prsentation des donnes.Sa constitution est immdiate dans le cas dun caractre discret mais ncessite en revanche

    une transformation des donnes dans le cas dun caractre continu.

    2.1 Caractre qualitatif

    Modalit

    Numro i

    Effectif

    n

    Frquence

    f

    1

    2

    ..

    p

    n1n2

    .

    n

    f1f2

    fOn a les relations suivantes:

    p

    i

    inn1 n

    nf ii 1

    1

    p

    i

    if

    Remarque : les frquences peuvent tre exprimes dans le tableau en pourcentage, dans ce

    cas : 1001

    p

    iif

    2.2 Caractre quantitatif

    a) Caractre quantitatif discret

    Valeurs observes

    x

    Effectifs

    n

    Frquences

    f

    Frquences cumules

    croissantes F

    x1x2

    .

    xP

    n1n2

    ..

    n

    f1f2

    .

    f

    F1F2

    F

  • 5/24/2018 Chapitre1(1)

    4/11

    Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif

    Cours Statistique descriptive Mahmoud BABAY 6

    b) Caractre quantitatif continu

    Classes

    numro i

    [b ; b +1[

    Centres

    ci

    Effectifs

    ni

    Frquences

    fi

    Frquences

    cumules

    croissantes F

    [b1 ; b2 [[b2 ; b3 [

    ..

    [bP; bP+1[

    c1c2

    c

    n1n2

    .

    nP

    f1f2

    fP

    F1F2

    FP

    Remarque:

    - Une classe est un intervalle ferm gauche et ouvert droite, du type [bi ; bi+1

    [.

    - Le centre d'une classe est 1

    iiibb

    c

    - L'amplitude d'une classe est iii bba 1

    3. Reprsentations graphiques

    3.1 Caractres qualitatifs

    a) Diagrammes bandes

    On appelle diagramme bandes un graphique qui, chaque modalit de la variable qualitative

    associe un rectangle de base constante dont la hauteur est proportionnelle l'effectif.

    Figure 1-1 : Diagramme bandes (verticales) :

    nombre darrive aux frontires des scandinaves par nationalit pour l'anne 2005

    0

    5 000

    10 000

    15 000

    20 000

    25 000

    30 000

    35 000

    40 000

    Sudois Danois Norvgiens Finlandais

    Nationalits

    b) Diagrammes secteurs

    On appelle diagramme sect eurs un graphique qui divise un disque en secteurs angulaires

    dont les angles au centre sont proportionnels aux effectifs de chaque modalit.

  • 5/24/2018 Chapitre1(1)

    5/11

    Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif

    Cours Statistique descriptive Mahmoud BABAY 7

    Pour une modalit donne Mi, d'effectifni, l'angle au centre i, correspondant est donn (en

    degr) par : 360360 ii

    i fn

    n

    Figure 1-2 : Diagramme secteurs :

    nombre darrive aux frontires des scandinaves par nationalit pour l'anne 2005

    Sudois

    Danois

    Norvgiens

    Finlandais

    3.2 Caractres quantitatifs

    3.2.1 Caractre quantitatif Discret

    a) Diagramme en btons

    On appelle diagramme en btons un graphique qui associe chaque valeur de la variable un

    segment (bton) dont la hauteur est proportionnelle l'effectif.

    Remarque

    On suppose les valeurs observes de la variable quantitative discrte, ordonnes par ordre

    croissant.

    Figure 1-3 : Diagramme en btons :

    Nombre de nuites des non rsidants par nombre dtoile en 2005

  • 5/24/2018 Chapitre1(1)

    6/11

    Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif

    Cours Statistique descriptive Mahmoud BABAY 8

    b) Diagrammes cumulatifs

    On appelle diagramme cumulatif, la courbe reprsentative de la fonction de rpartition.

    On appelle fonction de rpartition d'un caractreX, l'application noteF, dont l'ensemble de

    dpart est Ret l'ensemble d'arrive, l'intervalle[0,1].

    F : R [0,1]

    X F(x) = P(X

  • 5/24/2018 Chapitre1(1)

    7/11

    Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif

    Cours Statistique descriptive Mahmoud BABAY 9

    Classes d'amplitudes gales:

    Lorsque les classes sont d'amplitudes gales (ai= a)

    Figure 1-5 : Histogramme (amplitude gales) :

    Capacit Htelire en lits pour la rgion de Nabeul-Hammamet

    0,00

    0,05

    0,10

    0,15

    0,20

    0,25

    0,30

    101 201 301 401 501

    apacit htelire en lits

    Frquences

    Classes d'amplitudes ingales :

    Lorsqu'au moins deux classes ont des amplitudes diffrentes, la hauteur proportionnelle

    l'effectif ne permet plus de construire un histogramme. En effet, la surface de chaque

    rectangle n'est plus proportionnelle l'effectif (conformment la dfinition).

    Do la ncessit de corrig les frquences (ou les effectifs).

    i

    ic

    ia

    ff ou

    i

    ic

    ia

    nn

    Avec: cif : frquence corrig ; c

    in : effectif corrig

    Figure 1-6: Histogramme (amplitude ingales) : Chmeurs par groupe d'ges

  • 5/24/2018 Chapitre1(1)

    8/11

    Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif

    Cours Statistique descriptive Mahmoud BABAY 10

    b) Polygone des frquences

    On obtient un polygone de frquences en joignant les milieux des segments suprieurs de

    chaque rectangle de lhistogramme (laire du polygone des frquences est laire de la surface

    par la ligne polygonale et laxe des abscisses).

    Figure 1-7 : Polygone des frquences (amplitude gales) :

    Capacit Htelire en lits pour la rgion de Nabeul-Hammamet

    c) Courbe des frquences cumules

    croissantes

    Dfinition

    On appelle courbe des frquences cumules croissantes la reprsentation graphique de la

    fonction de rpartition de la variablex.

    Les donnes tant groupes en classes, la frquence cumule croissanteFiassocie la classe

    n : ireprsente la proportion d'individus de la population pour lequel la variable prend une

    valeur inferieure (strictement) la limite suprieurebide la classen : i.En pratique, la courbe des frquences cumules croissantes est obtenue en joignant, dans un

    systme d'axes orthogonaux, les points d'abscisse bi(extrmit de la classen : i) et

    d'ordonneFi (frquence cumule croissante correspondante) [Remarque : Joindre les points

    de coordonnes (bi, Fi) par des segments revient faire lhypothse dune rpartition

    uniforme des individus lintrieur des classes].

  • 5/24/2018 Chapitre1(1)

    9/11

    Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif

    Cours Statistique descriptive Mahmoud BABAY 11

    Figure 1-8 : Courbe des frquences cumules croissantes : Capacit Htelire en lits pour la

    rgion de Sousse-Kairouan

    Courbe des frquences cumules

    croissantes

    0,00

    20,00

    40,00

    60,00

    80,00

    100,00

    101 201 301 401 501 601

    Capacit Htelire en lits

    fr

    quencescumules

    croissantesen%

    3.3 Graphiques spcialises

    a) Pyramide des ges

    Exemple : Pyramide des ges en Tunisie en 1994 :

    La pyramide est une version particulire de l'histogramme, uti lis e pour rep art ir une

    pop ul ati on en fon cti on de l ge (va ri abl e qu ant ita tiv e con tin ue) et du sex e des

    ind ivi dus (va riable quali tative secondaire).

    Le graphique se prsente comme un histo gramme double, les valeurs de la va ri ab le

    pr in ci pa le ( l g e) t an t po rt e s su r l' ax e ve rt ic al .

    Fi gu re 1- 9 : Py ra mi de de s g es (e n% ) 19 94

  • 5/24/2018 Chapitre1(1)

    10/11

    Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif

    Cours Statistique descriptive Mahmoud BABAY 12

    b) Diagramme cartographique (ou cartogramme)

    Lorsqu'une tud e stat ist ique concerne des donnes gographiques, les individus ou les

    modalits de la variable tudie sont des units spatiales (des rgions par exemple).

    On petit alors utili ser une carte pour visualiser les valeu rs associes a un caractre et a

    une unit spatiale.

    La population tudie est l'ensemble des gouvernorats de la Tunisie . La variable

    tudie est l'cart global en taux (L'cart global en taux, reprsente ici le

    dif fr ent iel de croissance de l'emploi un gouvernor at donn et la nat ion tou t e ent ir e

    sur la priod e 198 4 -1989. Un cart global pos iti f (n gat if) , signif ie que le tau x de

    croissance de lemploi du gouvernorat considr est suprieur (inferieur), au taux do

    croissance moyen au niv eau nat ion a l). Elle est qua nti tat ive con tin ue. Une

    dc omp osi tio n des val eur s de la var iab le en 5 cla sse s di ng ale amp lit ude con dui t

    la figure suivante :

    Fig ure 1-10 : Dia gra mme Car tog rap hiq ue

    Eca rt glo bal en tau x (Tr ) par gou ver nor at (19 84- 198 9)

  • 5/24/2018 Chapitre1(1)

    11/11

    Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif

    Cours Statistique descriptive Mahmoud BABAY 13

    c) Diagramme polaire

    Ce diagramme (figure 1-10) est utilise lorsqu'on cherche comparer, pour une variable

    donne, des observations relatives plusieurs sous populations (d'une mme population).

    On suppose que la variable (qualitative ou quantitative) tudie prsente p modalits. Le plan

    est divis en psecteurs dlimits par des axes associes aux diffrentes modalits de la

    variable. On reporte sur chaque axe la valeur correspondant la modalit concerne ; la

    distance du point l'origine est proportionnelle la valeur correspondante. Les points

    correspondants une mme sous population peuvent tre joints (figure 1-10).

    Les donnes du tableau prcisent le nombre de chmeurs selon la dure du chmage (en mois)

    et le niveau d'instruction enregistres en 1997(Source : enqute national sur l'emploi, 1999).

    Tableau: Nombre de chmeurs en Tunisie, enregistrs en 1997

    Dure dechmage

    en mois

    nant primaire secondaire suprieur total

    [0,1[ 1880 5089 2453 138 9560

    [1,3[ 12616 39895 16193 731 69435

    [3,6[ 12108 43318 16346 1072 72844

    [6,9[ 4002 19797 13263 1657 38719

    [9,12[ 2112 8419 8582 1816 20929

    [12,24[ 16224 93402 83346 11708 204680

    Figure 1 -10 : Diagramme Polaire