Cours Stat Descriptive

  • Upload
    ae

  • View
    220

  • Download
    0

Embed Size (px)

Citation preview

  • 8/14/2019 Cours Stat Descriptive

    1/73

    Cours de statistique - DM 2009/2010 1

    STATISTIQUE

    Statistique descriptive

  • 8/14/2019 Cours Stat Descriptive

    2/73

    Introduction

    Faire parler les sries de donnes statistique descriptive Dgager les caractristiques :

    Tendance centrale Dispersion Distribution Valeurs extrmes Temps

    statistique infrentielle

    Utilisation de tests ou de lois

  • 8/14/2019 Cours Stat Descriptive

    3/73

    Statistique descriptive

    1 - Distribution de frquences

    2 - Mthodes graphiques

    3 - Mesures de tendance centrale 4 - Mesures de dispersion

    5 - Mesures de positionnement

    6 - Analyse exploratoire des donnes

  • 8/14/2019 Cours Stat Descriptive

    4/73

    1 Distribution de frquences

    Dans un tableau de donnes, les frquencesreprsentent le nombre de fois o chaquevaleur apparat

    Critres dfinir : Nombre de classes

    Largeur des classes

    Frquences relatives Frquences cumules

  • 8/14/2019 Cours Stat Descriptive

    5/73

    Exercice 1 : ctes sur coquilledAmmonites

    Tableau de donnes

    Dtermination du nombre de classes (k) pour n valeurs,par la rgle de Sturges :

    K = 1 + 3,322 log nsoit 5,52366, arrondi 6

    Dtermination de la larguer des classes :

    (35 16)/6 = 3,16666

    donnes en vrac 2donnes tries 1

  • 8/14/2019 Cours Stat Descriptive

    6/73

    Exercice 1 : ctes sur coquilledAmmonites

    Tableau de donnes

    donnes en vrac 2donnes tries 1Classes

    de frquenc

  • 8/14/2019 Cours Stat Descriptive

    7/73

    Exercice 1 : ctes sur coquilledAmmonites

    Tableau de donnes

    donnes en vrac 2donnes tries 1Classes

    de fr uenc

  • 8/14/2019 Cours Stat Descriptive

    8/73

    0

    5

    10

    15

    20

    25

    17 20 23 26 29 32 35

    Classes de frquences

    nombred'in

    dividus

    Histogramme des frquences cumules

    0

    1

    2

    3

    4

    5

    6

    7

    17 20 23 26 29 32 35

    Classes de frquences

    Nombred

    'individus

    Histogramme des frquences

    0%

    5%

    10%

    15%

    20%

    25%

    30%

    17 20 23 26 29 32 35

    Classes de frquences

    Nombred

    'individus

    Histogramme des frquences relatives

  • 8/14/2019 Cours Stat Descriptive

    9/73

    Nombre de ct

    n

    Importance du choix du nombre de classes

  • 8/14/2019 Cours Stat Descriptive

    10/73

    Exercice 2 Hauteurs despeupliers

    Application la mise en vidence de

    diffrences dans les rsultats

  • 8/14/2019 Cours Stat Descriptive

    11/73

    Exercice 2 Hauteurs despeupliers

    Tableau de frquence

    Classesde frquence

  • 8/14/2019 Cours Stat Descriptive

    12/73

    Exercice 2 Hauteurs despeupliers

    3 traitements : Nombre de classes avec n = 30

    K = 1 + 3,322 log n

    soit 5.907, arrondi 6- Largeur des classes :

    6,8/6 = 1,1333Choix de classes de 1 unit

  • 8/14/2019 Cours Stat Descriptive

    13/73

    Exercice 2 Hauteurs despeupliers

    Classesde frquence

    Tableau de frquence

  • 8/14/2019 Cours Stat Descriptive

    14/73

    Exercice 2 Hauteurs despeupliers

    0%5%

    10%

    15%

    20%

    25%

    30%35%

    40%

    45%

    50%

    1,9 2,9 3,9 4,9 5,9 6,9 7,9 8,9

    Classes de hauteur (limites suprieures des classes)

    frquencerelativ

    e

    Contrle

    Irrigation

    Irrigation et fertilisati

    Hauteur des plants de Peupliers en mtre ; distribution en frquences relativesen fonction du traitement.

  • 8/14/2019 Cours Stat Descriptive

    15/73

    2 Mthodes graphiques

    Histogrammes des frquences

    Polygones des frquences

    Le Dotplot Le Trac en tige et feuilles

    Le diagramme de btons

    Le diagramme circulaire Les sries chronologiques

  • 8/14/2019 Cours Stat Descriptive

    16/73

    Le polygone des frquences

    0

    2

    4

    6

    8

    10

    12

    14

    1 2 3 4 5 6 7 8 9 10

  • 8/14/2019 Cours Stat Descriptive

    17/73

    Courbe cumulative

    0

    10

    20

    30

    40

    50

    60

    1 2 3 4 5 6 7 8

  • 8/14/2019 Cours Stat Descriptive

    18/73

    Courbe cumulative (2)

    I = point dinflexion

  • 8/14/2019 Cours Stat Descriptive

    19/73

    Courbe cumulative (3)

    0

    5

    10

    15

    20

    25

    1 2 3 4 5 6

    0

    10

    20

    30

    40

    50

    60

    1 2 3 4 5 6 7 8

    0

    2

    4

    6

    8

    10

    12

    14

    1 2 3 4 5 6 7 8 9 10

    0

    1

    2

    3

    4

    5

    6

    7

    1 2 3 4 5 6

    Un point dinflexion un modeDeux points dinflexion deux modes

    i1

    i2

    i

  • 8/14/2019 Cours Stat Descriptive

    20/73

    Le diagramme circulaire

    2% 6%

    15%

    25%

    21%

    17%

    10%

    4%

    1

    2

    3

    4

    5

    67

    8

  • 8/14/2019 Cours Stat Descriptive

    21/73

    Le diagramme en bton

    900

  • 8/14/2019 Cours Stat Descriptive

    22/73

    Le diagramme de dispersion

    0

    2

    4

    6

    8

    10

    12

    14

    0 5 10 15

    valeurs des x

    valeursdey

  • 8/14/2019 Cours Stat Descriptive

    23/73

    Le diagramme de dispersion

    0

    2

    4

    6

    8

    10

    12

    14

    0 5 10 15

    valeurs des x

    valeursdey

    Graphique en courbe

  • 8/14/2019 Cours Stat Descriptive

    24/73

    Le diagramme de dispersion

    y = 0,4659x + 5,2198

    0

    2

    4

    6

    8

    10

    12

    14

    0 5 10 15

    valeurs des x

    valeursdey

    Courbe de tendanceCorrlation

  • 8/14/2019 Cours Stat Descriptive

    25/73

  • 8/14/2019 Cours Stat Descriptive

    26/73

    Le Dotplot

    1 32 54 76 8

    1 32 54 76 8

    1 32 54 76 8

    Contrle

    Irrigation

    Irrigation & fertilisation

  • 8/14/2019 Cours Stat Descriptive

    27/73

    Le trac tige et feuilles

    1 92 9

    Contrle Irrigation Irrigation & fertilisation

  • 8/14/2019 Cours Stat Descriptive

    28/73

    Exercice 3

    sexe M Mpoids enfant 62,5 64,poids mre 66 58

    Mise en vidence dune relation entre le poids de la mre et celui des enfants masculins.

    60,0

    62,0

    64,0

    66,0

    68,0

    70,0

    72,0

    74,0

    76,0

    55 60 65 70 75

    P o i d s d e l a m

    Poids

    de

    l'enfant

  • 8/14/2019 Cours Stat Descriptive

    29/73

    Exercice 3 (2)

    0,0

    10,0

    20,0

    30,0

    40,0

    50,0

    60,0

    70,0

    80,0

    55 60 65 70 75

    Mise en vidence dune relation entre le poids de la mre et celui des enfants masculins.

    ATTENTION AUX ECHELLES

    DES X et DES Y

  • 8/14/2019 Cours Stat Descriptive

    30/73

    Exercice 3

    sexe M Mpoids enfant 62,5 64,poids mre 66 58

    Mise en vidence dune relation entre le poids de la mre et celui des enfants masculins.

    y = 0 ,3941x + 42

    60,0

    62,0

    64,0

    66,0

    68,0

    70,0

    72,0

    74,0

    76,0

    55 60 65 70 75

    P o i d s d e l a m

    Poids

    de

    l'enfant

  • 8/14/2019 Cours Stat Descriptive

    31/73

    Exercice 4

    35.5 35.7 39.2 39.641.1 41.2 41.3 41.4

    Classe de

    34-35,936-37,90%10%20%30%

    40%

    50%

    60%

    70%

    35 37 39 41 43

    classes de primtre (cm)

    frquence

    %

    Histogrammedes primtrescrniens desenfants de deux

    mois

  • 8/14/2019 Cours Stat Descriptive

    32/73

    Exercice 4 (2)

    35 5,73637

    35 3736 3938 4140 42 43

  • 8/14/2019 Cours Stat Descriptive

    33/73

    3 Mesures de tendance centrale

    a) La moyenne

    Ex : teneur en plomb dans latmosphre (norme = 1,5 g/m3)

    5,40 1,10 0,42 0,73 0,48 1,10 g/m3

    n

    xmoyenne

    =

    538,16/23,9 ==x

  • 8/14/2019 Cours Stat Descriptive

    34/73

    3 Mesures de tendance centrale (2)

    moyenne dun chantillon

    moyenne dune population

    n

    x

    x

    =

    N

    x=

  • 8/14/2019 Cours Stat Descriptive

    35/73

    3 Mesures de tendance centrale (3)

    b) La mdiane : valeur du milieu

    Si nb dindividus impair, mdiane = valeur delindividu moyen ou central

    Ex 15 valeurs tries ; mdiane = 8me valeur enpartant de la plus basse

    Si nb dindividus pair, mdiane = moyennedes deux individus moyens

    Ex 6 valeurs de plomb :

    mdiane = (1,10 + 0,73)/2 = 0,915

  • 8/14/2019 Cours Stat Descriptive

    36/73

    3 Mesures de tendance centrale (4)

    c) Le mode

    = valeur qui est prsente le plus grand nombre

    de foisEx : primtre crnien unimodal

    multimodal

    0%

    10%

    20%

    30%

    40%

    50%

    60%

    70%

    35 37 39 41 43

    classes de primtre (cm)

    frquence%

  • 8/14/2019 Cours Stat Descriptive

    37/73

    3 Mesures de tendance centrale (5)

    c) Le midrange

    = moyenne arithmtique des deux valeurs

    extrmes

    midrange = (min + max)/2

    Ex Plomb (5,40 + 0,42)/2 = 2,91

  • 8/14/2019 Cours Stat Descriptive

    38/73

    Exercice 6

    CONTRLEmoyenne

    diIRRIGATIONIRRIGAT &

  • 8/14/2019 Cours Stat Descriptive

    39/73

    3 Mesures de tendance centrale (6)

    c) La moyenne pondre

    =

    ).( xxpondremoyenne

    ==

    tscoefficiendessommetcoefficien

  • 8/14/2019 Cours Stat Descriptive

    40/73

    Exercice 7

    5,81

    100

    )5075()3090()2085(=

    ++ xxx

    33,833

    759085=

    ++

    Moyenne pondre

    Moyenne arithmtique

  • 8/14/2019 Cours Stat Descriptive

    41/73

    Exercice 8

    Moyenne de frquence

    50,179100

    )5450()3350()35250()30150()5050(=

    ++++ xxxxx

  • 8/14/2019 Cours Stat Descriptive

    42/73

    Avantages etMeure de

    tendance

    centrale

    Uti

  • 8/14/2019 Cours Stat Descriptive

    43/73

  • 8/14/2019 Cours Stat Descriptive

    44/73

    4 Mesures de dispersion

    Ex : temps de file dattente dans deuxcliniques : une ou 3 files dattente

    Moyenne = 6 mn Variation ?Une seule filT is fil s d

  • 8/14/2019 Cours Stat Descriptive

    45/73

    4 Mesures de dispersion (2)

    4.1 Ltendue

    Premier cas : 7 4 = 3 mn

    Deuxime cas : 14 1 = 13 mn

    Facilit dutilisation

    mais ne tient compte que des valeurs extrmes

    imalevaleurimalevaleurEtendue minmax =

  • 8/14/2019 Cours Stat Descriptive

    46/73

    4 Mesures de dispersion (3)

    4.2 Lcart type

    Premier cas

    Deuxime cas

    ou

    2*3

    )18()774(32222

    ++=s 732,13

    6

    18

    6

    324342===

    =s

    2*3

    )18()1431(3 2222 ++

    =s749

    6

    294

    6

    324618===

    =s

    )1(

    )()( 22

    =

    nn

    xxns

    1

    )( 2

    =

    n

    xxs

  • 8/14/2019 Cours Stat Descriptive

    47/73

    4 Mesures de dispersion (4)

    Pourquoi diviser parn 1 ? Seulement n 1 valeurs indpendantes

    n 1 = nombre de degr de libert

    Cas dune population

    N

    xx =2)(

  • 8/14/2019 Cours Stat Descriptive

    48/73

    4 Mesures de dispersion (5)

    La variance Cas dun chantillon : s2

    Cas dune population : 2

    Le coefficient de variation CV

    chantillon Population%100x

    sCV = %100

    =CV

  • 8/14/2019 Cours Stat Descriptive

    49/73

    4 Mesures de dispersion (6)

    Interprtation de lcart type : 1) valeur de s et dispersion

    s1 s2

    S1 > S2

    Grande dispersion Faible dispersion

  • 8/14/2019 Cours Stat Descriptive

    50/73

    4 Mesures de dispersion (7)

    Interprtation de lcart type : 2) 95 % des observations sont moins de 2 s

    95 % des observations

    ss

  • 8/14/2019 Cours Stat Descriptive

    51/73

  • 8/14/2019 Cours Stat Descriptive

    52/73

    4 Mesures de dispersion (9)

    Ex 1

    IRRIGATI3,2 4,43 9 5 3

  • 8/14/2019 Cours Stat Descriptive

    53/73

    Exercice 17

    A%Lf%L %

  • 8/14/2019 Cours Stat Descriptive

    54/73

    IMC 19x2 384moyenne 25

    2

    Exercice 10

  • 8/14/2019 Cours Stat Descriptive

    55/73

    4 Mesures de dispersion (10)

    Ex 2 : primtre crnien

    0%

    10%

    20%

    30%

    40%

    50%

    60%

    70%

    35 37 39 41 43

    classes de primtre (cm)

    frquence%

    Primtres de 35,5 et 35,7 considrs plus petits que la normale

    moy

  • 8/14/2019 Cours Stat Descriptive

    56/73

    4 Mesures de dispersion (11)

    - 5) rgle des 68 95 99,7

    2

    3

    +

    +2

    +3

    68 % moins dun s

    95 % moins de 2 s

    99,7 % moins de 3 s

  • 8/14/2019 Cours Stat Descriptive

    57/73

    Ex

    taille des femmoyenne de 1145 et 181 cor

    Exercice 12

  • 8/14/2019 Cours Stat Descriptive

    58/73

    Exercice 13

    Tailles

    Conclusion : la variation du poids est plus importante que celle de la taille

    5 Mesures de positionnement

  • 8/14/2019 Cours Stat Descriptive

    59/73

    5 Mesures de positionnementrelatif

    5.1 - Le score-z : combien dcart type lavaleur se trouve-t-elle de la moyenne ?Ex : JordanLobo mesures

    xxz

    =

    =xzou

    5 Mesures de positionnement

  • 8/14/2019 Cours Stat Descriptive

    60/73

    5 Mesures de positionnementrelatif (2)

    La taille de Jordan se trouve + 3,23 fois lcart type de

    la moyenne des hommes

    La taille de Lobo se trouve 5,04 fois lcart type de lamoyenne des femmes

    Lobo est relativement plus grande parmi les

    femmes que Jordan parmi les hommes

    Jordan23,3

    0711,0

    75,198,1===

    xz

    04,50635,0

    61,193,1=

    =

    =

    xz

    5 Mesures de positionnement

  • 8/14/2019 Cours Stat Descriptive

    61/73

    5 Mesures de positionnementrelatif (3)

    Valeurs ordinaires et valeurs inhabituelles

    0 +1 +2 +3-1-2-3

    Valeurs ordinaires Valeurs inhabituellessuprieures

    Valeurs inhabituellesinfrieures

    5 Mesures de positionnement

  • 8/14/2019 Cours Stat Descriptive

    62/73

    5 Mesures de positionnementrelatif (4)

    5.2 Quartiles et percentiles QUARTLIES

    Q1 = premier% 25 % d

    5 Mesures de positionnement

  • 8/14/2019 Cours Stat Descriptive

    63/73

    5 Mesures de positionnementrelatif (5)

    5.2 Quartiles et percentiles

    Les PERCENTILES sparent les donnes en

    100 parties gales avec 1 % des donnes danschaque groupe.

    5 Mesures de positionnement

  • 8/14/2019 Cours Stat Descriptive

    64/73

    5 Mesures de positionnementrelatif (6)

    5.2 Quartiles et percentiles

    Comment trouver le percentile qui correspond unevaleur particulire ?

    100

    inf

    valeursdestotalnombre

    xrieuresvaleursdenombrexvaleurdepercentile =

    301004012112 ==depercentile

    5 Mesures de positionnement

  • 8/14/2019 Cours Stat Descriptive

    65/73

    5 Mesures de positionnementrelatif (7)

    5.2 Quartiles et percentiles

    Comment trouver la valeur qui correspond unpercentile particulierk? On cherche le localisateurL

    dune valeur particulire parmi n valeurs.

    nk

    L100

    =

    i L t

    5 Mesures de positionnement

  • 8/14/2019 Cours Stat Descriptive

    66/73

    5 Mesures de positionnementrelatif (8)

    5.2 Quartiles et percentiles

    Ex : cotinine2,274010068

    ==L

    5 Mesures de positionnement

  • 8/14/2019 Cours Stat Descriptive

    67/73

    5 Mesures de positionnementrelatif (9)

    5.2 Quartiles et percentiles

    Q1 = P25 ; Q2 = P50 ; Q3 = P 75

    Distance interquartile : DIQ = Q3 Q1

    tendue 10 90 % : = P90 - P10

    Exercice 14

  • 8/14/2019 Cours Stat Descriptive

    68/73

    Exercice 14

    P20

    840100

    20==L

    3040100

    75==L

    4,040100

    1==L

    Distance Int1040

    10025 ==L

    Exercice 14 (suite)

  • 8/14/2019 Cours Stat Descriptive

    69/73

    Exercice 14 (suite)

    Etendue 10

    440100

    10==L

    3640100

    90

    ==L

    6 Analyse exploratoire des

  • 8/14/2019 Cours Stat Descriptive

    70/73

    6 Analyse exploratoire desdonnes

    6.1 Valeurs extrmes

    Valeurs extrmes = valeurs aberrantes

    6 Analyse exploratoire des

  • 8/14/2019 Cours Stat Descriptive

    71/73

    6 Analyse exploratoire desdonnes (2)

    6.2 Botes moustaches (Boxplot)

    minimum

    mdiane

    Q1 Q3 maximum

    6 Analyse exploratoire des

  • 8/14/2019 Cours Stat Descriptive

    72/73

    6 Analyse exploratoire desdonnes (3)

    6.3 - Botes moustaches de Tukey

    minimum

    mdiane

    Q1 Q3maximum

    DIQ

    1,5 DIQ1,5 DIQ

    Q3 + 1,5 DIQ= vibrisse suprieure

    Q3 - 1,5 DIQ= vibrisse infrieure

    Valeurs normalesValeurs

    anomaliques

    suprieures

    =

    outliers

    Valeurs

    anomaliques

    infrieures

    =

    outliers

    6 Analyse exploratoire des

  • 8/14/2019 Cours Stat Descriptive

    73/73

    6 Analyse exploratoire desdonnes (4)

    6.3 - Botes moustaches de Tukey

    Application aux teneurs en Cd des sols franais