20
Statistiques 1

Statistiques

Embed Size (px)

DESCRIPTION

cours statiqtiques

Citation preview

  • Statistiques

    1

  • Table des matires1 Statistique Descriptive pour Une Variable 3

    1.1 Prsentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.1.1 tapes dune statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.1.2 Vocabulaire statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.1.3 Graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

    1.2 Paramtres statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.2.1 Paramtres de position . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.2.2 Paramtres de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.2.3 Changement dorigine et dchelle . . . . . . . . . . . . . . . . . . . . . . 81.2.4 Centrage et rduction dun caractre . . . . . . . . . . . . . . . . . . . . . 81.2.5 cart moyen la moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . 9

    2 tude Conjointe de Deux Variables 92.1 Srie statistique double . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

    2.1.1 Deux caractres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.1.2 Nuage de points . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.1.3 Point moyen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

    2.2 Ajustement affine par une mthode graphique . . . . . . . . . . . . . . . . . . . . 92.2.1 Ajustement la rgle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92.2.2 Droite de Mayer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

    2.3 Mthodes utilisant des moyennes, lissage . . . . . . . . . . . . . . . . . . . . . . 102.3.1 mthode des moyennes mobiles . . . . . . . . . . . . . . . . . . . . . . . 102.3.2 mthode des moyennes chelonnes . . . . . . . . . . . . . . . . . . . . . 102.3.3 mthode des moyennes discontinues . . . . . . . . . . . . . . . . . . . . . 10

    2.4 Ajustement affine par la mthode des moindres carrs . . . . . . . . . . . . . . . . 102.4.1 Covariance dune srie statistique double . . . . . . . . . . . . . . . . . . 102.4.2 Rgression linaire de y en x . . . . . . . . . . . . . . . . . . . . . . . . . 112.4.3 Rgression linaire de x en y . . . . . . . . . . . . . . . . . . . . . . . . . 11

    3 Corrlation linaire 123.1 Coefficient de corrlation linaire . . . . . . . . . . . . . . . . . . . . . . . . . . . 123.2 Proprits du coefficient de corrlation linaire . . . . . . . . . . . . . . . . . . . 123.3 Exemples de quelques cas possibles . . . . . . . . . . . . . . . . . . . . . . . . . 133.4 Exemple de rgression exponentielle . . . . . . . . . . . . . . . . . . . . . . . . . 14

  • 1 Statistique Descriptive pour Une Variable

    1.1 Prsentation1.1.1 tapes dune statistiqueCollecte des donnes Les observations sont effectues au sein dune population, relativement un caractre, les rsultats constituent une srie statistique.Par exemple les ges des lves dune classe, ou encore les nombres dlves du lyce reus auBTS en 1997 ...

    Analyse des donnes Il sagit de la dtermination de paramtres statistiques (effectifs, moyenne...) qui permettent de caractriser la srie statistique.

    Interprtation des rsultats laide de proprits mathmatiques et en laborant des tests onespre obtenir des indications suffisantes pour une exploitation des rsultats (tudes de marchspar exemple).

    1.1.2 Vocabulaire statistique

    Population La population est lensemble tudi, les lments de cette population sont appelsindividus ou encore units statistiques.Par exemple ltude du parc automobile en France se fera sur un ensemble de vhicules, la popu-lation est cet ensemble, les individus sont les vhicules.

    chantillon Lorsque la population est importante on prfre prlever au hasard ou en tenantcompte de certains critres, une partie ou sous-ensemble de cette population cest lchantillon.Sil est prlev au hasard on dira que cest un chantillon alatoire.

    Variable statistique

    Dfinition 1.1 La valeur statistique ou encore valeur du caractre est la mesure associe au ca-ractre aprs avoir choisi une unit qui sera prcise.

    Les diffrentes valeurs obtenues constituent la variable statistique.Par exemple les ges des automobiles dans un chantillon seront 5, 2, ... (annes)On distinguera deux types de variables statistiques suivant la nature mathmatique de lensembledes valeurs que le caractre est susceptible de prendre.Lorsque les valeurs du caractre sont isoles et appartiennent un ensemble fini de nombres ouencore appartiennent un ensemble infini tel que N , Z, D, Q on dira que la variable est discrte.Par exemple les ges des lves qui sont des nombres entiers positifs, mais ce pourrait tre dans unautre contexte {20; 20, 5; 21; 21, 5 . . .} qui sont des dcimaux (dont le nombre de chiffres droitede la virgule est fini : ici au plus un chiffre).Ne pas confondre les dcimaux et les rels qui ont des critures dcimales illimites et ne sont pas tousdcimaux.On convient dordonner ces valeurs dans lordre croissant x1 < x2 < x3 < . . .Au contraire, lorsque la variable peut prendre nimporte quelle valeur de R ou dun intervalle rel,on dit quelle est continue

  • Dans le cas dune variable continue on ralise une partition de R ou de lintervalle de R contenantles valeurs de la variable en k classes qui sont nots [a0; a1[, [a1; a2[, ..., [ai; ai+1[,..., [ak1; ak[ oubien [a1; a2[, ..., [ai; ai+1[,..., [ak1; ak[, [ak; ak+1[ selon le cas.Les centres des classes [ai; ai+1[ sont les rels ci = ai+ai+12 .

    Effectif, frquence

    Dfinition 1.2 Leffectif de la valeur xi dune variable est le nombre ni dobservations de la valeurxi dans le cas discret ou le nombre dobservations dans la classe [ai; ai+1[ dans le cas continu.

    en biologie, leffectif est appel la frquence absolue.Leffectif total est le nombre total dobservations, cest la somme de tous les effectifs.

    N = n1 + ... + nk1 + nk =

    i=ki=1

    ni.

    Dfinition 1.3 Les frquences sont les quotients des effectifs des valeurs du caractre ou des ef-fectifs des classes par leffectif total.

    fi =ni

    N=

    nii=ki=1 ni

    Proprit 1.4 Pour tout i on a 0 fi 1.

    En effet 0 ni i=k

    i=1 ni et donc en divisant par N =i=k

    i=1 ni on a 0 niN NN = 1.

    Proprit 1.5 La somme des frquences est 1,i=ki=1

    fi = 1.

    i=ki=1 fi =

    i=ki=1

    niN

    = 1N

    i=ki=1 ni =

    1N

    N = 1.

    Histogramme : Les aires des rectangles de lhistogramme des effectifs sont proportionnelles auxeffectifs des classes, on ne porte pas dchelle sur le second axe lorsque les classes nont pas lamme amplitude.

    Exemple 1 (Voir fig.1)

    Sil sagit de lhistogramme des frquences on agit de mme.

    Srie statistique

    Dfinition 1.6 Une srie statistique est lensemble des couples (xi; ni) ou ([ai; ai+1[; ni).

  • amplitude de la classe 5 5 10 20classe [0; 5[ [5; 10[ [10; 20[ [20; 40[effectif 4 12 12 22, 5 effectif / amplitude 2 6 3 0, 25(2, 5 est arbitraire)hauteur en cm du rectangle 2 cm 6 cm 3 cm 0, 25 cm

    0

    1

    2

    3

    4

    5

    6

    -5 0 5 10 15 20 25 30 35 40 45

    Amplitudes

    FIG. 1 Aires et Histogrammes.

    Effectifs cumuls croissants, frquences cumules croissantes

    Dfinition 1.7 Le tableau des effectifs cumuls croissants sobtient en associant chaque classe[ai; ai+1[, 1 i k, la somme des effectifs i =

    t=it=1 nt = n1 + n2 + ... + nt + ... + ni.

    En gnral on dessine lhistogramme des effectifs cumuls croissants ou le polygone des effectifscumuls croissants.On dfinit de mme les frquences cumules croissantes i =

    t=it=1 ft =

    iN

    . On dessine aussilhistogramme ou le polygone des frquences cumules croissantes.

    Effectifs cumuls dcroissants, frquences cumules dcroissantes Se dfinissent dune ma-nire semblable aux effectifs ou aux frquences cumuls croissants.

    Exemple 2 Dans le cas discret (Fig.2)

    Exemple 3 Variable continue. chaque classe [ai; ai+1[, 1 i k, on associe la somme deseffectifs i =

    t=kt=i nt = ni + ... + nt + ... + nk.

    1.1.3 Graphiques

    Les principaux graphiques sontLorsque la variable est discrte ou discontinue : le diagramme en btons, le polygone des effectifsou le polygone des frquences.Lorsque la variable est continue : lhistogramme (les aires des rectangles de lhistogramme deseffectifs sont proportionnelles aux effectifs des classes).

    1.2 Paramtres statistiques1.2.1 Paramtres de position

    Dominante ou mode

  • xi 1 2 3 4 5 6 7 Totauxni 2 3 4 8 6 2 25fi 0 0, 08 0, 12 0, 16 0, 32 0, 24 0, 08 1frquences cumules croissantes 0 0, 008 0, 2 0, 36 0, 60 0, 92 1frquences cumules dcroissantes 1 0, 92 0, 8 0, 64 0, 32 0, 08 0

    0

    0.2

    0.4

    0.6

    0.8

    1

    1 2 3 4 5 6 7

    FIG. 2 Frquences cumules.

    Dfinition 1.8 Lorsque la variable est discrte, une dominante ou mode est une valeur du carac-tre qui correspond un effectif maximum, la srie est unimodale, bimodale ... lorsque le nombrede modes est 1, 2 ...Lorsque la variable est continue, une classe modale correspondra un effectif maximum.

    Remarque 1 Lexistence de plusieurs modes peut permettre de suspecter ou de mettre en videncelexistence au sein de la population de plusieurs sous-populations dorigines diffrentes.

    Moyenne

    Dfinition 1.9 Lorsque la variable est discrte la moyenne x de la srie statistique est la moyennepondre

    x =

    i=ki=1 nixii=ki=1 ni

    =n1x1 + n2x2 + + nkxk

    N.

    Lorsque la variable est continue la moyenne est

    x =

    i=ki=1 nicii=ki=1 ni

    o les ci = ai+ai+12 sont les centres des classes.

    Mdiane

    Dfinition 1.10 La mdiane est la valeur du paramtre x telle que la moiti de leffectif totalcorrespond la fois aux valeurs du paramtre infrieures et aux valeurs du paramtre suprieures la mdiane.

    Proprit 1.11 La mdiane est labscisse du point dintersection des polygones des effectifs cu-muls croissants et dcroissants. Lordonne du point dintersection des deux polygones est N

    2.

  • Lorsque la variable est continue et que la valeur de la mdiane se trouve dans la classe [ai; ai+1[,les valeurs des frquences cumules croissantes sont i pour lensemble des classes prcdenteset ensuite i+1 = i + fi (en ajoutant la frquence fi de la classe courante [ai; ai+1[), alors i 0, 5 i+1 et la mdiane m se calcule par interpolation linaire : m ai = (ai+1ai)(0,5i)i+1i qui sesimplifie en

    m = ai +ei(0, 5 i)

    fi

    o ei = ai+1 ai est lamplitude de la classe [ai; ai+1[.En utilisant les effectifs cumuls on aurait

    m = ai +ei

    ni

    (N

    2 i

    ).

    1.2.2 Paramtres de dispersion

    Variance

    Dfinition 1.12 Lorsque la variable est discrte, la variance est

    V =

    i=ki=1 ni(xi x)2i=k

    i=1 ni.

    Lorsque la variable est continue, la variance est

    V =

    i=ki=1 ni(ci x)2i=k

    i=1 ni

    o les ci sont les centres des classes.

    Proprit 1.13 La variance est positive ou nulle : V 0.

    Proprit 1.14 Lorsque la variable est discrte, la variance est

    V =

    i=ki=1 nix

    2ii=k

    i=1 ni x2.

    Lorsque la variable est continue, la variance est

    V =

    i=ki=1 nic

    2ii=k

    i=1 ni x2

    o les ci sont les centres des classes.

    cart-typeDfinition 1.15 Lcart-type de la srie statistique est =

    V .

    Lorsque ltude porte sur un chantillon de la population, dont la moyenne x nest pas connue, onconstate que la variance et lcart-type calculs par les formules prcdentes sont infrieurs auxvaleurs relles et on utilise la dfinition suivante de lcart-type dun chantillon de taille N dunepopulation de grande taille (par rapport N ).

  • Dfinition 1.16 lcart-type dchantillon est

    N1 =

    1N 1

    i=ki=1

    ni(xi x)2

    o N est la taille de lchantillon.

    Remarque 2 Sur la calculatrice on peut vrifier que

    n1 =

    n

    n 1 n

    o n est leffectif total.

    1.2.3 Changement dorigine et dchelle

    Soit une variable statistique x dont les valeurs du caractre sont notes xi, 1 i k, avec deseffectifs ni de somme N et soient deux rels et , on peut alors dfinir une variable statistique ydont les valeurs du caractre sont les yi = xi + avec les mmes effectifs ni.

    Proprit 1.17 Avec les notations ci-dessus, on a :

    y = x + , y = ||x

    o x, y sont les valeurs moyennes et x, y les carts-types des deux variables.

    y = 1N

    niyi =

    1N

    (nixi + ) =

    1N

    ((

    nixi + N)) = 1N

    nixi + = x + .

    2y =1N

    ni(yiy)2 = 1N

    ni(xi+x)2 = 1N

    2ni(xix)2 = 2 1N

    ni(xix)2 =

    22x.

    Exemple 4 Utilisation du changement de variable pour le calcul dune moyenne.

    xi 7.1 7.2 7.5 8.4 8.6 8.9 9ni 1 2 3 6 4 3 1yi = 10xi 80 9 8 5 4 6 9 10

    y = 91615+24+24+27+1020

    = 4520

    = 2, 25 donc x = 2,25+8010

    = 8, 225.

    Exemple 5 Srie particulire

    xi 3 4 5 6 7ni 1 2 4 2 1yi = xi 5 2 1 0 1 2

    Le calcul y = 0 est immdiat do x = 5.2y =

    110

    (4 + 2 + 2 + 4) 02 = 1, 6 donc x = y =

    1, 6 1, 26.

  • 1.2.4 Centrage et rduction dun caractre

    Par un changement dorigine y = x x, il est possible dobtenir un caractre y de moyennenulle y = 0.

    Par un changement dchelle (ou dunit de mesure), si x 6= 0, et y = xx on obtient uncaractre y dcart-type 1.

    En combinant les deux et en prenant

    y =x x

    x

    on obtient un caractre y centr et rduit, cest--dire de moyenne nulle et dcart-type 1.

    Exemple 6 Srie centre et rduite.

    xi 3 5 6 8 10ni 1 3 4 1 1yi =

    xi6x

    1, 68 0.56 0 1, 12 2, 24

    x = 6 et x =

    3, 2 1, 79 do y = xxx

    x61,79

    est centre et rduite (du moins approximative-ment, dans le tableau, tant donn les erreurs darrondis).

    1.2.5 cart moyen la moyenneAvec les notations habituelles

    Dfinition 1.18 Soit la variable statistique x, lcart moyen la moyenne est

    Em =1

    N

    ni|xi x|

    Exemple 7 Calcul dun cart moyen la moyenne

    xi 3 5 6 8 10ni 1 3 4 1 1

    x = 6 et Em = 13+31+40+12+1410

    = 1210

    = 1, 2En moyenne les valeurs observes sont, en plus ou en moins, cartes de 1, 2 de la valeur moyenne6 de la srie.

    2 tude Conjointe de Deux Variables2.1 Srie statistique double2.1.1 Deux caractres

    On tudie pour une mme population P deux caractres qualitatifs ou quantitatifs et on dfinitune srie statistique sur lensemble des couples (x; y) de valeurs des deux caractres. Dans ce quisuit, sauf indication contraire, chaque couple a pour effectif 1 et on nutilisera pas de notation nipour ces effectifs, leffectif total N est alors le nombre des couples (xi; yi) de la srie et i variedonc de 1 N .

  • ge en annes x 36 42 48 54 60 66Tension maximale y 11, 6 13, 2 14 14, 4 15, 5 15, 1

    11

    12

    13

    14

    15

    16

    17

    35 40 45 50 55 60 65 70

    FIG. 3 Tension maximale.

    2.1.2 Nuage de points

    Dans un repre orthogonal on reprsente les points M (x; y) dont les coordonnes sont lescouples de valeurs des deux caractres, lensemble de ces points est communment appel le nuagede points.

    2.1.3 Point moyen

    Dfinition 2.1 Le point moyen G du nuage de points de la srie statistique double est le point decoordonnes x = 1

    N

    xi et y = 1N

    yi, o N est le nombre de points du nuage.

    Exemple 1 Le tableau (voir Fig. 3) donne, dans une population fminine, la moyenne de la tensionartrielle maximale en fonction de lge.La droite trace est la droite de Mayer, celle-c passe par le point moyen G du nuage (le placer).

    2.2 Ajustement affine par une mthode graphique2.2.1 Ajustement la rgle

    Lorsque les points du nuage semblent presque aligns il peut tre envisageable de rechercherune relation y = ax + b ou x = ay + b entre les deux caractres.En traant une droite L la plus proche possible de tous les points, entre ces points et dans ladirection quils suggrent on obtient rapidement une assez bonne approximation de la relationy = ax+b. Si besoin est, les coefficients a et b se calculent partir des coordonnes de deux pointsde L, mais gnralement la mthode nest utilise que pour des lectures graphiques (interpolationou extrapolation).

    2.2.2 Droite de Mayer

    La droite de Mayer passe par le point moyen G du nuage et par deux autres points moyens G1et G2 de deux moitis du nuage obtenus en prenant les N1 premiers points et les N2 = N N1autres.Lorsque N1 = N2 le point G est le milieu du segment [G1G2].

  • 2.3 Mthodes utilisant des moyennes, lissage2.3.1 mthode des moyennes mobiles

    Consiste remplacer M1, M2, ..., Mp par M 1 (xp;y1++yp

    p), puis les p points suivants par un

    point M 2(x2p;yp+1++y2p

    p) et aisi de suite.

    2.3.2 mthode des moyennes chelonnes

    Consiste remplacer M1, M2, ..., Mp par leur point moyen M 1 (x1++xp

    p; y1++yp

    p) et de

    recommencer avec les p points suivants ...

    2.3.3 mthode des moyennes discontinues

    Consiste remplacer plusieurs points de mme valeur du caractre x par un seul point moyen(ce point aura donc la mme abscisse x que ceux quil remplace).

    2.4 Ajustement affine par la mthode des moindres carrs2.4.1 Covariance dune srie statistique double

    Dfinition 2.2 La covariance de la srie double (x; y) est

    xy =1

    N

    i=Ni=1

    [(xi x)(yi y)]

    Les variances de x et de y se notent 2x = 1N

    [(xi x)2] et 2y = 1N

    [(yi y)2] .les carts-types de x et de y sont x et y.

    2.4.2 Rgression linaire de y en x

    Soient le nuage des points Mi (xi; yi) et une droite quelconque D dquation y = ax + b, nonparallle au second axe.Soient alors les points Pi (xi; axi + b) de mmes abscisses que les points Mi et situs sur la droiteD.

    Si la droite D passait par tous les points Mi, ont aurait Pi = Mi et les distances MiPi seraientnulles, mais en gnral une telle droite D nexiste pas.En dterminant une droite D telle que la somme S =

    MiPi

    2 des carrs des distances MiPi soitminimale on obtiendra la droite appele droite de rgression linaire de y en x . (Voir Fig. 4).

    Le calcul ci-dessous met en vidence les variances 2x, 2y et la covariance xy, il nest pas unedmonstration complte des proprits :S =

    MiPi

    2 =

    (yi axi b)2 =

    (yi y a(xi x) + y ax b)2en prenant yaxb = 0 on obtient une droite passant par le point moyen G du nuage et la sommedevientS =

    (yi y a(xi x))2 =

    [(yi y)2 2a(yi y)(xi x) + a2(xi x)]

    S = N(2y 2axy + a22x)En prenant a = xy

    2x

    S = N(2y 22xy + 2xy) = N(2y + 2xy).On montre que cest la valeur minimale de la somme et on admettra les proprits suivantes.

  • P i

    Myi

    ax + b

    y

    x

    D

    xiO

    i

    i

    nuage

    FIG. 4 Droite de rgression linaire de y en x.

    Dfinition 2.3 La droite de rgression de y en x est la droite D : y = ax+ b passant par le pointmoyen G du nuage et de coefficient directeur

    a =xy

    2x

    Le calcul du coefficient b de lquation se fait laide des coordonnes du point G (x; y) de ladroite D,

    b = y axLe signe de a est le signe de la covariance xy.

    2.4.3 Rgression linaire de x en y

    On peut remarquer que yx = xy.Par symtrie, en changeant les lettres x et y dans les explications et rsultats du paragraphe pr-cdent :On cherche une droite D : x = ay + b non parallle au premier axe, telle que la somme descarrs des longueurs MiQi soit minimale.(Les points Qi sont sur D et ont pour ordonnes les mmes yi que les Mi correspondants).

    Dfinition 2.4 La droite de rgression de x en y est la droite D : x = ay + b passant par lepoint moyen G du nuage et de coefficient directeur

    a =xy

    2y

    Le calcul du coefficient b de lquation se fait encore laide des coordonnes du point G (x; y)de la droite D,

    b = x ay(Voir Fig. 5).

    Le signe de a est le signe de la covariance xy.On peut voir que a = a

    2x

    2y.

    Lorsque a 6= 0, lquation x = ay + b peut scrire y = 1a b

    aet D a pour coefficient

    directeur 1a

    .

    Le produit des coefficients directeurs des droites D et D est donc gal aa

    =2y

    2x

  • ay + b

    DPi

    y

    xxiO

    nuage

    My i

    i

    i

    FIG. 5 Droite de rgression linaire de x en y.

    3 Corrlation linaire3.1 Coefficient de corrlation linaireDfinition 3.1

    Le coefficient de corrlation linaire entre les valeurs des caractres x et y dune srie statistiquedouble est

    r =xy

    xy

    Les droites de rgression sont D : y = ax + b et D : x = ay + b avec a = xy2x

    et a = xy2y

    .

    3.2 Proprits du coefficient de corrlation linaireProprit 3.2 On a les relations suivantes entre le coefficient de corrlation linaire r et les coef-ficients a et a des droites de rgression de y en x et de x en y

    aa = r2, r2 = a22x2y

    = a2Vx

    Vy, r = a

    x

    y

    aa = xy2x

    xy

    2y=

    2xy

    2x2y

    et r2 =(

    xy

    xy

    )2=

    2xy

    2x2y.

    r2 =2xy

    2x2y

    =2xy

    4x

    2x2y

    =(

    xy

    2x

    )22x2y

    = a2 2x

    2y= a2 Vx

    Vy.

    Proprit 3.3 On a

    1 r 1, le coefficient de corrlation linaire est compris entre 1 et 1 Les points du nuage sont aligns si et seulement si r = 1 ou r = 1 le coefficient de corrlation linaire a mme signe que les coefficients a et a et r2 = aa

    Si |r| = 1, lajustement affine est parfait.Si |r| < 0, 7, lajustement affine nest pas justifi.Si |r| > 0, 7 lajustement affine est envisageable et selon le domaine sur lequel porte la statistiqueet le problme tudi, on dcide dun seuil au-del duquel la corrlation est suffisante pour justifierun ajustement affine.

  • xi 5.5 9.7 8.7 11.8 19.0 5.9 9.5 17.3 13.3 11.0 18.0 7.8yi 8.5 13.2 8.7 11.1 3.8 6.5 7.4 5.6 6.5 5.9 6.7 4.9

    xi 1.5 1.3 1.8 12.0 2.7 15.4 12.9 6.2yi 0.8 7.4 18.1 4.7 10.2 17.8 11.2 9.0

    n = 20x = 9.57, Vx = 28.90, x = 5.38y = 8.40, Vy = 17.77, y = 4.22xy = 1.79, r = 0.08D : y = ax + b, a = 0.06, b = 8.99D : x = ay + b, a = 0.10, b = 10.41

    2

    4

    6

    8

    10

    12

    14

    16

    18

    2 4 6 8 10 12 14 16 18

    FIG. 6 Corrlation Proche de 0.

    Remarque 1 Une interprtation gomtrique du coefficient de corrlation linaire r que nous ne dtaillerons pasici montre que r = cos() o est un angle de deux vecteurs, le tableau ci-dessous donne quelques valeurs de langle :

    r = cos Angle Interprtationradians et degrs

    1 0, 0 mme direction, alignement0, 87 pi

    6, 30

    0, 7 pi4

    , 45

    0, 5 pi3

    , 60

    0 pi2

    , 90 orthogonalit, indpendance

    3.3 Exemples de quelques cas possiblesExemple 1 Coefficient de corrlation nul ou presque(Voir Fig. 6)

    Exemple 2 Bonne corrlation(Voir Fig. 7)

    Exemple 3 Trs forte corrlation(Voir Fig. 8)

    3.4 Exemple de rgression exponentielle

    Exemple 4 Allure exponentielle du nuage (Voir Fig. 9)On remarque que les points du nuage ne paraissent pas aligns et quau contraire ils semblent

  • xi 22.1 32.5 41.1 51.3 61.0 71.9 82.4 92.2 101.2 110.6 122.8 130.6yi 212.8 239.8 193.4 199.5 199.2 179.8 177.4 172.5 191.0 184.9 158.9 173.0

    xi 141.4 152.6 162.0 172.6 182.9 190.6 201.8 210.8 222.1 232.7 240.4 251.4yi 151.1 147.5 142.4 139.9 132.5 150.4 100.6 142.3 81.2 76.3 92.1 71.4

    n = 24x = 136.71, Vx = 4785.19, x = 69.18y = 154.58, Vy = 1940.84, y = 44.05xy = 2868.31, r = 0.94D : y = ax + b, a = 0.60, b = 236.52D : x = ay + b, a = 1.48, b = 365.16

    80

    100

    120

    140

    160

    180

    200

    220

    240

    50 100 150 200 250

    FIG. 7 Bonne Corrlation.

    xi 5.5 6.4 7.9 8.6 9.6 10.3 11.7 12.0 13.7 14.3 15.2 16.3yi 3.4 3.9 4.6 5.1 6.1 7.1 7.2 8.5 8.5 9.1 10.7 11.2

    n = 12x = 10.96, Vx = 11.22, x = 3.35y = 7.12, Vy = 6.07, y = 2.46xy = 8.14, r = 0.99D : y = ax + b, a = 0.73, b = 0.84D : x = ay + b, a = 1.34, b = 1.41

    4

    5

    6

    7

    8

    9

    10

    11

    6 8 10 12 14 16

    FIG. 8 Trs Forte Corrlation.

  • xi 3.4 5.3 4.4 7.5 6.1 8.5 9.3 9.8 11.0 11.2 12.9 14.7yi 2.1 2.9 2.1 4.1 3.0 4.9 5.0 5.6 6.4 7.1 9.1 12.0

    xi 15.2 16.2 18.4 19.6 19.7 20.5 22.0 21.9 25.0 25.4 24.6 26.4yi 12.8 15.2 21.4 26.6 27.7 30.8 39.9 38.9 64.5 69.8 60.9 81.8

    n = 24x = 14.96, Vx = 51.11, x = 7.15y = 23.11, Vy = 559.98, y = 23.66xy = 153.23, r = 0.91D : y = ax + b, a = 3.00, b = 21.74D : x = ay + b, a = 0.27, b = 8.64

    10

    20

    30

    40

    50

    60

    70

    80

    5 10 15 20 25

    FIG. 9 Nuage en forme de courbe exponentielle.

    disposs sur la courbe reprsentative dune fonction dallure exponentielle.

    Exemple 5 Transformation par la fonction logarithme nprienOu transformation de y en z = ln(y) partir des donnes de lexemple prcdent.(Voir Fig. 10)On a un trs bon coefficient de corrlation linaire en tudiant la srie double des caractres x etz = ln(y) au lieu de y (Voir lexemple prcdent Fig. 9).Les calculs indiquent que z = ax + b avec a = 0.16, b = 0.16 et on peut en dduire quey = e0,16x+0,16, ou encore y = e0,16x e0,16 = 1, 17e0,16x car e0,16 1, 17.Cest justement la courbe C dquation 1, 17e0,16x qui est trace sur la figure de lexercice prc-dent.Cet exemple montre comment on peut utiliser une transformation y 7 z = ln(y) pour pouvoireffectuer une rgression linaire et enfin la transformation inverse z 7 y = ez pour obtenir largression exponentielle.

  • xi 3.4 5.3 4.4 7.5 6.1 8.5 9.3 9.8 11.0 11.2 12.9 14.7zi = ln(yi) 0.7 1.1 0.8 1.4 1.1 1.6 1.6 1.7 1.9 2.0 2.2 2.5

    xi 15.2 16.2 18.4 19.6 19.7 20.5 22.0 21.9 25.0 25.4 24.6 26.4zi = ln(yi) 2.6 2.7 3.1 3.3 3.3 3.4 3.7 3.7 4.2 4.2 4.1 4.4

    n = 24x = 14.96, Vx = 51.11, x = 7.15z = 2.55, Vz = 1.31, z = 1.15xz = 8.18, r = 1.00D : z = ax + b, a = 0.16, b = 0.16D : x = az + b, a = 6.24, b = 0.98

    1

    1.5

    2

    2.5

    3

    3.5

    4

    5 10 15 20 25

    FIG. 10 Transformation z = ln(y).

  • Indexge, 7aire, 2ajuqtement affine, 7ajustement la rgle, 7ajustement affine, 8, 11aligns, 7, 11allure exponentielle, 12amplitude, 2analyse des donnes, 1angle de deux vecteurs, 11approximation, 7second axe, 9

    bimodale, 3

    calculatrice, 5caractre, 1centrage, 6centre, 5centres des classes, 2, 5changement dorigine et dchelle, 6changement de variable, 6chiffres, 1classe modale, 3classes, 2coefficient de corrlation linaire, 10coefficient directeur, 10coefficients, 7coefficients directeurs des droites, 10continu, 2coordonnes, 7corrlation linaire, 10couples, 7courbe reprsentative, 12covariance, 8critre, 1

    dcimaux, 1diagramme en btons, 3direction, 7discret, 2distances, 9dominante, 3droite, 9droite de Mayer, 7, 8

    cart moyen la moyenne, 7

    cart-type, 5chantillon, 1chantillon, 1, 5chantillon alatoire, 1chelle, 2effectif, 2effectif maximum, 3effectif total, 2effectifs cumuls croissants, 2effectifs cumuls dcroissants, 3lment, 1ensemble, 1ensemble fini, 1entiers positifs, 1quation, 9tude de march, 1exploitation des rsultats, 1extrapolation, 7

    frquence, 2frquence absolue, 2frquences cumules croissantes, 2frquences cumules dcroissantes, 3

    graphique, 3

    hasard, 1histogramme, 2, 3

    individus, 1interpolation, 7interprtation des rsultats, 1intervalle, 2isoles, 1

    lectures graphiques, 7lissage, 8

    mdiane, 4mthode des moindres carrs, 8mthode des moyennes discontinues, 8mthode des moyennes chelonnes, 8mthode des moyennes mobiles, 8mthode graphique, 7milieu, 8minimale, 9mode, 3modes, 3

    18

  • moitis du nuage, 8moyenne, 4moyenne pondre, 4

    nombre des couples, 7nuage de points, 7

    ordonnes, 9ordonner, 1ordre croissant, 1origines, 3

    non parallle, 9paramtres de dispersion, 5paramtre de position, 3paramtre statistique, 1, 3parfait, 11partie, 1partition, 2point dintersection, 4point moyen, 7, 8point moyen G du nuage, 10polygone des effectifs, 3polygone des frquences, 3population, 1, 5premier axe, 9proportionnelles, 3proprit, 1

    rectangle, 2rduction, 6rgression exponentielle, 12rgression linaire de y en x, 9rgression linaire de x en y, 9relation, 7repre orthogonal, 7

    segment, 8srie statistique, 1, 2srie statistique double, 7, 8signe de la covariance, 9, 10somme des carrs des longueurs, 9sous-populations, 3sous-ensemble, 1symtrie, 9

    tests, 1

    unimodale, 3unit, 1unit de mesure, 6

    unit statistique, 1

    variable continue, 2variable discrte, 1variance, 5variances, 8

  • Table des figures1 Aires et Histogrammes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 Frquences cumules. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 Tension maximale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 Droite de rgression linaire de y en x. . . . . . . . . . . . . . . . . . . . . . . . 115 Droite de rgression linaire de x en y. . . . . . . . . . . . . . . . . . . . . . . . 126 Corrlation Proche de 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 Bonne Corrlation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 Trs Forte Corrlation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 Nuage en forme de courbe exponentielle. . . . . . . . . . . . . . . . . . . . . . . . 1510 Transformation z = ln(y). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16