Les tests d'hypothèses.pdf

Embed Size (px)

Citation preview

  • Dpartement de Mathmatiques et Informatique

    Abdelhamid El Mossadeq Professeur lEHTP

  • A. El Mossadeq Mai 2008

  • TABLE DES MATIRES

    1.Lesprincipesgnrauxdestestsdhypothses 1

    2.Testdecomparaisonduneestimationunenorme 4

    2.1.Testdecomparaisondunefrquenceunenorme 4

    2.2.Testdecomparaisondunevarianceunenorme 6

    2.3.Testdecomparaisondunemoyenneunenorme 8

    2.3.1.n30 82.3.2.n

  • Tests dHypothses A. El Mossadeq

    1. Les Principes Gnraux des TestsdHypothses

    Soit X un ala dont la loi de probabilit appartient la famille fP j 2 g, Rp, p 1:

    Une hypothse H est un sous ensemble de :

    Une hypothse est dite simple si H ne contient quun seul lment.

    Soient deux hypothses H0 : 2 0 et H1 : 2 1 telles que :0 \1 = ?

    en gnaral, 0 et 1 forment une partition de .

    Un test dhypothses consiste trancher entre deux hypothses au vu desrsultats dun chantillon.

    Lobjectif dun test est de choisir entre ces deux hypothses, la dcision aboutira

    choisir H0 (appele lhypothse nulle) ou H1 appele (lhypothse alternative)

    dont une seule est en ralit vraie.

    Il y a donc quatre cas possibles dont les probabilits sont rsumes dans le tableau

    suivant:

    H0 vraie H1 vraie

    H0 dcide 1

    H1 dcide 1

    1

  • A. El Mossadeq Tests dHypothses

    1 est la probabilit de dcider H0 alors que H0 est vraie. est la probabilit de dcider H1 alors que H0 est vraie.

    est la probabilit de dcider H0 alors que H1 est vraie.

    1 est la probabilit de dcider H1 alors que H1 est vraie.

    est appel lerreur du 1ere espce. est appel lerreur du 2eme espce.1 est appel la puissance du test.

    Ces deux erreurs sont antogonistes, plus sera grand (resp. petit), plus sera

    petit (resp. grand).

    Le fait dimposer un faible conduit une rgle de dcision plus stricte qui

    aboutit le plus souvent nabandonner lhypothse nulle que dans des cas rares

    et donc conserver cette hypothse quelque fois tort.

    Le compromis entre les valeurs de et est donc souhaitable bien que di cile

    raliser.

    Dans la pratique, on dtermine la variable de dcision dont la loi doit treparfaitement connue sous lhypothse nulle H0.

    tant x, on appelle rgion critique, note C, lensemble des valeurs dela variable de dcision qui conduisent rejeter lhypothse nulle H0 au prot de

    lhypothse alternative H1 :

    P [C j H0] = et on appelle rgion dacceptation, note C, lensemble des valeurs de lavariable de dcision qui conduisent accepter lhypothse nulle H0 au prot de

    lhypothse alternative H1.

    2

  • Tests dHypothses A. El Mossadeq

    Un test bilatral sapplique quand on cherche une dirence entre une estima-tion et une valeur donne ou entre deux estimations sans se proccuper du signe

    ou du sens de la dirence :

    H0 : 0 = contre H1 : 0 6= ou :

    H0 : 1 = 2 contre H1 : 1 6= 2La rgion critique ou la zone de rejet de lhypothse nulle est situe de part et

    dautre de la distribution de probabilit de la variable de dcision :

    Region d0acceptation d0un test bilateral

    Un test unilatral sapplique quand on cherche dterminer si une estimationest suprieure (resp. infrieure) une valeur donne ou une autre estimation :

    H0 : 0 contre H1 : 0 < resp: H0 : 0 contre H1 : 0 >

    ou :

    H0 : 1 2 contre H1 : 1 < 2resp: H0 : 1 2 contre H1 : 1 > 2

    3

  • A. El Mossadeq Tests dHypothses

    Dans ce cas, la rgion critique ou la zone de rejet de lhypothse nulle est situe

    dun seul ct de la distribution de probabilit de la variable de dcision :

    Region d0acceptation d0un test unilateral

    Certains tests comme le test du khi-deux est pratiquement toujours unilatral.

    2. Tests de Comparaison dune Estimation une Norme

    2.1. Test de Comparaison dune Frquence Observe une Norme

    On dispose dune population o le caractre tudi prsente une proportion p.

    Sur un chantillon de taille n, on observe une frquence f:

    La dirence entre p et f est-elle signicative ou est-elle de seulement au hasard

    de lchantillonnage ?

    Soit donc tester lhypothse nulle :

    H0 : "f = p"

    4

  • Tests dHypothses A. El Mossadeq

    contre lhypothse alternative :

    H0 : "f 6= p"au seuil :

    Sous lhypothse nulle H0 et pourvu que np et n (1 p) soient suprieurs ougaux 5, la quantit :

    t =f prp (1 p)

    n

    peut tre considre comme une ralisation de la variable alatoire normale cen-

    tre rduite :

    N =F prp (1 p)

    n

    Ainsi, pour tout 2 [0; 1], il existe t1=2 2 R tel que :PjN j < t1=2 = 1

    On rejette lhypothse nulle H0, au seuil , ds que :

    jtj > t1=2

    Exemple 1Une machine former des pilules fonctionne de faon satisfaisante si la proportionde pilules non russies est de 1 pour 1000.Sur un chantillon de 10000 pilules, on a trouv 15 pilules dfectueuses.Que faut-il conclure ?Ici on a : 8

  • A. El Mossadeq Tests dHypothses

    Testons, au seuil , lhypothse nulle :

    H0 : "la machine est bien rgle"

    Sous cette hypothse, la quantit :

    t =f prp (1 p)

    n

    peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.Pour = 5%, on a :

    t:975 = 1:96

    et comme :

    t =f prp (1 p)

    n

    = 1:58

    on accepte donc lhypothse nulle H0 au seuil = 5%, cest dire, quau seuil = 5%, la machine fonctionne de faon satisfaisante.

    2.2. Test de Comparaison dune Variance Observe une Norme

    Si X suit une loi normale de moyenne et de variance 2, alors sous lhypothse

    nulle :

    H0 : "s2 = 2"

    la quantit :

    2 =(n 1) s2

    2

    est une ralisation dune variable 2n1 du Khi-deux (n 1) degrs de libert.

    6

  • Tests dHypothses A. El Mossadeq

    Ainsi, pour tout 2 [0; 1], il existe 2n1;=2 et 2n1;1=2 dans R tels que :

    Ph2n1;=2 <

    2 < 2n1;1=2i= 1

    o 2n1;=2 et 2n1;1=2 vrient :8

  • A. El Mossadeq Tests dHypothses

    est une ralisation dune variable du Khi-deux :

    (10 1) = 9degrs de libert : 29Pour = 5% :

    29;:025 = 2:7

    29;:975 = 19

    et comme :

    2 =(n 1) s2

    2= 7:02

    on accepte lhypothse nulleH0, au seuil = 5%, cest dire, la force de rupturede ce type de cable a pour variance :

    2 = 2000N2

    2.3. Test de Comparaison dune Moyenne Observe une Norme

    2.3.1. n 30Sous lhypothse nulle :

    H0 : "m = "

    la quantit :

    t =m pn

    peut tre considre comme une ralisation de la variable alatoire normale cen-

    tre rduite :

    N =M pn

    8

  • Tests dHypothses A. El Mossadeq

    Ainsi, pour tout 2 [0; 1], il existe t1=2 2 R tel que :PjN j < t1=2 = 1

    cest dire : Z t1=2t1=2

    1p2expt

    2

    2dt = 1

    ou encore : Z t1=21

    1p2expt

    2

    2dt = 1

    2

    On rejette alors lhypothse nulle H0, 1 , ds que :jtj > t1=2

    Si la variance 2 est inconnue, on la remplace par son estimation s2:

    Exemple 3Dune population, on extrait un chantillon de taille n = 40 sur lequel on observeune moyenne m = 7:5 et une variance s2 = 80.Tester lhypothse selon laquelle cet chantillon est extrait dune population demoyenne = 10.Ici on a :

    n = 40 = 10 m = 7:5 s2 = 80

    Testons lhypothse nulle :

    H0 : "la moyenne de la population est = 10"

    Sous cette hypothse, la quantit :

    t =m spn

    peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.Pour = 5%, on a :

    t:975 = 1:96

    9

  • A. El Mossadeq Tests dHypothses

    et comme :

    t =m spn

    = 1:77

    on accepte lhypothse nulle H0 au seuil = 5%, cest dire, lchantillon estextrait dune population de moyenne = 10.

    2.3.2. n < 30

    Si X suit une loi normale de moyenne et de variance 2, alors sous lhypothse

    nulle :

    H0 : "m = "

    la quantit :

    t =m spn

    est une ralisation de la variable alatoire de Student Tn1 (n 1) degrs delibert :

    Tn1 =M spn

    Ainsi, pour tout 2 [0; 1], il existe tn1;1=2 2 R tel que :PjTn1j < tn1;1=2 = 1

    o tn1;1=2 vrie :

    Fn1tn1;1=2

    = 1

    2Fn1 tant la fonction de rpartition de Tn1.On rejette alors lhypothse nulle H0, 1 , ds que :

    jtj > tn1;1=2

    10

  • Tests dHypothses A. El Mossadeq

    Exemple 4Un fabriquant de corde a rme que les objets quil produit ont une tension derupture moyenne de trois cents Kilogrammes.Peut-on admettre le bien fond de cette a rmation si des expriences faites surdix cordes ont permis de constater les forces de rupture suivantes :

    251 247 255 305 341 326 329 345 392 289

    Avant de tester lhypothse nulle :

    H0 : "la tension de rupture moyenne de la corde est 300 kg"

    Calculons les estimations m et s2 sur cet chantillon de taille n = 10.On a :

    m =1

    10

    10Xi=1

    xi

    = 308 kg

    et :

    s2 =1

    9

    10Xi=1

    (xi m)2

    = 2269:8 kg2

    Sous lhypothse nulle H0, la quantit :

    t =m spn

    est une ralisation dune variable alatoire de Student :

    n 1 = 9degrs de libert :T9.Pour = 5%, on a :

    t9;:975 = 2:26

    11

  • A. El Mossadeq Tests dHypothses

    et comme :

    t =m spn

    = :531

    on accepte lhypothse nulle H0 au seuil = 5%, cest dire, la tension derupture moyenne de la corde est 300 kg.

    3. Tests de Comparaison de DeuxEstimations

    3.1. Test de Comparaison de Deux Frquences

    On dispose de deux chantillons indpendants de tailles respectives n1 et n2 sur

    lesquels le caractre tudi prsente les frquences f1 et f2 respectivement.

    On se demande si ces deux chantillons proviennent dune mme population.

    Soit donc tester lhypothse nulle :

    H0 : "p1 = p2"

    contre lhypothse alternative :

    H0 : "p1 6= p2"au seuil :

    Si les deux chantillons proviennent dune mme population dnie par la pro-

    portion p = p1 = p2 (souvent inconnue) du caractre tudi, f1 et f2 peuvent

    tre considres comme des ralisations des variables alatoires normales centres

    rduites :

    12

  • Tests dHypothses A. El Mossadeq

    N1 =F1 prf1 (1 f1)

    n1

    N2 =F2 prf2 (1 f2)

    n2

    respectivement, pourvu que n1p1, n1 (1 p1), n2p2 et n2 (1 p2) soient toussuprieurs ou gaux 5:

    En consquence , la quantit :

    t =f1 f2r

    f1 (1 f1)n1

    +f2 (1 f2)

    n2

    peut tre considre comme une ralisation dune variable alatoire normale cen-

    tre rduite.

    On rejette lhypothse nulle H0, au seuil , ds que :

    jtj > t1=2

    Exemple 5Avant de procder au lancement dun produit, une entreprise a fait procder une enqute portant sur deux rgions gographiques A et B.Sur 1800 rponses provenant de la rgion A, 630 se dclarent intresses par leproduit.En provenance de B, 150 rponses sur 600 se dclarent favorables.Tester, au seuil de 5%, lhypothse de lidentit des opinions des rgions A et Bquant au produit considr.

    13

  • A. El Mossadeq Tests dHypothses

    Ici on : 8>>>>>:nA = 1800 ; fA =

    7

    20

    nB = 600 ; fB =1

    4Testons, au seuil , lhypothse nulle :

    H0 : les opinions des rgions A et B sont identiques

    Sous cette hypothse, la quantit :

    t =fA fBr

    fA (1 fA)nA

    +fB (1 fB)

    nB

    peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.Pour = 5%, on a :

    t:975 = 1:96

    et comme :

    t =fA fBr

    fA (1 fA)nA

    +fB (1 fB)

    nB= 4:77

    on rejette donc lhypothse nulle H0 95% (et mme 99:98%), cest dire,les deux rgions A et B ont des opinions direntes.

    3.2. Test de Comparaison de Deux Variances

    On considre deux populations dans lesquelles le caractre tudi est distribu

    selon des lois normales de variances 21 et 22 inconnues.

    Il sagit de dcider si les variances de ces deux populations sont gales.

    14

  • Tests dHypothses A. El Mossadeq

    Soit tester, au seuil , lhypothse nulle :

    H0 : "21 =

    22"

    On extrait de ces deux populations, deux chantillons indpendants de taille n1et n2 respectivement, sur lesquels on calcule les estimations s21 de

    21 et s

    22 de

    22.

    Sous lhypothse nulle H0, la quantit :

    f =s21s22

    est une ralisation dune variable alatoire Fn11;n21 de Fisher (n1 1; n2 1)degrs de libert.

    Ainsi, pour tout 2 [0; 1], il existe Fn11;n21;=2 2 R et Fn11;n21;1=2 2 Rtels que :

    PFn11;n21;=2 < f < Fn11;n21;1=2

    = 1

    On rejette alors lhypothse nulle H0, 1 , ds que :f =2 Fn11;n21;=2 Fn11;n21;1=2

    En pratique, on rejette lhypothse nulle H0, 1 , ds que :8>>>>>>>:s21s22> Fn11;n21;1=2 si s

    21 > s

    22

    s22s21> Fn21;n11;1=2 si s

    22 > s

    21

    Exemple 6Sur deux chantillons indpendants de tailles n1 = 9 et n2 = 21, extraits de deuxpopulations gaussiennes, les variances ont t estimes par s21 = 16 et s

    22 = 12.

    Peut-on admettre, au seuil = 10%, que les deux populations considres ontla mme variance ?

    15

  • A. El Mossadeq Tests dHypothses

    Ici on a : n1 = 9 s

    21 = 16

    n2 = 21 s22 = 12

    Testons au seuil , lhypothse nulle :

    H0 : "21 =

    22"

    Sous cette hypothse, la quantit :

    f =s21s22

    est une ralisation dune variable alatoire de Fisher :

    (n1 1; n2 1) = (8; 20)degrs de libert : F8;20Pour = 10%, on a :

    F8;20;:95 = 2:45

    et comme :

    f =s21s22

    =4

    3

    on accepte lhypothse nulle H0 au seuil = 10%.

    Exemple 7Sur deux chantillons indpendants de tailles n1 = 17 et n2 = 21, extraits dedeux populations gaussiennes, les variances ont t estimes par s21 = 36 ets22 = 45:

    Peut-on admettre, au seuil = 2%, que ces deux populations ont la mme vari-ance ?

    Ici on a : n1 = 17 s

    21 = 36

    n2 = 21 s22 = 45

    16

  • Tests dHypothses A. El Mossadeq

    Testons au seuil , lhypothse nulle :

    H0 : "21 =

    22"

    Sous cette hypothse, la quantit :

    f =s22s21

    est une ralisation dune variable alatoire de Fisher :

    (n2 1; n1 1) = (20; 16)degrs de libert : F20;16Pour = 2, on a :

    F20;16;:99 = 3:25

    et comme :

    f =s22s21

    = 1:25

    on accepte lhypothse nulle H0 au seuil = 2%.

    3.3. Test de Comparaison de Deux Moyennes

    On considre deux populations dans lesquelles le caractre tudi est dni par1;

    21

    et2;

    22

    respectivement.

    On extrait de ces deux populations, deux chantillons indpendants de tailles n1et n2 respectivement, sur lesquels on calcule les estimations

    m1; s

    21

    de1;

    21

    etm2; s

    22

    de2;

    22

    .

    3.3.1. n1 30 et n2 30Sous lhypothse nulle :

    H0 : "1 = 2"

    17

  • A. El Mossadeq Tests dHypothses

    la quantit :

    t =m1 m2s21n1+22n2

    peut tre considre comme une ralisation de la variable alatoire normale cen-

    tre rduite :

    N =M1 M2s21n1+22n2

    Ainsi, pour tout 2 [0; 1], il existe t1=2 2 R tel que :PjN j < t1=2 = 1

    On rejette alors lhypothse nulle H0, 1 , ds que :jtj > t1=2

    Si 21 ou 22 est inconnue, on peut remplacer sans inconvnient lune ou lautre

    par son estimation.

    Exemple 8Chez cent sujet normaux, on dose lacide urique, les rsultats sont :8

  • Tests dHypothses A. El Mossadeq

    Testons au seuil , lhypothse nulle :

    H0 : "la maladie de goutte na pas dinuence sur la dose de lacide urique"

    Sous cette hypothse, la quantit :

    t =m1 m2ss21n1+s22n2

    peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.Pour = 5%, on a :

    t:975 = 1:96

    et comme :

    t =m1 m2ss21n1+s22n2

    = 15:862

    on rejette lhypothse nulle H0 95% (mme 99:99%); cest dire, la maladiede goutte a une inuence sur la dose de lacide urique.

    3.3.2. n1 < 30 ou n2 < 30

    Si le caractre tudi est distribu dans les deux populations selon des lois nor-

    males de mme variance 2 = 21 = 22 (pour vrier cette hypothse, on peut

    faire un test de comparaison de deux variances) estime par :

    s2 =(n1 1) s21 + (n2 1) s22

    n1 + n2 2alors sous lhypothse nulle :

    H0 : "1 = 2"

    19

  • A. El Mossadeq Tests dHypothses

    la quantit :

    t =m1 m2s

    r1

    n1+1

    n2

    est une ralisation de la variable alatoire Tn1+n22 de Student (n1 + n2 2)degrs de libert.

    Ainsi, pour tout 2 [0; 1], il existe tn1+n22;1=2 2 R tel que :

    PjTn1+n22j < tn1+n22;1=2 = 1

    On rejette alors lhypothse nulle H0, 1 , ds que :jtj > tn1+n22;1=2

    Exemple 9On tudie leet dune substance sur la croissance dune tumeur gree.Les rsultats sont consigns sur le tableau ci-dessous donnant la surface de latumeur au 20eme jour aprs sa gree :

    Surface 5:5 6 6:5 7 7:5 8

    T emoins 1 2 3 8 4 3

    Traites 4 4 8 3 1 1

    Le traitement a-t-il un eet signicatif sur la surface tumorale ?On suppose que la surface tumorale est distribue selon des lois normalesN 1; 21et N 2; 22 chez les tmoins et les traits respectivement.

    20

  • Tests dHypothses A. El Mossadeq

    Calculons les estimationsm1; s

    21

    de1;

    21

    etm2; s

    22

    de2;

    22

    .

    On a : 8>>>>>>>>>>>:m1 =

    1

    21

    6Xi=1

    n1ixi = 7

    s21 =1

    20

    6Xi=1

    n1i (xi m1)2 = :45

    et : 8>>>>>>>>>>>:m2 =

    1

    21

    6Xi=1

    n2ixi = 6:4048

    s22 =1

    20

    6Xi=1

    n2i (xi m2)2 = :87972

    Testons dabord, au seuil = 5%, lhypothse nulle dgalit des variances dessurfaces tumorales chez les populations des tmoins et des traits.Sous cette hypothse, la quantit :

    f =s22s21

    est une ralisation dune variable alatoire de Fisher :

    (n2 1; n1 1) = (20; 20)degrs de libert.Pour = 5%, on a :

    F20;20;:975 = 2:45

    et comme :

    f =s22s21

    = 1:9549

    21

  • A. El Mossadeq Tests dHypothses

    on accepte donc lhypothse dgalit des variances des deux populations.Calculons maintenant lestimation commune s2 de cette variance :

    s2 =(n1 1) s21 + (n2 1) s22

    n1 + n2 2= :66486

    et testons lhypothse nulle :

    H0 : "le traitement est sans eet sur la croissance de la surface tumorale"

    Sous cette hypothse, la quantit :

    t =m1 m2s

    r1

    n1+1

    n2

    est une ralisation de la variable alatoire de Student :

    n1 + n2 2 = 40degrs de libert.

    Pour = 5%, on a :

    t40;:975 = 2:02

    et comme :

    t =m1 m2s

    r1

    n1+1

    n2= 2:831

    on rejette lhypothse nulleH0 95% (et mme 98%), cest dire, le traitementa une inuence sur la croissance de la surface tumorale.

    22

  • Tests dHypothses A. El Mossadeq

    4. Test dAdquation du Khi-Deux

    On considre un caractre k classes direntes en proportion p1; :::; pk.

    Comme p1+ :::+pk = 1, la composition de la population est entirement dter-

    mine par k 1 de ces proportions.On extrait de cette populations un chantillon de taille n:

    Si la composition de cet chantillon tait identique celle de la population, il

    contiendrait :

    t1 = np1 du caractre 1:

    tk = npk du caractre k

    ce sont les eectifs calculs ou les eectifs thoriques.En ralit, on observe des eectifs :

    o1 du caractre 1:

    ok du caractre k

    dirant plus ou moins des eectifs thoriques. Ce sont les eectifs observs.Le problme est de dcider si lcart entre ces eectifs est signicatif ou il est d

    seulement au hasard de lchantillonnage.

    Soit donc tester, au seuil , lhypothse nulle :

    H0 : "o1 = t1 ; ::: ; ok = tk"

    contre lhypothse alternative H0.

    Sous lhypothse nulle H0, et pourvu que tous les eectifs thoriques soient

    suprieurs ou gaux 5, la quantit :

    23

  • A. El Mossadeq Tests dHypothses

    2 =

    kXi=1

    (oi ti)2ti

    est une ralisation dune variable du Khi-deux k 1 degrs de libert : 2k1. tant donn, il existe 2k1;1 2 R tel que :

    P2 < 2k1;1

    = 1

    On rejette alors lhypothse nulle H0 1 ds que :2 > 2k1;1

    Exemple 10On a crois deux types de plantes dirant par deux caractres A et B.La premire gnration est homogne.La seconde fait apparaitre quatre types de plantes dont les gnotypes sontdsigns par : AB ; Ab ; aB ; ab:Si les caractres se trasmettent selon les lois deMendel, les proportions thoriques

    des quatre gnotypes sont :9

    16;3

    16;3

    16;1

    16respectivement.

    Sur un chantillon de 160 plantes, on a observ les eectifs :

    100 pour AB28 pour Ab24 pour aB8 pour ab

    Au vu de ces rsultats, les lois de Mendel sont-elles applicables ?

    Testons alors, au seuil , lhypothse nulle :

    H0 : les lois de Mendel sont applicables

    24

  • Tests dHypothses A. El Mossadeq

    Si H0 est vraie, la rpartition des 160 plantes sur les quatre gnotypes devraittre comme suit :

    t1 = 90 pour ABt2 = 30 pour Abt3 = 30 pour aBt4 = 10 pour ab

    On rsume toutes les donnes dans le tableau suivant :

    Genotypes Repartition Observee Repartition Theorique

    AB 100 90

    Ab 28 30

    aB 24 30

    ab 8 10

    Total 160 160

    Sous lhypothse nulle H0, et vu que tous les eectifs thoriques sont suprieursou gaux 5, la quantit :

    2 =

    4Xi=1

    (oi ti)2ti

    est une ralisation dune variable du Khi-deux :

    4 1 = 3degrs de libert : 23.

    25

  • A. El Mossadeq Tests dHypothses

    Pour = 5%, on a :

    23;:95 = 7:81

    et comme :

    2 =

    4Xi=1

    (oi ti)2ti

    = 2:84

    On accepte alors lhypothse nulle H0 au seuil de 5%, cest dire, les transmis-sions gntiques de ce type de plantes se font selon les lois de Mendel.

    Remarque 1Si pour lajustement par une loi thorique dpendant de paramtres, on utiliseles estimations de s parmi ces paramtres, et non leurs valeurs relles, alors lenombre de degrs de libert, dans ce cas, est :

    (k 1) s = k s 1Ainsi , par exemple :

    (i) si, pour lajustement par une loi de Poisson, on utilise lestimation de son

    paramtre, suppos inconnu, alors le nombre de degrs de libert est :

    (k 1) 1 = k 2(ii) si, pour lajustement par une loi normale, on utilise lestimation de la moyenne

    et de la variance, supposes toutes les deux inconnues, alors le nombre de

    degrs de libert est :

    (k 1) 2 = k 3

    26

  • Tests dHypothses A. El Mossadeq

    5. Test dIndpendance du Khi-Deux

    On considre deux caractres X et Y n et m classes respectivement.

    Le tableau suivant rsume les observations faites sur un chantillon de taille N

    concernant le couple de caractres (X; Y ) :

    Tableau des effectifs observes

    XY 1 2 : : m Total

    1 o11 o12 : : o1m o1:

    2 o21 o22 : : o2m o2:

    : : : : : : :

    n on1 on2 : : onm on:

    Total o:1 o:2 : : o:m N

    o :

    oi: =

    mXk=1

    oik

    o:j =

    nXk=1

    okj

    et :nXi=1

    oi: =

    mXj=1

    o:j =

    nXi=1

    mXj=1

    oij = N

    27

  • A. El Mossadeq Tests dHypothses

    Au vu de ces rsultats, Il sagit de dcider si les deux caractre X et Y sont

    indpendants.

    Soit tester, au seuil , lhypothse nulle :

    H0 : X et Y sont indpendants

    contre lhypothse alternative H0.

    Si X et Y taient indpendants, alors pour tout (i; j) 2 f1; ::; ng f1; ::;mg :

    P [X = i; Y = j] = P [X = i]P [Y = j]

    et lchantillon contiendrait en consquence :

    tij =oi:o:jN

    individus possdant le caractre [X = i; Y = j]. Ce sont les eectifs thoriquesou les eectifs calculs.

    Tableau des effectifs theoriques

    XY 1 2 : : m Total

    1 t11 t12 : : t1m o1:

    2 t21 t22 : : t2m o2:

    : : : : : : :

    n tn1 tn2 : : tnm on:

    Total o:1 o:2 : : o:m N

    28

  • Tests dHypothses A. El Mossadeq

    Sous lhypothse nulle H0, et pourvu que tous les eectifs thoriques soient

    suprieurs ou gaux 5, la quantit :

    2 =

    nXi=1

    mXj=1

    (oij tij)2tij

    est une ralisation dune variable alatoire du Khi-deux (n 1) (m 1) degrsde libert : 2(n1)(m1). tant donn, il existe 2(n1)(m1);1 2 R tel que :

    Ph2 < 2(n1)(m1);1

    i= 1

    On rejette alors lhypothse nulle H0 1 ds que :2 > 2(n1)(m1);1

    Exemple 1175 enfants sont vus en consultation pour un asthme. On relve chez eux les deuxsymptmes suivants :* Intensit de la maladie asmathique : lgre , moyenne , forte* Existence ou absence dun eczma au moment de lobservation ou dans lepass.On peut classer les enfants selon la rpartition suivante :

    EczemaAsthme fort moyen leger

    present 8 2 2

    passe 11 11 3

    jamais 6 18 14

    On se propose de dterminer sil existe une association entre lintensit de lasthmeet lexistence dun eczma ?

    29

  • A. El Mossadeq Tests dHypothses

    Testons, au seuil , lhypothse nulle :

    H0 : lintensit de lasthme est indpendante de lexistence dun eczma

    Calculons, sous cette hypothse, la rpartition thorique :

    Tableau des effectifs theoriques

    EczemaAsthme fort moyen leger Total

    present 4 4:96 3:04 12

    passe 8:33 10:33 6:34 25

    jamais 12:67 15:71 9:62 38

    Total 25 31 19 75

    Les eectifs thoriques sur la premire ligne sont strictement infrieurs cinq,ce qui empche lapplication dun test du Khi-deux. On peut remdier cet taten oprant le groupement logique des classes presentet passe.Les nouveaux tableaux des eectifs observs et thoriques, obtenus aprs re-groupement de ces deux classes sont donns ci-aprs.

    Tableau des effectifs observees

    EczemaAsthme fort moyen leger Total

    present ou passe 19 13 5 37

    jamais 6 18 14 38

    Total 25 31 19 75

    30

  • Tests dHypothses A. El Mossadeq

    Tableau des effectifs theoriques

    EczemaAsthme fort moyen leger Total

    present ou passe 12:33 15:29 9:38 37

    jamais 12:67 15:71 9:62 38

    Total 25 31 19 75

    Sous lhypothse nulle H0, la quantit :

    2 =

    2Xi=1

    3Xj=1

    (oij tij)2tij

    est une ralisation dune variable du Khi-deux :

    (2 1) (3 1) = 2degrs de libert.Pour = 5%, on a :

    22;:95 = 5:99

    Et comme :

    2 =

    2Xi=1

    3Xj=1

    (oij tij)2tij

    = 11:84

    On rejette alors H0 95% (mme 99:5%), cest dire, lintensit de lasthmedpend de lexistence dun eczma.

    Remarque 2Lorsque lhypothse nulle est rejete, il est souhaitable de prciser lintensit dela liaison entre les deux caractres X et Y .On introduit alors le coe cient suivant, dit coe cient de Tschuprov :

    31

  • A. El Mossadeq Tests dHypothses

    T 2 =2

    Np(n 1) (m 1)

    1. Si les deux caractres X et Y sont indpendants alors :

    2 = 0

    puisque pour tout (i; j) 2 f1; ::; ng f1; :::;mg :oij = tij

    do :

    T 2 = 0

    2. Si les deux caractres X et Y sont en liason fonctionnelle (bijection), alors

    n = m et par une permutation sur les lignes ou sur les colonnes, on peut

    ramener le tableau des eectifs observs un tableau diagonal.

    On a :

    oi: = o:i = oii

    do :

    2 =

    nXi=1

    nXj=1

    (oij tij)2tij

    =

    nXi=1

    (oii tii)2tii

    +Xi6=j

    (oij tij)2tij

    Or :

    nXi=1

    (oii tii)2tii

    = N (n 2) +nXi=1

    o2ii

    32

  • Tests dHypothses A. El Mossadeq

    et : Xi6=j

    (oij tij)2tij

    =Xi6=jtij

    =Xi6=j

    oi: o:jN

    =1

    N

    nXi=1

    oi: (N o:i)

    = N 1N

    nXi=1

    o2i:

    donc :

    2 = N (n 1)Il en rsulte que :

    jT j = 1

    3. Dans les autres cas, on admet que :

    (a) Si :

    0 < T < 0:3

    on dit que la liaison est faible.

    (b) Si :

    0:3 < T < 0:7

    on dit que la liaison est moyenne.

    (c) Si :

    0:7 < T < 1

    on dit que la liaison est forte.

    33

  • A. El Mossadeq Tests dHypothses

    Exemple 12Reprenons lexemple prcdent.On a :

    T 2 =2

    Np(n 1) (m 1)

    =11:84

    75p(2 1) (3 1)

    = 0:11163

    do :

    T = 0:334

    On conclut que la liason entre lintensit de lasthme et lexistence deczma estmoyenne.

    34

  • Tests dHypothses A. El Mossadeq

    6. Exercices

    Exercice 1Une machine former des pilules fonctionne de faon satisfaisante si la proportionde pilules non russies est de 1 pour 1000.Sur un chantillon de 10000 pilules, on a trouv 15 pilules dfectueuses.Que faut-il conclure ?

    Solution 1Ici on : 8

  • A. El Mossadeq Tests dHypothses

    Exercice 2On a lanc cent fois une pice de monnaie et lon a obtenu soixante fois pileet quarante fois face.Tester au seuil de 5%, puis 1%, lhypothse de la loyaut de la pice.

    Solution 2Ici on :

    n = 100

    f = 0:6

    o f est la frquence de pile.Testons, au seuil , lhypothse nulle :

    H0 : la pice est loyale

    Sous cette hypothse, on a :

    p = 0:5

    et la quantit :

    t =f prp (1 p)

    n

    peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.On a :

    t =f prp (1 p)

    n= 2

    (i) Pour = 5%, on a :

    t:975 = 1:96

    on rejette donc lhypothse nulle H0 95%, cest dire, qu 95%, la pice

    est truque.

    36

  • Tests dHypothses A. El Mossadeq

    (ii) Pour = 1%, on a :

    2:57 < t:995 < 2:58

    on accepte donc lhypothse nulle H0 au seuil = 1%, cest dire, quau

    seuil = 1%, la pice est normale.

    Exercice 3Avant de procder au lancement dun produit, une entreprise a fait procder une enqute portant sur deux rgions gographiques A et B.Sur 1800 rponses provenant de la rgion A, 630 se dclarent intresses par leproduit.En provenance de B, 150 rponses sur 600 se dclarent favorables.Tester, au seuil de 5%, lhypothse de lidentit des opinions des rgions A et Bquant au produit considr.

    Solution 3Cet exercice peut tre trair soit par un test de comparaison de deux frquencessoit par un test dindpendance du Khi-deux.

    1. Test de comparaison de deux frquences :Ici on : 8>>>>>:

    nA = 1800 et fA =7

    20

    nB = 600 et fB =1

    4Testons, au seuil , lhypothse nulle :

    H0 : les opinions des rgions A et B sont identiques

    Sous cette hypothse, la quantit :

    t =fA fBr

    fA (1 fA)nA

    +fB (1 fB)

    nB

    37

  • A. El Mossadeq Tests dHypothses

    peut tre considre comme une ralisation dune variable alatoire normale

    centre rduite.

    Pour = 5%, on a :

    t:975 = 1:96

    et comme :

    t =fA fBr

    fA (1 fA)nA

    +fB (1 fB)

    nB= 4:77

    on rejette donc lhypothse nulle H0 95% (et mme 99:98%), cest dire,

    les deux rgions A et B ont des opinions direntes.

    2. Test dindpendance du Khi-deux :La rpartition observe est :

    Tableau des effectifs observes

    RegionOpinion favorable non favorable Total

    Region A 630 1170 1800

    Region B 150 450 600

    Total 780 1620 2400

    Testons, au seuil , lhypothse nulle :

    H0 : les rgions A et B ont la mme opinion

    38

  • Tests dHypothses A. El Mossadeq

    Calculons, sous cette hypothse, la rpartition thorique :

    Tableau des effectifs theoriques

    RegionOpinion favorable non favorable Total

    Region A 585 1215 1800

    Region B 195 405 600

    Total 780 1620 2400

    Sous lhypothse nulle H0, la quantit :

    2 =

    2Xi=1

    2Xj=1

    (oij tij)2tij

    est une ralisation dune variable du Khi-deux :

    (2 1) (2 1) = 1degr de libert.

    Pour = 5%, on a :

    21;:95 = 3:84

    comme :

    2 =

    2Xi=1

    2Xj=1

    (oij tij)2tij

    = 20:51

    On rejette alors H0 95% (et mme 99:5%), cest dire, les deux rgions

    ont des opinions direntes quant au produit considr.

    39

  • A. El Mossadeq Tests dHypothses

    Exercice 4Dans un groupe de 200 malades atteints du cancer du col de lutrus, un traite-ment par application locale du radium a donn 50 gurisons.Un autre groupe de 150 sujets atteints de la mme maladie a t trait parchirurgie, on a trouv 54 gurisons.Que peut-on conclure ?

    Solution 4Cet exercice peut tre trair soit par un test de comparaison de deux frquencessoit par un test dindpendance du Khi-deux.

    1. Test de comparaison de deux frquences :Ici on :

    n1 = 200 ; f1 = 0:25

    n2 = 150 ; f2 = 0:36

    Testons, au seuil , lhypothse nulle :

    H0 : les deux traitements sont quivalents

    Sous cette hypothse, la quantit :

    t =f1 f2r

    f1 (1 f1)n1

    +f2 (1 f2)

    n2

    peut tre considre comme une ralisation dune variable alatoire normale

    centre rduite.

    Pour = 5%, on a :

    t:975 = 1:96

    et comme :

    t =f1 f2r

    f1 (1 f1)n1

    +f2 (1 f2)

    n2

    = 2:12

    40

  • Tests dHypothses A. El Mossadeq

    on rejette donc lhypothse nulle H0 95%, cest dire, les deux mthodes

    ne sont pas quivalentes.

    2. Test dindpendance du Khi-deux :La rpartition observe est :

    Tableau des effectifs observees

    TraitementResultat gueri non gueri Total

    radium 50 150 200

    chirurgie 54 96 150

    Total 104 246 350

    Testons, au seuil , lhypothse nulle :

    H0 : les deux traitements sont quivalents

    Calculons, sous cette hypothse, la rpartition thorique :

    Tableau des effectifs theoriques

    TraitementResultat gueri non gueri Total

    radium 59:4 140:6 200

    chirurgie 44:6 105:4 150

    Total 104 246 350

    Sous lhypothse nulle H0, la quantit :

    41

  • A. El Mossadeq Tests dHypothses

    2 =

    2Xi=1

    2Xj=1

    (oij tij)2tij

    est une ralisation dune variable du Khi-deux :

    (2 1) (2 1) = 1degr de libert.

    Pour = 5%, on a :

    21;:95 = 3:84

    Et comme :

    2 =

    2Xi=1

    2Xj=1

    (oij tij)2tij

    = 4:94

    On rejette alors H0 95% , cest dire, les deux traitements ne sont pas

    quivalents.

    Exercice 5Aux guichets dune gare parisienne, sur les 350 billets vendus vendredi aprs-midi,95 taient des billets de 1ere classe. Sur les 250 billets vendus la matine du lundisuivant, 55 taient de 1ere classe.Peut-on considrer quil y a une dirence entre les proportions de vente deparcours en 1ere classe pour les ns et dbuts de semaines ?

    Solution 5Cet exercice peut tre trair soit par un test de comparaison de deux frquencessoit par un test dindpendance du Khi-deux.

    42

  • Tests dHypothses A. El Mossadeq

    1. Test de comparaison de deux frquences :Ici on : 8>>>>>:

    n1 = 350 ; f1 =19

    70

    n2 = 250 ; f2 =11

    50Testons, au seuil , lhypothse nulle :

    H0 : les taux de billets de 1ere classe vendus en net dbut de semaines sont identiques

    Sous cette hypothse, la quantit :

    t =f1 f2r

    f1 (1 f1)n1

    +f2 (1 f2)

    n2

    peut tre considre comme une ralisation dune variable normale centre

    rduite.

    Pour = 5%, on a :

    t:975 = 1:96

    et comme :

    t =f1 f2r

    f1 (1 f1)n1

    +f2 (1 f2)

    n2

    = 1:45

    on accepte donc lhypothse nulle H0 au seuil 5%, cest dire, les taux de

    billets de parcours en 1ere classe vendus en ns et dbuts de semaines sont

    identiques et quon peut estimer par :

    f =n1f1 + n2f2n1 + n2

    = 0:25

    43

  • A. El Mossadeq Tests dHypothses

    2. Test dindpendance du Khi-deux :La rpartition observe est :

    Tableau des effectifs observees

    jourClasse 1ere classe 2ere classe Total

    V endredi A:M 95 255 350

    Lundi matin 55 195 250

    Total 150 450 600

    Testons, au seuil , lhypothse nulle :

    H0 : les taux de billets de parcours en 1ere classe vendus en net dbut de semaines sont identiques

    Calculons, sous cette hypothse, la rpartition thorique :

    Tableau des effectifs theoriques

    JourClasse 1ere classe 2ere classe Total

    V endredi A:M 87:5 262:5 350

    Lundi matin 62:5 187:5 250

    Total 150 450 600

    44

  • Tests dHypothses A. El Mossadeq

    Sous lhypothse nulle H0, la quantit :

    2 =

    2Xi=1

    2Xj=1

    (oij tij)2tij

    est une ralisation dune variable du Khi-deux :

    (2 1) (2 1) = 1degr de libert.

    Pour = 5%, on a :

    21;:95 = 3:84

    Et comme :

    2 =

    2Xi=1

    2Xj=1

    (oij tij)2tij

    = 2:06

    On accepte alors H0 au seuil = 5% , cest dire, les taux de billets de

    parcours en 1 ere classe vendus en ns et dbuts de semaines sont identiques.

    Exercice 6Un chantillon de taille n a donn lieu au calcul dune frquence observe fcorrespondant lintervalle de conance [0:22 0:34] au seuil = 5%.1. Calculer n.

    2. Par rapport la proportion p = 0:3, lcart entre f et p est-il signicatif au

    seuil = 5% ?

    3. Dterminer lintervalle de conance de jf pj au seuil = 5%.

    45

  • A. El Mossadeq Tests dHypothses

    Solution 61. Au seuil , lintervalle de conance correspondant une frquence f observe

    sur un chantillon de taille n est dni par :"f t1=2

    rf (1 f)

    n; f + t1=2

    rf (1 f)

    n

    #On en dduit : 8>>>>>>>:

    f =0:22 + 0:34

    2

    n = t21=2f (1 f)(f 0:22)2

    Pour = 5%, on a :

    t0:975 = 1:96

    on obtient alors : f = :28

    n = 215

    2. Testons, au seuil , lhypothse nulle :

    H0 : lcart nest pas singicatif

    Sous cette hypothse, la quantit :

    t =f prp (1 p)

    n

    peut tre considre comme une ralisation dune variable alatoire normale

    centre rduite.

    On a :

    t =f prp (1 p)

    n= 0:64

    46

  • Tests dHypothses A. El Mossadeq

    Pour = 5%, on a :

    t:975 = 1:96

    on accepte donc lhypothse nulle H0 au seuil = 5%.

    3. Au seuil :

    f prp (1 p)

    n

    2 t1=2; t1=2donc, au seuil :

    jf pj 2"0; t1=2

    rp (1 p)

    n

    #Pour = 5%, on a :

    t:975 = 1:96

    do :

    jf pj 2 [0; 0:06]

    Exercice 7Ltude du taux de dfectuosits arentes aux caractristiques de traitementsthermiques dune mme pice, traite par deux fours dirents, a donn lieu auxrsultats suivants :* Pour le premier four, 20 pices dfectueuses sur un chantillon de 200 picestraites.* Pour le second four, 120 pices dfectueuses sur un chantillon de 800 picestraites.Que peut-on conclure ?

    47

  • A. El Mossadeq Tests dHypothses

    Solution 7Ici on : 8

  • Tests dHypothses A. El Mossadeq

    1. Quelle est la taille n de lchantillon.

    2. Par rapport la proportion p = 0:4, lcart entre f et p est-il signicatif au

    seuil = 5% ?

    3. Dterminer lintervalle de conance de jf pj au seuil = 5%.

    Solution 81. Au seuil , lintervalle de conance correspondant une frquence f observe

    sur un chantillon de taille n est dni par :"f t1=2

    rf (1 f)

    n; f + t1=2

    rf (1 f)

    n

    #On en dduit : 8>>>>>>>:

    f =0:35 + 0:43

    2

    n = t21=2f (1 f)(f 0:35)2

    Pour = 5%, on a :

    t0:975 = 1:96

    on obtient alors : 8

  • A. El Mossadeq Tests dHypothses

    peut tre considre comme une ralisation dune variable alatoire normale

    centre rduite.

    On a :

    t =f prp (1 p)

    n= 0:49

    Pour = 5%, on a :

    t:975 = 1:96

    On accepte donc lhypothse nulle H0 au seuil = 5%.

    3. Au seuil :f prp (1 p)

    n

    2 t1=2; t1=2donc, au seuil :

    jf pj 2"0; t1=2

    rp (1 p)

    n

    #Pour = 5%, on a :

    t:975 = 1:96

    do :

    jf pj 2 [0; 0:04]

    Exercice 9Parmi 470 sujets exposs une infection, 370 nayant pas t immuniss.Parmi ces derniers, 140 contractent la malidie ainsi que 25 sujets immuniss.Le traitement donne-t-il une protection signicative ?

    50

  • Tests dHypothses A. El Mossadeq

    Solution 9Soient f1 la frquence de contracter la maladie pour un sujet non immunis etf2 la frquence de contracter la maladie pour un sujet immunis.Ici on : 8>>>>>:

    n1 = 370 et f1 =14

    37

    n2 = 100 et f2 =1

    4Testons, au seuil , lhypothse nulle :

    H0 : le traitements nest pas e cace

    Sous cette hypothse, la quantit :

    t =f1 f2r

    f1 (1 f1)n1

    +f2 (1 f2)

    n2peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.Pour = 5%, on a :

    t:975 = 1:96

    et comme :

    t =f1 f2r

    f1 (1 f1)n1

    +f2 (1 f2)

    n2

    = 2:56

    On rejette donc lhypothse nulle H0 95%, cest dire, le traitement donneune protection signicative.

    51

  • A. El Mossadeq Tests dHypothses

    Exercice 10La taille de 1200 conscrits du bureau de recrutement X a pour moyenne X =172 cm et pour cart-type sX = 6 cm:Les mmes mesures eectues sur les 250 conscrits du bureau de recrutement Yont donn pour moyenne Y = 170 cm et pour cart-type sY = 5 cm:Que peut-on conclure ?

    Solution 10Testons au seuil lhypothse nulle :

    H0 : les conscrits des bureaux de recrutement X et Y ont la mme taille

    Sous lhypothse nulle H0, la quantit :

    t =X Yss2Xn1+s2Yn2

    peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.Pour = 5%, on a :

    t:975 = 1:96

    Et comme :

    t =X Yss2Xn1+s2Yn2

    = 5:547

    On rejette alors lhypothse nulle H0 95% (mme 99%), cest dire, lesconscrits des bureaux de recrutement X et Y ont des tailles moyennes direntes.

    52

  • Tests dHypothses A. El Mossadeq

    Exercice 11On se propose de comparer le poids la naissance chez une srie de primapares(srie 1) et une srie de multipares (srie 2) :

    Serie 1 : n1 = 95 m1 = 3197 g s21 = 210100 g

    2

    Serie 2 : n2 = 105 m2 = 3410 g s22 = 255400 g

    2

    Que peut-on conclure ?

    Solution 11Testons au seuil lhypothse nulle :

    H0 : les primapares et les multipares ont le mme poids moyen la naissance

    Sous lhypothse nulle H0, la quantit :

    t =m1 m2ss21n1+s22n2

    peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.Pour = 5%, on a :

    t:975 = 1:96

    Et comme :

    t =m1 m2ss21n1+s22n2

    = 3:1256On rejette alors lhypothse nulle H0, 95% (mme 99%), cest dire, lesprimapares et les multipares nont pas le mme poids moyen la naissance.

    53

  • A. El Mossadeq Tests dHypothses

    Exercice 12Chez cent sujet normaux, on dose lacide urique, les rsultats sont :8

  • Tests dHypothses A. El Mossadeq

    Exercice 13On admet que la valeur moyenne de la glycmie du sujet normal est 1 g= l.Sur 17 sujets, on a trouv une moyenne de :965 g= l et un cart-type estim de:108 g= l.Cette valeur peut-elle tre considre comme dirente du taux normal ?

    Solution 13Testons au seuil , lhypothse nulle :

    H0 : "la valeur est normale"

    Sous cette hypothse, la quantit :

    t =m spn

    est une ralisation de la variable alatoire Tn1 de Student :

    n 1 = 16degrs de libert.Pour = 5%, on a :

    t16;:975 = 2:12

    et comme :

    t =m spn

    = 1:3362on accepte lhypothse nulle H0 au seuil = 5%, cest dire, la valeur estnormale.

    55

  • A. El Mossadeq Tests dHypothses

    Exercice 14Dans un chantillon de 17 prmaturs, la moyenne du Na-plasmatique est :8

  • Tests dHypothses A. El Mossadeq

    Calculons maintenant lestimation commune s2 de cette variance :

    s2 =(n1 1) s21 + (n2 1) s22

    n1 + n2 2

    = 66:42

    et testons lhypothse nulle :

    H0 : "les prmaturs et les dysmaturs ont la mme moyenne du Na-plasmatique"

    Sous cette hypothse, la quantit :

    t =m1 m2s

    r1

    n1+1

    n2

    est une ralisation de la variable alatoire de Student :

    n1 + n2 2 = 40degrs de libert.Pour = 5%, on a :

    t40;:975 = 2:02

    Et comme :

    t =m1 m2s

    r1

    n1+1

    n2

    = 1:17On accepte lhypothse nulle H0 au seuil = 5%, cest dire, les prmaturset les dysmaturs ont la mme moyenne du Na-plasmatique estime par :

    m =n1m1 + n2m2n1 + n2

    = 134:79

    57

  • A. El Mossadeq Tests dHypothses

    Exercice 15Lorquune machine est bien rgle, elle produit des pices dont le diamtre Dest une variable gaussienne de moyenne 25mm.Deux heures aprs le rglage de la machine, on a prlev au hasard neuf pices.Leurs diamtres ont pour mesure en mm :

    22 23 21 25 24 23 22 26 21

    Construire 95% puis 99% les intervalles de conance de la moyenne et de lavariance.Que peut-on conclure quant la qualit du rglage aprs deux heures de fonc-tionnement de la machine ?

    Solution 15Calculons dabord les estimations m et s2 de la moyenne et de la variance surcet chantillon de taille n = 9.On a :

    m =1

    n

    nXi=1

    xi = 23mm

    et :

    s2 =1

    n 1nXi=1

    (xi m)2 = 3mm2

    Testons lhypothse nulle :

    H0 : "la machine est bien rgle"

    Sous lhypothse nulle H0, la quantit :

    t =m spn

    est une ralisation dune variable alatoire de Student :

    n 1 = 8degrs de libert : T8.

    58

  • Tests dHypothses A. El Mossadeq

    Pour = 5%, on a :

    t8;:975 = 2:31

    et comme :

    t =m spn

    = 3:4641

    On rejette lhypothse nulle H0 95% (mme 99%), cest dire, le rglagede la machine est rompu.

    Exercice 16On eectue un dosage par deux mthodes direntes A et B.On obtient les rsultats suivants :

    Methode A :6 :65 :7 :7 :7 :7 :75 :8 :8

    Methode B :6 :6 :65 :65 :7 :6 :75 :8 :8

    Peut-on considrer que les deux mthodes sont quivalentes ?

    Solution 16Calculons les estimations

    m1; s

    21

    de1;

    21

    etm2; s

    22

    de2;

    22

    :8>>>>>>>:

    m1 =1

    9

    9Xi=1

    x1i = :71

    s21 =1

    8

    9Xi=1

    (x1i m1)2 = :004

    et : 8>>>>>>>:m2 =

    1

    9

    9Xi=1

    x2i = :68

    s22 =1

    8

    9Xi=1

    (x2i m2)2 = :007

    59

  • A. El Mossadeq Tests dHypothses

    Testons dabord, au seuil = 5%, lhypothse nulle dgalit des variances desdeux mthodes de dosage.Sous cette hypothse, la quantit :

    f =s22s21

    est une ralisation dune variable alatoire de Fisher :

    (n2 1; n1 1) = (8; 8)degrs de libert.Pour = 5%, on a :

    F8;8;:95 = 4:43

    et comme :

    f =s22s21

    = 1:75

    On accepte donc lhypothse dgalit des variances des deux populations.Calculons maintenant lestimation commune s2 de cette variance :

    s2 =(n1 1) s21 + (n2 1) s22

    n1 + n2 2

    = 0:0055

    et testons lhypothse nulle :

    H0 : "les deux mthodes de dosage sont quivalentes:"

    Sous cette hypothse, la quantit :

    t =m1 m2s

    r1

    n1+1

    n2

    60

  • Tests dHypothses A. El Mossadeq

    est une ralisation de la variable alatoire de Student :

    n1 + n2 2 = 16degrs de libert.Pour = 10%, on a :

    t16;:95 = 2:12

    et comme :

    t =m1 m2s

    r1

    n1+1

    n2

    = 0:86

    on accepte lhypothse nulle H0 au seuil = 5%, cest dire, les deux mthodesde dosage sont quivalentes.

    Exercice 17Dans deux types de forts, on a mesur les hauteurs de treize et quatorze peuple-ments choisis au hasard et indpendamment dans le but de vrier si les hauteursde ces deux types darbres sont ou ne sont pas gales.Les rsultats sont les suivants :

    Type 1 : 22:5 22:9 23:7 24:0 24:4 24:5 26:0

    26:2 26:4 26:7 27:4 28:6 28:7

    Type 2 : 23:4 24:4 24:6 24:9 25:0 26:2 26:3

    26:8 26:8 26:9 27:0 27:6 27:7 27:8

    On admet que les hauteurs de ces deux types darbres sont des variables gaussi-ennes N 1; 21 et N 2; 22.Que peut-on conclure ?

    61

  • A. El Mossadeq Tests dHypothses

    Solution 17Calculons les estimations

    m1; s

    21

    de1;

    21

    etm2; s

    22

    de2;

    22

    :8>>>>>>>:

    m1 =1

    13

    13Xi=1

    x1i = 25:538

    s21 =1

    12

    13Xi=1

    (x1i m1)2 = 4:1576

    et : 8>>>>>>>:m2 =

    1

    14

    14Xi=1

    x2i = 26:1

    s22 =1

    13

    14Xi=1

    (x2i m2)2 = 1:9431

    Testons dabord, au seuil = 5%, lhypothse nulle dgalit des variances deshauteurs des deux types darbres.Sous cette hypothse, la quantit :

    f =s21s22

    est une ralisation dune variable alatoire de Fisher :

    (n1 1; n2 1) = (12; 13)degrs de libert.

    Pour = 5%, on a :

    F12;13;:975 = 3:15

    et comme :

    f =s21s22

    = 2:1398

    on accepte donc lhypothse dgalit des variances des hauteurs des deux typesdarbres.

    62

  • Tests dHypothses A. El Mossadeq

    Calculons maintenant lestimation commune s2 de cette variance :

    s2 =(n1 1) s21 + (n2 1) s22

    n1 + n2 2= 3:0062

    et testons lhypothse nulle :

    H0 : "les deux types darbres ont la mme hauteur"

    Sous cette hypothse, la quantit :

    t =m1 m2s

    r1

    n1+1

    n2est une ralisation de la variable alatoire de Student :

    n1 + n2 2 = 25degrs de libert.

    Pour = 5%, on a :

    t25;:975 = 2:06

    et comme :

    t =m1 m2s

    r1

    n1+1

    n2= 0:84155

    on accepte lhypothse nulle H0 au seuil = 5%, cest dire, les deux typesdarbres ont la mme hauteur moyenne estime par :

    m =n1m1 + n2m2n1 + n2

    = 25:829

    63

  • A. El Mossadeq Tests dHypothses

    Exercice 18On considre deux varits de masM1 etM2 dont les rendements sont des vari-ables alatoires gaussiennes N 1; 21 et N 2; 22.An de comparer les rendements de ces deux varits de mas, on a choisi decultiver dans neuf stations direntes des parcelles voisines encemences de luneou lautre des deux varits. On a observ les rendements suivants :

    Station 1 2 3 4 5 6 7 8 9

    V ariete 1 39:6 32:4 33:1 27 36 32 25:9 32:4 33:2

    V ariete 2 39:2 33:1 32:4 25:2 33:1 29:5 24:1 29:2 34:1

    Que peut-on conclure ?

    Solution 18Calculons les estimations

    m1; s

    21

    de1;

    21

    etm2; s

    22

    de2;

    22

    :8>>>>>>>>>>>:

    m1 =1

    13

    13Xi=1

    x1i = 32:4

    s21 =1

    12

    13Xi=1

    (x1i m1)2 = 17:188

    et : 8>>>>>>>>>>>:m2 =

    1

    14

    14Xi=1

    x2i = 31:1

    s22 =1

    13

    14Xi=1

    (x2i m2)2 = 21:785

    64

  • Tests dHypothses A. El Mossadeq

    Testons dabord, au seuil = 5%, lhypothse nulle dgalit des variances desrendements des deux varits de mas.Sous cette hypothse, la quantit :

    f =s22s21

    est une ralisation dune variable alatoire de Fisher :

    (n2 1; n1 1) = (8; 8)degrs de libert.Pour = 10%, on a :

    F8;8;:975 = 4:43

    et comme :

    f =s22s21

    = 1:2675

    On accepte donc lhypothse dgalit des variances des hauteurs des deux typesdarbres.Calculons maintenant lestimation commune s2 de cette variance :

    s2 =(n1 1) s21 + (n2 1) s22

    n1 + n2 2=

    s21 + s22

    2= 19:4865

    et testons lhypothse nulle :

    H0 : "les deux varits de mas ont le mme rendement"

    Sous cette hypothse, la quantit :

    t =m1 m2s

    r1

    n1+1

    n2

    65

  • A. El Mossadeq Tests dHypothses

    est une ralisation de la variable alatoire de Student :

    n1 + n2 2 = 16degrs de libert.Pour = 5%, on a :

    t16;:975 = 2:12

    et comme :

    t =m1 m2s

    r1

    n1+1

    n2

    = :42892

    on accepte lhypothse nulle H0 au seuil = 5%, cest dire, les deux varitsde mas ont le mme rendement moyen estim par :

    m =n1m1 + n2m2n1 + n2

    = 31:75

    Exercice 19Le relev des tempratures journalires minimales de deux stations S1 et S2, aucours de neuf journes conscutives a fourni les valeurs suivantes en C:

    Station 1 12 8 9 10 11 13 10 7 10

    Station 2 7 11 10 6 8 11 12 9 7

    On admet que la distribution des tempratures journalires minimales des deuxstations S1 et S2 sont des variables gaussiennes N

    1;

    21

    et N 2; 22.

    1. Dterminer les estimations des moyennes et des variances des tempratures

    journalires minimales des deux stations S1 et S2.

    66

  • Tests dHypothses A. El Mossadeq

    2. Construire, au seuil = 5%, les intervalles de conance de ces estimations.

    3. Peut-on admettre, au seuil = 5%, lhypothse selon laquelle les tempratures

    journalires minimales moyennes des deux stations S1 et S2 sont identiques ?

    Solution 191. Calculons les estimations

    m1; s

    21

    de1;

    21

    etm2; s

    22

    de2;

    22

    .

    On a : 8>>>>>>>>>>>:m1 =

    1

    9

    11Xi=1

    x1i = 10C

    s21 =1

    8

    11Xi=1

    (x1i m1)2 = 3:5

    et : 8>>>>>>>>>>>:m2 =

    1

    9

    10Xi=1

    x2i = 9C

    s22 =1

    8

    10Xi=1

    (x2i m2)2 = 4:5

    (a) Lintervalle de conance de 1 1 est dni par :m1 tn1;1=2 s1p

    n;m1 + tn1;1=2

    s1pn

    Pour = 5%, on a :

    t8;:975 = 2:31

    do lintervalle :

    [8:56 C; 11:44 C]

    67

  • A. El Mossadeq Tests dHypothses

    (b) Lintervalle de conance de 21 1 est dni par :"(n 1) s212n1;1=2

    ;(n 1) s212n1;=2

    #Pour = 5%, on a : 8

  • Tests dHypothses A. El Mossadeq

    2. Testons dabord, au seuil = 5%, lhypothse nulle dgalit des variances

    des tempratures journalires minimales des deux stations S1 et S2.

    Sous cette hypothse, la quantit :

    f =s22s21

    est une ralisation dune variable alatoire de Fisher :

    (n2 1; n1 1) = (8; 8)degrs de libert.

    Pour = 5%, on a :

    F8;8;:975 = 4:43

    et comme :

    f =s22s21

    = 1:29

    On accepte donc lhypothse dgalit des variances.

    Calculons maintenant lestimation commune s2 de cette variance :

    s2 =(n1 1) s21 + (n2 1) s22

    n1 + n2 2

    =s21 + s

    22

    2

    = 4

    et testons lhypothse nulle :

    H0 : les tempratures journalires minimales moyennesdes deux stations S1 et S2.sont identiques

    69

  • A. El Mossadeq Tests dHypothses

    Sous cette hypothse, la quantit :

    t =m1 m2s

    r1

    n1+1

    n2est une ralisation de la variable alatoire de Student :

    n1 + n2 2 = 16degrs de libert.

    Pour = 5%, on a :

    t16;:95 = 2:12

    et comme :

    t =m1 m2s

    r1

    n1+1

    n2

    = 1:0607

    On accepte lhypothse nulle H0 au seuil = 5%, cest dire, les tem-

    pratures journalires minimales moyennes des deux stations S1 et S2.sont

    identiques.

    Cette temprature moyenne peut tre estime par :

    m =n1m1 + n2m2n1 + n2

    =m1 +m2

    2= 9:5

    70

  • Tests dHypothses A. El Mossadeq

    Exercice 20On tudie leet dune substance sur la croissance dune tumeur gree.Les rsultats sont consigns sur le tableau ci-dessous donnant la surface de latumeur au 20eme jour aprs sa gree :

    Surface 5:5 6 6:5 7 7:5 8

    T emoins 1 2 3 8 4 3

    Traites 4 4 8 3 1 1

    Le traitement a-t-il un eet signicatif sur la surface tumorale ?On suppose que la surface tumorale est distribue selon des lois normalesN 1; 21et N 2; 22 chez les tmoins et les traits respectivement.Solution 20Calculons les estimations

    m1; s

    21

    de1;

    21

    etm2; s

    22

    de2;

    22

    .

    On a : 8>>>>>>>>>>>:m1 =

    1

    21

    6Xi=1

    n1ixi = 7

    s21 =1

    20

    6Xi=1

    n1i (xi m1)2 = :45

    et : 8>>>>>>>>>>>:m2 =

    1

    21

    6Xi=1

    n2ixi = 6:4048

    s22 =1

    20

    6Xi=1

    n2i (xi m2)2 = :87972

    Testons dabord, au seuil = 5%, lhypothse nulle dgalit des variances des

    71

  • A. El Mossadeq Tests dHypothses

    surfaces tumorales chez les populations des tmoins et des traits.Sous cette hypothse, la quantit :

    f =s22s21

    est une ralisation dune variable alatoire de Fisher :

    (n2 1; n1 1) = (20; 20)degrs de libert.Pour = 5%, on a :

    F20;20;:975 = 2:46

    et comme :

    f =s22s21

    = 1:9549

    on accepte donc lhypothse dgalit des variances des deux populations.Calculons maintenant lestimation commune s2 de cette variance :

    s2 =(n1 1) s21 + (n2 1) s22

    n1 + n2 2

    = :66486

    et testons lhypothse nulle :

    H0 : "le traitement est sans eet sur la croissance

    de la surface tumorale"

    Sous cette hypothse, la quantit :

    t =m1 m2s

    r1

    n1+1

    n2

    72

  • Tests dHypothses A. El Mossadeq

    est une ralisation de la variable alatoire de Student :

    n1 + n2 2 = 40degrs de libert.Pour = 5%, on a :

    t40;:99 = 2:02

    et comme :

    t =m1 m2s

    r1

    n1+1

    n2

    = 2:831

    On rejette lhypothse nulle H0 95% (et mme 98%), cest dire, le traite-ment a une inuence sur la croissance de la surface tumorale.

    Exercice 21De nombreuses observations cliniques ont montr que jusque l :

    30% des malades atteints de M ont une survie infrieure un an 50% ont une survie entre un an et deux ans 10% ont une survie entre deux ans et cinq ans 10% ont une survie suprieure cinq ans.

    On applique un nouveau traitement 80 malades atteint de la maladie M et onconstate :

    12 ont une survie infrieure un an 56 ont une survie entre un an et deux ans 8 ont une survie entre deux ans et cinq ans 4 ont une survie suprieure cinq ans.

    Que peut-on conclure ?

    Solution 21Testons, au seuil , lhypothse nulle :

    H0 : le nouveau traitement nest pas actif contre la maladie M

    73

  • A. El Mossadeq Tests dHypothses

    Sous cette hypothse, on a les rpartitions :

    SurvieRepartition

    Observee

    Repartition

    Theorique

    survie 1 an 12 24

    1 an < survie 2 ans 56 40

    2 an < survie 5 ans 8 8

    survie > 5 ans 4 8

    Total 80 80

    Sous lhypothse nulle H0, la quantit :

    2 =

    4Xi=1

    (oi ti)2ti

    est une ralisation dune variable du Khi-deux :

    4 1 = 3degrs de libert.Pour = 5%, on a :

    23;:95 = 7:81

    Et comme :

    2 =

    2Xi=1

    (oi ti)2ti

    = 14:4

    on rejette donc lhypothse nulle H0 95% (mme 99:5%), cest dire, qu99:5%, le nouveau traitement est actif contre la maladie M.

    74

  • Tests dHypothses A. El Mossadeq

    Exercice 22Le tableau ci-aprs concerne le nombre annuel de cyclones tropicaux ayant at-teint la cte orientale des Etats-Unis entre 1887 et 1956 :

    Nombre annuel de cyclones Nombre d0annees

    0 1

    1 6

    2 10

    3 16

    4 19

    5 5

    6 8

    7 3

    8 1

    9 1

    > 9 0

    Peut-on admettre, au seuil = 5%, que ce nombre annuel de cyclones est unevariable de Poisson ?

    75

  • A. El Mossadeq Tests dHypothses

    Solution 22Testons, au seuil , lhypothse nulle :

    H0 : le nombre annuel de cyclones est une variable de Poisson

    Calculons une estimation ponctuelle du paramtre de cette loi :

    P [X = k] =k

    k!exp

    o X est la variable alatoire reprsentant le nombre annuel de cyclones.

    On sait que :

    ^ =1

    n

    nXi=1

    Xi

    est un estimateur sans biais et convergent de .

    Une estimation ponctuelle ~ de est donne par :

    ~ =1

    70

    9Xi=0

    ini

    = 3:7286

    Leectif thorique tk, k 0, reprsentant le nombre dannes k cyclones estdonn par :

    tk = nP [X = k]

    Do les rpartitions :

    76

  • Tests dHypothses A. El Mossadeq

    Nombre annuel

    de cyclonesEffectifs observes Effectifs theoriques

    0 1 1:68

    1 6 6:27

    2 10 11:69

    3 16 14:53

    4 19 13:54

    5 5 10:1

    6 8 6:28

    7 3 3:34

    8 1 1:56

    9 1 0:65

    > 9 0 0:36

    Total 70 70

    On constate que le tableau contient des eectifs thoriques strictement infrieurs 5, ce qui empche lutilisation dun test du khi-deux.On peut remdier cet tat en oprant le groupement logique :* des classes 0et 1dune part,* et des classes 7 et plusdautre part.Les tableaux des eectifs observs et thoriques deviennent :

    77

  • A. El Mossadeq Tests dHypothses

    Nombre annuel

    de cyclonesEffectifs observes Effectifs theoriques

    0 ou 1 7 7:95

    2 10 11:69

    3 16 14:53

    4 19 13:54

    5 5 10:10

    6 8 6:28

    7 5 5:91

    Total 70 70

    Sous lhypothse nulle H0, la quantit :

    2 =

    7Xi=1

    (oi ti)2ti

    est une ralisation dune variable du Khi-deux :

    7 1 1 = 5degrs de libert.puisque pour calculer les eectifs thoriques, nous avons utilislestimation, et non la valeur rel, du paramtre de la loi de Poisson.Pour = 5%, on a :

    25;:95 = 5:8948

    78

  • Tests dHypothses A. El Mossadeq

    Et comme :

    2 = 5:81

    On accepte alors H0 au seuil = 5%, cest dire, le nombre annuel de cyclonespeut tre ajust par une loi de Poisson dont le paramtre est estim par :

    ~ = 3:7286

    Exercice 23On veut savoir si la russite (R) dun traitement est indpendantes du niveauxde la tension artrielle du malade (T ).On dispose pour cela de 250 observations rparties comme suit :

    TR echec succes

    basse 21 104

    elevee 29 96

    Que peut-on conclure ?

    Solution 23La rpartition observe est :

    Tableau des effectifs observees

    TR Echec Succes Total

    Basse 21 104 125

    Elevee 29 96 125

    Total 50 200 250

    79

  • A. El Mossadeq Tests dHypothses

    Testons, au seuil , lhypothse nulle :

    H0 : "la russite du traitement est indpendante du niveau de la tension artrielle"

    Calculons, sous cette hypothse, la rpartition thorique :

    Tableau des effectifs theoriques

    TR Echec Succes Total

    Basse 25 100 125

    Elevee 25 100 125

    Total 50 200 250

    Sous lhypothse nulle H0, la quantit :

    2 =

    2Xi=1

    2Xj=1

    (oij tij)2tij

    est une ralisation dune variable du Khi-deux :

    (2 1) (2 1) = 1degr de libert.Pour = 5%, on a :

    21;:95 = 3:84

    Et comme :

    2 =

    2Xi=1

    2Xj=1

    (oij tij)2tij

    = 1:6

    On accepte alors H0 au seuil = 5% , cest dire, la russite du traitement estindpendante du niveau de la tension artrielle.

    80

  • Tests dHypothses A. El Mossadeq

    Exercice 2475 enfants sont vus en consultation pour un asthme. On relve chez eux les deuxsymptmes suivants :* Intensit de la maladie asmathique : lgre , moyenne , forte* Existence ou absence dun eczma au moment de lobservation ou dans lepass.On peut classer les enfants selon la rpartition suivante :

    EA fort moyen leger

    present 8 2 2

    passe 11 11 3

    jamais 6 18 14

    Peut-on considrer quil existe-t-il une association entre lintensit de lasthmeet lexistence dun eczma ?

    Solution 24Le tableau de la rpartition observe est donne par :

    Tableau des effectifs observees

    EczemaAsthme fort moyen leger Total

    present 8 2 2 12

    passe 11 11 3 25

    jamais 6 18 14 38

    Total 25 31 19 75

    81

  • A. El Mossadeq Tests dHypothses

    Testons, au seuil , lhypothse nulle :

    H0 : lintensit de lasthme est indpendante de lexistence dun eczma

    Calculons, sous cette hypothse, la rpartition thorique.

    Tableau des effectifs theoriques

    EczemaAsthme fort moyen leger Total

    present 4 4:96 3:04 12

    passe 8:33 10:33 6:34 25

    jamais 12:67 15:71 9:62 38

    Total 25 31 19 75

    Les eectifs thoriques sur la premire ligne sont strictement infrieurs cinq, cequi empche lapplication dun test du Khi-deux.On peut remdier cet tat enoprant le groupement logiquedes classes presentet passe.Les nouveaux tableaux des eectifs observs et thoriques, obtenus aprs re-groupement de ces deux classes sont donns ci-aprs.

    Tableau des effectifs observees

    EczemaAsthme fort moyen leger Total

    present ou passe 19 13 5 37

    jamais 6 18 14 38

    Total 25 31 19 75

    82

  • Tests dHypothses A. El Mossadeq

    Tableau des effectifs theoriques

    EczemaAsthme fort moyen leger Total

    present ou passe 12:33 15:29 9:38 37

    jamais 12:67 15:71 9:62 38

    Total 25 31 19 75

    Sous lhypothse nulle H0, la quantit :

    2 =

    2Xi=1

    3Xj=1

    (oij tij)2tij

    est une ralisation dune variable du Khi-deux :

    (2 1) (3 1) = 2degrs de libert.Pour = 5%, on a :

    22;:95 = 5:99

    Et comme :

    2 =

    2Xi=1

    3Xj=1

    (oij tij)2tij

    = 11:84

    On rejette alors H0 95% (mme 99:5%), cest dire, lintensit de lasthmedpend de lexistence dun eczma.

    83

  • A. El Mossadeq Tests dHypothses

    Exercice 25On veut savoir sil y a une liason entre la localisation (L) du cancer du poumon(priphrique , non priphrique) et le ct (C) de la lsion (poumon gauche ,poumon droit). Ltude a port sur 1054 malades :

    LC gauche droit

    peripherique 26 62

    non peripherique 416 550

    Que peut-on conclure ?

    Solution 25La rpartition observe est donne par :

    Tableau des effectifs observees

    LC gauche droit Total

    peripherique 26 62 88

    non peripherique 416 550 966

    Total 442 612 1054

    Testons, au seuil , lhypothse nulle :

    H0 : la localisation du cancer est indpendante du ct de la lsion

    Calculons, sous cette hypothse, la rpartition thorique.

    84

  • Tests dHypothses A. El Mossadeq

    Tableau des effectifs theoriques

    LC gauche droit Total

    peripherique 36:9 51:1 88

    nonperipherique 405:1 560:9 966

    Total 442 612 1054

    Sous lhypothse nulle H0, la quantit :

    2 =

    2Xi=1

    2Xj=1

    (oij tij)2tij

    est une ralisation dune variable du Khi-deux :

    (2 1) (2 1) = 1degr de libert.Pour = 5%, on a :

    21;:95 = 3:84

    Et comme :

    2 =

    2Xi=1

    2Xj=1

    (oij tij)2tij

    = 6:05

    On rejette alorsH0 95% (mme 97:5%), cest dire, la localisation du cancerdpend du ct de la lsion.

    85

  • A. El Mossadeq Tests dHypothses

    Exercice 26On suppose pouvoir classer les malades atteints dune maladie M en trois cat-gories cliniques : A ; B ; C:On se demande si ces trois catgories dirent par leurs survies un an.Les eectifs observs sont les suivants :

    SurvieCategorie A B C

    survie a un an 5 20 45

    deces avant un an 15 50 145

    Que peut-on conclure ?

    Solution 26La rpartition observe est :

    Tableau des effectifs observees

    SurvieCategorie A B C Total

    Survie a un an 5 20 45 70

    Deces avant un an 15 50 145 210

    Total 20 70 190 280

    Testons, au seuil , lhypothse nulle :

    H0 : la survie un an est indpendante de la catgorie clinique

    Calculons, sous cette hypothse, la rpartition thorique.

    86

  • Tests dHypothses A. El Mossadeq

    Tableau des effectifs theoriques

    SurvieCategorie A B C Total

    Survie a un an 5 17:5 47:5 70

    Deces avant un an 15 52:5 142:5 210

    Total 20 70 190 280

    Sous lhypothse nulle H0, la quantit :

    2 =

    2Xi=1

    3Xj=1

    (oij tij)2tij

    est une ralisation dune variable du Khi-deux :

    (2 1) (3 1) = 2degrs de libert.

    Pour = 5%, on a :

    22;:95 = 5:99

    Et comme :

    2 =

    2Xi=1

    3Xj=1

    (oij tij)2tij

    = 0:65

    On accepte alors H0 au seuil = 5% , cest dire, la survie un an estindpendante de la catgorie clinique.

    87

  • A. El Mossadeq Tests dHypothses

    Exercice 27Sur un chantillon de 84 prmaturs, on cherche sil existe une liaison entre lasurvenue dune hypoglycmie et la survenue dun ictre :

    sur 43 enfants nayant pas dictre, 23 sont hypoglycmiques

    sur 20 enfants ayant un ictre modr, 6 sont hypoglycmiques

    sur 21 enfants ayant un ictre intense, 4 sont hypoglycmiquesQue peut-on conclure ?

    Solution 27La rpartition observe est donne dans le tableau :

    Tableau des effectifs observees

    IctereHypoglycemie hypoglycemique non hypoglycemique Total

    pas d0ictere 23 20 43

    ictere modere 6 14 20

    ictere intense 4 17 21

    Total 33 51 84

    Testons, au seuil , lhypothse nulle :

    H0 : la survenue dune hypoglycmie est indpendante de la survenue dun ictre

    Calculons, sous cette hypothse, la rpartition thorique.

    88

  • Tests dHypothses A. El Mossadeq

    Tableau des effectifs theoriques

    IctereHypoglycemie hypoglycemique non hypoglycemique Total

    pas d0ictere 16:89 26:11 43

    ictere modere 7:86 12:14 20

    ictere intense 8:25 12:75 21

    Total 33 51 84

    Sous lhypothse nulle H0, la quantit :

    2 =

    2Xi=1

    2Xj=1

    (oij tij)2tij

    est une ralisation dune variable du Khi-deux :

    (3 1) (2 1) = 2degrs de libert.

    Pour = 5%, on a :

    22;:95 = 5:99

    Et comme :

    2 =

    3Xi=1

    2Xj=1

    (oij tij)2tij

    = 7:97

    On rejette alors H0 95% (mme 97:5%), cest dire, la survenue dunehypoglycmie dpend de la survenue dun ictre.

    89

  • A. El Mossadeq Tests dHypothses

    Exercice 28Une tude statistique relative aux rsultats dadmission du concours dune grandecole fait ressortir la rpartition des admis selon la profession des parents lorsquecelle-ci est connue :

    Profession des Parents Candidats Admis

    Fontionnaires et Assimiles 2224 180

    Commerce et Industrie 998 89

    Professions Liberales 575 48

    Proprietaires Rentiers 423 37

    Proprietaires Agricoles 287 13

    Artisans 210 18

    Banques et Assurances 209 17

    1. La profession des parents a-t-elle une inuence sur laccs cette cole ?

    2. Cette conclusion persiste-t-elle lorsquon tient compte pour complter la sta-

    tistique prcdente de 961 candidats dont lorigine socio-professionnelle est

    inconnue et qui ont obtenus 43 succs ?

    Solution 281. La rpartition observe est :

    90

  • Tests dHypothses A. El Mossadeq

    Tableau des effectifs observees

    Profession des Parents Candidats Admis Non admis

    Fontionnaires et Assimiles 2224 180 2044

    Commerce et Industrie 998 89 899

    Professions Liberales 575 48 527

    Proprietaires Rentiers 423 37 386

    Proprietaires Agricoles 287 13 274

    Artisans 210 18 192

    Banques et Assurances 209 17 192

    Total 4916 402 4514

    Testons, au seuil , lhypothse nulle :

    H0 : laccs lEcole est indpendant de la profession des parents

    Calculons, sous cette hypothse, la rpartition thorique.

    Le tableau de cette rpartition est donne ci-aprs.

    Sous lhypothse nulle H0, la quantit :

    2 =

    7Xi=1

    2Xj=1

    (oij tij)2tij

    91

  • A. El Mossadeq Tests dHypothses

    Tableau des effectifs theoriques

    Profession des Parents Candidats Admis Non admis

    Fontionnaires et Assimiles 2224 181:9 2042:1

    Commerce et Industrie 998 80:8 907:2

    Professions Liberales 575 47 528

    Proprietaires Rentiers 423 34:6 388:4

    Proprietaires Agricoles 287 23:5 263:5

    Artisans 210 17:2 192:8

    Banques et Assurances 209 17:1 191:9

    Total 4916 402 4514

    est une ralisation dune variable du Khi-deux :

    (7 1) (2 1) = 6degrs de libert.

    Pour = 5%, on a :

    26;:95 = 12:6

    Et comme :

    2 =

    2Xi=1

    3Xj=1

    (oij tij)2tij

    = 6:28

    92

  • Tests dHypothses A. El Mossadeq

    On accepte alors H0 au seuil = 5% , cest dire, laccs lEcole est

    indpendant de la profession des parents.

    2. Si lon tient compte des 961 candidats dont lorigine socio-professionnelle est

    inconnue et qui ont obtenus 43 succs, la rpartition observe et la rparti-

    tion thorique, sous la mme hypothse nulle, deviennent comme consogns

    ci-aprs.

    Tableau des effectifs observees

    Profession des Parents Candidats Admis Non admis

    Fontionnaires et Assimiles 2224 180 2044

    Commerce et Industrie 998 89 899

    Professions Liberales 575 48 527

    Proprietaires Rentiers 423 37 386

    Proprietaires Agricoles 287 13 274

    Artisans 210 18 192

    Banques et Assurances 209 17 192

    Autres 961 43 918

    Total 5877 445 5432

    93

  • A. El Mossadeq Tests dHypothses

    Tableau des effectifs theoriques

    Profession des Parents Candidats Admis Non admis

    Fontionnaires et Assimiles 2224 168:4 2055:6

    Commerce et Industrie 998 74:8 913:2

    Professions Liberales 575 43:5 531:5

    Proprietaires Rentiers 423 32 391

    Proprietaires Agricoles 287 21:7 265:3

    Artisans 210 15:9 194:1

    Banques et Assurances 209 15:8 193:2

    Autres 961 72:8 888:2

    Total 5877 445 5432

    Sous lhypothse nulle H0, la quantit :

    2 =

    8Xi=1

    2Xj=1

    (oij tij)2tij

    est une ralisation dune variable du Khi-deux :

    (8 1) (2 1) = 7degrs de libert.

    94

  • Tests dHypothses A. El Mossadeq

    Pour = 5%, on a :

    27;:95 = 14:1

    Et comme :

    2 =

    2Xi=1

    3Xj=1

    (oij tij)2tij

    = 22:5

    On rejette alors H0 95% (mme 99:5%) , cest dire, laccs lEcole

    dpend de la profession des parents.

    Exercice 29Un mdicament essay sur 42 patients est contrl quant aux eets secondairesquil peut avoir sur le poids des malades. On peut considrer que :

    quinze dentre eux ont maigri dix sept nont pas chang de poids dix ont grossi

    En supposant que la maladie est sans eet sur les variations de poids, le mdica-ment a-t-il un eet signicatif sur le poids ?

    Solution 29Testons, au seuil , lhypothse nulle :

    H0 : le traitement est sans eet sur les variations du poids

    Si le traitement est sans eet sur les variations du poids, alors ces variations sontdes seulement au hasard.La loi de probabilit est donc la loi uniforme, cest dire la probabilit de chaque

    classe est la mme et est gale 1

    3.

    95

  • A. El Mossadeq Tests dHypothses

    Do les rpartitions :

    V ariations Repartition Observee Repartition Theorique

    ont maigri 15 14

    n0ont pas change 17 14

    ont grossi 10 14

    Total 42 42

    Sous lhypothse nulle H0, la quantit :

    2 =

    3Xi=1

    (oi ti)2ti

    est une ralisation dune variable du Khi-deux :

    3 1 = 2degrs de libert.

    Pour = 5%, on a :

    22;:95 = 5:99

    Et comme :

    2 =

    2Xi=1

    (oi ti)2ti

    = 1:86

    on accepte donc lhypothse nulle H0 au seuil = 5%, cest dire, le traite-ment est sans eet sur les variations du poids.

    96

  • Tests dHypothses A. El Mossadeq

    Exercice 30Pour tudier la densit de poussires dans un gaz, on a procd une sriedobservations de petits chantillons de gaz au moyen dun microscope.On a ainsi eectu 143 observations et les rsultats sont les suivants :

    Nombre de particules

    en suspension

    Nombre d0echantillonsde gaz

    0 34

    1 46

    2 38

    3 19

    4 4

    5 2

    > 5 0

    Peut-on admettre, au seuil = 5%, que le nombre de particules en suspensionest une variable de Poisson ?

    Solution 30Testons, au seuil , lhypothse nulle :

    H0 : le nombre de particules en suspension est une variable de Poisson

    Calculons une estimation ponctuelle du paramtre de cette loi :

    P [X = k] =k

    k!exp

    o X est la variable alatoire reprsentant le nombre de particules en suspension.

    97

  • A. El Mossadeq Tests dHypothses

    On sait que :

    ^ =1

    n

    nXi=1

    Xi

    est un estimateur sans biais et convergent de .Une estimation ponctuelle ~ de est donne par :

    ~ =1

    143

    5Xi=0

    ini

    = 1:4336

    Do les rpartitions :

    Particules

    en suspension

    Repartition

    observee

    Repartition

    theorique

    0 34 34:1

    1 46 48:9

    2 38 35:0

    3 19 16:7

    4 4 06:0

    5 2 01:7

    > 5 0 00:6

    Total 143 143

    Leectif thorique tk, k 0, reprsentant le nombre particules en suspension kest donn par :

    tk = nP [X = k]

    98

  • Tests dHypothses A. El Mossadeq

    On constate que le tableau contient des eectifs thoriques strictement infrieurs 5, ce qui empche lutilisation dun test du khi-deux.On peut remdier cet tat en oprant le groupement logique des classes4 et plus.Les tableaux des eectifs observs et thoriques deviennent comme consignsci-aprs.

    Particules

    en suspension

    Repartition

    Observee

    Repartition

    Theorique

    0 34 34:1

    1 46 48:9

    2 38 35:0

    3 19 16:7

    4 4 08:3

    Total 143 143

    Sous lhypothse nulle H0, la quantit :

    2 =

    4Xi=0

    (oi ti)2ti

    est une ralisation dune variable du Khi-deux :

    5 1 1 = 3degrs de libert.puisque pour calculer les eectifs thoriques, nous avons utilislestimation, et non la valeur rel, du paramtre de la loi de Poisson.

    99

  • A. El Mossadeq Tests dHypothses

    Pour = 5%, on a :

    23;:95 = 7:81

    Et comme :

    2 = 2:97

    On accepte alors H0 au seuil = 5%, cest dire, le nombre de particules ensuspension peut tre ajust par une loi de Poisson dont le paramtre est estimpar :

    ~ = 1:4336

    Exercice 31On considre les familles de quatre enfants.Sur un chantillon de cent familles quatre enfants, la rpartition suivante a tobserve :

    Nombre de filles Nombre de familles

    0 7

    1 20

    2 41

    3 22

    4 10

    Peut-on considrer que la probabilit quun enfant soit une lle est1

    2?

    100

  • Tests dHypothses A. El Mossadeq

    Solution 31Testons, au seuil , lhypothse nulle :

    H0 : la probabilit davoir une lle est1

    2

    Sous lhypothse nulle H0, la variable alatoire X gale au nombre de lles parmi

    les quatre enfants suit une loi binomiale dordre 4 et de paramtre1

    2: B

    4;1

    2

    .

    Ainsi, pour tout k, 0 k 4, la probabilit pk davoir k lles parmi les quatreenfants est :

    pk = C (4; k)

    1

    2

    4Leectif thorique tk, 0 k 4, reprsentant le nombre de familles ayant klles parmi les quatre enfants est donn par :

    tk = npk

    Do les rpartitions :

    Nombre de fillesRepartition

    Observee

    Repartition

    Theorique

    0 7 6:25

    1 20 25

    2 41 37:5

    3 22 25

    4 10 6:25

    Total 100 100

    Sous lhypothse nulle H0, la quantit :

    101

  • A. El Mossadeq Tests dHypothses

    2 =

    4Xi=0

    (oi ti)2ti

    est une ralisation dune variable du Khi-deux :

    5 1 = 4degrs de libert.

    Pour = 5%, on a :

    24;:95 = 9:49

    Et comme :

    2 = 4:03

    On accepte alors H0 au seuil = 5% : la probabilit davoir une lle est1

    2:

    Exercice 32Le tableau suivant indique le rsultat de lexamen de 124 sujets, classs daprsla couleur de leurs yeux (Y ) et la couleur de leus cheveux (C) :

    YC Blonds Bruns Noirs Roux

    Bleus 25 9 3 7

    Gris ou V erts 13 17 10 7

    Marrons 7 13 8 5

    Existe-t-il une liason entre ces deux caractres ?

    102

  • Tests dHypothses A. El Mossadeq

    Solution 32La rpartition observe est :

    Tableau des effectifs observees

    YC Blonds Bruns Noirs Roux Total

    Bleus 25 9 3 7 44

    Gris ou V erts 13 17 10 7 47

    Marrons 7 13 8 5 33

    Total 45 39 21 19 124

    Testons, au seuil , lhypothse nulle :

    H0 : les couleurs des yeux et des cheveux sont indpendantes

    Calculons, sous cette hypothse, la rpartition thorique.

    Tableau des effectifs theoriques

    YC Blonds Bruns Noirs Roux Total

    Bleus 16 13:8 7:4 6:8 44

    Gris ou V erts 17 14:8 8 7:2 47

    Marrons 12 10:4 5:6 5 33

    Total 45 39 21 19 124

    103

  • A. El Mossadeq Tests dHypothses

    Sous lhypothse nulle H0, la quantit :

    2 =

    3Xi=1

    4Xj=1

    (oij tij)2tij

    est une ralisation dune variable du Khi-deux :

    (3 1) (4 1) = 6degrs de libert.Pour = 5%, on a :

    26;:95 = 12:6

    Et comme :

    2 =

    2Xi=1

    3Xj=1

    (oij tij)2tij

    = 15

    On rejette alors H0 95% (mme 97:5%), cest dire, les couleurs des yeuxet des cheveux ne sont pas indpendantes.

    Exercice 33On distribue un jeu de quarante cartes quatre joueurs : A ; B ; C ; D ; cha-cun reevant dix cartesUn statisticien a labor un programme de distribution de donnes par ordinateur.Pour un ensemble de deux cents donnes, obtenues partir de ce programme, ilobserve le nombre de donnes o le joueur A reoit k as, 0 k 4. Les rsul-tats sont les suivants :

    Nombre d0as 0 1 2 3 4

    Nombre de donnes 64 74 52 8 2

    Le programme du statisticien est-il able ?

    104

  • Tests dHypothses A. El Mossadeq

    Solution 33Testons, au seuil , lhypothse nulle :

    H0 : le programme du statisticien est able

    Sous lhypothse nulleH0, la variable alatoireX gale au nombre das du joueurA suit une loi hypergomtrique.Ainsi, pour tout k, 0 k 4, la probabilit pk pour que le joueur A ait k asest :

    pk =C (4; k)C (36; 10 k)

    C (40; 10)

    Leectif thorique tk, 0 k 4, reprsentant le nombre de donnes k as, dujoueur A; est donn par :

    tk = npk

    Do les rpartitions :

    Nombre d0asRepartition

    Observee

    Repartition

    Theorique

    0 64 59:97

    1 74 88:85

    2 52 42:84

    3 8 7:88

    4 2 0:46

    Total 200 200

    On constate que le tableau contient des eectifs thoriques strictement infrieurs 5, ce qui empche lutilisation dun test du khi-deux.On peut remdier cet tat en oprant le groupement logique des classes3 et 4.

    105

  • A. El Mossadeq Tests dHypothses

    Le tableau des eectifs observs et thoriques deviennent :

    Nombre d0asRepartition

    Observee

    Repartition

    Theorique

    0 64 59:97

    1 74 88:85

    2 52 42:84

    3 ou 4 10 8:34

    Total 200 200

    Sous lhypothse nulle H0, la quantit :

    2 =

    3Xi=0

    (oi ti)2ti

    est une ralisation dune variable du Khi-deux :

    4 1 = 3degrs de libert.

    Pour = 5%, on a :

    23;:95 = 7:81

    Et comme :

    2 = 5:0418

    On accepte alors H0 au seuil = 5%, cest dire, le programme du statisticienest able.

    106

  • Tests dHypothses A. El Mossadeq

    Exercice 34On a crois deux types de plantes dirant par deux caractres A et B.La premire gnration est homogne.La seconde fait apparaitre quatre types de plantes dont les gnotypes sontdsigns par :

    AB ; Ab ; aB ; ab

    Si les caractres se trasmettent selon les lois deMendel, les proportions thoriques

    des quatre gnotypes sont :9

    16;3

    16;3

    16;1

    16respectivement.

    Sur un chantillon de 160 plantes, on a observ les eectifs :

    100 pour AB

    28 pour Ab

    24 pour aB

    8 pour ab

    Au vu de ces rsultats, les lois de Mendel sont-elles applicables ?

    Solution 34Testons alors, au seuil , lhypothse nulle :

    H0 : les lois de Mendel sont applicables

    Si H0 est vraie, la rpartition des 160 plantes sur les quatre gnotypes devraittre comme suit :

    t1 = 90 pour AB

    t2 = 30 pour Ab

    t3 = 30 pour aB

    t4 = 10 pour ab

    107

  • A. El Mossadeq Tests dHypothses

    On rsume toutes les donnes dans le tableau suivant :

    Genotypes Repartition Observee Repartition Theorique

    AB 100 90

    Ab 28 30

    aB 24 30

    ab 8 10

    Total 160 160

    Sous lhypothse nulle H0, et vu que tous les eectifs thoriques sont suprieursou gaux 5, la quantit :

    2 =

    4Xi=1

    (oi ti)2ti

    est une ralisation dune variable du Khi-deux :

    4 1 = 3degrs de libert : 23.Pour = 5%, on a :

    23;:95 = 7:81

    et comme :

    2 =

    4Xi=1

    (oi ti)2ti

    = 2:84

    On accepte alors lhypothse nulle H0 au seuil de 5%, cest dire, les transmis-sions gntiques de ce type de plantes se font selon les lois de Mendel.

    108

  • Tests dHypothses A. El Mossadeq

    Exercice 35On se propose de comparer les ractions produites par deux vaccins A et B.Un groupe de 348 individus a t divis, par tirage au sort, en deux sries quiont t vaccines lune par A et lautre par B.Les ractions ont t lues par une personne ignorant le vaccin utilis :

    V accinReaction legere moyenne ulceration abces

    A 12 156 8 1

    B 29 135 6 1

    Que peut-on conclure ?

    Solution 35la rpartition observs est :

    Tableau des effectifes observes

    V accinReaction legere moyenne ulceration abces Total

    A 12 156 8 1 177

    B 29 135 6 1 171

    Total 41 291 14 2 348

    Testons, au seuil , lhypothse nulle :

    H0 : les ractions sont indpendantes du vaccin utilis

    Calculons, sous cette hypothse, la rpartition thorique.

    109

  • A. El Mossadeq Tests dHypothses

    Tableau des effectifs theoriques

    V accinReaction legere moyenne ulceration abces Total

    A 20:9 148 7:1 1 177

    B 20:1 143 6:9 1 171

    Total 41 291 14 2 348

    On constate que les eectifs thoriques dans la colonne Abcessont infrieurs 5; ce qui empche lapplication dun test du Khi-deux.On peut remdier cet tat en oprant le groupement logique des classesUlcerationet Abces.Les tableaux des eectifs observs et thoriques obtenus aprs regroupement sontdonns ci-aprs.Sous lhypothse nulle H0, la quantit :

    2 =

    2Xi=1

    3Xj=1

    (oij tij)2tij

    est une ralisation dune variable du Khi-deux :

    (2 1) (3 1) = 2Et comme :

    22;:95 = 5:99

    et :

    2 =

    2Xi=1

    3Xj=1

    (oij tij)2tij

    = 8:8

    110

  • Tests dHypothses A. El Mossadeq

    On rejette alors, 95%, lhypothse selon laquelle les deux vaccins A et Bprovoquent les mmes ractions.

    Tableau des effectifs observes

    V accinReaction legere moyenne ulcerationou abces

    Total

    A 12 156 9 177

    B 29 135 7 171

    Total 41 291 16 348

    Tableau des effectifs theoriques

    V accinReaction legere moyenne ulcerationou abces

    Total

    A 20:9 148 8:1 177

    B 20:1 143 7:9 171

    Total 41 291 16 348

    Exercice 36An de juguler le chmage des jeunes, le gouvernement franais a cr le CPE(Contrat Premire Embauche) permettant aux entreprises de licencier sans motifla personne recrute pendant les deux premires annes et dautre part de bn-cier davantages nanciers substantiels.Il est dcid de faire une enqute la sortie de lANPE (Agence Nationale PourlEmploi) pour connatre lopinion des jeunes sur ce nouveau contrat.

    111

  • A. El Mossadeq Tests dHypothses

    La question pose sera :

    "Pensez-vous que le CPE est une bonne chose pour

    les jeunes en recherche demploi ?"

    On note p la proportion inconnue de la population rpondant positivement cette question .

    1. (a) Exprimer, en fonction dune estimation f de p, la taille n de lchantillon

    prlever pour que lintervalle de conance de p obtenu aprs enqute ait

    une amplitude de 0; 05 avec un coe cient de conance de 95%.

    (b) Si un pr-sondage 30% de rponses positives, quelle doit tre la taille n

    de lchantillon prlever ?.

    (c) Il est nalement dcid de diminuer le coe cient de conance 90% et

    de ninterroger que 500 personnes dont 130 rpondent positivement la

    question pose.

    Donner lintervalle de conance de p.

    2. Trois mois aprs la mise en place de ce contrat, le gouvernement franaisan-

    nonce que le salaire moyen dembauche du CPE est de 1100 e.

    Lors dune analyse des salaires de 100 personnes on obtient :

    Salaire en e Nombre de personnes

    [950-1000[ 17

    [1000-1050[ 36

    [1050-1100[ 31

    [1100-1200[ 13

    [1200-1500[ 3

    112

  • Tests dHypothses A. El Mossadeq

    (a) Donner une estimation de la moyenne et de lcart-type du salaire de

    lensemble des personnes recrutes sur ce contrat.

    (b) Tester lhypothse de normalit de la distribution des salaires de la popu-

    lation concerne par ce contrat.

    (c) Que pensez-vous de lannonce du gouvernement franais ?

    Solution 361. (a) Au seuil , lintervalle de conance de p correspondant une frquence f

    observe sur un chantillon de taille n est dni par :"f t1=2

    rf (1 f)

    n; f + t1=2

    rf (1 f)

    n

    #Si lamplitude de cet intervalle est 0; 05, alors :

    0:05 = 2t1=2

    rf (1 f)

    n

    do :

    n =

    2t1=20:05

    2f (1 f)

    Pour = 5%, on a :

    t0:975 = 1:96

    do :

    n = 6146:56f (1 f)(b) Pour :