Upload
ali-amani
View
25
Download
2
Embed Size (px)
Citation preview
Dpartement de Mathmatiques et Informatique
Abdelhamid El Mossadeq Professeur lEHTP
A. El Mossadeq Mai 2008
TABLE DES MATIRES
1.Lesprincipesgnrauxdestestsdhypothses 1
2.Testdecomparaisonduneestimationunenorme 4
2.1.Testdecomparaisondunefrquenceunenorme 4
2.2.Testdecomparaisondunevarianceunenorme 6
2.3.Testdecomparaisondunemoyenneunenorme 8
2.3.1.n30 82.3.2.n
Tests dHypothses A. El Mossadeq
1. Les Principes Gnraux des TestsdHypothses
Soit X un ala dont la loi de probabilit appartient la famille fP j 2 g, Rp, p 1:
Une hypothse H est un sous ensemble de :
Une hypothse est dite simple si H ne contient quun seul lment.
Soient deux hypothses H0 : 2 0 et H1 : 2 1 telles que :0 \1 = ?
en gnaral, 0 et 1 forment une partition de .
Un test dhypothses consiste trancher entre deux hypothses au vu desrsultats dun chantillon.
Lobjectif dun test est de choisir entre ces deux hypothses, la dcision aboutira
choisir H0 (appele lhypothse nulle) ou H1 appele (lhypothse alternative)
dont une seule est en ralit vraie.
Il y a donc quatre cas possibles dont les probabilits sont rsumes dans le tableau
suivant:
H0 vraie H1 vraie
H0 dcide 1
H1 dcide 1
1
A. El Mossadeq Tests dHypothses
1 est la probabilit de dcider H0 alors que H0 est vraie. est la probabilit de dcider H1 alors que H0 est vraie.
est la probabilit de dcider H0 alors que H1 est vraie.
1 est la probabilit de dcider H1 alors que H1 est vraie.
est appel lerreur du 1ere espce. est appel lerreur du 2eme espce.1 est appel la puissance du test.
Ces deux erreurs sont antogonistes, plus sera grand (resp. petit), plus sera
petit (resp. grand).
Le fait dimposer un faible conduit une rgle de dcision plus stricte qui
aboutit le plus souvent nabandonner lhypothse nulle que dans des cas rares
et donc conserver cette hypothse quelque fois tort.
Le compromis entre les valeurs de et est donc souhaitable bien que di cile
raliser.
Dans la pratique, on dtermine la variable de dcision dont la loi doit treparfaitement connue sous lhypothse nulle H0.
tant x, on appelle rgion critique, note C, lensemble des valeurs dela variable de dcision qui conduisent rejeter lhypothse nulle H0 au prot de
lhypothse alternative H1 :
P [C j H0] = et on appelle rgion dacceptation, note C, lensemble des valeurs de lavariable de dcision qui conduisent accepter lhypothse nulle H0 au prot de
lhypothse alternative H1.
2
Tests dHypothses A. El Mossadeq
Un test bilatral sapplique quand on cherche une dirence entre une estima-tion et une valeur donne ou entre deux estimations sans se proccuper du signe
ou du sens de la dirence :
H0 : 0 = contre H1 : 0 6= ou :
H0 : 1 = 2 contre H1 : 1 6= 2La rgion critique ou la zone de rejet de lhypothse nulle est situe de part et
dautre de la distribution de probabilit de la variable de dcision :
Region d0acceptation d0un test bilateral
Un test unilatral sapplique quand on cherche dterminer si une estimationest suprieure (resp. infrieure) une valeur donne ou une autre estimation :
H0 : 0 contre H1 : 0 < resp: H0 : 0 contre H1 : 0 >
ou :
H0 : 1 2 contre H1 : 1 < 2resp: H0 : 1 2 contre H1 : 1 > 2
3
A. El Mossadeq Tests dHypothses
Dans ce cas, la rgion critique ou la zone de rejet de lhypothse nulle est situe
dun seul ct de la distribution de probabilit de la variable de dcision :
Region d0acceptation d0un test unilateral
Certains tests comme le test du khi-deux est pratiquement toujours unilatral.
2. Tests de Comparaison dune Estimation une Norme
2.1. Test de Comparaison dune Frquence Observe une Norme
On dispose dune population o le caractre tudi prsente une proportion p.
Sur un chantillon de taille n, on observe une frquence f:
La dirence entre p et f est-elle signicative ou est-elle de seulement au hasard
de lchantillonnage ?
Soit donc tester lhypothse nulle :
H0 : "f = p"
4
Tests dHypothses A. El Mossadeq
contre lhypothse alternative :
H0 : "f 6= p"au seuil :
Sous lhypothse nulle H0 et pourvu que np et n (1 p) soient suprieurs ougaux 5, la quantit :
t =f prp (1 p)
n
peut tre considre comme une ralisation de la variable alatoire normale cen-
tre rduite :
N =F prp (1 p)
n
Ainsi, pour tout 2 [0; 1], il existe t1=2 2 R tel que :PjN j < t1=2 = 1
On rejette lhypothse nulle H0, au seuil , ds que :
jtj > t1=2
Exemple 1Une machine former des pilules fonctionne de faon satisfaisante si la proportionde pilules non russies est de 1 pour 1000.Sur un chantillon de 10000 pilules, on a trouv 15 pilules dfectueuses.Que faut-il conclure ?Ici on a : 8
A. El Mossadeq Tests dHypothses
Testons, au seuil , lhypothse nulle :
H0 : "la machine est bien rgle"
Sous cette hypothse, la quantit :
t =f prp (1 p)
n
peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.Pour = 5%, on a :
t:975 = 1:96
et comme :
t =f prp (1 p)
n
= 1:58
on accepte donc lhypothse nulle H0 au seuil = 5%, cest dire, quau seuil = 5%, la machine fonctionne de faon satisfaisante.
2.2. Test de Comparaison dune Variance Observe une Norme
Si X suit une loi normale de moyenne et de variance 2, alors sous lhypothse
nulle :
H0 : "s2 = 2"
la quantit :
2 =(n 1) s2
2
est une ralisation dune variable 2n1 du Khi-deux (n 1) degrs de libert.
6
Tests dHypothses A. El Mossadeq
Ainsi, pour tout 2 [0; 1], il existe 2n1;=2 et 2n1;1=2 dans R tels que :
Ph2n1;=2 <
2 < 2n1;1=2i= 1
o 2n1;=2 et 2n1;1=2 vrient :8
A. El Mossadeq Tests dHypothses
est une ralisation dune variable du Khi-deux :
(10 1) = 9degrs de libert : 29Pour = 5% :
29;:025 = 2:7
29;:975 = 19
et comme :
2 =(n 1) s2
2= 7:02
on accepte lhypothse nulleH0, au seuil = 5%, cest dire, la force de rupturede ce type de cable a pour variance :
2 = 2000N2
2.3. Test de Comparaison dune Moyenne Observe une Norme
2.3.1. n 30Sous lhypothse nulle :
H0 : "m = "
la quantit :
t =m pn
peut tre considre comme une ralisation de la variable alatoire normale cen-
tre rduite :
N =M pn
8
Tests dHypothses A. El Mossadeq
Ainsi, pour tout 2 [0; 1], il existe t1=2 2 R tel que :PjN j < t1=2 = 1
cest dire : Z t1=2t1=2
1p2expt
2
2dt = 1
ou encore : Z t1=21
1p2expt
2
2dt = 1
2
On rejette alors lhypothse nulle H0, 1 , ds que :jtj > t1=2
Si la variance 2 est inconnue, on la remplace par son estimation s2:
Exemple 3Dune population, on extrait un chantillon de taille n = 40 sur lequel on observeune moyenne m = 7:5 et une variance s2 = 80.Tester lhypothse selon laquelle cet chantillon est extrait dune population demoyenne = 10.Ici on a :
n = 40 = 10 m = 7:5 s2 = 80
Testons lhypothse nulle :
H0 : "la moyenne de la population est = 10"
Sous cette hypothse, la quantit :
t =m spn
peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.Pour = 5%, on a :
t:975 = 1:96
9
A. El Mossadeq Tests dHypothses
et comme :
t =m spn
= 1:77
on accepte lhypothse nulle H0 au seuil = 5%, cest dire, lchantillon estextrait dune population de moyenne = 10.
2.3.2. n < 30
Si X suit une loi normale de moyenne et de variance 2, alors sous lhypothse
nulle :
H0 : "m = "
la quantit :
t =m spn
est une ralisation de la variable alatoire de Student Tn1 (n 1) degrs delibert :
Tn1 =M spn
Ainsi, pour tout 2 [0; 1], il existe tn1;1=2 2 R tel que :PjTn1j < tn1;1=2 = 1
o tn1;1=2 vrie :
Fn1tn1;1=2
= 1
2Fn1 tant la fonction de rpartition de Tn1.On rejette alors lhypothse nulle H0, 1 , ds que :
jtj > tn1;1=2
10
Tests dHypothses A. El Mossadeq
Exemple 4Un fabriquant de corde a rme que les objets quil produit ont une tension derupture moyenne de trois cents Kilogrammes.Peut-on admettre le bien fond de cette a rmation si des expriences faites surdix cordes ont permis de constater les forces de rupture suivantes :
251 247 255 305 341 326 329 345 392 289
Avant de tester lhypothse nulle :
H0 : "la tension de rupture moyenne de la corde est 300 kg"
Calculons les estimations m et s2 sur cet chantillon de taille n = 10.On a :
m =1
10
10Xi=1
xi
= 308 kg
et :
s2 =1
9
10Xi=1
(xi m)2
= 2269:8 kg2
Sous lhypothse nulle H0, la quantit :
t =m spn
est une ralisation dune variable alatoire de Student :
n 1 = 9degrs de libert :T9.Pour = 5%, on a :
t9;:975 = 2:26
11
A. El Mossadeq Tests dHypothses
et comme :
t =m spn
= :531
on accepte lhypothse nulle H0 au seuil = 5%, cest dire, la tension derupture moyenne de la corde est 300 kg.
3. Tests de Comparaison de DeuxEstimations
3.1. Test de Comparaison de Deux Frquences
On dispose de deux chantillons indpendants de tailles respectives n1 et n2 sur
lesquels le caractre tudi prsente les frquences f1 et f2 respectivement.
On se demande si ces deux chantillons proviennent dune mme population.
Soit donc tester lhypothse nulle :
H0 : "p1 = p2"
contre lhypothse alternative :
H0 : "p1 6= p2"au seuil :
Si les deux chantillons proviennent dune mme population dnie par la pro-
portion p = p1 = p2 (souvent inconnue) du caractre tudi, f1 et f2 peuvent
tre considres comme des ralisations des variables alatoires normales centres
rduites :
12
Tests dHypothses A. El Mossadeq
N1 =F1 prf1 (1 f1)
n1
N2 =F2 prf2 (1 f2)
n2
respectivement, pourvu que n1p1, n1 (1 p1), n2p2 et n2 (1 p2) soient toussuprieurs ou gaux 5:
En consquence , la quantit :
t =f1 f2r
f1 (1 f1)n1
+f2 (1 f2)
n2
peut tre considre comme une ralisation dune variable alatoire normale cen-
tre rduite.
On rejette lhypothse nulle H0, au seuil , ds que :
jtj > t1=2
Exemple 5Avant de procder au lancement dun produit, une entreprise a fait procder une enqute portant sur deux rgions gographiques A et B.Sur 1800 rponses provenant de la rgion A, 630 se dclarent intresses par leproduit.En provenance de B, 150 rponses sur 600 se dclarent favorables.Tester, au seuil de 5%, lhypothse de lidentit des opinions des rgions A et Bquant au produit considr.
13
A. El Mossadeq Tests dHypothses
Ici on : 8>>>>>:nA = 1800 ; fA =
7
20
nB = 600 ; fB =1
4Testons, au seuil , lhypothse nulle :
H0 : les opinions des rgions A et B sont identiques
Sous cette hypothse, la quantit :
t =fA fBr
fA (1 fA)nA
+fB (1 fB)
nB
peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.Pour = 5%, on a :
t:975 = 1:96
et comme :
t =fA fBr
fA (1 fA)nA
+fB (1 fB)
nB= 4:77
on rejette donc lhypothse nulle H0 95% (et mme 99:98%), cest dire,les deux rgions A et B ont des opinions direntes.
3.2. Test de Comparaison de Deux Variances
On considre deux populations dans lesquelles le caractre tudi est distribu
selon des lois normales de variances 21 et 22 inconnues.
Il sagit de dcider si les variances de ces deux populations sont gales.
14
Tests dHypothses A. El Mossadeq
Soit tester, au seuil , lhypothse nulle :
H0 : "21 =
22"
On extrait de ces deux populations, deux chantillons indpendants de taille n1et n2 respectivement, sur lesquels on calcule les estimations s21 de
21 et s
22 de
22.
Sous lhypothse nulle H0, la quantit :
f =s21s22
est une ralisation dune variable alatoire Fn11;n21 de Fisher (n1 1; n2 1)degrs de libert.
Ainsi, pour tout 2 [0; 1], il existe Fn11;n21;=2 2 R et Fn11;n21;1=2 2 Rtels que :
PFn11;n21;=2 < f < Fn11;n21;1=2
= 1
On rejette alors lhypothse nulle H0, 1 , ds que :f =2 Fn11;n21;=2 Fn11;n21;1=2
En pratique, on rejette lhypothse nulle H0, 1 , ds que :8>>>>>>>:s21s22> Fn11;n21;1=2 si s
21 > s
22
s22s21> Fn21;n11;1=2 si s
22 > s
21
Exemple 6Sur deux chantillons indpendants de tailles n1 = 9 et n2 = 21, extraits de deuxpopulations gaussiennes, les variances ont t estimes par s21 = 16 et s
22 = 12.
Peut-on admettre, au seuil = 10%, que les deux populations considres ontla mme variance ?
15
A. El Mossadeq Tests dHypothses
Ici on a : n1 = 9 s
21 = 16
n2 = 21 s22 = 12
Testons au seuil , lhypothse nulle :
H0 : "21 =
22"
Sous cette hypothse, la quantit :
f =s21s22
est une ralisation dune variable alatoire de Fisher :
(n1 1; n2 1) = (8; 20)degrs de libert : F8;20Pour = 10%, on a :
F8;20;:95 = 2:45
et comme :
f =s21s22
=4
3
on accepte lhypothse nulle H0 au seuil = 10%.
Exemple 7Sur deux chantillons indpendants de tailles n1 = 17 et n2 = 21, extraits dedeux populations gaussiennes, les variances ont t estimes par s21 = 36 ets22 = 45:
Peut-on admettre, au seuil = 2%, que ces deux populations ont la mme vari-ance ?
Ici on a : n1 = 17 s
21 = 36
n2 = 21 s22 = 45
16
Tests dHypothses A. El Mossadeq
Testons au seuil , lhypothse nulle :
H0 : "21 =
22"
Sous cette hypothse, la quantit :
f =s22s21
est une ralisation dune variable alatoire de Fisher :
(n2 1; n1 1) = (20; 16)degrs de libert : F20;16Pour = 2, on a :
F20;16;:99 = 3:25
et comme :
f =s22s21
= 1:25
on accepte lhypothse nulle H0 au seuil = 2%.
3.3. Test de Comparaison de Deux Moyennes
On considre deux populations dans lesquelles le caractre tudi est dni par1;
21
et2;
22
respectivement.
On extrait de ces deux populations, deux chantillons indpendants de tailles n1et n2 respectivement, sur lesquels on calcule les estimations
m1; s
21
de1;
21
etm2; s
22
de2;
22
.
3.3.1. n1 30 et n2 30Sous lhypothse nulle :
H0 : "1 = 2"
17
A. El Mossadeq Tests dHypothses
la quantit :
t =m1 m2s21n1+22n2
peut tre considre comme une ralisation de la variable alatoire normale cen-
tre rduite :
N =M1 M2s21n1+22n2
Ainsi, pour tout 2 [0; 1], il existe t1=2 2 R tel que :PjN j < t1=2 = 1
On rejette alors lhypothse nulle H0, 1 , ds que :jtj > t1=2
Si 21 ou 22 est inconnue, on peut remplacer sans inconvnient lune ou lautre
par son estimation.
Exemple 8Chez cent sujet normaux, on dose lacide urique, les rsultats sont :8
Tests dHypothses A. El Mossadeq
Testons au seuil , lhypothse nulle :
H0 : "la maladie de goutte na pas dinuence sur la dose de lacide urique"
Sous cette hypothse, la quantit :
t =m1 m2ss21n1+s22n2
peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.Pour = 5%, on a :
t:975 = 1:96
et comme :
t =m1 m2ss21n1+s22n2
= 15:862
on rejette lhypothse nulle H0 95% (mme 99:99%); cest dire, la maladiede goutte a une inuence sur la dose de lacide urique.
3.3.2. n1 < 30 ou n2 < 30
Si le caractre tudi est distribu dans les deux populations selon des lois nor-
males de mme variance 2 = 21 = 22 (pour vrier cette hypothse, on peut
faire un test de comparaison de deux variances) estime par :
s2 =(n1 1) s21 + (n2 1) s22
n1 + n2 2alors sous lhypothse nulle :
H0 : "1 = 2"
19
A. El Mossadeq Tests dHypothses
la quantit :
t =m1 m2s
r1
n1+1
n2
est une ralisation de la variable alatoire Tn1+n22 de Student (n1 + n2 2)degrs de libert.
Ainsi, pour tout 2 [0; 1], il existe tn1+n22;1=2 2 R tel que :
PjTn1+n22j < tn1+n22;1=2 = 1
On rejette alors lhypothse nulle H0, 1 , ds que :jtj > tn1+n22;1=2
Exemple 9On tudie leet dune substance sur la croissance dune tumeur gree.Les rsultats sont consigns sur le tableau ci-dessous donnant la surface de latumeur au 20eme jour aprs sa gree :
Surface 5:5 6 6:5 7 7:5 8
T emoins 1 2 3 8 4 3
Traites 4 4 8 3 1 1
Le traitement a-t-il un eet signicatif sur la surface tumorale ?On suppose que la surface tumorale est distribue selon des lois normalesN 1; 21et N 2; 22 chez les tmoins et les traits respectivement.
20
Tests dHypothses A. El Mossadeq
Calculons les estimationsm1; s
21
de1;
21
etm2; s
22
de2;
22
.
On a : 8>>>>>>>>>>>:m1 =
1
21
6Xi=1
n1ixi = 7
s21 =1
20
6Xi=1
n1i (xi m1)2 = :45
et : 8>>>>>>>>>>>:m2 =
1
21
6Xi=1
n2ixi = 6:4048
s22 =1
20
6Xi=1
n2i (xi m2)2 = :87972
Testons dabord, au seuil = 5%, lhypothse nulle dgalit des variances dessurfaces tumorales chez les populations des tmoins et des traits.Sous cette hypothse, la quantit :
f =s22s21
est une ralisation dune variable alatoire de Fisher :
(n2 1; n1 1) = (20; 20)degrs de libert.Pour = 5%, on a :
F20;20;:975 = 2:45
et comme :
f =s22s21
= 1:9549
21
A. El Mossadeq Tests dHypothses
on accepte donc lhypothse dgalit des variances des deux populations.Calculons maintenant lestimation commune s2 de cette variance :
s2 =(n1 1) s21 + (n2 1) s22
n1 + n2 2= :66486
et testons lhypothse nulle :
H0 : "le traitement est sans eet sur la croissance de la surface tumorale"
Sous cette hypothse, la quantit :
t =m1 m2s
r1
n1+1
n2
est une ralisation de la variable alatoire de Student :
n1 + n2 2 = 40degrs de libert.
Pour = 5%, on a :
t40;:975 = 2:02
et comme :
t =m1 m2s
r1
n1+1
n2= 2:831
on rejette lhypothse nulleH0 95% (et mme 98%), cest dire, le traitementa une inuence sur la croissance de la surface tumorale.
22
Tests dHypothses A. El Mossadeq
4. Test dAdquation du Khi-Deux
On considre un caractre k classes direntes en proportion p1; :::; pk.
Comme p1+ :::+pk = 1, la composition de la population est entirement dter-
mine par k 1 de ces proportions.On extrait de cette populations un chantillon de taille n:
Si la composition de cet chantillon tait identique celle de la population, il
contiendrait :
t1 = np1 du caractre 1:
tk = npk du caractre k
ce sont les eectifs calculs ou les eectifs thoriques.En ralit, on observe des eectifs :
o1 du caractre 1:
ok du caractre k
dirant plus ou moins des eectifs thoriques. Ce sont les eectifs observs.Le problme est de dcider si lcart entre ces eectifs est signicatif ou il est d
seulement au hasard de lchantillonnage.
Soit donc tester, au seuil , lhypothse nulle :
H0 : "o1 = t1 ; ::: ; ok = tk"
contre lhypothse alternative H0.
Sous lhypothse nulle H0, et pourvu que tous les eectifs thoriques soient
suprieurs ou gaux 5, la quantit :
23
A. El Mossadeq Tests dHypothses
2 =
kXi=1
(oi ti)2ti
est une ralisation dune variable du Khi-deux k 1 degrs de libert : 2k1. tant donn, il existe 2k1;1 2 R tel que :
P2 < 2k1;1
= 1
On rejette alors lhypothse nulle H0 1 ds que :2 > 2k1;1
Exemple 10On a crois deux types de plantes dirant par deux caractres A et B.La premire gnration est homogne.La seconde fait apparaitre quatre types de plantes dont les gnotypes sontdsigns par : AB ; Ab ; aB ; ab:Si les caractres se trasmettent selon les lois deMendel, les proportions thoriques
des quatre gnotypes sont :9
16;3
16;3
16;1
16respectivement.
Sur un chantillon de 160 plantes, on a observ les eectifs :
100 pour AB28 pour Ab24 pour aB8 pour ab
Au vu de ces rsultats, les lois de Mendel sont-elles applicables ?
Testons alors, au seuil , lhypothse nulle :
H0 : les lois de Mendel sont applicables
24
Tests dHypothses A. El Mossadeq
Si H0 est vraie, la rpartition des 160 plantes sur les quatre gnotypes devraittre comme suit :
t1 = 90 pour ABt2 = 30 pour Abt3 = 30 pour aBt4 = 10 pour ab
On rsume toutes les donnes dans le tableau suivant :
Genotypes Repartition Observee Repartition Theorique
AB 100 90
Ab 28 30
aB 24 30
ab 8 10
Total 160 160
Sous lhypothse nulle H0, et vu que tous les eectifs thoriques sont suprieursou gaux 5, la quantit :
2 =
4Xi=1
(oi ti)2ti
est une ralisation dune variable du Khi-deux :
4 1 = 3degrs de libert : 23.
25
A. El Mossadeq Tests dHypothses
Pour = 5%, on a :
23;:95 = 7:81
et comme :
2 =
4Xi=1
(oi ti)2ti
= 2:84
On accepte alors lhypothse nulle H0 au seuil de 5%, cest dire, les transmis-sions gntiques de ce type de plantes se font selon les lois de Mendel.
Remarque 1Si pour lajustement par une loi thorique dpendant de paramtres, on utiliseles estimations de s parmi ces paramtres, et non leurs valeurs relles, alors lenombre de degrs de libert, dans ce cas, est :
(k 1) s = k s 1Ainsi , par exemple :
(i) si, pour lajustement par une loi de Poisson, on utilise lestimation de son
paramtre, suppos inconnu, alors le nombre de degrs de libert est :
(k 1) 1 = k 2(ii) si, pour lajustement par une loi normale, on utilise lestimation de la moyenne
et de la variance, supposes toutes les deux inconnues, alors le nombre de
degrs de libert est :
(k 1) 2 = k 3
26
Tests dHypothses A. El Mossadeq
5. Test dIndpendance du Khi-Deux
On considre deux caractres X et Y n et m classes respectivement.
Le tableau suivant rsume les observations faites sur un chantillon de taille N
concernant le couple de caractres (X; Y ) :
Tableau des effectifs observes
XY 1 2 : : m Total
1 o11 o12 : : o1m o1:
2 o21 o22 : : o2m o2:
: : : : : : :
n on1 on2 : : onm on:
Total o:1 o:2 : : o:m N
o :
oi: =
mXk=1
oik
o:j =
nXk=1
okj
et :nXi=1
oi: =
mXj=1
o:j =
nXi=1
mXj=1
oij = N
27
A. El Mossadeq Tests dHypothses
Au vu de ces rsultats, Il sagit de dcider si les deux caractre X et Y sont
indpendants.
Soit tester, au seuil , lhypothse nulle :
H0 : X et Y sont indpendants
contre lhypothse alternative H0.
Si X et Y taient indpendants, alors pour tout (i; j) 2 f1; ::; ng f1; ::;mg :
P [X = i; Y = j] = P [X = i]P [Y = j]
et lchantillon contiendrait en consquence :
tij =oi:o:jN
individus possdant le caractre [X = i; Y = j]. Ce sont les eectifs thoriquesou les eectifs calculs.
Tableau des effectifs theoriques
XY 1 2 : : m Total
1 t11 t12 : : t1m o1:
2 t21 t22 : : t2m o2:
: : : : : : :
n tn1 tn2 : : tnm on:
Total o:1 o:2 : : o:m N
28
Tests dHypothses A. El Mossadeq
Sous lhypothse nulle H0, et pourvu que tous les eectifs thoriques soient
suprieurs ou gaux 5, la quantit :
2 =
nXi=1
mXj=1
(oij tij)2tij
est une ralisation dune variable alatoire du Khi-deux (n 1) (m 1) degrsde libert : 2(n1)(m1). tant donn, il existe 2(n1)(m1);1 2 R tel que :
Ph2 < 2(n1)(m1);1
i= 1
On rejette alors lhypothse nulle H0 1 ds que :2 > 2(n1)(m1);1
Exemple 1175 enfants sont vus en consultation pour un asthme. On relve chez eux les deuxsymptmes suivants :* Intensit de la maladie asmathique : lgre , moyenne , forte* Existence ou absence dun eczma au moment de lobservation ou dans lepass.On peut classer les enfants selon la rpartition suivante :
EczemaAsthme fort moyen leger
present 8 2 2
passe 11 11 3
jamais 6 18 14
On se propose de dterminer sil existe une association entre lintensit de lasthmeet lexistence dun eczma ?
29
A. El Mossadeq Tests dHypothses
Testons, au seuil , lhypothse nulle :
H0 : lintensit de lasthme est indpendante de lexistence dun eczma
Calculons, sous cette hypothse, la rpartition thorique :
Tableau des effectifs theoriques
EczemaAsthme fort moyen leger Total
present 4 4:96 3:04 12
passe 8:33 10:33 6:34 25
jamais 12:67 15:71 9:62 38
Total 25 31 19 75
Les eectifs thoriques sur la premire ligne sont strictement infrieurs cinq,ce qui empche lapplication dun test du Khi-deux. On peut remdier cet taten oprant le groupement logique des classes presentet passe.Les nouveaux tableaux des eectifs observs et thoriques, obtenus aprs re-groupement de ces deux classes sont donns ci-aprs.
Tableau des effectifs observees
EczemaAsthme fort moyen leger Total
present ou passe 19 13 5 37
jamais 6 18 14 38
Total 25 31 19 75
30
Tests dHypothses A. El Mossadeq
Tableau des effectifs theoriques
EczemaAsthme fort moyen leger Total
present ou passe 12:33 15:29 9:38 37
jamais 12:67 15:71 9:62 38
Total 25 31 19 75
Sous lhypothse nulle H0, la quantit :
2 =
2Xi=1
3Xj=1
(oij tij)2tij
est une ralisation dune variable du Khi-deux :
(2 1) (3 1) = 2degrs de libert.Pour = 5%, on a :
22;:95 = 5:99
Et comme :
2 =
2Xi=1
3Xj=1
(oij tij)2tij
= 11:84
On rejette alors H0 95% (mme 99:5%), cest dire, lintensit de lasthmedpend de lexistence dun eczma.
Remarque 2Lorsque lhypothse nulle est rejete, il est souhaitable de prciser lintensit dela liaison entre les deux caractres X et Y .On introduit alors le coe cient suivant, dit coe cient de Tschuprov :
31
A. El Mossadeq Tests dHypothses
T 2 =2
Np(n 1) (m 1)
1. Si les deux caractres X et Y sont indpendants alors :
2 = 0
puisque pour tout (i; j) 2 f1; ::; ng f1; :::;mg :oij = tij
do :
T 2 = 0
2. Si les deux caractres X et Y sont en liason fonctionnelle (bijection), alors
n = m et par une permutation sur les lignes ou sur les colonnes, on peut
ramener le tableau des eectifs observs un tableau diagonal.
On a :
oi: = o:i = oii
do :
2 =
nXi=1
nXj=1
(oij tij)2tij
=
nXi=1
(oii tii)2tii
+Xi6=j
(oij tij)2tij
Or :
nXi=1
(oii tii)2tii
= N (n 2) +nXi=1
o2ii
32
Tests dHypothses A. El Mossadeq
et : Xi6=j
(oij tij)2tij
=Xi6=jtij
=Xi6=j
oi: o:jN
=1
N
nXi=1
oi: (N o:i)
= N 1N
nXi=1
o2i:
donc :
2 = N (n 1)Il en rsulte que :
jT j = 1
3. Dans les autres cas, on admet que :
(a) Si :
0 < T < 0:3
on dit que la liaison est faible.
(b) Si :
0:3 < T < 0:7
on dit que la liaison est moyenne.
(c) Si :
0:7 < T < 1
on dit que la liaison est forte.
33
A. El Mossadeq Tests dHypothses
Exemple 12Reprenons lexemple prcdent.On a :
T 2 =2
Np(n 1) (m 1)
=11:84
75p(2 1) (3 1)
= 0:11163
do :
T = 0:334
On conclut que la liason entre lintensit de lasthme et lexistence deczma estmoyenne.
34
Tests dHypothses A. El Mossadeq
6. Exercices
Exercice 1Une machine former des pilules fonctionne de faon satisfaisante si la proportionde pilules non russies est de 1 pour 1000.Sur un chantillon de 10000 pilules, on a trouv 15 pilules dfectueuses.Que faut-il conclure ?
Solution 1Ici on : 8
A. El Mossadeq Tests dHypothses
Exercice 2On a lanc cent fois une pice de monnaie et lon a obtenu soixante fois pileet quarante fois face.Tester au seuil de 5%, puis 1%, lhypothse de la loyaut de la pice.
Solution 2Ici on :
n = 100
f = 0:6
o f est la frquence de pile.Testons, au seuil , lhypothse nulle :
H0 : la pice est loyale
Sous cette hypothse, on a :
p = 0:5
et la quantit :
t =f prp (1 p)
n
peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.On a :
t =f prp (1 p)
n= 2
(i) Pour = 5%, on a :
t:975 = 1:96
on rejette donc lhypothse nulle H0 95%, cest dire, qu 95%, la pice
est truque.
36
Tests dHypothses A. El Mossadeq
(ii) Pour = 1%, on a :
2:57 < t:995 < 2:58
on accepte donc lhypothse nulle H0 au seuil = 1%, cest dire, quau
seuil = 1%, la pice est normale.
Exercice 3Avant de procder au lancement dun produit, une entreprise a fait procder une enqute portant sur deux rgions gographiques A et B.Sur 1800 rponses provenant de la rgion A, 630 se dclarent intresses par leproduit.En provenance de B, 150 rponses sur 600 se dclarent favorables.Tester, au seuil de 5%, lhypothse de lidentit des opinions des rgions A et Bquant au produit considr.
Solution 3Cet exercice peut tre trair soit par un test de comparaison de deux frquencessoit par un test dindpendance du Khi-deux.
1. Test de comparaison de deux frquences :Ici on : 8>>>>>:
nA = 1800 et fA =7
20
nB = 600 et fB =1
4Testons, au seuil , lhypothse nulle :
H0 : les opinions des rgions A et B sont identiques
Sous cette hypothse, la quantit :
t =fA fBr
fA (1 fA)nA
+fB (1 fB)
nB
37
A. El Mossadeq Tests dHypothses
peut tre considre comme une ralisation dune variable alatoire normale
centre rduite.
Pour = 5%, on a :
t:975 = 1:96
et comme :
t =fA fBr
fA (1 fA)nA
+fB (1 fB)
nB= 4:77
on rejette donc lhypothse nulle H0 95% (et mme 99:98%), cest dire,
les deux rgions A et B ont des opinions direntes.
2. Test dindpendance du Khi-deux :La rpartition observe est :
Tableau des effectifs observes
RegionOpinion favorable non favorable Total
Region A 630 1170 1800
Region B 150 450 600
Total 780 1620 2400
Testons, au seuil , lhypothse nulle :
H0 : les rgions A et B ont la mme opinion
38
Tests dHypothses A. El Mossadeq
Calculons, sous cette hypothse, la rpartition thorique :
Tableau des effectifs theoriques
RegionOpinion favorable non favorable Total
Region A 585 1215 1800
Region B 195 405 600
Total 780 1620 2400
Sous lhypothse nulle H0, la quantit :
2 =
2Xi=1
2Xj=1
(oij tij)2tij
est une ralisation dune variable du Khi-deux :
(2 1) (2 1) = 1degr de libert.
Pour = 5%, on a :
21;:95 = 3:84
comme :
2 =
2Xi=1
2Xj=1
(oij tij)2tij
= 20:51
On rejette alors H0 95% (et mme 99:5%), cest dire, les deux rgions
ont des opinions direntes quant au produit considr.
39
A. El Mossadeq Tests dHypothses
Exercice 4Dans un groupe de 200 malades atteints du cancer du col de lutrus, un traite-ment par application locale du radium a donn 50 gurisons.Un autre groupe de 150 sujets atteints de la mme maladie a t trait parchirurgie, on a trouv 54 gurisons.Que peut-on conclure ?
Solution 4Cet exercice peut tre trair soit par un test de comparaison de deux frquencessoit par un test dindpendance du Khi-deux.
1. Test de comparaison de deux frquences :Ici on :
n1 = 200 ; f1 = 0:25
n2 = 150 ; f2 = 0:36
Testons, au seuil , lhypothse nulle :
H0 : les deux traitements sont quivalents
Sous cette hypothse, la quantit :
t =f1 f2r
f1 (1 f1)n1
+f2 (1 f2)
n2
peut tre considre comme une ralisation dune variable alatoire normale
centre rduite.
Pour = 5%, on a :
t:975 = 1:96
et comme :
t =f1 f2r
f1 (1 f1)n1
+f2 (1 f2)
n2
= 2:12
40
Tests dHypothses A. El Mossadeq
on rejette donc lhypothse nulle H0 95%, cest dire, les deux mthodes
ne sont pas quivalentes.
2. Test dindpendance du Khi-deux :La rpartition observe est :
Tableau des effectifs observees
TraitementResultat gueri non gueri Total
radium 50 150 200
chirurgie 54 96 150
Total 104 246 350
Testons, au seuil , lhypothse nulle :
H0 : les deux traitements sont quivalents
Calculons, sous cette hypothse, la rpartition thorique :
Tableau des effectifs theoriques
TraitementResultat gueri non gueri Total
radium 59:4 140:6 200
chirurgie 44:6 105:4 150
Total 104 246 350
Sous lhypothse nulle H0, la quantit :
41
A. El Mossadeq Tests dHypothses
2 =
2Xi=1
2Xj=1
(oij tij)2tij
est une ralisation dune variable du Khi-deux :
(2 1) (2 1) = 1degr de libert.
Pour = 5%, on a :
21;:95 = 3:84
Et comme :
2 =
2Xi=1
2Xj=1
(oij tij)2tij
= 4:94
On rejette alors H0 95% , cest dire, les deux traitements ne sont pas
quivalents.
Exercice 5Aux guichets dune gare parisienne, sur les 350 billets vendus vendredi aprs-midi,95 taient des billets de 1ere classe. Sur les 250 billets vendus la matine du lundisuivant, 55 taient de 1ere classe.Peut-on considrer quil y a une dirence entre les proportions de vente deparcours en 1ere classe pour les ns et dbuts de semaines ?
Solution 5Cet exercice peut tre trair soit par un test de comparaison de deux frquencessoit par un test dindpendance du Khi-deux.
42
Tests dHypothses A. El Mossadeq
1. Test de comparaison de deux frquences :Ici on : 8>>>>>:
n1 = 350 ; f1 =19
70
n2 = 250 ; f2 =11
50Testons, au seuil , lhypothse nulle :
H0 : les taux de billets de 1ere classe vendus en net dbut de semaines sont identiques
Sous cette hypothse, la quantit :
t =f1 f2r
f1 (1 f1)n1
+f2 (1 f2)
n2
peut tre considre comme une ralisation dune variable normale centre
rduite.
Pour = 5%, on a :
t:975 = 1:96
et comme :
t =f1 f2r
f1 (1 f1)n1
+f2 (1 f2)
n2
= 1:45
on accepte donc lhypothse nulle H0 au seuil 5%, cest dire, les taux de
billets de parcours en 1ere classe vendus en ns et dbuts de semaines sont
identiques et quon peut estimer par :
f =n1f1 + n2f2n1 + n2
= 0:25
43
A. El Mossadeq Tests dHypothses
2. Test dindpendance du Khi-deux :La rpartition observe est :
Tableau des effectifs observees
jourClasse 1ere classe 2ere classe Total
V endredi A:M 95 255 350
Lundi matin 55 195 250
Total 150 450 600
Testons, au seuil , lhypothse nulle :
H0 : les taux de billets de parcours en 1ere classe vendus en net dbut de semaines sont identiques
Calculons, sous cette hypothse, la rpartition thorique :
Tableau des effectifs theoriques
JourClasse 1ere classe 2ere classe Total
V endredi A:M 87:5 262:5 350
Lundi matin 62:5 187:5 250
Total 150 450 600
44
Tests dHypothses A. El Mossadeq
Sous lhypothse nulle H0, la quantit :
2 =
2Xi=1
2Xj=1
(oij tij)2tij
est une ralisation dune variable du Khi-deux :
(2 1) (2 1) = 1degr de libert.
Pour = 5%, on a :
21;:95 = 3:84
Et comme :
2 =
2Xi=1
2Xj=1
(oij tij)2tij
= 2:06
On accepte alors H0 au seuil = 5% , cest dire, les taux de billets de
parcours en 1 ere classe vendus en ns et dbuts de semaines sont identiques.
Exercice 6Un chantillon de taille n a donn lieu au calcul dune frquence observe fcorrespondant lintervalle de conance [0:22 0:34] au seuil = 5%.1. Calculer n.
2. Par rapport la proportion p = 0:3, lcart entre f et p est-il signicatif au
seuil = 5% ?
3. Dterminer lintervalle de conance de jf pj au seuil = 5%.
45
A. El Mossadeq Tests dHypothses
Solution 61. Au seuil , lintervalle de conance correspondant une frquence f observe
sur un chantillon de taille n est dni par :"f t1=2
rf (1 f)
n; f + t1=2
rf (1 f)
n
#On en dduit : 8>>>>>>>:
f =0:22 + 0:34
2
n = t21=2f (1 f)(f 0:22)2
Pour = 5%, on a :
t0:975 = 1:96
on obtient alors : f = :28
n = 215
2. Testons, au seuil , lhypothse nulle :
H0 : lcart nest pas singicatif
Sous cette hypothse, la quantit :
t =f prp (1 p)
n
peut tre considre comme une ralisation dune variable alatoire normale
centre rduite.
On a :
t =f prp (1 p)
n= 0:64
46
Tests dHypothses A. El Mossadeq
Pour = 5%, on a :
t:975 = 1:96
on accepte donc lhypothse nulle H0 au seuil = 5%.
3. Au seuil :
f prp (1 p)
n
2 t1=2; t1=2donc, au seuil :
jf pj 2"0; t1=2
rp (1 p)
n
#Pour = 5%, on a :
t:975 = 1:96
do :
jf pj 2 [0; 0:06]
Exercice 7Ltude du taux de dfectuosits arentes aux caractristiques de traitementsthermiques dune mme pice, traite par deux fours dirents, a donn lieu auxrsultats suivants :* Pour le premier four, 20 pices dfectueuses sur un chantillon de 200 picestraites.* Pour le second four, 120 pices dfectueuses sur un chantillon de 800 picestraites.Que peut-on conclure ?
47
A. El Mossadeq Tests dHypothses
Solution 7Ici on : 8
Tests dHypothses A. El Mossadeq
1. Quelle est la taille n de lchantillon.
2. Par rapport la proportion p = 0:4, lcart entre f et p est-il signicatif au
seuil = 5% ?
3. Dterminer lintervalle de conance de jf pj au seuil = 5%.
Solution 81. Au seuil , lintervalle de conance correspondant une frquence f observe
sur un chantillon de taille n est dni par :"f t1=2
rf (1 f)
n; f + t1=2
rf (1 f)
n
#On en dduit : 8>>>>>>>:
f =0:35 + 0:43
2
n = t21=2f (1 f)(f 0:35)2
Pour = 5%, on a :
t0:975 = 1:96
on obtient alors : 8
A. El Mossadeq Tests dHypothses
peut tre considre comme une ralisation dune variable alatoire normale
centre rduite.
On a :
t =f prp (1 p)
n= 0:49
Pour = 5%, on a :
t:975 = 1:96
On accepte donc lhypothse nulle H0 au seuil = 5%.
3. Au seuil :f prp (1 p)
n
2 t1=2; t1=2donc, au seuil :
jf pj 2"0; t1=2
rp (1 p)
n
#Pour = 5%, on a :
t:975 = 1:96
do :
jf pj 2 [0; 0:04]
Exercice 9Parmi 470 sujets exposs une infection, 370 nayant pas t immuniss.Parmi ces derniers, 140 contractent la malidie ainsi que 25 sujets immuniss.Le traitement donne-t-il une protection signicative ?
50
Tests dHypothses A. El Mossadeq
Solution 9Soient f1 la frquence de contracter la maladie pour un sujet non immunis etf2 la frquence de contracter la maladie pour un sujet immunis.Ici on : 8>>>>>:
n1 = 370 et f1 =14
37
n2 = 100 et f2 =1
4Testons, au seuil , lhypothse nulle :
H0 : le traitements nest pas e cace
Sous cette hypothse, la quantit :
t =f1 f2r
f1 (1 f1)n1
+f2 (1 f2)
n2peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.Pour = 5%, on a :
t:975 = 1:96
et comme :
t =f1 f2r
f1 (1 f1)n1
+f2 (1 f2)
n2
= 2:56
On rejette donc lhypothse nulle H0 95%, cest dire, le traitement donneune protection signicative.
51
A. El Mossadeq Tests dHypothses
Exercice 10La taille de 1200 conscrits du bureau de recrutement X a pour moyenne X =172 cm et pour cart-type sX = 6 cm:Les mmes mesures eectues sur les 250 conscrits du bureau de recrutement Yont donn pour moyenne Y = 170 cm et pour cart-type sY = 5 cm:Que peut-on conclure ?
Solution 10Testons au seuil lhypothse nulle :
H0 : les conscrits des bureaux de recrutement X et Y ont la mme taille
Sous lhypothse nulle H0, la quantit :
t =X Yss2Xn1+s2Yn2
peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.Pour = 5%, on a :
t:975 = 1:96
Et comme :
t =X Yss2Xn1+s2Yn2
= 5:547
On rejette alors lhypothse nulle H0 95% (mme 99%), cest dire, lesconscrits des bureaux de recrutement X et Y ont des tailles moyennes direntes.
52
Tests dHypothses A. El Mossadeq
Exercice 11On se propose de comparer le poids la naissance chez une srie de primapares(srie 1) et une srie de multipares (srie 2) :
Serie 1 : n1 = 95 m1 = 3197 g s21 = 210100 g
2
Serie 2 : n2 = 105 m2 = 3410 g s22 = 255400 g
2
Que peut-on conclure ?
Solution 11Testons au seuil lhypothse nulle :
H0 : les primapares et les multipares ont le mme poids moyen la naissance
Sous lhypothse nulle H0, la quantit :
t =m1 m2ss21n1+s22n2
peut tre considre comme une ralisation dune variable alatoire normale cen-tre rduite.Pour = 5%, on a :
t:975 = 1:96
Et comme :
t =m1 m2ss21n1+s22n2
= 3:1256On rejette alors lhypothse nulle H0, 95% (mme 99%), cest dire, lesprimapares et les multipares nont pas le mme poids moyen la naissance.
53
A. El Mossadeq Tests dHypothses
Exercice 12Chez cent sujet normaux, on dose lacide urique, les rsultats sont :8
Tests dHypothses A. El Mossadeq
Exercice 13On admet que la valeur moyenne de la glycmie du sujet normal est 1 g= l.Sur 17 sujets, on a trouv une moyenne de :965 g= l et un cart-type estim de:108 g= l.Cette valeur peut-elle tre considre comme dirente du taux normal ?
Solution 13Testons au seuil , lhypothse nulle :
H0 : "la valeur est normale"
Sous cette hypothse, la quantit :
t =m spn
est une ralisation de la variable alatoire Tn1 de Student :
n 1 = 16degrs de libert.Pour = 5%, on a :
t16;:975 = 2:12
et comme :
t =m spn
= 1:3362on accepte lhypothse nulle H0 au seuil = 5%, cest dire, la valeur estnormale.
55
A. El Mossadeq Tests dHypothses
Exercice 14Dans un chantillon de 17 prmaturs, la moyenne du Na-plasmatique est :8
Tests dHypothses A. El Mossadeq
Calculons maintenant lestimation commune s2 de cette variance :
s2 =(n1 1) s21 + (n2 1) s22
n1 + n2 2
= 66:42
et testons lhypothse nulle :
H0 : "les prmaturs et les dysmaturs ont la mme moyenne du Na-plasmatique"
Sous cette hypothse, la quantit :
t =m1 m2s
r1
n1+1
n2
est une ralisation de la variable alatoire de Student :
n1 + n2 2 = 40degrs de libert.Pour = 5%, on a :
t40;:975 = 2:02
Et comme :
t =m1 m2s
r1
n1+1
n2
= 1:17On accepte lhypothse nulle H0 au seuil = 5%, cest dire, les prmaturset les dysmaturs ont la mme moyenne du Na-plasmatique estime par :
m =n1m1 + n2m2n1 + n2
= 134:79
57
A. El Mossadeq Tests dHypothses
Exercice 15Lorquune machine est bien rgle, elle produit des pices dont le diamtre Dest une variable gaussienne de moyenne 25mm.Deux heures aprs le rglage de la machine, on a prlev au hasard neuf pices.Leurs diamtres ont pour mesure en mm :
22 23 21 25 24 23 22 26 21
Construire 95% puis 99% les intervalles de conance de la moyenne et de lavariance.Que peut-on conclure quant la qualit du rglage aprs deux heures de fonc-tionnement de la machine ?
Solution 15Calculons dabord les estimations m et s2 de la moyenne et de la variance surcet chantillon de taille n = 9.On a :
m =1
n
nXi=1
xi = 23mm
et :
s2 =1
n 1nXi=1
(xi m)2 = 3mm2
Testons lhypothse nulle :
H0 : "la machine est bien rgle"
Sous lhypothse nulle H0, la quantit :
t =m spn
est une ralisation dune variable alatoire de Student :
n 1 = 8degrs de libert : T8.
58
Tests dHypothses A. El Mossadeq
Pour = 5%, on a :
t8;:975 = 2:31
et comme :
t =m spn
= 3:4641
On rejette lhypothse nulle H0 95% (mme 99%), cest dire, le rglagede la machine est rompu.
Exercice 16On eectue un dosage par deux mthodes direntes A et B.On obtient les rsultats suivants :
Methode A :6 :65 :7 :7 :7 :7 :75 :8 :8
Methode B :6 :6 :65 :65 :7 :6 :75 :8 :8
Peut-on considrer que les deux mthodes sont quivalentes ?
Solution 16Calculons les estimations
m1; s
21
de1;
21
etm2; s
22
de2;
22
:8>>>>>>>:
m1 =1
9
9Xi=1
x1i = :71
s21 =1
8
9Xi=1
(x1i m1)2 = :004
et : 8>>>>>>>:m2 =
1
9
9Xi=1
x2i = :68
s22 =1
8
9Xi=1
(x2i m2)2 = :007
59
A. El Mossadeq Tests dHypothses
Testons dabord, au seuil = 5%, lhypothse nulle dgalit des variances desdeux mthodes de dosage.Sous cette hypothse, la quantit :
f =s22s21
est une ralisation dune variable alatoire de Fisher :
(n2 1; n1 1) = (8; 8)degrs de libert.Pour = 5%, on a :
F8;8;:95 = 4:43
et comme :
f =s22s21
= 1:75
On accepte donc lhypothse dgalit des variances des deux populations.Calculons maintenant lestimation commune s2 de cette variance :
s2 =(n1 1) s21 + (n2 1) s22
n1 + n2 2
= 0:0055
et testons lhypothse nulle :
H0 : "les deux mthodes de dosage sont quivalentes:"
Sous cette hypothse, la quantit :
t =m1 m2s
r1
n1+1
n2
60
Tests dHypothses A. El Mossadeq
est une ralisation de la variable alatoire de Student :
n1 + n2 2 = 16degrs de libert.Pour = 10%, on a :
t16;:95 = 2:12
et comme :
t =m1 m2s
r1
n1+1
n2
= 0:86
on accepte lhypothse nulle H0 au seuil = 5%, cest dire, les deux mthodesde dosage sont quivalentes.
Exercice 17Dans deux types de forts, on a mesur les hauteurs de treize et quatorze peuple-ments choisis au hasard et indpendamment dans le but de vrier si les hauteursde ces deux types darbres sont ou ne sont pas gales.Les rsultats sont les suivants :
Type 1 : 22:5 22:9 23:7 24:0 24:4 24:5 26:0
26:2 26:4 26:7 27:4 28:6 28:7
Type 2 : 23:4 24:4 24:6 24:9 25:0 26:2 26:3
26:8 26:8 26:9 27:0 27:6 27:7 27:8
On admet que les hauteurs de ces deux types darbres sont des variables gaussi-ennes N 1; 21 et N 2; 22.Que peut-on conclure ?
61
A. El Mossadeq Tests dHypothses
Solution 17Calculons les estimations
m1; s
21
de1;
21
etm2; s
22
de2;
22
:8>>>>>>>:
m1 =1
13
13Xi=1
x1i = 25:538
s21 =1
12
13Xi=1
(x1i m1)2 = 4:1576
et : 8>>>>>>>:m2 =
1
14
14Xi=1
x2i = 26:1
s22 =1
13
14Xi=1
(x2i m2)2 = 1:9431
Testons dabord, au seuil = 5%, lhypothse nulle dgalit des variances deshauteurs des deux types darbres.Sous cette hypothse, la quantit :
f =s21s22
est une ralisation dune variable alatoire de Fisher :
(n1 1; n2 1) = (12; 13)degrs de libert.
Pour = 5%, on a :
F12;13;:975 = 3:15
et comme :
f =s21s22
= 2:1398
on accepte donc lhypothse dgalit des variances des hauteurs des deux typesdarbres.
62
Tests dHypothses A. El Mossadeq
Calculons maintenant lestimation commune s2 de cette variance :
s2 =(n1 1) s21 + (n2 1) s22
n1 + n2 2= 3:0062
et testons lhypothse nulle :
H0 : "les deux types darbres ont la mme hauteur"
Sous cette hypothse, la quantit :
t =m1 m2s
r1
n1+1
n2est une ralisation de la variable alatoire de Student :
n1 + n2 2 = 25degrs de libert.
Pour = 5%, on a :
t25;:975 = 2:06
et comme :
t =m1 m2s
r1
n1+1
n2= 0:84155
on accepte lhypothse nulle H0 au seuil = 5%, cest dire, les deux typesdarbres ont la mme hauteur moyenne estime par :
m =n1m1 + n2m2n1 + n2
= 25:829
63
A. El Mossadeq Tests dHypothses
Exercice 18On considre deux varits de masM1 etM2 dont les rendements sont des vari-ables alatoires gaussiennes N 1; 21 et N 2; 22.An de comparer les rendements de ces deux varits de mas, on a choisi decultiver dans neuf stations direntes des parcelles voisines encemences de luneou lautre des deux varits. On a observ les rendements suivants :
Station 1 2 3 4 5 6 7 8 9
V ariete 1 39:6 32:4 33:1 27 36 32 25:9 32:4 33:2
V ariete 2 39:2 33:1 32:4 25:2 33:1 29:5 24:1 29:2 34:1
Que peut-on conclure ?
Solution 18Calculons les estimations
m1; s
21
de1;
21
etm2; s
22
de2;
22
:8>>>>>>>>>>>:
m1 =1
13
13Xi=1
x1i = 32:4
s21 =1
12
13Xi=1
(x1i m1)2 = 17:188
et : 8>>>>>>>>>>>:m2 =
1
14
14Xi=1
x2i = 31:1
s22 =1
13
14Xi=1
(x2i m2)2 = 21:785
64
Tests dHypothses A. El Mossadeq
Testons dabord, au seuil = 5%, lhypothse nulle dgalit des variances desrendements des deux varits de mas.Sous cette hypothse, la quantit :
f =s22s21
est une ralisation dune variable alatoire de Fisher :
(n2 1; n1 1) = (8; 8)degrs de libert.Pour = 10%, on a :
F8;8;:975 = 4:43
et comme :
f =s22s21
= 1:2675
On accepte donc lhypothse dgalit des variances des hauteurs des deux typesdarbres.Calculons maintenant lestimation commune s2 de cette variance :
s2 =(n1 1) s21 + (n2 1) s22
n1 + n2 2=
s21 + s22
2= 19:4865
et testons lhypothse nulle :
H0 : "les deux varits de mas ont le mme rendement"
Sous cette hypothse, la quantit :
t =m1 m2s
r1
n1+1
n2
65
A. El Mossadeq Tests dHypothses
est une ralisation de la variable alatoire de Student :
n1 + n2 2 = 16degrs de libert.Pour = 5%, on a :
t16;:975 = 2:12
et comme :
t =m1 m2s
r1
n1+1
n2
= :42892
on accepte lhypothse nulle H0 au seuil = 5%, cest dire, les deux varitsde mas ont le mme rendement moyen estim par :
m =n1m1 + n2m2n1 + n2
= 31:75
Exercice 19Le relev des tempratures journalires minimales de deux stations S1 et S2, aucours de neuf journes conscutives a fourni les valeurs suivantes en C:
Station 1 12 8 9 10 11 13 10 7 10
Station 2 7 11 10 6 8 11 12 9 7
On admet que la distribution des tempratures journalires minimales des deuxstations S1 et S2 sont des variables gaussiennes N
1;
21
et N 2; 22.
1. Dterminer les estimations des moyennes et des variances des tempratures
journalires minimales des deux stations S1 et S2.
66
Tests dHypothses A. El Mossadeq
2. Construire, au seuil = 5%, les intervalles de conance de ces estimations.
3. Peut-on admettre, au seuil = 5%, lhypothse selon laquelle les tempratures
journalires minimales moyennes des deux stations S1 et S2 sont identiques ?
Solution 191. Calculons les estimations
m1; s
21
de1;
21
etm2; s
22
de2;
22
.
On a : 8>>>>>>>>>>>:m1 =
1
9
11Xi=1
x1i = 10C
s21 =1
8
11Xi=1
(x1i m1)2 = 3:5
et : 8>>>>>>>>>>>:m2 =
1
9
10Xi=1
x2i = 9C
s22 =1
8
10Xi=1
(x2i m2)2 = 4:5
(a) Lintervalle de conance de 1 1 est dni par :m1 tn1;1=2 s1p
n;m1 + tn1;1=2
s1pn
Pour = 5%, on a :
t8;:975 = 2:31
do lintervalle :
[8:56 C; 11:44 C]
67
A. El Mossadeq Tests dHypothses
(b) Lintervalle de conance de 21 1 est dni par :"(n 1) s212n1;1=2
;(n 1) s212n1;=2
#Pour = 5%, on a : 8
Tests dHypothses A. El Mossadeq
2. Testons dabord, au seuil = 5%, lhypothse nulle dgalit des variances
des tempratures journalires minimales des deux stations S1 et S2.
Sous cette hypothse, la quantit :
f =s22s21
est une ralisation dune variable alatoire de Fisher :
(n2 1; n1 1) = (8; 8)degrs de libert.
Pour = 5%, on a :
F8;8;:975 = 4:43
et comme :
f =s22s21
= 1:29
On accepte donc lhypothse dgalit des variances.
Calculons maintenant lestimation commune s2 de cette variance :
s2 =(n1 1) s21 + (n2 1) s22
n1 + n2 2
=s21 + s
22
2
= 4
et testons lhypothse nulle :
H0 : les tempratures journalires minimales moyennesdes deux stations S1 et S2.sont identiques
69
A. El Mossadeq Tests dHypothses
Sous cette hypothse, la quantit :
t =m1 m2s
r1
n1+1
n2est une ralisation de la variable alatoire de Student :
n1 + n2 2 = 16degrs de libert.
Pour = 5%, on a :
t16;:95 = 2:12
et comme :
t =m1 m2s
r1
n1+1
n2
= 1:0607
On accepte lhypothse nulle H0 au seuil = 5%, cest dire, les tem-
pratures journalires minimales moyennes des deux stations S1 et S2.sont
identiques.
Cette temprature moyenne peut tre estime par :
m =n1m1 + n2m2n1 + n2
=m1 +m2
2= 9:5
70
Tests dHypothses A. El Mossadeq
Exercice 20On tudie leet dune substance sur la croissance dune tumeur gree.Les rsultats sont consigns sur le tableau ci-dessous donnant la surface de latumeur au 20eme jour aprs sa gree :
Surface 5:5 6 6:5 7 7:5 8
T emoins 1 2 3 8 4 3
Traites 4 4 8 3 1 1
Le traitement a-t-il un eet signicatif sur la surface tumorale ?On suppose que la surface tumorale est distribue selon des lois normalesN 1; 21et N 2; 22 chez les tmoins et les traits respectivement.Solution 20Calculons les estimations
m1; s
21
de1;
21
etm2; s
22
de2;
22
.
On a : 8>>>>>>>>>>>:m1 =
1
21
6Xi=1
n1ixi = 7
s21 =1
20
6Xi=1
n1i (xi m1)2 = :45
et : 8>>>>>>>>>>>:m2 =
1
21
6Xi=1
n2ixi = 6:4048
s22 =1
20
6Xi=1
n2i (xi m2)2 = :87972
Testons dabord, au seuil = 5%, lhypothse nulle dgalit des variances des
71
A. El Mossadeq Tests dHypothses
surfaces tumorales chez les populations des tmoins et des traits.Sous cette hypothse, la quantit :
f =s22s21
est une ralisation dune variable alatoire de Fisher :
(n2 1; n1 1) = (20; 20)degrs de libert.Pour = 5%, on a :
F20;20;:975 = 2:46
et comme :
f =s22s21
= 1:9549
on accepte donc lhypothse dgalit des variances des deux populations.Calculons maintenant lestimation commune s2 de cette variance :
s2 =(n1 1) s21 + (n2 1) s22
n1 + n2 2
= :66486
et testons lhypothse nulle :
H0 : "le traitement est sans eet sur la croissance
de la surface tumorale"
Sous cette hypothse, la quantit :
t =m1 m2s
r1
n1+1
n2
72
Tests dHypothses A. El Mossadeq
est une ralisation de la variable alatoire de Student :
n1 + n2 2 = 40degrs de libert.Pour = 5%, on a :
t40;:99 = 2:02
et comme :
t =m1 m2s
r1
n1+1
n2
= 2:831
On rejette lhypothse nulle H0 95% (et mme 98%), cest dire, le traite-ment a une inuence sur la croissance de la surface tumorale.
Exercice 21De nombreuses observations cliniques ont montr que jusque l :
30% des malades atteints de M ont une survie infrieure un an 50% ont une survie entre un an et deux ans 10% ont une survie entre deux ans et cinq ans 10% ont une survie suprieure cinq ans.
On applique un nouveau traitement 80 malades atteint de la maladie M et onconstate :
12 ont une survie infrieure un an 56 ont une survie entre un an et deux ans 8 ont une survie entre deux ans et cinq ans 4 ont une survie suprieure cinq ans.
Que peut-on conclure ?
Solution 21Testons, au seuil , lhypothse nulle :
H0 : le nouveau traitement nest pas actif contre la maladie M
73
A. El Mossadeq Tests dHypothses
Sous cette hypothse, on a les rpartitions :
SurvieRepartition
Observee
Repartition
Theorique
survie 1 an 12 24
1 an < survie 2 ans 56 40
2 an < survie 5 ans 8 8
survie > 5 ans 4 8
Total 80 80
Sous lhypothse nulle H0, la quantit :
2 =
4Xi=1
(oi ti)2ti
est une ralisation dune variable du Khi-deux :
4 1 = 3degrs de libert.Pour = 5%, on a :
23;:95 = 7:81
Et comme :
2 =
2Xi=1
(oi ti)2ti
= 14:4
on rejette donc lhypothse nulle H0 95% (mme 99:5%), cest dire, qu99:5%, le nouveau traitement est actif contre la maladie M.
74
Tests dHypothses A. El Mossadeq
Exercice 22Le tableau ci-aprs concerne le nombre annuel de cyclones tropicaux ayant at-teint la cte orientale des Etats-Unis entre 1887 et 1956 :
Nombre annuel de cyclones Nombre d0annees
0 1
1 6
2 10
3 16
4 19
5 5
6 8
7 3
8 1
9 1
> 9 0
Peut-on admettre, au seuil = 5%, que ce nombre annuel de cyclones est unevariable de Poisson ?
75
A. El Mossadeq Tests dHypothses
Solution 22Testons, au seuil , lhypothse nulle :
H0 : le nombre annuel de cyclones est une variable de Poisson
Calculons une estimation ponctuelle du paramtre de cette loi :
P [X = k] =k
k!exp
o X est la variable alatoire reprsentant le nombre annuel de cyclones.
On sait que :
^ =1
n
nXi=1
Xi
est un estimateur sans biais et convergent de .
Une estimation ponctuelle ~ de est donne par :
~ =1
70
9Xi=0
ini
= 3:7286
Leectif thorique tk, k 0, reprsentant le nombre dannes k cyclones estdonn par :
tk = nP [X = k]
Do les rpartitions :
76
Tests dHypothses A. El Mossadeq
Nombre annuel
de cyclonesEffectifs observes Effectifs theoriques
0 1 1:68
1 6 6:27
2 10 11:69
3 16 14:53
4 19 13:54
5 5 10:1
6 8 6:28
7 3 3:34
8 1 1:56
9 1 0:65
> 9 0 0:36
Total 70 70
On constate que le tableau contient des eectifs thoriques strictement infrieurs 5, ce qui empche lutilisation dun test du khi-deux.On peut remdier cet tat en oprant le groupement logique :* des classes 0et 1dune part,* et des classes 7 et plusdautre part.Les tableaux des eectifs observs et thoriques deviennent :
77
A. El Mossadeq Tests dHypothses
Nombre annuel
de cyclonesEffectifs observes Effectifs theoriques
0 ou 1 7 7:95
2 10 11:69
3 16 14:53
4 19 13:54
5 5 10:10
6 8 6:28
7 5 5:91
Total 70 70
Sous lhypothse nulle H0, la quantit :
2 =
7Xi=1
(oi ti)2ti
est une ralisation dune variable du Khi-deux :
7 1 1 = 5degrs de libert.puisque pour calculer les eectifs thoriques, nous avons utilislestimation, et non la valeur rel, du paramtre de la loi de Poisson.Pour = 5%, on a :
25;:95 = 5:8948
78
Tests dHypothses A. El Mossadeq
Et comme :
2 = 5:81
On accepte alors H0 au seuil = 5%, cest dire, le nombre annuel de cyclonespeut tre ajust par une loi de Poisson dont le paramtre est estim par :
~ = 3:7286
Exercice 23On veut savoir si la russite (R) dun traitement est indpendantes du niveauxde la tension artrielle du malade (T ).On dispose pour cela de 250 observations rparties comme suit :
TR echec succes
basse 21 104
elevee 29 96
Que peut-on conclure ?
Solution 23La rpartition observe est :
Tableau des effectifs observees
TR Echec Succes Total
Basse 21 104 125
Elevee 29 96 125
Total 50 200 250
79
A. El Mossadeq Tests dHypothses
Testons, au seuil , lhypothse nulle :
H0 : "la russite du traitement est indpendante du niveau de la tension artrielle"
Calculons, sous cette hypothse, la rpartition thorique :
Tableau des effectifs theoriques
TR Echec Succes Total
Basse 25 100 125
Elevee 25 100 125
Total 50 200 250
Sous lhypothse nulle H0, la quantit :
2 =
2Xi=1
2Xj=1
(oij tij)2tij
est une ralisation dune variable du Khi-deux :
(2 1) (2 1) = 1degr de libert.Pour = 5%, on a :
21;:95 = 3:84
Et comme :
2 =
2Xi=1
2Xj=1
(oij tij)2tij
= 1:6
On accepte alors H0 au seuil = 5% , cest dire, la russite du traitement estindpendante du niveau de la tension artrielle.
80
Tests dHypothses A. El Mossadeq
Exercice 2475 enfants sont vus en consultation pour un asthme. On relve chez eux les deuxsymptmes suivants :* Intensit de la maladie asmathique : lgre , moyenne , forte* Existence ou absence dun eczma au moment de lobservation ou dans lepass.On peut classer les enfants selon la rpartition suivante :
EA fort moyen leger
present 8 2 2
passe 11 11 3
jamais 6 18 14
Peut-on considrer quil existe-t-il une association entre lintensit de lasthmeet lexistence dun eczma ?
Solution 24Le tableau de la rpartition observe est donne par :
Tableau des effectifs observees
EczemaAsthme fort moyen leger Total
present 8 2 2 12
passe 11 11 3 25
jamais 6 18 14 38
Total 25 31 19 75
81
A. El Mossadeq Tests dHypothses
Testons, au seuil , lhypothse nulle :
H0 : lintensit de lasthme est indpendante de lexistence dun eczma
Calculons, sous cette hypothse, la rpartition thorique.
Tableau des effectifs theoriques
EczemaAsthme fort moyen leger Total
present 4 4:96 3:04 12
passe 8:33 10:33 6:34 25
jamais 12:67 15:71 9:62 38
Total 25 31 19 75
Les eectifs thoriques sur la premire ligne sont strictement infrieurs cinq, cequi empche lapplication dun test du Khi-deux.On peut remdier cet tat enoprant le groupement logiquedes classes presentet passe.Les nouveaux tableaux des eectifs observs et thoriques, obtenus aprs re-groupement de ces deux classes sont donns ci-aprs.
Tableau des effectifs observees
EczemaAsthme fort moyen leger Total
present ou passe 19 13 5 37
jamais 6 18 14 38
Total 25 31 19 75
82
Tests dHypothses A. El Mossadeq
Tableau des effectifs theoriques
EczemaAsthme fort moyen leger Total
present ou passe 12:33 15:29 9:38 37
jamais 12:67 15:71 9:62 38
Total 25 31 19 75
Sous lhypothse nulle H0, la quantit :
2 =
2Xi=1
3Xj=1
(oij tij)2tij
est une ralisation dune variable du Khi-deux :
(2 1) (3 1) = 2degrs de libert.Pour = 5%, on a :
22;:95 = 5:99
Et comme :
2 =
2Xi=1
3Xj=1
(oij tij)2tij
= 11:84
On rejette alors H0 95% (mme 99:5%), cest dire, lintensit de lasthmedpend de lexistence dun eczma.
83
A. El Mossadeq Tests dHypothses
Exercice 25On veut savoir sil y a une liason entre la localisation (L) du cancer du poumon(priphrique , non priphrique) et le ct (C) de la lsion (poumon gauche ,poumon droit). Ltude a port sur 1054 malades :
LC gauche droit
peripherique 26 62
non peripherique 416 550
Que peut-on conclure ?
Solution 25La rpartition observe est donne par :
Tableau des effectifs observees
LC gauche droit Total
peripherique 26 62 88
non peripherique 416 550 966
Total 442 612 1054
Testons, au seuil , lhypothse nulle :
H0 : la localisation du cancer est indpendante du ct de la lsion
Calculons, sous cette hypothse, la rpartition thorique.
84
Tests dHypothses A. El Mossadeq
Tableau des effectifs theoriques
LC gauche droit Total
peripherique 36:9 51:1 88
nonperipherique 405:1 560:9 966
Total 442 612 1054
Sous lhypothse nulle H0, la quantit :
2 =
2Xi=1
2Xj=1
(oij tij)2tij
est une ralisation dune variable du Khi-deux :
(2 1) (2 1) = 1degr de libert.Pour = 5%, on a :
21;:95 = 3:84
Et comme :
2 =
2Xi=1
2Xj=1
(oij tij)2tij
= 6:05
On rejette alorsH0 95% (mme 97:5%), cest dire, la localisation du cancerdpend du ct de la lsion.
85
A. El Mossadeq Tests dHypothses
Exercice 26On suppose pouvoir classer les malades atteints dune maladie M en trois cat-gories cliniques : A ; B ; C:On se demande si ces trois catgories dirent par leurs survies un an.Les eectifs observs sont les suivants :
SurvieCategorie A B C
survie a un an 5 20 45
deces avant un an 15 50 145
Que peut-on conclure ?
Solution 26La rpartition observe est :
Tableau des effectifs observees
SurvieCategorie A B C Total
Survie a un an 5 20 45 70
Deces avant un an 15 50 145 210
Total 20 70 190 280
Testons, au seuil , lhypothse nulle :
H0 : la survie un an est indpendante de la catgorie clinique
Calculons, sous cette hypothse, la rpartition thorique.
86
Tests dHypothses A. El Mossadeq
Tableau des effectifs theoriques
SurvieCategorie A B C Total
Survie a un an 5 17:5 47:5 70
Deces avant un an 15 52:5 142:5 210
Total 20 70 190 280
Sous lhypothse nulle H0, la quantit :
2 =
2Xi=1
3Xj=1
(oij tij)2tij
est une ralisation dune variable du Khi-deux :
(2 1) (3 1) = 2degrs de libert.
Pour = 5%, on a :
22;:95 = 5:99
Et comme :
2 =
2Xi=1
3Xj=1
(oij tij)2tij
= 0:65
On accepte alors H0 au seuil = 5% , cest dire, la survie un an estindpendante de la catgorie clinique.
87
A. El Mossadeq Tests dHypothses
Exercice 27Sur un chantillon de 84 prmaturs, on cherche sil existe une liaison entre lasurvenue dune hypoglycmie et la survenue dun ictre :
sur 43 enfants nayant pas dictre, 23 sont hypoglycmiques
sur 20 enfants ayant un ictre modr, 6 sont hypoglycmiques
sur 21 enfants ayant un ictre intense, 4 sont hypoglycmiquesQue peut-on conclure ?
Solution 27La rpartition observe est donne dans le tableau :
Tableau des effectifs observees
IctereHypoglycemie hypoglycemique non hypoglycemique Total
pas d0ictere 23 20 43
ictere modere 6 14 20
ictere intense 4 17 21
Total 33 51 84
Testons, au seuil , lhypothse nulle :
H0 : la survenue dune hypoglycmie est indpendante de la survenue dun ictre
Calculons, sous cette hypothse, la rpartition thorique.
88
Tests dHypothses A. El Mossadeq
Tableau des effectifs theoriques
IctereHypoglycemie hypoglycemique non hypoglycemique Total
pas d0ictere 16:89 26:11 43
ictere modere 7:86 12:14 20
ictere intense 8:25 12:75 21
Total 33 51 84
Sous lhypothse nulle H0, la quantit :
2 =
2Xi=1
2Xj=1
(oij tij)2tij
est une ralisation dune variable du Khi-deux :
(3 1) (2 1) = 2degrs de libert.
Pour = 5%, on a :
22;:95 = 5:99
Et comme :
2 =
3Xi=1
2Xj=1
(oij tij)2tij
= 7:97
On rejette alors H0 95% (mme 97:5%), cest dire, la survenue dunehypoglycmie dpend de la survenue dun ictre.
89
A. El Mossadeq Tests dHypothses
Exercice 28Une tude statistique relative aux rsultats dadmission du concours dune grandecole fait ressortir la rpartition des admis selon la profession des parents lorsquecelle-ci est connue :
Profession des Parents Candidats Admis
Fontionnaires et Assimiles 2224 180
Commerce et Industrie 998 89
Professions Liberales 575 48
Proprietaires Rentiers 423 37
Proprietaires Agricoles 287 13
Artisans 210 18
Banques et Assurances 209 17
1. La profession des parents a-t-elle une inuence sur laccs cette cole ?
2. Cette conclusion persiste-t-elle lorsquon tient compte pour complter la sta-
tistique prcdente de 961 candidats dont lorigine socio-professionnelle est
inconnue et qui ont obtenus 43 succs ?
Solution 281. La rpartition observe est :
90
Tests dHypothses A. El Mossadeq
Tableau des effectifs observees
Profession des Parents Candidats Admis Non admis
Fontionnaires et Assimiles 2224 180 2044
Commerce et Industrie 998 89 899
Professions Liberales 575 48 527
Proprietaires Rentiers 423 37 386
Proprietaires Agricoles 287 13 274
Artisans 210 18 192
Banques et Assurances 209 17 192
Total 4916 402 4514
Testons, au seuil , lhypothse nulle :
H0 : laccs lEcole est indpendant de la profession des parents
Calculons, sous cette hypothse, la rpartition thorique.
Le tableau de cette rpartition est donne ci-aprs.
Sous lhypothse nulle H0, la quantit :
2 =
7Xi=1
2Xj=1
(oij tij)2tij
91
A. El Mossadeq Tests dHypothses
Tableau des effectifs theoriques
Profession des Parents Candidats Admis Non admis
Fontionnaires et Assimiles 2224 181:9 2042:1
Commerce et Industrie 998 80:8 907:2
Professions Liberales 575 47 528
Proprietaires Rentiers 423 34:6 388:4
Proprietaires Agricoles 287 23:5 263:5
Artisans 210 17:2 192:8
Banques et Assurances 209 17:1 191:9
Total 4916 402 4514
est une ralisation dune variable du Khi-deux :
(7 1) (2 1) = 6degrs de libert.
Pour = 5%, on a :
26;:95 = 12:6
Et comme :
2 =
2Xi=1
3Xj=1
(oij tij)2tij
= 6:28
92
Tests dHypothses A. El Mossadeq
On accepte alors H0 au seuil = 5% , cest dire, laccs lEcole est
indpendant de la profession des parents.
2. Si lon tient compte des 961 candidats dont lorigine socio-professionnelle est
inconnue et qui ont obtenus 43 succs, la rpartition observe et la rparti-
tion thorique, sous la mme hypothse nulle, deviennent comme consogns
ci-aprs.
Tableau des effectifs observees
Profession des Parents Candidats Admis Non admis
Fontionnaires et Assimiles 2224 180 2044
Commerce et Industrie 998 89 899
Professions Liberales 575 48 527
Proprietaires Rentiers 423 37 386
Proprietaires Agricoles 287 13 274
Artisans 210 18 192
Banques et Assurances 209 17 192
Autres 961 43 918
Total 5877 445 5432
93
A. El Mossadeq Tests dHypothses
Tableau des effectifs theoriques
Profession des Parents Candidats Admis Non admis
Fontionnaires et Assimiles 2224 168:4 2055:6
Commerce et Industrie 998 74:8 913:2
Professions Liberales 575 43:5 531:5
Proprietaires Rentiers 423 32 391
Proprietaires Agricoles 287 21:7 265:3
Artisans 210 15:9 194:1
Banques et Assurances 209 15:8 193:2
Autres 961 72:8 888:2
Total 5877 445 5432
Sous lhypothse nulle H0, la quantit :
2 =
8Xi=1
2Xj=1
(oij tij)2tij
est une ralisation dune variable du Khi-deux :
(8 1) (2 1) = 7degrs de libert.
94
Tests dHypothses A. El Mossadeq
Pour = 5%, on a :
27;:95 = 14:1
Et comme :
2 =
2Xi=1
3Xj=1
(oij tij)2tij
= 22:5
On rejette alors H0 95% (mme 99:5%) , cest dire, laccs lEcole
dpend de la profession des parents.
Exercice 29Un mdicament essay sur 42 patients est contrl quant aux eets secondairesquil peut avoir sur le poids des malades. On peut considrer que :
quinze dentre eux ont maigri dix sept nont pas chang de poids dix ont grossi
En supposant que la maladie est sans eet sur les variations de poids, le mdica-ment a-t-il un eet signicatif sur le poids ?
Solution 29Testons, au seuil , lhypothse nulle :
H0 : le traitement est sans eet sur les variations du poids
Si le traitement est sans eet sur les variations du poids, alors ces variations sontdes seulement au hasard.La loi de probabilit est donc la loi uniforme, cest dire la probabilit de chaque
classe est la mme et est gale 1
3.
95
A. El Mossadeq Tests dHypothses
Do les rpartitions :
V ariations Repartition Observee Repartition Theorique
ont maigri 15 14
n0ont pas change 17 14
ont grossi 10 14
Total 42 42
Sous lhypothse nulle H0, la quantit :
2 =
3Xi=1
(oi ti)2ti
est une ralisation dune variable du Khi-deux :
3 1 = 2degrs de libert.
Pour = 5%, on a :
22;:95 = 5:99
Et comme :
2 =
2Xi=1
(oi ti)2ti
= 1:86
on accepte donc lhypothse nulle H0 au seuil = 5%, cest dire, le traite-ment est sans eet sur les variations du poids.
96
Tests dHypothses A. El Mossadeq
Exercice 30Pour tudier la densit de poussires dans un gaz, on a procd une sriedobservations de petits chantillons de gaz au moyen dun microscope.On a ainsi eectu 143 observations et les rsultats sont les suivants :
Nombre de particules
en suspension
Nombre d0echantillonsde gaz
0 34
1 46
2 38
3 19
4 4
5 2
> 5 0
Peut-on admettre, au seuil = 5%, que le nombre de particules en suspensionest une variable de Poisson ?
Solution 30Testons, au seuil , lhypothse nulle :
H0 : le nombre de particules en suspension est une variable de Poisson
Calculons une estimation ponctuelle du paramtre de cette loi :
P [X = k] =k
k!exp
o X est la variable alatoire reprsentant le nombre de particules en suspension.
97
A. El Mossadeq Tests dHypothses
On sait que :
^ =1
n
nXi=1
Xi
est un estimateur sans biais et convergent de .Une estimation ponctuelle ~ de est donne par :
~ =1
143
5Xi=0
ini
= 1:4336
Do les rpartitions :
Particules
en suspension
Repartition
observee
Repartition
theorique
0 34 34:1
1 46 48:9
2 38 35:0
3 19 16:7
4 4 06:0
5 2 01:7
> 5 0 00:6
Total 143 143
Leectif thorique tk, k 0, reprsentant le nombre particules en suspension kest donn par :
tk = nP [X = k]
98
Tests dHypothses A. El Mossadeq
On constate que le tableau contient des eectifs thoriques strictement infrieurs 5, ce qui empche lutilisation dun test du khi-deux.On peut remdier cet tat en oprant le groupement logique des classes4 et plus.Les tableaux des eectifs observs et thoriques deviennent comme consignsci-aprs.
Particules
en suspension
Repartition
Observee
Repartition
Theorique
0 34 34:1
1 46 48:9
2 38 35:0
3 19 16:7
4 4 08:3
Total 143 143
Sous lhypothse nulle H0, la quantit :
2 =
4Xi=0
(oi ti)2ti
est une ralisation dune variable du Khi-deux :
5 1 1 = 3degrs de libert.puisque pour calculer les eectifs thoriques, nous avons utilislestimation, et non la valeur rel, du paramtre de la loi de Poisson.
99
A. El Mossadeq Tests dHypothses
Pour = 5%, on a :
23;:95 = 7:81
Et comme :
2 = 2:97
On accepte alors H0 au seuil = 5%, cest dire, le nombre de particules ensuspension peut tre ajust par une loi de Poisson dont le paramtre est estimpar :
~ = 1:4336
Exercice 31On considre les familles de quatre enfants.Sur un chantillon de cent familles quatre enfants, la rpartition suivante a tobserve :
Nombre de filles Nombre de familles
0 7
1 20
2 41
3 22
4 10
Peut-on considrer que la probabilit quun enfant soit une lle est1
2?
100
Tests dHypothses A. El Mossadeq
Solution 31Testons, au seuil , lhypothse nulle :
H0 : la probabilit davoir une lle est1
2
Sous lhypothse nulle H0, la variable alatoire X gale au nombre de lles parmi
les quatre enfants suit une loi binomiale dordre 4 et de paramtre1
2: B
4;1
2
.
Ainsi, pour tout k, 0 k 4, la probabilit pk davoir k lles parmi les quatreenfants est :
pk = C (4; k)
1
2
4Leectif thorique tk, 0 k 4, reprsentant le nombre de familles ayant klles parmi les quatre enfants est donn par :
tk = npk
Do les rpartitions :
Nombre de fillesRepartition
Observee
Repartition
Theorique
0 7 6:25
1 20 25
2 41 37:5
3 22 25
4 10 6:25
Total 100 100
Sous lhypothse nulle H0, la quantit :
101
A. El Mossadeq Tests dHypothses
2 =
4Xi=0
(oi ti)2ti
est une ralisation dune variable du Khi-deux :
5 1 = 4degrs de libert.
Pour = 5%, on a :
24;:95 = 9:49
Et comme :
2 = 4:03
On accepte alors H0 au seuil = 5% : la probabilit davoir une lle est1
2:
Exercice 32Le tableau suivant indique le rsultat de lexamen de 124 sujets, classs daprsla couleur de leurs yeux (Y ) et la couleur de leus cheveux (C) :
YC Blonds Bruns Noirs Roux
Bleus 25 9 3 7
Gris ou V erts 13 17 10 7
Marrons 7 13 8 5
Existe-t-il une liason entre ces deux caractres ?
102
Tests dHypothses A. El Mossadeq
Solution 32La rpartition observe est :
Tableau des effectifs observees
YC Blonds Bruns Noirs Roux Total
Bleus 25 9 3 7 44
Gris ou V erts 13 17 10 7 47
Marrons 7 13 8 5 33
Total 45 39 21 19 124
Testons, au seuil , lhypothse nulle :
H0 : les couleurs des yeux et des cheveux sont indpendantes
Calculons, sous cette hypothse, la rpartition thorique.
Tableau des effectifs theoriques
YC Blonds Bruns Noirs Roux Total
Bleus 16 13:8 7:4 6:8 44
Gris ou V erts 17 14:8 8 7:2 47
Marrons 12 10:4 5:6 5 33
Total 45 39 21 19 124
103
A. El Mossadeq Tests dHypothses
Sous lhypothse nulle H0, la quantit :
2 =
3Xi=1
4Xj=1
(oij tij)2tij
est une ralisation dune variable du Khi-deux :
(3 1) (4 1) = 6degrs de libert.Pour = 5%, on a :
26;:95 = 12:6
Et comme :
2 =
2Xi=1
3Xj=1
(oij tij)2tij
= 15
On rejette alors H0 95% (mme 97:5%), cest dire, les couleurs des yeuxet des cheveux ne sont pas indpendantes.
Exercice 33On distribue un jeu de quarante cartes quatre joueurs : A ; B ; C ; D ; cha-cun reevant dix cartesUn statisticien a labor un programme de distribution de donnes par ordinateur.Pour un ensemble de deux cents donnes, obtenues partir de ce programme, ilobserve le nombre de donnes o le joueur A reoit k as, 0 k 4. Les rsul-tats sont les suivants :
Nombre d0as 0 1 2 3 4
Nombre de donnes 64 74 52 8 2
Le programme du statisticien est-il able ?
104
Tests dHypothses A. El Mossadeq
Solution 33Testons, au seuil , lhypothse nulle :
H0 : le programme du statisticien est able
Sous lhypothse nulleH0, la variable alatoireX gale au nombre das du joueurA suit une loi hypergomtrique.Ainsi, pour tout k, 0 k 4, la probabilit pk pour que le joueur A ait k asest :
pk =C (4; k)C (36; 10 k)
C (40; 10)
Leectif thorique tk, 0 k 4, reprsentant le nombre de donnes k as, dujoueur A; est donn par :
tk = npk
Do les rpartitions :
Nombre d0asRepartition
Observee
Repartition
Theorique
0 64 59:97
1 74 88:85
2 52 42:84
3 8 7:88
4 2 0:46
Total 200 200
On constate que le tableau contient des eectifs thoriques strictement infrieurs 5, ce qui empche lutilisation dun test du khi-deux.On peut remdier cet tat en oprant le groupement logique des classes3 et 4.
105
A. El Mossadeq Tests dHypothses
Le tableau des eectifs observs et thoriques deviennent :
Nombre d0asRepartition
Observee
Repartition
Theorique
0 64 59:97
1 74 88:85
2 52 42:84
3 ou 4 10 8:34
Total 200 200
Sous lhypothse nulle H0, la quantit :
2 =
3Xi=0
(oi ti)2ti
est une ralisation dune variable du Khi-deux :
4 1 = 3degrs de libert.
Pour = 5%, on a :
23;:95 = 7:81
Et comme :
2 = 5:0418
On accepte alors H0 au seuil = 5%, cest dire, le programme du statisticienest able.
106
Tests dHypothses A. El Mossadeq
Exercice 34On a crois deux types de plantes dirant par deux caractres A et B.La premire gnration est homogne.La seconde fait apparaitre quatre types de plantes dont les gnotypes sontdsigns par :
AB ; Ab ; aB ; ab
Si les caractres se trasmettent selon les lois deMendel, les proportions thoriques
des quatre gnotypes sont :9
16;3
16;3
16;1
16respectivement.
Sur un chantillon de 160 plantes, on a observ les eectifs :
100 pour AB
28 pour Ab
24 pour aB
8 pour ab
Au vu de ces rsultats, les lois de Mendel sont-elles applicables ?
Solution 34Testons alors, au seuil , lhypothse nulle :
H0 : les lois de Mendel sont applicables
Si H0 est vraie, la rpartition des 160 plantes sur les quatre gnotypes devraittre comme suit :
t1 = 90 pour AB
t2 = 30 pour Ab
t3 = 30 pour aB
t4 = 10 pour ab
107
A. El Mossadeq Tests dHypothses
On rsume toutes les donnes dans le tableau suivant :
Genotypes Repartition Observee Repartition Theorique
AB 100 90
Ab 28 30
aB 24 30
ab 8 10
Total 160 160
Sous lhypothse nulle H0, et vu que tous les eectifs thoriques sont suprieursou gaux 5, la quantit :
2 =
4Xi=1
(oi ti)2ti
est une ralisation dune variable du Khi-deux :
4 1 = 3degrs de libert : 23.Pour = 5%, on a :
23;:95 = 7:81
et comme :
2 =
4Xi=1
(oi ti)2ti
= 2:84
On accepte alors lhypothse nulle H0 au seuil de 5%, cest dire, les transmis-sions gntiques de ce type de plantes se font selon les lois de Mendel.
108
Tests dHypothses A. El Mossadeq
Exercice 35On se propose de comparer les ractions produites par deux vaccins A et B.Un groupe de 348 individus a t divis, par tirage au sort, en deux sries quiont t vaccines lune par A et lautre par B.Les ractions ont t lues par une personne ignorant le vaccin utilis :
V accinReaction legere moyenne ulceration abces
A 12 156 8 1
B 29 135 6 1
Que peut-on conclure ?
Solution 35la rpartition observs est :
Tableau des effectifes observes
V accinReaction legere moyenne ulceration abces Total
A 12 156 8 1 177
B 29 135 6 1 171
Total 41 291 14 2 348
Testons, au seuil , lhypothse nulle :
H0 : les ractions sont indpendantes du vaccin utilis
Calculons, sous cette hypothse, la rpartition thorique.
109
A. El Mossadeq Tests dHypothses
Tableau des effectifs theoriques
V accinReaction legere moyenne ulceration abces Total
A 20:9 148 7:1 1 177
B 20:1 143 6:9 1 171
Total 41 291 14 2 348
On constate que les eectifs thoriques dans la colonne Abcessont infrieurs 5; ce qui empche lapplication dun test du Khi-deux.On peut remdier cet tat en oprant le groupement logique des classesUlcerationet Abces.Les tableaux des eectifs observs et thoriques obtenus aprs regroupement sontdonns ci-aprs.Sous lhypothse nulle H0, la quantit :
2 =
2Xi=1
3Xj=1
(oij tij)2tij
est une ralisation dune variable du Khi-deux :
(2 1) (3 1) = 2Et comme :
22;:95 = 5:99
et :
2 =
2Xi=1
3Xj=1
(oij tij)2tij
= 8:8
110
Tests dHypothses A. El Mossadeq
On rejette alors, 95%, lhypothse selon laquelle les deux vaccins A et Bprovoquent les mmes ractions.
Tableau des effectifs observes
V accinReaction legere moyenne ulcerationou abces
Total
A 12 156 9 177
B 29 135 7 171
Total 41 291 16 348
Tableau des effectifs theoriques
V accinReaction legere moyenne ulcerationou abces
Total
A 20:9 148 8:1 177
B 20:1 143 7:9 171
Total 41 291 16 348
Exercice 36An de juguler le chmage des jeunes, le gouvernement franais a cr le CPE(Contrat Premire Embauche) permettant aux entreprises de licencier sans motifla personne recrute pendant les deux premires annes et dautre part de bn-cier davantages nanciers substantiels.Il est dcid de faire une enqute la sortie de lANPE (Agence Nationale PourlEmploi) pour connatre lopinion des jeunes sur ce nouveau contrat.
111
A. El Mossadeq Tests dHypothses
La question pose sera :
"Pensez-vous que le CPE est une bonne chose pour
les jeunes en recherche demploi ?"
On note p la proportion inconnue de la population rpondant positivement cette question .
1. (a) Exprimer, en fonction dune estimation f de p, la taille n de lchantillon
prlever pour que lintervalle de conance de p obtenu aprs enqute ait
une amplitude de 0; 05 avec un coe cient de conance de 95%.
(b) Si un pr-sondage 30% de rponses positives, quelle doit tre la taille n
de lchantillon prlever ?.
(c) Il est nalement dcid de diminuer le coe cient de conance 90% et
de ninterroger que 500 personnes dont 130 rpondent positivement la
question pose.
Donner lintervalle de conance de p.
2. Trois mois aprs la mise en place de ce contrat, le gouvernement franaisan-
nonce que le salaire moyen dembauche du CPE est de 1100 e.
Lors dune analyse des salaires de 100 personnes on obtient :
Salaire en e Nombre de personnes
[950-1000[ 17
[1000-1050[ 36
[1050-1100[ 31
[1100-1200[ 13
[1200-1500[ 3
112
Tests dHypothses A. El Mossadeq
(a) Donner une estimation de la moyenne et de lcart-type du salaire de
lensemble des personnes recrutes sur ce contrat.
(b) Tester lhypothse de normalit de la distribution des salaires de la popu-
lation concerne par ce contrat.
(c) Que pensez-vous de lannonce du gouvernement franais ?
Solution 361. (a) Au seuil , lintervalle de conance de p correspondant une frquence f
observe sur un chantillon de taille n est dni par :"f t1=2
rf (1 f)
n; f + t1=2
rf (1 f)
n
#Si lamplitude de cet intervalle est 0; 05, alors :
0:05 = 2t1=2
rf (1 f)
n
do :
n =
2t1=20:05
2f (1 f)
Pour = 5%, on a :
t0:975 = 1:96
do :
n = 6146:56f (1 f)(b) Pour :