que 2eedit Corrige Chap 5-9

Embed Size (px)

Citation preview

BIOSTATISTIQUE, 2e dition, volume 1 Bruno Scherrer

CORRIG DES EXERCICES DES CHAPITRES 5 9 CORRIG DE LEXERCICE 5.1Si lchantillonnage seffectue sans remise, le nombre dchantillons diffrents est donn par la formule 5.7 : n ! / [(n p) ! p !] avec n = 20 et p = 10 (11 12 13 14 15 16 17 18 19 20) / (1 2 3 4 5 6 7 8 9 10) = 184 756. Si lchantillonnage seffectue avec remise, le nombre dchantillons diffrents est donn par la formule 5.8 : (n + p 1) ! / [(n 1) ! p !] avec n = 20 et p = 10 (20 21 22 23 24 25 26 27 28 29) / (1 2 3 4 5 6 7 8 9 10) = 20 000 010.

CORRIG DE LEXERCICE 5.3Il sagit destimer des probabilits (empiriques) partir dchantillon de grande taille. La probabilit estime quune personne ge ait un effet secondaire grave est gale 35 / 680 = 0,05147 (5,15%). Cette probabilit de survenue dvnements intercurrents graves est souvent exprime en pourcentage est sappelle aussi taux dincidence. Le taux dincidence pour les personnes non ge slve : 100(75 35) / (12500 680) = 0,338%.

CORRIG DE LEXERCICE 5.51) Quelle est la probabilit davoir un as ou une carte de niveau infrieur ? Comme toutes les cartes ont un niveau gal ou infrieur un as la probabilit a priori est gale 52 / 52 = 1. Il sagit dun vnement certain. Quelle est la probabilit dobtenir un trfle ou un roi ? 13 cartes sont un trfle aux quelles il faut ajouter les 3 rois qui ne sont pas un trfle. La probabilit a priori est gale 16 / 52 = 0,3077. Quelle est la probabilit que ce soit une figure de couleur rouge ? Il existe 3 figures et deux sries de couleur rouge, soit 6 cartes favorables sur 52 p = 6 / 52 = 0,1154. Quelle est la probabilit que ce soit un roi de pique si lon sait quil sagit dune carte noire ? Il existe 26 cartes noires et 1 roi de pique. La probabilit conditionnelle (roi de pique carte noire) slve 1 / 26 = 0,0385. Si lon tire au hasard deux cartes de ce jeu, quelle est la probabilit que ce soit deux rois ? Au premier tirage la probabilit davoir un roi slve 4 / 52. Au deuxime tirage et condition quun roi ait dj t tir, il reste 3 rois et 51 cartes. La probabilit conditionnelle slve 3 / 51. Il sagit dappliquer le thorme 8 des probabilits composes (formule 5.18) : P(E1E2) = P(E1) P(E2 E1) = (4/52) (3/51) = 0,00452. Si lon tire au hasard une carte de ce jeu, puis une seconde sans remettre la premire, quelle est la probabilit que la deuxime soit un as si la premire tait un roi ? Le tirage dun roi modifie la probabilit de tirage dun as au deuxime tirage car il reste 51 cartes au lieu de 52 et 4 as puisquaucun na t retir au premier tirage. La probabilit conditionnelle est donc gale 4 / 51 = 0,07843. Corrig des exercices des chapitres 5 9 1

2)

3) 4)

5)

6)

Biostatistique, 2e dition, volume 1 Bruno Scherrer

7)

Si lon tire au hasard une carte de ce jeu, puis une seconde sans remettre la premire, quelle est la probabilit que la deuxime soit un as si la premire ltait aussi ? Contrairement la question, il ne sagit dune probabilit compose mais dune probabilit conditionnelle. Au deuxime tirage, il reste dans le 51 cartes et 3 as. La probabilit conditionnelle slve : 3 / 51 = 0,0588. Si lon tire au hasard et successivement trois cartes et si lon replace les cartes dans le jeu aprs chaque tirage, quelle est la probabilit dobtenir 3 rois ? A chaque tirage la probabilit dobtenir un roi est gale 4 / 52 = 0,0769. Comme les vnements sont indpendants cest--dire que la probabilit de tirage dun roi un tirage donn ne dpend pas des rsultats des tirages prcdents le thorme 4 des probabilits composes (formule 5.12) et la probabilit slve (4 4 4)/(52 52 52) = 0,000455. Si lon tire au hasard 4 cartes, quelle est la probabilit dobtenir un carr ? Imaginons que la premire carte soit un as. La probabilit que les 4 cartes soient un as est gale : (4/52) (3/51) (2/50) (1/49) = 0,000003694. Comme il peut sagir dun carr as ou de nimporte quel carr (13 carrs possibles) laxiome des probabilits totales (formule 5.10) sapplique : 0,000003694 13 = 0,000048. On peut galement considrer que quelle que soit la premire carte tire, la seconde doit tre identique la premire. Il y a 3 chances sur 51 quun tel vnement survienne. La probabilit que la troisime carte soit identique aux 2 premires, slve : (3/51) (2/50). Enfin la probabilit que la quatrime soit identique au 3 premires est gale : (3/51) (2/50) (1/49) = 0,000048.

8)

9)

10) Si lon tire au hasard 4 cartes, quelle est la probabilit davoir un carr das. La rponse cette question a dj t donne la question prcdente, elle est gale : (4/52) (3/51) (2/50) (1/49) = 0,000003694.

CORRIG DE LEXERCICE 6.11) Quelle est la distribution de probabilit du nombre de canards infests. Lestimation de la probabilit dabattre un canard infest est gale 0,947. La distribution de probabilit suit une loi binomiale de paramtres p = 0,947 et n = 7. Les valeurs de probabilit sont obtenues partir de la formule 6.7. On obtient pour X = 0 : 7! 7! 0 ,947 0 ( 1 0 ,947 )7 = 1 0 ,053 7 = 1,2 10-9 P(X = 0 7, 0,947) = ( 7 0 )! 0! 7! -7 Les rsultats suivants sont : P(X = 1) = 1,47 10 , P(X = 2) = 7,9 10-6, P(X = 3) = 0,0002, P(X = 4) = 0,0042, P(X = 5) = 0,0449, P(X = 6) = 0,2676 et P(X = 7) = 0,6830. Quelle est la probabilit de navoir aucun canard infest ? Il sagit de P(X = 0) savoir 0,0000000012. Quelle est la probabilit de navoir que des canards infests ? Il sagit de P(X = 7) savoir 0,6830. Quelle est la probabilit davoir au moins un canard infest ? Il sagit den avoir 1 ou 2 ou 3 ou 7. Lapplication de la formule 5.10 (probabilit totale) conduit : P(X 1) = P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) + P(X = 6) + P(X = 7) = 1,47 10-7 + 7,9 10-6 + 0,0002 + 0,0042 + 0,0449 + 0,2676 + 0,6830 = 0,9999. Quelle est la probabilit davoir plus de deux canards infest ? Il sagit den avoir 3 ou 4 ou 5 ou 7. Lapplication de la formule 5.10 (probabilit totale) conduit : P(X > 2) = P(X = 3) + P(X = 4) + P(X = 5) + P(X = 6) + P(X = 7) = 0,0002 + 0,0042 + 0,0449 + 0,2676 + 0,6830 = 0,9999. Quelle est la probabilit davoir moins de quatre canards infests ? Il sagit den avoir 0 ou 1 ou 2 ou 3. Lapplication de la formule 5.10 (probabilit totale) conduit : P(X < 4) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = 1,2 10-9 + 1,47 10-7 + 7,9 10-6 + 0,0002 = 0,0002. Corrig des exercices des chapitres 5 9 2

2) 3) 4)

5)

6)

Biostatistique, 2e dition, volume 1 Bruno Scherrer

7)

Quelle est la probabilit davoir au plus trois canard infest ? Il sagit den avoir 0 ou 1 ou 2 ou 3. Lapplication de la formule 5.10 (probabilit totale) conduit : P(X 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = 1,2 10-9 + 1,47 10-7 + 7,9 10-6 + 0,0002 = 0,0002. Quelle est la probabilit davoir deux canards ou plus dinfests ? : P(X 2) = P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) + P(X = 6) + P(X = 7) = 7,9 10-6 + 0,0002 + 0,0042 + 0,0449 + 0,2676 + 0,6830 = 0,9999. Quelle est la probabilit davoir sept canards ou moins dinfests ? : Il sagit de lvnement certain car toutes les possibilits sont incluses P(X 7) = 1.

8)

9)

10) Quelle est lesprance mathmatique du nombre de canards infests ? Il sagit de lesprance dune variable binomiale (formule 6.8) : E(X) = n.p = 7 0,947 = 6,629. Mme si les ralisations de la variable sont des nombres entiers, lesprance peut comporter des dcimales. 11) Quelle est la variance du nombre de canards infests ? La variance (attendue et non observe) du nombre de canards infests est donne par la formule 6.9 : Var(X) = n.p.q = 7 0,947 (1-0,947) = 0,3513. 12) Quel est le coefficient dasymtrie de la distribution de probabilit ? Le coefficient est donn par la formule 6.10 : (0,053 0,947) / (7 0,947 0,053) = - 1,5083. Il existe donc une asymtrie droite de la distribution.

CORRIG DE LEXERCICE 6.31) Dans loptique de la vrification de la dose ltale 50 (DL 50), quelle est lpreuve alatoire ? Lpreuve ou exprience alatoire consiste tirer un rat au hasard, lui administrer une dose de 7 mg/kg et observer sa survie. Quels sont les vnements possibles et dintrt pour lestimation de la DL 50 ? Il y a trois vnements possibles savoir lobservation daucune anomalie, lobservation danomalies non fatales probablement lies au traitement comme des convulsions, et lobservation de la mort de lindividu. Il existe deux vnements dintrt : la mort ou non de lindividu. Quelle est la probabilit a priori de survenue de lvnement dintrt ? Comme la DL50 correspond la dose conduisant la mort de 50% des individus, la probabilit a priori est gale 0,5. Attention, ce nest pas parce quil y a deux vnements possibles (vivant ou mort) que la probabilit slve 0,5. Si lon calculait la dose ltale 25, la probabilit serait alors de 0,25. Combien dpreuves alatoires on t effectus ? 10 car il y a 10 rats. quelle loi de probabilit obit le nombre de rats morts ? Comme les preuves sont alatoires (rat tir au hasard), identiques (tous les rats reoivent un dose de 7 mg/kg) et indpendantes (le mode opratoire et la survie du ime rat ne dpendent ni des interventions effectues sur les rats prcdents ni de leur survie), il sagit dune loi binomiale de paramtres p = 0,5 et n = 10. Sil existait un phnomne de contagion, ou si la dose administre dpendait du rsultat obtenu sur les rats prcdents (essais adaptatifs) la loi ne serait plus binomiale. Quelle est lesprance mathmatique de la distribution ? Elle est donne par la formule 6.8. E(X) = 10 5 = 5 rats. Quelle est la variance de la distribution ? Elle est donne par la formule 6.9. Var(X) = n.p.q = 10 0,5 0,5 = 2,5 rat2. Quel est le coefficient dasymtrie de la distribution ? En se rfrant la formule 6.10 : 0,5) / 2,5 = 0. La distribution est parfaitement symtrique.1

2)

3)

4) 5)

6) 7)

8)

= (0,5

Biostatistique, 2e dition, volume 1 Bruno Scherrer 3

Corrig des exercices des chapitres 5 9

9)

Quelle est la probabilit dobserver 4 rats morts cette dose ? Il sagit de P(X = 4 B (10, 0,5)) = 10 ! (4 !)-1 (10 4)-1 0,54 0,56 = 0,2051.

10) Quelle est la probabilit dobserver moins de 5 rats morts ? Il sagit de P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) = 0,0009766 + 0,009766 + 0,043947 + 0,117192 + 0,205086 = 0,377 11) Le pourcentage de rats prsentant des convulsions la dose ltale 50 a t estim 10%. Si lon sintresse la mortalit et la proportion de rats prsentant des convulsions, quelle est la probabilit dobserver dans lchantillon quatre rats morts, deux avec des convulsions et quatre rats sans anomalie ? Notons quun rat peut avoir des convulsions et mourir. Comme ces deux vnements sont compatibles il faut les rendre incompatibles en classant ces individus dans la catgorie des morts. Nous aboutissons ainsi 3 vnements incompatibles. La loi multinomiale est alors pertinente et la formule 6.14 sapplique : P(X1 = 4, X2 = 2, X3 = 4 M (10, p1 = 0,5, p2 = 0,1, p3 = 0,4) = 10 ! (4 !)-1 (2 !)-1 (4 !)-1 0,54 0,12 0,44 = 0,05040.

CORRIG DE LEXERCICE 7.11) Quelle est la distribution de probabilit du nombre daccidents pour une ville de 1445 salaris ? Si la probabilit quun salari ait un accident nait pas dpendante de la ville, celle-ci est estime p = 168 385 / 12805055 = 0,013149885 0,01315. Si les vnements sont indpendants la distribution de probabilit suit une distribution de Poisson de paramtre = n.p = 1445 0,01315 = 19,00. La table III de la loi de Poisson la page 749 et la colonne = 19 fournit la distribution de probabilit. P(X = 0) = 0,0000, , P(X = 5) = 0,0001, P(X = 6) = 0,0004, P(X = 7) = 0,0010, P(X = 8) = 0,0024, P(X = 9) = 0,005, P(X = 10) = 0,009, P(X = 11) = 0,016, P(X = 12) = 0,026, P(X = 13) = 0,038, Ces probabilits ne sont autres que lapplication de la formule 7.1. P(X = 14 = 19) = 1 e 9 1 14 1 ! = 0,05135. La distribution peut tre reprsente par un diagramme en bton qui 9 4 montre que la distribution est assez proche dune distribution en cloche.

Distribution de Poisson0,1 0,08 Probabilit 0,06 0,04 0,02 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 x

2)

Quelle est la probabilit quaucun accident ne ce soit produit ? La probabilit correspond P(X 1 9 = 0) = e 9 1 0 0! = 6 10 9 Quelle est la variance du nombre daccidents ? Var(X) = n.p.q = 1445 0,01315 (1 0,01315) = 18,75

3)

Biostatistique, 2e dition, volume 1 Bruno Scherrer 4

Corrig des exercices des chapitres 5 9

4)

Quelle est la probabilit denregistrer un nombre daccidents infrieur lesprance mathmatique ? Lesprance est trs lgrement suprieure 19 (E(X) = 19,0016). La probabilit est donc gale P(X 19) = P(X = 0) + P(X = 1) + P(X = 2) + + P(X = 19) = 0,0000 + + 0,091 = 0,558. Quelle est la probabilit que plus de 1,315% des salaris de cette ville aient un accident ? Un tel pourcentage correspond 1445 1,315% = 19,00175 salaris ou encore la moyenne (esprance). La probabilit est donc gale au complment 1 de la rponse la question prcdente : 1 0,558 = 0,442. Quelle est la probabilit que moins de 2,08% des salaris de cette ville aient un accident ? 2,08 % 1445 = 30,056. Il sagit de trouver P(X 30) 0,992 (selon les donnes de la table III qui ne prsentent que 3 dcimales).

5)

6)

CORRIG DE LEXERCICE 7.61) Construire la distribution de frquence attendue du nombre dHydrellia par unit dchantillonnage sous lhypothse dune distribution binomiale ngative. On suppose que la rpartition spatiale est agrgative (ou contagieuse, en grappes, surdisperse, ). Il sagit donc destimer le paramtre k de surdispersion. La premire estimation est donne par la formule 7.22 : k1 = y 2 /( s 2 y ) = 4,2072 / (71,822 4,207) = 17,699 / 67,615 = 0,26176. Cette estimation est y

correcte si k1 / y > 6, ce qui est loin dtre le cas. Lestimateur k2 est appropri si la moyenne est petite, ce qui nest pas vraiment le cas. Lestimateur k3 ne pourra pas tre utilis car nous navons pas la distribution de frquences pour yi > 9 Ayi inconnue pour yi = 10 et les classes suivantes.Essai 1 2 3 4 5 6 7 8

k20,26176 1 0,8 0,7 0,75 0,74 0,735 0,736

k 2 log (1 + y / k 2) 0,32256 0,7166 0,6372 0,5920 0,6151 0,6106 0,6083 0,60875

log(n/n0) 0,60879 0,60879 0,60879 0,60879 0,60879 0,60879 0,60879 0,60879

Commentaires Trop petit augmentation trop grande diminution insuffisante Trop petit mais proche peine trop leve encore trop leve peine trop bas OK

k 2 = 0,736La formule 7.12 peut maintenant tre applique pour obtenir la distribution de frquences attendues du nombre dindividus par unit dchantillonnage

+k Le problme avec une valeur de k petite et par consquent une valeur de k 1 ngative rside dans limpossibilit de calculer la factorielle dun nombre ngatif. Soit lestimation sous-estime la valeur du paramtre k, soit la distribution sloigne trop de la loi binomiale ngative pour utiliser la formule 7.12. Il faudrait la distribution de frquence complte pour estimer k avec lestimateur k 3 et savoir sil y a effectivement une sous-estimation. Notons quun ajustement la loi de Poisson est possible, mais les rsultats savrent probablement mdiocres (manque dajustement = cart important entre la distribution observe et la distribution attendue) car la variance est trs suprieure la moyenne (71,82 >> 4,207) et lon sattend un variance proche de la moyenne. Ce type de problme nest pas rare dans la pratique et lon ne sait pas vraiment quelle loi se rapporte la distribution. Dans de telles circonstances lemploi de statistiques robustes ou de statistiques non Biostatistique, 2e dition, volume 1 Corrig des exercices des chapitres 5 9 Bruno Scherrer 5P(Y = y = 4,207, k = 0,736) =

( k + y 1 )! 1 + ( k 1 )! y! k

k

y

paramtriques (distribution free = sans condition sur la forme de la distribution) savre une sage prcaution et ce au moins au titre dune analyse de sensibilit.

CORRIG DE LEXERCICE 7.91) Quelle est la probabilit de nobserver aucun cas lors des essais pr-AMM ? Les cas de p cytolyse sont des vnements indpendants faible probabilit de survenue ( = 22 / 1 200 000 = 0,0000183). On peut donc admettre que la probabilit de survenue de X = x vnements est donne par la loi de Poisson. Lesprance du nombre de cas pour 6750 patients est de 6750 0,0000183 = 0,1237. La probabilit de nen observer aucun lors des essais thrapeutiques slve : P(X = 0 P (0,1237)) = e 0,1237 0,12370 / 0 ! = 0,8836. Quelle est la probabilit de nobserver quun seul cas ? Il sagit de trouver : P(X = 1 P (0,1237)) = e 0,1237 0,12371 / 1 ! = 0,1093. Quelle est la probabilit den observer au moins un ? Il sagit du complment 1 de P(X = 0 P (0,1237)) = 0,8836. la probabilit est donc gale 1 0,8836 = 0,1164

2)

3)

CORRIG DE LEXERCICE 8.11) Quelle est la distribution attendue sous lhypothse de normalit des longueurs totales des femelles juvniles ? Cette distribution peut tre calcule avec Excel Colonne A : indice de classe Colonne B : Effectif observ de classe Colonne C : Indice de classe centr rduit = (xi 728,1)/21,8. Utiliser la fonction produit en C2 : Produit(A1-728,1 ;1/21,8) et tendre la fonction toute la colonne C. Colonne D : Densit de probabilit (table V): se positionner en D2, cliquer sur autre fonction , puis sur statistique , puis sur loi normale avec X = C2, Esprance = 0, cart type = 1 et cumulative = faux. Colonne E : P(xi,inf X < xi,sup) N (728,1, 21,8). Pour ce faire multiplier la densit de probabilit par lintervalle de classe (h = 20) et diviser par lcart type (sx = 21,8) : Fonction : PRODUIT(20 ;D2 ;1/21,8). Colonne F : Effectif attendu en multipliant la probabilit par leffectif de lchantillon (n =217). Fonction : PRODUIT(217;D2). Le graphe montre que la distribution de frquences attendues sous lhypothse de normalit, est relativement proche de la distribution observe.Indice de classe 625 645 665 685 705 725 745 765 785 805 Effectif observ 1 1 0 9 57 72 58 16 3 0 Indice centre et rduit -4,7293578 -3,81192661 -2,89449541 -1,97706422 -1,05963303 -0,14220183 0,77522936 1,69266055 2,61009174 3,52752294 Densit de probabilit 5,5465E-06 0,00027899 0,00604823 0,05651043 0,22755812 0,39492902 0,29539885 0,09522732 0,01323053 0,00079224 P(X=x classe i) 5,08849E-06 0,000255955 0,005548831 0,051844434 0,208768916 0,362320206 0,271008117 0,087364514 0,012138104 0,000726825 Effectif attendu 0,0011042 0,05554226 1,20409624 11,2502422 45,3028547 78,6234848 58,8087613 18,9580995 2,63396857 0,15772096

Biostatistique, 2e dition, volume 1 Bruno Scherrer 6

Corrig des exercices des chapitres 5 9

Longueur Totale de l'oie des neiges90 80 70 60 50 40 30 20 10 0 600 longueur totale en mm

Effectif observ Effectif attendu

650

700 Effectifs

750

800

2)

Si on sait que la plus petite oie mle juvnile mesurait 680 mm, quelle est la probabilit de trouver une jeune femelle plus petite que ce mle ? La probabilit recherche est P(X < 680 N (728,1, 21,8)). Ceci revient trouver P(Z < (680 728,1)/21,8) = P(Z < -2,2064). Cette probabilit est lue dans la table IV ou avec Excel: P(Z < -2,2064) = 0,01368. Dans quel intervalle de longueur sattend-on trouver 95% des jeunes femelles ? ll sagit de trouver par une mthode paramtrique (mthode faisant appel une loi de distribution et en loccurrence la loi normale) lintervalle de tolrance pour p = 0,025 (intervalle incluant 95% des ralisations de X). La figure 8.5 montre que cet intervalle est gal 1,96 soit P[728,1 1,96 21,8 < X < 728,1 + 1,96 21,8) = P [685,4 < X < 770,8] = 0,95. Dix pour cent des jeunes oies femelles devraient avoir une longueur totale gale ou suprieure une certaine valeur. Laquelle ? Il sagit de trouver la valeur de x qui satisfait lquation P(X x) = 0,10 ou encore P(X x) = 0,90. Pour ce faire il faut utiliser la table IV pour trouver P(Z z) = 0,90 soit z = 1,2816 et transformer z en x sachant que z = ( x x ) / s x = (x 728,1) /21,8. x = 1,2816 21,8 + 728,1 = 756. P(X 756) = 0,10. Dix pour cent des jeunes oies femelles devraient avoir une longueur totale gale ou infrieure une certaine valeur. Laquelle ? Il sagit de trouver la valeur de x qui satisfait lquation P(X x) = 0,90 ou encore P(X x) = 0,10. Pour ce faire il faut utiliser la table IV pour trouver P(Z z) = 0,10 soit z = 1,2816 et transformer z en x sachant que z = ( x x ) / s x = (x 728,1) /21,8. x = 1,2816 21,8 + 728,1 = 700,2. P(X 700,2) = 0,10. Quelle est la proportion attendue dindividus ayant une longueur infrieure 728,1 ? Comme il sagit de la moyenne et que la distribution normale est symtrique par rapport la moyenne, la proportion attendue slve 0,5.

3)

4)

5)

6)

CORRIG DE LEXERCICE 8.3Dans la zone administrative B du Qubec, le sexe et lge des 73 orignaux tus ont t dtermins. Quelle est la probabilit que 36 mles adultes aient t tus dans cette zone ? On sait que 100 3824 /7281 = 52,52% des individus taient mles. Il sagit donc de trouver la valeur de P[X = 36 B (73, 0,5252)]. Un calcul exact peut tre effectu avec la formule 6.7 de la loi binomiale. Biostatistique, 2e dition, volume 1 Corrig des exercices des chapitres 5 9 Bruno Scherrer 7 1)

Une approximation de la loi binomiale par la loi normale sera satisfaisante car pour p = 0,5, un effectif n = 30 fournit une approximation suffisante (tableau 8.2). Il sagit donc de trouver P(35,5 < X < 36,5) sous lhypothse de normalit N (73 0,5252, (73, 0,5252, 0,4748)) N (38,3396, 4,2666)). Il faut donc trouver P((35,5 38,34)/4,27 < Z < (36,5 38,34)/4,27) = P( 0,6655 < Z < -0,4312) = P (Z < -0,4312 N (0,1)) P (Z < -0,6655 N (0,1)) . Table IV : = P (Z < -0,4312 N (0,1)) = 0,3332 , P (Z < -0,6655 N (0,1)) = 0,2529. P (X = 36) = 0,3332 0,2529 = 0,0803. Un calcul avec Excel par la loi binomiale conduit P (X = 36) = 0,0801. De toute vidence lapproximation par la loi normale est de moins en moins utile avec lemploi dordinateurs et de simple tableur comme Excel . 2) Dans la zone administrative F/3, 103 orignaux ont t tus et identifis. Quelle est la probabilit que 58 mles adultes ou moins y aient t abattus ? Il sagit de trouver P(X 58 B (103, 0,5252)) ou P (X 58 N (103 0,5252, (103 0,5252 0,4748). Le plus simple est de passer par la loi normale pour viter de calculer toutes les probabilits de X = 58, 57, 56, 0 et den faire la somme. P (X 58,5 N (54,0956, 5,0680)) = P (Z (58,5 54,0956)/5,0680 N (0, 1)) = P (Z 0,8691 N (0, 1)) = 0,8076. Notons que la probabilit recherche sapplique jusqu la limite suprieure de la classe 58 soit 58,5 mme sil sagit dune variable discontinue. Si lon fixe la borne lindice de classe (xi = 58 = mi-distance de la classe suppose continue) la probabilit devient 0,779 au lieu de 0,8076 ce qui nest pas exact.

CORRIG DE LEXERCICE 8.71) Quelle est la distribution de frquences observes du score de la MADRS la visite finale pour les patients ayant reu un placebo ? La distribution de frquences a t obtenue avec JMP en considrant Y comme une variable nominale (qualitative) (voir chapitre 3, corrig de lexercice 3.5). Distribution FrequenciesLevel 2 3 4 5 6 7 8 9 10 11 13 14 15 21 22 25 27 28 29 30 31 32 39 41 43 44 45 48 52 Total Count 2 2 4 5 2 2 4 1 3 2 2 1 1 1 1 1 2 1 1 2 2 1 2 2 3 2 1 1 1 55 freq 0,03636 0,03636 0,07273 0,09091 0,03636 0,03636 0,07273 0,01818 0,05455 0,03636 0,03636 0,01818 0,01818 0,01818 0,01818 0,01818 0,03636 0,01818 0,01818 0,03636 0,03636 0,01818 0,03636 0,03636 0,05455 0,03636 0,01818 0,01818 0,01818 1,00000

Biostatistique, 2e dition, volume 1 Bruno Scherrer 8

Corrig des exercices des chapitres 5 9

2)

Quelle est la distribution de frquence attendue sous lhypothse de normalit du score de la MADRS ? Le logiciel JMP permet dajuster directement une loi normale toute distribution. Il suffit de cliquer sur Analyse , puis sur distribution , de slectionner la variable quantitative Y, les histogrammes apparaissent lcran. Cliquer sur le triangle rouge gauche du nom de la variable. puis sur fit distribution et sur normal . La sortie dordinateur apparaissant ci-dessous montre que la distribution observe (en vert) ne sajuste pas du tout une loi normale (courbe en rouge). Distributions VF

60 50 40 30 20 10 0Normal(19,6364,15,5461)

Quantiles100.% 99.5% 97.5% 90.0% 75.0% 50.0% 25.0% 10.0% 2.5% 0.5% 0.0% maximum 52,000 52,000 50,400 43,400 31,000 13,000 6,000 4,000 2,000 2,000 2,000

quartile median quartile

minimum

MomentsMean Std Dev Std Err Mean upper 95% Mean lower 95% Mean N 19,63636 15,54606 2,09623 23,83905 15,43368 55,00000

Fitted Normal Parameter EstimatesType Location Dispersion Parameter Mu Sigma Estimate 19,63636 15,54606 Lower 95% 15,43367 13,08768 Upper 95% 23,83905 19,15030

Biostatistique, 2e dition, volume 1 Bruno Scherrer 9

Corrig des exercices des chapitres 5 9

Si lon utilise Excella colonne A indique les indices de classe, la colonne B les effectifs de classe, la colonne C est lcart centr rduit calcul laide dune formule appliquer par extension et gale : Produit(A2 19,636 ;1/15,546), f(x) est une formule tendre et obtenue en cliquant sur fx (autre fonction) puis sur statistique puis sur loi normale , avec X = C2, Esprance = 0, cart type = 1 et cumulative = faux. La frquence attendue est gale h.f(x) = 5 f(x) et est obtenue avec la fonction produit. Leffectif attendu de classe est gal la frquence attendue multipli par leffectif n = 55.Indice de classe 2 7 12 17 22 27 32 37 42 47 52 Effectif de classe 8 14 8 1 2 5 5 2 7 2 1 Indice normalis -1,13443973 -0,81281359 -0,49118744 -0,1695613 0,15206484 0,47369098 0,79531712 1,11694327 1,43856941 1,76019555 2,08182169 Frquence attendue 0,06742221 0,09221459 0,11372904 0,12647893 0,1268353 0,11469308 0,09352106 0,0687633 0,045591 0,02725691 0,01469431 Effectif attendu 3,70822174 5,07180227 6,25509694 6,95634141 6,97594175 6,30811955 5,14365816 3,78198145 2,50750497 1,4991301 0,80818719

f(x) 0,20962915 0,28671359 0,35360632 0,3932483 0,39435633 0,35660373 0,29077567 0,21379885 0,14175154 0,08474719 0,04568756

Distribution de frquences attendues et observes16 14 12 10 8 6 4 2 0 0 20 40 60 MADRS en fin d'essai

Effectif de classe

Effectifs attendus sous la loi normale Effectifs observs

3)

Les distributions de frquences attendues et observes diffrent-elles notablement ? On constate nouveau que la distribution attendue sous la loi normale sloigne de faon importante la distribution observe. Un intervalle de tolrance calcul sous lhypothse de normalit naurait aucun sens.

CORRIG DE LEXERCICE 9.11) Indiquer la fonction de densit de probabilit de la variable alatoire T donnant le temps de fonctionnement de la pile. Il sagit de la drive de la fonction (t) qui scrit f(t) = 0,05e-0,05(t -300). A combien slve les deux paramtres de la distribution ? Il sagit dune distribution exponentielle de paramtre = 0,05 et =300. Corrig des exercices des chapitres 5 9 10

2)

Biostatistique, 2e dition, volume 1 Bruno Scherrer

3)

Quelle est la moyenne et la variance de T ? Elles sont donnes par les formules 9.6 et 9.7 : E(T) = = 300 + 1/0,05 = 320 jours, Var(T) = 1 / 0,052 = 400 jours2 Quelle est la probabilit que la pile fonctionne plus dune anne ? La probabilit est donne part la fonction de rpartition (formule 9.4) : P(T > 365) = e-0,05(365-300) = 0,03877. Quelle est la probabilit que la pile fonctionne moins dune anne ? Il sagit du complment 1 de P(T > 364) = e-0,05(364-300) = 0,04076. Elle a donc une probabilit de 1 0,04076 = 0,9592 de durer moins dun an. Quelle est la probabilit de durer moins de quatre mois ? Comme le paramtre = 300, il existe une probabilit de 1 (certitude) que la pile dure au moins 300 jours. La probabilit de durer moins de 4 mois est donc nulle. Quelle est la probabilit que la pile dure plus de 335 jours mais moins de 365 jours ? Elle est gale P(T > 335) P(T > 364) = e-0,05(335 300) e-0,05(364 300) = 0,17377 0,04076 = 0,133.

4)

5)

6)

7)

CORRIG DE LEXERCICE 9.21)2 Sachant que est une variable alatoire obissant une loi du khi carr, trouver les probabilits suivantes : Utiliser les fonctions statistiques dExcel ou la table VII en annexe. 2 P( ) > 14,07) = 0,05 7 2 P( ) > 38,93) = 0,01 21 2 P( ) > 3,84) = 0,05 1 2 P( ) > 4,10) = 0,0429 1

2)

Trouver les valeurs critiques du

2

satisfaisant les expressions suivantes :)

2 2 2 P( ) > ,05 , ( 15 ) ) = 0,05 ,05 , ( 15 0 0 15

= 25,0 = 61,66)

P(

2 45

)>

2 ,05 , ( 45 ) 0

) = 0,05

2 ,05 , ( 45 ) 0

2 P( / 2 , ( 10 ) 1

2 > 0 ) > 1

2 / 2 ,( 10 )

2 2 ) = 0,95 ,975 , ( 10 ) = 3,25, ,025 , ( 10 0 0

= 20,49. Attention

est laire situe droite de la courbe (figure 9.6) et non gauche comme pour la loi normale (figure 8.2). 2 2 2 2 2 P( / 2 , ( 100 ) > ) > / 2 ,( 100 ) ) = 0,99 ,975 , ( 100 ) = 20,49, ,025 , ( 100 ) = 129,57. 1 0 0 100

CORRIG DE LEXERCICE 9.31) Trouver les probabilits suivantes : Utiliser les fonctions statistiques dExcel ou la table VIII en annexe. P(F(1, 20) > 4,35) = 0,05 P(F(50, 200) > 1,42) = 0,0482 0,05 P(F(5, 20) > 4,10) = 0,010 2) Trouver les valeurs critiques de F satisfaisant les expressions suivantes : P(F(10, 18) > f0,05 (10,18)) = 0,05 f0,05 (10,18) = 2,41 P(F(5, ) > f0,01 (5, )) = 0,01 f0,01 (5, ) = 3,02 Biostatistique, 2e dition, volume 1 Bruno Scherrer 11 Corrig des exercices des chapitres 5 9

P(F(8, 22) > f0,05 (8, 22)) = 0,05 f0,05 (8, 22) = 2,40

CORRIG DE LEXERCICE 9.41) Trouver les probabilits suivantes : Utiliser les fonctions statistiques dExcel ou la table IX en annexe. P(T(16) > 1,74) = 0,0505 0,05 P( (18) < T 1,74) = 0,0495 0,05 P( T(22) > 2,81) = 0,0102 0,01 2) Trouver les valeurs critiques de t satisfaisant les expressions suivantes : P( T(18) > t /2 (18) ) = 0,05 t0,025 (18) = 2,10 P( T(23) > t /2 (23) ) = 0,01 t0,005 (23) = 2,81 P( T(18) > t /2 (18) ) = 0,05 t0,05 (18) = 1,74.

Biostatistique, 2e dition, volume 1 Bruno Scherrer 12

Corrig des exercices des chapitres 5 9