268

Click here to load reader

Maths LivreOrange

Embed Size (px)

Citation preview

,

.

Chapitre

1mOI latinSfCI/US :

Statistique descriptive.

L'objectif de ce chapitre est de consolider et d'approfondir les connaissances acquises les annes prcdentes ce sujet en tudiant des situations issues notamment de l'industrie et des laboratoires. De nouvelles sries statistiques seront galement prsentes en tudiant des situations issues de secteurs trs varis: mcanique, btiment, lectronique, laboratoire, conomie, ... l' origine (da ns l'ancienne Babylone, 3000 ans avant Jsus-Christ, en Chine, plus de 2000 ans avant Js us-Christ, et en gypte, vers 1700 avant Jsus-Christ) la statistique rassemblait des renseignements concernant des populations (les premiers recensements permettaientde connatre le nombre des habitants d'un pays et leur rpartition par sexe, par ge , par catgorie socia-professionne lle , ... ) et l'conomie

Le mot statistique, traduction du mOI allemand Srafisfik, apparu au milieu du XVIIIe sicle, vient dul:lI.

(valuatio n des ressources, de l'tat des stocks, ... ), ce qui explique levocab ulaire encore utilis actuellement. Les mthodes statistiques sont aujourd'hui employes galement en mdecine (valuation de l'efficacit d'un mdicame nt, de l' tat sanitaire d'une population, ... ), en agro-

nomie (recherche d'engrais spcifiques, slection de vari ts, ... ), ensociologie (enqutes, sondages d'opinion), dans l'illdustrie (organisation scientifique du travail, contrle de qualit, gestion des stocks, .. . ), et dans bien d'autres domaines.

A. SERIES STATISTIQUES A UNE VARIABLE1. MTHODES DE REPRSENTATIONa. Vocabulaire (rappel)PopulationLa population est l'ensemble que l'on observe et dont chaque lmentest appel individu ou unit statistique.

,

,

chantillon (ou lot)Peul-on. en quelques jours. interroger tous les l ecteu r.~ de France avant une lection prsidentielle?

Un chantillon (o u lot) est une partie (ou sous-ensemble) de la population considre. On tudie un chantillon de la population notamment lorsque celle-ci est impossible tudier dans son ensemble; c'est le cas pour les sondages d'opinion ou pour des mesures rendant inutilisables les objets tudi s,

par exemple la dure de vie de piles lectriques d'un certain type.Chap. 1 : Statistique descriptive

13

Caractre

Le dernier recensement, en France,

a eu lieu au printemps de 1999,

Le traitement des donnes relatives un carac tre quantitatif et il un

caractre qualitatif est diffrent par exemplt', on peut dfinir une taille moyenne pour les lves du lyce A, mais pas une rgion moyenne de r~sidence pour les Franais.

Le caractre tudi est la proprit observe dans la population ou l'chantillon considr: par exemple, la rgion de rsidence de chaque Franais observe lors du dernier recensement, ou le nombre d'enfants par famille observ cette mme occasion, ou encore la taille des lves d'un lyce. Dans ces deux derniers exemples, le caractre est dit quantitatif, car il est mesurable; ce qui n'est pas le cas dans le premier exemple o le caractre est dit qualitatif. Dans le deuxime exemple, le caractre quantitatif est discret, car il ne peut prendre que des valeurs isoles (ici entires) alors que, dans le troisime, le caractre qualitatif est continu, car il peut prendre, au moins thoriquement, n'importe quelle valeur d'un intervalle de nombres rels, Dans chaque exemple, les rsultats obtenus se prsentent, au dpart, sous forme d'une liste ventuellement trs longue et sans autre classement que l'ordre d'arrive des informations, Aussi, pour faciliter leur lecture, est-on amen les prsenter de manire plus synthtique sous forme de tableau ou de graphique,

b. TableauLes t'las~es sont non vides et telles que tout l ~ment de la population :lppartient tI une classe et une seule.

Classe Une classe est un so us-ensemble de la population correspondant une mme valeur ou des valeurs voisines prises par le caractre: par exemple, les habitants de la rgion Champagne-Ardennes, ou les familles de deux enfants, ou les lves du lyce A dont la taille (e n cm) appartient l'intervalle [165, 170r. Effectif L'effectif d'une classe est so n nombre d'lments, Ainsi, une srie statistique une variable peut tre dfinie par un tableau de la forme:

Voir l'nont' du TP 3,

lLe choix du nombre de classes

''l'

1

p est le nombre de classes et n; l'effectif de la i11

me

classe.

dpend du contexte de l'tude sta~ tistique \'oir la remarque en marge, au dbut du paragrJ.phe 2. Cette not.ation, plus courte. v ite l'ambigut des points de suspension. Une frquence peut au~"i corres~ pondre un pourcentage: voir le paragraphe c. On en d~duit"i =

L'effectif total" est tel que: = 11 1 + "2 + ,.. + Il i + ..p

+ "p' que l'on convient de noter,Il

Il

=.I l n, que l'on lit somme de i gale 1 p de ,= '

,

.

Frquence La frquence d'une classe est la proportion d'individus de la population (ou de l'chantillon) appartenant cette classe.

fi'"

Ainsi , la i me classe a pour frquence

f.,

=

'.Il !.i..

On remarque que la somme des frquences de toutes les classes est:j=I'

I.

p

f.

=

~ + "112 + ... + ~ + 11 n14

p

p

On rencontrera des rsull:us analogues dans la deuxime partie calcul des probabilits.

Puisque

~ i=1

II = 11,1

nous obtenons~

L f i=1

= 1.1

D'autre part, 0

~

fi

], pour tout entier i compris entre 1 et p.

c. Graphique Caractre qualitatif On considre le tableau ci-contre relatif aux ventes de voitures neuves en Franceen 1999. La proprit tudie dans laMaqueRenaultPSA

~28% 29.2 CJ.

population des voitures neuves venduesen France en 1999 est la marque: c'est un

caractre qualitatif qui prend trois valeurs ou modalits permettant de dfinir trois classes avec leurs frquences:Si on connaiss:lit l'effectif total 11 (le nombre total de \'oi tures neuves vendues en Frunce en 1999), on en dduirait le lableau des effeclifs puisque "; = /;11. L'aire d'un secteur circulaire d'angle a (a en radians) et de rayon Rest

Marques trangres

42,8 %

Frquence

1 -

0,280

-

0,292

0,428

Voici trois graphiques possibles pour cette srie statistique:%

lR2a . 2

R

Diagramme secteurs circulaires

Fig. 2Traditionnellement, on utilise un demi-cercle pour reprsenter la composition de J'Assemble nationale suivant les groupes politiques.

Chaque classe correspond un secteur circulaire dont l'angle ou J'aire est proportionnel l'effectif, donc la frquen-

ce, de la classe. Ainsi, l'angle pour Renault mesure en degrs: 0,280x 360 = 100,8.Diagramme en tuyaux d'orgue Diagramme en bandesRen:.i.ult28,2 %

PSAJ.ft,. - Yp ., donc Fj~. = Yi - aXi

On garde les mmes vecteun unitaires du repre.Yu . =

Yi et

YI'. = aXj car1

P; appar-

tient D .

,

,

Alors PM1.2 = (y.1 - "X.)2 car PM12 = PM. 2 puisque PM-J = IPM- ' 1 1 1 J 1 1 1 1 l Donc.IlA - BJ'-

"

1= l1 1

" p,.Ml =.~ l (li ,=j

aX.)2,'

= A1

- 2AB +

s1.

ici

A = )jetB = aX;.

i= 1

I"

PM 2 =

I" 1 (y2 =1

2"XY,

1 1

+ ,,2X2) ' l

28

1-1

" .~

p;Ml = YT ....

2aX] YI + a 2Xf

+ Yi - 2aX2Y2 + a2X~ + ...

+

y2 _ 2aXn Yn n

+

2 a2X n .

En regroupant les termes contenant a 2 puis contenant a, puis les autres, on obt ient:

" i~1 FjMf = a 2(Xr + X~ + ... + X~)+

- 2a(X 1Y1 + X 2Y2 + ... + X"Y")

Yr + Y~ + ... +a2

y"2,fi

l RM 2 = i= 11 1

Il

l X2 i= 1 /

fi

2a

l Xy + ;= 1 Y,2. l i= 1Il

n

Dans cette expression, a est l'inconnue et les troisDM; = OG + JXj=X+XjGMidon~

" nombres . ~ X,~,1=

~ ~? i~ 1 XiV; et i~ 1 Yi sont con nus car

{K r,

1

= x = ,:. -,

x-

V

1

lY'=Y+Yj

et les nombres xi et Yi sont les donnes de la srie statistique deux variables reprsente par le nuage de points Mi. On est donc amen dtermjner a pour que

l (,= 1X 2 ) a 2 1

1/

2.I 1 (X/i )" +.I 1 Y7 soit minimum. 1= 1=

Il

/1

L'expression ci-dessus est un polynme du second degr en o.On !tait ch~rc.:her Je minimum d'une

tude d'une fonctionSoit f la fonction polynme du second degr dfinie sur IR par

foncljon. Ici la variable est a el les nombres Xi et tj sont des constantes.

f(a) = (

,= 1

l

11

11

11

X;)a - 2I (Xli) a +I Y;.1= 1 1= 1

2

f est drivable sur IR :l'(a) = 2a .I X7 - 2.I (Xli)1=

"

"

1

1=

1

" Or.L

1= 1

X7

> 0 : c'est une somme de carrs et tous les Xi ne sont pas nuls.n

Donc [(a) = 0 si, et seulement si, a =1/

l Xy ;= 1 l" X2 ;= 11 1

1 1

1

et [(a)

> 0 si, et seulement si, a >

i= 1

IXYi= 1

l" X21

Chap. 1 : Statistique descriptive

29

ConclusionIl existe une droite unique passant par G telle mum : c'est la droite de coefficient directeurj-l Cl=

11

que.~ P;M7 soit mini1-

1

l"

Xy"

i= 1

l"

X21

Remarques1. En revenant aux donnes statistiques x et -1 la condition ;=1 PM? V" 4. 1 1 11 1 minimum s'crit.4. [y. - (ClX. + b)]2 minimum.

"

,= 1l

1

1

l XY = i=1 (x - x)(y l ;=1II

11

1/

,.

v)

l X2 = jl=(x' - xl '; = 1 l1 1=

11

11

2. On montre que la premire conditionlorsque la seconde conditioni= 1

l

/1

" .l 1 PM; =1

0 est satisfaite

PM? minimum est vrifie,1 1

Ici, on a choisi une dmarche trs progressive permettant de mettre en forme et de rsoudre un problme de statistique en passant d'une deux variables statistiques et en montrant l'apport de la gomtrie et de l'analyse. 3. lei, nous avons privilgi les mesures d'carts paralllement l'axe des ordonnes. En adoptant une dmarche analogue avec l'axe des abscisses, on obtient de mme une autre droite passant par G(x, y).

d. Droites de rgressionOn considre une srie statistique deux variables reprsente par un nuage justifiant un ajustemnt affine (figure 12).y

,.D'

fi"/'

= Jj - (ax j + b)

ax,+b _______Yi

QjMj = x j - (a 'Yi

+ b')

-~3?1~iXi

l',~D

G

-

Yi - - - - - -

Q

x

,Mi , , , ,

o

,oa'y,

x

+ b'

Xi

Fig. 12

Fig. 13

L'ajustement sera d'autantme1leur que les points Mi seront proches des points Pi.

Soit D une droite d'ajustement. Soit Mj(x;, Yj) un point du nuage. P; est le point de mme abscisse Xi que Mi situ sur la droite D d'quation y = ax + b. On appelle droite de rgression de y en x la droite D telle que la sommei""'l

D' o l'appellation mthode des moindres carrs If.

t M.P~ = t I\' "

i= l "

(o.t.1

+ h)f

soit minimale.

30

Dans le cas de la fi gure 13, on note Qi le poin t de mme ordonne Yi q ue M i' situ sur la droite d' ajustement D ' d'qu ation x = a'y + b'. O n appe lle droite de r gression de x en y la droite D' telle que la so mme

i= l

1- M. Q~' ,

soit minimale.

e. Covariance d'une srie statistique doubleLa covariance de la srie statistique double de caractres x et ." est le~

et y sont les moyennes arithmtiques des sries statistiques une variable x et J.

nombre rel cov(x, y) =

~ j~t (xi -

:i )Lvj -

:V).

On note aussi cov(x, y) = U X}.. Il existe une autre fo rmul e, plus comm ode pour les calc uls : un. =n ~tX;Yi- X)' .. ~

1 ~

--

f. quations des droites de rgressionOn montre que:La droite de rgression D de ." en x a pour quation y = ax[a(x)]2 est 13 variance

+b

V=

l( i x;) ni= 11

(X)::! de la .-.rie

o le coefficient directeur est a =

--~

aX).

[a(x)j-

et o b vrifie:

v = di + b. .

statistique une vari"ble x.

La droite D passe donc par le point moyen GCx, y) du nuage.[o{Y)12 est la variance\f

= l11

(i

i= 1. '

r;) -

C,,)2 de la srie

La droite de rgression lY de x en .v a pour quation x = a'y + b' o a'

stalislique une variable J.

=

u.t).

lalv)j-

~ et o b' vrifie : x = a'y + b'.

La droite D ' passe donc elle aussi par le point moyen G (x, y) du nuage.Exemple

Reprenons la srie chronologique d es pourcentages de circ uits d ' un lot qui ont une panne. Dterminons une qu ati on de la droite de rgression de y en x.

55 x = W. x = 55 .[a(x))2 =

~~5 _ 30,25,y

[a(x)f = 8,25.

)'

126 = W.

= 126 ,.x 12,6, a xy = 25. b

a.no =On a arrondi a \O~ 1.

~~3 - 5,5CT.n

a=~,

[a(x) ]

a=3.

= y - ax,

b = -4.

Chap. 1 : Statistique descriptive

31

En sections de techn icien .. suprieurs, les coeffic ients li et Il s'obtiennent tt l'aide d'une calculatrice sans aucun calcul intermdiaire.

D 'o une quation de la droite de rgression de y en x : y = 3x - 4. En supposant que la tendance observe se poursuive, on peut alors en dduire que le pourcentage y de circuits d'un lot qui ont un e panne au cours de douze semestres d' utili sation est 3 x 12 - 4 = 32.

Pour dduire y de x. on utili se la droite de rgression de)' en x. De mme, pour dduire x de y, on utili se la droite de rgression de x en y.

RemarqueDans ce cas, x en fonction de y n'a pas de signification concrte; on ne cherchera pas la droite de rgression de x en y, bien que le calcul soit possible.

4. COEFFICIENT DE CORRLATION LINAIREAfin d'apprcier la qualit d'un ajustement affine, nous allons introduire un nouveau paramtre.

a. DfinitionLe coefficient de corrlation linaire d'une srie statistique double de variables x et y est le nombre r dfini par :r=----.a(x) x a(,')

azy

ExempleOn a arrondili

tt JO- 3.

Dans le cas de la srie des pourcentages de circuits d'un lot qui ont une panne, [a(v)]- = 76,04, donc r = 0,998.

,

b. Proprits r est un nombre rel , qui est du mme signe que cov (x, y).

Puisque a ;::: ---, et a =[lres de rangs 13 et 14.

b) Dterminer une quation de la droite.6., droite de rgression de y en x. On donnera une quation de la forme y = (u: + h dans laquelle li et b seront arrondi s 10- 3. Construire la droite!l. e) Calculer une estimation de la popuhltion de cette ville pour l'anne 2002. 3 On appelle taux annuel de croissance pour l'anne Il, le pourcentage d'accroissement de la popu lation entre J'anne 11 et J'anne 1/ + 1. Calcu ler, en arrondissant 1O-::!, les taux annuels de croissance pour 1996, 1997, 1998 et 1999. B. Soit f la fonction dfinie sur [0, f(x) = 5,3 ( 1 - eX '0 0.8).

+ co l par

TPB

Exemple d'exercice de BTS avec un ajustement affine

Le tableau j-des~ous donne l'volution de la population d'une ville moyenne au cours des 5 dernires annes:

-_ _d'Rq:zi

On admet dsor mai s qlle, pour x entier, f(x) + 58 reprsente la population en milliers d'habitants pour l'anne 1995 + x. 1 a) Calculer !'(x) pour tout x de {O, + !:C.(. Dmontrer que, pour tout x de [0, + oc [, j'lx) > O.x-+ + oc En dduire l'existence d'une asymptote D la courbe C reprsentant la fonction f dont on donnera une quation.

h) Calculer lim

f(x).

1996 0 58 0

1997 1 59.Q.l 1.04

19982

1999 3 60,552,55

20004

(.. milllm): Z,

59.88 1.88

61.1 3, 1

c) tablir Je tableau de variation de f. d) Construire la courbe C et la droite D sur le dessin du A. a) Commenter la faon selon laquelle volue la population de la ville avec le modle du B. b) Donner une estimation de la population pour 2002 10 habitants prs.

,,=:,-58

Le plan est muni d'un repre orthonormal (0; T, d'units graphiques: 2.5 cm pour une unit en abscisse et 2,5 cm pour 1 millier d'habitant s en ordonne.

J)

r

38

EXERCICES CORRIGSDES OBJECTIFSRegrouper en C1a5SCS une srie Mti:o;lique

N.............

.......... 01 3l6

La production de "atelier: histogramme

une \'ariable.Raliser un diagramme Mali:-.tique.C(m~truire le tableau des d'un histogramme. das~es

partir

3

Dans un atelier, la production de certaines pices pendanl les 20 jours de travail d'un mois donn a t la suiva nle: 520; 450; 460; 485; 510; 450; 405; 460; 499; 380; 398 ; 455 ; 385 ; 409 ; 390 ; 424 ; 459 ; 407 ; 41 0 ; 428.

,

Dtermner la miane d'unestat i ~tique.

~rie

1 Regrouper t'es donnes en dasses d'amplitude 25 en

64 et 5 4 et 5 7 II

commenant par la classe l375 , 400l.

Dterminer la moyenne d"une srieslati~tique.

On compltera le tableau suivant aprs l'avoir reproduit.

Dterminer l'cart type d'une srieslali~lique.

NOIIlbr< [375.400[ de pies produi...Effectif4

Repr6enter une !>rie statistique deux yariablc".R.11i~r un de Mayer. Rali~r aju~[ement

affine par la mthode

r

Construire l'hi stogramme correspondant.

78 II

un ajustement affine par la mthoder.::alT~.

des moindres

[TI. Rsistance mcanique d'un btonLors de la ralisation d'un tronon de l'autoroute A4, pour contrler la qua lit du bton utilis dans la construction de la chausse, on il mesur, en mgapasca ls, la rsistance la compression d'un chanti ll on de 200 prlvements, 7 jours aprs leur fabrication. On trou ve, dans la noti publie aprs la fin du chantier, l'histogramme des frquences suivant. Frquence(%)

Utilher un ajustement affine pour trouver un

maximum.Raliser un ajuo;tement qui se r.lmneun ajustement affine.i),

9la et Il

DailS ce qui suit, tOitS les calculs statistiques seront effectus avec une calculatrice.tude de sries statist iques une variable

25 20

;-

Diagrammt's statistiqut's

QJ

r-

Les bons de commande: diagramme en blons.$

Fig. 19 1510r-

La srie stati stique sui va nte donne le nombre de bons de commande enregistrs chaque jour par une entreprise pendant un mois: 30; 26; 26; 32; 31; 29; 27; 27; 28; 30; 3 1; 27; 29; 30; 28; 26; 26; 32; 31; 30.

-

10 Regrouper en classes cette s rie en remplissant, aprs l'avoir reprodu it , le tableau sui vant o les nombres Xi sont des nombres entiers conscutifs.

5 0

25

35

45

55

n-n65

75

Nombrede comlDalldea ; XI

26

27

Rsistance la compres!.ion (MPa)

Effectifs ";(nombre de joun

00 on a observ~ Xi COJIllIl8Ildes)

4

...

...

) 0 En effectuant des mesures sur la figure, constru ire le tableau des classes et des effectifs.

r

2 Construire le diagramme en btons correspondant.

Dterminer le pourcentage des pr lvements dont la rsistance est strictement infrieure 35 MPa.

Ch.p. 1 : Statistique descriptive

39

1 1I;:rl 1 1 1 1 1 1 1 1 1 1~n

i

CilleUJo\" dt' moyenne et d'kart ('Ile

[!] .. Les notes des tudiantsLes 31 tudiants d'une section de technicien s suprieurs ont obtenu les notes suivantes un devoir de mathmatiques:7 11

De cette population, on extrait un chantillon de 315 parties et on compte sur chacune d'elles le nombre de fautes de frappe. On a obtenu les rsultats suivants, les pourcentages tant arrond is:NOIIIIR de fou... de ~[75.80[ [80.85[

NOIIIIRdeporda(....j5 10 20 36 15 8 6

8 51

9 41

10 121

Il 51

12 31

14 11

10 Construire le diagramme en btons obtenu en plaant en abscisse xi et en ordonne "i' Construire le polygone des effectifs. r Faire une reprsentation en btons des effectifs cumuls croissants. 3 Dterminer les valeurs approches arrondies 10- 2 de la moyenne et de l'cart type de cette srie slatistique.

[85.90[ [90.95[ [95.100[ [100.105[ [105. IIO!

0" Longueurs de tiges d'acierOn a mesur les longueurs en millimtres d'un chantillon de 100 tiges d 'acie,r la sortie d'une machine automatique. On a trouv les rsult:.lts suivants:Longueurs (cn mm)Effec:tif~

1 0 Construire l'histogramme des frquences de cette srie statistique. 2 En utilisant les frquences cumules croissantes, tracer le polygone des frquences cumules croiss:.lntes. 3 Dterminer la c1a~se mdiane. En admenant que la rpartition de l'effectif est uniforme l'i ntrieur de chaque classe, dterminer la mdianeM. Que reprsente M? Exemp le d'tudes de sries statistiques

[120.125[ [125.130[ [130.135[

10 20 38 25 7

[l35.140[ [140. 145[

deux variables

10 Construire l'hi stogramme des effectifs. 2 0 On suppose que les tiges sont dfectueuses si leur longueur est strictement infrieure 125 mm ou suprieure ou gale 140 mm. Quel est le pourcentage de pices :.lcceptables '! 3 On suppose que, dans chaque classe, tous le s lments sonl situs au centre.

o

E.umple d'utilisationH

d~

la

m ~thode d~

Mayu

Contrle de qualit

Calculer la moyenne et la ,,

50 {f

Nole sur 20

BII'Icdf cleo CIlIpIJ

1

Fig. 20

ap...ve 10 6 5 8 1 3

a,....... 23 05 0 8 0 3 4

a,...... 30 0 2 1 6 3 5 0 2 6 3 2

Chaque dpense correspond un secteue c;,cula;'e do", l'angle (ou raire) est proportionnel(le)?t l'effectif, donc au pourcentage obtenu au r. Par exemple, les salaires reprsentant 50 % des dpenses. on leur :is~ie un secteur dont raire est la moiti de celle du disque.

~ * La dcomposition du prix du sans-plomb 95en 2000En septembre 2000, pour un litre de sans-p lomb 95 vendu la pompe 7,27 F, la TVA reprse.ntait 1,19 F,la taxe pour l'Institut franais du ptrole, 0,02 F, la TIPP (taxe intrieure sur les produits ptroliers), 3,85 F, le transport et la rmunration des stati ons service, 0,50 F, le cot du raffinage, 0,51 F, le prix du ptrole extrait 1,20 F. 1 Dterminer le pourcentage des taxes sur le prix de vente la pompe d'un litre de sans-plomb 95. 2 Reprsenter cette situati on par un diagramme circulaire. Un franc vaut 0.15 euro.

5 6 7 8 9 10 Il 12 13 14 15 16

02 0 1 2 2

01 4 2

Dterminer, pour chacune des preuves, des valeurs approches arrondies 10- 2 de la moyenne el de l'cart type des notes. Quelle est l'preuve qui a t le mieu~ russie? Quelle est celle dont les rsultats ont t les plus homognes?

[!!] * ProductiqueOn a relev le diamtre e n millimtres de 20 pices usines. Les rsultats figurent dans le tableau suivant.~(. . mm)

Ell'edif2 0 2

Di rerminarioll de moyenne et d'cart type (exercices 17 21)

[34.93; 34,95[ [34.95; 34.97[ [34,97; 34,99[ 134.99; 35,01[ 135,01; 35.03[ [35,03; 35,051 [35,05; 35.07[

ct

~ Le bon rglageOn mesure en millimtres le diamtre de 100 pices pri ses au hasard dans la production d'une machine; on obtien t les rsultats suivants:

6 7 2 1

44

10 Reprsenter l'histogramme des effectifs. r Dterminer des va leurs approches arrondies 10- 2 de la moyenne x et de l'cart type 0- de la srie statistique, en supposant que, dans chaque classe, tous le s lments son t si tus au centre.

~

Productique (suite)

Une presse produit des tiges cylindriques. Une lige e~t juge acceptable si sa longueur, exprime en centimtres, appartient i\ l'in ter valle [4,95; 5,05]. De la production on prlve un chant illon de 50 tiges dont on mesure les longueurs. On obt ient les rsultats suivants o 'I j dsigne le nombre de tiges de longueur lj'l,

10 a) Calculer les moyennes ml et 1112 des sa laires res pectivement dans les deux socits. b) Calculer les moyennes ml et 1112 des salai res des employs respectivement dans les deux socil~. e) Calculer les moyennes mi' el rI/!i. des salaires des cadres respectivement dans les deux soc its. 2 0 Donner, pour chaque entreprise, le pourcentage de cadres parmi les salaris. ] 0 Le PDG de la F/MAC dit celui de la FIAAM : .. Mes salaris sont mieu x pays que les vtres. Faux, rpond ce dernier, mes employs son t mieux pays et mes cadres galement. Lequel a raison ?)t )Do

4.9025.01 7

4,921 5.02 6

4.95 5 5.04 3

4.98 7 5,07

4.99 7 5,10 1

5.00 9

",l,

~ .... Contrle de qualit dans les tra\'au>. publicsSuivant l'usage pour lequel ils sont fabriqus (cloi son de btiments, chausse d'autoroutes ... ), les btons doi vent avoir une plus ou moins grande rsistance la compression 28 jours aprs leur fabrication. Celle rsistance au bout de 28 jours, exprime en mga pascals (MPa), est note f':2S' Une crcu laire ministrielle fixe les critres de confor mit. Lorsque l'effectif II de J'chantillon des prlve. ments effectus pour contrler la fabrication est suprieur ou gal 15, les conditions suivantes doivent tre remplies:1,2 E fi , X("' ) E CI.

(V,v)

IR,B).

x(n)

~-

1

o

2

3

Fig. 4

G est l'image par X de la partie {(R, R), (V, R), (R, V), (B, R), (V, V), (R, B)} de 0 constitue de six vnements lmentaires de O.Les neuf \'nements lmentaires de 0 sont qu iprobables.Dan s ce jeu, la probabilit degagner est suprieure ?t~,

Donc P({(R, R), (V, R), (R, V), (B, R), (V, V), (R, B)}) = ~ =~, Il est naturel de poser P '( G) = ~, Ainsi P'(G) est la probabilit (mes ure par P) de l'ensemble des lments w de 0 dont l'image X(O) par X appartient G :P'(G)

= P({w E 0; X(w) E

G}),

P'(A ) [0, 1].

Tableau de "aleursOn constate que ["quiprobabilit des vnements lme ntai~s de n n'ex iste plus pour les vnemen ts l me ntaires de X(fl).

Diagramme en btons

k

l'IX

~

k)

-8-3

J

'92

'9J

39

2 t

2La lo ngueur totale de tous les btons est gale 1.

32

7

'9J

1-8 -3

9 0 27

1t2Fig. 6

t2

'9

86

RemarqueIl est devenu inulile de connatre

et la probabilit dfinie sur n.

n

Les information s contenues dans ce tableau de valeurs suffisent pour

calculer la probabilit de n'importe quelle partie de X(n ).Pour modliser la situation propose au paragraphe La., nous pouvons aussi choisir pour uni vers J 'ensemble nJ des six lments su ivants

pour lesquels l'ordre d'obtention des boules n'est pas pris encompte: e l : deux boules rouges; e2 : deux boules vertes; e 3 : deux

boules bleues; '4 : une boule rouge et une boule verte; es : une boule rouge et une boule bleue; '6 : une boule verte et une boule bleue. La probabilit P, dfinie sur ne correspond plus l' quiprobabilit

n,

des vnements lmentaires, car on a :Par exemple,1!'4

corresjX)nd

pour l '" i '" 3, P'('i)toire XI sui vante:

=

I(R, V), (V. RH.

i,

pour 4 ", i '" 6, P, (' i)

=

l

La situation du paragraphe l.b. condu it alors dfinir la variable ala

"I!',,!

.'.

'2X,7

'

.."i~

"-8

2-)

n,

R

Fig. 7

La probabilit

(paragraphe c.). image de la probabilit par 1. variable alatoire XI' conduit (paragraphe d.), la loi de probabilit

P;

P,

suivante pour XI :i

P,(X, =

-8

,ij

Pt(X,

= 2) = P, ( { e2' es})'= P,({ '2 } U {es }), = P, ({'2}) + P, ( { es})'

-)

il

2

2

,"32 ij

car {e2 } et {es} sont incompatibles(h)

n {es} = 0).

7

'2

,ij

P,(X,

= 2) = + ~.

i

- 3'

1

C'est le mme tableau qu'avec la variable alatoire X: la variable alatoire mesurant le gain a la mme loi de probabilit avec ces deux modlisation s du tirage. au hasard el avec remise de deu x boules.

Chap. 3 : Variables alatoires valeurs relles

87

G est l',.nement .. avoir un gain ~ i tif .. : G est gal IwEn:X(w)E 12,7, 12)),

e. Fonction de rpartitionNous avo ns dj vu, au paragraphe I.c., que P(G ) = ~ o G = {WE O ;X(w O}, On convie nt de nOler P(G ) = P(X > 0) ; de m me, pOlir l'vne me nt conlraire, on nOIe p (e) = P(X";; 0),

on'appart ient pas Xt!l).p(X 0) se lit .. probabi lit que la variable alato ire X prenne une::!';;

valeur infrieure ou gale 0

JO.

D' une manire gnrale, pour tout nombre rel x , on note P(X : S; ; x )le nombre r el P({w E fi ; X (w ) ,,;; xl) .p(G) ~ 1 - p(G).

Par exemple, P(X ,,;; 0)P(X";; 1)

= 1; X(w )";; 1))

= P({w E 0

X(n)~1-8,-3,2,7,12}.

3 ouX(w) = - 8 )) = P(X = - 3) + P(X = - 8) car les vne menls X = - 3, X = - 8 sont incompatibles.= P({w E O ;X(w)

=-

p(x" 0)

~

p(X" 1),

P(X";; 1) = ~

993

+ 1 = 1,

P(X";; 15) = P( {w E 0; X(w)";; 15)),De mme. p(X::!';; 20) = 1.P(0) ~

= PlO) ,= L

O.

De mme P(X";; - 10)

= 0, car { w E

0; X(w ),,;; - IO}

= 0.

DfinitionOn dfinit parfois la fonction de rpartition de X par F(,.t) = p(X < x); seu les les valeurs de F(k) o t. appartient Xt11) sont modifies.

La fonction de rpartition de 1. variable alatoire X est 1. fonction F : x .... F(x) = p(X" x)

R .... [0, Il.

Reprsentation graphique de FF est une fonction en escalier (ou constanle par ioter\'alle5) : voir lechapitre 1. Sur chaque SC"gmenl de droite. l'eJttR:mi t de droi te est e:c:clue et ce lle de gauche. incl use: les absc isses des extrm its des SC"gmen ts sont des lments de X( !l ).

2

31

3

-8

-3

0

2

7

12

Fig. 8

x(n)

~

1- 8, - 3,2,7, 12 }.

F(x) est la so mm e des nombres P(X = k), s'ils existent, pour lesquels k apparti ent X(O) el k ,,;; x.

La proprit selon laquelle Fest conti nue droite en lout .1"0 ~ I n'est pas un objectif du progr.unmc= de mathmatiques dc=s sect ion" de: tech niciens suprieurs.

Les nombres P(X = k) appar tenant [0, Il, la fonction F est croissante (au sens large) sur litF(x) = 0 pour lout x

< - 8.

F(x) = 1 pour lout x ;" 12.

Ce derni er rsullat est rapprocher de P(X(O )) = l ,

88

Remarque La donne de F suffit dfinir X : en effet, par diffrence, on peut retrouver la loi de probabilit de X. Ainsi F(7)

= ~ et

F(6,5)

= ~ ; comme 7 est le seul lment de X(n)

appartenant l'intervalle [6,5; 7]. on a :F(7)~

F(6,5)

+ p(X

~

7).

P(X

= 7) = F(7) - F(6,5), donc P(X = 7) = ~.

Nous rt'ncontrerons au par.tgraphe 2. d'autres variables alatoires pour lesquelles la fonction de rpartition joue un rle essentiel.

Cependant, pour une variable alatoire comme X, il est plus simple d'utiliser la loi de probabilit que la fonction de rpartition.

2. AUTRES EXEMPLESa. Exemples de variables alatoires discrtesLa variable alatoire X ludi~ au parJgraphe 1. est une variable al.atoiredisc~le

1. Soit Y la variable alatoire mesurant le nombre k de voitures neuvesvendues en un jour par un concessionnaire d'une certaine marque.

prenant

poUf

valeurs

les lments -8. - 3. 2. 7,12 deX(n).

Supposons que la loi de probabilit de Y soit la suivante:

o0,0:2

2

3

4 0,4

O,t

0,3

Voir le dbut de la remarque- du paragraphe l.d.

Bien que l'univers n, sur lequel la variable alatoire Y est dfinie, ne soit pas prcis, nous pouvons effecnler des calculs de probabilits avec Yet reprsenter graphiquement la loi de probabilit (fig. 9) et la fonction de rpartition (fig. 10) de Y.

0.5

-----------,..--------..........t, ,

, ,

--------.1 ,

O, t

0,2

----~

, , , ,5k

......-.j

oRemarqueNous a\'ons vu au paragraphe 1. que cette somme est P'(Y(O = J.

5

k

o

Fig. 9

Fig. 10

La somme des nombres P( Y = k) o k appartient (D, l, 2, 3, 4, 5) estk~O

~

5

pey = k) = 1. C'est aussi F(x), pour x '" 5.

2. Soit X la variable alatoire mesurant le nombre de lancers d'unepice de monnaie ncessaires pour obtenir face pour la premire fois,X peut prendre une infinit de valeurs: les lments de N *.

en supposant qu' chaque lancer pile et face sont quiprobables. X peut prendre pour valeur tout nombre entier k suprieur ou gal 1.

Chap. 3 : Variables alatoires

valeurs

relles

89

L'vnement X = k correspond : obtenir pile chacun des (k - 1) premiers lancers et face au k-ime lancer .p(X

~ 1) ~ P(faco) ~ ~.

P(X = k) =

(1 x 1 x ... x 1) x 1 2 2 2 2(k - 1) facteurs

p(X = 2) = P(pile au premier lancer et face au second). p(X = 2) = P(ple au premier lan-

En effet, les lancers sont indpendants et, chaque lancer, pile et face ont la mme probabilit ~ d'tre obtenus. Donc, pour tout k;;. l, P(X

cer) x p(face au second) car lesdeu x lancers sont indpe01.Jants: donc:p(X = 2) =

= k) = (~t

t x ~ = (!t

p(X = k)

2

3

4

5

6

7

kFig. II

RemarqueSoit n un nombre entier naturel non nul.k- I

" k (t)k es t gal ?t _

1 2: (1)" 2 + (1)' + (1)' +"'+2' 2:

suite gomtrique de premier terme ~ et de raison q = ~.

k~ 1

k

11

P(X = k) =

k~ 1

k (l)k est la somme des Il premiers termes de la 2"

Donc soit

k~ 1

" k

P(X = k) =

1

-(~r2

21 _ 1

k P(X = k) = 1 _ (1)". k~ 1 2

"

Or lim

11-+ +0:;1

(1)" = 0, car < 1< 2 2" kP(X

l,

d'o lim

n-+ +oo k = 1

=

k)

=

1.+~

On convient de noter ce rsultat: Comme

k ~ 1

k

P(X

= k) = 1.

Ces risultats sont rnpprocher dela remarque concernant la variable

k ~ 1

" k

P(X

=

k)

=

P(X ..

Il)

=

F(II), o F est la fonction de F(II) = 1.

alatoire Y ci-dessus. On retrouve P'(X(O) ~ 1.

rpartition de X, on a dmontr que lim

11-+ + 00

90

b. Exemple de variable alatoire continueDans les exemples prcdents. les variables alatoires prennent des valeurs isoles les unes des autres: ainsi, le nombre de voitures vendues ou le nombre de lancers d'une pice peut tre 2 ou 3, mais ni

2,468, ni~, ni , 5.

Celte dure n'est pas nces~;:Jire ment un nombre entier de jours.

Or, dans les domaines conomiques et industriels, on est amen tudier des variables alatoires pouvant prendre, au moins thoriquement, n'importe quelle valeur dans R ou dans un intervalle de R. C'est le cas, par exemple, de la variable alatoire X mesurant la dure de bon fonctionnement, en jours, d'un quipement particulier fabriqu en grande srie, avec l'intervalle lO, + 00[. Pour une telle variJble alatoire, les vnements intressants ne sontpas du type X = 400, ou X = 271,35, mais plutt X ,,; 400, ou X > 1 000, ou 400 ,,; X ,,; 1 200.

Avec les opr;lIions d'union ct d'intersection, on peut obteni r le!'\ vnements .. utile!))10 l'aide d'intervalles. Nou

lim

= O.

On convient d'crire ce rsultat J,

r+0

oo

f(t) dt = 1 et, comme f est nulle

Ce rsultat est rapprocher de F(X(n)) ~ 1.

sur ]- "', 0], on crit _ 00 f(t) dt = 1.

f

+00

92

)'

~gale

L'aire lal:lle sous la courbe eSI 1.

0,002

~01000

)' = f(l)1

Fig. 17

De mme, comme f est nulle sur] - 00,0[, nous pouvons crire : pour lout x rel, F(x) =

J~ :

f(t) dt.

3. CAS GENERALTrois types de variables alatoires figurent au programme de mathmatiques des sections de techniciens suprieurs.

,

,

discrte, prenanl un nombre fini de valeurs Il exisle une bijelion entre cet ensemble de valeurs el N. dis 0,3.

Et le calcul prcdent donne P(24 '" X '" 26) = 0,223.

ai

+ h,

Il faut donc amliorer la faon dont on passe d'une variable alatoire discrte (ici binomiale) une variable alatoire continue (ici normale), en se souvenant qu'en statistique on a effectu la dmarche inverse.Ici, on va adopter le mme point de vue, mais dans l'autre sens: on remplace, par exemple, 25 par J'intervalle 124,5; 25,5], 21 par [23,5; 24,5] et 26 par [25,5; 26,5].

Le sens des crochel. au seul secteur industriel mai s intervient aussi dans le com merce, les services ...Le formulaire donne

P(X'" - 4) = p(X ~ 20 < = fl( - 12)= 1 - fl(l2)

12)

1 - 0 (4.5)D'aut~

=3 x

10- 6

part

= O.

1 - 0 (5.9) - 1.8 x 10- '.

De mme, P(X

> 1(0)

= 1 - fl(40) = O.

CeUe situation est galement frquente en conom ie (salaires. prix.

... ).Conformmen t au programme, aucune 'conna issance n'est exigibl e ce sujet en mat hmatiques .

Ces rsultats sont compatibles avec la ralit. En revanche, il peut tre imprudent de choisir pour mod le une loi normale lorsqu ' une tude statistique pralable dbouche sur un petit nombre de classes de grande amplitude. Enfin, lorsque les effets de nombreuses causes indpendantes so nt multiplicatifs, la loi normale ne constitue pas un bon modle. Il est prfrable de s'orienter vers une autre loi, par exemple la loi log-normale .'II(

D. SOMME DE DEUX VARIABLES ALATOIRES1. EXEMPLESa. Exemple 1Deux reprsentants A et B d'une mme entreprise travaiHent en quipe pendant un mois pour propose r des contrats d'ventuels clients: A est charg de placer de nouveaux contrats des clients actuels de l'entreprise, tandis que B doit prospecter de nouveaux clients. Chap. 3 : Variables alatoires valeurs relles 107

Les nombres situs dans ce tableau sont dfinis par:

IXy

x

Soit X (resp. Y) la variable alatoire mesurant le nombre de con trats obtenus par A (resp. B) au cours d'une demi-journe. On suppose que X prend des valeurs dans 10, 1,2, 3 j, que Y prend des va leurs dans 10, 1) et que, pour tout lment x de 10, 1,2,3) et pour tout lment y de 10, 1 j, la probabilit P(X = x et Y = y) est donne par le tableau suivant:

P(X

=

x et Y = y)

~0 1

0

1

20,20

3

0,05 0,10

0. 15 0.20

0. 10 0.05

0.15

On lit ce rsultat dans le tableau. On ne peUl pas avoir en mme temps X = 0 et X = 1. Si Cel D sont incompatibles, alors PC 0" D) ~ P(C) + P(D). C

L'entreprise s' intresse la variable alatoire, note X + Y, mesurant le nombre total de contrats obtenus par l'quipe constitue de A et de B au cours d'une demi-journe. X + Y prend ses valeurs dans 10, 1, 2, 3, 4). L'vnement X + Y = 0 correspond (X = 0 et Y = 0). Donc P(X + y = 0) = 0,05. L'vnement X + Y = 1 correspond (X = 1 et Y = 0) ou (X = 0 et Y = 1); ces deux derniers vnements tant incompatibles, on a : P (X + y = 1) = P (X = 1 et Y = 0) + P(X = 0 et Y = 1) = 0,15 + 0,10 = 0,25. Par un raisonnement analogue, on dmontre que: P (X + y = 2) = P(X = 2 et Y = 0) + P (X = 1 et Y = 1) = 0,40. P (X + y = 3) = P(X = 3 et Y = 0) + P (X = 2 et Y = 1) = 0,25. P (X + y = 4) = P (X = 3 et Y = 1) = 0,05. On a ainsi obtenu la loi de probabilit (o u distribution) de la variable alatoire X + Y:

o0,050,25

2

3 0,25

4

0,40

0.05

Sur une longue priode, l' quipe cons titue de A et B obtient en moyenne deux contrats par demijourne.

E(X

L'esprance mathmatique de la variable al atoire X + Yest + Y) = 0 x 0,05 + 1 x 0,25 + 2 x 0,40 + 3 x 0,25 + 4 x 0,05

E(X

+ Y) = 2. La variance de X + Ye st : V(X + Y) = (0 - 2)2 x 0,05 + (3 - 2)2 x 0,25 V(X + Y) = 0 ,9.

+ (1 - 2)2 x 0,25 + (2 - 2)2 + (4 - 2)2 x 0,05

x 0,40

108

xy

Les nombres situs an" ce tableau sont dfinis par :

x

Soit X (resp. Y) la variable alatoire mesurant le nombre de contrats obtenus par A (resp. B) au cours d'une demi-journe. On suppose que X prend des valeurs dans {a, 1,2, 3), que Y prend des valeurs dans {a, 1) et que, pour tout lment x de {a, l, 2, 3) et pour tout lment y de {a, l}, la probabilit P(X = x et Y = y) est donne par le tableau suivant:

p(X = x et Y = y )

~0 1

0

1

2

3

0,05 0.10

0,15 0,20

0,20

0.10 0 ,05

0,15

On lit ce rsultat dans le tableau. On ne peU! pas avoir en mme temps X = Oet X = 1. Si Cet D sont incompatibles, alors P(C ou D ) ~ P(C) + P(D).

L'entreprise s'intresse la variable alatoire, note X + Y, mesurant le nombre total de contrats obtenus par l'quipe constitue de A et de B au cours d'une demi-journe. X + Y prend ses valeurs dans {O, 1,2,3,4). L'vnement X + Y = a correspond (X = a et Y = 0). Donc P(X + y = 0) = 0,05. L'vnement X + Y = 1 correspond (X = 1 et Y = 0) ou (X = a et Y = 1); ces deux derniers vnements tant incompatibles, on a : P(X + y = 1) = P(X = 1 et Y = 0) + P(X = et Y = 1) = 0,15 + 0,10 = 0,25. Par un raisonnement analogue. on dmontre que: P(X + y = 2) = P(X = 2 et Y = 0) + P(X = 1 et Y = 1) = 0,40. P(X + y = 3) = P(X = 3 et Y = 0) + P(X = 2 et Y = 1) = 0,25. P(X + y = 4) = P(X = 3 et Y = 1) = 0,05. On a ainsi obtenu la loi de probabilit (ou distribution) de la variable alatoire X + Y:

k Pl.x+r=k)

o0,050,25

2 0,40

3 0,25

4 0.05

Sur une longue priode. l'quipe constitue de A e t B obtie nt en moyenne deux contrats par demijourne.

L'esprance mathmatique de la variable alatoire X + Yest E(X + Y) = x 0,05 + 1 x 0,25 + 2 x 0,40 + 3 x 0,25 + 4 x 0,05 E(X + Y) = 2. La variance de X + Yest : V(X + Y) = (0 - 2)2 x 0,05 + (1 - 2)2 x 0,25 + (2 - 2)2 x 0,40 + (3 - 2)2 x 0,25 + (4 - 2)2 x 0,05

a

V(X

+

Y) = 0,9.

108

d. Champ d'intervention de la loi normaleUne loi normale intervient dans la modlisation de phnomnes ala toires possdant de nombreuses causes indpendantes dont les effets s'ajoutent, sans que l'un d'eux soit dominant. Compte tenu de la complexit des phnomnes conomiques et sociaux, la loi normale intervient dans tous les secteurs. Comme une loi normale est dfinie par la donne de deux paramtres 111 et (1' , on peut la prendre pour modle dans des phnomnes o des tudes statistiques prlin'linaires conduisent des histogrammes trs diffrents. En effet, pour une mme valeur quelconque de 111, on peut avoir des courbes varies (fig. 32). On peut mme utiliser une loi normale pour une variable alatoire mesurant une quantit ne variant pas alatoirement dans IR mais dans une partie de IR se ulement, par exemple [0, + co[ ou ]0, 30]. C'est le cas en particulier lorsque X mesure un prix, une longueur ou une masse. Ainsi, en contrle de qualit, il est a priori tonnant d'envisager le calcul de la probabilit d'vnements tels que X,,; -4, X :;" 100, lorsque X, mesurant une longueur, suit la loi normale de moyenne 111 = 20 cm et d 'cart type 0' = 2 cm; il est en effet impossible, dans une mme chaine de fabrication, d'obtenir un produit de longueur - 5 cm ou 120 cm. Avec la loi normale, on obtient:

Ce. n' est pa') le cas d'une loi dePo i ~son.

o EIX) = \'(X):fi x~

si E(X) = ~ eM alors cr{X) =

Vi est fix.

~ mcr grand

m

cr petitFi g. 32

Le contrle de qualit joue un rle de plus en plu~ imporlant dans la \'ie conomique; il ne se limite pas au !\eul sec: tcur indu~ lri e l mai s intervient aussi da",; le commen.:e, les se(\' ices." Le formulaire donne

P(X"; - 4) = p(X ~ 20 < = =

1 2)n(40) ~ o.

n(-

12)~

1 - 11(4.5) = 3 x 10- 6 D'aul~ part 1 - 11(5,9) - 1,8 x 10- 9.

1 - n (12)

o.

De mme, P(X

> 100)

= 1-

Celte si tuatio n est ~ga l e ment frquente en conom ie (salaires. prix.

... ).Confor m me nt au programme, aucune connaissance n' est ex igi ble ce sujet en mathmatiques .

Ces rsultats sont compalibles avec la ralit. En revanche, il peut tre imprudent de choisir pour modle une loi normale lorsqu'une tude statistique pralable dbouche sur un petit nombre de classes de grande amplitude, Enfin, lorsque les effets de nombreuses causes indpendames sont multiplicatifs, la loi normale ne constitue pas un bon modle. Il est prfrable de s'orienter vers une autre loi, par exemple la loi log-normale ,

D. SOMME DE DEUX VARIABLES ALATOIRES1. EXEMPLESa. Exemple 1Deux reprsentants A et B d' une mme entreprise travaiHem en quipe pendant un moi s pour proposer des contrats d'ventuels clients: A est charg de placer de nouveaux contrats des clients actuels de l'entreprise, tandis que B doit prospecter de nouveaux clients,Chap, 3 : Variables alatoires valeurs relles

107

Remarques

Les deux \'nements du second membre de l'galit sont incompatibles.

1. Le tableau initial permet de dte.rminer les lois de probabilit respectives de X et de Y. En effet, l'vnement X = correspond (X = et Y = 0) ou (X = et Y = 1). Donc P(X = 0) = P(X = et Y = 0) + P(X = et Y = 1) = 0,05 + 0,10 = 0,15.

a

a

a

a

a

On obtient de mme P(X = 1), P(X = 2) et P(X = 3) en ajoutant les nombres figurant dans une mme colonne du tableau initial. D'autre part, l'vnement Y = 0 correspond (X = et Y = 0) ou (X = 1 et Y = 0) ou (X = 2 et Y = 0) ou (X = 3 et Y = 0). Ces quatre vnements tant incompatibles deux deux, P(Y = 0) est la somme des probabilits de ces vnements:P(Y = 0) = 0,05= 0,5.

a

+ 0,15 +

0,20

+ 0,10

L'vnement contraire Y = J a donc pour probabilitP(Y = 1) = 1 - P(Y = 0)= 0,5.On reprseme gnralement les lois de probabilit de X et Y de cette faon: elles sont places en marge du tableau: c'est pourquoi on les appelle loi .. marginales. Attention la posit.ion dans le tableau des lois respecti ves de X et Y.

On peut alors complter le tableau initial:

~a1

0

1

2

3

loi de Y0,5 0,5

0,05 0,10

0,150,20

0,20

0,10 0,05

0,15

loi de X

0,15

0,35

0,35

0,15

f-----+~

On permute les lignes Y et Y = 1.

=0

2. ln versement, la donne des lois marginales de X et Y ne suffit pas dfinir le tableau initial: le nouveau tableau obtenu en permutant les deux lignes du prcdent est diffrent de celui-ci et il correspond cependant aux mmes lois marginales de X et Y.3. Les variables alatoires X, Y et X + Y ont pour esprances math matiques respectives: E(X) = 1,5 E(Y) = 0,5 E(X + Y) = 2. Donc E(X + Y) = E(X) + E(Y). Les variances de ces mmes variables alatoires sont: V(X) = 0,85 VrY) = 0,25 V(X + Y) = 0,9.

Par exemple, = 0 x 0,5 + 1 x 0,5. E(X + Y):l. dj t calcul ci-dessus. Par exemple, \'(y) ~ (0 - 0.5)'0.5 + (1 - 0,5)'0,5. V(X + Y) a dj t calcul ci-dessus. On n'a pas d' galit pour les \'ariances.E ( Y)

Donc V(X

+ Y) .,. V(X) +

VrY)

b. Exemple 2Voir le dbut du parJgraphe c.l.a.

Reprenons l'exemple. utilis pour introduire la loi binomiale, du fichier Clientle dans lequel un tiers des fiches correspondent des clients domicilis dans la rgion lle-de-France. 109

Chap.3 : Variables alatoires valeurs relles

XI = 0 est l'vnement: .. la fiche choisie au premier tirage est celle d'un client non domil'ili en lIe-de-

France .

Effectuons un premier tirage avec remise en supposant que toutes les fiches o nt la mme probabilit d'tre choisies. La variable alatoire Xl qui prend la va leur 1 si la tiche tire correspond un client d'lle-deFrance et qui , sinon, prend la valeur 0, a pour loi de probabilit:

o'iLes tirages tant avec remise la composition du fich ier est la mme chaque tirage.

2

3

1

La variable alato ire X 2 dfinie de la mme faon po ur un second tirage avec remise a la m me loi de probabilit.

La variable alatoire, note XI + X2, mesurant le nombre de fois qu'une fich e d'le-de-France est obtenue au cours des deu x tirages, prend des vale urs dans (O, 1, 2).

Aucune fiche d'l le-de-France n'a t tire au cou ~ des deux tirages.Si C. D sont il1dpendanL'i, alors

p(e et D)

~

P(C) x P(D).

+ X2 = 0 correspond (XI = 0 et X2 = 0). Donc P(X] + X2 = 0) = P(X I = 0 et X2 = 0) = P(X ] = 0) x P(X 2 = 0) car les tirages tant avec remise, les vnements X] = 0 et X2 = 0 sontL'vnement XI indpendants. Donc P(X I

+ X, = 0) = ~ x ~ = '1..3 3 9

De mme P(X IOn ne peut pas avoir en mmetemps X] = 1 etX] = O.

+ X2 = 2) = P(X] =

1 et X2

=

1)

= 1 x l = 1.3 3 9

Enfin, l'vnement XI + X2 = 1 correspond (X t = 1 et X2 = 0) ou (X t = 0 et X 2 = 1); ces deux derniers vnements tant incompatibl es, o n a:P(X I

On a dj remarqu que XI = 1 et X2 = 0 sont intlpendants. de mme que X] = OetX2 = 1.

+ X2 =

1)

= P(X I = 1 et X2 = 0) + P(X ] = 0 et X2 = 1) = P(X ] = 1) x P(X2 = 0) + P(X I = 0) x P(X2 == l x ~+~ x 1 ='1. 3 3 3 3 9'

1)

On a ainsi obtenu la loi de probabilit de XI

+ X2 :2

o4 4

9Les calculs sont analogues ceux qui ont t effecws pour X + }' dans l'exemple 1.

9

9=

1

L'esprance mathmatique de XI

La variance de XI

+ X2 est

V(X I

+ X2 est E(X I + X2) + X 2) = ~.

l

RemarqueE(X I )On avait obtenu un rsultat analogue dans l'exemple 1.

=0 x~ +1x~ =~+ X2 )= E(X I )

et E(X2 )

= E(X]).

Donc E(X]V(X])

+ E(X2 ).

On a,'a obtenu un rsultat diffrent dans l'exemple 1.

= (0 - ~n + (1 _ ~)2 ~ = ~ Dot;c V(X] + X2) = V(X I) + V(X2).

11 0

2. INDPENDANCE DE DEUX VARIABLES ALATOIRESOn a dj dfini deux \.nements indpendants au paragraphe B.2. du chapitre 2. Ici, il s'ag it de variables alloires indpendantes.

DfinitionSoil X une variable alatoire discrte prenant un nombre fini de valeurs *1' *2' .... kit .... k". Soit Y une variable alatoire discrte prenant un nombre fini de valeurs

ki. ki ... kj ... k~.On peut tendre cette dfinition aux deux autres. types de variables alatoire!i prsents au paragraphe A. 3.

X et Y sonl indpendantes si. pour tout i. l '" i .. n. etpourloutj.l""j""p. on a : p(X = ki et Y = kj) = p(X = k i ) X p(Y

= kj ).

Voir le paragraphe I.a.

EKemple 1

x apparlient {D, 1. 2. 3} el y {O. I} que P(X = 0 elOr, on a dmonlr que P(XL'galit de la dfinition ci-dessusest fausse au moins dans le cas particulier k 1 0 el k; O.

On iii dans le lableau dfinissant les probabilits P(X = x el Y = y) o Y = 0) = 0,05.

=

=

= 0) = 0.15 et pey = 0) = 0,5. O'o P(X = 0) x pey = 0) = 0,Q75. Donc P(X = 0 et Y = 0) '" P(X = 0) x pey = 0).Les variables alatoires X et Y ne sont pas indpendantes.

Voir le paragraphe l.b.

EKemple 2

La composition du fichier est lamme il chaque tirage.

On a remarqu que, les tirages tant effectus avec remise, le rsultat d'un tirage est indpendant du rsultat d'un autre lirage, et cela quels que soient ces rsultats.Donc, pour tout k de {O, I} e t lout k' de {O. I}. on a :P(X,

= ketX2 = k') = P(X, = k)

X P(X2

= k')

Les variables alatoires XI et X2 sont indpendantes.Remarque

Nous avons dj rencontr le nom de Bernoulli la fin du chapitre 2.

Les variables alatoires XI el X 2 ci-dessus, qui prennent la valeur 1 avec la probabilil p = ~ el la valeur 0 avec la probabilil 1 - P. sontappeles variables de Bernoulli de paramtre p; elles suivenl la loi binomiale de paramlres/1

=

1 el p

= ~ car

CO' 3 (~)' = ~ = P(X ' = 0) (1)0 3 3el C:Constater que, pour tout lment k de {D, 1. 21, on aP(X, + X, ~ k) ~

(~)' (~t = ~ = P(X, =

1).

La variable alatoire XI

+ X2 suit elle aussi une loi binomiale: la loi

q ('1)'(')'-'. 3 '3

00(2,

~) de paramlres Il = 2 et p = ~.

On admet ici ce rsultat qu'on n'a dmontr que dans Je Ca.li n = 2.

Plus gnralement, on dmontre qu'une variable alatoire qui suit une loi binomiale 2li(n, p) est la somme de II variables alatoires de Bernoulli indpendantes de mme paramtre p.111

Chap. 3 : Variables alatoires valeurs relles

3. ESPERANCE MATHEMATIQUE D'UNE SOMME DE VARIABLES ALATOIRESVoir les paragraphes I.a. et Lb. Ce rsultat s ' ~tend une somme de plus de deux variables al ~atoires :

,

,

Nous avons dmontr, dans deux exemples, que pour une somme X + Y, on a E(X + 1') = E(X) + E( 1').

On dmontre que ce rsultat est gnral.E(X

E(

i - 1

i

Xi)

~ ii- I E(X,)

+ Yi

= E(.l()

+ E( YJ. si ces nombres existent.

Voir le paragraphe 8. l.d.

De mme: E(X - Y) E(X) - E(Y). Rappelons que, a et b tant des constantes relles, on aE(aX+ b)

=

= aE(X) + b.

Application la loi binomialeLa propri~l~ d'ind~pe ndance est inutile pour cette Mmonslration.

Soit X une variable alatoire qui suit une loi binomiale 'lll(II, l'). On peut considrer X comme la somme de n variables Xj de Bernoulli indpendantes de mme paramtre p.E(X)

= E( ,= l Xi) puisque X

i

=.i ,=.

1

Xi' l')

On utilise une extension du thorme ci-dessus. Cette somme a Il termes gaux p. C'est le rsultat admis au paragraphe C. I.b.

Donc E(X)

=.1

n

E(X,). Or E(X,)

1= 1

=0(1 -

+

II'

=l';

d'o E(X) = l'

+ l' + ... + l',

soit E(X) = '111'.

4. VARIANCE DE LA SOMME , DE DEUX VARIABLES ALEATOIRES INDPENDANTESNous avons dmontr dans un exemple, au paragraphe l,b., que, pour deux variables alatoires indpendantes X) et X2' on aV(X)

+ X2)

= V(X)

+

V(X2 ).

On dmontre que ce rsultat est gnral.Dans ce lh:o~me, on suppose que ces nombres ex istent.

X et Y tant des variables

alatoire~ indlp~ndant~s,

VI X

+

Y) = V(X)

+

V(YJ.

Nous avons observ sur un exemple, au paragraphe I.a., qu'avec des variables alatoires non indpendantes, on peut avoirV(XAttention au signe +.

+

1') '" V(X)

+

V( 1').

Pour une diffrence de variables alatoires indpendantes, on aV(X - Y) V(aX

= V(X) + V(Y). = a2V(X).

Rappelons que, a et b tant des constantes relles, on a

+ b)

112

Application la loi binomialePour une variable X; de Bernoulli de paramtre p, on a E(X;) = p. Comme V(X,l = E(X;) - [E(X;)]2, on a V(X;) = 02(1 - p) + l2p - p 2, soit V(X,l

= p el

- pl .

Comme une variabl e alatoire X qui suit une loi binomiale oo(n, p) est

la somme de Il variables X; de Bernoulli indpendantes de mme paramtre p, on a :

V(XJ = V Donc V(XJC'est le rsultat admis au p:U-.tgraphe C. l.b,

" " (.k X;), puisq ue X =k X;.1=

1

1=

1

j= 1

" k

V(X; ) en utilisant une extension du thorme ci-

dessus, soit: V(XJ = IIp(l - p).

5. SOMME DE VARIABLES ALATOIRES SUIVANT DES LOIS NORMALES OU DES LOIS DE POISSONa. Lois normalesNOIer l'hypothse d'indpendance,E(X, ;: X,) ~ E(X,) V(X,

Soit X, et X2 deux variables al.toiles indpendantes suivant les loisnormale~

+ X,)

~

+ E(X,) . V(X r) + V(X,).

respectives X(m" ",) et X(m2' "2)' alors X, + X2 suit la loi

normal,e de moyenne ml + m2 el d' cart type

Vai + a~.

Cette proprit des lO normales est trs importante. IS

RemarquesE(X, - X,) V(X, - X, )~ ~

E(X,) - E(X,). V(X,)

1. Avec les mmes hypothses, XI - X 2 suit la loi normale demoyenne ml - m 2 et d'cart type

+. V(X,).

VfT~ + (T~.

2. Le rsultat sur une somme de deux variables alatoires indpendantes s;tend une somme de Il variables normales indpendantes.

b.

Lois de Poisson

Si Xl et X2 sont deux variables alatoires indpendantes suivant les lois de Poisson respectives g>(,) et g>( 2). Alors leur somme X, + X2 est une variable alatoire suivant la loi de Poisson g>(, + 1. 2).

Chap. 3 : Variables alatoires valeurs relles

11 3

TRAVAUX PRATIQUESEXEMPLES D'TUDE DE SITUATION DE PROBABILIT FAISANT INTERVENIR UNE VARIABLE ALATOIRETP 1 Dtermination d'une loi de probabilit, calcul d'esprance mathmatique, de variance d'cart type, jeu quitable TP2 Tirages simultans, variable alatoire

Une urne contient dix bou les: une rouge, une blanche et huit noires. Un jeu consiste tirer simultanment deux boules. On suppose l' quiprobabilit des tirages.

l OCombien y a-t-il de tirages possibles?

r

- Une bote con tient 10 boules. Sur chacune d'elles on a in scrit un nombre suivant le tableau ci-dessous;

On considre les vnements suivants: El ; le tirage contient la boule rouge el la boule blanche : E2 : .c le tirage contient la boule rouge et une boule noire ; EJ : le tirage con tient la boule blanche et une boule noire ; E4 : Je lirage cont ien t deux bou les noires .

Nombrt inscritNombre debuul~

1

Calculer sous forme de fractions irrductibles les probabili,s PtE,), P(E, ), P(E3), P(E.).

Un joueur mise 10 eu ros, tire une bou le au hasard el reoit la somme (en euros) inscrite sur la boule. Toutes les boules onl la mme probabilit d'tre tires.

3 0 Si le joueur tire la boule rouge, il gagne 15 euros; s'il tire la boule blanche, il ne gagne rien; enfin, il perd 2 euros p~lr boule noire tire.Par exemple, ~ l tire la rouge et la blanche, il reoit 15 euros pour la rouge, 0 euro pou r la blanche et, donc, pour les deux boules, 15 euros. On considre la variable alatoire X qui, chaque tirage, associe le gain du joueur (une perle e~t un gain ngatif). a) Dterminer les valeurs prises par la variable alatoire X. b) Donner la loi de probabilit de X sous forme de tableau. c) En dduire l'esprance mathmatique de la variable alatoire X. Quelle remarque peut-on faire?

I Ole joueur joue une fo is. On >tppelle PI la probabilit qu'il perde de l'argen t (c'est--dire qu'il reoive moins de 10 euros ,'issue U li rage) et p~ la probabilit qu'il reoive plus de 10 euros. Donner PI elP2" r Soit X la variable alatoire qui. chaque tirage, fail correspond re le gain ,. du joueur (u ne perle est un gain ,. ngatif). Par exemple : si un joueur lire le nombre 12, son '1\ gain ,. est + 2; s'il tire le 6, son gain est - 4.a) Quelles sont les valeurs prises par la variable alatoire X'! b) Donner la loi de probabilit de X en compltant, aprs l'avoir reproduit, le tableau suivant:

c) Calculer son esprance mathmatique E(X). Que reprsente E(X) pou r le joueur? d) Calculer la variance et la valeur approche arrondie IO-:! de J'cart type de X. 3 JI s'agit maintenant, en changeant Je nombre inscrit sur une boule, de rendre ce jeu quitable (c'est--dire que l'esprance mathmatique de la variable alatoire associe doit tre nulle). Proposer une solution.

EXEMPLES D'TUDE DE SITUATIONS DE PROBABILITS FAISANT INTERVENIR DES VARIABLES ALATOIRES SUIVANT UNE LOI BINOMIALE, DE POISSON OU NORMALETP 3 Tirage de boules et loi binomiale

. Une bote contient quatre boules rouges, troi s boules vertes et sept boules jaunes. On lire si mult:mment deux boules de la bote et on ~ uppose que les tirages son t quiprobables.

114

1 On considre les vnements suivants:

TP 5,

A : obten ir deux boules de mme couleur

Approximation d'une loi binomiale par une loi de Poisson~:urcice

B : '" obtenir deux boules de couleurs diffre,ntes .

Dans cet

chaque prohahiliti demande sera

Calcu ler, sous forme de fractions irrductibles, les probabilits PlA) et P(B).

arm"di~ il JO -J.

r

On rpte dix foi s l'preuve prcdente en remeUarll les deux boules tires dans la bote, aprs chaque tirage. Les di x preuves alatoires lment 2) ; l'espran-

[!] . If faut .. liminer!3 % des bouteilles d'eau fabriques par une usine sont dfectueu ses.. On appelle X la variable alatoire qui, tout lot de 100 bouteilles prises au hasard, associe le nombre de bouteilles dfectueuses. On admet que X suit la loi de Poisson de paramtre 3. Trouver la probabilit de chacun des trois vnements suivants: A : Un tel lot n'a aucune bouteille dfectueuse ;

P(X ~ 0): P(X ~ 2): p(X '" 2); P(X

ce E(X) ell'carllype O'(X). TOlU les r.wlrats seront arroI/di" 10- 6.

o

** Assurance-vie

Une compagnie d'assura.nces vend des polices d'assurance-vie des personnes de quarante~cinq ans, toules e.n bonne sant. Aprs consultation des statist.iques des compagnies d'assurances, on admet que la probabilit, de l'vne.ment : Une personne de quar::lIlle-cinq ans vit encore trente ans ", est 0,7. On prlve au hasard six: personnes de quarante-cinq ans en bonne sant parmi la clientle de la compagnie. On admet que la clientle des personnes de quarantecinq ans en bonne sant est suffisamment imporlante pour que l'on pui sse assimiler ce prlvement h un tirage avec remise. On a donc une succession de six preuves indpendantes.

B : Un tel lot a exacte.mcnt deux bouteille.s dfectueuses " ;C: Un te.! lot a au plus deux bouteilles dfectueuses .

~ ** Lecture nverse de

la table

Soit X une variable alatoire qui suit la loi de Poisson de paramtre 7. Dterminer la plus petite valeur de k vrifiant:P(X '" k) '" 0,80.

Chap. 3 : Variables alatoires valeurs relles

119

2J u.

Dtermination du paramtre

Approximation d'une loi binomiale par une loi normale (exercices 16 et 17)

Soit X une variable alatoire qui suit une loi de Poisson. Dt.ermine.r 10- 2 prs Je paramtre sachant que P(X = 0) = 0,3. Utiliser la dfinition de la loi de Pois'>On.

~ *** Pile ou faceOn jene dix fois de suite une pice de monnaie bien quilibre en notant chaque fois le rsultat, ce qui constitue une partie. Tous les rsultats approchls sero'" arrondis 10- 3. 1 0 On note X la variable alatoire qui, chaque partie, associe le nombre de face" obtenu. a) Justifier que la loi de probabilit suivie par la variable X est une loi binomi ale; on prcisera les paramtres de cette loi. b) Calculer la probabilit de l' vnement E : ..: Le nombre de face" est compris entre 3 et 6 (bornes incluses) ". r On dlide d'approcher la loi de la variable alatoire discrte X par la loi normale de paramtres m et u. a) Expliquer pourquoi on prend m = 5 et cr W. b) On considre une variable alatoire Y suivan t la loi .N'(5 ; ,{2,5). En utili sant cette approximarion calculer la probabilit de l'vnement: Le nombre de face est compris entre 3 et 6, borne s incluses " , c'est--dire P(2,5 :s; Y:s; 6,5).

Loi normale. Lecture directe de la table (exercices 12 et 13)

La variable alatoire X suit la loi normale .N(20, 5).

Calculer, avec la prcision permise par la table du formulaire: a) P(X ,. 28); b) P(X ;. 28); c) P(X;' 12); d) P(X,. 12); e) P(12 ,. X,. 28).

~ .. Gestion de parc automobileUne entreprise de tran sport a un parc total de ISO

=

. camions. On dsigne par X la variable alatoire qui, chaque camion tir au hasard dans le parc, associe la distance qu'il a parcourue dans une journe. (Les distances sont mesures en kilomtres.) On admet que cette variable alatoire X suit la loi normale de moyenne 120 et d'carttype 14.

Dterminer 10- 4 prs la probabilit qu'un camionparcoure un jour donn une distance comprise entre 110 et 130 kilomtres en utilisant ventuellement une interpolation affine.

~

U_

Statistique et probabilits

A. Statistiqut! Avant d'accepter un contrat de livraison de vh icule s, une socit d'quipements automobiles tablit une stati stique de production journalire sur 100 jours. Le nombre de vhicules quips journellement se rpartit comme suit:Production journali!'re de vhil:ules quip~

Lecture inverse de la table de la loi normale (exercices 14 et 15)

~

..

La variable alatoire X suit la loi normale .N'(20. 5). Dterminer 10- 2 prs le nombre rel a tel que: a) P(X,. a) ~ 0,99; b) P(X ,. a) ~ 0,01 ; c) P(X;' a) = 0,05; d) P(X;' a) ~ 0,90; e) P(20 - a ,. X ,. 20 + a) = 0,95.

Nomhrt de jOU"

~

...

On dsigne par X une variable alatoire. 1 0 X suit la loi normale .N(2 ; 0,1), calculer P(X ;:=: 2,2). 2 X suit la loi norm ale X(m ; 0,1) : a) calculer ni pour que P(X ~ 2,2) = 0,05 ; b) calculer /Il pour que P(X;' 2,2) ~ 0,95. 3 Q X suit la loi normale H(2 ; a) : a) calculer cr pour que P(X ,. 2,2) ~ 0,9; b) calculer cr pour que p(1,8 ,. X,. 2,2) = 0,9. TOlls I~s rsultats seront arrondis 10- 2.

95 96 97 98 99 100 lOt 102 103 104 105 106 107

1 3 6 8 10 13 18 14 9 8 6 2

2100

120

Dterminer la moyenne de la production journalire et une valeur approche arrondie 10- 2 de l'cart type de cene production.

3 Dterminer le nombre rel positif a, tel que la probabilit de l'vnement 40 - Cl ~ Z ~ 40 + Cl lt soit gale 0,95.

B. ProbabilitbLa production exige par le contrai est au moin s de J00

vhicules quips par jour, pendant J00 jours de travail conscutifs. chaque journe tire au hasard, on assoc ie le nombre de vhicules quips que l'on suppose indpendant du nombre obtenu chacun des autres jours. On dfinit ainsi une variable aluroire X. On admet que la variable alaroire discrte X peut tre approche par la loi normale de paramtres ni = 10 J el cr = 2,59. On note y une variable alatoire sui va nt la loi X( 1 1 ; 2,59). Calculer la valeur approche arrondie ft 10- 3 de la probabilit de l'vnement Le contrat est rempli , c'est-dire P( Y ;;' 99,5).

Exercices d'examen

~ ... Production de montres,vnements indpendants, loi binomialeUne usine d'horlogerie fabrique une srie de montres. La fabrication comporte deux: phases. La premire phase fait apparatre un dfaut a dan s 2 % des cas; la seconde phase, un dfaut b dans 10 % des cas. 1 Une montre est tire au hasard. On dfinit les vnements sui vants: A : La montre tire prsente le dfaut a lt ; B : .-: La montre tire prsente le dfaut b lt. On suppose que les vnements A et B so nt indpendants. Calculer la probabilit des vnements suivants: C : La montre tire prsente les deux dfauts ,. ; D La montre li re ne prsente aucun des deux dfauts lt ; E : La montre tire prsente un et un seul des deux dfauts .

Somme de deux variables alatoires

Soit X et Y deux variables alatoires indpendantes dont les lois de probabilit sont dfinies par le s tahleau x suivant s.

x,l'IX - x,)1 :1

0

10

20 11

2- 5 1

1

1

410 1:j

1

4'20

1

Y,P(Y == Yi)

15

'5

20

9

ru

1

Calculer l'esprance math matique el une vale ur approche arrondie 10- 3 de l'cart type de la variable alatoire Z = X + Y.

[!!] u. Somme de variables alatoiressuivant une loi normaleLes deux variables alatoires X et Y sont indpendantes et suivent respect ivement les lois normales: )((22, 4) et X( 18, 3). Soit la variable alatoire Z = X + Y. On admet que Z suit une loi normale. ] 0 Montrer que l'esprance mathmatique et l'cart type de Z sont respectivement 40 et 5.2 Calculer la probabi lit de l'vnement .-: 34 ~ Z ~ 48 lt.

r Au cours de la fabrication, on prlve au hasard successivement cinq montres. On considre que le nombre de montres fabriques est assez gT"dnd pour que l'on puisse supposer que les tirages sont indpendants. On admet que la probabilit qu'une montre choisie au hasard dans la production ne prsente aucun des deux dfauts a e t b est 0,882. Soit X la variable alatoire qui associe chaque prlve ment de cinq montres le nombre de montres sans aucun des deux dfauts a et b. a) Expliquer pourquoi X suit une loi binomiale. Donner les paramtres de cette loi. b) Dterminer la probabilit de l'vnement F : Quatre montres au moins n'ont aucun dfaut lt. On donnera la valeur exacte de cette probabilit, puis une valeur dc imale approche arrond ie au millime.~ ... O on fait de la statistique descriptive etutilise les trois lois usuelles de probabilitUS pa,.ti~~ A, B~t

C SOIll

jlld~p~l/da1llu.

Une usi ne fabrique des ~iges mtalliques servant d'essieux ?t des modles rduits de voiture. A.Statistiqu~

Dans un lOI de 1(XX) pices, on a mesur la longueur des tiges.

Chap. 3 : Variables alatoires valeurs relles

121

Voici la rpartition en classes de ces mesures; Longueur (en mm)[67 ,5; n.5[

Nomhre de pi:es5 95 790 100 10

172,5; 77,51 [77.5 ; 82.51 [82,5; 87.5[ 187,5; 92,51

b) Dterminer une valeur approche arrondie 10- 4 Je la probabilit pour un tel chantillon: - de n'avoir aucune pice dfectueuse; d'avoir au plus 2 pices dfectueuses. r a) On admet que la loi suiv ie par X peut tre approche par une loi de Poisson. Dterminer le paramtre de celle loi. b) En utilisant cette loi de Poisson, dterminer des valeurs approches 10-3 prs de la probabilit de chJ.cu n des deux vnemenL~ du l Ob).

10 Tracer l'histogramme de cette srie stat istique.

C. On cons idre maintenant que la variable alatoirey qui, loute tige de la production, associe sa longueur suit la loi normale de moyenne 11/ = 80 et d'cart type cr = 2,5 .Dans ce qui suit, 01/ dOlillera pOlir chaqlle risl/lUlf tille \'llieur approche (lrro"di~ 10- ol.

r

En suppos:.tnt que, dans chaq ue classe, tous les lments sont situs au centre, calculer une valeur approc.:he arrondie 10- 2 de la moyenne et de l'c:ut type de cette srie stat istique. B. Probabilir

On prlve des pices d:.lIls la production d'une journe. On suppose que la probabilit qu'une pice soit dfectueuse est 0,1. On noIe X la variable alatoire qui, tout chantillon de 50 tiges, prlev au hasard avec remise, "lssocie le nombre de tiges dfectueuses parm i les 50.

1 Quelle est la probabilit qu'une lige prise au hasard dans la production ait une longueur comprise entre 77.5 et 82,S?

10 a) Expliquer pourquoi X su it une loi binominale.Donner les paramtres de cette loi.

r On accepte les pices donl la longueur appartient l'intervalle l77, 86] (les pices Irop longues peuvent tre recoupe.s). a) Quelle est la probabilit qu'une pice soit accepte? b) Donner une estimation du pourcentage de pices dfectueuses dans la production.

EXERCICES NON CORRIGSLoi de probabilit, esprance mathmatique, fonction de rpartition

~ * Dcouvert la banqueSoit X la variable alatoire qui associe un mois tir au hasard le dcouvert des comptes en banque d'une grande entreprise. Une tude statist ique permet d'ad~ mettre que la loi de probabilit de X est donne par le tableau suivant:

1 Calculer l'esprance mathmatique, la variance et la valeur approche arrondie 10- 2 de l'cart type de la variable alatoire X dont la loi de probabilit est donne par le tableau:2 1 5 1 2 12 1 3

Xi (d"OUvcrl en eurm.)

Pt,X=x j )

200 000150000

1 10

X;

P(X

=

Xi.

12000090000

1 6 15 1 3 1 5

6

r

Construire la reprsentation graph ique de la fonction de rpartition de la variable alatoire X.

70000

122

Calculer l'esprance mathmatique E(}() de la variable alatoire X. Que reprsente E(X)?

~ ... Tirage sans remiseUne urne contient deux boules rouges, trois boules blanches et quatre boules noires, indiscernables au toucher. Un jeu consiste lirer deux boule~ successivement, sans remise. 11 y a quiprobabilit des tirages. Le tirage d'une boule rouge fait gagner 3 euros. Le tirage d'une boule blanche fait gagner 2 euros. Le tirage d'une boule noire fait perdre 3 euros. On appe lle X la variable alatoire qui :l tout tirage de deux bou les fait correspondre le gain en euros (une perte est un gain ngatif).

~ -- Pile ou faceOn lance simultanment trois pices de monnaie (non truques!) : une de 0,50 , une de 1 , une de 2 . Un rsultat est not sous forme de triplet, par exemple (P, P, F) . o le premier lment est le rsultat pour la pice de 0,50 . le deuxime le r!'>uhat pour la pice de 1 , le troi sime le rsultat pour la pice de 2 .

1 Dterminer l'ensemble des rsllltats possibles.2 On gagne 1 euro si on obtient 3 fois face, 0,5 euro si ... on obtient 2 fois face el on perd 0,5 euro si on obtient une seule foi s face ou aucune fois face. On note X la variable alatoire qui. tout lancer des trois pices, associe le gain obtenu, une perte tant considre comme un gain ng~ltif.a) Dfinir la loi de probabilit de X en prsentant

1 En utilisant les lettres R, B. N respectivement pour rouge, blanche, noire, crire les neuf rsultats possibles sous la forme de couples dOn! le premier terme reprsente la couleur de la premire boule tire, et le deuxime terme la couleur de la deuxime boule tire.2 Calculer. sous forme de fraction irrductible, la probabilit de chacun des vnements trouvs dans la premire question. 30 Calculer le gain associ chacun de ces vnements.

les rsultats l'aide d'un tableau.b) Calculer l'esprance mathmatique E{X) de la

vari able alatoire X. Que reprsente E{X)? Le jeu est-il quitable?Un jeu e ... t quitable l0rMIue les gains et les perles

s'quilibrent sur un Irh gr.md nombre de parties. c'e))!-dire lorsque EV.') = Q.

4 0 crire la loi de probabilit de X. So a) Calculer l'esprance mathmatique de X et l'interprter. b) Calculer l'cart type de X et en donner une approximation dcimale 0,01 prs.

EJ~ .... Tirage a\'ec remiseUne urne contient troi s boules indiscernables au toucher, numrotes respec ti vement 1,2 et 3. On effectue trois tirages successi fs avec remise, et on note dans l'ordre les trois numros ainsi obtenus. Un rsultat est un triplet donnan! les numros dans l'ordre o ils ont t obtenus. par exemple: ( l, l, 2). Tous les triplets sont quiprobables.]0

U

Problme de ds

On dispose de deu~ ds cubiques non truqus. Le premier cube a cinq faces rouges et une face verte. Le deuxime cube a une face rouge, deux vertes et trois bleues.

Donner la liste des triplets possibles.

2 Soit X la variable alatoire qui chaque triplet associe la somme des deux premiers numros tirs. Par exemple. pour le triplet (J, 3, 3). on a X = 4. a) Donner les valeurs possibles de X; b) Dresser le tableau de la loi de probabilit de X; c) Calculer son esprance mathmatique. 3 0 Soit Y la variab le alatoire qui chaque triplet associe le double du troisime numro tir. a) Donner les va leurs possibles de Y. b) Calculer sous forme de fraction irrductible la probabilit de J'vnement X = Y.

1 On jette les deux ds. Tous les tirages sont quiprobables. On regarde la couleur des faces suprieures de chaque d. On note: A, l'vnement: les deux faces son t rouges . - B, l'vnement: les deux faces sont de la mme couleur . - C, l'vnement l'une des faces est rouge et l'autre verte . D. l'vnement: toC les deux faces sont de couleurs diffrentes >t.Expliquer pourquoi PlA) Calcu ler P(B) el P(D).

= 2. el P(C) = Il.36 36

r chaque jet de ces deux ds est

associ un jeu qui permet: un gain de 5 euros si les deux faces sont rouges, un gain de 2 euros si les deux faces sont vertes, une perte si les deux faces sont de couleurs diffrentes.

Chap. 3 : Variables alatoires valeurs relles

123

("1- _

J 1) ; Pour a) et b) les ri,fII/tats seront arrondis li 1'0- 3. c) pour 11 = 50 et p = 0,5 P(X = 0), P(X = 49), P(X < 50), E(X); dl pour Il = 100 et p = 0,05 P(X = 0), PIX = 1(0), P(X = 2), Ei>-1. Pour c) et d) 011 donnera lt! premier chiffre 1/011 nu/ du rlst/ltat.

;

C : L'c han tillon comporte au moins deux pices dfectueuses lt. Tous leJ rb ullats llpprochts serofll arnmdi.\ JO- 3.

~ AbsentismeUn chef d'entreprise a rali s une tude slir l'absent isme dans son q uipe de 50 employs. Soit X la variable alatoire qui, un jour tir au hasard dans une anne, associe le nombre d'employs absents ce jour-l. Une tude statistique permet d'admettre que la loi de probabilit de la variable alatoire X est donne par le tableau suivant:Valeur de X : x, (_d'_

].

f.-

Sachant que la variable alatoire X suit une loi binomiale ") et = a 2 V(X).

E(S,,) = ln E(S ); v(S,,) =.l. V(S ): ,,211/1

11

E(S,,) = p. n donc v(S,,) = p(l donc"

l')

/1

Il

S L'cart type de -1! est '11'(1Il

Il

l') .

Chap. 4 : chantillonnage

147

L'vnement: Sn prend une valeur appartenant/1

l'intervalle l' -

, 11'(1 - 1')

[

V

/1

'

l'

+

Voir le rappel sur la valeur ab ~lu e dan s le chapitre 1 du tome d'AnalyJe (mmes auteurs):A1

s'crit:

1~7

- pl ,,; yp(l[

Il

l')

B1

a

b

"1

La distance AB est lb - al.

y/~

"' Son venement contratre s 'cnt De mme:

-IS"il """'

11'(1 p > ,V

l

Il

l')

[

1 l~

2

y

P(1 - p)

---

"

Et

--------+[--------,j-c-------~-Jr---------

S" I Il

P

1 >2,6,

V

11'(1 - l')11

Thorme (admis)Pour tout nombre entier nP est fix dan s [O. 1].

>

0 et pour tout nombre rel t

>

0,

Ce thorme indique que, pour n'importe quel nombre rel, > et S nombre entier Il> 0, la variable -.2!.. mesurant la frquence d'appariIl

tion d'un vnement A de probabilit p au cours de Il expriences ind-

pendantes, prend une valeur extrieure l'intervalle

1'-1 [ Y

p(l/1

l')

,1'+1

yp(1Il

l')

1

[

P1

avec une probabilit infrieure ou gale ~. rp)

t

y,,(1"

-

148

Par exemple, A est J'\-'nement prlever au hasard un garon dans une classe compose de 18 filles el de 12 garons lIo, Ima&inon~ alors une urne avec 30 boules corre~pon dam aux 30 l\'es de la dasse et effectuon.s 200 tirages d'une boule en remellant chaque fois la boule tire dans J'urne.'fi

Exemples1. l'

= 0,4 ; II = 200 ; r =

10.

p(I S200 _0041 10"0,42000,6 _1_. > x 20 ' V 100Donc

p( 1~~~ -

0,41

> 0,35) 0,01.0,4

p(ii) ~ 1 - P(B)

1 - 0,01

~

0,99.

l'issue de 200 tirages, la frquence d'apparilion d'un garon est infrieure 0,05 ou suprieure 0,75 avec une probabilit infrieure ou gale 0,01. En consquence, cette frquence est comprise entre 0,05 et 0,75 avec une probabilit suprieure ou gale 0,99.

On effectue 10000 tirJges dans les mailles condition:",

2, l' = 0,4 ; Il = 10 000 ; r = 10.Nous obtenons de mme

p(l~b~ - 0,41 > 0,049)

0,01.

L'intervalle [0,05 ; 0,75] esl remplac par [0,35 1 ; 0,449].p est un nombre th dans lO, 1].

Remarquons sur ces exemples que, quand 11 augmente, t tant constant, l'amplitude de l'intervalle diminue.t et p SOn! fixs, t

> 0,

D'autre part, r' 1 1 1'( ' donc limII--t+oo

V

l') =Il

ni p(1o.

p) _I_ et lim

y;;

_1- = 0;

11

--t + 00

y;;

r' 11'...;(_---,p-,-) = 1

V

II

Ainsi:

Il suffit de choisir t assez grand,

Avec une probabilit 1 --\,choisie aussi grande que l'on veut, Sn

r

n

prend une valeur aussi proche que l'on veut de p lorsque n est suffisamment grand: c'est la loi faible des grands nombrPs.

Remarques 1. Jacques Bernoulli avait mis ce phnomne en vidence vers 1700,Voir Mat"bnatiqll~s (lIIftl d~s g~.t - IREM. Groupe pistmologie et des mathmatiques histoire (Gauthier - Villars).

Voir le chapitre 2 p:lragraphe D.

comme le rappelle Laplace, un sicle plus tard: En multipliant indfiniment les observations et les expriences, le rapport des vnements de diverses natures qui doivent arriver approche de celui de leurs possibilits respectives, dans des limites dont l' intervalle se resserre de plus en plus et devient moindre qu'aucune quantit assignable. 2. La loi faible des grands nombres justifie le point de vue des frquentistes qui attribuent comme probabilit d'un vnement une valeur aulour de laquelle la frquence d'apparition de cet vnement se stabilise lorsque le nombre d'expriences indpendantes devient trs grand.

Chop. 4 : chantillonnage

149

Ce point de vue, oppos :\ celui de!. f~quenlisles 10 , est dit bayesien _, en hommage au rvrend anglai s Thomas Bayes, auteur en 1763 d' un essai. Drx:trill~ of

dumas.

Cependant, par ex.emple en conomie, il n'est pas toujours possible d'effectuer de telles expriences, et on peut alors tre conduit fi xer a priori la valeur attribue il la probabilit d ' un vnement; on contrle et ventuellement valide ce choix a posteriori, en tudiant ses consquences. 3. La loi faible des grands nombres a une grande importance thorique, mais elle conduit, dans bien des cas, choisir des valeurs de Il beaucoup trop grandes. En effet, cette loi s' appuie sur un rsultat de porte trs gnrale, l'ingalit de BienaymTchebychev qui, dans des cas particuliers. peut tre amlior.

B. THEOREME DE LA LIMITE CENTREE1. CAS PARTICULIERSoit Xl ' X2 ... Xi" ... X", Il variables alatoires indpendantes suivant toutes la mme loi normale X( /J.,u). Pour tout i, 1 ~ i ~ " . on a E(X j ) = I-L. Donc E(X t + X + ... + X,.) =

,

,

,

Xi sui t la loi .N'( IL, (1). E(X + Y) ~ E(X) + E(Y).E({jX)

= ({X).

2

II/J..

EtE(X tX; suil la loi X(IJ-. 0").

+

2 X:

...

+X,,) = /J..

De mme, pour tout i , 1 ~ i ~ Il, on a V(X j ) = 0.2. Les variables alatoires Xj tant indpendantes, on a V(X] + ... + X,,) = V(X]) + ... + V(X,.). Donc V(X t Et V ( Xl

+ ... + X,,) = IIU- . + X2 + ... + XII) - - , - - 2 _na 2 _ a . Il

,

11-"

Celte notation mppelle la moyenne arithmtiGue dfinie en MatiOCie au premier

tirage le solde du premier livret ainsi tir; de mme pour X'l: .. , XII'

Considrons une population d'effectif N, de moyenne m et d'cart type CI. Prlevons, dans cette population, un chantillon (alatoire) de taille II ; on note x la moyenne de cet chantillon et (T' son cart type. Considrons les" variables alatoires XI' X2 , ... , Xi' ... , XII o chaque variable alatoire Xi' 1 ~ i ~ Il, associe au i-me tirage le nombre correspondant l'lment choisi.

152

Un tel chantillonnage alatoire de laille II, obtenu avec;: remise. est ainsi con

t

Jmthod~

C. Miu0

~n

uvre de la

r

En ralit P est inconnu et la frquence du seul chantillon prlev est 0,2,

1 Loi de probabilit de la variable alatoire FSoit F la variable alatoire qui, tout chantillon de taille n = la, prlev au hasard et avec remi se, associe la frquence de ses lments dfectueux,

partir de la frquence de cet chantillon, nous allons dterminer les extrmits Pl et P2 de l'intervalle deconfiance [Pl' P2] avec le coefficient de confiance 95 %, c'est--dire avec le risque 5 %, de la faon suivante qui s'appuie sur les observations du paragraphe 1 o le risque 5 % est partag en deux parts gales, gauche de Pl et droite de P2'0,21

La taille n de l'chantillon est trop petite pour que l'on puisse utiliser l'approximation de la loi F par une loi normale.Cependant F est lie la variable 5 10 qui tout chantllon de taille n = la, prlev au hasard et avec remise, associe le nombre de ses lments dfectueux par la relation F =

10'

SIO

a) Pl est le plus grand nombre p de l'intervalle [0, 1] vrifiant la condition suivante: si on prlve un trs grand nombre d'chantillons de taille 10, au hasard et avec remise, dans la production o la frquence d'lments dfectueux estp, alors moins de 2,5 % de ces chanti llons a une frquence f d'lments dfectueux suprieure ou gale 0,2,0,21

D'aprs la remarque 1 du paragraphe D du chapitre 4, nous connaissons la loi de probabilit de F: c'est une loi discrte lie la loi binomiale suivie par S 10' Plus prcisment F peut prendre chacune des onze valeurs Ik ' o k est un nombre. entier tel que a ~ k ~ la, O avec la probabilit P(F = Jko) = ctopk (l - p)I 0,

p(m - ..!Q.,,;; X ,,;;Vii188

ln

+

..!Q.) = Vii

2IJ(t) - 1.

Cest un cas part iculier trs

uli l i~.

En par ti culi er, comme 2Il(r) - 1 = 0,95 pour r = 1,96, on a ici P(775,92 .. X .. 784,08) = 0,95. Ainsi, en supposant que m = 780, on sait, ava nt de prlever un cha ntillon alatoire de taille 36. que sa moyenne appartient l'intervalle [775,92 ; 784,08] avec la probabilit 0,95.

HO:

tri

=

780.

Autre ment dit, si l' hypoth se Ho est vraie, il n'y a que 5 % de chances de prlever un chantillon alatoire de taille 36 dont la moye nne soit inf rieure 775,92 ou suprie ure 784,08.

C. On fixe alors la rgle de dcision suiva nte:On prlve un chantillon alatoire non ex hausti f de taille n = 36 et on calc ul e sa moye nn e

x.

Si Si

x E 1775.92 ; 784.08). on accepte Ho' x fi [775.92 ; 784.08). on rejette Ho'Rgion cri tique ; Rgion : critique

0.025

0.95

0,025

On rejette Ho

------

780

7K4.08

----------------- ----------------~On accepte Ho

On rejellt' Ho

------

Ne p:IS oublier qu'en ralit on ne sait pas si Ho est vraie ct qu'il faut bien fixer une b:t.rrihe pour dider entre les deux choix possibles: 011 accepte ou on rejette Ho. On lim ite ainsi les risques d'erreur de premire e.~pce.Nou~ avons dj donn celte ~po n se au a, dans une note en marge. en utilisant l'intervalle de confiance de fil au coefficient de confiance 95 % : ces deux rponses M>nt cohrentes, car ce sont deux consquences de J'ing:t.lit:

Si HOest vraie, on prend donc le risq ue de se trompe r dans 5 % des cas en rejetant tor t Ho' On dfinit ainsi un e rgion critique au seuil (de signiti cation) 0 = 5 %. Le seuil u est la probabilit de rejete r Ho alors qu e Ho est vraie. Il correspond l'erreur de premire espce. En gnral, on fi xe li priori la vale ur de a. Iei, on a choisi a = 0,05.

Application de la rgle de dcisionCo mme x = 774,7 pour l'chantillon considr, on a x < 775,92 et on rejette l'h ypothse Ho ; au seuil 5 %, on consid re que les 500 pices de la popul ation n'ont pas une masse moyenne de 780 g el o n re fuse la li vraiso n.

",-1'> \ ,96.~

V"mj'

> x + \ ,96fn d'une pari,< m = \.96fnd'autre parI.

Ch.p. G : Test de validit d'hypothse

189

Comme on l'a vu au chapilre 3,211(1) -

d.

1 = 0,99 pour

1=

2.58 el

Nous aurions pu choisir 1 % comme se uil pour diminuer le ri sque de rejeter H o alors que Ho est vraie. On a P(774,62 .. X .. 785,38) = 0,99.Rgion critique 0,99

alol"\ ' - 5,38. ..!!,..

vu

; Rgion : crilique

i = 774.7.

774,62--; x

780 On accepte Ho

l' 785,38

---------- ---------~

P [u~ le ~ uil diminue. plu .. !a rgion d'aCCeplJ tion de Ho augmente.

Au se uil 1 %, on accepte Ho puisque :r appartient l'intervalle [774,62; 785,38] ; au se uil l %, on consid re que les 500 pices ont une masse moye nne de 780 g et on accepte la livraison. Mais en acceptant Ho au seuil 1 %, on court un second ri sque, celui d'accepter Ho alors que Ho est fausse: c'est l'erreur de seconde espce, dont la probabi lit est note fl.

Ne pas oublier qu'on ne sait pas si Ho est vraie ou fau s~.

fl est la probabilit d'accepter Ho alors que Ho est fausse .J - 13 est la probabilit~ de rejeter HO alors que Ho eSI fausse: l.:'e51. par dfinition, la puissance du test.

L' idal serait de rendre les nombres a et fl les plus petits possibles, mais, comme on le constate dans cet exemple, en diminuant ex on ag randit la rgion d 'acceptation de Ho donc, le plus souvent, on augmente la probabilit fl d'accepter Ho alors que H o est fausse . En gnral, " tant fi x, quand ex diminue, ~ augmente et inverse men t. La se ule faon de diminuer en mme temps ex et ~ est d'augmenter Il, ce qui n'est pas toujours possible. En fait, la plupart du temps, les erreurs des deux types n'ont pas la m me importa nce, et on essaie de limiter la plus grave. On doit dfinir plus prcisment le cas o Ho est fa usse. Dans ce qui prcde, on a choisi implicitement III 780 co mme hypo thse alternative Hl .

Cela eSI relier au fait que lorsque " augmente, l'cafl type de X

%

diminue. V Il Par exemple, leurs consquencesfinan cires peu ve nt tre diff-

renies.

e.

HO :m=780.

*

Le test es t alors bilatral, car la rgion critique est si tue des deux cts de la rgi on o l' on accepte H o.Pour un mme seui l. la va leur de tn'eS pas l a mme pour un test bilaI

lr.ll el pour un leSI unilatral: voir le paragraphe 2.f.

Mais on peut rencontrer des situations diffrente s et, par exempl e, choisir III < 780 comm e hypothse alternative HI ; le test est alors unila tral et la rgion critique est alors situe entirement d' un ct, ici gauche, de la rgio n o 1'on accepte Ho.

190

f.Respectant stri Clemell1 le s programmes. nous nous limitons ici tl une initiation el donc aux problmes l-menlares sur les tesb de validi l d'hypOlhse. Pour le choix de H O' voir la remarque du paragraphe 2.e : Ho doit lre une galit mme pour un test unilal~ral. Ce paramtre peut tre une moyenne, un pourcentage ... li est irnporlant de d isti nguer. d'une part, la construction du test effectue avant le prl\'t'ment d'un chantillon et, d'autre parI, l'ulili sation de ce test qui dbouche sur une dcision Mpend'lOt de J'chan tillon.

Rsum retenir

En g nral, les questions faisant intervenir un test de validit d' hypothse peuvent tre rsolues en adoptant le plan sui vant :A.CO~TRUcnONDU~~

1. Choix de l'hypoth~.., nulle Ho et de l'hypothse alternative Hl'

2. Dtermination de la rgion critique un seuil t est l'vnement contraire de T ~ t. Donc P(T > 1) = 1 - P(T .. 1), P(T > t) = 1 - F(I). En fiabilit, ce nombre es1 not R(t).

y

J = R(t)

o

R(ll esl la probabilil qu'un dispositif prleY au hasard dans la population considre n'ait pas