View
196
Download
1
Category
Preview:
Citation preview
Echantillonnage
____________
1 Le problème de l’échantillonnage
Il s’agit de déterminer des propriétés concernant des échantillons prélevés dans une
population donnée.
Nous ne considérons ici que des échantillons aléatoires, c'est-à-dire constitués d’éléments pris
au hasard dans la population.
Pour former un échantillon de taille n :
– Le tirage des n éléments de la population peut être sans remise ou exhaustif : n fois de
suite, on tire au hasard un élément de la population pour noter un résultat le
concernant , sans le remettre dans cette population.
On a une suite de n prélèvements d’un élément dans la population qui ne sont pas
indépendants les uns des autres.
– Le tirage des n éléments de la population peut être avec remise ou non exhaustif : n
fois de suite, on tire au hasard un élément de la population pour noter un résultat le
concernant, on le remet ensuite dans cette population.
On a une suite de n prélèvements d’un élément dans la population qui sont
indépendants les uns des autres.
2 Étude de la moyenne d’un échantillon
On considère une population sur laquelle est définie une variable numérique X de moyenne ou
d’espérance m et d’écart type .
Prélevons dans cette population un échantillon aléatoire de taille n, le tirage de ces n éléments
est avec remise ou non exhaustif.
Considérons les n variables aléatoires X1, X2, …, Xn où Xi donne la valeur fournie par X, à
l’élément obtenu au ième
tirage.
Les n variables aléatoires X1, X2, …, Xn sont indépendantes et suivent la même loi de
probabilité (celle fournie par X ) et ont toutes la même espérance m et le même écart type
La variable aléatoire )...(1
21 nXXXn
X associe à cet échantillon sa moyenne
(concernant la variable numérique X).
D’après le chapitre précédent, on a les résultats suivants :
① X est une variable aléatoire d’espérance m et d’écart type n
.
② Si X suit la loi normale N (m ; ), X suit la loi normale N (m ; n
).
③ Pour n suffisamment grand, X suit approximativement la loi normale N (m ; n
).
Remarque : Dans la plupart des cas où la population a un grand effectif dont on tire une faible
proportion d’éléments, on assimile un tirage sans remise à un tirage avec remise.
3 Étude d’exemples
Énoncés
① Une machine fabrique des pièces de forme circulaire en grande série. A chaque pièce tirée
au hasard, on associe son diamètre exprimée en millimètres ; on définit ainsi une variable
aléatoire X.
On suppose que X suit la loi normale N ( ; ) où 150 et = 0,21.
Soit M la variable aléatoire qui, à chaque échantillon de 400 pièces prélevées au hasard et
avec remise, associe la moyenne des diamètres des pièces de cet échantillon.
a) Déterminer la loi suivie par la variable aléatoire M .
b) Déterminer le nombre positif h tel que P(– h ≤ M ≤ + h ) = 0,95.
② Une machine fabrique des pièces en grande série. À chaque pièce tirée au hasard, on
associe sa longueur exprimée en millimètres ; on définit ainsi une variable aléatoire X.
On suppose que X suit la loi normale N ( m ; ) où met= 0,027.
Soit M la variable aléatoire qui, à tout échantillon aléatoire non exhaustif de taille n, associe la
moyenne des longueurs des pièces de l’échantillon.
a) Déterminer la loi suivie par la variable aléatoire M .
b) Déterminer n pour que P( 8,195 ≤ M ≤ ) ≥ 0,95.
Corrigés
① a) 20
21,0
400
=0,0105 et M suit la loi normale N (150 ; 0,0105) ; T=
0105,0
150M suit la loi
normale N (0 ; 1).
b) Avec 0< h,
P(– h ≤ M ≤ + h ) = P ( -h <M–µ=M–150< h) =P ( )0105,00105,00105,0
hµMT
h
soit P(– h ≤ M ≤ + h ) = 2 0105,0
h) – 1.
____________________________________
2 0105,0
h) – 1 pour 2
0105,0
h) = 1,95 soit pour
0105,0
h) = 0,9750 .
______________________________________
Avec les tables numériques, on fait l’approximation suivante :
P(– h ≤ M ≤ + h ) pour 0105,0
h = 1,96 soit pour h = 0,02 058 .
② a) M suit la loi normale N ( m ; )n
= N ( 28,2 ;
n
027,0).
b) T = )2,28(027,0/027,0
2,28
M
n
n
Msuit la loi normale N (0 ;1).
Soit q = P( 28,195 M 28,205), on fait intervenir des probabilités d’événements
équivalents : q = P ( -0,005 < M – 28,2<0,005) soit :
q = P( -0,005 027,0
n< T =
027,0
n(M–28,2)<0,005
027,0
n) d’où
q= P( - )27
5
27
5nTn = 2 ( n
27
5) –1
ainsi 0,95 < q 1,95 < 2 ( n27
5) 0,9750 < ( n
27
5).
___________________________
On fait l’approximation 0,9750= 1,96) et ainsi 0,9750 < ( n27
5) pour 1,96 < n
27
5,
soit pour n
5
2796,1, ou encore (
5
2796,1 )2 < n où
5
2796,1 ≈ 112,02
Finalement 0,95 < q pour 113 < n.
Finalement 0,95 < P( 28,195 M 28,205) pour 113 < n .
4 Étude de la fréquence d’une propriété
On considère une population dont une proportion p de la population possède une certaine
propriété.
∗ On fait un tirage non exhaustif dans la population pour former un échantillon de taille n.
Soit S la variable aléatoire donnant le nombre d’éléments de cet échantillon qui possèdent la
propriété considérée.
Pour constituer l’échantillon, on a une suite de n épreuves :
Chaque épreuve consiste à tirer au hasard un élément de la population, à donner un
résultat dans l’alternative [« propriété réalisée », «propriété non réalisée »], on remet
alors cet élément dans la population.
Dans n’importe la quelle des épreuves, p est la probabilité d’obtenir le résultat
« propriété réalisée » .
Ces n épreuves se déroulent de façon indépendante.
A la fin de cette suite de n épreuves, S donne le nombre de fois que l’on a trouvé le résultat
« propriété réalisée ». De cette manière :
S suit la loi binomiale ℬ(n ; p) ; S a pour espérance np et écart type )1( pnp .
Soit F = n
1S ; F est la variable aléatoire qui donne la proportion d’éléments de l’échantillon
qui possèdent la propriété considérée.
Comme n
1(np)= p et
n
pp
n
pnppnp
n
)1()1()1(
12
,
F a pour espérance n
1(np)= p et pour écart type
n
pp )1( .
∗∗ En fait pour n suffisamment grand,
F suit approximativement la loi normale N (p ; n
pp )1( ).
∗∗∗ Remarque
S et F sont 2 variables aléatoires discrètes :
S peut prendre pour valeur toute nombre k entier compris entre 0 et n, F peut prendre pour
valeur tout fraction n
k où k est un entier compris ente 0 et n.
Ainsi dans l’approximation de la loi de F par la loi normale N (p ; n
pp )1( ), on peut être
amené à effectuer une correction de continuité.
5 Exemple
Dans une population on constate qu’il naît 52 % de garçons et 48 % de filles.
On suppose que la variable aléatoire F qui, à tout échantillon de taille n = 400 prélevé au
hasard et avec remise dans la population, associe le pourcentage de garçons dans cet
échantillon suit une loi normale N (p ;
On se propose de prélever un échantillon aléatoire non exhaustif de 400 nouveau-nés.
1. Quelles valeurs prend-on pour p et ?.
2. Quelle est la probabilité d’avoir dans un tel échantillon, un pourcentage de garçons compris
entre 50 % et 54 % ?
3. Quelle est la probabilité d’avoir, dans un tel échantillon, un pourcentage de filles inférieur à
45 % ?
Résolution
On transforme les pourcentages en nombres décimaux et on considère que F est la variable
aléatoire qui, à tout échantillon de taille n = 400 prélevé au hasard et avec remise dans la
population, associe la proportion de garçons dans cet échantillon.
1. F suit une loi normale N (p ; .
On prend p= 0,52 (avec 1–p = 0,48) et
= 39100
1
10
4
100100
313
10
4
100
1603,013,0
400
48,052,0)1(
n
pp ,
soit = 0,004 39 .
T= )52,0(39
250)52,0(
39004,0
1
FF
pF
suit la loi normale N (0 ;1).
2. On fait intervenir des événements équivalents et leur probabilité :
P(0,5 F 0,54) = P( -0,02 F– 0,52 0,02) soit
P(0,5 F 0,54)= P( -0,02 × 39
250
39
250(F–0,52) 0,02×
39
250) soit
P(0,5 F 0,54) = P( - 39
5 T
39
5) = 2
39
5) –1 .
On fait des approximations 39
5=0,80 et
39
5)= 0,7881, alors P(0,5 F 0,54) = 0,58 .
3. L’événement étudié est (0,55 < F) et on a en faisant intervenir des événements équivalents
P(0,55 < F) = P (0,03 < F– 0,52) = P( 0,03×39
250 <
39
250( F– 0,52)) soit
P(0,55 < F) = P ( T39
5,7) = 1–
39
5,7 ) .
On fait des approximations 39
5,7=1,20 et
39
5,7) = 0,8849, alors P(0,55 < F) = 0,12 .
Recommended