1 - Programme de Seconde (juin 2009) Statistique et probabilités Statistique et probabilités

Preview:

Citation preview

1 - Programme de Seconde (juin 2009)

Statistique et probabilitésStatistique et probabilités

1 - Programme de Seconde (juin 2009)

Statistique et probabilitésStatistique et probabilités

Quand on doit décrire une population comportant un grand nombre d'individus, on ne peut pas ou on ne veut pas, en général pour des raisons économiques, en faire une étude exhaustive.

Les observations ne portent alors que sur un nombre restreint d'individus à sélectionner selon un protocole expérimental.

Les individus sélectionnés et leur ordre de sélection constituent un échantillon, leur nombre est la taille de l'échantillon.

Quand on doit décrire une population comportant un grand nombre d'individus, on ne peut pas ou on ne veut pas, en général pour des raisons économiques, en faire une étude exhaustive.

Les observations ne portent alors que sur un nombre restreint d'individus à sélectionner selon un protocole expérimental.

Les individus sélectionnés et leur ordre de sélection constituent un échantillon, leur nombre est la taille de l'échantillon.

2 - Échantillons2.1 - Définitions2.1 - Définitions

2 - Échantillons2.2 - Comment prélever un échantillon ?

Lors d’une prise de décision à partir d‘un échantillon, pour que les résultats de la théorie des probabilités s'appliquent, il est important que l'échantillon soit prélevé au hasard.

Chaque individu de la population doit avoir la même probabilité d'être sélectionné.

échantillon aléatoire.

2.2 - Comment prélever un échantillon ?

Deux types d'échantillons :

– Échantillons exhaustifs ou constitués sans remise

– Échantillons non exhaustifs ou constitués avec remise Le programme de Seconde 2009 ne retient que ce type d'échantillons :

2 - Échantillons2.2 - Comment prélever un échantillon ?

"Un échantillon est constitué des résultats de n

répétitions indépendantes de la même expérience".

L'échantillonnage est l'étude des distributions de fréquences de variables définies sur l’ensemble des échantillons (proportion, moyenne, variance…).

2 - Échantillons2.3 - Échantillonnage2.3 - Échantillonnage

On considère une population de 4 enfants : Adeline, Benjamin, Clara et David, d'âges respectifs 12, 13, 14 et 15 ans et on s'intéresse aux enfants de plus de 14 ans et demi. Il y en a une proportion p = 1/4 dans la population-mère.

On constitue (avec remise) des échantillons de taille 3.

On peut ainsi constituer 43=64 échantillons.

3 - Distribution de fréquences de la proportion d’échantillonnage

3.1 - Un premier exemple3.1 - Un premier exemple

Tirage d’une boule dans une urne contenant 1 boule blanche et 3 rouges

Tirage d’une boule dans une urne contenant 100 boules blanches et 300 rouges

Lancer d’un dé tétraédrique équilibré et obtention d'une des faces

Roue de loterie dont un quart est peint en rouge et le reste en bleu et obtention du rouge

3 - Distribution de fréquences de la proportion d’échantillonnage

3.2 – D’autres situations similaires3.2 – Des situations similaires

3 - Distribution de fréquences de la proportion d’échantillonnage

3.3 - Exemples

échantillons de taille 3

0%

5%

10%

15%

20%

25%

30%

35%

40%

45%

0 1/3 2/3 1

Proportion d'enfants de plus de 14 ans et demi

fréq

uen

ces

3 - Distribution de fréquences de la proportion d’échantillonnage

3.3 - Exemples

échantillons de taille 10

0%

5%

10%

15%

20%

25%

30%

0 1/10 2/10 3/10 4/10 5/10 6/10 7/10 8/10 9/10 10/10

Proportion d'enfants de plus de 14 ans et demi

fréq

uen

ces

3 - Distribution de fréquences de la proportion d’échantillonnage

3.3 - Exemples

échantillons de taille 30

0%

2%

4%

6%

8%

10%

12%

14%

16%

18%0

2/30

4/30

6/30

8/30

10/3

0

12/3

0

14/3

0

16/3

0

18/3

0

20/3

0

22/3

0

24/3

0

26/3

0

28/3

0

30/3

0

Proportion d'enfants de plus de 14 ans et demi

fréq

uen

ces

3 - Distribution de fréquences de la proportion d’échantillonnage

3.3 - Exemples

échantillons de taille 100

0%

1%

2%

3%

4%

5%

6%

7%

8%

9%

10%0

5/10

0

10/1

00

15/1

00

20/1

00

25/1

00

30/1

00

35/1

00

40/1

00

45/1

00

50/1

00

55/1

00

60/1

00

65/1

00

70/1

00

75/1

00

80/1

00

85/1

00

90/1

00

95/1

00

100/

100

Proportion d'enfants de plus de 14 ans et demi

fréq

uen

ces

Résultat 1 :Les proportions observées sont de plus en plus souvent proches de la proportion du caractère dans la population-mère lorsque la taille de l'échantillon n augmente.

3 - Distribution de fréquences de la proportion d’échantillonnage 3.4 – Quand n augmente

Résultat 2 :Lorsque n est grand la distribution de fréquence de la proportion d’échantillonnage s'approche d'une "distribution en cloche".

3 - Distribution de fréquences de la proportion d’échantillonnage 3.4 – Quand n augmente

échantillons de taille 100

0%

1%

2%

3%

4%

5%

6%

7%

8%

9%

10%1/

100

6/10

0

11/1

00

16/1

00

21/1

00

26/1

00

31/1

00

36/1

00

41/1

00

46/1

00

51/1

00

56/1

00

61/1

00

66/1

00

71/1

00

76/1

00

81/1

00

86/1

00

91/1

00

96/1

00

Proportion d'enfants de plus de 14 ans et demi

fréq

uen

ces

échantillons de taille 100

0%

1%

2%

3%

4%

5%

6%

7%

8%

9%

10%1/

100

6/10

0

11/1

00

16/1

00

21/1

00

26/1

00

31/1

00

36/1

00

41/1

00

46/1

00

51/1

00

56/1

00

61/1

00

66/1

00

71/1

00

76/1

00

81/1

00

86/1

00

91/1

00

96/1

00

Proportion d'enfants de plus de 14 ans et demi

fréq

uen

ces

L’intervalle de fluctuation d’une fréquence ou proportion à 95%, pour des échantillons de taille n, est l’intervalle :

– d'amplitude minimale, – centré autour de p, proportion du caractère dans la population,

– contenant la proportion observée sur un échantillon aléatoire de taille n, avec une probabilité au moins égale à 0,95.

4 - Intervalles de fluctuation4.1 - Définition4.1 - Définition

Échantillons de taille 10 issus d'une population contenant 1/4 d'enfants de plus de 14 ans et demi :

0/10 5,6 %

1/10 18,8 %

2/10 28,2 %

3/10 25,0 %

4/10 14,6 %

5/10 5,8 %

6/10 1,6 %

7/30 0,3 %

8/10 0,0 %

9/10 0,0 %

10/10 0,0 %

p = 25 %

Distribution des fréquences

4 - Intervalles de fluctuation4.2 - Détermination

échantillons de taille 10

0%

5%

10%

15%

20%

25%

30%

0 1/10 2/10 3/10 4/10 5/10 6/10 7/10 8/10 9/10 10/10

Proportion d'enfants de plus de 14 ans et demi

fréq

uen

ces

4.2 - Détermination

Échantillons de taille 10 issus d'une population contenant 1/4 d'enfants de plus de 14 ans et demi :

0/10 5,6 %

1/10 18,8 %

2/10 28,2 %

3/10 25,0 %

4/10 14,6 %

5/10 5,8 %

6/10 1,6 %

7/30 0,3 %

8/10 0,0 %

9/10 0,0 %

10/10 0,0 %

p = 25 % 86,6 %

Distribution des fréquences

échantillons de taille 10

0%

5%

10%

15%

20%

25%

30%

0 1/10 2/10 3/10 4/10 5/10 6/10 7/10 8/10 9/10 10/10

Proportion d'enfants de plus de 14 ans et demi

pou

rcen

tage

d'é

chan

tillo

ns

4 - Intervalles de fluctuation4.2 - Détermination

échantillons de taille 10

0%

5%

10%

15%

20%

25%

30%

0 1/10 2/10 3/10 4/10 5/10 6/10 7/10 8/10 9/10 10/10

Proportion d'enfants de plus de 14 ans et demi

fréq

uen

ces

Échantillons de taille 10 issus d'une population contenant 1/4 d'enfants de plus de 14 ans et demi :

p = 25 %

0/10 5,6 %

1/10 18,8 %

2/10 28,2 %

3/10 25,0 %

4/10 14,6 %

5/10 5,8 %

6/10 1,6 %

7/30 0,3 %

8/10 0,0 %

9/10 0,0 %

10/10 0,0 %

98 %

Distribution des fréquences

L'intervalle de fluctuation est [0 ; 0,5].

4 - Intervalles de fluctuation4.2 - Détermination

échantillons de taille 10

0%

5%

10%

15%

20%

25%

30%

0 1/10 2/10 3/10 4/10 5/10 6/10 7/10 8/10 9/10 10/10

Proportion d'enfants de plus de 14 ans et demi

fréq

uen

ces

Échantillons de taille 30 issus d'une population contenant 1/4 d'enfants de plus de 14 ans et demi :

0/30 0,0% 11/30 5,5% 21/30 0,0%

1/30 0,2% 12/30 2,9% 22/30 0,0%

2/30 0,9% 13/30 1,3% 23/30 0,0%

3/30 2,7% 14/30 0,5% 24/30 0,0%

4/30 6,0% 15/30 0,2% 25/30 0,0%

5/30 10,5% 16/30 0,1% 26/30 0,0%

6/30 14,5% 17/30 0,0% 27/30 0,0%

7/30 16,6% 18/30 0,0% 28/30 0,0%

8/30 15,9% 19/30 0,0% 29/30 0,0%

9/30 13,0% 20/30 0,0% 30/30 0,0%

10/30 9,1%

p = 25 %

4 - Intervalles de fluctuation4.2 - Détermination

Échantillons de taille 30 issus d'une population contenant 1/4 d'enfants de plus de 14 ans et demi :

0/30 0,0% 11/30 5,5% 21/30 0,0%

1/30 0,2% 12/30 2,9% 22/30 0,0%

2/30 0,9% 13/30 1,3% 23/30 0,0%

3/30 2,7% 14/30 0,5% 24/30 0,0%

4/30 6,0% 15/30 0,2% 25/30 0,0%

5/30 10,5% 16/30 0,1% 26/30 0,0%

6/30 14,5% 17/30 0,0% 27/30 0,0%

7/30 16,6% 18/30 0,0% 28/30 0,0%

8/30 15,9% 19/30 0,0% 29/30 0,0%

9/30 13,0% 20/30 0,0% 30/30 0,0%

10/30 9,1%

96,7 %

p = 25 %

4 - Intervalles de fluctuation4.2 - Détermination

L'intervalle de fluctuation est [0,1 ; 0,4].

4 - Intervalles de fluctuation4.2 - Détermination

échantillons de taille 30

0%

2%

4%

6%

8%

10%

12%

14%

16%

18%

0

2/30

4/30

6/30

8/30

10/3

0

12/3

0

14/3

0

16/3

0

18/3

0

20/3

0

22/3

0

24/3

0

26/3

0

28/3

0

30/3

0

Proportion d'enfants de plus de 14 ans et demi

fréq

uen

ces

11/100 0,0% 21/100 6,3% 31/100 3,4%

12/100 0,1% 22/100 7,5% 32/100 2,5%

13/100 0,1% 23/100 8,5% 33/100 1,7%

14/100 0,3% 24/100 9,1% 34/100 1,1%

15/100 0,6% 25/100 9,2% 35/100 0,7%

16/100 1,0% 26/100 8,8% 36/100 0,4%

17/100 1,7% 27/30 8,1% 37/100 0,2%

18/100 2,5% 28/30 7,0% 38/100 0,1%

19/100 3,7% 29/100 5,8% 39/100 0,1%

20/100 4,9% 30/100 4,6% 40/100 0,0%

Échantillons de taille 100 issus d'une population contenant 1/4 d'enfants de plus de 14 ans et demi :

25 %

11/100 0,0% 21/100 6,3% 31/100 3,4%

12/100 0,1% 22/100 7,5% 32/100 2,5%

13/100 0,1% 23/100 8,5% 33/100 1,7%

14/100 0,3% 24/100 9,1% 34/100 1,1%

15/100 0,6% 25/100 9,2% 35/100 0,7%

16/100 1,0% 26/100 8,8% 36/100 0,4%

17/100 1,7% 27/30 8,1% 37/100 0,2%

18/100 2,5% 28/30 7,0% 38/100 0,1%

19/100 3,7% 29/100 5,8% 39/100 0,1%

20/100 4,9% 30/100 4,6% 40/100 0,0%

4 - Intervalles de fluctuation4.2 - Détermination

11/100 0,0% 21/100 6,3% 31/100 3,4%

12/100 0,1% 22/100 7,5% 32/100 2,5%

13/100 0,1% 23/100 8,5% 33/100 1,7%

14/100 0,3% 24/100 9,1% 34/100 1,1%

15/100 0,6% 25/100 9,2% 35/100 0,7%

16/100 1,0% 26/100 8,8% 36/100 0,4%

17/100 1,7% 27/30 8,1% 37/100 0,2%

18/100 2,5% 28/30 7,0% 38/100 0,1%

19/100 3,7% 29/100 5,8% 39/100 0,1%

20/100 4,9% 30/100 4,6% 40/100 0,0%

Échantillons de taille 100 issus d'une population contenant 1/4 d'enfants de plus de 14 ans et demi :

95,1 %

4 - Intervalles de fluctuation4.2 - Détermination

L'intervalle de fluctuation est [0,17 ; 0,33].

4 - Intervalles de fluctuation4.2 - Détermination

échantillons de taille 100

0%

1%

2%

3%

4%

5%

6%

7%

8%

9%

10%

0

5/10

0

10/1

00

15/1

00

20/1

00

25/1

00

30/1

00

35/1

00

40/1

00

45/1

00

50/1

00

55/1

00

60/1

00

65/1

00

70/1

00

75/1

00

80/1

00

85/1

00

90/1

00

95/1

00

100/

100

Proportion d'enfants de plus de 14 ans et demi

fréq

uen

ces

Soit X1, X2,..., Xn une suite de n variables aléatoires indépendantes de même loi de probabilité admettant pour espérance mathématique et pour écart-type .

On pose : X =    (X1 + X2 + ... + Xn)._

_1n

5 - Des mathématiques5.1 – Espérance et variance de la moyenne

d’échantillonnage

_ n

X a pour espérance et pour écart-type .

Loi faible des grands nombres :Pour tout  > 0, P (|X - |  ) tend vers 1 quand n tend vers l'infini.

_

5 - Des mathématiques5.2 - Des théorèmes

_

n

Théorème limite central :Alors pour n grand, la loi de la moyenne X

peut être approchée par la loi normale de

paramètres et .

5.2 - Des théorèmes

•   (X1 + X2 + ... + Xn) évalue la proportion de

la propriété A dans l’échantillon, notons-la F.

•Dans une population statistique, on s’intéresse à une propriété A. On tire un échantillon de taille n.

Prenons pour variables Xi, les variables qui, à

chaque échantillon, associent la valeur 1 si le i-ème individu possède la propriété A et 0 sinon.

_ 1n

5 - Des mathématiques5.3 - Application à la fréquence ou proportion

d ’échantillonnage

• Comme l’espérance mathématique des variables aléatoires Xi est égale à p, alors d’après la loi des grands nombres

Pour tout  > 0, P (|F - p|  ) tend vers 1 quand n tend vers l'infini.

• La probabilité que F prenne une valeur éloignée de p de moins d’un fixé à l’avance tend vers 1 lorsque n tend vers l’infini.

5 - Des mathématiques5.3 - Application à la fréquence ou proportion

d ’échantillonnage

•Comme l’espérance mathématique et l'écart-

type des variables aléatoires Xi sont

respectivement p et , d’après le

théorème limite central :

p (1 p)n

Pour n grand, la loi de F peut être approchée

par

la loi normale de paramètres p et

.

5 - Des mathématiques5.3 - Application à la fréquence ou proportion

d ’échantillonnage

5 - Des mathématiques5.4 -Intervalle de fluctuation d’une fréquence

d’échantillonnage

Alors la loi de est approchée par la

loi

normale centrée, réduite.

On cherche un réel tel que

P(p   F  p + ) = 0,95

D'après le théorème limite central, pour n

assez grand (n 25), la loi de la F peut être

approchée par la loi normale de paramètres p

et .

p (1 p)n

L'équation P(p   F  p + ) = 0,95 devient :

La table de la loi

normale

centrée, réduite

donne

95 %

5 - Des mathématiques5.4 -Intervalle de fluctuation d’une fréquence

d’échantillonnage

L'intervalle de fluctuation est approché par :

Or 1,96 < 2 et pour 0,2 p 0,8,

on a donc 0,4 0,5

Ainsi 1,96 est compris entre 0,8 et

1.

5 - Des mathématiques5.4 -Intervalle de fluctuation d’une fréquence

d’échantillonnage

Finalement l'intervalle de fluctuation au seuil

de 95%, relatif aux échantillons de taille n,

est approché par l’intervalle :

Remarque : Cet intervalle contient l'intervalle :

5 - Des mathématiques5.4 -Intervalle de fluctuation d’une fréquence

d’échantillonnage

On constitue, avec remise, des échantillons de taille 40, dans une population. On considère une modalité d’un caractère qualitatif observée pour p =37 % des individus de la population.

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque 6.1 - Construction d'un abaque

On constitue, avec remise, des échantillons de taille 40, dans une population. On considère une modalité d’un caractère qualitatif observée pour p =37 % des individus de la population.

L'intervalle de fluctuation au seuil de 95%, relatif aux échantillons de taille 40, est [0,22 ; 0,52].

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque

Représentation de l'intervalle au seuil de 95%, relatif aux échantillons de taille 40 pour p =0,37.

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque

Représentation de l'intervalle au seuil de 95%, relatif aux échantillons de taille 40 pour p =0,37 et p =0,40.

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque

6 - Estimation par intervalle de confiance

6.1 - Construction d'un abaque

On souhaite estimer la proportion p (inconnue) d'individus présentant une propriété donnée dans une population statistique à partir d'un échantillon de taille 40 prélevé au hasard et sans remise.

Supposons que la propriété est observée dans l'échantillon avec une fréquence de 60 %.

On détermine ensuite les valeurs de p qui font en sorte que 0,6 appartienne à l'intervalle de fluctuation au seuil de 95 %, relatif aux échantillons de taille 40 associé à p .

6 - Estimation par intervalle de confiance6.2 - Utilisation de l'abaque6.2 - Utilisation de l'abaque

6 - Estimation par intervalle de confiance6.2 - Utilisation de l'abaque

Intervalle à 95 % de confiance de p

6 - Estimation par intervalle de confiance6.2 - Utilisation de l'abaque

Recommended