51
1 Séquence 9 – MA02 Lois normales, intervalle de fluctuation, estimation Séquence 9 Sommaire 1. Prérequis 2. Lois normales 3. Intervalles de fluctuation 4. Estimation 5. Synthèse de la séquence © Cned - Académie en ligne

Lois normales, intervalle de fluctuation, estimation

  • Upload
    dinhthu

  • View
    232

  • Download
    1

Embed Size (px)

Citation preview

1Séquence 9 – MA02

Lois normales, intervalle de fluctuation, estimation

Séquence 9

Sommaire

1. Prérequis2. Lois normales 3. Intervalles de fluctuation 4. Estimation 5. Synthèse de la séquence

© Cned - Académie en ligne

2 Séquence 9 – MA02

Dans le chapitre 2, après le rappel et l’approfondissement des résultats connus sur les lois binomiales, le théorème de Moivre-Laplace est énoncé. On introduit alors la loi normale réduite centrée, loi à den-sité sur ,� et les autres lois normales.

Dans le chapitre 3, on  étudie des intervalles de fluctuation des variables aléatoires FXnnn= ,

fréquences des variables aléatoires binomiales Xn de paramètres n et p. On étudie quelques exemples de prise de décision.

Dans le chapitre 4, on aborde l’estimation d’une proportion inconnue à partir de celle d’un échantillon.

Cette séquence pourra vous paraître difficile au premier abord.

Le monde des probabilités et des statistiques est différent des autres par son sujet et ses méthodes.

Il faut vous y plonger et, au fur et à mesure, vous vous familiariserez avec ces notions.

Les premiers exercices vont montreront comment utiliser les résultats du cours et les calculs sont souvent simples à réaliser.

© Cned - Académie en ligne

3Séquence 9 – MA02

1 PrérequisFonctions

Les lois normales sont des lois à densité, on utilisera donc les résultats des séquences précédentes sur les fonctions et le calcul intégral.

Probabilité

1. Espérance et écart-type d’une variable aléatoire

On rappelle que, dans le cas fini, on a la propriété suivante.

Propriété

Soit X une variable aléatoire et deux nombres réels a et b.

On a alors : E E( ) ( )aX b a X b+ = + et σ σ( ) ( ).aX b a X+ =

Signalons que l’on dit aussi «  moyenne  » pour désigner l’espérance d’une variable aléatoire.

2. Loi binomiale

Soit X la variable aléatoire définie par le nombre de succès obtenus quand on répète n fois de façon indépendante une expérience ayant deux résultats possibles, réussite de probabilité p et échec de probabilité 1− p. La loi de probabilité de X est la loi binomiale de paramètres n et p, notée B ( ).n p;

Définition

A

B

© Cned - Académie en ligne

4 Séquence 9 – MA02

Propriétés La loi binomiale

On a P X knk

p pk n k( ) ( )= =

− −1 pour tout entier k tel que 0 ≤ ≤k n, le

nombre nk

est un coefficient binomial qui se lit « k parmi n » et qu’on

peut déterminer avec une calculatrice.

On a E( )X np= et σ ( ) ( ).X np p= −1

Représentation graphique d’une loi binomiale

0 1 2 3 4 5 6 7 8 9 10111213141516171819200,000

0,050

0,100

0,150

0,200

0,250

n=20 et p=0,7 P(X=k)

k

prob

abili

Utiliser une calculatrice ou un tableur.

Avec un tableurSoit X une variable aléatoire suivant la loi binomiale de paramètres n et p.

La syntaxe LOI.BINOMIALE(k ; n ; p ; FAUX) ou LOI.BINOMIALE(k ; n ; p ; 0) renvoie la probabilité P X k( ).=

La syntaxe LOI.BINOMIALE(k ; n ; p ; VRAI) ou LOI.BINOMIALE(k ; n ; p ; 1) renvoie la probabilité cumulée P X k( ).≤

Avec une calculatrice TI (84, mais aussi 83 et 82 avec des modifications mineures)

Pour calculer P X k( )= lorsque X suit la loi binomiale B ( ),n p; on utilise l’instruction binomFdp( (que l’on obtient par l’instruction DISTR (touches 2ND VARS) et la touche 0) que l’on complète ainsi : binomFdp(n, p, k).

Ces calculatrices donnent aussi les probabilités P X k( )≤ par l’instruction binomFREPdp(.

Avec une calculatrice Casio (graph 35+ ou plus)

Pour calculer P X k( )= lorsque X suit la loi binomiale B ( ),n p; on utilise le menu STAT, on choisit DIST (touche F5) puis BINM (touche F5), Bpd (touche F1) et Var (touche F2).

On renseigne la boîte de dialogue  : Data  : variable ; valeur désirée : k ; Numtrial : n ; pro-babilité : p.

Avec une calculatrice Casio graph 25+Pro, pour calculer P X k( ),= il faut taper la formule ou avoir implémenté un programme.

� Exemple

© Cned - Académie en ligne

5Séquence 9 – MA02

3. Loi à densité

On dit qu’une fonction f, définie sur un intervalle I de �, est une densité de probabilité sur I lorsque :

la fonction f est continue sur I ;

la fonction f est à valeurs positives sur I ;

l’aire sous la courbe de f est égale à 1 u.a.

Définition

Soit f une fonction, définie sur I, qui est une densité de probabilité sur I.

On dit que la variable aléatoire X suit la loi de densité f sur l’intervalle I lorsque, pour tout événement J inclus dans I, la probabilité de l’événement

X( J)∈ est la mesure, en unités d’aire, de l’aire du domaine :

x y x y f xM ; ; J et 0 ( ) .{ }( ) ∈ ≤ ≤

j

O ic d

Définition

Propriété

Pour tout intervalle c dJ ;[ ]= de I, on a : P c X d f x xc

d≤ ≤( ) = ∫ ( ) .d

Pour tout réel α de I, on a : P X 0.( )= α =

© Cned - Académie en ligne

6 Séquence 9 – MA02

Pour deux intervalles J et J’, inclus dans I, tels que J J ,′∩ = ∅ on a :

P X P X P XJ J J J .( ) ( ) ( )∈ ∪ ′ = ∈ ′ + ∈

Définition

Propriété

Soit J un intervalle, on a : P X P XJ 1 J .( ) ( )∈ = − ∈

Échantillonnage

En statistiques, un échantillon de taille n est la liste des n résultats obtenus par n  répétitions indépendantes de la même expérience aléatoire. Ici l’expérience répétée est une épreuve de Bernoulli, c’est-à-dire qu’elle ne prend que deux valeurs : échec / réussite, oui / non, homme / femme, 0 / 1… 

Par exemple, un échantillon de taille 100 du lancer d’un dé dont on observe l’apparition ou non de la face 6 est la liste des résultats obtenus en lançant 100 fois le dé. Pour chaque lancer la probabilité de réussir (d’obtenir la face 6) est p,

la probabilité de l’échec (ne pas obtenir 6) est 1− p (p = 16

si le dé est bien équilibré).

Le nombre de réussites dans un échantillon de taille n suit la loi binomiale B ( ).n p;

On appelle f la fréquence du nombre de réussites dans l’échantillon.

Un intervalle de fluctuation au seuil de 95 %, relatif aux échantillons de taille n, est un intervalle où se situe la fréquence f observée dans un échan-tillon de taille n avec une probabilité supérieure à 0,95.

Définition

On a vu en Seconde que :

L’intervalle pn

pn

− +

1 1; est un intervalle de fluctuation approché au seuil

de 95 %, relatif aux échantillons de taille n.

Dans certains cas, la probabilité que la fréquence appartienne à l’intervalle

pn

pn

− +

1 1; est très proche de 0,95 mais en étant inférieure, c’est

pourquoi on dit que ce sont des intervalles de fluctuation « approchés ».

C

Commentaire

© Cned - Académie en ligne

7Séquence 9 – MA02

Cela a été admis après avoir observé des exemples obtenus, par exemple, par simulation.

Dans la pratique, on utilise l’intervalle pn

pn

− +

1 1; pour des probabilités p

comprises entre 0,2 et 0,8 et des échantillons de taille n supérieure à 25.

© Cned - Académie en ligne

8 Séquence 9 – MA02

2 Lois normales

Objectifs du chapitreOn observe d’abord, dans une activité, des représentations graphiques de lois binomiales, puis de lois binomiales centrées et réduites.

Le théorème de Moivre-Laplace est énoncé. Ce théorème théorise les observa-tions de l’activité 2 et montre l’utilité de la loi normale (0 ; 1)N de moyenne 0 et d’écart-type égal à 1.

On étudie donc la loi normale (0 ; 1)N qui est la loi normale de référence.

On termine par la définition des autres lois normales et des exemples d’utili-sation.

Pour débuter

Centrer et réduire

On dit qu’une variable aléatoire est centrée et réduite lorsque son espérance est nulle et son écart-type égal à 1.

Définition 1

Soit X une variable aléatoire prenant un nombre fini de valeurs, d’espérance m X= E( ), de variance V( )X et d’écart-type σ0 = V( )X non nul. Démontrer que :

la variable aléatoire ( )X m− a une espérance nulle ;

la variable aléatoire ZX m= −

σ0 est une variable aléatoire centrée et réduite.

Approche de la loi normale centrée et réduite

On montre dans cette activité la démarche qui, en partant des lois binomiales, amène à la loi normale centrée et réduite.

On fait cette approche en trois étapes.

A

B� Activité 1

� Activité 2

© Cned - Académie en ligne

9Séquence 9 – MA02

� Observation des représentations graphiques des lois binomiales

On donne ci-dessous deux représentations graphiques des probabilités obtenues par des lois binomiales B ( ).n p;

Il s’agit de diagrammes en bâtons, le logiciel OpenOffice dessinant les bâtons un peu épais. Il ne faut pas confondre avec des histogrammes.

0 2 4 6 8 10 12 14 16 18 20 22 24 26

00,020,040,060,08

0,10,120,140,160,18

Loi binominalen=40 p=0,2

Valeurs de k

prob

abili

té P

(X=

K)

0 3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48

0

0,020

0,040

0,060

0,080

0,100

0,120

0,140

Loi binominalen=50 p=0,7

Valeurs de k

prob

abili

té P

(X=

K)

Les lois, donc les représentations graphiques, dépendent des valeurs des para-mètres n et p, mais on observe, ici et aussi sur la représentation donnée dans les prérequis, une grande ressemblance entre ces graphiques. Toutes les représenta-tions graphiques des lois binomiales sont analogues.

Il semble que la probabilité maximum (le bâton de plus grande ordonnée) est obtenue pour la valeur moyenne, pour l’espérance qui vaut np.

� On associe à chacune de ces lois B ( )n p; une autre loi, centrée et réduite.

On utilise pour cela le résultat de l’activité 1.

Ainsi, à la variable aléatoire X, on associe la variable aléatoire centrée et réduite

ZX m= −

σ, soit Z

X npnp p

= −−( )

.1

0

–0,

93

–1,

54

1,54

2,16

–2,

16

–2,

78

2,78

3,39

4,01

–4,

01

4,63

–4,

63

–5,

25

–5,

86

–6,

48

–7,

1

–7,

72

–8,

33

–8,

95

–9,

57

–10

,18

–10

,8

–3,

39

0,93

Loi de ZZ=(X–np)/rac(np(1–p)) n=50 p=0,7

Valeurs de Z

0,15

Toutes les variables aléatoires Z centrées réduites définies à partir d’une loi bino-miale ont des représentations graphiques qui ont la même allure. Elles sont seu-lement plus ou moins « étalées », le maximum est plus ou moins grand.

© Cned - Académie en ligne

10 Séquence 9 – MA02

� Changement de représentation

Les sommets des bâtons semblent dessiner une courbe, qui est de plus en plus « visible » quand n grandit.

Pour définir cette courbe, puis utiliser une probabilité à densité, on change de représentation. On passe des diagrammes en bâtons où les probabilités sont représentées par la hauteur des bâtons, à des rectangles où les probabilités sont représentées par les aires des rectangles.

Les deux représentations sont illustrés ci-dessous sur un exemple où n n’est pas très grand. 

O

0,2

1

loi de X : B(n,p)n = 20 et p = 0,7Z = (X–14)/ 4,2

loi de probabilité de Z : ordonnées des bâtons

Le rectangle correspondant au bâton en couleur est aussi en couleur sur la repré-sentation suivante (analogue à un histogramme). L’axe des ordonnées permet de repérer les densités, comme on l’a vu dans la séquence 8 (Lois à densité).

O 1

densité

probabilité : 0,025

loi de X : B(n,p)n = 20 et p = 0,7Z = (X–14)/ 4,2

loi de probabilité de Z : aires des rectangles

Chaque bâton est remplacé par un rectangle. La mesure de l’aire du rectangle est égale à la probabilité. Comme toutes les bases des rectangles ont la même longueur, les aires des rectangles sont proportionnelles aux hauteurs de ces rec-tangles et donc les hauteurs des rectangles sont proportionnelles aux hauteurs

© Cned - Académie en ligne

11Séquence 9 – MA02

des bâtons. Les bords supérieurs des rectangles ont donc la même allure que les extrémités supérieures des bâtons.

Les bords supérieurs des rectangles font apparaître une courbe régulière et symé-trique.

Le mathématicien Abraham de Moivre, protestant français émigré en Angleterre après la révocation de l’édit de Nantes, a montré en 1733, dans un cas particulier, que cette courbe est la courbe représentative de la fonction définie sur � par

f t( )1

2e .

t2

2

Ce résultat a été généralisé par Pierre-Simon de Laplace (dans Théorie analytique des probabilités (1812).

Étude de la fonction définie sur � par f x( )1

2e

x2

2

(complément de l’exercice 16 de la séquence 7 ).

� Montrer que cette fonction est paire.

� Étudier la limite de f en +∞ et en −∞.

� Activité 3

© Cned - Académie en ligne

12 Séquence 9 – MA02

� Étudier les variations de f et donner la représentation graphique de la fonc-tion f.

� Donner une valeur approchée de f x x( ) .−∫ 10

10d Quelle conjecture peut-on

faire pour la mesure de l’aire (en unités d’aire) sous la courbe représentant f tout entière ?

� Justifier que f semble donc être une densité de probabilité.

Cours

1. Théorème de Moivre-Laplace

Le paramètre p est fixé, l’entier n varie, les variables aléatoires Xn suivent les lois binomiales B ( ).n p;

On utilise les variables aléatoires centrées et réduites correspondantes Zn .

la largeur des rectangles est de plus en plus petite ;

les aires des rectangles, c’est-à-dire les probabilités, deviennent de plus en plus proches des aires correspondantes limitées par la courbe représentant la fonction f et l’axe des abscisses : les probabilités P a Z bn≤ ≤( ) sont de plus

en plus proches de 12

2

e d−

∫x

a

bx.

0

0,1

0,2

0,3

0,4

0,5

n = 99

p = 0,34

0

1 2 3 4–4 –3 –2 –1

Voici donc l’énoncé du théorème de Moivre-Laplace, qui théorise les observations et qui est fondamental en statistiques.

Ce théorème est admis en Terminale S.

C

© Cned - Académie en ligne

13Séquence 9 – MA02

La motivation commune à Bernoulli (qui a énoncé le premier la loi des grands nombres), Moivre et Laplace était de déterminer le plus finement possible la fluctuation des valeurs prises par une variable aléatoire suivant une loi binomiale autour de son espérance. Il s’agissait ensuite d’utiliser ces résultats pour estimer une probabilité inconnue.

Le théorème permet cela et nous verrons comment dans les chapitres suivants.

Mais auparavant, il convient d’étudier la loi qui apparaît dans le théorème de Moivre-Laplace. On l’appelle la loi normale centrée réduite que l’on note

(0 ; 1).N

2. Loi normale centrée réduite (0 ; 1)N

a) Définition

Propriété 1

La fonction définie sur � par f xx

( ) =−1

2

2

e est une densité de proba-bilité.

La fonction a été étudiée dans l’activité 3. C’est une fonction continue à valeurs positives, on admet que l’aire sous la courbe est égale à 1u.a.

O 1

1 2 0,4/

Cette courbe est souvent appelée « courbe de Gauss » ou « courbe en cloche ».

Théorème 1 : Théorème de Moivre-Laplace

Soit p un nombre réel de l’intervalle 0 1; .] [Soit une suite de variables aléatoires Xn( ) où chaque variable aléatoire Xn suit la loi binomiale B ( ).n p;

On pose ZX npnp pn

n= −−( )

,1

variable centrée et réduite associée à Xn .

Alors, pour tous réels a et b tels que a b< , on a :

P a Z b xlim1

2e d .

nn

x

ab 2

2

∫( )≤ ≤ =π→+∞

© Cned - Académie en ligne

14 Séquence 9 – MA02

Une variable aléatoire X suit la loi normale centrée réduite (0 ; 1)N si sa

fonction de densité est la fonction définie sur � par f x( )1

2e .

x2

2

On a alors pour tous réels a et b tels que a b< ,

P a X b f x x x( ) d1

2e d .

ab

x

ab 2

2

∫ ∫( )≤ ≤ = =π

− 

Définition 2

Propriété 2

Soit X une variable aléatoire qui suit la loi normale (0 ; 1),N on a :

pour tout réel u positif, P X u P X u≤ −( ) = ≥( )  ;

P X P X0 012

≤( ) = ≥( ) = .

� Démonstration

La fonction de densité de la loi normale (0 ; 1)N est paire, donc, par symétrie, les mesures des aires égales aux probabilités P X u≤ −( ) et P X u≥( ) sont égales, P X u P X u≤ −( ) = ≥( ).

O u

P(X u)

–u

�fP(X –u)

Pour u = 0, on a P X P X≤( ) = ≥( )0 0 et, comme

1 0 0 0 0= ≥ + < = ≥ + ≤P X P X P X P X( ) ( ) ( ) ( ),

on obtient 1 2 0= ≥P X( ).

On en déduit P X P X0 012

≤( ) = ≥( ) = .

Calculs

La fonction de densité de la loi normale (0 ; 1)N n’a pas de primitive connue, c’est-à-dire qu’il est impossible de l’exprimer algébriquement (somme, produit…) à partir des fonctions usuelles (polynômes, exponentielle, logarithme…). Les calculatrices et les tableurs permettent de calculer des valeurs approchées des intégrales (voir le cours d’intégration), mais ils permettent aussi d’obtenir direc-

Remarque

© Cned - Académie en ligne

15Séquence 9 – MA02

tement des valeurs approchées de certaines probabilités liées à la loi normale. Les calculs des probabilités de la forme P a X b( ),≤ ≤ P X c( )≤ et P X c( ),≥ a, b et c étant des nombres réels donnés, seront expliqués dans la partie � où sont étudiées toutes les lois normales.

b) Espérance et écart-type de la loi normale centrée et réduite

On généralise la définition de l’espérance d’une variable aléatoire à densité qui a été vue pour les lois uniformes et les lois exponentielles. Ici la variable aléatoire est définie sur �.

On emploie souvent le mot « moyenne » pour désigner l’espérance.

Si la variable aléatoire X suit la loi normale (0 ; 1),N l’espéranceE( )X de la variable aléatoire X est définie par :

X t f t t t f t tE( ) lim ( )d lim ( )dy y x

x00∫ ∫= +

→−∞ →+∞

où f est la fonction de densité de la loi normale (0 ; 1).N

Définition 3

Propriété 3

L’espérance (ou la moyenne) de la loi normale (0 ; 1)N est égale à 0.

� Démonstration

Soit x un nombre réel positif, on a :

∫ ∫

− +

− − −

t f t tt

t

t t

( )d2

e d

1

2e d

1

2e

1

2e 1 .

xt

x

tx

tx

x

02

0

20

2

0

2

2

2 2 2

On étudie d’abord la limite lim ( )x

xt f t t

→+∞ ∫0d par composition.

La fonction xx

� e−

2

2 est la composée de xx

� −2

2 et de X X� e , or

limx

x→+∞

− = −∞2

2 et lim ,

X

X

→−∞=e 0 on peut donc écrire

lim e lim ex

x

X

X

→+∞

→−∞= =

2

2 0 par composition avec Xx= −

2

2.

Remarque

© Cned - Académie en ligne

16 Séquence 9 – MA02

Donc t f t tlim ( )d1

2.

x

x0∫ =

π→+∞

De même, on trouve t f t t( )d1

2e 1

y

y0 2

2

∫ =π

− et t f t tlim ( )d

1

2.

y y0∫ = −

π→−∞

On conclut finalement : E( ) .X = 0

Propriété 4

La variance V( )X de la loi normale (0 ; 1),N définie par

V E E( ) ( ( ) ,X X X= −( )2 est égale à 1.

Cette propriété est admise.

On en déduit que l’écart-type de la loi normale (0 ; 1)N est aussi égal à 1.

c) Répartition des valeurs de X

Dans le théorème qui suit apparaît un nombre nommé .α Le choix de α dans 0 1;] [ correspond au choix d’une probabilité. Dans la pratique il est intéressant

de choisir α proche de 0 (0,05 ou 0,01 ou…). Le nombre 1−α est lui aussi dans 0 1; ,] [ il est alors proche de 1 (0,95 ou 0,99 ou…).

On cherche un intervalle −[ ]u u; tel que la probabilité que X soit en dehors de cet intervalle −[ ]u u; soit égale à α (0,05 ou 0,01 ou…) et donc que la probabilité que X appartienne à −[ ]u u; soit égale à 1−α (0,95 ou 0,99 ou…). Le choix de α aura pour conséquence que la probabilité que X appartienne à

−[ ]u u; sera proche de 1 (voire très proche) et la probabilité que X n’appar-tienne pas à −[ ]u u; sera faible (voire très faible).

O u

P(X u)

–u

�f

P(–u X u) = 1 –

P(X –u)

Théorème 2

Lorsque la variable aléatoire X suit la loi normale (0 ; 1),N pour tout nombre α de l’intervalle 0 1; ,] [ il existe un unique nombre réel positif uα tel que

P u X u 1 .( )− ≤ ≤ = −αα α

© Cned - Académie en ligne

17Séquence 9 – MA02

� Démonstration

D’après la symétrie de la courbe de la densité de la loi normale, pour tout réel u positif on a :

P u X u P X u f x x H uu

− ≤ ≤( ) = ≤ ≤( ) = =∫2 0 2 20

( ) ( ),d

où H est la primitive de la fonction f sur � qui s’annule en 0.

La fonction H est donc continue et strictement croissante sur �.

On a 2 0 0H( ) = et lim ( ) lim .u u

H u P X u P X→+∞ →+∞

= ≤ ≤( ) = ≤( ) = × =2 2 0 2 0 212

1

On obtient le tableau de variation de la fonction 2H  :

u 0 uα +∞

2H u( )0

1−α

1

Pour tout nombre α de l’intervalle 0 1; ,] [ le nombre 1−α appartient aussi à 0 1;] [ et donc, d’après le corollaire du théorème des valeurs intermédiaires, il

existe un unique réel uα tel que 2 1H u( )α α= − c’est-à-dire tel que

P u X u− ≤ ≤( ) = −α α α1 .

Valeurs particulières

On a u0 05 1 96, ,≈ d’où : P X− ≤ ≤( ) ≈1 96 1 96 0 95, , , .

On a u0 01 2 58, ,≈ et P X− ≤ ≤( ) ≈2 58 2 58 0 99, , , .

Comme les valeurs de u0 05, et u0 01, ne sont pas des valeurs exactes, il en est de même pour les probabilités. On obtient une bonne idée de la répartition des valeurs de X. Environ 95% des réalisations de X se trouvent entre −1 96, et 1,96 et 99% des réalisations de X se trouvent entre −2 58, et 2 58, .

On appelle « réalisation d’une variable aléatoire X » la valeur observée quand on réalise concrètement l’expérience aléatoire.

3. Loi normale ( ; 2)N σµ

a) Définition, espérance, écart-type

Une variable aléatoire X suit une loi normale ( ; )2N σµ si la variable

aléatoire ZX= − µ

σ suit la loi normale (0 ; 1).N

Définition 4

À savoir

Remarque

© Cned - Académie en ligne

18 Séquence 9 – MA02

Voici un premier exemple de modélisation d’un phénomène concret par une loi normale.

Le poids en kilos des nouveau-nés à la naissance est une variable aléatoire qui peut être modélisée par une variable aléatoire suivant la loi normale de moyenne µ = 3 3, et d’écart-type σ = 0 5, . La probabilité qu’un nouveau-né pèse moins de 2,5 kg à la naissance est donc : P X( , ).< 2 5 Avec une calculatrice (l’explica-tion est donnée un petit peu plus loin), on trouve P X( , ) ,< ≈2 5 0 054 à 10 3− près par défaut.

Ainsi, le risque qu’un nouveau-né soit d’un poids inférieur à 2,5 kg est un peu supérieur à 5 %.

On a représenté ci-dessous les courbes des fonctions de densité de cinq lois nor-males.

O 1

� (0;4)

� (0;1)

� (1;4)

� (3;0,25)

� (1;1)

On observe que chaque courbe est symétrique par rapport à la droite d’équation x = µ.

Propriété 5

On admet que, si une variable aléatoire X suit la loi normale ( ; ),2N σµ

alors son espérance est égale à µ et son écart-type à σ   : E( )X = µ etσ σ( ) .X =

b) Utilisation des calculatrices

La variable aléatoire X suivant la loi normale ( ; ),2N σµ il faut savoir calculer des probabilités de la forme : P a X b( ),≤ ≤ P X c( )≤ et P X c( ),≥ a, b et c étant des nombres réels donnés.

� Exemple

� Exemples

À savoir

© Cned - Académie en ligne

19Séquence 9 – MA02

Il faut aussi savoir déterminer le nombre x tel que P X x p( ) ,≤ = p étant une probabilité donnée.

On donne d’abord les explications pour toutes les calculatrices TI et les calcula-trices Casio pour les modèles Graph 35 et plus. On donne ensuite les explications pour la calculatrice Casio 25+Pro.

P a X b( )≤ ≤

Sauf la calculatrice Casio 25+Pro, les calculatrices étudiées ici font le calcul direc-tement.

Par exemple P X( , ) ,− ≤ ≤ ≈1 1 5 0 203877 où X suit la loi (3 ; 4).N

Texas Casio Graph 35…

On choisit Distr (par 2nd Var) puis normalcdf (ou, en français, normalFRep).

On indique les données dans l’ordre a, b, µ et σ (attention à ne pas confondre σ et σ 2 ).

Voici un exemple avec a = −1 b = 1 5, µ = 3 et σ = 2  :

Dans le menu Stat, on choisit Distr, puis NormCD. On indique les données dans l’ordre a, b, σ et µ (attention à ne pas confondre σ et σ 2 ).

Voici un exemple avec a = −1 b = 1 5, µ = 3 et σ = 2  :

P X c( )≤Les calculatrices étudiées ne font pas le calcul directement. On dispose de deux méthodes.

On utilise l’approximation P X c P X c( ) ( )≤ ≈ − ≤ ≤1099 où on néglige P X( ).< −1099

Ou bien on utilise des égalités, mais elles dépendent de la position de c par rapport à µ. Les égalités sont obtenues en écrivant la probabilité d’une réunion d’événements incompatibles. On mémorise visuellement ces égali-tés qui s’interprètent avec des aires.

�f P( X c)P(X )

c

Si c ≥ µ  :

P X c P X P X c P X c( ) ( ) ( ) ( )≤ = < + ≤ ≤ = + ≤ ≤µ µ µ12

© Cned - Académie en ligne

20 Séquence 9 – MA02

�fP(X c)

P(c X )

c

Si c ≤ µ  :

P X c P X P c X P c X( ) ( ) ( ) ( ).≤ = ≤ − < ≤ = − ≤ ≤µ µ µ12

On a P X c P X c( ) ( )≥ = − <1 (événements contraires) et aussi P X c P X c( ) ( )≥ = ≤ − à cause de la symétrie de la courbe de la fonction de densité.

On a : P X( ) ,≤ ≈8 0 9937903 où X suit la loi (3 ; 4).N

Déterminer x tel que P X x p( ) ,≤ = p étant une probabilité donnée.

La plupart des calculatrices permettent de trouver directement le résultat.

Texas Casio graph 35 et plus

On choisit Distr (par 2nd Distr) puis invNorm (ou, en français, FracNorm), puis on donne p, µ et σ .

Voici un exemple avec p = 0 1, µ = 3 etσ = 2  :

Dans le menu Stat, on choisit Distr, puis Inverse Nor-mal. On indique les données dans l’ordre p, σ et µ .

Voici un exemple avec p = 0 1, µ = 3 et σ = 2  :

Cas particulier de la calculatrice Casio 25+Pro

Cette calculatrice donne seulement les probabilités de la forme P Z c( )≤ où Z suit la loi normale centrée réduite (0 ; 1).N

Pour accéder à cette fonctionnalité, on utilise :

OPTN PROB P( 

Ainsi OPTN PROB P(2) donne P Z( ) , .≤ ≈2 0 97725

Pour calculer P X c( )≤ où X suit la loi normale ( ; ),2N σµ on se ramène à

la loi (0 ; 1)N en utilisant ZX= − µ

σ.

La probabilité P X( )≤ 8 où X suit la loi (3 ; 4)N s’obtient par OPTN PROB P(( ) / )8 3 2− et on trouve P X( ) , .≤ ≈8 0 9937903

On a P a X b P X b P X a( ) ( ) ( )≤ ≤ = ≤ − ≤ car

P X a P a X b P X b( ) ( ) ( )< + ≤ ≤ = ≤ (probabilité de l’union de deux événe-ments incompatibles ou aire de l’union de deux ensembles disjoints).

Remarque

� Exemple

© Cned - Académie en ligne

21Séquence 9 – MA02

Pour déterminer x tel que P X x p( ) ,≤ = p étant une probabilité donnée, la seule possibilité est de commencer par tâtonner. On cherche d’abord z tel que P Z z p( ) ,≤ = Z suivant la loi normale (0 ; 1)N puis utiliser l’équivalence

Z zX

z X z≤ ⇔ − ≤ ⇔ ≤ +µ µσ

σ .

On en déduit x z= +σ µ.

Par exemple, pour déterminer x tel que P X x( ) ,≤ = 0 1 où X suit la loi (3 ; 4),N on trouve d’abord en tâtonnant z ≈ −1 281, , puis

x ≈ × − +2 1 281 3( , ) d’où x ≈ 0 438, .

Pour s’entraîner

La variable aléatoire suit la loi normale (21 ; 9).N Calculer :

a) P X( )8 18≤ ≤ b) P X( )≥ 23 c) x tel que P X x( ) , .≤ = 0 7

a) P X( ) ,8 18 0 159≤ ≤ ≈ b) P X( ) ,≥ ≈23 0 252 c) x ≈ 22 573, .

c) Intervalles « un, deux, trois sigmas »

On a représenté ci-dessous les fonctions de densité de trois lois normales ( ; )2N σµ de même espérance µ et d’écarts-types différents : σ = 2, σ = 1

et σ = 0 5, .

O

�( ;0,25)

�( ;1)

�( ;4)

On sait que l’écart-type σ mesure la dispersion des valeurs prises par la variable aléatoire autour de son espérance µ. L’influence de l’écart-type sur la courbe est très visible : plus il est important, plus la courbe est « étalée ».

Les résultats suivants doivent être connus, ils donnent une idée de la répartition, autour de son espérance µ, d’une variable aléatoire X qui suit une loi normale

( ; ).2N µ σ

� Exemple 1

� Solution

© Cned - Académie en ligne

22 Séquence 9 – MA02

Propriété 6

On a :

P X( ) 0,68µ −σ ≤ ≤µ +σ ≈ (à 10 2− près) ;

P X( 2 2 ) 0,95µ − σ ≤ ≤µ + σ ≈ (à 10 2− près) ;

P X( 3 3 ) 0,997µ − σ ≤ ≤µ + σ ≈ (à 10 3− près).

µ

0,68

µ–� µ+�

µ

0,95

µ–2� µ+2�

µ

0,997

µ–3� µ+3�

© Cned - Académie en ligne

23Séquence 9 – MA02

� Démonstration

On a µ µ µ µ− ≤ ≤ + ⇔ − ≤ − ≤ ⇔ − ≤ − ≤σ σ σ σσ

X XX

1 1.

Donc P X PX

P Z( ) ( )µ µ µ− ≤ ≤ + = − ≤ − ≤

= − ≤ ≤σ σ

σ1 1 1 1 et, comme la

variable aléatoire ZX= − µ

σ suit la loi normale (0 ; 1),N la calculatrice permet

de faire le calcul et on trouve environ 0,68.

De même :

P X PX

P Z( ) ( ) ,µ µ µ− ≤ ≤ + = − ≤ − ≤

= − ≤ ≤ ≈2 2 2 2 2 2 0 95σ σ

σ et

P X PX

P Z( ) ( ) ,µ µ µ− ≤ ≤ + = − ≤ − ≤

= − ≤ ≤ ≈3 3 3 3 3 3 0 997σ σ

σ..

Ainsi, environ 68 % des réalisations d’une variable aléatoire suivant la loi nor-male ( ; )2N σµ se trouvent dans l’intervalle µ µ− +[ ]σ σ; , environ 95 % se trouvent dans l’intervalle µ µ− +[ ]2 2σ σ; et environ 99,7 % dans l’intervalle µ µ− +[ ]3 3σ σ; .

Exercices d’apprentissage

Plusieurs exercices de cette séquence sont issus de documents ressources  de l’Éducation nationale.

Dans les exercices 1 et 2, on donnera des valeurs approchées à 10 4− près par défaut.

Soit X une variable aléatoire suivant la loi normale centrée réduite.

� Calculer :

a) P X( , , )− ≤ ≤0 5 1 3 ; b) P X( )≤ −1 ; c) P X( , ).≥ 1 8

� Déterminer le réel x tel que P X x( ) , .≤ = 0 8

Soit X une variable aléatoire suivant la loi normale (12 ; 9).N

� Calculer :

a) P X( )10 14≤ ≤ ; b) P X( )≤ 13 ; c) P X( ).≥ 7

� Déterminer le réel x tel que P X x( ) , .≤ = 0 9

� On donne ci-dessous les représentations graphiques des fonctions densité

de probabilité des lois normales (7 ; 1),N (7 ; 2 ),2N (5 ; 1)N et (5 ; 0,5 ).2N Associer chaque courbe à la loi correspondante.

� Proposer une valeur pour la moyenne µ et pour l’écart-type σ de la loi normale ( ; )2N σµ dont la fonction densité de probabilité est représentée par la courbe C .

D

Exercice 1

Exercice 2

Exercice 3

© Cned - Académie en ligne

24 Séquence 9 – MA02

O 1

1

1

3

2

4

Soit X une variable aléatoire suivant la loi normale ( ; ).2N σµ

� Si µ = 15 et P X( ) , ,< =12 0 4 combien vaut σ  ?

� Si σ = 0 5, et P X( ) , ,< =7 0 3 combien vaut µ  ?

Une entreprise produit en grande quantité des pièces cylindriques. Soit X la variable aléatoire qui, à chaque pièce prélevée au hasard dans la production, associe son diamètre, en millimètres. On admet que la variable aléatoire X suit la loi normale de moyenne 61,5 mm et d’écart-type 0,4 mm.

� Déterminer, dans ces conditions, la probabilité qu’une pièce, tirée au hasard, ait un diamètre compris entre 60,7 mm et 62,3 mm.

� Une pièce est déclarée défectueuse si son diamètre est soit inférieur à 60,7 mm, soit supérieur à 62 3, mm. Calculer la probabilité qu’une pièce tirée au hasard soit défectueuse.

� Sachant qu’une pièce n’est pas défectueuse, quelle est la probabilité que son diamètre soit inférieur à 61 mm ?

La production laitière annuelle en litres des vaches laitières de la race « Française Frisonne Pie Noir » peut être modélisée par une variable aléatoire suivant la loi normale de moyenne µ = 6000 et d’écart-type σ = 400.

� Calculer la probabilité qu’une vache de cette race produise entre 5 800 et 6 200 litres par an.

� Calculer la probabilité qu’une vache de cette race produise moins de 5 700 litres par an.

� Calculer la probabilité qu’une vache de cette race produise plus de 6 300 litres par an.

� Donner une interprétation concrète du nombre x tel que P X x( ) , .< = 0 30 Déterminer x.

� Calculer la production minimale prévisible des 20 % de vaches les plus pro-ductives du troupeau.

Exercice 4

Exercice 5

Exercice 6

© Cned - Académie en ligne

25Séquence 9 – MA02

Une confiserie produit des plaques de chocolat. On admet que la variable aléa-toire égale au poids d’une plaquette de 125 g suit une loi normale d’espérance µ = 125 et d’écart-type σ = 0 5, .

La plaquette est jugée conforme lorsque son poids est compris entre µ − 3σ et µ + 3σ .

� Calculer la probabilité qu’une plaquette prélevée aléatoirement au hasard en fin de chaîne soit non conforme.

� Pour contrôler le réglage de la machine, on détermine des poids d’alerte µ − h et µ + h tels que

P h X h( ) , .µ µ− ≤ ≤ + = 0 99

Ces poids d’alerte sont inscrits sur une carte de contrôle et correspondent à une marge de sécurité en lien avec des normes de conformité. Calculer ces poids d’alerte.

Exercice 7

© Cned - Académie en ligne

26 Séquence 9 – MA02

3 Intervalles de fluctuation

Objectifs du chapitre

Quand on réalise une expérience aléatoire, on observe bien sûr que les résultats obtenus ne sont pas toujours les mêmes, c’est la fluctuation d’échantillonnage.

Mais on observe aussi que, quand on répète une expérience un grand nombre de fois, il y a une régularité des résultats.

Le théorème de Moivre-Laplace permet de mathématiser ces observations.

On définit des intervalles de fluctuation.

On pourra alors décider si on considère que des résultats obtenus lors d’une expérience sont dus au hasard (c’est-à-dire à la fluctuation d’échantillonnage), ou si on considère qu’ils sont statistiquement significatifs d’une différence avec le modèle choisi.

Pour débuter

Rappel

En statistiques, un échantillon de taille n est la liste des n résultats obtenus par n  répétitions indépendantes de la même expérience aléatoire. Ici l’expérience répétée est une épreuve de Bernoulli, c’est-à-dire qu’elle ne prend que deux valeurs : échec / réussite, oui / non, homme / femme, 0 / 1… 

Par exemple, un échantillon de taille 100 du lancer d’une pièce où on compte le nombre de fois où on obtient « pile » est la liste des résultats obtenus en lançant effectivement 100 fois la pièce.

Le nombre de réussites dans un échantillon de taille n suit la loi binomiale B ( ).n p;

Un intervalle de fluctuation au seuil de 95 %, relatif aux échantillons de taille n, est un intervalle où se situe la fréquence d’un échantillon de taille n avec une probabilité supérieure à 0,95.

Définition 5

A

B� Activité 4

© Cned - Académie en ligne

27Séquence 9 – MA02

Tout intervalle qui contient un intervalle de fluctuation au seuil de 95 % est lui aussi un intervalle de fluctuation à ce même seuil.

L’intervalle 0 1;[ ] contient toutes les fréquences, il vérifie la condition de la défi-nition 5, mais il est sans intérêt. On cherchera des intervalles de fluctuation cor-respondant à des probabilités supérieures à 0,95 et aussi très proches de 0,95 en particulier dans les prises de décision.

Il y a plusieurs sortes d’intervalle de fluctuation. On peut choisir des intervalles de fluctuation centrés en p comme ceux vus en Seconde, ou pour lesquels la probabilité que la fréquence soit à l’extérieur de l’intervalle à gauche soit égale à la probabilité que la fréquence soit à l’extérieur de l’intervalle à droite comme ceux vus en Première, ou…

Par exemple, pour p = 0 2, et n = 100, l’intervalle de fluctuation vu en Seconde est 0 1 0 3, ; ,[ ] et celui obtenu en Première est 0 12 0 28, ; , .[ ]Propriété admise en Seconde

L’intervalle pn

pn

− +

1 1; est un intervalle de fluctuation approché au seuil

de 95%, relatif aux échantillons de taille n.

Dans la pratique, on utilise l’intervalle pn

pn

− +

1 1; pour des probabi-

lités p comprises entre 0,2 et 0,8 et des échantillons de taille n supérieure à 25.

� On dispose d’un dé bien équilibré, on gagne quand on obtient 1 ou 6. Détermi-ner un intervalle de fluctuation au seuil de 95 % de la fréquence des lancers gagnants dans les échantillons de taille 100.

� On sait qu’en moyenne 51 % des nouveau-nés sont des garçons. Déterminer un intervalle de fluctuation au seuil de 95 % de la fréquence des garçons nouveau-nés dans des échantillons de taille 25. Que peut-on en déduire pour le nombre de garçons parmi 25 nouveau-nés ?

Prise de décision

On a découvert une pièce ancienne et on se demande si elle est bien équilibrée. Comment faire ?

On lance n fois la pièce et on note la fréquence f d’apparition de « pile ».

On détermine un intervalle de fluctuation In au seuil de 95 % de la fréquence d’apparition de « pile » dans des échantillons de taille n.

Règle de décision  : si f appartient à l’intervalle I ,n on décide que la pièce est équilibrée ; si f n’appartient pas à l’intervalle In , on décide que la pièce n’est pas équilibrée.

Dans chacun des deux cas suivants, quelle est la décision prise ?

� n = 100 et f = 0 56,

� n = 1000 et f = 0 560, .

Remarque

Remarque

� Utilisation

© Cned - Académie en ligne

28 Séquence 9 – MA02

Sur le tableur Open Office, on a simulé 100 échantillons de n lancers d’un dé tétraédrique bien équilibré.

On a déterminé les fréquences où la face marquée 1 est la face cachée ( , ),p = 0 25 elles sont indiquées en ordonnées sur le graphique.

Dans chacun des trois cas, déterminer :

� le pourcentage des fréquences appartenant à l’intervalle pn

pn

− +

1 1; ;

� le pourcentage des fréquences appartenant à

pp p

np

p pn

−−

+−

1 96

11 96

1,

( ); ,

( ).

Premier cas

00 20

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

fréq

uenc

e

40 60

Fluctation 100 échantillons

n = 50 p = 0,25

80 100

� Activité 5

© Cned - Académie en ligne

29Séquence 9 – MA02

Deuxième cas

00 20

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4fréquence

40 60

Fluctation 100 échantillons

n = 100 p = 0,25

80 100

Troisième cas

0

0 20

0,05

0,1

0,15

0,2

0,25

0,3

0,35fréquence

40 60

Fluctation 100 échantillonsn = 200 p = 0,25

80 100

© Cned - Académie en ligne

30 Séquence 9 – MA02

Cours

1. Intervalles de fluctuation asymptotique

Dans ce qui suit, on considère des variables aléatoires Xn suivant chacune une loi binomiale B ( )n p; (exemple : on lance n fois une pièce équilibrée, Xn est le nombre de « pile » obtenus, Xn suit la loi B ( )).n ; 0,5

La variable aléatoire FXnnn= donne donc la fréquence du nombre de « suc-

cès ».

Propriété 7

La variable aléatoire FXnnn=  :

prend n +1 valeurs : n n

nn

0,1

,2

, ...,  ;

vérifie EXn

pn

= et σ X

np p

nn

=

−( ).

1

� Démonstration

La variable aléatoire Xn prenant les n +1 valeurs : 0, 1, 2, …, n, on en déduit celles de Fn .

On sait que E X npn( ) = et σ X np pn( ) = −( ),1 on sait aussi que E E( ) ( )aX b a X b+ = + et σ σ( ) ( ),aX b a X+ = donc on divise l’espérance et l’écart-type par n et on obtient les valeurs annoncées.

Les fréquences Fn ont pour espérance p qui ne dépend pas de n.

Les fréquences Fn ont pour écart-type p p

n( )1−

qui diminue quand n augmente.

Les résultats observés ont tendance à se resserrer autour de l’espérance p quand n augmente. C’est cette concentration des valeurs les plus probables autour de p qui permet d’améliorer la prise de décision à partir des observations.

Un intervalle de fluctuation asymptotique de la variable aléatoire FXnnn=

au seuil 1−α est un intervalle déterminé à partir de p et de n et qui contient Fn avec une probabilité d’autant plus proche de 1−α que n est grand.

Définition 6

C

© Cned - Académie en ligne

31Séquence 9 – MA02

On montrera plus loin que l’intervalle pn

pn

− +

1 1; est un intervalle de

fluctuation asymptotique au seuil de 95 % ( 0,05).α = En classe de Seconde, cela a été énoncé sous forme simplifiée, le caractère asymptotique ne pouvant pas être introduit. Des exemples ont été donnés dans l’activité 4.

Dans le théorème qui suit, le nombre uα est celui qui est défini dans le cha-pitre 2  : l’unique réel tel que P u Z u 1 ,( )− ≤ ≤ = −αα α la variable aléatoire Z suivant la loi normale (0 ;1).N

Théorème 3

Soit p un nombre réel fixé de l’intervalle 0 1; .] [Soit une suite de variables aléatoires Xn( ) chaque variable aléatoire Xn suivant la loi binomiale B ( ),n p; alors, pour tout réel α dans 0 1; ,] [ on a

PXn

lim I 1 ,n

nn∈

= −α

→+∞ où In est l’intervalle

p up p

np u

p pn

(1 );

(1 ).− − + −

α α

� DémonstrationLa variable aléatoire Xn suit la loi binomiale B ( ),n p; donc E X npn( ) = et σ X np pn( ) = −( ).1

La variable aléatoire Zn définie par ZX npnp pn

n= −−( )1

est la variable centrée et réduite associée à Xn .

D’après le théorème de Moivre-Laplace, pour tous réels a et b tels que a b< , on a :

P a Z b xlim1

2e d .

nn

x

ab 2

2

∫( )≤ ≤ =π→+∞

Or :

P a Z b P a X npnp p

bnn≤ ≤( ) = ≤ −

−≤

( )1

= − ≤ − ≤ −( )P a np p X np b np pn( ) ( )1 1

= + − ≤ ≤ + −( )P np a np p X np b np pn( ) ( )1 1

= + − ≤ ≤ + −P p

a p pn

Xn

pb pn( ) (1 1 pp

n)

.

Donc P pa p p

nXn

pb p p

nxlim

(1 ) (1 ) 1

2e d .

nn

x

ab 2

2

∫+ − ≤ ≤ + −

=

π→+∞

En remplaçant a et b par u− α et uα on obtient :

P pu p p

nXn

pu p p

nxlim

(1 ) (1 ) 1

2e d 1 ,

nn

x

uu 2

2

∫ α− − ≤ ≤ + −

=

π= −

→+∞α α −

− αα

c’est-à-dire :

PXn

lim I 1 .n

nn∈

= −α

→+∞

� Exemple

© Cned - Académie en ligne

32 Séquence 9 – MA02

Propriété 8

L’intervalle p up p

np u

p pn

I(1 )

;(1 )

n = − − + −

α α est un intervalle de

fluctuation asymptotique au seuil 1−α de la variable aléatoire FXnnn= .

� Démonstration

C’est une conséquence immédiate du théorème précédent car la suite

PXn

Inn∈

converge vers 1 .−α L’intervalle In contient bien F

Xnnn= avec

une probabilité d’autant plus proche de 1−α que n est grand.

L’intervalle pp p

np

p pn

J 1,96(1 )

; 1,96(1 )

n = − − + −

est un intervalle de

fluctuation asymptotique au seuil de 95 % (p désigne la proportion dans la population).

En effet, pour 0,05α = , on sait que u0 05 1 96, , .≈

Les intervalles In et Jn sont des intervalles de fluctuation asymptotiques car il y a la condition « d’autant plus proche de … que n est grand ». On peut considérer que In et Jn sont des intervalles de fluctuation « approchés », la probabilité que Fn appartienne à In ou à Jn n’est pas forcément supérieure à 0,95 mais si elle n’est pas supérieure à cette valeur, elle en est proche. 

En pratique dans les exercices, la taille n de l’échantillon est fixée, l’intervalle de fluctuation asymptotique Jn correspondant sera l’intervalle de fluctuation utilisé. 

Conditions d’utilisation

Les exigences habituelles de précision pour utiliser cette approximation sont :

n ≥ 30, np ≥ 5 et n p( ) .1 5− ≥

Dans l’activité 5, on a pu faire des observations cohérentes avec ces résultats. Mais la définition d’un intervalle de fluctuation est exprimée avec une probabi-lité. Si vous faites d’autres simulations avec le fichier qui est sur le site, il se peut que quelques observations donnent des pourcentages éventuellement un peu éloignés de 95 %.

Déterminer un intervalle de fluctuation asymptotique au seuil de 95 % lorsque n = 100 et p = 0 5, .

On a np = 50 et n p( )1 50− = donc les trois conditions sont réalisées et on peut

utiliser l’intervalle J .n On obtient :

J 0,5 1,960,5 0,5

100; 0,5 1,96

0,5 0,5

100100 = − × + ×

soit 0 402 0 598, ; , .[ ]

Cet exemple modélise 100 lancers d’une pièce équilibrée. On peut donc dire que, pour environ 95 % des séries de 100 lancers, la fréquence du nombre de « pile » obtenus se situe dans l’intervalle 0 402 0 598, ; , .[ ]

À savoir

Remarque

Remarque

Remarque

� Exemple 2

� Solution

© Cned - Académie en ligne

33Séquence 9 – MA02

Ces intervalles de fluctuation asymptotique sont plus faciles à déterminer que ceux du cours de Première qui nécessitaient l’utilisation de tableurs ou d’algo-rithmes.

2. Exemple d’utilisation : prise de décisionOn utilise un intervalle de fluctuation lorsque l’on veut déterminer si la propor-tion  f observée dans un échantillon est compatible ou non avec un modèle de Bernoulli, c’est-à-dire si elle peut être un résultat obtenu par une variable aléatoire

FXnnn= , où Xn suit une loi binomiale de paramètres n et p, la valeur p étant

connue ou supposée dans la population.

Quand Xn suit une loi binomiale de paramètres n et p, un intervalle de fluctua-tion asymptotique In au seuil de 95 % est un intervalle où se situe la fréquence

FXnnn= avec une probabilité d’autant plus proche de 0,95 que n est grand.

L’intervalle In contient donc environ 95 % des fréquences observées dans les échantillons de taille n suffisamment grande. Des fréquences (environ 5 %) de certains échantillons ne sont pas dans I ,n c’est la fluctuation d’échantillonnage.

En fonction de l’appartenance ou non de la fréquence observée f à l’intervalle I ,n on décide si l’échantillon est conforme ou non au modèle.

Avec cette règle, la fluctuation d’échantillonnage amène à rejeter, à tort, les 5 % (environ) d’échantillons qui suivent le modèle de Bernoulli et qui ne sont pas dans I .n

Dans les exemples, les tirages sont effectués sans remise. La taille des échan-tillons considérés étant faible par rapport à la taille de la population totale, on assimile les tirages réalisés à des tirages avec remise et on peut alors appliquer les résultats précédents.

(D’après document ressources de l’Éducation nationale)

Le responsable de la maintenance des machines à sous d’un casino doit vérifier qu’un certain type de machine est bien réglé sur une fréquence de succès de 0,06.

Il décide de régler chaque machine pour laquelle il aura observé, dans l’historique des jeux, une fréquence de succès se situant en dehors d’un intervalle de fluctua-tion au seuil de 95 %.

Lors du contrôle d’une machine, le technicien constate qu’elle a fourni 9 succès sur 85 jeux.

Remarque

La règle de décision adoptée est la suivante :

si la fréquence observée f dans un échantillon appartient à un intervalle de fluctuation asymptotique au seuil de 95 %, on considère que l’échantil-lon est compatible avec le modèle ;

sinon, on considère que l’échantillon n’est pas compatible avec le modèle.

Remarque

� Exemple 3

© Cned - Académie en ligne

34 Séquence 9 – MA02

� Déterminer la fréquence observée f de succès de cette machine.

� Déterminer un intervalle de fluctuation asymptotique du cours au seuil de 95 %.

� Le technicien va-t-il modifier le réglage de la machine ?

� Quelle aurait été sa décision s’il y avait eu 21 succès sur 200 jeux ?

� On a f = ≈985

0 106, .

� On a n = 85, p = 0 06, , np = 5 1, et n p( ) , ,1 79 9− = donc les conditions sont remplies pour utiliser l’intervalle de fluctuation asymptotique du cours

0 06 1 960 06 0 94

851 96

0 06 0 9485

, ,, ,

; ,, ,

.− × + ×

p

Comme 0,009 est une valeur approchée par défaut de

0 06 1 960 06 0 94

85, ,

, ,− × et 0,111 est une valeur approchée par

excès de 0 06 1 960 06 0 94

85, ,

, ,,+ × alors 0 009 0 111, ; ,[ ]

contient

0 06 1 960 06 0 94

851 96

0 06 0 9485

, ,, ,

; ,, ,− × + ×

p et 0 009 0 111, ; ,[ ] est

donc un intervalle de fluctuation légèrement plus large que celui du cours.

� La fréquence observée f se situe dans l’intervalle de fluctuation, donc le réglage de la machine n’est pas modifié.

� Dans ce deuxième cas, la fréquence observée est f = =21200

0 105, et l’in-

tervalle de fluctuation est environ égal à 0 027 0 093, ; , .[ ] La fréquence f du nombre de succès observée n’est pas dans l’intervalle car elle est trop grande, donc le technicien va modifier le réglage de la machine. On remarque que, dans les deux cas, les fréquences f sont presque les mêmes mais les décisions prises sont différentes car les intervalles de fluctuation sont différents.

L’amplitude de l’intervalle de fluctuation asymptotique au seuil de 95 % du cours

est égale à 2 1 961

×−

,( )

.p p

n Pour une valeur de p donnée, cette amplitude

diminue quand la taille n de l’échantillon augmente.

3. Complément sur les intervalles pn

pn

1 1;− +

a) On peut retrouver l’intervalle de fluctuation qui a été donné en classe de Seconde.

Pour tout p dans 0 1; ,] [ l’inégalité p p( )114

− ≤ est vérifiée (la fonction polynôme

du second degré p p p p p� ( )1 2− = − + admet un maximum car le coefficient de

p2 est négatif, ce maximum est atteint pour p = 12

et il vaut donc 12

112

14

= ).

� Solution

Remarque

© Cned - Académie en ligne

35Séquence 9 – MA02

On en déduit que 1 96 1 1 9614

1, ( ) , .p p− ≤ × ≤

Remarquons que cette inégalité a déjà été démontrée (exemple  12 de la séquence 2, Généralités sur les fonctions).

On peut alors élargir l’intervalle de fluctuation Jn donné dans le cas particulier :

pn

pp p

np

p pn

pn

− ≤ −−

≤ +−

≤ +11 96

11 96

1 1,

( ),

( ).

Donc l’intervalle Jn est inclus dans l’intervalle pn

pn

− +

1 1; , ce qui prouve

que

PXn

P pn

Xn

pn

J1 1

.nn

n∈

≤ − ≤ ≤ +

Conclusion

L’intervalle pn

pn

− +

1 1; est bien un intervalle de fluctuation asympto-

tique de Xnn à un seuil au moins égal à celui de J ,n c’est-à-dire 95 %.

b) Théorème

Le théorème suivant fournit une inégalité à la place des mots «  environ  », « proche de ».

Il sera utilisé dans le chapitre suivant.

� Démonstration

La démonstration est proposée ci-dessous en exercice résolu. Elle fait intervenir le théorème de Moivre-Laplace, la définition d’une suite convergente, la majora-tion de p p( )1− vue ci-dessus.

� Démontrer que

P pp p

nXn

pp p

nP p

nXn

pn

n n−−

≤ ≤ +−

≤ − ≤ ≤ +2

12

1 1 1( ) ( )

.

� On pose a P pp p

nXn

pp p

nnn= −

−≤ ≤ +

2

12

1( ) ( ). Démontrer que

a PX npnp pn

n= − ≤ −−

2

12

( ) et en déduire que la suite an( ) est convergente

vers une limite L telle que 0 95 0 96, , .< <L

Théorème 4

Soit un réel p de l’intervalle 0 1;] [ et une suite de variables aléatoires Xn( ) où chaque variable aléatoire Xn suit la loi binomiale B ( ).n p; Il existe un

entier n0 tel que : si n n≥ 0 alors PXn

pn

pn

n ∈ − +

≥1 10 95; , .

Exercice résolu

© Cned - Académie en ligne

36 Séquence 9 – MA02

� En déduire qu’il existe un entier n0 tel que : si n n≥ 0 alors

PXn

pn

pn

n ∈ − +

≥1 10 95; , .

� On fait avec 2 ce que l’on a fait pour 1,96.

Pour tout réel p de l’intervalle 0 1; ,] [ on a 2 1 214

1p p( ) .− ≤ × ≤

On obtient : pn

pp p

np

p pn

pn

− ≤ −−

≤ +−

≤ +12

12

1 1( ) ( ).

Donc P pp p

nXn

pp p

nP p

nXn

pn

n n−−

≤ ≤ +−

≤ − ≤ ≤ +2

12

1 1 1( ) ( )

.

� On a :

pp p

nXn

pp p

nnp np p X np npn

n−−

≤ ≤ +−

⇔ − − ≤ ≤ +21

21

2 1 2( ) ( )

( ) (( )1− p

⇔ − ≤ −−

≤21

2X npnp p

n( )

.

Donc

P pp p

nXn

pp p

nP

X npnp

n n−−

≤ ≤ +−

= − ≤ −

−2

12

12

1

( ) ( )

( ppan)

.≤

=2

D’après le théorème de Moivre-Laplace

lim lim( )n

nn

na PX npnp p→+∞ →+∞

−= − ≤ −

−≤

=2

12

12π

exx

x L

2

22

2d

−∫ = .

Le calcul de L donne L ≈ 0 9544997, , donc 0 95 0 96, , .< <L

� La suite an( ) converge vers L, donc il existe un rang n0 à partir duquel tous les termes de la suite an( ) sont dans l’intervalle 0 95 0 96, ; , .] [ (Remarque : n0 dépend de p.)

On en déduit que si n n≥ 0 alors 0 95, .< an

À la question �, on a montré que a P pn

Xn

pnn

n≤ − ≤ ≤ +

1 1. On en

déduit que si n n≥ 0 alors 0 951 1

, < ≤ − ≤ ≤ +

a P pn

Xn

pnn

n

d’où PXn

pn

pn

n ∈ − +

≥1 10 95; , .

Le nombre n0 dépend de p. Un algorithme de calcul montre que sa plus grande

valeur est obtenue pour p = 12

(la variance est alors maximale) et on obtient alors n0 529= .

� Solution

Remarque

© Cned - Académie en ligne

37Séquence 9 – MA02

Exercices d’apprentissage

(D’après document ressources de l’Éducation nationale)

Les enfants sont dits prématurés lorsque la durée gestationnelle est inférieure ou égale à 259 jours. La proportion de ces naissances est de 6 %. Des chercheurs suggèrent que les femmes ayant eu un travail pénible pendant leur grossesse sont plus susceptibles d’avoir un enfant prématuré que les autres. Il est décidé de réaliser une enquête auprès d’un échantillon aléatoire de 400 naissances cor-respondant à des femmes ayant eu pendant leur grossesse un travail pénible. Les chercheurs décident a priori que si la proportion d’enfants nés prématurés dans cet échantillon est supérieure à la borne supérieure d’un intervalle de fluctuation asymptotique au seuil de 0,95, alors leur hypothèse sera acceptée. Finalement, le nombre d’enfants prématurés est de 50. Quelle est donc la conclusion ?

Dans le monde, la proportion de gauchers est 12 %.

Dans un club de tennis, il y a 21 gauchers parmi les 103 licenciés.

� Déterminer la fréquence de gauchers dans ce club.

� Déterminer un intervalle de fluctuation asymptotique au seuil de 95 %.

� Peut-on dire que ce club est « représentatif » de la proportion de gauchers dans le monde ?

On souhaite utiliser l’intervalle de fluctuation asymptotique

J pp p

np

p pnn = −

−+

1 96

11 96

1,

( ); ,

( ).

� Pour p = 0 02, , déterminer la plus petite valeur de n vérifiant les conditions d’utilisation :

n ≥ 30, np ≥ 5 et n p( ) .1 5− ≥

� Déterminer ensuite la plus petite valeur de n pour laquelle l’amplitude de l’intervalle de fluctuation est inférieure à 0,1.

D

Exercice 8

Exercice 9

Exercice 10

© Cned - Académie en ligne

38 Séquence 9 – MA02

14 EstimationObjectifs du chapitre

On souhaite connaître, dans une population, la valeur d’une proportion p (pro-portion des pièces défectueuses parmi les pièces fabriquées par une usine, pro-portion des gauchers en France, intentions de vote pour un référendum…).

Pour des raisons matérielles, financières ou autres (par exemple, on ne peut pas tester le bon fonctionnement de toutes les allumettes d’une production car dans ce cas tester une allumette amène à la détruire !), on ne peut pas toujours réunir les données concernant la population tout entière.

On va donc estimer la proportion p que l’on cherche à partir de la fréquence f observée dans un échantillon.

Mais on sait que cette fréquence observée va varier d’un échantillon à l’autre, c’est la fluctuation d’échantillonnage autour de p.

Il est donc nécessaire de tenir compte de cette fluctuation en donnant un résultat sous forme d’un intervalle, appelé « intervalle de confiance » en précisant aussi le niveau de confiance que l’on accorde à cette réponse.

Dans ce chapitre, on montre comment on peut déterminer un intervalle de confiance avec un niveau de confiance de 95 %.

Cet intervalle dépendant de la taille de l’échantillon, on détermine la taille de l’échantillon qui est suffisante pour obtenir une précision donnée (qui dépend de l’amplitude de l’intervalle de confiance), le niveau de confiance étant toujours 95 %.

Pour débuterDans ce chapitre, vous apprendrez à répondre à des questions analogues à la suivante.

On considère une urne contenant un très grand nombre de petites billes de cou-leur blanche ou noire, la proportion p de billes noires est inconnue. On cherche à estimer p à partir d’un échantillon de taille n.

� On effectue 100 tirages indépendants et on obtient 71 billes noires et 29 billes blanches, à combien peut-on estimer p ?

� Même question sachant qu’on a effectué 1000 tirages et obtenu 693 billes noires et 307 billes blanches.

A

B

© Cned - Académie en ligne

39Séquence 9 – MA02

Cours

1. Résultat préliminaireDémontrer que, pour tous réels x et y et pour tout réel r positif, on a :

x r y x r y r x y r− ≤ ≤ + ⇔ − ≤ ≤ + .

x r y x rx r yy x r

x y ry r x

y r x y r− ≤ ≤ + ⇔− ≤≤ +

⇔≤ +− ≤

⇔ − ≤ ≤ + ..

La double inégalité x r y x r− ≤ ≤ + équivaut à − ≤ − ≤r y x r qui peut s’inter-prétér avec une valeur absolue : y x r− ≤ . La distance entre les deux nombres x et y est inférieure à r, les deux nombres x et y jouant le même rôle.

2. Exemple de référenceAvant d’aborder les définitions et les propriétés bien mises en forme mais un peu difficiles au premier abord, nous allons étudier un exemple.

On considère une urne contenant un très grand nombre de petites billes de cou-leur blanche ou noire, la proportion p de billes noires est inconnue. On cherche à estimer p à partir d’un échantillon de taille n.

La probabilité d’obtenir une bille noire quand on fait un tirage au hasard est égale à la proportion p.

On sait donc que, parmi tous les échantillons de taille n qu’on peut obtenir, envi-ron 95 % d’entre eux ont une fréquence f qui appartient à l’intervalle de fluctua-

tion pn

pn

− +

1 1; . Le résultat préliminaire du � prouve que :

pn

f pn

fn

p fn

− ≤ ≤ + ⇔ − ≤ ≤ +1 1 1 1,

ce qui permet de déduire que  : f pn

pn

∈ − +

′′1 1

; est équivalent à

p fn

fn

∈ − +

′′1 1

; .

Donc, parmi tous les échantillons de taille n qu’on peut obtenir, environ 95 %

sont tels que l’intervalle associé fn

fn

− +

1 1; contient le nombre p que

l’on cherche à estimer.

On réalise donc un échantillon de taille n en effectuant n tirages indépendants (tirages au hasard avec remise). On calcule la fréquence f de billes noires dans

l’échantillon obtenu et on détermine l’intervalle fn

fn

− +

1 1; .

On dit alors que p appartient à fn

fn

− +

1 1; avec un niveau de confiance

de 95 % et que l’intervalle fn

fn

− +

1 1; est un intervalle de confiance au

niveau 95 %.

C

� Solution

Remarque

© Cned - Académie en ligne

40 Séquence 9 – MA02

� On effectue 100 tirages indépendants et on obtient 71 billes noires et 29 billes blanches. Donner un intervalle de confiance au niveau de 95 % pour la proportion p de billes noires.

� Même question sachant qu’on a effectué 1000 tirages et obtenu 693 billes noires.

� On trouve f = 0 71, . Comme n = 100, l’intervalle fn

fn

− +

1 1; est

l’intervalle 0 711

1000 71

1100

, ; , ,− +

soit 0 61 0 81, ; , .[ ]La proportion p de billes noires appartient à 0 61 0 81, ; ,[ ] avec un niveau de confiance de 95 %.

On dit aussi que la proportion de billes noires est estimée à 0,71 avec l’inter-valle de confiance de 0 61 0 81, ; ,[ ] au niveau 95 %.

� On a ici f = 0 693, .

Un intervalle de confiance au niveau 95 % est donc

0 6931

10000 693

11000

, ; , .− +

Pour donner un intervalle dont les bornes sont des nombres décimaux ayant trois chiffres après la virgule, on détermine une valeur approchée par excès de la borne de droite et une valeur approchée par défaut de la borne de gauche : on obtient

0 661 0 725, ; , .[ ]La proportion de billes noires est estimée à 0,693 avec l’intervalle de confiance de 0 661 0 725, ; ,[ ] au niveau de 95 %.

Il est clair qu’une fois l’échantillon réalisé, l’intervalle fn

fn

− +

1 1; est

déterminé et il n’y a alors que deux possibilités : p appartient ou n’appartient pas à cet intervalle (de même quand on a lancé une pièce, on a obtenu « pile » ou on a obtenu « face »). C’est pourquoi on ne s’exprime plus en termes de probabilité. Pour exprimer l’idée qu’on a obtenu un intervalle et qu’environ 95 % des inter-valles qu’on peut obtenir ainsi contiennent la proportion cherchée, on a choisi le mot « confiance ».

3. Définition

Comme dans le chapitre précédent, on considère une suite de variables aléatoires Xn( ) où chaque variable aléatoire Xn suit la loi binomiale B ( )n p; (exemple :

on lance n fois une pièce et Xn est le nombre de « pile » obtenus). La variable

aléatoire FXnnn= donne donc la fréquence du nombre de « succès ».

On dit qu’un intervalle est aléatoire lorsque ses bornes sont définies par des variables aléatoires.

La réalisation d’un intervalle aléatoire est l’intervalle obtenu après avoir réalisé l’expérience aléatoire (après avoir lancé 500 fois une pièce, interrogé 1000 per-sonnes…).

� Exemple 4

� Solution

© Cned - Académie en ligne

41Séquence 9 – MA02

Un intervalle de confiance pour une proportion p à un niveau de confiance de 95 % est la réalisation, à partir d’un échantillon, d’un intervalle aléatoire contenant la proportion p avec une probabilité supérieure ou égale à 95 %.

Définition 7

Propriété 9

Pour une valeur de p fixée, l’intervalle aléatoire Fn

Fnn n− +

1 1;

contient, pour n assez grand, la proportion p avec une probabilité au moins

égale à 0,95.

� Démonstration

Dans le chapitre précédent, on a démontré le théorème 4. On sait donc que, pour une valeur de p fixée, il existe un entier n0 tel que : si n n≥ 0 alors

P pn

Xn

pn

n− ≤ ≤ +

≥1 10 95, .

Comme P pn

Xn

pn

P Fn

p Fn

nn n− ≤ ≤ +

= − ≤ ≤ +

1 1 1 1, l’intervalle

aléatoire Fn

Fnn n− +

1 1; contient bien pour n n≥ 0 la proportion p avec

une probabilité au moins égale à 0,95.

4. Taille de l’échantillon pour obtenir une précision donnée au niveau de confiance de 95%

La précision de l’estimation est donnée par l’amplitude de l’intervalle

fn

fn

− +

1 1; qui est égale à

2n

et dépend donc de la taille n de l’échan-

tillon.

À savoirOn se place dans le cas où l’échantillon contient au moins 30 éléments. Si

la fréquence f observée est telle que nf ≥ 5 et n f( ) ,1 5− ≥ on convient

que f est une estimation de p et que l’intervalle fn

fn

− +

1 1; est

un intervalle de confiance au niveau de 95 % pour la proportion p.

Cet intervalle est parfois appelé fourchette de sondage.

© Cned - Académie en ligne

42 Séquence 9 – MA02

On observe que cette amplitude ne dépend pas de la taille de la population totale, ce qui peut étonner. Mais pour goûter un plat, il suffit d’en goûter une petite quantité, cette quantité ne dépend pas de la taille du récipient (mais il faut néanmoins avoir bien mélangé) ! (Explication donnée d’après une idée de Jean-Louis Boursin dans son livre Les structures du hasard.)

On peut donc choisir la taille n de l’échantillon pour obtenir la précision sou-

haitée. En notant a la précision souhaitée, on cherche un entier n tel que 2n

a≤ ,

soit na

≥ 42 .

Précision a 0,06 0,04 0,02 0,01

Taille minimale de l’échantillon n 1112 2500 10000 40000

Les sondages sont souvent faits avec des échantillons d’environ 1000 personnes, la précision obtenue est donc d’environ 0,06.

Ainsi, questionner 1 112 personnes suffit pour avoir une fourchette de sondage d’amplitude 0,06, qu’il s’agisse d’un sondage pour un référendum local concer-nant 100 000 électeurs ou pour le deuxième tour d’une élection présidentielle concernant 35 millions d’électeurs.

Il faut bien sûr savoir cela quand on reçoit des informations où les sondages sont un élément important.

5. Exemple : sondages et élections

Dans cet exercice, la population est suffisamment grande pour que les sondages soient assimilés à des tirages avec remise. On ne tient compte que des réponses exprimées, c’est-à-dire qu’on ne tient pas compte des prévisions d’abstentions ou des intentions de vote nul. Les sondages sont faits auprès de 1 112 personnes.

Au deuxième tour de l’élection présidentielle, le dernier sondage de l’institut A indique 52,5 % d’intentions de vote pour le candidat X et 47,5 % pour le candi-dat Y (les abstentions ou les votes nuls ne sont pas pris en compte).

L’institut B indique 50 5, % d’intentions de vote pour le candidat X et 49 5, % pour le candidat Y.

� Y a-t-il une contradiction entre les résultats de ces deux instituts de sondage ?

� Le candidat X peut-il être totalement rassuré ?

� L’intervalle de confiance fn

fn

− +

1 1; obtenu à partir des résultats

de l’institut A qui donne f = 0 525, pour le candidat X est environ égal à 0 495 0 555, ; , .[ ] En utilisant les résultats de l’institut B qui donne f = 0 505, ,

on obtient environ 0 475 0 535, ; , .[ ] Les deux intervalles de confiance ont une partie commune, donc les résultats de ces deux instituts de sondage ne sont pas en contradiction.

� Exemple 5

� Solution

© Cned - Académie en ligne

43Séquence 9 – MA02

� Le candidat X ne peut pas être totalement rassuré car les deux intervalles de confiance contiennent des nombres inférieurs à 0,5, correspondant à un échec de sa candidature.

6. Simulation

Pour mieux voir ce qu’est un intervalle de confiance, une fourchette de sondage, on a réalisé 20 séries de 200 tirages de 0 et de 1 au hasard.

Pour chaque série, on obtient un intervalle de confiance.

Dans la colonne GS, on a déterminé la fréquence avec laquelle on a obtenu 1. Dans les colonnes GT et GU sont calculées les bornes de l’intervalle de confiance du cours au niveau de 95 %. La sélection des colonnes GT et GU et le choix de « XY dispersion » dans type de diagramme dans Open Office donne le dia-gramme ci-dessous.

Les 20 intervalles de confiance sont limités verticalement par les deux séries de points.

On constate ici que 19 d’entre eux contiennent p = 0 5, qui est la proportion réelle dans cet exemple de tirage au hasard. Un seul intervalle ne contient pas p = 0 5, .

Dans d’autres simulations, on peut bien sûr trouver plusieurs intervalles de confiance, plusieurs fourchettes de sondage, qui ne contiennent pas p ; on peut aussi n’en trouver aucun.

Quand on veut estimer une proportion, on utilise un seul intervalle de confiance.

La simulation permet de voir qu’environ 95 % des intervalles de confiance contiennent p ce qui illustre la propriété 8.

© Cned - Académie en ligne

44 Séquence 9 – MA02

7. Autre intervalle de confiance

Comme il existe différents intervalles de fluctuation, il existe différents intervalles de confiance.

Par exemple, l’intervalle ff f

nf

f fn

− − + −

1 96

11 96

1,

( ); ,

( ) est aussi un inter-

valle de confiance qui est utilisé dans certains cas. On ne le justifiera pas ici.

Exercices d’apprentissage

� Une usine vient d’installer une chaîne de fabrication pour fabriquer une nou-velle pièce. Après un bref temps de fonctionnement, on prélève 100 pièces. La fabrication est assez importante pour que ce prélèvement soit assimilé à un tirage avec remise. On trouve 23 pièces défectueuses. Déterminer un intervalle de confiance de la proportion de pièces sans défaut avec un niveau de confiance de 95 %.

� Des modifications ont été apportées. On prélève de nouveau 100 pièces et on en trouve 9 défectueuses.

Déterminer l’intervalle de confiance correspondant.

� Conclure.

Dans une grande ville, un nouveau cinéma va être construit. La municipalité pro-pose un terrain à proximité du centre ancien.

� Un premier sondage est effectué auprès de 100 personnes choisies de façon aléatoire et indique 53 avis favorables. Peut-on dire que la majorité de la population est favorable à cet emplacement ?

� Un deuxième sondage effectué auprès de 500 personnes indique la même proportion d’avis favorables. La conclusion est-elle différente ?

� Si un sondage effectué auprès de n personnes indique la même proportion d’avis favorables, à partir de quelle valeur de n peut-on estimer, au niveau de confiance de 95 %, que la majorité de la population est favorable à cet emplacement ?

D

Exercice 11

Exercice 12

© Cned - Académie en ligne

45Séquence 9 – MA02

5 SynthèseSynthèse de la séquence

Dans cette séquence, trois types de variables aléatoires discrètes (prenant un nombre fini de valeurs) sont utilisées.

Les variables dépendent des deux paramètres n et p.

Par exemple, on lance n fois une pièce déséquilibrée pour laquelle la probabilité d’obtenir « pile » est égale à p = 0 6, . La variable aléatoire Xn est égale au nombre de fois où on obtient « pile ».

Les variables aléatoires Xn  suivent des lois binomiales de paramètres n et p. La variable aléatoire Xn prend les valeurs entières de 0 à n, E X npn( ) = et σ X np pn( ) = −( ).1

La variable aléatoire Zn est la variable aléatoire centrée-réduite associée à Xn . La variable aléatoire Zn prend des valeurs discrètes, souvent non entières, E Zn( ) = 0 et σ Zn( ) = 1. Toutes les variables Zn ont la même espé-rance et le même écart-type mais elles sont différentes (les valeurs prises par Zn dépendent de n et de p).

La variable aléatoireFXnnn= est la variable aléatoire qui est la fréquence

associée à Xn . La variable Fn prend des valeurs discrètes dans 0 1; ,[ ]E F pn( ) = (indépendante de n) et σ Fn( ) diminue quand n augmente.

Centrer et réduire

On dit qu’une variable aléatoire est centrée et réduite lorsque son espérance est nulle et son écart-type égal à 1.

Définition

Propriété

Soit X une variable aléatoire d’espérance m et d’écart-type σ , la variable

aléatoire ZX m= −

σ est une variable aléatoire centrée et réduite.

A

© Cned - Académie en ligne

46 Séquence 9 – MA02

Théorème de Moivre-Laplace

Soit p un nombre réel de l’intervalle 0 1; .] [Soit une suite de variables aléatoires Xn( ) où chaque variable aléatoire Xn suit la loi binomiale B ( ).n p;

On pose ZX npnp pn

n= −−( )

,1

variable centrée et réduite associée à Xn .

Alors, pour tous réels a et b tels que a b< , on a :

P a Z b xlim1

2e d .

nn

x

ab 2

2

∫( )≤ ≤ =π→+∞

0

0,1

0,2

0,3

0,4

0,5

n = 99

p = 0,34

0

1 2 3 4–4 –3 –2 –1

Loi normale centrée réduite

Une variable aléatoire X suit la loi normale centrée réduite (0 ;1)N si, pour tous réels a et b tels que a b< , on a :

P a X b f x x x( ) d1

2e d .

ab

x

ab 2

2

∫ ∫( )≤ ≤ = =π

Définition

O 1

1 2 0,4/

© Cned - Académie en ligne

47Séquence 9 – MA02

Si X suit la loi normale (0 ; 1)N alors E( )X = 0 et σ ( ) .X = 1

Lorsque la variable aléatoire X suit la loi normale (0 ; 1),N pour tout nombre α de l’intervalle 0 1; ,] [ il existe un unique nombre réel positif uα tel que P u X u 1 .( )− ≤ ≤ = −αα α

Valeurs particulières à connaître :

u0 05 1 96, ,≈ d’où : P X− ≤ ≤( ) ≈1 96 1 96 0 95, , , .

u0 01 2 58, ,≈ et P X− ≤ ≤( ) ≈2 58 2 58 0 99, , , .

Autres lois normales

Une variable aléatoire X suit une loi normale ( ; )2N σµ si la variable aléa-

toire ZX= − µ

σ suit la loi normale centrée réduite (0 ; 1).N

Définition

O 1

� (0;4)

� (0;1)

� (1;4)

� (3;0,25)

� (1;1)

Espérance et écart-type

Si une variable aléatoire X suit la loi normale ( ; )2N σµ alors E( )X = µ et σ σ( ) .X =

Calculs

La variable aléatoire X suivant la loi normale ( ; ),2N σµ il faut savoir calculer des probabilités de la forme : P a X b( ),≤ ≤ P X c( )≤ et P X c( ),≥ a, b et c étant des nombres réels donnés.

Il faut aussi savoir déterminer le nombre x tel que P X x p( ) ,≤ = p étant une probabilité donnée.

© Cned - Académie en ligne

48 Séquence 9 – MA02

µ

µ–3� µ+3�

µ–2� µ+2�

0,68

µ–� µ+�

Intervalles de fluctuation

Un intervalle de fluctuation asymptotique de la variable aléatoire FXnnn=

au seuil 1−α est un intervalle déterminé à partir de p et de n et qui contient

Fn avec une probabilité d’autant plus proche de 1−α que n est grand.

Définition

À connaître

P X( ) ,µ µ− ≤ ≤ + ≈σ σ 0 68 (à 10 2− près) ;

P X( ) ,µ µ− ≤ ≤ + ≈2 2 0 95σ σ (à 10 2− près) ;

P X( ) ,µ µ− ≤ ≤ + ≈3 3 0 997σ σ (à 10 3− près).

Théorème

Soit p un nombre réel fixé de l’intervalle 0 1; .] [Soit une suite de variables aléatoires Xn( ), chaque variable aléatoire Xn sui-vant la loi binomiale B ( ),n p; alors, pour tout réel α dans 0 1; ,] [ on a

PXn

lim I 1 ,n

nn∈

= −α

→+∞ où In est l’intervalle

p up p

np u

p pn

(1 );

(1 )− − + −

α α et uα désigne l’unique réel tel

que P u Z u 1 ,( )− ≤ ≤ = −αα α la variable aléatoire Z suivant la loi normale

(0 ; 1).N

© Cned - Académie en ligne

49Séquence 9 – MA02

Conditions d’utilisation

Les exigences habituelles de précision pour utiliser cette approximation sont  :n ≥ 30, np ≥ 5 et n p( ) .1 5− ≥

Il faut savoir utiliser un intervalle de fluctuation pour prendre une décision. La règle de décision adoptée étant la suivante :

si la fréquence observée f dans un échantillon appartient à un intervalle de fluctuation asymptotique au seuil de 95 %, on considère que l’échantil-lon est compatible avec le modèle ;

sinon, on considère que l’échantillon n’est pas compatible avec le modèle.

Intervalle de confiance

Un intervalle de confiance (on dit aussi une «  fourchette de sondage  ») pour une proportion p à un niveau de confiance de 95 % est la réalisation, à partir d’un échantillon, d’un intervalle aléatoire contenant la proportion p avec une probabilité supérieure ou égale à 95 %.

Définitions

Il faut savoir estimer une proportion inconnue p grâce à un échantillon :

la proportion p est estimée par la fréquence f, l’intervalle fn

fn

− +

1 1;

étant un intervalle de confiance au niveau de 95 %.

Conditions d’utilisation

On se place dans le cas où l’échantillon contient au moins 30 éléments et où la fréquence f observée est telle que nf ≥ 5 et n f( ) .1 5− ≥

La précision de l’estimation est donnée par l’amplitude de l’intervalle

fn

fn

− +

1 1; qui est égale à

2n

et dépend donc de la taille n de

l’échantillon.

Propriété

L’intervalle p up p

np u

p pn

I(1 )

;(1 )

n = − − + −

α α est un intervalle de

fluctuation asymptotique au seuil 1−α de la variable aléatoire FXnnn= .

En particulier, l’intervalle pp p

np

p pn

J 1,96(1 )

; 1,96(1 )

n = − − + −

est un

intervalle de fluctuation asymptotique au seuil de 95 %.

© Cned - Académie en ligne

50 Séquence 9 – MA02

Exercices de synthèsePlusieurs exercices de cette séquence sont issus de documents ressources  de l’Éducation nationale.

Lois normales

Sur une chaîne d’embouteillage, la quantité X (en cl) de liquide fournie par une machine pour remplir chaque bouteille, étiquetée 75 cl, de contenance totale 83 cl (liquide + air + bouchon), peut être modélisée par une variable aléatoire X suivant une loi normale de moyenne µ et d’écart-type σ = 2.

� Le directeur de la coopérative demande de régler la machine pour qu’il y ait moins de 1% de bouteilles qui débordent.

a) Quelle est alors la valeur de µ  ?

b) Quelle est, dans les conditions du a), la probabilité que la bouteille contienne moins de 75 cl ? La législation imposant qu’il y ait moins de 0 1, % de bou-teilles contenant moins de 75 cl, la législation est-elle respectée ?

� a) Sans changer l’écart-type, à quelle valeur de la moyenne µ doit-on régler la machine pour respecter la législation ?

b) Quelle est alors la probabilité qu’une bouteille déborde au remplissage ?

� Déterminer µ et σ pour qu’il y ait moins de 0 1, % de bouteilles de moins de 75 cl et moins de 1% de bouteilles qui débordent.

Intervalle de fluctuation

Les personnes qui achètent un billet pour un voyage en avion ne se présentent pas toutes à l’embarquement. Les compagnies aériennes cherchent donc à opti-miser le remplissage d’un avion en vendant éventuellement un nombre de billets supérieur à la capacité de l’avion (on dit que les places sont vendues en surréser-vation ou en surbooking). Les compagnies aériennes veulent bien sûr maîtriser le risque dû à cette pratique.

On considère un avion de 300 places, soit n le nombre de billets vendus, soit p la probabilité qu’un client ayant acheté un billet se présente à l’embarquement et soit Xn la variable aléatoire désignant le nombre d’acheteurs d’un billet se présentant à l’embarquement.

On cherche à évaluer n, n > 300, tel que P Xn( ) , ,> ≈300 0 05 c’est-à-dire tel que la probabilité que le nombre de passagers se présentant à l’embarquement soit supérieur à 300 soit égale à peu près à 0,05.

Pour modéliser cette situation, on suppose que les comportements des clients sont indépendants les uns des autres.

� Déterminer la loi de Xn .

� On suppose que p = 0 85, . Écrire l’intervalle de fluctuation asymptotique Jn

du cours pour Xnn au seuil de 95 %.

B

Exercice I

Exercice II

© Cned - Académie en ligne

51Séquence 9 – MA02

� Montrer que si Jnn ⊂

0300

; , alors la probabilité que le nombre de pas-

sagers se présentant à l’embarquement excède 300 est inférieure à une valeur proche de 0,05.

� On cherche à déterminer la valeur de n maximale permettant de satisfaire la

condition Jnn ⊂

0300

; .

a) Montrer que si Jnn ⊂

0300

; , alors 0 85 1 96 0 1275 300 0, , , .n n+ − ≤

b) On définit sur 1; + ∞[ [ la fonction f par f x x x( ) , , , .= + −0 85 1 96 0 1275 300 Montrer que la fonction f est strictement croissante sur 1; + ∞[ [ et déter-miner le plus grand entier n0 pour lequel la fonction f prend une valeur négative.

c) Vérifier que, pour cette valeur n0 , on a bien Jnn0

0300

0⊂

; . Conclure.

� Appliquer la même démarche lorsque p = 0 9, puis lorsque p = 0 95, . Com-menter.

Intervalle de fluctuation au seuil de 98 %

� Expliquer comment on peut retrouver, avec une calculatrice, les valeurs don-nées dans le cours pour u0 05, et u0 01, .

� Déterminer u0 02, . En déduire un intervalle de fluctuation asymptotique au

seuil de 98 % de la variable aléatoire FXnnn= , où chaque variable aléatoire

Xn suit la loi binomiale B ( ).n p;

� Une confiserie fabrique des pâtes de fruits. Les machines ont été réglées pour que la proportion des pâtes de fruits de premier choix dans la production soit de 80 %.

Dans un prélèvement d’un échantillon de 150 pâtes de fruits, on en a trouvé 122 de premier choix et 28 de deuxième choix.

La production est-elle conforme à la proportion attendue au seuil de 98 % ?

Intervalle de confiance

Pour estimer dans une population la proportion p des individus possédant le caractère A, on interroge au hasard 80 individus de cette population. On observe que 18 individus possèdent le caractère A.� Donner pour p un intervalle de confiance au niveau de 95 %.� Donner une condition sur le nombre n d’individus interrogés pour que la pré-

cision obtenue par l’intervalle de confiance au niveau de 95 % soit inférieure à 0,05.

� Donner une condition sur le nombre n d’individus interrogés pour qu’avec la même fréquence observée l’intervalle de confiance au niveau de 95 % soit inclus dans 0 0 25; , .[ ]

� Déterminer un entier n vérifiant les deux conditions. Quel serait alors l’inter-valle de confiance au niveau de 95 % ? �

Exercice III

Exercice IV

© Cned - Académie en ligne