54
Statistique et Statistique et probabilités probabilités

Statistique et probabilités. En classe de seconde

Embed Size (px)

Citation preview

Page 1: Statistique et probabilités. En classe de seconde

Statistique et probabilitésStatistique et probabilités

Page 2: Statistique et probabilités. En classe de seconde

En classe de secondeEn classe de seconde

Page 3: Statistique et probabilités. En classe de seconde

échantillonéchantillon : liste de résultats de n expériences identiques et indépendantes.

fluctuation d’échantillonnagefluctuation d’échantillonnage : les distributions des fréquences varient d’un

échantillon à l’autre d’une même expérience.

L’ampleur des fluctuations des L’ampleur des fluctuations des distributions de fréquences calculées distributions de fréquences calculées

sur des échantillons de taille sur des échantillons de taille n n diminue diminue lorsque lorsque n n augmente.augmente.

distribution des fréquencesdistribution des fréquences associée à un échantillon : liste des fréquences des différentes issues de cette expérience.

Page 4: Statistique et probabilités. En classe de seconde

Simuler une expérience, c’est choisir un choisir un modèlemodèle de cette expérience puis simuler simuler ce modèlece modèle, pour produire une liste de produire une liste de

résultatsrésultats assimilable à un échantillonéchantillon de cette expérience.

La simulation permet de disposer disposer d’échantillons de grande tailled’échantillons de grande taille et

d’observer des phénomènesappelant une explication dans le champ des

mathématiques.

SimulationSimulation

Page 5: Statistique et probabilités. En classe de seconde

En 1En 1èreère L : L :

enseignement obligatoire au enseignement obligatoire au choixchoix

Page 6: Statistique et probabilités. En classe de seconde

Expérience aléatoireExpérience aléatoire

EventualitésEventualités

EvénementsEvénements

Probabilité d’un événement, Probabilité d’un événement,

de l’événement contraire.de l’événement contraire.

PP((AABB)) + P + P((AABB)) = P = P((AA)) + P + P((BB))

EquiprobabilitéEquiprobabilité

Loi de probabilitéLoi de probabilité

Page 7: Statistique et probabilités. En classe de seconde

La simulation de l’expérience et le phénomène de stabilisation des stabilisation des fréquencesfréquences observées lorsque le

nombre d’épreuves augmente, permet de postuler l’existence d’un modèle l’existence d’un modèle probabilisteprobabiliste, caractérisé par une loi loi

de probabilitéde probabilité.

Page 8: Statistique et probabilités. En classe de seconde

Enoncé vulgarisé de la loi des Enoncé vulgarisé de la loi des grands nombresgrands nombres

Pour une expérience aléatoireexpérience aléatoire donnée, dans le modèle défini par une loi de loi de

probabilité probabilité PP, les distributions de fréquences obtenues sur des séries de taille n sont très proches de P quand n

est grand.

Page 9: Statistique et probabilités. En classe de seconde

En Terminale L : En Terminale L :

enseignement de spécialitéenseignement de spécialité

Page 10: Statistique et probabilités. En classe de seconde

ProbabilitésProbabilités

Arbres pondérésArbres pondérés

Conditionnement par un événement Conditionnement par un événement de probabilité non nullede probabilité non nulle

Indépendance de deux événementsIndépendance de deux événements

Formule des probabilités totalesFormule des probabilités totales

Epreuve de Bernoulli et loi binomialeEpreuve de Bernoulli et loi binomiale

Page 11: Statistique et probabilités. En classe de seconde

Tableaux et arbresTableaux et arbres

Différentes représentations Différentes représentations pour un même ensemblepour un même ensemble

Page 12: Statistique et probabilités. En classe de seconde

Une enquête de marketing portant sur Une enquête de marketing portant sur le choix entre deux abonnements A et le choix entre deux abonnements A et

B lors de l’achat d’un téléphone B lors de l’achat d’un téléphone portable et le statut de l’acheteur portable et le statut de l’acheteur

(salarié ou non salarié) a conduit au (salarié ou non salarié) a conduit au recueil des données de 9321 nouveaux recueil des données de 9321 nouveaux acheteurs, consignées dans le tableau acheteurs, consignées dans le tableau

suivant:suivant:

Page 13: Statistique et probabilités. En classe de seconde

Effectifs A B

Salarié 4 956 1 835

Non salarié

1 862 668

Page 14: Statistique et probabilités. En classe de seconde

EffectifsEffectifs A B Total

Salarié 4 956 1 835 6 7916 791

Non salarié

1 862 668 2 5302 530

Total 6 8186 818 2 5032 503 9 321

Page 15: Statistique et probabilités. En classe de seconde

A

B

NS

S

NS

S

6 6 818818

2 2 503503

668668

1 1 835835

1 1 862862

4 4 956956

Page 16: Statistique et probabilités. En classe de seconde

S

NS

B

A

B

A

6 6 791791

2 2 530530

668668

1 1 862862

1 1 835835

4 4 956956

Page 17: Statistique et probabilités. En classe de seconde

Chaque représentation (tableau ou Chaque représentation (tableau ou arbre) contient toute l’information et arbre) contient toute l’information et

permet de reconstituer n’importe permet de reconstituer n’importe laquelle des autreslaquelle des autres

Page 18: Statistique et probabilités. En classe de seconde

Fréquences des Fréquences des événementsévénements

Page 19: Statistique et probabilités. En classe de seconde

FréquencesFréquences A B Total

Salarié 0,531 0,197 0,7280,728

Non salarié 0,20 0,072 0,2720,272

Total 0,7310,731 0,2690,269 1

NotationsNotations : f (A)= 0,728

f (S) = 0,272

f (A et S) = 0,531 etc……

Page 20: Statistique et probabilités. En classe de seconde

Fréquences Fréquences conditionnellesconditionnelles

A B Total

Salarié 0,7270,727 0,7330,733 0,7280,728

Non salarié 0,2730,273 0,2670,267 0,2720,272

Total 11 11 11

NotationsNotations : f A (S) = 0,727

f A (NS) = 0,273 etc……

Page 21: Statistique et probabilités. En classe de seconde

Fréquences Fréquences conditionnellesconditionnelles A B Total

Salarié 0,7290,729 0,2810,281 11

Non salarié 0,7360,736 0,2640,264 11

Total 0,7310,731 0,2690,269 1

NotationsNotations : f S (A ) = 0,729

f NS (A ) = 0,736 etc……

Page 22: Statistique et probabilités. En classe de seconde

Comment reconstituer un Comment reconstituer un tableau de fréquences à partir tableau de fréquences à partir

d’un autre ?d’un autre ?

et

A

SASA f

ff

SASA Afff et

SBSAS et et fff

Page 23: Statistique et probabilités. En classe de seconde

NS

NS

A

B

S

S

f f ((AA))

f f ((BB))

ffAA((NSNS))

ffAA((SS))

ffBB((NSNS))

ffBB((SS))

f f ((AA )) ffAA((SS ) =) =f f ((AASS ))

Page 24: Statistique et probabilités. En classe de seconde

S

NS

A

f f ((SS))

f f ((NSNS))

ffSS((BB))

ffSS((AA))

ffNSNS((BB))

ffNSNS((AA))A

f f ((SS)) ffS S ((AA) ) ==f f ((AASS))

B

B

Page 25: Statistique et probabilités. En classe de seconde

AP

SAPSPP A

,0ALorsque

Définition

:

APSPSAP A

Page 26: Statistique et probabilités. En classe de seconde

NS

NS

A

B

S

S

PP((AA))

PP((BB))

PPAA((NSNS))

PPAA((SS))

PPBB((NSNS))

PPBB((SS))

P P ((A A )) PPA A ((S S ) =) =P P ((AAS S ))

Arbre pondéréArbre pondéré

Page 27: Statistique et probabilités. En classe de seconde

Indépendance de deux Indépendance de deux événementsévénements

Page 28: Statistique et probabilités. En classe de seconde

Dans l’exemple étudié,Dans l’exemple étudié,

ffA A ((SS)) = 0,726 = 0,726

ff ((SS)) = 0,728 = 0,728 ff AA ((SS)) ff ((SS))

Existence d’un lien de causalité ?Existence d’un lien de causalité ?

Page 29: Statistique et probabilités. En classe de seconde

Dans une urne il y a des pièces Dans une urne il y a des pièces indiscernables au toucher, de 1 ou 2 euros indiscernables au toucher, de 1 ou 2 euros

((EE11 ou ou EE22), 30 sont françaises, 70 non ), 30 sont françaises, 70 non françaises (françaises (FF ou ou NFNF). ).

Il y a 60 pièces de 1 euro, dont Il y a 60 pièces de 1 euro, dont kk sont sont françaises, et 40 pièces de 2 euros, dont 30 – françaises, et 40 pièces de 2 euros, dont 30 – kk sont françaises. sont françaises.

Est-il possible que le fait de Est-il possible que le fait de savoir que la savoir que la pièce extraite est une pièce de 1 europièce extraite est une pièce de 1 euro, , ne modifie pas la probabilité que la pièce ne modifie pas la probabilité que la pièce

extraite soit française ?extraite soit française ?

On choisit une pièce au hasard.On choisit une pièce au hasard.

Page 30: Statistique et probabilités. En classe de seconde

E1 E2 Total

F k 30 − k 30

NF 60 − k 10 + k 70

Total 60 40 100

Page 31: Statistique et probabilités. En classe de seconde

NF

NF

E1

E2

F

0,6

0,4F

60

k

60

1k

-

40

30

k

40

10 k

Page 32: Statistique et probabilités. En classe de seconde

? 1

relation la vérifiée soit que possible il-Est

FPFPE

1810030

10030

kk

k

60

0

si seulement et si

si seulement et si 1

et

6FPFPE

LorsqueLorsque kk = 18, = 18, savoir qu’il s’agit d’une pièce savoir qu’il s’agit d’une pièce de 1 euro ne modifie pas la probabilité qu’elle de 1 euro ne modifie pas la probabilité qu’elle soit française.soit française.

Page 33: Statistique et probabilités. En classe de seconde

11

1

ou

EPFPEFP

FPFPE

Evénements indépendants

Page 34: Statistique et probabilités. En classe de seconde

La notion d’indépendance entre deux La notion d’indépendance entre deux événements est une événements est une propriété propriété

numérique à l’intérieur du modèle numérique à l’intérieur du modèle probabilisteprobabiliste..

Page 35: Statistique et probabilités. En classe de seconde

Dans l’exemple précédent, supposons que le nombre total de pièces soit K.

n1 : nombre de pièces de 1 euro,

nF : nombre de pièces françaises

nF,1 : nombre de pièces françaises de 1 euro

Kn

n

n , FF1E FPFP

1

1

11 nnn , FFK:dire-à-estc'

Page 36: Statistique et probabilités. En classe de seconde

Lorsque Lorsque KK est un nombre premier, est un nombre premier,

(par exemple K = 101 au lieu de K = 100)

si K nF,1 =nF n1, alors

soit nF = K (toutes les pièces sont françaises)

soit n1 = K (toutes les pièces sont de 1 euro)

Page 37: Statistique et probabilités. En classe de seconde

Si nF = K

E1 E2 Total

F nF,1 K nF,1 K

NF 0 0 0

Total nF,1 K nF,1 K

FPFPE 1

Page 38: Statistique et probabilités. En classe de seconde

Si n1 = K

E1 E2 Total

F n F,1 0 n F,1

NFK n F,1

0 K n F,1

Total K 0 K

FPFPE 1

Page 39: Statistique et probabilités. En classe de seconde

StatistiqueStatistique

Adéquation d’une série de Adéquation d’une série de données à une loi équirépartiedonnées à une loi équirépartie

Page 40: Statistique et probabilités. En classe de seconde

En 1En 1èreère L L

L’L’équiprobabilité équiprobabilité : une hypothèse : une hypothèse parmi d’autres pour proposer un parmi d’autres pour proposer un

modèlemodèle

Modèles issus d’une Modèles issus d’une observation observation expérimentaleexpérimentale

Page 41: Statistique et probabilités. En classe de seconde

Objectif: Objectif:

sensibiliser les élèves au problème sensibiliser les élèves au problème de la validation d’un modèlede la validation d’un modèle

Page 42: Statistique et probabilités. En classe de seconde

Exemple : Exemple :

lancé d’un dé à 6 faces.lancé d’un dé à 6 faces.

Les Les résultatsrésultats obtenus dans obtenus dans des conditions normales des conditions normales

d’utilisation de ce dé sont-ils d’utilisation de ce dé sont-ils compatibles avec le modèle compatibles avec le modèle

d’équiprobabilitéd’équiprobabilité sur sur l’ensemble {1, 2, 3, 4, 5, 6} ?l’ensemble {1, 2, 3, 4, 5, 6} ?

Page 43: Statistique et probabilités. En classe de seconde

On dispose d’un On dispose d’un échantillon de taille échantillon de taille nn de cette épreuve aléatoirede cette épreuve aléatoire..

Cet échantillon peut-il être considéré Cet échantillon peut-il être considéré comme un échantillon de taille comme un échantillon de taille nn de la de la loi équirépartie sur l’ensemble {1, 2, 3, loi équirépartie sur l’ensemble {1, 2, 3,

4, 5, 6} ?4, 5, 6} ?

On lance On lance nn fois de suite ce dé. fois de suite ce dé.

Page 44: Statistique et probabilités. En classe de seconde

Critère de compatibilité entre une distribution Critère de compatibilité entre une distribution de fréquences et la loi équirépartie.de fréquences et la loi équirépartie.

2

6

2

2

2

12

6

1

6

1

6

1....

fffd

Distance entre une distribution de Distance entre une distribution de fréquences {fréquences {ff11, , ff22, .., , .., ff66} et la loi } et la loi

équirépartie sur {1, 2, .., 6}équirépartie sur {1, 2, .., 6}

Les Les donnéesdonnées seront considérées comme seront considérées comme incompatibles avec la loi équirépartieincompatibles avec la loi équirépartie si si d d obsobs

22 est supérieur à une valeur seuil à définir.est supérieur à une valeur seuil à définir.

Page 45: Statistique et probabilités. En classe de seconde

d d 22 est soumiseest soumise àà la fluctuation la fluctuation d’échantillonnaged’échantillonnage

On simule N échantillons de On simule N échantillons de nn tirages tirages équiprobables dans {1, 2, 3, 4, 5, 6}. équiprobables dans {1, 2, 3, 4, 5, 6}.

Série de N valeurs de Série de N valeurs de d d 22 dans le modèle dans le modèle équiréparti. équiréparti.

Page 46: Statistique et probabilités. En classe de seconde

Le Le 99èmeème décile décile de cette série, noté D de cette série, noté D99 : la plus : la plus petite valeur de la série telle que au moins petite valeur de la série telle que au moins 90% des valeurs soient dans l’intervalle [0; 90% des valeurs soient dans l’intervalle [0;

DD99]]

Prendre Prendre DD99 comme seuil de compatibilité comme seuil de compatibilité c’est adopter la règle de décision :c’est adopter la règle de décision :

si si ddobsobs2 2 > D> D99 : refuser l’hypothèse : refuser l’hypothèse

d’équiprobabilité d’équiprobabilité

si si ddobsobs22 D D99 : ne pas refuser : ne pas refuser

l’hypothèse d’équiprobabilitél’hypothèse d’équiprobabilité

Page 47: Statistique et probabilités. En classe de seconde

En fait, la seule décision qu’on puisse prendre En fait, la seule décision qu’on puisse prendre c’est de refuser l’hypothèse d’équiprobabilité.c’est de refuser l’hypothèse d’équiprobabilité.

Ne pas la refuser ne revient pas à la validerNe pas la refuser ne revient pas à la valider..

Le Le risque d’erreurrisque d’erreur vient de ce que vient de ce que ddobsobs22 peut peut

être supérieur à Dêtre supérieur à D99 même si le dé est même si le dé est équilibré. (fluctuation d’échantillonnage)équilibré. (fluctuation d’échantillonnage)

Page 48: Statistique et probabilités. En classe de seconde

Les données simulées qui aboutissent à Les données simulées qui aboutissent à ce seuil de décision indiquent que cette ce seuil de décision indiquent que cette

situation se produit dans 10% des situation se produit dans 10% des échantillons d’une loi équirépartie.échantillons d’une loi équirépartie.

la marge d’erreur est 10%.la marge d’erreur est 10%.

Page 49: Statistique et probabilités. En classe de seconde

Prendre le 99Prendre le 99èmeème centile comme seuil centile comme seuil décisionnel conduit au risque d’erreur de 1%. décisionnel conduit au risque d’erreur de 1%.

Prendre le Prendre le 1919èmeème vingtile vingtile, noté V, noté V1919 (la plus (la plus petite valeur de la série telle que au moins petite valeur de la série telle que au moins 95% des valeurs soient dans l’intervalle [0; 95% des valeurs soient dans l’intervalle [0; VV1919]) comme seuil décisionnel conduit au ]) comme seuil décisionnel conduit au

risque d’erreur de 5%.risque d’erreur de 5%.

Abaisser le seuil de risque revient à relever le Abaisser le seuil de risque revient à relever le seuil entre petites et grandes valeurs de seuil entre petites et grandes valeurs de dd² . ² .

On peut être amené à refuser l’hypothèse On peut être amené à refuser l’hypothèse d’équiprobabilité au seuil de 10% et à ne pas la d’équiprobabilité au seuil de 10% et à ne pas la

refuser au seuil de 5% ou de 1%.refuser au seuil de 5% ou de 1%.

Page 50: Statistique et probabilités. En classe de seconde

1 2 3 4 5 6

0,215

0,155

0,207

0,115

0,17 0,13

008102 ,obsd

Expérience

Page 51: Statistique et probabilités. En classe de seconde

0 0,002 0,004 0,006 0,008 0,01 0,012 0,014 0,016 0,018 0,02

008102 ,obsdD9 V19

Page 52: Statistique et probabilités. En classe de seconde

Dans ce cas, au vu des résultats Dans ce cas, au vu des résultats expérimentaux, et en appliquant la règle expérimentaux, et en appliquant la règle décisionnelle choisie :décisionnelle choisie :

au seuil de risque de 10% , l’hypothèse au seuil de risque de 10% , l’hypothèse d’équiprobabilité doit être refusée;d’équiprobabilité doit être refusée;

au seuil de risque de 5%, on peut la au seuil de risque de 5%, on peut la maintenir. maintenir. Elle n’est pas, pour autant, Elle n’est pas, pour autant, validée.validée.

192

9 VD obsd

Page 53: Statistique et probabilités. En classe de seconde

Formule des probabilités Formule des probabilités totalestotales

SAPSAPAP

SPAPSPAPAP

,SPSP

SS

00 etLorsque

Page 54: Statistique et probabilités. En classe de seconde

f (A) = x f (A et S) = y

f (B) = 1- x f (B et S) = 0,728 - y

Fréquences Fréquences conditionnellesconditionnelles

A B Total

Salarié 0,7270,727 0,7330,733 0,7280,728

Non salarié 0,2730,273 0,2670,267 0,2720,272

Total 11 11 11

y=x0,727

0,728 – y = (1-x)0,733et