62
COURS DE STATISTIQUE INFÉRENTIELLE E.N.A.C Françoise SEYTE Maître de Conférence Université Montpellier 1 2014 - 2015 1 MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Cours de Stat Donné Etudiants

Embed Size (px)

DESCRIPTION

cours

Citation preview

Page 1: Cours de Stat Donné Etudiants

COURS DE STATISTIQUE

INFÉRENTIELLE

E.N.A.CFrançoise SEYTE

Maître de Conférence

Université Montpellier 1

2014 - 20151

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Page 2: Cours de Stat Donné Etudiants

OBJECTIFS DU COURS

Le cours a pour objectif d'acquérir et de maîtriser les outils dela statistique mathématique nécessaires à la constructiond'intervalles de confiance et de tests indispensables à la prisede décision pour un futur ingénieur.

2

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Page 3: Cours de Stat Donné Etudiants

OBJECTIFS DU COURS

Le cours de statistique probabiliste donne les basesnécessaires pour savoir prendre des décisions utilesdans le futur métier d'ingénieur.

Il essaie de répondre aux questions suivantes :

comment sont construits les échantillons?

Comment déterminer leurs tailles?

Les échantillons sont ils représentatifs de la population?

Peut-on comparer par exemple les moyennes de ces deuxéchantillons?

Peut-on faire des prévisions? …

Autant de questions auxquelles doivent savoir répondre unfutur ingénieur.

3

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Page 4: Cours de Stat Donné Etudiants

PROGRAMME

1 - Construction théorique des lois statistiques et lecturedes tables statistiques

2 - Echantillonnage

3 - Estimation ponctuelle

4 - Estimation par intervalles de confiance

5 - Tests non paramétriques (test d'adéquation et testd'indépendance) et paramétriques (tests de significationd'un paramètre et tests de comparaison de paramètres)

4

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Page 5: Cours de Stat Donné Etudiants

CHAPITRE 1 ECHANTILLONNAGE

Les lois d’échantillonnage et les variablesd’échantillonnage définies dans ce chapitre vont nousservir dans les chapitres 3 et 5 pour établir les intervallesde confiance (c’est à dire encadrer les paramètresinconnus d’une population : moyenne, variance,proportion) et faire des tests d’hypothèse (c’est-à-diretester les paramètres d’une population à partir desdonnées d’échantillonnage).

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

5

Page 6: Cours de Stat Donné Etudiants

Notion de base en statistique : celle de population

Population : ensemble d’individus (ou objets ou unitésstatistiques) pouvant être décrits par un ensemble de variables(ou propriétés ou caractéristiques) communes.

Impossible d’étudier tous les individus d’une population

un sondage un échantillon représentatif.

La théorie de l’échantillonnage permet de passer descaractéristiques de la population aux caractéristiques d’unéchantillon représentatif

6

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Page 7: Cours de Stat Donné Etudiants

La question essentielle que l’on peut se poser est la suivante :

Pourquoi s’intéresser à l’échantillon, pourquoi ne pas effectuer les calculs nécessaires directement sur la population ?

Pour deux raisons au moins :

- il n’est pas certain que les statistiques désirées soient disponibles sur l’ensemble de la population,

- et d’autre part, il est beaucoup moins coûteux et aussi plus rapide de rassembler des informations sur mille individus plutôt que sur un million.

7

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Page 8: Cours de Stat Donné Etudiants

1. DÉFINITIONS

1.1 Echantillons?

Soit X, une variable aléatoire définie dans une

population :

Caractérisée par sa densité de probabilité f(x), dans

le cas d’une variable aléatoire continue,

ou par sa probabilité élémentaire p(x), dans le cas

d’une variable aléatoire discrète.

8

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Page 9: Cours de Stat Donné Etudiants

échantillon théorique aléatoire probabilisé

échantillon empirique ou observé

9

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Page 10: Cours de Stat Donné Etudiants

Echantillon théorique aléatoire probabilisé :

Echantillon de taille n issu de X, ou n-échantillon de X, le vecteur aléatoire où et indépendants .

L’échantillon est dit IID c'est-à-dire identiquement indépendamment distribué.

10

ni XXXX ,,..., 21 iXX i ji XX ,

ji

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Page 11: Cours de Stat Donné Etudiants

Echantillon empirique ou observé :

L’ ensemble des n valeurs images indépendantes de X estconstitué des n images de l’épreuve associée à Xindépendantes

11

n21 x,,x,x

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Page 12: Cours de Stat Donné Etudiants

La dernière précision que nous devons apporter avant d’aborder les variables d’échantillonnage est de bien comprendre que les échantillons ne sont pas uniques :

il est en effet possible de prendre plusieurs échantillons de la population mère.

Par conséquent, il est toujours possible de considérer que les échantillons sont choisis de manière aléatoire.

12

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Page 13: Cours de Stat Donné Etudiants

1. 2. Vraisemblance d’un échantillon

→ X : variable aléatoire continue caractérisée par

son ensemble de définition f(x) densité de probabilité

→ X: variable aléatoire discrète caractérisée par :son ensemble de définition

p(x) probabilités élémentaires

13

n1 x,,xL

)x(p)x(px,,xL n1n1

)x(f)x(fx,,xL n1n1

)(; xp

)(; xf

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Page 14: Cours de Stat Donné Etudiants

SYNTHESE

Caractéristiques de la population

Caractéristiques correspondantes dans l’échantillon

théorique

Caractéristiques correspondantes dans l’échantillon

empiriqueLa moyenne : m

La variance :

ou s² ou La proportion p F f

14

X x

2S 2S ]X[V2

iX

nX

1 22 )(

1XX

nS i

n

XF

^

dxxxfXEm

x

xpxXEm

cas continu

dx)x(fmx)X(EXE]X[V222

x

222 pxmx)X(EXE]X[V

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

cas discret

Page 15: Cours de Stat Donné Etudiants

les échantillons ne sont pas uniques : il est en effet possiblede prendre plusieurs échantillons de la population mère.

Par conséquent, il est toujours possible de considérer que leséchantillons sont choisis de manière aléatoire.

Ainsi, théoriquement on peut associer à chaque échantillonune statistique comme la moyenne et une probabilitéd’occurrence associée à .

La moyenne de l’échantillon est donc une variable aléatoireque l’on notera , celle-ci rassemble toutes les valeurs prisespar l’ensemble des mesurées sur chaque échantillon.

Il en va de même pour l’écart-type S, la variance S², laproportion F, la caractéristique de l’individu i, …

15

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

x

X

x

x

Page 16: Cours de Stat Donné Etudiants

2 . VARIABLES D’ÉCHANTILLONNAGE

2.1. Etude de 𝑿

Ex : un chef d’entreprise s’intéresse au diamètre moyen despièces métalliques qu’il fabriqueLa population : ici : les pièces métalliquesLa variable aléatoire X : « diamètre des pièces »Il prélève un échantillon de n pièces. Il mesure le diamètre deces pièces. Il peut calculer le diamètre moyen de ces pièces.C’est une statistiquePar contre la variable aléatoire : « diamètre moyen despièces ». celle-ci rassemble toutes les valeurs prises parl’ensemble des mesurées sur chaque échantillon.

16

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Objectifs : calculer pour chacune des variables d’échantillonnage précédentes leurs espérance et variance qui serviront dans la détermination de leurs lois de probabilités.

X

x

x

Page 17: Cours de Stat Donné Etudiants

moyenne de l’échantillon théorique

Les sont des variables aléatoires est une variable

aléatoire.

Calcul de l’espérance de la moyenne de l’échantillon théorique

Calcul de sa variance

17

n

1i

iXn

1X

iX X

mXE

n

XV2

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

n

1i

i

n

1i

i XEn

1X

n

1EXE mXEXE i )( XX i

n

i

mn

XE1

1

.

²²

²

1XV

²

1V

²

1

11 nn

nnX

n

n

i

n

i

i

ind

XV

Page 18: Cours de Stat Donné Etudiants

2.2. ETUDE DE S²

Les sont des variables aléatoires, donc S² est une

variable aléatoire.

18

n

1i

2i

2 XXn

1S

s

iX

22 1

n

nSE

On recherche 2S 22 ]ˆ[ SEtel que

estimateur sans biais de (Cf. chapitre 2). 2

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

1

1

11ˆ

2

222

n

XXXX

nn

nS

n

nS

i

i

Page 19: Cours de Stat Donné Etudiants

2.3 ETUDE DE LA PROPORTION D’ÉCHANTILLON FSoit Y une variable aléatoire définie dans une population.

Y présente deux modalités : évènement A évènement

La variable aléatoire Y est donc associée au tirage d’un

individu. Y est une variable de Bernoulli.

Maintenant, soit la variable X associée au tirage de n individus

de manière indépendante (c’est-à-dire au nombre de fois où A

se produit).

Considérons F la proportion dans l’échantillon théorique issude la population. obéit elle aussi à une loi binomiale :

19

A

n

1i

iYX )p,n(BX

n

XF

pFE

n

pqFV

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

p

n

npXE

n

1

n

XEFE

n

pq

n

npqXV

n

1

n

XVFV

22

Page 20: Cours de Stat Donné Etudiants

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

20

POPULATION :

Moyenne : m= E[X]

Ecart-type : σ

Variance : σ ² =V[X]

Proportion : p

ECHANTILLON :

Moyenne :

Ecart-type (empirique) : s [ S ]

Variance (empirique) : s² [ S² ]

Proportion : f [ F ]

Taille : n

Caractéristique de l’individu i : xi [Xi]

x [ X ]

Page 21: Cours de Stat Donné Etudiants

3 . LOIS DE PROBABILITÉS DES VARIABLES

D’ÉCHANTILLONNAGE FONDÉES SUR L’HYPOTHÈSE DE

NORMALITÉ : CAS D’UN ÉCHANTILLON TIRÉ D’UNE

POPULATION NORMALE.

21

3.1 Loi de

Quelle est l’utilité de cette loi? Prenons un ex

Une étude statistique effectuée à l’Arena de Montpellier montre que l’affluence des spectateurs est une variable aléatoire X qui suit une loi normale de moyenne 13500.

Si on choisit aléatoirement un échantillon de 50 spectacles sur ces vingt dernières années, quelle est la probabilité pour que l’affluence moyenne soit strictement supérieure à 13500 spectateurs sachant que l’écart-type de la population s’élève à 1000 ?

X

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Page 22: Cours de Stat Donné Etudiants

La variable aléatoire X : « Affluence hebdomadaire des spectateurs ». Il est indiqué dans l’énoncé que X suit une loi normale de moyenne m = 13500 et d’écart-type σ = 1000 :

Epreuve aléatoire : « Choisir un échantillon au hasard de 50 spectacles ».

Ensuite, essayons de bien distinguer les informations relatives à l’échantillon de celles issues de la population :

Taille de l’échantillon : n = 50

22

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Page 23: Cours de Stat Donné Etudiants

La question posée dans l’énoncé est relative à « l’affluence moyenne dans l’échantillon ». Il faut donc définir une nouvelle variable aléatoire :

La variable aléatoire : « Affluence moyenne des spectateurs dans l’échantillon ».

La question est précisément « quelle est la probabilité … ». Pour mesurer une probabilité, il nous faut connaître la loi suivie par la variable aléatoire qui nous intéresse. Nous devons donc déterminer la loi suivie par .

23

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

X

X

Page 24: Cours de Stat Donné Etudiants

3 . LOIS DE PROBABILITÉS DES VARIABLES

D’ÉCHANTILLONNAGE FONDÉES SUR L’HYPOTHÈSE

DE NORMALITÉ : CAS D’UN ÉCHANTILLON TIRÉ

D’UNE POPULATION NORMALE.

3.1 Loi de

Hyp :

24

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

,mNX

X

Rappels sur la loi normale

Page 25: Cours de Stat Donné Etudiants

RAPPEL LOI NORMALE

25

La variable aléatoire normale X est une variable continue

pouvant prendre n’importe quelle valeur entre et avec ladensité de probabilité :

avec : m l’espérance mathématiquel’écart-type de la distribution.

La variable normale centrée réduite :

avec

Toutes les tables statistiques utilisent la variable normalecentrée réduite

2mx

2

1

e2

1xf

mXU

2

2

2

1u

euf

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

,mNX

10,NU

Page 26: Cours de Stat Donné Etudiants

26

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Cette table donne la densité de probabilité f(u) correspondant aux valeurs de la variable normale centrée réduite.En raison de la symétrie de la courbe de densité, la table permet de déterminer les densités correspondantes à des valeurs négatives de u : f(-u)=f(u)Ex pour f(-2,8)=0,0079=f(2,8)

Table de la densité de probabilité

Page 27: Cours de Stat Donné Etudiants

Le changement de variable permet de déterminer à l’aide de la table, la densité de probabilité correspondant à une valeur quelconque de la variable normale X de moyenne m et d’écart type .

Il existe donc entre les densités de probabilité de x et de u la relation :

Ex :

27

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

)u(f)x(f

)2,5(NX la densité de probabilité pour x=8 ?

10,NU

512

58,

mxu

064750

2

129501295051 ,

,)x(f,)u(f,u La lecture de la table donne

Page 28: Cours de Stat Donné Etudiants

Table de la fonction de répartition

Cette table donne, pour toute valeur positive u0 de lavariable normale centrée réduite, la valeurcorrespondante de la fonction de répartition F(u0)représentée par l’aire hachurée.

28

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

f(u)

0 u0

F(u0)

0

2

200

2

1Pr)(

u t

dteuuobuF

)u(FuUobPruUobPr 000 11

Page 29: Cours de Stat Donné Etudiants

29

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Supposons que Déterminons la probabilité pour que X soit compris entre deux valeurs a et b :

,mNX

mbmXmaobPrbXaobPr

maF

mbF

mbU

maobPrbXaobPr

)1,0(NmX

U

Exemple : Soit X une variable normale de moyenne 5 et d’écart type 2 : Calculer la probabilité pour que X soit compris entre 1 et 7.

25,NX

8185097720184130

21121121

12

2

57

2

5

2

5171

,,.

)(F)(F)(F)(F)(F)(F

UobPr

XobPrXobPr

Page 30: Cours de Stat Donné Etudiants

30

MCU F. Seyte, Université Montpellier 1- EM Alès - Statistique 1A

Table de la loi normale centrée réduite Cette table permet de trouver la valeur d’une variable normaleen fonction de la probabilité P de dépassement ou de laprobabilité Q complémentaire (Q=1-P). C'est-à-dire que dans cecas, est connue et on cherche à déterminer

Si > 0,5 alors on lira directement dans la table la valeur de u0.Si < 0,5 alors on lira dans la table la valeur de -u0.

0uF 0u

0uF

0uF

f(u)

0

u0

u

P

Q

00

0

uFuUobPrQ

uUobPrP

Page 31: Cours de Stat Donné Etudiants

Exemple : On cherche tel que

31

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

0u P,uUobPr 7500

f(u)

0

u0

u

P

Q

75%

250

250

7501

0

0

0

,uF

,uUobPr

,uUobPr

500 ,uF

on lira donc -u0

La lecture de la table donne 0,6745 donc 674500 ,u

Page 32: Cours de Stat Donné Etudiants

Soit u0 la valeur telle que

32

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

%uuobPr 50

f(u)

0

u0

u

P

5%

95%

950

950

0501

5

0

0

0

0

,uF

,uUobPr

,uUobPr

%uuobPr

95.u remplace la valeur de la variable centrée réduite ayant comme fonction de répartition 95% et/ou ayant comme probabilité de dépassement 5%

On lit cette valeur dans la table 6449,1%95 %5 95. uQP

95.0 uu

Page 33: Cours de Stat Donné Etudiants

CONDITIONS D’APPLICATION

1) Somme de variables normales indépendantes

Ce résultat s’étend à un nombre quelconque de variables normalesindépendantes.

2) Le théorème central limite

si les variables suivent des lois de même nature de moyenne m et d’écart type , si les sont indépendants

* est asymptotiquement normale de moyenne mn et d’écart type

*

3) Approximation de la loi binomiale par la loi normale

33

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

22

212121

222

111,mmNXX

,mNX

,mNX

iX

n

n,nmNXni

n,mN

n

XX

i

nn

nXV

nXV

mnmn

XEn

XE

i

i

2

2

2

2

1

11

iX

18

50

np

nnpq,npNp,nBX

L

Page 34: Cours de Stat Donné Etudiants

34

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

nmNX ;

D’après le théorème central limite: NX

mXE n

XV2

Loi de X

Page 35: Cours de Stat Donné Etudiants

SUITE EX DIAPO 22

Il y a donc une probabilité de 50% que l’affluence moyenne dans l’échantillon soit supérieure à 13500 personnes.

35

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

)0001 ; 13500(),(~X NmN

nmNX

;~ 50/1000 ; 13500~ NX

)1 ; 0(~U N

n

mX

501000

13500U

X

.5,0)0(1)0U(P

501000

1350013500P)13500(P

UF

n

mXX

Page 36: Cours de Stat Donné Etudiants

3.2 LOI DE LA VARIANCE S²

Quelle est l’utilité de cette loi? Prenons un ex

La politique de cohésion sociale d’un pays a, selon legouvernement en place, besoin de tenir compte desinégalités de revenu entre les salariés du secteur privé. Afind’y parvenir, le gouvernement prélève un échantillon de 30salariés du secteur privé, la moyenne étant de 1700€ et lavariance empirique de 1000€ (la variance de la populationétant de 1517.47€). Le gouvernement décidera de rehausserles bas salaires de 5% si la probabilité que la varianceempirique dépassant 1000€ est au moins de 20%. Legouvernement interviendra-t-il en faveur des bas salaires ?

Afin de résoudre le problème, traduisons la question poséeen langage statistique : 36

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

?1000S²P

Page 37: Cours de Stat Donné Etudiants

Loi de la variance S²Théorème de Fisher

Soit un échantillon IID issu de la loi Normale de moyenne m et d’écart type (notée : N(m,)), alors :

les grandeurs aléatoires sont indépendantes.

ou car

37

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

n

mXet

S1n

2

2

)1n(

S1n 2

2

2

)1n(nS 2

2

2

22 S1n

nS

)1(2

2

2

nnS

Page 38: Cours de Stat Donné Etudiants

LOI DU KHI DEUX

1) DéfinitionLoi du à un degré de liberté

Loi du à n degrés de liberté :

Soient avec i=1, …n les Ui sont indépendantes

pour a >0

38

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

2

2

22

1

2

1

01

x

ex

)x(f

,X)(XUX

10,NU

2 12

2 n2

10,NUi

)n(U...UUUU ni222

322

21

2

)(2 nX ,X 0

122

22

2

1

nx

nxe

n

)x(f

0

1dttea at !1 nn

2

1

Page 39: Cours de Stat Donné Etudiants

39

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

n=2

n=4

n=15

2

2f

La distribution du est dissymétrique avec étalement vers la droite

Elle se rapproche de la distribution normale à laquelle elle peut être assimiléelorsque n>30

2

n)x(V

n)X(E

2

Page 40: Cours de Stat Donné Etudiants

2 )TABLE STATISTIQUE

40

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

1-P

n2

2f

20

P

La distribution du ne dépendant que d’un seul paramètre n, le nombre de degrés de liberté, la table est à double entrée.Elle donne pour , la valeur de ayant la probabilité P d’être dépassée.

2

30n 2

20 2

0

2PrP que est tel nob np21

20

Page 41: Cours de Stat Donné Etudiants

3) LECTURES DANS LA TABLE

41

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

95%

n2

2f

202

95.

5% 41.31202

95.

97.5%

n2

2f

152

025.

2.5% 26.6152

025.

lorsque n>30 on admet que : 10122 2 ,Nn

67.22 2/)²1-50*2(1.6449 )²/21-DDL *2.952

95. u(50

Page 42: Cours de Stat Donné Etudiants

4) SOMME DE VARIABLES DE INDÉPENDANTES

42

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

2

1X 12 n

2X 22 n

et indépendantes 1X 2X

21

2

21 nnXX

n

i

i

n

i

nii nn...n...nnX

1

2

1

222

21

2

)n(X ii2 iX indépendantes

Théorème d’additivité de indépendants 2

Page 43: Cours de Stat Donné Etudiants

SUITE EX DIAPO 36

43

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

. 77.19KP1517.45

100003

²

S²P1000S²P

n

Dans la table du à la ligne v = 29, on constate que le fractile 19.77 correspond à une probabilité de 0,9. D’où :

. 0,91000S²P

Le gouvernement interviendra en faveur des bas salaires si cette probabilité dépasse 20%, ce qui est le cas.

2

Page 44: Cours de Stat Donné Etudiants

3.3 LOI DE INDÉPENDANTE DE (DE LA VARIANCE

DE LA POPULATION)

Quelle est l’utilité de cette loi? Prenons un ex

A la suite d’une étude statistique effectuée par le CROUS surces 15 dernières années, on estime que l’affluencehebdomadaire des étudiants au restaurant universitaire estune variable aléatoire que nous noterons X qui suit une loinormale de moyenne 2000. On choisit aléatoirement unéchantillon de 52 semaines sur ces 15 dernières années.L’écart-type de l’affluence hebdomadaire mesurée surl’échantillon est de 500. Quelle est la probabilité pour quel’affluence moyenne hebdomadaire soit strictementsupérieure à 2050 étudiants ?

44

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

X 2

Page 45: Cours de Stat Donné Etudiants

La variable aléatoire X : « Affluence hebdomadaire desétudiants au restaurant universitaire »

« Affluence hebdomadaire moyenne des étudiants aurestaurant universitaire issus de l’échantillon »

L’épreuve aléatoire : « Choisir un échantillon au hasard de 52semaines »

45

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

) ; 2000(),(~X NmN

X

)/;(~ nmNX

Page 46: Cours de Stat Donné Etudiants

Distinguons les informations relatives à l’échantillon de celles issuesde la population :

Taille de l’échantillon : n = 52

Ecart-type de l’échantillon : s = 500. Notons qu’il s’agit bien de s etnon de S puisque nous prenons la mesure de l’écart-type sur unéchantillon particulier.

L’écart-type de la population σ : inconnu

?

La technique consiste à faire « disparaître » σ, on l’appelleratechnique de « Studentisation ».

46

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

52

20002050P)2050(P

n

mXX

Page 47: Cours de Stat Donné Etudiants

un échantillon IID

studentisation

La loi de Student est le rapport entre une variablealéatoire obéissant à une loi normale centrée réduite etla racine carrée d’une variable aléatoire suivant une loide rapporté à son degré

47

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

ni1 XXX

);m(NXi

n

;mNX

Ici INCONNU

2

Page 48: Cours de Stat Donné Etudiants

LOI DE STUDENT 1)DÉFINITION

2 variables aléatoires X et Y indépendantes

48

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

10,NX nY 2

nY

XnT

10,NnTalorsnsi

n

n

,NnT

2

10

En pratique, lorsque n > à 30

Page 49: Cours de Stat Donné Etudiants

2 )TABLE STATISTIQUE

donne la probabilité P d’être dépassée en valeur absolue

49

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

f(t)

0

t0

t

P/2

P/2

1-P

-t0

000 tTobPrettTobPrtTobPrP

Notation : t0 =t1-p/2 -t0 = tp/2 = - t1-p/2

Page 50: Cours de Stat Donné Etudiants

3 )LECTURES DANS LA TABLE

50

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

f(t)

0

t0=t.95

t(20)

5%

5%

1-P=90%

-t0= t.05

725.1

%10

200

t

p

n

IBS

1.372 (10)T.80

IBS

1.725 (20)T.90

2ème exemple

Page 51: Cours de Stat Donné Etudiants

POUR TROUVER LA LOI DE INDÉPENDANTE DE

51

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

)1n(T1nS

mX

)1n(

nS

n

mX

2

2

nn

NnT

)(

)1,0()(

2

)1(2

2

2

nnS

nmNX ;

X

Page 52: Cours de Stat Donné Etudiants

SUITE EX DIAPO 44

Convergence : d’où FT = FU. On obtient :

52

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

51500

20002050TP

51500

20002050

1P)2050(P

nS

mXX

)71,0(1)71,0T(P TF

)1;0(T N

C

.2389,07611,01)71,0(1)71.0(1)71,0)51(P(T UT FF

Il y a donc une probabilité de 23.89% que l’affluence moyennedans l’échantillon soit supérieure à 2050 personnes.

Page 53: Cours de Stat Donné Etudiants

3.4 LOI DE F

Quelle est l’utilité de cette loi? Prenons un ex

Deux usines A et B fabriquent des avions de même marque.L’usine A produit 4% d’avions ayant des problèmes la premièreannée. Une compagnie reçoit 600 avions en provenance de A.

Quelle est la probabilité pour que la compagnie trouve moinsde 1% d’avions défectueux ?

53

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

Page 54: Cours de Stat Donné Etudiants

Soit X la variable aléatoire : « Nombre d’avions défectueux enprovenance de l’usine A »

Epreuves aléatoires : « Choisir un avion au hasard dansl’échantillon nA »,

F : « l’avion provenant de A est défectueux » avec pA = 4%.

« l’avion provenant de A n’est pas défectueux » avec qA =96%.

XA() = {0,1,2,…, 600} et nA = 600

Convergence : La loi binomiale converge vers la loi normale (les deux conditions nApA > 18 et nA > 50 D’où :

54

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

),(~XA AA pnB

qpnpnNAAAAA

C

A ;X

,84 ; 42XA NC

?)01,0F(P A

F

Page 55: Cours de Stat Donné Etudiants

LOI DE F

Supposons ( en pratique n > 50) et np > 18.

Soit

F converge alors vers une loi normale. On a montré dans le paragraphe 2.3 (diapo 19) que et .

55

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

)p,n(BX

n

npq,npN)p,n(BX

L

n

XF

pFE

n

pqFV

n

pqpNF

L

,

Page 56: Cours de Stat Donné Etudiants

SUITE EX DIAPO 54

56

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

.099991,01)75,3(175,3UP1

75,3UP0,008

04,001,0FP)01,0F(P

U

A

AA

AAA

F

n

qp

p

;~ X

FA

AA

A

A

AA

n

qppN

n 008,0 ; 04,0~

XF

A

AA N

n

Page 57: Cours de Stat Donné Etudiants

4 LOIS DE PROBABILITÉ DE VARIABLES D’ÉCHANTILLONNAGE

À PARTIR DE DEUX ÉCHANTILLONS TIRÉS DANS DEUX

POPULATIONS NORMALES.

Soient deux populations dans lesquelles nous définissons deux variables aléatoires et .

Dans ces deux populations, nous prélevons deux échantillons IID de taille respective n1 et n2.

HYPS :

57

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

1X 2X

),m(NX 111

),m(NX 222

Page 58: Cours de Stat Donné Etudiants

4.1 LOI DE LA DIFFÉRENCE DES MOYENNES

D’ÉCHANTILLONS LORSQUE ET SONT CONNUS

Quelle est l’utilité de cette loi? Prenons un ex

Les mécaniciens d’une compagnie A ont un revenu moyen de2500 euros avec un écart-type de 1100 euros. La compagnie Benregistre un revenu moyen de 3200 euros avec un écart-typede 1000 euros. Les revenus sont indépendants etidentiquement distribués.

Déterminez la probabilité pour que le revenu moyen d’unéchantillon de 62 personnes choisies de manière aléatoiredans la compagnie A soit inférieur d’au moins 900 euros àcelui d’un échantillon de même effectif tiré au hasard dans lacompagnie B.

58

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

21

22

Page 59: Cours de Stat Donné Etudiants

Xi la variable aléatoire : « Revenu des mécaniciens de lacompagnie i », i ∈{A,B}

Epreuves aléatoires : « Choisir un salarié au hasard dansl’échantillon ni = 62 de la compagnie i », i ∈{A,B}. Les deuxéchantillons sont de même taille nA = nB = 62.

Loi de probabilité : celle-ci n’est pas fournie mais la conditionspécifiée dans l’énoncé « revenus indépendants etidentiquement distribués » permet l’utilisation du théorèmede la limite centrale. On considère pour cela que deséchantillons de taille 62 permettent de garantir une conditionnécessaire du théorème : n → ∞. On en déduit alors soushypothèse de revenus indépendants et identiquementdistribués que : i∈{A,B}

59

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

iii m ; ~X

Page 60: Cours de Stat Donné Etudiants

: « Revenu moyen des mécaniciens de l’échantillon prélevé dans la compagnie i », i ∈{A,B}

60

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

1100 ; 2500~XA N .1000 ; 3200~XB N

iX

?900P AB XX

)/;(~ AA AA nmNX )/; (~ BB BB nmNX

?~AB XX

Page 61: Cours de Stat Donné Etudiants

LOI DE

avec X1 et X2 indépendantes

D’après le théorème central limite :

61

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

2

222

1

22

2

1

111

1

11

1

,1

,1

nmNXX

nX

nmNXX

nX

n

i

i

n

i

i

2

2

2

1

2

12121 ;

nnmmNXX

21 XX

Page 62: Cours de Stat Donné Etudiants

SUITE EX DIAPO 59

La probabilité pour que le revenu moyen dans l’échantillon Asoit inférieur d’au moins 900€ de celui de l’échantillon B est de14,66%.

62

MCU F. Seyte, Université Montpellier 1- ENAC- Statistique

.1466,08554,01)06,1(106,1UP

8,188

700900P900P

U

B

2

B

A

2

A

ABABAB

F

nn

mmXXXX