STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 1

Méthodesde

Biostatistique

Chapitre IVInférence Statistique sur la

moyenne


1.Estimation ponctuelle de la moyenne

L’estimation de la moyenne d’une population est donnée par:

Exemple: L’estimation de la moyenne du temps d’attente dans une salle d’urgence durant les week-ends est donnée par

X̂

85.37ˆ X


2. Estimation par intervalle de la moyenne

D’après le théorème central limite, pour une taille échantillonnale grande (n ¸ 30) , la moyenne échantillonnale a une distribution normale de moyenne et de variance

Ainsi, pour une taille échantillonnale assez large, on a

Suit une loi normale de moyenne 0 et de variance 1.

X

nX

22

X

XX

Z


Supposons qu’on a un niveau de confiance de 95%.

puisque , alors

La dernière équation indique la probabilité que l’intervalle contient la moyenne est de 95%. Cet

intervalle est appelé Intervalle de Confiance.

95.0)96.196.1( ZP

95.0)96.196.1(

X

XX

P

95.0)96.196.1( XXX

XXP X

95.0)96.196.1( XX

XXP

)96.1,96.1(XX

XX


L’intervalle de confiance (IC) de la moyenne à 95% est donné par

Supposons dans l’exemple précédent, =9.5, alors l’IC de à 95% est

L’intervalle de confiance (IC) de à 100(1-)% est donné par

nX

96.1

)71.39,99.35(86.185.37)95.0(96.185.37100

5.996.185.37

nZX

)2/(1


L’IC de quand la variance est inconnue:

Si la taille échantillonnale n ¸ 30, l’IC pour à 100(1-)%,

Si la taille échantillonnale n < 30, l’IC pour à 100(1-)%,

ddl=df=n-1, où t représente la distribution appelée Student, et dont les valeurs sont données par la table 2.

n

sZX )2/(1

n

stX )2/(1


Détermination de la taille échantillonnale: Pour planifier une expérience, spécifiquement trouver la taille échantillonnale

nécessaire pour répondre à des conditions statistiques précises, on doit répondre tout d’abord à ces deux questions:

1. Quelle erreur peut-on tolérer pour notre estimateur de la moyenne?

2. C’est quoi le niveau de confiance qu’on aimerait utiliser? Pour la question 2, le chercheur doit décider du niveau de confiance dont il a

besoin. (par ex. 90%, 95% ou 99%) Pour la question 1, On définit l’erreur par

Et donc

nZE

)2/(1

2

)2/(1

E

Zn


3. Tests d’hypothèses sur la moyenne: Considérons l’hypothèse suivante:

H0: = 0

vs H1: > 0

Considérons un échantillon de taille n provenant d’une population dont la variance est connue et est donnée par 2. Alors on dit qu’on rejette l’hypothèse nulle H0 au niveau de signifiance de %, si

)1(0

/

Z

n

XZ


Considérons l’hypothèse suivante:

H0: = 0

vs H1: < 0


)1(0

/

Z

n

XZ



vs


ou

01 : H00 : H

)2/(10

/

Z

n

XZ

)2/(10

/

Z

n

XZ


Tests d’hypothèses avec la variance inconnue


Considérons un échantillon de taille n provenant d’une population dont la variance est inconnue. Alors on dit qu’on rejette l’hypothèse nulle H0 au niveau de signifiance de %, si l’alternative est:

00 : H

01 : H

01 : H

01 : H

)1(0

/

t

ns

XZ

)1(0

/

t

ns

XZ

)2/(10

/

t

ns

XZ )2/(1

0

/

t

ns

XZou


P-value?

La règle suivante peut être utilisée pour prendre des décisions:

Rejeter H0 si p-value ·

où est le niveau de signifiance choisi pour le test. Cette règle s’applique pour les tests bilatéraux. Dans le

cas d’un test unilatéral, la règle devient

Rejeter H0 si (p-value/2) · Comment calculer la p-value (à la main!)?

(Voir exemple en classe!)


Puissance et détermination de la taille échantillonnale

La puissance d’un test est définie par

P = 1-= P(rejeter H0 | H0 fausse)

Calcul de la puissance:

La puissance est une fonction qui dépend des 3 paramètres suivants:

1. n = Taille échantillonnale.

2. = Niveau de signifiance.

3. DT = L’effet de la taille = La différence standardisée des moyennes spécifiées sous H0 et H1.


Considérons le test bilatéral suivant,

vs

Le paramètre DT est défini par:

La puissance est donnée par

10

DT

00 : H )(: 101 H

)( )2/(1 nDTZZPPuis


La taille échantillonnale nécessaire pour s’assurer d’un certain niveau de puissance pour un test bilatéral est

La taille échantillonnale nécessaire pour s’assurer d’un certain niveau de puissance pour un test unilatéral est

2

1)2/(1

DT

ZZn

2

11

DT

ZZn


4. Inférence statistique sur

4.1 Intervalles de confiance:

Pour construire un IC pour la différence de deux moyennes de deux populations supposées indépendantes, on étudie les 3 cas suivants:

Cas 1: Variances connues:

Cas 2: Variances inconnues mais égales: Si les tailles échantillonnales sont supérieures à 30

Si les tailles échantillonnales sont inférieures à 30

2

2

1

21

)2/(121 )(nn

ZXX

)( 21

21)2/(121

11)(

nnSZXX p

21)2/(121

11)(

nnStXX p 221 nnddl


Cas 3: Variances inconnues et possiblement inégales: Tests sur les variances:

vs

ou Si les tailles échantillonnales sont supérieures à 30

Si les tailles échantillonnales sont inférieures à 30

où

22

210 : H 2

2211 : H

),(1 12)2/(1(22

21 dfdfFs

sF ),( 21))2/(1(2

2

21 dfdfFs

sF

2

22

1

21

)2/(121 )(n

s

n

sZXX

2

22

1

21

)2/(121 )(n

s

n

stXX

1

)/(

1

)/(

2

22

22

1

21

21

2

2

22

1

21

n

ns

n

ns

n

s

n

s

ddl


Puissance et détermination de la taille échantillonnale

Considérons les hypothèses suivantes: vs

vs La puissance est donnée par

Où La taille échantillonnale relative à une puissance donnée:

en supposant que le tailles échantillonnales sont égales.

210 : H 211 : H

0: 210 H 0: 211 H

)2/( )2/(1 nDTZZPPui

21

DT

2

1)2/(12

DT

ZZni


Cas de deux populations dépendantes: Données pairées

Considérons le test suivant:

vs

Ce qui est équivalent à

vs On estime par , qui est la moyenne des différences entre

deux observations correspondantes. Les intervalles de confiances (avec différentes situations par

rapport à la variance) sont les mêmes que ceux d’une moyenne. Aussi, les mêmes règles pour les tests d’hypothèses sur une moyenne s’appliquent aussi dans ce contexte. (voir exemple)

210 : H 211 : H

0: 210 dH 0: 211 dH

d dX

Documents

STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne