19
STT6971-Méthodes de Biostat istique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

Embed Size (px)

Citation preview

Page 1: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 1

Méthodesde

Biostatistique

Chapitre IVInférence Statistique sur la

moyenne

Page 2: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 2

1.Estimation ponctuelle de la moyenne

L’estimation de la moyenne d’une population est donnée par:

Exemple: L’estimation de la moyenne du temps d’attente dans une salle d’urgence durant les week-ends est donnée par

85.37ˆ X

Page 3: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 3

2. Estimation par intervalle de la moyenne

D’après le théorème central limite, pour une taille échantillonnale grande (n ¸ 30) , la moyenne échantillonnale a une distribution normale de moyenne et de variance

Ainsi, pour une taille échantillonnale assez large, on a

Suit une loi normale de moyenne 0 et de variance 1.

X

nX

22

X

XX

Z

Page 4: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 4

Supposons qu’on a un niveau de confiance de 95%.

puisque , alors

La dernière équation indique la probabilité que l’intervalle contient la moyenne est de 95%. Cet

intervalle est appelé Intervalle de Confiance.

95.0)96.196.1( ZP

95.0)96.196.1(

X

XX

P

95.0)96.196.1( XXX

XXP X

95.0)96.196.1( XX

XXP

)96.1,96.1(XX

XX

Page 5: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 5

L’intervalle de confiance (IC) de la moyenne à 95% est donné par

Supposons dans l’exemple précédent, =9.5, alors l’IC de à 95% est

L’intervalle de confiance (IC) de à 100(1-)% est donné par

nX

96.1

)71.39,99.35(86.185.37)95.0(96.185.37100

5.996.185.37

nZX

)2/(1

Page 6: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 6

L’IC de quand la variance est inconnue:

Si la taille échantillonnale n ¸ 30, l’IC pour à 100(1-)%,

Si la taille échantillonnale n < 30, l’IC pour à 100(1-)%,

ddl=df=n-1, où t représente la distribution appelée Student, et dont les valeurs sont données par la table 2.

n

sZX )2/(1

n

stX )2/(1

Page 7: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 7

Détermination de la taille échantillonnale: Pour planifier une expérience, spécifiquement trouver la taille échantillonnale

nécessaire pour répondre à des conditions statistiques précises, on doit répondre tout d’abord à ces deux questions:

1. Quelle erreur peut-on tolérer pour notre estimateur de la moyenne?

2. C’est quoi le niveau de confiance qu’on aimerait utiliser? Pour la question 2, le chercheur doit décider du niveau de confiance dont il a

besoin. (par ex. 90%, 95% ou 99%) Pour la question 1, On définit l’erreur par

Et donc

nZE

)2/(1

2

)2/(1

E

Zn

Page 8: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 8

3. Tests d’hypothèses sur la moyenne: Considérons l’hypothèse suivante:

H0: = 0

vs H1: > 0

Considérons un échantillon de taille n provenant d’une population dont la variance est connue et est donnée par 2. Alors on dit qu’on rejette l’hypothèse nulle H0 au niveau de signifiance de %, si

)1(0

/

Z

n

XZ

Page 9: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 9

Considérons l’hypothèse suivante:

H0: = 0

vs H1: < 0

Considérons un échantillon de taille n provenant d’une population dont la variance est connue et est donnée par 2. Alors on dit qu’on rejette l’hypothèse nulle H0 au niveau de signifiance de %, si

)1(0

/

Z

n

XZ

Page 10: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 10

Considérons l’hypothèse suivante:

vs

Considérons un échantillon de taille n provenant d’une population dont la variance est connue et est donnée par 2. Alors on dit qu’on rejette l’hypothèse nulle H0 au niveau de signifiance de %, si

ou

01 : H00 : H

)2/(10

/

Z

n

XZ

)2/(10

/

Z

n

XZ

Page 11: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 11

Tests d’hypothèses avec la variance inconnue

Considérons l’hypothèse suivante:

Considérons un échantillon de taille n provenant d’une population dont la variance est inconnue. Alors on dit qu’on rejette l’hypothèse nulle H0 au niveau de signifiance de %, si l’alternative est:

00 : H

01 : H

01 : H

01 : H

)1(0

/

t

ns

XZ

)1(0

/

t

ns

XZ

)2/(10

/

t

ns

XZ )2/(1

0

/

t

ns

XZou

Page 12: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 12

P-value?

La règle suivante peut être utilisée pour prendre des décisions:

Rejeter H0 si p-value ·

où est le niveau de signifiance choisi pour le test. Cette règle s’applique pour les tests bilatéraux. Dans le

cas d’un test unilatéral, la règle devient

Rejeter H0 si (p-value/2) · Comment calculer la p-value (à la main!)?

(Voir exemple en classe!)

Page 13: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 13

Puissance et détermination de la taille échantillonnale

La puissance d’un test est définie par

P = 1-= P(rejeter H0 | H0 fausse)

Calcul de la puissance:

La puissance est une fonction qui dépend des 3 paramètres suivants:

1. n = Taille échantillonnale.

2. = Niveau de signifiance.

3. DT = L’effet de la taille = La différence standardisée des moyennes spécifiées sous H0 et H1.

Page 14: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 14

Considérons le test bilatéral suivant,

vs

Le paramètre DT est défini par:

La puissance est donnée par

10

DT

00 : H )(: 101 H

)( )2/(1 nDTZZPPuis

Page 15: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 15

La taille échantillonnale nécessaire pour s’assurer d’un certain niveau de puissance pour un test bilatéral est

La taille échantillonnale nécessaire pour s’assurer d’un certain niveau de puissance pour un test unilatéral est

2

1)2/(1

DT

ZZn

2

11

DT

ZZn

Page 16: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 16

4. Inférence statistique sur

4.1 Intervalles de confiance:

Pour construire un IC pour la différence de deux moyennes de deux populations supposées indépendantes, on étudie les 3 cas suivants:

Cas 1: Variances connues:

Cas 2: Variances inconnues mais égales: Si les tailles échantillonnales sont supérieures à 30

Si les tailles échantillonnales sont inférieures à 30

2

2

1

21

)2/(121 )(nn

ZXX

)( 21

21)2/(121

11)(

nnSZXX p

21)2/(121

11)(

nnStXX p 221 nnddl

Page 17: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 17

Cas 3: Variances inconnues et possiblement inégales: Tests sur les variances:

vs

ou Si les tailles échantillonnales sont supérieures à 30

Si les tailles échantillonnales sont inférieures à 30

22

210 : H 2

2211 : H

),(1 12)2/(1(22

21 dfdfFs

sF ),( 21))2/(1(2

2

21 dfdfFs

sF

2

22

1

21

)2/(121 )(n

s

n

sZXX

2

22

1

21

)2/(121 )(n

s

n

stXX

1

)/(

1

)/(

2

22

22

1

21

21

2

2

22

1

21

n

ns

n

ns

n

s

n

s

ddl

Page 18: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 18

Puissance et détermination de la taille échantillonnale

Considérons les hypothèses suivantes: vs

vs La puissance est donnée par

Où La taille échantillonnale relative à une puissance donnée:

en supposant que le tailles échantillonnales sont égales.

210 : H 211 : H

0: 210 H 0: 211 H

)2/( )2/(1 nDTZZPPui

21

DT

2

1)2/(12

DT

ZZni

Page 19: STT6971-Méthodes de Biostatistique 1 Méthodes de Biostatistique Chapitre IV Inférence Statistique sur la moyenne

STT6971-Méthodes de Biostatistique 19

Cas de deux populations dépendantes: Données pairées

Considérons le test suivant:

vs

Ce qui est équivalent à

vs On estime par , qui est la moyenne des différences entre

deux observations correspondantes. Les intervalles de confiances (avec différentes situations par

rapport à la variance) sont les mêmes que ceux d’une moyenne. Aussi, les mêmes règles pour les tests d’hypothèses sur une moyenne s’appliquent aussi dans ce contexte. (voir exemple)

210 : H 211 : H

0: 210 dH 0: 211 dH

d dX