Upload
margaux-clerc
View
110
Download
6
Embed Size (px)
Citation preview
STT6971-Méthodes de Biostatistique 1
Méthodesde
Biostatistique
Chapitre IVInférence Statistique sur la
moyenne
STT6971-Méthodes de Biostatistique 2
1.Estimation ponctuelle de la moyenne
L’estimation de la moyenne d’une population est donnée par:
Exemple: L’estimation de la moyenne du temps d’attente dans une salle d’urgence durant les week-ends est donnée par
X̂
85.37ˆ X
STT6971-Méthodes de Biostatistique 3
2. Estimation par intervalle de la moyenne
D’après le théorème central limite, pour une taille échantillonnale grande (n ¸ 30) , la moyenne échantillonnale a une distribution normale de moyenne et de variance
Ainsi, pour une taille échantillonnale assez large, on a
Suit une loi normale de moyenne 0 et de variance 1.
X
nX
22
X
XX
Z
STT6971-Méthodes de Biostatistique 4
Supposons qu’on a un niveau de confiance de 95%.
puisque , alors
La dernière équation indique la probabilité que l’intervalle contient la moyenne est de 95%. Cet
intervalle est appelé Intervalle de Confiance.
95.0)96.196.1( ZP
95.0)96.196.1(
X
XX
P
95.0)96.196.1( XXX
XXP X
95.0)96.196.1( XX
XXP
)96.1,96.1(XX
XX
STT6971-Méthodes de Biostatistique 5
L’intervalle de confiance (IC) de la moyenne à 95% est donné par
Supposons dans l’exemple précédent, =9.5, alors l’IC de à 95% est
L’intervalle de confiance (IC) de à 100(1-)% est donné par
nX
96.1
)71.39,99.35(86.185.37)95.0(96.185.37100
5.996.185.37
nZX
)2/(1
STT6971-Méthodes de Biostatistique 6
L’IC de quand la variance est inconnue:
Si la taille échantillonnale n ¸ 30, l’IC pour à 100(1-)%,
Si la taille échantillonnale n < 30, l’IC pour à 100(1-)%,
ddl=df=n-1, où t représente la distribution appelée Student, et dont les valeurs sont données par la table 2.
n
sZX )2/(1
n
stX )2/(1
STT6971-Méthodes de Biostatistique 7
Détermination de la taille échantillonnale: Pour planifier une expérience, spécifiquement trouver la taille échantillonnale
nécessaire pour répondre à des conditions statistiques précises, on doit répondre tout d’abord à ces deux questions:
1. Quelle erreur peut-on tolérer pour notre estimateur de la moyenne?
2. C’est quoi le niveau de confiance qu’on aimerait utiliser? Pour la question 2, le chercheur doit décider du niveau de confiance dont il a
besoin. (par ex. 90%, 95% ou 99%) Pour la question 1, On définit l’erreur par
Et donc
nZE
)2/(1
2
)2/(1
E
Zn
STT6971-Méthodes de Biostatistique 8
3. Tests d’hypothèses sur la moyenne: Considérons l’hypothèse suivante:
H0: = 0
vs H1: > 0
Considérons un échantillon de taille n provenant d’une population dont la variance est connue et est donnée par 2. Alors on dit qu’on rejette l’hypothèse nulle H0 au niveau de signifiance de %, si
)1(0
/
Z
n
XZ
STT6971-Méthodes de Biostatistique 9
Considérons l’hypothèse suivante:
H0: = 0
vs H1: < 0
Considérons un échantillon de taille n provenant d’une population dont la variance est connue et est donnée par 2. Alors on dit qu’on rejette l’hypothèse nulle H0 au niveau de signifiance de %, si
)1(0
/
Z
n
XZ
STT6971-Méthodes de Biostatistique 10
Considérons l’hypothèse suivante:
vs
Considérons un échantillon de taille n provenant d’une population dont la variance est connue et est donnée par 2. Alors on dit qu’on rejette l’hypothèse nulle H0 au niveau de signifiance de %, si
ou
01 : H00 : H
)2/(10
/
Z
n
XZ
)2/(10
/
Z
n
XZ
STT6971-Méthodes de Biostatistique 11
Tests d’hypothèses avec la variance inconnue
Considérons l’hypothèse suivante:
Considérons un échantillon de taille n provenant d’une population dont la variance est inconnue. Alors on dit qu’on rejette l’hypothèse nulle H0 au niveau de signifiance de %, si l’alternative est:
00 : H
01 : H
01 : H
01 : H
)1(0
/
t
ns
XZ
)1(0
/
t
ns
XZ
)2/(10
/
t
ns
XZ )2/(1
0
/
t
ns
XZou
STT6971-Méthodes de Biostatistique 12
P-value?
La règle suivante peut être utilisée pour prendre des décisions:
Rejeter H0 si p-value ·
où est le niveau de signifiance choisi pour le test. Cette règle s’applique pour les tests bilatéraux. Dans le
cas d’un test unilatéral, la règle devient
Rejeter H0 si (p-value/2) · Comment calculer la p-value (à la main!)?
(Voir exemple en classe!)
STT6971-Méthodes de Biostatistique 13
Puissance et détermination de la taille échantillonnale
La puissance d’un test est définie par
P = 1-= P(rejeter H0 | H0 fausse)
Calcul de la puissance:
La puissance est une fonction qui dépend des 3 paramètres suivants:
1. n = Taille échantillonnale.
2. = Niveau de signifiance.
3. DT = L’effet de la taille = La différence standardisée des moyennes spécifiées sous H0 et H1.
STT6971-Méthodes de Biostatistique 14
Considérons le test bilatéral suivant,
vs
Le paramètre DT est défini par:
La puissance est donnée par
10
DT
00 : H )(: 101 H
)( )2/(1 nDTZZPPuis
STT6971-Méthodes de Biostatistique 15
La taille échantillonnale nécessaire pour s’assurer d’un certain niveau de puissance pour un test bilatéral est
La taille échantillonnale nécessaire pour s’assurer d’un certain niveau de puissance pour un test unilatéral est
2
1)2/(1
DT
ZZn
2
11
DT
ZZn
STT6971-Méthodes de Biostatistique 16
4. Inférence statistique sur
4.1 Intervalles de confiance:
Pour construire un IC pour la différence de deux moyennes de deux populations supposées indépendantes, on étudie les 3 cas suivants:
Cas 1: Variances connues:
Cas 2: Variances inconnues mais égales: Si les tailles échantillonnales sont supérieures à 30
Si les tailles échantillonnales sont inférieures à 30
2
2
1
21
)2/(121 )(nn
ZXX
)( 21
21)2/(121
11)(
nnSZXX p
21)2/(121
11)(
nnStXX p 221 nnddl
STT6971-Méthodes de Biostatistique 17
Cas 3: Variances inconnues et possiblement inégales: Tests sur les variances:
vs
ou Si les tailles échantillonnales sont supérieures à 30
Si les tailles échantillonnales sont inférieures à 30
où
22
210 : H 2
2211 : H
),(1 12)2/(1(22
21 dfdfFs
sF ),( 21))2/(1(2
2
21 dfdfFs
sF
2
22
1
21
)2/(121 )(n
s
n
sZXX
2
22
1
21
)2/(121 )(n
s
n
stXX
1
)/(
1
)/(
2
22
22
1
21
21
2
2
22
1
21
n
ns
n
ns
n
s
n
s
ddl
STT6971-Méthodes de Biostatistique 18
Puissance et détermination de la taille échantillonnale
Considérons les hypothèses suivantes: vs
vs La puissance est donnée par
Où La taille échantillonnale relative à une puissance donnée:
en supposant que le tailles échantillonnales sont égales.
210 : H 211 : H
0: 210 H 0: 211 H
)2/( )2/(1 nDTZZPPui
21
DT
2
1)2/(12
DT
ZZni
STT6971-Méthodes de Biostatistique 19
Cas de deux populations dépendantes: Données pairées
Considérons le test suivant:
vs
Ce qui est équivalent à
vs On estime par , qui est la moyenne des différences entre
deux observations correspondantes. Les intervalles de confiances (avec différentes situations par
rapport à la variance) sont les mêmes que ceux d’une moyenne. Aussi, les mêmes règles pour les tests d’hypothèses sur une moyenne s’appliquent aussi dans ce contexte. (voir exemple)
210 : H 211 : H
0: 210 dH 0: 211 dH
d dX