Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
Chapitre 2
Test de comparaison d’une moyenne
à une valeur théorique
I Test bilatéral pour une
population de loi normale et
d’écart-type connu
24
Exemple 1
Score d’Achenbach : mesure les problèmes compor-
tementaux des jeunes.
Dans la population des jeunes, les scores se distri-
buent selon la loi normale N(50, 10).
– Population étudiée P : enfants de parentsrécemment divorcés.
– Hypothèse de recherche : la moyenne (µ) est
différente de la norme (50).
– Observations :
Sur un échantillon de 24 enfants, on observe un
score moyen x̄obs = 54, 5.
Peut-on, à partir des observations valider
l’hypothèse de recherche ?
– Pour les calculs : on admet que pour ces
enfants, la loi des scores est encore normale et
d’écart-type σ = 10.
25
Les étapes du test d’hypothèses
1 ) Les hypothèses du test
50 : valeur de référence pour µ, à tester.
valeur théorique, norme
Un test comporte toujours 2 hypothèses :
– Hypothèse nulle notée H0
« Opposée » à l’hypothèse formulée :
H0 : La moyenne des enfants est égale à la
valeur théorique
– Hypothèse alternative, notée H1
Celle que l’on a formulée et que l’on veut
valider :
H1 : La moyenne des enfants n’est pas égale à
la valeur théorique
« elle est plus petite ou plus grande »
hypothèse bilatérale
26
➡ On pose les 2 hypothèses :
H0 : µ = 50
H1 : µ 6= 50 bilatérale
On teste H0 contre H1.
Hypothèses unilatérales : on aurait pu
poser un test unilatéral :
H0 : µ = 50
H1 : µ > 50ou
H0 : µ = 50
H1 : µ < 50
unilatérale droite unilatérale gauche
➡ Orientation de H1 à choisir au départ.
27
2 ) Observations et statistique du test
On prélève un échantillon de 24 enfants.
Statistique utilisée pour le test : X̄n.
On calcule sa valeur observée x̄obs = 54, 5.
3 ) Règle de décision basée sur x̄obs
- Choix à faire entre l’hypothèse H0 et
l’hypothèse H1.
- Décision prise en fonction de la moyenne
observée : 54,5.
28
a) Principe de la règle
On suppose au départ que H0 est vraie.
« On se place sous H0 »
➡ On va conserver (accepter) H0 si la valeur
observée (54,5) est jugée suffisamment plausible
sous H0.
➡ On va rejeter H0 et accepter H1 si la valeur
observée (54,5) est jugée trop improbable sous
H0.
b) Région de rejet et intervalle
d’acceptation
Sous H0 :
Les moyennes se distribuent autour de 50 avec
une certaine dispersion.
29
➡ Il est normal d’observer un écart entre valeur
prise par X̄n et la valeur centrale 50.
➡ Il est par contre anormal d’observer un écart
trop grand.
50
L1 L2x
Rejet RejetAcceptation
➡ Valeurs de X̄n plausibles :
contenues dans un intervalle de variation
(dit d’acceptation, noté IA).
➡ Valeurs de X̄n trop improbables :
les plus éloignées de 50,
dans la région dite de rejet ou critique RC.
Les plus extrêmes sont les plus significatives de H1.
30
c) Calcul des bornes de l’IA
➡ On choisit un risque α associé à l’IA.
➡ Bornes L1 et L2 : quantiles d’ordres α/2 et
1 − α/2 de la statistique X̄n.
➀ On fixe le risque α
α est appelé « le niveau » du test.
α petit. Valeurs usuelles : 5%, 1%.
On choisit un risque α = 5%.
➁ Loi de X̄n sous H0
X̄n ∼ N(
50 ;10√24
)
et sous forme centrée réduite
Zn =X̄n − 50
10√24
∼ N (0 ; 1)
31
➂ Intervalle d’acceptation et région de rejet
➡ IA : intervalle centré en 50 et contenant
1 − α = 95% des moyennes.
5046 54
x
RC RCIntervalle d’acceptation
α 2 α 21 − α
IA = [46 ; 54]
Bornes 46 et 54 : « valeurs critiques »
➡ Quand H0 est vraie, il y a 95% de chances
d’observer une valeur de X̄n dans l’intervalle
IA = [46 ; 54] et seulement 5% de chances dans
la région de rejet.
32
Calculs détaillés :
Bornes obtenues par la formule standard de
calcul des quantiles d’une loi normale.
bornes : 50 ± z1−α/2 ×10√24
moyenne quantile écart-type
Pour α = 5% :
➡ z1−α/2 = z0,975 quantile d’ordre 0,975 de la loi
N (0 ; 1) .
➡ Lu dans la table N (0 ; 1).
➡ IA =
[
50 − 1, 96 × 10√24
; 50 + 1, 96 × 10√24
]
.
33
d) Décision
Règle :
Si x̄obs appartient à l’IA, on accepte H0.
Sinon on la rejette et on accepte H1.
Décision :
La moyenne observée x̄obs = 54, 5 appartient à
la région de rejet.
➡ On rejette H0 et on accepte H1.
« Résultat du test significatif au niveau 5 % ».
Risque d’erreur associé à cette décision :
α = 5%.
α : Risque d’observer une valeur de X̄n dans
la région de rejet quand H0 est vraie.
➡ Probabilité de rejeter H0 à tort.
➡ On le fixe au départ.
34
4 ) Règle de décision équivalente,
basée sur zobs
- Valeur observée de Zn :
zobs =x̄obs − 50
10√24
=54, 5 − 50
10√24
= 2, 20
- IA au risque α = 5% :
IA = [− z0,975 ; z0,975] = [−1, 96 ; 1, 96]
- Décision : zobs est dans la région de rejet.
On rejette H0 avec un risque d’erreur de 5%.
35
Conclusion sur l’exemple traité
Test d’une hypothèse bilatérale pour une
population ayant une loi normale et un
écart-type connu.
➡ En pratique σ inconnu.
➡ La loi peut être inconnue.
➡ Les hypothèses sont souvent « unilatérales ».
36
II Test de Student pour une
population de loi normale, σ
inconnu
Exemple 2
On modifie le contexte de l’exemple 1 :
- P : enfants de parents récemment divorcés.- On teste la valeur théorique 50.
- On admet que la loi des scores est normale.
➡ L’écart-type σ est inconnu.
37
Contexte général du test :
Population P.
Variable X quantitative.
Loi de X normale.
Moyenne µ et écart-type σ inconnus.
On teste une valeur théorique notée µ0 pour µ.
➡ L’écart-type σ doit être estimé à partir des
données de l’échantillon.
➡ Pour le calcul des bornes de l’IA :
la loi N (0 ; 1) est remplacée par une loi appelée
loi de Student.
38
Etapes du test identiques à celles de l’exemple
précédent.
1 ) Hypothèses à tester et niveau α
On teste
H0 : µ = µ0 contre H1 : µ 6= µ0 bilatéraleou H1 : µ > µ0 unil. droite
ou H1 : µ < µ0 unil. gauche
Niveau (risque) α fixé.
Exemple 2.1. Test bilatéral : H1 : µ 6= 50.On choisit α = 1%.
Exemple 2.2. Test unilatéral droit : H1 : µ > 50.
On choisit α = 1%.
39
2 ) Observations et statistique du test
Cas général : on tire au sort un échantillon de
taille n.
Pour la décision :
On calcule x̄obs. Statistique de décision : X̄n.
Pour estimer σ :
On calcule s∗. Statistique utilisée : S∗n.
Exemple 2 : n = 24. x̄obs = 54, 5 ; s∗ = 9, 6.
3 ) Loi de X̄n sous H0
On se place sous H0.
➡ On doit déterminer l’IA et la région de rejet
associés au risque α choisi.
➡ Calcul des bornes : loi de X̄n indispensable.
40
Exemple 2 : On sait que X̄n se distribue selon
la loi normale N
(
50 ;σ√24
)
.
! ! La formule « centrée réduite » qui transforme
X̄n en
Zn =X̄n − 50
σ√24
n’est pas utilisable car σ n’est pas connu.
➡ On la remplace ici par la formule
Tn =X̄n − 50
S∗n√24
.
➡ La statistique Tn a sa propre distribution
légèrement différente de la loi normale N (0 ; 1) .
41
Loi de Tn :
- Appelée loi de Student : symétrique autour de
0, un peu plus étalée que la loi N (0, 1) .
- Dépend d’un paramètre ν (nu) : « nombre de
degrés de liberté ».
- Ce paramètre est égal à n − 1 = 24 − 1 = 23.
- On écrit
Tn ∼ T à 23 ddl
Résultat général :
Tn =X̄n − µ0
S∗n√n
suit la loi de Student à n − 1 ddl
Tn ∼ T à n − 1 ddl
➡ Rq : Pour n ≥ 30, on peut remplacer la loi deStudent par la loi N(0 ; 1).
42
4 ) Intervalle d’acceptation et région
de rejet associés au risque α
a) Valeurs de X̄n qui conduisent à rejeter
H0
➀ Pour H1 : µ 6= µ0Valeurs de X̄n s’écartant trop de µ0 (droite ou
gauche).
➡ Les plus extrêmes : les plus significatives de
H1.
➁ Pour H1 : µ > µ0
Valeurs de X̄n trop grandes par rapport à µ0 (à
droite).
➡ Les plus grandes : les plus significatives de H1.
➂ Pour H1 : µ < µ0
Valeurs de X̄n trop petites par rapport à µ0 (à
gauche).
➡ Les plus petites : les plus significatives de H1.
43
➀
µ0L1 L2
x
RC RCIntervalle d’acceptation
α 2 α 21 − α
➁
µ0
L
1 − α
x
RCIntervalle d’acceptation
α
➂
µ0
L
x
RC Intervalle d’acceptation
α 1 − α
44
b) Intervalle d’acceptation au risque α
pour X̄n
➀ Pour H1 : µ 6= µ0IA pour le cas précédent (I) :
bornes : µ0 ± z1−α/2σ√n
➡ On remplace σ par s∗ et le quantile z1−α/2
par celui de la loi de Student :
IA =
[
µ0 − t1−α/2s∗√n
;µ0 + t1−α/2s∗√n
]
(1)
➡ t1−α/2 : quantile d’ordre 1 − α/2 de la loi deStudent à n − 1 ddl.➡ A lire dans la table de Student :
ligne n − 1 et colonne α.
45
➁ Pour H1 : µ > µ0
Un seule borne à calculer. On change l’ordre du
quantile :
IA =
]
−∞ ;µ0 + t1−αs∗√n
]
(2)
➡ t1−α : quantile d’ordre 1 − α de la loi deStudent à n − 1 ddl.➡ A lire dans la table de Student :
ligne n − 1 et colonne 2α.
➂ Pour H1 : µ < µ0 :
IA =
[
µ0 − t1−αs∗√n
; +∞[
(3)
➡ Règle de décision générale :
Si x̄obs appartient à l’IA, on conserve H0.
Sinon on la rejette au risque d’erreur α.
46
Pour α = 1% et 23 ddl :
➀ Exemple 2.1 : H1 : µ 6= 50t1−α/2 = t0,995 = 2, 807 (ligne 23, colonne 0,01).
IA =
[
50 − 2, 807 × 9, 6√24
; 50 + 2, 807 × 9, 6√24
]
= [44, 5 ; 55, 5]
➡ Décision : x̄obs = 54, 5 appartient à l’inter-
valle d’acceptation. On ne rejette pas H0.
➁ Exemple 2.2 : H1 : µ > 50
t1−α = t0,99 = 2, 5 (ligne 23, colonne 0,02).
IA =
]
−∞ ; 50 + 2, 5 × 9, 6√24
]
= ]−∞ ; 54, 9].
➡ Décision : x̄obs = 54, 5 appartient à l’inter-
valle d’acceptation. On ne rejette pas H0.
➡ Dans les deux cas : « Résultat du test non
significatif au niveau 1 % ».
47
5 ) Règle alternative basée sur Tn
a) Intervalle d’acceptation :
➀ Pour H1 : µ 6= µ0
IA =[
−t1−α/2 ; t1−α/2]
(4)
➁ Pour H1 : µ > µ0
IA = ]−∞ ; t1−α] (5)
➂ Pour H1 : µ < µ0
IA = [−t1−α ; ∞[ (6)
b) Valeur observée de Tn :
tobs =x̄obs − µ0
s∗√n
➡ Si tobs appartient à l’IA, on conserve H0.
Sinon on la rejette au risque d’erreur α.
48
Exemples 2.1 et 2.2
Valeur observée de Tn :
tobs =54, 5 − 50
9, 6√24
= 2, 296.
➀ Exemple 2.1 : H1 : µ 6= 50
IA =[
−t1−α/2 ; t1−α/2]
= [−2, 807 ; 2, 807].
➡ Décision : tobs = 2, 296 appartient à l’IA.
On ne rejette pas H0.
➁ Exemple 2.2 : H1 : µ > 50.
IA = ]−∞ ; t1−α] = ]−∞ ; 2, 5].
➡ Décision : tobs = 2, 296 appartient à l’IA.
On ne rejette pas H0.
49
III Test pour une population
de loi inconnue et σ inconnu
Contexte général :
Ce qui change par rapport au test de
Student :
➡ Loi de X inconnue (quelconque).
Procédure du test :
Ce qui change :
➡ Loi de X̄n sous H0.
➡ Formules des bornes.
50
1 ) Loi de X̄n sous H0
On doit utiliser l’approximation normale.
Pour n ≥ 30 : on sait que
X̄n ∼approxt
N
(
µ0 ;σ√n
)
.
➡ Pour les calculs : pour n grand, on peut
transformer X̄n en
Zn =X̄n − µ0
S∗n√n
.
➡ La statistique Zn suit approximativement la
loi normale N (0 ; 1) .
Pour n < 30 : ? ?
51
2 ) Intervalle d’acceptation pour X̄n
➡ Formules analogues aux formules (1), (2) et
(3) du test de Student.
➡ Les quantiles « t » sont remplacés par les
quantiles « z » de la loi N(0 ; 1) :
Bilatéral : t1−α/2 remplacé par z1−α/2.
Unilatéral : t1−α remplacé par z1−α.
➡ Règle de décision usuelle.
3 ) Règle alternative basée sur Zn
a) Intervalle d’acceptation :
➡ Formules (4), (5) et (6) transformées de la
même façon.
b) Valeur observée de Zn : zobs =x̄obs − µ0
s∗√n
➡ Règle de décision usuelle.
52
IV Niveau de signification (ou
p-valeur)
Probabilité, notée αobs, associée à la moyenne
observée x̄obs.
Exemple 3
On teste H1 : µ > 13 unilatérale droite.
On choisit de faire le test au niveau α = 5%.
Echantillon :
- n = 65 (n ≥ 30).- Valeurs observées des statistiques de test :
x̄obs = 15, 2 et zobs = 2, 07.
- Ecart-type estimé : s∗ = 8, 58.
Test basé sur « l’approximation normale ».
53
Détails du test pour l’exemple 3
– Loi de X̄n sous H0 :
comme n = 65 ≥ 30 et σ est inconnu,
X̄n ∼approx.
N
(
13 ;σ√n
)
et
Zn =X̄n − 13
S∗n√n
∼approx.
N (0 ; 1) .
– IA et RC au risque α = 5% pour X̄n :
Région critique à droite du domaine.
Valeur critique : 13 + 1, 645 × 8, 58√65
= 14, 75.
Décision : x̄obs = 15, 2 > 14, 75. On rejette
H0 pour un risque d’erreur de 5%.
➡ Si l’on utilise Zn pour la décision :
Valeur observée :
zobs =15, 2 − 13
8, 58√65
= 2, 07.
54
Réponse au test de niveau α = 5% :
Pour Zn : on rejette H0 si zobs > 1, 645.
Décision :
zobs = 2, 07 > 1, 645 donc on rejette H0.
➡ Résultat du test significatif au niveau 5%.
Valeur observée (x̄obs ou zobs) significative au
niveau 5%.
Test au niveau α = 1% :
zobs = 2, 07 < 2, 325 donc on accepte H0.
➡ Valeur observée non significative au niveau
1%.
55
Résultat significatif pour quelles valeurs
de α ?
1.645
0 zzobs = 2.07
Rejet
α = 5%
2.325
0 z2.07
Rejet
α = 1%
(Sous H0, Zn suit approx. la loi N(0 ; 1)).
56
➡ Résultat significatif pour n’importe
quel niveau α > 1,92% :
0 z2.07
Rejet
1.92 %
α
1, 92% = P (Zn ≥ 2, 07) = P (X̄n ≥ 15, 2).
1, 92% : probabilité définie par rapport aux
valeurs de X̄n qui sont encore plus significatives
que 15,2.
1, 92% : niveau de signification ou p-valeur de la
moyenne observée 15,2.
57
1 ) Définition et formules générales
Définition : αobs est la probabilité, sous H0,
d’observer une valeur de X̄n encore plus
significative que la valeur effectivement observée.
➀ Pour H1 : µ > µ0
Valeur plus significative : plus grande.
αobs =définition
PH0(X̄n ≥ x̄obs).
xµ0 xobs
αobs
Exemple 3 : αobs =définition
PH0(X̄n ≥ 15, 2).
58
➁ Pour H1 : µ < µ0
Valeur plus significative : plus petite.
αobs =définition
PH0(X̄n ≤ x̄obs).
xobs µ0x
αobs
59
➂ Pour H1 : µ 6= µ0Valeurs les plus significatives : les plus extrêmes
( à droite et à gauche).
xµ0xobs
αobs 2 αobs 2
Si x̄obs < µ0, on pose
αobs2
= PH0(
X̄n ≤ x̄obs)
,
Si x̄obs > µ0, on pose
αobs2
= PH0(
X̄n ≥ x̄obs)
.
60
2 ) Détermination numérique
➡ Table de la fonction de répartition de la « loi
centrée réduite » nécessaire.
Table disponible pour la loi N(0 ; 1).
Table non disponible pour la loi de Student.
➡ On se limitera donc au cas où n ≥ 30.
3 ) Interprétation de αobs
On peut considérer αobs comme un risque
d’erreur.
61
Exemple 3 :
Pour un risque nominal α fixé à l’avance :
– Si
αobs = 1, 92% < α,
on peut rejeter H0 au risque α.
➡ αobs : risque d’erreur minimum à
prendre pour rejeter H0.
– Si
αobs = 1, 92% ≥ α,on conserve H0.
➡ α : risque d’erreur maximal que l’on
accepte de prendre pour rejeter H0.
0 z2.07
Rejet
1.92 %
α
62
V Risques d’erreur et
puissance d’un test
- Deux états possibles pour H0 :
vraie ou fausse.
- Deux décisions possibles :
rejeter H0 ou conserver H0.
➡ Pour chaque décision : risque d’erreur
associé.
63
Décision
H0 Rejeter H0 Conserver H0
erreur de 1re espèce bonne décision
Vraie risque de 1re espèce
α fixé
bonne décision erreur de 2e espèce
Fausse risque de 2e espèce
noté β
➡ Risque α : probabilité de choisir H1 alors
que H0 est vraie. Connu car fixé.
➡ Risque β : probabilité de choisir H0 alors
que H1 est vraie. Inconnu en général.
➡ Puissance 1 − β : probabilité de choisir H1alors que H1 est vraie. Plus le risque β est
petit, plus le test est puissant.
64
On souhaite de faibles risques d’erreur.
– Risques antagonistes :
Si on diminue α, on élargit l’intervalle
d’acceptation et donc β augmente.
– Effet de la taille n :
Pour α fixé, si on augmente n, β diminue.
Pour faire un test :
➡ Fixer α en fonction des conséquences du rejet
erroné de H0.
➡ Prendre n le plus grand possible pour avoir le
test le plus puissant possible.
65