Chapitre 2 Test de comparaison d’une moyenne `a une valeur ...gandalfmagicien.free.fr/psycho/Licence 3/Premier Semestre...Chapitre 2 Test de comparaison d’une moyenne `a une valeur

Chapitre 2

Test de comparaison d’une moyenne

à une valeur théorique

I Test bilatéral pour une

population de loi normale et

d’écart-type connu

24

Exemple 1

Score d’Achenbach : mesure les problèmes compor-

tementaux des jeunes.

Dans la population des jeunes, les scores se distri-

buent selon la loi normale N(50, 10).

– Population étudiée P : enfants de parentsrécemment divorcés.

– Hypothèse de recherche : la moyenne (µ) est

différente de la norme (50).

– Observations :

Sur un échantillon de 24 enfants, on observe un

score moyen x̄obs = 54, 5.

Peut-on, à partir des observations valider

l’hypothèse de recherche ?

– Pour les calculs : on admet que pour ces

enfants, la loi des scores est encore normale et

d’écart-type σ = 10.

25

Les étapes du test d’hypothèses

1 ) Les hypothèses du test

50 : valeur de référence pour µ, à tester.

valeur théorique, norme

Un test comporte toujours 2 hypothèses :

– Hypothèse nulle notée H0

« Opposée » à l’hypothèse formulée :

H0 : La moyenne des enfants est égale à la

valeur théorique

– Hypothèse alternative, notée H1

Celle que l’on a formulée et que l’on veut

valider :

H1 : La moyenne des enfants n’est pas égale à

la valeur théorique

« elle est plus petite ou plus grande »

hypothèse bilatérale

26

➡ On pose les 2 hypothèses :

H0 : µ = 50

H1 : µ 6= 50 bilatérale

On teste H0 contre H1.

Hypothèses unilatérales : on aurait pu

poser un test unilatéral :

H0 : µ = 50

H1 : µ > 50ou

H0 : µ = 50

H1 : µ < 50

unilatérale droite unilatérale gauche

➡ Orientation de H1 à choisir au départ.

27

2 ) Observations et statistique du test

On prélève un échantillon de 24 enfants.

Statistique utilisée pour le test : X̄n.

On calcule sa valeur observée x̄obs = 54, 5.

3 ) Règle de décision basée sur x̄obs

- Choix à faire entre l’hypothèse H0 et

l’hypothèse H1.

- Décision prise en fonction de la moyenne

observée : 54,5.

28

a) Principe de la règle

On suppose au départ que H0 est vraie.

« On se place sous H0 »

➡ On va conserver (accepter) H0 si la valeur

observée (54,5) est jugée suffisamment plausible

sous H0.

➡ On va rejeter H0 et accepter H1 si la valeur

observée (54,5) est jugée trop improbable sous

H0.

b) Région de rejet et intervalle

d’acceptation

Sous H0 :

Les moyennes se distribuent autour de 50 avec

une certaine dispersion.

29

➡ Il est normal d’observer un écart entre valeur

prise par X̄n et la valeur centrale 50.

➡ Il est par contre anormal d’observer un écart

trop grand.

50

L1 L2x

Rejet RejetAcceptation

➡ Valeurs de X̄n plausibles :

contenues dans un intervalle de variation

(dit d’acceptation, noté IA).

➡ Valeurs de X̄n trop improbables :

les plus éloignées de 50,

dans la région dite de rejet ou critique RC.

Les plus extrêmes sont les plus significatives de H1.

30

c) Calcul des bornes de l’IA

➡ On choisit un risque α associé à l’IA.

➡ Bornes L1 et L2 : quantiles d’ordres α/2 et

1 − α/2 de la statistique X̄n.

➀ On fixe le risque α

α est appelé « le niveau » du test.

α petit. Valeurs usuelles : 5%, 1%.

On choisit un risque α = 5%.

➁ Loi de X̄n sous H0

X̄n ∼ N(

50 ;10√24

)

et sous forme centrée réduite

Zn =X̄n − 50

10√24

∼ N (0 ; 1)

31

➂ Intervalle d’acceptation et région de rejet

➡ IA : intervalle centré en 50 et contenant

1 − α = 95% des moyennes.

5046 54

x

RC RCIntervalle d’acceptation

α 2 α 21 − α

IA = [46 ; 54]

Bornes 46 et 54 : « valeurs critiques »

➡ Quand H0 est vraie, il y a 95% de chances

d’observer une valeur de X̄n dans l’intervalle

IA = [46 ; 54] et seulement 5% de chances dans

la région de rejet.

32

Calculs détaillés :

Bornes obtenues par la formule standard de

calcul des quantiles d’une loi normale.

bornes : 50 ± z1−α/2 ×10√24

moyenne quantile écart-type

Pour α = 5% :

➡ z1−α/2 = z0,975 quantile d’ordre 0,975 de la loi

N (0 ; 1) .

➡ Lu dans la table N (0 ; 1).

➡ IA =

[

50 − 1, 96 × 10√24

; 50 + 1, 96 × 10√24

]

.

33

d) Décision

Règle :

Si x̄obs appartient à l’IA, on accepte H0.

Sinon on la rejette et on accepte H1.

Décision :

La moyenne observée x̄obs = 54, 5 appartient à

la région de rejet.

➡ On rejette H0 et on accepte H1.

« Résultat du test significatif au niveau 5 % ».

Risque d’erreur associé à cette décision :

α = 5%.

α : Risque d’observer une valeur de X̄n dans

la région de rejet quand H0 est vraie.

➡ Probabilité de rejeter H0 à tort.

➡ On le fixe au départ.

34

4 ) Règle de décision équivalente,

basée sur zobs

- Valeur observée de Zn :

zobs =x̄obs − 50

10√24

=54, 5 − 50

10√24

= 2, 20

- IA au risque α = 5% :

IA = [− z0,975 ; z0,975] = [−1, 96 ; 1, 96]

- Décision : zobs est dans la région de rejet.

On rejette H0 avec un risque d’erreur de 5%.

35

Conclusion sur l’exemple traité

Test d’une hypothèse bilatérale pour une

population ayant une loi normale et un

écart-type connu.

➡ En pratique σ inconnu.

➡ La loi peut être inconnue.

➡ Les hypothèses sont souvent « unilatérales ».

36

II Test de Student pour une

population de loi normale, σ

inconnu

Exemple 2

On modifie le contexte de l’exemple 1 :

- P : enfants de parents récemment divorcés.- On teste la valeur théorique 50.

- On admet que la loi des scores est normale.

➡ L’écart-type σ est inconnu.

37

Contexte général du test :

Population P.

Variable X quantitative.

Loi de X normale.

Moyenne µ et écart-type σ inconnus.

On teste une valeur théorique notée µ0 pour µ.

➡ L’écart-type σ doit être estimé à partir des

données de l’échantillon.

➡ Pour le calcul des bornes de l’IA :

la loi N (0 ; 1) est remplacée par une loi appelée

loi de Student.

38

Etapes du test identiques à celles de l’exemple

précédent.

1 ) Hypothèses à tester et niveau α

On teste

H0 : µ = µ0 contre H1 : µ 6= µ0 bilatéraleou H1 : µ > µ0 unil. droite

ou H1 : µ < µ0 unil. gauche

Niveau (risque) α fixé.

Exemple 2.1. Test bilatéral : H1 : µ 6= 50.On choisit α = 1%.

Exemple 2.2. Test unilatéral droit : H1 : µ > 50.

On choisit α = 1%.

39

2 ) Observations et statistique du test

Cas général : on tire au sort un échantillon de

taille n.

Pour la décision :

On calcule x̄obs. Statistique de décision : X̄n.

Pour estimer σ :

On calcule s∗. Statistique utilisée : S∗n.

Exemple 2 : n = 24. x̄obs = 54, 5 ; s∗ = 9, 6.

3 ) Loi de X̄n sous H0

On se place sous H0.

➡ On doit déterminer l’IA et la région de rejet

associés au risque α choisi.

➡ Calcul des bornes : loi de X̄n indispensable.

40

Exemple 2 : On sait que X̄n se distribue selon

la loi normale N

(

50 ;σ√24

)

.

! ! La formule « centrée réduite » qui transforme

X̄n en

Zn =X̄n − 50

σ√24

n’est pas utilisable car σ n’est pas connu.

➡ On la remplace ici par la formule

Tn =X̄n − 50

S∗n√24

.

➡ La statistique Tn a sa propre distribution

légèrement différente de la loi normale N (0 ; 1) .

41

Loi de Tn :

- Appelée loi de Student : symétrique autour de

0, un peu plus étalée que la loi N (0, 1) .

- Dépend d’un paramètre ν (nu) : « nombre de

degrés de liberté ».

- Ce paramètre est égal à n − 1 = 24 − 1 = 23.

- On écrit

Tn ∼ T à 23 ddl

Résultat général :

Tn =X̄n − µ0

S∗n√n

suit la loi de Student à n − 1 ddl

Tn ∼ T à n − 1 ddl

➡ Rq : Pour n ≥ 30, on peut remplacer la loi deStudent par la loi N(0 ; 1).

42

4 ) Intervalle d’acceptation et région

de rejet associés au risque α

a) Valeurs de X̄n qui conduisent à rejeter

H0

➀ Pour H1 : µ 6= µ0Valeurs de X̄n s’écartant trop de µ0 (droite ou

gauche).

➡ Les plus extrêmes : les plus significatives de

H1.

➁ Pour H1 : µ > µ0

Valeurs de X̄n trop grandes par rapport à µ0 (à

droite).

➡ Les plus grandes : les plus significatives de H1.

➂ Pour H1 : µ < µ0

Valeurs de X̄n trop petites par rapport à µ0 (à

gauche).

➡ Les plus petites : les plus significatives de H1.

43

➀

µ0L1 L2

x

RC RCIntervalle d’acceptation

α 2 α 21 − α

➁

µ0

L

1 − α

x

RCIntervalle d’acceptation

α

➂

µ0

L

x

RC Intervalle d’acceptation

α 1 − α

44

b) Intervalle d’acceptation au risque α

pour X̄n

➀ Pour H1 : µ 6= µ0IA pour le cas précédent (I) :

bornes : µ0 ± z1−α/2σ√n

➡ On remplace σ par s∗ et le quantile z1−α/2

par celui de la loi de Student :

IA =

[

µ0 − t1−α/2s∗√n

;µ0 + t1−α/2s∗√n

]

(1)

➡ t1−α/2 : quantile d’ordre 1 − α/2 de la loi deStudent à n − 1 ddl.➡ A lire dans la table de Student :

ligne n − 1 et colonne α.

45

➁ Pour H1 : µ > µ0

Un seule borne à calculer. On change l’ordre du

quantile :

IA =

]

−∞ ;µ0 + t1−αs∗√n

]

(2)

➡ t1−α : quantile d’ordre 1 − α de la loi deStudent à n − 1 ddl.➡ A lire dans la table de Student :

ligne n − 1 et colonne 2α.

➂ Pour H1 : µ < µ0 :

IA =

[

µ0 − t1−αs∗√n

; +∞[

(3)

➡ Règle de décision générale :

Si x̄obs appartient à l’IA, on conserve H0.

Sinon on la rejette au risque d’erreur α.

46

Pour α = 1% et 23 ddl :

➀ Exemple 2.1 : H1 : µ 6= 50t1−α/2 = t0,995 = 2, 807 (ligne 23, colonne 0,01).

IA =

[

50 − 2, 807 × 9, 6√24

; 50 + 2, 807 × 9, 6√24

]

= [44, 5 ; 55, 5]

➡ Décision : x̄obs = 54, 5 appartient à l’inter-

valle d’acceptation. On ne rejette pas H0.

➁ Exemple 2.2 : H1 : µ > 50

t1−α = t0,99 = 2, 5 (ligne 23, colonne 0,02).

IA =

]

−∞ ; 50 + 2, 5 × 9, 6√24

]

= ]−∞ ; 54, 9].

➡ Décision : x̄obs = 54, 5 appartient à l’inter-

valle d’acceptation. On ne rejette pas H0.

➡ Dans les deux cas : « Résultat du test non

significatif au niveau 1 % ».

47

5 ) Règle alternative basée sur Tn

a) Intervalle d’acceptation :

➀ Pour H1 : µ 6= µ0

IA =[

−t1−α/2 ; t1−α/2]

(4)

➁ Pour H1 : µ > µ0

IA = ]−∞ ; t1−α] (5)

➂ Pour H1 : µ < µ0

IA = [−t1−α ; ∞[ (6)

b) Valeur observée de Tn :

tobs =x̄obs − µ0

s∗√n

➡ Si tobs appartient à l’IA, on conserve H0.

Sinon on la rejette au risque d’erreur α.

48

Exemples 2.1 et 2.2

Valeur observée de Tn :

tobs =54, 5 − 50

9, 6√24

= 2, 296.

➀ Exemple 2.1 : H1 : µ 6= 50

IA =[

−t1−α/2 ; t1−α/2]

= [−2, 807 ; 2, 807].

➡ Décision : tobs = 2, 296 appartient à l’IA.

On ne rejette pas H0.

➁ Exemple 2.2 : H1 : µ > 50.

IA = ]−∞ ; t1−α] = ]−∞ ; 2, 5].

➡ Décision : tobs = 2, 296 appartient à l’IA.

On ne rejette pas H0.

49

III Test pour une population

de loi inconnue et σ inconnu

Contexte général :

Ce qui change par rapport au test de

Student :

➡ Loi de X inconnue (quelconque).

Procédure du test :

Ce qui change :

➡ Loi de X̄n sous H0.

➡ Formules des bornes.

50

1 ) Loi de X̄n sous H0

On doit utiliser l’approximation normale.

Pour n ≥ 30 : on sait que

X̄n ∼approxt

N

(

µ0 ;σ√n

)

.

➡ Pour les calculs : pour n grand, on peut

transformer X̄n en

Zn =X̄n − µ0

S∗n√n

.

➡ La statistique Zn suit approximativement la

loi normale N (0 ; 1) .

Pour n < 30 : ? ?

51

2 ) Intervalle d’acceptation pour X̄n

➡ Formules analogues aux formules (1), (2) et

(3) du test de Student.

➡ Les quantiles « t » sont remplacés par les

quantiles « z » de la loi N(0 ; 1) :

Bilatéral : t1−α/2 remplacé par z1−α/2.

Unilatéral : t1−α remplacé par z1−α.

➡ Règle de décision usuelle.

3 ) Règle alternative basée sur Zn

a) Intervalle d’acceptation :

➡ Formules (4), (5) et (6) transformées de la

même façon.

b) Valeur observée de Zn : zobs =x̄obs − µ0

s∗√n

➡ Règle de décision usuelle.

52

IV Niveau de signification (ou

p-valeur)

Probabilité, notée αobs, associée à la moyenne

observée x̄obs.

Exemple 3

On teste H1 : µ > 13 unilatérale droite.

On choisit de faire le test au niveau α = 5%.

Echantillon :

- n = 65 (n ≥ 30).- Valeurs observées des statistiques de test :

x̄obs = 15, 2 et zobs = 2, 07.

- Ecart-type estimé : s∗ = 8, 58.

Test basé sur « l’approximation normale ».

53

Détails du test pour l’exemple 3

– Loi de X̄n sous H0 :

comme n = 65 ≥ 30 et σ est inconnu,

X̄n ∼approx.

N

(

13 ;σ√n

)

et

Zn =X̄n − 13

S∗n√n

∼approx.

N (0 ; 1) .

– IA et RC au risque α = 5% pour X̄n :

Région critique à droite du domaine.

Valeur critique : 13 + 1, 645 × 8, 58√65

= 14, 75.

Décision : x̄obs = 15, 2 > 14, 75. On rejette

H0 pour un risque d’erreur de 5%.

➡ Si l’on utilise Zn pour la décision :

Valeur observée :

zobs =15, 2 − 13

8, 58√65

= 2, 07.

54

Réponse au test de niveau α = 5% :

Pour Zn : on rejette H0 si zobs > 1, 645.

Décision :

zobs = 2, 07 > 1, 645 donc on rejette H0.

➡ Résultat du test significatif au niveau 5%.

Valeur observée (x̄obs ou zobs) significative au

niveau 5%.

Test au niveau α = 1% :

zobs = 2, 07 < 2, 325 donc on accepte H0.

➡ Valeur observée non significative au niveau

1%.

55

Résultat significatif pour quelles valeurs

de α ?

1.645

0 zzobs = 2.07

Rejet

α = 5%

2.325

0 z2.07

Rejet

α = 1%

(Sous H0, Zn suit approx. la loi N(0 ; 1)).

56

➡ Résultat significatif pour n’importe

quel niveau α > 1,92% :

0 z2.07

Rejet

1.92 %

α

1, 92% = P (Zn ≥ 2, 07) = P (X̄n ≥ 15, 2).

1, 92% : probabilité définie par rapport aux

valeurs de X̄n qui sont encore plus significatives

que 15,2.

1, 92% : niveau de signification ou p-valeur de la

moyenne observée 15,2.

57

1 ) Définition et formules générales

Définition : αobs est la probabilité, sous H0,

d’observer une valeur de X̄n encore plus

significative que la valeur effectivement observée.

➀ Pour H1 : µ > µ0

Valeur plus significative : plus grande.

αobs =définition

PH0(X̄n ≥ x̄obs).

xµ0 xobs

αobs

Exemple 3 : αobs =définition

PH0(X̄n ≥ 15, 2).

58

➁ Pour H1 : µ < µ0

Valeur plus significative : plus petite.

αobs =définition

PH0(X̄n ≤ x̄obs).

xobs µ0x

αobs

59

➂ Pour H1 : µ 6= µ0Valeurs les plus significatives : les plus extrêmes

( à droite et à gauche).

xµ0xobs

αobs 2 αobs 2

Si x̄obs < µ0, on pose

αobs2

= PH0(

X̄n ≤ x̄obs)

,

Si x̄obs > µ0, on pose

αobs2

= PH0(

X̄n ≥ x̄obs)

.

60

2 ) Détermination numérique

➡ Table de la fonction de répartition de la « loi

centrée réduite » nécessaire.

Table disponible pour la loi N(0 ; 1).

Table non disponible pour la loi de Student.

➡ On se limitera donc au cas où n ≥ 30.

3 ) Interprétation de αobs

On peut considérer αobs comme un risque

d’erreur.

61

Exemple 3 :

Pour un risque nominal α fixé à l’avance :

– Si

αobs = 1, 92% < α,

on peut rejeter H0 au risque α.

➡ αobs : risque d’erreur minimum à

prendre pour rejeter H0.

– Si

αobs = 1, 92% ≥ α,on conserve H0.

➡ α : risque d’erreur maximal que l’on

accepte de prendre pour rejeter H0.

0 z2.07

Rejet

1.92 %

α

62

V Risques d’erreur et

puissance d’un test

- Deux états possibles pour H0 :

vraie ou fausse.

- Deux décisions possibles :

rejeter H0 ou conserver H0.

➡ Pour chaque décision : risque d’erreur

associé.

63

Décision

H0 Rejeter H0 Conserver H0

erreur de 1re espèce bonne décision

Vraie risque de 1re espèce

α fixé

bonne décision erreur de 2e espèce

Fausse risque de 2e espèce

noté β

➡ Risque α : probabilité de choisir H1 alors

que H0 est vraie. Connu car fixé.

➡ Risque β : probabilité de choisir H0 alors

que H1 est vraie. Inconnu en général.

➡ Puissance 1 − β : probabilité de choisir H1alors que H1 est vraie. Plus le risque β est

petit, plus le test est puissant.

64

On souhaite de faibles risques d’erreur.

– Risques antagonistes :

Si on diminue α, on élargit l’intervalle

d’acceptation et donc β augmente.

– Effet de la taille n :

Pour α fixé, si on augmente n, β diminue.

Pour faire un test :

➡ Fixer α en fonction des conséquences du rejet

erroné de H0.

➡ Prendre n le plus grand possible pour avoir le

test le plus puissant possible.

65

Documents

Chapitre 2 Test de comparaison d’une moyenne `a une valeur ...gandalfmagicien.free.fr/psycho/Licence 3/Premier Semestre...Chapitre 2 Test de comparaison d’une moyenne `a une valeur