42
Chapitre 2 Test de comparaison d’une moyenne `a une valeur th´ eorique I Test bilat´ eral pour une population de loi normale et d’´ ecart-type connu 24

Chapitre 2 Test de comparaison d’une moyenne `a une valeur ...gandalfmagicien.free.fr/psycho/Licence 3/Premier Semestre...Chapitre 2 Test de comparaison d’une moyenne `a une valeur

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

  • Chapitre 2

    Test de comparaison d’une moyenne

    à une valeur théorique

    I Test bilatéral pour une

    population de loi normale et

    d’écart-type connu

    24

  • Exemple 1

    Score d’Achenbach : mesure les problèmes compor-

    tementaux des jeunes.

    Dans la population des jeunes, les scores se distri-

    buent selon la loi normale N(50, 10).

    – Population étudiée P : enfants de parentsrécemment divorcés.

    – Hypothèse de recherche : la moyenne (µ) est

    différente de la norme (50).

    – Observations :

    Sur un échantillon de 24 enfants, on observe un

    score moyen x̄obs = 54, 5.

    Peut-on, à partir des observations valider

    l’hypothèse de recherche ?

    – Pour les calculs : on admet que pour ces

    enfants, la loi des scores est encore normale et

    d’écart-type σ = 10.

    25

  • Les étapes du test d’hypothèses

    1 ) Les hypothèses du test

    50 : valeur de référence pour µ, à tester.

    valeur théorique, norme

    Un test comporte toujours 2 hypothèses :

    – Hypothèse nulle notée H0

    « Opposée » à l’hypothèse formulée :

    H0 : La moyenne des enfants est égale à la

    valeur théorique

    – Hypothèse alternative, notée H1

    Celle que l’on a formulée et que l’on veut

    valider :

    H1 : La moyenne des enfants n’est pas égale à

    la valeur théorique

    « elle est plus petite ou plus grande »

    hypothèse bilatérale

    26

  • ➡ On pose les 2 hypothèses :

    H0 : µ = 50

    H1 : µ 6= 50 bilatérale

    On teste H0 contre H1.

    Hypothèses unilatérales : on aurait pu

    poser un test unilatéral :

    H0 : µ = 50

    H1 : µ > 50ou

    H0 : µ = 50

    H1 : µ < 50

    unilatérale droite unilatérale gauche

    ➡ Orientation de H1 à choisir au départ.

    27

  • 2 ) Observations et statistique du test

    On prélève un échantillon de 24 enfants.

    Statistique utilisée pour le test : X̄n.

    On calcule sa valeur observée x̄obs = 54, 5.

    3 ) Règle de décision basée sur x̄obs

    - Choix à faire entre l’hypothèse H0 et

    l’hypothèse H1.

    - Décision prise en fonction de la moyenne

    observée : 54,5.

    28

  • a) Principe de la règle

    On suppose au départ que H0 est vraie.

    « On se place sous H0 »

    ➡ On va conserver (accepter) H0 si la valeur

    observée (54,5) est jugée suffisamment plausible

    sous H0.

    ➡ On va rejeter H0 et accepter H1 si la valeur

    observée (54,5) est jugée trop improbable sous

    H0.

    b) Région de rejet et intervalle

    d’acceptation

    Sous H0 :

    Les moyennes se distribuent autour de 50 avec

    une certaine dispersion.

    29

  • ➡ Il est normal d’observer un écart entre valeur

    prise par X̄n et la valeur centrale 50.

    ➡ Il est par contre anormal d’observer un écart

    trop grand.

    50

    L1 L2x

    Rejet RejetAcceptation

    ➡ Valeurs de X̄n plausibles :

    contenues dans un intervalle de variation

    (dit d’acceptation, noté IA).

    ➡ Valeurs de X̄n trop improbables :

    les plus éloignées de 50,

    dans la région dite de rejet ou critique RC.

    Les plus extrêmes sont les plus significatives de H1.

    30

  • c) Calcul des bornes de l’IA

    ➡ On choisit un risque α associé à l’IA.

    ➡ Bornes L1 et L2 : quantiles d’ordres α/2 et

    1 − α/2 de la statistique X̄n.

    ➀ On fixe le risque α

    α est appelé « le niveau » du test.

    α petit. Valeurs usuelles : 5%, 1%.

    On choisit un risque α = 5%.

    ➁ Loi de X̄n sous H0

    X̄n ∼ N(

    50 ;10√24

    )

    et sous forme centrée réduite

    Zn =X̄n − 50

    10√24

    ∼ N (0 ; 1)

    31

  • ➂ Intervalle d’acceptation et région de rejet

    ➡ IA : intervalle centré en 50 et contenant

    1 − α = 95% des moyennes.

    5046 54

    x

    RC RCIntervalle d’acceptation

    α 2 α 21 − α

    IA = [46 ; 54]

    Bornes 46 et 54 : « valeurs critiques »

    ➡ Quand H0 est vraie, il y a 95% de chances

    d’observer une valeur de X̄n dans l’intervalle

    IA = [46 ; 54] et seulement 5% de chances dans

    la région de rejet.

    32

  • Calculs détaillés :

    Bornes obtenues par la formule standard de

    calcul des quantiles d’une loi normale.

    bornes : 50 ± z1−α/2 ×10√24

    moyenne quantile écart-type

    Pour α = 5% :

    ➡ z1−α/2 = z0,975 quantile d’ordre 0,975 de la loi

    N (0 ; 1) .

    ➡ Lu dans la table N (0 ; 1).

    ➡ IA =

    [

    50 − 1, 96 × 10√24

    ; 50 + 1, 96 × 10√24

    ]

    .

    33

  • d) Décision

    Règle :

    Si x̄obs appartient à l’IA, on accepte H0.

    Sinon on la rejette et on accepte H1.

    Décision :

    La moyenne observée x̄obs = 54, 5 appartient à

    la région de rejet.

    ➡ On rejette H0 et on accepte H1.

    « Résultat du test significatif au niveau 5 % ».

    Risque d’erreur associé à cette décision :

    α = 5%.

    α : Risque d’observer une valeur de X̄n dans

    la région de rejet quand H0 est vraie.

    ➡ Probabilité de rejeter H0 à tort.

    ➡ On le fixe au départ.

    34

  • 4 ) Règle de décision équivalente,

    basée sur zobs

    - Valeur observée de Zn :

    zobs =x̄obs − 50

    10√24

    =54, 5 − 50

    10√24

    = 2, 20

    - IA au risque α = 5% :

    IA = [− z0,975 ; z0,975] = [−1, 96 ; 1, 96]

    - Décision : zobs est dans la région de rejet.

    On rejette H0 avec un risque d’erreur de 5%.

    35

  • Conclusion sur l’exemple traité

    Test d’une hypothèse bilatérale pour une

    population ayant une loi normale et un

    écart-type connu.

    ➡ En pratique σ inconnu.

    ➡ La loi peut être inconnue.

    ➡ Les hypothèses sont souvent « unilatérales ».

    36

  • II Test de Student pour une

    population de loi normale, σ

    inconnu

    Exemple 2

    On modifie le contexte de l’exemple 1 :

    - P : enfants de parents récemment divorcés.- On teste la valeur théorique 50.

    - On admet que la loi des scores est normale.

    ➡ L’écart-type σ est inconnu.

    37

  • Contexte général du test :

    Population P.

    Variable X quantitative.

    Loi de X normale.

    Moyenne µ et écart-type σ inconnus.

    On teste une valeur théorique notée µ0 pour µ.

    ➡ L’écart-type σ doit être estimé à partir des

    données de l’échantillon.

    ➡ Pour le calcul des bornes de l’IA :

    la loi N (0 ; 1) est remplacée par une loi appelée

    loi de Student.

    38

  • Etapes du test identiques à celles de l’exemple

    précédent.

    1 ) Hypothèses à tester et niveau α

    On teste

    H0 : µ = µ0 contre H1 : µ 6= µ0 bilatéraleou H1 : µ > µ0 unil. droite

    ou H1 : µ < µ0 unil. gauche

    Niveau (risque) α fixé.

    Exemple 2.1. Test bilatéral : H1 : µ 6= 50.On choisit α = 1%.

    Exemple 2.2. Test unilatéral droit : H1 : µ > 50.

    On choisit α = 1%.

    39

  • 2 ) Observations et statistique du test

    Cas général : on tire au sort un échantillon de

    taille n.

    Pour la décision :

    On calcule x̄obs. Statistique de décision : X̄n.

    Pour estimer σ :

    On calcule s∗. Statistique utilisée : S∗n.

    Exemple 2 : n = 24. x̄obs = 54, 5 ; s∗ = 9, 6.

    3 ) Loi de X̄n sous H0

    On se place sous H0.

    ➡ On doit déterminer l’IA et la région de rejet

    associés au risque α choisi.

    ➡ Calcul des bornes : loi de X̄n indispensable.

    40

  • Exemple 2 : On sait que X̄n se distribue selon

    la loi normale N

    (

    50 ;σ√24

    )

    .

    ! ! La formule « centrée réduite » qui transforme

    X̄n en

    Zn =X̄n − 50

    σ√24

    n’est pas utilisable car σ n’est pas connu.

    ➡ On la remplace ici par la formule

    Tn =X̄n − 50

    S∗n√24

    .

    ➡ La statistique Tn a sa propre distribution

    légèrement différente de la loi normale N (0 ; 1) .

    41

  • Loi de Tn :

    - Appelée loi de Student : symétrique autour de

    0, un peu plus étalée que la loi N (0, 1) .

    - Dépend d’un paramètre ν (nu) : « nombre de

    degrés de liberté ».

    - Ce paramètre est égal à n − 1 = 24 − 1 = 23.

    - On écrit

    Tn ∼ T à 23 ddl

    Résultat général :

    Tn =X̄n − µ0

    S∗n√n

    suit la loi de Student à n − 1 ddl

    Tn ∼ T à n − 1 ddl

    ➡ Rq : Pour n ≥ 30, on peut remplacer la loi deStudent par la loi N(0 ; 1).

    42

  • 4 ) Intervalle d’acceptation et région

    de rejet associés au risque α

    a) Valeurs de X̄n qui conduisent à rejeter

    H0

    ➀ Pour H1 : µ 6= µ0Valeurs de X̄n s’écartant trop de µ0 (droite ou

    gauche).

    ➡ Les plus extrêmes : les plus significatives de

    H1.

    ➁ Pour H1 : µ > µ0

    Valeurs de X̄n trop grandes par rapport à µ0 (à

    droite).

    ➡ Les plus grandes : les plus significatives de H1.

    ➂ Pour H1 : µ < µ0

    Valeurs de X̄n trop petites par rapport à µ0 (à

    gauche).

    ➡ Les plus petites : les plus significatives de H1.

    43

  • µ0L1 L2

    x

    RC RCIntervalle d’acceptation

    α 2 α 21 − α

    µ0

    L

    1 − α

    x

    RCIntervalle d’acceptation

    α

    µ0

    L

    x

    RC Intervalle d’acceptation

    α 1 − α

    44

  • b) Intervalle d’acceptation au risque α

    pour X̄n

    ➀ Pour H1 : µ 6= µ0IA pour le cas précédent (I) :

    bornes : µ0 ± z1−α/2σ√n

    ➡ On remplace σ par s∗ et le quantile z1−α/2

    par celui de la loi de Student :

    IA =

    [

    µ0 − t1−α/2s∗√n

    ;µ0 + t1−α/2s∗√n

    ]

    (1)

    ➡ t1−α/2 : quantile d’ordre 1 − α/2 de la loi deStudent à n − 1 ddl.➡ A lire dans la table de Student :

    ligne n − 1 et colonne α.

    45

  • ➁ Pour H1 : µ > µ0

    Un seule borne à calculer. On change l’ordre du

    quantile :

    IA =

    ]

    −∞ ;µ0 + t1−αs∗√n

    ]

    (2)

    ➡ t1−α : quantile d’ordre 1 − α de la loi deStudent à n − 1 ddl.➡ A lire dans la table de Student :

    ligne n − 1 et colonne 2α.

    ➂ Pour H1 : µ < µ0 :

    IA =

    [

    µ0 − t1−αs∗√n

    ; +∞[

    (3)

    ➡ Règle de décision générale :

    Si x̄obs appartient à l’IA, on conserve H0.

    Sinon on la rejette au risque d’erreur α.

    46

  • Pour α = 1% et 23 ddl :

    ➀ Exemple 2.1 : H1 : µ 6= 50t1−α/2 = t0,995 = 2, 807 (ligne 23, colonne 0,01).

    IA =

    [

    50 − 2, 807 × 9, 6√24

    ; 50 + 2, 807 × 9, 6√24

    ]

    = [44, 5 ; 55, 5]

    ➡ Décision : x̄obs = 54, 5 appartient à l’inter-

    valle d’acceptation. On ne rejette pas H0.

    ➁ Exemple 2.2 : H1 : µ > 50

    t1−α = t0,99 = 2, 5 (ligne 23, colonne 0,02).

    IA =

    ]

    −∞ ; 50 + 2, 5 × 9, 6√24

    ]

    = ]−∞ ; 54, 9].

    ➡ Décision : x̄obs = 54, 5 appartient à l’inter-

    valle d’acceptation. On ne rejette pas H0.

    ➡ Dans les deux cas : « Résultat du test non

    significatif au niveau 1 % ».

    47

  • 5 ) Règle alternative basée sur Tn

    a) Intervalle d’acceptation :

    ➀ Pour H1 : µ 6= µ0

    IA =[

    −t1−α/2 ; t1−α/2]

    (4)

    ➁ Pour H1 : µ > µ0

    IA = ]−∞ ; t1−α] (5)

    ➂ Pour H1 : µ < µ0

    IA = [−t1−α ; ∞[ (6)

    b) Valeur observée de Tn :

    tobs =x̄obs − µ0

    s∗√n

    ➡ Si tobs appartient à l’IA, on conserve H0.

    Sinon on la rejette au risque d’erreur α.

    48

  • Exemples 2.1 et 2.2

    Valeur observée de Tn :

    tobs =54, 5 − 50

    9, 6√24

    = 2, 296.

    ➀ Exemple 2.1 : H1 : µ 6= 50

    IA =[

    −t1−α/2 ; t1−α/2]

    = [−2, 807 ; 2, 807].

    ➡ Décision : tobs = 2, 296 appartient à l’IA.

    On ne rejette pas H0.

    ➁ Exemple 2.2 : H1 : µ > 50.

    IA = ]−∞ ; t1−α] = ]−∞ ; 2, 5].

    ➡ Décision : tobs = 2, 296 appartient à l’IA.

    On ne rejette pas H0.

    49

  • III Test pour une population

    de loi inconnue et σ inconnu

    Contexte général :

    Ce qui change par rapport au test de

    Student :

    ➡ Loi de X inconnue (quelconque).

    Procédure du test :

    Ce qui change :

    ➡ Loi de X̄n sous H0.

    ➡ Formules des bornes.

    50

  • 1 ) Loi de X̄n sous H0

    On doit utiliser l’approximation normale.

    Pour n ≥ 30 : on sait que

    X̄n ∼approxt

    N

    (

    µ0 ;σ√n

    )

    .

    ➡ Pour les calculs : pour n grand, on peut

    transformer X̄n en

    Zn =X̄n − µ0

    S∗n√n

    .

    ➡ La statistique Zn suit approximativement la

    loi normale N (0 ; 1) .

    Pour n < 30 : ? ?

    51

  • 2 ) Intervalle d’acceptation pour X̄n

    ➡ Formules analogues aux formules (1), (2) et

    (3) du test de Student.

    ➡ Les quantiles « t » sont remplacés par les

    quantiles « z » de la loi N(0 ; 1) :

    Bilatéral : t1−α/2 remplacé par z1−α/2.

    Unilatéral : t1−α remplacé par z1−α.

    ➡ Règle de décision usuelle.

    3 ) Règle alternative basée sur Zn

    a) Intervalle d’acceptation :

    ➡ Formules (4), (5) et (6) transformées de la

    même façon.

    b) Valeur observée de Zn : zobs =x̄obs − µ0

    s∗√n

    ➡ Règle de décision usuelle.

    52

  • IV Niveau de signification (ou

    p-valeur)

    Probabilité, notée αobs, associée à la moyenne

    observée x̄obs.

    Exemple 3

    On teste H1 : µ > 13 unilatérale droite.

    On choisit de faire le test au niveau α = 5%.

    Echantillon :

    - n = 65 (n ≥ 30).- Valeurs observées des statistiques de test :

    x̄obs = 15, 2 et zobs = 2, 07.

    - Ecart-type estimé : s∗ = 8, 58.

    Test basé sur « l’approximation normale ».

    53

  • Détails du test pour l’exemple 3

    – Loi de X̄n sous H0 :

    comme n = 65 ≥ 30 et σ est inconnu,

    X̄n ∼approx.

    N

    (

    13 ;σ√n

    )

    et

    Zn =X̄n − 13

    S∗n√n

    ∼approx.

    N (0 ; 1) .

    – IA et RC au risque α = 5% pour X̄n :

    Région critique à droite du domaine.

    Valeur critique : 13 + 1, 645 × 8, 58√65

    = 14, 75.

    Décision : x̄obs = 15, 2 > 14, 75. On rejette

    H0 pour un risque d’erreur de 5%.

    ➡ Si l’on utilise Zn pour la décision :

    Valeur observée :

    zobs =15, 2 − 13

    8, 58√65

    = 2, 07.

    54

  • Réponse au test de niveau α = 5% :

    Pour Zn : on rejette H0 si zobs > 1, 645.

    Décision :

    zobs = 2, 07 > 1, 645 donc on rejette H0.

    ➡ Résultat du test significatif au niveau 5%.

    Valeur observée (x̄obs ou zobs) significative au

    niveau 5%.

    Test au niveau α = 1% :

    zobs = 2, 07 < 2, 325 donc on accepte H0.

    ➡ Valeur observée non significative au niveau

    1%.

    55

  • Résultat significatif pour quelles valeurs

    de α ?

    1.645

    0 zzobs = 2.07

    Rejet

    α = 5%

    2.325

    0 z2.07

    Rejet

    α = 1%

    (Sous H0, Zn suit approx. la loi N(0 ; 1)).

    56

  • ➡ Résultat significatif pour n’importe

    quel niveau α > 1,92% :

    0 z2.07

    Rejet

    1.92 %

    α

    1, 92% = P (Zn ≥ 2, 07) = P (X̄n ≥ 15, 2).

    1, 92% : probabilité définie par rapport aux

    valeurs de X̄n qui sont encore plus significatives

    que 15,2.

    1, 92% : niveau de signification ou p-valeur de la

    moyenne observée 15,2.

    57

  • 1 ) Définition et formules générales

    Définition : αobs est la probabilité, sous H0,

    d’observer une valeur de X̄n encore plus

    significative que la valeur effectivement observée.

    ➀ Pour H1 : µ > µ0

    Valeur plus significative : plus grande.

    αobs =définition

    PH0(X̄n ≥ x̄obs).

    xµ0 xobs

    αobs

    Exemple 3 : αobs =définition

    PH0(X̄n ≥ 15, 2).

    58

  • ➁ Pour H1 : µ < µ0

    Valeur plus significative : plus petite.

    αobs =définition

    PH0(X̄n ≤ x̄obs).

    xobs µ0x

    αobs

    59

  • ➂ Pour H1 : µ 6= µ0Valeurs les plus significatives : les plus extrêmes

    ( à droite et à gauche).

    xµ0xobs

    αobs 2 αobs 2

    Si x̄obs < µ0, on pose

    αobs2

    = PH0(

    X̄n ≤ x̄obs)

    ,

    Si x̄obs > µ0, on pose

    αobs2

    = PH0(

    X̄n ≥ x̄obs)

    .

    60

  • 2 ) Détermination numérique

    ➡ Table de la fonction de répartition de la « loi

    centrée réduite » nécessaire.

    Table disponible pour la loi N(0 ; 1).

    Table non disponible pour la loi de Student.

    ➡ On se limitera donc au cas où n ≥ 30.

    3 ) Interprétation de αobs

    On peut considérer αobs comme un risque

    d’erreur.

    61

  • Exemple 3 :

    Pour un risque nominal α fixé à l’avance :

    – Si

    αobs = 1, 92% < α,

    on peut rejeter H0 au risque α.

    ➡ αobs : risque d’erreur minimum à

    prendre pour rejeter H0.

    – Si

    αobs = 1, 92% ≥ α,on conserve H0.

    ➡ α : risque d’erreur maximal que l’on

    accepte de prendre pour rejeter H0.

    0 z2.07

    Rejet

    1.92 %

    α

    62

  • V Risques d’erreur et

    puissance d’un test

    - Deux états possibles pour H0 :

    vraie ou fausse.

    - Deux décisions possibles :

    rejeter H0 ou conserver H0.

    ➡ Pour chaque décision : risque d’erreur

    associé.

    63

  • Décision

    H0 Rejeter H0 Conserver H0

    erreur de 1re espèce bonne décision

    Vraie risque de 1re espèce

    α fixé

    bonne décision erreur de 2e espèce

    Fausse risque de 2e espèce

    noté β

    ➡ Risque α : probabilité de choisir H1 alors

    que H0 est vraie. Connu car fixé.

    ➡ Risque β : probabilité de choisir H0 alors

    que H1 est vraie. Inconnu en général.

    ➡ Puissance 1 − β : probabilité de choisir H1alors que H1 est vraie. Plus le risque β est

    petit, plus le test est puissant.

    64

  • On souhaite de faibles risques d’erreur.

    – Risques antagonistes :

    Si on diminue α, on élargit l’intervalle

    d’acceptation et donc β augmente.

    – Effet de la taille n :

    Pour α fixé, si on augmente n, β diminue.

    Pour faire un test :

    ➡ Fixer α en fonction des conséquences du rejet

    erroné de H0.

    ➡ Prendre n le plus grand possible pour avoir le

    test le plus puissant possible.

    65