40
1 Constats - terminologie - concepts de base Tests concernant une moyenne - variance connue / variance inconnue - courbe caractéristique - n = ? Tests concernant 2 moyennes - variances connues / courbes caractéristiques / n = ? - variances inconnues : égales / inégales - échantillons appariés (= dépendants) Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes ou plus 12.1 HMGB Utilisation de STATISTICA Autres tests - Test de Shapiro-Wilk: distribution normale - Test d’ajustement à une distribution: test du Khi-deux Tests d’hypothèses (ch. 11 HMGB ) Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques

Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

1

Constats - terminologie - concepts de base Tests concernant une moyenne

- variance connue / variance inconnue- courbe caractéristique - n = ?

Tests concernant 2 moyennes- variances connues / courbes caractéristiques / n = ?- variances inconnues : égales / inégales- échantillons appariés (= dépendants)

Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes ou plus 12.1 HMGB

Utilisation de STATISTICA

Autres tests- Test de Shapiro-Wilk: distribution normale - Test d’ajustement à une distribution: test du Khi-deux

Tests d’hypothèses (ch. 11 HMGB)

Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques

Page 2: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

2Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques

Problèmes statistiques description / visualisation : données Y (ch8)

estimation : paramètres distribution (ch9/10)

tests statistiques : prise de décision avec Y (ch11/12)

modélisation Y = f(X) f = fonction de transfert f =? (ch13)

processussystème Y variable de réponsevariables X

Variable Y - plusieurs cas

- mesure : variable continue : distribution normale N(μ, σ2) … autre

- classement 0 ou 1 : variable qualitative : distribution Bernoulli Ber(θ)

- comptage 0,1,2,.. : variable entière : distribution Poisson Poi (λ)

Variables X - catégoriques / continues / une ou plusieurs

Page 3: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

3

constats - terminologie – concepts de base

prendre des décisions à l’aide de données échantillonnalesprovenant d’observations passives ou de données expérimentales:- 2 appareils de mesure ont-ils la même justesse / précision?- traitement anti corrosion réduit – il la rouille de 50% après 4 ans?- un type de boulon peut-il être soumis à 100 000 cycles de

tension-compression sans se rompre par fatique? prendre une décision conjecture issue incertaine

formulation d’une hypothèse d’ordre statistique hypothèse statistique : affirmation concernant une population (distribution)

- elle est vraie jusqu’à preuve du contraire- on dispose d’un seul échantillon de taille n pour décider- RISQUES (probabilités ) de mauvaises décisions:

► rejeter une hypothèse vraie (erreur de type I , première espèce)► ne pas rejeter une hypothèse fausse (erreur de type II , deuxième espèce)

ne pas rejeter (réfuter) une hypothèse veut dire : les données del’échantillon n’indiquent pas clairement que l’on doive la rejeterc-s-d : statut quo est maintenu jusqu’à preuve du contraire

rejeter une hypothèse: les données témoigne fortement contre

Bernard CLÉMENT, PhDMTH2302 Probabilités et méthodes statistiques

Page 4: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

4

Hypothèse nulle H0: hypothèse à tester (mettre à l’épreuve)

Contre hypothèse H1 : seule affirmation sensée lorsque que H0 est fausse

H0 est toujours formulée en termes d’une valeur exacte du paramètre statistique à tester - exemple : H0 : μ = 100

H1 prévoit toujours un ensemble de valeurs : ex. H 1 : μ < 100 test statistique : est définie par une région critique (région de rejet)

d’une statistique W = f(Y1, Y2,…, Yn) qui conduit au rejet de H0

erreur de type I : rejeter l’hypothèse nulle H0 alors qu’elle est vraie

erreur de type II : ne pas rejeter H0 alors qu’elle fausse

seuil (niveau) de signification: la probabilité de commettre erreur type 1

Région critique : W > cRégion de non rejet de H0 c

Bernard CLÉMENT, PhD

terminologie – concepts de base

W

MTH2302 Probabilités et méthodes statistiques

Page 5: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

5

H0

VRAIE FAUSSE

REJETER H0 erreur type I pas d’erreur

NE PAS REJETER H0 pas d’erreur erreur type II

Risque de type I = P (erreur type I ) = α

Risque de type II = P (erreur type II ) = β

LA DÉCISION EST BASÉE SUR DES OBSERVATIONS Yi LE STATUT (VRAIE OU FAUSSE) DE H0 N’ EST JAMAIS CONNU

β EST UNE FONCTION COURBE D’ EFFICACITÉ

STATUTDÉCISION

Bernard CLÉMENT, PhD

constats - terminologie – concepts de base

MTH2302 Probabilités et méthodes statistiques

remarque ne jamais utiliser l’expression « accepter H0 »

mais toujours « ne pas rejeter H0 »

Page 6: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

6

LES DÉCISIONS STATISTIQUES

La statistique n’est pas une discipline qui permet de décider de la vérité ou de la fausseté des questions qu’elle examine :c’est une science du comportement rationnel qui fournit des règlesde conduite pratiques dans des situations d’incertitude.il y a 2 cas possibles:

cas 1 si une hypothèse particulière (dite nulle) n’est pas rejetée :sur la base de données disponibles vous pouvez la tenir vraiejusqu’à preuve du contraire.

cas 2 si une hypothèse particulière (dite nulle) est rejetée : sur la base de données disponibles vous ne pouvez pas latenir pour vraie.

Dans les deux cas, vous aurez raison en moyenne, 19 fois sur 20, (95%), ou n’importe quel niveau de confiance ou niveau derisque (= 1- niveau de confiance) que l’on se fixe d’avance.

En moyenne, vos conclusions seront donc bonnes, mais on nepourra jamais savoir avec certitude si une décision particulièreest bonne ou non.

Bernard CLÉMENT, PhDMTH2302 Probabilités et méthodes statistiques

Page 7: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

7

LISTE de TESTS STATISTIQUES

Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques

Cas A : moyenne μ = μ0 - variance σ2 connue

Cas B : moyenne μ = μ0 - variance σ2 inconnue

Cas C : égalité de 2 moyennes μ1 = μ2

cas C1 : variances connues cas C2 : variances inconnues égalescas C3 : variances inconnues inégalescas C4 : échantillons appariés

Cas D : variance σ2 = σ02

Cas E : égalité de 2 variances σ12 = σ2

2

Cas G : égalité k (k ≥ 3) moyennes μ1 = μ2 = … = μk chap. 12.1 HMGB

Cas F : proportion θ = θ0

autre cas : ajustement à des distributions

Page 8: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

8

Cas A : test moyenne μ - population gaussienne - variance σ2 connue Y ~ N (μ, σ2 )

-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26

U

-0.02

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

GAUS

S

si H0 est vraie μ = μ0

Z = ( Y – μ0 ) / (σ / √ n ) ~ N ( 0, 1)

μ0

H0 : μ = μ0 vs H1 : μ > μ0

N ( μ, σ2 ) Y1, Y2, …, Yn : échantillon de Y

Y = ∑ Yi / n : moyenne échantillonnale

Y

Y

Z

0

c

σ

Région critique :rejeter H 0 si Y > c c = ?

P ( rejeter H0 quand elle est vraie ) = α P ( Y > c ) = P ( Y - μ0 > c - μ0 )

( Y – μ0 ) ( c - μ0 ) σ/√ n σ/√ n

= P ( Z > z0 ) = α

z0 = ( c - μ0 ) / σ/√ n = z 1-α

c = μ0 + z1-α ( σ /√ n )

σ/√ n

σz =1

z1 – α

aussi noté z α

α

= P >

Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques

Page 9: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

9

Exemple 1 : un acier d’un alliage spécial a une tension de rupture Y (psi) dont la moyenne est de 25800 avec un écart type de 300. Un changement dans la composition de l’alliage devrait augmenter la tension moyenne sans changer l’écart type. Si le nouvel alliage ne produit aucun changement on voudrait pouvoir le dire avec une probabilité de 0.99. Par contre, si la tension moyenne est augmentéede 250, on veut que le risque de ne pas le détecter soit 0.10Questions(a) Définir l’hypothèse nulle , la contre hypothèse, le seuil du test, le risque de type II.(b) Poser les équations définissant les risques de type I et de type II; résoudre afin de trouver la taille de

l’échantillon à prélever et déterminer la région critique du test.(c) Un échantillon de 19 observations a donné une moyenne de 25970. Le nouvel alliage est-il supérieur ?

Solution (a)-(b)

Yμ0 = 25800

H0

μ1 = 25800 + 250 = 26050

H1 : μ > μ0 ( unilatérale )

c

Région critique

Y > c

σ/√n

α

P( erreur type I ) = P ( Y > c ) = α = 0.01P( erreur type II ) = P ( Y < c ) = β = 0.10

β

σ= 300

Bernard CLÉMENT, PhD

Cas A : test moyenne μ - population gaussienne - variance σ2 connue Y ~ N (μ, σ2 )

MTH2302 Probabilités et méthodes statistiques

Page 10: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

10

Solution (a)-(b)

Yμ0 = 25800

H0

μ1 = 25800 + 250 = 26050

H1

c

Région critique

X > c

σ/√n

α

P( erreur type I ) = P ( Y > c ) = α = 0.01P( erreur type II ) = P ( Y < c ) = β = 0.10

β

Solution (a)-(b) P ( Y > c | si μ = 25800) = α = 0.01 (1)P ( Y < c | si μ = 26050) = β = 0.10 (2)2 équations avec 2 inconnus : n et c

n = ( z0.99 + z0.90 )2 σ2 / (26050 – 25800)2 = (2.33 + 1.28)2 (300 / 250 )2 = 18.8 ≈ 19

c = 25800 + 2.33 * 300 / (19)0.5 = 25960.36

( c ) puisque Y = 25970 > c = 25960.36 on rejette H0

σ= 300

Bernard CLÉMENT, PhD

Cas A : test moyenne μ - population gaussienne - variance σ2 connue Y ~ N (μ, σ2 )

H0

y = 25970

Page 11: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

11

Courbe d’efficacité (caractéristique) du test

Définition: probabilité de ne pas rejeter H0 en fonction de la moyenne μ de la

populationβ ( μ ) = P ( Y < c = μ0 + z 1-α ( σ /√ n ) | μ )

= P [ ( Y - μ ) / σ /√ n < z 1-α + (μ0 - μ) / σ /√n ]

β ( μ ) = Φ (z 1-α + δ √ n ) ( * ) dépend de α, n, δoù δ = (μ0 - μ) / σ : paramètre de non centralité (écart par rapport à H0)

graphiques : page 12 avec α = 0.05, 0.01 / n = 1,2,3, … / -1 ≤ δ ≤ 3

Calcul de n : on veut que β (μ1) = β pour une valeur particulière μ1 de μ

n = ( z 1-α + z 1- β )2 σ2 / (μ1 – μ0)2

Exemple : page 9 avec α = 0.01 β = 0.10 σ = 300 μ0 = 25800 μ1 = 26050

Exemple : calcul de la fonction d’efficacité μ = 25800 26000 26050 26100

μ 25800 26000 26050 26100

β 0.99 0.28 0.10 0.02

avec la formule ( * ) ci haut

Bernard CLÉMENT, PhD

Cas A : test moyenne μ - population gaussienne - variance σ2 connue Y ~ N (μ, σ2 )

MTH2302 Probabilités et méthodes statistiques

Page 12: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

12

courbe d’efficacité (caractéristique) du test Z: unilatéral

Bernard CLÉMENT, PhD

Cas A : test moyenne μ - population gaussienne - variance σ2 connue Y ~ N (μ, σ2 )

ProbdenepasrejeterHo

ProbdenepasrejeterHo

Page 13: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

13

type de la CONTRE HYPOTHÈSE : unilatérale ou bilatérale

Exemple 1 : contre hypothèse H1 : μ > μ0 unilatéral droite (cas 1)

autres cas H1 : μ < μ0 unilatéral gauche (cas 2)

H1 : μ ≠ μ0 bilatéral (cas 3)

Formules

Cas 2 rejeter H0 si y < c = μ0 - z1-α ( σ /√ n ) note : - z1-α = zαn = ( z1-α + z1- β )2 σ2 / (μ1 – μ0) 2

β(μ) = Φ (z1-α - δ √ n ) δ = (μ0 - μ) / σ

Cas 3 rejeter H0 si y < c1 = μ0 - z1-α/2 ( σ /√ n ) ou si y > c2 = μ0 + z1-α/2 ( σ /√ n )

région critique bilatérale

équivalent à : rejeter H0 si │ y - μ0 │ / σ /√ n > z1-α/2

n = ( z1-α/2 + z 1- β )2 σ2 / (μ1 – μ0) 2

β(μ) = Φ (z 1-α/2 - δ √ n ) + Φ (z 1-α/2 - δ √ n ) - 1

Bernard CLÉMENT, PhD

Cas A : test moyenne μ - population gaussienne - variance σ2 connue Y ~ N (μ, σ2 )

Page 14: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

14

courbe d’efficacité (caractéristique) du test Z : bilatéral

Bernard CLÉMENT, PhD

Cas A : test moyenne μ - population gaussienne - variance σ2 connue Y ~ N (μ, σ2 )

ProbdenepasrejeterHo

ProbdenepasrejeterHo

Page 15: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

15

Cas B : test moyenne μ - population N ( μ, σ2) variance σ2 inconnue

Si σ2 est inconnue : on en fait l’estimation avec la variance échantillonnale s2

S2 = ∑ ( Y i – Y )2 / ( n - 1 ) et on utilise la statistique T de Student en place de Z

Les 2 cas sont résumés dans le tableau.

0: µµ =NH

2σ0

0yZ

σ−

=

0: µµ ≠AH

0: µµ <AH0: µµ >AH

210 α−> zZ

α−−< 10 zZ

α−> 10 zZ

0: µµ =NH

2σ0

0yTs n

µ−=

0: µµ ≠AH

0: µµ <AH

0: µµ >AH

21,10 α−−> ntT

α−−−< 1,10 ntT

α−−> 1,10 ntT

Remarque : le test est employé pour le cas de différences appariées

(2 échantillons dépendants) avec 1 2i i iy y y= −

Hypothèse nulleHN (H0)

Statistiquepour le test

Contre hypothèse(alternative) HA (H1)

Critère de rejet

connue

inconnue

Bernard CLÉMENT, PhD

Cas

A

Cas

B

Page 16: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

16

courbe d’efficacité (caractéristique) du test T : unilatéral

Bernard CLÉMENT, PhD

Cas B : test moyenne μ - population N ( μ, σ2) variance σ2 inconnue

ProbdenepasrejeterHo

ProbdenepasrejeterHo

Page 17: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

17

courbe d’efficacité (caractéristique) du test T : bilatéral

Bernard CLÉMENT, PhD

Cas B : test moyenne μ - population N ( μ, σ2) variance σ2 inconnue

Page 18: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

18

Exemple 2 : étiquette sur un contenant 4 litres de peinture ‘’couvre

325 pi. ca’’ en moyenne dans des conditions normales d’utilisation.

Vous testez 6 contenants - données : 305, 285, 310, 300, 280, 290

( a ) Testez H0 : μ = 325 vs H1: μ < 325 au seuil α = 0,05

( b ) calculer le nombre d’observations nécessaire pour détecter

un écart de moyenne de 10 pi. car. avec un risque de type 2 de 0,10

Solution : ( a ) n = 6 y = 295 s = 11,83 ,

T5 = ( 295 – 325 ) / 11.83 √ 6 = - 6.21 < - t 5 , 0.95 = - 2,015

H0 est rejetée

( b ) δ = 10 / 11,83 = 0,84 noté d (page12)

on obtient une valeur de n = 15

Bernard CLÉMENT, PhD

Cas B : test moyenne μ - population N ( μ, σ2) variance σ2 inconnue

MTH2302 Probabilités et méthodes statistiques

Page 19: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

19

-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26

U

-0.02

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

GAUS

S

-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26

U

-0.02

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

GAUS

S

Y11, Y12, … , Y1n1

Y1 ~ N ( μ1, σ12) Y2 ~ N ( μ2, σ2

2)

σ1 σ2

μ2

Y21, Y22, … , Y2n2

Cas C : test d’égalité de 2 moyennes

échantillonsindépendants

Y1 = ∑ Y1i / n1Y2 = ∑ Y2i / n2moyennes

H0 : μ1 = μ2

cas C1 : variances connues

cas C2 : variances inconnues égales

cas C3 : variances inconnues inégales

cas C4 : échantillons appariés

(échantillons dépendants)

Tableau page suivante

Bernard CLÉMENT, PhD

μ1

MTH2302 Probabilités et méthodes statistiques

XX= groupe 1

X: facteur input X= groupe 2

Page 20: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

20

Cas C : tests d’égalité de 2 moyennes

0: 21 =− µµNH

22

21 ,σσ

1 20 2 2

1 2

1 2

( )y yZ

n nσ σ

−=

+

0: 21 ≠− µµAH

0: 21 <− µµAH

0: 21 >− µµAH

210 α−> zZ

α−−< 10 zZ

α−> 10 zZ

0: 21 =− µµNH

222

21 σσσ ==

1 20

1 2

( )1 1

P

y yTS

n n

−=

+0: 21 ≠− µµAH

0: 21 <− µµAH

0: 21 >− µµAH

21,2210 α−−+> nntT

α−−+−< 1,2210 nntT

α−−+> 1,2210 nntT

2)1()1(

21

222

2112

−+−+−

=nn

SnSnS p

0: 21 =− µµNH

22

21 σσ ≠

1 20 2 2

1 2

1 2

( )y yTS Sn n

−=

+

0: 21 ≠− µµAH

0: 21 <− µµAH

0: 21 >− µµAH

21,0 αν −> tT

αν −−< 1,0 tT

αν −> 1,0 tT

2221

21 , nsbnsa ==

)1()1()(

22

12

2

−+−

+=

nbnabaν

Hypothèse nulle HN Statistique pour le test Contre hypothèse Critère de rejet

connues

σ 2 inconnue

inconnuesinégales

Bernard CLÉMENT, PhD

C1

C2

C3

Page 21: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

21

Exemple 3 : calculer un intervalle de confiance avec coefficient de confiance 0.95pour la différence de vie ( heures ) moyenne de deux types 1 et 2

d’ampoules électriques à l’aide des informations suivantes :échantillon 1 : n1 = 16 σ1 = 128 Y1= 1050échantillon 2 : n2 = 9 σ2 = 81 Y2 = 970

Intervalle de confiance avec coefficient de confiance 0.95

μ1 – μ2 : 1050 – 970 ± 1,96 ( 1282 / 16 + 812 / 9 )0.5 = 80 ± 82.1 = ( - 2.1, 162.9 )

Question : les ampoules de type 1 durent - elles (en moyenne) plus longtemps que les ampoules de type 2 ?

solution avec un test d’hypothèse : bilatéral - variances connues - alpha = 0.05

Z = ( 1050 – 970 ) / ( 1282 / 16 + 812 / 9 )0.5 = 80 / 41,87 = 1,91 < 1,96 = z0,975

conclusion: la durée moyenne ampoules type 1 n’est pas différente

de la durée moyenne des ampoules de type 2

Bernard CLÉMENT, PhD

Cas C1 : tests d’égalité de 2 moyennes - variances connues

MTH2302 Probabilités et méthodes statistiques

Page 22: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

22

-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26

U

-0.02

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

GAUS

S

Résultat ( Y1 – Y2 ) - (μ1 - μ2)

Sp√ 1/ n1 + 1 / n2

-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26

U

-0.02

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

GAUS

S

Y11, Y12, … , Y1n1

Y1 ~ N ( μ1, σ2 ) Y2 ~ N ( μ2, σ2 )

σσ

μ1 μ2

Y21, Y22, … , Y2n2

Cas C2 : différence entre 2 moyennes avec variances inconnues égales

échantillons indépendants

Y1 = ∑ Y1i / n1 Y2 = ∑ Y 2i / n2moyennes

S12 = ∑ ( Y1i – Y1 ) 2 / ( n1 - 1 ) S2

2 = ∑ ( Y2i – Y2 ) 2 / ( n2 – 1) variances

Sp2 = [ ( n1 -1 ) S12 + ( n2 – 1) S22 ] / ( n1 + n2 - 2) ‘ pooled ’

= T ~ Student avec n1 + n2 - 2 ddl

Bernard CLÉMENT, PhD

X

X = groupe1

X =groupe2

Page 23: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

23

Exemple 4 : comparaison de l’épaisseur : heure 1 VS heure 2

Heure 1 : 10.0-11.2- 8.1- 8.3- 10.8- 10.3- 9.5- 8.2- 10.0- 10.1- 9.2- 8.4- 6.4- 8.3- 8.2- 7.0- 10.8- 7.5 7.4- 9.5- 9.7- 9.4-8.6-10.4-8.3-8.0-8.7-9.6-8.9-8.9

Heure 2 : 12.4-10.9- 10.4- 10.3- 10.6- 9.6- 9.7- 9.6- 9.8- 10.3- 7.7- 12.7- 10.2- 10.2- 8.6- 8.4- 9.5- 7.8 11.5- 10.0- 10.0- 8.4-10.0-11.5-11.4-11.7-10.7-10.8-9.4-10.7

Solution : avec Statistica / Statistiques élémentaires / test t échantillons indépendants

épaisseur

No

of o

bs

HEURE: x

5 6 7 8 9 10 11 12 13 140

2

4

6

8

10

12

HEURE: y

5 6 7 8 9 10 11 12 13 14

Test T avec variances

inconnues et égales

sp = 1,20

T = - 3,77 ddl = 58p- value = 0,0004

égalité moyennes rejetée

groupe n moy écart type

1 30 8,99 1,18

2 30 10,16 1,22

Bernard CLÉMENT, PhDMTH2302 Probabilités et méthodes statistiques

Page 24: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

24

Cas C4 : Test d’égalité de 2 moyennes : échantillons appariés (pairés)

Contexte : lorsque les 2 séries de mesures proviennent des mêmes unités expérimentales.Par exemple, lorsque que l’on fait une comparaison AVANT-APRÈS :

groupe 1 : y11, y12, …, y1n mesures avant sur n unités expérimentalesgroupe 2 : y21, y22, …, y2n mesures après sur les mêmes unités expérimentales

l’indépendance des 2 échantillons n’est pas vérifiée car les mêmes unités expérimentalessont utilisées pour faire la comparaison. Le test est basé sur les différences :

Di = y1i - y2i i = 1, 2, …, nLe problème est ramené à un test de la nullité d’une moyenne avec variance inconnue.Remarque: il est important de reconnaître le cas d’échantillons appariés (= dépendants)

afin d’exécuter le bon test : échantillons indépendants ou échantillons dépendants?

Exemple 5 : 15 composants électroniques sont testés à 2 niveaux de température : N normale (20 deg C) et E élevée (100 deg C)

Une mesure de qualité importante Y fut mesurée à ces 2 niveaux de températureComposant : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

N (normale) : 7.6 - 10.2 - 9.5 - 1.3 - 3.0 - 6.3 - 5.3 - 6.2 - 2.2 - 4.8 - 11.3 - 12.1 - 6.9 - 7.6 - 8.4

E (élevée) : 7.3 - 9.1 - 8.4 - 1.5 - 2.7 - 5.8 - 4.9 - 5.3 - 2.0 - 4.2 - 11.0 - 11.0 - 6.1 - 6.7 - 7.5

D = YN – YE : 0.3 1.1 1.1 -0.2 0.3 0.5 0.4 0.9 0.2 0.6 0.3 1.1 0.8 0.9 0.9

test : D = 0.61 sD = 0.39 T = D / (s D/√ 15) = 6.02 > t14, 0.995 = 2.977

On rejette l’égalité des 2 moyennes avec risque de type 1 de 0.001

Bernard CLÉMENT, PhD

Page 25: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

25

Cas D : test sur une variance H0 : σ2 = σ02

Exemple 6 : n = 75 données de poids donne s2 = ( 0,101 )2 = 0,010

test de H0 : σ2 = 0,015 vs H1 : σ2 < 0,015

W = 74 ( 0,01) / 0,015 = 50,3

p-value = P ( W ≤ 50,3 ) = 0,016

on rejette H0 si on utilise un risque de type I de 0,05

Statistique du test rejet de H0 au seuil α

contre hypothèse σ2 < σ02 σ2 > σ0

2 σ2 ≠ σ02

W = ( n – 1 ) s2 / σ02 W < χ2 n – 1, α W < χ2 n – 1, 1- α W < χ2 n – 1, α / 2 ou W < χ2 n – 1, 2- α/ 2

Bernard CLÉMENT, PhD

MTH2302 Probabilités et méthodes statistiques

Page 26: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

26

Courbes

d’efficacité du

test Khi-deux

---------------------

Application :

Calcul de n

Bernard CLÉMENT, PhD

Page 27: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

27

-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26

U

-0.02

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

GAUS

S

Résultat s12 / s2

2 suit distribution Fisher Fn1-1 , n2-1

-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26

U

-0.02

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

GAUS

S

Y11, Y12, … , Y1n1

Y1 ~ N ( μ1, σ12 ) Y2 ~ N ( μ2, σ1

2 )

σ1 σ2

μ1 μ2

Y21, Y22, … , Y2n2échantillons indépendants

Y1 = ∑ Y1i / n1 Y2 = ∑ Y 2i / n2moyennes

S12 = ∑ ( Y1i – Y1 ) 2 / ( n1 - 1 ) S2

2 = ∑ ( Y2i – Y2 ) 2 / ( n2 – 1) variances

Bernard CLÉMENT, PhD

X

X = 1 X = 2

Cas E : test d’égalité de 2 variances H0 : σ12 = σ2

2

Exemple 7 : n1 = 16 s1 = 1,93 et n2 = 10 s2 = 1,00test bilatéral F = 1,932 / 1,00 2 = 3,72loi de Fisher avec (15, 9) ddl F15 ,9, 0,975 = 3,77H0 non rejetée car 3,72 inférieur à 3,77

TEST BILATÉRAL H0 vs H1 : σ12 ≠ σ2

2 s1 = max (s1, s2) rejeter H0 si s1

2 / s22 ≥ Fn1-1 , n2-1, 1 – (α/2)

autres cas:

tests

Unilatéral

Voir

formulaire

Page 28: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

28

Bernard CLÉMENT, PhD

Cas F : proportion p = p0

Cas F : calcul de β et n - test unilatéral Cas F : calcul de β et n - test bilatéral

Page 29: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

29

Bernard CLÉMENT, PhD

Exemple 8 : test sur une proportion p

Page 30: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

30

Bernard CLÉMENT, PhD

Tests de moyennes et variances avec STATISTICA

Test T pairé - 2 échantillons dépendants

Test 2 moyennes - échantillons indépendants

Test plusieurs moyennes (2 et plus)

One-way ANOVA

classification simplek groupes k ≥ 3

Test T - 1 moyenne

Page 31: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

31Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques

Tests de moyennes et variances avec STATISTICAExemple 2

1new

2Y

123456

exemple 2 305test 285une 310

moyenne 300280290

Hypothèse H0 : μ = 325

rejetée car p-value = 0,001581 ≤ 0,05

Mean

Std.Dv.

N

Std.Err.

Reference Constant

t-value

df

p

Y

295,0 11,8 6 4,83 325 - 6,21 5 0,001581

Page 32: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

32Bernard CLÉMENT, PhD

MTH2302 Probabilités et méthodes statistiques

Tests de moyennes et variances avec STATISTICA

Exemple 4 : comparaison de l’épaisseur : heure 1 VS heure 2Heure 1 : 10.0-11.2- 8.1- 8.3- 10.8- 10.3- 9.5- 8.2- 10.0- 10.1- 9.2- 8.4- 6.4- 8.3- 8.2- 7.0- 10.8- 7.5

7.4- 9.5- 9.7- 9.4-8.6-10.4-8.3-8.0-8.7-9.6-8.9-8.9

Heure 2 : 12.4-10.9- 10.4- 10.3- 10.6- 9.6- 9.7- 9.6- 9.8- 10.3- 7.7- 12.7- 10.2- 10.2- 8.6- 8.4- 9.5- 7.8 11.5- 10.0- 10.0- 8.4-10.0-11.5-11.4-11.7-10.7-10.8-9.4-10.7

1new

2Y

3heure

123456789

10

exemple 4 10,0 1test 11,2 1

2 8,1 1moyennes 8,3 1

10,8 1. .

8,9 112,4 2

. .10,7 2

Fichier Statistica

Page 33: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

33Bernard CLÉMENT, PhD

Tests de moyennes et variances avec STATISTICA

Conclusion

moyennes inégales et variances égales

T-tests; Grouping: heure Group 1: 1 Group 2: 2 Mean

1

Mean 2

t-value

df

p

N1

N2

8,99 10,16 -3,77 58 0,00038 30 30

T-tests; Grouping: heure Group 1: 1 Group 2: 2

Std.Dev 1

Std.Dev 2

F-ratio Variances

p Variances

1,182 1,22 1,065 0,866832

Page 34: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

34

Bernard CLÉMENT, PhD

Tests de moyennes et variances avec STATISTICA

MTH2302 Probabilités et méthodes statistiques

Test de moyennes avec variances inégales

Page 35: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

35

Bernard CLÉMENT, PhD

Exemple 9 : n = 10

Y : 4050 - 4185 - 4080 - 4100 - 4160 - 4230 - 4350 - 4290 - 4320 - 4710

W calculée = 0.85 et P ( W ≤ 0.85) = 0.06 = p-value

on ne rejette pas la loi normale pour ces données.

Page 36: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

36

Cas G : test d’ajustement à une loi normale - procédure de Shapiro-Wilk

BUT : vérifier si une série de données x1 , x2 , x3 , …….. xn provient d’unepopulation distribué selon une loi gaussienne.

H0 : Y ~ N ( μ, σ2 ) vs H1 : Y ~ autre distribution

Plusieurs tests : Khi2, Kolmogorov-Smirnov (D ), Lilifors, Shapiro-Wilk (W)Statistique W du test de Shapiro-Wilk :

W = [ ∑ an, i y( i ) ] 2 / [ ∑ ( yi - y ) ] 2a n, i coefficients spéciaux ( table non disponible dans le manuel du cours ).La statistique W mesure la corrélation entre la série ordonnée des observationset les quantiles théoriques d’une loi N( 0,1 ). 0.70 ≤ W ≤ 1

Décision : rejeter H0 si W est ‘’petite’’

Mise en oeuvre avec le logiciel Statistica : p-value = P ( W < Wcalculée )

Si le p-value est petite (disons inférieure à 0.05 ) on rejette loi normale

comme modèle acceptable pour les observations.

Exemple 9 : n = 10

Y : 4050 - 4185 - 4080 - 4100 - 4160 - 4230 - 4350 - 4290 - 4320 - 4710

W calculée = 0.85 et P ( W ≤ 0.85) = 0.06 = p-value

on ne rejette pas la loi normale pour ces données.

Bernard CLÉMENT, PhD

Page 37: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

37

Exemple 9 : graphique quantile – quantile W = 0.85 et P (W ≤ 0.85) = 0.06 = p-value

Bernard CLÉMENT, PhD

Quantile-Quantile Plot of EX3_Y ( 6v*60c)Distribution: Normal

EX3_Y = 4247,5+187,1784*x

-2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0

Theoretical Quantile

0,05 0,10 0,25 0,50 0,75 0,90 0,95

4000

4100

4200

4300

4400

4500

4600

4700

4800

Obs

erve

d V

alue

Histogram: EX3_YK-S d=.19683, p> .20; Lilliefors p> .20

Shapiro-Wilk W=.85334, p=.06364

3900 4000 4100 4200 4300 4400 4500 4600 4700 4800

X <= Category Boundary

0

1

2

3

No. of obs.

Test Shapiro-Wilk

W = 0,85 p = 0,06

on ne rejette pas la distribution normale pour ces données

Page 38: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

38Bernard CLÉMENT, PhD

Cas H : test d’ajustement à une loi de probabilité - test du Khi-deux

H0 : X suit loi fx (x; θ) exemple: X suit loi Weibull (θ1= b, θ2= c)

H1 : X ne suit pas loi fX(x; θ)

Statistique

pour le test ∑=

−=

k

i i

ii

een

D1

22 )(données : tableau d’effectifs n i

n i : effectifs observése i : effectifs calculés sous H0

Test : H0 rejetée si D2 > χ2ν, 1-α ν = k – p - 1 k = nombre classes

p = nombre paramètres estimés de la distribution

Condition d’application : e i > 5 α = seuil (niveau) du test)

Exemple 10 : données : n = 100 présentées en ordre croissant63.12 65.90 67.99 68.68 72.51 72.89 73.16 76.67 76.82 77.22 79.80 80.16 82.09 83.13 84.03

84.19 85.56 85.60 85.68 86.06 86.08 86.81 86.87 88.47 89.89 90.23 90.48 90.64 91.39 91.80

92.53 92.93 93.84 93.90 94.02 94.06 94.26 94.60 95.24 95.97 96.71 97.39 97.96 98.50 99.72

99.88 99.89 100.30 100.46 100.51 101.03 102.00 102.37 103.20 103.64 103.96 104.12 104.35 105.22 105.34

105.49 106.99 107.08 107.20 107.72 108.57 108.65 108.85 109.17 109.54 109.60 109.78 110.55 110.75 111.23

111.45 112.41 113.19 113.45 113.54 115.45 115.46 116.21 116.41 118.24 118.27 118.72 119.05 119.76 121.28

121.37 121.47 124.33 126.32 126.96 128.28 128.44 134.69 136.77 138.57

H0 : X suit une loi N(μ, σ2)

Page 39: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

39

Bernard CLÉMENT, PhD

Cas H : test d’ajustement à une loi de probabilité - test du Khi-deux

Histogram ( 11v*100c)X = 100*7,5448*normal(x; 100,7308; 16,3745)

4%

6%

9%

13%

18%

15%

17%

10%

5%

3%

63,118570,6633

78,208185,7530

93,2978100,8426

108,3875115,9323

123,4771131,0220

138,5668

X

0

2

4

6

8

10

12

14

16

18

20

No

of o

bs

4%

6%

9%

13%

18%

15%

17%

10%

5%

3%

X: SW-W = 0.9938; p = 0.9292; N = 100; Mean = 100.7308; StdDv = 16.3745; Max = 138.5668; Min = 63.1185

Quantile-Quantile Plot of X ( 11v*100c)Distribution: Normal

X = 100,7308+16,5245*x

-3 -2 -1 0 1 2 3

Theoretical Quantile

0,01 0,05 0,25 0,50 0,75 0,90 0,99

60

70

80

90

100

110

120

130

140

150

Obs

erve

d Va

lue

Normal Probability Plot of X ( 11v*100c)

60 70 80 90 100 110 120 130 140 150

Observed Value

-3

-2

-1

0

1

2

3

Expe

cted

Nor

mal

Val

ue

Page 40: Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

40

Bernard CLÉMENT, PhD

Cas H : test d’ajustement à une loi de probabilité - test du Khi-deux

<= 64.5 1 1 1.00 1.00 1.35 1.35 1.35 1.3 -0.35

74.0 6 7 6.00 7.00 3.78 5.13 3.78 5.1 2.22

83.5 7 14 7.00 14.00 9.50 14.63 9.50 14.6 -2.50

93.0 18 32 18.00 32.00 17.21 31.84 17.21 31.8 0.79

102.5 21 53 21.00 53.00 22.46 54.30 22.46 54.3 -1.46

112.0 23 76 23.00 76.00 21.13 75.43 21.13 75.4 1.87

121.5 16 92 16.00 92.00 14.33 89.77 14.33 89.8 1.67

131.0 5 97 5.00 97.00 7.01 96.77 7.01 96.8 -2.01

140.5 3 100 3.00 100.00 2.47 99.24 2.47 99.2 0.53

infinity 0 100 0.00 100.00 0.76 100.00 0.76 100.0 -0.76

Procédure : « distribution fitting » de STATISTICA

Variable: X Distribution: Normal

Chi-Square = 2.31985 = D2 df = 4 (adjusted) p = 0.67716

loi normale n’est pas rejetée

Intervalle ni cum ni ni (%) cum ni (%) ei cum ei ei (%) cum ei (%) ni - ei

ni : observés

ei : attendus

sous H0