40
UE71 2013-2014 Tests sur un et deux échantillons 1

Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

UE71 2013-2014

Tests sur un et deux échantillons

1

Page 2: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Plan • Vocabulaire

• Comment construire un test

• Test de comparaison à une moyenne

• Test de comparaison de moyennes d’échantillons appariés

• Tests de comparaison de deux moyennes d’échantillons indépendants (avec variances égales et variances inégales

• Tests de comparaison des variances

2

Page 3: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

3

Attention : HO et H1 ne sont pas symétriques ! HO est l’hypothèse de base qu’on ne quitte que si les données sont, de manière criante (p-value faible), trop improbables sous HO Si ces données expérimentales sont compatibles » (pas « trop » improbables) avec H0 ) alors on reste sous H0, même si ces données sont « compatibles » (probables) avec H1.

Exemple : H0 : innocence de l’accusé H1 : culpabilité de l’accusé Données : l’accusé n’a pas d’alibi on reste sous H0

Page 4: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Les deux risques: le alpha qu’on choisit obligatoirement a priori, le béta qui

en découle

4

Page 5: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Vocabulaire: 1) Un test bilatéral s'applique quand on cherche une différence entre deux estimations, ou entre une estimation et une valeur donnée sans se préoccuper du signe ou du sens de la différence. Dans ce cas, la zone de rejet de l'hypothèse principale se fait de part et d'autre de la distribution de référence. 2) Un test unilatéral s'applique quand on cherche à savoir si une estimation est supérieure (ou inférieure) à une autre ou à une valeur donnée. La zone de rejet de l'hypothèse principale est située d'un seul côté de la distribution de probabilité de référence. 3) Certains test comme l'analyse de la variance ou le test du Khi2 sont pratiquement toujours unilatéraux.

5

Page 6: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

6

Page 7: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

7

²

Page 8: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Test de comparaison d’une moyenne empirique à une moyenne théorique, la population étant supposée normale et de variance connue (peu fréquent en pratique!) La statistique du test Z suit une loi normale standard.

Le test est bilatéral ou unilatéral

8

Page 9: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Exercice:

9

Page 10: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

T-test pour la moyenne μ0 d’une population (variance inconnue)

On suppose l’échantillon de taille n issu d’une population normale. S étant l’écart-type corrigé et la moyenne empirique la statistique de test est:

Le test est bilatéral ou unilatéral.

à comparer avec un Student à n-1 ddl .rappelons que

10

Page 11: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Solution sans graphe, non recommandée pour des praticiens comme vous!

Le chercheur veut tester si les dépenses moyennes hebdomadaires sont égales à 150 FS. Dans ce cas il s'agit d'un test bilatéral: H0: m = 150 H1: m différent de 150 La valeur critique pour un risque de 5% est de 2.093 pour un dll= n-1= 19 on ne rejette pas m=150

Exercice: Un chercheur veut étudier le comportement des dépenses

moyennes hebdomadaires des étudiantes de l'Université de Genève. Pour

cela, il sélectionne un échantillon aléatoire de 20 étudiants et obtient les

réponses suivantes:

11

Page 12: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

12

Page 13: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

13

Page 14: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Deux échantillons appariés

14

Page 15: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

T-test pour comparer les moyennes μ1 et μ2 de deux populations normales appariées. On ne fait pas d’hypothèses sur les variances des populations Les n observations (xi,yi)sont obtenues par paires. Les moyennes empiriques des échantillons sont et Les di = (xi - yi) sont les différences par paires. La statistique de test est:

avec la variance corrigée des différences:

à comparer avec un Student de n – 1 ddl. Le test peut être bilatéral ou

unilatéral

15

Page 16: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Danger : nous calculons sans faire de graphe!!!

16

Page 17: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Comment résumer les données brutes de cet exemple par un graphe en perdant le moins d’informations? On doit s’efforcer d’abord de produire un graphe au plus près des données de départ

17

Page 18: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Ce graphe permet de voir la variation globale et individuelle entre les deux versions!

18

Page 19: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Etude graphique de la variable différence et test : la normalité est rejetée à cause du patient 9

Il est donc discutable d’utiliser ici le test de Student.

19

Page 20: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Comparaison de deux échantillons indépendants

20

Page 21: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

T-test pour comparer les moyennes de deux populations normales où les variances sont inconnues mais égales. Les deux échantillons sont normaux, indépendants et de variances empiriques

corrigées et . La statistique t de test est:

à comparer avec un Student de n1 + n2 – 2 ddl. Le test peut être bilatéral ou unilatéral.

avec

21

Page 22: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Exemple: Un chercheur veut comparer le comportement des dépenses moyennes hebdomadaires des étudiantes de l'Université de Genève et de Lausanne. Pour cela, il sélectionne deux échantillons aléatoires de 20 et 30 étudiants respectivement et obtient les réponses suivantes:

22

Page 23: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Les deux échantillons doivent être normaux et de variances à peu près égales

23

Page 24: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

On sélectionne un seuil de signification, par exemple, 5%. On a supposé ici que les variances sont égales. Le test étant bilatéral, vous devez diviser ce seuil par deux, c'est-à dire 2.5%. Le nombre de degrés de liberté est ng + nl - 2 = 20 + 30 – 2 = 48 La valeur critique est donc 2.02 à comparer avec 0.970 On ne rejette pas l'hypothèse nulle. Les dépenses hebdomadaires ne sont pas différentes.

24

L’hypothèse nulle et l’alternative sont (g pour Genève et l pour Lausanne): H0: mg= ml ou mg – ml = 0

H1: mg ≠ ml ou mg – ml ≠ 0

Page 25: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Exercice: Test unilatéral: Le chercheur veut tester maintenant si les dépenses moyennes des étudiants de Lausanne sont inférieures à celle des étudiants de Genève.

• L'hypothèse nulle et l'alternative sont les suivantes: H0: mg = ml ou mg - ml = 0 contre H1: mg > ml ou mg - ml > 0

• Il s'agit d'un test unilatéral

• La statistique t est la même que dans le cas bilatéral • La valeur critique: La valeur critique est différente de celle du cas bilatéral. Utiliser la

table de valeurs critiques pour la statistique t en prenant en considération qu'il s'agit d'un test unilatéral. La valeur critique est 1.68.

• Décision: Comparer la valeur observée, 0.970, à la valeur critique, 1.684, et prendre la décision:

Comme la valeur calculée est inférieure à la valeur critique, on reste sur l'hypothèse

nulle. Ce qui signifie qu’on ne peut pas dire que la moyenne de dépenses hebdomadaires des

étudiants de Lausanne soit inférieure à celle des étudiants de Genève.

25

Page 26: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

T-test pour comparer les moyennes et de deux populations normales de variances inconnues et non supposées égales (problème de Behrens-Fisher). Les échantillons de taille n1 et n2 sont indépendants avec des écarts-types corrigés s1 et s2 . La statistique de test t n’utilise pas la variance commune pondérée:

qui suit approximativement (approximation dite de Satterthwaite) une loi de

Student de dll égal à la partie entière de :

Ou, dans une version plus conservatrice, une Student avec un dll approximé par

min(n1 – 1, n2 - 1)

Le test peut être bilatéral ou unilatéral. Si on n’est pas sûr de la normalité, alors n1

et n2 doivent être supérieurs à 30. 26

Page 27: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Exercice 1: deux échantillons de taille 4 sont comparés. Les moyennes

empiriques sont 3166,00 et 2240,40 et les variances estimées 6328,27

et 22661,3.

Réponse: Nous ne supposerons pas (les tailles étant trop faibles) que les

variances sont égales. Nous sommes donc en plein dans le problème de

Behren-Fisher…

Le t est calculé sans utiliser de variance commune pondérée

T= 5.72

ddl= 9 (après arrondi de Satterthwaite)

D’où la valeur critique du Student bilatéral (au risque de 5%) est 2.26.

La différence de moyennes entre les deux échantillons est significative.

27

Page 28: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Exercice 2: deux médicaments A et B contre le mal de tête sont comparés

sur la base du temps d’absorption par le corps.

Pour A, la moyenne empirique de l’échantillon 21,8 mn s1= 8,7 mn n1= 12

Pour B, la moyenne empirique de l’échantillon 18,9 mn s2=7,5 mn n2=12

Réponse: Nous ne supposons pas l’égalité des variances (donc Behrens-

Fisher). Donc T n’est pas calculé avec la variance pondérée commune:

T= 0,875

Nous prendrons ici la version conservatrice (qui reste plus souvent qu’il ne

faudrait sur H0) , où les ddl sont plus faciles à calculer:

ddl= min(n1 -1; n2 -1)= 11

Le degré de signification du test bilatéral est supérieur à 0,25

On ne rejette pas H0 (égalité des moyennes)

28

Page 29: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Un test de comparaison des variances (parmi d’autres)….

29

Page 30: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Test de comparaison des variances de deux populations normales

30

Page 31: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Exercice:

31

Page 32: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Exemple: Un chercheur veut comparer les dispersions des dépenses hebdomadaires des étudiants des Universités de Genève et Lausanne. Pour cela il sélectionne deux échantillons aléatoires de 20 et 30 étudiants respectivement et obtient les réponses suivantes:

32

Page 33: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

• H0: s2 Lausanne = s2 Genève H1: s2 Lausanne > s2 Genève

où s2 représente la vraie variance des dépenses hebdomadaires des

étudiants. • F= s2 Lausanne / s2 Genève = 1.213

Au risque 5% , la valeur critique correspondant à 29 et 19 est 2.077 supérieure

à 1.213

Comme la valeur critique est à l'intérieur de la région d'acceptation, on ne rejette pas l'hypothèse nulle. Ce qui signifie que les variances ne peuvent pas être considérées comme différentes.

Note 1: Il faut supposer que les échantillons sont issus de populations

normales. Note 2: Formuler l'hypothèse alternative de telle manière que la valeur calculée

de la statistique du test soit toujours supérieure à l'unité.

33

Page 34: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

34

Page 35: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Exercice: Comparaison de variances (petits échantillons) Pour étudier l'action de la digitonine sur des embryons de Rana platyrrhina

on prépare deux séries d‘échantillons : une série témoin et une série traitée. Comparons les variances des deux échantillons

35

Le rapport des variances vaut 3.65. On effectue un test bilatéral de comparaison des variances au seuil de 95% Le seuil F au risque 5% en test bilatéral est donc à chercher dans la table de 2,5%

soit 4,99 On ne rejette pas l’hypothèse que les variances ne sont pas différentes

Page 36: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

36

Page 37: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

37

Page 38: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

Pour Information seulement!

38

Page 39: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

39

Page 40: Tests sur un échantillonanouarbenmalek.free.fr/maths/UE71 2013-2014/UE71 - 2013-2014 - P… · Deux échantillons appariés 14 . T-test pour comparer les moyennes μ 1 et μ 2 de

40