Pr. A. SOULAYMANICours Statistique 20051 TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Preview:

Citation preview

Pr. A. SOULAYMANI Cours Statistique 2005 1

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

TESTS RELATIFS AUX

CARACTERES QUANTITATIFS

Pr. A. SOULAYMANI Cours Statistique 2005 2

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

I- Position du Problème

Pr. A. SOULAYMANI Cours Statistique 2005 3

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Généralités

Population

Supposons une population infiniment grande pour laquelle la moyenne d’un caractère quantitatif X est = 0. On dispose d’un ou de plusieurs

échantillons de moyennes m1, m2,….mi… ;mk.

m1 m2mkmi

2Les observations mi sont elles compatibles avec l’hypothèse que dans la population ?

Pr. A. SOULAYMANI Cours Statistique 2005 4

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Trois problèmes peuvent être posés dans ces conditions :

La comparaison d’une moyenne observée à une moyenne théorique,

L’estimation d’une moyenne théorique à partir d’une moyenne observée et

La comparaison des moyennes observées deux à deux.

Pr. A. SOULAYMANI Cours Statistique 2005 5

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

II- Estimation statistique

Pr. A. SOULAYMANI Cours Statistique 2005 6

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

• Soit X, une variable aléatoire quantitative de moyenne et de variance 2.

Ces paramètres sont ceux d’une population de taille infini et peuvent être indéterminés.

m

2Tirage parfaitement

au hasard d’un échantillon de taille N

Pr. A. SOULAYMANI Cours Statistique 2005 7

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

La moyenne de la variable aléatoire X de cet échantillon est m de sorte que:

ki

ix

Nxm 1

1

La quantité S2 est un bon estimateur de 2 au niveau de l’échantillon; telle que:

ki

i

ki

ixx

Nxx

NS 1

22

1

22

11

)(1

1

Pr. A. SOULAYMANI Cours Statistique 2005 8

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Population

m1 m2 …… mk

2

• En tirant plusieurs échantillon de la population, les moyennes observées sont m1, m2,….mk.

La distribution de ces différentes moyennes est appelée distribution d’échantillonnage de la moyenne.

Pr. A. SOULAYMANI Cours Statistique 2005 9

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Il est évident, et l’expérience le montre que ces différentes moyennes ne sont pas identiques.

Les observations mi varient, et ses variations expriment les fluctuations de l’échantillonnage.

Autrement dit, la distribution des moyennes des différents échantillons constitue une nouvelle variable aléatoire, sur laquelle on peut appliquer les règles de calcul des variables aléatoires..

m = {m1, m2,……..m3,……….mk}

Pr. A. SOULAYMANI Cours Statistique 2005 10

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Les Différents paramètres de cette nouvelle distribution m = {m1, m2,……..m3,……….mk} sont:

La moyenne théorique de la distribution des moyennes est égale à E(m) = .Les différentes moyennes observées m1, m2…mi…mk sont regroupées autour de cette moyenne théorique .

La variance de la moyenne 2m et son écart type m

de la nouvelle distribution sont:

Net

Nx

m

x

m

2

2

Pr. A. SOULAYMANI Cours Statistique 2005 11

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Net

Nx

m

x

m

2

2

Il est clair que plus la taille N des échantillons est grande, plus les différentes moyennes observées m1, m2…mi…mk sont regroupées de manière très proche autour de la moyenne théorique .

Plus N augmentePlus la variance

diminue

Pr. A. SOULAYMANI Cours Statistique 2005 12

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

La Loi de probabilité de la distribution des moyennes

La forme de la distribution des moyennes ne peut être connue que si l’on connaît la distribution de la variable aléatoire X dans la population.

D’une manière générale, si le caractère étudié (V.A X) obéit à une loi de Laplace Gauss dans la population, alors la distribution des moyennes mi suit également une loi normale η(,sm) ou encore une Loi normale centrée réduite (0,1).

Pr. A. SOULAYMANI Cours Statistique 2005 13

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Toutefois, on peut admettre que lorsque l’effectif N tend vers l’infini, la loi de probabilité de la distribution de m suit une loi normale quelque soit la distribution de X dans la population.

m1 mimk

mm

En pratique,

on considère

une distributio

n

des moyennes norm

ale

à partir

de N>=30

Pr. A. SOULAYMANI Cours Statistique 2005 14

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Intervention de la loi de student:

Lorsque la taille de l’échantillon est petite, N<30; la loi de probabilité de la distribution des moyennes mi pour une variable aléatoire X distribuée normalement, ne suit pas une loi normale, mais une loi de student t à (N-1) degré de liberté, centrée réduite, de sorte que:

Ns

m

S

mt

xm

S x est l’é

cart - type

Estimé de la

Variable aléatoire X

Pr. A. SOULAYMANI Cours Statistique 2005 15

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Le remplacement de par son estimateur S a pour effet de modifier les calculs et les rendres sans biais.

La forme de la loi montre que dès que l’effectif augment, la loi de student tend vers une loi normale centrée réduite (0,1).

En pratique,

on considère que la lo

i de

Student tend vers une lo

i

Normale centré

e réduite

si N>=30

Pr. A. SOULAYMANI Cours Statistique 2005 16

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

En résumé, on distingue 4 situations selon la distribution de X:

X suit une loi normale dans la

population

X ne suit pas une loi normale dans la

population

Grand Échantillon

N≥30

La distribution des moyennes

suit une loi normale

La distribution des moyennes suit une loi approximativement

normale

Petit Échantillon

N<30

La distribution des moyennes suit une loi de

student

Loi

Indéterminée

!!!!!!!!!!!???

Ns

m

Ns

m

Ns

tmddlN )1(

Ns

m

Ns

m

Ns

tmddlN )1(

Pr. A. SOULAYMANI Cours Statistique 2005 17

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

III- Comparaison d’une moyenne

observée m à une moyenne théorique

Pr. A. SOULAYMANI Cours Statistique 2005 18

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Échantillon(N)

m

Tirage parfaitement au hasard

Soit un échantillon E de N individus sur lequel on mesure la valeur d’une variable aléatoire continue X.

Population de taille infini

De moyenne

On cherche à savoir si la moyenne de x au niveau de l’échantillon est compatible à celle de la population?.

Pr. A. SOULAYMANI Cours Statistique 2005 19

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

En d’autre termes, le problème peut être posé de 3 manières:

Sur le critère de la VA X, l’échantillon E est-il issu de la population P? (Situation bilatérale)

L’échantillon E provient-il d’une population P’ dont la moyenne de la VA X est supérieure à celle de la population P? (Situation unilatérale)

L’échantillon E provient-il d’une population P’’ dont la moyenne de la VA X est inférieure à celle de la population P? (Situation unilatérale)

Pr. A. SOULAYMANI Cours Statistique 2005 20

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

m ≠

Situatio

n bilatérale

m >

Situatio

n unilatérale

m <

Situatio

n unilatérale

En situation Unilatérale; la

signification est testée à 10%

En situation bilatérale; la

signification est testée à 5%

Pr. A. SOULAYMANI Cours Statistique 2005 21

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Dans la suite du résonnement, on pose les notations suivantes:

m : moyenne de X observée ou calculée sur l’échantillon.

: moyenne théorique de X au niveau de la population de référence P.

2: Variance théorique de X dans la population.

s2: Estimateur sans biais de la variance de X dans la population.

Pr. A. SOULAYMANI Cours Statistique 2005 22

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

III-1. Cas de petits échantillons: (N<30)

III-1-1. Si la distribution de la VA X suit une loi normale et la variance est inconnue:

Dans ce cas, on utilise une loi de student t à N-1 ddl de sorte que:

xxmS

Nm

NSm

S

mt

Pr. A. SOULAYMANI Cours Statistique 2005 23

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

La valeur de t calculé est confrontée à celle de t lue sur la table théorique à (N-1) ddl et au seuil choisi selon que le test soit bilatéral (5%) ou unilatéral (10%).

xxmS

Nm

NSm

S

mt

t suit une loi de student à N-1 ddl

Pr. A. SOULAYMANI Cours Statistique 2005 24

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Exemple: On sait que la concentration plasmatique du calcium du sujet sain est =2,5 mol/mt

Sur un échantillon de 18 personnes, on a trouvé une moyenne m de 3,2 mole/ml et un écart type estimé Sx = 1,1 mmole/ml.

Peut-on conclure que la calcémie moyenne des 18 personnes soit augmentée?NB: On suppose que la moyenne m’ de la calcémie, de la population dont l’échantillon est issu, suit une loi binomiale.

Pr. A. SOULAYMANI Cours Statistique 2005 25

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Réponse:

Choix du Test et vérification des conditions de son application

L’échantillon est Petit N<30, mais la VA « Calcémie » suit une loi normale dans la population dont l’échantillon est issu.

Application du Test:

xxmS

Nm

NSm

S

mt

Suit une loi de

student à 17 ddl(18-1)

Pr. A. SOULAYMANI Cours Statistique 2005 26

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Définir H0 et H1

H0: On considère que ’. La moyenne de la calcémie au niveau de l’échantillon ne diffère pas significativement de la moyenne des sujets sains.

H1: On considère que ’. La moyenne de la calcémie au niveau de l’échantillon est supérieure à la moyenne des sujets sains.

Pr. A. SOULAYMANI Cours Statistique 2005 27

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Fixer la taille du test et définir la règle de décision

Puisqu’on veut savoir si la moyenne au niveau de l’échantillon est supérieure à celle de la population, on est dans une situation unilatérale.

La valeur critique (ou limite) en situation bilatérale est t(5% / 17ddl) = 2,11.

La valeur critique (ou limite) en situation unilatérale est t(10% / 17ddl) = 1,74.

La valeur de t c

alculée

va être comparée

à 1,74 puisqu’on est

en situatio

n Unilatérale

Pr. A. SOULAYMANI Cours Statistique 2005 28

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Calcul de t observée

La valeur de tcalculée = 2,7 est supérieure à la valeur de la table t(10% / 17ddl) = 1,74. La valeur d

e t calculée

va être comparée

à 1,74 puisqu’on est

en situatio

n Unilatérale

7,21,1

185,22,3

xxmS

Nm

NSm

S

mt

Application de la règle de décision

On rejette H 0 au ris

que de 5%

&

on retient H 1

on conclu que la moyenne au

niveau de l’échantillon est

supérieure à celle de la

population de référence.

Pr. A. SOULAYMANI Cours Statistique 2005 29

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

III-1. Cas de petits échantillons (Suite): (N<30)

III-1-2. Si la distribution de la VA X est inconnue:

Dans ces conditions (cf Tableau) il n’existe pas de test non paramétrique

pour comparer les moyennes!!!?

On utilise alors la médiane.

On utilise alors la médiane en comparant la proportion des sujets à droite de la médiane de la population (ou à gauche) par rapport à 50%.

Pr. A. SOULAYMANI Cours Statistique 2005 30

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Exemple: Score de la douleur sur 15 patients traité a avec un nouvel morphinique. La médiane de la population de référence traité par un ancien médicament est de 4.

Ce score varie de 0 (aucune douleur) à 10 (douleur intense). Les résultats obtenus sont repectivement:

0,0,1,1,2,2,2,3,3,4,5,6,7,8,8

Dans l’échantillon le % des patient ayant un score <4 est de 60% (9/15)

Solution:

Pr. A. SOULAYMANI Cours Statistique 2005 31

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Le problème revient donc à la comparaison d’une proportion observée (60%) à une proportion théorique au niveau de la population (50%)

On doit donc utiliser un test de conformité

pour comparer une fréquence observée à une fréquence

théorique.(cf. Chap. Manipulation des fréquences)

Pr. A. SOULAYMANI Cours Statistique 2005 32

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

III-2. Cas des grands échantillons :(N≥30)

Dans ce cas, quelque soit la distribution de la VA X dans la population, on suppose que la distribution des moyenne m suit une loi normale d’espérance et d’écart type m.

NAvec x

m

Pr. A. SOULAYMANI Cours Statistique 2005 33

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

xxm

Obs

Nm

N

mm

Cet écart suit une loi normale centrée et réduite (0,1).

Le test consiste donc à calculer l’écart réduit et le confronter à l’écart théorique au niveau de la table de l’écart réduit.

Pr. A. SOULAYMANI Cours Statistique 2005 34

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

xxm

Obs

Nm

N

mm

La valeur de l’écart calculé est confrontée à celle de lue sur la table théorique au seuil choisi selon que le test soit bilatéral (5%) ou unilatéral (10%).

Pr. A. SOULAYMANI Cours Statistique 2005 35

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

IV- Estimation d’une moyenne théorique

à partir d’une moyenne observée m

Pr. A. SOULAYMANI Cours Statistique 2005 36

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Intervalle de confiance d’une moyenne

théorique

Pr. A. SOULAYMANI Cours Statistique 2005 37

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

III-1. Cas de petits échantillons : (N<30)

Dans ces conditions, il est nécessaire de s’assurer de la normalité de la distribution des moyennes.

Il est également, obligatoire, de remplacer la variance 2 par son estimation S2.

On utilisera pour le calcul statistique le t de student.

Pr. A. SOULAYMANI Cours Statistique 2005 38

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

En pratique, le calcul se fait de la manière suivante:

ddlNàNS

tm x 1%5

NS

tmNS

tm XX

%%

Pr. A. SOULAYMANI Cours Statistique 2005 39

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

III-1. Cas des grands échantillons : (N≥30)

Dans ces conditions, on suppose que la variance est connue, et que l’échantillon est assez grand pour considérer une distribution de moyenne normale.

On utilisera pour le calcul statistique le de l’écart centré réduit.

Pr. A. SOULAYMANI Cours Statistique 2005 40

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

En pratique, le calcul se fait de la manière suivante:

Nm x

%

Nm

Nm xx

%%

Pr. A. SOULAYMANI Cours Statistique 2005 41

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

L’intervalle de confiance de la moyenne a (1-)% chance de recouvrir la moyenne théorique de la population à partir de laquelle l’échantillon de moyenne m a été issu.

Une meilleure estimation de l’intervalle de confiance de la moyenne est obtenue en utilisant l’estimateur sans biais de la variance S2 pour le calcul au lieu de la variance 2.

Pr. A. SOULAYMANI Cours Statistique 2005 42

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

V- Comparaison de deux moyennes

observées m1 & m2

Pr. A. SOULAYMANI Cours Statistique 2005 43

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Population

m1 m2

2

On dispose de 2 Échantillon E1 et E2.

On veut comparer les moyennes observées aux niveaux des 2 Échantillon E1 et E2.

E1 E2

Pr. A. SOULAYMANI Cours Statistique 2005 44

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

En d’autre termes, le problème peut être posé de 3 manières:

Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle différente de la moyenne m2 de l’échantillon E2? (Situation bilatérale)

Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle supérieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale)

Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle inférieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale)

Pr. A. SOULAYMANI Cours Statistique 2005 45

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Définir H0 et H1

H0: On considère que 1. La moyenne m1 au niveau de l’échantillon E1 ne diffère pas significativement de la moyenne m2 de E2.

Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle différente de la moyenne m2 de l’échantillon E2? (Situation bilatérale)

1 et 2 sont respectivement les moyennes théoriques des 2

populations dont on a tirées E1 et E2.

H1: On considère que 1≠. La moyenne m1 au niveau de l’échantillon E1 diffère significativement de la moyenne m2 de E2.

Pr. A. SOULAYMANI Cours Statistique 2005 46

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Définir H0 et H1

H0: On considère que 1. La moyenne m1 au niveau de l’échantillon E1 ne diffère pas significativement de la moyenne m2 de E2.

1 et 2 sont respectivement les moyennes théoriques des 2

populations dont on a tirées E1 et E2.

H1: On considère que 1>. La moyenne m1 au niveau de l’échantillon E1 es supérieure significativement de la moyenne m2 de E2.

Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle supérieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale)

Pr. A. SOULAYMANI Cours Statistique 2005 47

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Définir H0 et H1

H0: On considère que 1. La moyenne m1 au niveau de l’échantillon E1 ne diffère pas significativement de la moyenne m2 de E2.

1 et 2 sont respectivement les moyennes théoriques des 2

populations dont on a tirées E1 et E2.

H1: On considère que 1<. La moyenne m1 au niveau de l’échantillon E1 est inférieure significativement de la moyenne m2 de E2.

Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle inférieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale)

Pr. A. SOULAYMANI Cours Statistique 2005 48

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

V.1- Cas des petits échantillons

N1 ou N2 < 30

Pr. A. SOULAYMANI Cours Statistique 2005 49

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

On suppose que les variables au niveau des 2 échantillons suivent une loi normale et que les 2 variances sont égales 1 = 2.

Dans ces conditions; on estime la variance commune aux 2 échantillons:

2)1()1(

21

2

22

2

112

NNSNSN

S

2

2)2(

2

2

2

2

1)1(

1

2

1)(

11

)(1

1mx

NSetmx

NS

ii

Pr. A. SOULAYMANI Cours Statistique 2005 50

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

On calcul l’écart observé en utilisant le test t de student:

2

2

2

1

2

1

21

NS

NSmm

tObservé

La quantité tobs. Suit une loi de student à (N1 +N2-2)ddl sous l’hypothèse nulle.

La quantité tobs. Est donc comparée à la table à(N1+N2-2)ddl et à 5%(test bilatéral) ou à 10% (test unilatéral).

Pr. A. SOULAYMANI Cours Statistique 2005 51

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Pr. A. SOULAYMANI Cours Statistique 2005 52

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Pr. A. SOULAYMANI Cours Statistique 2005 53

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Recommended