labarere jose p04.ppt [Mode de compatibilité] · (échantillons indépendants) population1 µ 1,...

Preview:

Citation preview

Plan

I. Nature des variables

I. Comparaison de 2 moyennes observées sur

2 échantillons indépendants

• Test Z de l’écart réduit

• Test t de Student

III. Comparaison de 2 moyennes observées sur 2

échantillons appariés

• Test Z de l’écart réduit

• Test t de Student

Plan

I. Nature des variables

II. Comparaison de 2 moyennes observées sur 2

échantillons indépendants

• Test Z de l’écart réduit

• Test t de Student

III. Comparaison de 2 moyennes observées sur 2

échantillons appariés

• Test Z de l’écart réduit

• Test t de Student

I. Nature des variables

• Comparer 2 moyennes = tester l’association entre

• 1 variable quantitative

• 1 variable qualitative binaire

• Exemple : µmasculin(âge) µféminin (âge) ?

- âge : variable quantitative continue

- sexe: variable qualitative binaire (dichotomique)

Plan

I. Nature des variables

II. Comparaison de 2 moyennes observées sur 2

échantillons indépendants

• Test Z de l’écart réduit

• Test t de Student

III. Comparaison de 2 moyennes observées sur 2

échantillons appariés

• Test Z de l’écart réduit

• Test t de Student

II. Comparaison de deux moyennes observées

(échantillons indépendants)

population1

µ1, σ1

échantillon

m1, s1

« Indépendant » signifie que l’échantillon 1 est constitué de manière

indépendante de l’échantillon 2 (par opposition aux échantillons

appariés) :

•Les sujets de l’échantillon 1 ne sont pas les mêmes que ceux de

l’échantillon 2

• Les 2 échantillons peuvent être d’effectifs différents.

population 2

µ2 , σ2

échantillon

m2, s2

II. Comparaison de deux moyennes observées

(échantillons indépendants)

population1

µ1, σ1

échantillon

m1, s1

population 2

µ2, σ2

échantillon

m2, s2

1.Formulation des hypothèses H0 : µ1 = µ2

H1 : µ1 µ2

2. Risque α = 0.05 (5%) a priori

3. Choix du test

Test Z de l’écart réduit (n1 > 30 et n2 > 30 )

Test t de Student ((n1 ≤ 30 et/ou n2 ≤ 30 hypothèse de normalité, variances

comparables)

Test Z de l’écart réduit

• Si n1 > 30 et n2 > 30

• Sous H0 : µ1 = µ2 → µ1 - µ2 = 0

• Sous H1 : µ1 ≠ µ2

1 2

n1 n 2

2 2

1 2

varm m

m1 m2 m1 m2Z

n1 n2

s2 s21 2

m1 m2Z

→ N (0, 1)

s² est un estimateur de σ² →

Si test bilatéral

Exemple

On compare la consommation de caféine

chez 112 cancéreux : moyenne 147,2 mg/jour - écart type estimé 101,8 mg/jour

à celle de

185 non cancéreux : moyenne 132,9 mg/jour - écart type 115,7 mg/jour.

On prend un risque à 5%.

Test bilatéral, grands échantillons

Z = 147,2 - 132,9

101,82

112+ 115,72

185

= 1,11

1,11 est inférieur à 1,96 => Différence non significative

Les cancéreux consomment la même quantité de cafeine que les

non cancéreux

Test t de Student

• Conditions d’application :

- La distribution de la variable continue est normale dans les 2

populations

- Les variances σ1² et σ2² sont comparables (égales)

• Sous H0 : µ1 = µ2 → µ1 - µ2 = 0

1 2

2

22

2

112

n n 2n 1n 1s s

Variance commune s

→ t(n1 + n2 - 2) ddl

Exemple: la tension artérielle

nA = nB = 16

on observe mA = 130,7 mB = 136,1

s²A = 23,2 s²B = 25,8

H0 : mA = mB

H1 : mA ≠ mB

nA = nB < 30 on réalise le test t de student

on calcule : s² commune

ddl = 16+16-2 = 30 t > t30 à 5% = 2.042

La tension artérielle diffère dans les deux groupes avec p < 0.001

(nA+nB-2) ddl = 30 ddl

Plan

I. Nature des variables

II. Comparaison de 2 moyennes observées sur 2

échantillons indépendants

• Test Z de l’écart réduit

• Test t de Student

III. Comparaison de 2 moyennes observées sur 2

échantillons appariés

• Test Z de l’écart réduit

• Test t de Student

III. Comparaison de deux moyennes observées (échantillons

appariés)

Obs1 1

Obs1 2

Obs13

Obs1 n1

Obs2 1

Obs2 2

Obs2 3

Obs2 n1

Obs 1

Obs 2

Obs 3

Obs n1

Obs1

Obs 2

Obs 3

Obs n2

m1 m2

échantillons indépendants

échantillons appariés

sujet pris comme son propre témoin

(n1 = n2 ou n1 ≠ n2) (n1 = n2 = n)

III. Comparaison de deux moyennes observées (échantillons

appariés)

PAS1 1

PAS1 2

PAS1 3

PAS1 n

PAS2 1

PAS2 2

PAS2 3

PAS2 n

Avant Après

Traitement anti-

hypertenseur

H0 : mPAS avant = mPAS

après

Les mesures PAS1 et PAS2 du sujet 1 ne

sont pas indépendantes

Les 2 mesures ont été effectuées sur le

même sujet : si PAS1 était très élevée, il

est probable que PAS2 restera élevée

1(mais moins que PAS si le traitement

est efficace)

Le test doit prendre en compte cette

dépendance des observations PAS1 et

PAS2

(En revanche, les mesures PAS2 du

sujet 1 et PAS2 du sujet 2 sont

indépendantes)

PAS = Préssion Artérielle systolique

Echantillons appariés

nd

n

di

m i 1• (m1 - m2) = md avec

n2

2

d

d m s

i di1

n1• var (md) = sd² / n, avec

md : moyenne des différences

s2

d

n

mdZo

α/2

(rejet de H0)

Test Z de l’écart réduit pour échantillons appariés

• H0 : µd = 0 (µ1 = µ2)

• H1 : µd 0 (µ1 µ2)

• Si n > 30 paires1 – α

(non-rejet de H0)

z α

|Zo| Zα |Zo| > Zα|Zo| > Zα

-z α

α/2

(rejet de H0)

On dispose d'un échantillon de n = 100 patients pour lesquels on a mesuré:

• le LDL avant Traitement (µ1 = 1,8)• le LDL après Traitement (µ2 = 1,6)

Exemple :évaluation d'un traitement contre le cholestérol

H0 : d = 0 (µ1 = µ2) le traitement n'a pas d‘effet

H1 : d 0 (µ1 µ2) le traitement a un effet

n > 30 on réalise le test z α= 5%

z > 1.96 donc le traitement a un effet (efficace)

Test t de Student pour échantillons appariés

• H0 : µd = 0 (µ1 = µ2)

• H1 : µd 0 (µ1 µ2)

• n ≤ 30

• Si la distribution des différences individuelles est normale :

n

ts2

o

d

md → t (n-1) ddl

Exemple : Traitement du diabète 1

Objectif : On désire étudier l'effet d'une nouvelle stratégie de traitement du

diabète en mesurant l'effet sur la glycémie. On dose la glycémie (g/L) chez

15 sujets avant le début du nouveau protocole et 3 mois après.

Dans la population de malades, on pose :

X1 la mesure de glycémie avant traitement

X2 la mesure de glycémie après traitement (3 mois après)

D = X1 - X2 est distribuée selon une loi normale de moyenne d et de

variance

Les mesures sont appariées car elles sont effectuées sur les mêmes

individus.

La moyenne des différences entre les mesures : d = 0.1

L‘écart-type des différences entre les mesures : sD = 0.091

H0 : d = 0 les glycémies sont identiques avant et après le nouveau

protocole

H1 : d 0 les glycémies sont différentes avant et après le nouveau

protocole

> t de la table = 2.145

donc on rejette H0 au risque = 5% de se tromper.

La glycémie est significativement plus basse après administration de

la nouvelle stratégie.

n < 30 on réalise le test t de student

α = 5% ddl = n-1 = 15 – 1 = 14

m1 m2 effectif test conditions

Z -Observée observée

(indépendantes)

n1, n2 > 30

n1, n2 ≤ 30 t (n1+n2 -2) ddlnormalité

σ² comparables pour

calculer s² commune

observée observée n > 30 paires Z -

(appariées) n ≤ 30 paires t (n-1) ddl normalité di

Comparaison de moyennes

résumé

Références bibliographiques

Recommended