Laurent Bosquet Université Lille...

Preview:

Citation preview

Méthodologie Méthodologie de la de la

rechercherecherche

Laurent BosquetLaurent Bosquet

Université Lille 2Université Lille 2

Plan du coursPlan du cours

1.1. La loi normale et l’erreur d’échantillonnageLa loi normale et l’erreur d’échantillonnage

2.2. Comparaison de deux échantillonsComparaison de deux échantillons

3.3. Comparaison de trois échantillons ou plusComparaison de trois échantillons ou plus

4.4. Corrélation et régressionCorrélation et régression

Plan du coursPlan du cours

Corrélation et RégressionCorrélation et Régression

1.1. Coefficient de corrélation du produit des moments de Coefficient de corrélation du produit des moments de PearsonPearson

2.2. Coefficient de corrélation des rangs de SpearmanCoefficient de corrélation des rangs de Spearman

3.3. RésuméRésumé

4.4. Régression Régression bivariéebivariée

Coefficient de corrélationCoefficient de corrélation

Indique le degré dIndique le degré d ’association entre deux variables’association entre deux variables

Coefficient numérique compris entre +1 et Coefficient numérique compris entre +1 et --11Corrélation positive (0 < r < 1) : relation proportionnelleCorrélation positive (0 < r < 1) : relation proportionnelle

Corrélation négative (Corrélation négative (--1 < r < 0) : relation inversement proportionnelle1 < r < 0) : relation inversement proportionnelle

N’implique en aucun cas une relation de CAUSE A EFFET

11èreère étape : étape : PeutPeut--on utiliser le coefficient de corrélation ?on utiliser le coefficient de corrélation ?

•• La relation estLa relation est--elle linéaire ?elle linéaire ?

Vérifier le nuage de pointsVérifier le nuage de points

•• Les valeurs sont elles indépendantes ?Les valeurs sont elles indépendantes ?

Test Test DurbinDurbin WatsonWatson

ou … la logique !ou … la logique !

fHome

Variable 1Variable 1 Variable 2Variable 2 Var 1 x Var 2Var 1 x Var 2

11 1212 121222 33 6633 11 3344 2424 969655 2222 11011066 5959 35435477 66 424288 1515 12012099 33 27271010 1717 170170

Variable 1Variable 1 Variable 2Variable 2 Var 1 x Var 2Var 1 x Var 2

11 1212 121222 33 6633 11 3344 2424 969655 2222 11011066 5959 35435477 66 424288 1515 12012099 33 27271010 1717 170170

r = 0.11r = 0.11

Variable 1Variable 1 Variable 2Variable 2 Var 1 x Var 2Var 1 x Var 2

11 1212 121222 33 6633 11 3344 2424 969655 2222 11011066 5959 35435477 66 424288 1515 12012099 33 27271010 1717 170170

Variable 1Variable 1 Variable 2Variable 2 Var 1 x Var 2Var 1 x Var 2

11 1212 121222 33 6633 11 3344 2424 969655 2222 11011066 5959 35435477 66 424288 1515 12012099 33 27271010 1717 170170

r = 0.94r = 0.94

11èreère étape : étape : PeutPeut--on utiliser le coefficient de corrélation ?on utiliser le coefficient de corrélation ?

•• La relation estLa relation est--elle linéaire ?elle linéaire ?

Vérifier le nuage de pointsVérifier le nuage de points

•• Les valeurs sont elles indépendantes ?Les valeurs sont elles indépendantes ?

Test Test DurbinDurbin WatsonWatson

ou … la logique !ou … la logique !

22èmeème étape : étape :

Formuler les hypothèses statistiquesFormuler les hypothèses statistiques

Hypothèse Hypothèse nulle (H0)

Il n ’existe pas de relation entre les deux variables

Hypothèse alternative (HHypothèse alternative (H11))

Il existe une relation entre les deux variables

33èmeème étape : étape :

Choisir le coefficient appropriéChoisir le coefficient approprié

Méthode paramétriqueMéthode paramétrique

Le coefficient de corrélation du produit des moments de Pearson

Méthode non paramétriqueMéthode non paramétrique

Le coefficient de corrélation des rangs de Spearman

33èmeème étape : étape :

Vérifier la normalité de la distributionVérifier la normalité de la distribution

Test Shapiro Test Shapiro WilkWilk

H0 : la distribution de l’échantillon suit une loi normaleCoefficient de corrélation de Pearson

H1 : la distribution de l’échantillon ne suit pas une loi normaleCoefficient de corrélation de Spearman

Plan du coursPlan du cours

Corrélation et RégressionCorrélation et Régression

1.1. Coefficient de corrélation du produit des moments de Coefficient de corrélation du produit des moments de PearsonPearson

2.2. Coefficient de corrélation des rangs de SpearmanCoefficient de corrélation des rangs de Spearman

3.3. RésuméRésumé

4.4. Régression Régression bivariéebivariée

Coefficient de corrélation du produit des Coefficient de corrélation du produit des moments de Pearsonmoments de Pearson

Formule «Formule « moyenne moyenne -- écart typeécart type »»

YX

Y.XnXY

rσσ

−=

22

∑−∑=nn

XX

Coefficient de corrélation du produit des Coefficient de corrélation du produit des moments de moments de PearsonPearson

Formule «Formule « moyenne moyenne -- écart typeécart type »»

X Y X2 Y2 XY

3 5 9 25 152 7 4 49 14.. .. .. .. ..

∑∑XX ∑∑YY ∑∑XX22 ∑∑YY22 ∑∑XYXY

Coefficient de corrélation du produit des Coefficient de corrélation du produit des moments de Pearsonmoments de Pearson

Formule «Formule « moyenne moyenne -- écart typeécart type »»

YX

Y.XnXY

rσσ

−=

2

nX

n

2XX

∑−∑=σ

Table du r de Pearson Table du r de Pearson (Pearson et Hartley, 1966)(Pearson et Hartley, 1966)

ddl = n-2

Quelle signification clinique ?Quelle signification clinique ?

Il n’existe pas de relation entre les deux variables

Il existe une relation entre les deux variables

Quelle signification clinique ?Quelle signification clinique ?

Il n’existe pas de relation entre les deux variables

Variance commune

(r2) Il existe une relation entre les deux variables

Quelle signification clinique ?Quelle signification clinique ?

Variance commune

(r2)

Si 00 < rSi 00 < r22 < 25% (0.0 < r < 0.5) : < 25% (0.0 < r < 0.5) : Très faibleTrès faible

Si 25 < rSi 25 < r22 < 50% (0.5 < r < 0.7) : < 50% (0.5 < r < 0.7) : FaibleFaible

Si 50 < rSi 50 < r22 < 65% (0.7 < r < 0.8) : < 65% (0.7 < r < 0.8) : ModéréModéré

Si 65 < rSi 65 < r22 < 80% (0.8 < r < 0.9) : < 80% (0.8 < r < 0.9) : ÉlevéÉlevé

Si 80 < rSi 80 < r22 < 100% (0.9 < r < 1.0) : < 100% (0.9 < r < 1.0) : Très élevéTrès élevé

Plan du coursPlan du cours

Corrélation et RégressionCorrélation et Régression

1.1. Coefficient de corrélation du produit des moments de Coefficient de corrélation du produit des moments de PearsonPearson

2.2. Coefficient de corrélation des rangs de SpearmanCoefficient de corrélation des rangs de Spearman

3.3. RésuméRésumé

4.4. Régression Régression bivariéebivariée

Coefficient de corrélation des rangs de Coefficient de corrélation des rangs de SpearmanSpearman

Classer les sujets selon leur rang pour chacune des deux variablClasser les sujets selon leur rang pour chacune des deux variableses

Sujets Rang Rang Diff. (Diff.)2

Var 1 Var 2

1 5 9 - 4 162 7 4 +3 9.. .. .. .. ..n 12 12 0 0

∑∑(Diff.)(Diff.)2 2 : : XXXX

Coefficient de corrélation des rangs de Coefficient de corrélation des rangs de SpearmanSpearman

( )1nnD6

1 2

2

−−=ρ ∑

n = taille de l’échantillonn = taille de l’échantillon∑∑ DD22 = somme des différences au carré= somme des différences au carré

Table du Table du ρρ de Spearman de Spearman (Pearson et Hartley, 1966)(Pearson et Hartley, 1966)

Quelle signification clinique ?Quelle signification clinique ?

Si 0.0 < Si 0.0 < ρρ < 0.5 : < 0.5 : Très faibleTrès faible

Si 0.5 < Si 0.5 < ρρ < 0.7 : < 0.7 : FaibleFaible

Si 0.7 < Si 0.7 < ρρ < 0.8 : < 0.8 : ModéréModéré

Si 0.8 < Si 0.8 < ρρ < 0.9 : < 0.9 : ÉlevéÉlevé

Si 0.9 < Si 0.9 < ρρ < 1.0 : < 1.0 : Très élevéTrès élevé

Plan du coursPlan du cours

Corrélation et RégressionCorrélation et Régression

1.1. Coefficient de corrélation du produit des moments de Coefficient de corrélation du produit des moments de PearsonPearson

2.2. Coefficient de corrélation des rangs de SpearmanCoefficient de corrélation des rangs de Spearman

3.3. RésuméRésumé

4.4. Régression Régression bivariéebivariée

Degré d’association entre deux variables : Degré d’association entre deux variables : le coefficient de corrélationle coefficient de corrélation

STOPSTOP

OUIOUI NONNONLa relation estLa relation est-- elle linéaire ?elle linéaire ?

Les variables sontLes variables sont-- elles elles indépendantes ?indépendantes ?

OUIOUI NONNON

La distribution suitLa distribution suit-- elle une elle une loi normale ?loi normale ?

Signification cliniqueSignification clinique SPEARMANSPEARMANPEARSONPEARSON

Plan du coursPlan du cours

Corrélation et RégressionCorrélation et Régression

1.1. Coefficient de corrélation du produit des moments de Coefficient de corrélation du produit des moments de PearsonPearson

2.2. Coefficient de corrélation des rangs de SpearmanCoefficient de corrélation des rangs de Spearman

3.3. RésuméRésumé

4.4. Régression Régression bivariéebivariée

Relation entre la distance (m) et le temps (s)Relation entre la distance (m) et le temps (s)

0

2000

4000

6000

8000

10000

12000

0 250 500 750 1000 1250 1500 1750 2000

Temps (s)

Dist

ance

(m)

1500 m3:26

3000 m7:20

5000 m12:39

10000 m26:22

r = 0.99

Y = a(X) + b Y = distance (m)X = temps (s)a = penteb = ordonnée à l ’origine

Conditions dConditions d ’utilisation de la ’utilisation de la régression régression bivariéebivariée

•• La relation est elle linéaire ?La relation est elle linéaire ?

•• Les valeurs sont elles indépendantes ?Les valeurs sont elles indépendantes ?

•• La distribution de chaque variable suit La distribution de chaque variable suit elle une loi normale ?elle une loi normale ?

Régression Régression bivariéebivariée

Valeur 1Valeur 1 Valeur 2Valeur 2

X (temps)X (temps) 206206 759759

Y (distance)Y (distance) 15001500 50005000

1. Calculer la pente1. Calculer la pente

12

12

XXYYPente

−−

=2067591500500033.6

−−

=

Régression Régression bivariéebivariée

Valeur 1Valeur 1 Valeur 2Valeur 2

X (temps)X (temps) 206206 759759

Y (distance)Y (distance) 15001500 50005000

2. Calculer l’ordonnée à l2. Calculer l’ordonnée à l ’origine’origine

( ) bX33.6Y +=

( ) b75933.65000 +=

Régression Régression bivariéebivariée

Valeur 1Valeur 1 Valeur 2Valeur 2

X (temps)X (temps) 206206 759759

Y (distance)Y (distance) 15001500 50005000

2. Calculer l’ordonnée à l2. Calculer l’ordonnée à l ’origine’origine

( ) bX33.6Y +=b = 196

( ) b75933.65000 +=

Régression Régression bivariéebivariée

Valeur 1Valeur 1 Valeur 2Valeur 2

X (temps)X (temps) 206206 759759

Y (distance)Y (distance) 15001500 50005000

3. Établir l’équation de régression linéaire3. Établir l’équation de régression linéaire

( ) 196X33.6Y +=

Régression Régression bivariéebivariée

Valeur 1Valeur 1 Valeur 2Valeur 2

X (temps)X (temps) 206206 759759

Y (distance)Y (distance) 15001500 50005000

( ) 196X33.6Y +=

Préciser systématiquement :Préciser systématiquement :• les caractéristiques de la population• le coefficient de corrélation• l’erreur de prédiction (erreur type de l’estimé)

Régression Régression bivariéebivariée

L’erreur type de l’estimé (ETL’erreur type de l’estimé (ETEE))

2YE r1ET −σ=

Recommended