35
Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation 1 Analyse & traitement de données : mesurer, tester des hypothèses Rémi Bachelet [email protected] Centrale de Lille euve d’Ascq - France Cours distribué sous licence Creative Commons, selon les conditions suivantes : Source des images indiquées au-dessous ou en cliquant sur l’image Diapos disponibles http://rb.ec- lille.fr

Methodologie Validite Et Fiabilite

Embed Size (px)

DESCRIPTION

Validite Et Fiabilite

Citation preview

Page 1: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

1

Analyse & traitement de données : mesurer, tester des hypothèses

Rémi Bachelet

[email protected]

École Centrale de Lille

Villeneuve d’Ascq - France

Cours distribué sous licence Creative Commons, selon les conditions suivantes :

Source des images indiquées au-dessous ou en cliquant sur l’image

Diapos disponibles http://rb.ec-lille.fr

Page 2: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

Comment utiliser ce cours :

1. Mettre les diapos en format plein écran en cliquant sur

2. Faire défiler l’animation en cliquant sur les diapositives(attention : cliquer sur une image ou un lien ouvre la page web correspondante)

Page 3: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

Tester des hypothèses

Exemple : Le réchauffement climatique est-il une certitude ? Si oui d’où vient-il ?

1. « Il n’y a pas de réchauffement climatique » => réfuté avec de plus en plus de certitude d’année en année (désormais >95%)

2. Autres hypothèses 1. Le réchauffement climatique est lié à l’activité solaire => réfuté

2. Le réchauffement climatique est lié à l’activité humaine =>

3. …

Cf : travaux du GIEC

3

Page 4: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

A la recherche de la vérité …

Alors, faut-il tester des hypothèses, jusqu’à faire « sortir la vérité du puits » ?

Qui ne veut pas voir « la vérité toute nue » ?

La Vérité sortant du puitsEdouard Debat-Ponsan,

musée de l'Hôtel de ville d'Amboise© Ville d’Amboise 

Page 5: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

Conjectures et réfutations

On ne prouve pas qu’une théorie est vraie, on prouve que les théories concurrentes sont fausses

La théorie « vraie » est celle qui 1. Explique un phénomène le mieux possible …

2. permet de formuler des hypothèses réfutables

3. … mais pas encore réfutées

• Autrement dit, il n’y a pas de théorie vraie, mais seulement une « meilleure théorie » qui est :– parmi celles qui sont proposées….

– … la plus « élégante » (pouvoir explicatif, clarté, rasoir d’Occam) …

– …. dont on dispose à un moment donné, en attendant…

5

Page 6: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

Il n’y a pas de vérité scientifique, mais une population de théories en concurrence

6

Page 7: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

Mesurer

Comment tester une théorie ?Une théorie propose des construits qui permettent de formuler des

hypothèses

1. Définir rigoureusement les construits– 1/ Concept => 2/dimensions => 3/composantes– Température de la terre => t° eau;t° air, t° du sol => mesures (x, y, z, t)

2. Puis mesurer des variables pour tester les hypothèses– Variables métriques (sc physiques), mais aussi nominales, ordinales (sc

humaines)

– Variables indépendantes/dépendantes

Page 8: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation8

En sciences humaines/génie industriel, les variables mesurées sont rarement quantitatives au départ

• Affirmation– Opinion, réponse sur une échelle d’estime de soi

• Comportement– Rencontrer quelqu’un, éviter de faire quelque chose

• …. Voire discours sur un comportement – Par exemple « utilisation d’un préservatif »

– Cf. biodata

Page 9: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation9

Les variables métriques sont aussi de divers types

• Continues ou discrètes– Poids, taille (métrique continu)

– Image scanner, capacité à grimper sur une échelle jusqu’à un certain barreau (métrique discret)

• On peut faire énormément de calculs, surtout avec les variables continues : ACP

Page 10: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation10

Les variables nominales

• Elles ne peuvent faire l’objet d’un classement par ordre croissant… par exemple – Sexe (var. dichotomique)

– Lieu de naissance, plat préféré

• La plupart des calculs, sont impossibles, car il n’ont pas de sens.– Calculer une « moyenne » entre des marques de voitures ?

– On peut parfois les convertir en variables métriques – destinations de vacances => distance (km)

– vote à une élection => échelle droite <=> gauche.

Page 11: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation11

Variables Ordinales

• Elles sont ordonnées, mais pas métriques– Réponse sur une échelle d’estime de soi – par exemple une échelle du type de celles proposées par Rensis Likert (1903 -

1981)« J’ai confiance en moi », cochez la case correspondant à votre opinion => tout à fait d’accord / plutôt d’accord / pas d’accord / pas d’accord du tout

• Problème pour les traiter.. Faut-il les considérer comme ..1. … des variables métriques (pas du tout = 1, un peu = 2 …)2. Ou des variables nominales ?

• Effets pervers– En numérisant un Likert (pas du tout d’accord = 1, assez d’accord =2..) on est tenté de faire des calculs :

moyenne écart-type .. – Or, ces chiffres n’ont en fait que peu de sens, il impliquent notamment un postulat caché sur les «

distances » entre les réponses • passer de « pas du tout d’accord » à « assez d’accord » est-il identique à passer de « assez d’accord » à « plutôt

d’accord » ?

Page 12: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation12

Autres types de variables

• Rangs de classement– Premier choix, réponses multiples ..– Données dures à exploiter !

• Graphes – Par exemple réseau relationnel / sociogramme– Conversion du graphe en matrice et analyse structurale

• Variables textuelles– Texte brut ou transcription d’un entretien– analyse de contenu, voir ci-après

Erreur très fréquente : collecter des données et ne pas être capable de les exploiter ensuite !1. Savoir-faire : logiciels maitrisés, éviter de croire que « plus on utilise de

mathématiques, meilleur c’est »2. Méthodologie : rigoureuse et comprise par le lecteur 3. Temps .. et coût..(3* la durée d’un entretien pour le taper et autant pour l’analyser).

Page 13: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation13

L’analyse de contenu

• Elle se fait souvent « avec sa tête » !1. Construire un tableau des concepts

2. Faire une carte cognitive / conceptuelle

Création d’une carte conceptuelle +

Critères pour valider qu’une carte conceptuelle est bonne….

Logiciels d’aide à la fabrication de cartes conceptuelles :

• FreeMind

• Visual Understanding Environment (VUE) 

[[Guide - Réaliser une carte conceptuelle]]

Page 14: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

Une bonne synthèse méthodologique

Page 15: Methodologie Validite Et Fiabilite

Analyse & traitement de données : fiabilité et validité

Image : Source

[email protected]

École Centrale de Lille

Villeneuve d’Ascq - France

Diapos disponibles http://rb.ec-lille.fr

Cours distribué sous licence Creative Commons, selon les conditions suivantes :

Source des images indiquées au-dessous ou en cliquant sur l’image

15

Page 16: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

Validité et Fiabilité

Lorsque l’on mesure une grandeur, on souhaite que les résultats soient utiles et reflètent bien les concepts qu’elle représente.

À cet effet, on a deux préoccupations : – Le dispositif de recherche doit être valide

– La mesure doit être fiable

Bibliographie / sources :– William D. Richards http://www.uwm.edu/People/hessling/p325/Psy325_Chap3.pdf

– Bob Hessling http://www.sfu.ca/~richards/Zen/show4/ch4.html

– Igalens et Roussel, « Méthodes de recherche en management », chap 10

Page 17: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

La Validité

Suis-je proche de la vérité ?

Les trois exigences de validité1. Validité interne

2. Validité externe

3. Validité de construit / concept

Page 18: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation18

Validité interne

Validité interne = On a bien identifié cause et effetAutrement dit, pas d’explication rivale : les variations de la variable à

expliquer sont causées uniquement par les variables explicatives

A B

A B

X

? ou

Page 19: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation19

Qu’est-ce que la causalité ?

Selon John Stuart Mill (1806-1873), trois critères permettent d’inférer la causalité :i. La covariation,

• Cause et effet sont corrélés

ii. La précédence temporelle • La cause précède l’effet

iii. L’élimination d’explications alternatives. • Pas de troisième variable

Trouvez huit biais limitant la validité interne … et les moyens de les éviter (application à un questionnaire d’intention d’achat d’une population dans un centre commercial...)

Page 20: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

20

Huit biais limitant la validité interne (1/2)

Campbell DT, Stanley JC (1966). “Experimental and quasi-experimental designs for research”.

• faire valider le questionnaire par un expert• protocole normalisé•Méthode de la pensée à voix haute..

Les questions utilisées pour recueillir les données sont mal formulées (mots compliqués….)

Effet d’instrumentation

• Ne pas questionner deux fois les mêmes individus (?)• Éviter la mémorisation ?

Les réponses au deuxième questionnaire sont affectées par le fait d’avoir déjà répondu (mémoire)

Effet de test (pour une étude longitudinale/ par panel)

• Réduire la période d’étude• Examen critique des individus

Les individus ont changé pendant l’étude (réussite/échec au bac, entre ou sort du centre commercial)

Effet de maturation

• Réduire la période d’étude• Examen critique de la période d’étude

Des évènements extérieurs à l’étude faussent les résultats (Noël)Effet d’histoire

Comment l’éviterOrigineType

Page 21: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

21

Huit biais limitant la validité interne (2/2)

Campbell DT, Stanley JC (1966). “Experimental and quasi-experimental designs for research”.

• Mener l’étude rapidement• Cacher son objectif• Prévenir la communication entre sujets

Un individu interrogé apprend à l’avance par les autres l’objet de l’étude ou les réponses attendues

Effet de contamination

• Remplacer les sujets perdus• Trouver des moyens de garder le contact.

Des sujets disparaissent en cours d’étude (des participants abandonnent l’étude. Ceux qui agissent ainsi peuvent être différents de ceux qui restent)

Effet de mortalité expérimentale (pour une étude longitudinale/ par panel)

• Attention au plan de collecte !

L’échantillon n’est pas représentatif de la population pertinente (les enquêteurs sont actifs la journée, mais plus après 20h… les PCS faisant les courses tard sont oubliées)

Effet de sélection

• Revoir la constitution de l’échantillon

Présélection des individus sur la base de caractère extrêmes (les participants avec les plus mauvais résultats à un test sont inclus dans un programme de formation, ils réussissent au prochain test peu importe le programme, … parce que les probabilités d'obtenir d'aussi mauvais résultats deux fois sont faibles)

Effet de régression statistique

Comment l’éviterOrigineType

Page 22: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation22

Validité externe

Validité externe = Les résultats sont-ils généralisables ? Autres situations : pays, époques, populations ….

Un risque :– « Overfit » : en recherche inductive, on construit une théorie à partir de

données… et le modèle construit colle tellement à ces données … qu’il ne représente plus le phénomène qu’on voulait étudier au départ.… mais uniquement les données.

Une faible validité externe signifie que l’on ne peut pas généraliser, mais la recherche peut tout de même être intéressante (on a très bien étudié un terrain donné).

Toujours revenir sur la validité externe en conclusion d’une étude (« limites et perspectives »).

Page 23: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation23

Validité interne et externe s’opposent-elles ?

À votre avis ?Oui, souvent car

– la validité interne demande un meilleur contrôle des situations observées

– la validité externe demande des situations, méthodes et terrains de collecte plus variés et ouverts

Plus on multiplie les situations, plus le contrôle qu’on peut exercer sur les biais est faible.

Page 24: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation24

Validité de construit / concept

Validité de construit = on mesure bien ce que l’on veut mesurerLes recherches en sciences humaines portent sur des concepts abstraits non

toujours directement observables (le changement, l’autonomie, les savoirs-être... ). Les théories étudiées reposent sur ces concepts, souvent polysémiques et difficiles à définir.

Il faut donc valider la relation :

Concept abstrait

Construit (définition opérationnelle du

concept)

Croyance en dieu

Dimension

conséquentielle

Dimension Ritualiste

• Faites-vous des dons à des organisations caritatives ?

• Vous est-il arrivé de payer quelqu’un « au noir » ?

• Allez-vous à la messe ?

• Avez-vous fait baptiser vos enfants ?

Page 25: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation25

Les critères de validité de concept / construit

On compte jusqu’à douze moyens de l’évaluer, retenons notamment– La validité de contenu

L’opérationnalisation représente le concept sous tous ses aspects– La validité d’observation

Degré auquel le concept étudié peut se réduire à des observations– La validité de critère

Degré auquel on peut affirmer que le construit opérationnalisé est corrélé au concept qu’il est sensé représenter.

– La validité de traitDegré auquel on peut affirmer que le construit opérationnalisé permet de mesurer le concept qu’il

est sensé représenter.– La validité convergente

Deux mesures du concept par deux méthodes différentes sont efficaces.– La validité discriminante

Degré auquel le concept diffère d’autres concepts proches– La validité systémique

Degré auquel le concept permet l’intégration de concepts antérieurs ou de produire de nouveaux concepts

– …

C’est le type de validité le plus difficile à garantir

Zaltman, Pinson, and Angelmar, 1973 “Metatheory and Consumer Research”

Page 26: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation26

Évaluer la validité de construit : Matrice multitraits-multiméthodes

La matrice multitraits-multiméthodes synthétise la corrélation entre les mesures de différents traits par des méthodes différentes

Image d’origine: http://www.acm.org/sigchi/chi97/proceedings/paper/nt-tb3.gif

=1 diagonale monotrait-monométhode

diagonale monotrait-multiméthodes = validité convergente

Method 1 – Experiment 1

Method 2 – Experiment 1

Method 3 – Experiment 1

Method 1 – Experiment 1 Method 2 – Experiment 1 Method 3 – Experiment 1

multitraits-multiméthodes = validité discriminante

Campbell DT, Stanley JC (1966). “Convergent and discriminant validation by the multitrait-multimethod matrix”.

On peut aussi corréler les traits et méthodes avec eux-mêmes (plusieurs expériences). On évalue ainsi la reproductibilité d’une méthode …. = sa fiabilité

Page 27: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

La Fiabilité (reliability)

La mesure est-elle régulière ?La question de la fiabilité de l’instrument de mesure

Page 28: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation28

Qu’est-ce que la fiabilité?

Les opérations de la recherche peuvent être répétées à un autre moment par un autre chercheur avec le même résultat.

Si l’objet de la recherche ne change pas, une mesure parfaite donne le même résultat à chaque fois qu’elle est refaite.

• Trop de variabilité (écart-type) entre mesures = instrument pas fiable

Page 29: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation29

Mesures de fiabilité en recherche quantitative

Mesure lue

=

vraie valeur + erreur aléatoire + erreur systématique

Méthodes d’estimation de la fiabilité

1. Re-retestRefaire exactement la même mesure à des moments différents.

2. Méthodes des formes alternativesRe-retest avec un test différent (alternatif) mais mesurant la même chose.

3. Mesure de la cohérence internePour une échelle construite à partir de plusieurs items, tester leur cohérence. Alpha de

Cronbach, rho de Joreskog

Page 30: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation30

Validité et Fiabilité sont ils réservés à la recherche quantitative ?

Non !

Mais on ne procède pas de la même manière deux ces deux cas– Quanti => tests statistiques

– Quali => prendre certaines précautions, par exemple vérifier si on conserve le même résultat en changeant d’observateur

Problèmes possibles pour le qualitatif :– Critères observés ambigus

– Mal former les observateurs/enquêteurs problème d’harmonisation ses données collectées

– Situation trop dure à étudier

Page 31: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

Questions ?

Page 32: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

Rémi BACHELET

 Enseignant-chercheur,    Ecole Centrale de Lille

Mon CV est disponible ici.

Mes principaux cours à CentraleGestion de projet, sociologie des organisations, recueil, analyse et traitement de données, prévention du plagiat, module de marchés financiers, cours de qualité et méthodes de résolution de problèmes, établir des cartes conceptuelles, utiliser Wikipédia et CentraleWiki, formation au coaching pédagogique et à l'encadrement

Page 33: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

Pour mémoriser ce cours, voici une carte conceptuelle, vous trouverez ici d’autres cartes heuristiques sur ce cours

Page 34: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation

Autres cours :

1. Explorer ou vérifier ? Deux catégories d’approches

2. Éventails des démarches de recueil de données

3. Conception de questionnaires

4. Techniques d’entretien et reformulation

5. L'Analyse Factorielle des Correspondances pour les nuls

6. Validité et Fiabilité des données

Page 35: Methodologie Validite Et Fiabilite

Rémi BACHELET – Centrale Lille Utilisation ou copie interdites sans citation