41
Méthodologie de l’observation Partie B Statistiques

Méthodologie de l’observation Partie B Statistiques

Embed Size (px)

Citation preview

Page 1: Méthodologie de l’observation Partie B Statistiques

Méthodologie de l’observation

Partie BStatistiques

Page 2: Méthodologie de l’observation Partie B Statistiques

De la situation de recherche au tableau de codage des données

Recherche-Problème à clarifier ou à résoudre

Recueil systématique des données quantitatives

Les données sont rassemblées dans un tableau de codage

Page 3: Méthodologie de l’observation Partie B Statistiques

Quelques précisions

• Mesurer (>< collecter des infos) = assigner des nombres à des choses selon des règles déterminées

• Une donnée (>< information) = une information quantitative, chiffrée

• Le codage = l’attribution d’une lettre ou d’un chiffre à une observation

Ex: codage de la variable sexe

1 = hommes

2 = femmes

Page 4: Méthodologie de l’observation Partie B Statistiques

Tableau de codage des données

Tableau à double entrée :

• Lignes unités d’observation ou sujets

• Colonnes variables

Sujets / Variables V1 V2 V3 …

1

2

3

Variables informatives ou d’identification

Variables observées ou mesurées

Page 5: Méthodologie de l’observation Partie B Statistiques

Tableau de codage des donnéesSujets / Variables V1 V2 V3 …

1 1 21 1

2 2 23 1

3 2 32 2

Légende de codage  :

N° de la variable Enoncé de la variableSignification du code pour chaque modalité

V1 : sexe 1 = homme, 2 = femme

V2 : âge

V3 : motivation 1= très motivé

2=moyennement motivé3=pas du tout motivé

Page 6: Méthodologie de l’observation Partie B Statistiques

Les logiciels statistiques• Exemple de base de donnée sur SPSS 

Page 7: Méthodologie de l’observation Partie B Statistiques

Tableau de fréquences des données

• A partir du tableau de codage des données, on peut établir, par TRI SIMPLE, les tableaux des fréquences des données

Exemple :

V1 : genre 1=garçon

• 2=fille

V2 :type d’étude

• 1=math

• 2=physique

• 3=chimie

N° V1 V2

1

2

3

4

5

6

7

8

9

10

1

1

1

1

2

2

2

1

1

2

1

1

2

3

1

2

3

1

2

2

Page 8: Méthodologie de l’observation Partie B Statistiques

Tableau de fréquences des données

• pour la variable « genre »

Modalités Fréquences (fi)

Pourcentages (Pi)

1

2

6

4

60

40

N° V1 V2

1

2

3

4

5

6

7

8

9

10

1

1

1

1

2

2

2

1

1

2

1

1

2

3

1

2

3

1

2

2

Page 9: Méthodologie de l’observation Partie B Statistiques

Tableau de fréquences des données

• pour la variable « type d’étude »

Modalités Fréquences (fi)

Pourcentages (Pi)

1

2

3

4

4

2

40

40

20

N° V1 V2

1

2

3

4

5

6

7

8

9

10

1

1

1

1

2

2

2

1

1

2

1

1

2

3

1

2

3

1

2

2

Page 10: Méthodologie de l’observation Partie B Statistiques

Tableau de fréquences des données

• Tableau des fréquences croisées

Garçons Filles Total

Math

Physique

Chimie

3

2

1

1

2

1

4

4

2

Total 6 4 10

N° V1 V2

1

2

3

4

5

6

7

8

9

10

1

1

1

1

2

2

2

1

1

2

1

1

2

3

1

2

3

1

2

2

Page 11: Méthodologie de l’observation Partie B Statistiques

Du concept à la variable 

Pour être étudié, tout concept doit être opérationnalisé en variable

CONCEPT opérationnalisation VARIABLE

• Une variable = une quantité ou qualité susceptible de fluctuation.

• Au minimum, une variable a toujours 2 modalités, 2 fluctuations

Par exemple, la variable « sexe » possède deux modalités : fille et garçon

Page 12: Méthodologie de l’observation Partie B Statistiques

Du concept à la variable

• Devant un problème de recherche, il est très important – de bien préciser les variables qui interviennent dans ce

problème – ainsi que les relations que nous supposons entre ces

variables

• Ex: si nous pensons qu’en fin de 6ème primaire, les résultats des filles sont supérieurs à ceux des garçons, nous admettons l’existence de 2 variables : - le genre - les résultats scolaires

Page 13: Méthodologie de l’observation Partie B Statistiques

Statuts des variables

• Variable indépendante (VI) = représente la cause présumée, souvent manipulée par le chercheur

• Variable dépendante (VD) = traduit l’effet qui subit l’influence de la VI, variable que le chercheur mesure

Par exemple, si nous supposons que le choix des étudiants universitaires pour une filière d’études est en partie fonction du sexe des étudiants :

Le sexe des étudiants = variable indépendante

La filière d’études choisie = variable dépendante

VI VD

Page 14: Méthodologie de l’observation Partie B Statistiques

Exemple

• Dans l’hypothèse que les enfants de mères toxicomanes ont un poids de naissance plus faible que les enfants de mères non toxicomanes.

• La variable indépendante =

• La variable dépendante =

VI VD

Page 15: Méthodologie de l’observation Partie B Statistiques

Statuts des variables

• Variables interdépendantes = variables qui varient simultanément, par exemple sous l’influence d’une ou plusieurs variables indépendantes communes

Par exemple, la motivation et la réussite scolaire

V1VI

V2

Page 16: Méthodologie de l’observation Partie B Statistiques

Statuts des variables

• Variable contrôlée = variable susceptible d’influencer la variable dépendante, mais que le chercheur tentera de maintenir constante pour s’assurer que les changements observés dépendent bien du seul effet d’une ou plusieurs variables indépendantes

VC VDVI

Ex: l’âge des sujets peut devenir une variable contrôlée quand on veut étudier l’influence du moment de la journée sur les performances de mémoire

Page 17: Méthodologie de l’observation Partie B Statistiques

Exemple de variables contrôlée ou variables secondaires

Toxicomanie de la mère poids de naissance des enfants

Age de la mère

Tabagisme de la mère

Pour faire jouer une relation causale VI VD , le chercheur doit tenir compte de toutes les autres variables secondaires

S’il n’est pas à même de les analyser ou de les évincer de façon satisfaisante, il doit les mentionner

Page 18: Méthodologie de l’observation Partie B Statistiques

Quelques solutions possibles

• choisir avec soin sa population– échantillon de femmes de plus de 18 ans on supprime

déjà la première variable secondaire• mettre en place une variable-test

– mères non toxicomanes poids de naissance– mères toxicomanes poids de naissance – mères toxicomanes & tabagisme poids de naissance – mères toxicomanes & non tabagisme poids de naissance

On pourra dire que la relation causale entre la toxicomanie et le poids de naissance est réelle et persistante

Page 19: Méthodologie de l’observation Partie B Statistiques

Exercices : les variables

1) A propos des parents des élèves d’une école, nous avons défini 5 niveaux socio-culturels : les chômeurs, les ouvriers, les employés, les cadres, les professions libérales

2) Les élèves peuvent choisir le type d’études qu’ils veulent faire. Il y a pour cela trois orientations : « math  fort », « sciences fort », « langues »

3) Les élèves d’une classe sont classés suivent leur résultat en mathématique

4) Pour étudier la longueur des «énoncés, on les a classés en trois types : le mot, la phrase, le paragraphe

5) On recherche si l’emploi ou non de termes techniques dans des énoncés a une influence sur la réussite ou non à un test

6) On classe les délégués commerciaux du plus jeune au plus âgé

Page 20: Méthodologie de l’observation Partie B Statistiques

Exercices : les variables

7) Pour une recherche relative à l’intelligence, on identifie chaque élève à l’avance ou le retard qu’il a (en mois) par rapport à la norme (âge normal à une date fixée).

8) On classe les élèves suivant l’ordre d’arrivée à un 100m9) On réalise une recherche sur le type d’enseignement

(traditionnel, par projet, interactif, programmé)10) On évalue le degré de responsabilité d’une personne lors d’un

accident. Est-elle tout à fait responsable ? en partie responsable ? un peu responsable ? pas du tout responsable ?

11) Dans un questionnaire, on classe diverses drogues selon qu’elles entraînent une dépendance ou non

12) On se demande si l’implantation géographique d’une institution (zone urbaine, rurale, ou semi-rurale) influence le nombre de comportements délinquants

Page 21: Méthodologie de l’observation Partie B Statistiques

Exercices : les variables

13) On cherche à connaître au sein de l’université la répartition des étudiants par faculté

14) Après un examen de recrutement de candidats au poste de rédacteur, toutes les copies sont classées suivant le degré de réussite

15) Dans une enquête, plusieurs items traitent de la famille – votre père est-il toujours en vie ? oui non – votre mère est-elle toujours en vie ? oui non – si oui, dans les deux cas, vos parents vivent-ils ? a)

ensemble, b) séparés, c) divorcés16) En consultation médicale, on examine un enfant de 5 ans17) Le fait d’être alcoolique ou non a-t-il des répercussions sur

l’unité du couple ?

Page 22: Méthodologie de l’observation Partie B Statistiques

Exercices : les variables

18) Après les dernières élections, un organisme tente de classer les partis en fonction du nombre de sièges obtenus au parlement. Pour ce faire, il détermine cinq catégories : pas de siège, un ou deux sièges, entre trois et cinq sièges, entre six et neuf sièges, plus de neuf sièges

Page 23: Méthodologie de l’observation Partie B Statistiques

Types d’échelles

Echelle nominale

• Elle définit simplement l’appartenance d’un élément à une modalité ou classe ou catégorie non hiérarchique– catégories exhaustives et mutuellement exclusives

• Chiffre = un symbole conventionnel, une étiquette Pas d’opérations tels que addition, multiplication, …

• Variables nominales dichotomiques = 2 modalités

• Variables nominales multichotomiques > 2 modalités

Exemple : Sexe : 1 = hommes, 2= femmes

Nationalité : 1 = belge, 2= français, 3= italien, …

Etat civil : 1 = célibataire, 2 = marié, 3 = divorcé, …

Page 24: Méthodologie de l’observation Partie B Statistiques

Types d’échellesEchelle ordinale

• Les nombres représentent des catégories ordonnées. Les modalités de la variable peuvent être rangées par ordre de grandeur, elles peuvent être hiérarchisées

• Chiffre = valeur d’ordre

• On distingue 3 types de variables ordinales : – Les catégories rangées = nombre limité de modalités ordonnées

les unes par rapport aux autres

• Ex : degré de motivation (1 = pas du tout motivé , 2 = moyennement motivé , 3 = très motivé )

– Les rangs = obtenus après un classement des unités d’observation

• Ex : 1= le 1er, 2 = le 2ème, 3 = le 3ème, …

– Les scores rangés = mesures quantitatives classiques rangées

• Ex : note d’examen

Page 25: Méthodologie de l’observation Partie B Statistiques

Types d’échelles

Echelle d’intervalle

• Les distances arithmétiques entre les nombres sont équivalentes

• Les données obtenues, issues d’un comptage ou d’une mesure précise, peuvent être situées sur une échelle de mesure orientée et possédant une unité de mesure propre

• Chiffre = valeur concrète

• Ex : température (degré Celsius)

• Rem: Echelle de rapport quand un zéro vrai– Ex: taille (cm), poids (kg) multiplications et divisions

Page 26: Méthodologie de l’observation Partie B Statistiques

Transformations d’échelle

• Un seul sens possible !

Echelle d’intervalle échelle ordinale échelle nominale

• On perd chaque fois de l’information !

Exemple

• Les résultats de fin d’année d’un groupe d’élèves (en %)

Élèves A B C D E F G H I

intervalle 26 32 38 44 50 56 62 68 74

ordinale < 35 de 35 et 49 De 50 à 65 > 65

nominale échec réussite

Page 27: Méthodologie de l’observation Partie B Statistiques

Exemple de transformation

1) Variable : l’âge

2) Variable : t° de l’eau d’un aquarium

• Échelle d’intervalle:

• Échelle ordinale:

• Échelle nominale:

Page 28: Méthodologie de l’observation Partie B Statistiques

Exercices : Type d’échelle

1) Pour un examen d’orientation, on a soumis les sujets à un ensemble de tests comprenant: une échelle verbale avec 5 niveaux de réussite, une échelle numérique comprenant 20 items précis, dont les scores sont soit 1, soit 0, la cote globale étant la somme des scores obtenus

2) On considère un échantillon de 45 enfants de trois à six ans répartis en quatre groupes selon leur mensuration en hauteur

3) Les élèves d’une classe sont répartis en A5 groupes selon leur degré d’attention. Cette attention est mesurée par diverses épreuves et la note globale varie de 0 à 10

4) Considérons un test de connaissances générales préalablement étalonné. Le test est composé de questions supposées de même valeur. On attribue un point par question. A l’issue de la passation, chaque sujet obtient un score compris entre 0 et 100

Page 29: Méthodologie de l’observation Partie B Statistiques

Exercices : Type d’échelle5) Pour une recherche concernant la rentabilité au travail, on classe

les ouvriers d’une entreprise en trois groupes : arrivés avant l’heure, arrivés à l’heure, arrivés en retard

6) A l’occasion d’une enquête sociologique, on demande à un groupe de personnes âgées de choisir 3 valeurs parmi 20 valeurs données, selon l’importance qu’elles leur attribuent dans leur vie.

7) On désire ranger les clients fidèles à telle marque de véhicules automobiles suivant le milieu socio-culturel auquel ils appartiennent. On détermine ainsi trois catégories sociales

8) On classe les élèves suivant leur ville ou leur village d’origine 9) Un enseignant voudrait évaluer l’influence de la longueur des

énoncés et l’influence de la fréquence d’emploi de termes techniques dans ces énoncés sur la réussite à des problèmes de statistique

Page 30: Méthodologie de l’observation Partie B Statistiques

Statistiques

• La statistique descriptive rassemble les méthodes de dénombrement, de classement et de présentation des données quantitatives relatives à une population donnée

• La statistique inférentielle a pour fonction de généraliser à toute une population donnée des observations et conclusions tirées à partir des résultats obtenus sur un petit nombre d’individus appartenant à cette population

Page 31: Méthodologie de l’observation Partie B Statistiques

4 types de recherche

On peut distinguer selon le type de question-probème, différents types de recherches:

• Les recherches de description

Recherches inférentielles:

• Les recherches d’estimation

• Les recherches de comparaison

• Les recherches de liaison ou de relation

Page 32: Méthodologie de l’observation Partie B Statistiques

Les types de recherches

Recherche de description

• = DECRIRE les caractéristiques d’une ou de plusieurs variables d’un échantillon ou d’une population

• Ex : Quelle est la moyenne des résultats obtenus par des étudiants de 1ère licence

• Quel est le profil psycho-social de la population X ?

Page 33: Méthodologie de l’observation Partie B Statistiques

Les types de recherches

Recherche d’estimation • ESTIMER dans quelle mesure les caractéristiques d’un

échantillon correspondent à celles de la population de référence estimer la représentativité de l’échantillon

• 3 types principaux de problèmes d’estimation  – valeur d’un sondage (on connaît les caractéristiques de la

population de référence)– confrontation à des résultats antérieurs – confrontation à une hypothèse théorique

• Ex : Les résultats de 20 examens corrigés sur 300 reflètent-ils les résultats de l’ensemble des étudiants de 1ère licence ?

Page 34: Méthodologie de l’observation Partie B Statistiques

Recherche d’estimation: exemple

• Je dispose d’un échantillon de 20 sujets dont 8 hommes et 12 femmes.

• Cet échantillon est-il bien représentatif de la population de référence au sein de laquelle on trouve 52% de femmes et 48% d’hommes ?

Page 35: Méthodologie de l’observation Partie B Statistiques

Les types de recherches

Recherche de comparaison

• = COMPARER les caractéristiques de 2 échantillons ou de 2 groupes d’un même échantillon

• On s’intéresse à la relation causale entre 2 variables:

La VD est-elle sous l’influence de la VI ?

Ex : Le sexe influence-t-il les résultats scolaires? les résultats aux examens (VD) sont-ils les mêmes chez les

garçons que chez les filles ? (sexe = VI) Comparaison de 2 groupes: les filles et les garçons

Page 36: Méthodologie de l’observation Partie B Statistiques

Recherche de comparaison : exemple

• Je veux savoir si le taux d’obésité (VD) parmi mes patients dépend de leur nationalité (VI)

La nationalité le taux d’obésité

• On comparera le taux d’obésité de 2 ou plusieurs groupes de patients ayant la même nationalité

comparaison du poids moyen de patients espagnols par rapport au poids moyen de patients allemands

Page 37: Méthodologie de l’observation Partie B Statistiques

Les types de recherches

Recherche de liaison

• examiner le LIEN possible (la relation) entre 2 variables interdépendantes

• Les 2 variables sont sur un pied d’égalité : ce sont des variables interdépendantes. – On ne peut jamais affirmer que la variable X est la cause de la

variable Y !!!

• On va calculer une corrélation entre les 2 variables– Corrélation positive si les 2 variables varient dans le même sens

– Corrélation négative si les 2 variables fluctuent dans des sens opposés

Page 38: Méthodologie de l’observation Partie B Statistiques

Recherche de liaison : exemple

• Y a-t-il une relation chez les élèves entre les résultats en analyse et les résultats en résolution de problèmes?

• Résultat de l’étude de corrélation: les élèves les plus forts en analyse sont aussi ceux qui résolvent le mieux les problèmes arithmétiques qui leur sont présentés.

corrélation positive

Page 39: Méthodologie de l’observation Partie B Statistiques

Algorithme d’une démarche Se poser une question-problème

Analyser le type de question-problème et définir le type de recherche

Recherche de description

Recherche d’estimation

Recherche de comparaison

Recherche de liaison

Identifier la ou les variables + leur statut (VD, VI)

Identifier le type d’échelle de chacune des variables

Echelle nominale

Echelle ordinale

Echelle d’intervalle

Choisir et appliquer le test statistique

Page 40: Méthodologie de l’observation Partie B Statistiques

Exercices : Types de recherche

1) Les étudiants en biologie ont-ils de meilleurs résultats en statistique que les étudiants en sociologie ?

2) Y a-t-il dans ma classe une relation entre l’origine socio-économique et les résultats scolaires ?

3) Pour les étudiants universitaires, existe-t-il une relation entre le choix des études et le sexe ?

4) Deux juges sont priés de ranger 20 candidats représentants de commerce en fonction de critères de présentation et d’expression ? Jugent-ils de la même façon ?

5) Y a-t-il une relation entre l’origine socio-économique et le rendement scolaire des élèves de trois classes ?

6) En dehors des connaissances orthographiques, dans quelle mesure les résultats d’une dictée sont-ils influencés par la présentation du texte, la motivation des élèves, la vitesse de lecture?

Page 41: Méthodologie de l’observation Partie B Statistiques

Exercices : Types de recherche

7) Les résultats des élèves de cette classe à ce test de culture générale sont-ils semblables à ceux des élèves francophones belges ?

8) On décrit avec beaucoup de soin les types et taux de comportements agressifs d’une population carcérale donnée

9) Peut-on affirmer que, dans notre échantillon de délinquants, il y a autant de jeunes de moins de 17 ans que de jeunes de plus de 17 ans qui ont commis un délit mineur ?

10) Y a-t-il une relation entre le taux d’absentéisme à l’école et le degré de réussite scolaire ?

11) Peut-on affirmer que les accidents survenant la nuit sont plus meurtriers lorsque l’éclairage est moindre?

12) Le type de répression choisi pour de jeunes délinquants dépend-il du type de délits commis ?

13) Une meilleure insertion sociale (sur une échelle à 7 degrés) dépend-elle du dernier niveau d’études atteint ?