Upload
euphemie-ruiz
View
108
Download
0
Embed Size (px)
Citation preview
Méthodologie de l’observation
Partie BStatistiques
De la situation de recherche au tableau de codage des données
Recherche-Problème à clarifier ou à résoudre
Recueil systématique des données quantitatives
Les données sont rassemblées dans un tableau de codage
Quelques précisions
• Mesurer (>< collecter des infos) = assigner des nombres à des choses selon des règles déterminées
• Une donnée (>< information) = une information quantitative, chiffrée
• Le codage = l’attribution d’une lettre ou d’un chiffre à une observation
Ex: codage de la variable sexe
1 = hommes
2 = femmes
Tableau de codage des données
Tableau à double entrée :
• Lignes unités d’observation ou sujets
• Colonnes variables
Sujets / Variables V1 V2 V3 …
1
2
3
…
Variables informatives ou d’identification
Variables observées ou mesurées
Tableau de codage des donnéesSujets / Variables V1 V2 V3 …
1 1 21 1
2 2 23 1
3 2 32 2
…
Légende de codage :
N° de la variable Enoncé de la variableSignification du code pour chaque modalité
V1 : sexe 1 = homme, 2 = femme
V2 : âge
V3 : motivation 1= très motivé
2=moyennement motivé3=pas du tout motivé
Les logiciels statistiques• Exemple de base de donnée sur SPSS
Tableau de fréquences des données
• A partir du tableau de codage des données, on peut établir, par TRI SIMPLE, les tableaux des fréquences des données
Exemple :
V1 : genre 1=garçon
• 2=fille
V2 :type d’étude
• 1=math
• 2=physique
• 3=chimie
N° V1 V2
1
2
3
4
5
6
7
8
9
10
1
1
1
1
2
2
2
1
1
2
1
1
2
3
1
2
3
1
2
2
Tableau de fréquences des données
• pour la variable « genre »
Modalités Fréquences (fi)
Pourcentages (Pi)
1
2
6
4
60
40
N° V1 V2
1
2
3
4
5
6
7
8
9
10
1
1
1
1
2
2
2
1
1
2
1
1
2
3
1
2
3
1
2
2
Tableau de fréquences des données
• pour la variable « type d’étude »
Modalités Fréquences (fi)
Pourcentages (Pi)
1
2
3
4
4
2
40
40
20
N° V1 V2
1
2
3
4
5
6
7
8
9
10
1
1
1
1
2
2
2
1
1
2
1
1
2
3
1
2
3
1
2
2
Tableau de fréquences des données
• Tableau des fréquences croisées
Garçons Filles Total
Math
Physique
Chimie
3
2
1
1
2
1
4
4
2
Total 6 4 10
N° V1 V2
1
2
3
4
5
6
7
8
9
10
1
1
1
1
2
2
2
1
1
2
1
1
2
3
1
2
3
1
2
2
Du concept à la variable
Pour être étudié, tout concept doit être opérationnalisé en variable
CONCEPT opérationnalisation VARIABLE
• Une variable = une quantité ou qualité susceptible de fluctuation.
• Au minimum, une variable a toujours 2 modalités, 2 fluctuations
Par exemple, la variable « sexe » possède deux modalités : fille et garçon
Du concept à la variable
• Devant un problème de recherche, il est très important – de bien préciser les variables qui interviennent dans ce
problème – ainsi que les relations que nous supposons entre ces
variables
• Ex: si nous pensons qu’en fin de 6ème primaire, les résultats des filles sont supérieurs à ceux des garçons, nous admettons l’existence de 2 variables : - le genre - les résultats scolaires
Statuts des variables
• Variable indépendante (VI) = représente la cause présumée, souvent manipulée par le chercheur
• Variable dépendante (VD) = traduit l’effet qui subit l’influence de la VI, variable que le chercheur mesure
Par exemple, si nous supposons que le choix des étudiants universitaires pour une filière d’études est en partie fonction du sexe des étudiants :
Le sexe des étudiants = variable indépendante
La filière d’études choisie = variable dépendante
VI VD
Exemple
• Dans l’hypothèse que les enfants de mères toxicomanes ont un poids de naissance plus faible que les enfants de mères non toxicomanes.
• La variable indépendante =
• La variable dépendante =
VI VD
Statuts des variables
• Variables interdépendantes = variables qui varient simultanément, par exemple sous l’influence d’une ou plusieurs variables indépendantes communes
Par exemple, la motivation et la réussite scolaire
V1VI
V2
Statuts des variables
• Variable contrôlée = variable susceptible d’influencer la variable dépendante, mais que le chercheur tentera de maintenir constante pour s’assurer que les changements observés dépendent bien du seul effet d’une ou plusieurs variables indépendantes
VC VDVI
Ex: l’âge des sujets peut devenir une variable contrôlée quand on veut étudier l’influence du moment de la journée sur les performances de mémoire
Exemple de variables contrôlée ou variables secondaires
Toxicomanie de la mère poids de naissance des enfants
Age de la mère
Tabagisme de la mère
Pour faire jouer une relation causale VI VD , le chercheur doit tenir compte de toutes les autres variables secondaires
S’il n’est pas à même de les analyser ou de les évincer de façon satisfaisante, il doit les mentionner
Quelques solutions possibles
• choisir avec soin sa population– échantillon de femmes de plus de 18 ans on supprime
déjà la première variable secondaire• mettre en place une variable-test
– mères non toxicomanes poids de naissance– mères toxicomanes poids de naissance – mères toxicomanes & tabagisme poids de naissance – mères toxicomanes & non tabagisme poids de naissance
On pourra dire que la relation causale entre la toxicomanie et le poids de naissance est réelle et persistante
Exercices : les variables
1) A propos des parents des élèves d’une école, nous avons défini 5 niveaux socio-culturels : les chômeurs, les ouvriers, les employés, les cadres, les professions libérales
2) Les élèves peuvent choisir le type d’études qu’ils veulent faire. Il y a pour cela trois orientations : « math fort », « sciences fort », « langues »
3) Les élèves d’une classe sont classés suivent leur résultat en mathématique
4) Pour étudier la longueur des «énoncés, on les a classés en trois types : le mot, la phrase, le paragraphe
5) On recherche si l’emploi ou non de termes techniques dans des énoncés a une influence sur la réussite ou non à un test
6) On classe les délégués commerciaux du plus jeune au plus âgé
Exercices : les variables
7) Pour une recherche relative à l’intelligence, on identifie chaque élève à l’avance ou le retard qu’il a (en mois) par rapport à la norme (âge normal à une date fixée).
8) On classe les élèves suivant l’ordre d’arrivée à un 100m9) On réalise une recherche sur le type d’enseignement
(traditionnel, par projet, interactif, programmé)10) On évalue le degré de responsabilité d’une personne lors d’un
accident. Est-elle tout à fait responsable ? en partie responsable ? un peu responsable ? pas du tout responsable ?
11) Dans un questionnaire, on classe diverses drogues selon qu’elles entraînent une dépendance ou non
12) On se demande si l’implantation géographique d’une institution (zone urbaine, rurale, ou semi-rurale) influence le nombre de comportements délinquants
Exercices : les variables
13) On cherche à connaître au sein de l’université la répartition des étudiants par faculté
14) Après un examen de recrutement de candidats au poste de rédacteur, toutes les copies sont classées suivant le degré de réussite
15) Dans une enquête, plusieurs items traitent de la famille – votre père est-il toujours en vie ? oui non – votre mère est-elle toujours en vie ? oui non – si oui, dans les deux cas, vos parents vivent-ils ? a)
ensemble, b) séparés, c) divorcés16) En consultation médicale, on examine un enfant de 5 ans17) Le fait d’être alcoolique ou non a-t-il des répercussions sur
l’unité du couple ?
Exercices : les variables
18) Après les dernières élections, un organisme tente de classer les partis en fonction du nombre de sièges obtenus au parlement. Pour ce faire, il détermine cinq catégories : pas de siège, un ou deux sièges, entre trois et cinq sièges, entre six et neuf sièges, plus de neuf sièges
Types d’échelles
Echelle nominale
• Elle définit simplement l’appartenance d’un élément à une modalité ou classe ou catégorie non hiérarchique– catégories exhaustives et mutuellement exclusives
• Chiffre = un symbole conventionnel, une étiquette Pas d’opérations tels que addition, multiplication, …
• Variables nominales dichotomiques = 2 modalités
• Variables nominales multichotomiques > 2 modalités
Exemple : Sexe : 1 = hommes, 2= femmes
Nationalité : 1 = belge, 2= français, 3= italien, …
Etat civil : 1 = célibataire, 2 = marié, 3 = divorcé, …
Types d’échellesEchelle ordinale
• Les nombres représentent des catégories ordonnées. Les modalités de la variable peuvent être rangées par ordre de grandeur, elles peuvent être hiérarchisées
• Chiffre = valeur d’ordre
• On distingue 3 types de variables ordinales : – Les catégories rangées = nombre limité de modalités ordonnées
les unes par rapport aux autres
• Ex : degré de motivation (1 = pas du tout motivé , 2 = moyennement motivé , 3 = très motivé )
– Les rangs = obtenus après un classement des unités d’observation
• Ex : 1= le 1er, 2 = le 2ème, 3 = le 3ème, …
– Les scores rangés = mesures quantitatives classiques rangées
• Ex : note d’examen
Types d’échelles
Echelle d’intervalle
• Les distances arithmétiques entre les nombres sont équivalentes
• Les données obtenues, issues d’un comptage ou d’une mesure précise, peuvent être situées sur une échelle de mesure orientée et possédant une unité de mesure propre
• Chiffre = valeur concrète
• Ex : température (degré Celsius)
• Rem: Echelle de rapport quand un zéro vrai– Ex: taille (cm), poids (kg) multiplications et divisions
Transformations d’échelle
• Un seul sens possible !
Echelle d’intervalle échelle ordinale échelle nominale
• On perd chaque fois de l’information !
Exemple
• Les résultats de fin d’année d’un groupe d’élèves (en %)
Élèves A B C D E F G H I
intervalle 26 32 38 44 50 56 62 68 74
ordinale < 35 de 35 et 49 De 50 à 65 > 65
nominale échec réussite
Exemple de transformation
1) Variable : l’âge
2) Variable : t° de l’eau d’un aquarium
• Échelle d’intervalle:
• Échelle ordinale:
• Échelle nominale:
Exercices : Type d’échelle
1) Pour un examen d’orientation, on a soumis les sujets à un ensemble de tests comprenant: une échelle verbale avec 5 niveaux de réussite, une échelle numérique comprenant 20 items précis, dont les scores sont soit 1, soit 0, la cote globale étant la somme des scores obtenus
2) On considère un échantillon de 45 enfants de trois à six ans répartis en quatre groupes selon leur mensuration en hauteur
3) Les élèves d’une classe sont répartis en A5 groupes selon leur degré d’attention. Cette attention est mesurée par diverses épreuves et la note globale varie de 0 à 10
4) Considérons un test de connaissances générales préalablement étalonné. Le test est composé de questions supposées de même valeur. On attribue un point par question. A l’issue de la passation, chaque sujet obtient un score compris entre 0 et 100
Exercices : Type d’échelle5) Pour une recherche concernant la rentabilité au travail, on classe
les ouvriers d’une entreprise en trois groupes : arrivés avant l’heure, arrivés à l’heure, arrivés en retard
6) A l’occasion d’une enquête sociologique, on demande à un groupe de personnes âgées de choisir 3 valeurs parmi 20 valeurs données, selon l’importance qu’elles leur attribuent dans leur vie.
7) On désire ranger les clients fidèles à telle marque de véhicules automobiles suivant le milieu socio-culturel auquel ils appartiennent. On détermine ainsi trois catégories sociales
8) On classe les élèves suivant leur ville ou leur village d’origine 9) Un enseignant voudrait évaluer l’influence de la longueur des
énoncés et l’influence de la fréquence d’emploi de termes techniques dans ces énoncés sur la réussite à des problèmes de statistique
Statistiques
• La statistique descriptive rassemble les méthodes de dénombrement, de classement et de présentation des données quantitatives relatives à une population donnée
• La statistique inférentielle a pour fonction de généraliser à toute une population donnée des observations et conclusions tirées à partir des résultats obtenus sur un petit nombre d’individus appartenant à cette population
4 types de recherche
On peut distinguer selon le type de question-probème, différents types de recherches:
• Les recherches de description
Recherches inférentielles:
• Les recherches d’estimation
• Les recherches de comparaison
• Les recherches de liaison ou de relation
Les types de recherches
Recherche de description
• = DECRIRE les caractéristiques d’une ou de plusieurs variables d’un échantillon ou d’une population
• Ex : Quelle est la moyenne des résultats obtenus par des étudiants de 1ère licence
• Quel est le profil psycho-social de la population X ?
Les types de recherches
Recherche d’estimation • ESTIMER dans quelle mesure les caractéristiques d’un
échantillon correspondent à celles de la population de référence estimer la représentativité de l’échantillon
• 3 types principaux de problèmes d’estimation – valeur d’un sondage (on connaît les caractéristiques de la
population de référence)– confrontation à des résultats antérieurs – confrontation à une hypothèse théorique
• Ex : Les résultats de 20 examens corrigés sur 300 reflètent-ils les résultats de l’ensemble des étudiants de 1ère licence ?
Recherche d’estimation: exemple
• Je dispose d’un échantillon de 20 sujets dont 8 hommes et 12 femmes.
• Cet échantillon est-il bien représentatif de la population de référence au sein de laquelle on trouve 52% de femmes et 48% d’hommes ?
Les types de recherches
Recherche de comparaison
• = COMPARER les caractéristiques de 2 échantillons ou de 2 groupes d’un même échantillon
• On s’intéresse à la relation causale entre 2 variables:
La VD est-elle sous l’influence de la VI ?
Ex : Le sexe influence-t-il les résultats scolaires? les résultats aux examens (VD) sont-ils les mêmes chez les
garçons que chez les filles ? (sexe = VI) Comparaison de 2 groupes: les filles et les garçons
Recherche de comparaison : exemple
• Je veux savoir si le taux d’obésité (VD) parmi mes patients dépend de leur nationalité (VI)
La nationalité le taux d’obésité
• On comparera le taux d’obésité de 2 ou plusieurs groupes de patients ayant la même nationalité
comparaison du poids moyen de patients espagnols par rapport au poids moyen de patients allemands
Les types de recherches
Recherche de liaison
• examiner le LIEN possible (la relation) entre 2 variables interdépendantes
• Les 2 variables sont sur un pied d’égalité : ce sont des variables interdépendantes. – On ne peut jamais affirmer que la variable X est la cause de la
variable Y !!!
• On va calculer une corrélation entre les 2 variables– Corrélation positive si les 2 variables varient dans le même sens
– Corrélation négative si les 2 variables fluctuent dans des sens opposés
Recherche de liaison : exemple
• Y a-t-il une relation chez les élèves entre les résultats en analyse et les résultats en résolution de problèmes?
• Résultat de l’étude de corrélation: les élèves les plus forts en analyse sont aussi ceux qui résolvent le mieux les problèmes arithmétiques qui leur sont présentés.
corrélation positive
Algorithme d’une démarche Se poser une question-problème
Analyser le type de question-problème et définir le type de recherche
Recherche de description
Recherche d’estimation
Recherche de comparaison
Recherche de liaison
Identifier la ou les variables + leur statut (VD, VI)
Identifier le type d’échelle de chacune des variables
Echelle nominale
Echelle ordinale
Echelle d’intervalle
Choisir et appliquer le test statistique
Exercices : Types de recherche
1) Les étudiants en biologie ont-ils de meilleurs résultats en statistique que les étudiants en sociologie ?
2) Y a-t-il dans ma classe une relation entre l’origine socio-économique et les résultats scolaires ?
3) Pour les étudiants universitaires, existe-t-il une relation entre le choix des études et le sexe ?
4) Deux juges sont priés de ranger 20 candidats représentants de commerce en fonction de critères de présentation et d’expression ? Jugent-ils de la même façon ?
5) Y a-t-il une relation entre l’origine socio-économique et le rendement scolaire des élèves de trois classes ?
6) En dehors des connaissances orthographiques, dans quelle mesure les résultats d’une dictée sont-ils influencés par la présentation du texte, la motivation des élèves, la vitesse de lecture?
Exercices : Types de recherche
7) Les résultats des élèves de cette classe à ce test de culture générale sont-ils semblables à ceux des élèves francophones belges ?
8) On décrit avec beaucoup de soin les types et taux de comportements agressifs d’une population carcérale donnée
9) Peut-on affirmer que, dans notre échantillon de délinquants, il y a autant de jeunes de moins de 17 ans que de jeunes de plus de 17 ans qui ont commis un délit mineur ?
10) Y a-t-il une relation entre le taux d’absentéisme à l’école et le degré de réussite scolaire ?
11) Peut-on affirmer que les accidents survenant la nuit sont plus meurtriers lorsque l’éclairage est moindre?
12) Le type de répression choisi pour de jeunes délinquants dépend-il du type de délits commis ?
13) Une meilleure insertion sociale (sur une échelle à 7 degrés) dépend-elle du dernier niveau d’études atteint ?