Upload
dangtu
View
225
Download
0
Embed Size (px)
Citation preview
MeS
SM
od
ule
II
S1
RModule 2: Les échelles
• Echelles et mesure en sciences sociales- Mesurer des concepts abstraits/complexes (p.ex. attitudes)
- Mesures et questionnaires (questions
• Echelles (tests, indices)
- Echelles “conceptuelles” (Exemple Postmatérialisme)
- Création d’échelles ad hoc (Potentiel d’action)
- Catalogues d’échelles, nomenclatures (ex. des professions)
- Développement systématique d’échelles (Guttman, Likert,…)
• Echelles- Uni-dimensionnelles
- Multi-dimensionnelles
• Outils d’analyse- Tableaux de moyennes, analyse de la variance
- Segmentation
• SPSS- Transformations: RECODE, IF, COMPUTE
MeS
SM
od
ule
II
S2
RMesurer l’intérêt pour la politique
• Indicateur synthétique: uni- ou multi-dimensionnel?
- Intérêt: concept unidimensionnel?-→ Création d’une échelle uni-dimensionnelle
Indicateur 3Indicateur 4
Indicateur 2Indicateur 1
Indicateur“synthétique”
(Echelle)
Manifeste Latent
- Intérêt: concept multi-dimensionnel? → Plusieurs échelles...
Intérêt actifIndicateur 3Indicateur 4
Indicateur 2Indicateur 1
Intérêt passifIndicateur 7Indicateur 8
Indicateur 6Indicateur 5
Intérêt pour la
Manifeste Latent
politique
Intérêt pour lapolitique
MeS
SM
od
ule
II
S3
REchelles unidimensionnelles
• Variable latente: Conceptualisation et mesure- Hypothèse a priori: unidimensionalité
• Construction- Batteries de questions
- Construction (technique)- Type d’échelle: classification, continue, ....
→ Niveau de mesure
- Construction: règles ad-hoc- Echelle additive
→ Propriétés: items substituables
- Démarches systématiqueschoix des items et construction de l’échelle
- Echelle de Thurstone- Echelle de Likert (échelle additive)- Echelle de Guttman (échelle additive hiérarchique)
• Diagnostic et étude de la cohérence- Distribution- Corrélations items/échelle (RELIABILITY, alpha de Cronbach)
• Validation de l’échelle- Pertinence dans l’analyse
- Echelle de leadership d’opinion- Proposition 1: Leader/Non-Leader
- Proposition 2: Classification en 4 groupes
- Proposition 3: Echelle continue (additive)
- Proposition 4: ....
- Echelle additive- Simple
PotAct = A + B + C + D + EPotAct = (A + B + C + D + E)/5
- Avec pondérationPotAct = A + B + 1.5•C + 2•D + 2•E
MeS
SM
od
ule
II
S4
REchelle de post-matérialisme (Inglehart)
- Théorie qui postule un changement irréversible des priorités devaleurs dans les sociétés post-industrielles
- Mesure: question
- Objectifs de la société: Indiquer l’objectif prioritaire, le deuxième....
- A. Maintenir l’ordre et la sécurité
- B. Améliorer la participation des citoyens
- C. Combattre la hausse de prix
- D. Garantir la liberté d’expression
Première priorité
A B C D
A (1) 3 1 3B 2 (4) 2 4C 1 3 (1) 3D 2 4 2 (4)2e
prio
rité
1 = Matérialiste2 = Plutôt matérialiste3 = Plutôt post-matérialiste4 = Post-matérialiste
Tableau logique(règles de construction)
Instructions SPSS
MeS
SM
od
ule
II
S5
R
Première priorité (P1)
1 2 3 4
1 (1) 3 1 32 2 (4) 2 43 1 3 (1) 34 2 4 2 (4)2epr
iori
té(P
2)• 16 conditions logiques
IF P1=1 AND P2=1 PMAT= 1.IF P1=1 AND P2=2 PMAT= 2.IF P1=1 AND P2=3 PMAT= 1.IF P1=1 AND P2=4 PMAT= 2.IF P1=2 AND P2=1 PMAT= 3.IF P1=2 AND P2=2 PMAT= 4.IF P1=2 AND P2=3 PMAT= 3.IF P1=2 AND P2=4 PMAT= 4.IF P1=3 AND P2=1 PMAT= 1.IF P1=3 AND P2=2 PMAT= 2.IF P1=3 AND P2=3 PMAT= 1.IF P1=3 AND P2=4 PMAT= 2.IF P1=4 AND P2=1 PMAT= 3.IF P1=4 AND P2=2 PMAT= 4.IF P1=4 AND P2=3 PMAT= 3.IF P1=4 AND P2=4 PMAT= 4.
VARIABLE LABEL PMAT “Echelle d’Inglehart”.VALUE LABELS PMAT 1 “Matérialiste” 2 “plutôt matérialiste”
3 “plutôt post-matérialiste” 4 “Post-matérialiste”.
Données manquantes?
MeS
SM
od
ule
II
S6
RMesures de cohérence d’une échelle additive
• Procédure RELIABILITY
- Corrélations entre échelle et variables (items)
- Importance relative de chaque variable
• Coefficient de Cronbach
- Mesure de cohérence interne de l’échelle
- Corrélation (moyenne) entre l’échelle et les items
- Varie entre 0 et 1 (conseillé: min. 0.7)
k = nombre d’items
Vartot = variance totale (covariation des items)
Varitem = variance spécifique à chaque item
k
k 1–-----------
Vartot Varitem
item 1=
k
–
Vartot
-------------------------------------------------------------=
MeS
SM
od
ule
II
S7
R
Echelles multidimensionnelles
• Démarche
- Analyse de la covariation: Première, 2e, ... dimension (“axes”)
- Variables latentes: Dimensions sous-jacentes (facteurs, composants)
- Analyse factorielle (ACP=Analyse en composantes principales)
• Eléments
- Centralité des variables (communalités)
- Combien de dimensions?
- Importance d’une dimension: % de variance expliquée
- Echelles des variables [corrélations variables/facteurs] →Interprétation, baptême de dimension
- Echelles des observations (scores factoriels)
• Validation de l’échelle
- Pertinence dans l’analyse
MeS
SM
od
ule
II
S8
R
1.000 .548
1.000 .441
1.000 .514
1.000 .540
1.000 .518
1.000 .402
1.000 .517
1.000 .502
1.000 .479
1.000 .451
Communalities
moderne CH Moderne
fermee CH Fermée
peupart PartFaible des citoyens
fsuisses Plus de chances aux suisses
autpays Ecoute autres pays
cantons Cantons plus de pouvoir
marche Confiance au marché
revegal Revenus égalitaires
economie Economie plus importante
sarmee CH sans armée
Initi
al
Ext
ract
ion
Extraction Method: Principal Component Analysis.
Centralité des variables (corrélations entre chaque item et la structure factorielle)
Communalités
MeS
SM
od
ule
II
S9
R
Total Variance Explained
2.35 23.46 23.46 2.35 23.46 23.46
1.35 13.52 36.98 1.35 13.52 36.98
1.21 12.13 49.11 1.21 12.13 49.11
.96 9.60 58.70
.90 9.02 67.73
.81 8.10 75.83
.74 7.45 83.28
.63 6.32 89.60
.55 5.54 95.14
.49 4.86 100.00
Component1
2
3
4
5
6
7
8
9
10
Total% of
Variance Cumulative % Total% of
Variance Cumulative %
Initial Eigenvalues Extraction Sums of Squared Loadings
Extraction Method: Principal Component Analysis.
Importance relative des facteurs: Variance expliquée
Résultat de l’extraction des facteurs
Valeurs propres v
MeS
SM
od
ule
II
S10
R
Component Matrixa
.691 -.064 .257
-.651 .011 .132
.129 -.677 .198
-.698 .064 .219
.658 .029 .289
-.184 .419 .439
-.075 -.024 .715
.025 .674 .217
-.248 -.476 .437
.638 .165 .130
moderne CH Moderne
fermee CH Fermée
peupart PartFaible des citoyens
fsuisses Plus de chances aux suisses
autpays Ecoute autres pays
cantons Cantons plus de pouvoir
marche Confiance au marché
revegal Revenus égallitaires
economie Economie plus importante
sarmee CH sans armée
1 2 3
Component
Extraction Method: Principal Component Analysis.
3 components extracted.a.
Corrélation de cette variableavec la première dimension
• Corrélations entre variables et facteurs
- Coordonnées factorielles, (factor) loadings, cosinus (des angles),composantes (principales)
MeS
SM
od
ule
II
S11
R
• Corrélations entre variables et facteurs- Coordonnées factorielles, (factor) loadings, composantes (principales)
Component Matrixa
-.698 .219
.691 .257
.658 .289
-.651
.638
-.677
.674 .217
-.248 -.476 .437
.715
.419 .439
fsuisses Plus de chances aux suisses
moderne CH Moderne
autpays Ecoute autres pays
fermee CH Fermée
sarmee CH sans armée
peupart PartFaible des citoyens
revegal Revenus égalitaires
economie Economie plus importante
marche Confiance au marché
cantons Cantons plus de pouvoir
1 2 3
Component
Extraction Method: Principal Component Analysis.
3 components extracted.a.
Coordonnées
MeS
SM
od
ule
II
S12
R
-0.75 -0.50 -0.25 0.00 0.25 0.50 0.75
Component 1
-0.75
-0.50
-0.25
0.00
0.25
0.50
0.75
Component2
CH ModerneCH Fermée
PartFaible des citoyens
Plus de chances aux suisses
Ecoute autres pays
Cantons plus de pouvoir
Confiance au marché
Revenus égalitaires
Economie plus importante
CH sans armée
Component Plot
Dimension 1 et 2
Co
mp
on
en
t2
Variance expliquée 24%
Va
ria
nce
exp
liq
uée
14%
Interprétation des dimensions
Qu’est-ce queces variablesont en commun?
En quoi ces deuxgroupes de variabless’opposent?
MeS
SM
od
ule
II
S13
R
Scores (valeurs) factoriels
• Analyse des scores factoriels avec d’autres variables
- Variables utilisées dans l’ACP → Comprendre le résultat
- Avec d’autres variables →Comprendre les dimensions, les expliquer
• Utilisation dans l’analyse
- Scores = Echelle construite
- Score = résumé
- → Utilisation comme variable(s) dépendante(s) ou indépendante(s)
MeS
SM
od
ule
II
S14
RPortée/validité de l’échelle construite?
• “Utilité dans l’analyse”
- Discrimination de groupes des variables indépendantes?
- L’échelle est-elle un bon facteur explicatif?
• Tableaux croisés
• Tableaux de moyennes
MeS
SM
od
ule
II
S15
R
Aucune formscol/prof
Ecoleobligatoire
Appr prof ouécole prof
Ecole dematurité
Form sup techet prof
Ecole tech sup Université,EPF
Dernière école achevée
0
3
6
9
12
15
Potact1
Cases weighted by Pondération sur regling, données OFS grisons=além
Représentation graphique (boîte à pattes/Boxplot)
MeS
SM
od
ule
II
S16
RAnalyse de la variance (ANOVA)
• y = f (X1, X2,....)- Y (critère) : Quantitatif (continue)
- X1, X2 (facteurs): Qualitatif (catégoriel)
• Comparaison des catégories de la variable indépendante- Tableaux de moyennes/écart-types
- Boxplot (boîte à pattes)
• Décomposition de la varianceV
total= V
inter-groupes+ V
intra-groupes
Var(y) = Var(x) + Var(reste)attribuable à X attribuable à “autre chose”
- QualitéVariance expliquée)
- Relation (force)
• Signification statistique
- Relation → Test de F
MeS
SM
od
ule
II
S17
R
Variable dépendanteV
aria
ble
indé
pen
dan
teNominal Ordinal Intervalles
Nominal
Ordinal
Intervallesr
Régression
Tableaux
croisés
T T
Analyse
de la
variance
MeS
SM
od
ule
II
S18
RSégmentation Arbre de l’abstentionnisme
% d’abstentionniste dans le groupe
Suisse
40%
(1917)
N’a pas de préf. partisane
60%
(615)
A une préf. partisane
30%
(1302)
Educ. supérieure
54%
(183)
Educ. primaire
78%%
(235)
Hommes
46%
(197)
Femmes
67%
(418)
Revenu < 2000 F
45%
(419)
Membre org.prof
18%
(426)
Non-membre-org.prof.
36%
(876)
Age > 29
40%
(150)
Age 20-29
68%
(47)
Revenu > 2000F
28%
(457)
Femmes
53%
(256)
Autres profession
21%
(309)
Ouvriers
41%
(148)
Hommes
32%
(163)
Contrastemaximal(différence)
“noeud”
parent
enfant
split
Critères d’arrêt- effectif du noeud- seuil de contraste (difference)
MeS
SM
od
ule
II
S19
RSPSS: Quelques conseils
• Avant tout analyse plus sophistiquée
- Connaissez vos variables: Faites un diagnostic
- Distribution? Particularités? Donnes manquantes?
Transformations(par exemple pour construire une échelle)
• Analysez le problème → tâches à effectuer- Tableau logique du problème (cf. échelle de post-matérialisme)
- Faites les opérations “à la main” pour quelques individus typiques; lerésultat fait-il sens?
• Procédez par étapes- Plus facile à vérifier/à corriger
MeS
SM
od
ule
II
S20
R
• Vérifiez que tout s’est bien passé- Erreurs syntaxiques
- Messages d’erreurs/avertissements de SPSS (il ne devrait pas en avoir)- Attention: Il faut les chercher/lire; parfois il est nécessaire de faire défiler la fenêtreoutput en arrière....
- Erreurs logiques- Logique de l’échelle respectée?- Correspondance avec votre tableau logique
• Examinez la plausibilité des résultats (tableaux de fréquences)- Nombre d’observations (plausibles?)
- Valeurs plausibles, attendues?
- Individus typiques, individus extrêmes?
• Données manquantes- Avez vous déclaré correctement vos données manuqantes?
- Traitement automatique vs. traitement explicite
- Diagnostic... Le nombre des d.m. n’est-il pas trop élevé?
MeS
SM
od
ule
II
S21
R
• Documenter les nouvelles variables et les variablestransformées (libellés)
- Sauf si la durée de vie de la variable est très courte... (p. ex. pendant l’examen)
- et .. il vaut mieux pas documenter que mal documenter
• Stratégies de “déboguage”
- Correction séquentielle des erreurs/problèmes
- Insertion d’une procédure FREQUENCIES après chaque pas de transformation
- Pour les échelles p.ex. faites les opérations “à la main” pour quelques “cas”typiques
... et
• Un logiciel ne fait que suivre vos ordres:
- Apprenez à connaître les ordres qu’il peut suivre.
- Ne croyez pas aux miracles.
MeS
SM
od
ule
II
S22
R
RECODE Q84 (1=2) (2=1).VALUE LABELS V84 1 “Femme” 2 “Homme”.FREQUENCIES VAR=Q84.
Exemple d’un piège idiot....
Soit
Objectif: Intervertir Homme/femme
Message d’avertissement
Résultat: recodage ok, maislibellés inchangés
MeS
SM
od
ule
II
S23
R/* Creation d'une échelle potact pondérée:
/*compute potact2=0.5*A1 + 0.9*A2+1.75*A3+2*(A4+A5).
compute potact2=((potact2a-7.15)/14.30)*20.
formats potact2(F3.1).freq var=potact2.
Message d’erreur>Error # 4295 column 19 variable name too long or isnot defined by a previous command.>>Command not executed