Upload
lephuc
View
213
Download
0
Embed Size (px)
Citation preview
2
Une règle d’or: documenter!
Utiliser SPSS implique très rapidement l’accumulation d’une multitude d’opérations, de variables, de résultats : créer des variables; les recoder; analyser une variable de plusieurs manières différentes; complexifier progressivement une analyse en prenant en compte des variables supplémentaires, etc.
3
Pour s’y retrouver, il faut garder des tracesde ce que l’on fait :
sauvegarder les fichiers de résultats (outputs; extension .spo) ou/et les imprimer (en les classant)sauvegarder les données « travaillées » (variables recodées, nouvelles variables, etc.) dans un fichier de données (extension .sav) différent du fichier de données brutes
4
Il est aussi conseillé d’ajouter des commentaires (qui peuvent être brefs) décrivant ce que l’on fait et/ou le résultat de ce que l’on faitDocumenter est non seulement utile pour le déroulement de son propre travail, mais aussi pour en justifier le résultat vis-à-vis d’autruiC’est un support dans les cas où il faut faire mémoire de ce qui a été fait
5
Un conseil:travailler avec la syntaxe
De manière usuelle, on apprend SPSS et on travaille avec en utilisant son interface graphique (menus déroulants, fenêtres, etc.)De même, durant ce cours, toutes les opérations (ou presque) pourront être faites au moyen de l’interface graphique de SPSS
6
Cela étant, tout ce que nous demandons de faire à SPSS via l’interface graphique est « traduit » en instructions qui sont ensuite exécutéesCes instructions pour être comprises et exécutées par SPSS utilisent un langage propre au logiciel, avec ses mots-clés et ses règles
7
En d’autres termes, pour « commander » à SPSS nous utilisons une certaine syntaxeL’idée est dès lors de s’appuyer plus directement sur la syntaxe elle-même(et non uniquement sur l’interface graphiqueCette idée peut se concrétiser à trois niveaux
8
1. En tant que règle : que s’affichent dans la fenêtre résultats (outputs), les instructions données à SPSS
C’est un moyen de garder trace de ce que l’on fait avec SPSS :permet de regrouper la commande générant une certaine analyse et le résultat de la même analyse
9
2. A un deuxième niveau, également très utile et donc fortement recommandé :rassembler dans un fichier ad hoc appelé fichier syntaxe (extension .sps) les instructions données à SPSS
Ces fichiers syntaxes peuvent être sauvegardés et ainsi on garde mémoire des instructions données à SPSS
10
3. Enfin, à titre de conseil : travailler directement en mode syntaxe
Du fait que les fichiers syntaxe peuvent être sauvegardés, on peut les réutiliser à une autre occasion pour répéter des opérations, soit exactement identiques, soit similaires (par exemple, pour un même type d’analyse, on change simplement le nom des variables impliquées)
11
Cette manière de faire peut permettre de gagner du temps, et parfois même beaucoup de tempsDe plus, certaines opérations ou options ne peuvent tout simplement pas être réalisées via l’interface graphique de SPSS
12
Ceux qui apprécient un mode de raisonnement analytique préfèrent souvent avoir recours à l’écriture de syntaxeTravailler à l’aide de fichiers de syntaxe revient à utiliser un langage plus proche du procédé statistiqueEn cela, une telle manière de faire peut avoir un effet pédagogique en faisant mieux « voir » ce que l’on fait
13
Comment faireEn référence aux points 1 et 2, modifier deux options de SPSS
afin que les instructions données à SPSS d’effectuer telle ou telle opération s’inscrivent dans la fenêtre « résultats » (output) de SPSS (cf. point 1 ci-dessus)afin qu’au démarrage de SPSS, une fenêtre « syntaxe » s’ouvre automatiquement
14
1. Pour cela, aller dans le menuEdition
Options...2. Sur l’écran qui apparaît, choisir la
rubrique Généralités et cocher la case Ouvrir la fenêtre de syntaxe au démarrage
3. Puis dans la rubrique Editeurs de résultats, cocher la case Afficher syntaxe
4. Cliquer sur Appliquer, puis Ok
18
Rien de plus est nécessaire pour appliquer la règle du point 1 !
Pour illustrer les points 2 et 3, procédons à un exemple d’analyse
19
Nous nous appuierons sur un extrait du fichier de données de l’enquête menée en 1994 par le Centre interfacultaire de gérontologie de l’Université de Genève auprès d’un échantillon de la population âgée de 60 ans et plus résidant dans le canton de Genève et dans le Valais central (N=2101)L’échantillon est stratifié par canton, sexe et classes d’âges quinquennales
20
Référence : C. Lalive d’Epinay, J.-F. Bickel, C. Maystre et N. Vollenwyder, Vieillesse au fil du temps. Une révolution tranquille, Lausanne, Réalités Sociales, 2000
Les variables retenues ici sont :le numéro d’identification de la personne interrogée (variable icode)le canton de résidence : 0=Valais central ; 1=Genèvele sexe : 0=hommes ; 1=femmes
21
l’âge (en années)l’état de santé tel qu’évalué par la personne, variant de 1 « très mauvais » à 5 « très bon »le coefficient de pondération (pour rétablir la structure de la population « mise à mal » par la stratification : idée de représentativité)
L’image suivante représente les 25 premiers individus de la base de données
23
Commençons, via l’interface graphique, par demander une description de la distribution des variables canton, sexe et santé auto-évaluée
1. Pour cela, aller dans le menuAnalyse
Statistique descriptiveEffectifs (Frequencies)
25
2. Dans la fenêtre qui apparaît, sélectionner les trois variablesconcernées
3. Puis cliquer sur statistiques et cocher les cases moyenne, médiane, écart type, asymétrie, aplatissement
4. Cliquer sur Poursuivre pour revenir dans la fenêtre principale
28
5. De retour dans la fenêtre principale, cliquer sur Coller(plutôt que sur OK qui est la manière habituelle de procéder)
6. Cela a pour conséquence que l’instruction donnée à SPSS va être écrite dans la fenêtre syntaxe
30
Remarque : toutes les instructions commencent par un mot clé qui donne son nom à l’opération, ici Frequencies; celui-ci est suivi d’un certain nombre d’indications, certaines obligatoires, d’autres optionnelles; enfin toutes les instructions se terminent par un point
7. Pour exécuter l’instruction, marquercelle-ci à l’aide de la souris, puis cliquer sur la flèche dans la barre d’outil
32
Dans le cliché suivant, remarquons que :– La ligne de commande s’est inscrite dans
la fenêtre Résultats (Outputs)– Directement à la suite, sont affichés les
résultats de l’analyse
34
Observons tout d’abord dans le tableau « Statistiques » que l’effectif total (N valide) est de 1805 pour la variable santé auto-évaluée, contre 2101 pour les deux autres variablesCeci est dû au fait que les personnes enquêtées via un proxi (n=263) n’ont bien sûr pas été interrogées à ce propos, et que 33 personnes interrogées n’ont pas répondu
36
Par ailleurs, on voit que l’échantillon se compose d’autant de résidants en Valais qu’à Genève, d’autant d’hommes que de femmesCette « étrangeté » est due au caractère stratifié de l’échantillon57% évaluent leur état de santé comme « bon » ou « très bon » (moyenne par rapport à l’échelle de 3.66)
37
Pour l’heure, laissons de côté ces chiffres et procédons à une seconde analyse :un histogramme de la distribution de la variable santé auto-évaluée
1. Pour cela, aller dans le menuAnalyse
Statistique descriptiveExplorer (Examine)
39
2. Dans la fenêtre qui apparaît, sélectionner la variable
3. Cocher la case Graphiques4. Cliquer sur Diagrammes
40
5. Dans la fenêtre qui apparaît, cocher la case Aucun(e) dans la rubrique Boîte à moustaches
6. Cocher la case Histogramme dans la rubrique Diagramme descriptif
7. Cliquer sur Poursuivre
42
Dans la fenêtre syntaxe, la nouvelle commande « Examine » (explorer) est venu s’inscrire à la suite de l’instruction antérieure
9. Comme précédemment, marquerl’instruction et lancer l’exécution en cliquant sur la flèche dans la barre d’outil
45
Revenons au caractère étrange des distributions de nos variablesDans notre échantillon,– il y a autant de résidants en Valais qu’à
Genève; or, en réalité, la population du canton de Genève est plus nombreuse que celle du Valais central
– il y autant d’hommes que de femmes; or, nous le savons bien, la population âgée est en réalité à majorité féminine
46
Ceci est dû au plan d’échantillonnage de l’enquête, qui a reposé sur une stratification selon le canton, le sexe et les catégories d’âge quinquennales A ce titre, l’échantillon n’est pas représentatif de la population– les hommes sont surreprésentés dans
l’échantillon, comme le sont les personnes plus âgées
47
De plus, ce caractère non représentatif peut aussi mettre en doute la validité de la description de la santé auto-évaluée– comme l’état de santé tend à se
détériorer avec l’âge, le fait qu’il y ait une surreprésentation des personnes plus âgées dans l’échantillon pourrait conduire à ce que le résultat de notre analyse sous-estime le bon état de santé dans la population
48
– les travaux dans le domaine s’accordent sur le fait que les femmes, si elles vivent plus longtemps, ont davantage de problèmes de santé que les hommes; comme les femmes sont sous-représentées dans notre échantillon, le résultat de notre analyse pourrait à l’inverse surestimer le bon état de santé de la population
49
Si on veut pouvoir inférer les résultats obtenus sur la base de notre échantillon à l’univers dont il est issu et être capable de poser des affirmations plus générales sur la population âgée, il faut corriger la structure de l’échantillonUtilisation d’un coefficient de pondération : les individus, plutôt que d’être affecté d’un même poids dans les analyses, se voient attribués des poids différents selon le sexe et la catégorie d’âge auxquels ils appartiennent
50
On peut ainsi rétablir la « vraie » structure de la population (univers de référence)Notons aussi que l’enquête de terrain finie, on s’est rendu compte d’une surreprésentation des personnes âgées en institution dans l’échantillon : le coefficient de pondération corrige également ce faitPar contre, il ne corrige pas la distribution entre cantons : l’addition de Genève+Valais ne constitue pas une population faisant sens
51
Pour indiquer à SPSS d’utiliser un coefficient de pondération (la variable doit être créée précédemment)
1. Aller dans le menuDonnées
Pondérer les observations
53
2. Dans la fenêtre qui s’affiche, sélectionner la variable de pondération (ici variable coefpond)
3. Puis cliquer sur Coller
54
L’instruction s’inscrit dans la fenêtre de syntaxeRépétons les mêmes analyses que précédemment, cette fois en tenant compte de la pondération
1. Pour cela, il suffit d’aller dans la fenêtre de syntaxe, de copier les instructions d’analyse déjà utilisées et de les coller à la suite de la commande requérant l’utilisation de la pondération
59
L’utilisation du coefficient de pondération ne modifie pas la distribution de l’échantillon selon le cantonPar contre, elle change les proportions d’hommes et de femmes : ces dernières représentent désormais le 59% de l’ensemble
62
La distribution de la santé auto-évaluée se modifie peu : le score moyen est à peine plus élevé (3.74 contre 3.66); la proportion de personnes disant être en « mauvaise » ou « très mauvaise » santé est de 7%, contre 9% précédemmentCette relative stabilité entre l’avant et l’après pondération peut étonnerComment l’expliquer?
63
D’un côté, la pondération donne plus de poids aux personnes les plus jeunes de l’échantillon : effet positif sur l’état de santéDe l’autre, la pondération donne plus de poids aux femmes : effet négatif sur l’état de santé
64
En plus de ce phénomène de balance entre deux effets de sens contraire, l’état de santé auto-évalué est plus stable que la santé objective :processus de régulation psycho-sociale(par exemple, comparaison sociale)
65
Pour documenter son travail, on peut sauvegarder le contenu de la fenêtre syntaxe dans un fichier du même type (extension .sps)Y compris en ajoutant une brève description des procédures suivies, voire de ce qui motive ces procéduresLes lignes de commentaires doivent débuter par un astérisque « * »Ci-après une petite illustration
67
Comment exporter les résultats des analyses dans un fichier texte?
Pour exporter tout ou partie d’un fichier résultats de SPSS
1. Se placer dans la fenêtre résultat2. Aller dans le menu
FichierExporter
69
Dans la fenêtre qui s’affiche,
3. Indiquer Sortie document (défaut)
4. Choisir les objets à exporter(tout ce qui est dans la fenêtre « Résultats » n’est pas forcément utile)
5. Choisir le type de fichier vers lequel exporter (ici fichier word/rtf)
6. Choisir l’emplacement et le nom du fichier qui sera créé
7. Cliquer sur OK