70
1 Règles et recommandations pour l’utilisation de SPSS Jean-François Bickel Statistique II – SP08

Règles et recommandations pour utilisation SPSScommonweb.unifr.ch/artsdean/pub/gestens/f/as/files/4665/9547... · ¾De même, durant ce cours, toutes les opérations (ou presque)

  • Upload
    lephuc

  • View
    213

  • Download
    0

Embed Size (px)

Citation preview

1

Règles et recommandations pour l’utilisation de SPSS

Jean-François BickelStatistique II – SP08

2

Une règle d’or: documenter!

Utiliser SPSS implique très rapidement l’accumulation d’une multitude d’opérations, de variables, de résultats : créer des variables; les recoder; analyser une variable de plusieurs manières différentes; complexifier progressivement une analyse en prenant en compte des variables supplémentaires, etc.

3

Pour s’y retrouver, il faut garder des tracesde ce que l’on fait :

sauvegarder les fichiers de résultats (outputs; extension .spo) ou/et les imprimer (en les classant)sauvegarder les données « travaillées » (variables recodées, nouvelles variables, etc.) dans un fichier de données (extension .sav) différent du fichier de données brutes

4

Il est aussi conseillé d’ajouter des commentaires (qui peuvent être brefs) décrivant ce que l’on fait et/ou le résultat de ce que l’on faitDocumenter est non seulement utile pour le déroulement de son propre travail, mais aussi pour en justifier le résultat vis-à-vis d’autruiC’est un support dans les cas où il faut faire mémoire de ce qui a été fait

5

Un conseil:travailler avec la syntaxe

De manière usuelle, on apprend SPSS et on travaille avec en utilisant son interface graphique (menus déroulants, fenêtres, etc.)De même, durant ce cours, toutes les opérations (ou presque) pourront être faites au moyen de l’interface graphique de SPSS

6

Cela étant, tout ce que nous demandons de faire à SPSS via l’interface graphique est « traduit » en instructions qui sont ensuite exécutéesCes instructions pour être comprises et exécutées par SPSS utilisent un langage propre au logiciel, avec ses mots-clés et ses règles

7

En d’autres termes, pour « commander » à SPSS nous utilisons une certaine syntaxeL’idée est dès lors de s’appuyer plus directement sur la syntaxe elle-même(et non uniquement sur l’interface graphiqueCette idée peut se concrétiser à trois niveaux

8

1. En tant que règle : que s’affichent dans la fenêtre résultats (outputs), les instructions données à SPSS

C’est un moyen de garder trace de ce que l’on fait avec SPSS :permet de regrouper la commande générant une certaine analyse et le résultat de la même analyse

9

2. A un deuxième niveau, également très utile et donc fortement recommandé :rassembler dans un fichier ad hoc appelé fichier syntaxe (extension .sps) les instructions données à SPSS

Ces fichiers syntaxes peuvent être sauvegardés et ainsi on garde mémoire des instructions données à SPSS

10

3. Enfin, à titre de conseil : travailler directement en mode syntaxe

Du fait que les fichiers syntaxe peuvent être sauvegardés, on peut les réutiliser à une autre occasion pour répéter des opérations, soit exactement identiques, soit similaires (par exemple, pour un même type d’analyse, on change simplement le nom des variables impliquées)

11

Cette manière de faire peut permettre de gagner du temps, et parfois même beaucoup de tempsDe plus, certaines opérations ou options ne peuvent tout simplement pas être réalisées via l’interface graphique de SPSS

12

Ceux qui apprécient un mode de raisonnement analytique préfèrent souvent avoir recours à l’écriture de syntaxeTravailler à l’aide de fichiers de syntaxe revient à utiliser un langage plus proche du procédé statistiqueEn cela, une telle manière de faire peut avoir un effet pédagogique en faisant mieux « voir » ce que l’on fait

13

Comment faireEn référence aux points 1 et 2, modifier deux options de SPSS

afin que les instructions données à SPSS d’effectuer telle ou telle opération s’inscrivent dans la fenêtre « résultats » (output) de SPSS (cf. point 1 ci-dessus)afin qu’au démarrage de SPSS, une fenêtre « syntaxe » s’ouvre automatiquement

14

1. Pour cela, aller dans le menuEdition

Options...2. Sur l’écran qui apparaît, choisir la

rubrique Généralités et cocher la case Ouvrir la fenêtre de syntaxe au démarrage

3. Puis dans la rubrique Editeurs de résultats, cocher la case Afficher syntaxe

4. Cliquer sur Appliquer, puis Ok

15

16

17

18

Rien de plus est nécessaire pour appliquer la règle du point 1 !

Pour illustrer les points 2 et 3, procédons à un exemple d’analyse

19

Nous nous appuierons sur un extrait du fichier de données de l’enquête menée en 1994 par le Centre interfacultaire de gérontologie de l’Université de Genève auprès d’un échantillon de la population âgée de 60 ans et plus résidant dans le canton de Genève et dans le Valais central (N=2101)L’échantillon est stratifié par canton, sexe et classes d’âges quinquennales

20

Référence : C. Lalive d’Epinay, J.-F. Bickel, C. Maystre et N. Vollenwyder, Vieillesse au fil du temps. Une révolution tranquille, Lausanne, Réalités Sociales, 2000

Les variables retenues ici sont :le numéro d’identification de la personne interrogée (variable icode)le canton de résidence : 0=Valais central ; 1=Genèvele sexe : 0=hommes ; 1=femmes

21

l’âge (en années)l’état de santé tel qu’évalué par la personne, variant de 1 « très mauvais » à 5 « très bon »le coefficient de pondération (pour rétablir la structure de la population « mise à mal » par la stratification : idée de représentativité)

L’image suivante représente les 25 premiers individus de la base de données

22

23

Commençons, via l’interface graphique, par demander une description de la distribution des variables canton, sexe et santé auto-évaluée

1. Pour cela, aller dans le menuAnalyse

Statistique descriptiveEffectifs (Frequencies)

24

25

2. Dans la fenêtre qui apparaît, sélectionner les trois variablesconcernées

3. Puis cliquer sur statistiques et cocher les cases moyenne, médiane, écart type, asymétrie, aplatissement

4. Cliquer sur Poursuivre pour revenir dans la fenêtre principale

26

27

28

5. De retour dans la fenêtre principale, cliquer sur Coller(plutôt que sur OK qui est la manière habituelle de procéder)

6. Cela a pour conséquence que l’instruction donnée à SPSS va être écrite dans la fenêtre syntaxe

29

30

Remarque : toutes les instructions commencent par un mot clé qui donne son nom à l’opération, ici Frequencies; celui-ci est suivi d’un certain nombre d’indications, certaines obligatoires, d’autres optionnelles; enfin toutes les instructions se terminent par un point

7. Pour exécuter l’instruction, marquercelle-ci à l’aide de la souris, puis cliquer sur la flèche dans la barre d’outil

31

32

Dans le cliché suivant, remarquons que :– La ligne de commande s’est inscrite dans

la fenêtre Résultats (Outputs)– Directement à la suite, sont affichés les

résultats de l’analyse

33

34

Observons tout d’abord dans le tableau « Statistiques » que l’effectif total (N valide) est de 1805 pour la variable santé auto-évaluée, contre 2101 pour les deux autres variablesCeci est dû au fait que les personnes enquêtées via un proxi (n=263) n’ont bien sûr pas été interrogées à ce propos, et que 33 personnes interrogées n’ont pas répondu

35

36

Par ailleurs, on voit que l’échantillon se compose d’autant de résidants en Valais qu’à Genève, d’autant d’hommes que de femmesCette « étrangeté » est due au caractère stratifié de l’échantillon57% évaluent leur état de santé comme « bon » ou « très bon » (moyenne par rapport à l’échelle de 3.66)

37

Pour l’heure, laissons de côté ces chiffres et procédons à une seconde analyse :un histogramme de la distribution de la variable santé auto-évaluée

1. Pour cela, aller dans le menuAnalyse

Statistique descriptiveExplorer (Examine)

38

39

2. Dans la fenêtre qui apparaît, sélectionner la variable

3. Cocher la case Graphiques4. Cliquer sur Diagrammes

40

5. Dans la fenêtre qui apparaît, cocher la case Aucun(e) dans la rubrique Boîte à moustaches

6. Cocher la case Histogramme dans la rubrique Diagramme descriptif

7. Cliquer sur Poursuivre

41

8. Dans la fenêtre principale, comme précédemment, cliquer sur Coller

42

Dans la fenêtre syntaxe, la nouvelle commande « Examine » (explorer) est venu s’inscrire à la suite de l’instruction antérieure

9. Comme précédemment, marquerl’instruction et lancer l’exécution en cliquant sur la flèche dans la barre d’outil

43

44

Dans la fenêtre Résultats (Outputs), figure maintenant l’histogramme demandé

45

Revenons au caractère étrange des distributions de nos variablesDans notre échantillon,– il y a autant de résidants en Valais qu’à

Genève; or, en réalité, la population du canton de Genève est plus nombreuse que celle du Valais central

– il y autant d’hommes que de femmes; or, nous le savons bien, la population âgée est en réalité à majorité féminine

46

Ceci est dû au plan d’échantillonnage de l’enquête, qui a reposé sur une stratification selon le canton, le sexe et les catégories d’âge quinquennales A ce titre, l’échantillon n’est pas représentatif de la population– les hommes sont surreprésentés dans

l’échantillon, comme le sont les personnes plus âgées

47

De plus, ce caractère non représentatif peut aussi mettre en doute la validité de la description de la santé auto-évaluée– comme l’état de santé tend à se

détériorer avec l’âge, le fait qu’il y ait une surreprésentation des personnes plus âgées dans l’échantillon pourrait conduire à ce que le résultat de notre analyse sous-estime le bon état de santé dans la population

48

– les travaux dans le domaine s’accordent sur le fait que les femmes, si elles vivent plus longtemps, ont davantage de problèmes de santé que les hommes; comme les femmes sont sous-représentées dans notre échantillon, le résultat de notre analyse pourrait à l’inverse surestimer le bon état de santé de la population

49

Si on veut pouvoir inférer les résultats obtenus sur la base de notre échantillon à l’univers dont il est issu et être capable de poser des affirmations plus générales sur la population âgée, il faut corriger la structure de l’échantillonUtilisation d’un coefficient de pondération : les individus, plutôt que d’être affecté d’un même poids dans les analyses, se voient attribués des poids différents selon le sexe et la catégorie d’âge auxquels ils appartiennent

50

On peut ainsi rétablir la « vraie » structure de la population (univers de référence)Notons aussi que l’enquête de terrain finie, on s’est rendu compte d’une surreprésentation des personnes âgées en institution dans l’échantillon : le coefficient de pondération corrige également ce faitPar contre, il ne corrige pas la distribution entre cantons : l’addition de Genève+Valais ne constitue pas une population faisant sens

51

Pour indiquer à SPSS d’utiliser un coefficient de pondération (la variable doit être créée précédemment)

1. Aller dans le menuDonnées

Pondérer les observations

52

53

2. Dans la fenêtre qui s’affiche, sélectionner la variable de pondération (ici variable coefpond)

3. Puis cliquer sur Coller

54

L’instruction s’inscrit dans la fenêtre de syntaxeRépétons les mêmes analyses que précédemment, cette fois en tenant compte de la pondération

1. Pour cela, il suffit d’aller dans la fenêtre de syntaxe, de copier les instructions d’analyse déjà utilisées et de les coller à la suite de la commande requérant l’utilisation de la pondération

55

56

2. Marquer la suite d’instructions et lancer l’exécution

57

58

Les commandes et les résultats des analyses s’inscrivent dans la fenêtre Résultats (Outputs)

59

L’utilisation du coefficient de pondération ne modifie pas la distribution de l’échantillon selon le cantonPar contre, elle change les proportions d’hommes et de femmes : ces dernières représentent désormais le 59% de l’ensemble

60

61

62

La distribution de la santé auto-évaluée se modifie peu : le score moyen est à peine plus élevé (3.74 contre 3.66); la proportion de personnes disant être en « mauvaise » ou « très mauvaise » santé est de 7%, contre 9% précédemmentCette relative stabilité entre l’avant et l’après pondération peut étonnerComment l’expliquer?

63

D’un côté, la pondération donne plus de poids aux personnes les plus jeunes de l’échantillon : effet positif sur l’état de santéDe l’autre, la pondération donne plus de poids aux femmes : effet négatif sur l’état de santé

64

En plus de ce phénomène de balance entre deux effets de sens contraire, l’état de santé auto-évalué est plus stable que la santé objective :processus de régulation psycho-sociale(par exemple, comparaison sociale)

65

Pour documenter son travail, on peut sauvegarder le contenu de la fenêtre syntaxe dans un fichier du même type (extension .sps)Y compris en ajoutant une brève description des procédures suivies, voire de ce qui motive ces procéduresLes lignes de commentaires doivent débuter par un astérisque « * »Ci-après une petite illustration

66

67

Comment exporter les résultats des analyses dans un fichier texte?

Pour exporter tout ou partie d’un fichier résultats de SPSS

1. Se placer dans la fenêtre résultat2. Aller dans le menu

FichierExporter

68

69

Dans la fenêtre qui s’affiche,

3. Indiquer Sortie document (défaut)

4. Choisir les objets à exporter(tout ce qui est dans la fenêtre « Résultats » n’est pas forcément utile)

5. Choisir le type de fichier vers lequel exporter (ici fichier word/rtf)

6. Choisir l’emplacement et le nom du fichier qui sera créé

7. Cliquer sur OK

70