19
Formation en Analyse des Données Sociodémographiques Manuel de formation (Janvier 2005) SPSS 11.5 pour WINDOWS UNE INTRODUCTION (Version 11.5) Par Joseph Pierre TIMNOU

Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

Formation en Analyse des Données

Sociodémographiques

Manuel de

formation (Janvier 2005)

SPSS 11.5 pour

WINDOWS UNE INTRODUCTION

(Version 11.5)

Par Joseph Pierre TIMNOU

Page 2: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

2

TABLE DES MATIÈRES Introduction Intégrer population et développement est depuis longtemps apparu comme un impératif, particulièrement en Afrique. A cet effet, les recensements démographiques courants ici depuis les années 1970 sont un des maillons essentiels de cet impératif. Mieux utiliser les données du recensement permet alors de bien maîtriser les objectifs du développement, et plus spécifiquement aujourd’hui les OMD qui doivent faire l’objet régulier d’évaluation périodique dans le but de savoir si le chemin parcouru l’est dans le bon sens, et quelles stratégies adoptées pour s’assurer que l’échéance 2015 sera couronnée de succès. A cet effet, la collecte des données et la sortie des rapports statistiques ne constituent qu’une étape dans le rôle attendu des recensements. Une phase importante est celle d’analyse approfondie des différents thèmes contenus dans le questionnaire. L’esprit d’analyse dans ce cas peut se résumer simplement ainsi qu’il suit :

• Se donner une problématique ; • Au plan descriptif, commencer par un examen univarié des paramètres d’intérêt ; • Passer à l’analyse bivariée : tout dépend du type de variables. Pour les variables

nominales, CROSSTABS de SPSS convient largement pour une telle analyse. Une régression simple peut être utilisée pour les variables numériques continues. A ce niveau, des tests existent pour juger de la pertinence des liens trouvés.

• Par la suite vient l’analyse multivariée nécessaire pour résumer et relativiser l’importance des liens bivariés trouvés. En fonction des situations, plusieurs possibilités s’offrent à l’analyste. Selon la problématique posée et le type des variables, un modèle prédéfini peut être directement utilisé : Régression multilinéaire, Régression logistique, Logit/Probit/Torbit, Analyse discriminante, etc.

Il peut se faire que le nombre élevé de variables ne permette pas de déterminer les liens essentiels voulus (la forte colinéarité entre ces variables n’étant pas toujours un problème aisé à résoudre), ou simplement que la question posée nécessite l’analyse d’un tableau de contingence. L’analyse exploratoire sous forme factorielle s’impose dès lors, en vue de dégager les formes, les associations ou oppositions selon un procédé qui consiste à réduire l’espace d’observation de départ en un espace de dimension plus petite. Il s’agit d’une exploration par factorisation souvent préalable à une analyse décisionnelle. L’interrogation peut aller jusqu’à la simulation. Il faut alors définir le modèle de simulation à mettre en œuvre. Toutes les questions d’analyse ou de recherche étant posées, et les modèles d’analyse arrêtés, il faut ensuite trouver le logiciel qui sied le mieux à la résolution des différents problèmes.

Page 3: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

3

PRÉSENTATION: SPSS pour WINDOWS est un logiciel d’analyse statistique particulièrement adapté aux sciences sociales. SPSS signifie d’ailleurs Statistical Package for Social Sciences. Son environnement comprend un support de base de données très complet puisqu’il renferme en particulier un dictionnaire qui donne les informations sur le nom des variables et leur caractéristiques (numérique continue, nominales, ordinale, date, taille, nombre décimal, etc.), les libellés des codes pour les modalités des variables nominales… La manipulation des fichiers y est particulièrement aisée : concaténation des fichiers différents par les observations ou par les variables, agrégation, transposition, scission, tri, importation de fichiers d’origines diverses… Quant à la manipulation des variables, le logiciel possède de très nombreuses procédures : création de nouvelles variables à partir des variables existantes, traitement des questions à réponses multiples, traitement des valeurs manquantes, recodification… ses commandes permettent donc de faire rapidement des calculs statistiques plus ou moins complexes plutôt que des calculs comptables, des recherches de "dossiers", du traitement de texte, etc.. Comme SPSS fonctionne sous l'environnement Windows, la plupart des commandes sont utilisables avec la souris. Cependant, SPSS supporte la syntaxe des commandes des versions précédentes (i.e. sans le support de l'environnement Windows). Dans ce texte, nous faisons un tour rapide de l'utilisation des menus de façon à mieux aborder la façon "syntaxique" de commander des opérations sous SPSS. RÉFÉRENCE UTILE: SPSS Inc., SPSS Base System Syntax Reference Guide, chapitre "Universals" et au besoin par la suite selon la commande désirée. (Disponible au laboratoire d'informatique de la Faculté des sciences sociales de l’Université Laval) CONVENTIONS: A- Dans le présent document, une suite de commandes à réaliser dans les menus et les sous-menus à l'aide de la souris, sera notée de la manière suivante:

(Première opération\deuxième opération\troisième opération\etc.) Ex: (FILE\OPEN\DATA\Nom du fichier)

Page 4: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

4

1. ACTIVER SPSS ET QUITTER SPSS Dès l’activation de SPSS (en double-cliquant sur le nom qui convient dans la boîte « Tous les programmes »), une boîte de dialogue s’ouvre et vous propose de faire un choix sur les options : Lancer le didacticiel, Saisir les données, Exécuter une requête existante, Créer une requête, Ouvrir une source de données existante (avec affichage des dernières sources ouvertes, Ouvrir un autre type de fichier (avec les derniers fichiers ouverts listés). Si lors d’une activation précédente vous avez demandé que cette boîte de dialogue ne s’affiche plus, vous avez immédiatement une page de données vide. Dans ce cas, vous devez aller dans la boîte Fichier de la barre des fonctions pour charger s’il y a lieu votre fichier de travail. Dans tous les cas, vous ne pouvez travailler que lorsque vous avez dans la barre d’état en bas le message "SPSS Processeur est prêt". Vous devriez voir alors la fenêtre suivante lorsque votre préoccupation porte sur un fichier de données :

Ou alors, si vous travailler sur la syntaxe :

Page 5: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

5

Ou encore, si vous travailler sur les résultats des commandes :

Page 6: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

6

Vous avez aussi des affichages différents pour les résultats en mode brouillon, ou les scripts. Une seule fenêtre de données peut être ouverte à la fois, on peut avoir plusieurs fenêtres ouvertes pour chacune des autres formes de fichiers (syntaxe, résultats). On peut fermer toutes les fenêtres des autres formes de fichiers sans quitter SPSS, mais on ne peut pas fermer la fenêtre des données sans quitter SPSS. Autrement dit, tant que le processeur SPSS est actif, une fenêtre de données (même vide) est ouverte. Fermer la fenêtre de données revient donc à quitter SPSS. Tout naturellement comme pour la plupart des logiciels, tant qu’une fenêtre contient des informations non sauvegardées, l’option fermeture déclanche la question : Voulez-vous sauvegarder les modifications apportées au fichier ?. 2. LES FENÊTRES DANS SPSS: CONTENU ET CHANGEMENT DE FENÊTRE SPSS peut afficher différents types de fenêtres dont les trois principales sont :

1- la fenêtre des données (NEWDATA ou DATA) 2- la fenêtre des résultats (OUTPUT) 3- la fenêtre des commandes (SYNTAX)

Page 7: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

7

En plus de ces types de fenêtres, SPSS peut afficher des menus, des boîtes de dialogue, des fenêtres de texte (aide, etc.). De plus, certaines fenêtres peuvent exister en plusieurs exemplaires.

2.1 - Les trois premiers types de fenêtres

1- la fenêtre des données (DATA) affiche les données (les valeurs des variables) sous la forme bien connue d'une matrice de données (rangées = les cas, colonnes = les variables, cellules = les valeurs des variables); Dans l’exemple suivant, vous une vue partielle du fichier des données sur les ménages de l’ECAM II (2001) au Cameroun.

2- la fenêtre des commandes (SYNTAX) contient les commandes SPSS que l'utilisateur a écrites; il s'agit d'un éditeur comme EDIT du DOS.

3- la fenêtre des résultats (OUTPUT) contient les résultats des commandes de calculs ou de manipulation des fichiers; elle fonctionne comme un éditeur ;

Habituellement,

- toutes ces fenêtres sont vides immédiatement après la mise en marche de Windows. - la fenêtre active est sur le devant de l'écran, sa barre de titre est plus foncée et le curseur y

scintille: si vous tapez une touche ou demandez une opération, c'est le contenu de cette

fenêtre qui sera affecté. - à l'ouverture, c'est la fenêtre DATA qui est active et placée en avant des autres.

Page 8: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

8

2.2 - Trois opérations à maîtriser :

1 - disposer les fenêtres sur l'écran ; 2 - rendre active une fenêtre pour y travailler ; 3 - modifier la taille d'une fenêtre.

2.3- Disposer les fenêtres sur l'écran : Habituellement, SPSS affiche la fenêtre (vide) des données en avant-plan et une partie des autres fenêtres apparaît "en arrière" de celle-ci. Il est possible de modifier la disposition générale des fenêtres :

- cliquer sur le menu Window sur la barre des menus de SPSS, - choisir entre "Tile" (mosaïque) ou "Cascade".

2.4- Rendre active une fenêtre : Si la fenêtre n'a pas déjà été ouverte, il faut l'ouvrir en utilisant (FILE\NEW ou OPEN\DATA, SYNTAX ou OUTPUT). Parfois SPSS rend actives automatiquement certaines fenêtres, par exemple :

- lors de la mise en marche de SPSS, la fenêtre DATA est active par défaut, - quand SPSS a terminé des calculs, il rend automatiquement la fenêtre OUTPUT active, - si vous lisez un fichier de données sur disque ou disquette, la fenêtre DATA devient

automatiquement active. Deux façons de rendre active une fenêtre :

- si une partie de la fenêtre désirée est visible, cliquer sur celle-ci, - dans tous les cas,

• cliquer sur Window de la barre des menus de SPSS, • choisir en cliquant sur le nom de la fenêtre désirée dans la liste des fenêtres

affichée.

2.5- Modifier la taille de la fenêtre active Une fenêtre peut occuper plus ou moins de place sur l'écran. Vous pouvez modifier la taille de la fenêtre en plaçant la flèche de la souris sur la marge de la fenêtre jusqu’à ce que le symbole apparaisse, cliquez sur le bouton de gauche de la souris et déplacez la marge comme vous le désirez.

Page 9: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

9

3. LIRE UN FICHIER DE DONNÉES Pour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS un fichier de données déjà construit qui est sur le disque rigide ou sur une disquette.

3.1 - Saisie des données Saisir des données dans WINSPSS est, à notre connaissance, la manière la plus facile de construire un fichier de données. Il suffit de suivre les quelques étapes qui suivent : 1. rendre active la fenêtre DATA. Si elle n'est pas ouverte, sélectionner

(FILE\NEW\DATA), 2. définir les informations sur les variables à l'aide des boîtes de dialogues que vous

pouvez activer en cliquant sur l’onglet VARIABLE VIEW qui se trouve en bas à gauche de la fenêtre du fichier de données.

3. Choisir la commande DATA/INSERTE VARIABLE 4. Commencer par nommer la variable (8 caractères maximum) à définir dans la zone

d'édition « Name » ; 5. Vous pouvez ensuite définir certains paramètres pour chacune des variables que

vous créez en cliquant sur la cellule correspondant au paramètre de la variable et en activant la fenêtre en cliquant sur le symbole « … » à droite de la cellule,

• «Type» vous permet de spécifier le type de variable : numérique, alphanumérique, date, etc. ainsi que le nombre de décimales désirées ;

• le bouton « Label » vous permet de définir une étiquette à cette variable et le bouton « Values »permet d’attribuer des étiquettes à chacune des modalités que peut prendre cette variable ;

• le bouton « Missing Values » permet de déclarer les valeurs manquantes ; • le bouton « Column Format » sert à préciser la largeur du champ et

l'alignement désirés.

6. Une fois que toutes les variables ont été définies, cliquez sur l’onglet DATA VIEW

et il ne vous reste plus qu'à saisir les données. 7. Ne pas oublier de sauvegarder le fichier de données (FILE\SAVE AS...\nom du

fichier.SAV).

Page 10: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

10

3.2 - Ouvrir un fichier de données On rencontre deux types de fichier de données :

1- fichier de données brutes, 2- fichier de données de système.

3.3 - Ouverture d'un fichier de données brutes Un fichier de données brutes est une matrice de nombres où les colonnes correspondent aux variables et les rangées, aux répondants. Il s'agit, à l'ouverture, de faire savoir à SPSS quelle(s) colonne(s) correspond à quelle variable. L'opération est assez simple à l'aide de la boîte de dialogue "Define Fixed Variables".

1- Il faut spécifier à SPSS le nom du fichier de données brutes que nous voulons ouvrir: (FILE\Read ASCII Data\nom du fichier),

2- cliquer sur l’onglet « Variable View » et reprendre les étapes 4 et 5 que nous venons de présenter à la section 3.1 (saisie de données)

3- Ne pas oublier de sauvegarder le fichier de données (FILE\SAVE AS...\nom du fichier.SAV).

3.4 - Ouverture d'un fichier de données de système Un fichier de données de système contient les données et la définition nécessaire pour que SPSS puisse reconnaître les variables. Il contient aussi parfois, les modifications apportées, une pondération et les étiquettes des variables et des valeurs de celles-ci. Pour ouvrir un fichier de données de système, il suffit de suivre les quelques étapes suivantes :

- cliquer sur FILE sur la barre des menus de SPSS, - cliquer sur OPEN, - cliquer sur DATA.

Une boîte de dialogue permettant de localiser le fichier apparaît : l'objectif est d'écrire le nom du fichier et sa localisation dans la zone d'édition "Name:". Pour se faire, on peut utiliser le clavier pour écrire dans la zone d'édition (C:\répertoire\nom du fichier.SAV) ou encore, utiliser la souris de la manière suivante :

- cliquer sur l'unité de disque dans la liste "Directories" (C:), - cliquer sur les deux points dans la même liste pour accéder au répertoire principal, - cliquer sur le répertoire désiré, - cliquer sur le fichier de données désiré dans la liste "Files:" (*.SAV), - cliquer sur "OK".

SPSS lira le fichier DATA.SAV et placera ses valeurs sur les lignes de la fenêtre DATA en indiquant le nom du fichier.

Page 11: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

11

3.5 - À savoir Quand SPSS utilise un fichier de données qui existait déjà sur disquette, le micro-ordinateur contient deux copies de ce fichier: la copie sur disquette et la copie qui a été faite, en mémoire vive, lors de l'opération (FILE\OPEN\DATA\nom du fichier\OK). Tant que l'utilisateur ne sauvegarde pas de fichier de données, la première copie demeure inchangée car c'est la seconde copie qui est modifiée par les commandes SPSS de transformation comme RECODE, SELECT IF, etc. Cette copie disparaît de la mémoire vive lors de la fermeture de SPSS (elle est donc "perdue"). Rien n'empêche un utilisateur de sauvegarder un fichier modifié sur disquette, mais habituellement sous un autre nom, afin de conserver les données "originelles".

3.6 - Le fichier utilisé pour les exemples et les exercices : Le fichier de données que nous utiliserons est fictif. Pour les exercices et les exemples, nous utiliserons les variables VAR1 à VAR19. 4. FAIRE EXÉCUTER UN PROGRAMME ET DES COMMANDES STATISTIQUES

Trois façons de faire dans WINSPSS Il existe trois façons de faire exécuter des commandes "statistiques" à SPSS :

1- en indiquant à SPSS une commande à exécuter à l'aide du menu (et de ses sous-menus) ;

2- en indiquant à SPSS une commande à exécuter à l'aide de son menu et en indiquant à SPSS d'écrire cette commande dans la fenêtre de syntaxe; cette commande sera par la suite exécutée au moment voulu (probablement avec d'autres) par l'utilisateur ;

3- en écrivant un programme (un "texte" formé de plusieurs commandes) dans une fenêtre de syntaxe; ce programme sera par la suite exécuté au moment voulu par l'utilisateur; les commandes du programme peuvent avoir été préalablement sauvegardée (en partie ou en totalité) dans un fichier qui sera "lu" dans une fenêtre de syntaxe.

Dans SPSS sur les ordinateurs centraux, seule la dernière façon est utilisable. Pour illustrer les trois façons de faire, nous demanderons une distribution de fréquences de la variable VAR11 du fichier DATA.SAV.

a- Avec les menus: - sur la barre des menus de SPSS, choisir « ANALYSE », - choisir « DESCRIPTIVE STATISTICS », - choisir « FREQUENCIES », - choisir la ou les variables (cliquer sur VAR11), - cliquer sur - cliquer sur OK pour déclencher l'exécution de la commande.

Page 12: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

12

SPSS calculera la distribution de fréquences de la variable VAR11 et rendra automatiquement active la fenêtre OUTPUT pour afficher les résultats de ses calculs.

b- En faisant écrire la commande par SPSS dans une fenêtre de syntaxe : La procédure à suivre est la même que la précédente, sauf à la dernière étape :

- sur la barre des menus de SPSS, choisir « ANALYSE », - choisir « DESCRIPTIVE STATISTICS », - choisir « FREQUENCIES », - choisir la ou les variables (cliquer sur VAR11), - cliquer sur - cliquer sur PASTE.

PASTE fait écrire à SPSS la commande dans la fenêtre de syntaxe, sans exécuter la commande. De cette façon, il est possible d'écrire plusieurs commandes différentes avant de les faire exécuter en "lot". Pour faire exécuter la ou les commandes :

- se placer dans la fenêtre de syntaxe les contenant, - définir un bloc contenant les commandes à faire exécuter (sélectionner), - cliquer sur .

c. Avec un programme: - se placer dans la fenêtre des commandes SYNTAX; s'il n'y en a pas, faire (FILE/NEW/SYNTAX), - écrire FREQUENCIES VARIABLES=VAR11. (laisser le curseur sur la ligne), - cliquer sur .

5- LA SYNTAXE DANS SPSS Toutes les opérations statistiques peuvent être demandées de manière syntaxique à l'aide de commandes seule ou regroupées dans un programme. L'efficacité reliée à l'utilisation du langage syntaxique croit avec l'ampleur de l'analyse à réaliser. Toutes les commandes de SPSS sont cependant soumises à quelques règles générales d'écriture qu'il est impératif de connaître :

- chaque commande SPSS commence par un mot clef débutant sur la première position d'une ligne,

- une commande SPSS comprend habituellement des sous-commandes qui commencent par un autre mot clef précédé par "/",

- une commande SPSS peut être écrite sur plusieurs lignes; on ne doit pas cependant "couper" les mots en deux,

- une commande SPSS se termine par un "." (point), - SPSS exécute les commandes dans l'ordre où elles sont placées dans le fichier.

Il existe trois sortes de commandes principales : 1- des commandes de calculs (procédures),

Page 13: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

13

2- des commandes de transformation d'un fichier (variables ou cas): sélection de cas, modification de valeurs, etc.

3- des commandes de gestion de(s) fichier(s) (lire un fichier, sauvegarder un fichier).

6- Quelques commandes de calculs

a- FREQUENCIES Commande de procédure calculant des distributions de fréquences et la plupart des indices de l'analyse univariée. Syntaxe:

FREQUENCIES VARIABLES= liste des variables /FORMAT=ONEPAGE * /STATISTICS= liste des indices ou ALL * /PERCENTILES= liste des pourcentiles *. * facultatif

Exemples:

FREQUENCIES VARIABLES=VAR14. FREQUENCIES VARIABLES=VAR16 /FORMAT=ONEPAGE /STATISTICS=ALL /PERCENTILES=25 75. FREQUENCIES VARIABLES=VAR10 VAR12 VAR17 TO VAR19 /STATISTICS=MEAN MEDIAN STDDEV.

Noms SPSS des indices statistiques: DEFAULT = (MEAN STDDEV MINIMUM MAXIMUM) MEAN STDDEV MINIMUM MAXIMUM SEMEAN VARIANCE SKEWNESS SESKEW RANGE MODE KURTOSIS SEKKURT MEDIAN SUM ALL Pour un exemple d'utilisation des menus, consulter la section 4.1 du présent document.

b- MEANS Cette commande de procédure calcule les moyennes, écarts-types et nombre de cas d'une ou plusieurs variables selon les sous-groupes définis par les valeurs (combinées) d'une variable (ou de plusieurs variables).

Page 14: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

14

Syntaxe :

MEANS TABLES=liste de variables BY liste de variables BY liste de variables /STATISTICS=ALL.

Exemples : MEANS TABLES=VAR1 BY VAR2. MEANS TABLES=VAR1 BY VAR2 BY VAR3. MEANS TABLES=VAR1 BY VAR2 VAR3. La première commande calcule les moyennes, etc. de la variable VAR1 selon les sous-groupes définis par les valeurs différentes de la variable VAR2. La seconde commande calcule les moyennes, etc. de la variable VAR1 selon les sous-groupes définis par les combinaisons des valeurs des variables VAR2 et VAR3. La troisième commande calcule les moyennes, etc. de la variable VAR1 selon les sous-groupes définis par les valeurs de VAR2, puis selon les sous-groupes définis par les valeurs de VAR3. Pour exécuter cette procédure à l'aide des menus, faire (STATISTICS\COMPARE MEANS\MEANS\choisir les variables en les transférant dans la liste "Dependant List" et "Independant List" selon la problématique\Déterminer les paramètres d'impression et les indices statistiques à calculer à l'aide du bouton de commande "Options").

c- CROSSTABS TABLES Une commande permettant de demander à SPSS le calcul de tableaux de contingences, ou, autrement dit, de tableaux croisés. Syntaxe:

CROSSTABS TABLES= liste de variables BY liste de variables /STATISTICS= liste des indices statistiques * /CELLS= COUNT ROW COLUMN TOTAL EXPECTED. (Au choix) * * = facultatif.

Exemples:

CROSSTABS TABLES=VAR15 BY VAR18 /STATISTICS=CHISQ GAMMA /CELLS= COUNT ROW COLUMN. CROSSTABS TABLES=VAR10 TO VAR11 BY VAR17. CROSSTABS TABLES=VAR15 VAR16 BY VAR17 /STATISTICS=CHISQ PHI.

Liste des indices statistiques:

CHISQ LAMBDA BTAU GAMMA

Page 15: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

15

ETA PHI UC CTAU D CORR CC KAPPA RISK ALL NONE

Pour exécuter cette procédure à l'aide des menus, faire (STATISTICS\SUMMARIZE\CROSSTABS...\Choisir les variables en les transférant dans les listes "Column" et "Row"\Déterminer le format, le contenu des "cells" et les statistics désirées à l'aide des boutons de commandes au bas de la boîte de dialogue).

d- REGRESSION Syntaxe :

REGRESSION /VARIABLES= liste des variables du modèle* /MISSING=généralement LISTWISE ou INCLUDE* /STATISTICS=généralement DEFAULTS, R, COEFF, ou ALL* /DEPENDENT= variable dépendante /METHOD=généralement STEPWISE liste des variables indépendantes, ou ENTER liste des variables indépendantes /RESIDUALS=généralement DEFAULTS, HISTOGRAM liste des variables temporaires, ou OUTLIERS liste des variables temporaires* /CASEWISE=généralement DEFAULTS, OUTLIERS, ou PLOT liste des variables temporaires* /SCATTERPLOT=liste des variables temporaires* /PARTIALPLOT=généralement ALL* /SAVE=nom SPSS d'une variable temporaire (nouveau nom).*

* = facultatif. Liste des variables temporaires utilisées pour l'analyse des résidus :

PRED ADJPRED SRESID MAHAL RESID ZPRED SDRESID COOKDRESID ZRESID SEPRED LEVER DFBETA SDBETA DFFIT SDFFIT COVRATIO MCIN ICIN

Exemple : REGRESSION /MISSING=LISTWISE /STATISTICS=COEFF R COLLIN /DEPENDENT =VAR14 /METHOD=ENTER VAR10 VAR11 VAR12 VAR13 /PARTIALPLOT=ALL /RESIDUALS=DURBIN HIST(ZRESID) NORM(ZRESID) /CASEWISE=PLOT(ZRESID) OUTLIERS(3).

Pour faire exécuter cette procédure à l'aide du menu, faire (ANALYSE\REGRESSION\Choisir le type de régression désirée\Transférer la variable dépendante dans la liste "Dependent" et les variables indépendantes dans la liste

Page 16: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

16

"Independents"\Choisir la méthode d'entrée dans la liste de sélection "Method"\Utiliser les boutons de commande "Statistics", "Plot", "Save" et "Options" pour spécifier les indices statistiques désirés et le type d'analyse des résidus attendus).

7- Quelques commandes de transformation L'utilisation du menu et des sous-menus afin de transformer des variables ou de choisir des répondants est une source importante d'erreurs lorsqu'on débute avec WINSPSS. C'est pourquoi il est fortement recommandé de connaître la syntaxe de ces commandes. Il ne faut pas oublier que les transformations effectuées affectent le fichier de données en mémoire vive de l'ordinateur. Pour conserver les modifications, il faut sauvegarder

les données. Cependant, il est fortement recommandé de les conserver sous un nouveau

nom (créer un nouveau fichier de données) afin de disposer d'une banque de données

intacte pour des analyses subséquentes.

a- RECODE Une commande de transformation des valeurs d'une ou plusieurs variables. Syntaxe :

RECODE liste des variables (valeurs anciennes = nouvelle valeur) (valeurs anciennes = nouvelle valeur) etc.

Exemples :

RECODE VAR13 (1,2=3) (3=2) (4,5=1). RECODE VAR19 (1 THRU 3=3)(4=2)(ELSE=1). RECODE VAR14 TO VAR16 (1,2=3) (3=2) (4 THRU HIGHEST=1).

Opérateurs logiques utiles :

LO LOWEST HI HIGHEST ELSE THRU

b- SELECT IF Une commande de "transformation" des cas: seuls les cas satisfaisant la condition indiquée dans la commande sont retenus dans les analyses suivantes (voir TEMPORARY). Syntaxe :

SELECT IF (une condition). Exemples :

SELECT IF (VAR17 = 1 AND VAR12 >3). SELECT IF (VAR11 = 1). SELECT IF ((VAR17 EQ 1) AND (VAR12 GE 3)).

Page 17: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

17

Opérateurs logiques utiles : égal à EQ ou = inégal à NE ou <> moins que LT ou < plus que GT ou > moins que ou égal à LE ou <= plus que ou égal à GE ou >= et AND ou OR ne pas NOT

c- COMPUTE Une commande de transformation pour créer une nouvelle variable ou modifier une variable déjà existante à l'aide d'une expression algébrique. Syntaxe :

COMPUTE variable-cible = expresion algébrique. Exemples :

COMPUTE VAR3=VAR1+VAR2. COMPUTE VAR4=VAR1.

La variable VAR3 se voit attribuer les valeurs de la somme de VAR1 et VAR2 pour chaque cas du fichier de données en mémoire vive. La variable VAR4 se voit attribuer les valeurs de la variable VAR1. Si la variable-cible n'existe pas dans le fichier de données en mémoire vive, SPSS ajoute la variable-cible à ce fichier et lui associe a priori une valeur manquante de système pour tous les cas. Par la suite, en lisant les cas du fichier en mémoire vive, cette valeur "manquante" est remplacée pour chaque cas par la valeur de l'expression algébrique si toutes les valeurs des variables de cette expression ne sont pas des valeurs

"manquantes" pour ce cas. Si la variable-cible existe déjà, ses valeurs sont remplacées par celles de l'expression algébrique pour les cas dont toutes les variables de l'expression algébrique ne sont pas "manquantes". Il existe aussi de nombreuses fonctions dans SPSS qui peuvent faciliter les transformations : Exemples :

COMPUTE LSAL=LG10(SAL). COMPUTE M2=SQRT(VAR1).

Page 18: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

18

d - IF Cette commande de transformation est similaire à COMPUTE, elle calcule les valeurs d'une expression algébrique pour une variable-cible, mais seulement si une certaine condition est satisfaite. Syntaxe :

IF (une condition) variable-cible = une expression algébrique. Exemples :

IF (VAR1 EQ 1) VAR3=VAR4 + VAR5. IF (VAR1 NE 1) VAR3=9. MISSING VALUES VAR3 (9).

VAR3 contient la somme de VAR4 et VAR5 seulement si VAR1 égale 1 ; autrement, VAR3 égale 9 (qui est par la suite déclarée "valeur manquante").

e- COUNT Cette commande de transformation place dans une variable-cible le nombre d'occurrences d'un ou plusieurs codes pour plusieurs variables. Syntaxe :

COUNT variable-cible = une liste de variables (des codes). Exemples : COUNT VAR4=VAR10 VAR11 VAR12 (1). COUNT VAR5=VAR10 VAR11 VAR12 (3 THRU 5). La variable VAR4 contient le nombre de "1" dans les trois variables VAR10, VAR11 et VAR12 pour chaque cas (0,1,2 ou 3). La variable VAR5 contient le nombre de fois que l'on trouve des valeurs entre 3 et 5 pour chaque variable VAR10, VAR11 et VAR12.

f- WEIGHT

8- TEMPORARY Des commandes de transformation comme RECODE (ou comme SELECT IF) affectent toutes les commandes qui les suivent. Pour obtenir des transformations "temporaires", on utilise la commande TEMPORARY. Une commande limitant la portée des transformations jusqu'à la première procédure de calcul la suivant. La commande TEMPORARY se place immédiatement avant la première commande (habituellement une commande de transformation) que l'on veut affecter "temporairement". Exemples :

Page 19: Manuel de formationPour pouvoir faire des calculs, SPSS doit disposer de données. Il faut donc écrire ces données dans la fenêtre des données DATA ou, mieux, faire "lire" à SPSS

19

TEMPORARY. SELECT IF (VAR17 EQ 1). RECODE VAR10 (1,2=1)(3,4,5=2). RECODE VAR14 (1 THRU 3=1)(ELSE=2). FREQUENCIES VARIABLES=VAR10 VAR14. FREQUENCIES VARIABLES=VAR10 VAR14.

Seulement la première distribution de fréquences sera affectée par les transformations.