842
SPSS ® Base 14.0 Guide de l’utilisateur

SPSS Base Users Guide 14.0

Embed Size (px)

Citation preview

Page 1: SPSS Base Users Guide 14.0

SPSS® Base 14.0Guide de l’utilisateur

Page 2: SPSS Base Users Guide 14.0

Pour plus d’informations sur les logiciels SPSS®, visitez notre site Web à l’adresse suivante : http://www.spss.com ou contactez

SPSS Inc.

233 South Wacker Drive, 11th Floor

Chicago, IL 60606-6412

Tél : (312) 651-3000

Fax : (312) 651-3668

SPSS est une marque déposée et les autres noms de produit sont des marques commerciales de SPSS Inc. pour son logiciel

informatique propriétaire. La distribution ou la production de matériel décrivant ce type de logiciel est interdite sans

l’autorisation écrite des propriétaires de la marque commerciale et des droits de licence dans le logiciel, et des copyrights

dans les différentes documentations.

Le LOGICIEL et sa documentation sont soumis à des DROITS RESTREINTS. L’utilisation, la reproduction ou la divulgation

par le Gouvernement des Etats-Unis est sujette à des restrictions telles qu’elles sont décrites dans la sous-division (c)(1)(ii) de la

clause « The Rights in Technical Data and Computer Software », alinéa 52.227-7013. Le contractant et fabricant est SPSS Inc.,

233 South Wacker Drive, 11th Floor, Chicago IL 60606-6412, Etats-Unis.

Remarque générale : Les autres noms de produit mentionnés dans ce document sont utilisés à des fins d’illustration uniquement

et peuvent être des marques commerciales de leurs détenteurs respectifs.

TableLook est une marque commerciale de SPSS Inc.

Windows est une marque déposée de Microsoft Corporation.

DataDirect, DataDirect Connect, INTERSOLV et SequeLink sont des marques déposées de DataDirect Technologies.

Certaines parties de ce produit ont été créées à l’aide de LEADTOOLS © 1991–2000, LEAD Technologies, Inc. TOUS

DROITS RESERVES.

LEAD, LEADTOOLS et LEADVIEW sont des marques déposées de LEAD Technologies, Inc.

Sax Basic est une marque commerciale de Sax Software Corporation. Copyright © 1993–2004 Polar Engineering and

Consulting. Tous droits réservés.

Certaines parties de ce produit ont été basées sur le travail du FreeType Team (http://www.freetype.org).

Une partie du logiciel SPSS contient la technologie zlib. Copyright © 1995–2002 Jean-Loup Gailly et Mark Adler. Le logiciel

zlib est fourni « en l’état », sans garantie expresse ou implicite.

Une partie du logiciel SPSS contient des bibliothèques Sun Java Runtime. Copyright © 2003 Sun Microsystems, Inc. Tous droits

réservés. Les bibliothèques Sun Java Runtime comprennent un code sous licence de RSA Security, Inc. Certaines parties de ces

bibliothèques sont concédées sous licence par IBM et sont disponibles à l’adresse suivante : http://oss.software.ibm.com/icu4j/.

SPSS Base 14.0 Guide de l’utilisateur

© 2005 SPSS Inc.

Tous droits réservés.

Toute reproduction, tout stockage dans un système de récupération et toute transmission, même partiels, de quelque forme ou par

quelque moyen que ce soit, électronique, mécanique, par photocopie, enregistrement ou autre sont interdits sans le consentement

préalable écrit de l’éditeur.

1 2 3 4 5 6 7 8 9 0 08 07 06 05

ISBN 1-56827-680-X

Page 3: SPSS Base Users Guide 14.0

Préface

SPSS 14.0

SPSS 14.0 est un système complet d’analyse de données. SPSS peut utiliser lesdonnées de presque tout type de fichier pour générer des rapports mis en tableau,des diagrammes de distributions et de tendances, des statistiques descriptives et desanalyses statistiques complexes.

Ce guide, SPSS Base 14.0 Guide de l’utilisateur, documente l’interface utilisateurgraphique de SPSS pour Windows. Le système d’aide installé avec le logiciel contientdes exemples d’utilisation des procédures statistiques du système SPSS Base 14.0.Les algorithmes utilisés dans les procédures statistiques sont disponibles au formatPDF à partir du menu Aide.

En outre, sous les menus et les boîtes de dialogue, SPSS utilise un langage decommande. Certaines fonctions étendues du système sont accessibles uniquement viaune syntaxe de commande. (Ces fonctions ne sont pas disponibles dans la versionStudent.) Un guide de référence détaillé sur la syntaxe des commandes est disponiblesous deux formes différentes : guide intégré dans le système d’aide global et commedocument distinct au format PDF dans SPSS 14.0 Command Syntax Reference, aussidisponible à partir du menu Aide.

Options SPSS

Les options suivantes sont fournies comme améliorations complémentaires dusystème de base complet SPSS Base (pas de la version Student) :

Le module Modèles de régression SPSS™ fournit des techniques d’analyse desdonnées non adaptées aux modèles statistiques linéaires classiques. Il contient desprocédures pour les modèles de choix binaire, la régression logistique, la pondérationestimée, la régression par les doubles moindres carrés et la régression non linéairegénérale.

iii

Page 4: SPSS Base Users Guide 14.0

Le module Modèles avancés SPSS™ décrit les techniques souvent utilisées dansla recherche biomédicale et expérimentale avancée. Il inclut des procédures pourles modèles linéaires généraux (GLM), les modèles mixtes linéaires, l’analyse descomposantes de variance, l’analyse log-linéaire, la régression ordinale, la durée de vieactuarielle, l’analyse de survie de Kaplan-Meier, et la régression de Cox de base etétendue.

Le module Tableaux SPSS™ crée toute une gamme de rapports en tableau de qualitéprésentation, y compris des tableaux croisés complexes et les affichages de donnéesde réponses multiples.

Le module Séries SPSS™ effectue des prévisions et des analyses de sérieschronologiques complètes avec plusieurs modèles d’ajustement aux courbes, desmodèles de lissage et des méthodes d’estimation des fonctions autorégressives.

Le module Modalités SPSS® exécute des procédures de codage optimal commel’analyse des correspondances.

Le module Conjoint SPSS™ effectue des analyses Conjoint.

Le module Tests exacts SPSS™ calcule les valeurs p exactes pour les tests statistiqueslorsque de petits échantillons ou des échantillons distribués de façon très inégalerisquent de fausser la précision des tests habituels.

Le module Analyse des valeurs manquantes SPSS™ décrit les types des donnéesmanquantes, évalue les moyennes et d’autres statistiques, et affecte des valeurs auxobservations manquantes.

Le module SPSS Maps™ transforme vos données distribuées géographiquement encartes de haute qualité comportant des symboles, des couleurs, des diagrammes enbâtons ou en secteurs, et des combinaisons de thèmes, ce qui permet de représenter cequi se passe et où cela se passe.

Le module Echantillonnage SPSS™ permet aux chercheurs chargés d’effectuerdes enquêtes (notamment d’opinion), des études de marché, ou travaillant dans ledomaine de la santé, ainsi qu’aux spécialistes des sciences sociales qui utilisent uneméthodologie d’étude fondée sur les échantillons, d’incorporer leurs propres plansd’échantillonnage complexes dans l’analyse des données.

Le module Arbres de segmentation SPSS™ crée un modèle d’arbre de segmentation.Elle classe les observations en groupes ou estime les valeurs d’une variable (cible)dépendante à partir des valeurs de variables (explicatives) indépendantes. Cetteprocédure fournit des outils de validation pour les analyses de classificationd’exploration et de confirmation.

iv

Page 5: SPSS Base Users Guide 14.0

Validation des données SPSS™ fournit un cliché visuel rapide de vos données. Ilpermet d’appliquer des règles de validation qui identifient les valeurs de donnéesinvalides. Vous pouvez créer des règles qui repèrent les valeurs hors plage, les valeursmanquantes et les valeurs vides. Vous pouvez également enregistrer des variables quienregistrent les violations de règles individuelles et le nombre total de violations derègles par observation. Un ensemble limité de règles prédéfinies que vous pouvezcopier ou modifier vous est fourni.

La famille des produits SPSS comprend également des applications pour la saisie dedonnées, l’analyse de texte, la classification, les réseaux neuronaux et l’établissementd’organigrammes.

Installation

Pour installer le SPSS Base system, lancez l’assistant d’attribution de licence à l’aidedu code correspondant fourni par SPSS Inc. Pour plus d’informations, reportez-vousaux instructions d’installation fournies avec le SPSS Base system.

Compatibilité

SPSS est conçu pour fonctionner sous de nombreux systèmes d’exploitation. Pourplus d’informations sur la configuration minimale ou recommandée, reportez-vousaux instructions d’installation de votre système.

Numéros de série

Le numéro de série permet de vous identifier auprès de SPSS Inc. Vous en aurezbesoin lors de tout appel à SPSS Inc. pour des informations relatives au support,au paiement ou à la mise à niveau de votre système. Le numéro de série est fourniavec le système de base.

Service clients

Si vous avez des questions concernant votre envoi ou votre compte, contactez votrebureau local, dont les coordonnées figurent sur le site Web de SPSS à l’adressesuivante : http://www.spss.com/worldwide. Veuillez préparer et conserver votrenuméro de série à portée de main pour l’identification.

v

Page 6: SPSS Base Users Guide 14.0

Séminaires de formation

SPSS Inc. propose des séminaires de formation, publics et sur site. Tous lesséminaires font appel à des ateliers de travaux pratiques. Ces séminaires serontproposés régulièrement dans les grandes villes. Pour plus d’informations sur cesséminaires, contactez votre bureau local dont les coordonnées sont indiquées sur lesite Web de SPSS à l’adresse suivante : http://www.spss.com/worldwide.

Support technique

Les services du support technique de SPSS sont disponibles pour les utilisateursinscrits. Les clients peuvent contacter le support technique pour obtenir del’aide concernant l’utilisation de SPSS ou l’installation dans le cadre de l’un desenvironnements matériels pris en charge. Pour contacter le support technique, visitezle site Web de SPSS à l’adresse http://www.spss.com ou contactez votre bureaulocal dont les coordonnées figurent sur le site Web de SPSS à l’adresse suivante: http://www.spss.com/worldwide. Votre nom ou celui de votre société, ainsi que lenuméro de série de votre système, vous seront demandés.

Documents supplémentaires

Vous pouvez faire l’acquisition d’autres copies des manuels du produit SPSSdirectement auprès de SPSS Inc. Visitez le magasin de notre site Web àl’adresse http://www.spss.com/estore ou contactez votre bureau SPSS localdont les coordonnées figurent sur le site Web de SPSS à l’adresse suivante :http://www.spss.com/worldwide. Pour passer commande par téléphone aux Etats-Uniset au Canada, appelez SPSS Inc. au numéro 800-543-2185. Dans les autres pays,contactez votre bureau local dont les coordonnées figurent sur le site Web de SPSS.

Le module supplémentaire de procédures statistiques SPSS, créé par MarijaNorušis, a été publié par Prentice Hall. Une nouvelle version de ce manuel, miseà jour pour SPSS 14.0, est prévue. Le module supplémentaire de procéduresstatistiques SPSS avancées, qui repose également sur SPSS 14.0, sera disponibleprochainement. Le manuel d’analyse des données SPSS Guide to Data Analysis deSPSS 14.0 est également en préparation. L’annonce des publications disponiblesuniquement auprès de Prentice Hall pourra être consultée sur le site Web de SPSS àl’adresse suivante : http://www.spss.com/estore (sélectionnez le pays de votre choix,puis cliquez sur Books).

vi

Page 7: SPSS Base Users Guide 14.0

Votre avis nous intéresse

Vos remarques sont importantes. Veuillez nous envoyer une lettre nous décrivantvotre expérience de l’utilisation des produits SPSS. Nous apprécions toutparticulièrement les informations sur des applications nouvelles et intéressantesutilisant SPSS Base system. Veuillez nous envoyer un message électronique àl’adresse [email protected] ou écrivez à : Director of Product Planning, 233 SouthWacker Drive, 11th Floor, Chicago, IL 60606-6412, U.S.A.

A propos de ce manuel

Ce manuel présente l’interface graphique des procédures de SPSS Base system. Lesillustrations des boîtes de dialogue sont issues de SPSS for Windows. Les boîtes dedialogue des versions conçues pour les autres systèmes d’exploitation sont similaires.Vous trouverez plus d’informations sur la syntaxe de commande des fonctions deSPSS Base system est disponible sous deux formes différentes : guide intégré dans lesystème d’aide global et comme document distinct au format PDF dans SPSS 14.0Command Syntax Reference, disponible à partir du menu Aide.

Contacter SPSS

Si vous souhaitez être inscrit sur notre liste de mailing, contactez l’un denos bureaux, dont les coordonnées figurent sur notre site Web à l’adressehttp://www.spss.com/worldwide.

vii

Page 8: SPSS Base Users Guide 14.0
Page 9: SPSS Base Users Guide 14.0

Index

1 Sommaire 1

Nouveautés de SPSS 14.0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2Fenêtres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7Menus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9Barre d’état . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9Boîtes de dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10Noms de variables et étiquettes de variable dans les listes de boîtes dedialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10Commande des boîtes de dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11Sous-boîtes de dialogue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12Sélection de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12Icônes de la liste Variable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13Obtenir des informations sur les variables dans les boîtes de dialogue . . . . 13Procédures de base dans l’analyse des données . . . . . . . . . . . . . . . . . . . . 14Assistant statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14En savoir plus sur SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2 Obtention d’Aide 17

Utilisation du sommaire de l’aide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20Utilisation de l’index de l’aide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21Utilisation de la recherche dans l’aide . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21Aide sur les commandes des boîtes de dialogue . . . . . . . . . . . . . . . . . . . . . 22

ix

Page 10: SPSS Base Users Guide 14.0

Aide sur les termes utilisés dans les résultats . . . . . . . . . . . . . . . . . . . . . . . 23Utilisation de l’option Etudes de Cas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24Copie de texte d’aide à partir d’une fenêtre contextuelle. . . . . . . . . . . . . . . 24

3 Fichiers de données 25

Ouverture d’un fichier de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25Pour ouvrir un fichier de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25Types de fichier de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26Ouvrir les options de fichier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27Lecture de fichiers Excel version 5 ou ultérieure . . . . . . . . . . . . . . . . . . . . . 27Lecture de fichiers Excel antérieurs ou autres tableurs avec l’éditeur dedonnées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28Lecture de fichiers dBASE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28Lecture de fichiers Stata. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29Lire des fichiers de base de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29Assistant de texte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49Lecture des données de dimension. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62Informations sur les fichiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67Enregistrement des fichiers de données . . . . . . . . . . . . . . . . . . . . . . . . . . . 68Pour enregistrer des fichiers de données modifiés . . . . . . . . . . . . . . . . . . . 68Enregistrement de fichiers de données au format Excel . . . . . . . . . . . . . . . 68Enregistrement de fichiers de données au format SAS . . . . . . . . . . . . . . . . 69Enregistrement de fichiers de données au format Stata . . . . . . . . . . . . . . . 71Pour enregistrer des fichiers de données sous des formats différents. . . . . 73Enregistrement de données : Types de fichier de données . . . . . . . . . . . . . 73Enregistrement de sous-ensembles de variables . . . . . . . . . . . . . . . . . . . . 76Enregistrement de fichier : Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77Protection des données d’origine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

x

Page 11: SPSS Base Users Guide 14.0

Fichier actif virtuel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

4 Mode d’analyse distribuée 83

Analyse distribuée et analyse locale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

5 Editeur de données 95

Affichage des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96Affichage des variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97Saisie de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109Modification de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111Aller à l’observation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115Etat de la sélection de l’observation dans l’éditeur de données . . . . . . . . . 116Options d’affichage de l’éditeur de données . . . . . . . . . . . . . . . . . . . . . . . 117Impression de l’éditeur de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

6 Utilisation des sources de données multiples 119

Manipulation de base de plusieurs sources de données . . . . . . . . . . . . . . 120Copie et collage d’informations entre les ensembles de données . . . . . . . 122Attribution d’un nouveau nom aux ensembles de données . . . . . . . . . . . . 122

7 Préparation des données 123

Propriétés de variable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

xi

Page 12: SPSS Base Users Guide 14.0

Définition des propriétés de variable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124Vecteurs de réponses multiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132Copier les propriétés de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136Identification des observations dupliquées . . . . . . . . . . . . . . . . . . . . . . . . 147Outil visuel de regroupement en bandes . . . . . . . . . . . . . . . . . . . . . . . . . . 150

8 Transformations de données 163

Calcul de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163Fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166Valeurs manquantes dans les fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . 167Générateurs de nombres aléatoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167Compter occurrences des valeurs par observation . . . . . . . . . . . . . . . . . . 169Recodage de valeurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171Recodage de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172Création de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174Ordonner les observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178Recoder automatiquement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181Assistant Date et heure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185Transformation de données pour série chronologique. . . . . . . . . . . . . . . . 203Notation de données avec des modèles de prévision . . . . . . . . . . . . . . . . 211

9 Gestion et transformations de fichiers 217

Trier les observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218Transposer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219Fusionner des fichiers de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219Ajouter des observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220

xii

Page 13: SPSS Base Users Guide 14.0

Ajouter des variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224Agréger les données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227Scinder un fichier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232Sélectionner des observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234Pondérer les observations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239Restructuration des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240

10 Utilisation du résultat 265

Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265Utilisation de résultats dans d’autres applications . . . . . . . . . . . . . . . . . . 274Collage d’objets dans le Résultats. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278Collage spécial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278Collage d’objets d’une autre application dans le Résultats . . . . . . . . . . . . 278Exporter résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279Impression de documents du Résultats. . . . . . . . . . . . . . . . . . . . . . . . . . . 291Enregistrement des résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298

11 Viewer en mode brouillon 301

Pour créer un résultat en mode brouillon . . . . . . . . . . . . . . . . . . . . . . . . . 302Contrôle du format du résultat en mode brouillon . . . . . . . . . . . . . . . . . . . 303Attributs de polices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308Pour imprimer un résultat en mode brouillon. . . . . . . . . . . . . . . . . . . . . . . 308Pour enregistrer une sortie du Viewer en mode brouillon . . . . . . . . . . . . . 310

xiii

Page 14: SPSS Base Users Guide 14.0

12 Tableaux pivotants 311

Manipulation d’un tableau pivotant . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311Utilisation des strates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316Signets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320Montrer ou masquer des cellules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321Modification des résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323Modification de l’aspect des tableaux. . . . . . . . . . . . . . . . . . . . . . . . . . . . 324Propriétés du tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326Pour modifier les propriétés d’un tableau pivotant . . . . . . . . . . . . . . . . . . 326Propriétés de tableau : Général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327Propriétés de tableau : Notes de bas de page. . . . . . . . . . . . . . . . . . . . . . 328Propriétés de tableau : Formats de cellule . . . . . . . . . . . . . . . . . . . . . . . . 329Propriétés de tableau : Bordures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331Propriétés de tableau : Impression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332Polices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333Largeur des cellules de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334Propriétés de la cellule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335Propriétés des cellules : Valeur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336Propriétés des cellules : Alignement. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337Propriétés des cellules : Marges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338Propriétés des cellules : Ombrage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339Marque de bas de page . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340Sélection des lignes et des colonnes dans les tableaux pivotants . . . . . . . 341Pour sélectionner une ligne ou une colonne dans un tableau pivotant. . . . 341Modification des résultats d’un tableau pivotant . . . . . . . . . . . . . . . . . . . . 341Impression des tableaux pivotants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342Pour imprimer les strates masquées d’un tableau pivotant . . . . . . . . . . . . 343Contrôle des sauts de tableau pour les tableaux longs et larges . . . . . . . . 343

xiv

Page 15: SPSS Base Users Guide 14.0

13 Utilisation de la syntaxe de commande 345

Règles de syntaxe de commande . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346Création d’une syntaxe depuis les boîtes de dialogue . . . . . . . . . . . . . . . . 348Utilisation de la syntaxe depuis le fichier de résultat . . . . . . . . . . . . . . . . . 349Utilisation de la syntaxe dans un fichier-journal . . . . . . . . . . . . . . . . . . . . 351Exécuter une syntaxe de commande. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353Commandes Execute multiples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353

14 Effectifs 355

Statistiques des effectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 358Diagrammes des effectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 360Format des effectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361

15 Descriptives 363

Options Descriptives. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365Fonctionnalités supplémentaires de la commande DESCRIPTIVES . . . . . . 366

16 Explorer 369

Statistiques d’Explorer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373Diagrammes d’Explorer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374Options d’Explorer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 376Fonctionnalités supplémentaires de la commande EXAMINE . . . . . . . . . . 376

xv

Page 16: SPSS Base Users Guide 14.0

17 Tableaux croisés 379

Strates de tableaux croisés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382Diagrammes en bâtons juxtaposés de tableaux croisés . . . . . . . . . . . . . . 383Statistiques de tableaux croisés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383Affichage de cellules (cases) de tableaux croisés. . . . . . . . . . . . . . . . . . . 387Format de tableau croisé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389

18 Récapituler 391

Options de Récapituler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394Récapituler les statistiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 395

19 Moyennes 399

Moyennes : Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402

20 Cubes OLAP 405

Cubes OLAP : Statistiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 408Cubes OLAP : Différences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 411Cubes OLAP : Titre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412

21 Tests T 413

Test T pour échantillons indépendants . . . . . . . . . . . . . . . . . . . . . . . . . . . 413

xvi

Page 17: SPSS Base Users Guide 14.0

Test T pour échantillons appariés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 418Test T pour échantillon unique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421Fonctionnalités supplémentaires de la commande T-TEST . . . . . . . . . . . . 423

22 ANOVA à 1 facteur 425

Contrastes ANOVA à 1 facteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 428Tests Post Hoc ANOVA à 1 facteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429Options ANOVA à 1 facteur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432Fonctionnalités supplémentaires de la commande ONEWAY . . . . . . . . . . . 433

23 Analyse GLM – Univarié 435

Modèle GLM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 439Contrastes GLM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 442Diagrammes de profils GLM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443Comparaisons post hoc GLM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445Enregistrement GLM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447Options GLM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 449Fonctionnalités supplémentaires de la commande UNIANOVA . . . . . . . . . 451

24 Corrélations bivariées 453

Options de corrélations bivariées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 456Propriétés supplémentaires des commandes CORRELATIONS et NONPARCORR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 457

xvii

Page 18: SPSS Base Users Guide 14.0

25 Corrélations partielles 459

Options Corrélations partielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462Fonctionnalités supplémentaires de la commande PARTIAL CORR . . . . . . 463

26 Distances 465

Distances : Mesures de dissimilarité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467Indices : Mesures de similarité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 468Fonctionnalités supplémentaires de la commande PROXIMITIES . . . . . . . 469

27 Régression linéaire 471

Méthodes de sélection des variables de régression linéaire . . . . . . . . . . . 476Régression linéaire : Définir la règle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 477Diagrammes de régression linéaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 478Régression linéaire : Enregistrer de nouvelles variables . . . . . . . . . . . . . . 479Statistiques de régression linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483Régression linéaire : Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 485Fonctionnalités supplémentaires de la commande REGRESSION . . . . . . . 486

28 Ajustement de fonctions 487

Modèles d’ajustement de fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 491Enregistrement de l’ajustement de fonctions. . . . . . . . . . . . . . . . . . . . . . . 492

xviii

Page 19: SPSS Base Users Guide 14.0

29 Analyse discriminante 495

Définition d’intervalles pour l’analyse discriminante . . . . . . . . . . . . . . . . . 499Sélection des observations pour l’analyse discriminante . . . . . . . . . . . . . 499Statistiques de l’analyse discriminante . . . . . . . . . . . . . . . . . . . . . . . . . . . 500Méthode pas à pas de l’analyse discriminante . . . . . . . . . . . . . . . . . . . . . 501Analyse discriminante : Classement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503Enregistrement de l’analyse discriminante . . . . . . . . . . . . . . . . . . . . . . . . 505Fonctionnalités supplémentaires de la commande DISCRIMINANT. . . . . . 505

30 Analyse factorielle 507

Sélection des observations pour l’analyse factorielle . . . . . . . . . . . . . . . . 513Descriptives d’analyse factorielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514Extraction d’analyse factorielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 515Rotation d’analyse factorielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 517Scores d’analyse factorielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519Options d’analyse factorielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 520Fonctionnalités supplémentaires de la commande FACTOR. . . . . . . . . . . . 520

31 Choix d’une procédure de classification 523

32 Analyse TwoStep Cluster 525

Options de la procédure d’analyse TwoStep Cluster . . . . . . . . . . . . . . . . . 529Diagrammes de l’analyse TwoStep Cluster . . . . . . . . . . . . . . . . . . . . . . . . 532Résultats de l’analyse TwoStep Cluster . . . . . . . . . . . . . . . . . . . . . . . . . . . 533

xix

Page 20: SPSS Base Users Guide 14.0

33 Classification hiérarchique 535

Méthode de classification hiérarchique . . . . . . . . . . . . . . . . . . . . . . . . . . 539Statistiques de la classification hiérarchique . . . . . . . . . . . . . . . . . . . . . . 540Diagrammes (graphiques) de classification hiérarchique . . . . . . . . . . . . . 541Enregistrement des nouvelles variables de classification hiérarchique . . . 541Fonctionnalités supplémentaires de la syntaxe de commande CLUSTER . . 542

34 Nuées dynamiques 543

Efficacité de la classification en nuées dynamiques . . . . . . . . . . . . . . . . . 548Itération de la classification en nuées dynamiques . . . . . . . . . . . . . . . . . . 549Enregistrement des analyses de classes de nuées dynamiques . . . . . . . . 550Options d’analyses des classes de nuées dynamiques . . . . . . . . . . . . . . . 551Fonctionnalités supplémentaires de la commande QUICK CLUSTER . . . . . 552

35 Tests non paramétriques 553

Test du Chi-deux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 554Test binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 558Suites en séquences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 561Test Kolmogorov-Smirnov pour un échantillon . . . . . . . . . . . . . . . . . . . . . 565Tests pour deux échantillons indépendants. . . . . . . . . . . . . . . . . . . . . . . . 568Tests pour deux échantillons liés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573Tests pour plusieurs échantillons indépendants . . . . . . . . . . . . . . . . . . . . 577Tests pour plusieurs échantillons liés . . . . . . . . . . . . . . . . . . . . . . . . . . . . 581

xx

Page 21: SPSS Base Users Guide 14.0

36 Analyse des réponses multiples 585

Définition de vecteurs multiréponses . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586Tableaux de fréquences des réponses multiples . . . . . . . . . . . . . . . . . . . . 588Tableaux croisés des réponses multiples . . . . . . . . . . . . . . . . . . . . . . . . . 590Définir Intervalles Tableaux croisés De réponses multiples . . . . . . . . . . . . 592Options Tableaux croisés de réponses multiples . . . . . . . . . . . . . . . . . . . . 593Fonctionnalités supplémentaires de la commande MULT RESPONSE . . . . 594

37 Tableaux de Résultats 595

Tableaux de bord en lignes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 595Tableaux de bord en colonnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604Fonctionnalités supplémentaires de la commande REPORT. . . . . . . . . . . . 611

38 Analyse de fiabilité 613

Statistiques de l’analyse de fiabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 616Fonctionnalités supplémentaires de la commande RELIABILITY . . . . . . . . 618

39 Positionnement multidimensionnel 621

Forme des données du positionnement multidimensionnel . . . . . . . . . . . . 623Positionnement multidimensionnel : créer une mesure . . . . . . . . . . . . . . . 624Modèle de positionnement multidimensionnel . . . . . . . . . . . . . . . . . . . . . 625Positionnement multidimensionnel : Options . . . . . . . . . . . . . . . . . . . . . . . 626Fonctionnalités supplémentaires de la commande ALSCAL. . . . . . . . . . . . 627

xxi

Page 22: SPSS Base Users Guide 14.0

40 Statistiques de ratio 629

Statistiques de ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 631

41 Présentation de l’utilitaire de diagramme 633

Création et modification d’un diagramme . . . . . . . . . . . . . . . . . . . . . . . . . 633Options de définition du diagramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 641

42 Courbes ROC 647

Courbe ROC : Options . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650

43 Outils 651

Informations de la variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 651Commentaires de fichier de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . 652Groupes de Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653Définir des groupes de variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653Utiliser les groupes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 655Réordonner Listes Variables Cible. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 656

44 Options 659

Options générales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 660Options Viewer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 662

xxii

Page 23: SPSS Base Users Guide 14.0

Options du Viewer en mode brouillon . . . . . . . . . . . . . . . . . . . . . . . . . . . . 663Options Etiquettes Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665Options de diagramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667Options diagrammes interactifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 672Options tableaux pivotants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 673Options de données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 676Options monétaires (devises) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 677Options script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 679

45 Personnalisation des menus et des barresd’outils 681

Editeur de menu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 681Personnalisation des barres d’outils . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 682Montrer barres d’outils . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 683Pour personnaliser les barres d’outils . . . . . . . . . . . . . . . . . . . . . . . . . . . . 683

46 Système de production 691

Utilisation de l’Utilitaire de Production . . . . . . . . . . . . . . . . . . . . . . . . . . . 693Options d’exportation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 694Invites utilisateur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 696Sollicitation de macros de production . . . . . . . . . . . . . . . . . . . . . . . . . . . . 698Options de production . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 699Contrôle du format des tâches de production . . . . . . . . . . . . . . . . . . . . . . 700Exécution de tâches de production à partir d’une ligne de commande . . . 703Publication sur le Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 705Connexion au serveur Web SmartViewer . . . . . . . . . . . . . . . . . . . . . . . . . 706

xxiii

Page 24: SPSS Base Users Guide 14.0

47 Utilitaire de script SPSS 707

Exécution d’un script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 707Scripts livrés avec SPSS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 708Autoscripts. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 709Création et modification de scripts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 711Modification d’un script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 712Fenêtre de script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 712L’Assistant script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 715Création de scripts automatiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 716Fonctionnement des scripts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 721Table des classes d’objet et conventions d’appellation . . . . . . . . . . . . . . . 723Nouvelle procédure (Script) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 728Ajout d’une description à un script . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 731Boîtes de dialogue de script personnalisées . . . . . . . . . . . . . . . . . . . . . . . 731Mise au point des scripts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 736Fichiers de script et de syntaxe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 739

48 Système de gestion des résultats 743

Types d’objet de sortie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 747Identificateurs de commande et sous-types de tableau. . . . . . . . . . . . . . . 749Etiquettes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 751Options OMS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 752Journalisation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 758Exclusion de l’affichage des résultats du Viewer. . . . . . . . . . . . . . . . . . . . 758Acheminement des résultats vers des fichiers de données SPSS . . . . . . . 759Structure de tableau OXML. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 769Identificateurs OMS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 773

xxiv

Page 25: SPSS Base Users Guide 14.0

Annexes

A Administrateur d’accès de base de données 777

B Personnalisation de documents HTML 779

Pour ajouter du code HTML personnalisé à des documents de résultatexportés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 779Contenu et format du fichier texte pour code HTML personnalisé . . . . . . . 780Pour utiliser un autre fichier ou emplacement pour le code HTMLpersonnalisé. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 780

Index 783

xxv

Page 26: SPSS Base Users Guide 14.0
Page 27: SPSS Base Users Guide 14.0

Chapitre

1Sommaire

SPSS pour Windows vous offre un puissant système d’analyse statistique et de gestionde données dans un environnement graphique, avec des menus descriptifs et desboîtes de dialogue simples, pour faire presque tout le travail à votre place. La plupartdes tâches s’effectuent par simple pointage et cliquage de la souris.

Outre la simple interface de pointage et cliquage permettant l’analyse statistique,SPSS pour Windows offre les fonctions suivantes :

Editeur de données. Data Editor est un système polyvalent de type tableur pour définir,saisir, modifier et afficher des données.

Viewer. Le nouveau Viewer permet de parcourir les résultats, d’afficher et de masquerles résultats de façon sélective, de modifier l’ordre d’affichage des résultats, dedéplacer des tableaux et diagrammes pour présentation entre SPSS et d’autresapplications.

Tableaux pivotants multidimensionnels. Vos résultats prennent vie avec les tableauxpivotants multidimensionnels. Explorez vos tableaux en réorganisant les lignes,colonnes et strates. Révélez des conclusions importantes qui peuvent se perdre dansdes rapports standard. Comparez facilement les groupes en éclatant votre tableau defaçon à ce qu’un seul groupe soit affiché à la fois.

Graphismes à haute résolution. SPSS inclut de nombreuses caractéristiques standardcomme par exemple des diagrammes haute résolution et à secteurs unis, desdiagrammes en bâtons, des histogrammes, des diagrammes de dispersion, desgraphiques 3D et plus.

Accès aux bases de données. Récupérez des informations à partir des bases dedonnées en utilisant l’assistant de base de données au lieu d’avoir à poser desquestions SQL complexes.

1

Page 28: SPSS Base Users Guide 14.0

2

Chapitre 1

Transformations de données. Les fonctionnalités de transformation vous aident àrendre vos données prêtes à l’analyse. Vous pouvez, entre autres, grouper les donnéesen sous-ensembles, combiner des modalités, ajouter, agréger, fusionner, scinder ettransposer des fichiers en toute facilité.

Distribution électronique. Envoyez des rapports électroniques aux autres utilisateurs àl’aide d’un simple clic ou exportez des tableaux et des diagrammes au format HTMLpour la distribution électronique par Internet et intranet.

Aide en ligne. Des didacticiels détaillés offrent un aperçu complet ; les rubriquesd’aide contextuelle des boîtes de dialogue vous guident dans les tâches spécifiques ;les définitions contextuelles dans les résultats de tableaux pivotants expliquent lestermes statistiques. L’Assistant statistique vous aide à trouver les procédures que vousrecherchez et les études de cas fournissent des exemples concrets sur l’utilisation desprocédures statistiques et l’interprétation des résultats.

Langage de commande. Vous pouvez effectuer la plupart des tâches à l’aide d’unsimple clic, mais SPSS fournit également un langage de commande puissant qui vouspermet d’enregistrer et d’automatiser de nombreuses tâches courantes. Le langage decommande fournit également certaines fonctions non disponibles dans les menus etles boîtes de dialogue.

Une documentation complète de la syntaxe de commande est intégrée dans lesystème d’aide global et également disponible dans un document PDF séparé, SPSSCommand Syntax Reference, également disponible à partir du menu Aide.

Nouveautés de SPSS 14.0

Gestion des données

Le fait d’avoir plusieurs sources de données ouvertes en même temps rend plusfacile la comparaison des fichiers de données, la copie des données et des attributsd’un fichier à un autre et la fusion de plusieurs sources de données sans devoirenregistrer chaque source de données en tant que fichier de données SPSS trié.

Lire et écrire des fichiers de données au format Stata. Vous pouvez lire des fichiersde données Stata version 4–8 et écrire des fichiers de données Stata version 5–8.Pour plus d’informations, tapez Stata dans l’onglet Index du système d’aide.

Lire les données à partir des sources de données de dimension SPSS, y comprisQuanvert, Quancept, et mrInterview. Pour plus d'informations, reportez-vous à «Lecture des données de dimension » dans Chapitre 3 à p. 62.

Page 29: SPSS Base Users Guide 14.0

3

Sommaire

Lire des données à partir des sources de données OLE DB. Pour plusd'informations, reportez-vous à « Sélectionner une source de données » dansChapitre 3 à p. 31.

Définir des étiquettes de valeur descriptive jusqu’à 120 octets de long (auparavantlimitées à 60 octets).

Créer des valeurs de données à partir d’étiquettes de valeurs ou les utiliser dansune logique de transformation avec la fonction VALUELABEL.

Rechercher et remplacer les valeurs de chaîne avec la fonction REPLACE.

Définir des attributs de variables personnalisées et de fichiers de données avec lescommandes VARIABLE ATTRIBUTE et DATAFILE ATTRIBUTE.

Ecrire des données dans des tables de bases de données ou dans d’autres formatsen utilisant les noms de champ/colonne non soumis aux règles d’appellation desvariables SPSS. SAVE TRANSLATE a été amélioré pour vous permettre d’utiliserdes valeurs entre guillemets pour les noms de champs/colonnes qui contiennentdes espaces, des virgules et d’autres caractères non autorisés dans les noms devariables SPSS.

Ajoutez de nouvelles colonnes aux tableaux de bases de données, modifiez lesattributs des colonnes des tableaux de bases de données, joignez des tableaux etréalisez d’autres actions autorisées avec des instructions SQL valides grâce à lanouvelle sous-commande SQL de la commande SAVE TRANSLATE.

Diagrammes

Construisez des diagrammes à partir de diagrammes prédéfinis de la galerieou à partir de différents éléments individuels (par exemple, des systèmes decoordonnées et des bâtons) à l’aide de la nouvelle interface Générateur dediagrammes (menu Graphes).

Créez des types de diagrammes personnalisés en utilisant la syntaxe de commandeperformante GGRAPH et GPL.

Enrichissement statistique

Le nouveau modélisateur expert de l’option Tendances identifie automatiquementet estime le modèle le mieux ajusté pour une ou plusieurs séries chronologiques,éliminant ainsi le besoin d’identifier un modèle approprié via une suite detentatives et d’erreurs. Le modélisateur expert est accessible à partir de la boîte de

Page 30: SPSS Base Users Guide 14.0

4

Chapitre 1

dialogue Modélisateur de séries chronologiques ou via la syntaxe de commande(commande TSMODEL).

La nouvelle option de validation des données offre un instantané visuel rapidede vos données et permet d’appliquer les règles de validation qui identifient lesvaleurs de données non valides. Vous pouvez créer des règles qui repèrent lesvaleurs hors plage, les valeurs manquantes et les valeurs vides. Vous pouvezégalement enregistrer des variables qui enregistrent les violations de règlesindividuelles et le nombre total de violations de règles par observation. Unensemble limité des règles prédéfinies que vous pouvez copier ou modifier vousest fourni. La validation des données est disponible via la boîte de dialogueValider données du menu Données ou via la syntaxe de commande (commandeVALIDATEDATA).

La nouvelle procédure de détection des anomalies dans l’option Validation desdonnées recherche les observations inhabituelles qui risqueraient d’affecter lesmodèles prédictifs. Certaines de ces observations éloignées sont des observationstout à fait uniques et s’avèrent donc inexploitables en termes de prédiction, alorsque d’autres observations sont dues à des erreurs de saisie de données danslesquelles les valeurs sont techniquement « correctes » sans pouvoir toutefoisêtre prises en compte par les procédures de validation de données. La détectiondes anomalies est disponible via la boîte de dialogue Identifier les observationsinhabituelles dans le menu Données ou via la syntaxe de commande (commandeDETECTANOMALY).

La nouvelle procédure de dépliage multidimensionnel (PREFSCAL) de l’optionModalités tente de déterminer la structure d’un groupe de mesures de proximitéentre les objets de ligne et de colonne. Ce procédé est effectué en transmettantdes observations à des positions particulières dans un espace conceptuel depetite dimension de telle sorte que les distances entre les points dans l’espacecorrespondent le mieux possible aux (dis)similarités données. Le résultat est unereprésentation à moindres carrés des objets dans cet espace de petite dimension,qui vous aidera, dans de nombreux cas, à mieux comprendre vos données. Cetteprocédure est actuellement disponible avec la syntaxe de commande PREFSCAL.

La nouvelle procédure de sélection des variables indépendantes (SELECTPRED) duserveur SPSS recherche parmi un très grand nombre de variables indépendantesqualitatives et continues. La procédure sélectionne un sous-ensemble plus petitpour une utilisation dans des procédures de modèles de précision ne pouvant pasaccépter autant de variables indépendantes. Cette procédure est actuellementdisponible avec la syntaxe de commande SELECTPRED.

Page 31: SPSS Base Users Guide 14.0

5

Sommaire

La nouvelle procédure Naïve Bayes (NAIVEBAYES) du serveur SPSS produitun modèle simple et stable pour la sélection et le classement des variablesindépendantes. Cette procédure est actuellement disponible avec la commande desyntaxe NAIVEBAYES.

Les capacités de test de signification améliorées dans l’option Tableaux vouspermettent d’exécuter des tests de signification sur les sous-totaux et les vecteursmultiréponses.

Plus de flexibilité dans la définition de vecteurs multiréponses pour lesdichotomies multiples.

Résultats

Les résultats de tableau pivotant sont maintenant fournis pour Ordonner lesobservations (RANK), Remplacer les valeurs manquantes (RMV) et Créer lasérie chronologique (CREATE) dans le système Base ; toutes les procéduresdans l’option Conjoint ; Sélection du modèle log-linéaire (HILOGLINEAR)dans l’option Modèles avancés et enfin Modèles de choix binaire (PROBIT),Pondération estimée (WLS) et Doubles moindres carrés (2SLS) dans l’optionModèles de régression.

Amélioration des performances

Les structures des tableaux qui étaient auparavant longues à créer ou qui arrivaientà court de mémoire avec l’option Tableaux personnalisés (CTABLES) peuventmaintenant être créées rapidement et efficacement.

Aspect amélioré

Icônes de variables améliorées qui offrent plus d’informations sur les variablesdu premier coup d’oeil, y compris le niveau de mesure (nominal, ordinal oud’échelle) et le type de données (chaînes, numériques, date, heure).

Prise en charge complète de l’apparence et des paramètres de thème pourWindows XP.

Compatibilité de SPSS 14.0 avec les versions précédentes

Fonctions ANY et RANGE.

Page 32: SPSS Base Users Guide 14.0

6

Chapitre 1

Dans les versions précédentes, les fonctions ANY et RANGE donnaient uniquement unevaleur manquante si le premier argument avait pour résultat une valeur manquante.Pour des raisons de cohérence avec les autres fonctions et calculs, ces fonctionsdonneront également une valeur manquante si l’un des arguments restants est unevaleur manquante par défaut ou une valeur manquante utilisateur et si la valeur dupremier argument ne correspond à aucun des autres arguments non manquants. Ainsi :

COMPUTE newvar=ANY(var1, var2, var3)

est maintenant fonctionnellement équivalent à :

COMPUTE newvar=(var1=var2 or var1=var3).

Régression logistique

Dans les versions précédentes de SPSS, l’ordre des valeurs de chaînes recodéesdépendait de l’ordre des valeurs dans le fichier de données ; par exemple, lors durecodage des variables dépendantes, la première valeur de chaîne rencontrée étaitrecodée sur 0 et la seconde sur 1. La procédure recode maintenant les variables dechaîne afin que l’ordre des valeurs recodées soit l’ordre alphanumérique des valeursde chaînes. Ainsi, la procédure peut recoder des variables chaîne différemment quedans les versions précédentes. La régression logistique est disponible dans l’optionModèles de régression.

Utilitaire macro

Les améliorations apportées à l’utilitaire macro peut produire des erreurs dans lestravaux qui s’exécutaient précédemment sans erreurs. En ce qui concerne, plusprécisément, la syntaxe traitée avec des règles interactives, si un appel de macro seproduit à la fin d’une commande et qu’aucun caractère de fin de commandes n’a étéinséré (un point ou une ligne blanche), la prochaine commande suivant l’expansion dela macro sera interprétée comme une ligne de suite au lieu d’une nouvelle commande,comme indiquée ci-dessous :

DEFINE !macro1()var1 var2 var3!ENDDEFINE.FREQUENCIES VARIABLES = !macro1DESCRIPTIVES VARIABLES = !macro1.

En mode interactif, la commande DESCRIPTIVES sera interprétée comme la suite dela commande FREQUENCIES et aucune des deux commandes ne s’exécutera.

Page 33: SPSS Base Users Guide 14.0

7

Sommaire

Fenêtres

Il existe beaucoup de types de fenêtres différents dans SPSS :

Editeur de données. Data Editor affiche le contenu du fichier de données actif. Vouspouvez créer de nouveaux fichiers de données ou modifier des fichiers de donnéesexistants avec Data Editor. Si vous avez plus d’un fichier de données d’ouvert, alors ily a une fenêtre Data Editor distinctes pour chaque fichier de données.

Viewer. Tous les résultats, tableaux et diagrammes différents s’affichent dans leViewer. Vous pouvez modifier les résultats et les enregistrer pour une utilisationultérieure. Une fenêtre du Viewer s’ouvre automatiquement la première fois que vousexécutez une procédure qui génère des résultats.

Viewer en mode brouillon. Vous pouvez afficher un résultat en texte simple (plutôt quesous forme de tableaux pivotants interactifs) dans le Viewer en mode brouillon.

Editeur de tableaux pivotants. Les résultats affichés dans les tableaux pivotants peuventêtre modifiés de diverses manières grâce à l’éditeur de tableaux pivotants. Vouspouvez modifier le texte, permuter les données dans les lignes et colonnes, ajouter dela couleur, créer des tableaux multidimensionnels, et masquer et afficher les résultatsde façon sélective.

Editeur de diagrammes. Vous pouvez modifier les diagrammes à haute résolution dansles fenêtres de graphique. Vous pouvez changer les couleurs, sélectionner des policesde taille ou de type différent, permuter les axes horizontal et vertical, faire pivoter lesdiagrammes de dispersion 3D, et même changer le type de diagramme.

Editeur de résultats texte. Les résultats texte qui ne sont pas affichés dans les tableauxpivotants peuvent être modifiés grâce à l’éditeur de résultats. Vous pouvez modifierles résultats et changer les caractéristiques des polices (type, style, couleur, taille).

Editeur de syntaxe. Vous pouvez coller les choix des boîtes de dialogue dans unefenêtre de syntaxe, lorsque vos choix apparaissent sous forme de syntaxe decommande. Vous pouvez alors modifier la syntaxe de commande pour utiliser lesfonctions spéciales de SPSS qui ne sont pas disponibles dans les boîtes de dialogue.Vous pouvez enregistrer ces commandes dans un fichier pour les utiliser dans dessessions SPSS ultérieures.

Editeur de script. Le script et l’automatisation OLE vous permettent de personnaliseret d’automatiser de nombreuses tâches de SPSS. Utilisez l’éditeur de script pour créeret modifier des scripts de base.

Page 34: SPSS Base Users Guide 14.0

8

Chapitre 1

Figure 1-1Editeur de données et Viewer

Fenêtre désignée et fenêtre active

Si vous avez plusieurs fenêtres du Viewer ouvertes, le résultat est dirigé vers lafenêtre Viewer désignée. Si vous avez plusieurs fenêtres Editeur de syntaxe ouvertes,la syntaxe de commande est collée dans la fenêtre Editeur de syntaxe désignée. Lesfenêtres désignées seront indiquées par un signe plus dans l’icône de la barre de titres.Vous pouvez changer les fenêtres désignées à tout moment.

Il ne faut pas confondre fenêtre désignée et fenêtre active, qui est la fenêtresélectionnée. Si plusieurs fenêtres se chevauchent, la fenêtre active apparaît enpremier plan. Si vous ouvrez une fenêtre, elle devient automatiquement la fenêtreactive et la fenêtre désignée.

Changer la fenêtre désignée

E Activez la fenêtre de votre choix (en cliquant n’importe où dans la fenêtre).

Page 35: SPSS Base Users Guide 14.0

9

Sommaire

E Cliquez sur l’outil Fenêtre désignée dans la barre d’outils (l’icône du signe plus).

ou

E A partir des menus, sélectionnez :Outils

Désigner la fenêtre

Remarque : A partir des fenêtres de Data Editor, la fenêtre de données activedétermine l’ensemble de données qui est utilisé dans les analyses et calculs suivants. Iln’y a pas de fenêtre Data Editor « désignée ». Pour plus d'informations, reportez-vousà « Manipulation de base de plusieurs sources de données » dans Chapitre 6 à p. 120.

Menus

Un grand nombre des tâches effectuées avec SPSS sont disponibles via des sélectionsde menus. Dans SPSS chaque fenêtre a sa propre barre de menus avec les sélectionsde menus propres à ce type de fenêtre.

Les menus Analyse et Graphes sont disponibles dans toutes les fenêtres, ce quifacilite la génération de nouveaux résultats sans changer de fenêtre.

Barre d’état

La barre d’état affichée en bas de chaque fenêtre SPSS donne les informationssuivantes :

Etat de commande. Pour chaque procédure ou commande que vous exécutez, uncompteur d’observations indique le nombre d’observations déjà traitées. Pour lesprocédures statistiques qui demandent un traitement itératif, le nombre d’itérationss’affiche.

Etat du filtre. Si vous avez sélectionné un échantillon aléatoire ou un sous-ensembled’observations à analyser, le message Filtre activé indique qu’un certain type defiltrage d’observations est en vigueur et que l’analyse ne prend pas en compte toutesles observations du fichier de données.

Etat de la pondération. Le message Pondération activée indique qu’une variablede pondération est utilisée pour pondérer les observations prises en compte dansl’analyse.

Page 36: SPSS Base Users Guide 14.0

10

Chapitre 1

Etat de Fichier divisé. Le message Fichier scindé activé indique que le fichier dedonnées a été séparé en groupes distincts pour l’analyse, d’après les valeurs d’une oude plusieurs variables de regroupement.

Afficher ou masquer la barre d’état

E A partir des menus, sélectionnez :Affichage

Barre d’état

Boîtes de dialogue

La plupart des sélections de menu déclenchent l’ouverture de boîtes de dialogue.Les boîtes de dialogue permettent de sélectionner des variables et des options poureffectuer des analyses.

Les boîtes de dialogue des procédures statistiques et des diagrammes comportentdeux éléments de base :

Liste des variables sources. Une liste de variables dans l’ensemble de données actif.Seuls les types de variables autorisés par la procédure sélectionnée apparaissentdans la liste source. L’utilisation des variables alphanumériques courtes etalphanumériques longues est limitée dans de nombreuses procédures.

Liste(s) des variables cible. Une ou plusieurs listes indiquant les variables que vousavez choisies pour l’analyse, comme par exemple les listes de variables dépendanteset explicatives.

Noms de variables et étiquettes de variable dans les listesde boîtes de dialogue

Vous pouvez afficher soit des noms de variables, soit des étiquettes de variable dansles listes de boîtes de dialogue.

Pour contrôler l’affichage des noms de variables ou les étiquettes, choisissezOptions dans le menu Edition de n’importe quelle fenêtre.

Pour définir ou modifier des étiquettes de variable, utilisez l’affichage desvariables de l’éditeur de données.

Page 37: SPSS Base Users Guide 14.0

11

Sommaire

Pour des données importées à partir de sources de bases de données, les noms dechamps sont utilisés comme étiquettes de variable.

Pour de longues étiquettes, positionnez le pointeur de la souris sur l’étiquette dansla liste pour visualiser l’étiquette dans sa totalité.

Si aucune étiquette de variable n’est définie, le nom de la variable est affiché.

Figure 1-2Etiquettes de variables affichées dans une boîte de dialogue

Commande des boîtes de dialogue

La plupart des boîtes de dialogue comportent cinq commandes standard :

OK. Exécute la procédure. Une fois que vous avez sélectionné vos variables etéventuellement choisi des spécifications supplémentaires, cliquez sur OK pourexécuter la procédure et fermer la boîte de dialogue.

Coller. Ce bouton génère la syntaxe de commande à partir des sélections de laboîte de dialogue et colle la syntaxe dans une fenêtre de syntaxe. Vous pouvezalors personnaliser les commandes avec d’autres fonctions SPSS qui ne sont pasdisponibles à partir des boîtes de dialogue.

Restaurer. Désélectionne des variables dans la ou les listes de variables sélectionnéeset remet toutes les spécifications de la boîte de dialogue et des sous-boîtes de dialogueéventuelles à l’état par défaut.

Page 38: SPSS Base Users Guide 14.0

12

Chapitre 1

Annuler. Annule les modifications apportées aux paramètres de la boîte de dialoguedepuis sa dernière ouverture et ferme la boîte de dialogue. Au sein d’une session, lesparamètres de la boîte de dialogue restent tels quels. Une boîte de dialogue conservel’ensemble de spécifications le plus récent jusqu’à ce que vous les ayez annulées.

Aide. Aide sensible au contexte. Ce bouton vous permet d’accéder à une fenêtred’aide qui contient des informations sur la boîte de dialogue active. Vous pouvezaussi obtenir de l’aide sur des commandes individuelles des boîtes de dialogue encliquant sur la commande avec le bouton droit de la souris.

Sous-boîtes de dialogue

Etant donné que la plupart des procédures SPSS présentent une grande flexibilité, iln’est pas possible d’inclure tous les choix possibles dans une seule boîte de dialogue.La boîte de dialogue principale contient généralement le minimum d’informationsnécessaires pour exécuter une procédure. Les spécifications supplémentaires se fontdans les sous-boîtes de dialogue.

Dans la boîte de dialogue principale, les commandes dont le nom est suivi depoints de suspension (...) indiquent qu’une boîte de dialogue secondaire va apparaître.

Sélection de variables

Pour sélectionner une seule variable, il suffit de la mettre en surbrillance dans la listedes variables sources et de cliquer sur la flèche droite à côté de la liste des variablescibles. S’il n’y a qu’une liste de variables cible, vous pouvez double-cliquer sur desvariables individuelles pour les faire passer de la liste source vers la liste cible.

Vous pouvez aussi sélectionner plusieurs variables :

Pour sélectionner plusieurs variables qui sont groupées dans la liste de variables,cliquez sur la première puis, tout en appuyant sur Maj, cliquez sur la dernière dugroupe.

Pour sélectionner plusieurs variables qui ne sont pas regroupées dans la liste devariables, cliquez sur la première puis, tout en appuyant sur Ctrl, cliquez surla variable suivante et ainsi de suite.

Page 39: SPSS Base Users Guide 14.0

13

Sommaire

Icônes de la liste Variable

Les icônes affichées à côté des variables dans les listes de la boîte de dialoguefournissent des informations sur le type de variable et le niveau de mesure.

Type de donnéesNiveau demesure Numérique Chaîne Date Heure

Echelle n/a

Ordinale

Nominale

Obtenir des informations sur les variables dans les boîtes dedialogue

E Cliquez avec le bouton droit de la souris sur une variable dans la liste des variablessources ou cibles.

E Sélectionnez Informations sur les variables.

Page 40: SPSS Base Users Guide 14.0

14

Chapitre 1

Figure 1-3Informations sur les variables

Procédures de base dans l’analyse des donnéesAvec SPSS l’analyse de données est une tâche simple. Il suffit de :

Rentrer les données dans SPSS. Vous pouvez ouvrir un fichier de données SPSSpréalablement enregistré, lire une feuille de calcul, un fichier de base de données ouun fichier texte, ou saisir des données directement dans Data Editor.

Sélectionner une procédure. Sélectionnez une procédure dans les menus pour calculerdes statistiques ou créer un diagramme.

Sélectionner des variables à analyser. Les variables du fichier de données apparaissentdans une boîte de dialogue.

Exécutez la procédure et examinez les résultats. Les résultats sont affichés dans leViewer.

Assistant statistiqueSi vous ne connaissez pas bien SPSS ou les procédures statistiques disponibles dansSPSS, l’Assistant statistique peut vous aider à démarrer en vous posant des questionssimples, dans des termes non techniques, et en vous donnant des exemples visuels qui

Page 41: SPSS Base Users Guide 14.0

15

Sommaire

vous aideront à sélectionner les fonctions statistiques et de représentation graphiquede base convenant le mieux à vos données.

Pour utiliser l’Assistant statistique, choisissez dans les menus d’une fenêtre SPSSquelconque :Aide

Assistant statistique

L’Assistant statistique (prof de statistiques) ne traite qu’un certain nombres deprocédures du système SPSS de base. Il a été conçu pour fournir une assistanced’ordre général pour de nombreuses statistiques de base parmi les plus courantes.

En savoir plus sur SPSS

Pour avoir une vue d’ensemble complète des principes SPSS de base, consultez ledidacticiel en ligne. Dans une barre de menus SPSS quelconque choisissez :Aide

Didacticiel

Page 42: SPSS Base Users Guide 14.0
Page 43: SPSS Base Users Guide 14.0

Chapitre

2Obtention d’Aide

L’aide apparaît sous plusieurs formes :

Menu Aide. Le menu Aide de la plupart des fenêtres SPSS permet d’accéder ausystème d’aide principal, ainsi qu’aux didacticiels et aux informations de référencetechnique.

Rubriques. Les rubriques permettent d’accéder aux onglets Sommaire, Indexet Rechercher, que vous pouvez utiliser pour chercher des rubriques d’aideparticulières.

Didacticiel. Instructions illustrées et détaillées étape par étape vous expliquantcomment utiliser de nombreuses fonctions de base de SPSS. Il n’est pasnécessaire de visualiser le didacticiel du début à la fin. Vous pouvez choisir lesrubriques à visualiser, ignorer et visualiser des rubriques dans l’ordre de votrechoix, et utiliser l’index ou le sommaire pour rechercher des rubriques données.

Etudes de cas. Exemples pratiques indiquant comment créer différents typesd’analyse statistique et comment interpréter les résultats. Les fichiers de donnéesd’exemple utilisés dans ces cas pratiques vous sont également fournis afin quevous puissiez voir exactement comment les résultats ont été générés. Vous pouvezchoisir à partir du sommaire les procédures sur lesquelles vous souhaitez obtenirdes informations ou rechercher des rubriques appropriées dans l’index.

Assistant statistique. Vous aide à rechercher la procédure que vous souhaitezutiliser. Une fois vos sélections effectuées, l’Assistant statistique ouvre laboîte de dialogue de la procédure statistique, de rapport ou de diagramme quicorrespond aux critères sélectionnés. L’Assistant statistique permet d’accéder àla plupart des procédures statistiques et de rapport du système de base, et à denombreuses procédures de diagramme.

17

Page 44: SPSS Base Users Guide 14.0

18

Chapitre 2

Command Syntax Reference. Un guide de référence détaillé sur la syntaxe descommandes est disponible sous deux formes différentes : guide intégré dans lesystème d’aide global et comme document distinct au format PDF dans SPSSCommand Syntax Reference, aussi disponible à partir du menu Aide.

Algorithmes statistiques. Les algorithmes utilisés pour la plupart des procéduresstatistiques sont disponibles au format PDF depuis le menu Aide et depuis lesrubriques d’aide de l’interface de la boîte de dialogue associée.

Aide sensible au contexte. Plusieurs emplacements de l’interface utilisateur vouspermettent d’accéder à l’aide contextuelle.

Boutons Aide de boîte de dialogue. La plupart des boîtes de dialogue disposentd’un bouton Aide qui vous conduit directement à la rubrique d’aide relative àla boîte de dialogue. La rubrique d’aide fournit des informations générales etpropose des liens vers les rubriques apparentées.

Aide du menu contextuel de la boîte de dialogue. De nombreuses boîtes de dialoguefournissent une aide contextuelle pour les commandes et les fonctions. Cliquezavec le bouton droit sur n’importe quel contrôle d’une boîte de dialogue etsélectionnez A propos de... dans le menu contextuel. Une description du contrôles’affiche alors, ainsi que son mode d’utilisation. (Si A propos de n’apparaît pasdans le menu contextuel, ce type d’aide n’est pas disponible pour cette boîtede dialogue.)

Aide du menu contextuel du tableau pivotant. Cliquez sur le bouton droit de lasouris sur les termes du tableau pivotant dans le Viewer et sélectionnez A proposde dans le menu contextuel afin d’afficher les définitions de ces termes.

Etudes de cas. Cliquez avec le bouton droit de la souris sur un tableau pivotant,puis sélectionnez Etudes de cas dans le menu contextuel pour accéder directementà un exemple détaillé relatif à la procédure qui a généré ce tableau. (Si Etudes decas n’apparaît pas dans le menu contextuel, ce type d’aide n’est pas disponiblepour cette procédure.)

Syntaxe de commande. Dans une fenêtre de synatxe de commande, positionnezle curseur n’importe où à l’intérieur du bloc de syntaxe pour une commande etappuyez sur F1 sur le clavier. Un diagramme complet de syntaxe de commandepour cette commande s’affiche. La documentation complète de la syntaxe de

Page 45: SPSS Base Users Guide 14.0

19

Obtention d’Aide

commande est disponible à partir des liens des rubriques liées et depusi l’ongletContenu de l’aide.

Script et automatisation OLE. Dans une fenêtre de script (menu Fichier, Nouveauou Ouvrir, Script), le menu Aide offre l’accès aux informations sur le langagede script et sur les objets, méthodes et propriétés d’automatisation OLE SPSS.Une aide contextuelle est disponible dans une fenêtre de script via les touches F1ou F2 (navigateur d’objets).

Paramètres Microsoft Internet Explorer

La plupart des fonctions d’aide de cette application utilisent la technologie deMicrosoft Internet Explorer. Par défaut, certaines versions d’Internet Explorer(notamment la version fournie avec le service pack 2 de Windows XP) bloqueront cequ’elles considèrent être du « contenu actif » dans les fenêtres d’Internet Explorer devotre ordinateur local. Ce paramètre par défaut peut entraîner le blocage du contenusitué dans les fonctions d’aide. Pour afficher l’intégralité du contenu de l’aide, vouspouvez modifier le comportement par défaut d’Internet Explorer.

E Dans les menus d’Internet Explorer, sélectionnez :Outils

Internet Options...

E Cliquez sur l’onglet Avancé.

E Faites défiler la page jusqu’à la section intitulée Sécurité.

E Sélectionnez (cochez) Autoriser le contenu actif à exécuter dans les fichiers du Poste

de travail.

Autres ressources

Si vous ne trouvez pas les informations souhaitées dans le système d’aide, lesressources suivantes peuvent disposer des réponses que vous attendez.

Guide de développement SPSS pour Windows. Fournit des informations etdes exemples relatifs aux outils de développement de SPSS pour Windows,parmi lesquels l’automatisation OLE, l’interface de programmation tiers, unebibliothèque de liens dynamiques (entrée/sortie), une fonction de production et

Page 46: SPSS Base Users Guide 14.0

20

Chapitre 2

un utilitaire de script. Le Guide de développement est disponible au format PDFdans le répertoire SPSS\developer sur le CD d’installation.

Site Web du support technique. Vous trouverez les réponses à de nombreuxproblèmes courants à l’adresse suivante : http://support.spss.com. (Pour accéderau site Web du support technique, vous devez entrer un ID de connexion et unmot de passe. L’URL ci-dessus vous permettra d’obtenir des informations surl’obtention d’un ID et d’un mot de passe.)

Utilisation du sommaire de l’aide

E A partir du menu de n’importe quelle fenêtre, sélectionnez :Aide

Rubriques

E Cliquez sur l’onglet Sommaire.

E Double-cliquez sur les éléments avec une icône représentant un livre pour étendreou réduire le sommaire.

E Cliquez sur un élément pour accéder à la rubrique d’Aide.

Figure 2-1Fenêtre Aide avec onglet Index

Page 47: SPSS Base Users Guide 14.0

21

Obtention d’Aide

Utilisation de l’index de l’aide

E A partir du menu de n’importe quelle fenêtre, sélectionnez :Aide

Rubriques

E Cliquez sur l’onglet Index.

E Entrez le terme à rechercher dans l’index.

E Double-cliquez sur la rubrique que vous souhaitez consulter.

L’index de l’aide utilise la recherche incrémentale pour chercher le texte que voussaisissez et sélectionne la rubrique la plus proche dans l’index.

Figure 2-2Onglet Index et recherche incrémentale

Utilisation de la recherche dans l’aide

L’onglet Rechercher permet d’effectuer une recherche dans tout le texte y comprisdans les titres de rubrique, le texte des rubriques et le texte de l’index. Les rubriquessont triées sur la base de la fréquence à laquelle le ou les termes recherchésapparaissent dans la rubrique et/ou son index.

Page 48: SPSS Base Users Guide 14.0

22

Chapitre 2

Figure 2-3Onglet Rechercher dans l’aide

La recherche dans tout le texte est la plus efficace si vous pouvez affiner voscritères de recherche afin de limiter le nombre de rubriques dans la liste. Parexemple, si vous savez que recherchez une fonction pour les valeurs numériquestronquées, la recherche sur « tronquer fonction » produira une meilleure liste derubriques potentielles que la recherche simple « tronquer ».

Les rubriques avec un nom de commande entre parenthèses indiquent que larubrique d’aide concerne la syntaxe de commande. Les rubriques sans nom decommande entre parenthèses sont généralement des rubriques d’aide pour lesboîtes de dialogue et les autres rubriques de l’interface graphique utilisateur.

Aide sur les commandes des boîtes de dialogueE Cliquez sur le bouton droit dans la boîte de dialogue sur laquelle vous souhaitez

obtenir des informations.

E Sélectionnez A propos de dans le menu contextuel.

Page 49: SPSS Base Users Guide 14.0

23

Obtention d’Aide

La fenêtre qui s’affiche présente une description du contrôle ainsi que la façon del’utiliser. Les informations générales sur la boîte de dialogue sont disponibles à partirdu bouton Aide de cette boîte de dialogue.

Figure 2-4Aide sur les contrôles de boîte de dialogue en cliquant sur le bouton droit de la souris

Aide sur les termes utilisés dans les résultatsE Double-cliquez sur le tableau pivotant pour l’activer.

E Cliquez sur le bouton droit sur le terme dont vous souhaitez obtenir une explication.

E Sélectionnez A propos de dans le menu contextuel.

La fenêtre qui s’affiche présente une définition du terme.

Page 50: SPSS Base Users Guide 14.0

24

Chapitre 2

Figure 2-5Glossaire du tableau pivotant activé à partir du bouton droit de la souris

Utilisation de l’option Etudes de CasE Dans la fenêtre du Viewer, cliquez avec le bouton droit de la souris sur un tableau

pivotant.

E Choisissez Etudes de Cas dans le menu contextuel.

Copie de texte d’aide à partir d’une fenêtre contextuelleE Cliquez avec le bouton droit de la souris dans la fenêtre contextuelle.

E Sélectionnez Copier dans le menu contextuel.

L’intégralité du texte de la fenêtre contextuelle est copiée.

Page 51: SPSS Base Users Guide 14.0

Chapitre

3Fichiers de données

Les fichiers de données se présentent sous une grande diversité de formats et SPSS aété conçu pour traiter nombre d’entre eux, dont :

Feuilles de calcul créées sous Excel et Lotus

Tableaux de bases de données issus de plusieurs sources de bases de données,notamment Oracle, SQLServer, Access, dBASE, etc.

Fichiers texte délimités par des tabulations et autres types de fichiers texte simples

les fichiers de données au format SPSS créés avec d’autres systèmes d’exploitation;

Fichiers de données SYSTAT

Fichiers de données SAS

Fichiers de données Stata

Ouverture d’un fichier de données

Outre les fichiers sauvegardés au format SPSS, vous pouvez ouvrir les fichiers Excel,SAS, Stata, ainsi que les fichiers tabulés et autres sans avoir à convertir les fichiers enun format intermédiaire ni à entrer d’informations de définition de données.

Pour ouvrir un fichier de donnéesE A partir des menus, sélectionnez :

FichierOuvrir

Données

E Dans la boîte de dialogue Ouvrir un fichier, sélectionnez le fichier à ouvrir.

25

Page 52: SPSS Base Users Guide 14.0

26

Chapitre 3

E Cliquez sur Ouvrir.

Sinon, vous pouvez :

lire les noms de variables à partir de la première ligne dans le cas des feuilles decalcul et des fichiers délimités par des tabulateurs ;

spécifier une plage de cellules à lire dans le cas de fichiers de feuilles de calcul.

spécifier une feuille à lire dans un fichier Excel (version Excel 5 ou supérieure).

Types de fichier de données

SPSS. Ouvre les fichiers de données enregistrés en format SPSS, y compris SPSSpour Windows, Macintosh, UNIX, et également le produit DOS SPSS/PC+.

SPSS/PC+. Ouvre les fichiers de données SPSS/PC+.

SYSTAT. Ouvre les fichiers de données SYSTAT.

SPSS portable. Ouvre les fichiers de données SPSS sauvegardés en format portable.Sauvegarder un fichier en format portable prend bien plus de temps que desauvegarder le fichier en format SPSS.

Excel. Ouvre les fichiers Excel.

Lotus 1-2-3. Ouvre les fichiers de données enregistrés au format 1-2-3 pour les versions3.0 et 2.0, ainsi que pour la version 1A de Lotus.

SYLK. Ouvre les fichiers de données sauvegardés en format SYLK (lien symbolique),format utilisé par quelques applications de tableurs.

dBASE. Ouvre des fichiers de format dBASE pour dBASE IV, dBASE III ou III PLUS,ou pour dBASE II. Chaque observation est un enregistrement. Les étiquettes devariable et de valeurs ainsi que les spécifications de valeurs manquantes sont perdueslorsque vous sauvegardez un fichier dans ce format.

Nom de fichier SAS long. SAS version 7–9 pour Windows, extension longue.

Nom de fichier SAS court. SAS version 7–9 pour Windows, extension courte.

SAS version 6 pour Windows. SAS version 6.08 pour Windows et OS2.

SAS version 6 pour UNIX. SAS version 6 pour UNIX (Sun, HP, IBM).

SAS transfert. Fichier de transfert SAS.

Page 53: SPSS Base Users Guide 14.0

27

Fichiers de données

Stata. Version Stata 4–8.

Texte. Fichier texte ASCII.

Ouvrir les options de fichier

Lire les noms de variables. Dans le cas des feuilles de calcul, vous pouvez lire lenom des variables à partir de la première ligne du fichier ou de la première ligne dela plage définie. En fonction de vos besoins, vous pouvez convertir les valeurs pourcréer des noms de variables valides, en n’oubliant pas de convertir les espaces entraits de soulignement.

Feuille de calcul. Les fichiers de la version Excel 5 ou supérieure peuvent contenirplusieurs feuilles de calcul. Par défaut, l’éditeur de données lit la première feuille.Pour lire une autre feuille de calcul, sélectionnez-la dans la liste déroulante.

Intervalle. Pour les fichiers de données sous forme de feuilles de calcul, vous pouvezégalement lire une plage de cellules. Utilisez la même méthode pour spécifier desintervalles de cellules comme vous le feriez pour des applications tableur.

Lecture de fichiers Excel version 5 ou ultérieure

Les règles suivantes s’appliquent à la lecture de fichiers Excel version 5 ou ultérieure :

Type de données et largeur. Chaque colonne représente une variable. Le type et lalargeur de données de chaque variable sont déterminés par le type et la largeur dedonnées dans le fichier Excel. Si la colonne contient plusieurs types de données (parexemple, des dates et des valeurs numériques), le type de données est converti enchaîne et toutes les valeurs sont lues comme des valeurs de chaînes valides.

Cellules blanches. En ce qui concerne les variables numériques, les cellules videssont converties en valeurs manquantes par défaut et identifiées par un point. En cequi concerne les variables chaîne, un blanc est une valeur de caractère valide, et lescellules vides sont traitées comme des valeurs de chaîne valides.

Noms des variables. Si vous lisez la première ligne du fichier Excel (ou la premièreligne de la plage spécifiée) en tant que noms de variable, les valeurs qui ne sontpas conformes aux règles de dénomination de variable sont converties en noms devariable valides et les noms initiaux sont utilisés comme étiquettes de variable. Si

Page 54: SPSS Base Users Guide 14.0

28

Chapitre 3

vous ne lisez pas les noms de variables à partir du fichier Excel, des noms de variablespar défaut sont affectés.

Lecture de fichiers Excel antérieurs ou autres tableurs avecl’éditeur de données

Les règles applicables à la lecture de fichiers Excel antérieurs à la version 5 et à cellede fichiers d’autres tableurs sont les suivantes :

Type de données et largeur. Le type de données et la largeur de chaque variable sontdéterminés par la largeur de la colonne et le type de données de la première cellulede données de la colonne. Les valeurs d’autres types sont converties en valeursmanquantes par défaut. Si, dans la colonne, la première cellule de données est vide,le type général de données par défaut pour la feuille de calcul (habituellementnumérique) est utilisé.

Cellules blanches. En ce qui concerne les variables numériques, les cellules videssont converties en valeurs manquantes par défaut et identifiées par un point. En cequi concerne les variables chaîne, un blanc est une valeur de caractère valide, et lescellules vides sont traitées comme des valeurs de chaîne valides.

Noms des variables. Si, à partir de la feuille de calcul, vous ne pouvez pas lire le nomdes variables, SPSS utilise les lettres des colonnes (A, B, C, etc.) comme noms devariable pour les fichiers Excel et Lotus. En ce qui concerne les fichiers SYLK etExcel enregistrés au format d’affichage R1C1, le programme utilise le numéro de lacolonne, précédé par la lettre C (C1, C2, C3, etc.).

Lecture de fichiers dBASE

Les fichiers de base de données sont logiquement très semblables aux fichiers dedonnées au format SPSS. Les règles générales suivantes s’appliquent aux fichiersdBASE :

Les noms de champ sont convertis en noms de variable valides.

Page 55: SPSS Base Users Guide 14.0

29

Fichiers de données

Les signes deux points utilisés dans les noms de champ dBASE sont convertis entraits de soulignement.

Les enregistrements indiqués comme devant être supprimés, mais qui n’ont pasété purgés, sont inclus. SPSS crée une nouvelle variable chaîne, D_R, qui contientun astérisque pour les observations indiquées comme devant être supprimées.

Lecture de fichiers Stata

Les règles générales suivantes s’appliquent aux fichiers de données Stata :

Noms des variables. Les noms des variables Stata sont convertis en noms devariables SPSS dans un format sensible à la casse. Les noms de variables Stataqui sont identiques mais avec une casse différente sont convertis en noms devariables SPSS et comportent en suffixe un trait de soulignement et une lettreséquentielle ( _A, _B, _C, ..., _Z, _AA, _AB, ..., etc.).

Etiquettes de variable. Les étiquettes de variables Stata sont converties enétiquettes de variables SPSS.

Les étiquettes de valeurs. Les étiquettes de valeurs Stata sont converties enétiquettes de valeurs SPSS, à l’exception des étiquettes de valeurs Stata assignéesaux valeurs manquantes « étendues ».

Valeurs manquantes. Les valeurs manquantes « étendues » Stata sont converties envaleurs manquantes par défaut.

Conversion des données. Les valeurs de format de date Stata sont converties envaleurs de format de DATE SPSS (j-m-a). Les valeurs de format de date de «série chronologique » Stata (semaines, mois, trimestres, etc.) sont converties ausimple format numérique (F), en préservant la valeur entière originale interne quireprésente le nombre de semaines, mois, trimestres, etc. depuis le début de 1960.

Lire des fichiers de base de données

Vous pouvez lire des données à partir de n’importe quel format de base de donnéespour laquelle vous avez un pilote adapté. En mode d’analyse locale, les pilotesnécessaires doivent être installés sur votre ordinateur local. En mode d’analysedistribuée (disponible avec le serveur SPSS), les pilotes doivent être installés surle serveur distant. Pour plus d'informations, reportez-vous à « Mode d’analysedistribuée » dans Chapitre 4 à p. 83.

Page 56: SPSS Base Users Guide 14.0

30

Chapitre 3

Lire des fichiers de base de données

E A partir des menus, sélectionnez :Fichier

Ouvrir base de donnéesNouvelle requête...

E Sélectionnez la source des données.

E Si nécessaire (selon la source de données), sélectionnez le fichier de base de donnéeset/ou entrez un nom de connexion, un mot de passe et d’autres informations.

E Sélectionnez les tables et les champs. (Pour les sources de données OLE DB, vous nepouvez sélectionner qu’un seul tableau.)

E Spécifiez toute relation existante entre vos tables.

E Eventuellement :

Spécifier les critères éventuels de sélection de vos données.

Ajouter une invite pour que l’utilisateur puisse y entrer un paramètre de requête.

Enregistrer la requête que vous avez créée avant de l’exécuter.

Pour modifier une requête de base de données enregistrée

E A partir des menus, sélectionnez :Fichier

Ouvrir base de donnéesModifier requête...

E Sélectionnez le fichier requête (*.spq) à modifier.

E Suivez les instructions de création d’une nouvelle requête.

Pour lire des fichiers de base de données avec des requêtes enregistrées

E A partir des menus, sélectionnez :Fichier

Ouvrir base de donnéesExécuter requête...

E Sélectionnez le fichier requête (*.spq) à exécuter.

Page 57: SPSS Base Users Guide 14.0

31

Fichiers de données

E Si nécessaire (en fonction du fichier de base de données), entrez un nom de connexionet un mot de passe.

E Si la requête a une invite imbriquée, vous pourrez avoir besoin d’entrer d’autresinformations (par exemple, le trimestre pour lequel vous voulez récupérer les chiffresde ventes).

Sélectionner une source de données

Dans le premier écran de l’assistant de base de données, sélectionnez le type desource de données à lire.

Sources de données ODBC

Si vous n’avez pas de sources de données ODBC configurées ou si vous voulezajouter une nouvelle source de données, cliquez sur Ajouter source données ODBC.En mode d’analyse distribuée (disponible avec le serveur SPSS), ce bouton n’estpas disponible. Pour ajouter des sources de données en mode d’analyse distribuée,consultez votre administrateur système.

Une source de données ODBC est composée de deux principaux élémentsd’informations : Le pilote qui sera utilisé pour accéder aux données et l’emplacementde la base de données à laquelle vous souhaitez accéder. Pour spécifier des sources dedonnées, vous devez installer les pilotes appropriés. En mode d’analyse locale, vousdevez installer les pilotes à partir du CD-ROM pour ce produit :

SPSS Data Access Pack. Installe les pilotes de différents formats de base dedonnées. Cette fonctionnalité est disponible dans le menu AutoPlay.

Microsoft Data Access Pack. Installe les pilotes pour les produits Microsoft,notamment Microsoft Access. Pour installer Microsoft Data Access Pack,double-cliquez sur Microsoft Data Access Pack dans le dossier Microsoft DataAccess Pack qui se trouve sur le CD-ROM.

Page 58: SPSS Base Users Guide 14.0

32

Chapitre 3

Figure 3-1Boîte de dialogue Assistant de base de données

Sources de données OLE DB

Pour accéder aux sources de données OLE DB, vous devez avoir installé les élémentssuivants sur l’ordinateur exécutant SPSS :

.NET framework

modèle de données de dimension et accès OLE DB

Les versions des composants compatibles avec cette version de SPSS peuventêtre installées à partir du CD d’installation SPSS et sont disponibles dans le menuAutoPlay.

Page 59: SPSS Base Users Guide 14.0

33

Fichiers de données

Vous pouvez également ajouter des sources de données OLE DB en moded’analyse locale. Pour ajouter des sources de données OLE DB en moded’analyse distribuée sur un serveur Windows, consultez votre administrateursystème.

En mode d’analyse distribuée (disponible avec le serveur SPSS), les sources dedonnées OLE DB sont uniquement disponibles sur des serveurs Windows et.NET et le modèle de données de dimensions ainsi que l’accès OLE DB doiventêtre installés sur le serveur.

Figure 3-2Assistant de base de données avec accès aux sources de données OLE DB

Pour ajouter une source de données OLE DB :

E Cliquez sur Ajouter source données OLE DB.

Page 60: SPSS Base Users Guide 14.0

34

Chapitre 3

E Dans la boîte de dialogue Propriétés du lien de données, cliquez sur l’ongletFournisseur et sélectionnez le fournisseur OLE DB.

E Cliquez sur Suivant ou cliquez sur l’onglet Connexion.

E Sélectionnez la base de données en entrant l’emplacement du répertoire et le nom dela base de données ou en cliquant sur le bouton pour accéder à la base de données.(Un nom d’utilisateur et un mot de passe peuvent vous être demandés.)

E Cliquez sur OK après avoir saisi les informations nécessaires. (Vous pouvez vérifierque la base de données indiquée est bien disponible en cliquant sur le bouton Tester

la connexion.)

E Entrez un nom pour les informations de connexion à la base de données. (Ce noms’affichera dans la liste des sources de données OLE DB disponibles.)

Figure 3-3Boîte de dialogue Enregistrer les informations de connexion OLE DB en tant que

E Cliquez sur OK.

Cette opération vous renvoie au premier écran de l’assistant de base de données surlequel vous pouvez ensuite sélectionner le nom enregistré à partir de la liste dessources de données OLE DB puis passer à l’étape suivante de l’assistant.

Procédure d’entrée dans la base de données

Si votre base de données ODBC nécessite un mot de passe, l’Assistant de base dedonnées vous en demandera un avant de pouvoir ouvrir la source des données.

Page 61: SPSS Base Users Guide 14.0

35

Fichiers de données

Figure 3-4Boîte de dialogue de la procédure d’initialisation

Sélectionner des champs de données

Le boîte de dialogue Sélectionner des données contrôle les tableaux et les champs lus.Les champs base de données (colonnes) sont lus comme des variables.

Si une table comporte un ou plusieurs champ(s) sélectionné(s), tous ses champsseront visibles dans les fenêtres de l’Assistant de base de données suivantes, maisseuls les champs sélectionnés dans cette boîte de dialogue seront importés commevariables. Cela vous permet de créer des jointures de tables et de spécifier les critèresd’utilisation des champs que vous n’importez pas.

Page 62: SPSS Base Users Guide 14.0

36

Chapitre 3

Figure 3-5Boîte de dialogue Sélectionner base de données

Affichage des noms de champs. Pour lister les champs dans une table, cliquez sur lesigne « plus » (+) à gauche du nom d’une table. Pour masquer les champs, cliquez surle signe moins (–) à gauche du nom d’une table.

Pour ajouter un champ. Double-cliquez sur un champ de la liste des tables disponiblesou faites-le glisser dans les champs Extraction de cette liste de commandes. Leschamps peuvent être rangés de nouveau en les glissant et en les laissant dans la listedes champs.

Pour retirer un champ. Double-cliquez sur n’importe quel champ Extraction de cetteliste de commandes ou faites-le glisser jusqu’à la liste des tables disponibles.

Trier les noms de champs. Si cette case est cochée, l’assistant de base de donnéesaffiche les champs disponibles dans l’ordre alphabétique.

Page 63: SPSS Base Users Guide 14.0

37

Fichiers de données

Remarque : Pour les sources de données OLE DB, vous ne pouvez sélectionner leschamps qu’à partir d’un seul tableau. Les jointures de tables multiples ne sont pasprises en charge par les sources de données OLE DB.

Créer une relation entre des tables

La boîte de dialogue Spécifier les relations vous permet de définir les relationsexistant entre les tables pour les sources de données ODBC. Si les champs de plusd’une table sont sélectionnés, vous devez définir au moins une jointure.

Figure 3-6Boîte de dialogue Spécifier relations

Page 64: SPSS Base Users Guide 14.0

38

Chapitre 3

Etablir des relations. Pour créer une relation, faites glisser un champ de n’importequelle table vers le champ auquel vous souhaitez le lier. L’Assistant de base dedonnées tire un trait de jointure entre les deux champs pour indiquer leur relation.Ces champs doivent être du même type de données.

Jointure automatique de tables. Essaie de joindre automatiquement deux tables d’aprèsles clés primaire/étrangère, ou de mettre en correspondance le nom des champs et letype de données.

Spécifier les types de jointures. Si votre pilote prend en charge les jointures externes,vous pouvez spécifier soit des jointures internes, soit des jointures externes gauches oudroites. Pour sélectionner le type de jointure, double-cliquez sur la ligne de jointureentre les champs et l’assistant affichera la boîte de dialogue Propriétés de relations.

Propriétés de la relation

Cette boîte de dialogue vous permet de spécifier quels types relations lient vos tables.

Figure 3-7Boîte de dialogue Propriétés des relations

Jointures internes. Une jointure interne n’inclut que les lignes dont les champs reliéssont égaux. Dans cet exemple, toutes les lignes dont les valeurs ID sont identiquesdans les deux tables seront inclues.

Page 65: SPSS Base Users Guide 14.0

39

Fichiers de données

Jointures externes. En plus des jointures internes dont les lignes correspondentune à une, vous pouvez également fusionner les tables à l’aide du système decorrespondance une ligne vers plusieurs en utilisant les jointures externes. Vouspouvez, par exemple, fusionner un tableau contenant quelques enregistrementsseulement et représentant des valeurs de données et des étiquettes descriptivesassociées avec les valeurs d’un tableau contenant des centaines ou des milliersd’enregistrements représentant des personnes interrogées. Une jointure externegauche inclut tous les enregistrements de la table de gauche et seulement lesenregistrements de la table de droite dont les champs reliés sont égaux. Dans unejointure externe droite, la jointure importe tous les enregistrements de la table dedroite et seulement les enregistrements de la table de gauche dont les champs reliéssont égaux.

Limiter les observations récupérées

La boîte de dialogue Limiter les observations récupérées vous permet de spécifierles critères pour sélectionner des sous-groupes d’observations (lignes). Limiter lesobservations consiste généralement à remplir la grille de critères avec un ou plusieurscritères. Les critères consistent en deux expressions et des relations entre elles.Celles-ci renvoient la valeur True, False ou missing pour chaque observation.

Si le résultat est vrai, l’observation est sélectionnée.

Si le résultat est faux ou manquant, l’observation n’est pas sélectionnée.

La plupart des critères utilisent un ou plusieurs des six opérateurs relationnels(<, >, <=, >=, = et <>).

Les expressions conditionnelles peuvent inclure des noms de champs, desconstantes, des opérateurs arithmétiques, des fonctions numériques et autres, desvariables logiques et des opérateurs relationnels. Vous pouvez utiliser des champsque vous ne prévoyez pas d’importer comme variables.

Page 66: SPSS Base Users Guide 14.0

40

Chapitre 3

Figure 3-8Boîte de dialogue Limiter les observations récupérées

Pour établir vos critères, vous avez besoin d’au moins deux expressions et d’unerelation les connectant.

E Pour construire une expression, choisissez l’une des méthodes suivantes :

Dans une cellule Expression, vous pouvez taper les noms de champs, constantes,opérateur arithmétiques, fonctions numériques et autres fonctions ou variableslogiques.

Double-cliquez sur le champ dans la liste des champs.

Faites glisser le champ de la liste jusqu’à une cellule Expression.

Sélectionnez un champ dans le menu déroulant de n’importe quelle celluleExpression active.

Page 67: SPSS Base Users Guide 14.0

41

Fichiers de données

E Pour choisir l’opérateur relationnel (comme = or >), placez votre curseur dans lacellule Relation et tapez l’opérateur ou sélectionnez-le dans le menu déroulant.

Les dates et les heures employées dans les expressions doivent être indiquées demanière spécifique (y compris les accolades utilisées dans les exemples) :

Les littéraux de date doivent être spécifiés dans le format général : {d aaaa-mm-jj}.

Les littéraux d’heure doivent être spécifiés dans le format standard : {h hh:mm:ss}.

Les littéraux de date et d’heure (horodatages) doivent être spécifiés dans le formatstandard : {dh aaaa-mm-jj hh:mm:ss}.

Fonctions. Une sélection de fonctions SQL intégrées (arithmétique, logique, chaîne,date et heure) est fournie. Vous pouvez glisser une fonction de la liste dansune expression ou entrer n’importe quelle fonction SQL valide. Consultez votredocumentation sur les bases de données pour les fonctions SQL valides. La liste desfonctions standard est disponible dans le répertoire suivant :

http://msdn.microsoft.com/library/en-us/odbc/htm/odbcscalar_functions.asp

Utiliser échantillon aléatoire. Cette option sélectionne un échantillon aléatoired’observations dans la source de données. Pour les sources de données volumineuses,vous pouvez limiter le nombre d’observations à un échantillon restreint et représentatifafin de réduire la durée d’exécution des procédures. L’échantillonnage aléatoire natif,s’il est disponible pour la source de données, est plus rapide que l’échantillonnagealéatoire de SPSS ; en effet, ce dernier doit lire la totalité de la source de donnéespour extraire un échantillon aléatoire.

Environ. SPSS génère un échantillon aléatoire d'observations dont le nombrecorrespond approximativement au pourcentage indiqué. Comme cette routinegénère une décision indépendante pseudo-aléatoire pour chaque observation,le pourcentage d'observations sélectionnées peut seulement approcher lepourcentage spécifié. Plus il y a d'observations dans le fichier de données, plus lepourcentage des observations sélectionnées sera proche de la valeur indiquée.

Exactement. Sélectionne un échantillon aléatoire du nombre d'observationsspécifié dans le nombre total d'observations indiqué. Si le nombre totald'observations spécifié est supérieur au nombre total d'observations dans le fichierde données, l'échantillon contiendra proportionnellement moins d'observationsque le nombre demandé.

Page 68: SPSS Base Users Guide 14.0

42

Chapitre 3

Remarque : Si vous utilisez l’échantillonnage aléatoire, la fonction d’agrégation(disponible en mode distribué avec le serveur SPSS) n’est pas disponible.

Demander une valeur. Vous pouvez imbriquer une invite dans votre requête pour créerune requête de paramètre. Lorsque les utilisateurs utilisent la requête, il leur estdemandé d’entrer des informations (en fonction de ce qui est précisé ici). Cetteméthode peut s’avérer utile lorsque vous avez besoin par exemple de voir différentsaffichages des mêmes données. Par exemple, vous voulez exécuter la même requêtepour voir les chiffres de ventes des différents trimestres fiscaux.

E Placez votre curseur dans une cellule Expression et cliquez sur Demander une valeur

pour créer une invite.

Créer une requête de paramètre

Utilisez la boîte de dialogue Demander une valeur pour créer une boîte de dialoguesollicitant des informations auprès des utilisateurs chaque fois que quelqu’un exécutevotre requête. Cette fonctionnalité est utile si vous souhaitez effectuer une requête surles mêmes sources de données en utilisant des critères différents.

Figure 3-9Boîte de dialogue Demander une valeur

Page 69: SPSS Base Users Guide 14.0

43

Fichiers de données

Pour établir une invite, entrez une chaîne d’invite et une valeur par défaut. La chaîned’invite est affichée chaque fois qu’un utilisateur exécute votre requête. La chaînedoit indiquer le type d’informations à entrer. Si l’utilisateur n’utilise pas de liste poureffectuer sa sélection, la chaîne doit indiquer la syntaxe de la saisie. Voir l’exemplecomme suit : Entrez un trimestre (T1, T2, T3, ...).

Autoriser l’utilisateur à sélectionner une valeur dans la liste. Si la case est cochée, vouspouvez limiter l’accès de l’utilisateur aux valeurs que vous avez placées dans la liste.Assurez-vous de séparer les valeurs par des retours chariot.

Type de données. Choisissez ici le type de données (Nombre, Chaîne ou Date).

Le résultat final ressemble à ceci :

Figure 3-10Boîte de dialogue Invite définie par l’utilisateur

Agrégation de données

Si vous êtes en mode distribué et connecté à un serveur distant (disponible avec leserveur SPSS), vous pouvez agréger les données avant de les lire dans SPSS.

Page 70: SPSS Base Users Guide 14.0

44

Chapitre 3

Figure 3-11Boîte de dialogue Agréger les données

Il est également possible d’ajouter des données après les avoir lues dans SPSS mais,si l’agrégation a lieu avant la lecture, vous pouvez gagner du temps pour les sourcesde données volumineuses.

E Sélectionnez un ou plusieurs critères d’agrégation qui définissent la façon dont lesobservations sont groupées pour créer des données agrégées.

E Sélectionnez une ou plusieurs variables agrégées.

E Sélectionnez une fonction d’agrégation pour chaque variable d’agrégation.

E Vous pouvez également créer une variable qui contienne le nombre d’observationsdans chaque agrégat.

Page 71: SPSS Base Users Guide 14.0

45

Fichiers de données

Remarque : Si vous utilisez l’échantillonnage aléatoire, la fonction d’agrégationn’est pas disponible.

Définition de variables

Noms de variables et étiquettes. La totalité du nom de champ de la base de données(colonne) est utilisée en tant qu’étiquette de variable. A moins que vous ne modifiezle nom de variable, l’Assistant de base de données affecte des noms de variables àchaque colonne à partir de la base de données de l’une des manières suivantes :

Si le nom du champ de la base de données constitue un nom unique et valide devariable, il est utilisé comme nom de variable.

Si le nom du champ de la base de données ne constitue pas un champ unique etvalide de variable, un nom unique est automatiquement créé.

Cliquez sur n’importe quelle cellule pour modifier le nom de variable.

Conversion des chaînes en valeurs numériques. Cochez la case Recoder en numérique

d’une variable chaîne pour la convertir automatiquement en variable numérique.Les valeurs de chaîne sont converties en valeurs entières consécutives dans l’ordrealphabétique des valeurs d’origine. Les valeurs d’origine sont conservées commeétiquettes de valeurs pour les nouvelles variables.

Largeur des champs de chaînes à largeur variable. Détermine la largeur des valeurschaîne à largeur variable. Par défaut, la largeur est de 255 octets. Seuls les255 premiers octets (en général, 255 caractères dans les langues sur un octet) sontlus. La largeur peut s’élever jusqu’à 32 767 octets. Bien que vous ne souhaitiezprobablement pas tronquer les valeurs de chaîne, vous ne voulez pas non plusspécifier une valeur importante superflue, car des valeurs trop élevées rendent letraitement SPSS inefficace.

Page 72: SPSS Base Users Guide 14.0

46

Chapitre 3

Figure 3-12Boîte de dialogue Définir variables

Tri des observations

Si vous êtes en mode distribué et connecté à un serveur distant (disponible avec leserveur SPSS), vous pouvez trier les données avant de les lire dans SPSS.

Page 73: SPSS Base Users Guide 14.0

47

Fichiers de données

Figure 3-13Boîte de dialogue Trier les observations

Il est également possible de trier ces données après les avoir lues dans SPSS mais,si le tri a lieu avant la lecture, vous pouvez gagner du temps pour les sources dedonnées volumineuses.

Résultats

La boîte de dialogue Résultats affiche l’instruction SQL Select nécessaire à votrerequête.

Si vous modifiez l’instruction SQL Select avant d’exécuter la requête et cliquezsur le bouton Précédent pour apporter des modifications aux étapes précédentes,les dernières modifications de l’instruction Select seront perdues.

Page 74: SPSS Base Users Guide 14.0

48

Chapitre 3

Utilisez la section Enregistrer la requête dans le fichier pour enregistrer la requêtepour une future utilisation.

Sélectionnez Coller dans l’éditeur de syntaxe pour coller la syntaxe complète GETDATA dans une fenêtre de syntaxe. Le fait de copier-coller l’instruction Selectdepuis la fenêtre Résultats ne collera pas la syntaxe de commande nécessaire.

Remarque : La syntaxe collée contient un espace avant la parenthèse fermante surchaque ligne SQL créée par l’assistant. Cet espace n’est pas superflu. Lorsque lacommande est traitée, toutes les lignes de l’instruction SQL sont fusionnées de façontrès littérale. Si cet espace n’était pas utilisé, il n’y en aurait aucun entre le derniercaractère d’une ligne et le premier caractère de la ligne suivante.

Figure 3-14Boîte de dialogue Résultats

Page 75: SPSS Base Users Guide 14.0

49

Fichiers de données

Assistant de texte

L’Assistant de texte permet de lire des fichiers de données texte formatés dedifférentes façons

Fichiers délimités par des tabulations

Fichiers délimités par des espaces

Fichiers délimités par des virgules

Fichiers de format fixe

Dans le cas des fichiers délimités, vous pouvez choisir d’autres caractères en guise deséparateurs entre les valeurs et spécifier plusieurs séparateurs.

Lire des fichiers de données texte

E A partir des menus, sélectionnez :Fichier

Lire les données texte...

E Sélectionnez le fichier texte dans la boîte de dialogue Ouvrir fichier.

E Suivez les étapes de l’Assistant de texte pour définir le mode de lecture du fichier dedonnées.

Page 76: SPSS Base Users Guide 14.0

50

Chapitre 3

Assistant de texte : Etape 1Figure 3-15Assistant de texte : Etape 1

Le fichier texte est affiché dans une fenêtre d’aperçu. Vous pouvez appliquer unformat prédéfini (précédemment enregistré dans l’Assistant de texte) ou suivre lesétapes de l’Assistant de texte pour spécifier la façon dont les données doivent être lues.

Page 77: SPSS Base Users Guide 14.0

51

Fichiers de données

Assistant de texte : Etape 2Figure 3-16Assistant de texte : Etape 2

Cette étape offre des informations sur les variables. Dans une base de données, unevariable est similaire à un champ. Par exemple, chaque élément d’un questionnaireest une variable.

Disposition de vos variables. Pour lire correctement vos données, l’assistant detexte doit déterminer où finit la valeur d’une variable et où commence la valeur dela variable suivante. La disposition des variables définit la méthode utilisée pourdifférencier les variables entre elles.

Page 78: SPSS Base Users Guide 14.0

52

Chapitre 3

Délimité. Les variables sont séparées à l’aide d’espaces, de virgules, de tabulationsou d’autres caractères. Les variables sont enregistrées dans le même ordre pourchacune des observations, mais pas nécessairement dans les mêmes positionsde colonnes.

Largeur fixe. Pour chaque observation dans le fichier de données, chaque variableest enregistrée dans la même position de la colonne, sur le même enregistrement(ligne). Aucun séparateur n’est requis entre les variables. En fait, dans la plupartdes fichiers de données texte générés par des programmes informatiques, lesvaleurs de données peuvent sembler se chevaucher sans même être séparéespar des espaces. C’est la position des colonnes qui détermine la variable luepar l’Assistant.

Les noms de variable sont-ils inclus dans la partie supérieure de votre fichier ? Si lapremière ligne du fichier de données contient des étiquettes descriptives pour chaquevariable, vous pouvez utiliser ces étiquettes comme noms de variable. Les valeursqui ne sont pas conformes aux règles de dénomination de variable sont converties ennoms de variable valides.

Page 79: SPSS Base Users Guide 14.0

53

Fichiers de données

Assistant de texte : Etape 3 (Fichiers délimités)Figure 3-17Assistant de texte : Etape 3 (pour les fichiers délimités)

Cette étape offre des informations sur les observations. Dans une base de données,une observation est similaire à un enregistrement. Par exemple, chaque répondantpour un questionnaire est un enregistrement.

La première observation commence à la ligne Indique la première ligne du fichierde données contenant des valeurs de données. Si les lignes supérieures du fichierde données contiennent des étiquettes descriptives ou tout autre type de texte necorrespondant pas à des valeurs de données, elles ne seront pas considérées comme lapremière ligne du fichier.

Représentation de vos observations Contrôle la façon dont l’assistant de textedétermine où finit chaque observation et où commence la suivante.

Page 80: SPSS Base Users Guide 14.0

54

Chapitre 3

Chaque ligne représente une observation. Chaque ligne ne contient qu’uneobservation. Il est assez courant que chaque observation soit contenue surune seule ligne, même s’il peut s’agir d’une très longue ligne dans le cas defichiers de données comportant un grand nombre de variables. Si les lignes necontiennent pas toutes le même nombre de valeurs, le nombre de variables pourchaque observation est déterminé par la ligne comportant le plus grand nombrede valeurs. Les observations contenant moins de valeurs recevront alors desvaleurs manquantes pour les variables supplémentaires.

Un nombre spécifique de variables représente une observation. Le nombre spécifiéde variables pour chaque observation indique à l’Assistant de texte où terminerla lecture d’une observation et où commencer la lecture de la suivante. Lamême ligne peut contenir plusieurs observations ; en outre, les observationspeuvent commencer au milieu d’une ligne et se poursuivre sur la ligne suivante.L’Assistant de texte détermine la fin de chaque observation en fonction dunombre de valeurs lues, quel que soit le nombre de lignes. Chaque observationdoit contenir des valeurs de données (ou des valeurs manquantes indiquées pardes séparateurs) pour toutes les variables ; dans le cas contraire, le fichier dedonnées ne sera pas lu correctement.

Combien d’observations souhaitez-vous importer ? Vous pouvez importer toutes lesobservations du fichier de données, les n premières observations (n étant un nombreque vous avez défini) ou encore un échantillon aléatoire d’un pourcentage spécifié.Cette routine générant une décision indépendante pseudo-aléatoire pour chaqueobservation, le pourcentage d’observations sélectionnées ne peut qu’approcher lepourcentage spécifié. Plus il y a d’observations dans le fichier de données, plus lepourcentage des observations sélectionnées sera proche de la valeur indiquée.

Page 81: SPSS Base Users Guide 14.0

55

Fichiers de données

Assistant de texte : Etape 3 (Fichiers de largeur fixe)Figure 3-18Assistant de texte : Etape 3 (pour les fichiers de largeur fixe)

Cette étape offre des informations sur les observations. Dans une base de données,une observation est similaire à un enregistrement. Par exemple, chaque répondantpour un questionnaire est un enregistrement.

La première observation commence à la ligne Indique la première ligne du fichierde données contenant des valeurs de données. Si les lignes supérieures du fichierde données contiennent des étiquettes descriptives ou tout autre type de texte necorrespondant pas à des valeurs de données, elles ne seront pas considérées comme lapremière ligne du fichier.

Combien de lignes représente une observation ? Contrôle la façon dont l’assistant detexte détermine où finit chaque observation et où commence la suivante. Chaquevariable est définie par son numéro de ligne dans l’observation et par sa position decolonne. Vous devez spécifier le nombre de lignes de chaque observation pour quevos données soient lues correctement.

Page 82: SPSS Base Users Guide 14.0

56

Chapitre 3

Combien d’observations souhaitez-vous importer ? Vous pouvez importer toutes lesobservations du fichier de données, les n premières observations (n étant un nombreque vous avez défini) ou encore un échantillon aléatoire d’un pourcentage spécifié.Cette routine générant une décision indépendante pseudo-aléatoire pour chaqueobservation, le pourcentage d’observations sélectionnées ne peut qu’approcher lepourcentage spécifié. Plus il y a d’observations dans le fichier de données, plus lepourcentage des observations sélectionnées sera proche de la valeur indiquée.

Assistant de texte : Etape 4 (Fichiers délimités)Figure 3-19Assistant de texte : Etape 4 (pour les fichiers délimités)

Cette étape présente la meilleure méthode déterminée par l’Assistant de texte sur lafaçon de lire le fichier de données et vous permet de modifier cette méthode.

Page 83: SPSS Base Users Guide 14.0

57

Fichiers de données

Quels séparateurs s’affichent entre les variables ? Indique les caractères ou lessymboles utilisés pour séparer les valeurs de données. Vous pouvez sélectionnern’importe quelle combinaison d’espaces, de virgules, de points-virgules, detabulations ou d’autres caractères. Plusieurs séparateurs consécutifs non séparés pardes valeurs de données sont considérés comme des valeurs manquantes.

What is the text qualifier? Il s’agit de caractères utilisés pour délimiter les valeurscontenant des caractères séparateur. Par exemple, si la virgule est un séparateur, lesvaleurs contenant des virgules ne seront lues correctement que si un qualificateur detexte délimite la valeur ; ainsi, les virgules de la valeur ne sont pas considérées commedes séparateurs de valeurs. Les fichiers de données au format CSV exportés à partird’Excel utilisent le guillemet (“) comme qualificateur de texte. Le qualificateur detexte apparaît au début et à la fin de la valeur, et délimite ainsi la valeur entière.

Assistant de texte : Etape 4 (Fichiers de largeur fixe)Figure 3-20Assistant de texte : Etape 4 (pour les fichiers de largeur fixe)

Page 84: SPSS Base Users Guide 14.0

58

Chapitre 3

Cette étape présente la meilleure méthode déterminée par l’Assistant de texte sur lafaçon de lire le fichier de données et vous permet de modifier cette méthode. Leslignes verticales présentées dans la fenêtre d’aperçu indiquent les positions quel’Assistant de texte estime correspondre au début de chaque variable dans le fichier.

Insérez, déplacez et supprimez les lignes de délimitation des variables à votreconvenance pour séparer les variables. Si chaque observation utilise plusieurslignes, sélectionnez chaque ligne dans la liste déroulante et modifiez les lignes dedélimitation des variables en conséquence.

Remarques :

Dans le cas de fichiers de données générés par ordinateur et présentant un flux continude valeurs de données non séparées par des espaces ni par d’autres caractéristiquesdistinctives, il peut s’avérer difficile de déterminer l’endroit où commence chaquevariable. De tels fichiers de données sont généralement associés à un fichier dedéfinitions de données ou à toute autre description écrite définissant la position deligne et de colonne de chaque variable.

L’Assistant de texte est conçu pour être utilisé avec une police monoespacée (àespacement fixe) pour afficher les contenus des fichiers. Avec les polices nonmonoespacées (proportionnelles), le contenu des fichiers n’est pas correctementaligné. Ce paramètre de police est contrôlé par le paramètre Police résultats texte dansl’onglet Editeur de résultats de la boîte de dialogue Options (menu Edition).

Page 85: SPSS Base Users Guide 14.0

59

Fichiers de données

Assistant de texte : Etape 5Figure 3-21Assistant de texte : Etape 5

Cette étape définit le nom de variable et le format de données utilisés par l’Assistantde texte pour lire chaque variable et détermine les variables qui seront incluses dansle fichier de données final.

Nom de la variable. Vous pouvez remplacer les noms de variables par défaut parvos propres noms de variable. Si vous choisissez des noms de variable provenantdu fichier de données, l’assistant de texte modifiera automatiquement les nomsde variable qui ne sont pas conformes aux règles de dénomination de variable.Sélectionnez une variable dans la fenêtre d’aperçu, puis entrez un nom de variable.

Format des données. Sélectionnez une variable dans la fenêtre d’aperçu, puissélectionnez un format dans la liste déroulante. Pour sélectionner plusieurs variablescontiguës, appuyez sur le bouton de la souris tout en maintenant la touche Majenfoncée ; pour sélectionner plusieurs variables non contiguës, appuyez sur le boutonde la souris tout en maintenant la touche Ctrl enfoncée.

Page 86: SPSS Base Users Guide 14.0

60

Chapitre 3

Assistant de texte : options de formatage

Les options de formatage pour la lecture des variables au moyen de l’Assistant detexte sont les suivantes :

Ne pas importer. Cette option permet d’omettre la ou les variables sélectionnées dansle fichier de données importé.

Numérique. Les valeurs valides incluent les nombres, un signe plus ou moins endébut, et un indicateur de décimale.

Chaîne. Les valeurs valides incluent pratiquement tous les caractères du clavier avecdes blancs imbriqués. Dans le cas des fichiers délimités, vous pouvez spécifier lenombre de caractères de la valeur (le nombre maximal étant de 32 767). Par défaut,l’Assistant de texte détermine que ce nombre de caractères correspond à celui de lavaleur de chaîne la plus longue pour la ou les variables sélectionnées. Dans le cas desfichiers de largeur fixe, le nombre de caractères des valeurs de chaîne est défini par lepositionnement des lignes de délimitation des variables effectué à l’étape 4.

Date/Heure. Les valeurs valides correspondent aux dates exprimées dans les formatstraditionnels jj-mm-aaaa, mm/jj/aaaa, jj.mm.aaaa, aaaa/mm/jj, hh:mm:ss, et dansdivers autres formats de date et d’heure. Les mois peuvent être représentés par deschiffres, des chiffres romains, des abréviations à trois lettres, ou bien ils peuvent êtreénoncés en entier. Sélectionnez un format de date dans la liste.

Dollar. Les valeurs valides sont des nombres précédés, en option, par un signe dollaret, également en option, des virgules comme séparateurs de milliers.

Virgule. Les valeurs valides correspondent aux nombres utilisant un point commeindicateur décimal et des virgules comme séparateurs de milliers.

Point. Les valeurs valides correspondent aux nombres utilisant une virgule commeindicateur décimal et des points comme séparateurs de milliers.

Remarque : les valeurs comportant des caractères incorrects pour le formatsélectionné seront traitées comme des valeurs manquantes. Les valeurs contenant l’undes séparateurs spécifiés seront considérées comme des valeurs multiples.

Page 87: SPSS Base Users Guide 14.0

61

Fichiers de données

Assistant de texte : Etape 6Figure 3-22Assistant de texte : Etape 6

Il s’agit de la dernière étape de l’Assistant de texte. Vous pouvez enregistrer vossélections dans un fichier pour les appliquer lors de l’importation de fichiers dedonnées texte similaires. Il vous est également possible de coller la syntaxe généréepar l’Assistant de texte dans une fenêtre de syntaxe. Vous pouvez alors personnaliseret/ou enregistrer cette syntaxe afin de l’utiliser dans d’autres sessions ou d’autrestâches de production.

Mettre données en cache localement. Un cache de données est une copie complète dufichier de données, enregistrée dans un espace disque temporaire. La création d'uncache du fichier de données peut améliorer les performances.

Page 88: SPSS Base Users Guide 14.0

62

Chapitre 3

Lecture des données de dimension

Vous pouvez lire les données à partir des produits de dimensions SPSS, y comprisQuanvert, Quancept et mrInterview.

Pour lire les sources de données de dimensions, vous devez avoir installé les élémentssuivants sur l’ordinateur exécutant SPSS :

.NET framework

Modèle de données de dimension et accès OLE DB

Les versions des composants compatibles avec cette version de SPSS peuventêtre installées à partir du CD d’installation SPSS et sont disponibles dans le menuAutoPlay. Vous pouvez uniquement lire les sources de données de dimension enmode d’analyse locale. Cette fonction n’est pas disponible dans le mode d’analysedistribuée utilisant le serveur SPSS.

Pour lire les données à partir d’une source de données de dimension :

E A partir du menu de n’importe quelle fenêtre SPSS ouverte, sélectionnez :Fichier

Ouvrir les données de dimension

E Dans l’onglet Connexions des Propriétés du lien de données, spécifiez le fichier demétadonnées, le type de données d’observation et le fichier de données d’observation.

E Cliquez sur OK.

E Dans la boîte de dialogue Importation des données de dimension, sélectionnez lesvariables à inclure et tout critère de sélection des observations.

E Cliquez sur OK pour lire les données.

Onglet Connexions des propriétés du lien de données

Pour lire les sources de données de dimension, vous devez spécifier :

L’emplacement des métadonnées. Le fichier de document des métadonnées (.mdd) quicontient les informations de définition du questionnaire.

Page 89: SPSS Base Users Guide 14.0

63

Fichiers de données

Le type des données d’observation. Le format du fichier de données d’observation. Lesformats disponibles sont les suivants :

Fichier de données Quancept (DRS). Données d’observation dans un fichierQuancept .drs, .drz ou .dru.

Base de données Quanvert. Données d’observation dans une base de donnéesQuanvert.

Base de données de dimensions (Serveur MS SQL). Les données d’observationdans une base de données relationnelle SPSS MR dans un serveur SQL. Cetteoption peut être utilisée pour lire des données collectées en utilisant mrInterview.

Fichier de données de dimension XML. Données d’observation dans un fichierXML.

Emplacement des données d’observation. Le fichier contenant les donnéesd’observation. Le format de ce fichier doit être cohérent avec le type de donnéesd’observation sélectionné.

Figure 3-23Propriétés du lien de données : Onglet Connexions

Page 90: SPSS Base Users Guide 14.0

64

Chapitre 3

Remarque : Il est impossible de savoir si les autres paramètres de l’onglet Connexionsou les paramètres des autres onglets Propriétés du lien de données affecteront ou nonla lecture des données de dimension dans SPSS ; il est donc recommandé de ne pasles modifier.

Sélectionner l’onglet Variables

Vous pouvez sélectionner un sous-ensemble de variables à lire. Par défaut, toutes lesvariables standard de la source de données sont affichées et sélectionnées.

Afficher les variables système. Affiche toutes les variables “système”, y comprisles variables affichant un état d’entrevue (en cours, terminé, date de fin, etc.).Vous pouvez alors sélectionner toutes les variables système à inclure. Par défaut,toutes les variables système sont exclues.

Afficher les variables de code. Affiche toutes les variables qui représentent descodes utilisés pour des réponses ouvertes “Autre” pour les variables qualitatives.Vous pouvez alors sélectionner toutes les variables de code à inclure. Par défaut,toutes les variables de code sont exclues.

Afficher les variables SourceFile. Affiche toutes les variables contenant des nomsde fichiers d’images de réponses analysées. Vous pouvez alors sélectionner toutesles variables SourceFile à inclure. Par défaut, toutes les variables SourceFilesont exclues.

Page 91: SPSS Base Users Guide 14.0

65

Fichiers de données

Figure 3-24Importation des données de dimension : Sélectionner l’onglet Variables

Onglet Sélection des observations

Pour les sources de données de dimension qui contiennent des variables système, vouspouvez sélectionner des observations se basant sur un nombre de critères de variablessystème. Vous n’avez pas besoin d’inclure les variables système correspondantesdans la liste des variables à lire, mais les variables système nécessaires doiventexister dans la source de données pour appliquer les critères de sélection. Si lesvariables nécessaires n’existent pas dans les données source, les critères de sélectioncorrespondants seront ignorés.

Etat de la collecte des données. Vous pouvez sélectionner des données du répondant,des données de test ou les deux. Vous pouvez également sélectionner des observationsse basant sur une combinaison des paramètres de l’état d’entrevue suivants :

Terminé avec succès

Actif/en cours

Page 92: SPSS Base Users Guide 14.0

66

Chapitre 3

Expiré

Arrêté par le script

Arrêté par le répondant

Arrêt du système d’entrevue

Signal (terminé par un énoncé de signal dans le script)

Date de fin de la collecte des données. Vous pouvez sélectionner des observations ense basant sur la date de fin de la collecte des données.

Date de début. Les observations pour lesquelles la collecte des données s’estterminée à la date spécifiée ou après celle-ci sont incluses.

Date de fin. Les observations pour lesquelles la collecte des données s’est terminéeavant la date spécifiée sont incluses. Cela ne comprend pas les observations pourlesquelles la collecte des données s’est terminée à la date de fin.

Si vous spécifiez à la fois une date de début et une date de fin, cela définitune plage de dates de fin à partir de la date de début jusqu’à la date de fin (àl’exclusion de celle-ci).

Page 93: SPSS Base Users Guide 14.0

67

Fichiers de données

Figure 3-25Importation des données de dimension : Onglet Sélection des observations

Informations sur les fichiers

Un fichier de données SPSS contient bien plus que des données brutes. Il contientégalement toutes les informations sur la définition des variables, dont :

Le nom des variables

Le format des variables

Les étiquettes descriptives de variables et de valeurs.

Ces informations sont enregistrées dans la partie dictionnaire du fichier de donnéesde SPSS. L’éditeur de données permet de voir les informations de la définition desvariables. Vous pouvez également afficher des informations de dictionnaire complètespour l’ensemble de données actif, ou tout autre fichier de données.

Page 94: SPSS Base Users Guide 14.0

68

Chapitre 3

Pour obtenir des informations sur un fichier de données

E A partir des menus de la fenêtre de l’éditeur de données, sélectionnez :Fichier

Afficher des informations sur un fichier de données

E Pour le fichier de données en cours d’utilisation, choisissez Fichier de travail.

E Pour d’autres fichiers de données, sélectionnez Fichier externe puis le fichier dedonnées.

Les informations sur le fichier de données sont affichées dans le Viewer.

Enregistrement des fichiers de données

Toute modification effectuée dans un fichier de données ne dure que le temps de lasession en cours, à moins que vous n’enregistriez ces modifications de façon explicite.

Pour enregistrer des fichiers de données modifiésE Faites en sorte que l’éditeur de données devienne la fenêtre active (cliquez n’importe

où dans la fenêtre pour la rendre active).

E A partir des menus, sélectionnez :Fichier

Enregistrer

Le fichier de données modifié est enregistré, et écrase les versions précédentes dufichier.

Enregistrement de fichiers de données au format Excel

Vous pouvez enregistrer vos données dans un des trois formats Microsoft Excel.Le choix du format dépend de la version d’Excel qui sera utilisée pour ouvrir lesdonnées. L’application Excel ne peut pas ouvrir de fichier créé dans une versionplus récente. Par exemple, Excel 5.0 ne peut pas ouvrir un document Excel 2000.Cependant, Excel 2000 peut facilement lire un document Excel 5.0.

Page 95: SPSS Base Users Guide 14.0

69

Fichiers de données

Le format de fichier Excel induit des contraintes qui n’existent pas dans SPSS. Cescontraintes sont les suivantes :

Les informations sur les variables, telles que les valeurs manquantes et lesétiquettes de variable, ne sont pas comprises dans les fichiers Excel exportés.

Concernant l’exportation vers Excel 97 et les versions ultérieures, une optionpermet d’inclure les étiquettes de valeurs au lieu des valeurs.

Du fait que tous les fichiers Excel sont limités à 256 colonnes de données, les 256premières variables sont comprises dans le fichier exporté.

Les fichiers Excel 4.0 et Excel 5.0/95 sont limités à 16 384 enregistrements, oulignes de données. Les fichiers Excel 97–2000 autorisent 65 536 enregistrements.Si vos données excèdent ces limites, un message d’avertissement apparaît et lesdonnées sont tronquées à la taille maximale autorisée par Excel.

Types de variable

Le tableau suivant indique la concordance des types de variable entre les donnéesSPSS d’origine et les données exportées dans Excel.

Type de variable SPSS Format de données Excel

Numérique 0.00; #,##0.00; ...

Virgule 0.00; #,##0.00; ...

Dollar $#,##0_); ...

Date j-mmm-aaaa

Heure hh:mm:ss

Chaîne Général

Enregistrement de fichiers de données au format SAS

Vos données reçoivent divers traitements spéciaux quand elles sont enregistrées entant que fichier SAS. Ces traitements sont les suivants :

Certains caractères autorisés dans les noms de variable SPSS ne sont pas validesdans SAS, comme @, # et $. Lors de l’exportation des données, ces caractèresinterdits sont remplacés par un trait de soulignement.

Page 96: SPSS Base Users Guide 14.0

70

Chapitre 3

Les noms de variables SPSS qui contiennent des caractères plusieurs octets (paxexemple, caractères japonais ou chinois) sont convertis en noms de variables auformat traditionnel Vnnn, nnn correspondant à une valeur entière.

Les étiquettes de variable SPSS contenant plus de 40 caractères sont tronquéesquand elles sont exportées vers un fichier SAS v6.

Quand elles existent, les étiquettes de variable SPSS sont associées aux étiquettesde variable SAS. S’il n’existe aucune étiquette de variable dans les donnéesSPSS, le nom de variable est associé à l’étiquette de variable SAS.

SAS n’autorise qu’une seule valeur manquante par défaut, alors que SPSS enautorise un grand nombre. Par conséquent, toutes les valeurs manquantes pardéfaut de SPSS sont associées à une seule de ces valeurs dans le fichier SAS.

Enregistrement des étiquettes de valeurs

Vous pouvez choisir d’enregistrer les valeurs et les étiquettes de valeurs associéesà votre fichier de données dans un fichier de syntaxe SAS. Par exemple, lorsqueles étiquettes de valeurs du fichier de donnéescars.sav sont exportées, le fichier desyntaxe généré contient :

libname library 'd:\spss\' ;

proc format library = library ;

value ORIGIN /* Pays d'origine */

1 = 'Américaine'

2 = 'Européenne'

3 = 'Japonaise' ;

value CYLINDER /* Nombre de cylindres */

3 = '3 cylindres'

4 = '4 cylindres'

5 = '5 cylindres'

6 = '6 cylindres'

8 = '8 cylindres' ;

value FILTER__ /* cylrec = 1 | cylrec = 2 (FILTER) */

0 = 'Non sélectionnés'

Page 97: SPSS Base Users Guide 14.0

71

Fichiers de données

1 = 'Sélectionnés' ;

proc datasets library = library ;

modify cars;

format ORIGIN ORIGIN.;

format CYLINDER CYLINDER.;

format FILTER__ FILTER__.;

quit;

Cette fonctionnalité n’est pas prise en charge par le fichier de transfert SAS.

Types de variable

Le tableau suivant indique la concordance des types de variable entre les donnéesSPSS d’origine et les données exportées dans SAS.

Type de variable SPSS Type de variable SAS Format de données SAS

Numérique Numérique 12

Virgule Numérique 12

Points Numérique 12

Notation scientifique Numérique 12

Date Numérique (Date) par exemple,MMJJAA10, ...

Date (Heure) Numérique Time18

Dollar Numérique 12

Devise personnalisée Numérique 12

Chaîne Caractère $8

Enregistrement de fichiers de données au format StataLes données peuvent être écrites au format Stata versions 5-8 et à la fois auxformats Intercooled et SE (versions 7-8 uniquement).

Les fichiers de données enregistrés au format Stata version 5 peuvent être luespar un format Stata version 4.

Page 98: SPSS Base Users Guide 14.0

72

Chapitre 3

Les premiers 80 octets d’étiquettes de variable sont enregistrés comme étiquettesde variable Stata.

Pour les variables numériques, les premiers 80 octets d’étiquettes de valeurssont enregistrés comme étiquettes de valeurs Stata. Pour les variables chaîne,les étiquettes de valeurs sont ignorées.

Pour les versions 7 et 8, les premiers 32 octets de noms de variables sensiblesà la casse sont enregistrés comme noms de variables Stata. Pour les versionsantérieures, les premiers 8 octets de noms de variables sont enregistrés commenoms de variables Stata. Tout caractère autre que des lettres, des chiffres ou destraits de soulignement sont convertis en traits de soulignement.

Les noms de variables SPSS qui contiennent des caractères plusieurs octets (paxexemple, caractères japonais ou chinois) sont convertis en noms de variables auformat traditionnel Vnnn, où nnn correspond à une valeur entière.

Pour les versions 5-6 et les versions Intercooled 7-8, les premiers 80 octets devaleurs chaînes sont enregistrés. Pour Stata SE versions 7-8, les premiers 244octets de valeurs chaîne sont enregistrés.

Pour les versions 5-6 et les versions Intercooled 7-8, seuls les premiers 2 047octets de variables sont enregistrés. Pour Stata SE versions 7-8, seuls les premiers32 767 octets de variables sont enregistrés.

Type de variable SPSS Type de variable Stata Format de donnéesStata

Numérique Numérique g

Virgule Numérique g

Points Numérique g

Notation scientifique Numérique g

Date, dateheure Numérique J_m_A

Heure, DHeure Numérique g (nombre de secondes)

Joursem Numérique g (1-7)

Moan Numérique g (1-12)

Dollar Numérique g

Devise personnalisée Numérique g

Chaîne Chaîne s

Page 99: SPSS Base Users Guide 14.0

73

Fichiers de données

Pour enregistrer des fichiers de données sous des formatsdifférents

E Faites en sorte que l’éditeur de données devienne la fenêtre active (cliquez n’importeoù dans la fenêtre pour la rendre active).

E A partir des menus, sélectionnez :Fichier

Enregistrer sous

E Sélectionnez un type de fichier de la liste proposée.

E Entrez un nom de fichier pour le nouveau fichier de données.

Pour écrire des noms de variable sur la première ligne d’un fichier de données de formatfeuille de calcul ou délimité par des tabulations :

E Cliquez sur Ecrire nom de var. dans tableur dans la boîte de dialogue EnregistrerDonnées sous.

Pour enregistrer les étiquettes de valeurs à la place des valeurs de données au formatExcel 97 :

E Dans la boîte de dialogue Enregistrer les données sous, cliquez sur Enregistrer les

étiquettes de valeurs lorsqu’elles sont définies à la place des valeurs de données.

Pour enregistrer les étiquettes de valeurs dans un fichier de syntaxe SAS (cette optionn’est active que si un type de fichier SAS est sélectionné) :

E Dans la boîte de dialogue Enregistrer les données sous, cliquez sur Enregistrer les

étiquettes de valeurs dans un fichier .sas.

Enregistrement de données : Types de fichier de données

Vous pouvez enregistrer des données sous les formats suivants :

SPSS (*:sav). Format SPSS.

Les fichiers de données enregistrés dans le format SPSS ne peuvent être lus avecles versions du logiciel antérieures à la version 7.5.

Page 100: SPSS Base Users Guide 14.0

74

Chapitre 3

Lorsque vous utilisez des fichiers de données ayant des noms de plus de huitoctets sous SPSS 10.x ou 11.x, des versions uniques de noms de variable àhuit octets sont utilisées—. Toutefois, les noms de variables originaux sontconservés pour la version 12.0 ou supérieure. Dans les versions SPSS antérieuresà la version 10,0, les noms longs originaux des variables sont perdus si vousenregistrez le fichier de données.

Lorsque vous utilisez des fichiers de données avec des variables chaîne de plus de255 octets dans les versions de SPSS antérieures à 13.0, ces variables chaîne sontsegmentées en plusieurs variables chaîne de 255 octets.

SPSS 7.0 (*:sav). Format SPSS 7.0 pour Windows. Les fichiers de données enregistrésau format SPSS 7.0 peuvent être lus par SPSS 7.0 et par les versions SPSS pourWindows antérieures, mais n’incluent pas les vecteurs multiréponses définis ni lesdonnées entrées pour l’information de Windows.

SPSS/PC+ (*:sys). Format SPSS/PC+. Si le fichier de données contient plus de500 variables, seules les 500 premières seront sauvegardées. En ce qui concerneles variables ayant plus d’une valeur manquante par défaut définie, les valeursmanquantes par défaut supplémentaires seront réalignées sur la première valeurmanquante par défaut.

SPSS portable (*:por). Fichier SPSS portable qui peut être lu par d’autres versions deSPSS sur d’autres systèmes d’exploitation (par exemple, Macintosh, UNIX). Lesnoms de variable sont limités à huit octets et sont automatiquement convertis ennoms à huit octets uniques si nécessaire.

Tabulé (*:dat). Fichiers texte ASCII avec valeurs séparées par des tabulations.

ASCII fixe (*:dat). Fichier ASCII texte en format fixe, qui utilise le format d’écriturepar défaut pour toutes les variables. Il n’y a pas de tabulations ni d’espaces entreles champs de variables.

Excel 2.1 (*:xls). Fichier de type tableur Microsoft Excel 2.1. Le nombre maximum devariables est de 256 et le nombre maximum de lignes est de 16 384.

Excel versions 97 et ultérieures (*.xls). Fichier de type feuille de calcul Microsoft Excel97/2000/XP. Le nombre maximum de variables est de 256 et le nombre maximumde lignes est de 65 536.

1-2-3 Version 3.0 (*:wk3). Fichier tableur Lotus 1-2-3, version 3,0. Vous pouvezenregistrer un nombre maximum de 256 variables.

Page 101: SPSS Base Users Guide 14.0

75

Fichiers de données

1-2-3 Version 2.0 (*:wk1). Fichier tableur Lotus 1-2-3, version 2.0. Vous pouvezenregistrer un nombre maximum de 256 variables.

1-2-3 Version 1.0 (*:wks). Fichier tableur Lotus 1-2-3, version 1A. Vous pouvezenregistrer un nombre maximum de 256 variables.

SYLK (*:slk). Format de lien symbolique pour fichiers de type tableur Microsoft Excelet Multiplan. Vous pouvez enregistrer un nombre maximum de 256 variables.

dBASE IV (*:dbf). Format dBASE IV.

dBASE III (*:dbf). Format dBASE III.

dBASE II (*:dbf). Format dBASE II.

SAS v6 pour Windows (*.sd2). Format de fichier SAS v6 pour Windows/OS2.

SAS v6 pour UNIX (*.ssd01). Format de fichier SAS v6 pour UNIX (Sun, HP, IBM).

SAS v6 pour Alpha/OSF (*.ssd04). Format de fichier SAS v6 pour Alpha/OSF (DECUNIX).

SAS v7+ extension courte Windows (*.sd7). SAS version 7–8 pour Windows, formatde nom de fichier court.

SAS v7+ extension courte Windows (*.sas7bdat). SAS version 7–8 pour Windows,format de nom de fichier long.

SAS v7+ pour UNIX (*.ssd01). SAS v8 pour UNIX.

SAS transfert (*.xpt). Fichier de transfert SAS.

Stata Version 4–5 (*.dta).

Stata Version 6 (*.dta).

Stata Intercooled Version 7 (*.dta).

Stata Version 7 SE (*.dta).

Stata Intercooled Version 8 (*.dta).

Stata Version 8 SE (*.dta).

Page 102: SPSS Base Users Guide 14.0

76

Chapitre 3

Enregistrement de sous-ensembles de variablesFigure 3-26Boîte de dialogue Enregistrer les données en tant que variables

La boîte de dialogue Enregistrer les données en tant que variables vous permet desélectionner les variables que vous souhaitez enregistrer dans le nouveau fichierde données. Par défaut, toutes les variables sont enregistrées. Désélectionnez lesvariables à ne pas enregistrer, ou cliquez sur Supprimer tout puis sélectionnez lesvariables à enregistrer.

Pour enregistrer un sous-groupe de variables

E Faites en sorte que l’éditeur de données devienne la fenêtre active (cliquez n’importeoù dans la fenêtre pour la rendre active).

E A partir des menus, sélectionnez :Fichier

Enregistrer sous

E Sélectionnez le type de fichier.

E Cliquez sur Variables.

E Sélectionnez les variables à enregistrer.

Page 103: SPSS Base Users Guide 14.0

77

Fichiers de données

Enregistrement de fichier : Options

Vous pouvez écrire des noms de variables dans la première ligne des fichiers de typetableur et des fichiers tabulés.

Protection des données d’origine

Pour éviter de modifier/supprimer vos données d’origine par accident, vous pouvezparamétrer les fichiers en lecture seule.

E A partir des menus de l’éditeur de données, sélectionnez :Fichier

Marquer le fichier comme étant en lecture seule

Si vous apportez d’importantes modifications aux données, puis que vous essayezd’enregistrer le fichier de données, vous pouvez uniquement l’enregistrer sous unautre nom ; les données d’origine sont ainsi protégées.

Vous pouvez redonner au fichier l’attribut de lecture/écriture en sélectionnantMarquer le fichier comme étant en lecture/écriture dans le menu Fichier.

Fichier actif virtuel

Le fichier actif virtuel vous permet de travailler avec des fichiers de donnéesvolumineux sans nécessiter d’importants volumes d’espace disque temporaire. Dansle cas de la plupart des procédures d’analyse et de création de diagrammes, la sourcede données d’origine est lue chaque fois que vous exécutez une procédure différente.Les procédures qui modifient les données nécessitent un certain volume d’espacedisque temporaire afin de conserver une trace de ces modifications, et certainesopérations requièrent toujours un espace disque suffisant pour pouvoir effectuer aumoins une copie intégrale du fichier de données.

Page 104: SPSS Base Users Guide 14.0

78

Chapitre 3

Figure 3-27Espace disque temporaire requis

Les opérations ne nécessitant pas d’espace disque temporaire sont les suivantes :

lecture de fichiers de données SPSS ;

fusion de deux fichiers de données SPSS ou plus ;

lecture de tableaux de base de données avec l’assistant de base de données ;

fusion d’un fichier de données SPSS avec un tableau de base de données ;

exécution de procédures lisant les données (par exemple, Fréquences, Tableauxcroisés, Explorer).

Les opérations créant une ou plusieurs colonnes de données dans un espace disquetemporaire sont les suivantes :

calcul de nouvelles variables ;

recodage de variables existantes ;

exécution de procédures créant ou modifiant des variables (par exemple,enregistrement de prévisions dans la Régression linéaire).

Page 105: SPSS Base Users Guide 14.0

79

Fichiers de données

Les opérations créant une copie intégrale du fichier de données dans un espace disquetemporaire sont les suivantes :

lecture de fichiers Excel ;

exécution de procédures triant les données (par exemple, Trier les observations,Scinder fichier) ;

Lecture des données avec la commande GET TRANSLATE ou DATA LIST

Utilisation de la fonctionnalité Données de mémoire cache ou de la commandeCACHE

Ouverture depuis SPSS d’autres applications lisant le fichier de données (parexemple, AnswerTree, DecisionTime).

Remarque : La commande GET DATA assure des fonctionnalités comparables à cellesde la commande DATA LIST mais sans créer de copie intégrale du fichier de donnéesdans un espace disque temporaire. Dans sa syntaxe, la commande SPLIT FILE

ne trie pas le fichier de données et n’en crée donc pas de copie. Toutefois, pourpouvoir fonctionner correctement, cette commande nécessitent des données triées ;l’interface de boîtes de dialogue de ces procédures triera donc automatiquement lefichier de données, aboutissant ainsi à la création d’une copie complète de ce fichier.(La syntaxe de commande n’est pas disponible dans la version Student.)

Opérations créant une copie intégrale du fichier de données par défaut :

Lecture de bases de données avec l’Assistant de base de données

Lecture de fichiers texte avec l’Assistant de texte

L’Assistant de texte offre un paramètre optionnel qui crée automatiquement un cachedes données. Par défaut, cette option est sélectionnée. Pour désactiver cette option,désélectionnez la case Mettre données en cache localement. Pour l’Assistant de basede données, vous pouvez coller la syntaxe de commande générée et supprimer lacommande CACHE.

Création d’un cache de données

Bien que le fichier actif virtuel contribue à réduire considérablement le volumed’espace disque temporaire requis, l’absence d’une copie temporaire du fichier «actif » signifie que la source de données d’origine doit être lue de nouveau pourchaque procédure. Dans le cas de fichiers de données volumineux provenant d’une

Page 106: SPSS Base Users Guide 14.0

80

Chapitre 3

source externe, la création d’une copie temporaire des données peut améliorer lesperformances de lecture. Dans le cas de tableaux de données lus dans une base dedonnées, la requête SQL qui consulte les informations de la base doit être réexécutéepour toute commande ou procédure nécessitant la lecture des données. Du fait quequasiment toutes les procédures d’analyse statistique et de création de diagrammesdoivent lire les données, la requête SQL est réexécutée pour chaque nouvelleprocédure que vous lancez, ce qui risque d’entraîner un allongement considérable destemps de traitement si vous devez exécuter un grand nombre de procédures.

Si l’ordinateur sur lequel vous effectuez l’analyse (qu’il s’agisse de votreordinateur local ou d’un serveur distant) dispose d’un volume d’espace disquesuffisant, vous pouvez éliminer de nombreuses requêtes SQL et réduire ainsi lestemps de traitement en créant un cache de données du fichier actif. Le cache dedonnées est une copie temporaire de la totalité des données.

Remarque : Par défaut, l’Assistant de base de données crée automatiquement un cachede données. Toutefois, si vous utilisez la commande GET DATA dans une syntaxe afinde lire une base de données, le cache de données n’est pas créé automatiquement. (Lasyntaxe de commande n’est pas disponible dans la version Student.)

Pour créer un cache de données

E A partir des menus, sélectionnez :Fichier

Données Cache...

E Cliquez sur OK ou sur Cacher maintenant.

L’option OK créera un cache de données à la prochaine lecture des données (parexemple, lorsque vous exécuterez une procédure statistique). C’est l’option quevous choisirez le plus souvent puisque cette opération ne nécessite pas de passagede données supplémentaire. L’option Cacher maintenant crée un cache de données

Page 107: SPSS Base Users Guide 14.0

81

Fichiers de données

immédiatement, ce qui généralement ne devrait pas s’avérer nécessaire. L’optionCacher maintenant est surtout utile pour deux raisons :

Une source de données est « verrouillée » et ne peut être mise à jour tant quevous n’avez pas fermé la session, ouvert une autre source de données ou crééun cache des données.

Pour les sources de données volumineuses, la consultation du contenu de l’ongletAffichage des données dans Data Editor s’avérera bien plus rapide si vous placezles données dans un cache.

Pour mettre automatiquement des données en mémoire cache

Vous pouvez paramétrer la commande SET pour qu’elle crée automatiquement uncache de données dès que vous avez apporté un certain nombre de modifications dansle fichier de données actif. Par défaut, le fichier de données actif est automatiquementmis en mémoire cache après 20 modifications.

E A partir des menus, sélectionnez :Fichier

NouveauSyntaxe

E Dans la fenêtre de syntaxe, entrez SET CACHE n. La valeur n correspond au nombrede modifications apportées au fichier de données actif avant sa mise en mémoirecache.

E Dans le menu de la fenêtre de syntaxe, sélectionnez :Exécuter

Tous

Remarque : Vous devez définir le paramètre de cache pour chaque session. A chaquenouvelle session, la valeur est paramétrée par défaut sur 20.

Page 108: SPSS Base Users Guide 14.0
Page 109: SPSS Base Users Guide 14.0

Chapitre

4Mode d’analyse distribuée

Le mode d’analyse distribuée vous permet d’utiliser un autre ordinateur local que levôtre (ou de bureau) pour les tâches sollicitant la mémoire de façon intensive. Lesserveurs distants utilisés pour l’analyse distribuée se révélant généralement pluspuissants et plus rapides que votre ordinateur local, le mode d’analyse distribuéepermet de réduire considérablement les temps de traitement. L’analyse distribuéeeffectuée à l’aide d’un serveur distant peut s’avérer utile si votre travail met en œuvre :

des fichiers de données volumineux, contenant notamment des données provenantde bases de données ;

des tâches sollicitant la mémoire de façon intensive. Toute tâche longue à effectueren mode d’analyse locale serait ainsi mieux adaptée à une analyse distribuée.

L’analyse distribuée n’affecte que les tâches impliquant des données, telles que lalecture et la transformation de données ainsi que le calcul de nouvelles variableset de statistiques. L’analyse distribuée n’a aucun effet sur les tâches associées à lamodification de résultats, telles que la manipulation de tableaux pivotants ou lamodification de diagrammes.

Remarque : L’analyse distribuée n’est disponible que si vous disposez à la fois d’uneversion locale du programme et d’un accès à une version serveur du même logicielinstallé sur un serveur distant.

Analyse distribuée et analyse locale

Voici quelques recommandations destinées à vous permettre de choisir entre le moded’analyse locale et celui d’analyse distribuée :

Accès aux bases de données. Il est possible que les tâches effectuant des requêtes dansdes bases de données s’exécutent plus rapidement en mode distribué si le serveurdispose d’un accès prioritaire à ces bases de données ou qu’il s’exécute sur le même

83

Page 110: SPSS Base Users Guide 14.0

84

Chapitre 4

poste que le moteur de base de données. Si le logiciel d’accès à la base de donnéesrequise n’est disponible que sur le serveur ou que votre administrateur réseau ne vouspermet pas de télécharger des tableaux de données de grande taille, vous ne pourrezaccéder à la base de données qu’en mode distribué.

Rapport entre calculs et résultats. Les commandes qui offrirent des performancesoptimales si elles sont exécutées en mode distribuée sont des commandes effectuantun grand nombre de calculs et produisant peu de résultats (par exemple, des tableauxpivotants en petit nombre ou peu volumineux, de brefs résultats en format texte, ouencore des diagrammes simples ou en nombre réduit). Le gain de performancesobtenu dépend dans une large mesure de la puissance de calcul du serveur distant.

Tâches rapides. Les tâches s’exécutant rapidement en mode local le feront presquetoujours plus lentement en mode distribué du fait des sollicitations système inhérentesà l’architecture client-serveur.

Diagrammes. Les diagrammes conçus pour les observations, tels que les diagrammesde dispersion, les diagrammes de résidus de régression ou les diagrammes séquentiels,nécessitent la présence de données brutes sur votre ordinateur local. Dans le cas defichiers de données ou de tableaux de base de données volumineux, cette nécessitérisque d’entraîner un ralentissement des performances en mode distribué puisqueles données doivent être envoyées par le serveur distant à votre ordinateur local.En revanche, les autres diagrammes mettant en œuvre des données récapitulativesou agrégées seront traités de façon adéquate en mode distribué puisque l’opérationconsistant à agréger les données est effectuée sur le serveur.

Diagrammes interactifs. Si les données brutes sont enregistrées avec des graphiquesinteractifs (un paramètre optionnel), de grandes quantités de données peuvent êtretransférées depuis un serveur distant vers votre ordinateur local, réduisant de manièresignificative le temps nécessaire à l’enregistrement de vos résultats.

Tableaux pivotants. La création de tableaux pivotants de grande taille peut s’avérerplus longue en mode distribué. Ceci se vérifie plus particulièrement dans le cas dela procédure Cubes OLAP et des tableaux contenant des données d’observationsindividuelles, tels que ceux disponibles dans la procédure Récapituler.

Résultats texte. Plus la quantité de texte générée est importante, plus elle sera longue às’effectuer en mode distribué, car ce texte est créé sur le serveur distant, puis copiésur votre ordinateur local pour affichage. Toutefois, les résultats en format texte nesollicitent que faiblement le système et sont transmis rapidement.

Page 111: SPSS Base Users Guide 14.0

85

Mode d’analyse distribuée

Connexion au serveur SPSS

La boîte de dialogue Connexion au serveur vous permet de sélectionner l’ordinateurqui traite les commandes et exécute les procédures. Vous pouvez sélectionner votreordinateur local ou un serveur distant.

Figure 4-1Boîte de dialogue Connexion au serveur

Vous pouvez ajouter et modifier des serveurs distants de la liste, ou en supprimer. Lesserveurs distants nécessitent généralement un ID utilisateur ainsi qu’un mot de passe,et parfois même un nom de domaine. Pour plus d’informations sur la connexion,les serveurs disponibles, les ID utilisateur, les mots de passe et noms de domaine,contactez l’administrateur système.

Vous pouvez sélectionner un serveur par défaut et enregistrer l’ID utilisateur, lenom de domaine et le mot de passe associés à un serveur. Lorsque vous démarrez unesession, vous êtes automatiquement connecté au serveur par défaut.

Ajout et modification des paramètres de connexion au serveur

Utilisez la boîte de dialogue Paramètres de connexion au serveur pour ajouter oumodifier des informations de connexion pour les serveurs distants à utiliser en moded’analyse distribuée.

Page 112: SPSS Base Users Guide 14.0

86

Chapitre 4

Figure 4-2Boîte de dialogue Paramètres de connexion au serveur

Contactez l’administrateur système pour obtenir la liste des serveurs disponibles etdes numéros de port associés aux serveurs, ainsi que des informations de connexionsupplémentaires. N’utilisez le protocole SSL que si l’administrateur vous le demande.

Nom du serveur. Un « nom » de serveur peut être un nom alphanumérique affecté àun ordinateur (par exemple, NetworkServer) ou une adresse IP unique attribuée à unordinateur (par exemple, 202.123.456.78).

Numéro de port. Le numéro du port est le port que le logiciel du serveur utilise pourles communications.

Description. Vous pouvez entrer une description facultative devant apparaître dans laliste des serveurs.

Connecter avec le protocole SSL. Le protocole SSL (Secure Sockets Layer) code lesdemandes d’analyse distribuée envoyées au serveur SPSS distant. Avant d’utiliser leprotocole SSL, consultez l’administrateur. Pour qu’il soit activé, le protocole SSLdoit être configuré sur votre ordinateur et sur le serveur.

Page 113: SPSS Base Users Guide 14.0

87

Mode d’analyse distribuée

Sélection, changement ou ajout de serveurs

E A partir des menus, sélectionnez :Fichier

Changer serveur

Pour sélectionner un serveur par défaut :

E Dans la liste des serveurs, cochez la case située en regard du serveur à utiliser.

E Entrez l’ID utilisateur, le nom de domaine et le mot de passe fournis parl’administrateur.

Remarque : Lorsque vous démarrez une session, vous êtes automatiquement connectéau serveur par défaut.

Pour utiliser un autre serveur :

E Sélectionnez un serveur dans la liste.

E Entrez votre ID utilisateur, nom de domaine et mot de passe (le cas échéant).

Remarque : Lorsque vous changez de serveur au cours d’une session, toutes lesfenêtres ouvertes sont automatiquement fermées. Le système vous demanded’enregistrer vos modifications avant la fermeture des fenêtres.

Pour ajouter un serveur :

E Demandez les informations de connexion du serveur à l’administrateur.

E Cliquez sur Ajouter pour ouvrir la boîte de dialogue Paramètres de connexion auserveur.

E Entrez les informations de connexion et les paramètres facultatifs, puis cliquez sur OK.

Pour modifier un serveur :

E Demandez les informations de connexion révisées à l’administrateur.

E Cliquez sur Edition pour ouvrir la boîte de dialogue Paramètres de connexion auserveur.

E Entrez les modifications et cliquez sur OK.

Page 114: SPSS Base Users Guide 14.0

88

Chapitre 4

Ouverture de fichiers de données à partir d’un serveur distantFigure 4-3Boîte de dialogue Ouvrir fichier distant

En mode d’analyse distribuée, la boîte de dialogue Ouvrir fichier distant remplace laboîte de dialogue Ouvrir fichier.

Le contenu de la liste des fichiers, dossiers et lecteurs disponibles dépend desdonnées accessibles sur le serveur distant. Le nom du serveur utilisé est indiquédans la zone supérieure de la boîte de dialogue.

En mode d’analyse distribuée, vous n’aurez accès aux fichiers de données devotre ordinateur local que si vous définissez le lecteur correspondant comme unlecteur partagé et les dossiers contenant vos fichiers de données comme desdossiers partagés.

Si le système d’exploitation du serveur est différent du vôtre (Windows et UNIXpar exemple), vous n’aurez probablement pas accès aux fichiers de donnéeslocaux en mode d’analyse distribuée, même s’ils se trouvent dans des dossierspartagés.

Pour ouvrir des fichiers de données à partir d’un serveur distant

E Si vous n’êtes pas encore connecté au serveur distant, faites-le maintenant.

Page 115: SPSS Base Users Guide 14.0

89

Mode d’analyse distribuée

E Selon le type de fichier de données à ouvrir, sélectionnez les options de menusuivantes :Fichier

OpenDonnées

ouFichier

Ouvrir la base de données

ouFichier

Lire les données du texte...

Enregistrement de fichiers de données à partir d’un serveur distantFigure 4-4Boîte de dialogue Enregistrer fichier distant

En mode d’analyse distribuée, la boîte de dialogue Enregistrer fichier distant remplacela boîte de dialogue Enregistrer fichier standard.

Le contenu de la liste des dossiers et lecteurs disponibles dépend des donnéesaccessibles sur le serveur distant. Le nom du serveur utilisé est indiqué dansla zone supérieure de la boîte de dialogue. Vous n’aurez accès aux dossiers de

Page 116: SPSS Base Users Guide 14.0

90

Chapitre 4

votre ordinateur local que si vous définissez le lecteur correspondant comme unlecteur partagé et spécifiez les dossiers comme des dossiers partagés. Si le systèmed’exploitation du serveur est différent du vôtre (Windows et UNIX par exemple), vousn’aurez probablement pas accès aux fichiers de données locaux en mode d’analysedistribuée, même s’ils se trouvent dans des dossiers partagés. Les droits d’accèsrelatifs aux dossiers partagés doivent inclure la possibilité d’écrire dans les dossiers sivous souhaitez enregistrer les fichiers de données dans un dossier local.

Pour enregistrer des fichiers de données à partir d’un serveur distant

E Activez la fenêtre de l’éditeur de données.

E A partir des menus, sélectionnez :Fichier

Enregistrer (ou Enregistrer sous...)

Accès aux fichiers de données en mode d’analyse locale ou distribuée Mode :

L’affichage des fichiers de données, dossiers (répertoires) et lecteurs de votreordinateur local et du réseau dépend de l’ordinateur que vous utilisez pour traiter lescommandes et exécuter les procédures (qui ne correspond pas obligatoirement àl’ordinateur que vous avez en face de vous).

Mode d’analyse locale. Lorsque vous utilisez votre ordinateur local comme votre« serveur », l’affichage des fichiers de données, dossiers et lecteurs que vous obtenezdans la boîte de dialogue d’accès aux fichiers (permettant d’ouvrir les fichiers dedonnées) est le même que celui fourni dans d’autres applications ou dans l’ExplorateurWindows. Vous pouvez afficher tous les fichiers de données et dossiers de votreordinateur, ainsi que tous les fichiers et dossiers stockés sur les lecteurs réseau.

Mode d’analyse distribuée. Lorsque vous utilisez un autre ordinateur comme « serveurdistant » pour exécuter les commandes et procédures, l’affichage des fichiers dedonnées, dossiers et lecteurs correspond à celui obtenu du serveur distant. Bien quevous puissiez obtenir des noms de dossiers familiers tels que Program Files et deslecteurs portant la lettre C, il ne s’agit pas des dossiers et lecteurs de votre ordinateur,mais des dossiers et lecteurs du serveur distant.

Page 117: SPSS Base Users Guide 14.0

91

Mode d’analyse distribuée

Figure 4-5Affichages local et distant

En mode d’analyse distribuée, vous n’aurez accès aux fichiers de données de votreordinateur local que si vous définissez le lecteur correspondant comme un lecteurpartagé et spécifiez les dossiers contenant vos fichiers de données comme desdossiers partagés. Si le système d’exploitation du serveur est différent du vôtre(Windows et UNIX par exemple), vous n’aurez probablement pas accès aux fichiersde données locaux en mode d’analyse distribuée, même s’ils se trouvent dans desdossiers partagés.

L’utilisation du mode d’analyse distribuée n’équivaut pas à accéder aux fichiers dedonnées stockés sur un autre ordinateur de votre réseau. Vous pouvez accéder auxfichiers de données situés sur d’autres disques réseau en mode d’analyse locale ouen mode d’analyse distribuée. En mode local, vous accédez à d’autres disques à

Page 118: SPSS Base Users Guide 14.0

92

Chapitre 4

partir de votre ordinateur local. En mode distribué, vous accédez à d’autres disquesréseau depuis le serveur distant.

Pour savoir si vous utilisez le mode local ou le mode distribué, examinez la barrede titre de la boîte de dialogue permettant d’accéder aux fichiers de données. Si letitre de la boîte de dialogue contient le terme Distant (comme dans Ouvrir fichier

distant) ou que le libellé Serveur distant : [nom_de_serveur] apparaît dans la zonesupérieure de la boîte de dialogue, vous utilisez le mode d’analyse distribuée.

Remarque : Ceci ne concerne que les boîtes de dialogue permettant d’accéder auxfichiers de données (telles que Ouvrir les données, Enregistrer les données, Ouvrirla base de données et Appliquer le dictionnaire des données). Pour tous les autrestypes de fichier (tels que les fichiers Viewer, les fichiers de syntaxe et les fichiersscripts), l’affichage local est toujours utilisé.

Pour définir des droits d’accès de partage pour un lecteur ou un dossier

E Dans Poste de travail, cliquez sur le dossier (répertoire) ou le lecteur à partager.

E Depuis le menu Fichier, choisissez Propriétés.

E Cliquez sur l’onglet Partage, puis sur Nom de partage.

Pour plus d’informations sur le partage de lecteurs et de dossiers, consultez l’aidede votre système d’exploitation.

Disponibilité des procédures en Mode :

En mode d’analyse distribuée, uniquement les procédures installées à la fois sur votreversion locale et sur la version du serveur distant sont disponibles.

Si vous avez des composants optionnels installés localement qui ne sont pasdisponibles sur le serveur distant et si vous basculez de l’ordinateur local au serveurdistant, les procédures affectées seront supprimées des menus et des erreurs seproduiront dans la syntaxe de commande correspondante. Vous devrez rétablir lemode local pour restaurer toutes les procédures affectées.

Page 119: SPSS Base Users Guide 14.0

93

Mode d’analyse distribuée

Utilisation des spécifications de chemins UNC

Avec la version serveur Windows NT de SPSS, les spécifications de chemins relatifspour des fichiers de données sont relatives par rapport au serveur utilisé en moded’analyse distribuée, et non par rapport à votre ordinateur local. Une spécification dechemin telle que c:\mydocs\mydata.sav ne désigne pas un répertoire et un fichier devotre disque C, mais un répertoire et un fichier du disque dur du serveur distant. Si lerépertoire et/ou le fichier n’existent pas sur le serveur distant, une erreur se produitdans la syntaxe de commande comme dans l’exemple suivant :

GET FILE='c:\Mes_documents\Mes_données.sav'.

Avec la version serveur Windows NT de SPSS, vous pouvez utiliser des nomsde chemin UNC (Universal Naming Convention = convention de dénominationuniverselle) pour spécifier l’emplacement des fichiers de données dans vos fichiers decommande. Une spécification de chemin UNC prend généralement la forme suivante :

\\nom_serveur\nom_partage\chemin\nom_fichier

L’élément nom_serveur est le nom de l’ordinateur contenant le fichier de données.

L’élément nom_partage désigne le dossier (répertoire) de l’ordinateur définicomme dossier de partage.

L’élément chemin correspond aux sous-dossiers (sous-répertoires) du dossierpartagé.

L’élément nom_fichier est le nom du fichier de données.

Voir l’exemple comme suit :

GET FILE='\\hqdev001\public\juillet\ventes.sav'.

Si aucun nom n’a été attribué à l’ordinateur, vous pouvez utiliser son adresse IP,comme dans l’exemple suivant :

GET FILE='\\204.125.125.53\public\juillet\ventes.sav'.

Même si vous utilisez des spécifications de chemins UNC, vous ne pouvez accéderqu’aux fichiers de données installés sur des lecteurs et des dossiers partagés. Lorsquevous utilisez le mode d’analyse distribuée, les fichiers de données de votre ordinateurlocal sont inclus dans le traitement.

Page 120: SPSS Base Users Guide 14.0

94

Chapitre 4

Serveurs UNIX. Sur les plateformes UNIX, il n’existe aucun équivalent à ladénomination UNC. Pour tous les répertoires, vous devez indiquer un chemind’accès absolu, commençant à la racine du serveur. Les chemins relatifs ne sontpas admis. Par exemple, si le fichier de données se trouve dans le répertoire/bin/spss/data et que le répertoire actif est également /bin/spss/data, la commandeGET FILE='ventes.sav' n’est pas valide. Vous devez indiquer l’intégralité duchemin d’accès, à savoir :

GET FILE='/bin/spss/data/sales.sav'.

Page 121: SPSS Base Users Guide 14.0

Chapitre

5Editeur de données

L’éditeur de données fournit une méthode pratique, semblable à celle d’un tableur,permettant de créer et de modifier des fichiers de données SPSS. La fenêtre del’éditeur de données s’ouvre automatiquement lorsque vous lancez une session SPSS.

Editeur de données permet d’afficher les données de deux façons :

Affichage des données. Affiche les valeurs réelles des données ou les étiquettes devaleurs définies.

Affichage des variables. Affiche les informations de définition des variables, àsavoir les étiquettes de valeurs et de variables définies, le type des données (parexemple, chaîne, date ou valeur numérique), le niveau de mesure (nominale,ordinale ou échelle) et les valeurs utilisateur manquantes.

Dans les deux affichages, vous pouvez ajouter, modifier et supprimer les informationscontenues dans le fichier de données.

95

Page 122: SPSS Base Users Guide 14.0

96

Chapitre 5

Affichage des donnéesFigure 5-1Affichage des données

Un grand nombre des fonctions de l’Affichage des données sont similaires à cellesque proposent les tableurs. Il y a toutefois des différences importantes :

Les lignes sont des observations. Chaque ligne représente une observation. Parexemple, chaque répondant d’un questionnaire est considéré comme étant uneobservation.

Les colonnes sont des variables. Chaque colonne représente une variable ouune caractéristique étant mesurée. Par exemple, chaque élément ou élémentd’un questionnaire est une variable.

Les cellules contiennent des valeurs. Chaque cellule contient une seule valeurpour une variable et pour une observation. La cellule correspond au pointd’intersection de l’observation et de la variable. Les cellules ne contiennent quedes valeurs de données. A la différence des tableurs, les cellules de l’éditeur dedonnées ne peuvent pas contenir de formules.

Le fichier de données est rectangulaire. La taille du fichier de données estdéterminée par le nombre d’observations et de variables. Vous pouvez entrerdes données dans n’importe quelle cellule. Si vous entrez des données dansune cellule en dehors des limites du fichier de données défini, SPSS agrandit lerectangle des données pour inclure toutes les lignes et/ou colonnes nécessairesentre cette cellule et les limites du fichier. Il n’y a pas de cellule « vide » à

Page 123: SPSS Base Users Guide 14.0

97

Editeur de données

l’intérieur des limites du fichier de données. En ce qui concerne les variablesnumériques, les cellules à blanc sont converties en valeurs manquantes pardéfaut. En ce qui concerne les variables chaîne, un blanc est considéré commeune valeur valide.

Affichage des variablesFigure 5-2Affichage des variables

L’Affichage des variables présente les descriptions des attributs de chaque variabledu fichier de données. Dans l’Affichage des variables :

Les lignes sont des variables.

Les colonnes sont des attributs de variable.

Vous pouvez ajouter ou supprimer des variables et modifier les attributs de cesdernières, y compris les attributs suivants :

Le nom de la variable

Le type de données

Page 124: SPSS Base Users Guide 14.0

98

Chapitre 5

Le nombre de chiffres ou de caractères

Le nombre de décimales

Les étiquettes descriptives de variables et de valeurs.

Les valeurs manquantes définies par l’utilisateur

La largeur des colonnes

Le niveau de mesure

Tous ces attributs sont enregistrés lorsque vous sauvegardez le fichier de données.

Vous pouvez définir les propriétés des variables dans l’Affichage des variables, maisvous disposez également de deux autres méthodes pour ce faire :

L’assistant Copier des propriétés de données permet d’utiliser un fichier dedonnées SPSS externe ou un autre ensemble de données disponible dans lasession en cours comme modèle pour définir les propriétés de fichier et devariable dans l’ensemble de données actif. Vous pouvez également utiliser desvariables de l’ensemble de données actif comme modèle pour d’autres variablesde l’ensemble de données actif. L’option Copier des propriétés de données estdisponible dans le menu Données de la fenêtre de l’éditeur de données.

L’option Définir les propriétés de variable (également disponible dans le menuDonnées de la fenêtre de l’éditeur de données) permet d’analyser vos donnéeset de répertorier toutes les valeurs de données uniques pour les variablessélectionnées et d’identifier les valeurs non étiquetées, et fournit une fonctiond’étiquetage automatique. Cette méthode est particulièrement utile pour lesvariables qualitatives qui utilisent des codes numériques pour représenter lesmodalités. Par exemple, 0 = Masculin, 1 = Féminin.

Pour afficher ou définir des attributs de variable

E Activez la fenêtre de l’éditeur de données.

E Double-cliquez sur un nom de variable dans la zone supérieure de la colonne del’affichage de données ou cliquez sur l’onglet Affichage des variables.

E Pour définir de nouvelles variables, entrez un nom de variable dans une ligne vierge.

E Sélectionnez les attributs à définir ou modifier.

Page 125: SPSS Base Users Guide 14.0

99

Editeur de données

Noms de variable

Les règles suivantes s’appliquent pour les noms des variables :

Le nom doit commencer par une lettre. Les autres caractères peuvent êtren’importe quelle lettre, n’importe quel chiffre, un point, ou les symboles @,#, _ ou $.

Les noms de variable ne peuvent pas se terminer par un point.

Les noms de variable se terminant par un trait de soulignement sont à éviter(pour éviter des conflits avec les variables créées automatiquement par certainesprocédures).

La longueur du nom ne doit pas excéder 64 octets. 64 octets correspondent à64 caractères dans les langues sur un octet (anglais, français, allemand, espagnol,italien, hébreu, russe, grec, arabe et thaï par exemple) et à 32 caractères dans leslangues sur deux octets (japonais, chinois et coréen par exemple).

Les espaces et les caractères spéciaux ne peuvent pas être utilisés (par exemple,!, ?, ‘, et *).

Chaque nom de variable doit être unique ; aucune duplication n’est admise.

Les mots-clés réservés ne peuvent pas être utilisés pour les noms de variables :Les mots-clés réservés sont les suivants : ALL, AND, BY, EQ, GE, GT, LE, LT,NE, NOT, OR, TO, WITH.

Les noms de variables peuvent être définis par n’importe quelle combinaison demajuscules et de minuscules. La casse est respectée pour des raisons d’affichage.

Lorsque des noms longs de variable occupent plusieurs lignes au niveaudu résultat, SPSS essaie d’insérer les sauts de ligne au niveau des traits desoulignement, des virgules et des passages de minuscule à majuscule.

Niveau de mesure des variables

Vous pouvez spécifier un niveau de mesure d’échelle (données numériques sur unintervalle ou une échelle de rapport), ordinal ou nominal Les données nominales etordinales peuvent être des chaînes de caractères (alphanumériques) ou numériques.

Nominales. Une variable peut être traitée comme étant nominale si ses valeursreprésentent des modalités sans classement intrinsèque (par exemple, le servicede la société dans lequel travaille un employé). La région, le code postal oul'appartenance religieuse sont des exemples de variable nominale.

Page 126: SPSS Base Users Guide 14.0

100

Chapitre 5

Ordinales. Une variable peut être traitée comme étant ordinale si ses valeursreprésentent des modalités associées à un classement intrinsèque (par exemple,des niveaux de satisfaction allant de Très mécontent à Très satisfait). Exemplesde variable ordinale : des scores d'attitude représentant le degré de satisfaction oude confiance, et des scores de classement des préférences.

Echelle.. Une variable peut être traitée comme étant une variable d'échelle si sesvaleurs représentent des modalités classées avec une mesure significative, de sorteque les comparaisons de distance entre les valeurs soient adéquates. L'âge enannées et le revenu en milliers de dollars sont des exemples de variable d'échelle.

Remarque : Pour les variables chaîne ordinales, l’ordre alphabétique des valeurschaîne est supposé refléter l’ordre des modalités. Par exemple, pour une variablechaîne comportant des valeurs Faible, Moyen, Elevé, l’ordre des modalités estinterprété comme Elevé, Faible ou Moyen, ce qui ne correspond pas à l’ordre correct.En règle générale, il est recommandé d’utiliser les codes numériques pour représenterles données ordinales.

Pour les nouvelles variables créées lors d’une session, les données lues à partir deformats de fichier externes et les fichiers de données SPSS créés précédemmentà la version 8, l’attribution par défaut de niveaux de mesure est basée sur les règlessuivantes :

Les variables numériques ayant moins de 24 valeurs uniques et les variableschaîne sont définies comme variables nominales.

Les variables numériques ayant 24 valeurs uniques ou plus sont définies commevariables d’échelle.

Vous pouvez changer la valeur d’inclusion d’échelle/nominale pour des variablesnumériques dans la boîte de dialogue Options. Pour plus d'informations, reportez-vousà « Options diagrammes interactifs » dans Chapitre 44 à p. 672.

La boîte de dialogue Définir les propriétés de la variable, disponible à partir dumenu Données, peut vous aider à attribuer le niveau de mesure adéquat. Pour plusd'informations, reportez-vous à « Affectation du niveau de mesure » dans Chapitre 7à p. 129.

Page 127: SPSS Base Users Guide 14.0

101

Editeur de données

Type de variable

L’option Type de variable permet de définir le type de données pour chaque variable.Par défaut, toute nouvelle variable est numérique. Vous pouvez utiliser l’option Typede variable pour changer le type des données. Le contenu de la boîte de dialogue Typede variable dépend du type de données sélectionné. Pour certains types de données,il y a des zones de texte où sont indiqués la longueur et le nombre de décimales.Pour d’autres types de données, il vous suffit de sélectionner un format dans uneliste déroulante contenant des exemples.

Figure 5-3Boîte de dialogue Type de variable

Les types de données disponibles sont les suivants :

Numérique. Variable dont les valeurs sont des nombres. Les valeurs sont affichées enformat numérique standard. L’éditeur de données accepte les valeurs numériques auformat standard ou sous forme de notation scientifique.

Virgule. Variable numérique dont les valeurs sont affichées avec des virgules toutesles trois positions, le point servant de séparateur décimal. L’outil Editeur de donnéesaccepte les valeurs numériques pour les variables de virgule avec ou sans virgule ousous forme de notation scientifique. Les valeurs ne peuvent pas contenir de virgule àdroite de l’indicateur décimal.

Point. Variable numérique dont les valeurs sont affichées avec des points toutes lestrois positions, la virgule servant de séparateur décimal. L’outil Editeur de donnéesaccepte les valeurs numériques pour les variables de point avec ou sans point ousous forme de notation scientifique. Les valeurs ne peuvent pas contenir de point àdroite de l’indicateur décimal.

Page 128: SPSS Base Users Guide 14.0

102

Chapitre 5

Notation scientifique. Variable numérique dont les valeurs sont affichées avec un Eintégré et un exposant de puissance dix avec signe. L’éditeur de données accepte desvaleurs numériques pour les variables de notation scientifique avec ou sans exposant.L’exposant peut être précédé d’un E ou d’un D avec ou sans signe, ou seulement d’unsigne. Par exemple, 123, 1.23E2, 1.23D2, 1.23E+2 et même 1.23+2.

Date. Variable numérique dont les valeurs sont affichées dans l’un des formats de dateou d’heure possibles. Sélectionnez un format dans la liste. Vous pouvez entrer desdates avec, comme séparateur, des barres obliques, des traits d’union, des points, desvirgules ou des espaces. La valeur du siècle pour les années à 2 chiffres est déterminéepar les paramètres Options (accessibles depuis le menu Edition, sélectionnez Options,puis cliquez sur l’onglet Données).

Dollar. Variable numérique affichée avec le signe dollar ($), avec des virgules toutesles trois positions, le point servant de séparateur décimal. Vous pouvez entrer desvaleurs de données avec ou sans le signe dollar.

Symbole monétaire. Variable numérique dont les valeurs sont affichées dans l’un desformats monétaires personnalisés que vous avez définis dans l’onglet Devise de laboîte de dialogue Options. Les caractères de symbole monétaire définis ne sont pasutilisables lors de la saisie de données mais sont affichés dans l’éditeur de données.

Chaîne. Variable dont les valeurs ne sont pas numériques et ne sont donc pas utiliséespour les calculs. Ces valeurs peuvent contenir n’importe quel caractère, dans la limitede la longueur définie. Les majuscules et les minuscules sont différenciées. Ce typede variable est aussi connu sous le nom de variable alphanumérique.

Pour définir le type de variable

E Cliquez sur le bouton de la cellule Type de la variable à définir.

E Sélectionnez le type de données dans la boîte de dialogue Type de variable.

E Cliquez sur OK.

Page 129: SPSS Base Users Guide 14.0

103

Editeur de données

Formats d’entrée/d’affichage

Selon le format, les valeurs affichées dans l’Affichage des données peuvent différerdes valeurs réelles entrées et enregistrées en interne. Voici quelques règles générales :

Pour les formats Numérique, Virgule et Point, vous pouvez entrer des valeursavec n’importe quel nombre de positions décimales (maximum 16), et la valeurentière est enregistrée. L’Affichage des données n’affiche que le nombre dedécimales défini et arrondit les valeurs comportant plus de décimales. Toutefois,la valeur complète est utilisée dans tous les calculs.

Pour les variables chaîne, toutes les valeurs sont cadrées à droite au maximum dela longueur. Pour une variable chaîne dont la largeur maximum est de trois, unevaleur Non est enregistrée comme 'Non ' et n’est pas équivalente à ' Non'.

Pour les formats de dates, vous pouvez utiliser des barres obliques, des tirets, desespaces, des virgules ou des points comme séparateurs entre les jours, les moiset les années. Pour les mois, vous pouvez entrer des nombres, des abréviationsà trois lettres ou le nom des mois en clair. Les dates de format général sous laforme jj-mmm-aa sont affichées avec des tirets servant de séparateurs et desabréviations à trois lettres pour le mois. Les dates de format général sous la formejj/mm/aa et mm/jj/aa sont affichées avec des barres obliques comme séparateurset des nombres pour le mois. De manière interne, les dates sont enregistréessous la forme d’un nombre de secondes à partir du 14 octobre 1582. La plagede siècles pour les dates avec des années à deux chiffres est déterminée à partirdes paramètres Options (dans le menu Edition, sélectionnez Options, puis cliquezsur l’onglet Données).

Pour les formats de temps, vous pouvez utiliser les deux points, des points oudes espaces comme séparateurs entre les heures, les minutes et les secondes.Les temps sont affichés avec des deux points comme séparateurs. De façoninterne, les temps sont enregistrés comme étant le nombre de secondes depuis le14 octobre 1582.

Etiquettes des variables

Vous pouvez attribuer des étiquettes de variables descriptives dont le nombre decaractères ne dépasse pas 256 (128 caractères pour les langages sur deux octets). Lesétiquettes de variable peuvent contenir des espaces et des caractères réservés qui nesont pas autorisés dans les noms de variable.

Page 130: SPSS Base Users Guide 14.0

104

Chapitre 5

Pour spécifier des étiquettes de variable

E Activez la fenêtre de l’éditeur de données.

E Double-cliquez sur un nom de variable dans la zone supérieure de la colonne del’affichage de données ou cliquez sur l’onglet Affichage des variables.

E Entrez l’étiquette de variable descriptive dans la cellule Etiquette de la variable.

Etiquettes de valeurs

Vous pouvez affecter des étiquettes descriptives de valeur pour chaque valeur d’unevariable. Ce processus se révèle particulièrement utile si votre fichier de donnéesutilise des codes numériques pour représenter des modalités non numériques (parexemple, les codes 1 et 2 pour homme et femme).

Les étiquettes de valeurs peuvent s’élever jusqu’à 120 octets.

Les étiquettes de valeurs ne sont pas disponibles pour les variables chaîne longues(variables chaîne de plus de 8 caractères).

Figure 5-4Boîte de dialogue Etiquettes de valeurs

Pour spécifier des étiquettes de valeur

E Cliquez sur le bouton de la cellule Valeurs de la variable à définir.

Page 131: SPSS Base Users Guide 14.0

105

Editeur de données

E Pour chaque valeur, entrez la valeur et une étiquette.

E Cliquez sur Ajouter pour entrer l’étiquette de valeur.

E Cliquez sur OK.

Insertion de sauts de ligne dans les étiquettes

Les étiquettes de variables ou de valeurs ont un retour à la ligne automatique dansles tableaux pivotants et les diagrammes si la cellule ou la zone n’est pas assez largepour afficher l’étiquette sur une seule ligne ; vous pouvez également modifier lesrésultats pour insérer des sauts de ligne manuellement si vous voulez que le sautde ligne se fasse ailleurs. Vous pouvez aussi créer des étiquettes de variable ou devaleur qui effectueront toujours un retour à la ligne en des points définis et quicomporteront plusieurs lignes.

E Pour les étiquettes de variable, sélectionnez la cellule Etiquette de la variable dansla zone Affichage des variables de Editeur de données.

E Pour les étiquettes de valeur, sélectionnez la cellule Valeurs de la variable dans la zoneAffichage des variables de Editeur de données, cliquez sur le bouton qui apparaît dansla cellule, puis sélectionnez l’étiquette que vous souhaitez modifier dans la boîte dedialogue Etiquettes de valeurs.

E Dans l’étiquette, saisissez \n à l’endroit où vous voulez insérer un retour à la ligne.

Le \n ne s’affiche pas dans les tableaux pivotants ou les diagrammes ; il est reconnucomme un caractère de saut de ligne.

Valeurs manquantes

L’option Valeurs manquantes permet de définir les valeurs de données spécifiéescomme valeurs manquantes spécifiées par l’utilisateur. Par exemple, vous pouvezfaire la distinction entre les données manquantes parce qu’une personne interrogée arefusé de répondre et les données manquantes parce que la question ne s’appliquaitpas au répondant. Les valeurs des données définies comme valeurs utilisateurmanquantes sont repérées par un indicateur en vue d’un traitement spécial et sontexclues de la plupart des calculs.

Page 132: SPSS Base Users Guide 14.0

106

Chapitre 5

Figure 5-5Boîte de dialogue Valeurs manquantes

Vous pouvez entrer jusqu’à trois valeurs manquantes de votre choix, un intervallede valeurs manquantes ou un intervalle plus une valeur de votre choix.

Les intervalles ne peuvent être spécifiés que pour des valeurs numériques.

Vous ne pouvez pas définir de valeur manquante pour des variables chaînelongues (variables chaîne de plus de 8 caractères).

Valeurs manquantes pour des variables de chaîne. Toutes les valeurs de chaîne, ycompris les valeurs nulles ou vides, sont considérées comme des valeurs valides àmoins que vous ne les définissiez comme manquantes. Pour définir des valeurs nullesou vides comme manquantes pour une variable chaîne, entrez un seul espace dansl’un des champs sous la sélection Valeurs manquantes discrètes.

Pour définir les valeurs manquantes

E Cliquez sur le bouton de la cellule Manquante de la variable à définir.

E Entrez les valeurs ou l’intervalle de valeurs représentant les valeurs manquantes.

Toutes les valeurs de chaîne, y compris les valeurs nulles ou vides, sont considéréescomme des valeurs valides à moins que vous ne les définissiez comme manquantes.Pour définir des valeurs nulles ou vides comme manquantes pour une variable chaîne,entrez un seul espace dans l’un des champs sous la sélection Valeurs manquantes

discrètes.

Page 133: SPSS Base Users Guide 14.0

107

Editeur de données

Largeur des colonnes

Vous pouvez spécifier le nombre de caractères définissant la largeur des colonnes.Vous pouvez également modifier la largeur des colonnes dans l’affichage Données encliquant et en tirant les bords des colonnes.

Les formats de colonnes affectent seulement l’affichage des valeurs dans l’éditeurde données. Modifier la largeur de la colonne ne change pas la largeur définie d’unevariable. Si la largeur réelle et la largeur définie d’une valeur sont plus larges que lacolonne, des astérisques (*) apparaissent dans l’affichage Données.

Alignement de variable

L’alignement contrôle l’affichage des valeurs des données et/ou des étiquettes devaleur dans l’affichage Données. L’alignement par défaut est « droite » pour lesvariables numériques et « gauche » pour les variables chaîne. Ce paramètre n’affecteque l’affichage de l’affichage Données.

Application d’attributs de définition de variable à plusieurs variables

Lorsque vous avez défini les attributs de définition d’une variable, vous pouvez copierdes attributs et les appliquer à une ou à plusieurs variables.

L’application d’attributs de définition de variable s’effectue au moyen des opérationsCopier et Coller de base. Vous pouvez:

Copier un seul attribut (par exemple, les étiquettes de valeurs) et le coller dans laou les mêmes cellules d’attribut d’une ou de plusieurs variables.

Copier tous les attributs d’une variable et les coller dans d’autres variables.

Créer plusieurs variables avec tous les attributs de la copie d’une variable.

Application d’attributs de définition de variable à d’autres variables

Pour appliquer certains attributs d’une variable définie, procédez comme suit.

E Dans l’Affichage des variables, sélectionnez la cellule d’attribut à appliquer à d’autresvariables.

Page 134: SPSS Base Users Guide 14.0

108

Chapitre 5

E A partir des menus, sélectionnez :Edition

Copier

E Sélectionnez la ou les cellules d’attribut auxquelles vous souhaitez appliquer l’attribut.(Vous pouvez sélectionner plusieurs variables cible.)

E A partir des menus, sélectionnez :Edition

Coller

Si vous collez l’attribut dans des lignes vides, de nouvelles variables sont créées avecdes valeurs d’attributs par défaut pour tous les attributs, à l’exception de celui quevous avez sélectionné.

Pour appliquer tous les attributs d’une variable définie, procédez comme suit.

E Dans l’Affichage des variables, sélectionnez le numéro de ligne de la variableprésentant les attributs à utiliser. (La totalité de la ligne est mise en surbrillance.)

E A partir des menus, sélectionnez :Edition

Copier

E Sélectionnez le numéro de ligne de la variable à laquelle vous souhaitez appliquer lesattributs. (Vous pouvez sélectionner plusieurs variables cible.)

E A partir des menus, sélectionnez :Edition

Coller

Création de plusieurs nouvelles variables avec les mêmes attributs

E Dans l’Affichage des variables, cliquez sur le numéro de ligne de la variableprésentant les attributs à utiliser pour la nouvelle variable. (La totalité de la ligneest mise en surbrillance.)

E A partir des menus, sélectionnez :Edition

Copier

E Cliquez sur le numéro de la ligne vide qui se trouve sous la dernière variable définiedans le fichier de données.

Page 135: SPSS Base Users Guide 14.0

109

Editeur de données

E A partir des menus, sélectionnez :Edition

Coller les variables...

E Dans la boîte de dialogue Coller les variables, entrez le nombre de variables à créer.

E Entrez un préfixe et un numéro de départ pour les nouvelles variables.

E Cliquez sur OK.

Les noms des nouvelles variables seront composés du préfixe spécifié et d’un numéroséquentiel commençant par le numéro spécifié.

Saisie de données

Dans l’affichage des données, vous pouvez entrer les données directement dansEditeur de données. Vous pouvez entrer des données dans n’importe quel ordre.Vous pouvez entrer des données par observation ou par variable, pour des zonessélectionnées ou des cellules individuelles.

La cellule active est mise en surbrillance.

Le nom de variable et le numéro de ligne de la cellule active sont affichés dans lecoin supérieur gauche de l’éditeur de données.

Lorsque vous sélectionnez une cellule et lorsque vous entrez une valeur dedonnées, la valeur est affichée dans l’éditeur de cellules en haut de l’éditeurde données.

Les valeurs de données ne sont pas enregistrées tant que vous n’avez pas appuyésur Entrée ou que vous n’avez pas sélectionné une autre cellule.

Pour entrer autre chose que des données numériques simples, vous devez d’aborddéfinir le type de variable.

Si vous entrez une valeur dans une colonne vide, l’éditeur de données créeautomatiquement une nouvelle variable et affecte un nom de variable.

Page 136: SPSS Base Users Guide 14.0

110

Chapitre 5

Figure 5-6Ensemble de données actif dans l’Affichage de données

Pour entrer des données numériques

E Sélectionnez une cellule dans l’affichage Données.

E Entrez la valeur des données. (La valeur est affichée dans l’éditeur de cellules dans lapartie supérieure de Editeur de données.)

E Appuyez sur Entrée ou sélectionnez une autre cellule pour enregistrer la valeur.

Pour entrer des données non numériques

E Double-cliquez sur un nom de variable dans la zone supérieure de la colonne del’affichage de données ou cliquez sur l’onglet Affichage des variables.

E Cliquez sur le bouton de la cellule Type de la variable.

E Sélectionnez le type de données dans la boîte de dialogue Type de variable.

E Cliquez sur OK.

E Double-cliquez sur le numéro de ligne ou cliquez sur l’onglet Affichage des données.

E Pour la variable que vous venez de définir, entrez les données dans la colonne.

Page 137: SPSS Base Users Guide 14.0

111

Editeur de données

Pour utiliser des étiquettes de valeur pour l’entrée de données

E Si les étiquettes de valeurs n’apparaissent pas dans l’Affichage des données,choisissez dans les menus :Affichage

Etiquettes de valeurs

E Cliquez sur la cellule dans laquelle vous souhaitez entrer la valeur.

E Sélectionnez une étiquette de valeur dans la liste déroulante.

La valeur est saisie et l’étiquette de valeur est affichée dans la cellule.

Remarque : Ce processus ne fonctionne que si vous avez défini des étiquettes devaleurs pour la variable.

Restrictions concernant la valeur de données dans l’éditeur de données

Le type et la largeur définis de la variable déterminent le type de valeur que vouspouvez entrer dans la cellule de l’affichage Données.

Si vous tapez un caractère qui n’est pas autorisé par le type défini de la variable,l’outil Editeur de données émet un signal sonore et n’accepte pas le caractère.

Pour les variables chaîne, les caractères dépassant la largeur définie ne sont pasautorisés.

Pour les variables numériques, des nombres entiers dépassant la valeur définiepeuvent être entrés mais l’éditeur de données affichera dans la cellule unenotation scientifique ou des astérisques pour indiquer que la valeur dépasse lalargeur définie. Pour afficher la valeur dans la cellule, changez la largeur définiede la variable. (Remarque : changer la largeur de la colonne n’affecte pas lalargeur de la variable).

Modification de donnéesAvec Editeur de données, vous pouvez modifier les valeurs des données dansl’Affichage des données de plusieurs manières. Vous pouvez:

Changer les valeurs des données.

Couper, copier et coller des valeurs de données.

Ajouter et supprimer des observations.

Page 138: SPSS Base Users Guide 14.0

112

Chapitre 5

Ajouter et supprimer des variables.

Changer l’ordre des variables.

Pour remplacer ou modifier les valeurs de données

Pour supprimer l’ancienne valeur et pour entrer une nouvelle valeur :

E Dans l’affichage Données, double-cliquez sur la cellule. (La valeur de la celluleest affichée dans l’éditeur de cellules.)

E Modifiez la valeur directement dans la cellule ou dans l’éditeur de cellules.

E Appuyez sur Entrée (ou déplacez-vous sur une autre cellule) pour enregistrer lanouvelle valeur.

Couper, copier et coller des valeurs de données

Vous pouvez couper, copier et coller des valeurs individuelles de cellules ou desgroupes de valeurs dans l’éditeur de données. Vous pouvez:

Déplacer ou copier la valeur d’une seule cellule dans une autre cellule.

Déplacer ou copier la valeur d’une seule cellule dans un groupe de cellules.

Déplacer ou copier les valeurs d’une seule observation (ligne) dans plusieursobservations.

Déplacer ou copier les valeurs d’une seule variable (colonne) dans plusieursvariables.

Déplacer ou copier un groupe de valeurs de cellule dans un autre groupe decellules.

Conversion de données de valeurs collées dans l’éditeur de données

Si les types définis de variables des cellules source et cible ne sont pas les mêmes,SPSS essaye de convertir la valeur. Si aucune conversion n’est possible, la valeurmanquante par défaut est insérée dans la cellule cible.

Conversion des formats numérique ou date en chaînes de caractères. Les formatsnumériques (par exemple, Numérique, Dollar, Point ou Virgule) et les formats de datesont convertis en caractères s’ils sont collés dans une cellule de variables chaîne. La

Page 139: SPSS Base Users Guide 14.0

113

Editeur de données

valeur d’une chaîne est la valeur numérique telle qu’elle est affichée dans la cellule.Par exemple, pour une variable dont le format est exprimé en dollars, le signe Dollarqui est affiché devient partie intégrante de la valeur de caractères. Les valeurs quiexcèdent la largeur définie de la variable chaîne sont tronquées.

Conversion de chaînes de caractères en formats numérique ou date. Les valeurs dechaînes qui contiennent des caractères acceptables pour le format numérique ou dedate de la cellule cible sont converties dans la valeur équivalente numérique ou dedate. Par exemple, une valeur de caractères de 25/12/91 est convertie en date valide sile type de format de la cellule cible est un des formats jour-mois-année, mais elle estconvertie en valeur manquante par défaut si le type de format de la cellule cible estde type mois-jour-année.

Conversion du format date en format numérique. Les valeurs de dates et de temps sontconverties en un nombre de secondes si la cellule cible est d’un format numérique(par exemple, Numérique, Dollar, Point ou Virgule). Etant donné que les dates sontenregistrées en interne comme le nombre de secondes depuis le 14 octobre 1582, lefait de convertir des dates en valeurs numériques peut résulter en des nombres trèsimportants. Par exemple, la date du 10/29/91 a une valeur de conversion numériquede 12.908.073.600.

Conversion du format numérique en formats date ou heure. Les valeurs numériques sontconverties en dates ou temps si la valeur représente un nombre de secondes pouvantproduire une date ou un temps valides. En ce qui concerne les dates, les valeursnumériques inférieures à 86 400 sont converties dans la valeur manquante par défaut.

Insérer de nouvelles observations

Le fait d’entrer des données dans une cellule sur une ligne blanche créeautomatiquement une nouvelle observation. Editeur de données insère la valeurmanquante par défaut pour toutes les autres variables de cette observation. S’il y aquelques lignes blanches entre la nouvelle observation et les observations existantes,les lignes blanches deviennent également des nouvelles observations avec des valeursmanquantes par défaut pour toutes les variables. Vous pouvez également insérer denouvelles observations entre des observations existantes

Page 140: SPSS Base Users Guide 14.0

114

Chapitre 5

Pour insérer de nouvelles observations entre des observations existantes

E Dans l’Affichage des données, sélectionnez n’importe quelle cellule pourl’observation (ligne) située sous la position où vous souhaitez insérer la nouvelleobservation.

E A partir des menus, sélectionnez :Edition

Insérer les observations

Une nouvelle ligne est insérée pour cette observation et toutes les variables reçoiventla valeur manquante par défaut.

Insérer de nouvelles variables

La saisie de données dans une colonne vide de l’Affichage des données ou dans uneligne vide de l’Affichage des variables crée automatiquement une nouvelle variableportant un nom par défaut (préfixe var et numéro séquentiel) et un type de format dedonnées par défaut (numérique). L’éditeur de données insère la valeur manquante pardéfaut pour toutes les observations concernées par la nouvelle variable. S’il existe descolonnes vides dans l’Affichage des données ou des lignes vides dans l’Affichagedes variables entre la nouvelle variable et les variables existantes, ces colonnes oulignes deviennent également de nouvelles variables avec une valeur manquante pardéfaut pour toutes les observations. Vous pouvez également insérer des nouvellesvariables entre les variables existantes.

Pour insérer de nouvelles variables entre des variables existantes

E Sélectionnez n’importe quelle cellule de la variable située à droite de (pourl’Affichage des données) ou au-dessous (pour l’Affichage des variables) de l’endroitoù vous souhaitez insérer la nouvelle variable.

E A partir des menus, sélectionnez :Edition

Insérer une variable

Une nouvelle variable est insérée avec la valeur manquante par défaut pour toutes lesobservations.

Page 141: SPSS Base Users Guide 14.0

115

Editeur de données

Pour déplacer des variables

E Pour sélectionner la variable, cliquez sur son nom dans l’Affichage des données ousur son numéro de ligne dans l’Affichage des variables.

E Faites glisser la variable jusqu’à son nouvel emplacement.

E Pour positionner la variable entre deux variables existantes : Dans l’Affichage desdonnées, déplacez la variable sur la colonne de la variable à droite de laquelle voussouhaitez la positionner ou déplacez la variable sur la ligne de la variable sous laquellevous souhaitez la positionner dans l’Affichage des variables.

Pour modifier le type de données

Vous pouvez changer le type de données d’une variable à tout moment en utilisant laboîte de dialogue Type de variable dans l’Affichage des variables. L’outil Editeur dedonnées essaiera de convertir les valeurs existantes dans le nouveau type. Si aucuneconversion n’est possible, la valeur manquante par défaut est affectée. Les règlesde conversion sont les mêmes que celles pour coller des valeurs de données à unevariable de type de format différent. Si le changement du format des données peutavoir pour conséquence la perte des spécifications de la valeur manquante par défautou d’étiquettes de valeurs, l’outil Editeur de données affiche une boîte d’alerte et vousdemande si vous voulez poursuivre le changement ou si vous désirez l’annuler.

Aller à l’observation

‎La boîte de dialogue Aller à l’observation vous permet d’aller au numérod’observation (ligne) spécifié dans Editeur de données.

Figure 5-7Boîte de dialogue Aller à l’observation

Page 142: SPSS Base Users Guide 14.0

116

Chapitre 5

Pour rechercher une observation dans l’éditeur de données

E Activez la fenêtre de l’éditeur de données.

E A partir des menus, sélectionnez :Données

Aller à l’observation

E Dans la boîte de dialogue Aller à l’observation, entrez le numéro de ligne del’observation de Editeur de données.

Etat de la sélection de l’observation dans l’éditeur de données

Si vous avez sélectionné un sous-ensemble d’observations mais n’avez pas écarté lesobservations non sélectionnées, celles-ci sont identifiées dans Editeur de données parune barre oblique dans le numéro de ligne.

Figure 5-8Observations filtrées dans l’éditeur de données

Page 143: SPSS Base Users Guide 14.0

117

Editeur de données

Options d’affichage de l’éditeur de donnéesLe menu Affichage propose plusieurs options d’affichage pour l’éditeur de données :

Polices. Contrôle les caractéristiques de la police pour l’affichage des données.

Quadrillage. Permet de basculer l’affichage du quadrillage.

Etiquette de valeur. Permet de basculer entre l’affichage des valeurs de donnéesactuelles et l’affichage des étiquettes de valeurs descriptives définies par l’utilisateur.Cette option n’est disponible que dans l’Affichage des données.

Utilisation des affichages multiples

Dans l’Affichage des données, vous pouvez créer plusieurs affichages (panneaux) enutilisant les séparations situées au-dessus de la barre de défilement horizontale et àdroite de la barre de défilement verticale.

Figure 5-9Séparations du panneau Affichage des données

Vous pouvez également utiliser le menu de la fenêtre pour insérer et supprimer desséparations de panneaux. Pour insérer des séparations :

E Dans l’Affichage de données, à partir des menus, sélectionnez :Fenêtre

Séparée

Les séparations sont insérées au-dessus et à gauche de la cellule sélectionnée.

Page 144: SPSS Base Users Guide 14.0

118

Chapitre 5

Si la cellule supérieure gauche est sélectionnée, les séparations sont insérées pourdiviser l’affichage actuel en deux parties, verticalement et horizontalement.

Si une cellule autre que la cellule supérieure de la première colonne estsélectionnée, une séparation horizontale du panneau est insérée au-dessus dela cellule sélectionnée.

Si une cellule autre que la première cellule de la ligne supérieure est sélectionnée,une séparation verticale du panneau est insérée à gauche de la cellule sélectionnée.

Impression de l’éditeur de données

Un fichier de données s’imprime tel qu’il apparaît à l’écran.

Les informations de l’affichage en cours sont imprimées. Dans l’Affichage desdonnées, les données sont imprimées. Dans l’Affichage des variables, ce sont lesinformations de définition des données qui sont imprimées.

Le quadrillage n’est imprimé que s’il apparaît dans l’affichage sélectionné.

Les étiquettes de valeurs sont imprimées si elles apparaissent dans l’Affichagedes données. Dans le cas contraire, ce sont les valeurs de données réelles quisont imprimées.

Utilisez le menu Affichage dans la fenêtre de l’éditeur de données pour afficher oumasquer le quadrillage et pour activer/désactiver l’affichage des valeurs de données etdes étiquettes de valeurs.

Pour imprimer le contenu de Editeur de données

E Activez la fenêtre de l’éditeur de données.

E Cliquez sur l’onglet correspondant à l’affichage que vous souhaitez imprimer.

E A partir des menus, sélectionnez :Fichier

Imprimer

Page 145: SPSS Base Users Guide 14.0

Chapitre

6Utilisation des sources dedonnées multiples

Avec SPSS 14.0, SPSS peut avoir plusieurs sources de données ouvertes en mêmetemps, ce qui permet de facilement :

Basculer entre les sources de données.

Comparer les contenus des différentes sources de données.

Copier et coller les données entre les sources de données.

Créer de multiples sous-ensembles d’observations et/ou de variables pour analyse.

Fusionner plusieurs sources de données à partir de différents formats de données(par exemple des feuilles de calcul, des bases de données ou des données texte)sans avoir à enregistrer préalablement chaque source de données au format SPSS.

119

Page 146: SPSS Base Users Guide 14.0

120

Chapitre 6

Manipulation de base de plusieurs sources de donnéesFigure 6-1Deux sources de données s’ouvrent en même temps

Chaque source de données que vous ouvrez est affichée dans une nouvelle fenêtrede Data Editor.

Toute source de données ouverte au préalable le reste pour utilisation ultérieure.

Lorsque vous ouvrez d’abord une source de données, elle devientautomatiquement l’ensemble de données actif.

Vous pouvez modifier l’ensemble de données actif en cliquant simplementn’importe où dans la fenêtre Data Editor de la source de données que voussouhaitez utiliser ou en sélectionnant la fenêtre Data Editor pour cette sourcede données à partir du menu Fenêtre.

Page 147: SPSS Base Users Guide 14.0

121

Utilisation des sources de données multiples

Seules les variables de l’ensemble de données actif sont disponibles pour analyse.

Figure 6-2Liste de variables contenant les variables dans l’ensemble de données actif

Vous ne pouvez pas modifier l’ensemble de données actif lorsque une boîte dedialogue ayant accès aux données est ouverte (y compris toutes les boîtes dedialogue qui affichent des listes de variables).

Au moins une fenêtre Data Editor doit être ouverte lors d’une session. Lorsquevous fermez la dernière fenêtre Data Editor, SPSS se ferme automatiquement,vous invitant au préalable à enregistrer vos modifications.

Remarque : Si vous utilisez la syntaxe de commande pour ouvrir les sources dedonnées (par exemple GET FILE ou GET DATA), vous devez explicitement nommerchaque ensemble de données afin d’avoir plus d’une source de données ouvertesimultanément.

Page 148: SPSS Base Users Guide 14.0

122

Chapitre 6

Copie et collage d’informations entre les ensembles dedonnées

Vous pouvez copier à la fois des données et des attributs de définition de variable d’unensemble de données à un autre de la même façon que vous copiez et collez desinformations au sein d’un fichier de données unique.

Le fait de copier et coller des cellules de données sélectionnées dans Affichagedes données ne colle que les valeurs des données, sans les attributs de définitionde variable.

Le fait de copier et coller une variable entière dans Affichage des données ensélectionnant le nom de la variable en haut de la colonne colle toutes les donnéeset tous les attributs de définition de variable pour cette variable.

Le fait de copier et coller des attributs de définition de variable ou des variablesentières dans Affichage des variables colle les attributs sélectionnés (ou ladéfinition de la variable entière) mais ne colle pas les valeurs des données.

Attribution d’un nouveau nom aux ensembles de données

Lorsque vous ouvrez une source de données via les menus et les boîtes de dialogue,un nom d’ensemble de données DataSetn est automatiquement attribuer à chaquesource de données ; n est une valeur entière séquentielle . Lorsque vous ouvrez unesource de données via la syntaxe de commande, aucun nom d’ensemble de donnéesn’est attribué à moins que vous en spécifiez un avec DATASET NAME. Pour fournirdes noms d’ensembles de données plus descriptifs :

E Depuis les menus de la fenêtre Data Editor pour l’ensemble de données dont voussouhaitez modifier le nom, choisissez :Fichier

Renommer l’ensemble de données

E Entrez un nouveau nom conforme aux règles d’appelation des variables SPSS pourl’ensemble de données. Pour plus d'informations, reportez-vous à « Noms de variable» dans Chapitre 5 à p. 99.

Page 149: SPSS Base Users Guide 14.0

Chapitre

7Préparation des données

Une fois que vous avez ouvert le fichier de données ou saisi les données dans l’éditeurde données, vous pouvez créer des tableaux, des diagrammes et des analyses sanseffectuer aucune autre tâche préliminaire. Cependant, il existe des fonctions depréparation des données supplémentaires qui peuvent vous être utiles, y comprisla possibilité de :

Affecter des propriétés de variable qui décrivent les données et déterminent letraitement devant être appliqué à certaines valeurs.

Identifier les observations pouvant contenir des informations redondantes, et lesexclure des analyses ou les supprimer du fichier de données.

Créer des variables avec différentes modalités qui représentent des intervalles devaleurs provenant de variables comportant un grand nombre de valeurs possibles.

Propriétés de variable

Les données saisies dans Data Editor dans l’affichage des données ou lues dans SPSSà partir d’un format de fichier externe (une feuille de calcul Excel ou un fichier textepar exemple) ne sont pas dotées de certaines propriétés de variable que vous pourrieztrouver très utiles, notamment :

Définition d’étiquettes de valeurs descriptives pour les codes numériques (parexemple, 0 = homme et 1 = femme).

Identification des codes de valeurs manquantes (par exemple, 99 = Sans objet).

Attribution de niveaux de mesure (nominal, ordinal ou échelle).

123

Page 150: SPSS Base Users Guide 14.0

124

Chapitre 7

Toutes ces propriétés de variable (ainsi que d’autres) peuvent être affectées dans lavue Variable de l’éditeur de données. Plusieurs utilitaires peuvent également vousaider dans ce processus :

L’option Définir les propriétés de variable peut vous aider à définir les étiquettesde valeurs descriptives et les valeurs manquantes. Ceci est particulièrementutile pour les données qualitatives dotées de codes numériques utilisés pour lesvaleurs de modalités.

L’option Copier les propriétés de données permet d’utiliser un fichier de donnéesau format SPSS existant comme modèle pour les propriétés de fichier et devariable dans le fichier de données en cours. Ceci est particulièrement utile sivous utilisez fréquemment des fichiers de données au format externe ayant uncontenu similaire (comme des rapports mensuels au format Excel).

Définition des propriétés de variable

L’option Définir les propriétés de variable vous aide dans le processus de créationd’étiquettes de valeurs descriptives pour les variables qualitatives (nominales ouordinales). Définir les propriétés de variable :

Analyse les valeurs réelles des données et répertorie toutes les valeurs de donnéesuniques pour chaque variable sélectionnée.

Identifie les valeurs non étiquetées et possède une fonction d’« étiquetageautomatique ».

Permet de copier des étiquettes de valeurs définies d’une autre variable vers lavariable sélectionnée ou de la variable sélectionnée vers plusieurs autres variables.

Remarque : Pour utiliser l’option Définir les propriétés de variable sans analysepréalable des observations, saisissez 0 dans le nombre d’observations à analyser.

Pour définir les propriétés de variable

E A partir des menus, sélectionnez :Données

Définir les propriétés de variables

Page 151: SPSS Base Users Guide 14.0

125

Préparation des données

Figure 7-1Boîte de dialogue initiale permettant de sélectionner les variables à définir

E Sélectionnez les variables numériques ou les variables chaîne courtes pour lesquellesvous voulez créer des étiquettes de valeurs, ou définir ou modifier d’autres propriétésde variables, telles que les valeurs manquantes ou les étiquettes de variabledescriptives.

Remarque : Les variables chaîne longues (variables chaîne d’une largeur définie deplus de huit caractères) ne sont pas affichées dans la liste de variables. Les variableschaîne longues ne peuvent pas avoir d’étiquettes de valeurs définies ou de modalitésde valeurs manquantes.

E Spécifier le nombre d’observations à analyser afin de générer la liste de valeursuniques. Ceci est particulièrement utile pour les fichiers de données comportant ungrand nombre d’observations, pour lesquelles une analyse complète du fichier dedonnées prendrait beaucoup de temps.

E Spécifier une limite supérieure pour le nombre de valeurs uniques à afficher. Cetteopération est particulièrement utile pour éviter de répertorier des centaines, des

Page 152: SPSS Base Users Guide 14.0

126

Chapitre 7

milliers, voire des millions de valeurs pour les variables d’échelle (intervalle continu,rapport).

E Cliquez sur Poursuivre pour ouvrir la boîte de dialogue principale de la fonctionDéfinir les propriétés de variable.

E Sélectionnez une variable pour laquelle vous voulez créer des étiquettes de valeurs,ou définir ou modifier d’autres propriétés de variable.

E Saisissez le texte de l’étiquette pour toutes les valeurs non étiquetées affichées dans lagrille Etiquette de valeur.

E Si vous souhaitez créer des étiquettes de valeurs pour des valeurs qui ne sont pasaffichées, vous pouvez saisir les valeurs dans la colonne Valeur, sous la dernièrevaleur analysée.

E Répétez l’opération pour chaque variable répertoriée pour laquelle vous voulez créerdes étiquettes de valeurs.

E Cliquez sur OK pour appliquer les étiquettes de valeurs et les autres propriétés devariable.

Page 153: SPSS Base Users Guide 14.0

127

Préparation des données

Définition des étiquettes de valeurs et des autres propriétés de variableFigure 7-2Définir les propriétés de variable, boîte de dialogue principale

La boîte de dialogue principale de la fonction Définir les propriétés de variable donnel’information suivante concernant les variables analysées :

Liste des variables analysées. Pour chaque variable analysée, une coche dans lacolonne Sans étiquette indique que la variable contient des valeurs qui ne possèdentpas d’étiquette de valeur.

Pour trier la liste de variables dans le but d’afficher en tête de liste toutes les variablesnon étiquetées :

E Cliquez sur le titre de colonne Sans étiquette sous la liste des variables analysées.

Vous pouvez également faire un tri par nom de variable ou par niveau de mesure encliquant sur le titre de colonne correspondant dans la liste des variables analysées.

Grille d’étiquettes de valeurs

Etiquette. Affiche toute étiquette de valeur définie. Dans cette colonne, vouspouvez ajouter ou modifier des étiquettes.

Page 154: SPSS Base Users Guide 14.0

128

Chapitre 7

Valeur. Valeurs uniques pour chaque variable sélectionnée. Cette liste de valeursuniques se fonde sur le nombre d’observations analysées. Par exemple, si vousanalysez seulement les 100 premières observations du fichier de données, la listereflétera uniquement les valeurs uniques présentes dans ces observations. Si lefichier de données a déjà été trié par la variable à laquelle vous voulez affecterdes étiquettes de valeurs, la liste pourrait afficher beaucoup moins de valeursuniques qu’il n’en existe dans les données.

Effectif. Nombre d’occurrences de chaque valeur dans les observations analysées.

Manquant. Valeurs représentant les données manquantes. Vous pouvez modifier ladésignation des valeurs manquantes de la modalité en cochant la case. Si la caseest cochée, la modalité est définie en tant que modalité manquante spécifiée parl’utilisateur. Si une variable possède déjà une plage de valeurs définies commemanquantes par l’utilisateur (par exemple, 90-99), vous ne pouvez ni ajouterni supprimer des modalités de valeurs manquantes pour cette variable avecla fonction Définir les propriétés de variable. Dans l’éditeur de données, vouspouvez utiliser l’option d’affichage des variables pour modifier les modalités devaleurs manquantes de la variable possédant des plages de valeurs manquantes.Pour plus d'informations, reportez-vous à « Valeurs manquantes » dans Chapitre5 à p. 105.

Modifié. Indique que vous avez ajouté ou modifié une étiquette de valeur.

Remarque : Dans la boîte de dialogue initiale, si vous indiquez 0 comme nombred’observations à analyser, la grille Etiquette de valeur est d’abord vide, sauf pourles étiquettes de valeurs et/ou les modalités de valeurs manquantes définies pour lavariable sélectionnée. En outre, le bouton Suggérer du niveau de mesure est désactivé.

Niveau de mesure. Comme les étiquettes de valeurs sont particulièrement utiles pourles variables qualitatives (nominales et ordinales), et comme certaines procédurestraitent les variables qualitatives et d’échelle différemment, il peut être importantd’attribuer le niveau de mesure correct. Toutefois, par défaut, le niveau de mesured’échelle est affecté à toutes les nouvelles variables numériques. Par conséquent, denombreuses variables normalement qualitatives peuvent être initialement affichéesen tant que variables d’échelle.

En cas de doute sur le niveau de mesure à affecter à une variable, cliquez sur Suggérer.

Copier les propriétés. Vous pouvez copier les étiquettes de variable ou les autrespropriétés de variable à partir d’une autre variable vers la variable sélectionnée, ou àpartir de la variable sélectionnée vers une ou plusieurs autres variables.

Page 155: SPSS Base Users Guide 14.0

129

Préparation des données

Valeurs non étiquetées. Pour créer automatiquement des étiquettes pour les valeursnon étiquetées, cliquez sur Etiquettes automatiques.

Etiquette de variable et Format d’affichage

Vous pouvez modifier l’étiquette de variable descriptive et le format d’affichage.

Vous ne pouvez pas modifier le type fondamental de la variable (chaîne ounumérique).

Pour les variables chaîne, vous ne pouvez modifier que l’étiquette de variable,mais pas le format d’affichage.

Concernant les variables numériques, vous pouvez changer le type numérique(nombres, dates, dollars ou autre devise), la largeur (nombre maximal dechiffres, dont les décimales et/ou les indicateurs de regroupement) et le nombrede décimales.

Pour ce qui est du format numérique de date, vous pouvez sélectionner un formatde date spécifique (tel que jj-mm-aaaa, mm/jj/aa, aaaajjj, etc.)

Pour un format numérique personnalisé, vous pouvez sélectionner un des cinqformats de devise personnalisés (de CCA à CCE). Pour plus d'informations,reportez-vous à « Options monétaires (devises) » dans Chapitre 44 à p. 677.

Un astérisque est affiché dans la colonne Valeur si la largeur indiquée estinférieure soit à celle des valeurs analysées, soit à celle des valeurs affichées,dans le cas des étiquettes de valeurs définies déjà existantes ou des modalitésde valeurs manquantes.

Un point (.) est affiché si les valeurs analysées ou les valeurs affichées (pour lesétiquettes de valeurs définies déjà existantes ou pour les modalités de valeursmanquantes) ne sont pas valides pour le type de format d’affichage sélectionné.Par exemple, une valeur numérique interne de moins de 86 400 n’est pas validepour une variable format de date.

Affectation du niveau de mesure

Quand vous cliquez sur Suggérer pour le niveau de mesure dans la boîte de dialogueprincipale Définir les propriétés de variable, la variable en cours est évaluée enfonction des observations analysées et des étiquettes de valeurs définies, et un niveaude mesure est suggéré dans la boîte de dialogue de suggestion d’un niveau de mesure

Page 156: SPSS Base Users Guide 14.0

130

Chapitre 7

qui apparaît. La zone Explication propose une brève description des critères utiliséspour déterminer le niveau de mesure suggéré.

Figure 7-3Boîte de dialogue Suggestion d’un niveau de mesure

Remarque : Les valeurs définies comme étant manquantes ne sont pas comprisesdans l’évaluation pour le niveau de mesure. Par exemple, l’explication du niveau demesure suggéré peut indiquer que la suggestion est due, en partie, au fait que lavariable ne contient pas de valeurs négatives, alors qu’en réalité, elle peut en contenir,mais elles sont déjà définies comme manquantes.

E Cliquez sur Poursuivre pour accepter le niveau de mesure suggéré ou sur Annuler

pour ne pas modifier le niveau de mesure.

Copie de propriétés de variable

La boîte de dialogue Appliquer des étiquettes et un niveau apparaissent lorsquevous cliquez sur A partir d’une autre variable ou sur Vers d’autres variables dans laboîte de dialogue principale Définir les propriétés de variable. Toutes les variablesanalysées correspondant au type de la variable courante (numérique ou chaîne) sont

Page 157: SPSS Base Users Guide 14.0

131

Préparation des données

alors affichées. Dans le cas des variables chaîne, la largeur définie doit égalementcorrespondre.

Figure 7-4Boîte de dialogue Appliquer les étiquettes et le niveau

E Sélectionnez une seule variable dont vous allez copier les étiquettes de valeurs et lesautres propriétés de variable (sauf l’étiquette de variable).

ou

E Sélectionnez une ou plusieurs variables qui doivent recevoir les étiquettes de valeurset les autres propriétés de variable.

E Cliquez sur Copier pour copier les étiquettes de valeurs et le niveau de mesure.

Les étiquettes de valeurs existantes et les modalités de valeurs manquantes desvariables cible ne sont pas remplacées.

Les étiquettes de valeurs et les modalités de valeurs manquantes des valeursqui ne sont pas encore définies pour les variables cible sont ajoutées au grouped’étiquettes de valeurs et de modalités de valeurs manquantes des variables cible.

Page 158: SPSS Base Users Guide 14.0

132

Chapitre 7

Le niveau de mesure des variables destination est toujours remplacé.

Si la variable source ou cible possède un intervalle défini de valeurs manquantes,les définitions de valeurs manquantes ne sont pas copiées.

Vecteurs de réponses multiples

Les options Tableaux personnalisés et Générateur de diagrammes prennent égalementen charge un type spécifique de variable nommé vecteur de réponses multiples. Lesvecteurs multiréponses ne sont pas réellement des « variables » au sens habituel duterme. En effet, vous ne pouvez pas les voir dans l’éditeur de données et les autresprocédures ne les reconnaissent pas. Les vecteurs multiréponses utilisent plusieursvariables pour enregistrer les réponses à des questions auxquelles le répondant peutdonner plusieurs réponses. Les vecteurs multiréponses sont traités comme desvariables qualitatives, et la plupart des actions appliquées à ces dernières peuventégalement l’être aux vecteurs multiréponses.

Les vecteurs multiréponses sont construits à partir de plusieurs variables dans lefichier de données. Un vecteur multiréponses est une structure spéciale dans unfichier de données au format SPSS. Vous pouvez définir et enregistrer les vecteursmultiréponses dans un fichier de données au format SPSS, mais vous ne pouvez niimporter ni exporter des vecteurs multiréponses à partir/vers d’autres formats defichiers. (Vous pouvez copier les vecteurs multiréponses d’autres fichiers de donnéesSPSS via l’option Copier des propriétés de données accessibles à partir du menuDonnées dans la fenêtre de Data Editor.Pour plus d'informations, reportez-vous à «Copier les propriétés de données » à p. 136.)

Définir des vecteurs multiréponses

Pour définir des vecteurs multiréponses :

E A partir du menu, sélectionnez :Données

Définir des vecteurs multiréponses...

Page 159: SPSS Base Users Guide 14.0

133

Préparation des données

Figure 7-5Boîte de dialogue Définir des vecteurs multiréponses

E Sélectionnez deux ou plusieurs variables. Si vos variables sont codées commedichotomies, indiquez la valeur que vous souhaitez calculer.

E Entrez un nom unique pour chaque vecteur multiréponses. Le nom peut comporterjusqu’à 63 octets de long. Un signe dollar est automatiquement ajouté devant lenom du vecteur.

E Indiquez une étiquette décrivant le vecteur. (Cette opération est facultative.)

E Cliquez sur Ajouter pour ajouter les vecteurs multiréponses à la liste des vecteursdéfinis.

Dichotomies

Un vecteur de dichotomies multiples est composé de plusieurs variablesdichotomiques : il s’agit de variables qui n’ont que deux valeurs possibles du typeoui/non, présent/absent ou sélectionné/non sélectionné. Bien que les variables peuvent

Page 160: SPSS Base Users Guide 14.0

134

Chapitre 7

ne pas être strictement dichotomiques, toutes les variables du vecteur sont codées dela même manière et la valeur comptée représente la condition oui/présent/sélectionné.

Par exemple, une enquête pose la question “ Parmi les sources suivantes, quellessont les plus fiables dans le domaine de l’information ? “ et propose cinq réponsespossibles. Le répondant peut indiquer plusieurs choix en cochant la case situéeen regard de chaque proposition. Les cinq réponses deviennent cinq variablesdans le fichier de données, codées par 0 pour Non (non sélectionné) et 1 pour Oui(sélectionné). Dans le vecteur de dichotomies multiples, la valeur comptée est 1.

Le fichier de données d’échantillon survey_sample.sav (dans le répertoiretutorial/sample_files du répertoire d’installation) comporte déjà trois vecteursmultiréponses définis. $mltnews est un vecteur de dichotomies multiples.

E Dans la liste Vecteurs de réponses multiples, sélectionnez $mltnews en cliquant dessus.

Les variables et paramètres utilisés pour définir ce vecteur multiréponses apparaissent.

La liste Variables à inclure comporte les cinq variables utilisées pour construire levecteur multiréponses.

Le groupe Variables codées en tant que indique que les variables sontdichotomiques.

La valeur comptée est 1.

E Sélectionnez une des variables de la liste Variables à inclure en cliquant dessus.

E Cliquez avec le bouton droit de la souris sur la variable et sélectionnez Informations

sur les variables dans le menu contextuel.

E Dans la fenêtre Informations sur les variables, cliquez sur la flèche de la listedéroulante Etiquettes de valeur pour afficher la liste complète des étiquettes devaleurs définies.

Figure 7-6Informations sur la variable source à dichotomies multiples

Page 161: SPSS Base Users Guide 14.0

135

Préparation des données

L’étiquette de valeur indique que la variable est une dichotomie avec les valeurs 0 et1, représentant respectivement Non et Oui. Les cinq variables de la liste sont codéesde la même façon et la valeur 1 (code correspondant à Oui) est la valeur comptéepour le vecteur de dichotomies multiples.

Modalités

Un vecteur de modalités multiples comporte plusieurs variables, toutes codées de lamême façon, souvent avec un grand nombre de modalités de réponses possibles. Parexemple, une enquête comporte la question “ Nommez jusqu’à trois nationalitésdécrivant le mieux votre héritage ethnique “. Des centaines de réponses sontpossibles, mais pour des questions de codage, la liste est limitée aux 40 nationalitésles plus courantes, le reste étant relégué dans une modalité “ Autre “. Dans lefichier de données, les trois choix deviennent trois variables, chacune comportant 41modalités (40 nationalités codées et une modalité “ Autre “).

Dans le fichier de données exemple, $ethmult et $mltcars sont des vecteurs demodalités multiples.

Source de l’étiquette de modalité

Pour les dichotomies multiples, vous pouvez contrôler la manière dont les ensemblessont étiquetés.

Etiquettes de variable. Utilise les étiquettes de variables définies (ou les noms devariables pour les variables sans étiquette de variable définie) en tant qu’étiquettesde modalité d’ensemble. Par exemple, si toutes les variables de l’ensemble ontla même étiquette de valeur (ou pas d’étiquette de valeur définie) pour la valeurcomptée (par exemple, Oui), alors vous devez utiliser les étiquettes de variablescomme étiquettes de modalité d’ensemble.

Etiquettes des valeurs comptées. Utilise les étiquettes de valeur définies desvaleurs comptées comme étiquettes de modalité d’ensemble. Sélectionnez cetteoption uniquement si toutes les variables ont une étiquette de valeur définiepour la valeur comptée et si l’étiquette de la valeur comptée est différente pourchaque variable.

Utilisez l’étiquette de variable comme étiquette d’ensemble. Si vous sélectionnezEtiquette des valeurs comptées, vous pouvez également utiliser l’étiquette devariable pour la première variable de l’ensemble avec une étiquette de variabledéfine comme étiquette d’ensemble. Si aucune des variables de l’ensemble ne

Page 162: SPSS Base Users Guide 14.0

136

Chapitre 7

comporte d’étiquettes de variables définies, le nom de la première variable estutilisé comme étiquette d’ensemble.

Copier les propriétés de données

L’assistant Copier des propriétés de données permet d’utiliser un fichier de donnéesSPSS externe comme modèle pour définir les propriétés de fichier et de variabledans l’ensemble de données actif. Vous pouvez également utiliser des variables del’ensemble de données actif comme modèle pour d’autres variables de l’ensemblede données actif. Vous pouvez:

Copier des propriétés de fichier sélectionnées à partir d’un fichier de donnéesexterne ou ouvrir un ensemble de données vers l’ensemble de données actif. Lespropriétés de fichier comprennent les documents, les étiquettes de fichier, lesvecteurs multiréponses, les groupes de variables et la pondération.

Copier des propriétés de variable sélectionnées à partir d’un fichier de donnéesexterne ou ouvrir un ensemble de données vers des variables correspondantesde l’ensemble de données actif. Les propriétés de variable comprennent lesétiquettes de valeurs, les valeurs manquantes, le niveau de mesure, les étiquettesde variable, le format d’impression et d’écriture, l’alignement et la largeur descolonnes (dans l’éditeur de données).

Copier des propriétés de variable sélectionnées à partir d’une variable d’un fichierde données externe, ouvrir un ensemble de données ou l’ensemble de donnéesactif vers plusieurs variables de l’ensemble de données actif.

Créer de nouvelles variables dans l’ensemble de données actif à partir de variablessélectionnées dans un fichier de données externe ou ouvrir un ensemble dedonnées.

Lors de la copie de propriétés de données, les règles générales suivantes sontappliquées :

Si vous utilisez un fichier de données externe en tant que fichier source, celui-cidoit être au format SPSS.

Si vous utilisez l’ensemble de données actif comme fichier de données source,celui-ci doit contenir au moins une variable. Vous ne pouvez pas utiliser unensemble de données actif entièrement vide comme le fichier de données source.

Page 163: SPSS Base Users Guide 14.0

137

Préparation des données

Les propriétés non définies (vides) de l’ensemble de données source neremplacent pas les propriétés définies dans l’ensemble de données actif.

Les propriétés de variable ne sont copiées à partir de la variable source que surdes variables d’un type correspondant : chaîne (alphanumérique) ou numérique(nombres, dates et devises).

Remarque : L’option Copier des propriétés de données remplace l’option d’applicationdu dictionnaire de données, auparavant disponible dans le menu Fichier.

Pour copier des propriétés de données

E A partir des menus de la fenêtre de l’éditeur de données, sélectionnez :Données

Copie des propriétés de données...

Page 164: SPSS Base Users Guide 14.0

138

Chapitre 7

Figure 7-7Assistant Copier des propriétés de données : Etape 1

E Sélectionnez le fichier de données possédant les propriétés de fichier et/ou de variableà copier. Il peut s’agir d’un ensemble de données en cours d’utilisation, d’un fichierde données externe au format SPSS ou de l’ensemble de données actif.

E Suivez les instructions de l’assistant Copier des propriétés de données étape par étape.

Sélection des variables source et cible

Dans cette étape, vous pouvez spécifier les variables source contenant les propriétésde variable à copier et les variables cible qui doivent recevoir ces propriétés.

Page 165: SPSS Base Users Guide 14.0

139

Préparation des données

Figure 7-8Assistant Copier des propriétés de données : Etape 2

Application des propriétés provenant de variables de l’ensemble de données source auxvariables concordantes de l’ensemble de données actif. Les propriétés de variable sontcopiées à partir d’une ou de plusieurs variables source sélectionnées vers les variablesconcordantes dans l’ensemble de données actif. Les variables sont concordantessi le type (chaîne ou numérique) et le nom de la variable sont les mêmes. En cequi concerne les variables chaîne, la longueur définie doit également être la même.Par défaut, seules les variables concordantes sont affichées dans les deux listes devariables.

Création des variables concordantes dans l’ensemble de données actif si ellesn’existent pas déjà. Permet de mettre à jour la liste source afin d’afficher toutesles variables dans le fichier de données source. Si vous sélectionnez des variables

Page 166: SPSS Base Users Guide 14.0

140

Chapitre 7

source qui n’existent pas dans l’ensemble de données actif (d’après le nom devariable), les nouvelles variables sont créées dans l’ensemble de données actifavec les noms et propriétés de variable du fichier de données source.

Si l’ensemble de données actif ne contient pas de variables (dans le cas d’un nouvelensemble de données vide), toutes les variables du fichier de données source sontaffichées et les nouvelles variables fondées sur les variables source concernées sontcréées automatiquement dans l’ensemble de données actif.

Application des propriétés d’une variable source unique sur des variables sélectionnéesde même type d’un ensemble de données actif. Les propriétés d’une variable uniquesélectionnée dans la liste source peuvent être appliquées à une ou à plusieurs variablessélectionnées de la liste de l’ensemble de données actif. Seules des variables du mêmetype (numérique ou chaîne) que la variable choisie dans la liste source sont affichéesdans la liste de l’ensemble de données actif. Dans le cas des variables de chaîne,seules les chaînes de même longueur que la variable source sont affichées. Cetteoption n’est disponible que si l’ensemble de données actif ne contient aucune variable.

Remarque : Cette option ne vous permet pas de créer de nouvelles variables dansl’ensemble de données actif.

Application des propriétés d’un ensemble de données uniquement, sans sélection devariable. Seules les propriétés du fichier (par exemple, les documents, les étiquettesde fichier et la pondération) sont appliquées à l’ensemble de données actif. Aucunepropriété de variable n’est appliquée. Cette option n’est pas disponible si l’ensemblede données actif est également le fichier de données source.

Choix des propriétés de variable à copier

Vous pouvez copier des propriétés de variable à partir des variables source vers lesvariables cible. Les propriétés non définies (vides) des variables source ne remplacentpas les propriétés définies des variables cible.

Page 167: SPSS Base Users Guide 14.0

141

Préparation des données

Figure 7-9Assistant Copier des propriétés de données : Etape 3

Etiquette de valeur. Les étiquettes de valeurs sont des étiquettes descriptives associéesà des valeurs de données. Les étiquettes de valeurs sont souvent utilisées quanddes valeurs de données numériques représentent des modalités non numériques(par exemple, les codes 1 et 2 pour Homme et Femme). Vous pouvez remplacer oufusionner les étiquettes de valeurs dans les variables cible.

L’option Remplacer supprime les étiquettes de valeurs définies dans la variablecible et les remplace par les étiquettes de valeurs définies de la variable source.

L’option Fusionner fusionne les étiquettes de valeurs définies de la variable sourceavec toute étiquette de valeur définie existante de la variable cible. Si la mêmevaleur possède une étiquette définie dans les deux variables source et cible,l’étiquette de valeur de la variable cible reste inchangée.

Page 168: SPSS Base Users Guide 14.0

142

Chapitre 7

Attributs Personnalisés. Les attributs de variables personnalisés, créés en général parla commande VARIABLE ATTRIBUTE dans la syntaxe de commande.

L’option Remplacer supprime les attributs personnalisés dans la variable cible etles remplace par les attributs définis de la variable source.

L’option Fusionner fusionne les attributs définis de la variable source avec toutattribut personnalisé défini existant de la variable cible.

Valeurs manquantes. Les valeurs manquantes représentent des données manquantes(par exemple, 98 pour Ne se prononce pas et 99 pour Sans objet). Ces valeurspossèdent également des étiquettes de valeurs définies qui décrivent ce quereprésentent les codes de la valeur manquante. Les valeurs manquantes définiesexistant dans la variable cible sont supprimées et remplacées par les valeursmanquantes définies dans la variable source.

Etiquette de variable. Les étiquettes de variable descriptive peuvent contenir desespaces et des caractères réservés qui ne sont pas autorisés dans les noms de variable.Avant de copier des propriétés d’une seule variable source sur plusieurs variablescible, plusieurs éléments sont à prendre en compte.

Niveau de mesure. Le niveau de mesure peut être nominal, ordinal ou d’échelle. Pourles procédures qui font une distinction entre différents niveaux de mesure, les niveauxnominal et ordinal sont tous deux considérés comme qualitatifs.

Formats. Concernant les variables numériques, cette option contrôle le type numérique(nombres, dates ou devises), la largeur (nombre total de caractères affichés, dontles caractères de début et de fin, et l’indicateur décimal) et le nombre de décimalesaffichées. Cette option est ignorée pour les variables chaîne.

Alignement. Cette option n’affecte que l’alignement (gauche, droite, centré) del’affichage des données de l’éditeur de données.

Largeur des colonnes dans l’éditeur de données. Cette option n’affecte que la largeurdes colonnes de l’affichage des données dans l’éditeur de données.

Copie des propriétés d’ensembles de données (propriétés de fichier)

Vous pouvez appliquer des propriétés choisies d’un ensemble de données global àpartir du fichier de données source vers l’ensemble de données actif. (Cette optionn’est pas disponible si l’ensemble de données actif est le fichier de données source.)

Page 169: SPSS Base Users Guide 14.0

143

Préparation des données

Figure 7-10Assistant Copier des propriétés de données : Etape 4

Vecteurs multiréponses. Applique les définitions de vecteurs multiréponses du fichierde données source vers l’ensemble de données actif. (Remarque : Les vecteurs deréponses multiples ne sont actuellement utilisés que par le Générateur de diagrammeset l’option complémentaire Tableaux.)

Les vecteurs multiréponses du fichier de données source contenant des variablesqui n’existent pas dans l’ensemble de données actif sont ignorés, à moins queces variables ne soient créées selon les spécifications de l’étape 2 (sélection desvariables source et cible) avec l’assistant Copier des propriétés de données.

Page 170: SPSS Base Users Guide 14.0

144

Chapitre 7

L’option Remplacer supprime tous les vecteurs multiréponses de l’ensemblede données actif et les remplace par les vecteurs multiréponses du fichier dedonnées source.

L’option Fusionner ajoute les vecteurs multiréponses du fichier de données sourceà l’ensemble de vecteurs multiréponses de l’ensemble de données actif. S’ilexiste dans les deux fichiers un vecteur portant le même nom, le vecteur existantdans l’ensemble de données actif reste inchangé.

Groupes de variables. Les groupes de variables permettent de contrôler la liste desvariables affichées dans les boîtes de dialogue. Les groupes de variables sont définis àl’aide de l’option Définir les vecteurs du menu Utilitaires.

Les groupes du fichier de données source contenant des variables qui n’existentpas dans l’ensemble de données actif sont ignorés à moins que ces variables nesoient créées selon les spécifications de l’étape 2 (sélection des variables sourceet cible) avec l’assistant Copier des propriétés de données.

L’option Remplacer supprime tous les groupes de variables existants dansl’ensemble de données actif et les remplace par les groupes de variables dufichier de données source.

L’option Fusionner ajoute les groupes de variables du fichier de données source àl’ensemble des groupes de variables de l’ensemble de données actif. S’il existedans les deux fichiers un vecteur portant le même nom, le vecteur existant dansl’ensemble de données actif reste inchangé.

Documents. Remarques ajoutées au fichier de données via la commande DOCUMENT.

L’option Remplacer supprime tous les documents existants dans l’ensemble dedonnées actif et les remplace par les documents du fichier de données source.

L’option Fusionner combine les documents de l’ensemble de données actif etsource. Les documents uniques dans le fichier source et qui n’existent pas dansl’ensemble de données actif sont ajoutés à l’ensemble de données actif. Tous lesdocuments sont ensuite triés par date.

Attributs Personnalisés. Les attributs de fichier de données personnalisés, créés engénéral par la commande DATAFILE ATTRIBUTE dans la syntaxe de commande.

Page 171: SPSS Base Users Guide 14.0

145

Préparation des données

L’option Remplacer supprime tous les attributs du fichier de données personnalisésexistants dans l’ensemble de données actif et les remplace par les attributs dufichier de données à partir du fichier de données source.

L’option Fusionner combine les attributs du fichier de données de l’ensemble dedonnées actif et source. Les noms d’attributs uniques dans le fichier source etqui n’existent pas dans l’ensemble de données actif sont ajoutés à l’ensemble dedonnées actif. Si un nom d’attribut identique existe dans les deux fichiers dedonnées, l’attribut nommé dans l’ensemble de données actif reste inchangé.

Spécification de pondération. Pondère les observations à l’aide de la variable depondération actuelle du fichier de données source s’il existe une variable concordantedans l’ensemble de données actif. Cette opération remplace toute pondération encours dans l’ensemble de données actif.

Etiquette de fichier. Etiquette descriptive appliquée à un fichier de données via lacommande FILE LABEL.

Page 172: SPSS Base Users Guide 14.0

146

Chapitre 7

RésultatsFigure 7-11Assistant Copier des propriétés de données : Etape 5

La dernière étape de l’assistant Copier des propriétés de données fournit desinformations sur le nombre de variables dont les propriétés seront copiées à partirdu fichier de données source, le nombre de nouvelles variables qui seront créées etle nombre de propriétés d’ensembles de données (propriétés de fichier) qui serontcopiées.

Vous pouvez également choisir de coller la syntaxe de commande générée dansune fenêtre de syntaxe et de l’enregistrer pour un usage ultérieur.

Page 173: SPSS Base Users Guide 14.0

147

Préparation des données

Identification des observations dupliquées

Vos données peuvent comprendre des observations « dupliquées » pour les raisonssuivantes :

La même observation est saisie plusieurs fois par erreur.

Plusieurs observations partagent la même valeur d’ID principal, mais ont desvaleurs d’ID secondaire différentes (par exemple, les membres d’une famillequi vivent tous dans la même maison).

Plusieurs observations représentent la même observation, mais les valeurs desvariables autres que celles qui identifient l’observation sont différentes (parexemple, plusieurs achats effectués par la même personne ou la même sociétépour des produits différents ou à des heures différentes).

L’identification des observations dupliquées vous permet de définir la variableduplicate suivant vos besoins et de contrôler la détermination automatique desobservations principales par rapport aux observations dupliquées.

Pour identifier et repérer les observations dupliquées

E A partir des menus, sélectionnez :Données

Identifier les observations dupliquées...

E Sélectionnez les variables qui identifient les observations concordantes.

E Sélectionnez des options dans la zone Variables à créer.

Sinon, vous pouvez :

E Sélectionner des variables pour trier les observations dans des groupes définis par lesvariables des observations concordantes sélectionnées. L’ordre de tri défini par cesvariables détermine la « première » et la « dernière » observation de chaque groupe.Sinon, l’ordre utilisé est celui d’origine du fichier.

E Filtrer automatiquement les observations dupliquées afin qu’elles ne soient pasincluses dans les rapports, les graphiques ou le calcul des statistiques.

Page 174: SPSS Base Users Guide 14.0

148

Chapitre 7

Figure 7-12Boîte de dialogue Identifier les observations dupliquées

Définir les observations concordantes par. Les observations sont considéréescomme étant dupliquées lorsque leurs valeurs concordent avec toutes les variablessélectionnées. Pour identifier uniquement les observations dont la concordance estégale à 100 %, sélectionnez toutes les variables.

Trier les groupes concordants par. Les observations sont automatiquement triées parles variables qui définissent les observations concordantes. Vous pouvez sélectionnerd’autres variables de tri qui détermineront l’ordre des observations dans chaquegroupe concordant.

Pour chaque variable de tri, vous pouvez effectuer le tri dans l’ordre croissant oudécroissant.

Page 175: SPSS Base Users Guide 14.0

149

Préparation des données

Si vous sélectionnez plusieurs variables de tri, les observations sont triées pourchaque variable au sein des modalités de la variable précédente dans la liste. Parexemple, si la première variable de tri sélectionnée est date et que la deuxième estquantité, les observations sont triées en fonction de la quantité correspondant àchaque date.

Pour modifier l’ordre de tri des variables, utilisez les boutons fléchés Haut etBas situés à droite de la liste.

L’ordre de tri détermine la “ première ” et la “ dernière ” observation de chaquegroupe concordant, qui détermine la valeur de la variable indicatrice principalefacultative. Par exemple, pour filtrer toutes les observations, à l’exception de laplus récente, dans chaque groupe concordant, vous pouvez trier les observationsdu groupe dans l’ordre croissant à partir d’une variable de date. De cette façon, ladate la plus récente devient la dernière date du groupe.

Indicateur d’observations principales. Crée une variable dont la valeur est 1 pour toutesles observations uniques et pour l’observation identifiée comme étant l’observationprincipale de chaque groupe d’observations concordantes, et 0 pour les observationsdupliquées non principales de chaque groupe.

En fonction de l’ordre de tri déterminé dans le groupe concordant, l’observationprincipale peut être la dernière ou la première observation de ce groupe. Si vousn’indiquez aucune variable de tri, l’ordre d’origine du fichier détermine celuides observations dans chaque groupe.

Vous pouvez utiliser la variable indicatrice en tant que variable de filtre pourexclure les observations dupliquées non principales des rapports et des analysessans les supprimer du fichier de données.

Effectif séquentiel des observations concordantes de chaque groupe. Crée une variabledont la valeur séquentielle est comprise entre 1 et n pour les observations de chaquegroupe concordant. La séquence est basée sur l’ordre en cours des observationsdans chaque groupe, c’est-à-dire l’ordre d’origine du fichier ou celui déterminé parles variables de tri indiquées.

Déplacer les observations concordantes vers le haut. Trie le fichier de données afinque tous les groupes d’observations concordantes se trouvent au début de ce fichier.Le contrôle visuel des observations concordantes est ainsi facilité dans l’éditeur dedonnées.

Page 176: SPSS Base Users Guide 14.0

150

Chapitre 7

Afficher les fréquences pour les variables créées. Tableaux de fréquences indiquant lenombre d’observations pour chaque valeur des variables créées. Par exemple, pour lavariable indicatrice principale, le tableau indique le nombre d’observations dont lavaleur est 0 pour cette variable (ce qui indique le nombre d’observations dupliquées)et le nombre d’observations dont la valeur est 1 pour cette variable (c’est-à-dire lenombre d’observations uniques et principales).

Valeurs manquantes. Pour les variables numériques, la valeur manquante par défautest traitée comme toute autre valeur. Les observations disposant de la valeurmanquante par défaut pour une variable d’identificateur sont traitées comme si ellesdisposaient de valeurs concordantes pour cette variable. Pour les variables chaîne,les observations ne disposant d’aucune valeur pour une variable d’identificateur sonttraitées comme si elles disposaient de valeurs concordantes pour cette variable.

Outil visuel de regroupement en bandes

L’outil visuel de regroupement en bandes est conçu pour vous aider lors de la créationde variables basées sur le regroupement des valeurs contiguës de variables dans unnombre distinct de modalités. L’outil visuel de regroupement en bandes vous permetd’effectuer les opérations suivantes :

Créer des variables qualitatives à partir de variables d’échelle continues. Parexemple, vous pouvez utiliser la variable d’échelle Revenu pour créer unevariable qualitative contenant les tranches de revenus.

Fusionner un grand nombre de modalités ordinales en un jeu de modalités pluspetit. Par exemple, vous pouvez fusionner une échelle d’évaluation allant jusqu’àneuf pour obtenir trois modalités qui représenteraient les niveaux faible, moyenet élevé.

Dans la première étape de l’outil visuel de regroupement en bandes, vous pouvezeffectuer les opérations suivantes :

E Sélectionner l’échelle numérique et/ou les variables ordinales pour lesquelles créerdes variables qualitatives (en bandes).

Page 177: SPSS Base Users Guide 14.0

151

Préparation des données

Figure 7-13Première boîte de dialogue permettant de sélectionner les variables à regrouper en bandes

Vous pouvez également limiter le nombre d’observations à analyser. Pour les fichiersde données contenant un grand nombre d’observations, même si la limitation dunombre d’observations analysées peut permettre de gagner du temps, évitez sipossible de procéder à cette opération car elle risque d’avoir une incidence sur ladistribution des valeurs utilisées dans les calculs effectués ultérieurement dans l’outilvisuel de regroupement en bandes.

Remarque : Les variables chaîne et les variables numériques nominales ne sont pasaffichées dans la liste des variables source. L’outil visuel de regroupement en bandesrequiert l’utilisation de variables numériques qui sont mesurées sur une échelle ouau niveau ordinal. En effet, l’outil considère que les valeurs de données représententun ordre logique qui peut servir à regrouper les valeurs de manière significative.Vous pouvez modifier le niveau de mesure défini d’une variable dans la vue Variablede Data Editor. Pour plus d'informations, reportez-vous à « Niveau de mesure desvariables » dans Chapitre 5 à p. 99.

Page 178: SPSS Base Users Guide 14.0

152

Chapitre 7

Pour regrouper les variables en bandes

E A partir des menus de la fenêtre de l’éditeur de données, sélectionnez :Transformer

Outil visuel de regroupement en bandes :

E Sélectionner l’échelle numérique et/ou les variables ordinales pour lesquelles créerdes variables qualitatives (en bandes).

E Sélectionnez une variable dans la zone Liste des variables analysées.

E Entrez le nom de la nouvelle variable regroupée en bandes. Les noms de variabledoivent être uniques et conformes aux règles de dénomination de variables SPSS. Pourplus d'informations, reportez-vous à « Noms de variable » dans Chapitre 5 à p. 99.

E Définissez les critères de regroupement en bandes de la nouvelle variable. Pour plusd'informations, reportez-vous à « Regroupement de variables en bandes » à p. 153.

E Cliquez sur OK.

Page 179: SPSS Base Users Guide 14.0

153

Préparation des données

Regroupement de variables en bandes

Figure 7-14Boîte de dialogue principale de l’outil visuel de regroupement en bandes

La boîte de dialogue principale de l’outil visuel de regroupement en bandes fournitles informations suivantes concernant les variables analysées :

Liste des variables analysées. Affiche les variables sélectionnées dans la premièreboîte de dialogue. Vous pouvez trier la liste par niveau de mesure (échelle ou ordinal),par étiquette de variable ou par nom. Pour ce faire, cliquez sur les titres de colonne.

Observations analysées. Indique le nombre d’observations analysées. Toutes lesobservations analysées dont la variable sélectionnée ne présente aucune valeurmanquante par défaut ou utilisateur sont utilisées pour générer la distribution desvaleurs servant aux calculs effectués dans l’outil visuel de regroupement en bandes, ycompris l’histogramme affiché dans la boîte de dialogue principale et les divisionsbasées sur les centiles ou les écarts-types.

Page 180: SPSS Base Users Guide 14.0

154

Chapitre 7

Valeurs manquantes. Indique le nombre d’observations analysées contenant desvaleurs manquantes par défaut et spécifiées par l’utilisateur. Les valeurs manquantesne sont incluses dans aucune modalité regroupée en bandes. Pour plus d'informations,reportez-vous à « Valeurs manquantes utilisateur dans l’outil visuel de regroupementen bandes » à p. 161.

Variable actuelle. Nom et étiquette (si disponible) de la variable sélectionnée, quiseront utilisés comme base pour les nouvelles variables regroupées en bandes.

Variable regroupée en bandes. Nom et étiquette facultative de la nouvelle variableregroupée en bandes.

Nom. Vous devez entrer le nom de la nouvelle variable. Les noms de variabledoivent être uniques et conformes aux règles de dénomination de variables SPSS.Pour plus d'informations, reportez-vous à « Noms de variable » dans Chapitre 5à p. 99.

Etiquette. Vous pouvez entrer une étiquette de variable descriptive contenantjusqu’à 255 caractères. L’étiquette de variable par défaut est l’étiquette (sidisponible) ou le nom de la variable source, suivi de la mention (Regroupé enbandes).

Minimum et Maximum. Valeurs minimales et maximales de la variable sélectionnée,basées sur les observations analysées et n’incluant pas de valeurs définies en tant quevaleurs manquantes spécifiées par l’utilisateur.

Valeurs non manquantes. L’histogramme affiche la distribution des valeurs nonmanquantes pour la variable sélectionnée, basée sur les observations analysées.

Une fois que vous avez défini les bandes de la nouvelle variable, les lignesverticales de l’histogramme apparaissent afin d’indiquer les divisions définissantces bandes.

Vous pouvez cliquer sur les lignes de division, puis les déplacer vers différentsemplacements de l’histogramme, sans changer les intervalles de bandes.

Vous pouvez supprimer les bandes en faisant glisser les lignes de division horsde l’histogramme.

Remarque : L’histogramme (affichant les valeurs non manquantes), et les valeursminimales et maximales sont basés sur les valeurs analysées. Si vous n’incluez pastoutes les observations dans l’analyse, vous risquez de ne pas obtenir une distributionprécise et représentative, surtout si le fichier de données a été trié par la variable

Page 181: SPSS Base Users Guide 14.0

155

Préparation des données

sélectionnée. Si vous n’analysez pas d’observations, aucune information sur ladistribution des valeurs n’est disponible.

Grille. Affiche les valeurs qui définissent les extrema supérieurs de chaque bande etles étiquettes de valeur facultatives de chaque bande.

Valeur. Valeurs qui définissent les extrema supérieurs de chaque bande. Vouspouvez entrer des valeurs ou utiliser l’option Créer des divisions pour créerautomatiquement des bandes en fonction des critères sélectionnés. Par défaut,une division dont la valeur est ELEVE est automatiquement incluse. Cette bandecontient alors toutes les valeurs non manquantes situées au-dessus des autresdivisions. La bande définie par la division la moins élevée inclut toutes les valeursnon manquantes inférieures ou égales à cette valeur (ou simplement inférieures àcette valeur, en fonction de la définition des extrema supérieurs).

Etiquette. Etiquettes descriptives facultatives pour les valeurs de la nouvellevariable regroupée en bandes. Etant donné que les valeurs de la nouvelle variablesont des valeurs entières séquentielles comprises entre 1 et n, les étiquettesdécrivant les valeurs peuvent se révéler très utiles. Vous pouvez entrer lesétiquettes de valeur ou utiliser l’option Créer des étiquettes pour les créerautomatiquement.

Pour supprimer une bande de la grille

E Cliquez avec le bouton droit de la souris sur la cellule Valeur ou Etiquette de la bande.

E Dans le menu contextuel, sélectionnez Supprimer la ligne.

Remarque : Si vous supprimez la bande ELEVE, la valeur par défaut manquantede la nouvelle variable est attribuée à toutes les observations dont les valeurs sontsupérieures à celle de la dernière division spécifiée.

Pour supprimer toutes les étiquettes ou toutes les bandes définies

E Cliquez avec le bouton droit n’importe où dans la grille.

E Dans le menu contextuel, sélectionnez Supprimer toutes les étiquettes ou Supprimer

toutes les divisions.

Extrema supérieurs. Contrôle le traitement des valeurs des extrema supérieurs saisiesdans la colonne Valeur de la grille.

Page 182: SPSS Base Users Guide 14.0

156

Chapitre 7

Inclus (<=). Les observations contenant la valeur spécifiée dans la cellule Valeursont incluses dans la modalité regroupée en bandes. Par exemple, si vousspécifiez les valeurs 25, 50 et 75, les observations dont la valeur est 25 serontplacées dans la première bande. En effet, cette bande inclut les observations dontles valeurs sont inférieures ou égales à 25.

Exclu (<). Les observations contenant la valeur spécifiée dans la cellule Valeurne sont pas incluses dans la modalité regroupée en bandes. Elles sont inclusesdans la bande suivante. Par exemple, si vous spécifiez les valeurs 25, 50 et 75,les observations dont la valeur est 25 seront placées dans la seconde bande. Eneffet, la première bande inclut uniquement les observations dont les valeurs sontinférieures à 25.

Créer des divisions. Génère automatiquement des modalités regroupées en bandespour les intervalles de longueur identique, les intervalles avec le même nombred’observations ou les intervalles basés sur les écarts-types. Cette option n’estdisponible que si vous analysez au moins une observation. Pour plus d'informations,reportez-vous à « Génération automatique de modalités regroupées en bandes » à p.156.

Créer des étiquettes. Génère des étiquettes descriptives pour les valeurs entièresséquentielles de la nouvelle variable regroupée en bandes, basées sur les valeurs setrouvant dans la grille et le traitement des extrema supérieurs (inclus ou exclus).

Inverser l’échelle. Par défaut, les valeurs de la nouvelle variable regroupée en bandessont des valeurs entières séquentielles croissantes comprise entre 1 et n. Inversezl’échelle pour que ces valeurs deviennent des entiers séquentiels décroissants comprisentre n et 1.

Copier les bandes. Vous pouvez copier les spécifications de regroupement à partird’une variable vers la variable sélectionnée ou à partir de la variable sélectionnée versd’autres variables. Pour plus d'informations, reportez-vous à « Copie de modalitésregroupées en bandes » à p. 159.

Génération automatique de modalités regroupées en bandes

La boîte de dialogue Créer des divisions vous permet de générer automatiquement lesmodalités regroupées en bandes en fonction des critères sélectionnés.

Page 183: SPSS Base Users Guide 14.0

157

Préparation des données

Pour utiliser la boîte de dialogue Créer des divisions

E Dans la zone Liste des variables analysées, sélectionnez une variable en cliquantdessus.

E Cliquez sur Créer des divisions.

E Sélectionnez les critères de génération des divisions, qui définira les modalitésregroupées en bandes.

E Cliquez sur Appliquer.

Figure 7-15Boîte de dialogue Créer des divisions

Remarque : La boîte de dialogue Créer des divisions n’est disponible que si vousavez analysé des observations.

Page 184: SPSS Base Users Guide 14.0

158

Chapitre 7

Intervalles de longueur identique. Génère des modalités regroupées en bandes delongueur identique (par exemple, 1–10, 11–20, 21–30, etc.) en fonction de deux destrois critères suivants :

Emplacement de la première division. Valeur qui définit la limite supérieure de lamodalité regroupée en bandes la moins élevée (par exemple, la valeur 10 indiqueun intervalle comprenant toutes les valeurs jusqu’à 10).

Nombre de divisions. Le nombre de modalités regroupées en bandes correspondau nombre de divisions, plus 1. Par exemple, 9 divisions génèrent 10 modalitésregroupées en bandes.

Largeur. Longueur de chaque intervalle. Par exemple, la valeur 10 regroupe lesdonnées d’âge en années par intervalles de 10 ans.

Centiles égaux fondés sur les observations analysées. Génère des modalités regroupéesen bandes avec un nombre d’observations identique dans chaque bande (à l’aide del’algorithme empirique pour les centiles), en fonction de l’un des critères suivants :

Nombre de divisions. Le nombre de modalités regroupées en bandes correspond aunombre de divisions, plus 1. Par exemple, trois divisions génèrent quatre bandesde centiles (quartiles), chacune contenant 25 % des observations.

Largeur (%). Longueur de chaque intervalle, exprimée en pourcentage dunombre total des observations. Par exemple, la valeur 33,3 générerait troismodalités regroupées en bandes (deux divisions), chacune contenant 33,3 %des observations.

Si la variable source comporte peu de valeurs distinctes ou de nombreusesobservations ayant la même valeur, vous risquez d’obtenir un nombre de bandesinférieur à celui requis. Si une division dispose de plusieurs valeurs identiques, cesdernières seront toutes placées dans le même intervalle ; les pourcentages réelsrisquent donc de ne pas être strictement égaux.

Divisions au niveau de la moyenne et des écarts-types sélectionnés, fondées sur lesobservations analysées. Génère des modalités regroupées en bandes basées sur lesvaleurs de la moyenne et de l’écart-type de la distribution de la variable.

Page 185: SPSS Base Users Guide 14.0

159

Préparation des données

Si vous ne sélectionnez pas les intervalles d’écarts-types, deux modalitésregroupées en bandes sont créées, la moyenne étant utilisée comme divisionentre les bandes.

Vous pouvez sélectionner n’importe quelle combinaison d’intervallesd’écarts-types en utilisant un, deux et/ou trois écarts-types. Par exemple, si voussélectionnez les trois, huit modalités regroupées en bandes sont créées : sixbandes dans un intervalle d’écarts-types, et deux bandes pour les observationssupérieures ou inférieures à la moyenne de plus de trois écarts-types.

Dans une distribution normale, 68 % des observations sont comprises dans unécart-type de la moyenne, 95 %, dans deux écarts-types et 99 % dans troisécarts-types. Si la création de modalités regroupées en bandes est basée sur lesécarts-types, certaines bandes définies risquent de se retrouver hors de l’intervallede données réel, voire hors de l’intervalle des valeurs possibles (par exemple, unintervalle de salaires négatif).

Remarque : Les calculs de centiles et d’écarts-types reposent sur les observationsanalysées. Si vous limitez le nombre d’observations analysées, les bandes obtenuesrisquent de ne pas contenir la proportion d’observations souhaitée, en particuliersi le fichier de données est trié par variable source. Par exemple, si vous limitezl’analyse aux 100 premières observations d’un fichier de données contenant 1 000observations et que ce fichier de données est trié dans l’ordre croissant de l’âge desrépondants, vous n’obtiendrez pas quatre bandes d’âge en centiles contenant 25 % desobservations, mais plutôt trois bandes contenant chacune 3,3 % des observations etune quatrième en contenant 90 %.

Copie de modalités regroupées en bandes

Si vous souhaitez créer des modalités regroupées en bandes pour plusieurs variables,vous pouvez copier les spécifications du regroupement à partir d’une variable vers lavariable sélectionnée ou à partir de la variable sélectionnée vers plusieurs variables.

Page 186: SPSS Base Users Guide 14.0

160

Chapitre 7

Figure 7-16Copie de bandes à partir de ou vers la variable actuelle

Pour copier les spécifications de regroupement en bandes

E Définissez des modalités regroupées en bandes pour une variable au moins (ne cliquezpas sur OK ni sur Coller).

E Dans la zone Liste des variables analysées, cliquez sur une variable pour laquellevous avez défini des modalités regroupées en bandes.

E Cliquez sur Vers d’autres variables.

E Sélectionnez les variables pour lesquelles créer des variables ayant les mêmesmodalités regroupées en bandes.

E Cliquez sur Copier.

ou

E Dans la zone Liste des variables analysées, cliquez sur la variable vers laquelle copierles modalités regroupées en bandes concernées.

E Cliquez sur A partir d’une autre variable.

E Sélectionnez la variable avec les modalités regroupées en bandes définies à copier.

Page 187: SPSS Base Users Guide 14.0

161

Préparation des données

E Cliquez sur Copier.

Si vous avez spécifié des étiquettes de valeur pour la variable à partir de laquelle vouscopiez les spécifications de regroupement, ces étiquettes sont également copiées.

Remarque : Une fois que vous avez cliqué sur OK dans la boîte de dialogue principalede l’outil visuel de regroupement en bandes pour créer les variables regroupées enbandes (ou que vous avez fermé cette boîte de dialogue d’une autre manière), vousne pouvez pas utiliser cet outil pour copier les modalités regroupées en bandes versd’autres variables.

Valeurs manquantes utilisateur dans l’outil visuel de regroupement en bandes

Les valeurs définies comme valeurs manquantes spécifiées par l’utilisateur (valeursidentifiées comme codes pour les données manquantes) pour la variable source nesont pas incluses dans les modalités regroupées en bandes de la nouvelle variable.Les valeurs manquantes utilisateur des variables source sont copiées en tant que tellespour la nouvelle variable. Toutes les étiquettes de valeur définies pour les codes devaleur manquante sont également copiées.

Si un code de valeur manquante est en conflit avec l’une des valeurs de modalitéregroupée en bandes pour la nouvelle variable, le code de la valeur manquante decette nouvelle variable est modifié : 100 est ajouté à la valeur la plus élevée de lamodalité regroupée en bandes. Par exemple, si la valeur 1 est définie comme valeurmanquante utilisateur de la variable source et que la nouvelle variable comporte sixmodalités regroupées en bandes, la valeur 106 de la nouvelle variable vient remplacerla valeur 1 de la variable source pour toutes les observations. Cette valeur devientalors la nouvelle valeur manquante spécifiée par l’utilisateur. Si la valeur manquanteutilisateur de la variable source comporte une étiquette de valeur définie, cettedernière est utilisée comme étiquette pour la valeur recodée de la nouvelle variable.

Remarque : Si la variable source comporte un intervalle défini de valeurs manquantesutilisateur sous la forme LO-n (n étant un nombre positif), les valeurs manquantesutilisateur correspondantes de la nouvelle variable sont des nombres négatifs.

Page 188: SPSS Base Users Guide 14.0
Page 189: SPSS Base Users Guide 14.0

Chapitre

8Transformations de données

Dans une situation idéale, vos données brutes conviennent parfaitement pour letype d’analyse que vous désirez effectuer, et toute relation entre les variables estsoit linéaire soit orthogonale. Malheureusement, c’est rarement le cas. L’analysepréliminaire peut révéler des schémas de codage peu pratiques ou des erreurs decodage, ou des transformations de données peuvent s’avérer nécessaires pourdéterminer la véritable relation entre les variables.

SPSS vous permet d’effectuer des transformations de données simples, commela fusion de modalités pour une analyse, ou des tâches plus évoluées, comme lacréation de nouvelles variables basées sur des équations complexes et des instructionsconditionnelles.

Calcul de variables

Utilisez la boîte de dialogue Calculer pour calculer les valeurs d’une variable enfonction des transformations numériques d’autres variables.

Vous pouvez calculer les valeurs de variables numériques ou sous forme de chaînede caractères (alphanumérique).

Vous pouvez créer de nouvelles variables ou remplacer les valeurs de variablesexistantes. Dans le cas de nouvelles variables, vous pouvez aussi spécifier letype et l’étiquette.

Vous pouvez calculer les valeurs de manière sélective pour des sous-ensembles dedonnées en fonction de conditions logiques.

Vous pouvez utiliser plus de 70 fonctions intégrées, dont des fonctionsarithmétiques, statistiques, de distribution, et de chaîne.

163

Page 190: SPSS Base Users Guide 14.0

164

Chapitre 8

Figure 8-1Boîte de dialogue Calculer la variable

Pour calculer des variables

E A partir des menus, sélectionnez :Transformer

Calculer

E Entrez le nom d’une seule variable cible. Il peut s’agir d’une variable existante oud’une nouvelle variable à ajouter à l’ensemble de données actif.

E Pour construire une expression, vous pouvez soit coller les composants dans le champExpression, soit les saisir directement depuis le clavier.

Pour coller des fonctions ou des variables système couramment utilisées,sélectionnez un groupe dans la liste Groupe de fonctions, puis, dans la listeFonctions et variables spéciales, double-cliquez sur la fonction ou la variablevoulue (ou sélectionnez-la, puis cliquez sur la flèche adjacente à la liste Groupe defonctions). Définissez tous les paramètres indiqués par un point d’interrogation

Page 191: SPSS Base Users Guide 14.0

165

Transformations de données

(cette opération ne concerne que les fonctions). Le groupe de fonctions étiquetéTous répertorie toutes les fonctions et variables système disponibles. Une brèvedescription de la variable ou de la fonction sélectionnée apparaît dans une zoneparticulière de la boîte de dialogue.

Les constantes alphanumériques doivent être présentées entre guillemets ouapostrophes.

Si des valeurs contiennent des chiffres décimaux, utilisez la virgule commeindicateur décimal.

Pour les nouvelles variables chaîne, vous devez aussi sélectionner Type & étiquettepour spécifier le type de données.

Calculer la variable : Expressions conditionnelles

La boîte de dialogue Si... (Expressions conditionnelles) vous permet d’appliquer lestransformations de données à des sous-ensembles d’observations sélectionnées, aumoyen d’expressions conditionnelles. Une expression conditionnelle renvoie la valeurTrue (vrai), False (faux) ou manquant pour chaque observation.

Figure 8-2Boîte de dialogue Expression conditionnelle Calculer la variable

Page 192: SPSS Base Users Guide 14.0

166

Chapitre 8

Si le résultat d’une expression conditionnelle est Vrai, l’observation est inclusedans le sous-ensemble sélectionné.

Si le résultat d’une expression conditionnelle est Faux ou manquant, l’observationn’est pas incluse dans le sous-ensemble sélectionné.

La plupart des expressions conditionnelles utilisent un ou plus des six opérateursrelationnels (<, >, <=, >=, = et ~=) du pavé numérique.

Les expressions conditionnelles peuvent comprendre des noms de variable, desconstantes, des opérateurs arithmétiques, des fonctions (numériques ou non), desvariables logiques et des opérateurs relationnels.

Calculer la variable : Type et étiquette

Par défaut, les nouvelles variables calculées sont numériques. Pour calculer unenouvelle variable chaîne, vous devez spécifier le type de données et sa longueur.

Etiquette. Etiquette de variable facultative et descriptive jusqu’à 120 caractères. Vouspouvez entrer une étiquette ou utiliser les 110 premiers caractères de l’expression decalcul comme étiquette.

Type. Les variables calculées peuvent être numériques ou alphanumériques. Lesvariables chaîne ne peuvent être utilisées dans des calculs.

Figure 8-3Boîte de dialogue Calculer la variable : Type et étiquette

FonctionsPlusieurs types de fonctions sont prises en charge, y compris :

Fonctions arithmétiques

Fonctions statistiques

Page 193: SPSS Base Users Guide 14.0

167

Transformations de données

Fonctions sur chaînes

les fonctions date et heure

Fonctions de distribution

les fonctions de variable aléatoire

les fonctions de valeur manquante

Fonctions d’analyse (serveur SPSS uniquement)

Recherchez les fonctions dans l’index de l’aide en ligne pour obtenir la liste complètedes fonctions.

Valeurs manquantes dans les fonctions

Les fonctions et les expressions arithmétiques simples traitent les valeurs manquantesde manière différente. Dans l’expression :

(var1+var2+var3)/3

le résultat est manquant s’il manque une valeur dans l’une des trois variables d’uneobservation.

Dans l’expression :

MEAN(var1, var2, var3)

le résultat ne manque que si les valeurs des trois variables manquent dansl’observation.

Pour les fonctions statistiques, vous pouvez spécifier le nombre minimal d’argumentsne comportant pas de valeurs manquantes. Pour ce faire, tapez un point et le nombreminimal après le nom de la fonction, comme suit :

MEAN.2(var1, var2, var3)

Générateurs de nombres aléatoires

La boîte de dialogue Générateurs de nombres aléatoires vous permet de sélectionnerle générateur de nombres aléatoires et de définir la valeur de la séquence initiale afinque vous puissiez reproduire une séquence de nombres aléatoires.

Page 194: SPSS Base Users Guide 14.0

168

Chapitre 8

Générateur actif. Deux types de générateur de nombres aléatoires sont disponibles :

Compatible avec SPSS 12. Générateur de nombres aléatoires utilisé dans SPSS 12et les versions précédentes. Si vous avez besoin de reproduire des résultatsaléatoires générés dans des versions précédentes sur la base d'une valeur degénérateur spécifiée, utilisez ce générateur de nombres aléatoires.

Mersenne Twister. Générateur de nombres aléatoires plus récent et plus fiablepour les simulations. Si la reproduction de résultats aléatoires à partir de SPSS12 ou d'une version antérieure n'est pas un problème, utilisez ce générateur denombres aléatoires.

Initialisation du générateur actif. Le nombre aléatoire change chaque fois que SPSSgénère un nombre aléatoire à utiliser dans des transformations (telles que lesfonctions de distribution aléatoire), un échantillonnage aléatoire ou une pondérationd’observation. Pour répliquer une séquence de nombres aléatoires, définissez lavaleur du point de départ de l’initialisation avant chaque analyse utilisant les nombresaléatoires. Il doit s’agir d’un nombre entier positif.

Figure 8-4Boîte de dialogue Générateurs de nombres aléatoires

Page 195: SPSS Base Users Guide 14.0

169

Transformations de données

Pour sélectionner le générateur de nombres aléatoires et/ou définir la valeurd’initialisation :

E A partir des menus, sélectionnez :Transformer

Générateurs de nombres aléatoires

Compter occurrences des valeurs par observation

Cette boîte de dialogue crée une variable qui compte les occurrences des mêmesvaleurs dans une liste de variables pour chaque observation. Par exemple, uneenquête peut comporter une liste de magazines avec des cases à cocher oui/non pourindiquer les magazines lus par chaque répondant. Vous pourriez compter le nombrede réponses oui pour chaque répondant et créer une nouvelle variable contenant lenombre total de magazines lus.

Figure 8-5Boîte de dialogue Compter occurrences des valeurs par observation

Pour compter les occurrences de valeurs par observations

E A partir des menus, sélectionnez :Transformer

Compter

E Entrez le nom d’une variable cible.

Page 196: SPSS Base Users Guide 14.0

170

Chapitre 8

E Sélectionnez deux ou plusieurs variables du même type (numérique oualphanumérique).

E Cliquez sur Définir les valeurs et spécifiez les valeurs à compter.

En option, vous pouvez définir un sous-ensemble d’observations dont il faut compterles occurrences de valeurs.

Compter les occurrences des valeurs par observations : Valeurs à compter

La valeur de la variable cible (dans la boîte de dialogue principale) est incrémentéed’une unité chaque fois que l’une des variables sélectionnées correspond à unespécification dans la liste Valeurs à compter. Si une observation correspondà plusieurs spécifications pour une variable quelconque, la variable cible estincrémentée plusieurs fois pour cette variable.

Les spécifications de valeurs peuvent inclure des valeurs individuelles, des valeursmanquantes ou manquantes par défaut, et des intervalles. Les limites comprennentleurs extrêmes et toute valeur manquante spécifiée figurant dans l’intervalle.

Figure 8-6Boîte de dialogue Compter occurrences des valeurs par observation : Valeurs à compter

Page 197: SPSS Base Users Guide 14.0

171

Transformations de données

Compter occurrences : Expressions conditionnelles

La boîte de dialogue Si... (Expressions conditionnelles) vous permet de compter lesoccurrences des valeurs pour un sous-ensemble donné d’observations, au moyend’expressions conditionnelles. Une expression conditionnelle renvoie la valeur True(vrai), False (faux) ou manquant pour chaque observation.

Figure 8-7Boîte de dialogue Expression conditionnelle Compter occurrences

Pour obtenir des informations d’ordre général sur l’utilisation de la boîte dedialogue Si les observations, reportez-vous à « Calculer la variable : Expressionsconditionnelles » à p. 165.

Recodage de valeurs

Vous pouvez modifier les valeurs de données en les recodant. Ceci est particulièrementutile pour fusionner des modalités ou les combiner. Vous pouvez recoder les valeursà l’intérieur de variables existantes ou créer des variables sur la base des valeursrecodées de variables existantes.

Page 198: SPSS Base Users Guide 14.0

172

Chapitre 8

Recodage de variablesLa boîte de dialogue Recodage de variables vous permet de réaffecter les valeursde variables existantes ou de fusionner des intervalles de valeurs existantes dansde nouvelles valeurs. Par exemple, vous pourriez fusionner des salaires dans desmodalités d’intervalles de salaires.

Vous pouvez recoder des variables numériques et chaîne. Si vous sélectionnezplusieurs variables, elles doivent toutes être du même type. Vous ne pouvez pasrecoder ensemble des variables numériques et chaîne.

Figure 8-8Boîte de dialogue Recodage de variables

Pour recoder les valeurs d’une variable

E A partir des menus, sélectionnez :Transformer

RecodeRecodage de variables

E Sélectionnez les variables que vous désirez recoder. Si vous sélectionnez plusieursvariables, elles doivent être du même type (numérique ou alphanumérique).

E Cliquez sur Anciennes et nouvelles valeurs et spécifiez comment recoder les valeurs.

En option, vous pouvez définir un sous-ensemble d’observations à recoder. La boîtede dialogue Si les observations permettant d’effectuer cette opération est identique àcelle décrite pour le comptage d’occurrences.

Page 199: SPSS Base Users Guide 14.0

173

Transformations de données

Recodage de variables : Anciennes et nouvelles valeurs

Vous pouvez définir les valeurs à recoder dans cette boîte de dialogue. Toutes lesspécifications de valeurs doivent être du même type de données (numérique oualphanumérique) que les variables sélectionnées dans la boîte de dialogue principale.

Ancienne valeur. Valeurs à recoder. Vous pouvez recoder des valeurs uniques, desintervalles de valeurs, et des valeurs manquantes. Les valeurs manquantes par défautet les intervalles ne peuvent être sélectionnés pour des variables chaîne, car aucunde ces concepts ne s’applique à ce type de variable. Les limites comprennent leursextrêmes et toute valeur manquante spécifiée figurant dans l’intervalle.

Valeur. Les anciennes valeurs individuelles doivent être recodées par de nouvellesvaleurs. La valeur doit être du même type de données (numérique ou chaîne) quela variable que vous recodez.

Manquant par défaut. Valeurs affectées par le programme lorsque certaines valeursde vos données sont non définies d'après le type de format spécifié, lorsqu'unchamp numérique est vide ou lorsqu'une valeur résultant d'une commande detransformation n'est pas définie. Les valeurs manquantes par défaut numériquessont affichées sous forme de points. Les variables chaîne ne peuvent pascomporter de valeurs manquantes par défaut, puisqu'elles acceptent tous lescaractères.

Manquante par défaut ou spécifiée. Observations comportant des valeurs définiescomme valeurs utilisateur manquantes, ou comportant des valeurs inconnues etauxquelles ont été attribuées des valeurs par défaut, comme l'indique le point (.).

Plage. Intervalle de valeurs inclusif. Non disponible pour les variables de chaîne.Les valeurs manquantes spécifiées comprises dans l'intervalle sont prises encompte.

Toutes les autres valeurs. Toute autre valeur non incluse dans l'une desspécifications de la liste Ancienne-Nouvelle. Apparaît sous l'intitulé ELSE dansla liste Ancienne-Nouvelle.

Nouvelle valeur. Valeur unique en laquelle chaque ancienne valeur ou intervalle devaleurs est recodé. Vous pouvez entrer une valeur ou la valeur manquante par défaut.

Page 200: SPSS Base Users Guide 14.0

174

Chapitre 8

Valeur. Valeur dans laquelle une ou plusieurs valeurs anciennes devront êtrerecodées. La valeur doit être du même type de données (numérique ou chaîne)que l'ancienne variable.

Manquant par défaut. Recode les anciennes valeurs spécifiées en valeursmanquantes par défaut. Les valeurs manquantes par défaut ne sont pas utiliséesdans les calculs, et les observations avec des valeurs manquantes par défaut sontexclues de nombreuses procédures. Non disponible pour les variables de chaîne.

Ancienne–>Nouvelle. liste les spécifications qui seront utilisées pour recoder la ou lesvariables. Vous pouvez ajouter, modifier et supprimer des spécifications dans la liste.La liste est triée automatiquement, en fonction de la spécification de l’ancienne valeur,selon l’ordre suivant : valeurs uniques, valeurs manquantes, intervalles, puis toutesles autres valeurs. Si vous changez une spécification de recodage dans la liste, SPSStrie de nouveau la liste automatiquement, si nécessaire, pour conserver cet ordre.

Figure 8-9Boîte de dialogue Anciennes et nouvelles valeurs

Création de variables

La boîte de dialogue Création de variables vous permet de réaffecter les valeurs devariables existantes ou de fusionner des intervalles de valeurs existantes dans denouvelles valeurs pour une nouvelle variable. Par exemple, vous pourriez fusionnerles salaires en une nouvelle variable contenant des modalités d’intervalles de salaires.

Page 201: SPSS Base Users Guide 14.0

175

Transformations de données

Vous pouvez recoder des variables numériques et chaîne.

Vous pouvez recoder des variables numériques en variables chaîne et inversement.

Si vous sélectionnez plusieurs variables, elles doivent toutes être du même type.Vous ne pouvez pas recoder ensemble des variables numériques et chaîne.

Figure 8-10Boîte de dialogue Recoder et créer de nouvelles variables

Pour recoder les valeurs d’une variable dans une nouvelle variable

E A partir des menus, sélectionnez :Transformer

RecodeCréation de variables

E Sélectionnez les variables que vous désirez recoder. Si vous sélectionnez plusieursvariables, elles doivent être du même type (numérique ou alphanumérique).

E Entrez un nom de variable de résultat (nouveau) pour chaque nouvelle variable, puiscliquez sur Remplacer.

E Cliquez sur Anciennes et nouvelles valeurs et spécifiez comment recoder les valeurs.

En option, vous pouvez définir un sous-ensemble d’observations à recoder. La boîtede dialogue Si les observations permettant d’effectuer cette opération est identique àcelle décrite pour le comptage d’occurrences.

Page 202: SPSS Base Users Guide 14.0

176

Chapitre 8

Recoder et créer de nouvelles variables : Anciennes et nouvelles valeurs

Vous pouvez définir les valeurs à recoder dans cette boîte de dialogue.

Ancienne valeur. Valeurs à recoder. Vous pouvez recoder des valeurs uniques, desintervalles de valeurs, et des valeurs manquantes. Les valeurs manquantes par défautet les intervalles ne peuvent être sélectionnés pour des variables chaîne, car aucun deces concepts ne s’applique à ce type de variable. Les anciennes valeurs doivent êtredu même type de données (numérique ou alphanumérique) que la variable d’origine.Les limites comprennent leurs extrêmes et toute valeur manquante spécifiée figurantdans l’intervalle.

Valeur. Les anciennes valeurs individuelles doivent être recodées par de nouvellesvaleurs. La valeur doit être du même type de données (numérique ou chaîne) quela variable que vous recodez.

Manquant par défaut. Valeurs affectées par le programme lorsque certaines valeursde vos données sont non définies d'après le type de format spécifié, lorsqu'unchamp numérique est vide ou lorsqu'une valeur résultant d'une commande detransformation n'est pas définie. Les valeurs manquantes par défaut numériquessont affichées sous forme de points. Les variables chaîne ne peuvent pascomporter de valeurs manquantes par défaut, puisqu'elles acceptent tous lescaractères.

Manquante par défaut ou spécifiée. Observations comportant des valeurs définiescomme valeurs utilisateur manquantes, ou comportant des valeurs inconnues etauxquelles ont été attribuées des valeurs par défaut, comme l'indique le point (.).

Plage. Intervalle de valeurs inclusif. Non disponible pour les variables de chaîne.Les valeurs manquantes spécifiées comprises dans l'intervalle sont prises encompte.

Toutes les autres valeurs. Toute autre valeur non incluse dans l'une desspécifications de la liste Ancienne-Nouvelle. Apparaît sous l'intitulé ELSE dansla liste Ancienne-Nouvelle.

Nouvelle valeur. Valeur unique en laquelle chaque ancienne valeur ou intervallede valeurs est recodé. Les nouvelles valeurs peuvent être numériques oualphanumériques.

Valeur. Valeur dans laquelle une ou plusieurs valeurs anciennes devront êtrerecodées. La valeur doit être du même type de données (numérique ou chaîne)que l'ancienne variable.

Page 203: SPSS Base Users Guide 14.0

177

Transformations de données

Manquant par défaut. Recode les anciennes valeurs spécifiées en valeursmanquantes par défaut. Les valeurs manquantes par défaut ne sont pas utiliséesdans les calculs, et les observations avec des valeurs manquantes par défaut sontexclues de nombreuses procédures. Non disponible pour les variables de chaîne.

Copier les anciennes valeurs. Conserve les anciennes valeurs. Si certainesvaleurs n'ont pas besoin d'être recodées, utilisez cette option pour inclure lesanciennes valeurs. Toute ancienne valeur non spécifiée n'est pas incluse dans lanouvelle variable, et les observations avec ces valeurs se verront affecter la valeurmanquante par défaut de la nouvelle variable.

Variables destination sont des chaînes. Définit la nouvelle variable recodée comme unevariable chaîne (alphanumérique). L'ancienne variable peut être numérique ou chaîne.

Convertir les chaînes numériques en nombres. Convertit les variables de chaînecontenant des chiffres en valeurs numériques. Les chaînes de caractères contenantautre chose que des nombres et des signes (+ ou -) sont considérées comme desvaleurs manquantes par défaut.

Ancienne–>Nouvelle. liste les spécifications qui seront utilisées pour recoder la ou lesvariables. Vous pouvez ajouter, modifier et supprimer des spécifications dans la liste.La liste est triée automatiquement, en fonction de la spécification de l’ancienne valeur,selon l’ordre suivant : valeurs uniques, valeurs manquantes, intervalles, puis toutesles autres valeurs. Si vous changez une spécification de recodage dans la liste, SPSStrie de nouveau la liste automatiquement, si nécessaire, pour conserver cet ordre.

Figure 8-11Boîte de dialogue Anciennes et nouvelles valeurs

Page 204: SPSS Base Users Guide 14.0

178

Chapitre 8

Ordonner les observations

La boîte de dialogue Ordonner les observations vous permet de créer de nouvellesvariables contenant des rangs, des scores normaux et de Savage, ainsi que des valeursde centiles pour les variables numériques.

De nouveaux noms de variables et des étiquettes de variable descriptives sontautomatiquement générées par SPSS, en fonction du nom d’origine de la variable etdes mesures sélectionnées. Un tableau récapitulatif liste les variables d’origine, lesnouvelles variables et les étiquettes de variable.

Sinon, vous pouvez :

Ordonner les observations en ordre croissant ou décroissant.

Séparez les rangs en sous-groupes en sélectionnant des variables de regroupementpour la liste Par. Les rangs sont calculés à l’intérieur de chaque groupe. Lesgroupes sont définis par combinaison des valeurs des variables de regroupement.Par exemple, si vous sélectionnez sexe et minorité comme variables deregroupement, les rangs seront calculés pour chaque combinaison de sexe etminorité.

Figure 8-12Boîte de dialogue Ordonner les observations...

Page 205: SPSS Base Users Guide 14.0

179

Transformations de données

Pour ordonner les observations

E A partir des menus, sélectionnez :Transformer

Ordonner les observations

E Sélectionnez des variables à ordonner. Vous ne pouvez ordonner que des variablesnumériques.

En option, vous pouvez ordonner les observations en ordre croissant ou décroissant etséparer les rangs en sous-groupes.

Ordonner les observations : Types (de rangs)

Vous pouvez sélectionner plusieurs méthodes d’ordonnancement. Une variabled’ordonnancement distincte est créée pour chaque méthode. Les méthodesd’ordonnancement comprennent les rangs simples, les scores de Savage, les rangsfractionnaires et les centiles. Vous pouvez aussi créer des ordonnancements basés surdes estimations de la proportion et des scores normaux.

Rang. Rang simple. La valeur de la nouvelle variable est égale à son rang.

Score de Savage. La nouvelle variable contient des scores de Savage reposant surune distribution exponentielle.

Rang fractionnaire. La valeur de la nouvelle variable est égale au rang divisé par lasomme des pondérations des observations non manquantes.

Rang en pourcentage. Chaque rang est divisé par le nombre d'observations ayantdes valeurs valides et multiplié par 100.

Somme des poids. La valeur de la nouvelle variable est égale à la somme despondérations d'observation. La nouvelle variable est une constante pour toutes lesobservations du même groupe.

Fractiles. Les rangs sont basés sur des groupes de centiles, chaque groupe contenant àpeu près le même nombre d'observations. Par exemple, une spécification de 4 fractilesaffectera une valeur de 1 aux observations inférieures au 25e centile, de 2 à cellessituées entre les 25e et 50e centiles, de 3 à celles situées entre les 50e et 75e centiles,et de 4 à celles supérieures au 75e centile.

Estimations de la proportion. Estimations de la proportion cumulée de la distributioncorrespondant à un rang particulier.

Page 206: SPSS Base Users Guide 14.0

180

Chapitre 8

Scores normaux. Ecarts z correspondant à la proportion cumulée estimée.

Formule d’estimation d’une proportion. Pour les estimations de la proportion et lesscores normaux, vous pouvez sélectionner la formule d’estimation d’une proportion :Blom, Tukey, Rankit ou Van der Waerden.

Blom. Crée une variable d'ordonnancement sur la base des estimations de laproportion, qui utilise la formule (r-3/8) / (w+1/4), où r est le rang et w la sommedes pondérations d'observation.

Tukey. Utilise la formule (r-1/3) / (w+1/3), dans laquelle r est le rang et w lasomme des pondérations d'observation.

Rankit. Utilise la formule (r-1/2) / w, w représentant le nombre d'observationset r le rang, de 1 à w.

Van der Waerden. Transformation de Van der Waerden, définie par la formuler/(w+1), dans laquelle w est la somme des pondérations d'observation et r le rang,compris entre 1 et w.

Figure 8-13Boîte de dialogue Ordonner les observations : Types

Ordonner les observations : Ex aequo

Cette boîte de dialogue détermine la méthode d’affectation pour ordonner lesobservations ayant la même valeur que la variable d’origine.

Page 207: SPSS Base Users Guide 14.0

181

Transformations de données

Figure 8-14Boîte de dialogue Ordonner les observations : Ex aequo

Le tableau suivant montre comment les différentes méthodes affectent des rangsà des valeurs ex aequo.

Valeur Moyenne Faible Elevée Séquentielle

10 1 1 1 1

15 3 2 4 2

15 3 2 4 2

15 3 2 4 2

16 5 5 5 3

20 6 6 6 4

Recoder automatiquement

La boîte de dialogue Recodage automatique vous permet de convertir les valeursnumériques et alphanumériques en entiers consécutifs. Lorsque les codes de modaliténe sont pas séquentiels, les cellules vides qui en résultent réduisent les performanceset augmentent les besoins en mémoire de nombreuses procédures SPSS. De plus,certaines procédures ne peuvent utiliser des variables chaîne, et certaines ont besoinde valeurs entières consécutives pour les niveaux de facteurs.

Page 208: SPSS Base Users Guide 14.0

182

Chapitre 8

Figure 8-15Boîte de dialogue Recoder automatiquement

Les nouvelles variables créées par le Recodage automatique conservent toutevariable définie et les étiquettes de valeurs de l’ancienne variable. Pour toutevaleur sans étiquette de définition de valeur, la valeur d’origine est utiliséecomme étiquette pour la valeur recodée. Un tableau affiche les anciennes et lesnouvelles valeurs et les étiquettes de valeurs.

Les valeurs de chaîne sont recodées dans l’ordre alphabétique, les majusculesprécédant leurs équivalents minuscules.

Les valeurs manquantes sont recodées en valeurs manquantes supérieures à toutesvaleurs non manquantes, en conservant leur ordre. Par exemple, si la variabled’origine comporte 10 valeurs non manquantes, la valeur manquante la plusfaible serait recodée en 11 et la valeur 11 serait une valeur manquante pour lanouvelle variable.

Utilisez le même système de recodage pour toutes les variables. Cette option vouspermet d’appliquer un seul système de recodage automatique à toutes les variablessélectionnées et de générer un système de codage approprié pour toutes les nouvellesvariables.

Page 209: SPSS Base Users Guide 14.0

183

Transformations de données

Si vous sélectionnez cette option, les règles et limites suivantes s’appliquent :

Toutes les variables doivent être du même type (numérique ou alphanumérique).

La totalité des valeurs observées pour toutes les variables sélectionnées est utiliséepour trier les valeurs afin de les recoder en entiers séquentiels.

Les valeurs utilisateur manquantes des nouvelles variables dépendent de lapremière variable de la liste contenant les valeurs utilisateur manquantes définies.Toutes les autres valeurs des autres variables d’origine, à l’exception des valeursmanquantes par défaut, sont traitées comme des valeurs valides.

Traiter les valeurs de chaîne vide comme valeurs manquantes spécifiées par l’utilisateur.Pour les variables chaîne, les valeurs nulles ou vides ne sont pas traitées comme desvaleursmanquantes par défaut. Cette option permet de recoder automatiquementune chaîne vide en unevaleur utilisateur manquante supérieure à la valeur nonmanquante la plus élevée.

Modèles

Vous pouvez enregistrer le système de recodage automatique dans un fichier demodèle, puis l’appliquer à d’autres variables et fichiers de données.

Exemple : vous disposez d’un grand nombre de codes de produit alphanumériquesque vous recodez automatiquement en nombres entiers tous les mois. Toutefois,certains mois, de nouveaux codes de produit sont ajoutés et le système de recodageautomatique d’origine est modifié. Si vous enregistrez le système d’origine dans unmodèle et que vous l’appliquez aux nouvelles données qui contiennent le nouvelensemble de codes, tous les nouveaux codes présents dans les données sont recodésautomatiquement en valeurs supérieures à la dernière valeur du modèle. Le systèmede recodage automatique d’origine des codes de produit d’origine est ainsi conservé.

Enregistrer le modèle sous. Enregistre le système de recodage automatique desvariables sélectionnées dans un fichier de modèle externe.

Le modèle contient des informations qui établissent une correspondance entre lesvaleurs non manquantes d’origine et les valeurs recodées.

Seules les informations relatives aux valeurs non manquantes sont enregistréesdans le modèle. Les informations relatives aux valeurs utilisateur manquantes nesont pas enregistrées.

Page 210: SPSS Base Users Guide 14.0

184

Chapitre 8

Si vous avez sélectionné plusieurs variables à recoder, mais que vous n’utilisezpas le même système de recodage automatique pour toutes les variables, ou quevous n’appliquez pas un modèle existant lors du recodage automatique, le modèledépend de la première variable de la liste.

Si vous avez sélectionné plusieurs variables à recoder et Utiliser la même méthoded’enregistrement pour toutes les variables, et/ou que vous avez choisi Appliquer lemodèle, le modèle contient le système de recodage automatique combiné detoutes les variables.

Appliquer le modèle à partir de. Applique un modèle de recodage automatique déjàenregistré aux variables sélectionnées pour le recodage, en ajoutant des valeurssupplémentaires de variables à la fin du système, et en conservant les relations entreles valeurs d’origine et les valeurs recodées automatiquement qui sont stockées dansle système enregistré.

Toutes les variables sélectionnées pour le recodage doivent être du même type(numérique ou alphanumérique) et ce type doit correspondre à celui défini dansle modèle.

Les modèles ne contiennent aucune information sur les valeurs utilisateurmanquantes. Les valeurs utilisateur manquantes des variables cible dépendentde la première variable de la liste des variables d’origine contenant les valeursutilisateur manquantes définies. Toutes les autres valeurs des autres variablesd’origine, à l’exception des valeurs manquantes par défaut, sont traitées commedes valeurs valides.

Les correspondances de valeurs du modèle sont appliquées en premier. Toutesles valeurs restantes sont recodées en valeurs supérieures à la dernière valeurdu modèle, et les valeurs utilisateur manquantes (qui dépendent de la premièrevariable de la liste contenant les valeurs utilisateur manquantes définies) sontrecodées en valeurs supérieures à la dernière valeur valide.

Si vous avez sélectionné plusieurs variables pour le recodage automatique, lemodèle est d’abord appliqué, suivi du recodage automatique combiné standard detoutes les valeurs supplémentaires détectées dans les variables sélectionnées. Unseul système de recodage automatique standard est ainsi généré pour toutes lesvariables sélectionnées.

Page 211: SPSS Base Users Guide 14.0

185

Transformations de données

Pour recoder des variables numériques ou alphanumériques en nombres entiersconsécutifs

E A partir des menus, sélectionnez :Transformer

Recoder automatiquement

E Sélectionnez des variables à recoder.

E Pour chaque variable sélectionnée, entrez un nom pour la nouvelle variable, puiscliquez sur Nouveau nom.

Assistant Date et heure

L’Assistant Date et heure simplifie un grand nombre de tâches courantes en relationavec les variables date et heure.

Pour utiliser l’Assistant Date et heure

E A partir des menus, sélectionnez :Transformer

Date/Heure...

E Sélectionnez la tâche que vous souhaitez accomplir et suivez les étapes pour la définir.

Page 212: SPSS Base Users Guide 14.0

186

Chapitre 8

Figure 8-16Ecran de présentation de l’Assistant Date et heure

Découvrir comment les dates et heures sont représentées dans SPSS. Cetteopération fait apparaître un écran contenant une brève présentation des variablesdate/heure dans SPSS. Le bouton Aide fait également apparaître un lien vers desinformations plus détaillées.

Créer une variable date/heure à partir d’une variable chaîne contenant une dateou une heure. Utilisez cette option pour créer une variable date/heure à partird’une variable chaîne. Par exemple, vous avez une variable chaîne représentantdes dates au format jj/mm/aaaa et vous souhaitez créer une variable date/heureà partir de la variable chaîne.

Créer une variable date/heure à partir de parties existantes de variables contenantune date ou une heure. Cette opération vous permet de construire une variabledate/heure à partir d’un ensemble de variables existantes. Par exemple, vousavez une variable représentant le mois (sous la forme d’un nombre entier), unedeuxième représentant le jour du mois et une troisième l’année. Vous pouvezcombiner ces trois variables pour créer une seule variable date/heure.

Page 213: SPSS Base Users Guide 14.0

187

Transformations de données

Calculer les dates et les heures. Utilisez cette option pour ajouter ou supprimer desvaleurs dans les variables date/heure. Par exemple, vous pouvez calculer la duréed’un processus en soustrayant une variable représentant le début du processusd’une autre variable représentant sa fin.

Extraire une partie d’une variable date ou heure. Cette option vous permet d’extraireune partie d’une variable date/heure, telle que le jour du mois d’une variabledate/heure de format jj/mm/aaaa.

Attribuer une périodicité à un ensemble de données. Cette opération fait apparaîtrela boîte de dialogue Définir des dates, utilisée pour créer des variables date/heurecomposées d’un ensemble de dates séquentielles. Cette fonctionnalité esttypiquement utilisée pour l’association de dates à des données de sérieschronologiques.

Remarque : Les tâches sont désactivées lorsque l’ensemble de données ne disposepas des types de variables requis pour accomplir la tâche. Si l’ensemble de donnéescontient des variables sans chaîne par exemple, la tâche permettant de créer unevariable date/heure à partir d’une variable chaîne ne s’applique donc pas et se trouvealors désactivée.

Dates et heures dans SPSS

Les variables représentant les dates et heures dans SPSS possèdent une variable detype numérique avec des formats d’affichages correspondant aux formats date/heurespécifiques. Ces variables sont généralement appelées variables date/heure. SPSSfait une distinction entre les variables date/heure représentant des dates et cellesreprésentant des durées (par exp. 20 heures, 10 minutes et 15 secondes) qui nedépendent de la date. Ces dernières sont appelées variables de durée et les premièressont appelées variables date ou variables date/heure. Pour une liste détaillée desformats d’affichage, reportez vous au paragraphe intitulé « Date and Time » de lasection « Universals » du manuel SPSS Command Syntax Reference.

Variables date et date/heure. Les variables date disposent d’un format de date tel quejj/mm/aaaa. Les variables date/heure disposent d’un format date et heure tel quejj-mmm-aaaa hh:mm:ss. Les variables date et date/heure sont enregistrées en interneen nombre de secondes depuis le 14 octobre 1582. Elles sont également appeléesvariables de format date.

Page 214: SPSS Base Users Guide 14.0

188

Chapitre 8

Les spécifications des années à deux ou quatres chiffres sont reconnues. Pardéfaut, des années à deux chiffres représentent une plage commençant 69 annéesavant la date courante et finissant 30 années après. Vos paramètres Optionspermettent de déterminer la plage et de la configurer (sélectionnez Options àpartir du menu Modifier, puis cliquez sur l’onglet Données.

Les tirets, points, virgules, barres obliques ou espaces peuvent être utilisés commeséparateurs dans les formats jour-mois-année.

Les mois peuvent être représentés par des chiffres, des chiffres romains, desabréviations à trois lettres, ou bien ils peuvent être énoncés en entier. Lesabbréviations à trois lettres et les noms de mois énoncés en entier doivent être enanglais. Les noms de mois d’autres langues ne seront pas reconnus.

Variables de durée. Les variables de durée disposent d’un format représentant unedurée temporelle, telle que hh:mm. Elles sont enregistrées en interne en nombres desecondes sans référence à une date en particulier.

Dans les spécifications temporelles (s’applique aux variables date/heure etdurée), les deux points peuvent être utilisés pour séparer les heures, les minuteset les secondes. Les heures et les minutes sont requises, les secondes restentoptionnelles. A period is required to separate seconds from fractional seconds.Les heures peuvent être avoir des valeurs illimitées, cependant la valeur maximumest de 59 pour les minutes et de 59,999... pour les secondes.

Date et heure actuelles. La variable par défaut $TIME contient la date et l’heureactuelles. Elle représente le nombre de secondes écoulées depuis le 14 octobre 1582,jusqu’à la date et l’heure auxquelles la commande de transformation utilisée pourcette variable est exécutée.

Création d’une variable date/heure à partir d’une variable chaîne

Pour créer une variable date/heure à partir d’une variable chaîne :

E Sélectionnez Créer une variable date/heure à partir d’une variable chaîne contenant une

date ou une heure sur l’écran de présentation de l’Assistant Date et heure.

Page 215: SPSS Base Users Guide 14.0

189

Transformations de données

Sélection d’une variable chaîne à convertir en une variable date/heure

Figure 8-17Etape 1 : Création d’une variable date/heure à partir d’une variable chaîne

E Sélectionnez la variable chaîne à convertir dans la liste Variables. Notez que cetteliste affiche uniquement des variables chaîne.

E Dans la liste Motifs, sélectionnez le motif correspondant à la manière dont les datessont représentées par la variable chaîne. La liste Valeurs de l’échantillon affiche lesvaleurs actuelles des variables sélectionnées dans le fichier de données. Les valeursde la variable chaîne qui ne correspondent pas au motif sélectionné engendrent unevaleur manquante par défaut pour la nouvelle variable.

Page 216: SPSS Base Users Guide 14.0

190

Chapitre 8

Spécification du résultat de conversion d’une variable chaîne en une variabledate/heure

Figure 8-18Etape 2 : Création d’une variable date/heure à partir d’une variable chaîne

E Entrez un nom pour la variable de résultat. Le nom ne peut pas être identique à unevariable existante.

Sinon, vous pouvez :

sélectionner un format date/heure pour la nouvelle variable dans la liste Formatsdes résultats.

attribuer une étiquette de variable descriptive à la nouvelle variable.

Création d’une variable date/heure à partir d’un ensemble de variables

Pour fusionner un ensemble de variables existantes en une variable date/heure unique :

E Sélectionnez Créer une variable date/heure à partir de parties existantes de variables

contenant une date ou une heure sur l’écran de présentation de l’Assistant Dateet heure.

Page 217: SPSS Base Users Guide 14.0

191

Transformations de données

Sélection de variables à fusionner en une variable date/heure unique

Figure 8-19Etape 1 : Création d’une variable date/heure à partir d’un ensemble de variables

E Sélectionnez les variables représentant les différentes parties de la date et de l’heure.

Certaines combinaisons de sélections ne sont pas autorisées. Par exemple, lacréation d’une variable date/heure à partir de Année et Jour du mois n’est pasvalide car une fois Année sélectionné, une date complète est requise.

Vous ne pouvez pas utiliser une variable date/heure existante comme l’une desparties de la variable date/heure finale que vous créez. Les variables formant lesparties de la nouvelle variable date/heure doivent correspondre à des nombresentiers. Il est toutefois possible d’utiliser une variable date/heure existante pour lapartie Secondes de la nouvelle variable. Etant donné que les fractions de secondessont autorisées, la variable utilisée pour Secondes ne doit pas nécessairementêtre un nombre entier.

Les valeurs, pour n’importe quelle partie de la nouvelle variable, non comprisesdans l’intervalle autorisé engendrent une valeur manquante par défaut pour lanouvelle variable. Par exemple, si, par inadvertance, vous utilisez une variablereprésentant le jour du mois pour le mois. Puisque la plage de valeurs valides deSPSS concernant les mois est comprise entre 1 et 113, une valeur manquante par

Page 218: SPSS Base Users Guide 14.0

192

Chapitre 8

défaut pour la nouvelle variable sera attribuée à toute observation dont la valeurJour du mois (jour du mois) sera comprise dans la plage 14 et 31.

Spécification d’une variable date/heure créée par la fusion de variables

Figure 8-20Etape 2 : Création d’une variable date/heure à partir d’un ensemble de variables

E Entrez un nom pour la variable de résultat. Le nom ne peut pas être identique à unevariable existante.

E Sélectionnez un format de date/heure dans la liste Formats des résultats.

Sinon, vous pouvez :

attribuer une étiquette de variable descriptive à la nouvelle variable.

Page 219: SPSS Base Users Guide 14.0

193

Transformations de données

Ajout de valeurs aux variables date/heure ou suppression de valeurs desvariables date/heure

Pour ajouter des valeurs aux variables date/heure ou en supprimer :

E Sélectionnez l’option Calculer les dates et les heures dans l’écran de présentation del’Assistant Date et heure.

Sélection du type de calcul à effectuer avec les variables date/heure.

Figure 8-21Etapes 1 : Ajout de valeurs aux variables date/heure ou suppression de valeurs desvariables date/heure

Ajout d’une durée à une date ou Suppression d’une durée d’une date. Utilisez cetteoption pour ajouter des valeurs à la variable de format date ou supprimer desvaleurs d’une variable de format date. Vous pouvez ajouter ou supprimer desdurées avec des valeurs fixes comme 10 jours ou les valeurs d’une variablenumérique, comme une variable représentant les années.

Page 220: SPSS Base Users Guide 14.0

194

Chapitre 8

Calculer le temps écoulé entre deux dates. Utilisez cette option pour obtenir ladifférence entre les deux dates comme mesurée dans une unité choisie. Parexemple, vous pouvez obtenir le nombre d’années ou le nombre de jours séparantles deux dates.

Supprimer deux durées. Utilisez cette option pour obtenir la différence entre deuxvariables ayant des formats de durée tels que hh:mm ou hh:mm:ss.

Remarque : Les tâches sont désactivées lorsque l’ensemble de données ne disposepas des types de variables requis pour accomplir la tâche. Par exemple, si l’ensemblede données ne dispose pas de deux variables avec des formats de durée, la tâchepermettant alors de supprimer deux durées ne s’applique plus et se trouve alorsdésactivée.

Ajout d’une durée à une date ou suppression d’une durée d’une date

Pour ajouter une durée à variable de format date ou supprimer une durée d’unevariable de format date :

E Sélectionnez Ajout d’une durée à une date ou Suppression d’une durée d’une date surl’écran intitulé Effectuer des calculs sur les dates de l’Assistant Date et heure.

Page 221: SPSS Base Users Guide 14.0

195

Transformations de données

Sélection d’une variable date/heure et d’une durée à ajouter ou supprimer

Figure 8-22Etape 2 : Ajout ou suppression d’une durée

E Sélectionnez une variable date (ou heure).

E Sélectionnez une variable durée ou entrez une valeur d’une durée constante. Lesvariables utilisées pour les durées ne peuvent pas être des variables date ou desvariables date/heure. Il peut s’agir de variables de durée ou de simples variablesnumériques.

E Sélectionnez l’unité représentée par la durée dans la liste déroulante. SélectionnezDurée si vous utilisez une variable et que celle-ci est exprimée sous la forme d’unedurée, telle que hh:mm ou hh:mm:ss.

Page 222: SPSS Base Users Guide 14.0

196

Chapitre 8

Spécification du résultat de l’ajout ou de la suppression d’une durée dans une variabledate/heure

Figure 8-23Etape 3 : Ajout ou suppression d’une durée

E Entrez un nom pour la variable de résultat. Le nom ne peut pas être identique à unevariable existante.

Sinon, vous pouvez :

attribuer une étiquette de variable descriptive à la nouvelle variable.

Suppression de variables de format date

Pour supprimer deux variables de format date :

E Sélectionnez Calculer le temps écoulé entre deux dates sur l’écran de l’Assistant Dateet heure intitulé Effectuer les calculs sur les dates.

Page 223: SPSS Base Users Guide 14.0

197

Transformations de données

Sélection des variables de format date à supprimer

Figure 8-24Etape 2 : Suppression de dates

E Sélectionnez les variables à supprimer.

E Sélectionnez l’unité du résulat dans la liste déroulante.

Page 224: SPSS Base Users Guide 14.0

198

Chapitre 8

Spécification du résultat de suppression de deux variables de format date

Figure 8-25Etape 3 : Suppression de dates

E Entrez un nom pour la variable de résultat. Le nom ne peut pas être identique à unevariable existante.

Sinon, vous pouvez :

attribuer une étiquette de variable descriptive à la nouvelle variable.

Suppression de variables de durée

Pour supprimer deux variables de durée :

E Sélectionnez Supprimer deux durées sur l’écran intitulé Effectuer des calculs surles dates de l’Assistant date et heure .

Page 225: SPSS Base Users Guide 14.0

199

Transformations de données

Sélection de variables de durée à supprimer

Figure 8-26Etape 2 : Suppression de durées

E Sélectionnez les variables à supprimer.

Page 226: SPSS Base Users Guide 14.0

200

Chapitre 8

Spécification du résultat de suppression de deux variables de durée

Figure 8-27Etape 3 : Suppression de durées

E Entrez un nom pour la variable de résultat. Le nom ne peut pas être identique à unevariable existante.

E Sélectionnez un format de durée dans la liste Formats des résultats.

Sinon, vous pouvez :

attribuer une étiquette de variable descriptive à la nouvelle variable.

Extraction d’une partie d’une variable date/heure

Pour extraire un composant (l’année par exemple) d’une variable date/heure :

E Sélectionnez Extraire une partie d’une variable date ou heure sur l’écran de présentationde l’Assistant Date et heure.

Page 227: SPSS Base Users Guide 14.0

201

Transformations de données

Sélection du composant à extraire d’une variable date/heure

Figure 8-28Etape 1 : Obtention d’une partie d’une variable date/heure

E Sélectionnez la variable contenant la partie date ou heure à extraire.

E Sélectionnez la partie de la variable à extraire dans la liste déroulante. Vous pouvezextraire les informations des dates qui ne sont pas explicitement affichées dans ladate, telles que le jour de la semaine.

Page 228: SPSS Base Users Guide 14.0

202

Chapitre 8

Spécification du résultat obtenu par l’extraction d’un composant d’une variabledate/heure

Figure 8-29Etape 2 : Obtention d’une partie d’une variable date/heure

E Entrez un nom pour la variable de résultat. Le nom ne peut pas être identique à unevariable existante.

E Si vous extrayez la partie date ou heure d’une variable date/heure, vous devez alorssélectionner un format dans la liste Formats des résultats. Les observations pourlesquelles le format du résultat n’est pas requis, la liste Format du résultat seradésactivée.

Sinon, vous pouvez :

attribuer une étiquette de variable descriptive à la nouvelle variable.

Page 229: SPSS Base Users Guide 14.0

203

Transformations de données

Transformation de données pour série chronologiquePlusieurs transformations de données utiles pour les analyses de séries chronologiquessont fournies :

Génération de variables de date pour établir une périodicité et faire la distinctionentre les périodes historiques, de validation et de prévision.

Création de nouvelles variables de séries chronologiques sous forme de fonctionsde variables de séries chronologiques existantes.

Remplacement des valeurs manquantes spécifiées et des valeurs manquantes pardéfaut par des estimations basées sur une méthode parmi plusieurs.

Une série chronologique est obtenue par mesure régulière d’une variable (ou d’ungroupe de variables) sur une certaine période. Les transformations de données deséries chronologiques exigent une structure de fichier de données dans laquelle chaqueligne représente un groupe d’observations à une heure différente, et l’intervalle detemps entre les observations est uniforme.

Définir des dates

La boîte de dialogue Définir des dates vous permet de générer des variables de datepouvant être utilisées pour établir la périodicité de Séries chronologiques et pourétiqueter le résultat d’analyses de séries chronologiques.

Figure 8-30Boîte de dialogue Définir des dates

Les observations sont. Définit l’intervalle de temps utilisé pour générer des dates.

Page 230: SPSS Base Users Guide 14.0

204

Chapitre 8

Non daté supprime toutes les variables de date précédemment définies. Toutes lesvariables portant les noms suivants sont supprimées : année_, trimestre_, mois_,semaine_, jour_, heure_, minute_, seconde_ et date_.

Autres indique la présence de variables de date personnalisées créées avec lasyntaxe de commande (par exemple, une semaine de travail de quatre jours).Cet élément reflète simplement l’état actuel de l’ensemble de données actif. Sasélection dans la liste est sans effet.

La première observation est. Définit la valeur de la date de départ, qui est affectée à lapremière observation. Des valeurs séquentielles, basées sur l’intervalle de temps, sontaffectées aux observations ultérieures.

Périodicité au niveau supérieur. Indique une variation cyclique répétitive, telle que lenombre de mois dans une année ou le nombre de jours de la semaine. La valeuraffichée indique la valeur maximale que vous pouvez entrer.

Une nouvelle variable numérique est créée pour chaque composant utilisé pour définirla date. Les noms des nouvelles variables se terminent par un trait de soulignement.Une variable descriptive chaîne, date_, est également créée à partir des composants.Par exemple, si vous avez sélectionné semaines, jours, heures, quatre nouvellesvariables sont créées : semaine_, jour_, heure_ et date_.

Si des variables de date ont été déjà définies, elles sont remplacées lorsque vousdéfinissez de nouvelles variables de date portant le même nom que les variablesde date existantes.

Pour définir des dates pour des données de séries chronologiques

E A partir des menus, sélectionnez :Données

Définir des dates

E Sélectionnez un intervalle de temps dans la liste Les observations sont.

E Entrez les valeurs définissant la date de départ, qui détermine la date affectée àla première observation.

Page 231: SPSS Base Users Guide 14.0

205

Transformations de données

Variables de date versus variables de format date

Les variables de date créées avec Définir les dates ne doivent pas être confonduesavec les variables de format date, définies dans l’affichage des variables de l’éditeurde données. Les variables de date sont utilisées pour créer une périodicité pour lesdonnées de séries chronologiques. Les variables de format date représentent desdates et/ou des heures affichées selon divers formats de date/heure. Les variables dedate sont de simples entiers représentant le nombre de jours, de semaines, d’heures,etc., à partir d’un point de départ spécifié par l’utilisateur. En interne, la plupart desvariables de format date sont stockées sous la forme du nombre de secondes écouléesdepuis le 14 octobre 1582.

Créer la série chronologique

La boîte de dialogue Créer la série chronologique vous permet de créer de nouvellesvariables basées sur des fonctions de variables numériques de Séries chronologiquesexistantes. Ces valeurs transformées sont utiles dans de nombreuses procéduresd’analyses de séries chronologiques.

Par défaut, les noms de nouvelles variables reprennent les six premiers caractèresde la variable existante utilisée pour les créer, suivis d’un trait de soulignement etd’un numéro séquentiel. Par exemple, pour la variable prix, le nom de la nouvellevariable serait prix_1. Les nouvelles variables conservent toute étiquette de valeurdéfinie des variables d’origine.

Les fonctions disponibles, permettant de créer des variables de sérieschronologiques, incluent les fonctions de différences, de moyennes mobiles, demédianes mobiles, de décalages et de décalage négatif.

Page 232: SPSS Base Users Guide 14.0

206

Chapitre 8

Figure 8-31Boîte de dialogue Créer la série chronologique

Pour créer des variables chronologiques

E A partir des menus, sélectionnez :Transformer

Créer la série chronologique

E Sélectionnez la fonction de séries chronologiques que vous désirez utiliser pourtransformer les variables d’origine.

E Sélectionnez les variables à partir desquelles vous désirez créer de nouvelles variablesde séries chronologiques. Seules des variables numériques peuvent être utilisées.

Sinon, vous pouvez :

Entrer des noms de variables pour remplacer les noms des nouvelles variablespar défaut.

Remplacer la fonction par une variable sélectionnée.

Page 233: SPSS Base Users Guide 14.0

207

Transformations de données

Fonctions de transformation de séries chronologiques

Différence. Différence non saisonnière entre les valeurs successives dans les séries.L’ordre est le nombre des valeurs précédentes utilisé pour calculer la différence.Comme une observation est perdue pour chaque ordre de différence, les valeursmanquantes par défaut apparaissent au début des séries. Par exemple, si l’ordre dedifférence est 2, les deux premières observations contiendront la valeur manquantepar défaut pour la nouvelle variable.

Différence saisonnière. Différence entre des valeurs de séries séparées par un intervalleconstant. L’intervalle est basé sur la périodicité actuellement définie. Pour calculerdes différences saisonnières, vous devez disposer de variables de date définies (MenuDonnées, Définir les dates) qui incluent une composante périodique (telle que lesmois de l’année). L’ordre est le nombre de périodes saisonnières utilisé pour calculerla différence. Le nombre d’observations avec la valeur manquante par défaut au débutdes séries est égal à la périodicité multipliée par l’ordre. Par exemple, si la périodicitécourante est 12 et l’ordre 2, les 24 premières observations auront la valeur manquantepar défaut pour nouvelle variable.

Moyenne mobile centrée. Moyenne d’un intervalle de valeurs de séries entourant etincluant la valeur courante. L’intervalle est le nombre de valeurs de séries utilisé pourcalculer la moyenne. Si l’intervalle est pair, la moyenne mobile est calculée en faisantla moyenne de chaque paire de moyennes non centrées. Le nombre d’observationsavec la valeur manquante par défaut au début et à la fin des séries pour un intervallede n est égal à n/2 pour des valeurs d’intervalles paires et impaires. Par exemple, sil’intervalle est 5, le nombre d’observations avec la valeur manquante par défaut audébut et à la fin des séries est 2.

Moyenne mobile précédente. Moyenne de l’intervalle de valeurs des séries précédantla valeur courante. L’intervalle est le nombre de valeurs de séries précédentes utilisépour calculer la moyenne. Le nombre d’observations avec la valeur manquante pardéfaut au début des séries est égal à la valeur de l’intervalle.

Médianes mobiles. Médiane d’un intervalle de valeurs de séries entourant et incluantla valeur courante. L’intervalle est le nombre de valeurs de séries utilisé pour calculerla médiane. Si l’intervalle est pair, la médiane est calculée en faisant la moyenne dechaque paire de médianes non centrées. Le nombre d’observations avec la valeurmanquante par défaut au début et à la fin des séries pour un intervalle de n est égalà n/2 pour des valeurs d’intervalles paires et impaires. Par exemple, si l’intervalle

Page 234: SPSS Base Users Guide 14.0

208

Chapitre 8

est 5, le nombre d’observations avec la valeur manquante par défaut au début età la fin des séries est 2.

Somme cumulée. Somme cumulée des valeurs des séries à concurrence de la valeurcourante, y compris celle-ci.

Décalage positif. Valeur d’une observation précédente, basée sur l’ordre de décalagespécifié. L’ordre est le nombre d’observations antérieures à l’observation couranteà partir de laquelle la valeur est obtenue. Le nombre d’observations avec la valeurmanquante par défaut au début des séries est égal à la valeur de l’ordre.

Décalage négatif. Valeur d’une observation ultérieure, basée sur l’ordre de décalagenégatif spécifié. L’ordre est le nombre d’observations après l’observation couranteà partir de laquelle la valeur est obtenue. Le nombre d’observations avec la valeurmanquante par défaut à la fin des séries est égal à la valeur de l’ordre.

Lissage. Nouvelles valeurs des séries basées sur un lisseur de données composées.Le lisseur commence avec une médiane mobile de 4, centrée par une médianemobile de 2. Il relisse ensuite ces valeurs en appliquant une médiane mobile de 5,puis une de 3, et du hanning (exécution de moyennes pondérées). Les résidus sontcalculés par soustraction des séries lissées des séries d’origine. Tout ce processus estensuite répété sur les résidus calculés. Pour finir, les résidus lissés sont calculéspar soustraction des valeurs lissées obtenues la première fois par le processus. Onparle parfois de lissage T4253H.

Remplacer les valeurs manquantes

Les observations manquantes peuvent constituer un problème dans le cadred’analyses, et il arrive que des mesures de séries ne puissent être calculées si desvaleurs manquent dans les séries. Il arrive que la valeur d’une observation donnéene soit tout simplement pas connue. De plus, une donnée manquante peut provenirde l’une des actions suivantes :

Chaque degré de différentiation réduit la longueur d’une série de 1.

Chaque degré de différentiation saisonnière réduit la longueur d’une série d’unesaison.

Page 235: SPSS Base Users Guide 14.0

209

Transformations de données

Si vous créez de nouvelles séries contenant des prévisions relatives à la fin de lasérie existante (en cliquant sur un bouton Enregistrer et en effectuant les choixappropriés), les séries d’origine et les séries de résidus générées auront desvaleurs manquantes pour les nouvelles observations.

Certaines transformations (la transformation log par exemple) génèrent desdonnées manquantes pour certaines valeurs des séries d’origine.

Les données manquantes situées au début ou à la fin d’une série ne posent aucunproblème : elles réduisent simplement la longueur utile de la série. Les trous situés aumilieu d’une série (données manquantes intégrées) peuvent représenter un problèmebeaucoup plus sérieux. L’étendue du problème dépend de la procédure d’analyseutilisée.

La boîte de dialogue Remplacer les valeurs manquantes vous permet de créerde nouvelles variables Séries chronologiques à partir de variables existantes, enremplaçant les valeurs manquantes par des estimations calculées selon une méthode.Par défaut, les noms de nouvelles variables reprennent les six premiers caractèresde la variable existante utilisée pour les créer, suivis d’un trait de soulignement etd’un numéro séquentiel. Par exemple, pour la variable prix, le nom de la nouvellevariable serait prix_1. Les nouvelles variables conservent toute étiquette de valeurdéfinie des variables d’origine.

Figure 8-32Boîte de dialogue Remplacer les valeurs manquantes...

Page 236: SPSS Base Users Guide 14.0

210

Chapitre 8

Pour remplacer les valeurs manquantes par des variables de séries chronologiques

E A partir des menus, sélectionnez :Transformer

Remplacer les valeurs manquantes

E Sélectionnez la méthode d’estimation que vous désirez utiliser pour remplacer lesvaleurs manquantes.

E Sélectionnez les variables dont vous voulez remplacer les valeurs manquantes.

Sinon, vous pouvez :

Entrer des noms de variables pour remplacer les noms des nouvelles variablespar défaut.

Changer la méthode d’estimation pour une variable sélectionnée.

Méthodes d’estimation pour le remplacement de valeurs manquantes

Moyenne de la série. Remplace les valeurs manquantes par la moyenne de toute lasérie.

Moyenne des points voisins. Remplace les valeurs manquantes par la moyenne desvaleurs valides qui les entourent. L’intervalle des points voisins est le nombre devaleurs valides au-dessus et au-dessous de la valeur manquante utilisée pour calculerla moyenne.

Médiane des points voisins. Remplace les valeurs manquantes par la médiane desvaleurs valides qui les entourent. L’intervalle des points voisins est le nombre devaleurs valides au-dessus et au-dessous de la valeur manquante utilisée pour calculerla médiane.

Interpolation linéaire. Remplace les valeurs manquantes au moyen d’une interpolationlinéaire. La dernière valeur valide avant la valeur manquante et la première valeurvalide après la valeur manquante sont utilisées pour l’interpolation. Si la premièreou la dernière observation de la série comporte une valeur manquante, celle-ci n’estpas remplacée.

Tendance linéaire au point. Remplace les valeurs manquantes par la tendance linéairede ce point. Une régression est effectuée sur la série existante selon une variabled’index d’une échelle de 1 à n. Les valeurs manquantes sont remplacées par lesprévisions correspondantes.

Page 237: SPSS Base Users Guide 14.0

211

Transformations de données

Notation de données avec des modèles de prévision

Le processus consistant à appliquer un modèle de prévision à un ensemble dedonnées est appelé notation des données. SPSS, Clementine et AnswerTree ontdes procédures pour construire des modèles de prévision comme les modèles derégression, de classification, de segmentation et de réseau neuronal. Une fois lemodèle construit, les spécifications de ce dernier sont enregistrées dans un fichierXML contenant toutes les informations nécessaires pour reconstruire le modèle.Le serveur SPSS fournit alors les moyens pour lire un fichier de modèle XML etappliquer le modèle à un ensemble de données.

Exemple. Une demande de crédit est notée comme étant à risque en se basant surdifférents aspects du demandeur et du prêt en question. Le résultat de crédit obtenu àpartir du modèle de risque est utilisé pour accepter ou refuser la demande de prêt.

La notation est traitée comme une transformation des données. Le modèle s’exprimeen interne comme un ensemble de transformations numériques appliquées à unensemble donné de variables, les variables indépendantes spécifiées dans le modèle,afin d’obtenir une prévision. En ce sens, le processus de notation de données avecun modèle donné est actuellement similaire à l’application d’une fonction, telle lafonction de racine carrée, à un ensemble de données.

La notation est uniquement disponible avec le serveur SPSS et peut être effectuéede façon interactive par les utilisateurs en travaillant en Mode d’analyse distribuée..Pour la notation de larges fichiers de données, vous pouvez utiliser SPSS BatchFacility, une version exécutable séparée de SPSS fournie avec le serveur SPSS.Pour obtenir plus d’informations concernant l’utilisation de SPSS Batch Facility,consultez SPSS Batch Facility User’s Guide, fourni en tant que fichier PDF sur le CDdu serveur SPSS.

Le processus de notation comporte les étapes suivantes :

E Le chargement d’un modèle depuis un fichier au format XML (PMML).

E Le calcul de vos résultats sous forme d’une nouvelle variable, en utilisant la fonctionApplyModel ou StrApplyModel disponible dans la boîte de dialogueCalculer lavariable .

Pour obtenir des détails au sujet des fonctions ApplyModel ou StrApplyModel,consultez Expressions de notation dans la section Expressions de transformationde SPSS Command Syntax Reference.

Page 238: SPSS Base Users Guide 14.0

212

Chapitre 8

Chargement d’un modèle enregistré

La boîte de dialogue Charger un modèle vous permet de charger des modèles deprévision au format XML (PMML) et est seulement disponible lorsque vous travaillezen Mode d’analyse distribuée.. Le chargement des modèles est une première étapeindispensable pour pouvoir les utiliser afin de noter les données.

Figure 8-33Charger le résultat du modèle

Pour charger un modèle

E A partir des menus, sélectionnez :Transformer

Préparer le modèleChargement du modèle...

Page 239: SPSS Base Users Guide 14.0

213

Transformations de données

Figure 8-34Boîte de dialogue Préparer le modèle Charger le modèle

E Entrez un nom à associer avec ce modèle. Chaque modèle chargé doit avoir unnom unique.

E Cliquez sur Fichier et sélectionnez un fichier de modèle. La boîte de dialogue Ouvrirle fichier en résultant affiche les fichiers disponibles en mode d’analyse distribuée.Cela comprend les fichiers de l’ordinateur sur lequel le serveur SPSS est installé et lesfichiers de votre ordinateur local se trouvant dans des dossiers ou des lecteurs partagés.

Remarque : Lorsque vous notez des données, le modèle sera appliqué aux variablesdans l’ensemble de données actif portant les mêmes noms que les variables dufichier de modèle. Vous pouvez lier des variables du modèle d’origine à différentesvariables de l’ensemble de données actif en utilisant la syntaxe de commande (voir lacommande MODEL HANDLE).

Nom. Un nom utilisé pour identifier ce modèle. Les règles pour la dénominationcorrecte des modèles est la même que pour les noms de variableSPSS (reportez-vousà « Noms de variable » dans Chapitre 5 à p. 99), avec l’ajout du signe $ en tant quepremier caractère. Vous utiliserez ce nom pour spécifier le modèle lors de la notationde données avec les fonctions ApplyModel ou StrApplyModel.

Fichier. Le fichier XML (PMML) contenant les spécifications du modèle.

Page 240: SPSS Base Users Guide 14.0

214

Chapitre 8

Valeurs manquantes

Ce groupe d’options contrôle le traitement des valeurs manquantes rencontrées lors duprocessus de notation pour les variables indépendantes définies dans le modèle. Unevaleur manquante dans le contexte de la notation réfère à l’une des options suivantes :

Une variable explicative ne contient pas de valeur. Pour les variables numériques,cela correspond à la variable manquante par défaut. Pour les variables de chaîne,cela correspond à une chaîne nulle.

La valeur a été définie comme manquante utilisateur dans le modèle, pourl’explication donnée. Les valeurs définies comme manquantes utilisateur dansl’ensemble de données actif mais pas dans le modèle ne seront pas traitées commedes valeurs manquantes lors du processus d’analyse.

La variable explicative est qualitative et la valeur n’est pas l’une des modalitésdéfinies dans le modèle.

Utiliser la valeur de substitution. Tentative pour utiliser une valeur de substitutionlors de la notation d’observations avec des valeurs manquantes. La méthode pourdéterminer une valeur se substituant à une valeur manquante dépend du modèle deprévision.

Modèles SPSS. Pour des variables indépendantes dans une régression linéaire etdes modèles discriminants, si la valeur moyenne de substitution pour les valeursmanquantes a été spécifiée lors de la construction et l’enregistrement du modèle,alors cette valeur moyenne est utilisée à la place de la valeur manquante lors ducalcul des notes et lors du processus de notation. Si cette valeur moyenne n’estpas disponible, alors la valeur manquante par défaut est retournée.

Modèles AnswerTree et modèles de commande SPSS TREE. Pour les modèlesCHAID et Exhaustive CHAID, le plus gros nœud enfant est sélectionné pour unevariable de scission manquante. Le plus gros nœud enfant est celui possédantla plus large population parmi les nœuds enfant utilisant des observationsd’échantillon d’apprentissage. Pour les modèles C&RT et QUEST, les variablesde scission de substitution (le cas échéant) sont utilisées en premier. (Lesvariables de scission de substitution sont des variables de scission qui tentent decorrespondre au mieux à la variable de scission originale en utilisant des variablesindépendantes alternatives.) Si aucune variable de scission de substitution n’estspécifiée ou si toutes les variables de scission de substitution sont manquantes,le plus gros nœud enfant est utilisé.

Page 241: SPSS Base Users Guide 14.0

215

Transformations de données

Modèles Clementine. Les modèles de régression linéaire sont traités commeindiqué pour les modèles SPSS. Les modèles de régression logistique sont traitéscomme indiqué pour les modèles de régression logistique. Les modèles C&RTTree sont traités comme indiqué pour les modèles C&RT sous les modèlesAnswerTree.

Modèles de régression logistique. Pour les covariables des modèles de régressionlogistique, si une valeur moyenne de la variable indépendante a été inclue dansle modèle enregistré, alors cette valeur moyenne est utilisée à la place de lavaleur manquante dans le calcul des notes et les processus de notation. Si lavariable indépendante est qualitative (par exemple un facteur d’un modèle derégression logistique) ou si la valeur moyenne n’est pas disponible, alors la valeurmanquante par défaut est retournée.

Utiliser la valeur manquante par défaut Retourne la valeur manquante par défaut lorsde la notation d’une observation comportant une valeur manquante.

Affichage d’une liste de modèles chargés

Vous pouvez obtenir une liste des modèles actuellement chargés. A partir des menus(uniquement disponibles en mode d’analyse distribuée), choisissez :Transformer

Préparer le modèleLister le(s) modèle(s)

Cela génère un tableau Descriptions des modèles. Ce tableau contient une liste desmodèles actuellement chargés et inclut le nom (appelé description du modèle) assignéau modèle, son type, le chemin d’accès au fichier du modèle et la méthode utiliséepour traiter les valeurs manquantes.

Figure 8-35Liste des modèles chargés

Page 242: SPSS Base Users Guide 14.0

216

Chapitre 8

Fonctions supplémentaires avec la syntaxe de commande

A partir de la boîte de dialogue Charger le modèle, vous pouvez coller vos sélectionsdans une fenêtre de syntaxe et modifier la syntaxe de commande MODEL HANDLE enrésultant. Cela vous permet de :

Lier les variables du modèle original à différentes variables de l’ensemble dedonnées actif (avec la sous-commande MAP). Par défaut, le modèle sera appliquéaux variables dans l’ensemble de données actif portant les mêmes noms que lesvariables du fichier de modèle.

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 243: SPSS Base Users Guide 14.0

Chapitre

9Gestion et transformations defichiers

L’organisation des fichiers de données ne répond pas toujours idéalement à vosbesoins. Vous pouvez, par exemple, combiner des fichiers, trier des données dansun ordre différent, sélectionner des sous-ensembles d’observations ou modifierl’unité d’analyse en regroupant les observations. De nombreuses possibilités detransformation de fichier sont disponibles, y compris la possibilité de :

Trier les données. Vous pouvez trier les observations en fonction de la valeur decertaines variables.

Transposer des observations et des variables. Le format des fichiers de données SPSSlit les lignes comme des observations et les colonnes comme des variables. Vouspouvez inverser les lignes et les colonnes et lire les données selon le bon format pourles fichiers qui présentent les informations dans l’autre sens.

Fusionner des fichiers. Vous pouvez fusionner des fichiers de données (au moinsdeux). Vous pouvez associer des fichiers disposant des mêmes variables maisprésentant des observations différentes, ou l’inverse.

Sélectionner des sous-ensembles d’observations. Vous pouvez limiter votre analyse àun sous-ensemble d’observations ou effectuer des analyses simultanées sur différentssous-ensembles.

Agréger les données. Vous pouvez modifier l’unité d’analyse en agrégeant desobservations en fonction de la valeur d’une ou plusieurs variables de regroupement.

Pondérer les données. La pondération des données concerne les analyses fondéessur la valeur d’une variable pondérée.

Restructurer les données. Vous pouvez restructurer des données pour créer uneobservation (un enregistrement) à partir de plusieurs observations ou créer plusieursobservations à partir d’une seule.

217

Page 244: SPSS Base Users Guide 14.0

218

Chapitre 9

Trier les observations

Cette boîte de dialogue permet de trier les observations (lignes) du fichier en fonctiondes valeurs d’une ou plusieurs variables de tri. Vous pouvez trier les observations parordre croissant ou décroissant.

Si vous sélectionnez plusieurs variables de tri, les observations sont triées pourchaque variable au sein des modalités de la variable précédente dans la liste Tri.Par exemple, si vous sélectionnez Sexe comme première variable de tri et Culturecomme seconde variable de tri, les observations seront triées en fonction de laculture de chaque individu au sein de chaque modalité de la variable sexe.

Pour les variables alphanumériques, les lettres en majuscules précèdent lesminuscules dans l’ordre de tri. Par exemple, la valeur “Oui” précède “oui” dansl’ordre de tri.

Figure 9-1Boîte de dialogue Trier les observations

Pour trier les observations

E A partir des menus, sélectionnez :Données

Trier les observations...

E Sélectionnez au moins une variable de tri.

Page 245: SPSS Base Users Guide 14.0

219

Gestion et transformations de fichiers

Transposer

La transposition permet de créer un nouveau fichier dans lequel les lignes et lescolonnes du fichier initial sont inversées pour que les observations (lignes) deviennentdes variables (colonnes), et vice versa. SPSS génère automatiquement de nouveauxnoms pour les variables et affiche une liste de ces nouveaux noms.

Une nouvelle variable de type chaîne contenant le nom de variable d’origine,case_lbl, est automatiquement créée.

Si l’ensemble de données actif contient un ID (identifiant) ou une variable denom dont les valeurs sont uniques, vous pouvez l’utiliser comme variable denom et employer ses valeurs comme noms de variable dans le fichier transposé.S’il s’agit d’une variable numérique, les noms de variables commencent par lalettre V, suivie de la valeur numérique.

Les valeurs manquantes à l’utilisateur sont converties en valeurs manquantespar défaut dans le fichier transposé. Pour conserver certaines de ces valeurs,modifiez la définition des valeurs manquantes dans l’affichage des variables del’éditeur de données.

Pour transposer des variables et des observations

E A partir des menus, sélectionnez :Données

Transposer

E Sélectionnez au moins une variable à transposer en observation.

Fusionner des fichiers de données

SPSS vous permet de fusionner des données à partir de deux fichiers et de deuxfaçons différentes. Vous pouvez:

Fusionner l’ensemble de données actif avec un autre fichier de données ouvert ouavec un fichier de données au format SPSS contenant les mêmes variables maisdes observations différentes.

Fusionner l’ensemble de données actif avec un autre fichier de données ouvert ouavec un fichier de données au formant SPSS contenant les mêmes variables maisdes observations différentes.

Page 246: SPSS Base Users Guide 14.0

220

Chapitre 9

Pour fusionner des fichiers

E A partir des menus, sélectionnez :Données

Fusionner des fichiers

E Sélectionnez Ajouter des observations ou Ajouter des variables.

Figure 9-2

Ajouter des observations

Ajouter des observations fusionne l’ensemble de données actif avec un secondensemble de données ou avec un fichier de données au format SPSS contenant lesmêmes variables (colonnes) mais des observations (lignes) différentes. Par exemple,vous pouvez enregistrer la même information sur des clients de deux secteurs devente et gérer ces données dans des fichiers séparés pour chaque région. Le secondensemble de données peut être un fichier de données externe au format SPSS ou unensemble de données disponible dans la section actuelle.

Page 247: SPSS Base Users Guide 14.0

221

Gestion et transformations de fichiers

Figure 9-3Boîte de dialogue Ajouter des observations

Variables non communes : Variables à exclure du nouveau fichier fusionné. Lesvariables de l’ensemble de données actif sont identifiées par un astérisque (*). Lesvariables d’un autre ensemble de données sont identifiées par un signe (+). Pardéfaut, la liste contient :

Des variables sans correspondance dans l’autre fichier. Vous pouvez créer despaires avec les variables non communes et les inclure dans le nouveau fichierfusionné.

Des variables contenant des données numériques dans l’un des fichiers et desdonnées alphanumériques dans l’autre. Il est impossible de fusionner desvariables numériques avec des variables alphanumériques.

Des variables alphanumériques de longueur différente. La longueur définie pourune variable alphanumérique doit être la même dans les deux fichiers.

Variables dans un nouvel ensemble de données actif. Variables à inclure dans lenouveau fichier actif. Par défaut, toutes les variables dont le nom et le type correspondsont ajoutées à la liste.

Vous pouvez supprimer des variables de la liste si vous ne les souhaitez pas dansle fichier fusionné.

Les variables non communes incluses dans le fichier fusionné contiendront desdonnées manquantes pour les observations du fichier qui ne les contient pas.

Page 248: SPSS Base Users Guide 14.0

222

Chapitre 9

Indiquer le fichier source dans la variable. Indique le fichier de données sourcepour chaque observation. Cette variable a une valeur de 0 pour les observationsde l'ensemble de données actif et une valeur de 1 pour les observations du fichierde données externe.

Pour fusionner des fichiers de données avec les mêmes variables mais des observationsdifférentes

E Ouvrez au moins un des fichiers de données que vous souhaitez fusionner. S’il existeplusieurs ensembles de données ouverts, vous devez sélectionner celui que voussouhaitez fusionner pour en faire l’ensemble de données actif. Les observations de cefichier apparaissent en premier dans le nouveau fichier fusionné.

E A partir des menus, sélectionnez :Données

Fusionner des fichiersAjouter des observations

E Sélectionnez l’ensemble de données ou le fichier de données au format SPSS àfusionner avec l’ensemble de données actif.

E Supprimez toutes les variables indésirables de la liste Variables du nouvel ensemblede données actif.

E Ajouter des paires de variables de la liste des variables non communes qui représententles mêmes informations mais enregistrées sous des noms différents dans les deuxfichiers. Par exemple, la date de naissance peut être enregistrée sous datenais dansun fichier et né_le dans l’autre.

Sélectionner une paire de variables non communes

E Cliquez sur l’une des variables dans la liste Variables non communes.

E Tout en maintenant la touche Ctrl enfoncée, cliquez sur l’autre variable dans laliste. (Appuyez sur la touche Ctrl et cliquez en même temps sur le bouton gauchede la souris.)

E Cliquez sur Apparier pour déplacer la paire de variables dans la liste Variables dunouvel ensemble de données actif. (Le nom de variable de l’ensemble de données estutilisé comme nom de variable dans le fichier fusionné.)

Page 249: SPSS Base Users Guide 14.0

223

Gestion et transformations de fichiers

Figure 9-4Sélectionner des paires de variables à l’aide du Ctrl/click

Ajout d’observations : Renommer

Vous pouvez renommer les variables de l’ensemble de données actif ou de l’autreensemble de données avant de les déplacer de la liste des variables non communesdans la liste des variables à ajouter au fichier fusionné. Renommer des variablesvous permet de :

Utiliser le nom de la variable de l’autre ensemble de données plutôt que celui del’ensemble de données actif pour les paires de variables.

Inclure deux variables portant le même nom mais de type différent ou de longueurdifférente. Par exemple, pour inclure à la fois la variable numérique sexe del’ensemble de données actif et la variable alphanumérique sexe de l’autreensemble de données, vous devez d’abord les renommer.

Page 250: SPSS Base Users Guide 14.0

224

Chapitre 9

Ajout d’observations : Informations du dictionnaire

Tous les informations du dictionnaire existantes (étiquettes de variable et de valeurs,valeurs manquantes utilisateur, formats d’affichage) dans l’ensemble de données actifsont appliquées au fichier de données fusionné.

Si certaines informations du dictionnaire relatives à une variable ne sont pasdéfinies dans l’ensemble de données actif, les informations du dictionnaire del’autre ensemble de données s’appliquent.

Si l’ensemble de données actif contient des étiquettes de valeurs non définies oudes valeurs manquantes de type utilisateur, toutes les autres étiquettes de valeursou les valeurs manquantes de type utilisateur pour cette variable dans l’autreensemble de données sont ignorées.

Fusion de plus de deux sources de données

A l’aide de la syntaxe de commande, vous pouvez fusionner jusqu’à 50 ensemblesde données et/ou de fichiers de données. Pour plus d’informations, reportez-vousà la commande ADD FILES dans SPSS Command Syntax Reference (disponibledepuis le menu Aide).

Ajouter des variables

Ajouter des variables fusionne l’ensemble de données actif avec un autre fichier dedonnées ouvert ou avec un fichier de données SPSS contenant les mêmes observations(lignes) mais des variables (colonnes) différentes. Par exemple, vous souhaitezfusionner un fichier de données contenant les résultats d’un test préalable avec unautre fichier contenant les résultats d’un test final.

Les observations doivent être présentées dans le même ordre dans les deuxensembles de données.

Si une ou plusieurs clés d’appariement sont utilisées pour apparier lesobservations, les deux ensembles de données doivent présenter ces clésd’appariement par ordre croissant.

Les noms de variable du second fichier, redondants avec les noms de l’ensemblede données actif, sont exclus par défaut. En effet, SPSS part du principe que cesvariables contiennent des informations redondantes.

Page 251: SPSS Base Users Guide 14.0

225

Gestion et transformations de fichiers

Indiquer le fichier source dans la variable. Indique le fichier de données sourcepour chaque observation. Cette variable a une valeur de 0 pour les observationsde l'ensemble de données actif et une valeur de 1 pour les observations du fichierde données externe.

Figure 9-5Boîte de dialogue Ajouter des variables

Variables exclues : Variables à exclure du nouveau fichier fusionné. Par défaut, cetteliste contient tous les noms de variable de l’autre ensemble de données qui sontredondants avec ceux de l’ensemble de données actif. Les variables de l’ensemble dedonnées actif sont identifiées par un astérisque (*). Les variables d’un autre ensemblede données sont identifiées par un signe (+). Si vous souhaitez inclure une variableexclue avec un nom redondant dans le fichier fusionné, vous pouvez le renommerpuis l’ajouter à la liste des variables à inclure.

Nouvel ensemble de données actif. Variables à inclure dans le nouvel ensemble dedonnées actif fusionné. Par défaut, tous les noms de variables uniques dans les deuxensembles de données sont inclus dans la liste.

Clés d’appariement : Si certaines observations dans un ensemble de données n’ontpas de concordance dans l’autre ensemble de données (c’est-à-dire que certainesobservations manquent dans un ensemble de données), utilisez les clés d’appariementpour identifier et correctement apparier les observations des deux ensembles de

Page 252: SPSS Base Users Guide 14.0

226

Chapitre 9

données. Vous pouvez également utiliser ces clés avec des fichiers de consultationde table.

Les clés d’appariement doivent avoir le même nom dans les deux ensemblesde données.

Les deux ensembles de données doivent présenter les variables par ordre croissantou décroissant et l’ordre des variables de la liste clés d’appariement doit être lemême que l’ordre de tri.

Les observations qui n’ont pas de correspondance dans les clés d’appariement sontinclus dans le fichier fusionné mais elles sont fusionnées avec les observationsde l’autre fichier. Les observations sans correspondance contiennent des valeursuniquement pour les variables du fichier duquel elles sont issues. Les variablesde l’autre fichier contiennent la valeur manquante par défaut.

L’ensemble de données actif ou non actif est une table codée. Une table codée ou unfichier de consultation de table, est un fichier dans lequel les données de chaqueobservation peuvent s’appliquer à plusieurs observations de l’autre fichier. Parexemple, si un des fichiers contient des informations sur les différents membres d’unefamille (sexe, âge, niveau scolaire) et l’autre des informations générales sur la famille(revenu global, taille, habitat), vous pouvez utiliser le fichier sur la famille commefichier de consultation et appliquer les informations générales à chaque membre de lafamille dans le fichier fusionné.

Pour fusionner des fichiers avec les mêmes variables mais des observations différentes

E Ouvrez au moins un des fichiers de données que vous souhaitez fusionner. Si il y aplusieurs ensembles de données ouverts, faites de l’un de celui dont vous souhaitezfusionner l’ensemble de données actif.

E A partir des menus, sélectionnez :Données

Fusionner des fichiersAjouter des variables

E Sélectionnez l’ensemble de données ou le fichier de données au format SPSS àfusionner avec l’ensemble de données actif.

Sélectionnez des clés d’appariement.

E Sélectionnez les variables du fichier externe (+) dans la liste des Variables exclues.

Page 253: SPSS Base Users Guide 14.0

227

Gestion et transformations de fichiers

E Sélectionnez Apparier les observations sur les clés des fichiers triés.

E Ajoutez des variables à la liste des clés d’appariement.

Les clés d’appariement doivent exister à la fois dans l’ensemble de données actif etdans l’autre. Les deux ensembles de données doivent présenter les variables par ordrecroissant ou décroissant et l’ordre des variables de la liste clés d’appariement doitêtre le même que l’ordre de tri.

Ajouter des variables: Renommer

Vous pouvez renommer les variables de l’ensemble de données actif ou de l’autreensemble de données avant de les déplacer dans la liste des variables à ajouter aufichier fusionné. Ceci est particulièrement important si vous souhaitez inclure deuxvariables portant le même nom mais contenant des informations différentes.

Fusion de plus de deux sources de données

A l’aide de la syntaxe de commande, vous pouvez fusionner jusqu’à 50 ensemblesde données et/ou de fichiers de données. Pour plus d’informations, reportez-vous àla commande MATCH FILES dans SPSS Command Syntax Reference (disponibledepuis le menu Aide).

Agréger les donnéesL’option Agréger les données permet d’agréger des groupes d’observations del’ensemble de données actif dans des observations uniques. Elle permet égalementde créer un nouveau fichier agrégé ou de nouvelles variables (dans l’ensemble dedonnées actif) qui contiennent des données agrégées. Les observations sont agrégéesen fonction de la valeur d’un ou de plusieurs critères d’agrégation (regroupement).

Si vous créez un fichier de données agrégées, il contient une observation pourchaque groupe défini par les critères d’agrégation. Par exemple, s’il existe uncritère d’agrégation comprenant deux valeurs, le nouveau fichier de donnéescontiendra uniquement deux observations.

Si vous ajoutez des variables d’agrégation à l’ensemble de données actif, lefichier de données n’est pas agrégé. Chaque observation disposant des mêmesvaleurs des critères d’agrégation reçoit les mêmes valeurs pour les nouvelles

Page 254: SPSS Base Users Guide 14.0

228

Chapitre 9

variables d’agrégation. Par exemple, si le seul critère d’agrégation est sexe, tousles hommes reçoivent la même valeur pour une nouvelle variable d’agrégationqui représente l’âge moyen.

Figure 9-6Boîte de dialogue Agréger les données

Critère(s) d’agrégation. Les observations sont regroupées selon les valeurs des critèresd’agrégation. Chaque combinaison unique de valeurs de critères d’agrégationdéfinit un groupe. Lorsque vous créez un fichier de données agrégées, tous lescritères d’agrégation sont enregistrés dans le nouveau fichier avec leurs noms et lesinformations du dictionnaire. Le critère d’agrégation peut être de type numériqueou chaîne.

Variable(s) agrégée(s). Les variables source sont utilisées avec des fonctionsd’agrégation pour créer de nouvelles variables d’agrégation. Le nom de la variabled’agrégation est suivi éventuellement d’une étiquette de variable entre guillemets, le

Page 255: SPSS Base Users Guide 14.0

229

Gestion et transformations de fichiers

nom de la fonction d’agrégation et du nom de la variable source entre parenthèses.Les variables source pour les fonctions d’agrégation doivent être numériques.

Vous pouvez également passer outre les noms de variables d’agrégation par défaut,ajouter des étiquettes de variable descriptive et modifier les fonctions utilisées pourcalculer la valeur des données agrégées. Vous pouvez également créer une variablequi contienne le nombre d’observations dans chaque agrégat.

Pour agréger un fichier de données

E A partir des menus, sélectionnez :Données

Agréger

E Sélectionnez un ou plusieurs critères d’agrégation qui définissent la façon dont lesobservations sont groupées pour créer des données agrégées.

E Sélectionnez une ou plusieurs variables d’agrégation.

E Sélectionnez une fonction d’agrégation pour chaque variable d’agrégation.

Enregistrement des résultats agrégés

Vous pouvez ajouter des variables d’agrégation à l’ensemble de données actif ou créerun nouveau fichier de données agrégées.

Ajouter des variables agrégées à un ensemble de données actif. De nouvellesvariables basées sur les fonctions d'agrégation sont ajoutées à l'ensemble dedonnées actif. Le fichier de données lui-même n'est pas agrégé. Chaqueobservation disposant des mêmes valeurs des critères d'agrégation reçoit lesmêmes valeurs pour les nouvelles variables d'agrégation.

Créer un nouvel ensemble de données ne contenant que les variables agrégées.Enregistre les données agrégées dans un nouvel ensemble de données de lasession en cours. L'ensemble de données comprend les critères d'agrégation quidéfinissent les observations agrégées et toutes les variables d'agrégation définiespar les fonctions d'agrégation. L'ensemble de données actif n'est pas affecté.

Créer un nouveau fichier de données ne contenant que les variables agrégées.Enregistre les données agrégées dans un fichier de données externe. Le fichiercomprend les critères d'agrégation qui définissent les observations agrégées

Page 256: SPSS Base Users Guide 14.0

230

Chapitre 9

et toutes les variables d'agrégation définies par les fonctions d'agrégation.L'ensemble de données actif n'est pas affecté.

Options de tri des fichiers de données volumineux

Pour les fichiers de données volumineux, il peut être plus judicieux d’agréger desdonnées préalablement triées.

Fichier déjà trié sur les critères d'agrégation. Si les données ont déja été triées enfonction des valeurs des critères d'agrégation, cette option permet une exécutionplus rapide de la procédure et une économie de mémoire. Utilisez cette option avecprécaution.

Les données doivent être triées en fonction des valeurs des critères d’agrégation,dans le même ordre que les critères d’agrégation indiqués pour la procédureAgréger les données.

Si vous ajoutez des variables à l’ensemble de données actif, sélectionnez cetteoption uniquement si les données sont triées dans l’ordre croissant en fonctiondes critères d’agrégation.

Trier le fichier avant l'agrégation. Dans de très rares instances avec des fichiers dedonnées volumineux, il peut s'avérer nécessaire de trier le fichier de données enfonction des valeurs des critères d'agrégation avant de procéder à l'agrégation.Cette option est déconseillée, sauf si vous rencontrez des problèmes demémoire/performances.

Agrégation de données : fonction d’agrégation

Cette boîte de dialogue indique la fonction à utiliser pour calculer la valeur desdonnées agrégées pour les variables sélectionnées dans la liste des variablesagrégées de la Boîte de dialogue Agréger des données. Les fonctions d’agrégationcomprennent :

Des fonctions récapitulatives, notamment la moyenne, la médiane, l’écart typeet la somme.

Le nombre d’observations (pondérées et non pondérées, manquantes et nonmanquantes).

Page 257: SPSS Base Users Guide 14.0

231

Gestion et transformations de fichiers

Le pourcentage ou la proportion des valeurs inférieures ou supérieures à unevaleur donnée.

Le pourcentage ou la proportion des valeurs appartenant ou n’appartenant pasà un intervalle donné.

Figure 9-7Boîte de dialogue Fonction d’agrégation

Agrégation de données : nom et étiquette de variable

SPSS attribue par défaut des noms aux variables agrégées dans le nouveau fichierde données. Cette boîte de dialogue vous permet de changer le nom des variablessélectionnées dans la liste des variables d’agrégation et vous propose une étiquettedescriptive des variables. Pour plus d'informations, reportez-vous à « Noms devariable » dans Chapitre 5 à p. 99.

Page 258: SPSS Base Users Guide 14.0

232

Chapitre 9

Figure 9-8Boîte de dialogue Nom et étiquette de variable

Scinder un fichier

Scinder un fichier vous permet de scinder un fichier de données en plusieurs classes,en fonction des valeurs d’une ou plusieurs variables de regroupement. Si voussélectionnez plusieurs variables de regroupement, les observations sont regroupéespour chaque variable au sein des modalités de la variable précédente dans la liste desvariables de regroupement. Par exemple, si vous sélectionnez sexe comme premièrevariable de regroupement et culture comme seconde, les observations seront classéesen fonction de l’origine culturelle au sein de chaque modalité de la variable sexe.

Vous pouvez spécifier jusqu’à 8 variables de regroupement.

Chaque bloc de huit caractères dans une variable alphanumérique longue (plusde 8 caractères) est considéré comme une variable par rapport à la limite de8 variables de regroupement.

Les observations doivent être triées en fonction des valeurs des variables deregroupement, suivant l’ordre dans lequel les variables sont présentées dansla liste des variables de regroupement. Si le fichier de données n’est pas trié,sélectionnez Tri suivant les variables de regroupement.

Page 259: SPSS Base Users Guide 14.0

233

Gestion et transformations de fichiers

Figure 9-9Boîte de dialogue Scinder un fichier

Comparer les classes. Les classes du fichier scindé sont présentées ensemble pourpermettre la comparaison. En ce qui concerne les tableaux pivotants, un seuld’entre eux est créé et chaque variable du fichier scindé peut être déplacée entreles dimensions du tableau. Quant aux diagrammes, un diagramme distinct est créépour chaque groupe du fichier scindé et ces diagrammes sont affichés ensemble dansle Viewer.

Séparer résultats par groupes. Tous les résultats de chaque procédure sont affichésséparément pour chaque classe du fichier scindé.

Pour scinder un fichier de données pour analyse

E A partir des menus, sélectionnez :Données

Scinder un fichier

E Sélectionnez Comparer les groupes ou Séparer résultats par groupes.

E Sélectionnez une ou plusieurs variables de regroupement.

Page 260: SPSS Base Users Guide 14.0

234

Chapitre 9

Sélectionner des observations

Sélectionner les observations propose une série de méthodes pour sélectionner unsous-groupe d’observations en fonction de certains critères qui incluent variables etexpressions complexes. Vous pouvez également sélectionner un échantillon aléatoired’observations. Les critères utilisés pour définir un sous-groupe comprennent :

Plages et valeurs de variables

Plages de dates et d’heures

Nombres d’observations (lignes)

Expressions arithmétiques

Expressions logiques

Fonctions

Figure 9-10Boîte de dialogue Sélectionner des observations

Toutes les observations. Désactive le filtrage et utilise toutes les observations.

Page 261: SPSS Base Users Guide 14.0

235

Gestion et transformations de fichiers

Selon une condition logique. Utilisez une expression conditionnelle pour sélectionnerdes observations. Si le résultat de l'expression conditionnelle est vrai, l'observation estsélectionnée. Si le résultat est faux ou manquant, l'observation n'est pas sélectionnée.

Par échantillonnage aléatoire. Sélectionne un échantillon aléatoire basé sur unpourcentage approximatif ou un nombre exact d'observations.

Dans un intervalle de temps ou d'observations. Permet de sélectionner des observationsà partir d'un intervalle d'observations ou d'un intervalle de date/temps.

Selon une variable filtre. Utilise comme filtre la variable numérique sélectionnée dansle fichier de données. Les observations dont la valeur de la variable filtre est autre quemanquante ou nulle sont sélectionnées.

Résultats

Cette section contrôle le traitement des observations exclues. Vous pouvez choisirl’une des options suivantes pour traiter les observations exclues :

Filtrez les observations exclues. Les observations exclues ne sont pas inclusesdans l’analyse, mais restent dans l’ensemble de données. Vous pouvez utiliserles observations exclues ultérieurement dans la session si vous désactivez lefiltrage. Si vous sélectionnez un échantillon aléatoire ou si vous sélectionnez desobservations sur la base d’une expression conditionnelle, une variable nomméefilter_$ est générée ; elle comporte la valeur 1 pour les observations sélectionnéeset la valeur 0 pour les observations exclues.

Copiez les observations sélectionnées dans l’ensemble de données. Lesobservations sélectionnées sont copiées dans un nouvel ensemble de données ;l’ensemble de données d’origine reste inchangé. Les observations exclues ne sontpas incluses dans le nouvel ensemble de données et sont conservées dans leurétat d’origine dans l’ensemble de données d’origine.

Supprimez les observations exclues. Les observations exclues sont supprimées del’ensemble de données. Vous pouvez récupérer les observations suppriméesuniquement en fermant le fichier sans enregistrer les modifications et en l’ouvrantà nouveau. La suppression des observations est définitive si vous enregistrez lesmodifications apportées au fichier de données. Remarque : Si vous supprimezdes observations exclues et enregistrez le fichier, vous ne pouvez pas récupérerces observations.

Page 262: SPSS Base Users Guide 14.0

236

Chapitre 9

Sélection d’un sous-groupe d’observations

E A partir des menus, sélectionnez :Données

Sélectionner des observations

E Sélectionnez une des méthodes de sélection d’observations.

E Spécifiez les critères de sélection des observations.

Sélectionner observations : Si

La boîte de dialogue vous permet de sélectionner des sous-ensembles d’observationsà l’aide d’expressions conditionnelles. Une expression conditionnelle renvoie lavaleur True (vrai), False (faux) ou manquant pour chaque observation.

Figure 9-11Boîte de dialogue Sélectionner des observations : Si

Si le résultat d’une expression conditionnelle est Vrai, l’observation est inclusedans le sous-ensemble sélectionné.

Si le résultat d’une expression conditionnelle est Faux ou manquant, l’observationn’est pas incluse dans le sous-ensemble sélectionné.

Page 263: SPSS Base Users Guide 14.0

237

Gestion et transformations de fichiers

La plupart des expressions conditionnelles utilisent un ou plus des six opérateursrelationnels (<, >, <=, >=, = et ~=) du pavé numérique.

Les expressions conditionnelles peuvent comprendre des noms de variable, desconstantes, des opérateurs arithmétiques, des fonctions (numériques ou non), desvariables logiques et des opérateurs relationnels.

Sélectionner observations : Echantillon aléatoire

Cette boîte de dialogue vous permet de sélectionner un échantillon aléatoireà partir d’un pourcentage approximatif ou un nombre précis d’observations.L’échantillonnage est réalisé sans remplacement ; vous ne pouvez donc sélectionnerune même observation qu’une seule fois.

Figure 9-12Boîte de dialogue Sélectionner observations : Echantillon aléatoire

Environ. SPSS génère un échantillon aléatoire d’observations dont le nombrecorrespond approximativement au pourcentage indiqué. Comme cette routine génèreune décision indépendante pseudo-aléatoire pour chaque observation, le pourcentaged’observations sélectionnées peut seulement approcher le pourcentage spécifié. Plusil y a d’observations dans le fichier de données, plus le pourcentage des observationssélectionnées sera proche de la valeur indiquée.

Exactement. Nombre d’observations spécifié par l’utilisateur. Vous devez égalementindiquer le nombre d’observations à partir duquel l’échantillon sera généré. Cedeuxième nombre doit être inférieur ou égal au nombre total d’observationsdans le fichier de données. Si ce nombre dépasse le nombre total d’observationsdans le fichier de données, l’échantillon contiendra proportionnellement moinsd’observations que le nombre demandé.

Page 264: SPSS Base Users Guide 14.0

238

Chapitre 9

Sélectionner observations : Plage

Cette boîte de dialogue vous permet de sélectionner des observations à partir d’unintervalle de numéros d’observation ou d’un intervalle de date ou de temps.

Les intervalles d’observations sont fondés sur un numéro de ligne, affiché dansl’éditeur de données.

Les intervalles de dates et de temps sont valables uniquement pour lesDonnées deséries chronologiques disposant de variables de date (menu Données, Définirdates).

Figure 9-13Sélectionnez la boîte de dialogue Intervalle d’observations pour un intervalle d’observations(aucune variable de date définie).

Figure 9-14Sélectionnez la boîte de dialogue Intervalle d’observations pour les séries chronologiques(variable de date définie).

Page 265: SPSS Base Users Guide 14.0

239

Gestion et transformations de fichiers

Pondérer les observationsPondérer les observations permet de pondérer différemment les observations (parréplication simulée) dans le cadre de l’analyse statistique.

Les valeurs de la variable de pondération doivent indiquer le nombred’observations représentées par des observations uniques de données.

Les observations avec zéro, une valeur négative ainsi que les variables manquantespour la variable de pondération sont exclues de l’analyse.

Vous pouvez utiliser des fractions. Elles sont utilisées à leur juste valeur lorsquecela est significatif, et le plus souvent lorsque les observations sont tabulées(tableaux croisés).

Figure 9-15Boîte de dialogue Pondérer les observations

Une fois que vous avez appliqué une variable de pondération, celle-ci est effectivejusqu’à ce que vous sélectionniez une autre variable de pondération ou que vousdésactiviez cette pondération. Si vous enregistrez un fichier de données pondérées,les informations de pondération sont également enregistrées. Vous pouvez désactiverla pondération à n’importe quel moment, même après l’enregistrement du fichieravec sa pondération.

Pondération dans des tableaux croisés. Plusieurs options de la procédure Tableauxcroisés permettent de gérer la pondération des observations. Pour plus d'informations,reportez-vous à « Affichage de cellules (cases) de tableaux croisés » dans Chapitre17 à p. 387.

Pondération des diagrammes de dispersion et histogrammes. Les diagrammes dedispersion et les histogrammes disposent d’une option d’activation/désactivation dela pondération des observations, mais cela n’affecte pas les observations avec des

Page 266: SPSS Base Users Guide 14.0

240

Chapitre 9

valeurs négatives, des zéros, ou une valeur manquante pour la variable de pondération.Ces observations sont toujours exclues du diagramme même lorsque la pondérationest désactivée depuis ce diagramme.

Pour pondérer des observations

E A partir des menus, sélectionnez :Données

Pondérer les observations

E Sélectionnez Pondérer les observations par.

E Sélectionnez une variable de fréquence.

Les valeurs de la variable de fréquence servent à la pondération des observations. Parexemple, une observation ayant la valeur 3 dans la table de fréquence représente 3observations dans le fichier des données pondérées.

Restructuration des données

Utilisez l’Assistant de restructuration des données pour restructurer les données quisont nécessaires à la procédure SPSS choisie. L’Assistant remplace le fichier actuelpar un nouveau fichier, restructuré. L’Assistant vous permet de :

Restructurer les variables sélectionnées en observations

Restructurer les observations sélectionnées en variables

Transposer toutes les données

Restructuration des données

E A partir des menus, sélectionnez :Données

Restructurer...

E Sélectionnez le type de restructuration à effectuer.

E Sélectionnez les données à restructurer.

Page 267: SPSS Base Users Guide 14.0

241

Gestion et transformations de fichiers

Sinon, vous pouvez :

Créer des variables d’identification qui vous permettent de faire correspondre unevaleur du nouveau fichier avec la valeur du fichier d’origine

Trier les données avant leur restructuration

Définir les options du nouveau fichier

Coller la syntaxe de la commande dans une fenêtre de syntaxe

Assistant de restructuration des données : Sélectionner un type

Servez-vous de l’Assistant de restructuration des données pour restructurer vosdonnées. Dans la première boîte de dialogue, sélectionnez le type de restructuration àeffectuer.

Figure 9-16Assistant de restructuration des données

Page 268: SPSS Base Users Guide 14.0

242

Chapitre 9

Restructurer les variables sélectionnées en observations. Sélectionnez cette optionlorsque vos données comportent des groupes de colonnes apparentées que voussouhaitez faire apparaître dans des groupes de lignes du nouveau fichier dedonnées. Si vous choisissez cette option, l’assistant affiche les étapes relatives àl’opération de restructuration des variables en observations.

Restructurer les observations sélectionnées en variables. Sélectionnez cette optionlorsque vos données comportent des groupes de lignes apparentées que voussouhaitez faire apparaître dans des groupes de colonnes du nouveau fichier dedonnées. Si vous choisissez cette option, l’Assistant affiche les étapes relatives àl’opération de restructuration des observations en variables.

Transposer toutes les donnéesChoisissez cette option pour transposer vos données.Dans les nouvelles données, toutes les lignes vont être transformées en colonneset les colonnes en lignes. La sélection de cette option entraîne la fermeture del’Assistant de restructuration des données et l’ouverture de la boîte de dialogueTransposer les données.

Choix du mode de restructuration des données

Une variable contient les informations à analyser, comme une mesure ou un résultat.Une observation correspond, par exemple, à un individu. Dans une structure dedonnées simple, chaque variable correspond à une colonne de vos données et chaqueobservation à une ligne. Supposez que vous mesuriez les résultats obtenus à un testpar tous les étudiants d’une classe. Dans ce cas, tous les résultats apparaissent dansune même colonne et une ligne est associée à chaque étudiant.

Lors de l’analyse des données, vous êtes souvent amené à analyser la manière dontune variable évolue en fonction de certaines conditions. Ces conditions peuventcorrespondre à un traitement expérimental précis, à une population, à un momenten particulier, etc. Dans l’analyse des données, les conditions qui vous intéressentsont souvent appelées facteurs. Lorsque vous analysez des facteurs, vous obtenezune structure de données complexe. Vous pouvez disposer d’informations sur unevariable dans plusieurs colonnes de vos données (par exemple, une colonne pourchaque niveau d’un facteur) ou d’informations sur une observation dans plusieurslignes (par exemple, une ligne pour chaque niveau d’un facteur). L’Assistant derestructuration des données vous aide à restructurer les fichiers dont la structure dedonnées est complexe.

Les options que vous sélectionnez dans l’Assistant dépendent de la structure dufichier actuel et de celle du nouveau fichier.

Page 269: SPSS Base Users Guide 14.0

243

Gestion et transformations de fichiers

Organisation des données dans le fichier actuel Vous pouvez organiser les donnéesactuelles de telle sorte que les facteurs soient enregistrés dans une variable distincte(dans des groupes d’observations) ou avec la variable (dans des groupes de variables).

Groupes d’observations. Dans le fichier actuel, les variables et les conditionssont-elles enregistrées dans des colonnes distinctes ? Par exemple :

var factor

8 1

9 1

3 2

1 2

Dans cet exemple, les deux premières lignes constituent un groupe d’observationscar elles sont apparentées. Elles contiennent des données relatives au même niveau defacteur. Dans les analyses de données SPSS, le facteur est souvent appelé variable deregroupement lorsque les données sont structurées de cette manière.

Groupes de colonnes. Dans le fichier actuel, les variables et les conditionssont-elles enregistrées dans la même colonne ? Par exemple :

var_1 var_2

8 3

9 1

Dans cet exemple, les deux colonnes constituent un groupe de variables car ellessont apparentées. Elles contiennent des données concernant la même variable (var_1pour le niveau de facteur 1 et var_2 pour le niveau de facteur 2). Dans les analysesde données SPSS, le facteur est souvent appelé mesure répétée lorsque les donnéessont structurées de cette manière.

Organisation des données dans le nouveau fichier La procédure d’analyse des donnéesdétermine généralement l’organisation des données.

Procédures nécessitant des groupes d’observations. Vous devez structurer vosdonnées en groupes d’observations pour procéder à des analyses qui requièrentune variable de regroupement. A titre d’exemple, il est possible de citer le modèlelinéaire général pour les composantes univariées, multivariées et de variance,les modèles linéaires généraux, les modèles mixtes, les cubes OLAP, ainsi que

Page 270: SPSS Base Users Guide 14.0

244

Chapitre 9

le test T ou les tests non paramétriques pour les échantillons indépendants. Sivos données actuelles sont structurées en groupes de variables, sélectionnezRestructurer les variables sélectionnées en observations pour procéder à cesanalyses.

Procédures nécessitant des groupes de variables. Vous devez structurer vosdonnées en groupes de variables pour procéder à des analyses de mesuresrépétées. A titre d’exemple, il est possible de citer le modèle linéaire généralpour les mesures répétées, l’analyse par la régression de Cox à prédicteurschronologiques, le test T pour les échantillons appariés ou les tests nonparamétriques pour les échantillons apparentés. Si vos données actuelles sontstructurées en groupes d’observations, sélectionnez Restructurer les observationssélectionnées en variables pour procéder à ces analyses.

Exemple de restructuration de variables en observations

Dans cet exemple, les résultats d’un test sont enregistrés dans des colonnes distinctespour chacun des facteurs A et B.

Figure 9-17Données actuelles utilisées pour la restructuration de variables en observations

Vous voulez réaliser un test t pour des échantillons indépendants. Vous disposezd’un groupe de colonnes comprenant score_a et score_b, mais pas de la variablede regroupement requise par la procédure. Sélectionnez Restructurer les variables

sélectionnées en observations dans l’Assistant de restructuration des données,restructurez un groupe de variables dans une nouvelle variable intitulée résultat,puis créez un index appelé groupe. Le nouveau fichier de données est illustré dansla figure suivante.

Page 271: SPSS Base Users Guide 14.0

245

Gestion et transformations de fichiers

Figure 9-18Nouvelles données restructurées utilisées pour la restructuration de variables enobservations

Lorsque vous exécutez le test t pour des échantillons indépendants, vous pouvezdésormais utiliser l’index groupe en tant que variable de regroupement.

Exemple de restructuration d’observations en variables

Dans cet exemple, les résultats du test sont enregistrés deux fois pour chaquesujet—avant et après le traitement.

Figure 9-19Données actuelles utilisées pour la restructuration d’observations en variables

Vous voulez réaliser un test t pour des échantillons appariés. Vos données sontstructurées en groupes d’observations, mais vous ne disposez pas des mesuresrépétées des variables appariées requises par la procédure. Sélectionnez Restructurer

les observations sélectionnées en variables dans l’Assistant de restructuration desdonnées, utilisez id pour identifier les groupes de lignes dans les données actuelles, ettemps pour créer le groupe de variables dans le nouveau fichier.

Figure 9-20Nouvelles données restructurées utilisées pour la restructuration d’observations envariables

Page 272: SPSS Base Users Guide 14.0

246

Chapitre 9

Pour l’exécution du test t pour échantillons appariés, vous pouvez désormais utiliserava et apr comme paire de variables.

Assistant de restructuration des données (Restructurer les variables enobservations) : Nombre de groupes de variables

Remarque : L’Assistant vous propose cette étape lorsque vous optez pour larestructuration des groupes de variables en lignes.

Lors de cette étape, vous déterminez le nombre de groupes de variables du fichieractuel à restructurer dans le nouveau fichier.

Nombre de groupes de variables présents dans le fichier actuel. Déterminez le nombrede groupes de variables présents dans les données actuelles. Un groupe de colonnesapparentées, appelé groupe de variables, permet d’enregistrer les mesures répétéesd’une même variable dans des colonnes distinctes. Supposez que parmi les donnéesdont vous disposez, trois colonnes, l1, l2 et l3, enregistrent la largeur. Dans ce cas,vous avez un groupe de variables. Si trois autres colonnes, h1, h2 et h3, enregistrentla hauteur, vous disposez de deux groupes de variables.

Nombre de groupes de variables à créer dans le nouveau fichier Déterminez le nombrede groupes de variables à représenter dans le nouveau fichier. Il n’est pas nécessairede restructurer tous les groupes de variables dans le nouveau fichier.

Page 273: SPSS Base Users Guide 14.0

247

Gestion et transformations de fichiers

Figure 9-21Assistant de restructuration des données : Nombre de groupes de variable, étape 2

Une. L’Assistant crée une variable restructurée dans le nouveau fichier à partird’un groupe de variables du fichier actuel.

Plusieurs. L’Assistant crée plusieurs variables restructurées dans le nouveaufichier. Le nombre spécifié est utilisé à l’étape suivante, au cours de laquellel’Assistant crée automatiquement le nombre de variables indiqué.

Assistant de restructuration des données (Restructurer les variables enobservations) : Sélectionnez Variables

Remarque : L’Assistant vous propose cette étape lorsque vous optez pour larestructuration des groupes de variables en lignes.

Page 274: SPSS Base Users Guide 14.0

248

Chapitre 9

A cette étape, décrivez le mode d’utilisation des variables du fichier actuel dans lenouveau fichier. Vous pouvez également créer une variable qui identifie les lignesdu nouveau fichier.

Figure 9-22Assistant de restructuration des données : Sélectionner les variables, étape 3

Identification des nouvelles lignes. Vous pouvez créer une variable dans le nouveaufichier de données afin d’identifier la ligne du fichier actuel qui a servi à créer ungroupe de nouvelles lignes. L’identificateur peut être un numéro d’observationséquentiel ; il peut également s’agir des valeurs de la variable. Utilisez lescontrôles de l’option Identification du groupe d’observations pour définir la variabled’identification dans le nouveau fichier. Cliquez sur une cellule pour modifier lenom de la variable par défaut et attribuer une étiquette descriptive à la variabled’identification.

Page 275: SPSS Base Users Guide 14.0

249

Gestion et transformations de fichiers

Eléments à restructurer dans le nouveau fichier. A l’étape précédente, vous avez indiquéà l’Assistant le nombre de groupes de variables à restructurer. L’Assistant a créé unevariable pour chaque groupe. Les valeurs du groupe de variables apparaîtront danscette variable, dans le nouveau fichier. Utilisez les contrôles de l’option Variables àtransposer pour définir la variable restructurée dans le nouveau fichier.

Pour spécifier une variable structurée

E Placez dans la liste Variables à transposer les variables comprenant le groupe devariables à transformer. Toutes les variables du groupe doivent être du même type(numérique ou alphanumérique).

Vous pouvez inclure une même variable plusieurs fois dans le groupe de variables(au lieu d’être déplacées, les variables sont copiées à partir de la liste des variablessource) ; ses valeurs sont répétées dans le nouveau fichier.

Pour spécifier plusieurs variables structurées

E Dans la liste déroulante, sélectionnez la première variable cible à définir.

E Placez dans la liste Variables à transposer les variables comprenant le groupe devariables à transformer. Toutes les variables du groupe doivent être du même type(numérique ou alphanumérique). Vous pouvez inclure la même variable plusieurs foisdans le groupe de variables. (Une variable est copiée au lieu d’être déplacée à partirde la liste des variables source et ses valeurs sont répétées dans le nouveau fichier.)

E Sélectionnez la variable cible suivante à définir et recommencez le processus desélection de la variable pour toutes les variables cible disponibles.

Bien que vous puissiez inclure plusieurs fois une même variable dans un groupede variables cible, vous ne pouvez pas l’inclure dans plusieurs groupes devariables cible.

Chaque liste de groupes de variables cible doit contenir le même nombre devariables. (Les variables répertoriées plusieurs fois sont comptées.)

Page 276: SPSS Base Users Guide 14.0

250

Chapitre 9

Le nombre de groupes de variables cible est déterminé par le nombre de groupesde variables que vous avez indiqué à l’étape précédente. Vous pouvez modifier lenom par défaut des variables ici, mais pour modifier le nombre de groupes devariables à restructurer, vous devez retourner à l’étape précédente.

Vous devez définir les groupes de variables (sélectionnez les variables dans la listesource) pour chaque variable cible disponible avant de passer à l’étape suivante.

Eléments à copier dans le nouveau fichier. Les variables non restructurées peuvent êtrecopiées dans le nouveau fichier. Leurs valeurs seront répercutées dans les nouvelleslignes. Déplacez vers la liste Variable(s) fixe(s) les variables à copier dans le nouveaufichier.

Assistant de restructuration des données (Restructurer les variables enobservations) : Créer des variables Variables

Remarque : L’Assistant vous propose cette étape lorsque vous optez pour larestructuration des groupes de variables en lignes.

A cette étape, indiquez si vous voulez créer des variables d’index. Un index est unenouvelle variable qui identifie de manière séquentielle un groupe de lignes d’après lavariable d’origine à partir de laquelle la nouvelle ligne a été créée.

Page 277: SPSS Base Users Guide 14.0

251

Gestion et transformations de fichiers

Figure 9-23Assistant de restructuration des données : Créer des variables d’index, étape 4

Nombre de variables d’index à créer dans le nouveau fichier Vous pouvez utiliser lesvariables d’index en tant que variables de regroupement dans les procédures SPSS.Dans la plupart des cas, une variable d’index suffit. Toutefois, si les groupes devariables de votre fichier actuel font apparaître plusieurs niveaux de facteur, il estrecommandé de créer plusieurs index.

Une. L’Assistant crée une seule variable d’index.

Plusieurs. L’Assistant crée plusieurs index. Entrez le nombre d’index à créer. Lenombre spécifié est utilisé à l’étape suivante, au cours de laquelle l’Assistant créeautomatiquement le nombre d’index indiqué.

Aucune. Sélectionnez cette option pour ne créer aucune variable d’index dans lenouveau fichier.

Page 278: SPSS Base Users Guide 14.0

252

Chapitre 9

Exemple d’index unique lors de la restructuration de variables en observations

Parmi les données actuelles figurent un groupe de variables, largeur, et un facteur,temps. La largeur a été mesurée trois fois et enregistrée dans l1, l2 et l3.

Figure 9-24Données actuelles utilisées pour un index

Vous allez restructurer le groupe de variables en une seule variable, largeur, et créerun index numérique. Les nouvelles données sont illustrées dans le tableau suivant.

Figure 9-25Nouvelles données restructurées avec un index

La valeur Index débute à 1 et s’incrémente pour chacune des variables du groupe.Elle se réinitialise sur 1 dès qu’une nouvelle ligne est détectée dans le fichierd’origine. Vous pouvez désormais utiliser la valeur index dans les procédures SPSSqui requièrent une variable de regroupement.

Exemple de deux index lors de la restructuration de variables en observations

Lorsqu’un groupe de variables enregistre plusieurs facteurs, vous pouvez créerplusieurs index. Toutefois, vous devez organiser les données utilisées de façon à ceque les niveaux du premier facteur correspondent à un index principal qui inclut lesniveaux des facteurs suivants. Les données actuelles comprennent un groupe devariables, largeur et deux facteurs, A et B. Les données sont organisées de telle sorteque les niveaux du facteur B sont inclus dans les niveaux du facteur A.

Page 279: SPSS Base Users Guide 14.0

253

Gestion et transformations de fichiers

Figure 9-26Données actuelles utilisées pour deux index

Vous allez restructurer le groupe de variables en une seule variable, largeur, et créerdeux index. Les nouvelles données sont illustrées dans le tableau suivant.

Figure 9-27Nouvelles données restructurées avec deux index

Assistant de restructuration des données (Restructurer les variables enobservations) : Créer une variable d’index

Remarque : L’Assistant vous propose cette étape lorsque vous optez pour larestructuration des groupes de variables en lignes et pour la création d’une variabled’index.

A cette étape, indiquez les valeurs à affecter à la variable d’index. Vous pouvezutiliser des nombres séquentiels ou le nom des variables d’un groupe de variablesd’origine. Vous pouvez également attribuer un nom et une étiquette à la nouvellevariable d’index.

Page 280: SPSS Base Users Guide 14.0

254

Chapitre 9

Figure 9-28Assistant de restructuration des données : Créer une variable d’index, étape 5

Pour plus d'informations, reportez-vous à « Exemple d’index unique lors de larestructuration de variables en observations » à p. 252.

Nombres séquentiels. L’Assistant affecte automatiquement des numérosséquentiels en tant que valeurs d’index.

Noms des variables. L’Assistant utilise les noms du groupe de variablessélectionné en tant que valeurs d’index. Choisissez un groupe de variables dansla liste proposée.

Noms et étiquettes. Cliquez sur une cellule pour modifier le nom de la variable pardéfaut et attribuer une étiquette descriptive à la variable d’index.

Page 281: SPSS Base Users Guide 14.0

255

Gestion et transformations de fichiers

Assistant de restructuration des données (Restructurer les variables enobservations) : Créer plusieurs variables d’index

Remarque : L’Assistant vous propose cette étape lorsque vous optez pour larestructuration des groupes de variables en lignes et pour la création de plusieursvariables d’index.

A cette étape, indiquez le nombre de niveaux de chaque variable d’index. Vouspouvez également attribuer un nom et une étiquette à la nouvelle variable d’index.

Figure 9-29Assistant de restructuration des données : Créer plusieurs variables d’index, étape 5

Pour plus d'informations, reportez-vous à « Exemple de deux index lors de larestructuration de variables en observations » à p. 252.

Page 282: SPSS Base Users Guide 14.0

256

Chapitre 9

Nombre de niveaux enregistrés dans le fichier actuel Déterminez le nombre de niveauxde facteur enregistrés dans les données actuelles. Un niveau définit un grouped’observations ayant été soumis à des conditions identiques. En cas de facteursmultiples, vous devez organiser les données actuelles de façon à ce que les niveauxdu premier facteur correspondent à un index principal qui inclut les niveaux desfacteurs suivants.

Nombre de niveaux à créer dans le nouveau fichier Entrez le nombre de niveauxpour chaque index. Les valeurs des variables d’index multiples sont toujours desnombres séquentiels. Les valeurs débutent à 1 et s’incrémentent à chaque niveau.L’incrémentation du premier index est la plus lente ; celle du dernier index est laplus rapide.

Niveaux combinés (total). Vous ne pouvez pas créer plus de niveaux que dans lesdonnées actuelles. Etant donné que les données restructurées vont contenir une lignepour chaque combinaison de traitements, l’Assistant vérifie le nombre de niveauxque vous créez. Il va comparer le produit des niveaux créés au nombre de variablesfigurant dans vos groupes de variables. Ils doivent être identiques.

Noms et étiquettes. Cliquez sur une cellule pour modifier le nom de la variable pardéfaut et attribuer une étiquette descriptive aux variables d’index.

Assistant de restructuration des données (Restructurer les variables enobservations) : Options

Remarque : L’Assistant vous propose cette étape lorsque vous optez pour larestructuration des groupes de variables en lignes.

A cette étape, précisez les options du nouveau fichier restructuré.

Page 283: SPSS Base Users Guide 14.0

257

Gestion et transformations de fichiers

Figure 9-30Assistant de restructuration des données : Options, étape 6

Suppression des variables non sélectionnées Lors de la phase de sélection des variables(étape 3), vous avez indiqué les groupes de variables à restructurer, les variables àcopier et une variable d’identification parmi les données actuelles. Les données desvariables sélectionnées vont figurer dans le nouveau fichier. Si d’autres variablesfigurent dans les données actuelles, vous pouvez les supprimer ou les conserver.

Conservation des données manquantes L’Assistant recherche des valeurs nulles danschacune des nouvelles lignes potentielles. Une valeur nulle est une valeur manquantepar défaut ou vide. Vous pouvez conserver ou supprimer les lignes qui contiennentuniquement des valeurs nulles.

Création d’une variable de décompte L’Assistant peut créer une variable de décomptedans le nouveau fichier. Elle contient le nombre de nouvelles lignes générées par uneligne des données actuelles. Une variable de décompte peut s’avérer utile lorsque

Page 284: SPSS Base Users Guide 14.0

258

Chapitre 9

vous choisissez de supprimer les valeurs nulles du nouveau fichier. Il est en effet alorspossible de créer un nombre de lignes différent pour une ligne précise des donnéesactuelles. Cliquez sur une cellule pour modifier le nom de la variable par défaut etattribuer une étiquette descriptive à la variable de décompte.

Assistant de restructuration des données (Restructurer les observations envariables) : Sélectionnez Variables

Remarque : L’Assistant vous propose cette étape lorsque vous optez pour larestructuration des groupes d’observations en colonnes.

A cette étape, décrivez le mode d’utilisation des variables du fichier actuel dansle nouveau fichier.

Figure 9-31Assistant de restructuration des données : Sélectionner les variables, étape 2

Page 285: SPSS Base Users Guide 14.0

259

Gestion et transformations de fichiers

Eléments d’identification des groupes d’observations dans les données actuelles Ungroupe d’observations est un groupe de lignes apparentées. En effet, ces dernièresmesurent la même unité d’observation, comme un individu ou une institution.L’Assistant doit pouvoir repérer les variables du fichier actuel qui identifient lesgroupes d’observations afin d’intégrer chacun d’entre eux dans une ligne du nouveaufichier. Déplacez vers la liste Variable(s) de l’identificateur les variables qui identifientles groupes d’observations dans le nouveau fichier. Les variables qui servent à diviserle fichier de données actuel sont automatiquement affectées à l’identification desgroupes. Chaque fois que l’Assistant détecte une nouvelle combinaison de valeursd’identification, il crée une ligne. Vous devez par conséquent trier les observationsdu fichier actuel sur la base des valeurs des variables d’identification, dans le mêmeordre que les variables qui figurent dans la liste Variable(s) de l’identificateur. Vouspouvez trier le fichier actuel à l’étape suivante.

Mode de création des groupes de variables dans le nouveau fichier Dans les donnéesd’origine, une variable apparaît dans une seule colonne. Dans le nouveau fichier dedonnées, cette variable apparaît dans plusieurs colonnes. Les variables d’indexcorrespondent aux variables incluses dans les données actuelles dont l’Assistant sesert pour créer des colonnes. Les données restructurées contiendront une nouvellevariable pour chacune des valeurs uniques figurant dans ces colonnes. Déplacez versla liste Variable(s) d’index les variables qui doivent servir à la création des groupes devariables. Parmi les possibilités offertes par l’Assistant, vous pouvez également opterpour le tri des nouvelles colonnes par index.

Devenir des autres colonnes L’Assistant détermine automatiquement ce que vontdevenir les variables qui demeurent dans la liste Fichier actuel. Il vérifie pour chaquevariable si les valeurs des données varient au sein d’un groupe d’observations. Si telest le cas, l’Assistant restructure, dans le nouveau fichier, les valeurs dans un groupede variables. Dans le cas contraire, l’Assistant copie les valeurs dans le nouveaufichier.

Assistant de restructuration des données (Restructurer les observations envariables) : Trier Données

Remarque : L’Assistant vous propose cette étape lorsque vous optez pour larestructuration des groupes d’observations en colonnes.

Page 286: SPSS Base Users Guide 14.0

260

Chapitre 9

A cette étape, indiquez si vous voulez trier le fichier actuel avant de le restructurer.Chaque fois que l’Assistant détecte une nouvelle combinaison de valeursd’identification, il crée une ligne. Vous devez par conséquent trier les données d’aprèsles variables identifiant les groupes d’observations.

Figure 9-32Assistant de restructuration des données : Trier les données, étape 3

Organisation des lignes dans le fichier actuel Déterminez le mode de tri des donnéesactuelles et les variables qui servent à identifier les groupes de variables (définis àl’étape précédente).

Oui. L’Assistant trie automatiquement les données actuelles par variabled’identification, dans le même ordre que les variables qui figurent dans la listeVariable(s) de l’identificateur présentée à l’étape précédente. Sélectionnez cetteoption lorsque les données ne sont pas triées par variable d’identification oulorsque vous avez des doutes à ce propos. Cette option implique un passage

Page 287: SPSS Base Users Guide 14.0

261

Gestion et transformations de fichiers

distinct des données, mais elle assure un tri adéquat des lignes dans l’optique dela restructuration.

Non. L’Assistant ne trie pas les données actuelles. Sélectionnez cette optionlorsque vous êtes certain que les données actuelles sont triées sur la base desvariables qui identifient les groupes d’observations.

Assistant de restructuration des données (Restructurer les observations envariables) : Options

Remarque : L’Assistant vous propose cette étape lorsque vous optez pour larestructuration des groupes d’observations en colonnes.

A cette étape, précisez les options du nouveau fichier restructuré.

Figure 9-33Assistant de restructuration des données : Options, étape 4

Page 288: SPSS Base Users Guide 14.0

262

Chapitre 9

Mode de tri des groupes de variables dans le nouveau fichier

Par variable. L’Assistant regroupe les variables créées à partir d’une variabled’origine.

Par index. L’Assistant regroupe les variables en fonction des valeurs des variablesd’index.

Exemple. Les variables à restructurer sont l et h, et l’index est mois :

l h mois

Le résultat du regroupement par variable est le suivant :

l.jan l.fév h.jan

Le résultat du regroupement par index est le suivant :

l.jan h.jan l.fév

Création d’une variable de décompte L’Assistant peut créer une variable de décomptedans le nouveau fichier. Elle contient le nombre de lignes des données actuelles qui apermis de créer une ligne dans le nouveau fichier de données.

Créer des variables indicatrices L’assistant peut utiliser les variables d’index pourcréer des variables indicatrices dans le nouveau fichier de données. Il crée unevariable pour chaque valeur unique de la variable d’index. Les variables indicatricessignalent la présence ou l’absence d’une valeur pour une observation. Une variableindicatrice a la valeur 1 si l’observation a une valeur ; sinon, elle a la valeur 0.

Exemple. La variable d’index est produit. Elle enregistre les produits achetés par unclient. Les données d’origine sont les suivantes :

client produit

1 poussin

1 oeufs

2 oeufs

3 poussin

Page 289: SPSS Base Users Guide 14.0

263

Gestion et transformations de fichiers

La création d’une variable indicatrice entraîne la création d’une variable pour chaquevaleur unique de produit. Les données restructurées sont les suivantes :

client poussinindicateur

oeufs indicateurs

1 1 1

2 0 1

3 1 0

Dans cet exemple, les données restructurées pourraient être utilisées pour obtenir deseffectifs des produits achetés par le client.

Assistant de restructuration des données : Terminer

Il s’agit de la dernière étape de l’Assistant de restructuration de données. Définissezl’objet de vos spécifications.

Page 290: SPSS Base Users Guide 14.0

264

Chapitre 9

Figure 9-34Assistant de restructuration des données : Terminer

Restructurer. L’assistant crée le fichier restructuré. Choisissez cette option pourremplacer immédiatement le fichier actuel. Remarque : Si les données d’originesont pondérées, les nouvelles données sont également pondérées à moins que lavariable qui sert de pondération ne soit restructurée ou supprimée du nouveaufichier.

Coller la syntaxe. L’assistant colle la syntaxe générée dans une fenêtre de syntaxe.Sélectionnez cette option si vous n’êtes pas prêt à remplacer le fichier actuel,lorsque vous voulez modifier sa syntaxe ou lorsque vous souhaitez l’enregistreren vue d’une utilisation ultérieure.

Page 291: SPSS Base Users Guide 14.0

Chapitre

10Utilisation du résultat

Lorsque vous lancez une procédure, les résultats sont affichés dans une fenêtreappelée le Résultats. Dans cette fenêtre, vous pouvez facilement naviguer vers lerésultat que vous voulez voir. Vous pouvez également manipuler le résultat et créerun document contenant précisément le résultat voulu.

Résultats

Les résultats sont affichés dans le Résultats. Vous pouvez utiliser le Résultats pour :

parcourir les résultats ;

afficher ou masquer les tableaux et diagrammes sélectionnés ;

modifier l’ordre d’affichage des résultats en déplaçant les éléments sélectionnés ;

déplacer des éléments entre le Résultats et d’autres applications.

265

Page 292: SPSS Base Users Guide 14.0

266

Chapitre 10

Figure 10-1Résultats

Le Résultats est divisé en deux panneaux :

Le panneau de gauche du Résultats contient une légende du contenu du résultat.

Le panneau droit contient les tableaux statistiques, les diagrammes et les textes.

Vous pouvez utiliser les barres de défilement pour parcourir les résultats ou cliquersur un élément de la ligne de légende pour aller directement au tableau ou diagrammecorrespondant. Vous pouvez cliquer et faire glisser le bord droit de la fenêtre delégende pour modifier la largeur de la fenêtre.

Utilisation du Résultats en mode brouillon

Si vous préférez les sorties en texte simple plutôt que les tableaux pivotants interactifs,vous pouvez utiliser le Résultats en mode brouillon.

Page 293: SPSS Base Users Guide 14.0

267

Utilisation du résultat

Pour utiliser le Résultats en mode brouillon :

E A partir du menu de n’importe quelle fenêtre, sélectionnez :Edition

Options

E Dans l’onglet Général, cliquez sur Editeur de résultats en mode brouillon comme typede résultat.

E Pour modifier les options de format de sortie du Résultats en mode brouillon, cliquezsur l’onglet Résultats en mode Brouillon.

Pour plus d'informations, reportez-vous à « Viewer en mode brouillon » dans Chapitre11 à p. 301. Vous pouvez également rechercher des informations dans l’utilitaired’aide pour en apprendre plus :

E A partir du menu de n’importe quelle fenêtre, sélectionnez :Aide

Rubriques

E Cliquez sur l’onglet Index dans la fenêtre Rubriques d’aide.

E Tapez Editeur de résultats en mode brouillon et double-cliquez sur l’entrée d’index.

Affichage et masquage des résultats

Dans le Résultats, vous pouvez sélectionner individuellement des tableaux ou lesrésultats d’une procédure pour les afficher ou les masquer. Ce processus est utile sivous voulez limiter la proportion de résultats visibles dans le panneau de contenu.

Pour masquer un tableau ou un diagramme

E Double-cliquez sur l’icône Livre de l’élément dans le panneau de légende de l’Editeurde résultats.

ou

E Cliquez sur l’élément pour le sélectionner.

Page 294: SPSS Base Users Guide 14.0

268

Chapitre 10

E A partir des menus, sélectionnez :Affichage

Masquer

ou

E Cliquez sur l’icône Livre fermé (Masquer) dans la barre d’outils Légende.

L’icône Livre ouvert (Montrer) devient l’icône active, indiquant que l’élément estdésormais masqué.

Pour masquer les résultats de la procédure

E Cliquez sur la boîte à gauche du nom de la procédure dans le panneau de légende.

Cela masque tous les résultats de la procédure et réduit l’affichage de la légende.

Déplacement, suppression et copie de résultats

Vous pouvez réarranger les résultats en copiant, en déplaçant ou en effaçant unélément ou un groupe d’éléments.

Pour déplacer des résultats dans l’Editeur de résultats

E Cliquez sur un item affiché dans le panneau de légende ou de contenu. (Maj-Clicpour sélectionner plusieurs éléments, ou Ctrl-clic pour sélectionner des élémentsnon contigus)

E Cliquez et faites glisser les items sélectionnés (maitenir le bouton de la souris enfoncélors du déplacement).

E Relâchez le bouton de la souris lorsque le curseur se trouve sur l’élément situé justeau-dessus de l’emplacement où vous voulez placer les éléments sélectionnés.

Vous pouvez également déplacer les éléments à l’aide des commandes Couper etColler après du menu Edition.

Page 295: SPSS Base Users Guide 14.0

269

Utilisation du résultat

Pour supprimer des résultats dans l’Editeur de résultats

E Cliquez sur un item affiché dans le panneau de légende ou de contenu. (Maj-Clicpour sélectionner plusieurs éléments, ou Ctrl-clic pour sélectionner des élémentsnon contigus)

E Appuyez sur la touche Supprimer.

ou

E A partir des menus, sélectionnez :Edition

Suppr

Pour copier des résultats dans l’Editeur de résultats

E Cliquez sur un item affiché dans le panneau de légende ou de contenu. (Maj-Clicpour sélectionner plusieurs éléments, ou Ctrl-clic pour sélectionner des élémentsnon contigus)

E Maintenez la touche Ctrl enfoncée pour cliquer et faire glisser les élémentssélectionnés (maintenez le bouton de la souris enfoncé pendant que vous faites glisserles éléments sélectionnés).

E Relâchez le bouton de la souris pour déposer les éléments à l’endroit désiré.

Vous pouvez également copier des items à l’aide des commandes Copier et Colleraprès du menu Edition.

Changemernt de l’alignement initial

Par défaut, tous les résultats sont initialement alignés à gauche. Vous pouvez modifierl’alignement initial (dans le menu Edition, choisissez Options, puis l’onglet Editeur de

résultats) à tout moment.

Changement de l’alignement des items de résultat

E Dans le panneau de légende ou de contenu, cliquez sur les items à aligner (cliquezdessus tout en appuyant sur la touche Maj ou Ctrl).

Page 296: SPSS Base Users Guide 14.0

270

Chapitre 10

E A partir des menus, sélectionnez :Format

Aligner à gauche

Les autres options d’alignement incluent Centrer et Aligner à droite.

Remarque : Tous les résultats sont affichés dans le Résultats avec alignement àgauche. Seul l’alignement des résultats imprimés est affecté par les paramètresd’alignement. Les éléments centrés et alignés à droite sont identifiés par un symbolesitué au-dessus et à gauche des éléments en question.

Légende du Résultats

Le panneau de légende fournit une table des matières du document Résultats. Vouspouvez utiliser le panneau de légende pour naviguer dans votre résultat et contrôlerl’affichage du résultat. La plupart des actions dans le panneau de légende ont un effetcorrespondant sur le panneau de contenu.

Le fait de sélectionner un élément dans le panneau de légende affiche l’élémentcorrespondant dans le panneau de contenu.

Déplacer un élément dans le panneau de légende déplace l’élément correspondantdans le panneau de contenu.

Réduire la ligne de légende masque le résultat de tous les éléments des niveauxréduits.

Page 297: SPSS Base Users Guide 14.0

271

Utilisation du résultat

Figure 10-2Panneau de légende réduit et résultats masqués

Contrôler l’Affichage du Résultat. Pour contrôler l’affichage du résultat, vous pouvez :

Maximiser et Réduire l’affichage de la ligne de légende.

Modifier le niveau de ligne de légende pour les éléments sélectionnés.

Modifier la taille des éléments dans l’affichage de la ligne de légende.

Modifier la police utilisée dans l’affichage de la ligne de légende.

Pour réduire et agrandir l’affichage de légende

E Cliquez sur la boîte à gauche de l’élément de ligne de légende à réduire ou à étendre.

ou

E Cliquez sur l’élément dans la ligne de légende.

E A partir des menus, sélectionnez :Affichage

Plier

Page 298: SPSS Base Users Guide 14.0

272

Chapitre 10

ouAffichage

Développer

Pour modifier le niveau de légende d’un élément

E Cliquez sur l’élément dans le panneau de légende.

E Cliquez sur la flèche gauche de la barre d’outil de la Ligne de légende pourpromouvoir l’élément (le déplacer vers la gauche).

E Cliquez sur la flèche droit de la barre d’outil de la Ligne de légende pour rétrograderl’élément (déplacer l’élément vers la droite).

ou

A partir des menus, sélectionnez :Edition

BordurePromouvoir

ouEdition

BordureRétrograder

Modifier le niveau de légende est particulièrement utile après avoir déplacé deséléments dans un niveau de légende. Déplacer des éléments peut modifier le niveau delégende des éléments et vous pouvez utiliser les boutons de flèche gauche et de flèchedroite dans la barre d’outils de la Ligne de légende pour restaurer le niveau d’origine.

Pour modifier la taille des éléments dans la légende

E A partir des menus, sélectionnez :Affichage

Taille de la ligne de légendePetit

D’autres options incluent Moyen et Grand.

Les icônes et les textes associés changent de taille.

Page 299: SPSS Base Users Guide 14.0

273

Utilisation du résultat

Pour modifier la police dans la légende

E A partir des menus, sélectionnez :Affichage

Police de la ligne de légende

E Sélectionnez une police.

Ajout d’éléments au Résultats

Dans le Résultats, vous pouvez ajouter des éléments tels que des titres, du nouveautexte, des diagrammes ou des données provenant d’autres applications.

Pour ajouter un nouveau titre ou texte

Des éléments textes qui ne sont pas liés à un tableau ou un diagramme peuvent êtreajoutés au Résultats.

E Cliquez sur le tableau, diagramme ou autre objet qui précédera le titre ou texte.

E A partir des menus, sélectionnez :Insérer

Nouveau titre

ouInsérer

Nouveau texte

E Double-cliquez sur le nouvel objet.

E Entrez le texte souhaité à cet emplacement.

Pour ajouter un fichier texte

E Dans le panneau de légende ou de contenu de l’Editeur de résultats, cliquez sur letableau, diagramme ou autre objet qui précédera le texte.

E A partir des menus, sélectionnez :Insérer

Fichier texte

E Sélectionnez un fichier texte.

Page 300: SPSS Base Users Guide 14.0

274

Chapitre 10

Pour modifier le texte, double-cliquez dessus.

Utilisation de résultats dans d’autres applications

Les tableaux pivotants et diagrammes peuvent être copiés et collés dans d’autresapplications Windows telles que les traitements de texte ou les tableurs. Vous pouvezcoller les tableaux pivotants ou les diagrammes dans l’un des divers formats suivants :

Objet imbriqué. Pour des applications supportant les objets ActiveX, vous pouvezimbriquer des tableaux pivotants et des diagrammes interactifs. Après avoir collé letableau, vous pouvez l’activer sur place en double-cliquant dessus puis le modifiercomme dans l’Editeur de résultats.

Image (métafichier). Vous pouvez coller des tableaux pivotants, des résultats texteet des diagrammes en tant qu’images (métafichiers). Le format image peut êtreredimensionné dans l’autre application, et quelquefois édité dans une mesure limitéeà l’aide des outils de l’autre application. Les tableaux pivotants collés comme imagesconservent toutes leurs caractéristiques de bordures et de polices.

RTF (texte enrichi). Les tableaux pivotants peuvent être collés dans d’autresapplications au format RTF. Dans la plupart des applications, cette procédure colle letableau pivotant en tant que tableau pouvant être modifié dans une autre application.

Bitmap. Les diagrammes peuvent être collés dans d’autres applications en tant quebitmaps.

BIFF. Le contenu d’un tableau peut être collé dans une feuille de calcul et conserversa précision numérique.

Texte. Le contenu d’un tableau peut être copié et collé comme texte. Cette option peutêtre utile pour les applications telles que le courrier électronique, où l’application nepeut accepter ou transmettre que du texte.

Pour copier un tableau ou un diagramme

E Sélectionnez le tableau ou diagramme à copier.

E A partir des menus, sélectionnez :Edition

Copier

Page 301: SPSS Base Users Guide 14.0

275

Utilisation du résultat

Pour copier - coller des résultats dans une autre application

E Copiez les résultats dans le Résultats.

E Dans les menus de l’application cible, choisissez :Edition

Coller

ouEdition

Collage spécial

Coller. Les sorties sont copiées vers le Presse-papiers dans un certain nombrede formats. Chaque application détermine le “ meilleur ” format à utiliser pourColler. Dans beaucoup d’applications, Coller collera les résultats en tant qu’image(métafichier). Pour les applications de traitement de texte, Coller collera les tableauxpivotants au format RTF, ce qui collera le tableau pivotant comme un tableau. Pourles tableurs, Coller colle les tableaux pivotants au format BIFF. Les diagrammes sontcollés en tant que métafichiers.

Collage spécial. Les résultats sont copiés dans le Presse-papiers dans de multiplesformats. Collage spécial vous permet de sélectionner le format voulu dans la liste desformats disponibles pour l’application cible.

Incorporation d’un tableau dans une autre application

Vous pouvez imbriquer des tableaux pivotants et des diagrammes interactifs dansd’autres applications au format ActiveX. Un objet imbriqué peut être activé surplace en double cliquant dessus puis en le modifiant et le faisant pivoter commedans l’Editeur de résultats.

Si vous avez des applications prenant en charge les objets Active-X :

E Double-cliquez sur le fichier objs-on.bat situé dans le répertoire d’installation deSPSS.

Ceci active l’incorporation ActiveX pour les tableaux pivotants. Le fichier objs-off.batdésactive l’incorporation des objets ActiveX.

Page 302: SPSS Base Users Guide 14.0

276

Chapitre 10

Pour incorporer un tableau pivotant ou un diagramme interactif dans une autreapplication :

E Dans le Résultats, copiez le tableau.

E Dans les menus de l’application cible, choisissez :Edition

Collage spécial

E Dans la liste, sélectionnez Objet tableau pivotant SPSSouSPSS Graphics Control Object.

L’application cible doit prendre en charge les objets ActiveX. Voir la documentationde l’application pour plus d’informations sur la prise en charge de ActiveX. Certainesapplications qui ne prennent pas en charge ActiveX pourront initialement accepter destableaux pivotants ActiveX mais faire preuve ensuite d’instabilité. Ne vous fiez pasaux objets imbriqués jusqu’à ce que vous ayez testé la stabilité de votre applicationavec les objets Active-X imbriqués.

Collage d’un tableau pivotant ou d’un diagramme en tant qu’image(métafichier)

E Dans le Résultats, copiez le tableau ou le diagramme.

E Dans les menus de l’application cible, choisissez :Edition

Collage spécial

E Dans la liste, sélectionnez Image.

L’élément est collé comme métafichier. Seule la strate et les colonnes visibles lorsquel’élément a été copié sont disponibles dans le métafichier. Les autres strates etcolonnes masquées ne sont pas disponibles.

Collage d’un tableau pivotant en tant que tableau (RTF)

E Dans le Résultats, copiez le tableau pivotant.

E Dans les menus de l’application cible, choisissez :Edition

Collage spécial

E Dans la liste, sélectionnez Texte formaté (RTF) ou Texte enrichi.

Page 303: SPSS Base Users Guide 14.0

277

Utilisation du résultat

Le tableau pivotant est collé en tant que tableau. Seule la strate et les colonnesvisibles lorsque l’élément a été copié sont collées dans le tableau. Les autres strateset colonnes masquées ne sont pas disponibles. Vous pouvez copier et coller un seultableau pivotant à la fois à ce format.

Collage d’un tableau pivotant en tant que texte

E Dans le Résultats, copiez le tableau.

E Dans les menus de l’application cible, choisissez :Edition

Collage spécial

E Dans la liste, choisissez Texte non formaté.

Le texte du tableau pivotant non formaté contient des tabulations entre les colonnes.Vous pouvez aligner des colonnes en ajustant les marques de tabulation dans l’autreapplication.

Pour copier et coller plusieurs éléments dans une autre application

E Sélectionnez les tableaux et/ou graphiques à copier. (Maj-clic ou Ctrl-clic poursélectionner plusieurs éléments)

E A partir des menus, sélectionnez :Edition

Copier les objets

E Dans l’application cible, à partir du menu, sélectionnez :Edition

Coller

Remarque : Utiliser Copier les objets pour copier plusieurs éléments du Résultats versune autre application seulement. Pour copier et coller dans SPSS (par exemple, entredeux fenêtres du Résultats), utilisez Copier dans le menu Edition.

Page 304: SPSS Base Users Guide 14.0

278

Chapitre 10

Collage d’objets dans le Résultats

Des objets provenant d’autres applications peuvent être collés dans le Résultats. Vouspouvez utiliser soit Coller après, soit Collage spécial. Les deux types de collageplacent le nouvel objet à la suite de l’objet actuellement sélectionné dans le Résultats.Utilisez Collage spécial lorsque vous voulez choisir le format de l’objet à coller.

Collage spécial

Collage spécial vous permet de sélectionner le format de l’objet copié à coller dansle Résultats. Les types possibles de fichier pour l’objet sont listés dans la boîte dedialogue Collage spécial. L’objet sera inséré dans le Résultats à la suite de l’objetactuellement sélectionné.

Figure 10-3Boîte de dialogue Collage spécial

Collage d’objets d’une autre application dans le RésultatsE Dans l’autre application, copiez l’objet.

E Dans le panneau de légende ou de contenu de l’Editeur de résultats, cliquez sur letableau, diagramme ou autre objet qui précédera l’objet.

Page 305: SPSS Base Users Guide 14.0

279

Utilisation du résultat

E A partir des menus, sélectionnez :Edition

Collage spécial

E Dans la liste, sélectionnez le format de l’objet.

Exporter résultats

L’option Exporter résultats enregistre les tableaux pivotants et les sorties texte auxformats HTML, texte, Word/RTF, Excel et PowerPoint (requiert PowerPoint 97 ouversion ultérieure) et enregistre les diagrammes sous divers formats communémentutilisés par d’autres applications. (Remarque : Exporter vers PowerPoint n’est pasdisponible dans la version Student.)

Document résultat. Exporte toute combinaison de tableaux pivotants, résultat texte etdiagrammes.

Pour les formats HTML et texte, les diagrammes sont exportés dans le formatd’exportation du diagramme sélectionné. Pour le format document HTML, lestableaux sont intégrés par référence, et vous devez exporter les tableaux sous unformat adapté pour permettre leur intégration dans des documents HTML. Pourle format document texte, une ligne est insérée dans le fichier texte pour chaquediagramme, indiquant le nom de fichier du diagramme exporté.

Pour le format Word/RTF, les diagrammes sont exportés au format métafichierWindows et incorporés dans le document Word.

Les diagrammes ne sont pas inclus dans les documents Excel.

Pour le format PowerPoint, les diagrammes sont exportés au format TIFF, puisincorporés dans le fichier PowerPoint.

Document Résultat (sans Graphiques). Exporte les tableaux pivotants et les résultatstexte. Les diagrammes du Résultats sont ignorés.

Graphiques uniquement. Les formats d’exportation disponibles sont les suivants :métafichier Windows (WMF), métafichier amélioré (EMF), bitmap Windows (BMP),PostScript encapsulé (EPS), JPEG, TIFF, PNG ou PICT Macintosh.

Exporter quoi. Vous pouvez exporter tous les objets du Résultats, tous les objetsvisibles ou seulement les objets sélectionnés.

Page 306: SPSS Base Users Guide 14.0

280

Chapitre 10

Format d’exportation. Pour les documents de résultat, les options disponibles sontHTML, texte, Word/RTF, Excel et PowerPoint ; pour les formats HTML et texte,les diagrammes sont exportés au format du diagramme sélectionné dans la boîte dedialogue Options. Pour Graphiques Seulement, sélectionnez un format d’exportationde graphiques dans la liste déroulante. Pour les documents de résultat, les tableauxpivotants et le texte sont exportés de la façon suivante :

Fichier HTML (*.htm). Les tableaux pivotants sont exportés comme des tableauxHTML. Les résultats texte sont publiés au format HTML pré-formaté.

Fichier texte (*.txt). Les tableaux pivotants peuvent être exportés en format tabuléou avec espaces. Tous les résultats texte sont exportés en format avec espaces.

Fichier Excel (*.xls). Les lignes, colonnes et cellules des tableaux pivotants sontexportées comme des lignes, colonnes et cellules Excel, avec tous les attributs deformatage (bordures de cellule, styles de police, couleurs d’arrière-plan, etc.).Le résultat texte est exporté avec tous les attributs de police. Chaque ligne durésultat texte est une ligne dans le fichier Excel, avec le contenu de toute la lignedans une seule cellule.

Fichier Word/RTF (*.doc). Les tableaux pivotants sont exportés en tant que tableauxWord, avec tous les attributs de formatage (bordures de cellule, styles de police,couleurs d’arrière-plan, etc.). La sortie texte est exportée au format RTF. Lerésultat texte dans SPSS apparaît toujours dans une police à espacement fixe(monoespacé) et est exporté avec les mêmes attributs de police. Une police àespacement fixe (monoespacé) est nécessaire pour le bon alignement des résultatstexte séparés par des espaces.

Fichier PowerPoint (*.ppt). Les tableaux pivotants sont exportés en tant quetableaux Word, puis incorporés au fichier PowerPoint dans des diapositivesdistinctes, à raison d’une diapositive par tableau pivotant. Tous les attributs deformatage (bordures de cellule, styles de police, couleurs d’arrière-plan, etc.)sont conservés. La sortie texte est exportée au format RTF. Le résultat textedans SPSS apparaît toujours dans une police à espacement fixe (monoespacé)et est exporté avec les mêmes attributs de police. Une police à espacement fixe(monoespacé) est nécessaire pour le bon alignement des résultats texte séparéspar des espaces. (Remarque : Exporter vers PowerPoint n’est pas disponibledans la version Student.)

Système de gestion des résultats. Vous pouvez également exporter automatiquementtous les résultats ou tous les types de résultats définis par l’utilisateur, tels que lesfichiers texte et les fichiers de données au format HTML, XML et SPSS. Pour plus

Page 307: SPSS Base Users Guide 14.0

281

Utilisation du résultat

d'informations, reportez-vous à « Système de gestion des résultats » dans Chapitre48 à p. 743.

Pour exporter le résultat

E Activez la fenêtre du Résultats (cliquez n’importe où dans la fenêtre).

E A partir des menus, sélectionnez :Fichier

Exporter...

E Entrez un nom de fichier (ou un préfixe pour les graphiques) et sélectionnez unformat d’exportation.

Figure 10-4Boîte de dialogue Exporter résultats

Page 308: SPSS Base Users Guide 14.0

282

Chapitre 10

Figure 10-5Résultats exportés au format Word/RTF

Options HTML, Word/RTF et Excel

Lorsque vous cliquez sur Options dans la boîte de dialogue Exporter résultats, uneboîte de dialogue s’affiche ; elle contrôle l’inclusion de notes de bas de page et delégendes pour les documents exportés aux formats HTML, Word/RTF et Excel, lesoptions d’exportation des diagrammes pour les documents HTML et la manipulationde tableaux pivotants multistrates.

Format Image. Contrôle le format d’exportation des diagrammes et les paramètresfacultatifs, comme la taille pour les documents HTML. Pour le format Word/RTF,tous les diagrammes sont exportés au format métafichier (WMF) Windows. PourExcel, les diagrammes sont exclus.

Page 309: SPSS Base Users Guide 14.0

283

Utilisation du résultat

Exporter les notes de bas de page et la légende Cochez cette case pour inclure desnotes de bas de page et des légendes au cours de l’exportation des tableaux pivotants.

Exporter toutes les strates. Cochez cette case pour exporter toutes les strates d’untableau pivotant multistrates. Si cette option est désélectionnée, seule la stratesupérieure est exportée.

Définition des options d’exportation HTML, Word/RTF et Excel

E Activez la fenêtre du Résultats (cliquez n’importe où dans la fenêtre).

E A partir des menus, sélectionnez :Fichier

Exporter...

E Sélectionnez Fichier HTML, Fichier Word/RTF ou Fichier Excel comme formatd’exportation.

E Cliquez sur Options.

Options PowerPoint

Avec les options PowerPoint, vous pouvez inclure des titres aux diapositives, desnotes de bas de page et des légendes dans les tableaux pivotants, gérer des tableauxpivotants à plusieurs strates et utiliser les options d’exportation de diagramme auformat PowerPoint. (Remarque : Exporter vers PowerPoint n’est pas disponibledans la version Student.)

Figure 10-6Boîte de dialogue Options PowerPoint

Page 310: SPSS Base Users Guide 14.0

284

Chapitre 10

Inclure le titre sur la diapositive. Cochez cette case pour inclure un titre sur chaquediapositive créée par l’exportation. Chaque diapositive contient un élémentunique exporté depuis l’Editeur de résultats. Le titre est formé à partir de l’entréecorrespondant à l’élément dans le panneau de légende du Résultats.

Exporter les notes de bas de page et la légende Cochez cette case pour inclure desnotes de bas de page et des légendes au cours de l’exportation des tableaux pivotants.

Exporter toutes les strates Cochez cette case pour exporter toutes les strates d’untableau pivotant à plusieurs strates ; chaque strate est placée sur une diapositivedistincte et toutes ont le même titre. Si cette option est désélectionnée, seule la stratesupérieure est exportée.

Options texte

Options texte contrôle les options de format des tableaux pivotants, des élémentstextes et des diagrammes ainsi que l’insertion de notes de bas de page et de légendespour les documents exportés en format texte.

Page 311: SPSS Base Users Guide 14.0

285

Utilisation du résultat

Figure 10-7Boîte de dialogue Options texte

Les tableaux pivotants peuvent être exportés en format tabulé ou avec espaces. Pour leformat tabulé, si une cellule n’est pas vide, son contenu et un caractère de tabulationsont imprimés. Si une cellule est vide, un caractère de tabulation seul est imprimé.

Tous les résultats texte sont exportés en format avec espaces. Tous les résultatsavec espaces nécessitent une police à point fixe (espacement unique) pour unalignement correct.

Formatage de cellule. Pour les tableaux pivotants avec espaces, par défaut, tous lessauts de lignes sont supprimés et chaque colonne est fixée à la largeur de la pluslongue étiquette ou valeur de la colonne. Pour limiter la largeur des colonnes et insérerdes sauts de ligne dans les longues étiquettes, spécifiez un nombre de caractères pourla largeur de la colonne. Ce réglage n’affecte que les tableaux pivotants.

Séparateurs de cellules. Pour les tableaux pivotants avec espaces, vous pouvezspécifier les caractères utilisés pour créer les bordures de cellules.

Format Image. Contrôle le format d’exportation des graphiques et les paramètresfacultatifs, comme la taille.

Page 312: SPSS Base Users Guide 14.0

286

Chapitre 10

Insérer un saut de page entre les tableaux. Insère un changement/saut de page entrechaque tableau. Pour les tableaux pivotants multistrates, cette option insère un saut depage entre chaque strate.

Options Taille graphique

L’option Taille du diagramme contrôle la taille des diagrammes exportés. Lesspécifications de pourcentage personnalisées vous permettent de diminuer oud’augmenter la taille du diagramme exporté jusqu’à 200 pour cent.

Figure 10-8Boîte de dialogue Taille d’export des graphiques

Pour définir la taille des graphiques exportés

E Activez la fenêtre du Résultats (cliquez n’importe où dans la fenêtre).

E A partir des menus, sélectionnez :Fichier

Exporter...

E Pour les documents de résultat, cliquez sur Options, sélectionnez le formatd’exportation, puis cliquez sur Taille graphique.

E Pour Graphiques uniquement, sélectionnez le format d’exportation, puis cliquezsur Taille graphique.

Options d’exportation de diagrammes au format JPEG

Profondeur des couleurs. Vous pouvez exporter les graphiques JPEG en modeCouleurs vraies 24 bits ou 256 niveaux de gris.

Page 313: SPSS Base Users Guide 14.0

287

Utilisation du résultat

Espace de couleurs. Cette option fait référence au codage des couleurs dans l’image.Le modèle de couleurs YUV est l’un des modes de codage des couleurs. Il estcouramment utilisé pour la transmission de données au format vidéo numérique ouMPEG. Les lettres de ce sigle identifient les signaux Y, U et V. Le composant Ydétermine le niveau de gris ou luminance. Les composants U et V définissent lachrominance (informations de couleur).

Les ratios correspondent au taux d’échantillonnage de chaque composant. Si vousréduisez les taux d’échantillonnage U et V, vous réduisez la taille du fichier (maiségalement sa qualité). L’option Espace de couleurs détermine le degré de « perte »des couleurs dans l’image exportée. Si le paramétrage YUV 4:4:4 n’entraîne aucuneperte, les configurations YUV 4:2:2 et YUV 4:1:1 constituent un compromis entre laréduction de la taille du fichier (espace disque) et la baisse de la qualité des couleursaffichées.

Encodage progressif. Permet le chargement progressif de l’image. L’image apparaîttout d’abord dans une faible résolution, puis sa qualité augmente au fur et à mesurede son chargement.

Paramètre de qualité de compression. Contrôle le taux de compression en fonction dela qualité de l’image. Plus la qualité de l’image est élevée, plus le fichier exporté estvolumineux.

Opérations de couleurs. Les opérations suivantes sont disponibles :

Inverser. Chaque pixel est enregistré dans la couleur inverse de sa couleurd’origine.

Correction Gamma. Ajuste l’intensité des couleurs dans le diagramme exportéen modifiant la constante gamma utilisée pour faire correspondre les valeursd’intensité. Cette option permet principalement d’éclaircir ou d’assombrirl’image bitmap. Sa valeur peut être comprise entre 0,10 (le plus foncé) et 6,5(le plus clair).

Options d’exportation de diagrammes aux formats BMP et PICT

Profondeur des couleurs. Détermine le nombre de couleurs du diagramme exporté.Quelle que soit la profondeur de couleur utilisée lors de l’enregistrement d’undiagramme, le nombre de couleurs du diagramme est compris entre le nombre decouleurs réellement utilisées et le nombre maximal de couleurs autorisé par la

Page 314: SPSS Base Users Guide 14.0

288

Chapitre 10

profondeur. Par exemple, si vous enregistrez un diagramme contenant trois couleurs(rouge, blanc et noir) en mode 16 couleurs, ce diagramme conserve ses 3 couleurs.

Lorsque le nombre de couleurs du diagramme est supérieur au nombre prévu pourcette profondeur, les couleurs sont converties de manière à reproduire celles dudiagramme.

L’option Profondeur d’écran actuelle correspond au nombre de couleurs affichéessur votre écran.

Opérations de couleurs. Les opérations suivantes sont disponibles :

Inverser. Chaque pixel est enregistré dans la couleur inverse de sa couleurd’origine.

Correction Gamma. Ajuste l’intensité des couleurs dans le diagramme exportéen modifiant la constante gamma utilisée pour faire correspondre les valeursd’intensité. Cette option permet principalement d’éclaircir ou d’assombrirl’image bitmap. Sa valeur peut être comprise entre 0,10 (le plus foncé) et 6,5(le plus clair).

Utiliser la compression RLE. (BMP uniquement). Il s’agit d’une technique decompression sans perte qui est prise en charge par les formats de fichiers Windowsstandard. L’expression « compression sans perte » signifie que la réduction de la tailledes fichiers n’est pas effectuée aux dépens de la qualité de l’image.

Options d’exportation de diagrammes aux formats PNG et TIFF

Profondeur des couleurs. Détermine le nombre de couleurs du diagramme exporté.Quelle que soit la profondeur de couleur utilisée lors de l’enregistrement d’undiagramme, le nombre de couleurs du diagramme est compris entre le nombre decouleurs réellement utilisées et le nombre maximal de couleurs autorisé par laprofondeur. Par exemple, si vous enregistrez un diagramme contenant trois couleurs(rouge, blanc et noir) en mode 16 couleurs, ce diagramme conserve ses 3 couleurs.

Lorsque le nombre de couleurs du diagramme est supérieur au nombre prévu pourcette profondeur, les couleurs sont converties de manière à reproduire celles dudiagramme.

L’option Profondeur d’écran actuelle correspond au nombre de couleurs affichéessur votre écran.

Page 315: SPSS Base Users Guide 14.0

289

Utilisation du résultat

Opérations de couleurs. Les opérations suivantes sont disponibles :

Inverser. Chaque pixel est enregistré dans la couleur inverse de sa couleurd’origine.

Correction Gamma. Ajuste l’intensité des couleurs dans le diagramme exportéen modifiant la constante gamma utilisée pour faire correspondre les valeursd’intensité. Cette option permet principalement d’éclaircir ou d’assombrirl’image bitmap. Sa valeur peut être comprise entre 0,10 (le plus foncé) et 6,5(le plus clair).

Transparence. Permet de sélectionner la couleur qui sera transparente dans lediagramme exporté. Cette option est disponible uniquement pour les exportationsen mode Couleurs vraies 32 bits. Entrez une valeur entière comprise entre 0 et 255pour chacune des couleurs. La valeur par défaut de chaque couleur est 255. De cefait, la couleur de transparence par défaut est le blanc.

Format. (TIFF uniquement) Permet de définir l’espace de couleurs et de compresserle diagramme exporté. Vous disposez de toutes les profondeurs de couleur en modeRVB. Seuls les modes Couleurs vraies 24 et 32 bits sont disponibles avec les couleursCMJN. Avec l’option YCbCr, seul le mode Couleurs vraies 24 bits est disponible.

Options d’exportation de diagrammes au format EPS

Cartes, arbres et diagrammes interactifs

Pour les arbres (option Arbres de segmentation), les cartes (option Cartes) et lesdiagrammes interactifs (menu Graphes, sous-menu Interactif), les options EPSsuivantes sont disponibles :

Aperçu de l’image. Permet d’enregistrer l’aperçu d’une image dans l’image EPS.Un aperçu sert principalement en cas d’insertion d’un fichier EPS dans un autredocument. Si de nombreuses applications ne peuvent pas afficher une image EPS,elles peuvent en revanche afficher l’aperçu enregistré avec l’image. L’aperçu del’image peut être au format WMF (plus petit et plus facilement redimensionnable)ou TIFF (plus souple et pris en charge par un plus grand nombre de plateformes).Vérifiez dans l’application de destination du graphique EPS les formats d’aperçupris en charge par l’application.

Polices. Contrôle le traitement des polices TrueType dans les images EPS.

Page 316: SPSS Base Users Guide 14.0

290

Chapitre 10

Incorporer en tant que TrueType natif. Incorpore la plupart des données de policedans l’image EPS. La police PostScript résultante est appelée police Type 42.Remarque : Toutes les imprimantes PostScript ne disposent pas d’un pilote deniveau 3 pouvant lire les polices Type 42).

Convertir en polices PostScript. Convertit les polices TrueType en policesPostScript (Type 1) en fonction de la famille de polices. Par exemple, la policeTimes New Roman est convertie en Times et Arial est convertie en Helvetica.Remarque : Ce format est déconseillé pour les graphiques interactifs qui utilisentla police SPSS Marker (comme les diagrammes de dispersion) car il n’existeaucun équivalent PostScript significatif aux marques SPSS TrueType.

Remplacer les polices avec courbes. Transforme les polices TrueType en donnéesde courbe PostScript. Vous ne pouvez plus modifier le texte en tant que teldans les applications de retouche des graphiques EPS. La qualité est égalementamoindrie. Cette option s’avère toutefois utile lorsque votre imprimantePostScript ne prend pas en charge les polices Type 42, mais qu’il vous fautconserver des symboles spéciaux TrueType, comme des marques dans desdiagrammes de dispersion interactifs.

Autres diagrammes

Pour tous les autres diagrammes, les options EPS suivantes sont disponibles :

Inclure un aperçu TIFF. Enregistre un aperçu avec l’image EPS au format TIFF pour unaffichage dans les applications qui ne peuvent pas afficher les images EPS à l’écran.

Polices. Contrôle le traitement des polices dans les images EPS.

Remplacer les polices avec courbes. Transforme les polices en données de courbePostScript. Vous ne pouvez plus modifier le texte en tant que tel dans lesapplications de retouche des graphiques EPS. Cette option est utile si les policesutilisées dans le diagramme ne sont pas disponibles sur le périphérique de sortie.

Utiliser des polices de référence. Si les polices utilisées dans le diagrammesont disponibles sur le périphérique de sortie, elles sont utilisées. Sinon, lepériphérique de sortie utilise des polices alternatives.

Page 317: SPSS Base Users Guide 14.0

291

Utilisation du résultat

Options d’exportation de diagrammes au format WMF

Aldus placeable. Fournit un degré d’indépendance par rapport au périphérique (taillephysique identique en cas d’ouverture à 96 ou 120 ppp) ; ce format n’est pas pris encharge par certaines applications.

Windows standard. Option prise en charge par la plupart des applications pouvantafficher des métafichiers Windows.

Pour définir les options d’exportation des graphiques

E Activez la fenêtre du Résultats (cliquez n’importe où dans la fenêtre).

E A partir des menus, sélectionnez :Fichier

Exporter...

E Pour les documents de résultat, cliquez sur Options, sélectionnez le formatd’exportation, puis cliquez sur Options de diagramme.

E Pour Graphiques uniquement, sélectionnez le format d’exportation, puis cliquez surOptions.

Impression de documents du Résultats

Il y a deux options pour l’impression du contenu de la fenêtre Editeur de résultats :

Tous les résultats affichés. Seuls s’impriment les éléments affichés dans le panneau decontenu. Les éléments masqués (éléments accompagnés d’une icône représentant unlivre fermé dans le panneau de ligne de légende ou masqués dans les strates réduitesdes lignes de légende) ne s’impriment pas.

Sélection. Seuls s’impriment les éléments sélectionnés dans les panneaux de ligne delégende et/ou de contenu.

Page 318: SPSS Base Users Guide 14.0

292

Chapitre 10

Figure 10-9Boîte de dialogue d’impression du Résultats

Pour imprimer des résultats et des diagrammes

E Activez la fenêtre du Résultats (cliquez n’importe où dans la fenêtre).

E A partir des menus, sélectionnez :Fichier

Imprimer

E Choisissez les paramètres d’impression voulus.

E Cliquez sur OK pour imprimer.

Aperçu avant impression

L’Aperçu avant impression vous montre ce qui va s’imprimer sur chaque page desdocuments du Résultats. Il est conseillé d’utiliser l’Aperçu avant impression avantd’imprimer réellement un document de l’Editeur de résultats car cela permet de

Page 319: SPSS Base Users Guide 14.0

293

Utilisation du résultat

détecter les éléments qui ne seront pas visibles, tout simplement en regardant lepanneau de contenu de l’Editeur de résultats, notamment :

Les sauts de page

Les strates masquées des tableaux pivotants

Les ruptures dans les tableaux de grande largeur

Les résultats complets des grands tableaux

Les en-têtes et pieds de page imprimés sur chaque page

Figure 10-10Aperçu avant impression

Si des résultats sont sélectionnés dans le Résultats, l’aperçu n’affiche que les résultatssélectionnés. Pour avoir un aperçu de tous les résultats, vérifiez que rien n’estsélectionné dans le Résultats.

Pour afficher un aperçu avant impression

E Activez la fenêtre du Résultats (cliquez n’importe où dans la fenêtre).

Page 320: SPSS Base Users Guide 14.0

294

Chapitre 10

E A partir des menus, sélectionnez :Fichier

Aperçu avant impression

Mise en page

La Mise en page vous permet de contrôler:

La taille et l’orientation du papier

Les marges

Les en-têtes et pieds de page

La numérotation des pages

La taille imprimée pour les graphiques

Page 321: SPSS Base Users Guide 14.0

295

Utilisation du résultat

Figure 10-11Boîte de dialogue Mise en page

Les paramètres de mise en page sont enregistrés dans le document du Résultats. LaMise en page affecte uniquement les paramètres des documents du Résultats. Cesparamètres n’ont aucun effet sur l’impression des données de l’éditeur de données oude la syntaxe d’une fenêtre de syntaxe.

Pour modifier la mise en page

E Activez la fenêtre du Résultats (cliquez n’importe où dans la fenêtre).

E A partir des menus, sélectionnez :Fichier

Mise en page

E Modifiez les paramètres et cliquez sur OK.

Page 322: SPSS Base Users Guide 14.0

296

Chapitre 10

Mise en page : En-têtes et pieds de page

Les en-têtes et pieds de page sont les informations qui s’impriment en haut et en basde chaque page. Vous pouvez saisir le texte à afficher dans les en-têtes et les pieds depage. Vous pouvez également utiliser la barre d’outils qui se trouve au milieu de laboîte de dialogue pour insérer :

La date et l’heure

Des numéros de page

Le nom du fichier du Résultats

Les étiquettes des en-têtes de lignes de légende

Les titres et les sous-titres ;

Figure 10-12Boîte de dialogue Options Mise en page, onglet En-tête/pied de page

Page 323: SPSS Base Users Guide 14.0

297

Utilisation du résultat

Les étiquettes d’en-tête des lignes de légende indiquent l’en-tête de ligne de légendede premier, deuxième, troisième et/ou quatrième niveau pour le premier élément dechaque page.

Les titres et sous-titres de page impriment les titres et sous-titres de la pagecourante. Les titres et sous-titres sont créés avec les options Nouveau titre de page dumenu Insérer de l’Editeur de résultats ou avec les commandes TITLE et SUBTITLEde la syntaxe de commande. Si vous n’avez indiqué aucun titre ou sous-titre de page,ce paramètre est ignoré.

Remarque : Les caractéristiques de police des nouveaux titres de page et dessous-titres sont vérifiées dans l’onglet Editeur de résultats de la boîte de dialogueOptions (accessible en choisissant Options dans le menu Edition). Les caractéristiquesde police des titres de page et des sous-titres existants peuvent être modifiées enchangeant les titres à l’aide du Résultats.

Pour voir comment vos en-têtes et pieds de page vont apparaître sur la page imprimée,choisissez Aperçu avant impression dans le menu Fichier.

Mise en page : Options

Cette boîte de dialogue contrôle la taille du diagramme imprimé, l’espace entre leséléments de résultat imprimés, ainsi que la numérotation des pages.

Taille imprimée diagramme. Contrôle la taille du diagramme imprimé par rapport à lataille définie pour la page. Le rapport hauteur/largeur du diagramme n’est pas affectépar la taille du diagramme imprimé. La taille globale d’un diagramme imprimé estlimitée par sa hauteur et par sa largeur. Lorsque les bordures extérieures d’un tableauatteignent les bordures de gauche et de droite de la page, la taille du diagramme nepeut plus augmenter pour occuper plus de hauteur.

Espace entre items. Contrôle l’espace entre des éléments imprimés. Chaque tableaupivotant, diagramme et objet de texte constitue un élément distinct. Ce paramètren’affecte pas l’affichage des éléments dans le Résultats.

Commencer page. Numéros de page consécutifs commençant à partir d’un numérospécifié.

Page 324: SPSS Base Users Guide 14.0

298

Chapitre 10

Figure 10-13Boîte de dialogue Options Mise en page, onglet Options

Enregistrement des résultats

Le contenu du Résultats peut être enregistré comme un document du Résultats. Ledocument enregistré contient les deux panneaux du Résultats (légende et contenu).

Pour enregistrer un document du Résultats

E A partir du menu du Résultats, sélectionnez :Fichier

Enregistrer

Page 325: SPSS Base Users Guide 14.0

299

Utilisation du résultat

E Entrez le nom du document et cliquez sur Enregistrer.

Pour enregistrer le résultat dans un format externe (par exemple HTML ou texte),utilisez Exporter dans le menu Fichier. (Non disponible dans la version autonomedu SmartViewer).

Option Publier

L’option Enregistrer avec mot de passe vous permet de protéger par mot de passevos fichiers Résultats.

Mot de passe. Le mot de passe est sensible à la casse et peut contenir jusqu’à16 caractères. Si vous assignez un mot de passe, le fichier ne peut pas être affichésans la saisie de ce mot de passe.

Code OEM. Laissez ce champ vide à moins que vous n’ayez un accord contractuelavec SPSS Inc. pour distribuer le Smart Résultats. Le code de licence OEM estfourni avec le contrat.

Pour enregistrer les fichiers du Résultats avec un mot de passe

E A partir du menu du Résultats, sélectionnez :Fichier

Enregistrer avec mot de passe...

E Saisissez le mot de passe.

E Entrez de nouveau le mot de passe pour le confirmer et cliquez sur OK.

E Entrez un nom de fichier dans la boîte de dialogue Enregistrer sous.

E Cliquez sur Enregistrer.

Remarque : Laissez le champ Code OEM vide à moins que vous n’ayez un accordcontractuel avec SPSS Inc. pour distribuer le Smart Résultats.

Page 326: SPSS Base Users Guide 14.0
Page 327: SPSS Base Users Guide 14.0

Chapitre

11Viewer en mode brouillon

Le Viewer en mode brouillon fournit des résultats sous forme de “ brouillons “, avec :

un résultat texte simple (au lieu de tableaux pivotants) ;

des diagrammes comme images métafichiers (au lieu d’objets diagramme).

Vous pouvez modifier les résultats texte du Viewer en mode brouillon, redimensionnerles diagrammes, et coller les résultats texte et les diagrammes dans d’autresapplications. Cependant, vous ne pouvez pas modifier les diagrammes, et lesfonctionnalités interactives des tableaux pivotants et des diagrammes ne sont pasdisponibles.

301

Page 328: SPSS Base Users Guide 14.0

302

Chapitre 11

Figure 11-1Fenêtre du Viewer en mode brouillon

Pour créer un résultat en mode brouillonE A partir des menus, sélectionnez :

FichierNouveau

Résultat mode brouillon

E Pour faire du résultat en mode brouillon le type de résultat par défaut à partir dumenu, sélectionnez :Affichage

Options

E Cliquez sur l’onglet Général.

E Sélectionnez Brouillon sous Type de navigateur au démarrage.

Page 329: SPSS Base Users Guide 14.0

303

Viewer en mode brouillon

Remarque : Le nouveau résultat est toujours affiché dans la fenêtre de Viewerdésigné. Si vous avez ouvert une fenêtre de l’Editeur de résultats ou de l’Editeur derésultats en mode brouillon, la fenêtre désignée est celle qui a été la dernière ouverteou celle désignée à l’aide du bouton Désigner la fenêtre (le point d’exclamation)dans la barre d’outils.

Contrôle du format du résultat en mode brouillon

La sortie qui serait affichée sous forme de tableaux pivotants dans le Viewer estconvertie en sortie texte pour le Viewer en mode brouillon. Les paramètres par défautpour une sortie de tableaux pivotants convertie sont définis comme suit :

Chaque colonne est ajustée en fonction de la largeur de l’étiquette de colonne etles étiquettes ne s’étalent pas sur plusieurs lignes.

L’alignement est contrôlé par des espaces (à la place des tabulations).

Les caractères de la zone de la police SPSS Marker Set sont utilisés comme desséparateurs de lignes et de colonnes.

Si les caractères de la boîte sont désactivés, les caractères verticaux (|) sont utiliséscomme des séparateurs de colonnes et les tirets (–) comme des séparateurs delignes.

Vous pouvez contrôler le format du nouveau résultat en mode brouillon en utilisantles options du Viewer en mode brouillon (menu Edition, Options, onglet Viewer enmode brouillon).

Page 330: SPSS Base Users Guide 14.0

304

Chapitre 11

Figure 11-2Options du Viewer en mode brouillon

Largeur de colonne. Pour réduire la largeur des tableaux contenant des étiquetteslongues, sélectionnez Maximum caractères sous Largeur de colonne. Les étiquettesplus longues que la largeur spécifiée sont adaptées pour s’ajuster à la largeurmaximale.

Page 331: SPSS Base Users Guide 14.0

305

Viewer en mode brouillon

Figure 11-3Résultat en mode brouillon avant et après le paramétrage de la largeur de colonnemaximale

Séparateurs de lignes et de colonnes. Comme autre choix de caractères de la boîtepour les bordures de lignes et de colonnes, vous pouvez utiliser les paramètres desséparateurs de cellules pour vérifier que les séparateurs de lignes et de colonness’affichent dans le nouveau résultat en mode brouillon. Vous pouvez spécifierdifférents séparateurs de cellules ou entrer des espaces vides si vous ne voulez utiliseraucun caractère pour repérer les lignes et colonnes. Vous devez désélectionner la caseAfficher les caractères pour indiquer les séparateurs de cellules.

Page 332: SPSS Base Users Guide 14.0

306

Chapitre 11

Figure 11-4Résultat en mode brouillon avant et après le paramétrage des séparateurs de cellules

Séparer colonnes avec Espaces / Tabulations. Le Viewer en mode brouillon est conçupour afficher une sortie dans laquelle les séparations sont des espaces dans une policeà espacement fixe (non proportionnelle). Si vous souhaitez coller un résultat en modebrouillon dans une autre application, vous devez utiliser une police à espacementfixe pour aligner correctement les colonnes avec un espace de séparation. Si voussélectionnez les tabulations comme séparateurs de colonnes, vous pouvez utiliser lapolice de votre choix dans l’autre application et définir les tabulations pour alignerle résultat correctement. Cependant, la sortie avec des tabulations de séparation nes’alignera pas correctement dans le Viewer en mode brouillon.

Page 333: SPSS Base Users Guide 14.0

307

Viewer en mode brouillon

Figure 11-5Résultat avec des tabulations de séparation dans le Viewer en mode brouillon puisformatée dans un traitement de texte

Définition des options du Viewer en mode brouillon

E A partir des menus, sélectionnez :Affichage

Options

E Cliquez sur l’onglet Viewer en mode brouillon.

E Sélectionnez les paramètres souhaités.

E Cliquez sur OK ou sur Appliquer.

Page 334: SPSS Base Users Guide 14.0

308

Chapitre 11

Les options d’affichage des résultats dans le Viewer affectent seulement le nouveaurésultat produit après modification des paramètres Un résultat déjà affiché dans leViewer n’est pas affecté par les changements de ces paramètres.

Attributs de polices

Vous pouvez modifier les attributs de polices (police, taille, style) du résultat textedans l’Editeur de résultats en mode brouillon. Cependant, si vous utilisez lescaractères de la boîte pour les bordures de lignes et de colonnes, l’alignementapproprié de la colonne pour du texte séparé par des espaces nécessite l’utilisationd’une police à espacement fixe (monoespacée), telle que Courier. De plus, d’autresmodifications de police, comme la taille et le style (par exemple gras et italique),appliquées à une partie seulement d’un tableau peuvent affecter l’alignement decolonne.

Bordures de lignes et de colonnes. Les bordures de lignes et de colonnes pleines pardéfaut utilisent la police SPSS Marker Set. Les caractères de traçage de lignes utiliséspour tracer les bordures ne sont pas pris en charge par d’autres polices.

Pour modifier les polices dans le Viewer en mode brouillon

E Sélectionnez le texte auquel vous voulez appliquer la modification de police.

E A partir des menus du Viewer en mode brouillon, sélectionnez :Format

Polices

E Sélectionnez les attributs de police à appliquer au texte sélectionné.

Pour imprimer un résultat en mode brouillonE A partir des menus du Viewer en mode brouillon, sélectionnez :

FichierImprimer

Pour imprimer uniquement la partie sélectionnée du résultat en mode brouillon

E Sélectionnez le résultat à imprimer.

Page 335: SPSS Base Users Guide 14.0

309

Viewer en mode brouillon

E A partir des menus, sélectionnez :Fichier

Imprimer

E Choisissez Sélection.

Aperçu avant impression

L’Aperçu avant impression vous montre ce qui va s’imprimer sur chaque page pourles documents brouillons. Nous vous conseillons d’utiliser l’Aperçu avant impressionavant d’imprimer réellement un document du Viewer car cela vous permet devisualiser les éléments qui peuvent ne pas avoir été ajustés pour tenir sur une page,comme :

les tableaux longs

les tableaux larges produits par la conversion d’une sortie d’un tableau pivotantsans contrôle de largeur de colonne

les résultats texte créées avec l’option de largeur de page Large (options duViewer en mode brouillon) sur une imprimante définie en mode Portrait.

Une sortie trop large pour la page est alors tronquée et ne s’imprimera pas sur uneautre page. Il existe plusieurs méthodes permettant d’éviter qu’un résultat tropvolumineux soit tronqué :

Utilisez une taille de police plus petite (menu Format, Polices).

Sélectionnez Paysage pour l’orientation de page (menu Fichier, Mise en page).

Pour une nouvelle sortie, spécifiez une largeur de colonne maximum étroite(menu Edition, Options, onglet Viewer en mode brouillon).

Pour les tableaux longs, utilisez les sauts de page (menu Insertion, Saut de Page) pourcontrôler les endroits où le tableau passe sur une autre page.

Pour visualiser un aperçu avant impression du Viewer en mode brouillon

E A partir des menus du Viewer en mode brouillon, sélectionnez :Fichier

Aperçu avant impression

Page 336: SPSS Base Users Guide 14.0

310

Chapitre 11

Pour enregistrer une sortie du Viewer en mode brouillonE A partir des menus du Viewer en mode brouillon, sélectionnez :

FichierEnregistrer

La sortie du Viewer en mode brouillon est enregistrée au format RTF (texte enrichi).

Pour enregistrer le résultat en mode brouillon en tant que texte

E A partir des menus du Viewer en mode brouillon, sélectionnez :Fichier

Exporter...

Vous pouvez exporter tout le texte ou juste le texte sélectionné Seul le résultat texte(sortie de tableau pivotant convertie et sortie texte) est enregistrée dans les fichiersexportés. Les diagrammes ne sont pas inclus.

Page 337: SPSS Base Users Guide 14.0

Chapitre

12Tableaux pivotants

Beaucoup de résultats sont présentés dans le Viewer sous forme de tableaux pouvantêtre pivotés de manière interactive. Cela signifie que vous pouvez réarranger leslignes, colonnes et strates.

Manipulation d’un tableau pivotant

Les options de manipulation des tableaux pivotants comprennent les élémentssuivants :

Transposer des lignes et des colonnes.

Déplacer des lignes et des colonnes.

Créer des strates multidimensionnelles.

Grouper et séparer des lignes et des colonnes.

Montrer et masquer des cellules.

Faire pivoter des étiquettes de lignes et de colonnes.

Trouver des définitions de termes.

Pour modifier un tableau pivotant

E Double-cliquez sur le tableau.

Cela active l’éditeur de tableaux pivotants.

Edition de deux tableaux pivotants ou plus en une fois

E Cliquez avec le bouton droit de la souris sur le tableau pivotant.

311

Page 338: SPSS Base Users Guide 14.0

312

Chapitre 12

E A partir du menu contextuel, sélectionnez :Objet tableau pivotant SPSS

Ouvrir

E Répétez l’opération pour chaque tableau pivotant que vous voulez modifier.

Chaque tableau pivotant est prêt à être édité dans sa propre fenêtre.

Pour faire pivoter un tableau à l’aide d’icônes

E Activez le tableau pivotant.

E A partir des menus du tableau pivotant, choisissez :Tableau pivotant

Structure pivotante

E Placez le pointeur sur chaque icône pour apercevoir une note d’aide qui vousindiquera la dimension de tableau représentée par l’icône.

E Faites glisser une icône d’une dimension à l’autre.

Figure 12-1Structure pivotante

Cette action modifie la disposition du tableau. Par exemple, supposons que l’icônereprésente une variable avec les modalités Oui et Non. Si vous faites glisser l’icônedepuis la dimension de ligne vers la dimension de colonne, Oui et Non deviennentles étiquettes des colonnes. Avant le déplacement, Oui et Non étaient les étiquettesdes lignes.

Page 339: SPSS Base Users Guide 14.0

313

Tableaux pivotants

Pour identifier des dimensions dans un tableau pivotant

E Activez le tableau pivotant.

E Si la structure pivotante n’est pas déjà activée, à partir des menus du tableau pivotant,choisissez :Tableau pivotant

Structure pivotante

E Cliquez sur une icône et maintenez le bouton enfoncé.

Cette action met en surbrillance les étiquettes de dimension dans le tableau pivotant.

Transposition des lignes et des colonnes

E A partir des menus du tableau pivotant, choisissez :Tableau pivotant

Transposer lignes et colonnes

Cette action a le même effet que le glissement de toutes les icônes de lignes dans ladimension de colonne et les icônes de colonnes dans la dimension de ligne.

Pour modifier l’ordre d’affichage

L’ordre des icônes de rotation dans un plateau de dimension reflète l’ordre d’affichagedes éléments dans le tableau pivotant. Pour modifier l’ordre d’affichage des élémentsdans une dimension :

E Activez le tableau pivotant.

E Si la structure pivotante n’est pas déjà activée, à partir des menus du tableau pivotant,choisissez :Tableau pivotant

Structure pivotante

E Faites glisser les icônes de chaque plateau pour les placer dans l’ordre désiré (degauche à droite ou de haut en bas).

Pour déplacer des lignes et des colonnes dans un tableau pivotant

E Activez le tableau pivotant.

Page 340: SPSS Base Users Guide 14.0

314

Chapitre 12

E Cliquez sur l’étiquette de la ligne ou colonne que vous voulez déplacer.

E Faites glisser l’étiquette vers sa nouvelle position.

E Dans le menu contextuel, choisissez Insérer Avant ou Permuter.

Remarque : Assurez-vous que l’option Faire glisser pour Copier du menu Edition n’estpas activée (cochée). Si l’option Faire glisser pour Copier est activée, désactivez-la.

Pour grouper des lignes ou des colonnes et insérer des étiquettes de groupe

E Activez le tableau pivotant.

E Sélectionnez les étiquettes des lignes ou des colonnes que vous voulez regrouper(cliquez et faites glisser ou cliquez dessus tout en maintenant la touche Maj enfoncéepour sélectionner plusieurs étiquettes).

E A partir des menus, sélectionnez :Edition

Groupe

Une étiquette de groupe est insérée automatiquement. Double-cliquez sur l’étiquettede groupe pour modifier le texte de l’étiquette.

Figure 12-2Groupes et étiquettes de lignes et de colonnes

Etiquette de groupe de colonnes

Etiquette deGroupe de Lignes

Clerical

ManagerCustodial

Female Male Total206

10

157 3632774

2784

Remarque : Pour ajouter des lignes ou des colonnes à un groupe existant, vous devezd’abord dissocier les éléments du groupe, puis créer un nouveau groupe incluantles éléments supplémentaires.

Pour dissocier des lignes ou des colonnes et supprimer des étiquettes degroupe

E Activez le tableau pivotant.

Page 341: SPSS Base Users Guide 14.0

315

Tableaux pivotants

E Cliquez n’importe où dans l’étiquette de groupe pour les lignes et les colonnes quevous souhaitez dégrouper.

E A partir des menus, sélectionnez :Edition

Dissocier

Dissocier supprime automatiquement l’étiquette de groupe.

Pour faire pivoter des étiquettes de tableaux pivotants

E Activez le tableau pivotant.

E A partir des menus, sélectionnez :Format

Pivoter Etiquettes de colonnes internes

ouPivoter Etiquettes de lignes externes

Figure 12-3Etiquettes de colonnes pivotées

Seules les étiquettes des colonnes les plus internes et les étiquettes des lignes les plusexternes peuvent être pivotées.

Page 342: SPSS Base Users Guide 14.0

316

Chapitre 12

Rétablissement des pivots aux valeurs par défaut

Après avoir exécuté une ou plusieurs opérations de pivot, vous pouvez rétablir ladisposition d’origine du tableau pivotant.

E A partir du menu Tableau pivotant, choisissez Remettre pivots à leur valeur par défaut.

Cette action ne rétablit que les changements résultant d’une rotation des élémentsde lignes, de colonnes ou de strates entre les dimensions. Elle n’affecte pas leschangements tels que le regroupement, la dissociation ou le déplacement des lignes etdes colonnes.

Pour rechercher la définition d’une étiquette dans un tableau pivotant

Vous pouvez obtenir de l’Aide contextuelle sur les étiquettes de cellules dans lestableaux pivotants. Par exemple, si Moyenne apparaît comme une étiquette, vouspouvez obtenir une définition de la moyenne.

E Cliquez avec le bouton droit sur une cellule d’étiquette.

E A partir du menu contextuel, sélectionnez A propos de...

Vous devez cliquer avec le bouton droit de la souris sur la cellule d’étiquetteelle-même plutôt que sur les cellules de données de la ligne ou de la colonne. L’aidecontextuelle n’est pas disponible pour les étiquettes définies par l’utilisateur tellesque les noms de variable ou les étiquettes de valeurs.

Utilisation des stratesVous pouvez afficher un tableau bidimensionnel séparé pour chaque modalité oucombinaison de modalités. Le tableau peut être imaginé comme un empilement destrates, dont seule la strate supérieure est visible.

Pour créer et afficher des strates

E Activez le tableau pivotant.

E >> A partir du menu Tableau pivotant, choisissez Structures pivotantes (si cela n’estpas déjà fait).

Page 343: SPSS Base Users Guide 14.0

317

Tableaux pivotants

E Faites glisser une icône du plateau Ligne ou du plateau Colonne vers le plateau Strate.

Figure 12-4Déplacer des modalités dans des strates

Chaque icône de strate possède des flèches à gauche et à droite. Le tableau visibleest celui de la strate supérieure.

Figure 12-5Modalités en strates séparées

Minority classification: YesMinority classification: No

Page 344: SPSS Base Users Guide 14.0

318

Chapitre 12

Pour modifier des strates

E Cliquez sur l’une des flèches de l’icône de strate.

ou

E Choisissez une modalité à partir de la liste déroulante de strates.

Figure 12-6Sélectionnez des strates à partir des listes déroulantes.

Atteindre la modalité de la strate

Aller à Modalité de Strate vous permet de modifier les strates d’un tableau pivotant.Cette boîte de dialogue est particulièrement utile lorsqu’il existe un grand nombre destrates ou lorsqu’une strate possède de nombreuses modalités.

Pour aller à une strate d’un tableau

E A partir des menus du tableau pivotant, choisissez :Tableau pivotant

Aller à la strate...

Page 345: SPSS Base Users Guide 14.0

319

Tableaux pivotants

Figure 12-7Boîte de dialogue Atteindre la modalité de la strate

E Dans la liste Modalité visible, sélectionnez une dimension de strate. La liste Modalitésde Strates affiche toutes les modalités de la dimension sélectionnée.

E Dans la liste Modalités, sélectionnez la modalité que vous désirez puis cliquez sur OK.Cette action change la strate et ferme la boîte de dialogue.

Pour afficher une autre strate sans fermer la boîte de dialogue :

E Sélectionnez la modalité et cliquez sur Appliquer.

Pour déplacer des strates vers des lignes ou des colonnes

Si le tableau que vous affichez est empilé en strates et que seule la strate supérieureest visible, vous pouvez afficher toutes les strates en même temps, soit de haut enbas (lignes), soit de gauche à droite (colonnes). Il doit y avoir au moins une icônedans le plateau Strate.

Page 346: SPSS Base Users Guide 14.0

320

Chapitre 12

E Dans le menu Tableau pivotant, choisissez Déplacer Strates vers Lignes.

ou

E Dans le menu Tableau pivotant, choisissez Déplacer Strates vers Colonnes.

Vous pouvez également déplacer les strates vers les lignes ou les colonnes en faisantglisser leurs icônes dans la structure pivotante Strate, Ligne et Colonne.

Signets

Les signets vous permettent d’enregistrer différents affichages d’un tableau pivotant.Les signets incluent :

le positionnement des éléments dans les dimensions de ligne, colonne et strate

l’ordre d’affichage des éléments dans chaque dimension ;

la strate affichée pour chaque élément de strate.

Pour définir un signet pour un affichage de tableau pivotant

E Activez le tableau pivotant.

E Faites pivoter le tableau vers l’affichage pour lequel vous voulez définir un signet.

E A partir des menus, sélectionnez :Tableau pivotant

Signets…

E Entrez un nom pour le signet. (Les noms de signets ne distinguent les majuscules desminuscules.)

E Cliquez sur Ajouter.

Chaque tableau pivotant a son propre jeu de signets. A l’intérieur d’un tableaupivotant, chaque nom de signet doit être unique, mais vous pouvez utiliser des nomsde signets en double dans des tableaux pivotants différents.

Page 347: SPSS Base Users Guide 14.0

321

Tableaux pivotants

Pour obtenir un affichage de tableau pivotant pour lequel un signet a étédéfini auparavant

E Activez le tableau pivotant.

E A partir des menus, sélectionnez :Tableau pivotant

Signets…

E Cliquez sur le nom du signet dans la liste.

E Cliquez sur Atteindre.

Pour renommer un signet de tableau pivotant

E Activez le tableau pivotant.

E A partir des menus, sélectionnez :Tableau pivotant

Signets…

E Cliquez sur le nom du signet dans la liste.

E Cliquez sur Renommer.

E Entrez le nouveau nom de signet.

E Cliquez sur OK.

Montrer ou masquer des cellules

Il est possible de masquer de nombreux types de cellules, y compris :

Etiquettes de dimension.

Modalités, y compris la cellule d’étiquette et les cellules de données d’une ligneou d’une colonne.

Etiquettes de modalité (sans masquer les cellules de données).

Notes de bas de page, titres et légendes.

Page 348: SPSS Base Users Guide 14.0

322

Chapitre 12

Pour masquer des lignes et des colonnes dans un tableau

E Ctrl-Alt-Clic sur l’étiquette de modalité de la ligne ou de la colonne à masquer.

E A partir des menus du tableau pivotant, choisissez :Affichage

Masquer

ou

E Cliquez avec le bouton droit de la souris sur la ligne ou la colonne.

E Dans le menu contextuel, choisissez Masquer modalité.

Pour afficher des colonnes et des lignes masquées dans un tableau

E Sélectionnez une autre étiquette dans la même dimension que la ligne ou la colonnemasquée.

Par exemple, si la modalité Femme de la dimension Sexe est masquée, cliquez sur lamodalité Homme.

E A partir des menus du tableau pivotant, choisissez :Affichage

Montrer toutes les modalités dans le nom de la dimension

Par exemple, choisissez Montrer Toutes les Modalités dans Sexe.

ou

E A partir des menus du tableau pivotant, choisissez :Affichage

Montrer Tout

Cette action affiche toutes les cellules masquées du tableau. (Si l’option Masquer les

Lignes et Colonnes vides est sélectionnée dans les propriétés de ce tableau, une ligneou une colonne totalement vide reste masquée)

Pour masquer ou afficher une étiquette de dimension

E Activez le tableau pivotant.

Page 349: SPSS Base Users Guide 14.0

323

Tableaux pivotants

E Sélectionnez l’étiquette de dimension ou toute étiquette de modalité dans ladimension.

E A partir des menus, sélectionnez :Affichage

Masquer (ou montrer) Etiquette de dimension.

Pour masquer ou afficher une note de bas de page dans un tableau

E Sélectionnez une note de bas de page.

E A partir des menus, sélectionnez :Affichage

Masquer (ou montrer)

Pour afficher ou masquer une légende ou un titre dans un tableau

E Sélectionnez une légende ou un titre.

E A partir des menus, sélectionnez :Affichage

Masquer (ou montrer)

Modification des résultats

L’aspect et le contenu de chaque élément texte ou tableau du résultat peuvent êtreédités. Vous pouvez:

Appliquer un modèle de tableau.

Modifier les propriétés du tableau actuel.

Modifier les propriétés des cellules dans le tableau.

Modifier du texte.

Ajouter des notes de bas de page et des légendes aux tableaux.

Ajouter des éléments au Viewer.

Copier et Coller le résultat dans d’autres applications.

Modifier la largeur des cellules de données.

Page 350: SPSS Base Users Guide 14.0

324

Chapitre 12

Modification de l’aspect des tableaux

Vous pouvez modifier l’aspect d’un tableau soit en éditant les propriétés du tableau,soit en appliquant un modèle de tableau. Chaque modèle de tableau comprend unregroupement de propriétés de tableau, y compris sur l’aspect général, les propriétésdes notes de bas de page, les propriétés des cellules et les bordures. Vous pouvezsélectionner l’un des Aspects de tableau prédéfinis ou créer et enregistrer un modèlede tableau personnalisé.

Modèles de tableaux

Un modèle de tableau est un ensemble de propriétés définissant l’aspect d’un tableau.Vous pouvez sélectionner un modèle de tableau prédéfini ou créer votre propremodèle de tableau.

Avant ou après avoir appliqué un modèle de tableau, vous pouvez modifier lesformats de cellules pour des cellules individuelles ou des groupes de cellules à l’aidedes propriétés de cellule. Les formats de cellule édités demeurent intactes, mêmelorsque vous appliquez un nouveau modèle de tableau.

Par exemple, vous pouvez commencer par appliquer le modèle de tableau 9POINT,puis sélectionner une colonne de données et utiliser la boîte de dialogue Formats descellules pour appliquer une police en caractères gras à cette colonne. Vous modifiezensuite le modèle de tableau et appliquez l’option BOXED. La colonne précédemmentsélectionnée reste en caractères gras tandis que le reste des caractéristiques du modèleBOXED est appliqué.

En option, vous pouvez restaurer pour toutes les cellules les formats définis par lemodèle de tableau actuel. Cette action restaure toutes les cellules qui ont été éditées.Si l’option Comme Affiché est sélectionnée dans la liste de fichiers de modèle detableau, toutes les cellules modifiées reprennent les propriétés actuelles du tableau.

Pour appliquer ou enregistrer un modèle de tableau

E Activez un tableau pivotant.

E A partir des menus, sélectionnez :Format

Modèles de tableaux

Page 351: SPSS Base Users Guide 14.0

325

Tableaux pivotants

Figure 12-8Boîte de dialogue Aspects de tableau

E Sélectionnez un modèle de tableau dans la liste de fichiers. Pour sélectionner unfichier dans un autre répertoire, cliquez sur Parcourir.

E Cliquez sur OK pour appliquer le modèle de tableau au tableau pivotant sélectionné.

Pour modifier ou créer un Modèle de tableau

E Dans la boîte de dialogue Modèles de tableaux, sélectionnez un modèle de tableauparmi la liste de fichiers.

E Cliquez sur Modifier modèle.

E Modifiez les propriétés de tableau pour obtenir les attributs souhaités et cliquez surOK.

E Cliquez sur Enregistrer modèle pour enregistrer le modèle de tableau modifié ou surEnregistrer sous pour l’enregistrer comme nouveau modèle.

Modifier un modèle de tableau n’affecte que le tableau pivotant sélectionné. Unmodèle de tableau modifié n’est pas appliqué à d’autres tableaux utilisant cet Aspect,sauf si vous sélectionnez ces tableaux et appliquez à nouveau le modèle de tableau.

Page 352: SPSS Base Users Guide 14.0

326

Chapitre 12

Propriétés du tableau

La boîte de dialogue Propriétés de tableau vous permet de fixer les propriétésgénérales d’un tableau et les styles de cellules pour diverses parties d’un tableau ainsique d’enregistrer un ensemble de propriété en tant que modèle de tableau. A l’aidedes onglets de cette boîte de dialogue, vous pouvez :

Contrôler les propriétés générales, telles que masquer les lignes ou les colonnesvides et ajuster les propriétés d’impression.

Contrôler le format et la position des marques de notes de bas de page.

Déterminer des formats spécifiques pour les cellules de données, pour lesétiquettes de ligne et de colonne et pour les autres zones du tableau.

Contrôler la largeur et la couleur des lignes formant les bordures de chaquezone du tableau.

Pour modifier les propriétés d’un tableau pivotantE Double-cliquez n’importe où sur le tabelau pivotant pour l’activer.

E A partir des menus du tableau pivotant, choisissez :Format

Propriétés du tableau

E Sélectionnez un onglet (Général, Notes de bas de page, Formats de cellule, Bordures

ou Impression).

E Sélectionnez les options souhaitées.

E Cliquez sur OK ou sur Appliquer.

Les nouvelles propriétés sont appliquées au tableau pivotant sélectionné. Pourappliquer de nouvelles propriétés de tableau à un modèle de tableau au lieu du tableausélectionné seulement, modifiez le modèle de tableau (menu Format, Modèle detableau).

Page 353: SPSS Base Users Guide 14.0

327

Tableaux pivotants

Propriétés de tableau : Général

Plusieurs propriétés s’appliquent au tableau dans son ensemble. Vous pouvez:

Afficher ou masquer des lignes et des colonnes. (Une ligne ou colonne vide nepossède rien dans aucune des cellules de données)

Contrôler le placement des étiquettes de lignes qui peuvent être dans le coingauche supérieur ou emboitées.

Contrôler la largeur maximum et minimum de colonne (exprimée en points).

Figure 12-9Boîte de dialogue Propriétés du tableau, onglet Général

Modification des propriétés générales d’un tableau

E Cliquez sur l’onglet Général.

E Sélectionnez les options souhaitées.

E Cliquez sur OK ou sur Appliquer.

Page 354: SPSS Base Users Guide 14.0

328

Chapitre 12

Propriétés de tableau : Notes de bas de page

Les propriétés des marques de notes de bas de page comprennent le style et la positionpar rapport au texte.

Le style des marques de notes de bas de page est soit numérique (1, 2, 3...), soitalphabétique (a, b, c...).

Les marques des notes de bas de page peuvent être attachées au texte en indicesou en exposants.

Figure 12-10Boîte de dialogue Propriétés du tableau, onglet Notes de bas de page

Modification des propriétés des marques des notes de bas de page

E Cliquez sur l’onglet Notes de bas de page.

E Sélectionnez un format pour la numérotation des notes de bas de page.

E Sélectionnez une position pour les marques.

Page 355: SPSS Base Users Guide 14.0

329

Tableaux pivotants

E Cliquez sur OK ou sur Appliquer.

Propriétés de tableau : Formats de cellule

Pour le formatage, un tableau est divisé en zones : Titre, Strates, Etiquettes de coins,Etiquettes de lignes, Etiquettes de colonnes, Données, Légende et Notes de bas depage. Pour chaque zone d’un tableau, vous pouvez modifier les formats des cellulesassociées. Les formats de cellule comprennent les éléments suivants : caractéristiquesde texte (police, taille, couleur, style), alignement horizontal et vertical, ombrage descellules, couleurs de premier plan et d’arrière-plan, et marges intérieures des cellules.

Figure 12-11Zones d’un tableau

Les formats des cellules sont appliqués aux zones (modalités d’informations).Ce ne sont pas des caractéristiques des cellules individuelles. Cette distinction estimportante lorsqu’on fait pivoter un tableau.

Par exemple :

Si vous spécifiez une police en caractères gras pour un format de cellules dans lesétiquettes de colonnes, celles-ci apparaîtront en caractères gras quelles que soientles informations affichées dans la dimension de la colonne—et si vous déplacez

Page 356: SPSS Base Users Guide 14.0

330

Chapitre 12

un élément de la dimension de colonne vers une autre dimension, il ne conservepas les caractères gras des étiquettes de colonnes.

Si vous appliquez les caractères gras sur les étiquettes de colonne simplement enmettant en surbrillance les cellules dans un tableau pivotant actif et en cliquantsur le bouton Gras de la barre d’outils, le contenu de ces cellules demeurera encaractères gras quelle que soit la dimension dans laquelle vous les déplacez, et lesétiquettes de colonne ne resteront pas en caractères gras pour d’autres élémentsdéplacés dans la dimension de colonne.

Figure 12-12Boîte de dialogue Propriétés du tableau, onglet Formats des cellules

Modification des formats des cellules

E Sélectionnez l’onglet Formats de cellule.

E Sélectionnez une zone dans la liste déroulante ou cliquez sur une zone de l’échantillon.

E Sélectionnez des caractéristiques pour la zone. Vos sélections se reflètent dansl’échantillon.

Page 357: SPSS Base Users Guide 14.0

331

Tableaux pivotants

E Cliquez sur OK ou sur Appliquer.

Propriétés de tableau : BorduresPour chaque emplacement de bordure dans un tableau, vous pouvez sélectionner unstyle et une couleur de ligne. Si vous sélectionnez Aucun comme style, il n’y auraaucune ligne à l’emplacement sélectionné.

Figure 12-13Boîte de dialogue Propriétés du tableau, onglet Bordures

Pour modifier les bordures d’un tableau

E Cliquez sur l’onglet Bordures.

E Sélectionnez un emplacement de bordure, soit en cliquant sur son nom dans la liste,soit en cliquant sur une ligne dans la zone d’échantillon. (Maj-clic pour sélectionnerplusieurs noms, Ctrl-Clic pour sélectionner plusieurs noms non contigus)

E Sélectionnez un style de ligne ou Aucun.

Page 358: SPSS Base Users Guide 14.0

332

Chapitre 12

E Sélectionnez une couleur.

E Cliquez sur OK ou sur Appliquer.

Pour afficher des bordures masquées dans un tableau pivotant

Pour les tableaux possédant peu de bordures visibles, vous pouvez afficher lesbordures masquées. Cela peut faciliter des tâches telles que la modification de lalargeur des colonnes. Les bordures masquées (quadrillage) sont affichées dans leViewer mais ne sont pas imprimées.

E Double-cliquez n’importe où sur le tabelau pivotant pour l’activer.

E A partir des menus, sélectionnez :Affichage

Quadrillage

Propriétés de tableau : Impression

Pour les tableaux pivotants imprimés, vous pouvez contrôler les propriétés suivantes :

Imprimer toutes les strates ou seulement la strate supérieure du tableau, etimprimer chaque strate sur une page séparée. (Ceci n’affecte que l’impression,pas l’affichage des strates dans l’Editeur de résultats.)

Rétrécir un tableau horizontalement ou verticalement pour qu’il tienne dans lapage lors de l’impression.

Contrôler les lignes veuves et orphelines en contrôlant le nombre minimal delignes et de colonnes qui seront contenues dans une section imprimée d’untableau si le tableau est trop large et/ou trop long pour la taille définie de la page.(Remarque : Si un tableau est trop long pour tenir sur le restant de la page actuellecar il y a un d’autres résultats au-dessus dans la page, mais qu’il tient dans lalongueur de page définie, il est automatiquement imprimé sur une nouvelle page,quel que soit le paramétrage des lignes veuves/orphelines)

Inclure du texte de suite pour des tableaux qui ne peuvent s’ajuster à une seulepage. Vous pouvez afficher du texte de suite au bas de chaque page et en hautde chaque page. Si aucune option est sélectionnée, le texte de suite de sera pasaffiché.

Page 359: SPSS Base Users Guide 14.0

333

Tableaux pivotants

Pour contrôler l’impression d’un tableau pivotant

E Cliquez sur l’onglet Impression.

E Sélectionnez les options d’impression souhaitées.

E Cliquez sur OK ou sur Appliquer.

Polices

Un modèle de tableau vous permet de spécifier des caractéristiques de police pourdifférentes zones du tableau. Vous pouvez également changer la police de toutecellule individuellement. Les options de police dans une cellule comprennent le typede police, le style, la taille et la couleur. Vous pouvez également masquer le texte oule souligner.

Si vous spécifiez des propriétés de police dans une cellule, ces propriétéss’appliquent dans toutes les strates du tableau possédant la même cellule.

Figure 12-14Boîte de dialogue Police

Page 360: SPSS Base Users Guide 14.0

334

Chapitre 12

Modification de la police d’une cellule

E Activez le tableau pivotant et sélectionnez le texte que vous voulez modifier.

E A partir des menus du tableau pivotant, choisissez :Format

Polices

En option, vous pouvez sélectionner une police, un style de police et une taille,spécifier si vous voulez masquer ou souligner le texte ou sélectionner une couleur etun style d’écriture.

Largeur des cellules de donnéesFixer la largeur des cellules de données est utilisé pour fixer une même largeur àtoutes les cellules de données.

Figure 12-15Boîte de dialogue Fixer la Largeur des Cellules de Données

Modification de la largeur des cellules de données

E Activez le tableau pivotant.

E A partir des menus, sélectionnez :Format

Largeur des cellules

E Entrez une valeur pour la largeur des cellules.

Modification de la largeur d’une colonne de tableau pivotant

E Double-cliquez n’importe où sur le tabelau pour l’activer.

Page 361: SPSS Base Users Guide 14.0

335

Tableaux pivotants

E Déplacez le pointeur de la souris dans les étiquettes de modalités jusqu’à ce qu’il soitsur la bordure droite de la colonne que vous voulez modifier. (Le pointeur se changeen flèche à deux pointes.)

E Maintenez le bouton de la souris enfoncé pendant que vous faites glisser la bordurevers sa nouvelle position.

Figure 12-16Modifier la largeur d’une colonne

Vous pouvez modifier les bordures verticales de modalité et de dimension dans lazone des étiquettes de ligne, qu’elles soient masquées ou non.

E Déplacez le pointeur de la souris à travers les étiquettes de ligne jusqu’à voirapparaître la flèche à deux pointes.

E Faites glisser la bordure jusqu’à la nouvelle largeur.

Propriétés de la celluleLes propriétés de cellules s’appliquent à une cellule sélectionnée. Vous pouvezchanger le format des valeurs, l’alignement, les marges et de l’ombrage. LesPropriétés des cellules supplantent les propriétés de tableau ; donc, si vous changezles propriétés de tableau, vous ne modifierez pas les propriétés de cellules appliquéesindividuellement.

Modification des propriétés de la cellule

E Activez un tableau et sélectionnez une cellule du tableau.

E A partir des menus, sélectionnez :Format

Propriétés de la cellule

Page 362: SPSS Base Users Guide 14.0

336

Chapitre 12

Propriétés des cellules : ValeurCet onglet de boîte de dialogue contrôle le format des valeurs d’une cellule. Vouspouvez sélectionner des formats pour les nombres, les dates, les heures ou lesmonnaies et ajuster le nombre de décimales affichées.

Figure 12-17Boîte de dialogue Propriétés de la cellule, onglet Valeur

Modification des formats des valeurs dans une cellule

E Cliquez sur l’onglet Valeur.

E Sélectionnez une modalité et un format.

E Sélectionnez le nombre de décimales.

Pour modifier le format des valeurs dans une colonne

E Ctrl-Alt-clic sur l’étiquette de colonne.

Page 363: SPSS Base Users Guide 14.0

337

Tableaux pivotants

E Cliquez avec le bouton droit de la souris sur la colonne en surbrillance.

E A partir du menu contextuel, sélectionnez Propriétés de la cellule.

E Cliquez sur l’onglet Valeur.

E Sélectionnez le format que vous voulez appliquer à la colonne.

Vous pouvez utiliser cette méthode pour supprimer ou ajouter des symbolespourcentage ou dollar, modifier le nombre de décimales affichées et passer de lanotation numérique normale à la notation scientifique.

Propriétés des cellules : Alignement

Cet onglet de boîte de dialogue fixe l’alignement vertical et horizontal et la directiondu texte pour une cellule. Si vous sélectionnez Mixte, le contenu de la cellule estaligné selon son type (nombre, date ou texte).

Figure 12-18Boîte de dialogue Propriétés de le cellule, onglet Alignement

Page 364: SPSS Base Users Guide 14.0

338

Chapitre 12

Modification de l’alignement dans les cellules

E Sélectionnez une cellule dans le tableau.

E A partir des menus du tableau pivotant, choisissez :Format

Propriétés de la cellule

E Cliquez sur l’onglet Alignement.

Lorsque vous sélectionnez les propriétés d’alignement de la cellule, elles s’illustrentdans la zone d’échantillon.

Propriétés des cellules : Marges

Cet onglet de boîte de dialogue spécifie la marge à chaque bord d’une cellule.

Figure 12-19Boîte de dialogue Propriétés de la cellule, onglet Marges

Page 365: SPSS Base Users Guide 14.0

339

Tableaux pivotants

Modification des marges dans les cellules

E Cliquez sur l’onglet Marges.

E Sélectionnez la valeur de chacune des quatre marges.

Propriétés des cellules : OmbrageCet onglet de boîte de dialogue spécifie le pourcentage d’ombrage ainsi que lescouleurs de premier plan et d’arrière-plan pour une zone de cellules spécifiée. Celan’affecte pas la couleur du texte.

Figure 12-20Boîte de dialogue Propriétés de la cellule, onglet Ombrage

Modification de l’ombrage des cellules

E Cliquez sur l’onglet Ombrage.

E Sélectionnez les surbrillances et les couleurs de la cellule.

Page 366: SPSS Base Users Guide 14.0

340

Chapitre 12

Marque de bas de page

Marque de note de bas de page modifie le ou les caractères utilisés pour marquerune note de bas de page.

Figure 12-21Boîte de dialogue Marque de Note de bas de page

Modification des caractères des marques des notes de bas de page

E Sélectionnez une note de bas de page.

E A partir des menus du tableau pivotant, choisissez :Format

Marque de note de bas de page

E Entrez un ou deux caractères.

Renumérotation des notes de bas de page

Lorsque vous avez fait pivoter un tableau en échangeant des lignes, des colonnes etdes strates, les notes de bas de page peuvent être désactivées. Pour renuméroter lesnotes de bas de page :

E Activez le tableau pivotant.

E A partir des menus, sélectionnez :Format

Renuméroter notes de bas de page

Page 367: SPSS Base Users Guide 14.0

341

Tableaux pivotants

Sélection des lignes et des colonnes dans les tableauxpivotants

Dans les tableaux pivotants, certaines contraintes existent quant à la manière desélectionner les lignes et les colonnes, et la surbrillance qui indique la ligne ou lacolonne sélectionnée peut s’étendre sur des zones non contiguës du tableau.

Pour sélectionner une ligne ou une colonne dans un tableaupivotant

E Double-cliquez n’importe où sur le tabelau pivotant pour l’activer.

E Cliquez sur une étiquette de ligne ou de colonne.

E A partir des menus, sélectionnez :Edition

SélectionnezCellules de données et d’étiquettes

ou

E Ctrl-Alt-clic sur l’étiquette de ligne ou de colonne.

Si le tableau contient plusieurs dimensions dans la zone des lignes ou des colonnes, lasélection en surbrillance peut s’étendre sur plusieurs cellules non contiguës.

Modification des résultats d’un tableau pivotantLe texte qui s’affiche dans le Viewer peut apparaître dans beaucoup d’éléments.Vous pouvez modifier le texte ou ajouter de nouveaux textes. Les tableaux pivotantspeuvent être édités en :

Editant du texte dans les cellules du tableau pivotant.

Ajoutant des légendes et des notes de bas de page.

Pour modifier le texte d’une cellule

E Activez le tableau pivotant.

E Double-cliquez sur la cellule.

Page 368: SPSS Base Users Guide 14.0

342

Chapitre 12

E Editez le texte.

E Appuyez sur la touche Entrée pour enregistrer vos changements ou appuyez sur latouche Echap pour restaurer le contenu précédent de la cellule.

Ajout de légendes à un tableau

E A partir des menus du tableau pivotant, choisissez :Insérer

Légende

Les mots Légende du tableau s’affichent au bas du tableau.

E Double-cliquez sur les mots Légende du tableau et remplacez-les par le texte delégende de votre choix.

Ajout d’une note de bas de page à un tableau

Une note de bas de page peut être attachée à tout élément d’un tableau.

E Cliquez sur un titre, une cellule ou une légende dans le tableau pivotant activé.

E A partir des menus du tableau pivotant, choisissez :Insérer

Note de bas de page

E Double-cliquez sur le mot Note de bas de page et remplacez-le par le texte de notede bas de page de votre choix.

Impression des tableaux pivotantsDivers facteurs peuvent affecter l’aspect des tableaux pivotants imprimés et cesfacteurs peuvent être contrôlés en modifiant les attributs du tableau pivotant.

Pour des tableaux pivotants multidimensionnels (tableaux avec strates), vouspouvez soit imprimer toutes les strates, soit simplement imprimer la stratesupérieure (visible).

Pour des tableaux pivotants longs ou larges, vous pouvez automatiquementredimensionner le tableau pour ajuster à la page ou contrôler la position dessauts de tableaux ou des sauts de page.

Page 369: SPSS Base Users Guide 14.0

343

Tableaux pivotants

Utilisez l’Aperçu avant impression du menu Fichier pour voir à quoi ressemblerontles tableaux pivotants imprimés.

Pour imprimer les strates masquées d’un tableau pivotantE Double-cliquez n’importe où sur le tabelau pour l’activer.

E A partir des menus, sélectionnez :Format

Propriétés du tableau

E Dans l’onglet Impression, sélectionnez Imprimer toutes les strates.

Vous pouvez aussi imprimer chaque strate d’un tableau pivotant sur une page distincte.

Contrôle des sauts de tableau pour les tableaux longs et largesLes tableaux pivotants qui sont soit trop larges soit trop longs pour être imprimés dansla taille de page définie sont automatiquement divisés et sont imprimés en plusieurssections. (Pour les tableaux larges, les différentes sections s’impriment sur la mêmepage s’il y a de la place). Vous pouvez:

Contrôler la position à laquelle les lignes et les colonnes sont divisés les grandstableaux

Indiquer les lignes et colonnes qui doivent être conservés ensemble lors de ladivision de tableaux

Redimensionner les grands tableaux pour les ajuster à la taille définie pour la page

Pour spécifier des sauts de ligne et de colonne dans les tableaux pivotantsimprimés

E Activez le tableau pivotant.

E Cliquez sur l’étiquette de colonne à gauche de l’endroit où vous souhaitez insérer lesaut ou sur l’étiquette de ligne au-dessus de l’endroit où vous souhaitez insérer le saut.

E A partir des menus, sélectionnez :Format

Séparer ici

Page 370: SPSS Base Users Guide 14.0

344

Chapitre 12

Spécification des lignes ou colonnes à conserver ensemble

E Activez le tableau pivotant.

E Sélectionnez les étiquettes des lignes ou colonnes que vous souhaitez conserverensemble. (Cliquez-glissez ou Maj+cliquez pour sélectionner plusieurs étiquettesde ligne ou de colonne.)

E A partir des menus, sélectionnez :Format

Conserver ensemble

Pour redimensionner un tableau pivotant afin de l’ajuster à la page

E Activez le tableau pivotant.

E A partir des menus, sélectionnez :Format

Propriétés du tableau

E Cliquez sur l’onglet Impression.

E Sélectionnez Redimensionner largeur de tableau.

et/ou

E Sélectionnez Redimensionner longueur de tableau.

Page 371: SPSS Base Users Guide 14.0

Chapitre

13Utilisation de la syntaxe decommande

SPSS fournit un puissant langage de commande qui vous permet d’enregistrer etd’automatiser de nombreuses tâches. Il fournit également des fonctionnalités qui nese trouvent ni dans les menus ni dans les boîtes de dialogue.

La plupart des commandes sont accessibles depuis les menus et boîtes de dialogue.Cependant, certaines options et commandes ne sont disponibles qu’en utilisant lelangage de commande. Celui-ci vous permet d’enregistrer vos travaux dans un fichierde syntaxe afin de vous permettre de relancer votre analyse à une date ultérieure ou del’exécuter dans une opération automatisée à l’aide du système de production.

Un fichier de syntaxe de commande est un fichier texte simple contenantdes commandes. Il est possible d’ouvrir une fenêtre de syntaxe et de taper descommandes, mais il est plus simple de laisser SPSS construire le fichier de syntaxeselon l’une des méthodes suivantes :

Copie de la syntaxe de commande à partir des boîtes de dialogue,

Copie de la syntaxe à partir du fichier de résultat,

Copie de la syntaxe à partir du fichier-journal.

Un guide de référence détaillé sur la syntaxe des commandes est disponible sousdeux formes différentes : guide intégré dans le système d’aide global et commefichier PDF distinct appelé SPSS Command Syntax Reference, aussi disponibleà partir du menu Aide.

L’aide contextuelle pour la commande en cours est disponible dans une fenêtre desyntaxe en pressant la touche F1.

345

Page 372: SPSS Base Users Guide 14.0

346

Chapitre 13

Règles de syntaxe de commande

Lorsque vous exécutez des commandes à partir d’une fenêtre de syntaxe de commandelors d’une session SPSS, vous exécutez des commandes en mode interactif.

Les règles suivantes s’appliquent aux spécifications de commandes en mode interactif:

Chaque commande doit être affichée avec un point servant de caractère de fin decommande. Cependant, il est préférable d’ignorer le caractère de fin sur BEGINDATA , de façon à ce que les données linéaires soient traitées comme une seulespécification continue.

Le caractère de fin de commande doit correspondre au dernier caractère nonvide d’une commande.

En l’absence d’un point servant de caractère de fin de commande, toute ligne videest interprétée comme un caractère de fin de commande.

Les commandes peuvent commencer dans n’importe quelle colonne d’une lignede commande et continuer sur autant de lignes que nécessaire. Cependant, uneexception existe pour la commande END DATA. La commande END DATA doitcommencer dans la première colonne de la première ligne à la fin des données.

Remarque : Pour que les autres modes d’exécution de commande soient compatiblesentre eux (notamment les fichiers de commandes exécutés avec les commandesINSERT ou INCLUDE dans une session interactive), chaque ligne de syntaxe decommande ne doit pas dépasser 256 octets.

La plupart des sous-commandes sont séparées par des barres obliques (/). Labarre oblique figurant avant la première sous-commande de la commande estsouvent facultative.

Le nom des variables doit être écrit en en toute lettre.

Le texte inclus dans les apostrophes ou les guillemets doit tenir sur une seule ligne.

Un point (.) doit être utilisé pour indiquer les décimales, indépendamment desparamètres régionaux ou locaux.

Le nom des variables finissant par un point peut engendrer des erreurs dans lescommandes créées par les boîtes de dialogue. Vous ne pouvez pas créer de telsnoms de variable dans les boîtes de dialogue ; vous devez donc éviter d’indiquerces noms.

Page 373: SPSS Base Users Guide 14.0

347

Utilisation de la syntaxe de commande

La syntaxe de commande respectant la casse, une abréviation de trois ou quatre lettrespeut être utilisée pour spécifier ces commandes. Vous pouvez utiliser autant de lignesvoulues pour spécifier une commande unique. Il vous est possible d’ajouter desespaces ou des sauts de ligne à presque tous les points d’insertion d’un espace vide,tels que des barres obliques, des parenthèses, des opérateurs arithmétique, ou lesajouter entre le nom des variables. Par exemple,

FREQUENCIES VARIABLES=JOBCAT GENDER /PERCENTILES=25 50 75 /BARCHART.

et

freq var=jobcat gender /percent=25 50 75 /bar.

sont deux choix possibles qui génèrent les mêmes résultats.

Fichiers INCLUDE

Pour les fichiers de commande exécutés via la commande INCLUDE, les règles desyntaxe du mode de commande s’appliquent.

Les règles suivantes s’appliquent à des spécifications de commandes en mode decommande ou en mode de production :

Toutes les commandes du fichier de commande doivent commencer dans lacolonne 1. Vous pouvez utiliser les signes plus (+) ou moins (-) dans la premièrecolonne si vous souhaitez indenter la spécification de commande afin de faciliterla lecture du fichier.

Si plusieurs lignes sont utilisées pour une commande, la colonne 1 de chaqueligne suivante doit être vide.

Les caractères de fin de commande sont optionnels.

Une ligne ne peut pas excéder 256 octets. Tout caractère supplémentaire esttronqué.

A moins de disposer de fichiers de commande existants qui utilisent déjà la commandeINCLUDE, il est préférable d’utiliser à la place la commande INSERT, car elleconvient aux fichiers de commande conformes à l’un des deux ensembles de règles.Si vous générez une syntaxe de commande en collant les sélections d’une boîte dedialogue dans une fenêtre de syntaxe, le format des commandes convient à tout modede production. Pour plus d’informations, reportez-vous au manuel SPSS CommandSyntax Reference (disponible au format PDF depuis le menu Aide).

Page 374: SPSS Base Users Guide 14.0

348

Chapitre 13

Création d’une syntaxe depuis les boîtes de dialogue

La méthode la plus simple pour construire un fichier de syntaxe de commandeconsiste à effectuer des sélections dans les boîtes de dialogue et à coller la syntaxedans la fenêtre correspondante. En collant la syntaxe à chaque étape d’une longueanalyse, vous pouvez construire un fichier de travail vous permettant de relancerl’analyse ultérieurement ou d’exécuter une opération automatisée à l’aide du systèmede production.

Dans la fenêtre de syntaxe, vous pouvez exécuter la syntaxe qui a été collée, lamodifier et l’enregistrer dans un fichier de syntaxe.

Collage d’une syntaxe depuis les boîtes de dialogue

E Ouvrez la boîte de dialogue et faites vos sélections.

E Cliquez sur Coller.

La syntaxe de commande est alors collée dans la fenêtre correspondante. Si vousn’avez pas ouvert de fenêtre, une nouvelle fenêtre s’ouvre automatiquement pourpouvoir y coller la syntaxe.

Page 375: SPSS Base Users Guide 14.0

349

Utilisation de la syntaxe de commande

Figure 13-1Syntaxe de commande collée depuis une boîte de dialogue

Remarque : Si vous ouvrez une boîte de dialogue à partir des menus d’une fenêtrede script, le code permettant d’exécuter la syntaxe depuis un script est alors collédans la fenêtre correspondante.

Utilisation de la syntaxe depuis le fichier de résultat

Vous pouvez construire un fichier de syntaxe en copiant la syntaxe depuis le fichierapparaissant dans le Viewer. Pour ce faire, sélectionnez Afficher commandes dansles paramètres de l’Editeur de résultats (menu Edition, Options, onglet Editeur derésultats) avant de lancer l’analyse. Chaque commande apparaît donc dans le Vieweraccompagné du résultat de l’analyse.

Dans la fenêtre de syntaxe, vous pouvez exécuter la syntaxe qui a été collée, lamodifier et l’enregistrer dans un fichier de syntaxe.

Page 376: SPSS Base Users Guide 14.0

350

Chapitre 13

Figure 13-2Syntaxe de commande dans le fichier

Copier la syntaxe depuis le fichier de résultats

E Avant de lancer l’analyse, à partir du menu, sélectionnez :Edition

Options

E Dans l’onglet Viewer, sélectionnez Afficher commandes.

Au cours de l’analyse, les commandes des sélections faites dans votre boîte dedialogue sont enregistrées dans le fichier.

E Ouvrez un fichier de syntaxe précédemment enregistré ou créez-en un nouveau. Pource faire, à partir du menu, sélectionnez :Fichier

NouveauSyntaxe

E Dans l’Editeur de résultats, double-cliquez sur un élément du fichier pour le mettre ensurbrillance.

Page 377: SPSS Base Users Guide 14.0

351

Utilisation de la syntaxe de commande

E Cliquez et faites glisser la souris pour sélectionner la syntaxe à copier.

E A partir du menu de l’Editeur de résultats, sélectionnez :Edition

Copier

E Dans la fenêtre de syntaxe, à partir du menu, sélectionnez :Edition

Coller

Utilisation de la syntaxe dans un fichier-journal

Par défaut, toutes les commandes exécutées au cours d’une session sont enregistréesdans un fichier-journal nommé spss.jnl (configuré dans le menu Edition, commandeOptions). Vous pouvez modifier le fichier-journal et l’enregistrer en tant que fichierde syntaxe que vous pouvez utiliser pour relancer une analyse, ou l’exécuter dans uneopération automatisée à l’aide du système de production.

Le fichier-journal est un fichier texte pouvant être modifié comme tout autrefichier. Des messages d’erreur et des avertissements étant également enregistrés dansle fichier-journal avec la syntaxe de commande, vous devez modifier les messagesd’erreur et les avertissements générés avant d’enregistrer le fichier de syntaxe. Noteztoutefois que les erreurs doivent être résolues pour que l’analyse puisse s’effectuercorrectement.

Enregistrez le fichier-journal modifié sous un autre nom. Le fichier-journalétant automatiquement ajouté ou écrasé à chaque session, la tentative d’utilisationdu même nom de fichier pour les fichiers de syntaxe et journaux peut générer desrésultats inattendus.

Page 378: SPSS Base Users Guide 14.0

352

Chapitre 13

Figure 13-3Edition du fichier-journal

Modification de la syntaxe dans un fichier-journal

E Pour ouvrir le fichier-journal, sélectionnez à partir du menu :Fichier

OpenAutre…

E Ouvrez le fichier-journal (par défaut, spss.jnl se trouve dans le répertoire temp).

Sélectionnez Tous les fichiers (*.*) dans la liste des types de fichiers ou entrez *.jnl dansla zone de texte Nom de fichier pour afficher les fichiers-journaux dans la liste. Sivous ne parvenez pas à trouver le fichier, utilisez Options du menu Edition pourconnaître l’emplacement du journal sur votre système.

E Modifiez le fichier afin de supprimer tout message d’erreur ou avertissement indiquépar un signe >.

Page 379: SPSS Base Users Guide 14.0

353

Utilisation de la syntaxe de commande

E Enregistrez le fichier-journal modifié sous un autre nom. (Nous vous conseillonsd’utiliser un nom avec une extension .sps. C’est l’extension par défaut des fichiers desyntaxe.)

Exécuter une syntaxe de commandeE Mettez en surbrillance les commandes à exécuter dans la fenêtre de syntaxe.

E Cliquez sur le bouton Exécuter (en forme de triangle) dans la barre d’outils de lafenêtre de l’éditeur de syntaxe.

ou

E Sélectionnez l’une des options du menu Exécuter.

Tout : Exécute toutes les commandes dans la fenêtre de syntaxe.

Sélection : Exécute les commandes sélectionnées, y compris les commandespartiellement sélectionnées.

Courant : Exécute la commande à l’endroit où le curseur est situé.

Jusqu’à la fin : Exécute toutes les commandes à partir de l’emplacement du curseurjusqu’à la fin du fichier de syntaxe de commande.

Le bouton Exécuter dans la barre d’outils de l’éditeur de syntaxe exécute lescommandes sélectionnées ou la commande sélectionnée à l’endroit où le curseur estsitué si aucun élément n’est sélectionné.

Figure 13-4Barre d’outils Editeur de syntaxe

Commandes Execute multiplesLa syntaxe collée depuis des boîtes de dialogue ou copiée depuis le journal peutcontenir des commandes EXECUTE. Lorsque vous exécutez plusieurs commandes àpartir d’une fenêtre de syntaxe, il est inutile de faire appel à plusieurs commandesEXECUTE. Vous risquez même de ralentir les performances car cette commande litl’intégralité du fichier de données.

Page 380: SPSS Base Users Guide 14.0

354

Chapitre 13

Si la dernière commande du fichier de syntaxe lit le fichier de données (commeune procédure statistique ou graphique), aucune commande EXECUTE n’estnécessaire ; vous pouvez donc supprimer ces commandes.

Si vous n’êtes pas sûr que la dernière commande lise le fichier de données, vouspouvez généralement supprimer toutes les commandes EXECUTE du fichier desyntaxe, à l’exception de la dernière.

Fonctions Décalage positif

Cette exception concerne les commandes de transformation qui contiennent desfonctions Décalage positif. Dans une série de commandes de transformation necontenant aucune commande EXECUTE ni aucune autre commande lisant les données,les fonctions Décalage positif sont calculées une fois toutes les autres transformationseffectuées, sans tenir compte de l’ordre des commandes. Par exemple :

COMPUTE lagvar=LAG(var1) COMPUTE var1=var1*2

et

COMPUTE lagvar=LAG(var1) EXECUTE COMPUTE var1=var1*2

génère différents résultats pour la valeur lagvar car la première valeur utilise la valeurtransformée var1 alors que la deuxième utilise la valeur d’origine.

Page 381: SPSS Base Users Guide 14.0

Chapitre

14Effectifs

La procédure Effectifs permet d’obtenir des affichages statistiques et graphiques quiservent à décrire de nombreux types de variables. La procédure Effectifs peut jouerun rôle lorsque vous prenez connaissance de vos données.

Pour obtenir un rapport des Effectifs et un diagramme en bâtons, vous pouvez trierles différentes valeurs par ordre croissant ou décroissant, ou bien classer les modalitésen fonction de leurs effectifs. Le rapport de effectifs peut être supprimé lorsqu’unevariable a plusieurs valeurs distinctes. Vous pouvez étiqueter les diagrammes avecdes effectifs (par défaut) ou des pourcentages.

Exemple. Quelle est la répartition de la clientèle d’une société selon le type d’industriedont elle fait partie ? Le résultat pourrait vous apprendre que votre clientèle estcomposée à 37,5 % d’organismes d’état, à 24,9 % de sociétés commerciales, à 28,1 %d’établissements universitaires et à 9,4 % du secteur de la santé. Pour des donnéescontinues et quantitatives, comme par exemple les revenus des ventes, vous pourriezconstater que la moyenne de vente par produit est de 3 576 avec un écart-type de1 078 .

Diagrammes et statistiques. Effectifs de fréquence, pourcentages, pourcentagescumulés, moyenne, médiane, mode, somme, écart-type, variance, intervalle, valeursminimale et maximale, erreur standard de la moyenne, asymétrie et aplatissement(avec leurs erreurs standard), quartiles, centiles choisis par l’utilisateur, diagrammesen bâtons, diagrammes en secteurs et histogrammes.

Données. Utilisez des codes numériques ou alphanumériques courts pour coder lesvariables qualitatives (mesures de niveau nominal ou ordinal).

Hypothèses. Les tabulations et les pourcentages fournissent une description utile surles données de n’importe quelle distribution, particulièrement pour les variablesdisposant de modalités triées ou non. Certaines des statistiques récapitulativesfacultatives, telles que la moyenne et l’écart-type, sont fondées sur la théorie denormalité et sont appropriées pour des variables quantitatives avec une distribution

355

Page 382: SPSS Base Users Guide 14.0

356

Chapitre 14

symétrique. Les statistiques de base, telles que la médiane, les quartiles et lescentiles, sont appropriées pour les variables quantitatives, qu’elles répondent ou nonau critère de normalité.

Figure 14-1Résultat de effectifs

Pour obtenir des tableaux de effectifs

E A partir des menus, sélectionnez :Analyse

Statistiques descriptivesEffectifs

Page 383: SPSS Base Users Guide 14.0

357

Effectifs

Figure 14-2Boîte de dialogue Effectifs

E Sélectionnez une ou plusieurs variables qualitatives ou quantitatives.

Sinon, vous pouvez :

Cliquer sur Statistiques pour obtenir des statistiques descriptives pour desvariables quantitatives.

Cliquer sur Diagrammes pour obtenir des diagrammes en bâtons, des diagrammesen secteurs ou des histogrammes.

Cliquer sur Format pour définir l’ordre de présentation des résultats.

Page 384: SPSS Base Users Guide 14.0

358

Chapitre 14

Statistiques des effectifsFigure 14-3Boîte de dialogue Effectifs : Statistiques

Fractiles. Valeurs d’une variable quantitative qui divisent les données triées enclasses par centième. Les quartiles (25ième, 50ième et 75ième centiles) divisent lesobservations en quatre classes de taille égale. Si vous souhaitez un nombre égal declasses différent de quatre, sélectionnez Partition en n classes égales. Vous pouvezégalement spécifier des centiles particuliers (par exemple, le 95ième centile, valeurau-dessus de 95 % des observations).

Tendance centrale. Les statistiques décrivant la position de la distribution comprennentla Moyenne, la Médiane, le Mode et la Somme de toutes les valeurs.

Moyenne. Mesure de la tendance centrale. Moyenne arithmétique ; somme diviséepar le nombre d'observations.

Médiane. Valeur au-dessus ou au-dessous de laquelle se trouve la moitié desobservations ; 50e centile. Si le nombre d'observations est pair, la médianecorrespond à la moyenne des deux observations du milieu lorsqu'elles sont triéesdans l'ordre croissant ou décroissant. La médiane est une mesure de tendancecentrale et elle n'est pas, à l'inverse de la moyenne, sensible aux valeurs éloignées.

Page 385: SPSS Base Users Guide 14.0

359

Effectifs

Mode . Valeur qui revient le plus fréquemment. Si plusieurs valeurs partagentla plus grande fréquence d'occurrence, chacune d'elles constitue un mode. Laprocédure Fréquences ne rend compte que du plus petit mode.

Somme. Somme ou total des valeurs, pour toutes les observations n'ayant pasde valeur manquante.

Dispersion. Les statistiques mesurant la variance ou la dispersion dans les données,comprennent l’écart-type, la variance, l’intervalle, le minimum, le maximum etl’erreur standard (ES) de la moyenne.

Ecart type. Mesure de la dispersion des valeurs autour de la moyenne. Dans lecas d'une distribution normale, 68 % des observations se situent à l'intérieur d'unécart-type de la moyenne et 95 % se situent à l'intérieur de deux écarts-types.Par exemple, si la moyenne d'âge est de 45 avec un écart-type égal à 10, unedistribution normale verra 95 % des observations se situer entre 25 et 65.

Variance. Mesure de la dispersion des valeurs autour de la moyenne, égale à lasomme des carrés des écarts par rapport à la moyenne, divisée par le nombred'observations moins un. La variance se mesure en unités, qui sont égales aucarré des unités de la variable.

Etendue. Différence entre la valeur maximale et la valeur minimale d'une variablenumérique (maximum–minimum).

Minimum. Valeur la plus petite d'une variable numérique.

Maximum. Plus grande valeur d'une variable numérique.

ES Moyenne. Mesure du taux de variation de la valeur de la moyenne surdes échantillons provenant de la même distribution. Cette mesure permet decomparer approximativement la moyenne observée avec une valeur hypothétique(autrement dit, vous pouvez conclure que ces deux valeurs sont différentes si lerapport de la différence avec l'erreur standard est inférieur à -2 ou supérieur à +2).

Distribution. L’Asymétrie et l’Aplatissement sont des statistiques qui décrivent laforme et la symétrie de la distribution. Ces statistiques sont présentées avec leurserreurs standard.

Skewness. Mesure de l'asymétrie d'une distribution. La distribution normale estsymétrique et possède une valeur d'asymétrie égale à 0. Une distribution dontla valeur d'asymétrie est positive présente une extrémité droite allongée. Unedistribution caractérisée par une importante asymétrie négative présente une

Page 386: SPSS Base Users Guide 14.0

360

Chapitre 14

extrémité gauche plus allongée. Pour simplifier, une valeur d'asymétrie deux foissupérieure à l'erreur standard correspond à une absence de symétrie.

Kurtosis. Mesure de l'étendue du regroupement des observations autour d'unpoint central. Dans le cas d'une distribution normale, la valeur de la statistiqued'aplatissement est égale à zéro. Un aplatissement positif indique que lesobservations sont plus regroupées et présentent des extrémités plus longues quedans le cas d'une distribution normale. Un aplatissement négatif signifie que lesobservations sont moins regroupées et présentent des extrémités plus courtes.

Valeurs sont des centres de classes. Si les valeurs dans vos données représentent descentres de classes (par exemple, les âges des individus trentenaires sont représentéspar le code 35), sélectionnez cette option pour estimer la médiane et les centilesdes données originales, non regroupées.

Diagrammes des effectifsFigure 14-4Boîte de dialogue Effectifs : Diagrammes

Type de diagramme. Un diagramme en secteurs montre la participation de chaquepartie à l’ensemble. Chaque secteur du diagramme correspond à un groupe défini parune simple variable de regroupement. Un diagramme en bâtons montre l’effectif dechaque valeur ou de chaque modalité sous la forme d’un bâton distinct, ce qui vouspermet de comparer les modalités visuellement. Un histogramme est égalementconstitué de bâtons mais ils sont répartis à intervalles égaux. La hauteur de chaque

Page 387: SPSS Base Users Guide 14.0

361

Effectifs

bâton représente l’effectif des valeurs d’une variable quantitative appartenant àl’intervalle. Un histogramme montre la forme, le centre et la dispersion de ladistribution. Si vous superposez une courbe normale sur l’histogramme, vous pouvezdéterminer si les données sont distribuées normalement.

Valeurs du diagramme. Dans les diagrammes en bâtons, l’axe peut être étiqueté pareffectifs ou pourcentages de fréquence.

Format des effectifsFigure 14-5Boîte de dialogue Effectifs: Format

Ordre d’affichage. Le tableau de effectifs peut être affiché en fonction des valeursréelles des données ou de l’effectif (fréquence d’occurrence) de ces valeurs et organisépar valeurs croissantes ou valeurs décroissantes. Cependant, si vous demandez unhistogramme ou des centiles, SPSS part du principe que la variable est quantitative etaffiche ses valeurs par ordre croissant.

Variables multiples. Si vous créez des tableaux statistiques pour des variablesmultiples, vous pouvez afficher toutes les variables dans un tableau unique (Comparer

variables) ou bien afficher un tableau statistique séparé pour chaque variable (Séparer

résultats par variables).

Supprimer les tableaux avec plus de n modalités. Cette option évite l’affichage destableaux ayant plus que le nombre spécifié de valeurs.

Page 388: SPSS Base Users Guide 14.0
Page 389: SPSS Base Users Guide 14.0

Chapitre

15Descriptives

La procédure Descriptive affiche les résumés de statistiques univariées pour plusieursvariables en un seul tableau et calcule les valeurs standardisées (scores z). Lesvariables peuvent être ordonnées en fonction de la taille de leurs moyennes (en ordreascendant ou descendant), alphabétiquement ou selon l’ordre dans lequel vous avezsélectionné les variables (par défaut).

Lorsque les scores z sont enregistrés, ils sont ajoutés aux données dans l’éditeurde données et sont disponibles pour les diagrammes SPSS, les listes de donnéeset les analyses. Lorsque les variables sont enregistrées avec des unités différentes(par exemple, produit domestique brut par personne et pourcentage de la populationsachant lire et écrire), une transformation en score z place les variables sur une échellecommune pour que la comparaison soit plus facile.

Exemple. Si chaque observation dans vos données contient les totaux des ventesquotidiennes pour chacun des membres du personnel commercial (par exemple, uneentrée pour Bob, une pour Kim, une pour Brian, etc.) rapportés chaque jour pendantplusieurs mois, la procédure Descriptives peut calculer les ventes quotidiennesmoyennes pour chacun des membres du personnel et ordonner les résultats de lamoyenne des ventes la plus élevée à la plus basse.

Statistiques. Taille de l’échantillon, moyenne, minimum, maximum, écart-type,variance, intervalle, somme, erreur standard de la moyenne, et aplatissement etasymétrie avec leurs erreurs standards (ES).

Données. Utilisez des variables numériques après les avoir visualisées graphiquementen cherchant des erreurs d’enregistrement, les valeurs éloignées et les anomaliesde distribution. La procédure Descriptives est très efficace pour les gros fichiers(milliers d’observations).

Hypothèses. La plupart des statistiques disponibles (y compris les écarts z) sont baséessur une théorie normale et conviennent pour des variables continues (mesures deniveau d’intervalle ou de rapport) avec distribution symétrique. Evitez les variables

363

Page 390: SPSS Base Users Guide 14.0

364

Chapitre 15

avec des modalités désordonnées ou des répartitions asymétriques. La distributiondes écarts z a la même forme que celle des données d’origine. Ainsi, le calcul desécarts z n’est pas une solution aux données posant des problèmes.

Pour obtenir des statistiques descriptives

E A partir des menus, sélectionnez :Analyse

Statistiques descriptivesDescriptives

Figure 15-1Boîte de dialogue Descriptives

E Sélectionnez une ou plusieurs variables.

Sinon, vous pouvez :

Cliquez sur Enregistrer des valeurs standardisées dans des variables pourenregistrer les écarts z comme nouvelles variables.

Cliquer sur Options pour les statistiques optionnelles et l’ordre d’affichage.

Page 391: SPSS Base Users Guide 14.0

365

Descriptives

Options DescriptivesFigure 15-2Boîte de dialogue Descriptives : Options

Moyenne et somme. La moyenne ou moyenne arithmétique s’affiche par défaut.

Dispersion. Les statistiques qui mesurent l’étendue ou les variations dans les donnéescomprennent l’écart-type, la variance, l’intervalle, le minimum, le maximum, etl’erreur standard (ES) de la moyenne.

Ecart type. Mesure de la dispersion des valeurs autour de la moyenne. Dans lecas d'une distribution normale, 68 % des observations se situent à l'intérieur d'unécart-type de la moyenne et 95 % se situent à l'intérieur de deux écarts-types.Par exemple, si la moyenne d'âge est de 45 avec un écart-type égal à 10, unedistribution normale verra 95 % des observations se situer entre 25 et 65.

Variance. Mesure de la dispersion des valeurs autour de la moyenne, égale à lasomme des carrés des écarts par rapport à la moyenne, divisée par le nombred'observations moins un. La variance se mesure en unités, qui sont égales aucarré des unités de la variable.

Etendue. Différence entre la valeur maximale et la valeur minimale d'une variablenumérique (maximum–minimum).

Page 392: SPSS Base Users Guide 14.0

366

Chapitre 15

Minimum. Valeur la plus petite d'une variable numérique.

Maximum. Plus grande valeur d'une variable numérique.

E.S. moyenne. Mesure du taux de variation de la valeur de la moyenne surdes échantillons provenant de la même distribution. Cette mesure permet decomparer approximativement la moyenne observée avec une valeur hypothétique(autrement dit, vous pouvez conclure que ces deux valeurs sont différentes si lerapport de la différence avec l'erreur standard est inférieur à -2 ou supérieur à +2).

Distribution. L’aplatissement et l’asymétrie sont des statistiques qui caractérisent laforme et la symétrie de la distribution. Ces statistiques sont présentées avec leurserreurs standard.

Kurtosis. Mesure de l'étendue du regroupement des observations autour d'unpoint central. Dans le cas d'une distribution normale, la valeur de la statistiqued'aplatissement est égale à zéro. Un aplatissement positif indique que lesobservations sont plus regroupées et présentent des extrémités plus longues quedans le cas d'une distribution normale. Un aplatissement négatif signifie que lesobservations sont moins regroupées et présentent des extrémités plus courtes.

Skewness. Mesure de l'asymétrie d'une distribution. La distribution normale estsymétrique et possède une valeur d'asymétrie égale à 0. Une distribution dontla valeur d'asymétrie est positive présente une extrémité droite allongée. Unedistribution caractérisée par une importante asymétrie négative présente uneextrémité gauche plus allongée. Pour simplifier, une valeur d'asymétrie deux foissupérieure à l'erreur standard correspond à une absence de symétrie.

Ordre d’affichage. Par défaut, les variables s’affichent dans l’ordre dans lequel vous lesavez sélectionnées. En option, vous pouvez afficher les variables alphabétiquement,par moyennes croissantes ou par moyennes décroissantes.

Fonctionnalités supplémentaires de la commandeDESCRIPTIVES

Le langage de commande SPSS vous permet aussi de :

Enregistrer les coordonnées standardisées (écarts z) pour certaines variablesuniquement (à l’aide de la sous-commande VARIABLES).

Spécifier le nom des nouvelles variables contenant des coordonnées standardisées(à l’aide de la sous-commande VARIABLES).

Page 393: SPSS Base Users Guide 14.0

367

Descriptives

Exclure de l’analyse les observations ayant des valeurs manquantes pourn’importe quelle variable (à l’aide de la sous-commande MISSING).

Trier les variables affichées en utilisant la valeur d’une statistique, et pasuniquement la moyenne (à l’aide de la sous-commande SORT).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 394: SPSS Base Users Guide 14.0
Page 395: SPSS Base Users Guide 14.0

Chapitre

16Explorer

La procédure Explorer produit des résumés statistiques et des affichages graphiquespour toutes vos observations ou séparément pour des groupes d’observations. Ilexiste plusieurs raisons pour utiliser la procédure Explorer : le filtrage de données,l’identification des valeurs éloignées, la description, la vérification d’hypothèses et lacaractérisation des différences parmi les sous populations (groupes d’observations).Le filtrage de données peut vous indiquer les valeurs inhabituelles, les valeursextrêmes, les trous dans les données ou d’autres particularités. L’exploration desdonnées peut vous aider à déterminer si les techniques statistiques que vous envisagezd’utiliser pour l’analyse de vos données sont appropriées. L’exploration peutindiquer que vous avez besoin de transformer les données si la technique nécessiteune répartition gaussienne. Vous pouvez également choisir d’utiliser des tests nonparamétriques.

Exemple. Examiner la distribution des temps d’apprentissage pour les souris dans unlabyrinthe avec quatre programmes de renforcement. Pour chacun des quatre groupes,vous pouvez voir si la répartition des temps est approximativement gaussienne etsi les quatre variances sont égales. Vous pouvez aussi identifier les observationsavec les cinq plus grands et les cinq plus petits temps. Les boîtes à moustaches etles diagrammes tige et feuille résument graphiquement la répartition des tempsd’apprentissage pour chacun des groupes.

Diagrammes et statistiques. Moyenne, médiane, moyenne tronquée à 5 %,erreur standard, variance, écart-type, minimum, maximum, intervalle, intervalleinterquartile, asymétrie et aplatissement avec leurs erreurs standard, intervalle deconfiance pour la moyenne (et niveaux de confiance spécifiés), centiles, M-estimateurde Huber, Andrews, Hampel, Tukey, les cinq plus grandes et cinq plus petites valeurs,le Kolmogorov-Smirnov avec un seuil de signification Lilliefors pour tester lanormalité, et la statistique Shapiro-Wilk. Boîtes à moustaches, diagrammes tige etfeuille, histogrammes, diagrammes de répartition gaussienne, et dispersion/niveauxavec le test de Levene et les transformations.

369

Page 396: SPSS Base Users Guide 14.0

370

Chapitre 16

Données. La procédure d’Explorer peut être utilisée pour les variables quantitatives(Mesures de niveaux d’intervalle ou de rapport). Une variable active (utilisée pourrépartir les données en groupes d’observations) doit avoir un nombre raisonnable devaleurs distinctes (modalités). Ces valeurs peuvent être des chaînes de caractèrescourtes ou numériques. La variable d’étiquette par observation, utilisée pour étiqueterles valeurs extrêmes dans les boîtes à moustache, peut être de courtes chaînes decaractères, de longues chaînes de caractères (15 premiers caractères) ou numériques.

Hypothèses. La distribution de vos données ne doit pas obligatoirement êtresymétrique ou gaussienne.

Figure 16-1Résultats d’Explorer

2.760 4.850 6.900 9.010

.165 .422 .445 .289

2.387 3.895 5.893 8.357

3.133 5.805 7.907 9.663

2.761 4.889 6.911 8.994

2.850 4.900 7.050 9.000

.272 1.783 1.982 .834

.521 1.335 1.408 .913

2.0 2.3 4.5 7.8

3.5 6.7 9.1 10.5

1.5 4.4 4.6 2.7

.925 2.250 2.400 1.650

-.116 -.559 -.197 .219

.687 .687 .687 .687

-1.210 -.104 -.606 -1.350

1.334 1.334 1.334 1.334

Statistique

Erreur std.

Statistique

Statistique

Statistique

Statistique

Statistique

Statistique

Statistique

Statistique

Statistique

Statistique

Statistique

Erreur std.

Statistique

Erreur std.

Moyenne

Limite inférieure

Limite supérieure

Intervale de confiancepour la moyenne à 95,0 %

Moyenne tronquée à 5 %

Médiane

Variance

Ecart-type

Minimum

Maximum

Plage

Intervalle interquartile

Asymétrie

Kurtosis

1 2 3 4

Planning

Temps

Descriptifs

Page 397: SPSS Base Users Guide 14.0

371

Explorer

31 4 10.533 4 9.939 4 9.832 4 9.536 4 9.3

2 1 2.07 1 2.11 1 2.3

11 2 2.33 1 2.5

1234512345

Plus élevé

Plus bas

Temps

Nombre Chaîne Valeur

Valeurs extrêmes

d'observations

Time Stem-and-Leaf Plot

Diagramme Tige et feuille (dans le temps)

7.00 2 . 0133589 6.00 3 . 014577 3.00 4 . 568 5.00 5 . 05779 4.00 6 . 1379 3.00 7 . 268 6.00 8 . 012237 5.00 9 . 13589 1.00 10 . 5

Largeur de tigeChaque feuille 1 observation(s)

1.0

Pour explorer vos données

E A partir des menus, sélectionnez :Analyse

Statistiques descriptivesExplorer

Page 398: SPSS Base Users Guide 14.0

372

Chapitre 16

Figure 16-2Boîte de dialogue Explorer

E Sélectionnez au moins une variable dépendante.

Sinon, vous pouvez :

Sélectionner une ou plusieurs variables actives, dont les valeurs définiront lesgroupes d’observations.

Sélectionner une variable d’identification pour étiqueter les observations.

Cliquer sur Statistiques pour les M-estimateurs, les Valeurs éloignées, les Centileset les tableaux de fréquences.

Cliquez sur Diagrammes pour les histogrammes, les diagrammes de répartitiongaussiens avec tests et la dispersion/niveau avec test de Levene.

Cliquez sur Options pour le traitement des valeurs manquantes.

Page 399: SPSS Base Users Guide 14.0

373

Explorer

Statistiques d’ExplorerFigure 16-3Boîte de dialogue Statistiques Explorer

Descriptives. Ces mesures de tendance centrale et de dispersion s’affichent par défaut.Les mesures de tendance centrale indiquent la position de la répartition. On y trouvela moyenne, la médiane et la moyenne tronquée à 5 %. Les mesures de dispersionmontrent la dissimilarité des valeurs ; on y trouve l’erreur standard, la variance,l’écart-type, le minimum, le maximum, l’intervalle, et l’intervalle interquartile. Lesstatistiques descriptives comprennent aussi les mesures de la forme des répartitions.L’asymétrie et l’aplatissement s’affichent avec leurs erreurs standard. L’intervalle duniveau de confiance à 95 % pour la moyenne s’affiche aussi. Vous pouvez spécifierun niveau de confiance différent.

Moyennes pondérées. Estimations de la moyenne et de la médiane de l’échantillonpour estimer la localisation. Les estimateurs calculés diffèrent selon les pondérationsqu’ils appliquent aux observations. M-estimateur de Huber, Andrew, Hampel, etTukey apparaissent.

Valeurs éloignées. Affiche les cinq plus grandes et cinq plus petites valeurs, avec lesétiquettes d’observations.

Centiles. Affiche les valeurs pour le 5ième, 10ième, 25ième, 50ième, 75ième, 90ième,et 95ième centiles.

Page 400: SPSS Base Users Guide 14.0

374

Chapitre 16

Diagrammes d’ExplorerFigure 16-4Boîte de dialogue Explorer : Diagrammes

Boîtes à moustaches. Ces alternatives contrôlent l’affichage de boîtes à moustachesquand vous avez plus d’une variable dépendante. Niveaux de critère génère unaffichage séparé pour chaque variable dépendante. Dans un affichage, les boîtes àmoustache sont données pour chacun des groupes définis par une variable active.Dépendantes génère un affichage séparé pour chaque groupe défini par une variableactive. Dans un affichage, les boîtes à moustaches s’affichent côte à côte pour chaquevariable dépendante. Cet affichage est particulièrement utile lorsque les différentesvariables représentent une seule caractéristique mesurée à des moments différents.

Caractéristique. Le groupe caractéristiques vous permet de choisir les diagrammestige et feuille et les histogrammes.

Graphes de répartition gaussiens avec tests. Affiche les diagrammes de répartitiongaussiens et les résidus. La statistique de Kolmogorov-Smirnov avec un seuil designification Lilliefors pour le test de normalité s’affiche. Si des pondérations nonentières sont spécifiées, la statistique Shapiro-Wilk est calculée lorsque la tailled’échantillon pondérée est comprise entre 3 et 50. En cas de pondérations entièresou en l’absence de pondération, le calcul est effectué lorsque la taille d’échantillonpondérée est comprise entre 3 et 5 000.

Page 401: SPSS Base Users Guide 14.0

375

Explorer

Dispersion/niveau avec test de Levene. Contrôle les transformations de données pourles diagrammes de dispersion par niveau. Pour tous les diagrammes de dispersionpar niveau, la pente de la ligne de régression et les tests de Levene portant surl’homogénéité de la variance s’affichent. Si vous sélectionnez une transformation, lestests de Levene sont basés sur les données transformées. Si aucune variable activen’est sélectionnée, les diagrammes de dispersion par niveau ne sont pas produits.Estimation d’exposants produit un diagramme des logs naturels des intervallesinterquartile opposés au logs naturels des médianes pour toutes les cellules, enmême temps qu’une estimation de la transformation de l’exposant pour arriver à desvariances égales dans les cellules. Un diagramme de dispersion par niveau aide àdéterminer l’exposant pour qu’une transformation stabilise (rende plus égales) lesvariances entre groupes. Transformation Exposant vous permet de sélectionner unedes alternatives de l’exposant, en suivant éventuellement les recommandations del’estimation de l’exposant et de produire les diagrammes des données transformées.L’intervalle interquartile et la médiane des données transformées sont dessinés. Sans

transformation produit des diagrammes de données brutes. Ceci est équivalent à unetransformation avec une puissance de 1.

Transformations de l’exposant d’Explorer

Voici les transformations de l’exposant pour les diagrammes de dispersion parniveau. Pour transformer les données, vous devez sélectionner un exposant pour latransformation. Vous avez le choix entre les options suivantes :

Log népérien. Transformation par log naturel. Il s’agit de la valeur par défaut.

1/racine carrée. La réciproque de la racine carrée est calculée pour chaque valeurdes données.

Réciproque. La réciproque de chaque valeur des données est calculée.

Racine carrée. La racine carrée de chaque valeur des données est calculée.

Carré. Chaque valeur des données est élevée au carré.

Cube. Chaque valeur des données est élevée au cube.

Page 402: SPSS Base Users Guide 14.0

376

Chapitre 16

Options d’ExplorerFigure 16-5Boîte de dialogue Explorer : Options

Valeurs manquantes. Contrôle le traitement des valeurs manquantes.

Exclure toute observation incomplète. Les observations avec des valeursmanquantes pour l’une ou l’autre des variables dépendantes ou actives sontexclues de toutes les analyses. Il s’agit de la valeur par défaut.

Exclure seulement les composantes non valides. Les observations sans valeurmanquante pour une variable dans un groupe (cellule) sont inclues dans l’analysede ce groupe. L’observation peut avoir des valeurs manquantes pour les variablesutilisées dans d’autres groupes.

Signaler les valeurs manquantes. Les valeurs manquantes pour les variables activessont traitées comme une modalité séparée. Tout résultat est produit pour cettemodalité supplémentaire. Les tableaux de fréquences contiennent les modalitéspour les valeurs manquantes. Les valeurs manquantes pour une variable activesont inclues, mais étiquetées comme manquantes.

Fonctionnalités supplémentaires de la commande EXAMINELa procédure Explorer utilise la syntaxe de la commande EXAMINE. Le langage decommande SPSS vous permet aussi de :

demander le total des résultats et des diagrammes en complément des résultats etdiagrammes relatifs aux groupes définis par les variables actives (au moyen dela sous-commande TOTAL) ;

spécifier une échelle commune pour un groupe de boîtes à moustaches (au moyende la sous-commande SCALE) ;

préciser les interactions des variables actives (au moyen de la sous-commandeVARIABLES) ;

Page 403: SPSS Base Users Guide 14.0

377

Explorer

spécifier les centiles autres que ceux par défaut (au moyen de la sous-commandePERCENTILES) ;

calculer les centiles à l’aide de l’une des cinq méthodes possibles (au moyen dela sous-commande PERCENTILES) ;

spécifier toute transformation de l’exposant pour les diagrammes de dispersionpar niveau (au moyen de la sous-commande PLOT) ;

préciser le nombre de valeurs extrêmes à afficher (au moyen de la sous-commandeSTATISTICS) ;

indiquer les paramètres pour les M-estimateurs d’un emplacement (au moyen dela sous-commande MESTIMATORS).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 404: SPSS Base Users Guide 14.0
Page 405: SPSS Base Users Guide 14.0

Chapitre

17Tableaux croisés

La procédure de tableaux croisés établit des tableaux à deux entrées ou à entréesmultiples et permet 22 tests et mesures d’associations pour les tableaux à deuxentrées. La structure du tableau et l’ordre des modalités déterminent quels test oumesures effectuer.

Les statistiques et les mesures d’association de tableaux croisés ne sont calculéesque pour les tableaux à deux entrées. Si vous spécifiez une ligne, une colonne et unestrate de facteur (variable de contrôle), SPSS forme un tableau de statistiques et demesures pour chaque valeur de la strate de facteur (ou une combinaison de valeurspour deux variables de contrôle ou plus). Par exemple, si le sexe est un facteur destrate pour un tableau marié (oui, non) face à la vie (est excitante, routinière ouennuyeuse), les résultats d’un tableau à deux entrées pour les femmes sont calculésséparément de ceux des hommes et affichés sous forme de tableaux consécutifs.

Exemple. Les clients de PME ont-ils plus de probabilités d’être rentables en ventes deservices (par exemple, formation et conseil) que ceux de grandes sociétés ? A partird’une tabulation croisée, vous pourriez apprendre que la majorité des PME (moinsde 500 salariés) génèrent des bénéfices de services élevés, alors que la majorité desgrandes sociétés (plus de 2 500 salariés) rapportent des bénéfices de services bas.

Statistiques et mesures d’association. Chi-deux de Pearson, Chi-deux du rapport devraisemblance, test d’association linéaire par linéaire, test exact de Fisher, Chi-deuxcorrigé de Yates, r de Pearson, rho de Spearman, coefficient de contingence, phi,V de Cramer, lambdas symétriques et asymétriques, tau de Goodman et Kruskal,coefficient d’incertitude, gamma, d de Somer, tau-b de Kendall, tau-c de Kendall,coefficient êta, Kappa de Cohen, estimation de risque relatif, odds ratio, test deMcNemar, et statistiques de Cochran et Mantel-Haenszel.

379

Page 406: SPSS Base Users Guide 14.0

380

Chapitre 17

Données. Pour définir les modalités de chaque variable du tableau, utilisez desvariables numériques ou des variables sous forme de chaînes de caractères courtes(huit caractères ou moins). Par exemple, pour sexe, vous pouvez codifier les donnéesavec 1 et 2, ou avec homme et femme.

Hypothèses. Des statistiques et des mesures partent du principe de modalitésordonnées (données ordinales) ou de valeurs quantitatives (données d’intervalle oudonnées de type ratio), tel que décrit dans la section sur les statistiques. D’autres sontvalides lorsque les variables du tableau ont des modalités désordonnées (donnéesnominales). Pour les statistiques basées sur le test Chi-deux (phi, V de Cramer,coefficient de contingence), les données doivent provenir d’un échantillon aléatoireavec une répartition multinomiale.

Remarque : Les variables ordinales peuvent être des codes numériques représentantdes modalités (par exemple, 1 = faible, 2 = moyen, 3 = élevé) ou des valeurs de chaîne.Toutefois, l’ordre alphabétique des valeurs de chaîne est supposé refléter l’ordre réeldes modalités. Par exemple, pour une variable chaîne comportant des valeurs Faible,Moyen, Elevé, l’ordre des modalités est interprété comme Elevé, Faible ou Moyen,ce qui ne correspond pas à l’ordre correct. En règle générale, il est recommandéd’utiliser les codes numériques pour représenter les données ordinales.

Page 407: SPSS Base Users Guide 14.0

381

Tableaux croisés

Figure 17-1Résultats de tableau croisé

Rentabilité du service * Tabulation croisée de l'entreprise

Rentabilité du service

Taille de l'entreprise

BasElevé

Tests du Khi-deux

Valeurasymptotique Signification

(bilatérale)Chi-deux de PearsonRapport de vraissemblanceAssociation linéaire par linéaireN d'observations valides

Pour obtenir des tableaux croisés

E A partir des menus, sélectionnez :Analyse

Statistiques descriptivesTableaux croisés

Page 408: SPSS Base Users Guide 14.0

382

Chapitre 17

Figure 17-2Boîte de dialogue Tableaux croisés

E Sélectionnez des lignes de variables et des colonnes de variables.

Sinon, vous pouvez :

Sélectionner des variables de contrôle.

Cliquer sur Statistiques pour les tests et les mesures d’association pour lestableaux à deux entrées ou les sous-tableaux.

Cliquez sur Cellules pour les valeurs observées et théoriques, les pourcentageset les résidus.

Cliquez sur Format pour contrôler l’ordre des modalités.

Strates de tableaux croisés

Si vous sélectionnez des variables de strate, un tableau croisé séparé est produit pourchacune des modalités de variable de strate (variable de contrôle). Par exemple, sivous avez une variable de ligne, une variable de colonne, et une variable de strate avecdeux modalités, vous obtenez un tableau à deux entrées pour chacune des modalitésde la variable de strate. Pour créer une autre strate de variables de contrôle, cliquezsur Suivant. Les sous-tableaux sont produits pour chaque combinaison de modalités

Page 409: SPSS Base Users Guide 14.0

383

Tableaux croisés

pour chaque variable de premier niveau avec chaque variable de second niveau, etc.Si les statistiques et les mesures d’association sont requises, elles ne s’appliquentqu’aux sous-tableaux à deux entrées.

Diagrammes en bâtons juxtaposés de tableaux croisés

Affichage de diagrammes en bâtons juxtaposés. Un diagramme en bâtons juxtaposésvous permet de résumer vos données pour des groupes d’observations. Il y a unregroupement de bâtons pour chaque valeur de la variable que vous avez spécifiéedans Ligne(s). La variable qui définit les bâtons dans chaque regroupement estla variable que vous avez spécifiée dans Colonne(s). Il y a un ensemble de bâtonsde couleurs ou de motifs différents pour chaque valeur de cette variable. Si vousspécifiez plus d’une variable dans Colonnes ou Lignes, un diagramme en bâtonsjuxtaposés est produit pour chaque combinaison de deux variables.

Statistiques de tableaux croisésFigure 17-3Boîte de dialogue Tableaux croisé : Statistiques

Chi-deux. Pour les tableaux avec deux lignes et deux colonnes, sélectionnez Chi-deux

pour calculer le Chi-deux de Pearson, le Chi-deux du rapport de vraisemblance, le testexact de Fisher et le test du Chi-deux de Yates corrigé (correction de continuité). Pourles tableaux 2 × 2, le test exact de Fisher est calculé lorsqu’un tableau qui ne provient

Page 410: SPSS Base Users Guide 14.0

384

Chapitre 17

pas de lignes ou de colonnes manquantes dans un tableau plus grand présente unecellule avec une fréquence attendue inférieure à 5. Le Chi-deux corrigé de Yates estcalculé pour tous les autres tableaux 2 × 2. Pour les tableaux avec n’importe quelnombre de lignes ou de colonnes, sélectionnez Chi-deux pour calculer le Chi-deux dePearson et le rapport de vraisemblance du Chi-deux. Lorsque les deux variables dutableau sont quantitatives, le Chi-deux donne le test d’association linéaire par linéaire.

Corrélations. Pour les tableaux dans lesquels les lignes et les colonnes contiennent desvaleurs ordonnées, les corrélations donnent le coefficient de corrélation de Spearman,rho (données numériques seulement). Le Spearman rho est une mesure d’associationentre les ordres de rang. Lorsque les deux variables (facteurs) du tableau sontquantitatives, les corrélations donnent le coefficient de corrélation de Pearson, r, unemesure de l’association linéaire entre les variables.

Nominal. Pour les données nominales (sans ordre intrinsèque, comme Catholique,Protestant, Juif), vous pouvez sélectionner le coefficient Phi et V de Cramer, lecoefficient de contingence, Lambda (lambdas symétriques et asymétriques, et tau deGoodman et Kruskal) et le coefficient d’incertitude.

Coefficient de contingence. Mesure d'association basée sur le Chi-deux. Lesvaleurs sont toujours comprises entre 0 et 1, 0 indiquant l'absence d'associationentre les variables de ligne et de colonne, et les valeurs proches de 1 indiquant undegré d'association élevé entre les variables. La valeur maximale possible dépenddu nombre de lignes et de colonnes dans le tableau.

Phi et V de Cramer. Mesure d'association calculée à partir du Chi-deux. Elle estobtenue en divisant la statistique du Chi-deux par la taille de l'échantillon, puis enprenant la racine carrée du résultat. Le V de Cramer est également une mesured'association basée sur le Chi-deux.

Lambda. Mesure d'association reflétant la réduction proportionnelle de l'erreurlorsque les valeurs de la variable indépendante sont utilisées pour prévoir lavariable dépendante. La valeur 1 signifie que la variable indépendante prévoitparfaitement la variable dépendante. La valeur 0 signifie que la variableindépendante ne prévoit pas du tout la variable dépendante.

Coefficient d'incertitude. Mesure d'association qui indique la réductionproportionnelle de l'erreur lorsque les valeurs d'une variable sont utilisées pourprévoir celles d'une autre. Par exemple, la valeur 0,83 indique que la connaissanced'une variable réduit de 83 % l'erreur dans les prévisions de l'autre variable.

Page 411: SPSS Base Users Guide 14.0

385

Tableaux croisés

Le programme calcule à la fois des versions symétriques et asymétriques dece coefficient.

Ordinal. Pour les tableaux dont les lignes et les colonnes contiennent des valeursordonnées, sélectionnez Gamma (ordre zéro pour les tableaux à 2 entrées etconditionnel pour les tableaux de 3 à 10 entrées), le tau-b de Kendall et le tau-c de

Kendall. Pour prévoir les modalités de colonnes à partir des modalités de lignes,sélectionnez le d de Somers.

Gamma. Mesure d'association symétrique entre deux variables ordinales. Cettemesure est située entre -1 et 1. Les valeurs proches d'une valeur absolue de 1indiquent une relation forte entre les deux variables. Les valeurs proches de 0indiquent une relation faible ou inexistante. Pour les tableaux d'ordre 2, lesgammas d'ordre 0 (zéro) apparaissent. Pour les tableaux d'ordre 3 et les tableauxd'ordre n, les gammas conditionnels apparaissent.

D de Somers. Mesure d'intensité de la relation entre deux variables ordinales, quis'étend de -1 à 1. Les valeurs proches de 1 indiquent une forte relation entreles deux variables, et celles proches de zéro indiquent une relation faible ouinexistante entre les variables. Le d de Somer est une extension asymétrique dugamma, qui ne diffère de celui-ci que par l'inclusion du nombre de paires nonliées à la variable indépendante. Le programme calcule également une versionsymétrique de cette statistique.

Tau-b de Kendall. Mesure de corrélation non paramétrique pour variables ordinalesou classées qui prend en considération les ex aequo. Le signe du coefficientindique la direction de la relation et sa valeur absolue indique sa force, les valeursabsolues les plus grandes indiquant les relations les plus fortes. Les valeurspeuvent varier de -1 à +1 mais une valeur de -1 ou de +1 ne peut toutefois êtreobtenue que dans des tableaux carrés.

Tau-c de Kendall. Mesure d'association non paramétrique pour variables ordinalesqui ne prend pas en considération les ex aequo. Le signe du coefficient indique ladirection de la relation et sa valeur absolue indique sa force, les valeurs absoluesles plus grandes indiquant les relations les plus fortes. Les valeurs peuventvarier de -1 à +1 mais une valeur de -1 ou de +1 ne peut toutefois être obtenueque dans des tableaux carrés.

Page 412: SPSS Base Users Guide 14.0

386

Chapitre 17

Données nominales x intervalle. Lorsqu’une variable est qualitative et l’autrequantitative, sélectionnez Eta. La variable qualitative doit être codée numériquement.

Eta. Mesure d'association dont les valeurs sont comprises entre 0 et 1, 0 indiquantl'absence d'association entre les variables de ligne et de colonne, et les valeursproches de 1 indiquant un degré d'association élevé. Eta convient à une variabledépendante continue mesurée sur une échelle d'intervalle (par exemple, lerevenu) et une variable indépendante ayant un nombre limité de modalités (parexemple, le sexe). Deux valeurs eta sont calculées : L'une traite la variable deligne comme variable d'intervalle et l'autre traite la variable de colonne commevariable d'intervalle.

Kappa. Le Kappa de Cohen mesure la concordance entre deux indicateurs lorsque lesdeux servent à évaluer le même objet. La valeur 1 indique une concordance parfaite.La valeur 0 indique que la concordance ne dépasse pas celle due au hasard. Le Kappan'est disponible que pour les tableaux dans lesquels les deux variables utilisent lesmêmes valeurs de modalité et possèdent le même nombre de modalités.

Risque. Pour les tableaux 2 x 2, mesure de la force de l'association entre la présenced'un facteur et la réalisation d'un événement. Si l'intervalle de confiance de lastatistique inclut une valeur de 1, il n'existe aucune association entre le facteur etl'événement. L'odds ratio peut être utilisé comme estimation du risque relatif dans lecas où la réalisation du facteur est rare.

McNemar. Test non paramétrique pour deux variables dichotomiques liées. Ilrecherche les changements de réponse en utilisant la répartition Chi-deux. Ce testest utile pour détecter les changements avant-après dans les réponses dus à uneintervention expérimentale dans les plans. Pour les tableaux carrés plus volumineux,le test McNemar-Bowker de symétrie est reporté.

Statistiques de Cochran et de Mantel-Haenszel. Les statistiques de Cochran et deMantel-Haenszel peuvent être utilisées pour tester l'indépendance présente entreune variable de critère dichotomique et une variable de réponse dichotomique,conditionnelle à des modèles covariés définis par une ou plusieurs variables de strate(de contrôle). Remarque : alors que les autres statistiques sont calculées strate parstrate, les statistiques de Cochran et de Mantel-Haenszel sont calculées une seule foispour toutes les strates.

Page 413: SPSS Base Users Guide 14.0

387

Tableaux croisés

Affichage de cellules (cases) de tableaux croisésFigure 17-4Boîte de dialogue Tableaux croisés : Contenu des cases (cellules)

Pour vous aider à découvrir des types dans les données qui contribuent à un testdu Chi-deux significatif, la procédure de Tableaux croisés affiche les fréquencesattendues et trois types de résidus (déviations) qui mesurent la différence entre lesfréquences observées et les fréquences attendues. Chaque cellule du tableau peutcontenir toute combinaison d’effectifs, de pourcentages et de résidus sélectionnés.

Effectif. Nombre d’observations effectivement observées et nombre d’observationsattendues si les variables de ligne et de colonne sont indépendantes l’une de l’autre.

Pourcentages. Les pourcentages peuvent s’additionner par ligne ou par colonne.Les pourcentages du nombre total d’observations représentées dans le tableau (unestrate) sont également disponibles.

Résidus. Les résidus non standardisés donnent la différence entre les valeursobservées et les valeurs théoriques. Les résidus standardisés et standardisés ajustéssont également disponibles.

Non standardisés. Différence entre une valeur observée et la valeur théorique.La valeur théorique correspond au nombre d'observations attendues dans lacellule quand il n'existe pas de relation entre les deux variables. Un résidu positifindique que la cellule contient plus d'observations que si les variables de ligneet de colonne étaient indépendantes.

Page 414: SPSS Base Users Guide 14.0

388

Chapitre 17

Standardisés. Résidu divisé par une estimation de son écart-type. Egalementappelés résidus de Pearson, les résidus standardisés ont une moyenne de 0 etun écart-type de 1.

Standardisés ajustés. Résidu d'une cellule (valeur observée moins valeurthéorique) divisé par une estimation de son erreur standard. Le résidu standardiséqui en résulte est exprimé en écarts par rapport à la moyenne.

Pondérations non entières. En général, les effectifs de cellules sont des valeursentières, car ils représentent le nombre d’observations figurant dans chaque cellule.Toutefois, si le fichier de données est pondéré par une variable de pondération avecdes fractions (par exemple, 1,25), les effectifs de cellules peuvent également être desfractions. Vous pouvez tronquer ou arrondir les valeurs avant ou après le calcul deseffectifs de cellules, ou utiliser des effectifs de cellules non entiers pour l’affichagedes tableaux et les calculs statistiques.

Effectifs de cellules arrondis. Les pondérations d'observation sont utilisées tellesquelles, mais les pondérations cumulées dans les cellules sont arrondies avantle calcul de toute statistique.

Effectifs de cellules tronqués. Les pondérations d'observation sont utilisées tellesquelles, mais les pondérations cumulées dans les cellules sont tronquées avantle calcul de toute statistique.

Poids des observations arrondis. Les pondérations sont arrondies avant utilisation.

Poids des observations tronqués. Les pondérations sont tronquées avant utilisation.

Aucun ajustement. Les pondérations d'observation sont utilisées telles quelles ;des effectifs de cellules non entiers sont également utilisés. Toutefois, lorsquedes statistiques exactes (disponibles uniquement avec l'option Tests exacts)sont demandées, les pondérations cumulées dans les cellules sont tronquées ouarrondies avant le calcul des statistiques du test exact.

Page 415: SPSS Base Users Guide 14.0

389

Tableaux croisés

Format de tableau croiséFigure 17-5Boîte de dialogue Tableaux croisés : Format

Vous pouvez arranger les lignes par ordre croissant ou décroissant de valeur de lavariable de ligne.

Page 416: SPSS Base Users Guide 14.0
Page 417: SPSS Base Users Guide 14.0

Chapitre

18Récapituler

La procédure Récapituler calcule les statistiques de sous-groupes pour les variables àl’intérieur des modalités de variables de regroupement. Tous les niveaux de variablesde regroupement sont à tabulation croisée. Vous pouvez choisir l’ordre dans lequel lesstatistiques sont affichées. Les statistiques Récapituler sont affichées pour chaquevariable à travers toutes les modalités. Les valeurs des données dans chaque modalitépeuvent être listées ou supprimées. Avec d’importants groupes de données, vouspouvez choisir de lister seulement les premières observations n.

Exemple : Quel est le montant moyen de ventes de produits par région et parsecteur de clientèle ? Vous pouvez découvrir que le montant moyen des ventes estlégèrement plus élevé dans la région Ouest que dans les autres régions, avec dessociétés commerciales dans la région Ouest apportant le montant moyen de ventesle plus élevé.

Statistiques : Somme, nombre d’observations, moyenne, médiane, médiane groupée,erreur standard pour la moyenne, minimum, maximum, plage, valeur de la variablepour la première modalité de la variable de regroupement, valeur de la variable pour ladernière modalité de la variable de regroupement, écart-type, variance, aplatissement,erreur standard d’aplatissement, asymétrie, erreur standard d’asymétrie, pourcentagede la somme totale, pourcentage de N total, pourcentage de la somme dans,pourcentage de N dans, moyennes géométrique et harmonique.

Données : Les variables de regroupement sont des variables qualitatives dont lesvaleurs peuvent être numériques ou alphanumériques. Le nombre de modalités doitêtre raisonnablement limité. Les autres variables doivent pouvoir être classées.

Hypothèses : Certains des sous-groupes statistiques optionnels, tels que la moyenneet l’écart-type sont basés sur la théorie normale et conviennent aux variablesquantitatives ayant une distribution symétrique. Les statistiques robustes telles quela médiane et l’intervalle, conviennent aux variables quantitatives qui confirmentou infirment l’hypothèse de normalité.

391

Page 418: SPSS Base Users Guide 14.0

392

Chapitre 18

Figure 18-1Récapituler Résultat

Résumés d'observations Moyenne des ventes de produit par région et industrie

Industrie

Région Gouvernement Finance Education Santé TotalEst

Centre

Ouest

Obtenir des récapitulatifs des observations

E A partir des menus, sélectionnez :Analyse

RapportsRécapitulatif des observations

Page 419: SPSS Base Users Guide 14.0

393

Récapituler

Figure 18-2Boîte de dialogue Rapport récapitulatif

E Sélectionnez une ou plusieurs variables.

Sinon, vous pouvez :

Sélectionner au moins une variable de regroupement afin de diviser vos donnéesen sous-groupes.

Cliquer sur Options afin de modifier le titre du résultat, ajouter une légendeau-dessous du résultat, ou exclure les observations ayant des valeurs manquantes.

Cliquer sur Statistiques pour obtenir des statistiques facultatives.

Sélectionner Afficher les observations afin de répertorier les observations danschaque sous-groupe. Par défaut, le système ne liste que les 100 premièresobservations de votre fichier. Vous pouvez augmenter ou diminuer la valeur del’option Limiter les observations aux n premières ou désélectionner cet élémentpour répertorier toutes les observations.

Page 420: SPSS Base Users Guide 14.0

394

Chapitre 18

Options de RécapitulerFigure 18-3Boîte de Dialogue Options de Rapport récapitulatif

SPSS vous permet de modifier le titre de votre résultat ou d’ajouter une légende quiapparaîtra en dessous du tableau de sortie. Vous pouvez contrôler les sauts de lignedans les titres et légendes en tapant \n à tous les endroits où vous voulez insérerun saut de ligne dans le texte.

Vous pouvez également choisir d’afficher ou de supprimer les sous-en-têtes destotaux et d’inclure ou d’exclure les observations ayant des valeurs manquantes pourtoute variable prise en compte dans toute analyse. Il est souvent souhaitable demarquer les observations manquantes dans le résultat par un point ou un astérisque.Saisir un caractère, une phrase, ou un code que vous souhaitez voir apparaîtrelorsqu’une valeur manque, sinon, aucun traitement spécial ne s’applique auxobservations manquantes dans le résultat.

Page 421: SPSS Base Users Guide 14.0

395

Récapituler

Récapituler les statistiquesFigure 18-4Boîte de Dialogue Rapport récapitulatif

Vous pouvez choisir l’une des statistiques de sous-groupe suivantes pour les variablesà l’intérieur de chaque modalité de chacune des variables de regroupement : Somme,nombre d’observations, moyenne, médiane, médiane groupée, erreur standard pourla moyenne, minimum, maximum, intervalle, valeur de la variable pour la premièremodalité de la variable de regroupement, valeur de la variable pour la dernièremodalité de la variable de regroupement, écart-type, variance, aplatissement, erreurstandard d’aplatissement, asymétrie, erreur standard d’asymétrie, pourcentage desomme totale, pourcentage de N total, pourcentage de la somme dans, pourcentagede N dans, moyenne géométrique, moyenne harmonique. L’ordre dans lequel lesstatistiques apparaissent dans la liste Variables correspond à celui dans lequel ellesseront affichées dans le résultat. Les statistiques récapitulatives sont aussi affichéespour chaque variable à travers toutes les modalités.

Première. Affiche la première valeur rencontrée dans le fichier de données.

Moyenne géométrique. Racine nième du produit des valeurs de données, n représentantle nombre d'observations.

Page 422: SPSS Base Users Guide 14.0

396

Chapitre 18

Médiane de groupes. Médiane calculée pour les données codées en groupes. Parexemple, pour les données d'âge, si chaque valeur de la trentaine est codée 35, chaquevaleur de la quarantaine est codée 45, etc., la médiane de groupes est la médianecalculée à partir des données codées.

Moyenne harmonique. Fonction utilisée pour estimer la taille moyenne d'un groupelorsque la taille des échantillons diffère d'un groupe à l'autre. La moyenne harmoniquecorrespond au nombre total d'échantillons divisé par la somme des réciproques destailles de l'échantillon.

Kurtosis. Mesure de l'étendue du regroupement des observations autour d'unpoint central. Dans le cas d'une distribution normale, la valeur de la statistiqued'aplatissement est égale à zéro. Un aplatissement positif indique que les observationssont plus regroupées et présentent des extrémités plus longues que dans le cas d'unedistribution normale. Un aplatissement négatif signifie que les observations sontmoins regroupées et présentent des extrémités plus courtes.

Dernière. Affiche la dernière valeur rencontrée dans le fichier de données.

Maximum. Plus grande valeur d'une variable numérique.

Moyenne. Mesure de la tendance centrale. Moyenne arithmétique ; somme diviséepar le nombre d'observations.

Médiane. Valeur au-dessus ou au-dessous de laquelle se trouve la moitié desobservations ; 50e centile. Si le nombre d'observations est pair, la médiane correspondà la moyenne des deux observations du milieu lorsqu'elles sont triées dans l'ordrecroissant ou décroissant. La médiane est une mesure de tendance centrale et elle n'estpas, à l'inverse de la moyenne, sensible aux valeurs éloignées.

Minimum. Valeur la plus petite d'une variable numérique.

N. Nombre d'observations (ou d'enregistrements).

Pourcentage de N total. Pourcentage du nombre total d'observations dans chaquemodalité.

Pourcentage de la somme totale. Pourcentage de la somme totale dans chaquemodalité.

Etendue. Différence entre la valeur maximale et la valeur minimale d'une variablenumérique (maximum–minimum).

Page 423: SPSS Base Users Guide 14.0

397

Récapituler

Skewness. Mesure de l'asymétrie d'une distribution. La distribution normale estsymétrique et possède une valeur d'asymétrie égale à 0. Une distribution dontla valeur d'asymétrie est positive présente une extrémité droite allongée. Unedistribution caractérisée par une importante asymétrie négative présente une extrémitégauche plus allongée. Pour simplifier, une valeur d'asymétrie deux fois supérieure àl'erreur standard correspond à une absence de symétrie.

Erreur standard du Kurtosis. Rapport de l'aplatissement avec son erreur standardpouvant être utilisé comme test de normalité (autrement dit, vous pouvez conclureà une anormalité si ce rapport est inférieur à -2 ou supérieur à +2). Une valeurd'aplatissement positive importante indique que les extrémités de la distribution sontplus allongées que celles d'une distribution normale ; une valeur d'aplatissementnégative présente des extrémités plus courtes (semblables à celles d'une distributionuniforme sous forme de boîtes).

Erreur standard du Skewness. Rapport de l'asymétrie avec son erreur standard pouvantêtre utilisé comme test de normalité (autrement dit, vous pouvez conclure à uneanormalité si ce rapport est inférieur à -2 ou supérieur à +2). Une valeur d'asymétriepositive importante indique une extrémité allongée vers la droite ; une valeur négativeextrême produit une extrémité allongée vers la gauche.

Somme. Somme ou total des valeurs, pour toutes les observations n'ayant pas devaleur manquante.

Variance. Mesure de la dispersion des valeurs autour de la moyenne, égale à la sommedes carrés des écarts par rapport à la moyenne, divisée par le nombre d'observationsmoins un. La variance se mesure en unités, qui sont égales au carré des unités de lavariable.

Page 424: SPSS Base Users Guide 14.0
Page 425: SPSS Base Users Guide 14.0

Chapitre

19Moyennes

La procédure des moyennes calcule les moyennes de sous-groupes et les statistiquesunivariées correspondantes pour des variables dépendantes au sein des modalitésd’une ou de plusieurs variables indépendantes. Vous pouvez également obtenir uneanalyse à un facteur de la variance, un coefficient êta et des tests de linéarité.

Exemple : Mesurez la quantité moyenne de lipides absorbée par trois différents typesd’huile alimentaire et effectuez une analyse à un facteur de la variance pour voir siles moyennes divergent.

Statistiques : Somme, nombre d’observations, moyenne, médiane, médianegroupée, erreur standard pour la moyenne, minimum, maximum, plage, valeur dela variable pour la première modalité de la variable de regroupement, valeur dela variable pour la dernière modalité de la variable de regroupement, écart-type,variance, aplatissement, erreur standard d’aplatissement, asymétrie, erreur standardd’asymétrie, pourcentage de la somme totale, pourcentage de N total, pourcentagede la somme dans, pourcentage de N dans, moyennes géométrique et harmonique.Les options comportent une analyse de la variance, un coefficient êta, un coefficientêta-carré, ainsi que des tests de linéarité R et R2.

Données : Les variables dépendantes sont quantitatives et les variables indépendantessont qualitatives. Les valeurs des variables qualitatives peuvent être soit numériques,soit des chaînes courtes.

Hypothèses : Certains des sous-groupes statistiques optionnels, tels que la moyenneet l’écart-type sont basés sur la théorie normale et conviennent aux variablesquantitatives ayant une distribution symétrique. Les statistiques robustes, telles que lamédiane, conviennent aux variables continues qui confirment ou infirment l’hypothèsede normalité. L’analyse de la variance résiste aux écarts par rapport à la normalité,à condition que les données de chaque cellule soient symétriques. L’analyse de lavariance part également du principe que les groupes sont issus de populations ayant la

399

Page 426: SPSS Base Users Guide 14.0

400

Chapitre 19

même variance. Pour vérifier cette hypothèse, utilisez le test d’homogénéité de lavariance de Levene, disponible dans la procédure ANOVA à un facteur.

Figure 19-1Résultat des moyennes

Grammes de graisse absorbée

72.00

6

13.34

85.00

6

7.77

62.00

6

8.22

73.00

18

13.56

Moyenne

N

Ecart-type

Huile d'arachide

Saindoux

Huile de maïs

Total

Typed'huile

Rapport

Moyenne

N

Ecart-type

Moyenne

N

Ecart-type

Moyenne

N

Ecart-type

1596.000 2 798.000 7.824 .005

1530.000 15 102.000

3126.000 17

CombinéEntre groupesDans les

Total

Grammes de graisse absorbée * Type d'huile

Somme des carrés df

Carré moyen F Sig.

Tableau ANOVA

groupes

Pour obtenir des moyennes de sous-groupes

E A partir des menus, sélectionnez :Analyse

Comparer les moyennesMoyennes

Page 427: SPSS Base Users Guide 14.0

401

Moyennes

Figure 19-2Boîte de dialogue Moyennes

E Sélectionnez au moins une variable dépendante.

E Utilisez l’une des méthodes suivantes pour sélectionner des variables indépendantesqualitatives :

Sélectionnez une ou plusieurs variables indépendantes. Des résultats distinctssont présentés pour chaque variable indépendante.

Sélectionnez une ou plusieurs strates des variables indépendantes. Chaque stratedivise une nouvelle fois l’échantillon. Si vous avez une variable indépendantedans la strate 1 et une dans la strate 2, les résultats sont présentés dans un tableaucroisé, par opposition aux tableaux séparés pour chaque variable indépendante.

E Cliquez sur Options pour obtenir des statistiques facultatives, telles que la tabled’analyse de la variance, eta, eta-carré, R et R2.

Page 428: SPSS Base Users Guide 14.0

402

Chapitre 19

Moyennes : OptionsFigure 19-3Boîte de dialogue Moyennes : Options

Vous pouvez choisir l’une des statistiques de sous-groupe suivantes pour les variablesà l’intérieur de chaque modalité de chacune des variables de regroupement : Somme,nombre d’observations, moyenne, médiane, médiane groupée, erreur standard pourla moyenne, minimum, maximum, intervalle, valeur de la variable pour la premièremodalité de la variable de regroupement, valeur de la variable pour la dernièremodalité de la variable de regroupement, écart-type, variance, aplatissement, erreurstandard d’aplatissement, asymétrie, erreur standard d’asymétrie, pourcentage desomme totale, pourcentage de N total, pourcentage de la somme dans, pourcentage deN dans, moyenne géométrique, moyenne harmonique. Vous pouvez changer l’ordrede présentation des statistiques des sous-groupes. L’ordre dans lequel les statistiquesapparaissent dans la liste Cellule Statistiques correspond à celui dans lequel ellesseront affichées dans le résultat. Les statistiques récapitulatives sont aussi affichéespour chaque variable à travers toutes les modalités.

Première. Affiche la première valeur rencontrée dans le fichier de données.

Page 429: SPSS Base Users Guide 14.0

403

Moyennes

Moyenne géométrique. Racine nième du produit des valeurs de données, n représentantle nombre d'observations.

Médiane de groupes. Médiane calculée pour les données codées en groupes. Parexemple, pour les données d'âge, si chaque valeur de la trentaine est codée 35, chaquevaleur de la quarantaine est codée 45, etc., la médiane de groupes est la médianecalculée à partir des données codées.

Moyenne harmonique. Fonction utilisée pour estimer la taille moyenne d'un groupelorsque la taille des échantillons diffère d'un groupe à l'autre. La moyenne harmoniquecorrespond au nombre total d'échantillons divisé par la somme des réciproques destailles de l'échantillon.

Kurtosis. Mesure de l'étendue du regroupement des observations autour d'unpoint central. Dans le cas d'une distribution normale, la valeur de la statistiqued'aplatissement est égale à zéro. Un aplatissement positif indique que les observationssont plus regroupées et présentent des extrémités plus longues que dans le cas d'unedistribution normale. Un aplatissement négatif signifie que les observations sontmoins regroupées et présentent des extrémités plus courtes.

Dernière. Affiche la dernière valeur rencontrée dans le fichier de données.

Maximum. Plus grande valeur d'une variable numérique.

Moyenne. Mesure de la tendance centrale. Moyenne arithmétique ; somme diviséepar le nombre d'observations.

Médiane. Valeur au-dessus ou au-dessous de laquelle se trouve la moitié desobservations ; 50e centile. Si le nombre d'observations est pair, la médiane correspondà la moyenne des deux observations du milieu lorsqu'elles sont triées dans l'ordrecroissant ou décroissant. La médiane est une mesure de tendance centrale et elle n'estpas, à l'inverse de la moyenne, sensible aux valeurs éloignées.

Minimum. Valeur la plus petite d'une variable numérique.

N. Nombre d'observations (ou d'enregistrements).

Pourcentage de N total. Pourcentage du nombre total d'observations dans chaquemodalité.

Pourcentage de somme totale. Pourcentage de la somme totale dans chaque modalité.

Etendue. Différence entre la valeur maximale et la valeur minimale d'une variablenumérique (maximum–minimum).

Page 430: SPSS Base Users Guide 14.0

404

Chapitre 19

Skewness. Mesure de l'asymétrie d'une distribution. La distribution normale estsymétrique et possède une valeur d'asymétrie égale à 0. Une distribution dontla valeur d'asymétrie est positive présente une extrémité droite allongée. Unedistribution caractérisée par une importante asymétrie négative présente une extrémitégauche plus allongée. Pour simplifier, une valeur d'asymétrie deux fois supérieure àl'erreur standard correspond à une absence de symétrie.

Erreur standard du Kurtosis. Rapport de l'aplatissement avec son erreur standardpouvant être utilisé comme test de normalité (autrement dit, vous pouvez conclureà une anormalité si ce rapport est inférieur à -2 ou supérieur à +2). Une valeurd'aplatissement positive importante indique que les extrémités de la distribution sontplus allongées que celles d'une distribution normale ; une valeur d'aplatissementnégative présente des extrémités plus courtes (semblables à celles d'une distributionuniforme sous forme de boîtes).

Erreur standard du Skewness. Rapport de l'asymétrie avec son erreur standard pouvantêtre utilisé comme test de normalité (autrement dit, vous pouvez conclure à uneanormalité si ce rapport est inférieur à -2 ou supérieur à +2). Une valeur d'asymétriepositive importante indique une extrémité allongée vers la droite ; une valeur négativeextrême produit une extrémité allongée vers la gauche.

Somme. Somme ou total des valeurs, pour toutes les observations n'ayant pas devaleur manquante.

Variance. Mesure de la dispersion des valeurs autour de la moyenne, égale à la sommedes carrés des écarts par rapport à la moyenne, divisée par le nombre d'observationsmoins un. La variance se mesure en unités, qui sont égales au carré des unités de lavariable.

Statistiques pour première strate

Tableau Anova et eta. Affiche un tableau d'analyse unifactorielle de la variance etcalcule êta et êta carré (mesures de l'association) pour chaque variable indépendantede la première strate.

Test de linéarité. Calcule la somme des carrés, les degrés de liberté et le carré moyenassociés aux composants linéaires et non linéaires, ainsi que le rapport F, le R et leR-deux. La linéarité n'est pas calculée si la variable indépendante est une chaînecourte.

Page 431: SPSS Base Users Guide 14.0

Chapitre

20Cubes OLAP

La procédure de Cubes OLAP (Online Analytical Processing) calcule les totaux, lesmoyennes et autres statistiques univariées pour des variables récapitulatives continuesà l’intérieur de modalités d’une ou plusieurs variables de regroupement qualitatives.Une strate séparée dans le tableau est créée pour chaque modalité de chaque variablede regroupement.

Exemple. Ventes totales et moyennes pour différentes régions et lignes de produitsà l’intérieur de chaque région.

Statistiques. Somme, nombre d’observations, moyenne, médiane, médiane groupée,erreur standard pour la moyenne, minimum, maximum, intervalle, valeur de lavariable pour la première modalité de la variable de regroupement, valeur de lavariable pour la dernière modalité de la variable de regroupement, écart-type,variance, aplatissement, erreur standard d’aplatissement, asymétrie, erreur standardd’asymétrie, pourcentage des observations totales, pourcentage de somme totale,pourcentage des observations totales dans les variables de regroupement, pourcentagede la somme totale dans les variables de regroupement, moyenne géométrique etmoyenne harmonique.

Données. Les variables récapitulatives sont quantitatives (variables continuesmesurées sur une échelle d’intervalle ou de rapport) et les variables de regroupementsont qualitatives. Les valeurs des variables qualitatives peuvent être soit numériques,soit des chaînes courtes.

Hypothèses. Certains des sous-groupes statistiques optionnels, tels que la moyenneet l’écart-type sont basés sur la théorie normale et conviennent aux variablesquantitatives ayant une distribution symétrique. Les statistiques robustes telles quela médiane et l’intervalle, conviennent aux variables quantitatives qui confirmentou infirment l’hypothèse de normalité.

405

Page 432: SPSS Base Users Guide 14.0

406

Chapitre 20

Figure 20-1Résultat des cubes OLAP

Division : totalRégion : total

$145,038,250$371,893$307,500$171,311

SommeMoyenneMédianeEcart-type

Ventes pour 1996 par division et région

Division : produits de consommationRégion : est

$18,548,100$289,814.06$273,600.00$80,674.66

SommeMoyenneMédianeEcart-type

Ventes pour 1996 par division et région

Pour obtenir des cubes OLAP

E A partir des menus, sélectionnez :Analyse

RapportsCubes OLAP

Page 433: SPSS Base Users Guide 14.0

407

Cubes OLAP

Figure 20-2Boîte de dialogue Cubes OLAP

E Sélectionnez une ou plusieurs variables récapitulatives continues.

E Sélectionnez une ou plusieurs variables qualitatives.

E Eventuellement :

Sélectionner d’autres statistiques récapitulatives (cliquez sur Statistiques...).Vous devez sélectionner un ou plusieurs critères de regroupement pour pouvoirsélectionner les statistiques récapitulatives.

Calculer les différences entre des paires de variables et des paires de groupesdéfinies par un critère de regroupement (cliquez sur Différences).

Créer des titres de tableaux personnalisés (cliquez sur Titre).

Page 434: SPSS Base Users Guide 14.0

408

Chapitre 20

Cubes OLAP : StatistiquesFigure 20-3Boîte de dialogue Cubes OLAP : Statistiques

Vous pouvez choisir l’une des statistiques de sous-groupe suivantes pour lesvariables récapitulatives à l’intérieur de chaque modalité de chacune des variables deregroupement : Somme, Nombre d’observations, Moyenne, Médiane, Médiane degroupes, Erreur std de la moyenne, Minimum, Maximum, Intervalle, Premier (valeurde la variable pour la première modalité de la variable de regroupement), Dernier(valeur de la variable pour la dernière modalité de la variable de regroupement), Ecarttype, Variance, Aplatissement, Erreur standard de l’aplatissement, Asymétrie, Erreurstd d’asymétrie, Pourcentage de N (observations) totales, Pourcentage de somme tot.,Pourcentage des observations totales dans les variables de regroupement, Pourcentagede la somme totale dans les variables de regroupement, Moyenne géométrique etMoyenne harmonique.

Vous pouvez changer l’ordre de présentation des statistiques des sous-groupes.L’ordre dans lequel les statistiques apparaissent dans la liste Cellule Statistiquescorrespond à celui dans lequel elles seront affichées dans le résultat. Les statistiquesrécapitulatives sont aussi affichées pour chaque variable à travers toutes les modalités.

Première. Affiche la première valeur rencontrée dans le fichier de données.

Moyenne géométrique. Racine nième du produit des valeurs de données, n représentantle nombre d'observations.

Page 435: SPSS Base Users Guide 14.0

409

Cubes OLAP

Médiane de groupes. Médiane calculée pour les données codées en groupes. Parexemple, pour les données d'âge, si chaque valeur de la trentaine est codée 35, chaquevaleur de la quarantaine est codée 45, etc., la médiane de groupes est la médianecalculée à partir des données codées.

Moyenne harmonique. Fonction utilisée pour estimer la taille moyenne d'un groupelorsque la taille des échantillons diffère d'un groupe à l'autre. La moyenne harmoniquecorrespond au nombre total d'échantillons divisé par la somme des réciproques destailles de l'échantillon.

Kurtosis. Mesure de l'étendue du regroupement des observations autour d'unpoint central. Dans le cas d'une distribution normale, la valeur de la statistiqued'aplatissement est égale à zéro. Un aplatissement positif indique que les observationssont plus regroupées et présentent des extrémités plus longues que dans le cas d'unedistribution normale. Un aplatissement négatif signifie que les observations sontmoins regroupées et présentent des extrémités plus courtes.

Dernière. Affiche la dernière valeur rencontrée dans le fichier de données.

Maximum. Plus grande valeur d'une variable numérique.

Moyenne. Mesure de la tendance centrale. Moyenne arithmétique ; somme diviséepar le nombre d'observations.

Médiane. Valeur au-dessus ou au-dessous de laquelle se trouve la moitié desobservations ; 50e centile. Si le nombre d'observations est pair, la médiane correspondà la moyenne des deux observations du milieu lorsqu'elles sont triées dans l'ordrecroissant ou décroissant. La médiane est une mesure de tendance centrale et elle n'estpas, à l'inverse de la moyenne, sensible aux valeurs éloignées.

Minimum. Valeur la plus petite d'une variable numérique.

N. Nombre d'observations (ou d'enregistrements).

Pourcentage de N dans. Pourcentage du nombre d'observations pour le critère deregroupement spécifié dans les modalités des autres critères de regroupement. Si vousn'avez qu'un seul critère de regroupement, cette valeur est identique au pourcentagedu nombre total d'observations.

Pourcentage de la somme dans. Pourcentage de la somme pour le critère deregroupement spécifié dans les modalités des autres critères de regroupement. Si vousn'avez qu'un seul critère de regroupement, cette valeur est identique au pourcentagede la somme totale.

Page 436: SPSS Base Users Guide 14.0

410

Chapitre 20

Pourcentage de N total. Pourcentage du nombre total d'observations dans chaquemodalité.

Pourcentage de la somme totale. Pourcentage de la somme totale dans chaquemodalité.

Etendue. Différence entre la valeur maximale et la valeur minimale d'une variablenumérique (maximum–minimum).

Skewness. Mesure de l'asymétrie d'une distribution. La distribution normale estsymétrique et possède une valeur d'asymétrie égale à 0. Une distribution dontla valeur d'asymétrie est positive présente une extrémité droite allongée. Unedistribution caractérisée par une importante asymétrie négative présente une extrémitégauche plus allongée. Pour simplifier, une valeur d'asymétrie deux fois supérieure àl'erreur standard correspond à une absence de symétrie.

Erreur standard du Kurtosis. Rapport de l'aplatissement avec son erreur standardpouvant être utilisé comme test de normalité (autrement dit, vous pouvez conclureà une anormalité si ce rapport est inférieur à -2 ou supérieur à +2). Une valeurd'aplatissement positive importante indique que les extrémités de la distribution sontplus allongées que celles d'une distribution normale ; une valeur d'aplatissementnégative présente des extrémités plus courtes (semblables à celles d'une distributionuniforme sous forme de boîtes).

Erreur standard du Skewness. Rapport de l'asymétrie avec son erreur standard pouvantêtre utilisé comme test de normalité (autrement dit, vous pouvez conclure à uneanormalité si ce rapport est inférieur à -2 ou supérieur à +2). Une valeur d'asymétriepositive importante indique une extrémité allongée vers la droite ; une valeur négativeextrême produit une extrémité allongée vers la gauche.

Somme. Somme ou total des valeurs, pour toutes les observations n'ayant pas devaleur manquante.

Variance. Mesure de la dispersion des valeurs autour de la moyenne, égale à la sommedes carrés des écarts par rapport à la moyenne, divisée par le nombre d'observationsmoins un. La variance se mesure en unités, qui sont égales au carré des unités de lavariable.

Page 437: SPSS Base Users Guide 14.0

411

Cubes OLAP

Cubes OLAP : DifférencesFigure 20-4Boîte de dialogue Cubes OLAP : Différences

Cette boîte de dialogue vous permet de calculer les différences arithmétiques et depourcentage qui existent entre des variables récapitulatives ou entre des groupesdéfinis par un critère de regroupement. Les différences sont calculées pour toutes lesmesures sélectionnées dans la boîte de dialogue Cubes OLAP : Statistiques.

Différences entre les variables. Calcule les différences existant entre des paires devariables. Les valeurs des statistiques récapitulatives de la seconde variable (variablemoins) de chaque paire sont soustraites des valeurs des statistiques récapitulatives dela première variable de la paire. Pour les différences de pourcentage, la valeur de lacaractéristique de la variable moins est utilisée en tant que dénominateur. Vous devezsélectionner plusieurs variables récapitulatives dans la boîte de dialogue principaleavant d’indiquer les différences entre les variables.

Différences entre les groupes. Calcule les différences existant entre les paires degroupes définies par une variable de regroupement. Les valeurs des statistiquesrécapitulatives de la seconde modalité (modalité moins) dans chaque paire sont

Page 438: SPSS Base Users Guide 14.0

412

Chapitre 20

soustraites des valeurs des statistiques récapitulatives de la première modalité de lapaire. Les différences de pourcentage utilisent la valeur de la statistique récapitulativepour la modalité moins en tant que dénominateur. Vous devez sélectionner au moinsune variable de regroupement dans la boîte de dialogue principale avant d’indiquerles différences entre groupes.

Cubes OLAP : TitreFigure 20-5Boîte de dialogue Cubes OLAP : Titre

SPSS vous permet de modifier le titre de votre sortie ou d’ajouter une légende quiapparaîtra au dessous du tableau de sortie. Vous pouvez également contrôler larépartition des titres et légendes sur plusieurs lignes en tapant \n partout où voussouhaitez insérer un saut de ligne dans le texte.

Page 439: SPSS Base Users Guide 14.0

Chapitre

21Tests T

Il existe trois types de test t :

Test T pour échantillons indépendants (test t pour deux échantillons). Permet decomparer la moyenne d’une variable de deux groupes d’observations. Les statistiquesdescriptives pour chaque groupe et le test de Levene permettant d’obtenir l’égalité desvariances sont disponibles ainsi que les valeurs t de variance égale et inégale, et qu’unintervalle de confiance de 95 % pour la différence des moyennes.

Test T pour échantillons appariés (test t dépendant). Permet de comparer la moyennede deux variables pour un seul groupe. Ce test sert aussi pour les plans d’étudesappariées ou de contrôle d’observation. Les résultat incluent les statistiquesdescriptives pour les variables de test, leurs corrélations, les statistiques descriptivespour les différences appariées, le test t et un intervalle de confiance de 95 %.

Test T pour échantillon unique. Permet de comparer la moyenne d’une variable avecune valeur connue ou supposée. Les statistiques descriptives des variables tests sontaffichées avec le test t. Un intervalle de confiance de 95 % pour la différence entre lamoyenne de la variable test et la valeur test supposée fait partie du résultat par défaut.

Test T pour échantillons indépendants

La procédure du Test T pour échantillons indépendants permet de comparer lamoyenne de deux groupes d’observations. Idéalement, pour ce test, les sujetsdoivent être attribués de manière aléatoire à deux groupes, de manière à ce que toutedifférence dans la réponse soit due au traitement (ou à un manque de traitement) etnon pas à d’autres facteurs. Ceci n’est pas le cas si l’on compare un revenu moyenpour les hommes et les femmes. Une personne n’est pas aléatoirement désignéecomme devant être un homme ou une femme. Dans de telles situations, il fauts’assurer que les différences dans les autres facteurs ne cachent pas ou n’augmentent

413

Page 440: SPSS Base Users Guide 14.0

414

Chapitre 21

de différence significative dans les moyennes. Les différences de revenu moyenpeuvent être influencées par des facteurs tels que l’éducation et non par le sexe seul.

Exemple. Les patients souffrant d’hypertension se voient assignés de façon aléatoireà un groupe placebo et à un groupe auquel on donne un traitement. Les sujets dugroupe placebo reçoivent une pilule inactive et les sujets du groupe auquel on donneun traitement reçoivent un nouveau médicament supposé réduire l’hypertension.Après que les sujets ont suivi le traitement pendant deux mois, le test t pour deuxéchantillons est utilisé pour comparer la tension artérielle moyenne du groupe placeboà celle du groupe qui suit le traitement. Chaque patient est examiné une fois etappartient à un groupe.

Statistiques. Pour chaque variable, on a les éléments suivants : taille de l’échantillon,moyenne, écart-type, et erreur standard de la moyenne. Pour la différence de lamoyenne: moyenne, erreur standard, et intervalle de confiance (vous pouvez spécifierle niveau de confiance). Tests : Test de Levene sur l’égalité des variances et tests t desvariances combinées et séparées pour l’égalité des moyennes.

Données. Les valeurs de la variable quantitative qui vous intéresse se trouvent dansune seule colonne du fichier de données. SPSS utilise une variable de regroupementà deux valeurs pour séparer les observations en deux groupes. Le critère deregroupement peut être numérique (on peut avoir des valeurs telles que 1 et 2, ou 6,25et 12,5) ou alphanumérique (telles que oui et non). Vous pouvez utiliser égalementune variable quantitative, telle que l’âge, pour séparer les observations en deuxgroupes en précisant une césure (la césure 21 provoque un groupe dont l’âge estinférieur à 21 ans et un groupe dont l’âge est supérieur à 21 ans).

Hypothèses. Pour le test t de variance égale, les observations doivent êtreindépendantes, et les échantillons aléatoires de distribution normale doivent avoirla même variance de population. Pour le test t de variance égale, les observationsdoivent être indépendantes, et les échantillons aléatoires doivent avoir une distributionnormale. Le test t pour deux échantillons est assez robuste pour se départir de lanormalité. Lors de la vérification graphique des distributions, vérifiez qu’elles sontsymétriques et n’ont pas de valeurs éloignées.

Page 441: SPSS Base Users Guide 14.0

415

Tests T

Figure 21-1Résultat Test T pour échantillons indépendants

10 142.50 17.04 5.39

10 116.40 13.62 4.31

placeboNouveau_

TraitementTension Artérielle

N Moyenne Ecart type

Moyenne des Erreurs

Statistiques de groupe

Standard

Médicament

.134 .719 3.783 18 .001 26.10 6.90 11.61 40.59

3.783 17.163 .001 26.10 6.90 11.56 40.64

Hypothèsede variances Égales

Hypothèsede variances Inégales

Tension Artérielle

F Signification

Test de Levene surl'égalité des variances

t dfSignification

(Bilatérale)Différence deMoyennes

des erreurs Standard Inférieur Supérieur

Intervalle de confiance dela moyenne à 95 %

Test-t pour égalité des moyennes

Test pour échantillons indépendants

Différence

Obtenir un test t pour échantillons indépendants

E A partir des menus, sélectionnez :Analyse

Comparer les moyennesTest T pour échantillons indépendants

Figure 21-2Boîte de Dialogue Test T pour échantillons indépendants

Page 442: SPSS Base Users Guide 14.0

416

Chapitre 21

E Sélectionnez au moins une variable test quantitative. Un test t distinct est alorscalculé pour chaque variable.

E Sélectionnez un seul critère de regroupement et cliquez sur Définir groupes pourspécifier deux codes pour les groupes à comparer.

E Vous pouvez également cliquer sur Options pour contrôler le traitement des donnéesmanquantes et le niveau de l’intervalle de confiance.

Définir Groupes Test T pour Echantillons IndépendantsFigure 21-3Boîte de dialogue Définir groupes pour variables numériques

Pour les critères de regroupement numérique, définissez les deux groupes du test ten spécifiant deux valeurs ou un point de séparation :

Utiliser les valeurs spécifiées. Saisissez une valeur pour le Groupe 1 et une autrepour le Groupe 2. Les observations qui ont une autre valeur sont exclues del’analyse. Il n’est pas nécessaire que les nombres soient des entiers (par exemple,6,25 et 12,5 sont valides).

Césure. Vous avez également la possibilité de saisir un nombre qui sépare lesvaleurs de la variable de regroupement en deux groupes. Toutes les observationsayant des valeurs inférieures à la césure constituent un groupe et les observationsayant des valeurs supérieures ou égales à la césure constituent l’autre groupe.

Page 443: SPSS Base Users Guide 14.0

417

Tests T

Figure 21-4Définir la boîte de dialogue Groupes pour les variables caractères

Pour les critères de regroupement alphanumériques, entrez une chaîne pour leGroupe 1 et une autre pour le Groupe 2, par exemple oui et non. Les observationsavec d’autres chaînes sont exclues de l’analyse.

Options Test T pour Echantillons IndépendantsFigure 21-5Boîte de dialogue Test T pour échantillons indépendants : Options

Intervalle de confiance. Par défaut, un intervalle de confiance de 95 % pour ladifférence dans les moyennes est affiché. Saisir une valeur comprise entre 1 et 99pour demander un niveau de confiance différent.

Valeurs manquantes. Quand vous testez plusieurs variables et que des données sontmanquantes pour au moins une variable, vous pouvez indiquer à la procédure lesobservations à inclure (ou exclure).

Page 444: SPSS Base Users Guide 14.0

418

Chapitre 21

Exclure les observations analyse par analyse. Chaque test t utilise toutes lesobservations qui ont des données valides pour les variables testées. La taille deséchantillons peut varier d’un test à l’autre.

Exclure toute observation incomplète. Chaque test t utilise seulement lesobservations qui ont des données valides pour toutes les variables utilisées dansles tests t requis. La taille des échantillons est constante durant les tests.

Test T pour échantillons appariés

La procédure du Test T pour Echantillons Appariés compare la moyenne de deuxvariables pour un seul groupe. Elle permet de calculer la différence de valeurs entreles deux variables pour chaque observation et de tester si la moyenne diffère de 0.

Exemple. Dans le cadre d’une étude sur l’hypertension, des mesures sont prises surtous les patients au début de l’étude, un traitement est administré, puis on procède àune nouvelle mesure. Par conséquent, chaque sujet est l’objet de deux mesures,souvent nommées mesures avant et après. Il existe une alternative à ce test, il s’agitd’une étude appariée ou de contrôle d’observation dans laquelle chaque déclarationdans le fichier de données contient la réponse du patient ainsi que celle de son sujetde contrôle apparié. Dans le cadre d’une étude sur la tension artérielle, les patientset les contrôles peuvent être appariés selon l’âge (un patient âgé de 75 ans avec unmembre du groupe de contrôle âgé de 75 ans).

Statistiques. Pour chaque variable, on a les éléments suivants : moyenne, tailled’échantillon, écart-type, et erreur standard de la moyenne. Pour chaque paire devariables, on a les éléments suivants : Corrélation, différence moyenne de moyennes,test t et intervalle de confiance pour la différence moyenne (vous pouvez préciser leniveau de confiance). Ecart-type et erreur standard de la différence moyenne.

Données. Pour chaque test apparié, précisez deux variables continues (niveaud’intervalle de mesure ou niveau de ratio de mesure). Dans le cadre d’une étudeappariée ou de contrôle d’observation, la réponse pour chaque sujet test et son sujetde contrôle apparié doit être dans la même observation du fichier de données.

Hypothèses. Les observations pour chaque paire devraient être réalisées dans lesmêmes conditions. Les différences moyennes devraient suivre une distributionnormale. Les variances de chaque variable peuvent être égales ou inégales.

Page 445: SPSS Base Users Guide 14.0

419

Tests T

Figure 21-6Test T pour échantillons appariés

116.40 10 13.62 4.31

142.50 10 17.04 5.39

AprèsTraitement

AvantTraitement

Paire 1Moyenne N

EcartType Standard

Statistiques des échantillons appariés

Moyenne des erreurs

-26.10 19.59 6.19 -40.11 -12.09 -4.214 9 .002

Après traitement - Avant traitement

Paire 1Moyenne Ecart-type

Moyenne Inférieur Supérieur

Intervale de confiance de 95 % de la différence

Différences appariées

t dfSignification

Test d'exemples appariés

d'erreur std. (bilatérale)

Obtenir un test t pour échantillons appariés

E A partir des menus, sélectionnez :Analyse

Comparer les moyennesTest T pour échantillons appariés

Figure 21-7Boîte de dialogue Test T pour échantillons appariés

Page 446: SPSS Base Users Guide 14.0

420

Chapitre 21

E Sélectionnez une paire de variables, comme suit :

Cliquez sur chacune des deux variables. La première variable apparaît dansle groupe Choix courants comme Variable 1 et la seconde apparaît commeVariable 2.

Cliquez sur le bouton fléché pour déplacer la paire vers la liste Variablesappariées. Vous pouvez sélectionner d’autres paires de variables. Pour retirer unepaire de variables de l’analyse, sélectionnez une paire dans la liste des VariablesAppariées et cliquez sur la flèche.

E Vous pouvez également cliquer sur Options pour contrôler le traitement des donnéesmanquantes et le niveau de l’intervalle de confiance.

Options test T pour échantillons appariés

Figure 21-8Boîte de dialogue Test T pour échantillons appariés

Intervalle de confiance. Par défaut, un intervalle de confiance de 95 % pour ladifférence dans les moyennes est affiché. Saisir une valeur comprise entre 1 et 99pour demander un niveau de confiance différent.

Valeurs manquantes. Quand vous testez plusieurs variables et que des donnéessont manquantes pour au moins une variable, vous pouvez indiquer à SPSS lesobservations à inclure (ou exclure) :

Exclure les observations analyse par analyse. Chaque test t utilise toutes lesobservations qui ont des données valides pour la paire de variables testées. Lataille des échantillons peut varier d’un test à l’autre.

Exclure toute observation incomplète. Chaque test t utilise seulement lesobservations qui ont des données valides pour toutes les paires de variablestestées. La taille des échantillons est constante durant les tests.

Page 447: SPSS Base Users Guide 14.0

421

Tests T

Test T pour échantillon unique

La procédure du Test T pour échantillon unique permet de tester si la moyenne d’uneseule variable diffère d’une constante spécifiée.

Exemples : Un chercheur souhaite tester si le QI moyen d’un groupe d’étudiantsdiffère de 100. Un fabricant céréalier prélève un échantillon de boîtes à partir d’unechaîne de production et vérifie si le poids moyen des échantillons diffère de 1,3 livresà l’intervalle de confiance 95 %.

Statistiques : Pour chaque variable test : moyenne, écart-type, et erreur standard dela moyenne. Différence moyenne entre chaque valeur de donnée et la valeur testsupposée, le test t vérifie que cette différence est égale à 0 et vérifie égalementl’intervalle de confiance pour cette différence (vous pouvez préciser le niveau deconfiance).

Données : Afin de tester les valeurs d’une variable quantitative par rapport à unevaleur test supposée, choisissez une variable quantitative et saisissez une valeur testsupposée.

Hypothèses : Ce test suppose que les données sont distribuées normalement ;cependant, ce test résiste convenablement à la normalité.

Figure 21-9Résultat Test T pour échantillon unique

15109.33

12.03

3.11

NMoyenne

Ecart typeMoyenne des erreurs standard

QI

Statistiques pour échantillon unique

Les lignes et les colonnes ont été transposées.

3.005 14 .009 9.33 2.67 15.99QIt df

Signification (Bilatérale)

Différence de moyennes Inférieur Supérieur

Intervalle de confiance de la différence à 95 %

Valeur de test = 100

Test pour échantillon unique

Page 448: SPSS Base Users Guide 14.0

422

Chapitre 21

Obtenir un test t pour échantillon unique

E A partir des menus, sélectionnez :Analyse

Comparer les moyennesTest T pour échantillon unique

Figure 21-10Boîte de dialogue Test T pour échantillon unique

E Sélectionnez au moins une variable à tester par rapport à la même valeur supposée.

E Entrez une valeur test numérique à laquelle vous souhaitez comparer chaque moyenned’échantillon.

E Vous pouvez également cliquer sur Options pour contrôler le traitement des donnéesmanquantes et le niveau de l’intervalle de confiance.

Options Test T pour échantillon uniqueFigure 21-11Boîte de Dialogue Options Test T pour échantillon unique

Page 449: SPSS Base Users Guide 14.0

423

Tests T

Intervalle de confiance : Par défaut, un intervalle de confiance de 95 % pour ladifférence entre la moyenne et la valeur de test supposée est affiché. Saisir une valeurcomprise entre 1 et 99 pour demander un niveau de confiance différent.

Valeurs manquantes : Quand vous testez plusieurs variables et que des données sontmanquantes pour au moins une variable, vous pouvez indiquer à la procédure lesobservations à inclure (ou exclure).

Exclure les observations analyse par analyse : Chaque test t utilise toutes lesobservations qui ont des données valides pour les variables testées. La taille deséchantillons peut varier d’un test à l’autre.

Exclure toute observation incomplète : Chaque test t utilise seulement lesobservations qui ont des données valides pour toutes les variables utilisées dansn’importe lequel des tests t requis. La taille des échantillons est constante durantles tests.

Fonctionnalités supplémentaires de la commande T-TEST

Le langage de commande SPSS vous permet aussi de :

Produire à la fois des tests t pour un échantillon et pour des écahntillonsindépendants en exécutant une commande unique.

Tester une variable avec chacune des variables d’une liste dans un test t apparié(avec la sous-commande PAIRS).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 450: SPSS Base Users Guide 14.0
Page 451: SPSS Base Users Guide 14.0

Chapitre

22ANOVA à 1 facteur

La procédure de l’analyse de variance ANOVA à 1 facteur permet d’effectuer uneanalyse de variance univariée sur une variable quantitative dépendante par une variablecritère simple (indépendant). L’analyse de variance sert à tester l’hypothèse d’égalitédes moyennes. Cette technique est une extension du test t pour deux échantillons.

Déterminer que des différences existent parmi les moyennes ne vous suffitpeut-être pas. Vous voulez éventuellement savoir quelles sont les moyennes quidiffèrent. Il existe deux types de tests pour comparer les moyennes : les contrastes apriori et les tests post hoc. Les contrastes sont des tests définis avant l’expérience,et les tests post hoc sont effectués après l’expérience. Vous pouvez aussi tester lestendances à travers les modalités.

Exemple. Les beignets absorbent la graisse dans des proportions variées lorsqu’ils sontcuisinés. Une expérience est conduite à partir de l’utilisation de trois types de graisse: huile d’arachide, huile de maïs, et saindoux. L’huile d’arachide et l’huile de maïssont des graisses non saturées, et le saindoux une graisse saturée. Non seulementvous déterminez si la quantité de graisse absorbée dépend du type de graisse utilisée,mais vous pouvez également créer un contraste a priori afin de déterminer si le degréd’absorption de graisse diffère pour les graisses saturées et non saturées.

Statistiques. Pour chaque groupe : nombre d’observations, moyenne, écart-type,erreur standard de la moyenne, minimum, maximum et intervalle de confiance à 95 %de la moyenne. Test de Levene pour l’homogénéité de la variance, tableau d’analysede la variance et tests d’égalité des moyennes pour chaque variable dépendante,contrastes a priori spécifiés par l’utilisateur et tests d’intervalle et comparaisonsmultiples post hoc : Bonferroni, Sidak, test de Tukey, GT2 de Hochberg, Gabriel,Dunnett, test F de Ryan-Einot-Gabriel-Welsch (R-E-G-W F), test d’intervallede Ryan-Einot-Gabriel-Welsch (R-E-G-W Q), T2 de Tamhane, T3 de Dunnett,Games-Howell, test C de Dunnett, test de Duncan, Student-Newman-Keuls (S-N-K),B de Tukey, Waller-Duncan, Scheffé et différence la moins significative.

425

Page 452: SPSS Base Users Guide 14.0

426

Chapitre 22

Données. Les valeurs de la variable active devraient être des nombres entiers, et lavariable dépendante devrait être quantitative (niveau d’intervalle de mesures).

Hypothèses. Chaque groupe est un échantillon aléatoire indépendant extrait d’unepopulation normale. L’analyse de la variance supporte les écarts à la normalité, bienque les données doivent être symétriques. Les groupes devraient être composésde populations à variance égale. Pour tester cette hypothèse, utiliser le testd’homogénéité de variance de Levene.

Figure 22-1Résultat ANOVA à 1 facteur

1596.00 2 798.00 7.824 .005

1530.00 15 102.00

3126.00 17

Entre groupes

Dans les groupes

Total

Grammes de graisse absorbée

Somme des carrés df Carré moyen F Signification

ANOVA

6 72.00 13.34 5.45 58.00 86.00 56 95

6 85.00 7.77 3.17 76.84 93.16 77 97

6 62.00 8.22 3.36 53.37 70.63 49 70

18 73.00 13.56 3.20 66.26 79.74 49 97

Huile d'arachide

Saindoux

Huile de maïs

Total

Type d'huile

Grammes graisse de

N Moyenne Ecart-type Erreur std.Limite

inférieureLimite

supérieure

Intervale de confiance de 95 % pour la moyenne

Minimum Maximum

Descriptions

absorbée

-.5 1 -.51ContrasteHuile d'arachide Saindoux Huile de maïs

Type d'huile

Coefficients de contraste

18.00 5.05 3.565 15 .003

18.00 4.51 3.995 12.542 .002

1Contraste

1Contraste

Suppose des variances égales

Ne suppose pas des variances égales

Grammes de graisse

Valeur de contraste Erreur std. t df

Signification [bilatérale)

Tests de contraste

absorbée

Page 453: SPSS Base Users Guide 14.0

427

ANOVA à 1 facteur

.534 2 15 .597Grammes de graisse absorbée

Statistique de Levene df1 df2 Signification

Test d'homogénéité des variances

Obtenir une analyse de variance à un facteur

E A partir des menus, sélectionnez :Analyse

Comparer les moyennesANOVA à 1 facteur

Figure 22-2Boîte de dialogue ANOVA à 1 facteur

E Sélectionnez au moins une variable dépendante.

E Sélectionnez une variable active indépendante simple.

Page 454: SPSS Base Users Guide 14.0

428

Chapitre 22

Contrastes ANOVA à 1 facteurFigure 22-3Boîte de dialogue ANOVA à 1 facteur : Contrastes

Vous pouvez diviser les sommes des carrés inter-groupes en tendances composants ouspécifier les contrastes a priori.

Modèle polynomial. Diviser les sommes des carrés inter-groupes en tendancescomposants. Vous pouvez tester la tendance d’une variable dépendante à travers lesniveaux ordonnés de la variable active. Par exemple, vous pourriez tester la tendancelinéaire (croissante ou décroissante) des salaires perçus les plus élevés à travers lesniveaux ordonnés.

Degré. Vous pouvez choisir un polynôme de premier, deuxième, troisième,quatrième ou cinquième degré.

Coefficients. Contrastes a priori spécifiés à tester par la statistique t. Saisissez uncoefficient pour chaque groupe (modalité) de la variable active et cliquez sur Ajouter

après chaque saisie. Chaque nouvelle valeur s’ajoute au bas de la liste des coefficients.Pour spécifier des groupes de contrastes supplémentaires, cliquez sur Suivant. UtilisezSuivant et Précédent pour vous déplacer entre les groupes de contrastes.

L’ordre des coefficients est important car il correspond à l’ordre croissant desvaleurs de modalité de la variable active. Le premier coefficient de la liste correspondà la valeur la plus petite de la variable active, et le dernier coefficient correspond àla valeur la plus élevée. Par exemple, s’il y a six modalités de variables actives,les coefficients –1, 0, 0, 0, 0,5 et 0,5 mettent en contraste le premier groupe avecles cinquième et sixième groupes. Pour la plupart des applications, les coefficients

Page 455: SPSS Base Users Guide 14.0

429

ANOVA à 1 facteur

devraient s’élever à 0. Les groupes qui n’atteignent pas 0 peuvent aussi être utilisés,mais un message d’avertissement s’affiche.

Tests Post Hoc ANOVA à 1 facteurFigure 22-4ANOVA à 1 facteur : Comparaisons multiples a posteriori

Lorsque vous avez déterminé qu’il existe des différences parmi les moyennes, les testsd’intervalles post hoc et de comparaisons multiples par paire peuvent déterminer lesmoyennes qui diffèrent. Les tests d’intervalle identifient les sous-groupes homogènesde moyennes qui ne diffèrent pas les uns des autres. Les comparaisons multiplesappariées testent la différence entre les moyennes appariées et engendrent une matricepour laquelle les astérisques indiquent les moyennes de groupes significativementdifférentes au niveau alpha 0.05.

Hypothèse de variances égales :

Le test de Tukey, le GT2 de Hochberg, le test de Gabriel et le test de Scheffé sont destests de comparaisons multiples et d’intervalle. Il existe d’autres tests d’intervalle,tels que le test B de Tukey, le S-N-K (Student-Newman-Keuls), le Duncan, leR-E-G-W F (F de Ryan-Einot-Gabriel-Welsch), le R-E-G-W Q (test d’intervalle deRyan-Einot-Gabriel-Welsch) et le Waller-Duncan. Les tests de comparaison multiple

Page 456: SPSS Base Users Guide 14.0

430

Chapitre 22

disponibles sont les suivants : Bonferroni, test de différence significative de Tukey,Sidak, Gabriel, Hochberg, Dunnett, Scheffé et LSD (différence la moins significative).

LSD. Utilisation de tests t pour effectuer toutes les comparaisons par paire entredes moyennes de groupe. Le taux d'erreur n'est pas corrigé dans le cas decomparaisons multiples.

Bonferroni. Utilise des tests t pour effectuer des comparaisons par paire entreles moyennes de groupes, mais contrôle le taux d'erreur global en spécif.iantcomme taux d'erreur pour chaque test le taux d'erreur empirique divisé par lenombre total de tests. Le seuil de signification observé est ainsi ajusté en raisondes comparaisons multiples réalisées.

Sidak. Test de comparaisons multiples par paire reposant sur la statistique t. Letest Sidak ajuste le seuil de signification en fonction des comparaisons multipleset fournit des bornes plus étroites que le test Bonferroni.

Scheffé. Exécute des comparaisons par paire simultanées pour toutes les pairesde moyennes possibles. Utilise la distribution d'échantillonnage F. Peut servir àexaminer toutes les combinaisons linéaires possibles de moyennes de groupe, etpas seulement des comparaisons par paire.

F de R-E-G-W (Ryan-Einot-Gabriel-Welsch). Procédure multiple descendante deRyan-Einot-Gabriel-Welsch basée sur un test F.

Q de R-E-G-W (Ryan-Einot-Gabriel-Welsch). Procédure multiple descendante deRyan-Einot-Gabriel-Welsch basée sur un intervalle de Student.

S-N-K. Ce test effectue toutes les comparaisons de moyennes par paire, à l'aidede la distribution des intervalles de Student. Lorsque la taille des échantillonsest égale, il compare aussi les moyennes par paire dans les sous-ensembleshomogènes, en utilisant une procédure pas à pas. Les moyennes sont triées dansl'ordre décroissant et les différences extrêmes sont testées en premier.

Tukey. Utilise les statistiques des intervalles studentisées pour effectuer descomparaisons de classes deux à deux. Fixe le taux d'erreur expérimental auniveau du taux d'erreur de l'ensemble pour toutes des comparaisons par paire.

B de Tukey. Utilise la distribution des intervalles studentisée pour effectuer descomparaisons de classes deux à deux. La valeur critique est la moyenne de lavaleur correspondante du test de Tukey et du test de Student-Newman-Keuls.

Page 457: SPSS Base Users Guide 14.0

431

ANOVA à 1 facteur

Duncan. Réalise des comparaisons par paires en suivant un ordre pas à pasidentique à celui utilisé dans le test de Student-Newman-Keuls, mais établit unniveau de protection du taux d'erreur pour l'ensemble des tests, plutôt que pourchaque test en particulier. Utilise la statistique d'intervalle de Student.

GT2 de Hochberg. Test de multiples comparaisons et intervalles appariés utilisantle modulus maximum de Student. Similaire au test de Tukey.

Gabriel. Test de comparaison par paire qui utilise le modulus maximum deStudent. Il est plus efficace que le GT2 de Hochberg lorsque les tailles descellules sont inégales. Le test de Gabriel offre plus de souplesse lorsque lestailles des cellules divergent beaucoup.

Waller-Duncan. Test de comparaisons multiples basé sur une statistique t etutilisant une approche bayésienne.

Dunnett. Test T de comparaisons multiples par paires comparant un ensemblede traitements à une moyenne de contrôle unique. La dernière modalité est lamodalité de contrôle par défaut. Vous pouvez également choisir la premièremodalité. L’option Bilatéral teste que la moyenne à un certain niveau (hormis lamodalité de contrôle) du facteur n’est pas égale à celle de la modalité de contrôle.L’option <Contrôle permet de tester si la moyenne est inférieure, à un certainniveau du facteur, à celle de la modalité de contrôle. L’option >Contrôle permetde tester si la moyenne est supérieure, à un certain niveau du facteur, à celle de lamodalité de contrôle.

Hypothèse de variances inégales.

Les tests de comparaison multiple qui ne supposent pas de variances égales sont le T2de Tamhane, le T3 de Dunnett, Games-Howell et le C de Dunnett.

T2 de Tamhane. Test des comparaisons appariées basé sur le test T. Ce test estopportun lorsque les variances sont inégales.

T3 de Dunnett. Test des comparaisons par paires basé sur le module maximal deStudent. Ce test est opportun lorsque les variances sont inégales.

Games-Howell. Test des comparaisons appariées qui peut parfois être souple. Cetest est opportun lorsque les variances sont inégales.

C de Dunnett. Test des comparaisons par paires basé sur l'intervalle de Student. Cetest est opportun lorsque les variances sont inégales.

Page 458: SPSS Base Users Guide 14.0

432

Chapitre 22

Remarque : Il peut vous paraître plus facile d’interpréter le résultat à partir de testspost hoc si vous désactivez l’option Masquer les lignes et les colonnes vides dans laboîte de dialogue Propriétés du tableau (dans le tableau pivotant activé, choisissezPropriétés du tableau dans le menu Format).

Options ANOVA à 1 facteurFigure 22-5Boîte de dialogue ANOVA à 1 facteur : Options

Statistiques. Choisissez une ou plusieurs des options suivantes :

Caractéristique. La procédure calcule le nombre d’observations, la moyenne,l’écart-type, l’erreur standard de la moyenne, le minimum, le maximum, et lesintervalles de confiance à 95 % pour chaque variable dépendante de chaquegroupe.

Effets fixes et aléatoires. La procédure affiche l’écart-type, l’erreur standardet l’intervalle de confiance à 95 % pour le modèle à effets fixes, ainsi quel’erreur standard, l’intervalle de confiance à 95% et l’estimation de la varianceinter-composants pour le modèle à effets aléatoires.

Test d’homogénéité de variance. La procédure calcule la statistique de Levene pourtester l’égalité des variances de groupe. Ce test ne dépend pas de l’hypothèsede normalité.

Page 459: SPSS Base Users Guide 14.0

433

ANOVA à 1 facteur

Brown-Forsythe. La procédure calcule la statistique de Brown-Forsythe pour testerl’égalité des moyennes de groupe. Il est préférable d’utiliser cette statistique(au lieu de la statistique F) lorsque l’hypothèse d’égalité des variances n’estpas satisfaite.

Welch. Calcule la statistique de Welch pour tester l’égalité des moyennes degroupe. Il est préférable d’utiliser cette statistique (au lieu de la statistique F)lorsque l’hypothèse d’égalité des variances n’est pas satisfaite.

Diagramme des moyennes. Affiche un diagramme qui représente les moyennes desous-groupes (les moyennes de chaque groupe définies par les valeurs de la variableactive).

Valeurs manquantes. Contrôle le traitement des valeurs manquantes.

Exclure les observations analyse par analyse. Aucune observation avec valeurmanquante n’est utilisée, que ce soit pour la variable dépendante ou pour lavariable active d’une analyse donnée. De même, on n’utilise pas d’observation endehors de l’intervalle spécifié pour la variable active.

Exclure toute observation incomplète. Les observations ayant des valeursmanquantes pour la variable active ou pour toute variable dépendante contenuedans la liste dépendante de la boîte de dialogue principale sont exclues de toutesles analyses. Si vous n’avez pas spécifié de variables multiples dépendantes,cela est sans effet.

Fonctionnalités supplémentaires de la commande ONEWAY

Le langage de commande SPSS vous permet aussi de :

Obtenir des statistiques à effets fixes et aléatoires Ecart type, erreur standardde la moyenne et intervalles de confiance de 95 % pour le modèle à effetsfixes. Erreur standard, intervalles de confiance de 95 % et estimation de lavariance inter-composants pour le modèle à effets aléatoires (en utilisantSTATISTICS=EFFECTS).

Spécifier les niveaux alpha pour la différence de moindre signification, tests decomparaison multiple Bonferroni, Duncan et Scheff (avec la sous-commandeRANGES).

Ecrire une matrice des moyennes, des écarts-types et des fréquences ou lire unematrice des moyennes, des fréquences, des variances combinées et des degrés deliberté des variances combinées. Ces matrices peuvent être utilisées à la place

Page 460: SPSS Base Users Guide 14.0

434

Chapitre 22

des données brutes pour obtenir une analyse à un facteur de la variance (avecla sous-commande MATRIX).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 461: SPSS Base Users Guide 14.0

Chapitre

23Analyse GLM – Univarié

GLM – Univarié fournit un modèle de régression et une analyse de la variancepour plusieurs variables dépendantes par un ou plusieurs facteurs ou variables. Lesvariables actives divisent la population en groupes. Cette procédure de régressionlinéaire généralisée vous permet de tester les hypothèses nulles à propos des effetsdes autres variables sur la moyenne de différents regroupements de la variabledépendante. Vous pouvez rechercher les interactions entre les facteurs ainsi queles effets des différents facteurs, certains d’entre eux étant aléatoires. En outre, leseffets et les interactions des covariables avec les facteurs peuvent être inclus. Pourl’analyse de la régression, les variables indépendantes (explicatives) sont spécifiéescomme covariables.

Vous pouvez tester les modèles équilibrés comme déséquilibrés. Un modèle estéquilibré si chaque cellule de ce modèle contient le même nombre d’observations.L’analyse GLM – Univarié teste non seulement les hypothèses mais elle produitégalement des estimations.

Vous disposez de contrastes a priori communs pour effectuer les tests d’hypothèse.En outre, lorsqu’un test F global se révèle significatif, vous pouvez utiliser les testspost hoc pour évaluer les différences entre les moyennes spécifiques. Les moyennesmarginales estimées fournissent des estimations des valeurs moyennes estimées pourles cellules dans le modèle et les diagrammes des profils (diagrammes d’interaction)de ces moyennes vous permettent de visualiser plus facilement certaines des relations.

Les résidus, les prévisions, la distance de Cook et les valeurs influentes peuventêtre enregistrées sous forme de nouvelles variables dans votre fichier de données pourvérifier les hypothèses.

Poids WLS. Vous permet de spécifier une variable utilisée pour pondérer lesobservations pour une analyse pondérée (WLS) des moindres carrés, peut-être pourcompenser les différents niveaux de précision des mesures.

435

Page 462: SPSS Base Users Guide 14.0

436

Chapitre 23

Exemple. Des données sont collectées sur les différents participants au Marathon deParis sur plusieurs années. Le temps effectué par chaque participant est la variabledépendante. Les autres facteurs comprennent le temps (froid, modéré, chaud), lenombre de mois d’entraînement, le nombre de marathons précédemment effectués etle sexe. L’âge est considéré comme co-variable. Vous devez trouver que le sexe a uneffet significatif et que l’interaction du sexe avec le temps est significatif.

Méthodes. Les sommes des carrés de type I, II, III et IV peuvent servir à évaluer lesdifférentes hypothèses. Le type III est la valeur par défaut.

Statistiques. Tests d’intervalle post hoc et comparaisons multiples : Ladifférence la moins significative, Bonferroni, Sidak, Scheffé, F multiple deRyan-Einot-Gabriel-Welsch, l’intervalle multiple de Ryan-Einot-Gabriel-Welsch,Student-Newman-Keuls, le test de Tukey, b de Tukey, Duncan, GT2 de Hochberg,Gabriel, le test t de Waller Duncan, Dunnett (unilatéral, bilatéral), T2 de Tamhane,T3 de Dunnett, Games-Howell et C de Dunnett. Statistiques descriptives : moyenneobservée, écart-type et effectifs pour toutes les variables dépendantes dans toutes lescellules. Le test de Levene pour l’homogénéité de la variance.

Diagrammes. Dispersion par niveau, résiduels et profils (interaction).

Données. La variable dépendante est quantitative. Les facteurs sont qualitatifs. Il peuts’agir de valeurs numériques ou alphanumériques de 8 caractères au maximum. Lescovariables sont des variables quantitatives liées à la variable dépendante.

Hypothèses. Les données forment un échantillon aléatoire d’une population normaleou gaussienne. Dans cette population, toutes les variances de cellule sont égales.L’analyse de la variance supporte les écarts à la normalité, bien que les donnéesdoivent être symétriques. Pour vérifier les hypothèses, vous pouvez utiliser les testsd’homogénéité de la variance et les diagrammes de dispersion par niveau. Vouspouvez également étudier les résidus et les diagrammes de résidus.

Page 463: SPSS Base Users Guide 14.0

437

Analyse GLM – Univarié

Figure 23-1Résultat GLM - Univarié

Tests des effets inter-sujets

Variable dépendante : SPVOL

22.520 11 2.047 12.376 .000

1016.981 1 1016.981 6147.938 .000

8.691 3 2.897 17.513 .000

10.118 2 5.059 30.583 .000

.997 2 .499 3.014 .082

5.639 4 1.410 8.522 .001

2.316 14 .165

1112.960 26

24.835 25

Source

Modèle corrigé

Constante

Farine

Graisse

Précipité

Graisse*Précipité

Erreur

Total

Total corrigé

Somme des carrés de type III df

Carré moyen F Sig.

R carré = .907 (R carré ajusté = .833)1.

Graisse * précipité

Variable dépendante : SPVOL

5.536 .240 5.021 6.052

5.891 .239 5.378 6.404

6.123 .241 5.605 6.641

7.023 .241 6.505 7.541

6.708 .301 6.064 7.353

6.000 .203 5.564 6.436

6.629 .301 5.984 7.274

7.200 .203 6.764 7.636

8.589 .300 7.945 9.233

précipité

1

2

3

1

2

3

1

2

3

Graisse

1

2

3

Moyenne Erreur std. Limite inférieure Limite supérieureIntervale de confiance de 95 %

Pour obtenir des tables GLM - Univarié

E A partir des menus, sélectionnez :Analyse

Modèle linéaire généralUnivarié

Page 464: SPSS Base Users Guide 14.0

438

Chapitre 23

Figure 23-2Boîte de dialogue Univarié

E Sélectionnez une variable dépendante.

E Sélectionnez les variables pour Facteur(s) fixé(s), Facteur(s) aléatoire(s) etCovariable(s), en fonction de vos données.

E En option, vous pouvez utiliser WLS Weight pour préciser une variable de pondérationpour l’analyse des moindres carrés pondérés. Si la valeur de la variable de pondérationest nulle, négative ou manquante, l’observation est exclue de l’analyse. Une variabledéjà utilisée dans le modèle ne peut pas servir de variable de pondération.

Page 465: SPSS Base Users Guide 14.0

439

Analyse GLM – Univarié

Modèle GLMFigure 23-3Boîte de dialogue Modèle univarié

Spécifier le modèle : Un modèle factoriel général contient tous les effets principaux desfacteurs, des covariables et toutes les interactions facteur/facteur. Il ne contient pasde d’interactions de covariable. Sélectionnez Autre pour indiquer un sous-ensembled’interactions ou des interactions variable active/covariable. Vous devez indiquertous les termes à inclure dans le modèle.

Critères et covariables :Les covariables et facteurs sont énumérés en indiquant (F)

pour facteur fixé et (C) pour covariable. Dans une analyse univariée, (R) indique unfacteur aléatoire.

Modèle : Le modèle dépend de la nature de vos données. Après avoir sélectionnéAutre, vous pouvez choisir les effets principaux et les interactions qui présententun intérêt pour votre analyse.

Somme des carrés Méthode de calcul des sommes des carrés. Pour les modèleséquilibrés ou non, auxquels aucune cellule ne manque, le type III est la méthodele plus fréquemment utilisée.

Inclure une constante au modèle : L’ordonnée est généralement incluse dans le modèle.Si vous partez du principe que les données passent par l’origine, vous pouvez exclurela constante.

Page 466: SPSS Base Users Guide 14.0

440

Chapitre 23

Termes construits

Pour les facteurs et covariables sélectionnés :

Interaction :Crée le terme d’interaction du plus haut niveau de toutes les variablessélectionnées. Il s’agit de la valeur par défaut.

Effets principaux :Crée un terme d’effet principal pour chaque variable sélectionnée.

Toutes d’ordre 2 :Crée toutes les interactions d’ordre 2 possibles des variablessélectionnées.

Toutes d’ordre 3 :Crée toutes les interactions d’ordre 3 possibles des variablessélectionnées.

Toutes d’ordre 4 :Crée toutes les interactions d’ordre 4 possibles des variablessélectionnées.

Toutes d’ordre 5 :Crée toutes les interactions d’ordre 5 possibles des variablessélectionnées.

Somme des carrés

Pour ce modèle, vous pouvez choisir un type de sommes des carrés. Le type III est leplus courant et c’est la valeur par défaut.

Type I : Cette méthode est également appelée décomposition hiérarchique de la sommedes carrés. Chaque terme est ajusté uniquement pour le terme qui le précède dans lemodèle. La somme des carrés de type I est généralement utilisée pour :

Une analyse de la variance équilibrée dans laquelle tout effet principal est spécifiéavant les effets d’interaction de premier ordre, et chaque effet de premier ordrespécifié avant ceux de second ordre, et ainsi de suite.

Un modèle de régression polynomial dans lequel les termes d’ordre inférieur sontspécifiés avant ceux d’ordre supérieur.

Un modèle par imbrication pur dans lequel le premier effet spécifié est imbriquédans le second et le second spécifié dans le troisième, etc. (Cette formed’imbrication peut être spécifiée par la syntaxe uniquement.)

Page 467: SPSS Base Users Guide 14.0

441

Analyse GLM – Univarié

Type II : Cette méthode calcule les sommes des carrés d’un effet dans le modèleajusté pour tous les autres effets « appropriés ». Un effet approprié est un effet quicorrespond à tous les effets qui ne contiennent pas l’effet à étudier. La méthode dessommes des carrés de type II sert généralement pour :

Une analyse de la variance équilibrée.

Tout modèle qui contient un effet principal uniquement.

Tout modèle de régression.

Un modèle par emboîtement pur. (Cette forme d’emboîtement peut être spécifiéepar la syntaxe.)

Type III : Valeur par défaut. Cette méthode calcule les sommes des carrés d’un effetdans le modèle comme les sommes des carrés ajustée pour tout autre effet qui ne lecontient pas et orthogonal à chaque effet qui le contient. Les sommes de carrés detype III présentent l’avantage essentiel qu’elles ne varient pas avec les fréquences decellule tant que la forme générale d’estimabilité reste constante. Ce type de sommedes carrés est donc souvent considéré comme utile pour les modèles déséquilibrésauxquels aucune cellule ne manque. Dans le modèle factoriel sans cellule manquante,cette méthode est équivalente à la technique de Yates des carrés moyens pondérés. Laméthode des sommes des carrés de type III sert généralement pour :

Tous les modèles énumérés dans les types I et II.

Tous les modèles équilibrés ou non qui ne contiennent pas de cellules vides.

Type IV : Cette méthode est conçue pour une situation dans laquelle il manque descellules. Pour chaque effet F dans le modèle, si F n’est inclus dans aucun autreeffet, Type IV = Type III = Type II. Si F est inclus dans d’autres effets, le Type IVdistribue les contrastes à effectuer parmi les paramètres dans F sur tous les effets deniveau supérieur de façon équitable. La méthode des sommes des carrés de type IVsert généralement pour :

Tous les modèles énumérés dans les types I et II.

Tous les modèles équilibrés ou non qui contiennent des cellules vides.

Page 468: SPSS Base Users Guide 14.0

442

Chapitre 23

Contrastes GLMFigure 23-4Boîte de dialogue GLM Univarié : Contrastes

Les contrastes servent à tester les différences entre les niveaux d’un facteur. Vouspouvez spécifier un contraste pour chaque facteur du modèle (dans un modèle demesures répétées, pour chaque facteur inter-sujets). Les contrastes représentent descombinaisons linéaires des paramètres.

Le test des hypothèses est fondé sur l’hypothèse nulle LB =0, L étant la matricedes coefficients de contraste et B le vecteur de paramètre. Si un contraste est spécifié,SPSS crée une matrice L de telle sorte que les colonnes correspondant au facteurcorrespondent aux contrastes. Les colonnes restantes sont ajustées de telle sorte quela matrice L puisse être estimée.

Le résultat reprend une statistique F pour chaque ensemble de contrastes. Pourles différences de contraste, le système affiche également les intervalles de confiancesimultanés de type Bonferroni fondés sur la distribution t de Student.

Contrastes possibles

Les contrastes fournis sont écart, simple, différence, Helmert, répétée et modèlepolynomial. Pour les contrastes d’écart et simple, vous pouvez choisir si la modalitéde référence est la première ou la dernière.

Types de contraste

Ecart. Compare la moyenne de chaque niveau (hormis une modalité de référence) à lamoyenne de tous les niveaux (grande moyenne). Les niveaux du facteur peuvent êtrede n’importe quel ordre.

Page 469: SPSS Base Users Guide 14.0

443

Analyse GLM – Univarié

Simple. Compare la moyenne de chaque niveau à celle d’un niveau donné. Ce typede contraste est utile lorsqu’il y a un groupe de contrôle. Vous pouvez prendre lapremière ou la dernière modalité en référence.

Différence. Compare la moyenne de chaque niveau (hormis le premier) à la moyennedes niveaux précédents. (Parfois appelé contrastes d’Helmert inversé.)

Helmert. Compare la moyenne de chaque niveau de facteur (hormis le dernier) à lamoyenne des niveaux suivants.

Répété. Compare la moyenne de chaque niveau (hormis le premier) à la moyennedu niveau suivant.

Modèle polynomial. Compare l’effet linéaire, l’effet quadratique, l’effet cubiqueetc. Le premier degré de liberté contient l’effet linéaire sur toutes les modalités, lesecond degré l’effet quadratique, etc. Ces contrastes servent souvent à estimer lestendances polynomiales.

Diagrammes de profils GLMFigure 23-5Boîte de dialogue GLM – Univarié : Diagrammes des protocoles

Les diagrammes des profils (diagrammes d’interaction) sont utiles pour comparer lesmoyennes marginales dans votre modèle. Un diagramme des profils est une courbedont chaque point indique la moyenne marginale estimée d’une variable dépendante(ajustée pour les covariables) à un niveau du facteur. Les niveaux d’un second facteur

Page 470: SPSS Base Users Guide 14.0

444

Chapitre 23

peuvent servir à dessiner des courbes distinctes. Chaque niveau dans un troisièmefacteur peut servir à créer un diagramme distinct. Tous les facteurs fixés et aléatoiresont disponibles pour les diagrammes. Pour les analyses multivariées, les diagrammesdes profils sont créés pour chaque variable dépendante. Dans une analyse à mesuresrépétées, à la fois les facteurs inter-sujets et intra-sujets peuvent être utilisés dans lesdiagrammes des profils. GLM Multivarié et GLM Mesures répétées sont disponiblesuniquement si vous avez l’option Statistiques avancées installée.

Un diagramme des profils pour un facteur montre si la moyenne marginale estiméeest croissante ou décroissante sur les niveaux. Pour au moins deux facteurs, descourbes parallèles indiquent qu’il n’y a pas d’interaction entre les facteurs, ce quisignifie que vous recherchez les niveaux d’un seul facteur. Les courbes non parallèlesindiquent une interaction.

Figure 23-6Diagramme non parallèle (gauche) et diagramme parallèle (droite)

Après avoir sélectionné des facteurs pour l’axe horizontal afin de spécifier undiagramme et, éventuellement, des facteurs pour des courbes ou des diagrammesdistincts, vous devez ajouter le diagramme à la liste Diagrammes.

Page 471: SPSS Base Users Guide 14.0

445

Analyse GLM – Univarié

Comparaisons post hoc GLMFigure 23-7Boîte de dialogue GLM – Univarié : Comparaisons multiples post hoc pour les moyennesobservées

Test de comparaison multiple post hoc. Lorsque vous avez déterminé qu’il existe desdifférences parmi les moyennes, les tests d’intervalles post hoc et de comparaisonsmultiples par paire peuvent déterminer les moyennes qui diffèrent. Les comparaisonssont effectuées sur des valeurs non-ajustées. Ces tests servent aux facteurs inter-sujetsfixés seulement. Dans GLM - Mesures répétées, ces tests ne sont pas disponibless’il n’y a pas de facteurs inter-sujets. Les tests de comparaisons multiples post hocsont effectués pour la moyenne de tous les niveaux des facteurs intra-sujets. PourGLM - Multivarié, les tests post hoc sont effectués séparément pour chaque variabledépendante. GLM Multivarié et GLM Mesures répétées sont disponibles uniquementsi vous avez l’option Statistiques avancées installée.

Les tests de différence significative de Bonferroni et Tukey servent généralementcomme tests de comparaison multiples. Le test de Bonferroni, fondé sur la statistiquet de Student, ajuste le niveau de signification observé en fonction du nombre decomparaisons multiples qui sont effectuées. Le test t de Sidak ajuste également leniveau de signification et fournit des limites plus strictes que le test de Bonferroni.Le test de Tukey utilise la statistique d’intervalle selon Student pour effectuer descomparaisons par paire entre les groupes et fixe le taux d’erreur empirique au tauxd’erreur du regroupement de toutes les comparaisons par paire. Lorsque vous testez

Page 472: SPSS Base Users Guide 14.0

446

Chapitre 23

un grand nombre de paires de moyennes, le test de Tukey est plus efficace que celuide Bonferroni. Lorsqu’il y a peu de paires, Bonferroni est plus efficace.

Le GT2 de Hochberg est similaire au test de Tukey mais il utilise un modulusmaximum selon Student. Le test de Tukey est généralement plus efficace. Le test decomparaison par paire de Gabriel utilise également le modulus maximum selonStudent. Il est plus efficace que le GT2 de Hochberg lorsque les tailles des cellulessont inégales. Le test de Gabriel offre plus de souplesse lorsque les tailles des cellulesdivergent beaucoup.

Le test de comparaison multiple de Dunnett compare un ensemble de traitementsà une simple moyenne de contrôle. La dernière modalité est la modalité de contrôlepar défaut. Vous pouvez également choisir la première modalité. Vous pouvezégalement choisir un test unilatéral ou bilatéral. Pour tester que la moyenne à uncertain niveau (hormis la modalité de contrôle) du facteur n’est pas égale à cellede la modalité de contrôle, utilisez le test double-face. Pour tester si la moyenneest inférieure, à un certain niveau du facteur, à celle de la modalité de contrôle,sélectionnez < Contrôle. En outre, pour vérifier si la moyenne est supérieure, à uncertain niveau du facteur, à celle de la modalité de contrôle, sélectionnez > Contrôle.

Ryan, Einot, Gabriel et Welsch (R-E-G-W) ont développé deux tests d’intervallesmultiples descendants. Les procédures multiples descendantes testent d’abord quetoutes les moyennes sont égales. Si toutes les moyennes ne sont pas égales, l’égalitéest testée sur des sous-ensembles de moyennes. Le F de R-E-G-W est fondé sur letest F et le Q de R-E-G-W est fondé sur l’intervalle selon Student. Ces tests sontplus efficaces que le test d’intervalles multiples de Duncan et Student-Newman-Keuls(procédures multiples descendantes), mais ils sont conseillés lorsque les cellulessont de taille inégale.

Lorsque les variances sont inégales, utilisez le T2 de Tamhane (test decomparaisons par paire conservatif fondé sur un test t), le T3 de Dunnett(comparaison par paire fondée sur le modulus maximal selon Student), le test decomparaison par paire de Games-Howell (parfois flexible) ou le C de Dunnett(test de comparaison par paire fondé sur l’intervalle selon Student).

Le test d’intervalles multiples de Duncan, Student-Newman-Keuls (S-N-K) etle b de Tukey sont des tests d’intervalle qui classifient les moyennes de groupe etcalculent une valeur d’intervalle. Ces tests ne sont pas utilisés aussi souvent que lestests évoqués précédemment.

Le test t de Waller-Duncan utilise une approche de Bayes. Ce test d’intervalleutilise la moyenne harmonique de la taille de l’échantillon lorsque les échantillonssont de tailles différentes.

Page 473: SPSS Base Users Guide 14.0

447

Analyse GLM – Univarié

Le niveau de signification du test de Scheffé est conçu pour permettre toutes lescombinaisons linéaires possibles des moyennes de groupe à tester, pas seulement parpaire, disponibles dans cette fonction. Il en résulte que le test de Scheffé est souventplus strict que les autres, ce qui signifie qu’une plus grande différence de moyenne estnécessaire pour être significative.

Le test de comparaison multiple par paire de différence la moins significative(LSD) est équivalent aux divers tests t individuels entre toutes les paires des groupes.L’inconvénient de ce test est qu’il n’essaie pas d’ajuster le niveau d’importanceobservée pour les comparaisons multiples.

Tests affichés. Les comparaisons par paire sont proposées pour LSD, Sidak,Bonferroni, Games et Howell, T2 et T3 de Tamhane, C et T3 de Dunnett. Dessous-ensembles homogènes pour les tests d’intervalle sont proposés pour S-N-K, b deTukey, Duncan, F et Q de R-E-G-W et Waller. Le test de Tukey, le GT2 de Hochberg,le test de Gabriel et le test de Scheffé sont à la fois des tests de comparaison multipleet des tests d’intervalle.

Enregistrement GLMFigure 23-8Boîte de dialogue GLM – Univarié : Enregistrement

Page 474: SPSS Base Users Guide 14.0

448

Chapitre 23

Vous pouvez enregistrer les prévisions par le modèle, les résidus et les mesuresassociées sous forme de nouvelles variables dans l’éditeur de données. La plupartde ces variables peuvent servir à étudier les hypothèses relatives aux données. Pourenregistrer les valeurs afin de les utiliser dans une autre session SPSS, vous devezenregistrer le fichier de données en cours.

Prévisions. Valeurs que le modèle estime pour chaque observation.

Non standardisés. Valeur prévue par le modèle pour la variable dépendante.

Pondérés. Valeurs estimées non standardisées pondérées. Disponibles uniquementlorsqu'une variable WLS a été préalablement sélectionnée.

Erreur standard. Estimation de l'écart-type de la valeur moyenne de la variabledépendante, pour les observations ayant la même valeur pour les variablesindépendantes.

Diagnostics. Mesures permettant d’identifier les observations avec des combinaisonsinhabituelles de valeurs pour les variables indépendantes et les observations quipeuvent avoir un impact important sur le modèle.

Distance de Cook. Mesure permettant de savoir de combien les résidus de toutesles observations seraient modifiés si une observation donnée était exclue du calculdes coefficients de régression. Si la distance de Cook est élevée, l'exclusion d'uneobservation changerait substantiellement la valeur des coefficients.

Valeurs influentes. Valeurs influentes non centrées. Influence relative de chaqueobservation sur la qualité d'ajustement du modèle.

Résidus. Un résidu non standardisé correspond à la valeur réelle de la variabledépendante moins la valeur estimée par le modèle. Les résidus standardisés, selonStudent et supprimés sont également disponibles. Si vous avez choisi une variable depondération, les résidus standardisés pondérés sont disponibles.

Non standardisés. Différence entre la valeur observée et la valeur prévue par lemodèle.

Pondérés. Résidus estimés non standardisés pondérés. Disponibles uniquementlorsqu'une variable WLS a été préalablement sélectionnée.

Standardisés. Résidu divisé par une estimation de son écart-type. Egalementappelés résidus de Pearson, les résidus standardisés ont une moyenne de 0 etun écart-type de 1.

Page 475: SPSS Base Users Guide 14.0

449

Analyse GLM – Univarié

Studentisés. Résidu, divisé par une estimation de son écart-type, qui varie d'uneobservation à une autre, selon la distance entre les valeurs et la moyenne desvariables indépendantes pour chaque observation.

Supprimées. Résidu d'une observation lorsque celle-ci est exclue du calcul descoefficients de régression. Il s'agit de la différence entre la valeur de la variabledépendante et la prévision ajustée.

Statistiques à coefficients. Ecrit une matrice variance-covariance des estimationsdes paramètres du modèle dans un nouvel ensemble de données de la session encours ou dans un fichier de données externe au format SPSS. D’autre part, pourchaque variable dépendante, il y aura une ligne d’estimations, une ligne de valeursde signification pour les statistiques t correspondant aux estimations et une ligne dedegrés de liberté résiduels. Pour un modèle multivarié, il y a les mêmes lignes pourchaque variable dépendante. Vous pouvez utiliser ce fichier de matrice dans les autresprocédures qui lisent un fichier de matrice SPSS.

Options GLMFigure 23-9Boîte de dialogue GLM- Univarié : Options

Page 476: SPSS Base Users Guide 14.0

450

Chapitre 23

Des statistiques facultatives sont disponibles à partir de cette boîte de dialogue. Cesstatistiques sont calculées à l’aide de modèle à effets fixes.

Moyenne marginale estimée. Sélectionnez les facteurs et les interactions pour lesquelsvous souhaitez obtenir des estimations de la moyenne marginale de la population dansles cellules. Ces moyennes sont ajustées pour les covariables, si elles existent.

Comparer les effets principaux. Propose des comparaisons par paire non corrigéesdes moyennes marginales estimées pour tout effet principal dans le modèle, à lafois pour les facteurs inter-sujets et intra-sujets. Ceci n’est valable que si leseffets principaux sont sélectionnés dans la liste Afficher les moyennes.

Ajustement intervalle de confiance. Sélectionnez l’ajustement aux intervalles età la significativité des intervalles en adoptant l’une des méthodes suivantes: la différence de moindre signification (LSD), l’ajustement Bonferroni oul’ajustement de Sidak. Cet élément est disponible uniquement si Comparer leseffets principaux est sélectionné.

Afficher.Sélectionnez Statistiques descriptives pour produire des moyennes, desécarts-types et des effectifs pour toutes les variables dépendantes de toutes lescellules. L’option Estimation d’effet de taille fournit une valeur partielle de Eta carrépour chaque effet et chaque estimation. La statistique d’Eta carré décrit la proportionde la variabilité totale imputable au facteur. Sélectionnez Puissance observée pourobtenir la puissance du test lorsque l’autre hypothèse est définie sur la base de lavaleur observée. Sélectionnez Estimation des paramètres pour produire des estimationsde paramètres, des erreurs standard, des tests t, des intervalles de confiance et lapuissance observée de chaque test. Sélectionnez Matrice des coefficients de contraste

pour obtenir la matrice L.L’option des tests d’homogénéité produit le test de Levene d’homogénéité

de la variance pour chaque variable dépendante sur toutes les combinaisons deniveaux des facteurs inter-sujets, uniquement pour les facteurs inter-sujets. Lesoptions des diagrammes de dispersion par niveau et de résidus sont utiles pourvérifier les hypothèses sur les données. Ceci n’est pas valable s’il n’y a pas defacteurs. Sélectionnez Diagrammes résiduels pour produire un diagramme résiduelobservé/estimé/standardisé pour chaque variable dépendante. Ces diagrammes sontutiles pour vérifier l’hypothèse de variance égale. Sélectionnez Manque d’ajustement

pour vérifier si la relation entre la variable dépendante et les variables indépendantespeut être convenablement décrite par le modèle. Fonction générale estimée vouspermet de construire des tests d’hypothèses personnalisés basés sur la fonction

Page 477: SPSS Base Users Guide 14.0

451

Analyse GLM – Univarié

générale estimée. Les lignes de n’importe quelle matrice des coefficients de contrastesont des combinaisons linéaires de la fonction générale estimée.

Niveau de signification. Vous souhaitez peut-être ajuster le niveau de significationutilisé dans les tests post hoc et le niveau de confiance utilisé pour construire desintervalles de confiance. La valeur spécifiée est également utilisée pour calculerl’intensité observée pour le test. Lorsque vous spécifiez un niveau de signification, leniveau associé des intervalles de confiance est affiché dans la boîte de dialogue.

Fonctionnalités supplémentaires de la commande UNIANOVA

Le langage de commande SPSS vous permet aussi de :

Spécifier les effets en cascade dans un modèle (à l’aide de la sous-commandeDESIGN).

Spécifier les tests d’effets par rapport à une combinaison linéaire d’effets ou unevaleur (à l’aide de la sous-commande TEST).

Spécifier de multiples contrastes (à l’aide de la sous-commande CONTRAST).

Inclure les valeurs manquantes pour l’utilisateur (à l’aide de la sous-commandeMISSING).

Spécifier les critères EPS (à l’aide de la sous-commande CRITERIA).

Construisez une matrice L personnalisée, une matrice M ou une matrice K (àl’aide des sous-commandes LMATRIX, MMATRIX et KMATRIX).

Pour les contrastes simples ou d’écart, spécifier une modalité de référenceintermédiaire (à l’aide de la sous-commande CONTRAST).

Spécifier les mesures pour les contrastes polynomiaux (à l’aide de lasous-commande CONTRAST).

Spécifier des termes d’erreur pour les comparaisons post hoc (à l’aide de lasous-commande POSTHOC).

Calculer les moyennes marginales estimées pour chaque facteur ou interaction defacteurs parmi les facteurs de la liste (à l’aide de la sous-commande EMMEANS).

Attribuer des noms aux variables temporaires (à l’aide de la sous-commandeSAVE).

Construire un fichier de matrice de corrélation (à l’aide de la sous-commandeOUTFILE).

Page 478: SPSS Base Users Guide 14.0

452

Chapitre 23

Construire un fichier de type matrice de données qui contient les statistiquesprovenant de la table ANOVA inter-sujets (à l’aide de la sous-commandeOUTFILE).

Enregistrer la matrice du plan dans un nouveau fichier de données (à l’aide de lasous-commande OUTFILE).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 479: SPSS Base Users Guide 14.0

Chapitre

24Corrélations bivariées

La procédure de corrélations bivariées calcule le coefficient de corrélation de Pearson,le rho de Spearman et le tau-b de Kendall avec leurs seuils de signification. Lescorrélations mesurent comment les variables ou les ordres de rang sont liés. Avantde calculer un coefficient de corrélation, parcourez vos données pour rechercher lesvaleurs éloignées (qui peuvent provoquer des résultats erronés) et les traces d’unerelation linéaire. Le coefficient de corrélation de Pearson est une mesure d’associationlinéaire. Deux variables peuvent être parfaitement liées, mais si la relation n’est paslinéaire, le coefficient de corrélation de Pearson n’est pas une statistique appropriéepour mesurer leur association.

Exemple. Le nombre de matchs de basket-ball remportés par une équipe est-il lié aunombre moyen de points marqués par match ? Un diagramme de dispersion indiquequ’il existe une relation linéaire. L’analyse des données de la saison NBA 1994–1995démontre que le coefficient de corrélation de Pearson (0,581) est significatif auniveau 0,01. On peut penser que plus on a gagné de matchs dans une saison, moinsl’adversaire a marqué de points. Ces variables sont liées négativement (–0,401) et lacorrélation est significative au niveau 0,05.

Statistiques. Pour chaque variable, on a les éléments suivants : nombre d’observationsavec des valeurs non manquantes, moyenne, et écart-type. Pour chaque paire devariables, on a les éléments suivants : coefficient de corrélation de Pearson, rho deSpearman, tau-b de Kendall, produits des écarts et covariance.

Données. Utilisez des variables quantitatives symétriques pour le coefficient decorrélation de Pearson, et des variables quantitatives ou des variables avec desmodalités ordonnées pour le rho de Spearman et le tau-b de Kendall.

Hypothèses. Le coefficient de corrélation de Pearson part du principe que chaquepaire de variables est gaussienne bivariée.

453

Page 480: SPSS Base Users Guide 14.0

454

Chapitre 24

Figure 24-1Résultats des corrélations bivariées

1.000 .581** -.401*

.581** 1.000 .457*

-.401* .457* 1.000

. .001 .038

.001 . .017

.038 .017 .

27 27 27

27 27 27

27 27 27

Nombre de matchs gagnés

Corrélation de Pearson

Signification (bilatérale)

N

Nombre de matchs

gagnés

Points marqués par match

Points en défense

par match

CorrelationsCorrélations

Corrélation à 0.01(bilatérale) :…**.

Corrélation à 0.05(bilatérale) :…*.

Points marqués par match

Points en défense par match

de matchs gagnés

Points marqués par match

Points en défense par match

Nombre

de matchs gagnés

Points marqués par match

Points en défense par match

Nombre

Pour obtenir des corrélations bivariées

A partir des menus, sélectionnez :Analyse

CorrélationBivariée

Page 481: SPSS Base Users Guide 14.0

455

Corrélations bivariées

Figure 24-2Boîte de dialogue Corrélations bivariées

E Sélectionnez plusieurs variables numériques.

Les options suivantes sont également disponibles :

Coefficients de corrélation. Pour des variables quantitatives, normalementdistribuées, choisissez le coefficient de corrélation de Pearson. Si vos donnéesne sont pas distribuées normalement ou si elles comportent des modalitésordonnées, choisissez le Tau-b de Kendall ou la corrélation de Spearman, quimesure l’association entre les ordres de rangs. Les coefficients de corrélationvont de la valeur –1 (relation négative parfaite) à +1 (relation positive parfaite).La valeur 0 indique l’absence de relation linéaire. Lors de l’interprétation devos résultats, vous ne pouvez pas, à partir de l’existence d’une corrélationsignificative, conclure en l’existence d’une relation de cause à effet.

Test de signification. Vous pouvez choisir des probabilités bilatérales ouunilatérales. Si la direction de l’association est connue à l’avance, choisissezUnilatéral. Sinon, sélectionnez Bilatéral.

Repérer les corrélations significatives. Les coefficients de corrélation significatifsau niveau 0,05 sont identifiés par un seul astérisque et ceux qui sont significatifsau niveau 0,01 sont identifiés par deux astérisques.

Page 482: SPSS Base Users Guide 14.0

456

Chapitre 24

Options de corrélations bivariéesFigure 24-3Boîte de dialogue Corrélations bivariées : Options

Statistiques. Pour les corrélations de Pearson, vous pouvez choisir l’une des optionssuivantes (ou les deux) :

Moyennes et écarts-types.Affichés pour chaque variable. Le nombred’observations avec valeurs non manquantes est également affiché. Les valeursmanquantes sont examinées variable par variable quel que soit votre réglagedes valeurs manquantes.

Produits des écarts et covariances. Indiqués pour chaque paire de variables. Leproduit des écarts est égal à la somme des produits des variables moyennescorrigées. Ceci est le numérateur du coefficient de corrélation de Pearson. Lacovariance est une mesure non standardisée de la relation entre deux variables,égale au produit des écarts divisé par N–1.

Valeurs manquantes. Vous pouvez choisir l’un des éléments suivants :

Exclure seulement les composantes non valides. Les observations avec des valeursmanquantes pour l’une ou les deux variables d’une paire pour un coefficient decorrélation sont exclues de l’analyse. Etant donné que chaque coefficient est basésur toutes les observations ayant des codes valides pour cette paire particulièrede variables, la quantité maximale d’informations disponibles est utilisée danschaque calcul. Ceci peut aboutir à un jeu de coefficients basé sur un nombrevariable d’observations.

Exclure toute observation incomplète. Les observations avec des valeursmanquantes pour une variable sont exclues de toutes les analyses.

Page 483: SPSS Base Users Guide 14.0

457

Corrélations bivariées

Propriétés supplémentaires des commandes CORRELATIONSet NONPAR CORR

Le langage de commande SPSS vous permet aussi de :

Ecrire une f pour les corrélations de Pearson qui peut être utilisée à la place dedonnées brutes pour obtenir d’autres analyses comme une analyse factorielle(avec la sous-commande MATRIX).

Obtenir des corrélations de chaque variable dans une liste avec chaque variabled’une seconde liste (en utilisant le mot clé WITH avec la sous-commandeVARIABLES).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 484: SPSS Base Users Guide 14.0
Page 485: SPSS Base Users Guide 14.0

Chapitre

25Corrélations partielles

La procédure des corrélations partielles calcule les coefficients de corrélation partiellequi décrivent le rapport linéaire entre deux variables tout en contrôlant les effetsd’une ou plusieurs autres variables. Les corrélations sont des mesures d’associationlinéaire. Deux variables peuvent être parfaitement liées mais, si leur rapport n’estpas linéaire, un coefficient de corrélation n’est pas une statistique adaptée pourmesurer leur association.

Exemple. Existe-t-il une relation entre le financement associé aux soins de santéet les taux d’attaque ? Contre toute attente, une étude fait état d’une corrélationpositive : Lorsque le financement associé aux soins de santé augmente, les tauxd’attaque augmentent. Cependant, le contrôle du taux de visite aux fournisseurs desoins de santé supprime presque la corrélation positive observée. Le financementlié aux soins de santé et les taux d’attaque sont associés de manière positive car lenombre de personnes ayant accès aux soins de santé augmente en même temps quele financement. De ce fait, le nombre de maladies déclarées par les docteurs et leshôpitaux augmente également

Statistiques. Pour chaque variable, on a les éléments suivants : nombre d’observationsavec des valeurs non manquantes, moyenne, et écart-type. Matrices de corrélationpartielle et simple, avec degrés de liberté et seuils de signification.

Données. Utiliser des variables quantitatives et symétriques.

Hypothèses. La procédure des Corrélations Partielles suppose que chaque paire devariables présente une corrélation normale.

459

Page 486: SPSS Base Users Guide 14.0

460

Chapitre 25

Figure 25-1Résultats de Corrélations Partielles

Obtenir des corrélations partielles

E A partir des menus, sélectionnez :Analyse

CorrélationPartielle

Page 487: SPSS Base Users Guide 14.0

461

Corrélations partielles

Figure 25-2Boîte de dialogue Corrélations partielles

E Sélectionnez au moins deux variables numériques pour lesquelles vous voulezcalculer des corrélations partielles.

E Sélectionnez une ou plusieurs variables numériques de contrôle.

Les options suivantes sont également disponibles :

Test de signification. Vous pouvez choisir des probabilités bilatérales ouunilatérales. Si la direction de l’association est connue à l’avance, choisissezUnilatéral. Sinon, sélectionnez Bilatéral.

Afficher le seuil exact de signification. La probabilité et les degrés de liberté sontaffichés par défaut pour chaque coefficient de corrélation. Si vous désélectionnezcette option, les coefficients significatifs au seuil 0,05 sont identifiés par uneastérisque, les coefficients significatifs au seuil de 0,01 par deux astérisques, etles degrés de liberté sont supprimés. Cette configuration affecte aussi bien lesmatrices de corrélation partielle que simple.

Page 488: SPSS Base Users Guide 14.0

462

Chapitre 25

Options Corrélations partiellesFigure 25-3Boîte de dialogue Corrélations partielles : Options

Statistiques. Vous avez le choix entre les deux options suivantes :

Moyennes et écarts-types. Affichés pour chaque variable. Le nombred’observations avec valeurs non manquantes est également affiché.

Corrélations simples. Une matrice de corrélations simples entre toutes lesvariables, y compris les variables de contrôle, s’affiche.

Valeurs manquantes. Vous avez le choix entre les options suivantes :

Exclure toute observation incomplète. Les observations ayant des valeursmanquantes pour une variable quelconque, y compris une variable de contrôle,sont exclues de tous les calculs.

Exclure seulement les composantes non valides. Pour le calcul des corrélationssimples sur lesquelles se basent les corrélations partielles, une observationayant des valeurs manquantes pour une composante ou les deux composantesd’une paire de variables ne sera pas utilisée. La suppression des composantesnon valides seulement utilise autant de données que possible. Le nombred’observations peut toutefois différer selon les coefficients. Lorsque lasuppression des composantes non valides seulement est sélectionnée, les degrésde liberté d’un coefficient partiel donné sont basés sur le plus petit nombred’observations utilisées dans le calcul de l’une quelconque des corrélationsd’ordre zéro.

Page 489: SPSS Base Users Guide 14.0

463

Corrélations partielles

Fonctionnalités supplémentaires de la commande PARTIALCORR

Le langage de commande SPSS vous permet aussi de :

Lire une matrice de corrélation d’ordre zéro ou écrire une matrice de corrélationd’ordre zéro (avec la sous-commande MATRIX).

Obtenir des corrélations partielles entre deux listes de variables (en utilisant lemot-clé WITH dans la sous-commande VARIABLES).

Obtenir des analyses multiples (avec les sous-commandes VARIABLES).

Spécifier les valeurs des ordres à demander (par exemple, à la fois les corrélationspartielles de premier et de second ordre) lorsque vous avez deux variables decontrôle (avec la sous-commande VARIABLES).

Supprimer les coefficients redondants (avec la sous-commande FORMAT).

Afficher une matrice de corrélations simples lorsque certains coefficients nepeuvent pas être calculés (avec la sous-commande STATISTICS).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 490: SPSS Base Users Guide 14.0
Page 491: SPSS Base Users Guide 14.0

Chapitre

26Distances

Cette procédure permet de calculer de très nombreuses statistiques mesurantles similitudes ou les différences (distances) entre des paires de variables oud’observations. Vous pourrez ensuite utiliser ces mesures de similarité ou dedissimilarité avec d’autres procédures, comme l’analyse factorielle, la classificationou le positionnement multidimensionnel, afin de simplifier l’analyse des ensemblesde données complexes.

Exemple. Est-il possible de mesurer les similarités entre des paires de voituresen fonction de certaines caractéristiques, comme le nombre de cylindres, laconsommation et la puissance ? En calculant les similarités existant entre desvoitures, vous pouvez déterminer les voitures qui sont semblables et celles qui sontdifférentes. Dans l’optique d’une analyse plus formelle, vous pouvez appliquer uneclassification hiérarchique ou un positionnement multidimensionnel aux similaritésafin d’examiner la structure sous-jacente.

Statistiques. Pour les données d’intervalle, les mesures de dissimilarité sont la distanceEuclidienne, le carré de la distance Euclidienne, la distance de Tchebycheff, ladistance de Manhattan (bloc), la distance de Minkowski ou une mesure personnalisée.Pour les données d’effectif, les mesures sont Chi-deux et phi-deux. Pour les donnéesbinaires, les mesures de dissimilarité sont la distance Euclidienne, le carré de ladistance Euclidienne, l’écart de taille, la différence de motif, la variance, la forme,ou la mesure de Lance et Williams. Pour les données d’intervalles, les mesures desimilarité sont la corrélation de Pearson ou cosinus. Pour les données binaires, ils’agit des mesures suivantes : Russel et Rao, indice de Sokal et Michener, Jaccard,Dice, Rogers et Tanimoto, Sokal et Sneath 1, Sokal et Sneath 2, Sokal et Sneath 3,Kulczynski 1, Kulczynski 2, Sokal et Sneath 4, Hamann, lambda, D d’Anderberg, Y deYule, Q de Yule, Ochiai, Sokal et Sneath 5, corrélation phi tétrachorique ou dispersion.

465

Page 492: SPSS Base Users Guide 14.0

466

Chapitre 26

Pour obtenir des matrices de distance

E A partir des menus, sélectionnez :Analyse

CorrélationIndices

Figure 26-1Boîte de dialogue Distances

E Sélectionnez au minimum une ou deux variables numériques pour calculerrespectivement les distances existant entre des observations ou des variables.

E Sélectionnez une possibilité dans le groupe Calculer les distances pour calculer lesproximités existant entre des observations ou des variables.

Page 493: SPSS Base Users Guide 14.0

467

Distances

Distances : Mesures de dissimilaritéFigure 26-2Boîte de dialogue Indices : Mesures de dissimilarité

Dans le groupe Mesure, sélectionnez la possibilité qui correspond au type de vosdonnées (intervalle, effectif ou binaire). Ensuite, dans la liste déroulante, sélectionnezl’une des mesures correspondant à ce type de données. Les mesures disponiblessont, par type de données :

Intervalle. Distance Euclidienne, Carré de la distance Euclidienne, Distance deTchebycheff, Distance de Manhattan, Distance de Minkowski ou Autre.

Effectifs. Distance du Chi-deux ou Distance du phi-deux.

Binaire. Distance Euclidienne, Carré de la distance Euclidienne, Ecart de taille,Différence de motif, Variance, Forme, ou Lance et Williams. (Entrez des valeursdans les champs Présent et Absent pour indiquer les deux valeurs significatives.Aucune autre valeur ne sera prise en compte dans Distances.)

Le groupe Transformer les valeurs vous permet de standardiser les valeurs desdonnées pour les observations ou les variables avant le calcul des proximités.Ces transformations ne s’appliquent pas aux données binaires. Les méthodesde standardisation disponibles sont Centrer-réduire, Entre –1 et 1, Entre 0 et 1,Maximum = 1, Moyenne = 1 et Ecart type = 1.

Page 494: SPSS Base Users Guide 14.0

468

Chapitre 26

Le groupe Transformer les mesures vous permet de transformer les valeursgénérées par la mesure de distance. Elles sont appliquées après le calcul de lamesure de distance. Les options possibles sont Valeurs absolues, Inverser le signe, etRééchelonner entre 0 et 1.

Indices : Mesures de similaritéFigure 26-3Boîte de dialogue Indices : Mesures de similarité

Dans le groupe Mesure, sélectionnez la possibilité qui correspond au type de vosdonnées (intervalle ou binaire). Ensuite, dans la liste déroulante, sélectionnez l’unedes mesures correspondant à ce type de données. Les mesures disponibles sont, partype de données :

Intervalle. Corrélation de Pearson ou Cosinus.

Binaire. Russel et Rao, Indice de Sokal et Michener, Jaccard, Dice, Rogers etTanimoto, Sokal et Sneath 1, Sokal et Sneath 2, Sokal et Sneath 3, Kulczynski1, Kulczynski 2, Sokal et Sneath 4, Hamann, Lambda, D d’Anderberg, Y deYule, Q de Yule, Ochiai, Sokal et Sneath 5, Corrélation phi tétrachorique ouDispersion. (Entrez des valeurs dans les champs Présent et Absent pour indiquerles deux valeurs significatives. Aucune autre valeur ne sera prise en comptedans Distances.)

Page 495: SPSS Base Users Guide 14.0

469

Distances

Le groupe Transformer les valeurs vous permet de standardiser les valeurs desdonnées pour les observations ou les variables avant le calcul des proximités.Ces transformations ne s’appliquent pas aux données binaires. Les méthodesde standardisation disponibles sont Centrer-réduire, Entre –1 et 1, Entre 0 et 1,Maximum = 1, Moyenne = 1 ou Ecart type = 1.

Le groupe Transformer les mesures vous permet de transformer les valeursgénérées par la mesure de distance. Elles sont appliquées après le calcul de lamesure de distance. Les options possibles sont Valeurs absolues, Inverser le signe, etRééchelonner entre 0 et 1.

Fonctionnalités supplémentaires de la commandePROXIMITIES

La procédure Distances utilise la syntaxe de la commande PROXIMITIES. Le langagede commande SPSS vous permet aussi de :

Indiquez un nombre entier comme la puissance pour la mesure de distance deMinkowski.

Indiquez des nombres entiers comme la puissance et la racine pour une mesure dedistance personnalisée.

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 496: SPSS Base Users Guide 14.0
Page 497: SPSS Base Users Guide 14.0

Chapitre

27Régression linéaire

La régression linéaire estime les coefficients de l’équation linéaire, impliquant uneou plusieurs variables indépendantes, qui estiment le mieux la valeur de la variabledépendante. Par exemple, vous pouvez essayer d’estimer les ventes annuellesglobales d’un commercial (la variable dépendante) à partir de variables indépendantestelles que l’âge, l’éducation et les années d’expérience.

Exemple. Le nombre de matches gagnés par une équipe de basket-ball au cours d’unesaison est-il lié au nombre moyen de points marqués par l’équipe à chaque match? Un diagramme de dispersion indique que ces variables ont un lien linéaire. Lenombre de matches gagnés et le nombre moyen de points marqué par l’équipe adverseont également un lien linéaire. Ces variables ont une relation négative. Lorsque lenombre de matches gagnés augmente, le nombre moyen de points marqués par lesadversaires diminue. A l’aide de la régression linéaire, vous pouvez modéliser larelation entre ces variables. Un bon modèle peut être utilisé pour prévoir combien dematches les équipes vont gagner.

Statistiques. Pour chaque variable, on a les éléments suivants : nombre d’observationsvalides, moyenne et écart-type. Pour chaque modèle : coefficients de régression,matrice de corrélations, mesures et corrélations partielles, R multiple, R2, R2

ajusté, variation de R2, erreur standard de l’estimation, tableau d’analyse de lavariance, prévisions et résidus. En plus, intervalles de confiance à 95 % pour chaquecoefficient de régression, matrice variances-covariances, facteur d’inflation de lavariance, tolérance, test de Durbin-Watson, mesures de distances (Mahalanobis,Cook, et valeurs influentes), DfBêta, différence de prévision, intervalles d’estimationet diagnostics des observations. Diagrammes : dispersion, diagrammes partiels,histogrammes et diagrammes de répartition gaussiens.

471

Page 498: SPSS Base Users Guide 14.0

472

Chapitre 27

Données. Les variables dépendantes et indépendantes doivent être quantitatives. Lesvariables qualitatives, comme la religion, la qualification, la zone de résidence,doivent être enregistrées sous forme de variables binaires (muettes) ou sous de toutautre type de variables de contraste.

Hypothèses. Pour chaque valeur de la variable indépendante, la distribution de lavariable dépendante doit être normale. La variance de la distribution de la variabledépendante doit être constante pour toutes les valeurs de la variable indépendante. Larelation entre la variable dépendante et chaque variable indépendante doit être linéaireet toutes les observations doivent être indépendantes.

Figure 27-1Résultat de régression linéaire

Page 499: SPSS Base Users Guide 14.0

473

Régression linéaire

défense par match, points marqués par match

1,2

. .947 .898 .889 4.40

1ModèleEntrées Supprimées

Variables

R R carré R carré ajustéErreur std.

de l'estimation

Résumé de modèle 3,4

Variables indép. : (constante) points en défense par match, points marqués par match…1.

Toutes les variables requises entrées.2.

Variable dépendante : nombre de matchs gagnés3.

Méthode : introduction simultanée4.

Points en

4080.533 2 2040.266 105.198 .0001

465.467 24 19.394

4546.000 26

Régression

Résidus

Total

1Modèle

Somme des carrés df Carré moyen F Significatif

ANOVA2

Variables indép. : (constante) points en défense par match, points marqués par match…1.

Variable dépendante : nombre de matchs gagnés2.

Page 500: SPSS Base Users Guide 14.0

474

Chapitre 27

Coefficients non standardisés

Coefficients standardisés

Erreur std. Bêta(constante)

Modèle

Points marqués par match

Points en défense par match

Variable dépendante : nombre de matchs gagnés

Obtenir une analyse de régression linéaire

E A partir des menus, sélectionnez :Analyse

RégressionLinéaire

Page 501: SPSS Base Users Guide 14.0

475

Régression linéaire

Figure 27-2Boîte de dialogue Régression linéaire

E Dans la boîte de dialogue Régression linéaire, sélectionnez une variable numériquedépendante.

E Sélectionnez une ou plusieurs variables indépendantes.

Sinon, vous pouvez :

Grouper des variables indépendantes en blocs et spécifier différentes méthodesd’entrée pour différents sous-groupes de variables.

Choisir une variable de sélection pour limiter l’analyse à un sous-grouped’observations ayant une ou des valeurs particulières pour cette variable.

Sélectionner une variable d’identification d’observations pour identifier despoints sur les diagrammes.

Sélectionnez une variable de pondération WLS numérique pour une analysedes moindres carrés pondérés.

Page 502: SPSS Base Users Guide 14.0

476

Chapitre 27

WLS. Permet d'obtenir un modèle des moindres carrés pondéré. Les points de donnéessont pondérés par l'inverse de leur variance. Ainsi, les observations dont la varianceest élevée ont moins d'impact sur l'analyse que celles dont la variance est faible. Si lavaleur de la variable de pondération est nulle, négative ou manquante, l'observationest exclue de l'analyse.

Méthodes de sélection des variables de régression linéaire

La sélection d’une méthode vous permet de spécifier la manière dont les variablesindépendantes sont entrées dans l’analyse. En utilisant différentes méthodes, vouspouvez construire divers modèles de régression à partir du même groupe de variables.

Introduire (régression). Procédure de sélection de variables au cours de laquelletoutes les variables d'un bloc sont introduites en une seule opération.

Pas à pas. A chaque étape, le programme saisit la variable indépendante excluede l'équation ayant la plus petite probabilité de F, si cette probabilité estsuffisamment faible. Les variables déjà comprises dans l'équation de régressionsont éliminées si leur probabilité de F devient trop grande. Le processus s'arrêtelorsqu'aucune variable ne peut plus être introduite ou éliminée.

Eliminer bloc. Procédure de sélection de variables dans laquelle toutes lesvariables d'un bloc sont supprimées en une seule étape.

Elimination descendante. Procédure de sélection de variables au cours de laquelletoutes les variables sont entrées dans l'équation, puis éliminées une à une. Lavariable ayant la plus petite corrélation partielle avec la variable dépendanteest la variable dont l'élimination est étudiée en premier. Si elle répond auxcritères d'élimination, elle est supprimée. Une fois la première variable éliminée,l'élimination de la variable suivante restant dans l'équation et ayant le plus petitcoefficient de corrélation partielle est étudiée. La procédure prend fin quand plusaucune variable de l'équation ne satisfait aux critères d'élimination.

Introduction ascendante. Procédure de sélection pas à pas de variables, danslaquelle les variables sont introduites séquentiellement dans le modèle. Lapremière variable considérée est celle qui a la plus forte corrélation positiveou négative avec la variable dépendante. Cette variable n'est introduite dansl'équation que si elle satisfait le critère d'introduction. Si la première variableest introduite dans l'équation, la variable indépendante externe à l'équationet qui présente la plus forte corrélation partielle est considérée ensuite. La

Page 503: SPSS Base Users Guide 14.0

477

Régression linéaire

procédure s'interrompt lorsqu'il ne reste plus de variables satisfaisant au critèred'introduction.

Les valeurs de significativité dans vos résultats sont basées sur l’adéquation à unmodèle unique. Par conséquent, les valeurs de significativité ne sont généralementpas valables lorsqu’on utilise une méthode progressive (Pas à pas, Ascendante ouDescendante).

Toutes les variables doivent respecter le critère de tolérance pour être entrées dansl’équation, quelle que soit la méthode d’entrée spécifiée. Le niveau de tolérance pardéfaut est 0,0001. Une variable n’est pas entrée si elle fait passer la tolérance d’uneautre variable déjà entrée dans le modèle en dessous du seuil de tolérance.

Toutes les variables indépendantes sélectionnées sont ajoutées dans un seul modèlede régression. Cependant, vous pouvez spécifier différentes méthodes d’entrée pourles sous-groupes de variables. Par exemple, vous pouvez entrer un bloc de variablesdans le modèle de régression en utilisant la sélection pas à pas, et un second bloc enutilisant la sélection ascendante. Pour ajouter un second bloc de variables au modèlede régression, cliquez sur Suivant.

Régression linéaire : Définir la règleFigure 27-3Boîte de dialogue Régression linéaire : Définir loi

Les observations définies par la règle de sélection sont incluses dans l’analyse. Parexemple, si vous sélectionnez une variable, choisissez égale et saisissez 5 pour lavaleur, alors seules les observations pour lesquelles la variable sélectionnée a unevaleur égale à 5 seront incluses dans l’analyse. Une valeur chaîne est égalementpermise.

Page 504: SPSS Base Users Guide 14.0

478

Chapitre 27

Diagrammes de régression linéaireFigure 27-4Boîte de dialogue Régression linéaire : Graphiques (diagrammes)

Les diagrammes peuvent aider à valider les hypothèses de normalité, linéarité etd’égalité des variances. Les diagrammes sont également utiles pour détecter lesvaleurs éloignées, les observations éloignées et les observations influentes. Aprèsavoir été enregistrés comme variables nouvelles, les prévisions, résidus et autresdiagnostics sont disponibles dans l’éditeur de données pour construire des diagrammesavec les variables indépendantes. Les diagrammes suivants sont disponibles :

Diagrammes de dispersion. Vous pouvez afficher deux des éléments suivants : lavariable dépendante, les prévisions standardisées, les résidus standardisés, les résidussupprimés, les prévisions ajustées, les résidus standardisés et les résidus supprimés deStudent. Affichez les résidus standardisés par rapport aux prévisions standardiséespour vérifier la linéarité et l’égalité des variances.

Liste des variables sources. Répertorie la variable dépendante (DEPENDNT), ainsique les variables prévues et les résidus suivants : prévisions standardisées (*ZPRED),résidus standardisés (*ZRESID), résidus supprimés (*DRESID), prévisions ajustées(*ADJPRED), résidus de Student (*SRESID), résidus supprimés de Student(*SDRESID).

Générer tous les graphiques partiels. Affiche des diagrammes de dispersion des résidusde chaque variable indépendante et les résidus de la variable dépendante lorsqueles deux variables sont régressées séparément par rapport au reste des variables

Page 505: SPSS Base Users Guide 14.0

479

Régression linéaire

indépendantes. Au moins deux variables indépendantes doivent être dans l’équationpour produire un diagramme partiel.

Diagrammes des résidus standardisés. Vous pouvez obtenir des histogrammes desrésidus standardisés et des diagrammes de répartition gaussiens en comparant larépartition des résidus standardisés à une répartition gaussienne.

Si vous demandez des diagrammes, des statistiques récapitulatives sont affichées pourles prévisions standardisées et les résidus standardisés (*ZPRED et *ZRESID).

Régression linéaire : Enregistrer de nouvelles variablesFigure 27-5Boîte de dialogue Régression linéaire : Enregistrer les nouvelles variables

Page 506: SPSS Base Users Guide 14.0

480

Chapitre 27

Vous pouvez enregistrer les prévisions, les résidus et autres statistiques utiles pourles diagnostics. Chaque sélection ajoute une ou plusieurs variables à votre fichierde données actif.

Prévisions. Valeurs prévues par le modèle de régression pour chaque observation.

Non standardisés. Valeur prévue par le modèle pour la variable dépendante.

Standardisés. Transformation de chaque prévision en sa forme standardisée. Laprévision moyenne est soustraite de la prévision, et la différence est divisée parl'écart-type des prévisions. Les prévisions standardisées ont une moyenne de 0et un écart-type de 1.

Ajustées. Prévision pour une observation exclue du calcul des coefficients derégression.

Erreur standard prévision moyenne. Erreurs standard des prévisions. Estimation del'écart-type de la valeur moyenne de la variable dépendante, pour les observationsayant la même valeur pour les variables indépendantes.

Distances. Mesures permettant d’identifier les observations avec des combinaisonsinhabituelles de valeurs pour les variables indépendantes et les observations quipeuvent avoir un impact important sur le modèle.

Mahalanobis. Mesure de la distance entre les valeurs d'une observation et lamoyenne de toutes les observations sur les variables indépendantes. Une distancede Mahalanobis importante identifie une observation qui a des valeurs extrêmespour des variables indépendantes.

Cook. Mesure permettant de savoir de combien les résidus de toutes lesobservations seraient modifiés si une observation donnée était exclue du calculdes coefficients de régression. Si la distance de Cook est élevée, l'exclusion d'uneobservation changerait substantiellement la valeur des coefficients.

Valeurs influentes. Mesures de l'influence d'un point sur l'ajustement de larégression. La valeur influente centrée varie de 0 (aucune influence sur la qualitéde l'ajustement) à (N-1)/N.

Intervalles de la prévision. Les limites supérieure et inférieure pour les intervallesde la prévision moyenne et individuelle.

Moyenne. Limites inférieure et supérieure (deux variables) de l'intervalle deprévision de la réponse moyenne prévue.

Page 507: SPSS Base Users Guide 14.0

481

Régression linéaire

Individuelle. Limites inférieure et supérieure (deux variables) de l'intervalle deprévision de la variable dépendante pour une observation particulière.

Intervalle de confiance. Entrez une valeur comprise entre 1 et 99,99 pour spécifierle seuil de confiance pour les deux intervalles de la prévision. Vous devezsélectionner Moyenne ou Individuelle avant d'entrer cette valeur. Les seuilsd'intervalle de confiance typiques sont 90, 95 et 99.

Résidus. La valeur réelle de la variable indépendante moins la valeur prévue parl’équation de régression.

Non standardisés. Différence entre la valeur observée et la valeur prévue par lemodèle.

Standardisés. Résidu divisé par une estimation de son écart-type. Egalementappelés résidus de Pearson, les résidus standardisés ont une moyenne de 0 etun écart-type de 1.

Studentisés. Résidu, divisé par une estimation de son écart-type, qui varie d'uneobservation à une autre, selon la distance entre les valeurs et la moyenne desvariables indépendantes pour chaque observation.

Supprimées. Résidu d'une observation lorsque celle-ci est exclue du calcul descoefficients de régression. Il s'agit de la différence entre la valeur de la variabledépendante et la prévision ajustée.

Supprimés studentisés. Résidu supprimé d'une observation, divisé par son erreurstandard. La différence entre le résidu supprimé de Student et le résidu deStudent associé indique l'impact de l'élimination d'une observation sur sa propreprédiction.

Influences individuelles. La modification des coefficients de régression (DfBêta(s)) etdes prévisions (différence de prévision) qui résulte de l’exclusion d’une observationparticulière. Les valeurs DfBêtas et de différence de prévision standardisées sontégalement disponibles ainsi que le rapport de covariance.

DfBêta(s). La différence de bêta correspond au changement des coefficients derégression qui résulte du retrait d'une observation particulière. Une valeur estcalculée pour chaque terme du modèle, y compris la constante.

DfBêta(s) standardisée. Différence standardisée de la valeur bêta. Modificationdu coefficient de régression, résultant de l'exclusion d'une observation donnée.Vous pouvez par exemple examiner les observations ayant des valeurs absoluessupérieures à 2, divisées par la racine carrée de N, N représentant le nombre

Page 508: SPSS Base Users Guide 14.0

482

Chapitre 27

d'observations. Une valeur est calculée pour chaque terme du modèle, y comprisla constante.

Différence de prévision. La différence de prévision est le changement de laprévision résultant de l'exclusion d'une observation donnée.

Dfprévision standardisée. Différence standardisée de la valeur ajustée.Modification de la prévision qui résulte de l'exclusion d'une observation donnée.Vous pouvez par exemple examiner les valeurs standardisées dont la valeurabsolue est supérieure à 2 fois la racine carrée de p/N, p correspondant au nombrede paramètres du modèle et N, au nombre d'observations.

Rapport de covariance. Rapport entre le déterminant de la matrice devariance-covariance si une observation donnée a été exclue du calcul descoefficients de régression et le déterminant de la matrice de covariance avectoutes les observations incluses. Si le rapport est proche de 1, l'observationmodifie peu la matrice de covariance.

Statistiques à coefficients. Enregistre les coefficients de régression dans un ensemblede données ou dans un fichier de données. Les ensembles de données sont disponiblespour utilisation ultérieure dans la même session mais ne sont pas enregistrés en tantque fichiers sauf si vous le faites explicitement avant la fin de la session. Les nomsdes ensembles de données doivent être conformes aux règles de dénomination devariables SPSS. Pour plus d'informations, reportez-vous à « Noms de variable »dans Chapitre 5 à p. 99.

Exporter les informations du modèle dans un fichier XML. Les estimations de paramètreset leurs covariances (facultatif) sont exportées vers le fichier spécifié au formatXML (PMML). SmartScore et le serveur SPSS (produit séparé) peuvent utiliser cefichier de modèle pour appliquer les informations du modèle à d’autres fichiers dedonnées à des fins d’analyse.

Page 509: SPSS Base Users Guide 14.0

483

Régression linéaire

Statistiques de régression linéaireFigure 27-6Boîte de dialogue Régression linéaire : Statistiques

Les statistiques suivantes sont disponibles :

Coefficients de régression. L’option Estimations affiche le coefficient de régression B,l’erreur standard de B, le coefficient bêta standardisé, la valeur t de B et le niveau designification bilatéral de t. L’option Intervalles de confiance affiche les intervalles deconfiance à 95 % pour chaque coefficient de régression ou une matrice de covariance.L’option Matrice de covariance affiche la matrice de variance-covariance descoefficients de régression avec les covariances hors de la diagonale et les variancesdans la diagonale. Une matrice de corrélation est également affichée.

Qualité de l’ajustement. Les variables entrées et supprimées du modèle sont listées etles statistiques de la qualité de l’ajustement suivantes sont affichées : R multiple, R2

et R2 ajusté, erreur standard de l’estimation et un tableau d’analyse de variance.

Variation de R-deux. Variation de la statistique du R2 obtenue en ajoutant ou enenlevant une variable indépendante. Si la variation du R2 associée à une variable estimportante, cela signifie que la variable est une bonne explication de la variabledépendante.

Page 510: SPSS Base Users Guide 14.0

484

Chapitre 27

Descriptives. Fournit le nombre d’observations valides, la moyenne et l’écart-typede chaque variable de l’analyse. Une matrice de corrélations avec le seuil designification unilatéral et le nombre d’observations pour chaque corrélation sontégalement affichés.

Corrélation partielle :. Corrélation résiduelle entre deux variables après l'éliminationde la corrélation due à leur association mutuelle avec les autres variables. Il s'agitde la corrélation entre la variable dépendante et une variable indépendante lorsqueles effets linéaires des autres variables indépendantes du modèle ont été éliminésdes deux variables.

Mesure. Il s'agit de la corrélation entre la variable dépendante et une variableindépendante lorsque les effets linéaires des autres variables indépendantes dumodèle ont été éliminés de la variable indépendante. Elle est liée à la modification duR-deux lorsqu'une variable est ajoutée à une équation. (Parfois appelée corrélationsemi-partielle.)

Tests de colinéarité. La colinéarité (ou multicolinéarité) est la situation indésirable oùune variable indépendante est une fonction linéaire d’autres variables indépendantes.Les valeurs propres de la matrice des produits croisés dimensionnés et non centrés,les indices de conditionnement et les proportions de décomposition de variance sontaffichés ainsi que les facteurs d’inflation de la variance (VIF) et les tolérances pourles variables individuelles.

Résidus. Affiche le test de Durbin-Watson de corrélation sérielle des résidus et lediagnostic des observations correspondant au critère de sélection (valeurs éloignéesde n écarts-types).

Page 511: SPSS Base Users Guide 14.0

485

Régression linéaire

Régression linéaire : OptionsFigure 27-7Boîte de dialogue Régression linéaire : Options

Les options suivantes sont disponibles :

Paramètres des méthodes progressives. Ces options sont valables lorsque la méthodede sélection ascendante, descendante ou progressive a été sélectionnée. Des variablespeuvent être entrées ou supprimées du modèle soit en fonction de la signification(probabilité) de la valeur F, soit en fonction de la valeur F elle-même.

Choisir la probabilité de F. Une variable est entrée dans le modèle si le seuil designification de la valeur F est supérieur à la valeur Entrée ; la variable estéliminée si ce seuil est supérieur à la valeur Elimination. La valeur Entrée doitêtre inférieure à la valeur Elimination et toutes deux doivent être positives. Pourintroduire davantage de variables dans le modèle, diminuez la valeur Entrée. Pouréliminer davantage de variables du modèle, réduisez la valeur Elimination.

Choisir la valeur de F. Une variable est introduite dans un modèle si sa valeur F estsupérieure à la valeur Entrée et elle est éliminée si la valeur F est inférieure à lavaleur Elimination. La valeur Entrée doit être supérieure à la valeur Eliminationet toutes deux doivent être positives. Pour introduire davantage de variablesdans le modèle, réduisez la valeur du champ Entrée. Pour éliminer davantage devariables dans le modèle, augmentez la valeur du champ Elimination.

Page 512: SPSS Base Users Guide 14.0

486

Chapitre 27

Inclure terme constant dans l’équation. Par défaut, le modèle de régression inclut unterme constant. Désélectionner cette option force la régression jusqu’à l’origine, cequi est rarement utilisé. Certains résultats de la régression jusqu’à l’origine ne sontpas comparables aux résultats de la régression incluant une constante. Par exemple,R2 ne peut pas être interprété de la manière habituelle.

Valeurs manquantes. Vous pouvez choisir l’un des éléments suivants :

Exclure toute observation incomplète. Seules les observations dont les valeurs sontvalides pour toutes les variables sont incluses dans les analyses.

Exclure seulement les composantes non valides. Les observations pour lesquellesles données sont complètes pour la paire de variables corrélées sont utilisées pourcalculer le coefficient de corrélation sur lequel l’analyse de régression est basée.Les degrés de liberté sont basés sur le minimum N par paire.

Remplacer par la moyenne. Toutes les observations sont utilisées pour les calculs,en substituant la moyenne de la variable aux observations manquantes.

Fonctionnalités supplémentaires de la commande REGRESSION

Le langage de commande SPSS vous permet aussi de :

Ecrire une matrice de corrélation ou lire une matrice à la place de données brutesafin d’obtenir une analyse de régression (avec la sous-commande MATRIX).

Spécifier des niveaux de tolérance (avec la sous-commande CRITERIA).

Obtenir plusieurs modèles pour des variables dépendantes différentes ouidentiques (avec les sous-commandes METHOD et DEPENDENT).

Obtenir des statistiques supplémentaires (avec les sous-commandesDESCRIPTIVES et STATISTICS).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 513: SPSS Base Users Guide 14.0

Chapitre

28Ajustement de fonctions

La procédure d’ajustement de fonctions produit des statistiques de régressiond’ajustement de fonctions et les diagrammes relatifs pour 11 modèles différents derégression d’ajustement de fonctions. Un modèle différent est produit pour chaquevariable dépendante. Vous pouvez aussi enregistrer les prévisions, les résidus et lesintervalles de la prévision comme nouvelles variables.

Exemple. Un fournisseur de services Internet suit le pourcentage dans le temps dutrafic de messages électroniques infectés par un virus sur ses réseaux. Un diagrammede dispersion révèle que la relation n’est pas linéaire. Vous pouvez ajuster un modèlequadratique ou cubique en fonction des données, vérifier la validité des hypothèses etla qualité d’ajustement du modèle.

Statistiques. Pour chaque modèle : coefficients de régression, R multiples, R2, R2

ajusté, erreur standard de la prévision, tableau d’analyse de la variance, prévisions,résidus et intervalles de prévision. Modèles : linéaire, logarithmique, inverse,quadratique, cubique, de puissance, composé, en S, logistique, de croissance etexponentiel.

Données.Les variables dépendantes et indépendantes doivent être quantitatives. Sivous sélectionnez Temps à partir de l’ensemble de données actif comme variableindépendante (au lieu de sélectionner une variable), la procédure Ajustement defonctions génère une variable de temps où la durée entre les observations estuniforme. Si Temps est sélectionné, la variable dépendante doit être une mesure deséries chronologiques. L’analyse des séries chronologiques nécessite une structure defichier de données dans lequel chaque observation (rangée) représente un ensembled’observations à des moments différents et où la durée entre les observations estuniforme.

Hypothèses. Vérifiez vos données graphiquement pour déterminer commentsont reliées les variables indépendantes et dépendantes (de manière linéaire ouexponentielle, etc.). Les résidus d’un bon modèle doivent être répartis aléatoirement

487

Page 514: SPSS Base Users Guide 14.0

488

Chapitre 28

et doivent être normaux. Si vous utilisez un modèle linéaire, les hypothèses suivantesdoivent être vérifiées : pour chaque valeur de la variable indépendante, la distributionde la variable dépendante doit être normale. La variance de la distribution dela variable dépendante doit être constante pour toutes les valeurs de la variableindépendante. La relation entre la variable dépendante et la variable indépendantedoit être linéaire, et toutes les observations doivent être indépendantes.

Figure 28-1Ajustement de fonctions - Tableau récapitulatif

Figure 28-2Ajustement de fonctions - Analyse de la variance (ANOVA)

Figure 28-3Ajustement de fonctions - Coefficients

Page 515: SPSS Base Users Guide 14.0

489

Ajustement de fonctions

Figure 28-4Ajustement de fonctions - Diagramme

Pour obtenir un ajustement de fonctions

E A partir des menus, sélectionnez :Analyse

RégressionAjustement de fonctions

Page 516: SPSS Base Users Guide 14.0

490

Chapitre 28

Figure 28-5Boîte de dialogue Ajustement de fonctions

E Sélectionnez au moins une variable dépendante. Un modèle différent est produitpour chaque variable dépendante.

E Sélectionnez une variable indépendante (une variable dans le fichier de travail ou dansl’ensemble de données actif ou Temps).

E Eventuellement :

Sélectionner une variable pour étiqueter des observations dans les diagrammesde dispersion. Pour chaque point du diagramme de dispersion, utilisez l’outilde sélection de points pour afficher la valeur de la variable avec Etiquetted’observation.

Cliquez sur Enregistrer pour enregistrer les prévisions, les résidus et les intervallesde prévision comme nouvelles variables.

Les options suivantes sont également disponibles :

Inclure terme constant dans l’équation. Evalue un terme constant dans l’équationde régression. La constante est incluse par défaut.

Page 517: SPSS Base Users Guide 14.0

491

Ajustement de fonctions

Représenter sous forme graphique. Représente graphiquement les valeurs de lavariable dépendante et chaque modèle sélectionné face à la variable indépendante.Un diagramme séparé est produit pour chaque variable dépendante.

Afficher le tableau ANOVA. Affiche un tableau récapitulatif de l’analyse de lavariance pour chaque modèle sélectionné.

Modèles d’ajustement de fonctionsVous pouvez choisir des modèles de régression d’ajustement de fonctions. Pourdéterminer quel modèle utiliser, représentez vos données sous forme graphique. Si vosvariables semblent être liées linéairement, utilisez un modèle de régression linéairesimple. Lorsque vos variables ne sont pas liées linéairement, essayez de transformervos données. Lorsque la transformation n’améliore pas les choses, vous devrezpeut-être utiliser un modèle plus élaboré. Observez un diagramme de dispersion devos données. Si le diagramme ressemble à une fonction mathématique que vousreconnaissez, ajustez vos données en fonction de ce type de modèle. Par exemple, sivos données ressemblent à une fonction exponentielle, utilisez un modèle exponentiel.

Linéaire. Modèle dont l'équation est Y = b0 + (b1 * t). Les valeurs de la série sontmodélisées comme fonction linéaire du temps.

Logarithmique. Modèle dont l'équation est Y = b0 + (b1 * ln(t)).

Inverse. Modèle dont l'équation est Y = b0 + (b1 / t).

Quadratique. Modèle dont l'équation est Y = b0 + (b1 * t) + (b2 * t**2). Le modèlequadratique peut être utilisé pour modéliser une série qui « décolle » ou qui s'amortitde manière oscillatoire.

Cubique. Modèle défini par l'équation Y = b0 + (b1 * t) + (b2 * t**2) + (b3 * t**3).

De puissance. Modèle dont l'équation est Y = b0 * (t**b1) ou ln(Y) = ln(b0) + (b1 *ln(t)).

Composé. Modèle dont l'équation est la suivante : Y = b0 * (b1**t) ou ln(Y) = ln(b0)+ (ln(b1) * t).

En S. Modèle dont l'équation est Y = e**(b0 + (b1/t)) ou ln(Y) = b0 + (b1/t).

Logistique. Modèle dont l'équation est Y = 1 / (1/u + (b0 * (b1**t))) ou ln(1/y-1/u)= ln(b0) + (ln(b1)*t), u étant la valeur de la borne supérieure. Après avoir sélectionnéla logistique, précisez la valeur de la borne supérieure à utiliser dans l'équation de

Page 518: SPSS Base Users Guide 14.0

492

Chapitre 28

régression. La valeur doit être un nombre positif supérieur à la plus grande valeur dela variable dépendante.

De croissance. Modèle dont l'équation est Y = e**(b0 + (b1 * t)) ou ln(Y) = b0 +(b1 * t).

Exponentielle. Modèle dont l'équation est Y = b0 * (e**(b1 * t)) ou ln(Y) = ln(b0) +(b1 * t).

Enregistrement de l’ajustement de fonctionsFigure 28-6Boîte de dialogue Ajustement de fonctions : Enregistrer

Enregistrer les variables. Pour chaque modèle sélectionné, vous pouvez enregistrer lesprévisions, les résidus (valeur observée de la variable dépendante moins la prévisiondu modèle) et les intervalles de prévision (limites supérieure et inférieure). Lesnouveaux noms de variable et les étiquettes descriptives s’affichent dans un tableaudans la fenêtre de résultats.

Calculer une prévision. Si, dans l’ensemble de données actif, vous sélectionnez Temps

à la place d’une variable comme variable indépendante, vous pouvez spécifier unepériode de prévision au-delà de la fin de la série chronologique. Vous avez le choixentre les options suivantes :

A partir d’une estimation limitée à une période. Prévoit les valeurs pour toutes lesobservations du fichier, à partir des observations de la période d’estimation. Lapériode d’estimation qui s’affiche en bas de la boîte de dialogue est définie avecla boîte de sous dialogue Intervalle de l’option Sélectionner des observations

Page 519: SPSS Base Users Guide 14.0

493

Ajustement de fonctions

du menu Données. Si aucune période d’estimation n’a été définie, toutes lesobservations sont utilisées pour prévoir les valeurs.

Jusqu’à. Prévoit les valeurs jusqu’à la date, l’heure ou le numéro de l’observationspécifié, à partir des observations de la période d’estimation. Cette fonctionnalitépeut être utilisée pour prévoir les valeurs au-delà de la dernière observation dela série chronologique. Les variables courantes de date définies déterminentles zones de texte disponibles pour la spécification de la fin de la période deprévision. Si aucune variable de date n’est définie, vous pouvez spécifier lenuméro de l’observation finale.

Utilisez l’option Définir des dates... dans le menu Données pour créer des variablesde date.

Page 520: SPSS Base Users Guide 14.0
Page 521: SPSS Base Users Guide 14.0

Chapitre

29Analyse discriminante

L’analyse discriminante est utile pour construire un modèle de prévision de grouped’affectation basé sur les caractéristiques observées de chaque observation. Laprocédure génère une fonction discriminante (ou, pour plus de deux groupes, unensemble de fonctions discriminantes) basée sur les combinaisons linéaires desvariables explicatives qui donnent la meilleure discrimination entre groupes. Lesfonctions sont générées à partir d’un échantillon d’observations pour lesquelles legroupe d’affectation est connu. Les fonctions peuvent alors être appliquées auxnouvelles observations avec des mesures de variables explicatives, mais de grouped’affectation inconnu.

Remarque : la variable de groupe peut avoir plus de deux valeurs. Les codes de lavariable de regroupement doivent cependant être des nombres entiers, et vous devezspécifier leur valeur minimale et maximale. Les observations dont les valeurs sesituent hors des limites sont exclues de l’analyse.

Exemple. En moyenne, les habitants des pays des zones tempérées consomment plusde calories par jour que ceux des tropiques, et une plus grande proportion de ceshabitants vit en ville. Un chercheur veut combiner ces informations en une fonctionpour déterminer comment un individu peut être différencié selon les deux groupesde pays. Le chercheur pense que la taille de la population et des informationséconomiques peuvent aussi être importantes. L’analyse discriminante vous permetd’estimer les coefficients de la fonction discriminante linéaire, qui ressemble à lapartie droite d’une équation de régression linéaire multiple. Ainsi, en utilisant lescoefficients a, b, c et d, la fonction est :

D = a * climat + b * urbain + c * population + d * Produit National Brut par habitant

495

Page 522: SPSS Base Users Guide 14.0

496

Chapitre 29

Si ces variables sont utiles pour établir la différence entre les deux zones climatiques,les valeurs de D seront différentes pour les pays tempérés et les pays tropicaux. Sivous utilisez une méthode de sélection des variables pas à pas, vous pouvez découvrirque vous n’avez pas forcément besoin d’inclure les quatre variables dans la fonction.

Statistiques. Pour chaque variable, on a les éléments suivants : moyenne, écarts-types,ANOVA à un facteur. Pour chaque analyse : Test de Box, matrice de corrélationintra-classe, matrice de covariance intra-classe, matrice de covariance de chaqueclasse, matrice de covariance totale. Pour chaque fonction discriminante canonique :valeur propre, pourcentage de la variance, corrélation canonique, lambda de Wilks,Chi-deux. Pour chaque pas : probabilités à priori, coefficients de fonction de Fisher,coefficients de fonction non standardisés, lambda de Wilks pour chaque fonctioncanonique.

Données. La variable de regroupement doit avoir un nombre limité de modalitésdistinctes, codifiées sous forme de nombres entiers. Les variables indépendantesnominales doivent être recodées en variables muettes ou de contraste.

Hypothèses. Les observations doivent être indépendantes. Les variables explicativesdoivent avoir une distribution gaussienne multivariée, et les matrices devariance-covariance intra-groupes doivent être égales entre groupes. On part del’hypothèse que les groupes d’affectation sont mutuellement exclusifs (c’est-à-direqu’aucune observation n’est affectée à plus d’un groupe) et collectivement exhaustifs(c’est-à-dire que toutes les observations sont affectées à un groupe). La procédureest la plus efficace lorsque l’affectation à un groupe est une variable réellementqualitative. Si l’affectation à un groupe est basée sur les valeurs d’une variablecontinue (par exemple, QI élevé contre QI bas), vous devez envisager d’utiliser larégression linéaire pour exploiter les informations plus riches données par la variablecontinue elle-même.

Figure 29-1Résultats d’analyse discriminante

1.002 100.0 100.0 .707Fonction1

Valeur % de variance % cumulé

Corrélation canonique

Valeurs propres

propre

Page 523: SPSS Base Users Guide 14.0

497

Analyse discriminante

.499 31.934 4 .000

Test de

1

LambdaKhi-deux Df Sig.

Lambda de Wilks

de Wilksfonction(s)

.986

.790

.488

.082

CALORIES

LOG_GDP

URBAIN(%)

LOG_POP

1

Fonction

Matrice de structure

Obtenir une analyse discriminante

E A partir des menus, sélectionnez :Analyse

ClassificationAnalyse discriminante

Page 524: SPSS Base Users Guide 14.0

498

Chapitre 29

Figure 29-2Boîte de dialogue Analyse discriminante : Classement

E Sélectionnez une variable de regroupement à valeur entière et cliquez sur Définir

intervalle pour spécifier les modalités à considérer.

E Sélectionnez les variables indépendantes (ou explicatives). (Si votre variable deregroupement n’a pas de valeurs entières, la procédure de recodification automatiquedu menu Transformer permettra d’en créer un avec des valeurs entières.)

E Sélectionnez la méthode de saisie des variables indépendantes.

Entrer les variables simultanément. Entre simultanément toutes les variablesindépendantes qui satisfont aux critères de tolérance.

Utiliser la méthode pas à pas. Utilise la méthode pas à pas pour contrôler l’entréeet la suppression de variables.

E Vous pouvez également sélectionner les observations avec une variable de sélection.

Page 525: SPSS Base Users Guide 14.0

499

Analyse discriminante

Définition d’intervalles pour l’analyse discriminanteFigure 29-3Boîte de dialogue Analyse discriminante : Définir intervalle

Spécifiez la valeur minimum et maximum de la variable de regroupement pourl’analyse. Les observations avec des valeurs hors de cet intervalle ne sont pasutilisées dans l’analyse discriminante mais elles sont classées dans un des groupesexistants en fonction des résultats de l’analyse. Les valeurs minimum et maximumdoivent être des entiers.

Sélection des observations pour l’analyse discriminanteFigure 29-4Boîte de dialogue Analyse discriminante : Enregistrer

Pour sélectionner les observations pour votre analyse :

E Dans la boîte de dialogue Analyse discriminante, sélectionnez une variable desélection.

E Cliquez sur Valeur pour entrer un entier comme valeur de sélection.

Seules les observations avec la valeur spécifiée pour la variable de sélection sontutilisées pour dériver les fonctions discriminantes. Les résultats des statistiques et declassification sont générés pour les observations sélectionnées et celles qui ne le sontpas. Ce processus fournit une méthode de classification des nouvelles observations

Page 526: SPSS Base Users Guide 14.0

500

Chapitre 29

reposant sur des données existantes ou de partitionnement de vos données dans unsous-ensemble de test ou de formation en vue d’effectuer une validation sur le modèlecréé.

Statistiques de l’analyse discriminanteFigure 29-5Boîte de dialogue Analyse discriminante: Statistiques

Descriptives. Les options disponibles sont moyennes (y compris écarts-types),ANOVA à 1 facteur et Test M de Box.

Moyennes. Affichage de la moyenne totale et de la moyenne de groupe, ainsi quedes écarts-types des variables indépendantes.

ANOVA à 1 facteur. Effectue pour chacune des variables indépendantes une analysede variance à 1 facteur pour tester l'égalité des moyennes de groupe.

Test de Box. Test d'égalité des matrices de covariance des classes. Pour leséchantillons de taille suffisamment importante, une valeur p non significativeindique qu'il n'est pas démontré que les matrices diffèrent. Ce test est sensibleaux déviations par rapport à la distribution gaussienne multivariée.

Coefficients de la fonction. Les options disponibles sont les coefficients de laclassification de Fisher et les coefficients non standardisés.

Page 527: SPSS Base Users Guide 14.0

501

Analyse discriminante

Fisher. Affiche les coefficients de la fonction de classification de Fisher quipeuvent être directement utilisés pour la classification. Un groupe de coefficientsest obtenu pour chaque groupe et une observation est affectée au groupe qui a leplus grand score discriminant.

Non standardisés. Affiche les coefficients non standardisés de la fonctiondiscriminante.

Matrices. Les matrices de coefficients pour variables indépendantes disponibles sontla matrice de corrélation intra-classe, la matrice de covariance intra-classe, la matricede covariance de chaque classe et la matrice de covariance totale.

Corrélations intra-classe. Affiche une matrice de corrélations intra-classe globale,en calculant la moyenne des matrices de covariance distinctes pour tous lesgroupes avant de calculer les corrélations.

Covariance intra-classe. Affiche une matrice de covariances intra-classe globale,qui peut différer de la matrice de covariance totale. Cette matrice est obtenue encalculant la moyenne des matrices de covariances distinctes de tous les groupes.

Covariance de chaque classe. Affiche des matrices de covariances distinctes pourchaque groupe.

Covariance totale. Affiche la matrice de covariance de toutes les observationscomme si elles provenaient d'un seul échantillon.

Méthode pas à pas de l’analyse discriminanteFigure 29-6Boîte de dialogue Analyse discriminante : Méthode pas à pas

Page 528: SPSS Base Users Guide 14.0

502

Chapitre 29

Méthode. Sélectionnez la statistique à utiliser pour ajouter ou supprimer de nouvellesvariables. Les options possibles sont le lambda de Wilks, la variance résiduelle, ladistance de Mahalanobis, le plus petit rapport F et le V de Rao. Avec le V de Rao,vous pouvez spécifier l’augmentation minimum de V pour entrer une variable.

Lambda de Wilks. Méthode de sélection des variables pour une analysediscriminante pas à pas qui sélectionne les variables à entrer dans l'équationd'après leur capacité à faire baisser le lambda de Wilks. A chaque étape, lesvariables sont entrées dans l'analyse d'après leur capacité à faire baisser le lambdade Wilks.

Variance résiduelle. A chaque étape, la variable qui minimise la somme desvariations résiduelles entre les groupes est saisie.

Distance de Mahalanobis. Mesure de la distance entre les valeurs d'une observationet la moyenne de toutes les observations sur les variables indépendantes. Unedistance de Mahalanobis importante identifie une observation qui a des valeursextrêmes pour des variables indépendantes.

Plus petit rapport F. Méthode de sélection des variables en analyse pas à pas,fondée sur la maximisation d'un rapport F calculé à partir de la distance deMahalanobis entre des groupes.

V de Rao. Mesure des différences entre des moyennes de groupes. Egalementappelée trace de Lawley-Hotelling. A chaque étape, la variable qui maximisel'augmentation du V de RAO est entrée. Après avoir sélectionné cette option,entrez la valeur minimale que doit avoir une variable pour entrer dans l'analyse.

Critères. Les options disponibles sont Choisir la valeur de F et Choisir la probabilité de F.Entrez des valeurs pour ajouter et supprimer des variables.

Choisir la valeur de F. Une variable est introduite dans un modèle si sa valeur F estsupérieure à la valeur Entrée et elle est éliminée si la valeur F est inférieure à lavaleur Elimination. La valeur Entrée doit être supérieure à la valeur Eliminationet toutes deux doivent être positives. Pour introduire davantage de variablesdans le modèle, réduisez la valeur du champ Entrée. Pour éliminer davantage devariables dans le modèle, augmentez la valeur du champ Elimination.

Choisir la probabilité de F. Une variable est entrée dans le modèle si le seuil designification de la valeur F est supérieur à la valeur Entrée ; la variable estéliminée si ce seuil est supérieur à la valeur Elimination. La valeur Entrée doitêtre inférieure à la valeur Elimination et toutes deux doivent être positives. Pourintroduire davantage de variables dans le modèle, diminuez la valeur Entrée. Pouréliminer davantage de variables du modèle, réduisez la valeur Elimination.

Page 529: SPSS Base Users Guide 14.0

503

Analyse discriminante

Afficher. L’option Récapitulation des étapes affiche les statistiques de toutes lesvariables après chaque étape. L’option Test F des distances entre couples affiche unematrice de rapports F appariés pour chaque paire de groupes.

Analyse discriminante : ClassementFigure 29-7Boîte de dialogue Analyse discriminante : Classement

Probabilités à priori. Ces valeurs sont utilisées pour le classement. Vous pouvezspécifier des probabilités à priori égales pour toutes les classes (Egales pour toutes

les classes). Vous pouvez sinon laisser les effectifs de classes observés dans votreéchantillon calculer les probabilités d’affectation à un groupe (A calculer selon les

effectifs).

Afficher. Les options d’affichage disponibles sont les résultats par observation, lerécapitulatif et la classification par élimination.

Résultats par observation. Les codes du groupe actuel, du groupe prévu, desprobabilités a posteriori et des scores discriminants sont affichés pour chaqueobservation.

Récapitulatif. Nombre d'observations correctement et incorrectement affectéesà chacune des classes sur la base de l'analyse discriminante. Parfois appelés «matrice de confusion ».

Classification par élimination. Classement de chaque observation de l'analyse parles fonctions dérivées de l'ensemble des observations autres que cette observation.Cette classification est également appelée « méthode U ».

Page 530: SPSS Base Users Guide 14.0

504

Chapitre 29

Remplacer les valeurs manquantes par la moyenne. Sélectionnez cette option pourremplacer la valeur manquante d’une variable indépendante par la moyenne de cettevariable, mais seulement durant la phase de classification.

Utiliser la matrice d’inertie. Vous pouvez choisir de classer les observations en utilisantune matrice de covariance intra-classe ou une matrice de covariance pour chaqueclasse.

Intra-classe. La matrice de covariances intra-classes globale est utilisée pourclassifier les observations.

Classe par classe. Les matrices de covariances de chaque groupe sont utiliséespour la classification. Comme la classification repose sur les fonctionsdiscriminantes et pas sur les variables d'origine, cette option n'est pas toujourséquivalente à la discrimination quadratique.

Diagrammes. Les options de diagramme disponibles sont toutes classes combinées,classe par classe, et carte des régions d’affectation.

Toutes classes combinées. Crée un diagramme de dispersion de tous les groupes,des valeurs des deux premières fonctions discriminantes. S'il n'y a qu'une seulefonction, un histogramme est tracé à la place.

Classe par classe. Crée des diagrammes de dispersion classe par classe pour lesdeux premières valeurs de fonction discriminante. Lorsqu'il n'y a qu'une seulefonction, des histogrammes sont affichés à la place.

Carte des régions d'affectation. Diagramme des limites servant à classifier lesobservations en fonction de valeurs de fonction. Les numéros correspondentaux groupes auxquels les observations ont été affectées. La moyenne de chaquegroupe est indiquée par un astérisque à l'intérieur de ses limites. La carte n'est pasaffichée s'il n'existe qu'une seule fonction discriminante.

Page 531: SPSS Base Users Guide 14.0

505

Analyse discriminante

Enregistrement de l’analyse discriminanteFigure 29-8Boîte de dialogue Analyse discriminante : Enregistrer

Vous pouvez ajouter de nouvelles variables à votre fichier de données actif. Lesoptions disponibles sont classe(s) d’affectation (une seule variable), valeurs du facteurdiscriminant (une variable pour chaque fonction discriminante dans la solution), etprobabilités d’affectation à un groupe en fonction des valeurs du facteur discriminant(une variable pour chaque groupe).

Vous pouvez également exporter les informations du modèle vers le fichier spécifiéau format XML (PMML). SmartScore et le serveur de SPSS (produit séparé) peuventutiliser ce fichier de modèle pour appliquer les informations du modèle à d’autresfichiers de données à des fins d’analyse.

Fonctionnalités supplémentaires de la commandeDISCRIMINANT

Le langage de commande SPSS vous permet aussi de :

effectuer plusieurs analyses discriminantes avec une seule commande et contrôlerl’ordre d’entrée des variables (au moyen de la sous-commande ANALYSIS).

spécifier des probabilités à priori pour la classification (au moyen de lasous-commande PRIORS).

afficher les matrices des coordonnées factorielles et les matrices des corrélationsstructurelles après rotation (au moyen de la sous-commande ROTATE).

limiter le nombre de fonctions discriminantes extraites (au moyen de lasous-commande FUNCTIONS).

Page 532: SPSS Base Users Guide 14.0

506

Chapitre 29

restreindre la classification aux observations sélectionnées (ou non sélectionnées)pour l’analyse (au moyen de la sous-commande SELECT).

lire et analyser une matrice de corrélation (au moyen de la sous-commandeMATRIX).

créer une matrice de corrélation pour une analyse ultérieure (au moyen de lasous-commande MATRIX).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 533: SPSS Base Users Guide 14.0

Chapitre

30Analyse factorielle

L’analyse factorielle essaie d’identifier des variables sous-jacentes, ou facteurs,qui permettent d’expliquer le patron des corrélations à l’intérieur d’un ensemblede variables observées. L’analyse factorielle est souvent utilisée pour réduire unensemble de données. L’analyse factorielle est souvent utilisée dans la factorisation,en identifiant un petit nombre de facteurs qui expliquent la plupart des variancesobservées dans le plus grand nombre de variables manifestes. On peut égalementutiliser l’analyse factorielle pour générer des hypothèses concernant des mécanismesde causalité ou pour afficher des variables pour une analyse ultérieure (par exemple,pour identifier la colinéarité avant une analyse de régression linéaire).

La procédure d’analyse factorielle offre une très grande flexibilité :

Il existe sept méthodes d’extraction de facteur.

Il existe cinq méthodes de rotation, dont directe Oblimin et Promax pour lesrotations non orthogonales.

Il existe trois méthodes pour calculer les facteurs, et ces facteurs peuvent êtreenregistrés en tant que variables pour des analyses ultérieures.

Exemple : Quelle est l’attitude sous-jacente qui pousse les personnes à répondre d’unecertaine manière aux questions concernant un sondage politique ? L’examen descorrélations parmi les éléments d’un sondage révèle qu’il y a des recouvrementssignificatifs parmi divers sous-groupes d’éléments. Les questions sur les impôtsont tendance à être en corrélation, de même que les questions à thèmes militaires,etc. Avec l’analyse factorielle, vous pouvez enquêter sur le nombre de facteurssous-jacents, et, dans de nombreux cas, vous pouvez identifier le concept représentépar ces facteurs. De plus, vous pouvez calculer les facteurs pour chaque répondant,facteurs que vous pouvez utiliser pour des analyses ultérieures. Par exemple, sur labase des facteurs, vous pouvez développer un modèle logistique de régression pourprévoir le comportement de vote.

507

Page 534: SPSS Base Users Guide 14.0

508

Chapitre 30

Statistiques : Pour chaque variable, on a les éléments suivants : nombre d’observationsvalides, moyenne et écart-type. Pour chaque analyse factorielle : matrice decorrélation des variables, incluant des seuils de signification, déterminant, inverse ; lesmatrices des corrélations reconstituées, incluant l’anti-image ; les solutions initiales(qualités de représentation, valeurs propres et pourcentage de variance expliqué) ;mesure d’adéquation d’échantillonnage de Kaiser-Meyer-Olkin et le test de sphéricitéde Bartlett ; structure avant rotation, incluant les saturations sur les facteurs, la qualitéde représentation, et les valeurs propres; structure après rotation, incluant une matricede forme après rotation et une matrice de transformation. Pour rotations obliques :type et matrices de structure après rotation ; matrice factorielle de coefficient defacteur et matrice factorielle de facteur de covariance. Diagrammes : Diagramme devaleurs propres et carte factorielle du premier, du deuxième et du troisième facteur.

Données : Les variables doivent être quantitatives au niveau de l’ Intervalle ou durapport . Les données qualitatives (comme la religion ou le pays d’origine) neconviennent pas pour l’analyse factorielle. Les données pour lesquelles la corrélationde Pearson calculée a un sens conviennent pour l’analyse factorielle.

Hypothèses : Les données doivent posséder une distribution gaussienne bivariée pourchaque paire de variables et les observations doivent être indépendantes. Le modèled’analyse factorielle spécifie que les variables sont déterminées par des facteurscommuns (les facteurs estimés par le modèle) et des facteurs uniques (qui ne sontpas corrélés entre les variables observées); les estimations calculées se basent surl’hypothèse que tous les facteurs uniques ne sont pas en corrélation entre eux ainsiqu’avec les facteurs communs.

Page 535: SPSS Base Users Guide 14.0

509

Analyse factorielle

Figure 30-1Sortie d’analyse factorielle

72.833 8.272 72

35.132 32.222 72

82.472 18.625 72

24.375 10.552 72

3.205 1.593 72

62.583 22.835 72

3.504 .608 72

1.697 1.156 72

3.577 2.313 72

8.038 3.174 72

4.153 .686 72

Espérance de vie moyenne des femmes

Mortalité infantile (nombre de décèssur 1 000 naissances vivantes)

Personnes sachant lire (%)

Taux de natalité pour 1 000 personnes

Fécondité : nombre moyen d'enfants

Personnes habitant en ville (%)

Log (base 10) de GDP_CAP

Croissance démographique (% par année)

Rapport entre les naissances et les décès

Taux de mortalité pour 1 000 personnes

Log (base 10) de Population

MoyenneEcart.Type

NAnalyse

Statistiques descriptives

1.000 .953

1.000 .949

1.000 .825

1.000 .943

1.000 .875

1.000 .604

1.000 .738

1.000 .945

1.000 .925

1.000 .689

1.000 .292

LIFEEXPF

BABYMORT

LITERACY

BIRTH_RT

FERTILTY

URBAN

LOG_GDP

POP_INCR

B_TO_D

DEATH_RT

LOG_POP

Initiale Extraction

Qualité de représentation

Méthode d'extraction : Analyse en composantes principales

Page 536: SPSS Base Users Guide 14.0

510

Chapitre 30

6.960 63.275 63.275 6.960 63.275 63.275 6.910 62.819 62.819

2.579 23.446 86.721 2.579 23.446 86.721 2.629 23.902 86.721

.612 5.562 92.283

.361 3.281 95.564

.218 1.985 97.549

.130 1.183 98.732

6.131E-02 .557 99.290

3.775E-02 .343 99.633

2.610E-02 .237 99.870

9.840E-03 8.946E-02 99.959

4.461E-03 4.055E-02 100.000

Composante1

2

3

4

5

6

7

8

9

10

11

Total% de

variance % cumulé Total% de

variance % cumulé Total% de

variance

Valeurs propres initiales Sommes des carrés chargées Sommes des carrés pour la rotation

Total des variables explicatives

Méthode d'extraction : analyse en composantes principales

% cumulé

Page 537: SPSS Base Users Guide 14.0

511

Analyse factorielle

.969

.931

-.880 .226

-.856 .469

.853 -.469

.847 .476

-.794 .327

-.561 .539

-.827

.614 .741

-.520

BIRTH_RT

FERTILTY

LITERACY

LIFEEXPF

BABYMORT

POP_INCR

LOG_GDP

URBAN

DEATH_RT

B_TO_D

LOG_POP

1 2

Composant

Matrice pivotée des composants

En composantes principalesMéthode de rotation : Varimax avec normalisation de Kaiser.

.982 -.190

.190 .982

1

2

Composant1 2

Matrice des transformations des composants

Méthode d'extraction : Analyseen composantes principalesMéthode de rotation : Varimax avec normalisation de Kaiser.

Page 538: SPSS Base Users Guide 14.0

512

Chapitre 30

Component Plot in Rotated Space

Component 1

1.0.50.0-.5-1.0

Com

pone

nt 2

1.0

.5

0.0

-.5

-1.0

log (base 10) of pop

death rate per 1000

birth to death ratio

population increase

log (base 10) of gdp

people living in cit

fertility: average nbirth rate per 100

people who read (%)

infant mortality (de

average female life

Obtenir une analyse factorielle

E A partir des menus, sélectionnez :Analyse

FactorisationAnalyse factorielle

E Sélectionnez les variables pour l’analyse factorielle.

Page 539: SPSS Base Users Guide 14.0

513

Analyse factorielle

Figure 30-2Boîte de dialogue Analyse factorielle

Sélection des observations pour l’analyse factorielleFigure 30-3Sélectionnez la boîte de dialogue Analyse factorielle

Pour sélectionner les observations pour votre analyse :

E Sélectionnez une variable de sélection.

E Cliquez sur Valeur pour entrer un entier comme valeur de sélection.

Seules les observations ayant cette valeur pour la variable de sélection sont utiliséesdans l’analyse factorielle.

Page 540: SPSS Base Users Guide 14.0

514

Chapitre 30

Descriptives d’analyse factorielleFigure 30-4Boîte de dialogue Analyse Factorielle : Descriptives...

Statistiques : Les descriptives univariées incluent la moyenne, l’écart-type et le nombred’observations valides pour chaque variable. La structure initiale affiche la qualité dereprésentation initiale, les valeurs propres et le pourcentage de variance expliqué.

Matrice de corrélation : Les options disponibles sont les coefficients, les seuils designification, les déterminants, les inverses, les reproduits, l’anti-image et l’indiceKMO et le test de sphéricité de Bartlett.

Indice KMO et test de sphéricité de Bartlett. Mesure de l'adéquation del'échantillonnage de Kaiser-Meyer-Olkin qui teste si les corrélations partiellesentre les variables sont faibles. Le test de sphéricité de Bartlett teste si la matricedes corrélations est une matrice d'identité, ce qui indiquerait que le modèle defacteur n'est pas adapté.

Reconstituée. Matrice des corrélations estimée à partir de la solution factorielle.Les résidus (différence entre les corrélations estimées et observées) sontégalement affichés.

Anti-image. La matrice de corrélation des anti-images contient les opposés descoefficients de corrélation partielle ; la matrice de covariance des anti-imagescontient les opposés des covariances partielles. Dans un bon modèle factoriel, laplupart des éléments hors diagonale doivent être petits. La mesure d'adéquationd'échantillonnage pour une variable est affichée sur la diagonale de la matrice decorrélation des anti-images.

Page 541: SPSS Base Users Guide 14.0

515

Analyse factorielle

Extraction d’analyse factorielleFigure 30-5Boîte de dialogue Analyse Factorielle : Extraction

Méthode : Vous permet de spécifier la méthode d’extraction de facteur. Les méthodesdisponibles sont les Composantes principales, les Moindres carrés non pondérés, lesMoindres carrés généralisés, le Maximum de vraisemblance, la Factorisation en axesprincipaux, l’Alpha-maximisation et la Factorisation en projections.

Analyse en composantes principales. Méthode d'extraction de facteur utiliséepour former des combinaisons linéaires non corrélées des variables observées.La première composante principale a une variance maximale. Les autrescomposantes expliquent progressivement des portions plus petites de la variancesans être corrélées les unes aux autres. L'analyse des composantes principales estutilisée pour obtenir la solution factorielle initiale. Elle peut être utilisée quand lamatrice des corrélations est singulière.

Méthode des moindres carrés non pondérés. Méthode d'extraction de facteur quiminimise la somme des carrés des différences entre les matrices de corrélationsobservées et reconstituées en ignorant les diagonales.

Méthode des Moindres carrés généralisés. Méthode d'extraction de facteur quiminimise la somme des carrés des différences entre les matrices de corrélationsobservées et reconstituées. Les corrélations sont pondérées par l'inverse de leurunicité, de façon à ce que les variables présentant une forte unicité reçoivent unepondération inférieure à celles présentant une faible unicité.

Page 542: SPSS Base Users Guide 14.0

516

Chapitre 30

Méthode du maximum de vraisemblance. Méthode d'extraction de facteur quifournit les estimations de paramètres les plus susceptibles d'avoir généré lamatrice de corrélations observée si l'échantillon est issu d'une distributiongaussienne multivariée. Les corrélations sont pondérées par l'inverse de l'unicitédes variables et un algorithme itératif est utilisé.

Factorisation en axes principaux. Méthode d'extraction de facteurs à partir dela matrice des corrélations initiales où les coefficients de corrélation multipleau carré sont placés sur la diagonale comme estimation initiale des qualités dereprésentation. Ces cartes factorielles sont utilisées pour une nouvelle estimationdes qualités de représentation qui remplace alors l'ancienne sur la diagonale.Les itérations se poursuivent jusqu'à ce que les variations des qualités dereprésentation d'une itération à l'autre satisfassent le critère de convergence del'extraction.

Alpha de Cronbach. Méthode d'extraction de facteur qui considère les variablesdans l'analyse comme un échantillon issu de la population des variablespotentielles. Cette méthode maximise l'alpha de Cronbach des facteurs.

Factorisation en projections. Méthode d'extraction de facteur développée parGuttman et basée sur la théorie d'une image. La partie commune de la variable,appelée image partielle, est définie comme sa régression linéaire sur les autresvariables, plutôt qu'une fonction de facteurs hypothétiques.

Analyser : Vous permet de spécifier si l’analyse porte sur une matrice de corrélationou sur une matrice de covariance.

Matrice de corrélation. Utile si les variables de votre analyse sont mesurées selondes échelles différentes.

Matrice de covariance. Utile lorsque vous souhaitez appliquer l’analyse factorielleà plusieurs groupes avec des variances différentes pour chaque variable.

Extraire : Vous pouvez retenir tous les facteurs dont les valeurs propres dépassent unevaleur spécifique ou retenir un nombre spécifique de facteurs.

Afficher : Vous permet de demander la solution factorielle avant rotation et undiagramme des valeurs propres.

Page 543: SPSS Base Users Guide 14.0

517

Analyse factorielle

Structure factorielle sans rotation. Affiche les corrélations factorielles sans rotation(matrice de projections factorielles), les qualités de représentation et les valeurspropres de la solution factorielle.

Diagramme des valeurs propres. Diagramme représentant la variance associéeà chaque facteur. Permet de déterminer le nombre de facteurs à conserver.Généralement, le diagramme montre une coupure franche entre la forte pente desfacteurs élevés et la traîne graduelle du reste (valeurs propres).

Maximum des itérations pour converger : Vous permet de spécifier le nombre maximumde pas que l’algorithme peut utiliser pour estimer la solution.

Rotation d’analyse factorielleFigure 30-6Boîte de dialogue Analyse factorielle : Rotation

Méthode : Vous permet de sélectionner la méthode de rotation des facteurs. Lesméthodes disponibles sont Varimax, Oblimin directe, Quartimax, Equamax ouPromax.

Méthode varimax. Méthode de rotation orthogonale qui minimise le nombre devariables ayant de fortes corrélations sur chaque facteur. Simplifie l'interprétationdes facteurs.

Critère oblimin direct. Méthode de rotation oblique (non orthogonale). Lorsquedelta est nul (valeur par défaut), les solutions sont les plus obliques. Plus la valeurde delta est négative, moins les facteurs sont obliques. Pour remplacer la valeurnulle par défaut de delta, entrez un nombre inférieur ou égal à 0,8.

Page 544: SPSS Base Users Guide 14.0

518

Chapitre 30

Méthode quartimax. Méthode de rotation qui réduit le nombre de facteurs requispour expliquer chaque variable. Simplifie l'interprétation des variables observées.

Equamax. Méthode de rotation qui est une combinaison de la méthode Varimax(qui simplifie les facteurs) et de la méthode Quartimax (qui simplifie lesvariables). Le nombre de variables pesant sur un facteur et le nombre de facteursnécessaires pour expliquer une variable sont minimisés.

Rotation Promax. Rotation oblique qui permet aux facteurs d'être corrélés. Peutêtre calculée plus rapidement qu'une rotation oblimin directe, aussi est-elle utilepour les vastes ensembles de données.

Afficher : Vous permet d’inclure le résultat de la structure après rotation, et égalementd’afficher les cartes factorielles sur le premier, le second et le troisième facteur(Cartes factorielles).

Structure après rotation. Vous devez sélectionner une méthode de rotation pourobtenir une structure après rotation. Pour les rotations orthogonales, la matricede forme après rotation et la matrice de transformation factorielle sont affichées.Pour les rotations obliques, le programme affiche la matrice des projectionsfactorielles, la matrice de structure et la matrice des corrélations de facteurs.

Diagramme des Contributions des Facteurs. Diagramme en trois dimensions descontributions des trois premiers facteurs. Pour une solution à deux facteurs, undiagramme en deux dimensions est affiché. Le diagramme n'est pas affiché si unseul facteur est extrait. Les diagrammes affichent des solutions ayant subi unerotation si cette dernière est demandée.

Maximum des itérations pour converger : Vous permet de spécifier le nombre maximumde pas que l’algorithme peut utiliser pour réaliser la rotation.

Page 545: SPSS Base Users Guide 14.0

519

Analyse factorielle

Scores d’analyse factorielleFigure 30-7Boîte de dialogue Scores de l’Analyse Factorielle

Enregistrer dans des variables : Vous permet de créer une nouvelle variable pourchaque facteur selon la structure finale. Sélectionnez une des méthodes alternativessuivantes pour calculer les facteurs : Régression, Bartlett, ou Anderson-Rubin.

Méthode de régression. Méthode d'estimation des coefficients factoriels. Lesécarts obtenus ont une moyenne de 0 et une variance égale au carré de lacorrélation multiple entre les coefficients factoriels estimés et les vraies valeursdu facteur. Les écarts peuvent être corrélés même lorsque les facteurs sontorthogonaux.

Facteurs de Bartlett. Méthode d'estimation des coefficients factoriels. Les résultatsont une moyenne de 0. La somme des carrés des facteurs uniques dans la plagede variables est minimisée.

Méthode d'Anderson-Rubin. Méthode d'estimation des coefficients factoriels; variante de la méthode de Bartlett qui garantit l'orthogonalité des facteursestimés. Les résultats obtenus affichent une moyenne de 0 et un écart-type de 1et ne sont pas corrélés.

Afficher la matrice des coefficients factoriels : Vous permet de montrer les coefficientspar lesquels les variables sont multipliées pour obtenir les facteurs. Cela permetégalement de montrer les corrélations entre les facteurs.

Page 546: SPSS Base Users Guide 14.0

520

Chapitre 30

Options d’analyse factorielleFigure 30-8Boîte de dialogue des Options de l’Analyse Factorielle

Valeurs manquantes : Vous permet de spécifier comment traiter les valeursmanquantes. Les options disponibles sont d’exclure Toute observation incomplète,Seulement les observationsappariéesou Remplacer par la moyenne.

Affichage des projections : Vous permet de contrôler le format des matrices de résultat.Triez les coefficients par leur taille et supprimez les coefficients dont la valeur absolueest inférieure à la valeur spécifiée.

Fonctionnalités supplémentaires de la commande FACTOR

Le langage de commande SPSS vous permet aussi de :

spécifier des critères de convergence pour les itérations lors de l’extraction et dela rotation ;

définir des diagrammes factoriels individuels après rotation ;

indiquer le nombre de facteurs à enregistrer ;

spécifier les valeurs des diagonales pour la méthode de factorisation en axesprincipaux ;

créer des matrices de corrélation ou des matrices de projections factorielles sur undisque pour une analyse ultérieure ;

lire et analyser des matrices de corrélation ou des matrices de projectionsfactorielles.

Page 547: SPSS Base Users Guide 14.0

521

Analyse factorielle

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 548: SPSS Base Users Guide 14.0
Page 549: SPSS Base Users Guide 14.0

Chapitre

31Choix d’une procédure declassification

Vous pouvez effectuer des analyses de classes à l’aide de la procédure TwoStep, de laclassification hiérarchique ou des nuées dynamiques. Chaque procédure utilise unalgorithme différent pour la création des classes, et chacune d’elles comporte desoptions qui ne sont pas disponibles dans les autres procédures.

Analyse du composant Classe TwoStep. La procédure Analyse du composant ClasseTwoStep est la méthode privilégiée pour de nombreuses applications. Elle offre lesfonctionnalités spécifiques suivantes :

Sélection automatique du meilleur nombre de classes, en plus des mesures desélection parmi des modèles de classe.

Possibilité de créer simultanément des modèles de classe sur la base de variablesqualitatives et continues.

Possibilité d’enregistrer le modèle de classe dans un fichier XML externe, puisde lire ce fichier et de mettre à jour le modèle de classe à l’aide des donnéesles plus récentes.

En outre, la procédure Analyse du composant Classe TwoStep permet d’analyser desfichiers de données volumineux.

Classification hiérarchique. La procédure Classification hiérarchique est limitéeà des fichiers de données plus petits (centaines d’objets à classer), mais offre lesfonctionnalités spécifiques suivantes :

Possibilité de classer des observations ou des variables.

523

Page 550: SPSS Base Users Guide 14.0

524

Chapitre 31

Possibilité de calculer plusieurs solutions possibles et d’enregistrer des classesd’affectation pour chacune de ces solutions.

Plusieurs méthodes de formation de classes, de transformation de variables et demesure de la dissimilarité entre les classes.

Tant que toutes les variables sont du même type, la procédure Classificationhiérarchique peut analyser des variables d’intervalle (continues), d’effectif ou binaires.

Nuées dynamiques. La procédure Nuées dynamiques est limitée aux donnéescontinues et exige que vous indiquiez au préalable le nombre de classes. Elle offrenéanmoins les fonctionnalités spécifiques suivantes :

Possibilité d’enregistrer les distances à partir des centres de classes pour chaqueobjet.

Possibilité de lire les centres de classes initiaux à partir d’un fichier SPSS externeet d’enregistrer les centres de classes finaux dans un fichier de ce type.

En outre, la procédure Nuées dynamiques permet d’analyser des fichiers de donnéesvolumineux.

Page 551: SPSS Base Users Guide 14.0

Chapitre

32Analyse TwoStep Cluster

La procédure d’analyse TwoStep Cluster est un outil d’exploration conçu pourrévéler des groupements naturels (ou classes) au sein d’un ensemble de données.L’algorithme utilisé par cette procédure possède plusieurs fonctionnalités qui ledistinguent des techniques de classification standard :

Gestion des données qualitatives et continues. En supposant que les variablessoient indépendantes, une distribution jointe multinomiale-normale peut êtreplacée sur des variables qualitatives et continues.

Sélection automatique du nombre de classes. En comparant les valeurs d’un critèrede modèle-choix dans différentes solutions de classification, la procédure peutdéterminer automatiquement le nombre optimal de classes.

Evolutivité. En construisant une arborescence de fonctionnalités de classe (CF)qui récapitule les enregistrements, l’algorithme TwoStep vous permet d’analyserdes fichiers de données volumineux.

Exemple. Les entreprises du domaine des produits de consommation et du commercede détail utilisent régulièrement des techniques de classification des données quidécrivent les habitudes d’achat, le sexe, l’âge, le niveau de revenu, etc. de leursclients. Ces sociétés adaptent leurs stratégies de marketing et de développementproduit à chaque groupe de consommation afin d’augmenter les ventes et dedévelopper la fidélité à la marque.

Statistiques. Cette procédure produit des critères d’information (AIC ou BIC) parnombre de classes dans la solution, effectifs de classe pour la classification finale etstatistiques descriptives par classe pour la classification finale.

Diagrammes. Cette procédure produit des diagrammes en bâtons pour les fréquencesde classe, des diagrammes en secteurs pour les fréquences de classe et des diagrammesd’importance pour les variables.

525

Page 552: SPSS Base Users Guide 14.0

526

Chapitre 32

Figure 32-1Boîte de dialogue Analyse du composant Classe TwoStep

Mesure de distance. Cette sélection détermine la façon dont la similarité entre deuxclasses est calculée.

Log-vraisemblance. La mesure de vraisemblance place une distribution deprobabilité sur les variables. Les variables continues sont considérées commeétant distribuées normalement alors que les variables qualitatives sont considéréescomme étant multinomiales. Toutes les variables sont considérées comme étantindépendantes.

Euclidienne. La mesure euclidienne est la distance « en ligne droite » entre deuxclasses. Elle peut être utilisée uniquement lorsque toutes les variables sontcontinues.

Nombre de classes. Cette sélection vous permet d’indiquer la façon dont le nombrede classes doit être déterminé.

Page 553: SPSS Base Users Guide 14.0

527

Analyse TwoStep Cluster

Déterminer automatiquement. Cette procédure déterminera automatiquement le «meilleur » nombre de classes en utilisant le critère défini dans le groupe Critèrede classification. Vous pouvez également entrer un nombre entier positif quidéfinit le nombre maximal de classes que la procédure doit prendre en compte.

Indiquer une valeur fixe. Vous permet d’indiquer le nombre de classes (valeur fixe)dans la solution. Entrez un entier positif.

Nombre de variables continues. Ce groupe fournit un récapitulatif des spécifications destandardisation des variables continues qui sont définies dans la boîte de dialogueOptions. Pour plus d'informations, reportez-vous à « Options de la procédured’analyse TwoStep Cluster » à p. 529.

Critère de classification. Cette sélection détermine la façon dont l’algorithme declassification automatique détermine le nombre de classes. Vous pouvez spécifier lecritère d’information bayésien (BIC) ou le critère d’information d’Akaike (AIC).

Données. Cette procédure fonctionne avec des variables continues et qualitatives. Lesobservations représentent les objets à classer et les variables représentent les attributssur lesquels est basée la classification.

Tri par observation. Remarque : l’arborescence des fonctionnalités de classe et lasolution finale peuvent dépendre de l’ordre des observations. Pour réduire les effetsde tri, classez les observations de manière aléatoire. Vous pouvez obtenir différentessolutions pour lesquelles les observations ont été triées de manière aléatoire, afin devérifier la stabilité d’une solution donnée. Lorsque cela s’avère difficile en raisonde fichiers très volumineux, vous pouvez effectuer plusieurs fois l’opération sur unéchantillon des observations triées de différentes manières aléatoires.

Hypothèses. La mesure de la distance de vraisemblance considère que les variablesdu modèle de classe sont indépendantes. De plus, chaque variable continue estconsidérée comme ayant une distribution normale (gaussienne) et chaque variablequalitative comme ayant une distribution multinomiale. Des tests internes empiriquesindiquent que la procédure est assez résistante aux violations de l’hypothèsed’indépendance et des hypothèses de distribution, mais vous devez savoir commentces hypothèses sont vérifiées.

Utilisez la procédureCorrélations bivariées pour tester l’indépendance de deuxvariables continues. Utilisez la procédureTableaux croisés pour tester l’indépendancede deux variables qualitatives. Utilisez la procédureMoyennes pour testerl’indépendance entre une variable continue et une variable qualitative. Utilisez laprocédureExplorer pour tester la normalité d’une variable continue. Utilisez la

Page 554: SPSS Base Users Guide 14.0

528

Chapitre 32

procédureTest du Chi-deux pour tester si une variable qualitative comporte unedistribution multinominale spécifiée.

Pour effectuer une procédure d’analyse TwoStep Cluster

E A partir des menus, sélectionnez :Analyse

ClassificationClassification TwoStep

E Sélectionnez une ou plusieurs variables qualitatives ou continues.

Sinon, vous pouvez :

Ajuster les critères sur lesquels est basée la construction des classes.

Sélectionner les paramètres de gestion du bruit, d’affectation de mémoire, destandardisation de variable et d’entrée de modèle de classe.

Demander des tableaux et des diagrammes facultatifs.

Enregistrer les résultats de modèle dans le fichier de travail ou dans un fichierXML externe.

Page 555: SPSS Base Users Guide 14.0

529

Analyse TwoStep Cluster

Options de la procédure d’analyse TwoStep ClusterFigure 32-2Boîte de dialogue Options de la procédure d’analyse TwoStep Cluster

Traitement des valeurs éloignées. Ce groupe permet de traiter les valeurs éloignées,notamment lors de la classification, si l’arborescence des fonctionnalités de classe(CF) est saturée. L’arborescence CF est saturée si elle ne peut plus accepter d’autresobservations dans un noeud feuille et qu’aucun noeud feuille ne peut être divisé.

Si vous sélectionnez la gestion du bruit et que l’arborescence CF est saturée,l’arborescence est reconstruite lorsque vous placez des observations de feuilleséclatées dans une feuille « bruit ». Une feuille est éclatée si elle contient unpourcentage inférieur au pourcentage d’observations correspondant à la taillemaximale de la feuille. Une fois que l’arborescence est reconstruite, les valeurs

Page 556: SPSS Base Users Guide 14.0

530

Chapitre 32

éloignées sont placées dans l’arborescence CF si cela est possible. Sinon, lesvaleurs éloignées sont supprimées.

Si vous ne sélectionnez pas la gestion du bruit et que l’arborescence CF estsaturée, elle sera reconstruite à l’aide d’un seuil de changement de distancesupérieur. Après la classification finale, les valeurs ne pouvant être affectées à uneclasse deviennent des valeurs éloignées étiquetées. Un numéro d’identificationde –1 est affecté à la classe de valeur éloignée et cette dernière n’est pas priseen compte dans le nombre de classes.

Allocation de mémoire. Ce groupe vous permet d’indiquer la quantité de mémoiremaximale en mégaoctets (Mo) que l’algorithme de classe doit utiliser. Si la procéduredépasse cette limite, elle utilisera le disque pour stocker les informations ne pouvantpas être enregistrées en mémoire. Spécifiez une valeur supérieure ou égale à 4.

Consultez l’administrateur système pour connaître la plus grande valeur quevous pouvez spécifier sur votre système.

L’algorithme risque de ne pas trouver le nombre correct ou souhaité de classessi cette valeur est trop basse.

Standardisation de variable. L’algorithme de classification fonctionne avec desvariables continues standardisées. Les variables continues non standardisées doiventêtre laissées comme étant « A standardiser ». Pour gagner du temps et éviter trop decalculs, vous pouvez sélectionner une variable continue déjà standardisée commevariable « Standardisées ».

Options avancées

Critères de réglage de l’arborescence CF. Les paramètres d’algorithme de classificationsuivants s’appliquent de façon spécifique à l’arborescence CF et doivent être modifiésavec le plus grand soin :

Seuil de modification de distance initiale. Il s’agit du seuil initial utilisé pourconstruire l’arborescence CF. Si l’insertion d’une observation dans une feuille del’arborescence CF provoque une étroitesse inférieure au seuil, la feuille n’est pasdivisée. Si l’étroitesse dépasse le seuil, la feuille est divisée.

Nombre maximum de branches (par noeud feuille). Nombre maximum de noeudsenfant qu’un noeud feuille peut contenir.

Page 557: SPSS Base Users Guide 14.0

531

Analyse TwoStep Cluster

Profondeur maximum de l’arborescence. Nombre maximum de niveaux quel’arborescence CF peut contenir.

Nombre maximal de noeuds. Ceci indique le nombre maximal de noeuds de l’arbreCF pouvant être générés par la procédure, d’après la fonction (bd+1 – 1) / (b–1), b étant le nombre maximal de branches et d, la profondeur maximale del’arbre. Notez qu’une arborescence CF trop volumineuse risque d’épuiser lesressources du système et d’avoir des effets défavorables sur les performances dela procédure. Chaque noeud exige au moins 16 octets.

Mettre à jour le modèle de classe. Ce groupe vous permet d’importer et de mettre àjour un modèle de classe généré dans une analyse précédente. Le fichier d’entréecontient l’arborescence CF au format XML. Le modèle est ensuite mis à jour avec lesdonnées du fichier actif. Vous devez sélectionner les noms des variables dans la boîtede dialogue principale dans le même ordre que celui dans lequel ils ont été spécifiésdans l’analyse précédente. Le fichier XML demeure inchangé, sauf si vous enregistrezles informations du nouveau modèle en utilisant le même nom de fichier. Pour plusd'informations, reportez-vous à « Résultats de l’analyse TwoStep Cluster » à p. 533.

Si vous avez indiqué la mise à jour d’un modèle de classe, les options relatives à lagénération de l’arborescence CF spécifiées pour le modèle d’origine sont utilisées.Plus précisément, les paramètres de mesure de la distance, de gestion du bruit,d’affectation de mémoire ou les critères de réglage de l’arborescence CF pour lemodèle enregistré sont utilisés et tous les paramètres de ces options dans les boîtes dedialogue sont ignorés.

Remarque : Lorsque vous effectuez une mise à jour d’un modèle de classe, laprocédure considère qu’aucune des observations sélectionnées dans l’ensemble dedonnées actif n’a été utilisée pour créer le modèle de classe d’origine. La procédureconsidère également que les observations utilisées dans la mise à jour du modèle sontissues de la même population d’observations utilisée pour créer le modèle d’origine.En d’autres termes, les moyennes et les variances des variables continues et lesniveaux des variables qualitatives sont considérés comme étant identiques dans lesdeux groupes d’observations. Si votre « nouveau » groupe d’observations ne provientpas de la même population que votre « ancien » groupe, exécutez la procédureAnalyse du composant Classe TwoStep sur les groupes d’observations combinés pourobtenir de meilleurs résultats.

Page 558: SPSS Base Users Guide 14.0

532

Chapitre 32

Diagrammes de l’analyse TwoStep ClusterFigure 32-3Boîte de dialogue Diagrammes de l’analyse TwoStep Cluster

Dans le graphique de pourcentage de classe. Fait apparaître les graphiques indiquantla variation de classe de chaque variable. Pour chaque variable qualitative, undiagramme en bâtons juxtaposés est produit, indiquant la fréquence de modalité parID de classe. Pour chaque variable continue, un diagramme de variation est produit,indiquant les variations par ID de classe.

Diagramme en secteurs de classe. Fait apparaître un diagramme en secteurs indiquantle pourcentage et le nombre d’observations dans chaque classe.

Diagramme d’importance des variables. Fait apparaître plusieurs diagrammes différentsindiquant l’importance de chaque variable dans chaque classe. Le résultat est trié parordre d’importance de chaque variable.

Rang des variables. Cette option détermine si des diagrammes seront créés pourchaque classe (Par variable) ou pour chaque variable (Par classe).

Mesure de l’importance. Cette option vous permet de sélectionner la mesurede l’importance des variables à représenter. L’option Chi-deux ou test T designification indique une statistique Chi-deux de Pearson comme importanced’une variable qualitative et une statistique t comme importance d’une variable

Page 559: SPSS Base Users Guide 14.0

533

Analyse TwoStep Cluster

continue. L’option Signification indique 1, moins la valeur p pour le test d’égalitédes moyennes pour une variable continue et la fréquence théorique avec le groupeglobal des données pour une variable qualitative.

Niveau de confiance. Cette option vous permet de définir le niveau de confiancepour le test d’égalité de la distribution d’une variable dans une classe par rapportà la distribution globale de la variable. Indiquez un nombre inférieur à 100 etsupérieur ou égale à 50. Si les diagrammes sont créés par variable ou si la mesurede la signification est représentée, la valeur du niveau de confiance apparaît sousla forme d’une ligne verticale dans les diagrammes d’importance des variables.

Omettre les variables non significatives. Les variables non significatives au niveaude confiance spécifié n’apparaissent pas dans les diagrammes d’importance desvariables.

Résultats de l’analyse TwoStep ClusterFigure 32-4Boîte de dialogue des résultats de l’analyse du composant Classe TwoStep

Statistiques. Ce groupe fournit des options d’affichage pour les tableaux des résultatsde la classification. Les statistiques descriptives et les fréquences de classe sontproduites pour le modèle de classe final alors que le tableau du critère d’informationfait apparaître des résultats pour une plage de solutions de classe.

Page 560: SPSS Base Users Guide 14.0

534

Chapitre 32

Descriptives par classe. Fait apparaître deux tableaux qui décrivent les variablesdans chaque classe. Dans un tableau, les moyennes et les écarts-types sontindiqués pour les variables continues par classe. L’autre tableau indique leseffectifs des variables qualitatives par classe.

Fréquences de classe. Fait apparaître un tableau indiquant le nombred’observations dans chaque classe.

Critère d’information (AIC ou BIC). Fait apparaître un tableau contenant lesvaleurs d’AIC ou de BIC en fonction du critère choisi dans la boîte de dialogueprincipale, pour différents nombres de classes. Ce tableau est fourni uniquementlorsque le nombre de classes est déterminé automatiquement. Si le nombre declasses est fixe, ce paramètre est ignoré et le tableau n’est pas fourni.

Ensemble de données actif. Ce groupe vous permet d’enregistrer des variables dansl’ensemble de données actif.

Créer une variable d’appartenance à une classe ; Cette variable contient un numérod’identification de classe pour chaque observation. Le nom de cette variableest tsc_n, n étant un nombre entier positif qui indique l’ordinal de l’opérationd’enregistrement de l’ensemble de données actif effectuée par cette procédureau cours d’une session.

Fichiers XML. Le modèle de classe final et l’arborescence CF représentent deux typesde fichiers de résultats pouvant être exportés au format XML.

Exporter le modèle final. Le modèle de classe final est exporté vers le fichierindiqué au format XML (PMML). SmartScore et le serveur de SPSS (produitséparé) peuvent utiliser ce fichier de modèle pour appliquer les informations dumodèle à d’autres fichiers de données à des fins d’analyse.

Exporter l’arborescence CF. Cette option vous permet d’enregistrer l’état actuelde l’arborescence de classe et de le mettre à jour ultérieurement en utilisant desdonnées plus récentes.

Page 561: SPSS Base Users Guide 14.0

Chapitre

33Classification hiérarchique

Cette procédure tente d’identifier les classes d’observations (ou de variables)relativement homogènes basées sur des caractéristiques sélectionnées, en utilisantun algorithme qui débute avec chaque observation (ou variable) dans une classeséparée et qui combine les classes jusqu’à ce qu’il n’en reste qu’une. Vous pouvezanalyser des variables non normées ou vous pouvez choisir parmi un assortiment detransformations standardisées. Les mesures de distance ou de similarité sont généréespar la procédure Proximities (Proximités). Les statistiques s’affichent à chaque étapepour vous aider à choisir la meilleure solution.

Exemple : Y a-t-il des classes identifiables de spectacles télévisuels qui attirentdes audiences similaires à l’intérieur de chaque classe ? Avec une classificationhiérarchique, vous pouvez reclasser les spectacles télévisuels (observations) enclasses homogènes basées sur les caractéristiques du spectateur. Cette méthode peutêtre utilisée pour identifier des segments à des fins commerciales. Vous pouvez aussiclasser les villes (observations) en groupes homogènes pour permettre la sélection devilles comparables afin de tester diverses stratégies commerciales.

Statistiques : Chaîne des agrégations, matrice de distances (ou des similarités) etclasse d’affectation pour une seule solution ou un ensemble de solutions. Diagrammes: arbres hiérarchiques et Stalactites.

Données : Les variables peuvent être des données quantitatives, binaires ou d’effectif.L’échelle des variables est un élément important : des différences d’échelle quipeuvent affecter votre (vos) solution(s) en classes hiérarchiques. Si vos variables sontd’échelles très différentes (par exemple, une variable est mesurée en dollars et l’autreest mesurée en années), vous devez envisager de les standardiser (ceci peut être faitautomatiquement avec la procédure de la classification hiérarchique).

Tri par observation. Si des distances ex aequo ou des similitudes se présentent dans lesdonnées de saisie ou entre les classes mises à jour au cours de l’opération de jointure,la solution de classe qui en résulte risque de dépendre de l’ordre des observations dans

535

Page 562: SPSS Base Users Guide 14.0

536

Chapitre 33

le fichier. Vous pouvez obtenir différentes solutions pour lesquelles les observationsont été triées de manière aléatoire, afin de vérifier la stabilité d’une solution donnée.

Hypothèses : Les mesures de distance ou de similarité utilisées doivent conveniraux données analysées (Voir la procédure Proximities (proximités) pour plus derenseignements sur le choix des mesures de distances et de similarité). Vous devezaussi inclure toutes les variables appropriées dans votre analyse. L’omission devariables influentes peut aboutir à une solution erronée. Parce que la classificationhiérarchique est une méthode d’exploration, les résultats doivent être considéréscomme provisoires tant qu’ils ne sont pas confirmés avec un échantillon indépendant.

Figure 33-1Résultat de classification hiérarchique

Argentina 1 1 1

Brazil 1 1 1

Chile 1 1 1

DomincanR. 1 1 1

Indonesia 1 1 1

Austria 2 2 1

Canada 2 2 1

Denmark 2 2 1

Italy 2 2 1

Japan 2 2 1

Norway 2 2 1

Switzerland 2 2 1

Bangladesh 3 3 2

India 3 3 2

Bolivia 4 1 1

Paraguay 4 1 1

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

ObservationEtiquette

4Classes

3Classes

2Classes

Classe(s) d'affectation

Page 563: SPSS Base Users Guide 14.0

537

Classification hiérarchique

X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X XX X X X X X X X X X X X X X X X X X X X X X X X X X X X X XX X X X X X X X X X X X X X X X X X X X X X X X X X X X XX X X X X X X X X X X X X X X X X X X X X X X X X X X XX X X X X X X X X X X X X X X X X X X X X X X X X X XX X X X X X X X X X X X X X X X X X X X X X X X X XX X X X X X X X X X X X X X X X X X X X X X X X XX X X X X X X X X X X X X X X X X X X X X X X XX X X X X X X X X X X X X X X X X X X X X X XX X X X X X X X X X X X X X X X X X X X X XX X X X X X X X X X X X X X X X X X X X XX X X X X X X X X X X X X X X X X X X XX X X X X X X X X X X X X X X X X X XX X X X X X X X X X X X X X X X X XX X X X X X X X X X X X X X X X X

NombreDeClasses1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

14:In

dia

14 13 10:J

apan

10 9:Ita

ly9 7:

Can

ada

7 8:D

enm

ark

8 12 11:N

orw

ay11 6:

Aus

tria

6 16:P

arag

uay

16 15:B

oliv

ia15 5:

Indo

nesi

a5 2:

Bra

zil

2 4 3:C

hile

3 1:A

rgen

tina

Observation

Stalactite Vertical

* * * * * * C L A S S I F I C A T I O N H I E R A R C H I Q U E * * * * * *

Arbre hiérarchique utilisant la distance moyenne (entre les groupes)

Distance redimensionnée pour classe combinée

OBSERVATION 0 5 10 15 20 25 Etiquette Num +---------+---------+---------+---------+---------+

LIFEEXPF 2

BABYMORT 5

LITERACY 3

BIRTH_RT 6

FERTILTY 10

URBAN 1

LOG_GDP 8

POP_INCR 4

B_TO_D 9

DEATH_RT 7

LOG_POP 11

Obtenir une classification hiérarchique

E A partir des menus, sélectionnez :Analyse

ClassificationClassification hiérarchique

Page 564: SPSS Base Users Guide 14.0

538

Chapitre 33

Figure 33-2Boîte de dialogue Classification hiérarchique

E Si vous classez des observations, sélectionnez au moins une variable numérique. Sivous classez des variables, sélectionnez au moins trois variables numériques.

Vous avez la possibilité de sélectionner une variable d’identification pour étiqueter lesobservations.

Page 565: SPSS Base Users Guide 14.0

539

Classification hiérarchique

Méthode de classification hiérarchiqueFigure 33-3Boîte de dialogue Classification hiérarchique : Méthode

Méthode d’agrégation : Les choix disponibles sont : la Distance moyenne entreclasses, la Distance moyenne dans les classes, l’Agrégation suivant le saut minimum,l’Agrégation suivant le diamètre, les Barycentres, la Médiane et la Méthode de Ward.

Mesure : Il permet de spécifier la mesure de distance ou de similarité devant êtreutilisée pour la classification. Sélectionnez le type de données et la mesure appropriéede distance ou de similarité :

Intervalle : Les choix possibles sont la Distance Euclidienne, le Carré de la distanceEuclidienne, le Cosinus, la Corrélation de Pearson, la Distance de Tchebycheff,la Distance de Manhattan (bloc), la Distance de Minkowski, et Autre.

Effectif : Les choix possibles sont la Distance du Chi-deux et la Distance duphi-deux.

Binaire. Les choix possibles sont la Distance Euclidienne, le Carré de la distanceEuclidienne, l’Ecart de taille, la Différence de motif, la Variance, la Dispersion,la Forme, l’Indice de Sokal et Michener, la Corrélation phi tétrachorique, leLambda, le D d’Anderberg, Dice, Hamann, Jaccard, Kulczynski 1, Kulczynski 2,

Page 566: SPSS Base Users Guide 14.0

540

Chapitre 33

Lance et Williams, Ochiai, Rogers et Tanimoto, Russel et Rao, Sokal et Sneath1, Sokal et Sneath 2, Sokal et Sneath 3, Sokal et Sneath 4, Sokal et Sneath 5,le Y de Yule, et le Q de Yule.

Transformer les valeurs : Vous permet de standardiser les valeurs des données pour lesobservations ou les valeurs avant le calcul des proximités (non disponible pour lesdonnées binaires). Les méthodes de standardisation disponibles sont Centrer-réduire,Entre –1 et 1, Entre 0 et 1, Maximum = 1, Moyenne = 1 ou Ecart type = 1.

mesures : Vous permet de transformer les valeurs générées par la mesure de distance.Elles sont appliquées après le calcul de la mesure de distance. Les choix possiblessont Valeurs absolues, Inverser le signe, et Rééchelonner entre 0 et 1.

Statistiques de la classification hiérarchiqueFigure 33-4Boîte de dialogue Classification hiérarchique : Statistiques

Chaîne des agrégations : Affiche les observations ou les classes combinées à chaqueétape, les distances entre les observations ou les classes en cours de combinaison, et ledernier niveau de classe auquel une observation (ou une variable) a rejoint la classe.

Matrice des distances : Indique les distances ou les similarités entre éléments.

Classe(s) d’affectation : Affiche le groupe auquel chaque observation appartient lorsd’une ou plusieurs étapes de la combinaison de classes. Les options disponibles sontUne seule partition, Plusieurs partitions ou Aucune.

Page 567: SPSS Base Users Guide 14.0

541

Classification hiérarchique

Diagrammes (graphiques) de classification hiérarchiqueFigure 33-5Boîte de dialogue Classification hiérarchique : Graphiques (diagrammes)

Arbre hiérarchique : Affiche un arbre hiérarchique. Les arbres hiérarchiques peuventêtre utilisés pour évaluer la cohésion des groupes formés et ils fournissent desrenseignements sur le nombre approprié de groupes à conserver.

Stalactites : Affiche un diagramme en stalactite, incluant toutes les classes ou uneclasse spécifique. Les diagrammes en stalactite affichent des informations sur la façondont les observations sont regroupées à chaque itération de l’analyse. Orientationvous permet de sélectionner un diagramme vertical ou horizontal.

Enregistrement des nouvelles variables de classificationhiérarchique

Figure 33-6Boîte de dialogue Classification hiérarchique : Enregistrer les nouvelles...

Page 568: SPSS Base Users Guide 14.0

542

Chapitre 33

Classe(s) d’affectation : Vous permet de sauvegarder les classes d’affectation pourune ou plusieurs ou aucune partition(s). Les variables sauvegardées peuvent alorsêtre utilisées pour des analyses ultérieures pour explorer d’autres différences entregroupes.

Fonctionnalités supplémentaires de la syntaxe de commandeCLUSTER

La procédure de classification hiérarchique utilise la syntaxe de commande CLUSTER.Le langage de commande SPSS vous permet aussi de :

Utiliser plusieurs méthodes de classification dans une seule analyse.

Lire et analyser une matrice de proximité.

Ecrire une matrice de proximité à analyser ultérieurement.

Indiquer des valeurs pour la puissance et la racine dans la mesure de distancepersonnalisée (Puissance).

Spécifier les noms des variables enregistrées.

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 569: SPSS Base Users Guide 14.0

Chapitre

34Nuées dynamiques

Cette procédure cherche à identifier des groupes d’observations relativementhomogènes d’après des caractéristiques sélectionnées, au moyen d’un algorithme quipeut traiter de grands nombres d’observations. L’algorithme vous demande toutefoisd’indiquer le nombre de classes. Vous pouvez indiquer les centres de classe initiauxsi vous connaissez cette information. Vous pouvez choisir entre deux méthodesde classement des observations, soit la mise à jour des centres de classe de façonitérative, soit la classification seule. Vous pouvez enregistrer l’appartenance à uneclasse, les informations de distance et les centres de classes finaux. Vous pouvezéventuellement indiquer une variable dont les valeurs servent à étiqueter les résultatspar observations. Vous pouvez également demander des statistiques F d’analyse dela variance. Bien que ces statistiques soient opportunistes (la procédure chercheà former des groupes qui diffèrent), la taille relative des statistiques fournit desinformations sur la contribution de chaque variable à la séparation des groupes.

Exemple. Quels sont les groupes de programmes de télévision identifiables qui attirentdes publics similaires au sein de chaque groupe ? Grâce à l’analyse des nuéesdynamiques, vous pouvez classer les programmes de télévision (observations) en kgroupes homogènes d’après les caractéristiques des téléspectateurs. Cette méthodepeut être utilisée pour identifier des segments à des fins commerciales. Vous pouvezaussi classer les villes (observations) en groupes homogènes pour permettre lasélection de villes comparables afin de tester diverses stratégies commerciales.

Statistiques. Solution complète : centres de classes initiaux, tableau ANOVA. Chaqueobservation: information de classe, distance au centre de classe.

Données. Les variables doivent être quantitatives au niveau intervalle ou ratio. Si vosvariables sont binaires ou sont des effectifs, utilisez la procédure de classificationhiérarchique.

543

Page 570: SPSS Base Users Guide 14.0

544

Chapitre 34

Ordre des observations et des centres de classe initiaux. L’algorithme par défautpermettant de choisir les centres de classe initiaux varie en fonction du tri parobservation. L’option Utiliser les nouveaux centres de la boîte de dialogue Itérer rendla solution résultante potentiellement dépendante du tri par observation, quel que soitle mode de sélection des centres de classe initiaux. Si vous utilisez l’une de cesméthodes, vous pouvez obtenir différentes solutions pour lesquelles les observationsont été triées de manière aléatoire, afin de vérifier la stabilité d’une solution donnée.Si vous indiquez les centres de classe initiaux et que vous n’utilisez pas l’optionUtiliser les nouveaux centres, vous évitez tout problème lié au tri par observation.Toutefois, le tri des centres de classe initiaux risque d’affecter la solution, s’il existedes distances ex aequo entre les observations et les centres de classe. Pour évaluer lastabilité d’une solution donnée, vous pouvez comparer les résultats des analyses pourlesquelles les valeurs des centres initiaux ont été permutées de différentes manières.

Hypothèses. Les distances sont calculées à l’aide de la distance euclidienne simple.Si vous souhaitez utiliser une autre distance ou une mesure de similarité, utilisez laprocédure de classification hiérarchique. Il est important de prendre en compte lamise à l’échelle des variables. Si vos variables sont mesurées selon des échellesdifférentes (une variable est exprimée en dollars par exemple et une autre enannées), vos résultats risquent d’être erronés. Dans ces cas, vous pouvez envisagerde standardiser vos variables avant d’effectuer l’analyse des nuées dynamiques (celapeut être fait dans la procédure Descriptives). La procédure suppose que vous avezsélectionné le nombre voulu de classes et que vous avez inclus toutes les variablespertinentes. Si vous avez choisi un nombre de classes inadéquat ou omis de variablesimportantes, vos résultats risquent d’être erronés.

Page 571: SPSS Base Users Guide 14.0

545

Nuées dynamiques

Figure 34-1Résultats de l’analyse des nuées dynamiques

-1.88606 -1.54314 1.45741 .55724

-3.52581 -1.69358 .62725 .99370

-2.89320 -1.65146 -.51770 .88601

.93737 .16291 3.03701 -1.12785

4.16813 1.38422 -.69589 -.88983

2.68796 .42699 .33278 -1.08033

4.41517 .63185 -1.89037 .63185

-1.99641 -1.78455 .53091 1.22118

-.52182 -.31333 4.40082 -.99285

2.24070 .75481 .46008 -.76793

.24626 2.65246 -1.29624 -.74406

ZURBAN

ZLIFEEXP

ZLITERAC

ZPOP_INC

ZBABYMOR

ZBIRTH_R

ZDEATH_R

ZLOG_GDP

ZB_TO_D

ZFERTILT

ZLOG_POP

1 2 3 4

Classe

Centres de classes initiaux

1.932 2.724 3.343 1.596

.000 .471 .466 .314

.861 .414 .172 .195

.604 .337 .000 .150

.000 .253 .237 .167

.000 .199 .287 .071

.623 .160 .000 .000

.000 .084 .000 .074

.000 .080 .000 .077

.000 .097 .185 .000

1

2

3

4

5

6

7

8

9

10

Itération1 2 3 4

Changements dans les centres de classes

Historique des itérations

Page 572: SPSS Base Users Guide 14.0

546

Chapitre 34

-1.70745 -.30863 .16816 .62767

-2.52826 -.15939 -.28417 .80611

-2.30833 .13880 -.81671 .73368

.59747 .13400 1.45301 -.95175

2.43210 .22286 .25622 -.80817

1.52607 .12929 1.13716 -.99285

2.10314 -.44640 -.71414 .31319

-1.77704 -.58745 -.16871 .94249

-.29856 .19154 1.45251 -.84758

1.51003 -.12150 1.27010 -.87669

.83475 .34577 -.49499 -.22199

ZURBAN

ZLIFEEXP

ZLITERAC

ZPOP_INC

ZBABYMOR

ZBIRTH_R

ZDEATH_R

ZLOG_GDP

ZB_TO_D

ZFERTILT

ZLOG_POP

1 2 3 4

Classe

Centres de classes finaux

5.627 5.640 7.924

5.627 2.897 3.249

5.640 2.897 5.246

7.924 3.249 5.246

1

2

3

4

Classe1 2 3 4

Distances entre les centres de classes finaux

Page 573: SPSS Base Users Guide 14.0

547

Nuées dynamiques

10.409 3 .541 68 19.234 .000

19.410 3 .210 68 92.614 .000

18.731 3 .229 68 81.655 .000

18.464 3 .219 68 84.428 .000

18.621 3 .239 68 77.859 .000

19.599 3 .167 68 117.339 .000

13.628 3 .444 68 30.676 .000

17.599 3 .287 68 61.313 .000

16.316 3 .288 68 56.682 .000

18.829 3 .168 68 112.273 .000

3.907 3 .877 68 4.457 .006

ZURBAN

ZLIFEEXP

ZLITERAC

ZPOP_INC

ZBABYMOR

ZBIRTH_R

ZDEATH_R

ZLOG_GDP

ZB_TO_D

ZFERTILT

ZLOG_POP

CarréMoyen df

Classe

CarréMoyen df

Erreur

F Sig.

ANOVA

Les tests F ne doivent être utilisés qu'à des fins descriptives car les classes sont choisies pour maximiser les différencesentre les observations des différentes classes. Les seuils de signification observés ne sont pas corrigés par la suite et nepeuvent donc pas être interprétés en tant que tests de l ’hypothèse

aquelle les moyennes de classe sont égales.Selon l

Obtenir une analyse de nuées dynamiques

E A partir des menus, sélectionnez :Analyse

ClassificationNuées dynamiques

Page 574: SPSS Base Users Guide 14.0

548

Chapitre 34

Figure 34-2Boîte de dialogue Nuées dynamiques

E Sélectionnez les variables à utiliser dans l’analyse.

E Spécifiez le nombre de classes. Le nombre de classes doit être au moins de deux et nedoit pas être supérieur au nombre d’observations contenues dans le fichier de données.

E Sélectionnez soit la méthode Itérer et classer soit la méthode Classer seulement.

E Vous avez la possibilité de sélectionner une variable d’identification pour étiqueter lesobservations.

Efficacité de la classification en nuées dynamiques

La commande d’analyse des nuées dynamiques est efficace essentiellement parcequ’elle ne calcule pas les distances entre toutes les paires d’observations, commec’est le cas dans de nombreux algorithmes de classification, y compris celui utilisépar la commande de classification hiérarchique de SPSS.

Page 575: SPSS Base Users Guide 14.0

549

Nuées dynamiques

Pour plus d’efficacité, prenez un échantillon d’observations et utilisez la méthodeItérer et classer pour déterminer les centres de classe. Sélectionnez Ecrire les

centres finaux dans Fichier. Ensuite, restaurez la totalité du fichier de données etsélectionnez la méthodeClasser seulement puis sélectionnez Lire les fichiers initiaux à

partir de pour classer tout le fichier en utilisant les centres qui sont estimés à partirde l’échantillon. Vous pouvez écrire et lire depuis un fichier ou un ensemble dedonnées. Les ensembles de données sont disponibles pour utilisation ultérieure dansla même session mais ne sont pas enregistrés en tant que fichiers sauf si vous lefaites explicitement avant la fin de la session. Les noms des ensembles de donnéesdoivent être conformes aux règles de dénomination de variables SPSS. Pour plusd'informations, reportez-vous à « Noms de variable » dans Chapitre 5 à p. 99.

Itération de la classification en nuées dynamiquesFigure 34-3Boîte de dialogue Nuées dynamiques : Itérer

Remarque : Ces options sont disponibles uniquement si vous avez sélectionné laméthode Itérer et classer dans la boîte de dialogue Analyse de nuées dynamiques.

Maximum des itérations. Limite le nombre des itérations dans l’algorithme des nuéesdynamiques. L’itération s’arrête après ce nombre d’itérations même si le critère deconvergence n’est pas satisfait. Ce nombre doit être compris entre 1 et 999.

Pour reproduire l’algorithme utilisé par la commande de classement rapide QuickCluster dans les versions de SPSS antérieures à la version 5.0, indiquez 1 commeMaximum des itérations.

Critère de convergence. Détermine le moment où l’itération s’arrête. Il représente uneproportion de la distance minimale entre les centres de classes initiaux et doit doncêtre plus grand que 0 mais plus petit que 1. Si le critère est égal à 0,02 par exemple,l’itération cesse lorsqu’une itération complète ne déplace plus aucun des centres

Page 576: SPSS Base Users Guide 14.0

550

Chapitre 34

d’une distance de plus de deux pour cent de la plus petite distance entre n’importequels centres initiaux.

Utiliser les nouveaux centres. Vous permet de demander la mise à jour des centresaprès l’affectation de chaque observation. Si vous ne sélectionnez pas cette option, lesnouveaux centres seront calculés lorsque toutes les observations auront été affectées.

Enregistrement des analyses de classes de nuées dynamiquesFigure 34-4Boîte de dialogue Nuées dynamiques : Enregistrer les nouvelles variables...

Vous pouvez enregistrer des informations sur la solution relatives aux nouvellesvariables à utiliser dans les analyses ultérieures :

Classe(s) d’affectation. Crée une nouvelle variable indiquant la classe d’affectationfinale de chaque observation. Les valeurs de la nouvelle variable vont de 1 au nombrede classes.

Distance au centre de classe. Crée une nouvelle variable indiquant la distanceeuclidienne entre chaque nouvelle variable et son centre de classification.

Page 577: SPSS Base Users Guide 14.0

551

Nuées dynamiques

Options d’analyses des classes de nuées dynamiquesFigure 34-5Boîte de dialogue Nuées dynamiques : Options

Statistiques. Vous pouvez sélectionner les statistiques suivantes : Centres de classesinitiaux, Tableau ANOVA, et Affectation et distances au centre.

Centres de classe initiaux. Première estimation des moyennes des variablesde chacune des classes. Par défaut, le nombre d'observations assez espacéessélectionné dans les données est égal au nombre de classes. Les centres de classesinitiaux sont utilisés pour une première classification et sont ensuite mis à jour.

Tableau ANOVA. Affiche un tableau d'analyse de la variance, incluant les testsF univariés pour chacune des variables de la classification. Les tests F sontuniquement descriptifs et les probabilités qui en résultent ne doivent pas êtreinterprétées. Le tableau ANOVA n'apparaît pas si toutes les observations sontaffectées à une seule classe.

Affectations et distances au centre. Affiche pour chaque observation l'affectationde classe finale et la distance euclidienne entre l'observation et le centre de classeutilisé pour classer l'observation. Affiche également la distance euclidienne entreles centres de classe finaux.

Valeurs manquantes. Les options disponibles sont Exclure toute observation incomplète

ou Exclure seulement les composantes non valides.

Exclure toute observation incomplète. Exclut de l’analyse les observations qui ontdes valeurs manquantes pour une variable de grappe.

Exclure seulement les composantes non valides. Affecte des observations auxclasses basées sur des distances calculées à partir de toutes les variables n’ayantpas de valeur manquante.

Page 578: SPSS Base Users Guide 14.0

552

Chapitre 34

Fonctionnalités supplémentaires de la commande QUICKCLUSTER

La procédure de nuées dynamiques utilise la syntaxe de commande QUICK CLUSTER.Le langage de commande SPSS vous permet aussi de :

Accepter les premières observations k comme centres de classes initiaux, évitantainsi le passage de données normalement utilisé pour les estimer.

Spécifier les centres de classe initiaux directement comme faisant partie de lasyntaxe de commande.

Spécifier les noms des variables enregistrées.

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 579: SPSS Base Users Guide 14.0

Chapitre

35Tests non paramétriques

La procédure de tests non paramétriques propose plusieurs tests qui ne nécessitent pasd’hypothèse concernant la forme de la distribution sous-jacente.

Test Chi-deux : Tabule une variable en modalités et calcule une statistique Chi-deuxbasée sur les différences entre les fréquences observées et les fréquences attendues.

Test binomial : Compare la fréquence observée dans chaque modalité d’une variabledichotomique avec les fréquences attendues de la distribution binomiale.

Suites en séquence : Teste si l’ordre d’occurrence de deux valeurs d’une variableest aléatoire.

Test Kolmogorov-Smirnov pour un échantillon : Compare la fonction de distributioncumulée observée pour une variable avec une distribution théorique spécifiée, quipeut être normale, uniforme, exponentielle ou Poisson.

Tests de deux échantillons indépendants : Compare deux groupes d’observationsd’une variable. Le test U de Mann-Whitney, le test de Kolmogorov-Smirnov pourdeux échantillons, le test de réactions extrêmes Moses et les suites en séquencesWald-Wolfowitz sont disponibles.

Tests de deux échantillons liés : Compare les distributions de deux variables. Le testde Wilcoxon, le test des signes et le test de McNemar sont disponibles.

Tests de plusieurs échantillons indépendants : Compare deux groupes d’observationsou plus d’une variable. Le test de Kruskal-Wallis, le test de la médiane et le test deJonckheere-Terpstra sont disponibles.

Tests de plusieurs échantillons liés : Compare les distributions de deux variablesou plus. Le test de Friedman, le test W de Kendall et le test Q de Cochran sontdisponibles.

Les quartiles et la moyenne, l’écart-type, le minimum, le maximum, et le nombred’observations sont disponibles pour tous les tests ci-dessus.

553

Page 580: SPSS Base Users Guide 14.0

554

Chapitre 35

Test du Chi-deux

La procédure de test du Chi-deux tabule une variable en modalités et calcule unestatistique Chi-deux. Ce test de qualité de l’ajustement compare les fréquencesobservées et attendues dans chaque modalité pour vérifier si toutes les modalitéscontiennent la même proportion de valeurs ou si chaque modalité contient uneproportion de valeurs spécifiées par l’utilisateur.

Exemples : Le test du Chi-deux peut être utilisé pour déterminer si un sac de bonbonscontient les mêmes proportions de bonbons bleus, marrons, verts, oranges, rouges etjaunes. Vous pouvez aussi tester si le sac de bonbons contient 5 % de bonbons bleus,30 % de bonbons marrons, 10 % de bonbons verts, 20 % bonbons oranges, 15 % debonbons rouges et 15 % de bonbons jaunes.

Statistiques : Moyenne, écart-type, minimum, maximum, et quartiles. Le nombre etle pourcentage d’observations manquantes et non manquantes, le nombre de casobservés et attendus pour chaque modalité, les résidus et la statistique du Chi-deux.

Données : Utilisez des variables qualitatives numériques ordonnées ou désordonnées(niveau de mesure ordinal ou nominal). Pour convertir des variables chaînes envariables numériques, utilisez la procédure de recodage automatique, disponibledans le menu Transformer.

Hypothèses : Les tests non paramétriques ne nécessitent pas d’hypothèses sur la formede la distribution sous-jacente. On part du principe que les données constituent unéchantillon aléatoire. Les fréquences attendues pour chaque modalité doivent êtreau moins égales à 1,20 % des modalités au maximum doivent avoir des fréquencesinférieures à 5.

Page 581: SPSS Base Users Guide 14.0

555

Tests non paramétriques

Figure 35-1Résultat de test du Chi-deux

6 18.8 -12.8

33 18.8 14.2

9 18.8 -9.8

17 18.8 -1.8

22 18.8 3.2

26 18.8 7.2

113

Bleu

Marron

Vert

Jaune

Orange

Rouge

Total

NObservé(e)s Théoriques Résidu

Couleur du bonbon haricot

N

27.973

5

.000

Khi-deux 1

df

SignificationAsymptotique

Couleur du

Haricot

Tests statistiques

0 cellule. 0 % de fréquences faibles. 18,8 fréquences faibles théoriques…

1.

Bonbon

6 18.8 -12.8

33 18.8 14.2

9 18.8 -9.8

17 18.8 -1.8

22 18.8 3.2

26 18.8 7.2

113

Bleu

Marron

Vert

Jaune

Orange

Rouge

Total

NObservé(e)s Théoriques Résidu

Couleur du bonbon haricot

N

Page 582: SPSS Base Users Guide 14.0

556

Chapitre 35

1.041

5

.959

Khi-deux 1

df

SignificationAsymptotique

Couleur du

Haricot

Tests statistiques

0 cellule. 0 % de fréquences faibles. 5,7 fréquences faibles théoriques…

1.

Bonbon

Pour obtenir un test Chi-deux

E A partir des menus, sélectionnez :Analyse

Tests non paramétriquesChi-deux

Figure 35-2Boîte de dialogue Test du Chi-deux

E Sélectionnez des variables de test. Chaque variable produit un test distinct.

E Vous pouvez également cliquer sur Options pour les statistiques descriptives, lesquartiles et le contrôle du traitement des données manquantes.

Page 583: SPSS Base Users Guide 14.0

557

Tests non paramétriques

Valeurs et intervalles théoriques du test du Chi-deux

Intervalle théorique. Par défaut, chaque valeur distincte de la variable est définiecomme modalité. Pour établir des modalités dans un intervalle spécifique,sélectionnez l’option Dans les limites spécifiées, et indiquez les valeurs entières pourles limites inférieure et supérieure. Des modalités sont établies pour chaque valeurentière comprise dans l’intervalle, et les observations à l’extérieur des limites sontexclues. Par exemple, si vous spécifiez une valeur de 1 pour la limite inférieure et unevaleur de 4 pour la limite supérieure, seules les valeurs entières comprises entre 1 et 4sont utilisées pour le test du Chi-deux.

Valeurs théoriques. Par défaut, toutes les modalités ont des valeurs théoriques égales.Les modalités peuvent avoir des proportions attendues définies par l’utilisateur.Sélectionnez Valeurs, indiquez une valeur supérieure à 0 pour chaque modalité devariable de test et cliquez ensuite sur Ajouter. Chaque fois que vous ajoutez une valeur,celle-ci apparaît au bas de la liste des valeurs. L’ordre des valeurs est important. Ilcorrespond à l’ordre croissant des valeurs des modalités de la variable de test. Lapremière valeur de la liste correspond à la valeur de groupe la plus basse de la variablede test et la dernière valeur correspond à la valeur la plus élevée. Les éléments de laliste des valeurs sont additionnés et chaque valeur est ensuite divisée par cette sommepour calculer la proportion d’observations attendues dans la modalité correspondante.Par exemple, une liste de valeurs de 3, 4, 5, 4 indique les proportions attendues de3/16, 4/16, 5/16 et 4/16.

Test du Chi-deux : Options

Figure 35-3Boîte de dialogue Test du Chi-deux : Options

Page 584: SPSS Base Users Guide 14.0

558

Chapitre 35

Statistiques : Vous pouvez choisir l’une des statistiques récapitulatives, ou bien lesdeux.

Caractéristique : Affiche la moyenne, l’écart-type, le minimum, le maximum, et lenombre d’observations non manquantes.

Quartiles : Indique les valeurs correspondant au 25ème, 50ème et 75ème centiles.

Valeurs manquantes : Contrôle le traitement des valeurs manquantes.

Exclure les observations test par test : Lorsque plusieurs tests sont indiqués, chaquetest est effectué séparément selon le nombre des valeurs manquantes.

Exclure toute observation incomplète : Les observations avec des valeursmanquantes pour l’une ou l’autre variable sont exclues de toutes les analyses.

Fonctionnalités supplémentaires de la commande NPAR TESTS (test duChi-deux)

Le langage de commande SPSS vous permet aussi de :

Spécifier des valeurs minimale et maximale différentes, ou des fréquencesattendues pour différentes variables (avec la sous-commande CHISQUARE).

Tester la même variable avec différentes fréquences attendues ou utiliserdifférentes plages (avec la sous-commande EXPECTED).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Test binomial

La procédure de test binomial compare les fréquences observées des deux modalitésd’une variable dichotomique avec les fréquences que l’on peut attendre d’unedistribution binomiale avec un paramètre de probabilité spécifié. Par défaut, leparamètre de probabilité pour les deux groupes est de 0,5. Pour modifier lesprobabilités, vous pouvez entrer un test de proportion pour le premier groupe. Laprobabilité pour le second groupe sera de 1 moins la probabilité spécifiée pourle premier groupe.

Page 585: SPSS Base Users Guide 14.0

559

Tests non paramétriques

Exemple : Quand vous lancez une pièce, la probabilité de tomber sur le côté face estde 1/2. Sur la base de cette hypothèse, une pièce est lancée 40 fois, et les résultatssont enregistrés (pile ou face). Du test binomial, il se peut que vous observiez que les3/4 des lancements sont tombés sur le côté face et que le seuil de signification observéest bas (0,0027). Ces résultats indiquent qu’il est peu probable que la probabilité pourque la pièce tombe sur le côté face soit égale à 1/2. La pièce est probablement truquée.

Statistiques : Moyenne, écart-type, minimum, maximum, nombre d’observations avecdes valeurs non manquantes et quartiles.

Données : Les variables testées doivent être numériques et dichotomiques. Pourconvertir des variables chaînes en variables numériques, utilisez la procédurede recodage automatique, disponible dans le menu Transformer. Une variabledichotomique est une variable qui ne peut prendre que deux valeurs possibles : oui ounon, vrai ou faux, 0 ou 1, etc. Si les variables ne sont pas dichotomiques, vous devezspécifier une césure. La césure répartit les observations dont la valeur est supérieure àla césure dans un groupe et le reste des observations dans un autre groupe.

Hypothèses : Les tests non paramétriques ne nécessitent pas d’hypothèses sur la formede la distribution sous-jacente. On part du principe que les données constituent unéchantillon aléatoire.

Figure 35-4Résultat du test binomial

Face 30 .75 .50 .0031

Pile 10 .25

40 1.00

Groupe 1

Groupe 2

Total

PièceModalité N

ProportionObservée

Test deProportion

SignificationAsymptotique

(Bilatérale)

Test binomial

Basé sur l'approximation Z1.

Pour obtenir un test binomial

E A partir des menus, sélectionnez :Analyse

Tests non paramétriquesBinomial

Page 586: SPSS Base Users Guide 14.0

560

Chapitre 35

Figure 35-5Boîte de dialogue Test binomial

E Sélectionnez une ou plusieurs variables numériques à tester.

E Vous pouvez également cliquer sur Options pour les statistiques descriptives, lesquartiles et le contrôle du traitement des données manquantes.

Test binomial : Options

Figure 35-6Boîte de dialogue Test binomial

Statistiques : Vous pouvez choisir l’une des statistiques récapitulatives, ou bien lesdeux.

Page 587: SPSS Base Users Guide 14.0

561

Tests non paramétriques

Caractéristique : Affiche la moyenne, l’écart-type, le minimum, le maximum, et lenombre d’observations non manquantes.

Quartiles : Indique les valeurs correspondant au 25ème, 50ème et 75ème centiles.

Valeurs manquantes : Contrôle le traitement des valeurs manquantes.

Exclure les observations test par test : Lorsque plusieurs tests sont indiqués, chaquetest est effectué séparément selon le nombre des valeurs manquantes.

Exclure toute observation incomplète : Les observations avec des valeursmanquantes pour toutes les variables testées sont exclues de toutes les analyses.

Fonctionnalités supplémentaires de la commande NPAR TESTS (Testbinomial)

Le langage de commande SPSS vous permet aussi de :

Sélectionner des groupes spécifiques (et en exclure d’autres) lorsqu’une variablecomporte plus de deux modalités (avec la sous-commande BINOMIAL).

Spécifier différentes césures ou probabilités pour différentes variables (avec lasous-commande BINOMIAL).

Tester la même variable avec différentes césures ou probabilités (avec lasous-commande EXPECTED).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Suites en séquences

La procédure Suites en séquences teste si l’ordre d’occurrence de deux valeursd’une variable est aléatoire. Une séquence est une suite d’observations semblables.Un échantillon comportant trop ou trop peu de séquences suggère que l’échantillonn’est pas aléatoire.

Exemples : Supposons que 20 personnes soient sondées pour déterminer si ellesachèteraient un produit donné. On peut douter que l’échantillon soit aléatoire si toutesles personnes sont du même sexe. Les suites en séquences peuvent être utilisées pourdéterminer si l’échantillon a été tiré au hasard.

Page 588: SPSS Base Users Guide 14.0

562

Chapitre 35

Statistiques : Moyenne, écart-type, minimum, maximum, nombre d’observations avecdes valeurs non manquantes et quartiles.

Données : Les variables doivent être numériques. Pour convertir des variables chaînesen variables numériques, utilisez la procédure de recodage automatique, disponibledans le menu Transformer.

Hypothèses : Les tests non paramétriques ne nécessitent pas d’hypothèses sur la formede la distribution sous-jacente. Utilisez des échantillons à distribution de probabilitécontinue.

Figure 35-7Résultat de Suites en Séquences

1.007

13

2015

2.234

.025

Valeur de test 1

Observations < Valeur de testObservations >= Valeur de testTotal des observationsNombre de séquences

Z

Significationasymptotique (bilatérale)

Sexe

Suites en séquences

Médiane1.

Pour obtenir un test de suites

E A partir des menus, sélectionnez :Analyse

Tests non paramétriquesSéquences

Page 589: SPSS Base Users Guide 14.0

563

Tests non paramétriques

Figure 35-8Boîte de dialogue Suites en séquences

E Sélectionnez une ou plusieurs variables numériques à tester.

E Vous pouvez également cliquer sur Options pour les statistiques descriptives, lesquartiles et le contrôle du traitement des données manquantes.

Césure des Suites en séquences

Césure : Spécifie une césure pour dichotomiser les variables que vous avez choisies.Vous pouvez utiliser soit la moyenne, la médiane ou le mode observés, soit une valeurspécifiée comme césure. Les observations dont les valeurs sont inférieures à la césuresont assignées à un groupe et les observations dont les valeurs sont supérieures à lacésure sont assignées à l’autre groupe. Un test est réalisé pour chaque césure choisie.

Page 590: SPSS Base Users Guide 14.0

564

Chapitre 35

Options des Suites en séquencesFigure 35-9Boîte de dialogue Suites en séquences : Options

Statistiques : Vous pouvez choisir l’une des statistiques récapitulatives, ou bien lesdeux.

Caractéristique : Affiche la moyenne, l’écart-type, le minimum, le maximum, et lenombre d’observations non manquantes.

Quartiles : Indique les valeurs correspondant au 25ème, 50ème et 75ème centiles.

Valeurs manquantes : Contrôle le traitement des valeurs manquantes.

Exclure les observations test par test : Lorsque plusieurs tests sont indiqués, chaquetest est effectué séparément selon le nombre des valeurs manquantes.

Exclure toute observation incomplète : Les observations avec des valeursmanquantes pour l’une ou l’autre variable sont exclues de toutes les analyses.

Fonctionnalités supplémentaires de la commande NPAR TESTS (Suites enséquences)

Le langage de commande SPSS vous permet aussi de :

Spécifier différentes césures pour différentes variables (à l’aide de lasous-commande RUNS).

Tester la même variable par rapport à différentes césures personnalisées (à l’aidede la sous-commande RUNS).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 591: SPSS Base Users Guide 14.0

565

Tests non paramétriques

Test Kolmogorov-Smirnov pour un échantillon

Le test de Kolmogorov-Smirnov pour un échantillon compare la fonction dedistribution cumulée observée d’une variable avec une distribution théoriquespécifiée, qui peut être normale, uniforme, de Poisson ou exponentielle. Le Z deKolmogorov-Smirnov est calculé à partir de la plus grande différence (en valeurabsolue) entre les fonctions de distribution cumulées observées et théoriques.Le test de qualité de l’ajustement contrôle si les observations peuvent avoir étéraisonnablement déduites de la distribution spécifiée.

Exemple : La plupart des tests paramétriques nécessitent des variables distribuéesnormalement. Le test de Kolmogorov-Smirnov pour un échantillon permet de vérifierqu’une variable (par exemple Revenu) est distribuée normalement.

Statistiques : Moyenne, écart-type, minimum, maximum, nombre d’observations avecdes valeurs non manquantes et quartiles.

Données : Utilisez des variables quantitatives (mesure d’intervalle ou de rapport).

Hypothèses : Le test de Kolmogorov-Smirnov part du principe que les paramètres dela distribution à tester sont précisés a priori. Cette procédure estime les paramètres àpartir d’un échantillon. L’échantillon de moyenne et l’échantillon d’écart type sontles paramètres pour une distribution normale. Les valeurs minimum et maximumde l’échantillon définissent l’intervalle de la distribution uniforme, l’échantillonde moyenne est le paramètre pour la distribution de Poisson et l’échantillon del’écart-type est le paramètre pour la distribution exponentielle. La puissance du test àdétecter les abandons de la distribution hypothétique peut être sérieusement diminuée.Pour le test d’une distribution normale avec des paramètres estimés, considérez le testK-S Lilliefors ajusté (disponible dans la procédure d’exploration).

Page 592: SPSS Base Users Guide 14.0

566

Chapitre 35

Figure 35-10du test de Kolmogorov-Smirnov pour un échantillon

20

56250.00

45146.40

.170

.170

-.164

.760

.611

N

Moyenne

Ecart type

Paramètres gaussiens 1,2

Absolues

Positives

Négatives

Différences les plus extrêmes

Z de Kolmogorov-Smirnov

Signification asymptotique (bilatérale)

Revenu

Test Kolmogorov-Smirnov pour un échantillon

Distribution à tester normale1.

Calcul à partir de données2.

Pour obtenir un test de Kolmogorov-Smirnov pour un échantillon

E A partir des menus, sélectionnez :Analyse

Tests non paramétriquesK-S à 1 échantillon

Page 593: SPSS Base Users Guide 14.0

567

Tests non paramétriques

Figure 35-11Boîte de dialogue Test de Kolmogorov-Smirnov pour un échantillon

E Sélectionnez une ou plusieurs variables numériques à tester. Chaque variable produitun test distinct.

E Vous pouvez également cliquer sur Options pour les statistiques descriptives, lesquartiles et le contrôle du traitement des données manquantes.

Options du test de Kolmogorov-Smirnov pour un échantillonFigure 35-12Boîte de dialogue K-S pour un échantillon : Options

Statistiques : Vous pouvez choisir l’une des statistiques récapitulatives, ou bien lesdeux.

Page 594: SPSS Base Users Guide 14.0

568

Chapitre 35

Caractéristique : Affiche la moyenne, l’écart-type, le minimum, le maximum, et lenombre d’observations non manquantes.

Quartiles : Indique les valeurs correspondant au 25ème, 50ème et 75ème centiles.

Valeurs manquantes : Contrôle le traitement des valeurs manquantes.

Exclure les observations test par test : Lorsque plusieurs tests sont indiqués, chaquetest est effectué séparément selon le nombre des valeurs manquantes.

Exclure toute observation incomplète : Les observations avec des valeursmanquantes pour l’une ou l’autre variable sont exclues de toutes les analyses.

Fonctions supplémentaires de commandes NPAR TESTS (test deKolmogorov-Smirnov pour un échantillon)

Le langage de commande SPSS vous permet également de spécifier des paramètrespour la distribution du test (avec la sous-commande K-S).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Tests pour deux échantillons indépendants

La procédure des tests pour deux échantillons indépendants compare deux groupesd’observations en fonction d’une variable.

Exemple. De nouveaux appareils dentaires qui sont censés être plus confortables,avoir une apparence plus agréable et provoquer des progrès plus rapides pour leredressage des dents ont été développés. Pour savoir si les nouveaux appareils doiventêtre portés aussi longtemps que les anciens, 10 enfants sont choisis de façon aléatoirepour porter les anciens appareils et 10 autres pour porter les nouveaux appareils. Letest U de Mann-Whitney peut par exemple vous montrer que les sujets portant lesnouveaux appareils ne doivent pas les porter aussi longtemps que les sujets utilisantles anciens appareils.

Statistiques. Moyenne, écart-type, minimum, maximum, nombre d’observations avecdes valeurs non manquantes et quartiles. Tests : U de Mann-Whitney, réactionsextrêmes de Moses, Z de Kolmogorov-Smirnov, suites de Wald-Wolfowitz.

Données. Utilisez des variables numériques qui peuvent être ordonnées.

Page 595: SPSS Base Users Guide 14.0

569

Tests non paramétriques

Hypothèses. Utilisez des échantillons indépendants, aléatoires. Le test U deMann-Whitney exige que les deux échantillons testés soient de forme semblable.

Figure 35-13Résultat pour deux échantillons indépendants

10 14.10 141.00

10 6.90 69.00

20

OldBraces

NewBraces

Total

Type ofBraces

TimeWorn inDays

NMeanRank

Sum ofRanks

Ranks

14.000

69.000

-2.721

.007

.0051

U de Mann-Whitney

W de Wilcoxon

Z

Signification Asymptotique(Bilatérale)

Signification exacte[2*(sig. Unilatérale)]

Temps écouléen jours

Tests statistiques 2

Ex æquo non corrigés.1.

Critère de regroupement qualitatifnumérique : type d'appareil

2.

Pour effectuer les tests pour deux échantillons indépendants

E A partir des menus, sélectionnez :Analyse

Tests non paramétriques2 échantillons indépendants

Page 596: SPSS Base Users Guide 14.0

570

Chapitre 35

Figure 35-14Boîte de dialogue Tests pour deux échantillons indépendants

E Sélectionnez une ou plusieurs variables numériques.

E Sélectionnez une variable de regroupement et cliquez sur Définir groupes... pourscinder le fichier en deux groupes ou échantillons.

Types de tests pour deux échantillons indépendants

Type de test. Quatre tests sont disponibles pour tester si deux échantillons (groupes)proviennent de la même population.

Le test U de Mann-Whitney est le plus populaire des tests pour deux échantillonsindépendants. Il équivaut au test de Wilcoxon et au test de Kruskal-Wallis pour deuxgroupes. Les tests de Mann-Whitney servent à vérifier que deux échantillons d’unepopulation ont une position équivalente. Les observations des deux groupes sontcombinées et ordonnées, et il leur est attribué un rang moyen en cas d’ex aequo.Le nombre d’ex aequo doit être petit par rapport au nombre total d’observations.Si les populations ont une position identique, les rangs doivent être attribués defaçon aléatoire entre les deux échantillons. Le test calcule le nombre de fois qu’unrésultat du groupe 1 précède un résultat du groupe 2, ainsi que le nombre de foisqu’un résultat du groupe 2 précède un résultat du groupe 1. La statistique du U deMann-Whitney est la plus petite de ces deux nombres. La statistique de la somme

Page 597: SPSS Base Users Guide 14.0

571

Tests non paramétriques

de rangs de Wilcoxon W, également affichée, est la somme des rangs du plus petitéchantillon. Si les deux échantillons ont le même nombre d’observations, W est lasomme des rangs du groupe nommé en premier dans la boîte de dialogue Définitiondes deux groupes d’échantillons indépendants.

Le test Z de Kolmogorov-Smirnov et les suites en séquences de Wald-Wolfowitzsont des tests plus généraux qui détectent les différences de position et la forme desdistributions. Le test Z de Kolmogorov-Smirnov est basé sur la différence absoluemaximum entre les fonctions de distribution cumulées observées pour les deuxéchantillons. Lorsque cette différence est significative, on considère que les deuxdistributions sont différentes. Le test des suites en séquences de Wald-Wolfowitzcombine et ordonne les observations des deux groupes. Si les deux échantillonsproviennent de la même population, les deux groupes doivent être dispersés de façonaléatoire dans tout le classement.

Le test des réactions extrêmes de Moses part du principe que la variableexpérimentale influence certains sujets dans une direction et d’autres sujets dans ladirection opposée. Le test vérifie les réponses extrêmes par rapport à un groupe decontrôle. Ce test permet d’étudier l’intervalle du groupe de contrôle et de mesurerà quel point les valeurs extrêmes du groupe expérimental influencent l’amplitudelorsque ce test est associé au groupe de contrôle. Le groupe de contrôle est définipar la valeur du groupe 1 dans la boîte de dialogue Définition des deux groupesd’échantillons indépendants. Les observations des deux groupes sont combinées etordonnées. L’intervalle du groupe de contrôle se calcule en effectuant la différenceentre les rangs des valeurs les plus grandes et les plus petites du groupe de contrôleplus 1. Puisque des valeurs éloignées peuvent occasionnellement et facilementfausser l’intervalle d’amplitude, 5 % des observations de contrôle sont filtréesautomatiquement à chaque extrémité.

Définition de deux groupes d’échantillons indépendantsFigure 35-15Boîte de dialogue Tests pour deux échantillons indépendants : Définir groupes

Page 598: SPSS Base Users Guide 14.0

572

Chapitre 35

Pour scinder le fichier en deux groupes ou échantillons, indiquez un nombre entierpour le groupe 1 et une autre valeur pour le groupe 2. Les observations avec d’autresvaleurs sont exclues de l’analyse.

Tests pour deux échantillons indépendants : OptionsFigure 35-16Boîte de dialogue Deux échantillons indépendants : Options

Statistiques. Vous pouvez choisir l’une des statistiques récapitulatives, ou bien lesdeux.

Caractéristique.Indique la moyenne, l’écart-type, le minimum, le maximum, etle nombre d’observations sans valeurs manquantes.

Quartiles. Indique les valeurs correspondant au 25ème, 50ème et 75ème centiles.

Valeurs manquantes. Contrôle le traitement des valeurs manquantes.

Exclure les observations test par test. Lorsque plusieurs tests sont indiqués, chaquetest est effectué séparément selon le nombre des valeurs manquantes.

Exclure toute observation incomplète. Les observations avec des valeursmanquantes pour l’une ou l’autre variable sont exclues de toutes les analyses.

Fonctionnalités supplémentaires de la commande NPAR TESTS (tests pourdeux échantillons indépendants)

Le langage de commande SPSS vous permet également de spécifier le nombred’observations devant être filtrées pour le test de Moses (avec la sous-commandeMOSES).

Page 599: SPSS Base Users Guide 14.0

573

Tests non paramétriques

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Tests pour deux échantillons liés

La procédure des tests pour deux échantillons liés compare les distributions pourdeux variables.

Exemple : En général, une famille qui vend sa maison perçoit-elle le prix demandé ?En appliquant le test de Wilcoxon aux données de 10 foyers, vous apprendrez quesept familles perçoivent moins que le prix demandé, qu’une famille perçoit plus quele prix demandé et que deux familles perçoivent le prix demandé.

Statistiques : Moyenne, écart-type, minimum, maximum, nombre d’observationsavec des valeurs non manquantes et quartiles. Tests : Classement Wilcoxon, Signe,McNemar.

Données : Utilisez des variables numériques qui peuvent être ordonnées.

Hypothèses : Bien qu’aucune distribution particulière ne soit supposée pour les deuxvariables, on part du principe que la distribution de la population des différencesliées est symétrique.

Figure 35-17Analyse pour deux échantillons liés

71

4.93 34.50

12

1.50 1.50

23

10

RangsNégatifs

RangsPositifs

Ex aequo

Total

Prix demandé - Prix de vente

NRangsMoyen

Somme des rangs

Rangs

Prix demandé < Prix de vente1.

Prix demandé > Prix de vente2.

Prix demandé = Prix de vente3.

Page 600: SPSS Base Users Guide 14.0

574

Chapitre 35

-2.3131

.021

Z

SignificationAsymptotique (Bilatérale)

Prix demandé- Prix de vente

Tests statistiques 2

Basé sur les rangs positifs1.

Test de Wilcoxon2.

Pour obtenir des tests pour deux échantillons liés

E A partir des menus, sélectionnez :Analyse

Tests non paramétriques2 échantillons liés

Figure 35-18Boîte de dialogue Tests pour deux échantillons liés

Page 601: SPSS Base Users Guide 14.0

575

Tests non paramétriques

E Sélectionnez des paires de variables de la manière décrite ci-dessous :

Cliquez sur chacune des deux variables. La première variable apparaît dansle groupe Choix courants comme Variable 1 et la seconde apparaît commeVariable 2.

Cliquez sur le bouton fléché pour déplacer la paire dans la liste Paire(s) à tester.Vous pouvez sélectionner d’autres paires de variables. Pour supprimer une pairede variables de l’analyse, sélectionnez une paire dans la liste Paire(s) à tester etcliquez sur le bouton fléché.

Types de tests pour deux échantillons liés

les tests de cette section comparent les distributions pour deux variables liées. Le testqu’il convient d’utiliser dépend du type de données.

Si vos données sont continues, utilisez le test de Signe ou le test de Wilcoxon.Le test de signe calcule les différences entre les deux variables pour toutes lesobservations, et classe les différences comme étant positives, négatives ou liées. Si lesdeux variables sont réparties de la même manière, le nombre de différences positiveset le nombre de différences négatives ne diffèrent pas de façon significative. Le test deWilcoxon prend en compte les informations relatives au signe des différences, ainsiqu’à l’amplitude des différences entre paires. Comme le test de Wilcoxon intègre plusde renseignements sur les données, il est plus puissant que le test des signes.

Si vos données sont binaires, utilisez le test de McNemar. Ce test s’utilisefréquemment lors de situations de mesures répétées, au cours desquelles la réponse dusujet est provoquée deux fois, une fois avant qu’un événement spécifié se produise etune fois après qu’un événement spécifié s’est produit. Le test de McNemar déterminesi le taux de réponses initial (avant l’événement) est égal au taux de réponse final(après l’événement). Ce test est utile pour détecter les changements dans les réponsesdues à une intervention expérimentale dans les plans avant et après.

Si vos données sont qualitatives, utilisez le test d’Homogénéité marginale. Cetest est un développement du test de McNemar d’une réponse binaire à une réponsemultinomiale. Il recherche les changements de réponse en utilisant la distributionChi-deux et permet de détecter les changements de réponse dus à une interventionexpérimentale dans les plans avant et après. Le test d’homogénéité marginale n’estdisponible que si vous avez installé les tests exacts SPSS.

Page 602: SPSS Base Users Guide 14.0

576

Chapitre 35

Tests pour deux échantillons liés : OptionsFigure 35-19Boîte de dialogue Tests pour deux échantillons liés : Options

Statistiques : Vous pouvez choisir l’une des statistiques récapitulatives, ou bien lesdeux.

Caractéristique :Indique la moyenne, l’écart-type, le minimum, le maximum, etle nombre d’observations sans valeurs manquantes.

Quartiles : Indique les valeurs correspondant au 25ème, 50ème et 75ème centiles.

Valeurs manquantes : Contrôle le traitement des valeurs manquantes.

Exclure les observations test par test : Lorsque plusieurs tests sont indiqués, chaquetest est effectué séparément selon le nombre des valeurs manquantes.

Exclure toute observation incomplète : Les observations avec des valeursmanquantes pour l’une ou l’autre variable sont exclues de toutes les analyses.

Fonctionnalités supplémentaires de la commande NPAR (Deux échantillonsliés)

Le langage de commande SPSS vous permet également de tester une variable avecchaque variable d’une liste.

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 603: SPSS Base Users Guide 14.0

577

Tests non paramétriques

Tests pour plusieurs échantillons indépendants

La procédure de Tests pour Plusieurs Echantillons Indépendants compare deuxgroupes d’observations ou plus sur une variable.

Exemple : Trois marques d’ampoules 100 watts diffèrent-elles par leur durée moyennede fonctionnement ? A partir de l’analyse de variance d’ordre 1 de Kruskal-Wallis,vous apprendrez peut-être que les trois marques diffèrent par leur durée de viemoyenne.

Statistiques : Moyenne, écart-type, minimum, maximum, nombre d’observations avecdes valeurs non manquantes et quartiles. Tests : H de Kruskal-Wallis, médiane.

Données : Utilisez des variables numériques qui peuvent être ordonnées.

Hypothèses : Utilisez des échantillons indépendants, aléatoires. Le test du H deKruskal-Wallis nécessite que les échantillons testés soient de forme similaire.

Figure 35-20Résultat des Tests pour plusieurs échantillons indépendants

10 15.20

10 25.50

10 5.80

30

Marque A

Marque B

Marque C

Total

MarqueHeuresN

RangMoyen

Rangs

25.061

2

.000

Khi-deux

df

SignificationAsymptotique

Heures

Tests statistiques 1,2

Test de Kruskal-Wallis1.

Critère de regroupement 2. qualitatif numérique : Marque

Page 604: SPSS Base Users Guide 14.0

578

Chapitre 35

Pour obtenir des tests pour plusieurs échantillons indépendants

E A partir des menus, sélectionnez :Analyse

Tests non paramétriquesK échantillons indépendants

Figure 35-21Boîte de dialogue Tests pour plusieurs échantillons indépendants

E Sélectionnez une ou plusieurs variables numériques.

E Sélectionnez une variable de regroupement et cliquez sur Définir intervalle pourspécifier les valeurs entières minimale et maximale pour la variable de regroupement.

Tests pour Plusieurs Echantillons Indépendants : Types de tests

Trois tests permettent de déterminer si plusieurs échantillons indépendantsproviennent de la même population. Le test du H de Kruskal-Wallis, le test de laMédiane et le test de Jonckheere-Terpstra testent tous si plusieurs échantillonsindépendants proviennent de la même population.

Le test H de Kruskal-Wallis, extension du test du U de Mann-Whitney, estl’équivalent non paramétrique de l’analyse de variance d’ordre 1 et détecte lesdifférences dans la position de la distribution. Le test de la médiane, test plus généralmais moins puissant, détecte les différences de position et de forme des distributions.Le test du H de Kruskal-Wallis et le test de la médiane supposent qu’il n’existe aucunclassement a priori des k populations à partir desquelles les échantillons sont tirés.

Page 605: SPSS Base Users Guide 14.0

579

Tests non paramétriques

Lorsqu’il existe un classement naturel a priori (ascendant ou descendant) des kpopulations, le test de Jonckheere-Terpstra est plus puissant. Par exemple, lesk populations peuvent représenter k températures croissantes. L’hypothèse selonlaquelle différentes températures produisent la même distribution des réponses esttestée contre l’hypothèse alternative selon laquelle l’accroissement de température faitaugmenter la magnitude de la réponse. Ici, l’hypothèse alternative est ordonnée ; letest de Jonckheere-Terpstra est donc le plus approprié. Le test de Jonckheere-Terpstran’est disponible que si vous avez installé les Tests Exacts de SPSS.

Tests pour Plusieurs Echantillons Indépendants : Définir l’IntervalleFigure 35-22Boîte de dialogue Plusieurs échantillons indépendants : Définir l’intervalle

Pour définir l’intervalle, entrez des valeurs entières pour Minimum et Maximum quicorrespondent à la modalité la plus basse et à la plus haute du critère de regroupement.Les observations dont les valeurs se trouvent à l’extérieur des limites sont exclues.Par exemple, si vous spécifiez une valeur minimale de 1 et une valeur maximale de 3,seules les valeurs entières comprises entre 1 et 3 seront utilisées. La valeur minimaledoit être inférieure à la valeur maximale, et les deux valeurs doivent être spécifiées.

Page 606: SPSS Base Users Guide 14.0

580

Chapitre 35

Options des Tests pour Plusieurs Echantillons IndépendantsFigure 35-23Boîte de dialogue Plusieurs échantillons indépendants : Options

Statistiques : Vous pouvez choisir l’une des statistiques récapitulatives, ou bien lesdeux.

Caractéristique :Indique la moyenne, l’écart-type, le minimum, le maximum, etle nombre d’observations sans valeurs manquantes.

Quartiles : Indique les valeurs correspondant au 25ème, 50ème et 75ème centiles.

Valeurs manquantes : Contrôle le traitement des valeurs manquantes.

Exclure les observations test par test : Lorsque plusieurs tests sont indiqués, chaquetest est effectué séparément selon le nombre des valeurs manquantes.

Exclure toute observation incomplète : Les observations avec des valeursmanquantes pour l’une ou l’autre variable sont exclues de toutes les analyses.

Fonctionnalités supplémentaires de la commande NPAR TESTS (Kéchantillons indépendants)

Le langage de commande SPSS vous permet également de spécifier une valeurdifférente de la médiane observée pour le test de la médiane (avec la sous-commandeMEDIAN).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 607: SPSS Base Users Guide 14.0

581

Tests non paramétriques

Tests pour plusieurs échantillons liés

La procédure de Tests pour Plusieurs Echantillons Liés compare les distributions dedeux variables ou plus.

Exemple : Le public associe-t-il différents niveaux de prestige à un docteur, un avocat,un officier de police et un enseignant ? On demande à dix personnes de classer cesquatre métiers par ordre de prestige. Le test de Friedman indique que le public associeeffectivement différents niveaux de prestige à ces quatre professions.

Statistiques : Moyenne, écart-type, minimum, maximum, nombre d’observationsavec des valeurs non manquantes et quartiles. Tests : Friedman, W de Kendall etQ de Cochran.

Données : Utilisez des variables numériques qui peuvent être ordonnées.

Hypothèses : Les tests non paramétriques ne nécessitent pas d’hypothèses sur la formede la distribution sous-jacente. Utilisez des échantillons dépendants, aléatoires.

Figure 35-24Résultat des Tests pour Plusieurs Echantillons Liés

1.50

2.50

3.40

2.60

MédecinHommede loiPolicier

Enseignant

RangMoyen

Rangs

10

10.920

3

.012

N

Khi-deux

df

Signification asymptotique

Tests statistiques 1

Test de Friedman1.

Page 608: SPSS Base Users Guide 14.0

582

Chapitre 35

Pour obtenir des tests pour plusieurs échantillons liés

E A partir des menus, sélectionnez :Analyse

Tests non paramétriquesK échantillons liés

Figure 35-25Boîte de dialogue Tests pour plusieurs échantillons liés

E Sélectionnez deux variables numériques ou plus à tester.

Tests pour plusieurs échantillons liés de types de tests

Trois tests sont disponibles pour comparer les distributions de plusieurs variables liées.Le test de Friedman est l’équivalent non paramétrique d’un plan de mesures

répétées sur un échantillon ou d’une analyse de variance d’ordre 2 avec uneobservation par cellule. Le test de Friedman teste l’hypothèse nulle selon laquellek variables liées proviennent de la même population. Pour chaque observation, lesvariables k sont classées de 1 à k. La statistique de test est basée sur ces classements.

Le test W de Kendall est une standardisation de la statistique de Friedman. Letest W de Kendall peut être interprété comme le coefficient de concordance, qui estune mesure de l’accord entre les évaluateurs. Chaque observation est un juge ou unindicateur, et chaque variable est une personne ou un élément jugé. Pour chaquevariable, la somme des rangs est calculée. Le W de Kendall se situe entre 0 (pasd’accord) et 1 (accord total).

Page 609: SPSS Base Users Guide 14.0

583

Tests non paramétriques

Le Q de Cochran est identique au test de Friedman mais s’applique lorsquetoutes les réponses sont binaires. Ce test est une extension du test de McNemar àK échantillons. Le Q de Cochran teste l’hypothèse nulle selon laquelle plusieursvariables dichotomiques liées ont la même moyenne. Les variables sont mesuréessur le même individu ou sur des individus comparables.

Statistiques des tests pour plusieurs échantillons liésFigure 35-26Boîte de dialogue Statistiques pour Plusieurs Echantillons Liés

Vous pouvez choisir les statitistiques.

Caractéristique :Indique la moyenne, l’écart-type, le minimum, le maximum, etle nombre d’observations sans valeurs manquantes.

Quartiles : Indique les valeurs correspondant au 25ème, 50ème et 75ème centiles.

Fonctionnalités supplémentaires de la commande NPAR TESTS (Kéchantillons liés)

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 610: SPSS Base Users Guide 14.0
Page 611: SPSS Base Users Guide 14.0

Chapitre

36Analyse des réponses multiples

Deux procédures sont proposées pour l’analyse des vecteurs comportant plusieursvariables dichotomiques ou plusieurs modalités. La procédure Fréquencesmultiréponses affiche les tableaux de fréquences. La procédure des Tableaux croisésmultiréponses affiche des tableaux croisés à deux ou trois dimensions. Avantd’utiliser l’une de ces procédures, vous devez définir des vecteurs multiréponses.

Exemple : Cet exemple illustre l’utilisation des éléments multiréponses dans uneétude de marché. Ces données sont fictives et ne doivent pas être considérées commeréelles. Une compagnie aérienne est parfois amenée à interroger les passagers d’untrajet donné pour évaluer la concurrence. Dans cet exemple, American Airlines veutsavoir si ses passagers utilisent d’autres compagnies aériennes pour couvrir le trajetChicago-New York et connaître l’importance relative des horaires et du servicedans le choix d’une compagnie aérienne. L’hôtesse distribue à chaque passager uncourt questionnaire lors de l’embarquement. La première question est la suivante :Entourez toutes les compagnies aériennes par lesquelles vous avez effectué au moinsun vol dans les six derniers mois parmi American, United, TWA, USAir et d’autres. Ils’agit d’une question à réponses multiples, car le passager peut entourer plus d’uneréponse. Cependant, cette question ne peut pas être codée directement, parce qu’unevariable SPSS ne peut avoir qu’une valeur pour chaque cas. Vous devez utiliserplusieurs variables pour mapper les réponses à chaque question. Ceci peut être fait dedeux manières. L’une consiste à définir une variable correspondant à chaque choixpossible (par exemple, American, United, TWA, USAir et d’autres). Si le passagerentoure United, le numéro de code 1 est affecté à la variable united, sinon c’est lecode 0 qui lui est affecté. Il s’agit de la méthode de codage de variables à dichotomiemultiple. L’autre méthode permettant de mapper les réponses est la méthode desmodalités multiples, où vous devez estimer le nombre maximal de réponses possiblesà la question et définir le même nombre de variables, avec des codes correspondantà la compagnie aérienne empruntée. En utilisant un échantillon de questionnaires,vous vous apercevrez peut-être que personne n’a emprunté plus de trois compagnies

585

Page 612: SPSS Base Users Guide 14.0

586

Chapitre 36

différentes pour ce trajet. Qui plus est, vous vous rendrez compte que, du fait de ladéréglementation des compagnies aériennes, 10 autres compagnies figurent dans lamodalité Autre. A l’aide de la méthode multiréponses, vous pouvez définir troisvariables, codées comme suit : 1 = american, 2 = united, 3 = twa, 4 = usair, 5 = delta,etc. Si un passager entoure American et TWA, la première variable porte le code 1, laseconde le code 3, et la troisième un code sans valeur. Un autre passager a peut-êtreentouré American et ajouté Delta. Ainsi, la première variable porte le code 1, laseconde le code 5, et la troisième un code sans valeur. Si vous utilisez la méthodedes dichotomies multiples, d’un autre côté, vous finissez par vous retrouver avec 14variables différentes. Les deux méthodes de codage sont possibles dans le cadre decette enquête. Cependant, votre choix dépendra de la répartition des réponses.

Définition de vecteurs multiréponses

La procédure de définition de vecteurs multiréponses regroupe des variables itemairesdans des vecteurs de dichotomies ou de modalités, pour lesquels vous pouvez obtenirdes tableaux de fréquences et des tableaux croisés. Vous pouvez définir jusqu’à 20vecteurs multiréponses. Chaque vecteur doit avoir un nom unique. Pour éliminerun vecteur, sélectionnez-le dans la liste des vecteurs multiréponses et cliquez surEliminer. Pour modifier un vecteur, sélectionnez-le dans la liste, modifiez-en lescaractéristiques et cliquez sur Changer.

Vous pouvez coder vos variables itemaires sous forme de dichotomies oude modalités. Pour utiliser des variables dichotomiques, sélectionnez Variables

dichotomiques afin de créer un vecteur de dichotomies multiples. Entrez une valeurentière dans Valeur comptée. Chaque variable ayant au moins une occurrencede la valeur comptée devient une modalité du vecteur de dichotomies multiples.Sélectionnez Modalités pour créer un vecteur de modalités multiples ayant le mêmeintervalle de valeurs que les variables qui le composent. Entrez des nombres entierspour le minimum et le maximum de l’intervalle des modalités du vecteur de modalitésmultiples. SPSS totalise chaque valeur entière contenue dans l’intervalle pour toutesles variables qui le composent. Les modalités vides ne sont pas tabulées.

A chaque vecteur multiréponses doit être attribué un nom unique de 7 caractèresmaximum. La procédure ajoute un signe dollar ($) devant le nom que vous avezattribué. Les noms réservés suivants ne doivent pas être utilisés : casenum, sysmis,jdate, date, time, length et width. Le nom du vecteur multiréponses doit uniquementêtre utilisé dans les procédures multiréponses. Vous ne pouvez pas faire référenceaux noms des vecteurs multiréponses dans les autres procédures. A titre facultatif,

Page 613: SPSS Base Users Guide 14.0

587

Analyse des réponses multiples

vous pouvez entrer une étiquette de variable décrivant le vecteur multiréponses. Cetteétiquette peut comporter jusqu’à 40 caractères.

Définir des vecteurs de réponses multiples

E A partir des menus, sélectionnez :Analyse

Réponses multiplesDéfinir des groupes

Figure 36-1Boîte de dialogue Définition des vecteurs multiréponses

E Sélectionnez deux ou plusieurs variables.

E Si vos variables sont codées comme dichotomies, indiquez la valeur que voussouhaitez calculer. Si elles sont codées comme modalités, définissez leur intervalle.

E Entrez un nom unique pour chaque vecteur multiréponses.

E Cliquez sur Ajouter pour ajouter les vecteurs multiréponses à la liste des vecteursdéfinis.

Page 614: SPSS Base Users Guide 14.0

588

Chapitre 36

Tableaux de fréquences des réponses multiples

La procédure Fréquences multiréponses produit des tableaux de fréquences pourles vecteurs multiréponses. Vous devez d’abord définir un ou plusieurs vecteursmultiréponses (voir “ Définir les vecteurs multiréponses “).

Pour les vecteurs de dichotomies multiples, les noms de modalité apparaissant dansle résultat proviennent d’étiquettes de variable définies pour les variables itemaires dugroupe. Si les étiquettes de variable ne sont pas définies, les noms de variables serventd’étiquettes. Pour les vecteurs de modalités multiples, les étiquettes des modalitésproviennent des étiquettes de valeurs de la première variable du groupe. Si lesmodalités manquantes de la première variable sont présentes pour d’autres variablesdu groupe, définissez une étiquette de valeurs pour les modalités manquantes.

Valeurs manquantes : Les cas de valeurs manquantes sont exclus tableau par tableau.Vous pouvez donc choisir l’une ou les deux solutions suivantes :

Exclure les observations ayant une information incomplète à l’intérieur desdichotomies : Ceci permet d’exclure les observations ayant des valeursmanquantes pour toute variable issue du tableau croisé du vecteur de dichotomiesmultiples. Ceci s’applique seulement aux vecteurs multiréponses définis commevecteurs de dichotomies. Par défaut, une observation est considérée manquantepour un vecteur de dichotomies multiples si aucune de ses variables composantesne contient de valeur comptée. Les cas de valeurs manquantes pour certainesvariables, mais pas toutes, sont inclus dans les tabulations du groupe si au moinsune variable contient la valeur comptée.

Exclure toute observation ayant une information incomplète à l’intérieur desmodalités : Cela permet d’exclure les observations ayant des valeurs manquantespour toute variable provenant du tableau croisé du vecteur des modalitésmultiples. Ceci s’applique seulement aux vecteurs multiréponses définis commedes vecteurs de modalités. Par défaut, une observation est considérée manquantepour un vecteur de modalités multiples si aucune de ses composantes n’a devaleurs valides à l’intérieur de l’intervalle défini.

Exemple : Chaque variable créée à partir d’une question de l’enquête est une variableélémentaire. Pour analyser un élément multiréponses, vous devez combiner lesvariables dans l’un des deux types de vecteurs multiréponses : vecteur de modalitésmultiples ou vecteur de dichotomies multiples. Par exemple, si dans une enquête, unecompagnie aérienne vous demande la compagnie (American Airlines, United Airlinesou TWA) que vous avez empruntée au cours des six derniers mois, si vous utilisez des

Page 615: SPSS Base Users Guide 14.0

589

Analyse des réponses multiples

variables dichotomiques et avez défini un vecteur de dichotomies multiples, chacunedes trois variables du vecteur devient une modalité de la variable de regroupement.Les effectifs et les pourcentages correspondant aux trois compagnies aérienness’affichent dans un tableau de fréquences. Si vous découvrez qu’aucun des répondantsn’a mentionné plus de deux compagnies, vous pouvez créer deux variables, chacuneayant trois codes, un par compagnie aérienne. Si vous définissez un vecteur demodalités multiples, les valeurs sont tabulées et les mêmes codes sont ajoutés danstoutes les variables élémentaires. Le vecteur de valeurs résultant est le même que pourchacune des variables itemaires. Par exemple, 30 réponses pour United représententla somme des cinq réponses United pour la compagnie aérienne 1 et des 25 réponsesUnited pour la compagnie 2. Les effectifs et les pourcentages correspondant aux troiscompagnies aériennes s’affichent dans un tableau de fréquences.

Statistiques : Tableaux de fréquences contenant des effectifs, des pourcentages deréponses, des pourcentages de cas, le nombre de cas valables, et le nombre de casmanquants.

Données : Utilisez des vecteurs multiréponses.

Hypothèses : Les effectifs et pourcentages représentent une description utile desdonnées de n’importe quelle distribution.

Procédures apparentées : La procédure Définir Vecteurs multiréponses vous permetde définir des vecteurs multiréponses.

Figure 36-2Résultat de la méthode des fréquences de réponses multiples

Pour obtenir des tableaux de fréquences de réponses multiples

E A partir des menus, sélectionnez :Analyse

Réponses multiplesEffectifs

Page 616: SPSS Base Users Guide 14.0

590

Chapitre 36

Figure 36-3Boîte de dialogue Fréquences de réponses multiples

E Sélectionnez un ou plusieurs vecteurs multiréponses.

Tableaux croisés des réponses multiples

La procédure Tableaux croisés de réponses multiples classe, par tableaux croisés, desvecteurs multiréponses définis, des variables itemaires ou une combinaison. Vouspouvez également obtenir des pourcentages de cellules basés sur des observationsou des réponses, modifier la gestion des valeurs manquantes ou obtenir des tableauxcroisés appariés. Vous devez d’abord définir un ou plusieurs vecteurs multiréponses(veuillez consulter “ Pour Définir des vecteurs multiréponses “).

Pour les vecteurs de dichotomies multiples, les noms de modalité apparaissantdans le résultat proviennent d’étiquettes de variable définies pour les variablesitemaires du groupe. Si les étiquettes de variable ne sont pas définies, les noms devariables servent d’étiquettes. Pour les vecteurs de modalités multiples, les étiquettesdes modalités proviennent des étiquettes de valeurs de la première variable dugroupe. Si les modalités manquantes de la première variable sont présentes pourd’autres variables du groupe, définissez une étiquette de valeurs pour les modalitésmanquantes. SPSS affiche les étiquettes de modalité des colonnes sur trois lignes,avec jusqu’à huit caractères par ligne. Pour éviter de scinder les mots, vous pouvezinverser les éléments lignes et les éléments colonnes ou redéfinir les étiquettes.

Page 617: SPSS Base Users Guide 14.0

591

Analyse des réponses multiples

Exemple. Les vecteurs de dichotomies multiples et les vecteurs de modalités multiplespeuvent être croisés avec d’autres variables dans cette procédure. Dans le cadre d’uneenquête menée auprès de passagers de compagnies aériennes, voici ce qui leur a étédemandé : Parmi les compagnies aériennes suivantes, entourez toutes celles aveclesquelles vous avez voyagé au moins une fois durant les six derniers mois (American,United, TWA). Est-il plus important de privilégier l’horaire ou le service ? Choisissezune seule réponse. Après avoir saisi les données en tant que dichotomies ou modalitésmultiples, et après les avoir combinées dans un vecteur, vous pouvez croiser les choixde compagnie aérienne déclarés avec la question relative au service ou aux horaires.

Statistiques. Tableau croisé avec cellule, ligne, colonne, et effectif total, et avec lespourcentages ligne, colonne, et effectif total. Les pourcentages cellule peuvent êtrebasés sur les observations ou les réponses.

Données. Utilisez des vecteurs multiréponses ou des variables qualitatives numériques.

Hypothèses. Les effectifs et pourcentages offrent une description utile des données quisuivent tout type de distribution.

Procédures apparentées. La procédure Définir Vecteurs multiréponses vous permetde définir des vecteurs multiréponses.

Figure 36-4Résultat Tableaux croisés de réponses multiples

Pour obtenir des tableaux croisés des réponses multiples

E A partir des menus, sélectionnez :Analyse

Réponses multiplesTableaux croisés

Page 618: SPSS Base Users Guide 14.0

592

Chapitre 36

Figure 36-5Boîte de dialogue Tableaux Croisés de réponses multiples

E Sélectionnez une ou plusieurs variables numériques ou vecteurs multiréponses pourchaque dimension de tableau croisé.

E Définissez l’intervalle de chaque variable itemaire.

Sinon, vous pouvez obtenir un tableau croisé bilatéral pour chaque modalité devariable de contrôle ou chaque vecteur multiréponses. Sélectionnez un ou plusieurséléments pour la liste de strate(s).

Définir Intervalles Tableaux croisés De réponses multiplesFigure 36-6Définir boîte de dialogue Intervalle Variables Tableaux croisés de réponses multiples

Les intervalles des valeurs doivent être définis pour toute variable itemaire de tableauxcroisés. Entrez les valeurs entières de modalités minimum et maximum que voussouhaitez tabuler. Les modalités se situant en dehors de l’intervalle sont exclues de

Page 619: SPSS Base Users Guide 14.0

593

Analyse des réponses multiples

l’analyse. Les valeurs se situant à l’intérieur de l’intervalle inclusif sont supposéesêtre des nombres entiers (les nombres non entiers sont tronqués).

Options Tableaux croisés de réponses multiplesFigure 36-7Boîte de dialogue Options Tableaux croisés de réponses multiples

Pourcentages de cellule. Les effectifs des cellules sont toujours affichés. Vouspouvez choisir d’afficher les pourcentages lignes, les pourcentages colonnes, et lespourcentages tableau bilatéral (total).

Pourcentages basés sur. Vous pouvez baser les pourcentages cellules sur lesobservations (ou répondants). Ceci n’est pas possible si vous sélectionnez la fonctionqui permet d’apparier les variables entre les vecteurs de modalités multiples. Vouspouvez aussi baser les pourcentages cellules sur les réponses. Pour les vecteurs dedichotomies multiples, le nombre de réponses est égal au nombre de valeurs comptéesà travers les observations. Pour les vecteurs de modalités multiples, le nombre deréponses correspond au nombre de valeurs comprises dans l’intervalle défini.

Valeurs manquantes. Vous avez le choix entre les deux options suivantes :

Exclure les observations ayant une information incomplète à l’intérieur desdichotomies. Ceci permet d’exclure les observations ayant des valeurs manquantespour toute variable issue du tableau croisé du vecteur de dichotomies multiples.Ceci s’applique seulement aux vecteurs multiréponses définis comme vecteursde dichotomies. Par défaut, une observation est considérée manquante pour unvecteur de dichotomies multiples si aucune de ses variables composantes necontient de valeur comptée. Les observations ayant des valeurs manquantes pour

Page 620: SPSS Base Users Guide 14.0

594

Chapitre 36

certaines, mais pas toutes, les variables sont incluses dans les tableaux croisés dugroupe si au moins une variable contient la valeur comptée.

Exclure toute observation ayant une information incomplète à l’intérieur desmodalités. Cela permet d’exclure les observations ayant des valeurs manquantespour toute variable provenant du tableau croisé du vecteur des modalitésmultiples. Ceci s’applique seulement aux vecteurs multiréponses définis commedes vecteurs de modalités. Par défaut, une observation est considérée manquantepour un vecteur de modalités multiples si aucune de ses composantes n’a devaleurs valides à l’intérieur de l’intervalle défini.

Par défaut, lorsque vous croisez deux vecteurs de modalités multiples, SPSS tabulechaque variable du premier groupe avec chaque variable du second groupe etadditionne les effectifs de chaque cellule. Par conséquent, certaines réponses peuventapparaître plus d’une fois dans un tableau. Vous pouvez choisir l’option suivante :

Apparier les variables entre les vecteurs réponses. Cela permet d’apparier la premièrevariable du premier groupe avec la première variable du second groupe, etc. Si voussélectionnez cette option, SPSS base les pourcentages cellules sur les réponses plutôtque sur les répondants. On ne peut apparier les vecteurs de dichotomies multiples oules variables itemaires.

Fonctionnalités supplémentaires de la commande MULTRESPONSE

Le langage de commande SPSS vous permet aussi de :

Obtenir des tableaux croisés ayant jusqu’à cinq dimensions (avec lasous-commande BY).

Modifier les options de formatage du résultat, y compris la suppression desétiquettes de valeurs (avec la sous-commande FORMAT).

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 621: SPSS Base Users Guide 14.0

Chapitre

37Tableaux de Résultats

Les listes d’observations et les statistiques descriptives sont des outils de basepermettant d’étudier et de présenter des données. Vous pouvez obtenir les listesd’observations à l’aide de l’éditeur de Données ou de la procédure Récapituler,les effectifs de fréquence et les statistiques descriptives à l’aide de la procédureFréquences, et les statistiques de sous-population à l’aide de la procédure Moyennes.Chacune de ces procédures utilise un format destiné à rendre les informations claires.Si vous souhaitez afficher les informations dans un format différent, les procéduresTableaux de bord en lignes et Tableaux de bord en colonnes vous permettent decontrôler la présentation des données.

Tableaux de bord en lignes

Tableaux de bord en lignes produit des tableaux de bord dans lesquels différentesstatistiques récapitulatives sont disposées en lignes. Les listes d’observations sontégalement disponibles, avec ou sans statistiques récapitulatives.

Exemple. Une société possédant une chaîne de magasins conserve des dossierssur les employés comprenant le salaire, l’ancienneté, le magasin et le service oùchaque employé travaille. Vous pourriez générer un tableau de bord fournissant lesinformations individuelles sur les employés (liste) divisées par magasin et par division(critères d’agrégation), avec les statistiques récapitulatives (par exemple, salairemoyen) pour chaque magasin, division et par division dans chaque magasin.

Variables en colonnes. Donne la liste des variables de tableau pour lesquelles vousvoulez obtenir des listes d’observations ou des statistiques récapitulatives, et contrôlele format d’affichage des Variables en colonnes.

Variables de ventilation. Donne la liste des critères d’agrégation optionnels quidivisent le tableau de bord en groupes et contrôle les statistiques récapitulatives etles formats d’affichage des colonnes de ventilation. Pour les critères d’agrégation

595

Page 622: SPSS Base Users Guide 14.0

596

Chapitre 37

multiples, il y aura un groupe séparé pour chaque modalité de chaque critèred’agrégation à l’intérieur des modalités du critère d’agrégation précédent dans laliste. Les critères d’agrégation doivent être des variables qualitatives discrètes quidivisent les observations en un nombre limité de modalités significatives. Les valeursindividuelles de chaque critère d’agrégation apparaissent, triées, dans une colonneséparée à gauche des Variables en colonnes.

Tableau de bord. Contrôle les caractéristiques globales du tableau de bord, y comprisles statistiques récapitulatives globales, l’affichage des valeurs manquantes, lanumérotation des pages et les titres.

Afficher les observations. Affiche les valeurs réelles (ou les étiquettes de valeurs) desvariables de Variables en colonnes pour chaque observation. La liste produite peutêtre nettement plus longue qu’un tableau de bord.

Aperçu. N’affiche que la première page du tableau de bord. Cette option est utile pouravoir un aperçu du format de votre tableau sans traiter le tableau entier.

Les données sont déjà triées. Pour les rapports avec critères d’agrégation, le fichier dedonnées doit être trié par valeur des critères d’agrégation avant de générer le tableaude bord. Si votre fichier de données est déjà trié par valeur des critères d’agrégation,vous pouvez gagner du temps de traitement en sélectionnant cette option. Cette optionest particulièrement utile après avoir vu un aperçu du tableau.

Page 623: SPSS Base Users Guide 14.0

597

Tableaux de Résultats

Echantillon de résultat

Figure 37-1Tableau de bord combiné avec listes d’observations et statistiques récapitulatives

Pour obtenir un rapport récapitulatif : Récapitulatifs en lignes

E A partir des menus, sélectionnez :Analyse

RapportsTableaux de bord en lignes

Page 624: SPSS Base Users Guide 14.0

598

Chapitre 37

E Sélectionnez une ou plusieurs variables pour les variables en colonnes. Une colonneest générée dans le tableau de bord pour chaque variable sélectionnée.

E Pour les tableaux triés et affichés par sous-groupe, sélectionnez une ou plusieursvariables pour les critères d’agrégation.

E Pour les tableaux avec statistiques récapitulatives de sous-groupe définies par descritères d’agrégation, sélectionnez le critère d’agrégation dans la liste et cliquezsur Tableau récapitulatif dans le groupe Variables de ventilation pour spécifier lesmesures récapitulatives.

E Pour les tableaux avec statistiques récapitulatives globales, cliquez sur Fonction dansle groupe Tableau pour spécifier les mesures récapitulatives.

Figure 37-2Boîte de dialogue Tableaux de bord en lignes

Format des Colonnes de données/Ventilations des Tableaux de bord

Les boîtes de dialogue Format contrôlent les titres et largeurs des colonnes,l’alignement du texte et l’affichage des valeurs de données ou des étiquettes devaleurs. Format colonne de données contrôle le format des Variables en colonnes du

Page 625: SPSS Base Users Guide 14.0

599

Tableaux de Résultats

côté droit de la page du tableau de bord. Format colonne de ventilation contrôle leformat des Colonnes de ventilation du côté gauche.

Figure 37-3Boîte de dialogue Tableau de bord : Format colonne de données

Titre de la colonne. Pour la variable sélectionnée, contrôle le titre de la colonne. Lestitres longs sont automatiquement ajustés dans la colonne. Utilisez la touche Entréepour insérer manuellement des sauts de lignes aux endroits où vous voulez ajusterles titres.

Position des valeurs dans la colonne. Pour la variable sélectionnée, contrôlel’alignement des valeurs de données ou des étiquettes de données dans la colonne.L’alignement des valeurs ou des étiquettes n’affecte pas l’alignement des titresde colonnes. Vous pouvez soit indenter le contenu de la colonne d’un nombre decaractères donné, soit centrer le contenu de la colonne.

Contenu de la colonne. Pour la variable sélectionnée, contrôle l’affichage soit desvaleurs de données, soit des étiquettes de valeurs définies. Les valeurs de donnéessont affichées pour toutes les valeurs qui ne possèdent pas d’étiquette de valeurdéfinie. (Non disponible pour les Variables en colonnes dans les Tableaux de borden colonnes)

Page 626: SPSS Base Users Guide 14.0

600

Chapitre 37

Fonctions récapitulatives des Tableaux pour/Fonctions récapitulativesFinales

Les deux boîtes de dialogue Fonctions récapitulatives contrôlent l’affichage desstatistiques récapitulatives pour les agrégats et pour l’ensemble du tableau de bord.L’option Fonctions récapitulatives contrôle les statistiques de sous-groupe pourchaque modalité définie par les critères d’agrégation. Fonctions récapitulativesFinales contrôle les statistiques globales affichées à la fin du tableau de bord.

Figure 37-4Boîte de dialogue Tableau de bord : Fonction récapitulative

Les statistiques récapitulatives disponibles sont la somme des valeurs, la moyennedes valeurs, la valeur minimale, la valeur maximale, le nombre d’observations, lepourcentage d’observations situées au-dessus ou en dessous d’une valeur spécifiée, lepourcentage d’observations comprises à l’intérieur d’un intervalle donné de valeurs,l’écart-type, l’aplatissement, la variance et l’asymétrie.

Options de Ventilation de Tableau de Bord

Options de Ventilation contrôle l’espacement et la pagination des informations demodalité de ventilation.

Page 627: SPSS Base Users Guide 14.0

601

Tableaux de Résultats

Figure 37-5Boîte de dialogue Options de Ventilation des Tableaux de bord

Gestion des pages. Contrôle l’espacement et la pagination des modalités du critèred’agrégation sélectionné. Vous pouvez spécifier un nombre de lignes vides entreles modalités de ventilation ou commencer chaque modalité de ventilation sur unenouvelle page.

Lignes à sauter avant fonctions élémentaires. Contrôle le nombre de lignes videsentre les étiquettes ou les données des modalités de ventilation et les statistiquesrécapitulatives. Cette option est particulièrement utile pour les tableaux de bordscombinés incluant des listes d’observations individuelles et des statistiquesrécapitulatives pour les modalités de ventilation ; dans ces tableaux, vous pouvezinsérer des espaces entre les listes d’observations et les statistiques récapitulatives.

Options du Tableau de bord

Options du Tableau de bord contrôle le traitement et l’affichage des valeursmanquantes et la numérotation des pages du tableau de bord.

Figure 37-6Boîte de dialogue Tableau de bord : Options colonne de ventilation ...

Page 628: SPSS Base Users Guide 14.0

602

Chapitre 37

Exclure les observations avec des valeurs manquantes. Elimine (du tableau de bord)toute observation avec des valeurs manquantes pour l’une des variables du tableaude bord.

Représentation des valeurs manquantes. Vous permet de spécifier le symbolereprésentant les valeurs manquantes dans le fichier de données. Ce symbole ne peutcomporter qu’un caractère et sert à représenter les valeurs manquantes par défautet valeur utilisateur manquante .

Paginer à partir de. Vous permet de spécifier un numéro pour la première page dutableau de bord.

Présentation du Tableau de bord

Présentation du Tableau de bord contrôle la largeur et la longueur de chaque pagedu tableau de bord, l’emplacement du tableau sur la page et l’insertion de lignesvides et d’étiquettes.

Figure 37-7Boîte de dialogue Tableau : Présentation

Page 629: SPSS Base Users Guide 14.0

603

Tableaux de Résultats

Mise en page. Contrôle les marges de page exprimées en lignes (haut et bas) et encaractères (gauche et droite), et reporte l’alignement à l’intérieur des marges.

Titres et bas de page. Contrôle le nombre de lignes séparant les titres et les pieds depage du corps du tableau de bord.

Variables de ventilation. Contrôle l’affichage des colonnes de ventilation. Si descritères d’agrégation multiples sont spécifiés, ils peuvent être affichés en colonnesséparées ou dans la première colonne. Placer tous les critères d’agrégation dans lapremière colonne produit un tableau de bord plus étroit.

Titres des colonnes. Contrôle l’affichage des titres de colonnes, y compris lesoulignement des titres, l’espacement entre les titres et le corps du tableau, etl’alignement vertical des titres de colonnes.

Lignes de variables en colonnes et étiquettes de ventilation. Contrôle l’emplacementdes informations de Variables en colonnes (valeurs de données et/ou statistiquesrécapitulatives) par rapport aux étiquettes de ventilation au début de chaque modalitéde ventilation. La première ligne des informations de Variables en colonnes peutcommencer soit sur la même ligne que l’étiquette de modalité de ventilation, soit unnombre donné de lignes après cette étiquette. (Non disponible pour les Tableaux debord en colonnes)

Titres du Tableau de bord

Titres du Tableau de bord contrôle le contenu et l’emplacement des titres et pieds depage du tableau de bord. Vous pouvez spécifier jusqu’à dix lignes de titre et jusqu’àdix lignes de pieds de page, avec des composants justifiés à gauche, centrés et justifiésà droite sur chaque ligne.

Page 630: SPSS Base Users Guide 14.0

604

Chapitre 37

Figure 37-8Boîte de dialogue Tableau : Titres

Si vous insérez des variables dans les titres ou les pieds de page, l’étiquette de valeuractuelle ou la valeur de la variable est affichée dans le titre ou le pied de page. Dansles titres, l’étiquette de valeur correspondant à la valeur de la variable au début dela page est affichée. Dans les pieds de page, l’étiquette de valeur correspondantà la valeur de la variable à la fin de la page est affichée. S’il n’y a aucune étiquettede valeur, la valeur réelle est affichée.

Variables spéciales. Les variables spéciales DATE et PAGE vous permettent d’insérerla date actuelle ou le numéro de page dans l’une des lignes d’un en-tête ou d’unpied de page. Si votre fichier de données contient des variables nommées DATE ouPAGE, vous ne pouvez pas utiliser ces variables dans les titres ou les pieds de pagedes tableaux.

Tableaux de bord en colonnes

Tableaux de bord en colonnes produit des tableaux de bord dans lesquels différentesstatistiques récapitulatives apparaissent en colonnes séparées.

Page 631: SPSS Base Users Guide 14.0

605

Tableaux de Résultats

Exemple. Une société possédant une chaîne de magasins conserve des dossiers surles employés comprenant le salaire, l’ancienneté et le service où chaque employétravaille. Vous pourriez générer un tableau de bord fournissant des statistiquesrécapitulatives sur les salaires (par exemple moyenne, minimum, maximum) pourchaque division.

Variables en colonnes. Fournit la liste des variables du tableau de bord pour lesquellesvous voulez des statistiques récapitulatives et contrôle le format d’affichage et lesstatistiques récapitulatives affichées pour chaque variable.

Variables de ventilation. Fournit la liste des critères d’agrégation optionnels quidivisent le tableau de bord en groupes et contrôle les formats d’affichage des colonnesde ventilation. Pour les critères d’agrégation multiples, il y aura un groupe séparépour chaque modalité de chaque critère d’agrégation à l’intérieur des modalités ducritère d’agrégation précédent dans la liste. Les critères d’agrégation doivent être desvariables qualitatives discrètes qui divisent les observations en un nombre limité demodalités significatives.

Tableau de bord. Contrôle les caractéristiques globales du tableau de bord, y comprisl’affichage des valeurs manquantes, la numérotation des pages et les titres.

Aperçu. N’affiche que la première page du tableau de bord. Cette option est utile pouravoir un aperçu du format de votre tableau sans traiter le tableau entier.

Les données sont déjà triées. Pour les rapports avec critères d’agrégation, le fichier dedonnées doit être trié par valeur des critères d’agrégation avant de générer le tableaude bord. Si votre fichier de données est déjà trié par valeur des critères d’agrégation,vous pouvez gagner du temps de traitement en sélectionnant cette option. Cette optionest particulièrement utile après avoir vu un aperçu du tableau.

Page 632: SPSS Base Users Guide 14.0

606

Chapitre 37

Echantillon de résultatFigure 37-9Tableau de bord avec statistiques récapitulatives en colonnes

Pour obtenir un rapport récapitulatif : Récapitulatifs en colonnes

E A partir des menus, sélectionnez :Analyse

RapportsTableaux de bord en colonnes

E Sélectionnez une ou plusieurs variables pour les variables en colonnes. Une colonneest générée dans le tableau de bord pour chaque variable sélectionnée.

E Pour modifier la mesure récapitulative d’une variable, sélectionnez la variable dansla liste Variables en colonnes et cliquez sur Fonction.

E Pour obtenir plus d’une mesure récapitulative pour une variable, sélectionnez lavariable dans la liste source et déplacez-la dans la liste Variables en colonnes plusieursfois, une fois pour chaque mesure récapitulative que vous souhaitez.

E Pour afficher une colonne contenant la somme, la moyenne, le rapport ou une autrefonction de colonnes existantes, cliquez sur Insérer le total. Une variable appelée totalest alors placée dans la liste Variables en colonnes.

E Pour les tableaux triés et affichés par sous-groupe, sélectionnez une ou plusieursvariables pour les critères d’agrégation.

Page 633: SPSS Base Users Guide 14.0

607

Tableaux de Résultats

Figure 37-10Boîte de dialogue Tableaux de bord en colonnes

Fonction récapitulative des Colonnes de données

Fonctions récapitulatives contrôle les statistiques récapitulatives affichées pour lavariable de colonne de données sélectionnée.

Page 634: SPSS Base Users Guide 14.0

608

Chapitre 37

Figure 37-11Boîte de dialogue Tableau de bord : Fonction récapitulative

Les statistiques récapitulatives disponibles sont la somme des valeurs, la moyennedes valeurs, la valeur minimale, la valeur maximale, le nombre d’observations, lepourcentage d’observations situées au-dessus ou en dessous d’une valeur spécifiée, lepourcentage d’observations comprises à l’intérieur d’un intervalle donné de valeurs,l’écart-type, l’aplatissement, la variance et l’asymétrie.

Fonction élémentaire des Colonnes de Données pour colonne de total

Variables à récapituler contrôle les statistiques récapitulatives totales qui récapitulentdeux ou plusieurs Variables en colonnes.

Les statistiques récapitulatives totales sont la somme des colonnes, la moyenne descolonnes, le minimum, le maximum, la différence entre les valeurs de deux colonnes,le quotient des valeurs d’une colonne divisées par les valeurs d’une autre colonne et leproduit des valeurs de colonnes multipliées.

Page 635: SPSS Base Users Guide 14.0

609

Tableaux de Résultats

Figure 37-12Boîte de dialogue Tableau de bord : Colonnes

Somme des colonnes. La colonne total représente la somme des colonnes de la listeVariables à récapituler.

Moyenne des colonnes. La colonne total représente la moyenne des colonnes de laliste Variables à récapituler.

Minimum des colonnes. La colonne total représente la somme minimale des colonnesde la liste Variables à récapituler.

Maximum des colonnes. La colonne total représente la somme maximale des colonnesde la liste Variables à récapituler.

1ère colonne – 2ème colonne. La colonne total représente la différence des colonnesde la liste Variables à récapituler. La liste Variables à récapituler doit contenirexactement deux colonnes.

1ère colonne / 2ème colonne. La colonne total représente le quotient des colonnes de laliste Variables à récapituler. La liste Variables à récapituler doit contenir exactementdeux colonnes.

% 1ère colonne / 2ème colonne. La colonne total représente le pourcentage de lapremière colonne par rapport à la seconde colonne de la liste Variables à récapituler.La liste Variables à récapituler doit contenir exactement deux colonnes.

Produit des colonnes. La colonne total représente le produit des colonnes de la listeVariables à récapituler.

Page 636: SPSS Base Users Guide 14.0

610

Chapitre 37

Format des Colonnes du Tableau de bord

Les options de format des Variables en colonnes et de ventilation pour les Tableaux debord en colonnes sont identiques à celles décrites pour les Tableaux de bord en lignes.

Tableaux de bord en Colonnes : Options de Ventilation

Options de Ventilation contrôle l’affichage des sous-totaux, l’espacement et lapagination des modalités de ventilation.

Figure 37-13Boîte de dialogue Options de Ventilation des Tableaux de bord

Sous-total. Contrôle l’affichage des sous-totaux pour les modalités de ventilation.

Gestion des pages. Contrôle l’espacement et la pagination des modalités du critèred’agrégation sélectionné. Vous pouvez spécifier un nombre de lignes vides entreles modalités de ventilation ou commencer chaque modalité de ventilation sur unenouvelle page.

Lignes à sauter avant sous-total. Contrôle le nombre de lignes vides entre les donnéesdes modalités de ventilation et les sous-totaux.

Page 637: SPSS Base Users Guide 14.0

611

Tableaux de Résultats

Options des Tableaux de bord en Colonnes

Options contrôle l’affichage des totaux généraux, l’affichage des valeurs manquanteset la pagination dans les Tableaux de bord en colonnes.

Figure 37-14Boîte de dialogue Tableau de bord : Options colonne de ventilation ...

Total général. Affiche et étiquette un total général pour chaque colonne ; affiché aubas de la colonne.

Exclure les observations avec des valeurs manquantes. Vous pouvez exclure les valeursmanquantes du tableau ou sélectionner un caractère unique indiquant les valeursmanquantes dans le tableau de bord.

Présentation du Tableau de bord en Colonnes

Les options de présentation pour les Tableaux de bord en colonnes sont identiques àcelles présentées pour les Tableaux de bord en lignes.

Fonctionnalités supplémentaires de la commande REPORT

Le langage de commande SPSS vous permet aussi de :

Afficher différentes fonctions récapitulatives dans les colonnes d’une ligne defonction unique.

Page 638: SPSS Base Users Guide 14.0

612

Chapitre 37

Insérer des fonctions récapitulatives dans les Variables en colonnes pour desvariables autres que la variable de la colonne de données, ou pour diversescombinaisons (fonctions composites) de fonctions récapitulatives.

Utiliser la Médiane, le Mode, la Fréquence et le Pourcentage comme desfonctions récapitulatives.

Contrôler plus précisément le format d’affichage des statistiques récapitulatives.

Insérer des lignes vides à divers emplacements du tableau de bord.

Insérer des lignes vides toutes les n observations dans les listes.

Du fait de la complexité de la syntaxe de la commande REPORT, vous trouverezpeut-être utile, lorsque vous construirez un nouveau tableau de bord avec syntaxe,d’approcher le tableau généré à partir des boîtes de dialogue, de copier et coller lasyntaxe correspondante, puis de préciser cette syntaxe afin d’obtenir le tableau debord exact que vous souhaitez.

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 639: SPSS Base Users Guide 14.0

Chapitre

38Analyse de fiabilité

L’analyse de fiabilité vous permet d’étudier les propriétés des échelles de mesureet des éléments qui les constituent. La procédure d’analyse de fiabilité calculeplusieurs mesures fréquemment utilisées de la fiabilité de l’échelle et proposeégalement des informations sur les relations entre les différents éléments de l’échelle.Les coefficients de corrélation intra-classe peuvent être utilisés pour calculer lesestimations de fiabilité inter-coefficients.

Exemple. Mon questionnaire mesure-t-il de façon fidèle la satisfaction de la clientèle ?L’analyse de la fiabilité vous permet de déterminer dans quelle mesure les élémentsde votre questionnaire sont liés les uns aux autres et vous procure un indice généralde la consistance ou de la cohérence interne de l’échelle dans son ensemble. Ellevous permet enfin d’identifier les éléments qui posent problème et qu’il faudraitexclure de l’échelle.

Statistiques. Descriptions de chaque variable et pour l’échelle, statistiquesrécapitulatives sur les éléments, corrélations et covariances entre éléments, prévisionsde fiabilité, tableau d’ANOVA, coefficients de corrélation intra-classe, T2 d’Hotellinget test d’additivité de Tukey.

Modèles. Les modèles suivants de fiabilité sont disponibles :

Alpha (Cronbach). Il s’agit d’un modèle de cohérence interne, fondé sur lacorrélation moyenne entre éléments.

Split-half. Ce modèle fractionne l’échelle en deux et examine la corrélation entreles deux parties.

Guttman. Ce modèle calcule les limites minimales de Guttman pour une fiabilitévraie.

613

Page 640: SPSS Base Users Guide 14.0

614

Chapitre 38

Parallèle. Ce modèle part de l’hypothèse que tous les éléments ont des varianceségales et des variances d’erreur égales en cas de réplication.

Parallèle strict. Ce modèle se fonde sur les mêmes hypothèses que le modèleparallèle mais envisage également que tous les éléments ont la même moyenne.

Données. Les données peuvent être dichotomiques, ordinales ou constituer desintervalles, mais elles doivent être codées en numérique.

Hypothèses. Les observations doivent être indépendantes, les erreurs ne doivent pasêtre corrélées entre éléments. Chaque paire d’éléments doit avoir une distributiongaussienne bivariée. Les échelles doivent être additives, de sorte que chaque élémentest linéairement relié au total.

Procédures apparentées. Si vous souhaitez explorer la dimensionnalité des élémentsde votre échelle (pour voir si plusieurs éléments de base sont nécessaires au modèledes calculs), utilisez Analyse factorielle ou Positionnement multidimensionnel. Pouridentifier des groupes homogènes de variables, utilisez la classification hiérarchiquepour classer les variables.

Obtenir une analyse de fiabilité

E A partir des menus, sélectionnez :Analyse

EchelleAnalyse de la fiabilité...

Page 641: SPSS Base Users Guide 14.0

615

Analyse de fiabilité

Figure 38-1Boîte de dialogue Analyse d’items

E Sélectionnez deux variables (éléments) au moins en tant que composants potentielsd’une échelle additive.

E Sélectionnez un modèle dans la liste déroulante Modèle.

Page 642: SPSS Base Users Guide 14.0

616

Chapitre 38

Statistiques de l’analyse de fiabilitéFigure 38-2Boîte de dialogue Analyse d’items : Statistiques

Vous pouvez sélectionner différentes statistiques décrivant votre échelle et voséléments. Les statistiques émises par défaut regroupent le nombre d’observations, lenombre d’éléments et les prévisions de fiabilité de la façon suivante :

Modèles alpha : Coefficient alpha. Pour les données dichotomiques, il s’agit d’unéquivalent du coefficient Kuder-Richardson 20 (KR20).

Modèles Split-half : Corrélation entre les sous-échelles, fiabilité Split-half deGuttman, fiabilité de Spearman-Brown (longueur égale ou inégale) et coefficientalpha pour chaque moitié.

Modèles de Guttman : Coefficients de fiabilité lambda 1 à lambda 6.

Modèles parallèle et parallèle strict : test de qualité de l’ajustement du modèle,estimation de la variance de l’erreur, variance commune et réelle, estimation de lacorrélation commune entre éléments, estimation de la fiabilité et estimation dela fiabilité non biaisée.

Caractéristiques pour. Produit des statistiques descriptives pour les échelles ou leséléments sur les observations.

Item. Produit des statistiques descriptives pour les items sur les observations.

Page 643: SPSS Base Users Guide 14.0

617

Analyse de fiabilité

Echelle. Produit des statistiques descriptives pour les échelles.

Echelle sans l’item. Affiche les statistiques récapitulatives en comparant chaqueitem à l’échelle composée des autres items. Les statistiques incluent la moyenneet la variance de l’échelle si l’item a été supprimé de l’échelle, la corrélation entrel’item et l’échelle composée des autres items, et l’alpha de Cronbach si l’itema été supprimé de l’échelle.

Principales statistiques. Fournit des statistiques descriptives de la distribution deséléments sur l’ensemble des éléments dans l’échelle.

Moyennes. Statistiques récapitulatives pour les moyennes d'élément. Lesmoyennes d'élément minimale, maximale et intermédiaire sont affichées, ainsique le rapport de la moyenne maximale à la moyenne minimale.

Variances. Statistique récapitulative des variances d'élément. Les valeurs devariance maximale, minimale et moyenne sont affichées, ainsi que la plage etla variance des variances d'élément, et le rapport entre les variances d'élémentmaximale et minimale.

Covariances. Statistiques récapitulatives pour les covariances d'élément. Lescovariances entre éléments minimale, maximale et intermédiaire sont affichées,ainsi que l'intervalle et la variance des covariances entre éléments, et le rapport dela covariance entre éléments maximale à la covariance minimale.

Corrélations. Statistiques récapitulatives pour les corrélations d'élément. Lescorrélations entre éléments minimale, maximale et intermédiaire sont affichées,ainsi que l'intervalle et la variance des corrélations entre éléments, et le rapport dela corrélation entre éléments maximale à la corrélation minimale.

Cohérence inter-items. Produit des matrices de corrélations et de covariances entreéléments.

Tableau ANOVA. Produit des tests de moyennes égales.

Test F. Affiche un tableau d'analyse de la variance des mesures répétées.

Page 644: SPSS Base Users Guide 14.0

618

Chapitre 38

Chi-deux de Friedman. Affiche le test de Friedman (Chi-deux) et le coefficient deconcordance de Kendall. Cette option convient aux données organisées sousforme de rangs. Le test du Chi-deux remplace le test F habituel dans le tableauANOVA.

Chi-deux de Cochran. Affiche la valeur Q de Cochran. Cette option est appropriéepour les données dichotomiques. Le Q de Cochran remplace le test F habitueldans le tableau ANOVA.

T-carré de Hotelling. Produit un test multivarié basé sur l’hypothèse nulle que tous leséléments sur l’échelle ont la même moyenne.

Test d’additivité de Tukey. Produit un test basé sur l’hypothèse qu’il n’y a pasd’interaction multiplicative entre les éléments.

Coefficient de corrélation intra-classe. Produit des mesures d’homogénéité ou decohérence des valeurs par observation.

Modèle. Sélectionnez le modèle de calcul du coefficient de corrélation intra-classe.Les modèles disponibles sont Mixte à deux facteurs, Aléatoire à deux facteurs etAléatoire à un facteur. Sélectionnez Mixte à deux facteurs lorsque les effets depopulation sont aléatoires et les effets d’item sont fixes, sélectionnez Aléatoire àdeux facteurs lorsque les effets de population et les effets d’items sont aléatoires.Sélectionnez Aléatoire à un facteur lorsque les effets sur les gens sont aléatoires.

Type. Sélectionnez le type d’index. Les types disponibles sont Homogénéité etCohérence absolue.

Intervalle de confiance. Spécifiez le niveau de l’intervalle de confiance. La valeurpar défaut est 95 %.

Valeur test. Spécifiez la valeur hypothétique du coefficient pour le testd’hypothèse. Il s’agit de la valeur par rapport à laquelle la valeur observée estcomparée. La valeur par défaut est 0.

Fonctionnalités supplémentaires de la commande RELIABILITY

Le langage de commande SPSS vous permet aussi de :

Lire et analyser une matrice de corrélation.

Enregistrer une matrice de corrélation à analyser ultérieurement.

Spécifier un fractionnement autre qu’en deux moitiés égales quant au nombred’éléments pour la méthode Split-half.

Page 645: SPSS Base Users Guide 14.0

619

Analyse de fiabilité

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 646: SPSS Base Users Guide 14.0
Page 647: SPSS Base Users Guide 14.0

Chapitre

39Positionnementmultidimensionnel

Le positionnement multidimensionnel tente de déterminer une structure dans unensemble de mesures de distance entre objets ou observations. Pour cela, il affecteles observations à des positions particulières dans un espace conceptuel (à deux outrois dimensions généralement) de telle sorte que les distances entre les points dansl’espace correspondent le mieux possible aux dissimilarités données. Dans la plupartdes cas, les dimensions de cet espace conceptuel peuvent être interprétées et utiliséespour mieux comprendre les données.

Si vous avez mesuré objectivement les variables, vous pouvez utiliserle positionnement multidimensionnel comme technique de factorisation (lePositionnement multidimensionnel calcule pour vous les distances à partir desdonnées multivariées, le cas échéant). Le positionnement multidimensionnel peutégalement s’appliquer à des estimations subjectives de dissimilarité entre objetsou concepts. D’autre part, le positionnement multidimensionnel peut gérer lesinformations de dissimilarité provenant de plusieurs sources, comme c’est le caslorsqu’il y a plusieurs indicateurs ou plusieurs répondants au questionnaire.

Exemple. Comment les gens perçoivent-ils les relations entre différentes voitures ?Si les données que vous obtenez de vos répondants indiquent des évaluations desimilarité entre différentes modèles, le positionnement multidimensionnel peut servirà identifier les dimensions qui décrivent les perceptions des consommateurs. Vouspouvez trouver, par exemple, que le prix et la taille du véhicule définissent un espaceà deux dimensions qui tient compte des similarités reportées par les répondants.

Statistiques. Pour chaque modèle : matrice des données, positionnement optimisé desdonnées de la matrice, stress S (de Young), stress S (de Kruskal), RSQ, coordonnéesdes stimuli, stress moyen et RSQ pour chaque stimulus (modèles RMDS). Pour lesmodèles des différences individuelles : pondérations des sujets et indice de singularité

621

Page 648: SPSS Base Users Guide 14.0

622

Chapitre 39

pour chaque sujet. Pour chaque matrice dans les modèles de positionnementmultidimensionnel répliqués : stress et RSQ pour chaque stimulus. Diagrammes :coordonnées des stimulus (à deux ou trois dimensions), diagramme de dispersiondes disparités par rapport aux distances.

Données. Si vos données sont dissemblables, toutes les dissemblances doivent êtrequantitatives et mesurées avec les mêmes unités et échelles. Si vos données sontmultivariées, les variables peuvent être quantitatives, binaires mais peuvent aussiêtre des données d’effectif. Le positionnement des variables est un enjeu de taille :les différences de positionnement peuvent affecter votre solution. Si vos variablesprésentent de grandes différences de positionnement (par exemple, si une variable estmesurée en dollar et l’autre en année), vous devez envisager de les standardiser (etcela automatiquement par la procédure de positionnement multidimensionnel).

Hypothèses. La procédure de positionnement multidimensionnel est relativementindépendante de toute hypothèse de distribution. Assurez-vous que vous avezsélectionné le niveau de mesure approprié (ordinal, intervalle ou rapport) dans laboîte de dialogue Positionnement multidimensionnel : Options afin de garantirla justesse des résultats.

Procédures apparentées. Si votre but est la factorisation, vous pouvez égalementenvisager l’analyse factorielle, plus particulièrement si vos données sont quantitatives.Si vous souhaitez identifier des groupes d’observations similaires, envisagez decompléter votre analyse par positionnement multidimensionnel avec une analyse desnuées dynamiques ou une analyse de la classification hiérarchique.

Obtenir une analyse par positionnement multidimensionnel

E A partir des menus, sélectionnez :Analyse

EchellePositionnement dimensionnel

Page 649: SPSS Base Users Guide 14.0

623

Positionnement multidimensionnel

Figure 39-1Boîte de dialogue Positionnement multidimensionnel

E Dans Distances, sélectionnez Données en matrice(s) ou Calculées à partir des données.

E Si vos données sont des distances, sélectionnez au moins quatre variables numériquespour analyse. (Vous pouvez également cliquer sur Former pour indiquer la forme dela matrice de distance.)

E Si vous souhaitez que SPSS crée les distances avant de les analyser, sélectionnez aumoins une variable numérique. (Vous pouvez aussi cliquer sur Mesure pour spécifierle type de mesure de distance désiré.) Chaque critère de regroupement peut êtrenumérique ou de chaîne et vous pouvez créer des matrices distinctes pour chaquemodalité d’un critère de regroupement (numérique ou alphanumérique). Pour cela,déplacez cette variable dans Matrices individuelles pour en établir la liste.

Forme des données du positionnement multidimensionnelFigure 39-2Boîte de dialogue Positionnement multidimensionnel : Forme

Page 650: SPSS Base Users Guide 14.0

624

Chapitre 39

Si votre ensemble de données actif représente les distances au sein d’un ensembled’objets ou entre deux ensembles d’objets, vous devez indiquer la forme devotre matrice de données afin d’obtenir des résultats corrects. Remarque : Vouspouvez sélectionner Carré symétrique si la boîte de dialogue Modèle indique uneconditionnalité de ligne.

Positionnement multidimensionnel : créer une mesureFigure 39-3Boîte de dialogue Positionnement multidimensionnel : Calcul de l’indice de dissimilarité

Le positionnement multidimensionnel utilise les données de dissimilarité pour créerune solution de codage. Si vos données sont multivariées (valeurs des variablesmesurées), vous devez créer des données de dissimilarité afin de calculer une solutionde positionnement multidimensionnel. Vous pouvez spécifier les détails de créationde mesures de dissimilarité à partir de vos données.

Mesure. Vous permet de spécifier la mesure de dissimilarité adaptée à votre analyse.Sélectionnez une possibilité dans le groupe Mesure correspondant à votre type dedonnées, puis sélectionnez l’une des mesures dans la liste déroulante correspondant àce type de mesure. Les possibilités sont :

Intervalle. Distance Euclidienne, Carré de la distance Euclidienne, Distance deTchebycheff, Distance de Manhattan, Distance de Minkowski ou Autre.

Page 651: SPSS Base Users Guide 14.0

625

Positionnement multidimensionnel

Compter. Distance du Chi-deux ou Distance du phi-deux.

Binaire. Distance Euclidienne, Carré de la distance Euclidienne, Ecart de taille,Différence de motif, Variance ou Lance et Williams.

Créer une matrice de distances. Vous permet de choisir l’unité d’analyse. Lespossibilités sont Par variables ou Par observations.

Transformer les valeurs. Dans certains cas, comme lorsque les variables sontmesurées selon des échelles très différentes, vous voudrez peut-être standardiser desvaleurs avant de calculer les proximités (ne s’applique pas aux données binaires).Sélectionnez une méthode de standardisation dans la liste déroulante. Si aucunestandardisation n’est requise, choisissez Aucune).

Modèle de positionnement multidimensionnelFigure 39-4Boîte de dialogue Positionnement multidimensionnel : Modèle

Une estimation correcte d’un modèle de positionnement multidimensionnel dépenddes aspects des données et du modèle lui-même.

Niveau de mesure. Vous permet de spécifier le niveau de vos données. Les possibilitéssont Ordinales, Intervalle ou Rapport. Si vos variables sont ordinales, la sélectionde l’option Délier des observations liées demande qu’elles soient traitées en tant quevariables continues, de telle sorte que les liens (mêmes valeurs pour des observationsdifférentes) soient résolus de manière optimale.

Conditionnalité. Vous permet de spécifier les comparaisons pertinentes. Lespossibilités sont Matrice, Ligne et Inconditionnel.

Page 652: SPSS Base Users Guide 14.0

626

Chapitre 39

Dimensions. Vous permet de spécifier la dimensionnalité de la ou des solutions depositionnement. Une seule solution est calculée pour chaque nombre de l’intervalle.Indiquez des nombres entiers entre 1 et 6. La valeur minimale 1 n’est autorisée que sivous sélectionnez l’option Distance Euclidienne comme modèle de positionnement.Pour n’obtenir qu’une seule solution, indiquez le même nombre en tant que minimumet maximum.

Modèle de positionnement. Vous permet de spécifier les hypothèses sous lesquelles lepositionnement est effectué. Les possibilités existantes sont Distance Euclidienneou Distance Euclidienne des différences individuelles (connue également en tantque INDSCAL). Pour le modèle Distance Euclidienne des différences individuelles,vous pouvez sélectionner l’option Permet la pondération négative, si cela convient àvos données.

Positionnement multidimensionnel : OptionsFigure 39-5Boîte de dialogue Positionnement multidimensionnel : Options

Vous pouvez spécifier les options de votre analyse par positionnementmultidimensionnel.

Afficher. Vous permet d’afficher les différents types d’affichage. Les options possiblessont Diagrammes des stimuli, Diagrammes des sujets, Matrice des données etRécapitulatif des options du modèle.

Page 653: SPSS Base Users Guide 14.0

627

Positionnement multidimensionnel

Critères. Vous permet de déterminer quand l’itération doit s’interrompre. Pourmodifier les valeurs par défaut, entrez des valeurs pour la Convergence du stress S, leMinimum du stress S et le Maximum des itérations.

Traiter les dissimilarités inférieures à n comme des valeurs manquantes. Ces distancessont exclues de l’analyse.

Fonctionnalités supplémentaires de la commande ALSCAL

Le langage de commande SPSS vous permet aussi de :

Utiliser trois types de modèles supplémentaires, ASCAL, AINDS et GEMSCALdans la documentation relative au Positionnement multidimensionnel.

Effectuer des transformations polynomiales sur l’intervalle et les données detype ratio.

Analyser les similarités (plutôt que les distances) avec des données ordinales.

Analyser les données nominales.

Enregistrer diverses matrices de coordonnées et de pondération dans des fichierset les relire pour l’analyse.

Contraindre le dépliage multidimensionnel.

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 654: SPSS Base Users Guide 14.0
Page 655: SPSS Base Users Guide 14.0

Chapitre

40Statistiques de ratio

La procédure Statistiques de ratio permet d’obtenir la liste exhaustive des statistiquesrécapitulatives qui servent à décrire le rapport entre deux variables d’échelle.

Vous pouvez trier le résultat sur la base des valeurs d’une variable de regroupement,dans l’ordre croissant ou décroissant. Vous pouvez supprimer le rapport desstatistiques de ratio dans le document de sortie et enregistrer les résultats dans unfichier externe.

Exemple : Le rapport existant entre le prix estimatif et le prix de vente des maisonsest-il uniforme dans chacun de ces cinq comtés ? D’après les résultats, vous pouvezconclure que la distribution des rapports varie considérablement d’un comté à l’autre.

Statistiques : Médiane, moyenne, moyenne pondérée, intervalles de confiance,coefficient de dispersion (COD), coefficient de variation avec médiane centrée,coefficient de variation avec moyenne centrée, différentiel lié au prix (PRD),écart-type, écart absolu moyen (AAD), intervalle, valeurs minimale et maximale,et index de concentration calculés pour un intervalle ou un pourcentage défini parl’utilisateur dans le rapport médian.

Données : Utilisez des codes numériques ou alphanumériques courts pour coder lesvariables de regroupement (mesures de niveau nominal ou ordinal).

Hypothèses : Vous devez utiliser des variables d’échelle acceptant les valeurs positivespour les variables qui définissent le numérateur et le dénominateur du rapport.

Pour obtenir des statistiques de ratio

E A partir des menus, sélectionnez :Analyse

Statistiques descriptivesRatio

629

Page 656: SPSS Base Users Guide 14.0

630

Chapitre 40

Figure 40-1Boîte de dialogue Statistiques de ratio

E Sélectionnez la variable du numérateur.

E Sélectionnez la variable du dénominateur.

E Eventuellement :

Sélectionner une variable de regroupement et préciser l’ordre de présentationdes groupes dans le résultat.

Choisissez si vous souhaitez afficher les résultats dans l’Editeur de résultats.

Choisissez ou non d’enregistrer les résultats dans un fichier externe en vue d’uneutilisation ultérieure, et précisez le nom du fichier dans lequel les résultats sontenregistrés.

Page 657: SPSS Base Users Guide 14.0

631

Statistiques de ratio

Statistiques de ratioFigure 40-2Boîte de dialogue Statistiques de ratio

Tendance centrale : Les mesures de tendance centrale sont des statistiques quidécrivent la distribution des rapports.

Médiane : La valeur telle que le nombre de ratios inférieurs à cette valeur estidentique au nombre de ratios supérieurs à cette valeur.

Moyenne : Résultat de la somme des ratios divisée par le nombre total de ratios.

Moyenne pondérée : Résultat de la division de la moyenne du numérateur par lamoyenne du dénominateur. La moyenne pondérée correspond également à lamoyenne des ratios pondérée par le dénominateur.

Intervalles de confiance : Affiche les intervalles de confiance de la moyenne,de la médiane et de la moyenne pondérée (si demandée). Affectez une valeursupérieure ou égale à 0 et inférieure à 100 au niveau de confiance.

Dispersion : Ces statistiques permettent de mesurer le degré de variation, ou derépartition, au niveau des valeurs observées.

AAD : L’écart absolu moyen est égal à la somme des écarts absolus des ratiosrelatifs à la médiane, divisée par le nombre total de ratios.

Page 658: SPSS Base Users Guide 14.0

632

Chapitre 40

COD : Le coefficient de dispersion résulte de l’expression de l’écart moyen absoluen pourcentage de la médiane.

PRD : Le différentiel lié au prix, ou index de régressivité, résulte de la division dela moyenne par la moyenne pondérée.

Médiane centrée COV : Le coefficient de variation avec médiane centrée résultede l’expression de la racine de la moyenne des carrés de l’écart par rapport à lamédiane en pourcentage de la médiane.

Moyenne centrée COV : Le coefficient de variation avec moyenne centrée résultede l’expression de l’écart-type en tant que pourcentage de la moyenne.

Ecart type : L’écart-type est la racine carrée positive de la somme des carrés desécarts des ratios relatifs à la moyenne divisée par le nombre total des ratiosmoins un.

Intervalle : Résultat de la soustraction du ratio minimal au ratio maximal.

Minimum : Le minimum est le plus petit ratio.

Maximum : Le maximum est le plus grand ratio.

Index de concentration. Le coefficient de concentration mesure le pourcentage desratios compris dans un intervalle. Vous pouvez le calculer de deux manières :

Ratios entre : Dans ce cas, vous définissez l’intervalle de manière explicite enprécisant les valeurs minimale et maximale. Entrez les valeurs des proportionsinférieure et supérieure, puis cliquez sur Ajouter pour obtenir un intervalle.

Ratios dans : Dans ce cas, vous définissez l’intervalle de manière impliciteen indiquant le pourcentage de la médiane. Entrez une valeur compriseentre 0 et 100, et cliquez sur Ajouter. La limite inférieure de l’intervalle estégale à (1 – 0,01×valeur)×médiane et la limite supérieure est égale à (1 +0,01×valeur)×médiane.

Page 659: SPSS Base Users Guide 14.0

Chapitre

41Présentation de l’utilitaire dediagramme

Les procédures du menu Diagrammes et de nombreuses procédures du menu Analysepermettent de créer des diagrammes et des graphiques haute résolution. Ce chapitreprésente l’utilitaire de diagramme.

Création et modification d’un diagramme

Avant de créer un diagramme, vous devez disposer de données dans l’éditeur dedonnées. Vous pouvez saisir les données directement dans l’éditeur de données,ouvrir un fichier de données déjà enregistré ou lire une feuille de calcul, unfichier de données délimité par des tabulations ou un fichier de base de données.L’élément Didacticiel du menu Aide propose des exemples en ligne de création et demodification de diagramme ; le système d’aide en ligne explique comment créer etmodifier tous les types de diagrammes.

Création du diagramme

E Après avoir obtenu vos données dans Data Editor, sélectionnez Générateur de

diagrammes depuis le menu Graphes. La boîte de dialogue Générateur de diagrammesapparaît.

633

Page 660: SPSS Base Users Guide 14.0

634

Chapitre 41

Figure 41-1Boîte de dialogue Générateur de diagrammes

La boîte de dialogue Générateur de diagrammes est utilisée pour les types dediagrammes communs qui apparaissent dans l’onglet Galerie. Si vous devez créer undiagramme qui n’est pas disponible dans le Générateur de diagrammes, vous pouvezaussi sélectionner un type de diagramme spécifique à partir du menu Graphes.

E Dans le Générateur de diagrammes, faites glisser l’icône représentant le diagrammedans le canevas, la large zone qui s’affiche au dessus de la galerie.

Page 661: SPSS Base Users Guide 14.0

635

Présentation de l’utilitaire de diagramme

E Faites glisser les variables de la liste Variables vers les zones de dépalcement de l’axe.(Pour plus d’informations sur le Générateur de diagrammes, cliquez sur Aide.)

Lorsque la définition du diagramme est terminée, il ressemblera au diagrammesuivant.

Figure 41-2Boîte de dialogue Générateur de diagrammes avec des zones de déplacement complétées

E Si vous devez changer les statistiques ou modifier les attributs des axes ou deslégendes, cliquez sur Propriétés des éléments.

Page 662: SPSS Base Users Guide 14.0

636

Chapitre 41

Figure 41-3Fenêtre Propriété des éléments

E Sélectionnez l’élément à modifier dans la liste Modifier les propriétés de. (Pour plusd’informations sur les propriétés spécifiques, cliquez sur Aide.)

E Dans la boîte de dialogue Générateur de diagrammes, cliquez sur OK pour créer lediagramme. Le diagramme apparaît dans l’Editeur de résultats.

Page 663: SPSS Base Users Guide 14.0

637

Présentation de l’utilitaire de diagramme

Figure 41-4Diagramme en bâtons affiché dans la fenêtre du Viewer

Modification d’un diagramme

Pour modifier un diagramme, double-cliquez n’importe où dans le diagramme affichédans le Viewer. Le diagramme apparaît dans l’éditeur de diagrammes.

Page 664: SPSS Base Users Guide 14.0

638

Chapitre 41

Figure 41-5Diagramme initial dans l’éditeur de diagrammes

Vous pouvez modifier tout élément du diagramme ou choisir un autre type dediagramme pour représenter les mêmes données. Pour ajouter, afficher ou masquerdes éléments, utilisez les menus de Chart Editor.

Pour modifier un élément de diagramme

E Sélectionnez l’élément à modifier.

Page 665: SPSS Base Users Guide 14.0

639

Présentation de l’utilitaire de diagramme

E A partir des menus, sélectionnez :Affichage

Propriétés

La fenêtre Propriétés apparaît. Les onglets de la fenêtre Propriétés dépendent deschoix effectués. L’aide en ligne explique comment afficher les onglets nécessaires.

Figure 41-6Fenêtre Propriétés

Ces modifications typiques incluent :

Modification du texte du diagramme.

Modification de la couleur et du motif de remplissage des bâtons.

Ajout de texte au diagramme (par exemple, un titre ou une annotation).

Modification de l’emplacement de la ligne d’origine des bâtons.

Page 666: SPSS Base Users Guide 14.0

640

Chapitre 41

Ci-dessous figure un diagramme modifié.

Figure 41-7Diagramme modifié

Les modifications apportées au diagramme sont enregistrées lorsque vous fermez lafenêtre de diagramme. Le diagramme modifié apparaît alors dans le Viewer.

Page 667: SPSS Base Users Guide 14.0

641

Présentation de l’utilitaire de diagramme

Options de définition du diagramme

Lorsque vous définissez un diagramme, vous pouvez ajouter des titres et modifierles options de création du diagramme. Dans le Générateur de diagrammes, cliquezsur l’onglet Eléments facultatifs pour spécifier les titres, les sous-titres et les notesde bas de page. Vous pouvez cliquer sur Options pour contrôler plusieurs optionsde diagramme, telles que le traitement des valeurs manquantes ou l’utilisation desmodèles. Les sections suivantes expliquent comment définir ces caractéristiques lorsde la définition du diagramme.

Titres, sous-titres et notes de bas de page

Lors de la définition initiale du diagramme, vous pouvez spécifier deux lignes detitre, une ligne de sous-titre et deux lignes de note de bas de page. Pour spécifierdes titres ou des notes de bas de page lors de la définition d’un diagramme, cliquezsur Eléments facultatifs dans la boîte de dialogue Générateur de diagrammes. Faitesensuite glisser un des items dans le canevas. Vous pouvez modifier le texte associéà l’item en cliquant sur Propriétés des éléments et en sélectionnant l’item dans laliste Modifier les propriétés de.

Chaque ligne peut contenir jusqu’à 72 caractères. Le nombre de caractères pouvantêtre contenus par le diagramme dépend de la police et de la taille utilisées. Par défaut,la plupart des titres sont alignés à gauche et tronqués à droite s’ils sont trop longs. Lestitres des diagrammes en secteurs sont quant à eux centrés par défaut et tronqués desdeux côtés s’ils sont trop longs.

Les titres, les sous-titres et les notes de bas de page sont représentés par des zonesde texte dans Chart Editor. Dans Chart Editor, vous pouvez ajouter ou supprimer deszones de texte et modifier leur contenu, leur police, leur taille ou leur justification.

Options

La boîte de dialogue Options contient des options correspondant au diagramme quevous créez. Cette boîte de dialogue est disponible en cliquant sur Options.

Page 668: SPSS Base Users Guide 14.0

642

Chapitre 41

Figure 41-8Options

Valeurs manquantes

Critères d’agrégation :

Si des valeurs manquantes figurent dans les données des variables utilisées pourdéfinir des modalités ou des sous-groupes, sélectionnez Inclure de sorte que lesmodalités des valeurs manquantes utilisateur (valeurs identifiées comme manquantespar l’utilisateur) soient incluses dans le diagramme. Ces modalités agissent égalementen tant que critères d’agrégation lors du calcul de la statistique. Les modalités« manquantes » figurent sur l’axe de modalités ou dans la légende, et se traduisent par

Page 669: SPSS Base Users Guide 14.0

643

Présentation de l’utilitaire de diagramme

exemple par l’ajout d’un bâton supplémentaire ou d’un secteur dans les diagrammesen secteurs. S’il n’existe aucune valeur manquante, les modalités « manquantes »n’apparaissent pas.

Si vous avez sélectionné cette option et que vous ne voulez plus afficher la modalitéManquant une fois le diagramme tracé, sélectionnez ce dernier, puis choisissezPropriétés dans le menu Modifier. Cliquez sur l’onglet Modalités et déplacez lesmodalités à masquer vers la liste Exclues.

Statistiques récapitulatives et valeurs d’observations

Vous pouvez sélectionner une des alternatives suivantes pour exclure les observationsayant des valeurs manquantes :

Exclure toute la liste pour obtenir une base cohérente pour le diagramme. Sil’une des variables du diagramme comporte une valeur manquante pour uneobservation donnée, l’observation est intégralement exclue du diagramme.

Exclure variable par variable pour optimiser l’utilisation des données. Si unevariable sélectionnée comporte des valeurs manquantes, les observationscontenant ces valeurs manquantes sont exclues lors de l’analyse de la variable.

Pour connaître la différence entre les exclusions de valeurs manquantes de typeExclure toute observation incomplète et Exclure les observations variable parvariable, étudiez les figures suivantes qui représentent le diagramme en bâtonscorrespondant à chacune des deux options.

Page 670: SPSS Base Users Guide 14.0

644

Chapitre 41

Figure 41-9Exclusion des valeurs manquantes de toute observation incomplète

Figure 41-10Exclusion des valeurs manquantes des observations variable par variable

Ces diagrammes ont été créés à partir d’une version du fichier Employee data.sav.Cette dernière a été modifiée afin que les variables du salaire actuel et du type deposte occupé contiennent quelques valeurs manquantes par défaut (vides). Dansd’autres observations, la valeur 0 a été saisie et définie comme manquante. L’optionAfficher les groupes définis par des valeurs manquantes étant sélectionnée pour les deuxdiagrammes, la modalité Manquant est ajoutée aux types de poste affichés. Dans

Page 671: SPSS Base Users Guide 14.0

645

Présentation de l’utilitaire de diagramme

chaque diagramme, les valeurs de la fonction récapitulative Nombre d’observationsfigurent dans les étiquettes des bâtons.

26 observations des deux diagrammes comportent une valeur manquante pardéfaut pour le type de poste occupé, et 13 la valeur manquante utilisateur (0). Dans lediagramme avec exclusion de toute observation incomplète, le nombre d’observationsest identique pour les deux variables de chaque regroupement de bâtons. En effet, siune valeur est manquante, l’observation est exclue pour toutes les variables. Dansle diagramme avec exclusion des observations variable par variable, le nombred’observations non manquantes de chaque variable d’une modalité donnée estreprésenté indépendamment des valeurs manquantes dans les autres variables.

Modèles de diagramme

Vous pouvez appliquer la plupart des attributs et des éléments textuels d’un diagrammeà un autre. Il est possible de modifier un diagramme, de l’enregistrer en tant quemodèle, puis d’utiliser le modèle pour créer toute une série de diagrammes similaires.

Pour utiliser un modèle lors de la création d’un diagramme, cliquez sur Ajouter

dans le groupe Modèles. Une boîte de dialogue standard de sélection de fichierapparaît. Si vous ajoutez plusieurs modèles, ils sont appliqués dans l’ordre danslequel ils s’affichent dans la liste Fichiers de modèle. Vous pouvez changer cet ordresi nécessaire.

Pour appliquer un modèle à un diagramme qui figure déjà dans Chart Editor,sélectionnez dans les menus :Fichier

Appliquer modèle de diagramme...

Une boîte de dialogue standard de sélection de fichier apparaît. Sélectionnez le fichierà utiliser comme modèle. Si vous êtes en train de créer un diagramme, le nom dufichier sélectionné apparaît dans le groupe Modèle lorsque vous revenez dans la boîtede dialogue de définition du diagramme.

Les modèles permettent d’emprunter le format d’un diagramme et de l’appliquerau diagramme en cours de création. En général, toutes les informations deformatage de l’ancien diagramme applicables au nouveau diagramme s’appliquentautomatiquement. Par exemple, si l’ancien diagramme est un diagramme en bâtonsjuxtaposés dont les bâtons ont été colorés en vert et en jaune et le nouveau diagrammeest un diagramme curviligne multiple, les lignes de ce dernier seront vertes et jaunes.Si l’ancien diagramme est un diagramme en bâtons simples comportant des ombrages

Page 672: SPSS Base Users Guide 14.0

646

Chapitre 41

et le nouveau diagramme est un diagramme curviligne simple, les lignes de ce derniern’auront pas d’ombrages car ceux-ci ne s’appliquent pas aux diagrammes curvilignes.Si le diagramme modèle comporte des titres, mais pas le nouveau diagramme, lestitres du diagramme modèle sont repris. Si des titres sont définis dans le nouveaudiagramme, ils remplacent ceux du diagramme modèle.

Pour créer un modèle de diagramme

E Créez un diagramme.

E Modifiez le diagramme afin qu’il contienne les attributs souhaités dans le modèle.

E A partir des menus de l’éditeur de diagrammes, sélectionnez :Fichier

Enregistrer modèle de diagramme...

E Dans la boîte de dialogue Enregistrer le modèle de diagramme, indiquez lescaractéristiques du diagramme à enregistrer dans le modèle. L’aide en ligne décritces paramètres en détail.

E Cliquez sur Poursuivre.

E Entrez le nom de fichier et l’emplacement du nouveau modèle. L’extension dumodèle est .sgt.

Page 673: SPSS Base Users Guide 14.0

Chapitre

42Courbes ROC

Cette procédure constitue un moyen efficace d’évaluer les performances des méthodesde classement ne mettant en œuvre qu’une seule variable à deux modalités et utiliséespour la classification des sujets.

Exemple : Une banque envisage de classer correctement ses clients en modalités, àsavoir ceux qui assumeront ou non le remboursement de leur prêt. Des méthodesparticulières sont développées afin de supporter la prise de décision. Les courbesROC peuvent être utilisées pour évaluer le mode de fonctionnement optimal de cesméthodes.

Statistiques : La zone inférieure à la courbe ROC comporte un intervalle de confianceainsi que les coordonnées de cette courbe. Diagrammes : Courbe ROC

Méthodes. L’estimation de la zone située sous la courbe ROC peut être calculée defaçon paramétrique ou non à l’aide du modèle exponentiel binégatif.

Données : Les variables de test sont quantitatives. Les variables de test se composentsouvent des probabilités issues d’une analyse discriminante, d’une régressionlogistique ou des scores indiqués sur une échelle arbitraire et spécifiant la « forcede conviction » d’un indicateur lorsqu’un sujet se rapporte à l’une ou l’autre desmodalités. La variable d’état peut être d’un type quelconque et indique la véritablemodalité à laquelle un sujet appartient. La valeur de la variable d’état indique lamodalité à considérer comme positive.

Hypothèses : Les nombres croissants d’une échelle d’indicateurs confirment que lesujet appartient à une modalité, tandis que les nombres décroissants d’une échelleconfirment qu’il appartient à une autre modalité. L’utilisateur doit choisir la directionpositive. On suppose également que la véritable modalité à laquelle chaque sujetappartient est connue.

647

Page 674: SPSS Base Users Guide 14.0

648

Chapitre 42

Figure 42-1Résultat de la courbe ROC

Page 675: SPSS Base Users Guide 14.0

649

Courbes ROC

Pour obtenir une courbe ROC

E A partir des menus, sélectionnez :Graphes

Courbe ROC...

Figure 42-2Boîte de dialogue Courbe ROC

E Sélectionnez une ou plusieurs variables de probabilité de test.

E Sélectionnez une variable d’état.

E Identifiez la valeur positive de la variable d’état.

Page 676: SPSS Base Users Guide 14.0

650

Chapitre 42

Courbe ROC : OptionsFigure 42-3Boîte de dialogue Courbe ROC : Options

Vous pouvez indiquer les options suivantes pour votre analyse ROC :

Classification Permet de spécifier si la valeur du point de césure doit être incluseou exclue lors d’une classification positive. Ce paramètre n’a pas de conséquencesur le résultat.

Direction du test Permet de spécifier la direction de l’échelle en fonction de lamodalité positive.

Paramètres pour une erreur standard de zone Vous permet de spécifier la méthodeutilisée pour estimer l’erreur standard de la zone située sous la courbe. Les méthodesdisponibles sont des valeurs exponentielles non paramétriques et bi-négatives. Vouspermet également de définir le niveau de l’intervalle de confiance. Les valeurs del’intervalle se situent entre 50,1 % et 99,9 %.

Valeurs manquantes : Vous permet de spécifier comment traiter les valeurs manquantes.

Page 677: SPSS Base Users Guide 14.0

Chapitre

43Outils

Ce chapitre décrit les fonctions du menu Outils et vous indique comment réordonnerles listes de variables cible en utilisant les menus systèmes de Windows.

Informations de la variable

La boîte de dialogue Variables affiche des informations sur la définition des variablespour les variables couramment sélectionnées, y compris:

le format des Données

l’étiquette Variable

les valeurs manquantes spécifiées

les étiquettes Valeurs

Figure 43-1la boîte de dialogue Variables

651

Page 678: SPSS Base Users Guide 14.0

652

Chapitre 43

Aller à. Permet d’accéder à la variable sélectionnée dans la fenêtre de l’éditeur dedonnées.

Coller. Permet de coller les variables sélectionnées dans la fenêtre syntaxe désignée àl’emplacement du curseur.

Pour modifier les définitions de variables, utilisez l’affichage des variables dansl’éditeur de données.

Pour obtenir des informations sur les variables

E A partir des menus, sélectionnez :Outils

Variables

E Sélectionnez la variable dont vous souhaitez afficher les informations de définitionvariable.

Commentaires de fichier de données

Vous pouvez inclure des commentaires descriptifs dans le fichier de données. Pourles fichiers de données au format SPSS, les commentaires sont enregistrés avec lefichier de données.

Pour ajouter, modifier, supprimer ou afficher les commentaires de fichier de données

E A partir des menus, sélectionnez :Outils

Commentaires de fichier de données.

E Pour afficher les commentaires dans le Viewer, sélectionnez Afficher les commentaires

dans la sortie.

Les commentaires ne sont pas limités en longueur, mais ne doivent pas dépasser 80octets (en général, cela correspond à 80 caractères dans les langues sur un octet)par ligne. Les lignes sont automatiquement interrompues par un renvoi à la lignesuivante à partir de 80 caractères. La police utilisée pour afficher les commentairesest celle utilisée pour les résultats texte de manière à donner une représentation fidèlede l’affichage dans le Viewer.

Page 679: SPSS Base Users Guide 14.0

653

Outils

Un cachet de date (la date actuelle entre parenthèses) est automatiquement ajoutéà la fin de la liste des commentaires dès que vous modifiez un commentaire ou quevous en ajoutez un. Ceci peut entraîner des ambiguïtés au niveau des dates associéesaux commentaires lorsque vous modifiez un commentaire ou que vous insérez unnouveau commentaire entre deux commentaires existants.

Groupes de Variables

Vous pouvez limiter le nombre de variables devant s’afficher dans les listes desvariables source de la boîte de dialogue. Pour cela, définissez et utilisez des groupesde variables. Ceci est particulièrement utile pour les fichiers de données avec ungrand nombre de variables. Les petits groupes de variables facilitent la rechercheet la sélection des variables pour votre analyse et peuvent aussi augmenter votreperformance sur SPSS. Si votre fichier de données a un grand nombre de variableset si les boîtes de dialogue s’ouvrent lentement, le fait de réduire les listes sourcede boîtes de dialogue en sous-groupes de variables plus petits devrait permettre deréduire le temps nécessaire à l’ouverture des boîtes de dialogue.

Définir des groupes de variables

La procédure Définir des groupes de variables crée des sous-groupes de variablespour permettre d’afficher les listes source de boîtes de dialogue.

Page 680: SPSS Base Users Guide 14.0

654

Chapitre 43

Figure 43-2Définir boîte de dialogue Définir des groupes

Nom du groupe. Les noms de groupes peuvent contenir jusqu’à 12 caractères. Tousles caractères, y compris vides, peuvent être utilisés. Les noms de Groupes sontindifférents aux observations.

Variables du groupe. Toute combinaison de variables numériques, alphanumériqueset alphanumériques longues peuvent être comprises dans un groupe. L’ordre desvariables dans le groupe n’a pas d’effet sur l’ordre d’affichage des variables dans leslistes source de la boîte de dialogue. Une variable peut appartenir à de multiplesgroupes.

Pour définir des groupes de variables

E A partir des menus, sélectionnez :Outils

Définir des groupes

E Sélectionnez les variables à inclure dans le groupe.

E Saisir un nom de groupe (jusqu’à 12 caractères).

Page 681: SPSS Base Users Guide 14.0

655

Outils

E Cliquez sur .

Utiliser les groupes

La procédure Utiliser des groupes limite le nombre de variables affichées dans leslistes source de la boîte de dialogue aux groupes sélectionnés que vous avez définis.

Figure 43-3Utiliser la boîte de dialogue Définir des groupes

Groupes utilisés. Affiche les groupes utilisés pour produire les listes source devariables dans les boîtes de dialogue. Les variables apparaissent dans les listes sourcedans l’ordre alphabétique ou dans l’ordre du fichier. L’ordre des groupes et l’ordredes variables dans le groupe n’ont pas d’effet sur l’ordre des listes source de variables.Par défaut, deux groupes définis par défaut sont utilisés.

ALLVARIABLES. Ce groupe contient toutes les variables du fichier de données, ycompris les nouvelles variables créées pendant une session.

NEWVARIABLES. Ce groupe contient seulement les nouvelles variables créées pendantla session.

Vous pouvez enlever ces groupes de la liste et en sélectionner d’autres, mais ildoit y avoir au moins un groupe dans la liste. Si vous n’enlevez pas le groupeALLVARIABLES de la liste des Groupes utilisés, tous les autres groupes que vousincluez ne sont pas significatifs.

Page 682: SPSS Base Users Guide 14.0

656

Chapitre 43

Pour limiter les listes source de boîte de dialogue à des groupes de variables définis

E A partir des menus, sélectionnez :Outils

Utiliser des groupes

E Sélectionnez les groupes de variables définis qui contiennent les variables que voussouhaitez voir apparaître dans les listes source de la boîte de dialogue.

Réordonner Listes Variables Cible

Les variables apparaissent dans les listes cible de la boîte de dialogue dans l’ordre danslequel elles sont sélectionnées à partir de la liste source. Si vous souhaitez modifierl’ordre des variables d’une liste cible, mais que vous ne souhaitez pas désélectionnertoutes les variables et les resélectionner dans le nouvel ordre, vous pouvez faireremonter et redescendre les variables dans la liste cible en utilisant le menu systèmedans le coin supérieur gauche de la boîte de dialogue (à laquelle vous pouvez accéderen cliquant sur la partie gauche de la barre de titre de la boîte de dialogue).

Figure 43-4Menu système de Windows avec réordonnance de la liste cible

Faire remonter sélection. Fait remonter la ou les variables sélectionnées d’une positiondans la liste destination.

Page 683: SPSS Base Users Guide 14.0

657

Outils

Faire redescendre sélection. Fait descendre la ou les variables sélectionnées d’uneposition dans la liste destination.

Vous pouvez déplacer simultanément les variables multiples si elles sont attenantes(regroupées). Vous ne pouvez pas déplacer les groupes de variables non attenantes.

Page 684: SPSS Base Users Guide 14.0
Page 685: SPSS Base Users Guide 14.0

Chapitre

44Options

Les commandes Options permettent de contrôler un grand nombre de paramètres, ycompris :

le journal de session qui enregistre toutes les commandes exécutées dans chaquesession

l’ordre d’affichage des variables dans les listes source des boîtes de dialogue

les éléments affichés et masqués dans les nouveaux résultats

le modèle de tableau pour les nouveaux tableaux pivotants et le modèle degraphiques pour les nouveaux diagrammes interactifs

les formats monétaires personnalisés (devises)

les fichiers et fonctions autoscript permettant de personnaliser les résultats

Pour modifier les paramètres d’options

E A partir des menus, sélectionnez :Edition

Options

E Cliquez sur les onglets correspondant aux paramètres que vous souhaitez modifier.

E Modifiez les paramètres.

E Cliquez sur OK ou sur Appliquer.

659

Page 686: SPSS Base Users Guide 14.0

660

Chapitre 44

Options généralesFigure 44-1Boîte de dialogue Options, onglet Général

Listes de variables. Contrôle l’affichage des variables dans les listes de boîtes dedialogue. Vous pouvez afficher des noms de variables ou des étiquettes de variable.On peut afficher les variables dans l’ordre alphabétique ou dans l’ordre du fichierqui correspond à l’ordre dans lequel elles interviennent dans le fichier de données(et dans lequel elles sont affichées dans la fenêtre Editeur de données). L’ordred’affichage affecte seulement la liste des variables source. Les listes de variables ciblereproduisent toujours l’ordre dans lequel les variables ont été sélectionnées.

Journal de session. Fichier-journal de toutes les commandes exécutées dans unesession. Celui-ci comprend les commandes saisies et exécutées dans les fenêtres desyntaxe, ainsi que les commandes générées par les choix de boîte de dialogue. Vouspouvez modifier le fichier-journal et réutiliser les commandes dans d’autres sessions.Vous pouvez activer ou désactiver la fonction journal, ajouter au fichier-journal oul’écraser et sélectionner le nom et l’emplacement du fichier-journal. Vous pouvez

Page 687: SPSS Base Users Guide 14.0

661

Options

copier la syntaxe de commande à partir du fichier-journal et l’enregistrer dans unfichier de syntaxe pour l’utiliser avec le système de production automatisée.

Répertoire temporaire. Contrôle l’emplacement des fichiers temporaires créés au coursd’une session. En mode distribué (disponible avec la version serveur), cette optionn’affecte pas l’emplacement des fichiers de données temporaires. En mode distribué,l’emplacement des fichiers temporaires est contrôlé par la variable d’environnementSPSSTMPDIR, qui ne peut être définie que sur l’ordinateur exécutant la versionserveur du programme. Si vous devez modifier l’emplacement du répertoiretemporaire, contactez votre administrateur système.

Liste des fichiers récemment utilisés. Cette procédure permet de contrôler le nombrede fichiers récemment utilisés qui apparaissent dans le menu Fichier.

Ouvrir la fenêtre de syntaxe au démarrage. Les fenêtres de syntaxe sont des fenêtresde fichier de texte utilisées pour saisir, modifier, et exécuter les commandes SPSS.Si vous travaillez fréquemment avec la syntaxe de commande, sélectionnez cetteoption pour ouvrir automatiquement une fenêtre de syntaxe au début de chaquesession SPSS. Ceci est particulièrement utile pour les utilisateurs avertis de SPSS quipréfèrent travailler avec la syntaxe de commande plutôt que les boîtes de dialogue.(non disponible avec la version Student).

Pas d’affichage scientifique pour les petits nombres dans les tableaux. Supprimel’affichage scientifique pour les petites valeurs décimales dans le résultat. Les valeursdécimales très petites sont affichées au format suivant : 0 (ou 0,000).

Type de Viewer au démarrage. Contrôle le type d’Editeur de résultats utilisé et leformat des résultats. Le Viewer produit des tableaux pivotants interactifs et desdiagrammes interactifs. Le Viewer en mode brouillon convertit les tableaux pivotantsen sortie texte et les diagrammes en métafichiers.

Unités de mesure. Système de mesure utilisé (Points, Pouces, ou Centimètres) pourspécifier les attributs tels que les marges de cellules du tableau pivotant, les largeursde cellules et l’espace d’impression entre les tableaux

Langage. Contrôle le langage utilisé dans les résultats. Ne s’applique ni aux résultatstexte simple, ni aux graphiques interactifs, ni aux cartes (disponible avec le modulecomplémentaire Maps). La liste des langages disponibles dépend des fichiers delangage installés.

Page 688: SPSS Base Users Guide 14.0

662

Chapitre 44

Remarque : Les scripts personnalisés fondés sur des chaînes de texte propres à unlangage dans le résultat risquent de ne pas être exécutés correctement lorsque vousmodifiez le langage des résultats. Pour plus d'informations, reportez-vous à « Optionsscript » à p. 679.

Notification. Cette procédure contrôle la façon dont SPSS notifie que votre exécutionest terminée et que les résultats sont accessibles dans le Viewer.

Options Viewer

Les options d’affichage du résultat avec l’explorateur affectent seulement le nouveaurésultat produit après modification de la configuration. Un résultat déjà affiché dansle Viewer n’est pas affecté par les changements de ces paramètres.

Figure 44-2Boîte de dialogue Options, onglet Editeur de résultats

Page 689: SPSS Base Users Guide 14.0

663

Options

Etat initial résultats. Cette procédure détermine quels éléments seront automatiquementaffichés ou masqués chaque fois que vous exécuterez une procédure et combiend’éléments sont initialement alignés. Vous pouvez contrôler l’affichage des élémentssuivants : Log, Avertissements, Remarques, Titre, Tableau pivotant, Diagramme,et Résultat texte (sortie non affichée dans les tableaux pivotants). Vous pouvezégalement démarrer ou arrêter l’affichage des commandes SPSS dans le journal. Vouspouvez copier la syntaxe de commande à partir du journal et l’enregistrer dans unfichier de syntaxe pour l’utiliser dans le système de production automatisé.

Remarque : Tous les éléments de résultat sont affichés alignés à gauche dans leViewer. Seul l’alignement des résultats imprimés est affecté par les paramètresd’alignement. Les éléments centrés et alignés à droite sont identifiés par un symbolesitué au-dessus et à gauche des éléments en question.

Police du titre. Cette procédure permet de contrôler le style de police, la taille, etla couleur des titres de sortie.

Police du titre de la page. Cette procédure permet de contrôler tous les styles depolice, la taille et la couleur des nouveaux titres de page et de ceux générés par lasyntaxe de commande TITLE et SUBTITLE ou créés dans le menu Insertion à l’aidede l’option Nouveau titre de page.

Taille de page résultats texte. Cette procédure permet de contrôler la largeur de pagedans la sortie de texte (exprimée en nombre de caractères), ainsi que la longueurde page (exprimée en nombre de lignes). Dans certaines procédures, certainesstatistiques sont affichées seulement en format Large.

Police résultats texte. Police utilisée pour la sortie de texte. Le résultat texte SPSSest prévu pour être utilisé dans une police monoespacée (à espacement fixe). Sivous sélectionnez une police qui n’est pas monoespacée, le tableau de résultats nesera pas correctement aligné. La police des résultats texte est également utilisée dansl’Assistant de texte pour afficher le contenu des fichiers qui ne seraient pas alignéssi la police était monoespacée.

Options du Viewer en mode brouillon

Les options d’affichage des résultats dans le Viewer affectent seulement le nouveaurésultat produit après modification des paramètres Un résultat déjà affiché dans leViewer n’est pas affecté par les changements de ces paramètres.

Page 690: SPSS Base Users Guide 14.0

664

Chapitre 44

Figure 44-3Boîte de dialogue Options, onglet Editeur de résultats en mode brouillon

Afficher items résultats. Contrôle les éléments à afficher automatiquement à chaqueexécution d’une procédure. Vous pouvez contrôler l’affichage des éléments suivants :Journal, Avertissement, Remarques, Titre, Résultats en tableau (les tableaux pivotantssont convertis en sortie texte), Diagramme et Résultats texte (résultats en séparationd’espace).Vous pouvez également démarrer ou arrêter l’affichage des commandesSPSS dans le journal. Vous pouvez copier la syntaxe de commande à partir dujournal et l’enregistrer dans un fichier de syntaxe pour l’utiliser dans le système deproduction automatisé.

Sauts de page entre. Insère des sauts de page entre les résultats à partir de différentesprocédures et/ou entre des éléments de résultat individuels.

Police. Police utilisée pour les nouveaux résultats. Seules les polices à espacementfixe (monoespacées) sont disponibles car le résultat texte en séparation d’espace nes’alignera pas correctement avec une police proportionnelle.

Page 691: SPSS Base Users Guide 14.0

665

Options

Résultats en tableau. Contrôle les paramètres pour les résultats de tableaux pivotantsconvertis en résultat texte, sous forme de tableaux. Les spécifications de largeur decolonne et de séparateur de colonne ne sont disponibles que si vous sélectionnezEspaces comme séparateur de colonne. Pour les résultats avec séparation tabulaire,tous les sauts de lignes sont supprimés et chaque colonne a la largeur de la pluslongue étiquette ou la valeur de la colonne par défaut. Pour limiter la largeur descolonnes et insérer des sauts de ligne dans les longues étiquettes, spécifiez un nombrede caractères pour la largeur de la colonne.

Remarque : Cependant, la sortie avec des tabulations de séparation ne s’alignera pascorrectement dans le Viewer en mode brouillon. Ce format est utile pour copier etcoller les résultats dans des traitements de texte dans lesquels vous pouvez utilisern’importe quelle police (et pas uniquement des polices à espacement fixe) et définirles onglets permettant d’aligner les résultats correctement.

Résultats texte. Pour des sorties texte autres que des résultats de tableaux pivotantsconvertis, contrôle la largeur de page (exprimée en nombre de caractères) et lalongueur de page (exprimée en nombre de lignes). Dans certaines procédures,certaines statistiques sont affichées seulement en format Large.

Options Etiquettes Résultats

Les options Etiquettes Résultats permettent de contrôler l’affichage des variables etles informations sur la valeur des données dans les tableaux de légende et les tableauxpivotants. Vous pouvez afficher les noms de variables et/ou les étiquettes de variabledéfinies ainsi que les valeurs de données réelles et/ou les étiquettes valeur définies.

Les variables descriptives et les étiquettes de valeurs (affichage des variables del’éditeur de données, colonnes Etiquettes et Valeurs) facilitent souvent l’interprétationdes résultats. Les étiquettes longues peuvent cependant être gênantes dans certainstableaux.

Page 692: SPSS Base Users Guide 14.0

666

Chapitre 44

Figure 44-4Boîte de dialogue Options, onglet Etiquettes de résultats

Les options Etiquettes Résultats affectent seulement le nouveau résultat produitaprès modification des paramètres. Un résultat déjà affiché dans le Viewer n’estpas affecté par les changements de ces paramètres. Un résultat déjà affiché dans leViewer n’est pas affecté par les changements de ces paramètres. Cette configurationn’affecte que le résultat du tableau pivotant. Le résultat texte ne se trouve pas affectépar ces paramètres.

Page 693: SPSS Base Users Guide 14.0

667

Options

Options de diagrammeFigure 44-5Boîte de dialogue Options, onglet Diagrammes

Modèle de diagramme. Les diagrammes peuvent utiliser soit les paramètressélectionnés ici, soit les paramètres provenant d’un fichier de modèle de diagramme.Cliquez sur Parcourir pour sélectionner un fichier de modèle de diagramme. Pourcréer un fichier de modèle de diagramme, créez un diagramme avec les attributsque vous souhaitez et enregistrez-le comme modèle (choisissez l’option Enregistrer

diagramme Modèle dans le menu Fichier).

Ratio d’aspect diagramme. Le rapport largeur à hauteur du cadre extérieur de nouveauxdiagrammes. Vous pouvez spécifier un rapport largeur à hauteur de 0,1 à 10,0. Lesvaleurs inférieures à 1 donnent des diagrammes plus hauts que larges. Les valeurssupérieures à 1donnent des diagrammes plus larges que hauts. Une valeur 1 donneun diagramme carré. Dès qu’un diagramme est créé, le ratio de son aspect peut êtremodifié.

Page 694: SPSS Base Users Guide 14.0

668

Chapitre 44

Lancement de JVM au démarrage. Les fonctions de représentation graphique requièrentl’emploi de Java Virtual Machine (JVM). Par défaut, le JVM se lance lorsque vousdémarrez une session SPSS. Si vous désélectionnez (désactivez) cette option, il sepeut que SPSS démarre plus vite, mais il devrait y avoir de légers retards pendant lelancement du JVM lors de la première utilisation du Générateur de diagrammes ou dela création d’un diagramme dans la session.

Police. Police utilisée pour tout le texte des nouveaux diagrammes.

Préférence de cycle de style. Les affectations initiales des couleurs et/ou motifspour de nouveaux diagrammes. L’option Couleurs uniquement utilise seulement lescouleurs pour différencier les éléments de diagramme et n’utilise pas de motif.L’option Motifs uniquement utilise seulement les styles de courbe, les symboles desmarques ou les motifs de remplissage pour différencier les éléments de diagramme.Elle n’utilise pas de couleur.

Cadre. Permet de contrôler l’affichage des cadres intérieurs et extérieurs des nouveauxdiagrammes.

Quadrillage. Permet de contrôler l’affichage des quadrillages de l’axe d’échelle et del’axe des modalités des nouveaux diagrammes.

Cycles de style. Personnalise les couleurs, les styles de ligne, les symboles de marqueet les motifs de remplissage pour les nouveaux diagrammes. Vous pouvez changerl’ordre des couleurs et des motifs utilisés lors de la création d’un diagramme.

Remarque : Ces paramètres n’ont pas d’effet sur les diagrammes interactifs (menuGraphes, sous-menu Interactive).

Données Couleurs des éléments :

Précisez l’ordre dans lequel les couleurs doivent être utilisées pour les élémentsde données (comme les bâtons et les marques) de votre nouveau diagramme. Lescouleurs sont utilisées dès que vous effectuez une sélection incluant l’option Couleurdans la zone de groupe Préférence de cycle de style de la boîte de dialogue principaleOptions de diagramme.

Par exemple, si vous créez un diagramme en bâtons juxtaposés comprenantdeux groupes, et que vous sélectionnez Couleurs puis motifs dans la boîte dedialogue principale Options de diagramme, les deux premières couleurs de la liste

Page 695: SPSS Base Users Guide 14.0

669

Options

des diagrammes regroupés sont utilisées comme couleurs des bâtons du nouveaudiagramme.

Pour modifier l’ordre d’utilisation des couleurs

E Sélectionnez Diagramme simple, puis sélectionnez une couleur utilisée pour lesdiagrammes sans modalités.

E Sélectionnez Diagramme regroupé pour modifier le cycle des couleurs des diagrammesavec modalités. Pour modifier la couleur d’une modalité, sélectionnez la modalitéconcernée, puis choisissez une couleur dans la palette.

Sinon, vous pouvez :

insérer une nouvelle modalité avant la modalité sélectionnée ;

déplacer une modalité sélectionnée ;

supprimer une modalité sélectionnée.

paramétrer la séquence sur la valeur par défaut ;

modifier une couleur en sélectionnant son puits, puis en cliquant sur Edition.

Courbes des éléments de données

Précisez l’ordre dans lequel les styles doivent être utilisés pour les éléments dedonnées de la courbe de votre nouveau diagramme. Les styles de courbe sont utiliséssi votre diagramme inclut des éléments de données de courbe et que vous effectuezune sélection incluant l’option Types dans la zone de groupe Préférence de cycle destyle de la boîte de dialogue principale Options de diagramme.

Par exemple, si vous créez un diagramme curviligne comprenant deux groupes, etque vous sélectionnez Motifs uniquement dans la boîte de dialogue principale Optionsde diagramme, les deux premiers styles de la liste des diagrammes regroupés sontutilisés comme motifs des courbes du nouveau diagramme.

Pour modifier l’ordre d’utilisation des styles de lignes

E Sélectionnez Diagramme simple, puis sélectionnez un style de courbe utilisé pour lesdiagrammes curvilignes sans modalités.

Page 696: SPSS Base Users Guide 14.0

670

Chapitre 44

E Sélectionnez Diagramme regroupé pour modifier le cycle des motifs des diagrammescurvilignes avec modalités. Pour modifier le style de courbe d’une modalité,sélectionnez la modalité concernée, puis choisissez un style de courbe dans la palette.

Sinon, vous pouvez :

insérer une nouvelle modalité avant la modalité sélectionnée ;

déplacer une modalité sélectionnée ;

supprimer une modalité sélectionnée.

paramétrer la séquence sur la valeur par défaut ;

Marques des éléments de données

Précisez l’ordre dans lequel les symboles doivent être utilisés pour les éléments dedonnées des marques de votre nouveau diagramme. Les styles de marque sont utiliséssi votre diagramme inclut des éléments de données de marque et que vous effectuezune sélection incluant l’option Types dans la zone de groupe Préférence de cycle destyle de la boîte de dialogue principale Options de diagramme.

Par exemple, si vous créez un diagramme de dispersion comprenant deux groupes,et que vous sélectionnez Motifs uniquement dans la boîte de dialogue principaleOptions de diagramme, les deux premiers symboles de la liste des diagrammesregroupés sont utilisés comme marques du nouveau diagramme.

Pour modifier l’ordre d’utilisation des styles de marques

E Sélectionnez Diagramme simple, puis sélectionnez un symbole de marque utilisé pourles diagrammes sans modalités.

E Sélectionnez Diagramme regroupé pour modifier le cycle des motifs des diagrammesavec modalités. Pour modifier le symbole de marque d’une modalité, sélectionnez lamodalité concernée, puis choisissez un symbole dans la palette.

Sinon, vous pouvez :

insérer une nouvelle modalité avant la modalité sélectionnée ;

déplacer une modalité sélectionnée ;

supprimer une modalité sélectionnée.

paramétrer la séquence sur la valeur par défaut ;

Page 697: SPSS Base Users Guide 14.0

671

Options

Remplissages des éléments de données

Précisez l’ordre dans lequel les styles de remplissage doivent être utilisés pour leséléments de données de bâton et d’aire de votre nouveau diagramme. Les stylesde remplissage sont utilisés si votre diagramme inclut des éléments de données debâton et d’aire, et que vous effectuez une sélection incluant l’option Types dans lazone de groupe Préférence de cycle de style de la boîte de dialogue principale Optionsde diagramme.

Par exemple, si vous créez un diagramme en bâtons juxtaposés comprenantdeux groupes, et que vous sélectionnez Motifs uniquement dans la boîte de dialogueprincipale Options de diagramme, les deux premiers styles de la liste des diagrammesregroupés sont utilisés comme motifs de remplissage des bâtons du nouveaudiagramme.

Pour modifier l’ordre d’utilisation des styles de remplissage

E Sélectionnez Diagramme simple, puis sélectionnez un motif de remplissage utilisé pourles diagrammes sans modalités.

E Sélectionnez Diagramme regroupé pour modifier le cycle des motifs des diagrammesavec modalités. Pour modifier le motif de remplissage d’une modalité, sélectionnez lamodalité concernée, puis choisissez un motif de remplissage dans la palette.

Sinon, vous pouvez :

insérer une nouvelle modalité avant la modalité sélectionnée ;

déplacer une modalité sélectionnée ;

supprimer une modalité sélectionnée.

paramétrer la séquence sur la valeur par défaut ;

Page 698: SPSS Base Users Guide 14.0

672

Chapitre 44

Options diagrammes interactifsFigure 44-6Boîte de dialogue Options, onglet Interactif

Pour des diagrammes interactifs (menus Graphes, sous-menu Interactive), les optionssuivantes sont disponibles :

AspectGraphique. Sélectionnez un modèle de graphiques dans la liste des fichiers etcliquez sur OK ou Appliquer. Par défaut, la liste affiche les modèles de graphiquesenregistrés dans le répertoire Looks du répertoire dans lequel le programme estinstallé. Vous pouvez utiliser l’un des modèles de graphiques fournis avec leprogramme, ou vous pouvez créer le vôtre dans l’éditeur de graphiques interactifs(depuis un diagramme activé, choisissez Modèles de graphiques dans le menu Format).

Répertoire. Permet de sélectionner un répertoire de modèles de graphiques.Utilisez Parcourir pour ajouter des répertoires à la liste.

Parcourir. Cette procédure permet de sélectionner un modèle de graphiques àpartir d’un autre répertoire.

Page 699: SPSS Base Users Guide 14.0

673

Options

Données enregistrées avec diagramme. Contrôle les informations enregistrées avec desdiagrammes interactifs une fois que les diagrammes ne sont plus attachés au fichierdonnées qui les a créés (par exemple, si vous ouvrez un fichier Viewer enregistré dansune session précédente). Enregistrer des données avec le diagramme vous permetd’exécuter la plupart des fonctions interactives disponibles pour les diagrammesattachés au fichier données qui les a créés (sauf d’ajouter des variables qui n’étaientpas incluses dans le diagramme original). Cependant, ceci peut substantiellementaugmenter la taille des fichiers Viewer, particulièrement pour les fichiers donnéesimportants.

Résolution de l’impression. Contrôle la résolution d’impression de diagrammesinteractifs. Dans la plupart des cas, l’option Métafichier vecteur produira uneimpression plus rapide et offrira les meilleurs résultats. Dans le cas des bitmaps, lesdiagrammes à basse résolution s’impriment plus rapidement et les diagrammes àhaute résolution ont un meilleur aspect.

Unités de mesure. Le système de mesure utilisé (Points, Pouces ou Centimètres) pourspécifier des attributs comme la taille de la région de données dans un diagramme.

Lecture des fichiers de données Pre-8.0. Pour les fichiers de données créés avec lesversions précédentes de SPSS, la lecture des données à partir de formats de fichiersexternes et les nouvelles variables créées dans une session, vous pouvez spécifier lenombre minimum de valeurs de données pour une variable numérique utilisé pourclassifier la variable en tant que variable d’échelle ou nominale. Les variables avecmoins que le nombre spécifié de valeurs uniques sont classées comme nominales.

Remarque : A l’exception du niveau de mesure, ces paramètres n’affectent que lesdiagrammes interactifs (menu Graphes, sous-menu Interactif).

Options tableaux pivotants

Les options de tableaux pivotants définissent le modèle de tableau par défaut utilisépour de nouveaux résultats de tableaux pivotants. Le modèle de tableau peut contrôlerune variété d’attributs de tableaux pivotants, y compris l’affichage et la largeur duquadrillage; le style de police, la taille, la couleur; et la couleur de fond.

Page 700: SPSS Base Users Guide 14.0

674

Chapitre 44

Figure 44-7Boîte de dialogue Options, onglet Tableaux pivotants

Modèle de tableaux. Sélectionnez un modèle de tableau dans la liste des fichiers etcliquez sur OK ou sur Appliquer. Par défaut, la liste affiche les modèles de tableauenregistrés dans le répertoire Looks dans lequel le programme est installé. Vouspouvez utiliser l’un des modèles de tableau SPSS ou en créer un dans l’éditeur detableaux pivotants (dans le menu Format, choisissez Modèles de tableaux).

Parcourir... Cette procédure permet de sélectionner un modèle de tableau à partird’un autre répertoire.

Définir le répertoire des modèles de tableaux. Cette procédure permet de modifierle répertoire des modèles de tableau par défaut.

Ajustement largeur de colonne pour Cette procédure permet de contrôler l’ajustementautomatique des largeurs de colonnes des tableaux pivotants.

Page 701: SPSS Base Users Guide 14.0

675

Options

Etiquettes seulement. Cette procédure permet d’ajuster la largeur de colonnepar rapport à la largeur de l’étiquette colonne. Cela produit des tableaux pluscompacts, mais les valeurs de données plus larges que l’étiquette ne seront pasaffichés (des astérisques indiquent les valeurs trop larges pour être affichées).

Etiquettes et données. Cette procédure permet d’ajuster la largeur de colonnepar rapport à la plus grande largeur, soit celle de l’étiquette colonne, soit cellede la valeur des données. Cela produit des tableaux plus larges, mais garantitque toutes les valeurs seront affichées.

Mode de modification par défaut . Contrôle l’activation des tableaux pivotants dans lafenêtre du Viewer ou dans une fenêtre séparée. Par défaut, le fait de double-cliquersur un tableau pivotant active le tableau dans la fenêtre du Viewer. Vous pouvezchoisir d’activer les tableaux pivotants dans une fenêtre séparée ou de sélectionnerune définition de taille qui ouvrira de plus petits tableaux pivotants dans la fenêtre duViewer et de plus grands tableaux pivotants dans une fenêtre séparée.

Page 702: SPSS Base Users Guide 14.0

676

Chapitre 44

Options de donnéesFigure 44-8Boîte de dialogue Options, onglet Données

Options de transformation et fusion Chaque fois que SPSS exécute une commande, illit le fichier de données. Certaines transformations de données (telles que Calculeret Recoder) et certaines transformations de fichiers (telles que Ajouter Variables etAjouter Observations) ne nécessitent pas de passe de données séparée, et l’exécutionde ces commandes peut être retardée jusqu’à ce que SPSS lise les données pourexécuter une autre commande, telle qu’une procédure statistique. Pour les grosfichiers de données, sélectionner Calculer les valeurs avant leur utilisation pour retarderl’exécution et enregistrer le temps de traitement.

Afficher format nouvelles variables numériques. Cette procédure permet de contrôlerla largeur d’affichage par défaut et le nombre de positions décimales par défaut desnouvelles variables numériques. Il n’existe pas de format d’affichage par défautpour les nouvelles variables chaînes. Si une valeur est trop grande pour le formatd’affichage spécifié, les premières décimales sont arrondies et les valeurs sont ensuite

Page 703: SPSS Base Users Guide 14.0

677

Options

converties en notation scientifique Les formats d’affichage n’affectent pas les valeursde données internes. Par exemple, la valeur 123456.78 peut être arrondie à 123457pour l’affichage, mais la valeur originale non arrondie est utilisée pour tout calcul.

Définir siècle pour années sur 2 chiffres : Définit l’intervalle d’années pour lesvariables de format de date entrés et/ou affichés avec des années à deux chiffres(par exemple,10/28/86, 29-OCT-87). Le paramétrage de l’intervalle automatique estbasé sur l’année en cours, commençant 69 années avant et finissant 30 années aprèsl’année en cours (ajouter l’année en cours donne un intervalle total de 100 années).Pour un intervalle personnalisé, l’année de fin est automatiquement déterminée enfonction de la valeur que vous entrez pour l’année de début.

Générateur de nombres aléatoires. Deux types de générateur de nombres aléatoiressont disponibles :

Compatible avec SPSS 12. Générateur de nombres aléatoires utilisé dans SPSS 12et les versions précédentes. Si vous avez besoin de reproduire des résultatsaléatoires générés dans des versions précédentes sur la base d'une valeur degénérateur spécifiée, utilisez ce générateur de nombres aléatoires.

Mersenne Twister. Générateur de nombres aléatoires plus récent et plus fiablepour les simulations. Si la reproduction de résultats aléatoires à partir de SPSS12 ou d'une version antérieure n'est pas un problème, utilisez ce générateur denombres aléatoires.

Options monétaires (devises)

Vous pouvez afficher jusqu’à cinq formats monétaires personnalisés (devises) quipeuvent comprendre des caractères spéciaux de préfixe et suffixe, et qui peuventrecevoir un traitement spécial pour les valeurs négatives.

Les cinq noms de format monétaire personnalisé sont CCA, CCB, CCC, CCD, etCCE. Vous ne pouvez pas modifier les noms de format ou en ajouter de nouveaux.Pour modifier un format monétaire personnalisé, sélectionnez le nom du format àpartir de la liste source et procédez aux modifications souhaitées.

Page 704: SPSS Base Users Guide 14.0

678

Chapitre 44

Figure 44-9Boîte de dialogue Options, onglet Devises

Les préfixes et suffixes définis pour les formats monétaires servent uniquement àl’affichage. Vous ne pouvez saisir de valeur dans l’éditeur de données en utilisantdes caractères monétaires personnalisés.

Création de formats monétaires personnalisés

E Cliquez sur l’onglet Devise.

E Sélectionnez un des formats de devises dans la liste (CCA, CCB, CCC, CCD et CCE).

E Saisissez les valeurs de préfixe, suffixe, et de séparateur décimal

E Cliquez sur OK ou sur Appliquer.

Page 705: SPSS Base Users Guide 14.0

679

Options

Options script

Utilisez l’onglet Scripts pour spécifier le fichier de procédures globales et le fichierautoscript, et sélectionner les sous-routines d’autoscript à utiliser. Vous pouvezutiliser les scripts pour automatiser de nombreuses fonctions dans SPSS, y compris lapersonnalisation des tableaux pivotants.

Procédures globales. Le fichier de procédure globale est une bibliothèque desous-routines script et de fonctions script qui peuvent être nommées par fichier script,y compris les fichiers autoscript.

Remarque : Le fichier de procédures globales livré avec SPSS est sélectionnépar défaut. Nombre des scripts livrés avec SPSS utilisent des fonctions et dessous-routines de ce fichier de procédures globales et ne seront pas opérationnelles sivous spécifiez un fichier de procédures globales différent.

Autoscripts.Un fichier d’autoscript est un recueil de sous-routines script exécutéesautomatiquement chaque fois que vous lancez des procédures qui créent certainstypes d’objet de sortie.

Page 706: SPSS Base Users Guide 14.0

680

Chapitre 44

Figure 44-10Boîte de dialogue Options, onglet Scripts

Toutes les sous-routines du fichier courant autoscript sont affichées, ce qui vouspermet d’autoriser, ou non, les sous-routines individuelles.

Pour spécifier des options pour fichiers de procédures globales et autoscripts

E Cliquez sur l’onglet Scripts.

E Sélectionnez Permettre l’autoscript.

E Sélectionnez les sous-routines d’autoscript souhaitées.

Vous pouvez aussi spécifier un fichier d’autoscript différent ou un fichier de procédureglobale.

Page 707: SPSS Base Users Guide 14.0

Chapitre

45Personnalisation des menus etdes barres d’outils

Editeur de menu

Vous pouvez utiliser l’éditeur de menu pour personnaliser vos menus SPSS. Avecl’éditeur de menu vous pouvez :

Ajouter des éléments de menus qui exécutent des scripts SPSS personnalisés.

Ajouter des éléments de menu qui exécutent des fichiers de syntaxe de commandeSPSS.

Ajouter des éléments de menu qui lancent d’autres applications et envoientautomatiquement des données SPSS vers d’autres applications.

SPSS peut envoyer des données vers d’autres applications dans les formats suivants :SPSS, Excel 4.0, Lotus 1-2-3 version 3, SYLK, tabulé, et dBASE IV.

Pour ajouter des items aux menus

E A partir des menus, sélectionnez :Outils

Editeur de menu

E Dans la boîte de dialogue Editeur de menu, double-cliquez sur le menu dans lequelvous voulez rajouter un nouvel élément.

E Sélectionnez l’élément de menu au-dessus de laquelle vous voulez qu’apparaissela nouvelle option.

E Cliquez sur Insérer item pour insérer un nouvel élément de menu.

681

Page 708: SPSS Base Users Guide 14.0

682

Chapitre 45

E Sélectionnez le type de fichier du nouvel élément (fichier de script, fichier de syntaxede commande ou application externe).

E Cliquez sur Parcourir pour sélectionner un fichier à attacher à l’élément de menu.

Figure 45-1Boîte de dialogue Editeur de menu

Vous pouvez également ajouter des menus entièrement nouveaux et des séparateursentre les éléments de menu.

Vous pouvez également envoyer automatiquement le contenu de l’éditeur dedonnées vers une autre application lorsque vous sélectionnez cette application dansles menus SPSS.

Personnalisation des barres d’outils

Vous pouvez personnaliser les barres d’outils SPSS et créer de nouvelles barresd’outils. Les barres d’outils peuvent contenir tous les outils disponibles dans SPSS,y compris les outils utilisés pour toutes les procédures des menus. Elles peuventégalement contenir des outils personnalisés permettant de lancer d’autres applications,d’exécuter des fichiers de syntaxe de commande ou des fichiers de script.

Page 709: SPSS Base Users Guide 14.0

683

Personnalisation des menus et des barres d’outils

Montrer barres d’outils

Utilisez Montrer barres d’outils pour afficher ou masquer les barres d’outils, lespersonnaliser et en créer de nouvelles. Les barres d’outils peuvent contenir tous lesoutils disponibles dans SPSS, y compris les outils utilisés pour toutes les procéduresdes menus. Elles peuvent également contenir des outils personnalisés permettant delancer d’autres applications, d’exécuter des fichiers de syntaxe de commande ou desfichiers de script.

Figure 45-2Boîte de dialogue Montrer barres d’outils

Pour personnaliser les barres d’outils

E A partir des menus, sélectionnez :Affichage

Barres d’outils...

E Sélectionnez la barre d’outils que vous voulez personnaliser et cliquez surPersonnaliser, ou cliquez sur Nouvelle barre d’outils pour créer une barre d’outils.

E Pour les nouvelles barres d’outils, indiquez le nom de la barre, sélectionnez lesfenêtres dans lesquelles vous voulez qu’elle apparaisse et cliquez sur Personnaliser.

Page 710: SPSS Base Users Guide 14.0

684

Chapitre 45

E Sélectionnez un élément dans la liste Modalités pour afficher les outils disponiblesdans cette modalité.

E Faites glisser et lâchez les outils que voulez inclure dans la barre d’outils affichéedans la boîte de dialogue.

E Pour supprimer un outil dans une barre d’outils, le faire glisser n’importe où en dehorsde la barre d’outils affichée dans la boîte de dialogue.

Pour créer un outil personnalisé pour ouvrir un fichier, exécuter un fichier de syntaxede commande ou exécuter un script :

E Cliquez sur Nouvel outil dans la boîte de dialogue Personnaliser barre d’outils.

E Indiquez une étiquette décrivant l’outil.

E Sélectionnez l’action que vous voulez affecter à l’outil (ouvrir un fichier, exécuter unfichier de syntaxe de commande ou exécuter un script).

E Cliquez sur Parcourir pour sélectionner un fichier ou une application à associer àl’outil.

Les nouveaux outils s’affichent dans la modalité définie par l’utilisateur, qui peutaussi contenir des éléments de menu définis par l’utilisateur.

Propriétés barre d’outils

Utilisez Propriétés des barres d’outils pour sélectionner les types de fenêtres danslesquelles vous voulez voir apparaître la barre d’outils sélectionnée. Cette boîte dedialogue sert aussi à créer des noms ou de nouvelles barres d’outils.

Page 711: SPSS Base Users Guide 14.0

685

Personnalisation des menus et des barres d’outils

Figure 45-3Boîte de dialogue Propriétés barre d’outils

Pour définir des propriétés des barres d’outils

E A partir des menus, sélectionnez :Affichage

Barres d’outils...

E Pour les barres d’outils existantes, cliquez sur Personnaliser, puis sur Propriétés dansla boîte de dialogue Personnaliser barre d’outils.

E Pour les nouvelles barres d’outils, cliquez sur Nouvel outil.

E Sélectionnez les types de fenêtres dans lesquelles vous voulez voir apparaître la barred’outils. Pour les nouvelles barres d’outils, indiquez aussi un nom de barre.

Personnaliser barre d’outils

Utilisez la boîte de dialogue Personnaliser barre d’outils pour personnaliser les barresd’outils existantes et en créer de nouvelles. Les barres d’outils peuvent contenirtous les outils disponibles dans SPSS, y compris les outils utilisés pour toutes lesprocédures des menus. Elles peuvent également contenir des outils personnaliséspermettant de lancer d’autres applications, d’exécuter des fichiers de syntaxe decommande ou des fichiers de script.

Page 712: SPSS Base Users Guide 14.0

686

Chapitre 45

Figure 45-4Boîte de dialogue Personnaliser barre d’outils

Créer nouvel outil

Utilisez la boîte de dialogue Créer nouvel outil pour créer des outils personnaliséspermettant de lancer d’autres applications, d’exécuter des fichiers de syntaxe decommande et d’exécuter des fichiers de script.

Page 713: SPSS Base Users Guide 14.0

687

Personnalisation des menus et des barres d’outils

Figure 45-5Boîte de dialogue Créer nouvel outil

Editeur bitmap de barre d’outils

Utilisez l’éditeur BMP pour créer des icônes personnalisées pour les boutons desbarres d’outils. Cela est tout particulièrement utile pour les outils personnalisés crééspour exécuter des scripts, de la syntaxe et d’autres applications.

Page 714: SPSS Base Users Guide 14.0

688

Chapitre 45

Figure 45-6Editeur BMP

Pour modifier les images bitmap de la barre d’outils

E A partir des menus, sélectionnez :Affichage

Barres d’outils...

E Sélectionnez la barre d’outils à personnaliser et cliquez sur Personnaliser.

E Cliquez sur l’outil avec l’icône bitmap que vous voulez modifier dans l’exemplede barre d’outils.

E Cliquez sur Modifier outil.

Page 715: SPSS Base Users Guide 14.0

689

Personnalisation des menus et des barres d’outils

E Utilisez la boîte à outils et la palette de couleurs pour modifier l’image bitmap oucréer une nouvelle icône bitmap.

Page 716: SPSS Base Users Guide 14.0
Page 717: SPSS Base Users Guide 14.0

Chapitre

46Système de production

Le Système de Production permet d’exécuter SPSS en mode automatisé. SPSSfonctionne seul et prend fin après avoir exécuté la dernière commande, ce qui vouspermet d’exécuter d’autres tâches pendant qu’il fonctionne. Le mode Production estutile si vous exécutez souvent le même ensemble d’analyses longues, telles que desrapports hebdomadaires.

Le Système de Production utilise des fichiers de syntaxe de commande pourindiquer au programme la marche à suivre. Un fichier de syntaxe de commande estun fichier texte simple contenant une syntaxe de commande. Vous pouvez utilisern’importe quel éditeur de texte pour créer ce fichier. Vous pouvez également générerune syntaxe de commande en collant les sélections de la boîte de dialogue dans unefenêtre de syntaxe ou en modifiant le fichier-journal.

Après que vous avez créé des fichiers de syntaxe et que vous les avez intégrésdans une tâche de production, vous pouvez les afficher et les modifier à partir dusystème de production.

691

Page 718: SPSS Base Users Guide 14.0

692

Chapitre 46

Figure 46-1Système de production

Format de saisie de syntaxe. Permet de contrôler la forme des règles de syntaxeutilisées pour la tâche :

Interactif. Chaque commande doit se terminer par un point. Les points peuventfigurer n’importe où dans la commande et les commandes peuvent occuperplusieurs lignes. Par contre, lorsqu’un point représente le dernier caractère nonvide d’une ligne, il est considéré comme la fin de la commande. Les lignessuivantes et les nouvelles commandes peuvent commencer n’importe où surune nouvelle ligne. Voici les règles « interactives » appliquées lorsque voussélectionnez et exécutez des commandes dans une fenêtre de syntaxe.

Commande. Chaque commande doit commencer au début d’une nouvelle ligne(aucun espace vide avant le début de la commande) et les lignes suivantesdoivent commencer par un décrochement d’au moins un espace. Pour mettreen retrait de nouvelles commandes, vous pouvez entrer le signe plus, un tiretou un point pour le premier caractère au début de la ligne, puis mettre enretrait la commande réelle. Le point à la fin de la commande est optionnel. Ceparamètre est compatible avec les règles de syntaxe des fichiers de commandequi accompagnent la commande INCLUDE.

Page 719: SPSS Base Users Guide 14.0

693

Système de production

Comportement d’erreur de syntaxe. Permet de contrôler le traitement des conditionsd’erreur dans la tâche :

Poursuivre. Les erreurs figurant dans la tâche n’arrêtent pas automatiquement letraitement des commandes. Les commandes des fichiers de tâches de productionsont traitées comme une partie du flux de commandes normal et le traitement descommandes se poursuit normalement.

Arrêter. Le traitement des commandes s’arrête lorsque la première erreur d’unfichier de tâches de production est détectée. Ce paramètre est compatible avecle comportement des fichiers de commande qui accompagnent la commandeINCLUDE.

Résultats de la tâche de production. Chaque séquence de production crée un fichierde résultats portant le même nom que la tâche de production et l’extension .spo. Parexemple, un fichier de tâche de production intitulé prodjob.spp crée un fichier derésultats intitulé prodjob.spo. Le fichier de résultats est un document du Viewer.

Type de résultat. Les sorties du Viewer sont sous forme de tableaux pivotants et degraphiques haute résolution et interactifs. Le Viewer en mode brouillon produit lesrésultats texte et des fichiers images (metafiles ou métafichiers) des graphiques. Lesrésultats texte peuvent être modifiés dans le Viewer en mode brouillon, à l’inversedes graphiques.

Utilisation de l’Utilitaire de Production

E Créez un fichier de syntaxe de commande.

E Démarrez le Système de production, disponible dans le menu Démarrage.

E Indiquez les fichiers de syntaxe que vous souhaitez utiliser dans la tâche deproduction. Cliquez sur Ajouter pour sélectionner les fichiers de syntaxe.

E Enregistrer le fichier de Tâche de production.

E Exécutez le fichier de Tâche de production. Cliquez sur le bouton Exécuter de la barred’outils ou choisissez dans les menus :Exécuter

Tâche de production

Page 720: SPSS Base Users Guide 14.0

694

Chapitre 46

Options d’exportation

Les options d’exportation permettent d’enregistrer les tableaux pivotants SPSS etles éléments texte au format HTML, texte, Word/RTF et Excel, et d’enregistrer desdiagrammes sous divers formats communément utilisés par d’autres applications.

Figure 46-2Boîte de dialogue Options d’exportation

Exporter

Cette liste déroulante indique les éléments que vous souhaitez exporter.

Document résultat. Exporte toute combinaison de tableaux pivotants, résultat texte etdiagrammes.

Pour les formats HTML et texte, les diagrammes sont exportés dans le formatd’exportation du diagramme sélectionné. Pour le format document HTML, lestableaux sont intégrés par référence, et vous devez exporter les tableaux sous unformat adapté pour permettre leur intégration dans des documents HTML. Pourle format document texte, une ligne est insérée dans le fichier texte pour chaquediagramme, indiquant le nom de fichier du diagramme exporté.

Pour le format Word/RTF, les diagrammes sont exportés au format métafichierWindows et incorporés dans le document Word.

Les diagrammes ne sont pas inclus dans les documents Excel.

Document Résultat (sans Graphiques). Exporte les tableaux pivotants et les résultatstexte. Les diagrammes du Viewer sont ignorés.

Graphiques uniquement. N’exporte que les graphiques. Pour les documents HTMLet texte, les formats d’exportation sont les suivants : métafichier amélioré (EMF),métafichier Windows (WMF), bitmap Windows (BMP), PostScript encapsulé

Page 721: SPSS Base Users Guide 14.0

695

Système de production

(EPS), JPEG, TIFF, PNG et PICT Macintosh. Pour les documents Word/RTF, lesdiagrammes sont toujours exportés au format métafichier Windows.

Format d’exportation

Pour les documents de résultat, les options disponibles sont HTML, texte, Word/RTFet Excel ; pour les formats HTML et texte, les diagrammes sont exportés au formatdu diagramme sélectionné. Pour Graphiques Seulement, sélectionnez un formatd’exportation de graphiques dans la liste déroulante. Pour les documents de résultat,les tableaux pivotants et le texte sont exportés de la façon suivante :

Fichier HTML (*.htm). Les tableaux pivotants sont exportés comme des tableauxHTML. Les résultats texte sont publiés au format HTML pré-formaté.

Fichier texte (*.txt). Les tableaux pivotants peuvent être exportés en format tabuléou avec espaces. Tous les résultats texte sont exportés en format avec espaces.

Fichier Excel (*.xls). Les lignes, colonnes et cellules des tableaux pivotants sontexportées comme des lignes, colonnes et cellules Excel, avec tous les attributs deformatage (bordures de cellule, styles de police, couleurs d’arrière-plan, etc.).Le résultat texte est exporté avec tous les attributs de police. Chaque ligne durésultat texte est une ligne dans le fichier Excel, avec le contenu de toute la lignedans une seule cellule.

Fichier Word/RTF (*.doc). Les tableaux pivotants sont exportés en tant que tableauxWord, avec tous les attributs de formatage (bordures de cellule, styles de police,couleurs d’arrière-plan, etc.). La sortie texte est exportée au format RTF. Lerésultat texte dans SPSS apparaît toujours dans une police à espacement fixe(monoespacé) et est exporté avec les mêmes attributs de police. Une police àespacement fixe (monoespacé) est nécessaire pour le bon alignement des résultatstexte séparés par des espaces.

Format d’image

L’option Format d’image contrôle le format d’exportation des diagrammes. Lesdiagrammes peuvent être exportés aux formats suivants : métafichier amélioré (EMF),métafichier Windows (WMF), bitmap Windows (BMP), PostScript encapsulé (EPS),JPEG, TIFF, PNG ou PICT Macintosh.

Les noms des diagrammes exportés comprennent le nom de fichier de la tâche deproduction, un numéro séquentiel, et l’extension du format choisi. Si la tâche deproduction prodjob.spp exporte des diagrammes au format métafichier Windows,

Page 722: SPSS Base Users Guide 14.0

696

Chapitre 46

les noms des diagrammes seraient prodjob1.wmf, prodjob2.wmf, prodjob3.wmf, etainsi de suite.

Options de texte et d’image

Les options d’exportation de texte (séparé par des tabulations ou par des espaces, parexemple) et les options d’exportation de diagrammes (paramètres des couleurs, tailleet résolution, par exemple) sont définies dans SPSS et ne peuvent pas être modifiéesdans le système de production. Pour modifier les options d’exportation de texte et dediagrammes, utilisez l’option Exporter du menu Fichier de SPSS.

Exportation du Viewer en mode brouillon

La seule option d’exportation disponible pour les résultats du Viewer en modebrouillon consiste à exporter les résultats en texte simple. Les diagrammes ne peuventêtre exportés par le Viewer en mode brouillon.

Invites utilisateur

Les symboles de macro définis dans un fichier de tâche de production et utilisés dansun fichier de syntaxe de commande simplifient les tâches comme l’exécution de lamême analyse pour différents fichiers de données ou l’exécution du même ensemblede commandes pour différents ensembles de variables. Vous pouvez par exempledéfinir les symboles de macro @datfile pour que le système vous demande un nom defichier de données chaque fois que vous exécutez une tâche de production qui utilise lachaîne @datfile au lieu d’un nom de fichier dans le fichier de syntaxe de commande.

Page 723: SPSS Base Users Guide 14.0

697

Système de production

Figure 46-3Boîte de dialogue Invites utilisateur

Symbole de macro. Nom de macro utilisé dans le fichier de syntaxe de commandepour appeler la macro qui demande à l’utilisateur de saisir des informations. Lenom du symbole de macro doit commencer par un @. Remarque : Ces symboles« macro » ne sont pas liés aux macros créées par l’utilitaire de macro SPSS enutilisant DEFINE-!ENDDEFINE.

Invite. Etiquette descriptive qui s’affiche lorsque la tâche de production vous demandede saisir des informations. Vous pouvez par exemple utiliser la phrase “ Quel fichierde données souhaitez-vous utiliser ? ”‚ pour identifier un champ qui exige un nomde fichier de données.

Défaut. Valeur que la tâche de production donne par défaut si vous ne tapez pasune valeur différente. Cette valeur s’affiche lorsque la tâche de production vousdemande cette information. Vous pouvez remplacer ou modifier cette valeur pendantl’exécution.

Page 724: SPSS Base Users Guide 14.0

698

Chapitre 46

Mettre la valeur entre guillemets. Tapez O ou Oui si vous souhaitez que la valeur soitmise entre guillemets. Sinon, laissez le champ vide ou tapez N ou Non. Par exemple,vous devez entrer Oui pour les spécifications de nom de fichier car les spécificationsde ce type doivent être placées entre guillemets.

Figure 46-4Invites de macro dans un fichier de syntaxe de commande

Sollicitation de macros de production

Le système de production SPSS vous demande des valeurs chaque fois que vousexécutez une tâche de production qui contient des symboles de macro définis. Vouspouvez remplacer ou modifier les valeurs par défaut affichées. SPSS remplace alorsces valeurs par les symboles de macro dans tous les fichiers de syntaxe de commandeassociés à la tâche de production.

Page 725: SPSS Base Users Guide 14.0

699

Système de production

Figure 46-5Boîte de dialogue Sollicitation de macros de production

Remarque : Ces symboles « macro » ne sont pas liés aux macros créées par l’utilitairede macro SPSS en utilisant DEFINE-!ENDDEFINE et la tâche de production vousinvitera à saisir ces valeurs même si aucun des fichiers de syntaxe de commande de latâche n’inclut de références à ces « macros » définies.

Options de production

Les options de production vous permettent de :

Spécifier un éditeur de texte par défaut pour les fichiers de syntaxe auxquels on aaccédé par le bouton de modification de la boîte de dialogue principale.

Exécuter la tâche de production comme une opération de fond invisible ou afficherSPSS et les résultats qu’il génère au fur et à mesure de l’exécution de la tâche.

Définir un serveur distant, un nom de domaine, un ID utilisateur ainsi qu’unmot de passe pour l’analyse distribuée (applicable uniquement si vous disposezd’un accès réseau à la version serveur de SPSS). Si vous ne fournissez pas cesinformations, les paramètres par défaut de la boîte de dialogue de connexion auserveur de SPSS seront utilisés. Vous ne pouvez sélectionner que les serveursdistants que vous avez précédemment définis dans la boîte de dialogue d’ajout deserveur de SPSS (menu Fichier, Changer serveur, Ajouter).

Page 726: SPSS Base Users Guide 14.0

700

Chapitre 46

Figure 46-6Options

Modification des options de production

Dans les menus du Système de production choisissezEdition

Options

Contrôle du format des tâches de production

Plusieurs paramètres de SPSS peuvent vous aider à choisir le meilleur format pour lestableaux pivotants créés dans les tâches de production :

Aspects de tableaux. En modifiant et en enregistrant Aspects de tableaux (menuFormat dans un tableau pivotant actif) vous pouvez contrôler de nombreux attributsde tableaux pivotants. Vous pouvez spécifier les tailles et styles de polices, lescouleurs, et les bordures. Pour éviter la division de tableaux larges sur plusieurspages, sélectionnez Redimensionner largeur de tableau pour l’ajuster à la page dansl’onglet Général, option Propriétés du tableau.

Page 727: SPSS Base Users Guide 14.0

701

Système de production

Etiquettes de résultats. Les options Etiquettes de résultats (Menu Edition, Options,onglet Etiquettes Résultats) contrôlent l’affichage des informations relatives auxvariables et aux valeurs de données dans les tableaux pivotants. Vous pouvezafficher des noms de variables et/ou des étiquettes de variable définies, des valeursde données réelles et/ou des étiquettes de valeurs définies. Les étiquettes de variableet de valeur, plus descriptives, permettent souvent d’interpréter plus facilement vosrésultats. Toutefois, de longues étiquettes peuvent parfois paraître étranges danscertains tableaux.

Largeur de colonne. Les options Tableaux pivotants (menu Edition, Options, ongletTableaux pivotants) contrôlent les modèles de tableaux par défaut et l’ajustementautomatique des largeurs de colonnes dans les tableaux pivotants.

Etiquettes seulement. Cette procédure permet d’ajuster la largeur de colonne parrapport à la largeur de l’étiquette de colonne. Cela produit des tableaux pluscompacts, mais les valeurs de données plus larges que l’étiquette ne seront pasaffichés (des astérisques indiquent les valeurs trop larges pour être affichées).

Etiquettes et données. Cette procédure permet d’ajuster la largeur de colonne parrapport à la plus grande largeur, soit celle de l’étiquette de colonne, soit celle dela valeur des données. Cela produit des tableaux plus larges, mais garantit quetoutes les valeurs seront affichées.

Les tâches de production utilisent les paramètres en vigueur définis sous Modèle detableau et Options. Vous pouvez définir les paramètres dans Modèles de tableaux etOptions avant de lancer votre tâche de production, mais vous pouvez égalementutiliser les commandes SET dans vos fichiers de syntaxe pour les contrôler. Le recoursaux commandes SET dans les fichiers de syntaxe vous permet d’utiliser plusieursparamètres Modèles de tableaux et Options dans la même tâche.

Création d’un modèle de tableau par défaut personnalisé

E Activez le tableau pivotant (double-cliquez à un endroit quelconque du tableau).

E A partir des menus, sélectionnez :Format

Aspects de tableaux...

E Sélectionnez un modèle de tableau dans la liste et cliquez sur Modifier modèle.

E Définissez les propriétés du tableau selon les attributs voulus.

Page 728: SPSS Base Users Guide 14.0

702

Chapitre 46

E Cliquez sur Enregistrer aspect ou Enregistrer sous pour enregistrer le modèle detableau et cliquez sur OK.

E A partir des menus, sélectionnez :Edition

Options

E Cliquez sur l’onglet Tableaux pivotants.

E Sélectionnez le modèle de tableau dans la liste et cliquez sur OK.

Définition des options pour les tâches de production

E A partir des menus, sélectionnez :Edition

Options

E Sélectionnez les options souhaitées.

E Cliquez sur OK.

Vous pouvez définir le modèle de tableau par défaut, les paramètres des étiquettes derésultats, et l’ajustement automatique de la largeur des colonnes avec Options. Lesparamètres définis sous Options sont enregistrés avec le programme. Lorsque vousexécutez une tâche de production, les paramètres des options en vigueur lors de ladernière exécution du programme sont appliqués à la tâche de production.

Contrôle du format des tableaux pivotants avec la syntaxe de commande

SET TLOOK. Contrôle le modèle de tableau par défaut pour les nouveaux tableauxpivotants, comme dans :

SET TLOOK = 'c:\prodjobs\montableau.tlo'.

SET TVARS. Contrôle l’affichage des noms et des étiquettes de variable dans lesnouveaux tableaux pivotants.

SET TVARS = LABELS fait apparaître les étiquettes de variable.

SET TVARS = NAMES fait apparaître les noms de variable.

SET TVARS = BOTH fait apparaître les noms et les étiquettes de variable.

Page 729: SPSS Base Users Guide 14.0

703

Système de production

SET ONUMBER. Contrôle l’affichage des valeurs de données ou des étiquettes devaleurs dans les nouveaux tableaux pivotants.

SET ONUMBER = LABELS fait apparaître les étiquettes de valeurs.

SET ONUMBER = VALUES fait apparaître les valeurs de données.

SET ONUMBER = BOTH fait apparaître les valeurs de données et les étiquettes devaleurs.

SET TFIT. Contrôle l’ajustement automatique de la largeur des colonnes pour lesnouveaux tableaux pivotants.

SET TFIT = LABELS ajuste la largeur des colonnes en fonction de la largeurdes étiquettes de colonne.

SET TFIT = BOTH ajuste la largeur des colonnes à la largeur des étiquettes ou àla plus grande valeur de données, le chiffre retenu étant le plus grand des deux.

Exécution de tâches de production à partir d’une ligne decommande

Les boutons de la ligne de commande vous permettent de programmer l’heured’exécution des tâches de production grâce aux utilitaires de programmation commecelui disponible dans Microsoft Plus!. Vous pouvez exécuter des tâches de Productionà partir d’une ligne de commande à l’aide des boutons suivants :

-r. Exécute la tâche de production. Si la tâche de production contient des invitesutilisateur, vous devez fournir l’information demandée pour que la tâche deproduction puisse s’exécuter.

-s. Exécute la tâche de production, et supprime les éventuels messages ou invitesutilisateur. Les valeurs par défaut des invites utilisateur sont automatiquementutilisées.

Analyse distribuée. Si vous disposez d’un accès réseau à la version serveur de SPSS,vous pouvez également utiliser les commutateurs suivants pour exécuter le systèmede production en mode d’analyse distribuée :

-x. Nom ou adresse IP du serveur distant.

-n. Numéro du port.

-d. Nom de domaine.

Page 730: SPSS Base Users Guide 14.0

704

Chapitre 46

-u. ID utilisateur pour l’accès au serveur distant.

-p. Mot de passe pour l’accès au serveur distant.

Si vous spécifiez l’un de ces paramètres de ligne de commande pour l’analysedistribuée, vous devez tous les indiquer (-x, -n, -d, -u et -p).

Vous devez indiquer le chemin complet aussi bien pour le système de production(spssprod.exe) que pour la tâche de production, et les deux doivent être mis entreguillemets, comme dans l’exemple suivant :

"c:\program files\spss\spssprod.exe""c:\spss\datajobs\prodjob.spp" -s -r

Pour les commutateurs de ligne de commande nécessitant des spécificationssupplémentaires, vous devez les faire suivre du signe égal (=) immédiatement avant laspécification. Si la spécification comporte des espaces (par exemple, dans un nomde serveur en deux mots), indiquez la valeur entre guillemets ou entre apostrophes,comme dans l’exemple suivant :

-x="HAL 9000" -u="nom secret"

Serveur par défaut. Si vous disposez d’un accès réseau à la version serveur de SPSS,le serveur par défaut et les informations associées (si vous ne les avez pas spécifiésdans les commutateurs de ligne de commande) correspondent au serveur par défautdéfini dans la boîte de dialogue de connexion au serveur de SPSS. Si aucun serveurpar défaut n’est défini dans cette boîte de dialogue, la tâche s’exécute en mode local.

Si vous souhaitez exécuter une tâche de production en mode local mais que votreordinateur local n’est pas votre serveur par défaut, indiquez des chaînes vides entreguillemets pour tous les commutateurs de ligne de commande de l’analyse distribuée,comme dans l’exemple suivant :

"c:\program files\spss\spssprod.exe""c:\spss\datajobs\prodjob.spp" -x="" -n="" -d="" -u="" -p=""

Page 731: SPSS Base Users Guide 14.0

705

Système de production

Exécution de plusieurs tâches de production

Si vous employez un fichier de commandes (.bat) ou une fonctionnalité similaire pourexécuter plusieurs tâches de production, utilisez la commande Démarrer de Windowset le paramètre /wait pour contrôler l’exécution de chaque tâche, en empêchant lestâches suivantes de démarrer avant la fin de la tâche précédente. Exemple :

cd \program files\spssstart /wait spssprod.exe prodjob1.spp -sstart /wait spssprod.exe prodjob2.spp -s

Publication sur le WebLa fonction Publier sur le Web exporte les résultats à publier vers le serveur WebSmartViewer. Les tableaux et rapports publiés dans SmartViewer peuvent êtrevisualisés et manipulés via le Web, en temps réel et à l’aide d’un navigateur standard.

Les tableaux pivotants sont publiés comme des tableaux dynamiques pouvant êtremanipulés via le Web afin d’obtenir différents affichages des données.

Les diagrammes sont publiés sous forme de fichiers graphiques JPEG ou PNG.

Les résultats texte sont publiés sous forme de HTML pré-formaté. (La plupartdes navigateurs utilisent par défaut une police à espacement fixe pour le textepréformaté.).

Publier. Permet de spécifier le résultat à publier :

Document résultat. Publie la totalité du document de résultat, y compris leséléments masqués ou réduits.

Document résultat (sans Notes). Publie tout sauf les tableaux Notes produitsautomatiquement pour chaque procédure.

Tableaux uniquement. Exclut les graphiques. Tous les tableaux pivotants ettableaux de texte sont publiés.

Tableaux uniquement (sans Notes). Exclut les graphiques et les tableaux Notes.

Graphiques uniquement. Publie uniquement les graphiques du document.

Rien. Désactive la publication sur le Web. Du fait que tous les paramètres sontenregistrés avec la tâche de production (fichier spp), les résultats seront publiésà chaque fois vous que exécuterez la tâche de production, à moins que vous ne

Page 732: SPSS Base Users Guide 14.0

706

Chapitre 46

sélectionniez l’option Rien. Celle-ci désactive la publication tout en générantd’autres types de résultats (fichiers du Viewer, fichiers HTML) spécifiés dansla tâche de production.

Publier tableaux en tant que. Contrôle la manière dont les tableaux pivotants sontpubliés :

Interactif. Les tableaux sont des objets dynamiques pouvant être manipulés via leWeb afin d’obtenir différents affichages des données.

Statique. Les tableaux sont statiques et ne peuvent pas être manipulés aprèspublication.

Configurer. Ouvre la page Configurer la publication automatique du serveur WebSmartViewer dans une fenêtre de navigateur. Cette procédure est requise pour lacréation d’une tâche de production à publier sur le Web.

Une ID utilisateur et un mot de passe vous sont également demandés pouraccéder au serveur Web SmartViewer. Lorsque vous créez une tâche de production àpublier sur le Web, vous devez entrer votre ID utilisateur et votre mot de passe. Cesinformations sont stockées dans la tâche de production dans un format codé.

Remarque : La fonction Publier sur le Web est disponible uniquement avec les sitesoù le serveur Web SmartViewer est installé et elle nécessite un plug-in pour activerla fonction de publication. Contactez votre administrateur système ou Webmasterpour obtenir des instructions sur le téléchargement du plug-in. Si SmartViewer n’estpas disponible sur votre site, utilisez l’option Exporter le résultat pour enregistrer lerésultat au format HTML.

Connexion au serveur Web SmartViewer

La publication sur le serveur Web SmartViewer nécessite un nom d’utilisateur (IDutilisateur) et un mot de passe valides.

Contactez votre administrateur système ou Webmaster pour plus d’informations.

Page 733: SPSS Base Users Guide 14.0

Chapitre

47Utilitaire de script SPSS

L’utilitaire de script vous permet d’automatiser certaines tâches, telles que :

Ouverture et enregistrement de fichiers de données.

Affichage et manipulation de boîtes de dialogue.

Exécution des transformations de données et des procédures statistiques à l’aidede la syntaxe de commande.

Exportation des diagrammes sous forme de fichiers graphiques dans de nombreuxformats.

Réorganisation des résultats dans l’Editeur de résultats

Un certain nombre de scripts figure dans le logiciel, notamment les scriptsautomatiques qui s’exécutent automatiquement à chaque fois qu’un type de résultatest produit. Vous pouvez utiliser ces scripts comme ils se présentent ou les adapterà vos besoins. Si vous souhaitez créer vos propres scripts, vous pouvez d’abord enchoisir un parmi les nombreux Assistants script.

Exécution d’un scriptE A partir des menus, sélectionnez :

OutilsExécuter le script

707

Page 734: SPSS Base Users Guide 14.0

708

Chapitre 47

Figure 47-1Boîte de dialogue Exécuter le script

E Sélectionnez le dossier Scripts.

E Sélectionnez le script de votre choix.

Pour plus d'informations, reportez-vous à « Personnalisation des menus et des barresd’outils » dans Chapitre 45 à p. 681.

Scripts livrés avec SPSS

Les scripts suivants sont livrés avec le programme :

Analyser les observations restantes. Répète une analyse factorielle ou une analysediscriminante à l’aide des observations qui n’ont pas été sélectionnées dans uneanalyse précédente. Un tableau de remarques produit par la précédente exécution del’analyse factorielle ou discriminante doit être sélectionné avant d’exécuter le script.

Modifier la signification de p. Changez Sig. en p= dans les étiquettes de colonnes den’importe quel tableau pivotant. Il faut choisir le tableau avant d’exécuter le script.

Clean navigator.sbs (effacer le Navigateur). Supprime tous les tableaux deremarques d’un document de résultat. Le document doit être ouvert dans la fenêtrecorrespondante du Viewer avant l’exécution du script.

Page 735: SPSS Base Users Guide 14.0

709

Utilitaire de script SPSS

Fréquences en bas de page. Insère les statistiques affichées dans un tableau statistiquede fréquences sous forme de notes de bas de page dans le tableau de fréquencescorrespondant pour chaque variable. Le tableau de statistiques de fréquences doit êtresélectionné avant l’exécution du script.

Make totals bold.sbs (totaux en gras). Applique l’attribut Gras et la couleur Bleue àtoutes les lignes, colonnes ou strates de données indiquées comme étant un Total dansle tableau pivotant. Il faut choisir le tableau avant d’exécuter le script.

Means report.sbs (état des moyennes). Extrait les informations du tableau desmoyennes et écrit les résultats dans plusieurs fichiers de résultat ASCII. Le tableaudes moyennes doit être sélectionné avant d’exécuter le script.

Remove labels.sbs (retirer les étiquettes). Supprime toutes les étiquettes de colonnesou de lignes dans un tableau pivotant sélectionné. Il faut choisir le tableau avantd’exécuter le script.

Rerun syntax from note.sbs (réexécuter la syntaxe à partir des remarques). Exécuteà nouveau la commande trouvée dans le tableau de remarques sélectionné avec lefichier de données actif. Si aucun fichier n’est ouvert, le script tente de lire le fichierde données utilisé initialement. Le tableau des remarques doit être sélectionné avantl’exécution du script.

R-deux max. Dans le tableau récapitulatif des modèles de régression, appliquez leformat Gras et la couleur Bleue à la ligne correspondant au modèle qui maximise lesR2 ajustés. Le tableau récapitulatif des modèles doit être sélectionné avant l’exécutiondu script.

Pour plus d'informations, reportez-vous à « Options » dans Chapitre 44 à p. 659.

Remarque : cette liste n’est pas exhaustive.

Autoscripts

Les scripts automatiques s’exécutent automatiquement lorsqu’ils sont déclenchés à lacréation d’une partie de résultat particulière par une procédure donnée. Par exemple,SPSS contient un autoscript qui supprime automatiquement la diagonale supérieure etmet en surbrillance les coefficients de corrélation négligeables à chaque fois qu’untableau de corrélations est produit par la procédure Corrélation Bivariée....

Page 736: SPSS Base Users Guide 14.0

710

Chapitre 47

L’onglet Scripts de la boîte de dialogue Options (menu Edition) affiche les scriptsautomatiques (Autoscripts) disponibles sur votre système et vous permet d’activer oude désactiver différents scripts.

Figure 47-2Onglet Scripts de la boîte de dialogue Options

Les scripts automatiques sont spécifiques à une procédure et à un type de résultatdonnés. Un autoscript qui formate les tableaux ANOVA produit par une analyseANOVA à un facteur n’est pas déclenché par des tableaux ANOVA produits pard’autres types de procédure statistiques (mais vous pourriez utiliser des procéduresgénérales pour créer des scripts automatiques distincts pour les tableaux ANOVAqui partagent un code très similaire). Cependant, vous pouvez utiliser un autoscriptdistinct pour chaque type de résultat produit par la même procédure. Fréquences, parexemple, produit à la fois un tableau de fréquences et un tableau de statistiques,chacune pouvant avoir son propre autoscript.

Pour plus d'informations, reportez-vous à « Options » dans Chapitre 44 à p. 659.

Page 737: SPSS Base Users Guide 14.0

711

Utilitaire de script SPSS

Création et modification de scripts

Vous pouvez adapter à vos besoins la plupart des scripts livrés avec le logiciel. Parexemple, l’un des scripts permet de supprimer tous les tableaux de remarques dansle document de résultat choisi. Vous pouvez facilement modifier ce script poursupprimer les éléments de résultat de n’importe quel type et d’étiquette.

Figure 47-3Modifier un script dans la fenêtre de script

Si vous préférez créer vos propres scripts, vous pouvez d’abord en choisir un parmiles nombreux Assistants scripts.

Page 738: SPSS Base Users Guide 14.0

712

Chapitre 47

Modification d’un scriptE A partir des menus, sélectionnez :

FichierOpen

Script

Figure 47-4Ouvrir un fichier de script

E Sélectionnez le dossier Scripts.

E Dans Type, sélectionnez Script SPSS (*.sbs).

E Sélectionnez le script de votre choix.

Si vous ouvrez plusieurs scripts, chacun d’eux dispose de sa propre fenêtre.

Fenêtre de script

La fenêtre de script est un environnement de programmation complet qui utilise lelangage Sax BASIC et inclut un éditeur de boîte de dialogue, un navigateur d’objets,des fonctions de mise au point et une aide contextuelle.

Page 739: SPSS Base Users Guide 14.0

713

Utilitaire de script SPSS

Figure 47-5Fenêtre de script

Lorsque vous déplacez le curseur, le nom de la procédure s’affiche en haut de lafenêtre.

Les termes en bleu sont des mots réservés au BASIC (tels que Sub, End Subet Dim). Pour accéder à l’Aide contextuelle relative à ces termes, cliquez surces termes et appuyez sur F1.

Les termes en magenta sont des objets SPSS, des propriétés ou des méthodes.Vous pouvez également cliquer sur ces termes et sur F1 pour accéder à l’Aide,mais uniquement lorsqu’ils apparaissent en magenta et dans des instructions

Page 740: SPSS Base Users Guide 14.0

714

Chapitre 47

correctes. (Il est inutile de cliquer sur le nom d’un objet dans un commentaire :l’aide qui apparaît concerne le langage Sax BASIC et non les objets SPSS.)

Les commentaires sont affichés en vert.

Cliquez sur F2 pour afficher le navigateur d’objets qui affiche les objets SPSS,les propriétés et les méthodes.

Propriétés de l’éditeur de script (fenêtre de script)

Les éléments de code dans la fenêtre de script répondent à un code couleur qui permetde les distinguer plus facilement. Par défaut, les commentaires sont en vert, les termesSax BASIC sont en bleu et les noms des objets, propriétés et méthodes valides, sonten magenta. Vous pouvez indiquer des couleurs différentes pour ces éléments etchanger la taille et la police de tout le texte.

Pour définir les propriétés de l’éditeur de script

E A partir des menus, sélectionnez :Script

Propriétés de l’éditeur…

Figure 47-6Boîte de dialogue Propriétés Editeur

E Pour modifier la couleur d’un type d’élément de code, sélectionner l’élément et unecouleur dans la palette déroulante.

Page 741: SPSS Base Users Guide 14.0

715

Utilitaire de script SPSS

L’Assistant script

Lorsque vous créez un nouveau script, vous pouvez tout d’abord choisir un certainnombre d’Assistants script.

Figure 47-7Boîte de dialogue Utiliser l’Assistant script

Chaque Assistant script fournit un code pour une ou plusieurs procédures classiquesainsi que certaines astuces sur la personnalisation du script.

Supprimer par étiquette. Supprime des lignes ou des colonnes dans un tableaupivotant en fonction du contenu de RowLabels ou ColumnLabels. Pour que ce scriptfonctionne, l’option Masquer les lignes et colonnes vides doit être sélectionnée dans laboîte de dialogue Propriétés de Tableau.

Supprimer les items du Navigateur. Supprime les éléments du Viewer en fonctiond’un certain nombre de critères.

Note de bas de page. Reformate les notes de bas de page d’un tableau pivotant,modifie le texte dans une note de bas de page ou ajoute une note de bas de page.

Reformate par étiquettes. Reformate un tableau pivotant en fonction des étiquettes delignes, de colonnes ou de strates.

Reformate par valeur. Reformate un tableau pivotant en fonction de la valeur decellules de données ou d’une combinaison de cellules et d’étiquettes.

Page 742: SPSS Base Users Guide 14.0

716

Chapitre 47

Reformate un tableau pivotant divers. Reformate ou modifie le texte dans un titre detableau pivotant, un texte de coin ou une légende.

Vous pouvez également utiliser n’importe quel autre script disponible commeAssistant Script, même s’il est plus complexe à personnaliser. Ouvrez simplement lescript et enregistrez-le sous un nom différent.

Création d’un script

E A partir des menus, sélectionnez :Nouveau

Script…

E Sélectionnez un Assistant script si vous souhaitez commencer par là.

E Si vous ne souhaitez pas utiliser d’assistant, cliquez sur Annuler.

Création de scripts automatiques

Pour créer un autoscript, sélectionnez un objet du résultat qui servira de déclencheur.Par exemple, pour créer un autoscript qui s’exécute à chaque fois qu’un tableau defréquences est produit, créez un tableau de fréquences selon la procédure habituelle etcliquez sur le tableau dans le Viewer pour le sélectionner. Cliquez sur le bouton droitde la souris ou utilisez le menu Outils pour créer un nouveau autoscript déclenché àchaque fois que ce type de tableau est produit.

Page 743: SPSS Base Users Guide 14.0

717

Utilitaire de script SPSS

Figure 47-8Créer un nouveau autoscript

Chaque autoscript que vous créez est ajouté au fichier d’autoscript actif (autscript.sbs,par défaut) en tant que nouvelle procédure. Le nom de la procédure renvoie àl’événement qui sert de déclencheur. Par exemple, si vous créez un autoscriptdéclenché chaque fois que la procédure Explorer crée un tableau de caractéristiques, lenom de la sous-routine d’autoscript est Explore_Table_Descriptives_Create.

Figure 47-9Procédure de Nouveau autoscript affiché dans la fenêtre de script

Page 744: SPSS Base Users Guide 14.0

718

Chapitre 47

Ceci facilite le développement des scripts automatiques en vous évitant d’avoir àréécrire le code permettant d’obtenir l’objet que vous souhaitez traiter, mais il fautque les scripts automatiques soient spécifiques à un élément de résultat et à uneprocédure statistique donnés.

Création d’un autoscript

E Sélectionnez l’objet que vous souhaitez utiliser en tant que déclencheur dans leViewer.

E A partir des menus, sélectionnez :Outils

Créer/modifier un script automatique…

S’il n’existe pas d’autoscript pour l’objet sélectionné, un nouveau autoscript est créé.Si un autoscript existe déjà, il est affiché.

E Entrez le code.

E Dans le menu Edition, sélectionnez Options pour activer ou désactiver l’autoscript.

Evénements déclenchant les scripts automatiques

Le nom de la procédure de l’autoscript renvoie à l’événement qui le déclenche. Lesévénements suivants peuvent déclencher des scripts automatiques :

Création d’un tableau pivotant. Le nom de cette procédure renvoie àla fois le type de tableau et la procédure qui l’a créé, par exemple,Correlations_Table_Correlations_Create.

Page 745: SPSS Base Users Guide 14.0

719

Utilitaire de script SPSS

Figure 47-10Procédure d’autoscript pour un tableau de corrélation

Création du titre. Renvoie à la procédure statistique qui l’a créé :Correlations_Title_Create.

Création de remarques. Renvoie à la procédure qui l’a créé :Correlations_Notes_Create.

Création d’avertissements. Renvoyé par la procédure qui l’a créé.

Vous pouvez également utiliser un script pour déclencher indirectement un autoscript.Par exemple, vous pouvez écrire un script qui invoque une procédure de corrélation,qui, à son tour, déclenche l’autoscript déclaré pour le tableau de corrélation enrésultant.

Page 746: SPSS Base Users Guide 14.0

720

Chapitre 47

Fichier d’autoscript

Tous les scripts automatiques sont enregistrés dans un seul fichier (à la différencedes autres scripts enregistrés dans des fichiers distincts). Tous les nouveaux scriptsautomatiques que vous créez sont ajoutés à ce fichier. Le nom du fichier d’autoscriptactif est affiché dans l’onglet Scripts de la boîte de dialogue Options (menu Edition).

Figure 47-11Sous-routines d’autoscript affichées dans la boîte de dialogue Options

La boîte de dialogue Options affiche également tous les scripts automatiques dans lefichier actif, ce qui vous permet d’activer et de désactiver les différents scripts.

Le fichier d’autoscript par défaut est autscript.sbs. Vous pouvez spécifier un fichierd’autoscript différent mais vous ne pouvez en activer qu’un seul à la fois.

Page 747: SPSS Base Users Guide 14.0

721

Utilitaire de script SPSS

Fonctionnement des scriptsLes scripts manipulent les objets à l’aide des propriétés et des méthodes. Par exemple,les tableaux pivotants constituent une classe d’objets. Les objets de cette classe vouspermettent d’utiliser la méthode SelectTable pour choisir tous les éléments du tableauet la propriété TextColor pour changer la couleur du texte sélectionné. Chaque classed’objets possède des propriétés et des méthodes qui lui sont propres. Le regroupementdes classes (ou types) d’objets SPSS s’appelle la bibliothèque des types SPSS.

Figure 47-12Arborescence de la hiérarchie des objets.

L’utilisation des objets constitue une procédure en deux étapes. Créez tout d’abordune référence pour l’objet (appelée accès à l’objet). Utilisez ensuite les propriétés etles méthodes pour effectuer quelque chose. Pour atteindre les objets, naviguez dansla hiérarchie des objets SPSS à chaque étape à partir des propriétés et des méthodes

Page 748: SPSS Base Users Guide 14.0

722

Chapitre 47

du niveau supérieur pour accéder aux objets du niveau inférieur. Par exemple, pouratteindre un tableau pivotant, vous devez d’abord accéder au document de résultat quicontient ce tableau puis aux éléments de ce document.

Chaque objet que vous atteignez est enregistré dans une variable. (Souvenez-vousque tout ce que vous enregistrez dans la variable est une référence à l’objet.) L’unedes premières étapes de la création d’un script est souvent la déclaration de variablespour les objets dont vous avez besoin.

Astuces : il est difficile de comprendre le fonctionnement de scripts si vous necomprenez pas le fonctionnement de SPSS. Avant d’écrire un script, effectuezplusieurs fois les tâches à accomplir à l’aide de la souris. A chaque étape, tenezcompte des objets que vous manipulez et des propriétés de chaque objet que vousmodifiez.

Déclarations des variables (Script)

Même si ce n’est pas obligatoire, il est judicieux de déclarer toutes les variables avantde les utiliser. Pour cela, on utilise généralement les instructions de déclaration Dim :

Dim objOutputDoc As ISpssOutputDocDim objPivotTable As PivotTableDim intType As IntegerDim strLabel As String

Chaque déclaration indique le nom et le type de variable. Par exemple, la premièredéclaration ci-dessus crée une variable d’objet appelée objOutputDoc et affectecette variable à la classe d’objets ISpssOutputDoc. La variable n’a pas encorede valeur. En effet, elle n’a pas encore été définie pour un document de résultatparticulier. L’instruction se contente de déclarer que la variable existe (il a été faitréférence à ce processus comme à “une attribution d’un nouveau nom aux objets quevous désirez utiliser”).

Conventions d’appellation des variables. Par convention, le nom de chaque variablefait référence à son type. Les noms des variables d’objet commencent par obj, ceuxdes variables numériques (entiers) par int et ceux des variables chaîne par str.Vous pouvez nommer vos variables de la façon qui vous convient mais nous vousconseillons d’utiliser des appellations aidant à leur compréhension lors de leur suivi.

Page 749: SPSS Base Users Guide 14.0

723

Utilitaire de script SPSS

Classes d’objets SPSS. ISpssOutputDoc et PivotTable sont des noms de classesd’objet SPSS. Chaque classe représente un type d’objet que le programme peut créer,tel qu’un document de résultat ou un tableau pivotant. Chaque classe d’objets possèdedes propriétés et des méthodes qui lui sont propres. Le regroupement des classes (outypes) d’objets SPSS s’appelle la bibliothèque des types SPSS.

Table des classes d’objet et conventions d’appellation

Les noms de variables suivants sont utilisés sans les scripts types livrés avec SPSS. Ilssont conseillés pour tous les scripts. Notez que, à l’exception des tableaux pivotants,les noms de classes d’objets commencent toujours par ISpss.

Objet Type ou Classe Nom de variable

Application SPSS IspssApp La variable objSpssApp estglobale. Elle ne requiertaucune déclaration.

Options SPSS ISpssOptions objSpssOptions

Informations sur les fichiersSPSS

ISpssInfo objSpssInfo

Documents ISpssDocuments objDocuments

Document de données ISpssDataDoc objDataDoc

Document de syntaxe ISpssSyntaxDoc objSyntaxDoc

Document du Viewer ISpssOutputDoc objOutputDoc

Options d’impression ISpssPrintOptions objPrintOptions

Regroupement deséléments de résultat

ISpssItems objOutputItems

Elément de résultat ISpssItem objOutputItem

Graphes ISpssChart objSPSSChart

Texte ISpssRtf objSPSSText

Tableau pivotant PivotTable objPivotTable

Notes de bas de page ISpssFootnotes objFootnotes

Cellules de données ISpssDataCells objDataCells

Etiquettes de strates ISpssLayerLabels objLayerLabels

Etiquettes de colonnes ISpssLabels objColumnLabels

Etiquettes de lignes ISpssLabels objRowLabels

Page 750: SPSS Base Users Guide 14.0

724

Chapitre 47

Objet Type ou Classe Nom de variable

Gestionnaire de tableaupivotant

ISpssPivotMgr objPivotMgr

Dimension IspssDimension objDimension

Accès aux objets d’automation SPSS (script)

Accéder à un objet signifie créer une référence à l’objet de telle sorte que vouspuissiez utiliser les propriétés et les méthodes servant à effectuer une action. Chaqueréférence à un objet que vous obtenez est enregistrée dans une variable. Pour obtenirun objet, déclarez d’abord une variable d’objet de la classe appropriée puis affectezcette variable à un objet particulier. Par exemple, pour accéder au document derésultat mentionné :

Dim objOutputDoc As ISpssOutputDocSet objOutputDoc = objSpssApp.GetDesignatedOutputDoc

Vous utilisez les propriétés et les méthodes des objets supérieurs dans lahiérarchie des objets pour obtenir les objets inférieurs. La seconde instructionci-dessus permet d’accéder au document de résultat mentionné à l’aide deGetDesignatedOutputDoc, méthode apparentée à l’objet d’application SPSS, quiest d’un niveau supérieur. De la même façon, pour accéder à un tableau pivotant, vousdevez d’abord atteindre le document de résultat qui contient le tableau pivotant pourle regroupement des éléments de ce document de résultat et ainsi de suite.

Exemple : Accès à un élément de résultat

Ce script accède au troisième élément de résultat dans le document de résultatmentionné et l’active. Si cet élément n’est pas un objet OLE, le script renvoie uneerreur.

Sub Main

Dim objOutputDoc As ISpssOutputDoc 'Déclarer les variables objetDim objOutputItems As ISpssItemsDim objOutputItem As ISpssItem

Page 751: SPSS Base Users Guide 14.0

725

Utilitaire de script SPSS

Set objOutputDoc = objSpssApp.GetDesignatedOutputDoc 'obtenir la référence du document de sortieSet objOutputItems = objOutputDoc.Items() 'obtenir la collection des éléments dans le documentSet objOutputItem = objOutputItems.GetItem(2) 'obtenir le troisième élément de résultat'(les numéros d'élément commencent à 0 pour que "2" corresponde au troisième élément)

objOutputItem.Activate 'activer l'élément de résultat

End sub

Exemple : Accès au premier tableau pivotant

Ce script accède au premier tableau pivotant dans le document de résultat mentionnéet l’active.

Sub Main

Dim objOutputDoc As ISpssOutputDoc 'déclarer les variables objetDim objOutputItems As ISpssItemsDim objOutputItem As ISpssItemDim objPivotTable As PivotTable

Set objOutputDoc = objSpssApp.GetDesignatedOutputDoc'obtenir la référence du document de sortieSet objOutputItems = objOutputDoc.Items()'obtenir la collection des items du document

Dim intItemCount As Integer'nombre d'éléments de résultatDim intItemType As Integer'type d'élément (défini par la propriété SpssType)

intItemCount = objOutputItems.Count()'obtenir le nombre d'éléments de résultatFor index = 0 To intItemCount'parcourir les éléments de résultatSet objOutputItem = objOutputItems.GetItem(index)'obtenir l'élément courant

intItemType = objOutputItem.SPSSType()'obtenir le type de l'élément courant IfintItemType = SPSSPivot ThenSet objPivotTable = objOutputItem.Activate()'si l'élément est un tableau pivotant, l'activerExit For

End IfNext index

End sub

Page 752: SPSS Base Users Guide 14.0

726

Chapitre 47

Ces exemples sont également accessibles dans l’aide en ligne. Vous pouvez testerces exemples vous-même. Pour cela, copiez le code de la fenêtre d’aide et collez-ledans la fenêtre de script.

Propriétés et méthodes (script)

Tout comme les objets réels, les objets d’automation OLE de SPSS ont des attributset des utilisations. Dans le vocabulaire de programmation, les attributs sont appelésdes propriétés et les utilisations des méthodes. Chaque classe d’objets dispose depropriétés et de méthodes spécifiques qui déterminent ce que vous pouvez en faire.

Objet Propriété Méthode

Crayon (réalité) Dureté(couleur)

EcrireEcraser

Tableau pivotant(SPSS)

TextFontDataCellWidthsCaptionText

SelectTableClearSelectionHideFootnotes

Exemple : Utilisation des propriétés (Script)

Les propriétés définissent ou renvoient aux attributs de l’objet, tels que la couleur oula largeur de cellule. Lorsqu’une propriété apparaît à gauche du signe égal, vousécrivez dessus. Par exemple, pour attribuer la légende “ Résultats d'Anita “ àun tableau pivotant activé (objPivotTable) :

objPivotTable.CaptionText = "Résultats d'Anita"

Lorsqu’une propriété apparaît sur la droite, vous lisez depuis cette propriété. Parexemple, pour définir la légende d’un tableau pivotant et l’enregistrer sous formede variable :

strFontName = objPivotTable.CaptionText

Exemple : Utilisation des méthodes (Script)

Les méthodes opèrent des actions sur les objets, telles que la sélection de tous leséléments dans un tableau :

objPivotTable.SelectTable

Page 753: SPSS Base Users Guide 14.0

727

Utilitaire de script SPSS

ou l’annulation d’une sélection :

objPivotTable.ClearSelection

Certaines méthodes renvoient à un autre objet. De telles méthodes sont extrêmementimportantes pour la navigation dans la hiérarchie des objets. Par exemple, la méthodeGetDesignatedOutputDoc renvoie le document de résultat choisi, ce qui vouspermet d’accéder aux éléments de ce document de résultat :

Set objOutputDoc = objSpssApp.GetDesignatedOutputDocSet objItems = objOutputDoc.Items

Navigateur d’objets

Le navigateur d’objets affiche toutes les classes d’objets et les méthodes et propriétésqui leur sont apparentées. Vous pouvez également accéder à l’aide relativeaux différentes propriétés et méthodes, puis copier les propriétés et méthodessélectionnées pour les coller dans votre script.

Figure 47-13Navigateur d’objets

Page 754: SPSS Base Users Guide 14.0

728

Chapitre 47

Utilisation du navigateur d’objets

E A partir du menu de la fenêtre de script, sélectionnez :Mettre au point

Parcourir les objets

E Sélectionnez une classe d’objets dans la liste Data Type (type de données) afind’afficher les méthodes et propriétés de cette classe.

E Sélectionnez les Methods/Properties (propriétés et méthodes) pour accéder à l’Aidecontextuelle ou les coller dans votre script.

Nouvelle procédure (Script)

Une procédure est une séquence libellée d’instructions exécutées comme unensemble. L’organisation des codes dans les procédures facilite la gestion et laréutilisation des différentes portions de code. Les scripts doivent contenir au moinsune procédure (Sous-routine principale). Ils en contiennent souvent plusieurs. Laprocédure principale peut à son tour contenir plusieurs instructions et des appels àd’autres sous-routines qui effectuent le plus gros de la tâche.

Figure 47-14Boîte de dialogue Nouvelle procédure

Les procédures sont soit des sous-routines, soit des fonctions. Une procédurecommence par une instruction qui spécifie le type de la procédure et son nom(par exemple, Sub Main ou Function DialogMonitor( )) et se termine parl’instruction de fin appropriée (End Sub ou End Function).

Lorsque vous faites défiler la fenêtre du script, le nom de la procédure actives’affiche en haut de la fenêtre. Dans un script, vous pouvez appeler n’importe quelleprocédure autant de fois que vous le souhaitez. Vous pouvez également appeler

Page 755: SPSS Base Users Guide 14.0

729

Utilitaire de script SPSS

n’importe quelle procédure dans le fichier général des scripts, ce qui permet departager les procédures sur plusieurs scripts.

Ajout d’une nouvelle procédure à un script

E A partir des menus, sélectionnez :Script

Nouvelle procédure

E Saisissez un nom pour la procédure.

E Sélectionnez Sous-routine ou Fonction.

Vous pouvez également créer une nouvelle procédure. Pour cela, entrez lesinstructions qui définissent la procédure directement dans le script.

Procédures générales (script)

Si vous souhaitez utiliser une procédure ou une fonction dans plusieurs scripts, vouspouvez l’ajouter au fichier général des scripts. Les procédures du fichier général desscripts peuvent être appelées par d’autres scripts.

Page 756: SPSS Base Users Guide 14.0

730

Chapitre 47

Figure 47-15Fichier général des scripts

Le fichier général des scripts par défaut est global.sbs. Vous pouvez ajouter librementdes procédures à ce fichier. Vous pouvez également spécifier un autre fichier généraldes scripts dans l’onglet Scripts de la boîte de dialogue Options (menu Edition), maisun seul fichier à la fois peut être actif en tant que fichier général. Cela signifie quesi vous créez et activez un nouveau fichier général, les procédures et les fonctionsde global.sbs ne sont plus disponibles.

Vous pouvez consulter le fichier général dans n’importe quelle fenêtre de script(cliquez sur l’onglet n°2 à droite de la fenêtre, sous la barre d’outils), mais vous nepouvez effectuer de modifications que dans une seule fenêtre à la fois.

Page 757: SPSS Base Users Guide 14.0

731

Utilitaire de script SPSS

Les procédures générales doivent être appelées par les autres procédures de script.Vous ne pouvez pas exécuter un script général directement depuis le menu Outilsou une fenêtre de script.

Ajout d’une description à un script

Vous pouvez ajouter une description à afficher dans les boîtes de dialogue Exécuterle script et Utiliser l’Assistant script. Ajoutez simplement un commentairesur la première ligne du script. Ce commentaire doit commencer par BeginDescription, suivi du commentaire souhaité (une ou plusieurs lignes), et s’acheverpar End Description. Par exemple :

'Begin Description'Ce script change "Sig." en "p=" dans les étiquettes de colonne d'un tableau pivotant.'Requirement: Le tableau pivotant à modifier doit être sélectionné.'End Description

La description doit être mise en forme comme un commentaire (chaque lignecommençant par une apostrophe).

Boîtes de dialogue de script personnalisées

La mise en oeuvre d’une boîte de dialogue personnalisée se déroule en deux étapes: Créez d’abord la boîte de dialogue à l’aide de l’éditeur de boîte de dialogue,puis créez une fonction de surveillance de la boîte de dialogue (DialogFunc) quisurveille la boîte de dialogue et définit son comportement.

La boîte de dialogue est définie par un bloc Begin Dialog...End Dialog.Il n’est pas nécessaire d’entrer le code directement. L’éditeur de Boîte de Dialoguefournit une interface graphique conviviale permettant de définir la boîte de dialogue.

Page 758: SPSS Base Users Guide 14.0

732

Chapitre 47

Figure 47-16Créer une boîte de dialogue à l’aide de l’éditeur de Boîte de Dialogue

L’éditeur affiche au départ une boîte de dialogue vierge. Vous pouvez ajouter descommandes comme, par exemple, des boutons radio et des cases à cocher. Il faut,pour cela, sélectionner l’outil approprié et le faire glisser avec la souris. (Placezla souris sur chaque outil pour obtenir une description.) Vous pouvez égalementfaire glisser les côtés et les coins de la boîte de dialogue afin de la redimensionner.Après avoir ajouté un contrôle, cliquez le bouton droit de la souris pour définir lespropriétés de ce contrôle.

Fonction de surveillance de la boîte de dialogue. Pour créer la fonction de surveillancede la boîte de dialogue, cliquez avec le bouton droit de la souris sur la boîte dedialogue (assurez-vous qu’aucun contrôle n’est sélectionné) et entrez un nom pourla fonction dans le champ Dialog Function (fonction dialogue). Les instructionsqui définissent la fonction sont ajoutées au script, même si vous devez modifiermanuellement la fonction pour définir le comportement de chaque action.

Une fois que vous avez fini, cliquez sur le bouton Enregistrer et quitter, situé àl’extrême droite de la barre d’outils) pour insérer le code de la boîte de dialoguedans votre script.

Création d’une boîte de dialogue personnalisée

E Dans la fenêtre de script, cliquez sur le curseur dans le script à l’endroit où voussouhaitez insérer le code de la boîte de dialogue.

Page 759: SPSS Base Users Guide 14.0

733

Utilitaire de script SPSS

E A partir des menus, sélectionnez :Script

Editeur de boîte de dialogue

E Sélectionnez les outils dans la palette et faites-les glisser dans la nouvelle boîte dedialogue afin d’ajouter des contrôles, tels que boutons ou cases à cocher.

E Redimensionnez la boîte de dialogue en faisant glisser les côtés et les coins.

E Cliquez avec le bouton droit de la souris sur la forme (aucun contrôle sélectionné)et saisissez un nom pour la fonction de surveillance de la boîte de dialogue dans lechamp Dialog Function (fonction dialogue).

E Une fois que vous avez fini, cliquez sur le bouton Enregistrer et quitter situé àl’extrême droite de la barre d’outils.

Vous devez modifier manuellement cette fonction pour définir le comportement de laboîte de dialogue.

Fonctions de surveillance des boîtes de dialogue (Script)

Une fonction de surveillance de la boîte de dialogue définit le comportement d’uneboîte de dialogue pour chacun des cas spécifiés. La fonction prend la forme (générale)suivante :

Function DialogFunc(strDlgItem as String, intAction as Integer, intSuppValue as Integer)Select Case intAction

Case 1 ' initialisation de boîte de dialogue... 'instructions à exécuter lorsque la boîte de dialogue est initialiséeCase 2 'changement de valeur ou sélection de bouton... 'instructions...

Case 3 ' Texte de zone de texte ou de zone de liste déroulante modifié...Case 4 ' focus modifié...Case 5 ' veille...

End SelectEnd Function

Page 760: SPSS Base Users Guide 14.0

734

Chapitre 47

Paramètres. La fonction doit être capable de supporter trois paramètres : une chaîne(strDlgItem) et deux entiers (intAction et intSuppValue). Les paramètressont des valeurs admises entre la fonction et la boîte de dialogue, en fonction del’action entreprise.

Par exemple, lorsqu’un utilisateur clique sur un contrôle dans la boîte de dialogue,le nom du contrôle passe à la fonction en tant que strDlgItem (le nom du champest spécifié dans la définition de la boîte de dialogue). Le second paramètre(intAction) est une valeur numérique qui indique l’action entreprise dans laboîte de dialogue. Le dernier paramètre est utilisé pour fournir des informationscomplémentaires dans certains cas. Vous devez ajouter les trois paramètres dans ladéfinition de la fonction, même s’ils ne servent pas tous.

Sélectionnez Case intAction. La valeur de intAction indique l’action entreprise dansla boîte de dialogue. Par exemple, l’initialisation de la boîte de dialogue correspond àintAction = 1. Si l’utilisateur clique sur un bouton, intAction prend la valeur2, etc. Il y a cinq actions possibles, et vous pouvez spécifier les instructions quis’exécutent pour chaque action, comme illustré ci-dessous. Il n’est pas nécessaire despécifier les 5 cas possibles, mais uniquement ceux qui s’appliquent. Par exemple, sivous ne souhaitez pas d’instructions exécutant l’initialisation, écartez le cas 1.

Cas intAction = 1. Spécifie les instructions à exécuter lors de l’initialisation de laboîte de dialogue. Par exemple, vous pouvez désactiver un ou plusieurs contrôlesou ajouter un son. La chaîne strDlgItem est une chaîne vide ; intSuppValueest égale à 0.

Cas 2. S’exécute lorsqu’un bouton est enfoncé ou lorsqu’une valeur change dansun contrôle CheckBox, DropListBox, ListBox ou OptionGroup. Si unbouton est enfoncé, strDlgItem représente le bouton, intSuppValue est sansvaleur, et vous devez définir DialogFunc = Vrai pour empêcher la fermeturede la boîte de dialogue. Si une valeur change, strDlgItem est l’élément dont lavaleur change, et intSuppValue représente la nouvelle valeur.

Cas 3. S’exécute lorsqu’une valeur change dans un contrôle TextBox ouComboBox. La chaîne strDlgItem représente le contrôle dont le texte a changéet qui perd le focus. intSuppValue représente le nombre de caractères.

Page 761: SPSS Base Users Guide 14.0

735

Utilitaire de script SPSS

Cas 4. S’exécute lorsque le focus change dans la boîte de dialogue. La chaînestrDlgItem représente l’élément qui reprend le focus et intSuppValue celuiqui le perd (le premier élément est 0, le second 1, etc.).

Cas 5. Traitement restant. La chaîne strDlgItem est une chaîne vide ;intSuppValueest égale à 0. Définissez DialogFunc = Vrai afin decontinuer à recevoir les actions restantes.

Pour plus d’informations, reportez-vous aux exemples et au prototype DialogFuncdans le fichier d’aide du langage Sax BASIC.

Exemple : Script d’une boîte de dialogue simple

Ce script crée une boîte de dialogue simple qui ouvre un fichier de données.Reportez-vous aux sections apparentées pour obtenir des explications sur lasous-routine BuildDialog et sur la fonction de surveillance de la boîte de dialogue.

Figure 47-17Boîte de dialogue Ouvrir fichier, créée par un script

Sub MainCall BuildDialog

End Sub

'définir boîte de dialogueSub BuildDialog

Begin Dialog UserDialog 580,70,"Ouverture du fichier de données",.DialogFunc

Text 40,7,280,21,"Fichier de données à ouvrir :",.txtDialogTitleTextBox 40,28,340,21,.txtFilenameOKButton 470,7,100,21,.cmdOKCancelButton 470,35,100,21,.cmdCancel

End DialogDim dlg As UserDialog

Page 762: SPSS Base Users Guide 14.0

736

Chapitre 47

Dialog dlgEnd Sub

'définir la fonction qui détermine le comportement de la boîte de dialogue FunctionDialogFunc(strDlgItem As String, intAction As Integer, intSuppValue As Integer) As Boolean

Select Case intActionCase 1' son lors de l'initialisation de la boîte de dialogue

BeepCase 2' changement de valeur ou sélection de bouton Select

Case strDlgItemCase "cmdOK"'si l'utilisateur clique sur OK, ouvre le fichier de données

correspondant au nom spécifiéstrFilename = DlgText("txtFilename")Call OpenDataFile(strFilename)DialogFunc = FalseCase "cmdCancel"'si l'utilisateur clique sur Annuler, ferme la boîte de dialogueDialogFunc = FalseEnd Select

End SelectEnd Function

Sub OpenDataFile(strFilename As Variant)'Ouvre le fichier de données correspondant aunom spécifiéDim objDataDoc As ISpssDataDocSet objDataDoc = objSpssApp.OpenDataDoc(strFilename)End Sub

Ces exemples sont également accessibles dans l’aide en ligne. Vous pouvez testerces exemples vous-même. Pour cela, copiez le code de la fenêtre d’aide et collez-ledans la fenêtre de script.

Mise au point des scripts

Le menu Mettre au point vous permet d’effectuer une exécution pas à pas ducode(Avancer d’un pas), d’exécuter une ligne ou une sous-routine à la fois et devisualiser le résultat. Vous pouvez également insérer un point d’arrêt dans le scriptafin de faire une pause dans l’exécution à la ligne qui contient ce point d’arrêt.

Pour mettre au point un autoscript, ouvrez-le dans une fenêtre de script, insérez despoints d’arrêt dans la procédure que vous souhaitez mettre au point puis exécutez laprocédure statistique qui déclenche l’autoscript.

Page 763: SPSS Base Users Guide 14.0

737

Utilitaire de script SPSS

Avancer d’un pas. Exécute la ligne active. Si la ligne active renvoie à une sous-routineou à une fonction, l’exécution s’arrête à la première ligne de cette sous-routine oufonction.

Sauter un pas. Exécute la ligne suivante. Si la ligne active renvoie à une sous-routineou à une fonction, exécute la sous-routine ou fonction dans la totalité.

Revenir d’un pas. Recule d’un pas dans la sous-routine ou dans la fonction appelée.

Avancer jusqu’au curseur. Exécute jusqu’à la ligne active.

Activer/désactiver Séparer. Insère ou retire un point d’arrêt. L’exécution du script estsuspendue au point d’arrêt et le volet de mise au point s’affiche.

Espion Express. Affiche la valeur de l’expression active.

Ajouter Espion. Ajoute l’expression active à la fenêtre espion.

Parcourir les objets.... Affiche le navigateur des objets.

Définir relation suivante. Définit l’instruction suivante à exécuter. Seules lesinstructions de la sous-routine/fonction peuvent être sélectionnées.

Montrer relation suivante. Affiche l’instruction suivante à exécuter.

Exécution d’un script pas à pas

E Dans le menu Mettre au point, sélectionnez l’une des options pour exécuter le code,une ligne ou une sous-routine à la fois.

Les onglets Immediate (immédiat), Watch (espion), Stack (pile) et Loaded (chargé)sont affichés dans la fenêtre de script, de même que la barre d’outils de mise au point.

E Utilisez la barre d’outils (ou les touches de raccourci) pour continuer l’exécutionpas à pas du script.

E Vous pouvez également sélectionner Activer/désactiver Séparer pour insérer un pointd’arrêt dans la ligne active.

L’exécution du script est suspendue au point d’arrêt.

Page 764: SPSS Base Users Guide 14.0

738

Chapitre 47

Volet de mise au point (Script)

Lorsque vous exécutez le code pas à pas (Avancer d’un pas), les onglets Immediate(immédiat), Watch (espion), Stack (pile) et Loaded (chargé) sont affichés.

Figure 47-18Volet de mise au point affiché dans la fenêtre de script

Onglet Immediate (immédiat). Cliquez sur le nom de n’importe quelle variablepuis sur le bouton Loupe pour afficher la valeur courante de la variable. Vouspouvez également évaluer une expression, attribuer une variable ou un appel à unesous-routine.

Entrez ?expr, puis appuyez sur Entrée pour afficher la valeur de expr.

Tapez var = expr, puis appuyez sur Entrée pour modifier la valeur de var.

Page 765: SPSS Base Users Guide 14.0

739

Utilitaire de script SPSS

Entrez subname args, puis appuyez sur Entrée pour appeler une sous-routine ouune instruction intégrée.

Entrez Trace, puis appuyez sur Entrée pour passer au mode trace. Le mode Tracepermet d’imprimer chaque instruction dans la fenêtre immédiate lorsque le scriptest exécuté.

Onglet Watch (espion). Pour afficher une variable, fonction ou expression, cliquez surcet élément et sélectionnez Ajouter Espion dans le menu Mettre au point. Les valeursaffichées sont mises à jour à chaque fois que l’exécution est suspendue. Vous pouvezmodifier l’expression à gauche de ->. Cliquez sur Entrée pour mettre immédiatementà jour toutes les valeurs. Cliquez sur Ctrl-Y pour supprimer la ligne.

Onglet Stack (pile). Affiche les lignes qui ont renvoyé à l’instruction active. Lapremière ligne est l’instruction active, la seconde ligne est celle appelée en premier,etc. Cliquez sur n’importe quelle ligne pour mettre en surbrillance cette ligne dans lafenêtre de modification.

Onglet Loaded (chargé). Présente la liste des scripts actifs. Cliquez sur une ligne pourvisualiser ce script.

Fichiers de script et de syntaxe

Les fichiers de syntaxe (*.sps) ne sont pas les mêmes que les fichiers de script(*.sbs). Les fichiers de syntaxe possèdent des commandes écrites dans le langagede commande qui vous permet d’exécuter les procédures statistiques et lestransformations de données. Alors que les scripts vous permettent de manipulerle résultat et d’automatiser les autres tâches que vous effectueriez normalementà l’aide de l’interface graphique des menus et des boîtes de dialogue, le langagede commande propose une méthode de communication directe différente avecl’arrière-plan du programme, la partie du système qui effectue les calculs statistiqueset les transformations de données).

Vous pouvez associer les fichiers de script et de syntaxe pour plus de flexibilité.Pour cela, exécutez un script à partir de la syntaxe de commande SPSS ou intégrez lasyntaxe de commande dans un script.

Page 766: SPSS Base Users Guide 14.0

740

Chapitre 47

Exécution d’une syntaxe de commande à partir d’un script

Vous pouvez exécuter une syntaxe de commande à partir d’un script d’automation àl’aide de la méthode ExecuteCommands. La syntaxe de commande vous permetd’exécuter les transformations de données et les procédures statistiques et deproduire des diagrammes. La majeure partie de cette fonctionnalité ne peut pas êtreautomatisée directement à partir des scripts de commande.

La méthode la plus simple pour construire un fichier de syntaxe de commandeconsiste à effectuer des sélections dans les boîtes de dialogue et à coller la syntaxe deces sélections dans la fenêtre de script.

Figure 47-19Coller une syntaxe de commande dans un script

Page 767: SPSS Base Users Guide 14.0

741

Utilitaire de script SPSS

Lorsque vous ouvrez une boîte de dialogue à l’aide du menu de la fenêtre de script,le bouton Coller permet de coller tous les codes nécessaires à l’exécution descommandes à partir d’un script.

Remarque : vous devez utiliser les menus de la fenêtre de script pour ouvrir les boîtesde dialogue. Sinon, les commandes sont collées dans la fenêtre de syntaxe, et nonpas dans celle des scripts.

Pour coller une syntaxe de commande dans un script

E A partir des menus de la fenêtre de script, sélectionnez les commandes des menusStatistiques, Diagrammes et Outils pour ouvrir les boîtes de dialogue.

E Effectuez des sélections dans la boîte de dialogue.

E Cliquez sur Coller.

Remarque : vous devez utiliser les menus de la fenêtre de script pour ouvrir les boîtesde dialogue. Sinon, les commandes sont collées dans la fenêtre de syntaxe, et nonpas dans celle des scripts.

Exécution d’un script depuis la syntaxe de commande

Vous pouvez utiliser la commande SCRIPT pour exécuter un script à partir d’unesyntaxe de commande. Indiquez le nom du script que vous souhaitez exécuter, ce nomde fichier étant entre guillemets, comme dans l’exemple suivant :

SCRIPT 'C:\PROGRAM FILES\SPSS\CLEAN NAVIGATOR.SBS'.

Pour obtenir des renseignements complets sur la syntaxe, reportez-vous au manuelSPSS Command Syntax Reference.

Page 768: SPSS Base Users Guide 14.0
Page 769: SPSS Base Users Guide 14.0

Chapitre

48Système de gestion des résultats

Le système de gestion des résultats (OMS - Output Management System) permetd’écrire automatiquement des modalités de résultats données dans des fichiers derésultats différents et de sélectionner différents formats. Les différents formats sontles suivants :

Format des fichiers de données SPSS (.sav). Les résultats qui sont affichés dans lestableaux pivotants du Viewer peuvent être écrits dans un fichier de données SPSS.Ils peuvent ainsi être utilisés en tant qu’entrées pour les commandes suivantes.

XML. Vous pouvez écrire des tableaux, des résultats texte et de nombreuxgraphiques au format XML.

HTML. Vous pouvez écrire des tableaux et des résultats texte au format HTML.Les diagrammes standard (non interactifs) et les diagrammes de modèle d’arbre(option Arbre de segmentation) peuvent être inclus comme fichiers image. Lesfichiers image sont enregistrés dans un sous-répertoire (dossier) distinct.

Texte. Vous pouvez écrire des tableaux et des résultats texte sous forme de texteséparé par des tabulations ou des espaces.

Pour utiliser le panneau de configuration du système de gestion des résultats

E A partir des menus, sélectionnez :Outils

Panneau de configuration du système de gestion des résultats...

743

Page 770: SPSS Base Users Guide 14.0

744

Chapitre 48

Figure 48-1Panneau de configuration du système de gestion des résultats

Vous pouvez utiliser le panneau de configuration pour démarrer et arrêterl’acheminement des résultats vers différentes destinations.

Chaque requête OMS reste active jusqu’à ce qu’elle soit interrompueexplicitement ou jusqu’à la fin de la session.

Un fichier de destination spécifié dans une requête OMS est indisponible pour lesautres procédures SPSS et les autres applications jusqu’à la fin de la requête.

Lorsqu’une requête OMS est active, les fichiers de destination spécifiés sontstockés en mémoire (RAM). Les requêtes OMS actives qui écrivent une grandequantité de résultats dans des fichiers externes risquent donc de consommerbeaucoup de mémoire.

Plusieurs requêtes OMS sont indépendantes les unes des autres. Les mêmesrésultats peuvent être acheminés vers différents emplacements dans plusieursformats en fonction des spécifications des différentes requêtes OMS.

Page 771: SPSS Base Users Guide 14.0

745

Système de gestion des résultats

L’ordre des objets de sortie dans une destination particulière est l’ordre danslequel ils ont été créés, déterminé par l’ordre et l’exécution des procédures àl’origine des résultats.

Le système OMS ne peut pas acheminer des diagrammes ou des objetsAvertissements créés par des procédures de diagrammes interactifs (menuGraphes, sous-menu Interactif) ou des cartes créées par les procédures decartographie (menu Graphes, sous-menu Cartes).

Pour ajouter de nouvelles requêtes OMS

E Sélectionnez les types de résultat (tableaux, diagrammes, etc.) à inclure. (Pour plusd'informations, reportez-vous à « Types d’objet de sortie » à p. 747.)

E Sélectionnez les commandes à inclure. Si vous souhaitez inclure tous les résultats,sélectionnez tous les éléments de la liste. (Pour plus d'informations, reportez-vous à «Identificateurs de commande et sous-types de tableau » à p. 749.)

E Pour les commandes qui produisent des résultats sous forme de tableaux pivotants,sélectionnez les types de tableau spécifiques à inclure.

La liste affiche uniquement les tableaux disponibles dans les commandessélectionnées ; tout type de tableau disponible dans une ou plusieurs des commandessélectionnées apparaît dans la liste. Si aucune commande n’est sélectionnée, tousles types de tableau sont affichés. (Pour plus d'informations, reportez-vous à «Identificateurs de commande et sous-types de tableau » à p. 749.)

E Pour sélectionner des tableaux en fonction des étiquettes et non des sous-types, cliquezsur Etiquettes. (Pour plus d'informations, reportez-vous à « Etiquettes » à p. 751.)

E Cliquez sur Options pour spécifier le format des résultats (par exemple, fichier dedonnées SPSS, XML, HTML). (Par défaut, le format XML de sortie est utilisé. Pourplus d'informations, reportez-vous à « Options OMS » à p. 752.)

E Spécifiez une destination pour les résultats :

Fichier. Tous les résultats sélectionnés sont acheminés dans un fichier unique.

Page 772: SPSS Base Users Guide 14.0

746

Chapitre 48

Basés sur les noms des objets. Le résultat est acheminé vers plusieurs fichiers dedestination basés sur des noms d’objet. Un fichier séparé est créé pour chaqueobjet de résultat, avec un nom de fichier basé sur les noms des sous-type detableau ou sur les étiquettes des tableaux. Entrez le nom du dossier de destination.

Nouvel ensemble de données. Pour les résultats au format de fichier de donnéesSPSS, vous pouvez les acheminer vers un ensemble de données. L’ensemble dedonnées est disponible pour utilisation ultérieure dans la même session maisn’est pas enregistré en tant que fichier sauf si vous le faites explicitement avantla fin de la session. Cette option est disponible uniquement pour les résultatsau format de fichier de données SPSS. Les noms des ensembles de donnéesdoivent être conformes aux règles de dénomination de variables SPSS. Pour plusd'informations, reportez-vous à « Noms de variable » dans Chapitre 5 à p. 99.

E Eventuellement :

Exclure les résultats sélectionnés du Viewer. Si vous sélectionnez Exclure del’Editeur de résultats, les types de résultat de la requête OMS n’apparaîtront pasdans la fenêtre de l’Editeur de résultats. Si plusieurs requêtes OMS activescomprennent les mêmes types de résultat, l’affichage de ces types de résultatdans le Viewer est déterminé par la requête OMS la plus récente qui les contient.Pour plus d'informations, reportez-vous à « Exclusion de l’affichage des résultatsdu Viewer » à p. 758.

Affecter une chaîne d’ID à la requête. Toutes les requêtes se voientautomatiquement attribuer une valeur d’ID et vous pouvez remplacer la chaîned’ID par défaut par un ID descriptif. Cela peut être utile si vous disposez deplusieurs requêtes actives que vous souhaitez identifier facilement. Les valeursd’ID que vous affectez ne peuvent pas commencer par le signe dollar ($).

Voici quelques astuces pour sélectionner plusieurs éléments dans une liste :

Pour sélectionner tous les éléments d’une liste, appuyez sur les touches Ctrl-Adu clavier.

Pour sélectionner plusieurs éléments contigus, cliquez dessus tout en maintenantla touche Maj enfoncée.

Pour sélectionner plusieurs éléments non contigus, cliquez dessus tout enmaintenant la touche Ctrl enfoncée.

Page 773: SPSS Base Users Guide 14.0

747

Système de gestion des résultats

Pour interrompre des requêtes OMS ou pour les supprimer

Les nouvelles requêtes OMS et les requêtes OMS actives sont affichées dans la listeRequêtes, la plus récente apparaissant en première position. Vous pouvez modifierla largeur des colonnes d’information en faisant glisser les bordures et vous pouvezparcourir la liste horizontalement pour voir davantage d’informations sur une requêteparticulière.

La présence d’un astérisque (*) après le terme Actif dans la colonne Etat signale unerequête OMS créée avec une syntaxe de commande comprenant des fonctions nondisponibles dans le panneau de configuration.

Pour interrompre une requête OMS active spécifique :

E Dans la liste requêtes, cliquez sur n’importe quelle cellule dans la ligne de la requête.

E Cliquez sur Fin.

Pour interrompre toutes les requêtes OMS actives :

E Cliquez sur Tout terminer.

Pour supprimer une nouvelle requête (une requête ajoutée mais pas encore active) :

E Dans la liste requêtes, cliquez sur la cellule d’une ligne pour la requête.

E Cliquez sur Supprimer.

Remarque : Les requêtes OMS actives ne sont interrompues que lorsque vous cliquezsur OK.

Types d’objet de sortieIl existe sept types d’objet de sortie :

Diagrammes. Diagrammes (à l’exception des diagrammes interactifs et des cartes).Les objets Diagramme sont inclus uniquement avec les formats de destinationXML et HTML. Pour le format HTML, les fichiers image sont enregistrés dans unsous-répertoire (dossier) distinct.

Journaux. Objets Texte Journal. Les objets Journal contiennent certains types demessage d’erreur et d’avertissement. Selon vos paramètres Options (menu Edition,Options, onglet Editeur de résultats), les objets Journal peuvent également contenir la

Page 774: SPSS Base Users Guide 14.0

748

Chapitre 48

syntaxe de commande exécutée pendant la session. Les objets Journal sont intitulésJournal dans le panneau de légende du Viewer.

Tables. Objets Résultats qui se présentent sous forme de tableaux pivotants dansl’Editeur de résultats (y compris les tableaux Notes). Les tableaux sont les seuls objetsde sortie qui peuvent être acheminés au format de fichier de données SPSS (sav).

Texte. Objets Texte qui ne sont pas des journaux ou en-têtes (y compris les objetsétiquetés Résultats texte dans le panneau de légende de l’Editeur de résultats).

Arbres. Diagrammes de modèle d’arbre produits par l’option Arbre de segmentation.Les objets Arbre sont inclus uniquement avec les formats de destination XML etHTML.

En-têtes. Objets Texte intitulés Titre dans le panneau de légende de l’Editeur derésultats. Pour le format XML de sortie, les objets Texte d’en-tête ne sont pas inclus.

Avertissements. Objets Avertissements. Les objets Avertissements contiennentcertains types de message d’erreur et d’avertissement.

Page 775: SPSS Base Users Guide 14.0

749

Système de gestion des résultats

Figure 48-2Types d’objet de sortie

Identificateurs de commande et sous-types de tableau

Identificateurs de commande

Les identificateurs de commande sont disponibles pour toutes les procéduresstatistiques et de création de diagrammes, et toute autre commande qui produit desblocs de résultat dotés de leur propre en-tête identifiable dans le panneau de légende

Page 776: SPSS Base Users Guide 14.0

750

Chapitre 48

du Viewer. Ces identificateurs sont généralement (mais pas systématiquement)identiques ou similaires aux noms de procédure figurant dans les menus et les titresde boîte de dialogue, qui sont souvent (mais pas toujours) similaires aux noms decommandes SPSS sous-jacentes. Par exemple, l’identificateur de commande de laprocédure Fréquences est « Fréquences » et c’est aussi le nom de la commandesous-jacente.

Toutefois, dans certains cas, le nom de la procédure, l’identificateur de commandeet/ou le nom de la commande ne sont pas tous similaires. Par exemple, toutes lesprocédures dans le sous-menu Tests non paramétriques (à partir du menu Analyse)utilisent la même commande sous-jacente et l’identificateur de commande estidentique au nom de cette commande : Npar Tests.

Sous-types de tableau

Les sous-types sont les différents types de tableau pivotant qui peuvent être générés.Certains sous-types sont produits par une seule commande, d’autres peuvent êtreproduits par plusieurs commandes (bien que les tableaux risquent de ne pas seressembler). Les noms des sous-types de tableau sont généralement assez descriptifs.Toutefois, leur nombre peut être assez élevé (notamment si vous avez sélectionnéun grand nombre de commandes) et/ou deux sous-types peuvent avoir des nomstrès proches.

Recherche d’identificateurs de commande et de sous-types de tableau

Si vous avez un doute, vous pouvez rechercher des identificateurs de commande etdes noms de sous-type de tableau dans la fenêtre du Viewer :

E Exécutez la procédure pour générer des résultats dans le Viewer.

E Cliquez avec le bouton droit de la souris sur l’item dans le panneau de légende del’Editeur de résultats.

E Sélectionnez Copier l’identificateur de commande OMS ou Copier le sous-type de table

OMS.

E Collez l’identificateur de commande ou le nom de sous-type de tableau copié dans unéditeur de texte (comme une fenêtre de syntaxe SPSS, par exemple).

Page 777: SPSS Base Users Guide 14.0

751

Système de gestion des résultats

Etiquettes

Alternative aux noms de sous-type de tableau, vous pouvez sélectionner des tableauxsur la base du texte affiché dans le panneau de légende de l’Editeur de résultats. Vouspouvez également sélectionner d’autres types d’objets en fonction de leur étiquette.Vous pouvez utiliser des étiquettes pour différencier des tableaux de même type danslesquels le texte de la légende reflète un attribut de l’objet de sortie particulier (parexemple, les noms de variable ou les étiquettes). Cependant, il existe un certainnombre de facteurs qui peuvent avoir une incidence sur le texte de l’étiquette :

Si le traitement du fichier scindé est activé, l’identification des classes de fichiersscindés peut être ajoutée à l’étiquette.

Les étiquettes qui comprennent des informations sur les variables ou les valeurssont affectées par le paramétrage des options des étiquettes de résultat (menuEdition, Options, onglet Etiquettes Résultats).

Les étiquettes sont affectées par le paramètre lié à la langue des résultats (menuModifier, Options, onglet Général).

Pour spécifier les étiquettes à utiliser pour identifier les objets Résultat

E Dans le panneau de configuration du système de gestion de résultats, sélectionnez unou plusieurs types de résultats, puis une ou plusieurs commandes.

E Cliquez sur Etiquettes.

Page 778: SPSS Base Users Guide 14.0

752

Chapitre 48

Figure 48-3Boîte de dialogue Etiquettes OMS

E Entrez l’étiquette exactement telle qu’elle apparaît dans le panneau de légende de lafenêtre de l’Editeur de résultats. Vous pouvez également cliquer avec le bouton droitde la souris sur l’item dans la légende, sélectionner Copier l’étiquette OMS et collerl’étiquette copiée dans le champ de texte Etiquette.

E Cliquez sur Ajouter.

E Répétez l’opération pour chaque étiquette à inclure.

E Cliquez sur Continuer.

Caractères génériques

Vous pouvez utiliser l’astérisque (*) comme dernier caractère de la chaîne d’étiquette.Toutes les étiquettes qui commencent par la chaîne spécifiée (astérisque exclu) serontsélectionnées. Cette opération fonctionne uniquement lorsque l’astérisque est ledernier caractère, car les astérisques peuvent apparaître comme des caractères validesdans une étiquette.

Options OMSVous pouvez utiliser la boîte de dialogue Options OMS pour :

Spécifier le format des résultats.

Page 779: SPSS Base Users Guide 14.0

753

Système de gestion des résultats

Inclure ou exclure les résultats qui se présentent sous la forme de diagrammes oude diagrammes de modèle d’arbre, et spécifier le format des diagrammes.

Indiquer quels éléments de dimension de tableau doivent aller dans la dimensionde ligne.

Pour le format de fichier de données SPSS, inclure une variable qui identifie lenuméro de tableau séquentiel qui est la source de chaque observation.

Pour spécifier les options OMS

E Cliquez sur Options. dans le panneau de configuration du système de gestion desrésultats.

Figure 48-4Boîte de dialogue Options OMS

Format

XML de sortie. Format XML conforme au schéma de résultat SPSS. Les diagrammesstandard sont inclus dans un format XML conforme au schéma vizml. Vous pouvezégalement exporter tous les diagrammes et toutes les cartes en tant que fichiersdistincts au format de diagramme sélectionné.

Page 780: SPSS Base Users Guide 14.0

754

Chapitre 48

HTML. Les objets de sortie qui correspondraient à des tableaux pivotants dans leViewer sont convertis en tableaux HTML simples. Aucun attribut Modèle de tableaux(caractéristiques de police, styles de bordure, couleurs, etc.) n’est pris en charge.Les objets de sortie Texte portent la balise <PRE> dans le fichier HTML. Si vouschoisissez d’inclure des diagrammes, ils sont exportés en tant que fichiers distinctsau format de diagramme sélectionné et sont intégrés par référence (<IMG SRC ='nomfichier.ext'>) dans le document HTML. Les fichiers image sont enregistrés dansun sous-répertoire (dossier) distinct.

Fichier de données SPSS. Il s’agit d’un format de fichier binaire. Tous les types d’objetde sortie autres que les tableaux sont exclus. Chaque colonne d’un tableau devientune variable dans le fichier de données. Pour utiliser un fichier de données créé avecle système OMS au cours de la même session, vous devez interrompre la requêteOMS active pour pouvoir ouvrir le fichier de données. Pour plus d'informations,reportez-vous à « Acheminement des résultats vers des fichiers de données SPSS »à p. 759.

XML SVWS. Format XML utilisé par le serveur Web SmartViewer. Il s’agit en fait d’unfichier JAR/ZIP contenant des fichiers XML, CSV, etc. Le serveur Web SmartViewerest un serveur distinct.

Texte. Texte séparé par des espaces. Les résultats sont écrits au format texte, lesrésultats en tableaux étant alignés avec des espaces pour les polices à espacement fixe.Tous les diagrammes et toutes les cartes sont exclus.

Texte à onglets. Texte délimité par des tabulations. Pour les résultats affichés entant que tableaux pivotants dans l’Editeur de résultats, des tabulations délimitent leséléments de colonne des tableaux. Les lignes de bloc de texte sont écrites tellesquelles ; le système ne tente pas de les diviser avec des tabulations aux emplacementsappropriés. Tous les diagrammes et toutes les cartes sont exclus.

Images graphiques

Pour le format HTML, vous pouvez inclure des diagrammes (à l’exception desdiagrammes interactifs) et des diagrammes de modèle d’arbre en tant que fichiersimage. Un fichier image distinct est créé pour chaque diagramme et/ou arbre, et desbalises standard <IMG SRC='nomfichier' sont incluses au format HTML pour chaquefichier image.

Page 781: SPSS Base Users Guide 14.0

755

Système de gestion des résultats

Les fichiers image sont enregistrés dans un sous-répertoire (dossier) distinct. Lenom du sous-répertoire est le nom du fichier HTML de destination sans extensionet présentant le suffixe _files. Par exemple, si le fichier de destination HTML estdonnéesjuillet.htm, le sous-répertoire des images est intitulé donnéesjuillet_files.

Format. Les formats d’images disponibles sont PNG, JPG, EMF et BMP.

Taille. Vous pouvez mettre à l’échelle la taille de l’image (de 10 % à 200 %).

Pivots de tableau

Pour les résultats Tableau pivotant, vous pouvez spécifier le ou les éléments dedimension qui doivent apparaître dans les colonnes. Tous les autres éléments dedimension apparaissent dans les lignes. Pour le format de fichier de données SPSS,les colonnes du tableau deviennent des variables et les lignes, des observations.

Si vous spécifiez plusieurs éléments de dimension pour les colonnes, ils sontemboîtés dans les colonnes dans l’ordre dans lequel ils sont répertoriés. Pourle format de fichier de données SPSS, les noms de variable sont construits parles éléments de colonne emboîtés. Pour plus d'informations, reportez-vous à «Noms de variable dans les fichiers de données générés par le système de gestiondes résultats » à p. 767.

Si un tableau ne contient aucun des éléments de dimension répertoriés, tous leséléments de dimension de ce tableau apparaissent dans les lignes.

Les pivots de tableau spécifiés ici n’ont aucun effet sur les tableaux affichés dansl’Editeur de résultats.

Chaque dimension d’un tableau (ligne, colonne, strate) peut contenir aucun, un ouplusieurs éléments. Par exemple, un tableau croisé bidimensionnel simple contientun seul élément de dimension de ligne et un seul élément de dimension de colonne,chacun contenant l’une des variables utilisées dans le tableau. Vous pouvez utiliserdes arguments de position ou des « noms » d’élément de dimension pour spécifier leséléments de dimension à placer dans la dimension de colonne.

Toutes les dimensions en lignes. Créé une ligne unique pour chaque tableau. Pour lesfichiers de données au format SPSS, cela implique que chaque tableau correspond àune observation unique et tous les élements du tableau à des variables.

Page 782: SPSS Base Users Guide 14.0

756

Chapitre 48

Liste des positions. La forme générale d’un argument de position est une lettreindiquant la position par défaut de l’élément (C pour colonne, L pour ligne ou S pourstrate), suivie d’un entier positif indiquant la position par défaut au sein de cettedimension. Par exemple, L1 indique l’élément de dimension de ligne le plus externe.

Pour spécifier plusieurs éléments à partir de plusieurs dimensions, séparez lesdimensions par un espace (par exemple, R1 C2).

La lettre de dimension suivie par ALL indique tous les éléments de cettedimension dans leur ordre par défaut. Par exemple, CALL équivaut aucomportement par défaut (utilisation de tous les éléments de colonne dans leurordre par défaut pour créer des colonnes).

CALL LALL SALL (ou LALL CALL SALL, etc.) placent tous les éléments dedimension dans les colonnes. Pour le format de fichier de données SPSS, celacrée une ligne/observation par tableau dans le fichier de données.

Figure 48-5Arguments de position de ligne et de colonne

Liste des noms de dimension. Alternative aux arguments de position, vous pouvezutiliser les « noms » d’élément de dimension qui sont les étiquettes de texteapparaissant dans le tableau. Par exemple, un tableau croisé bidimensionnel simplecontient un seul élément de dimension de ligne et un seul élément de dimension decolonne, tous deux dotés d’étiquettes basées sur les variables de ces dimensions,plus un seul élément de dimension de strate intitulé Statistiques (si le français est lalangue de sortie).

Page 783: SPSS Base Users Guide 14.0

757

Système de gestion des résultats

Les noms d’élément de dimension peuvent varier en fonction de la langue desortie et/ou des paramètres qui affectent l’affichage des noms de variable et/oudes étiquettes dans les tableaux.

Chaque nom d’élément de dimension doit apparaître entre apostrophes ou entreguillemets. Pour spécifier plusieurs noms d’élément de dimension, séparez-lespar un espace.

Les étiquettes associées aux éléments de dimension ne sont peut-être pas toujoursévidentes.

Pour afficher tous les éléments de dimension et leurs étiquettes pour un tableau pivotant

E Double-cliquez sur le tableau dans le Viewer pour l’activer.

E A partir des menus, sélectionnez :Affichage

Montrer Tout

et/ou

E Si les structures pivotantes ne sont pas affichées, sélectionnez les option suivantesdans les menus :Tableau pivotant

Structure pivotante

E Déplacez le pointeur de la souris au-dessus de chaque icône dans les structurespivotantes pour afficher l’étiquette.

Page 784: SPSS Base Users Guide 14.0

758

Chapitre 48

Figure 48-6Noms d’élément de dimension affichés dans le tableau et les structures pivotantes

Journalisation

Vous pouvez enregistrer l’activité OMS dans un journal au format XML ou texte.

Le journal effectue le suivi de toutes les nouvelles requêtes OMS de la session ; iln’inclut pas les requêtes OMS déjà actives avant que vous demandiez un journal.

Le fichier journal en cours est interrompu si vous en indiquez un nouveau ou sivous désélectionnez l’option Activité du log OMS.

Pour spécifier la journalisation OMS :

E Cliquez sur Création de logs en cours dans le panneau de configuration du systèmede gestion des résultats.

Exclusion de l’affichage des résultats du Viewer

La case à cocher Exclure de l’Editeur de résultats affecte l’ensemble des résultatssélectionnés dans la requête OMS en supprimant l’affichage de ces résultats de lafenêtre de l’Editeur de résultats. Cette fonctionnalité est souvent utile pour les tâches

Page 785: SPSS Base Users Guide 14.0

759

Système de gestion des résultats

de production qui génèrent un grand nombre de résultats et si vous n’avez pas besoindes résultats sous la forme d’un document de l’Editeur de résultats (fichier .spo).Vous pouvez également l’utiliser pour supprimer l’affichage d’objets de résultatsparticuliers que vous ne souhaitez jamais voir apparaître, sans acheminer les autresrésultats vers un fichier et un format externes.

Pour supprimer l’affichage de certains objets de sortie sans acheminer les autresrésultats vers un fichier externe :

E Créez une requête OMS identifiant les résultats indésirables.

E Sélectionnez Exclure du Viewer.

E Pour la destination des résultats, sélectionnez Fichier en prenant soin de laisser videle champ Fichier.

E Cliquez sur Ajouter.

Les résultats sélectionnés sont exclus du Viewer, alors que tous les autres résultatssont affichés normalement dans le Viewer.

Acheminement des résultats vers des fichiers de donnéesSPSS

Un fichier de données SPSS est composé de variables réparties dans les colonnes etd’observations réparties dans les lignes. Les tableaux pivotants sont convertis enfichiers de données de cette manière :

Les colonnes du tableau sont les variables du fichier de données. Les noms devariable valides sont construits à partir des étiquettes de colonne.

Les étiquettes de ligne du tableau deviennent des variables portant des nomsgénériques (Var1, Var2, Var3, etc.) dans le fichier de données. Les valeurs deces variables sont les étiquettes de lignes du tableau.

Trois variables d’identificateur de tableau sont automatiquement incluses dansle fichier de données : Command_, Subtype_ et Label_. Toutes trois sont desvariables chaîne. Les deux premières variables correspondent aux identificateursde commande et de sous-type. Pour plus d'informations, reportez-vous à «

Page 786: SPSS Base Users Guide 14.0

760

Chapitre 48

Identificateurs de commande et sous-types de tableau » à p. 749. Label_ contientle texte du titre de tableau.

Les lignes du tableau deviennent des observations dans le fichier de données.

Exemple : Tableau bidimensionnel unique

Dans le cas le plus simple (un tableau bidimensionnel unique), les colonnes dutableau deviennent les variables et les lignes deviennent les observations du fichier dedonnées.

Figure 48-7Tableau bidimensionnel unique

Les trois premières variables identifient le tableau source par commande,sous-type et étiquette.

Page 787: SPSS Base Users Guide 14.0

761

Système de gestion des résultats

Les deux éléments qui définissent les lignes du tableau (valeurs de la variableSexe et Mesures statistiques) se voient affecter les noms de variable génériquesVar1 et Var2. Dans les deux cas, il s’agit de variables chaîne.

Les étiquettes de colonne du tableau sont utilisées pour créer des noms de variablevalides. En l’occurrence, ces noms de variables sont basés sur les étiquettesdes trois variables d’échelle reprises dans le tableau. Si les variables ne sontpas dotées d’étiquettes ou si vous choisissez d’afficher les noms de variables àla place des étiquettes en tant qu’étiquettes de colonnes du tableau, les noms devariables du nouveau fichier de données sont identiques à ceux du fichier dedonnées source.

Exemple : Tableaux avec strates

Outre les lignes et les colonnes, un tableau peut également contenir une troisièmedimension : la dimension de strate.

Figure 48-8Tableau avec strates

Page 788: SPSS Base Users Guide 14.0

762

Chapitre 48

Dans le tableau, la variable intitulée Classification des minorités définit les strates.Dans le fichier de données, deux variables supplémentaires sont créées : une quiidentifie l’élément de strate et une autre qui identifie les modalités de cet élément.

Comme pour les variables créées à partir des éléments de ligne, les variablescréées à partir des éléments de strate sont des variables chaîne portant des nomsgénériques (le préfixe Var suivi d’un numéro séquentiel).

Fichiers de données créés à partir de plusieurs tableaux

Lorsque plusieurs tableaux sont acheminés vers le même fichier de données, chacund’entre eux est ajouté au fichier de données selon le même principe que la fusion defichiers de données qui consiste à ajouter les observations d’un fichier de données àun autre (menu Données, Fusionner des fichiers, Ajouter des observations).

Chaque tableau suivant ajoute des observations au fichier de données.

Si les étiquettes de colonne des tableaux sont différentes, chaque tableaupeut également ajouter des variables au fichier de données, avec des valeursmanquantes pour les observations provenant des autres tableaux qui necomportent pas de colonne dotée d’une étiquette identique.

Exemple : Plusieurs tableaux avec les mêmes étiquettes de colonne

Plusieurs tableaux contenant les mêmes étiquettes de colonnes produisentgénéralement les fichiers de données les plus utiles (ils ne requièrent aucunemanipulation supplémentaire). Par exemple, au moins deux tableaux d’effectifs de laprocédure Effectifs auront des étiquettes de colonne identiques.

Page 789: SPSS Base Users Guide 14.0

763

Système de gestion des résultats

Figure 48-9Deux tableaux avec étiquettes de colonne identiques

Le deuxième tableau apporte des observations supplémentaires (lignes) au fichierde données, mais aucune nouvelle variable car les étiquettes de colonnes sontexactement identiques ; les données manquantes sont ainsi beaucoup moinsnombreuses.

Bien que les valeurs de Command_ et Subtype_ soient identiques, la valeurLabel_ identifie le tableau source de chaque groupe d’observations car les deuxtableaux d’effectifs ont des titres différents.

Exemple : Plusieurs tableaux avec différentes étiquettes de colonne

Une nouvelle variable est créée dans le fichier de données pour chaque étiquette decolonne unique des tableaux acheminés vers le fichier de données. Cette opérationgénère de nombreuses valeurs manquantes si les tableaux contiennent différentesétiquettes de colonne.

Page 790: SPSS Base Users Guide 14.0

764

Chapitre 48

Figure 48-10Deux tableaux avec étiquettes de colonne différentes

Le premier tableau comporte des colonnes intitulées Salaire d’embauche etSalaire actuel, qui ne sont pas présentes dans le deuxième tableau, d’où l’absencede valeurs pour ces variables concernant les observations issues du deuxièmetableau.

A l’inverse, le deuxième tableau comporte des colonnes intitulées Niveaud’enseignement et Ancienneté, qui ne sont pas présentes dans le premier tableau,d’où l’absence de valeurs pour ces variables concernant les observations issuesdu premier tableau.

Il est possible d’obtenir des variables non concordantes comme celles de cetexemple même avec des tableaux du même sous-type. En fait, dans cet exemple,les deux tableaux sont du même sous-type.

Page 791: SPSS Base Users Guide 14.0

765

Système de gestion des résultats

Exemple : Fichiers de données non créés à partir de plusieurs tableaux

Si certains tableaux n’ont pas le même nombre d’éléments de ligne que les autres,aucun fichier de données n’est créé. Le nombre de lignes ne doit pas nécessairementêtre identique, contrairement au nombre d’éléments de ligne qui deviennent desvariables dans le fichier de données. Par exemple, un tableau croisé à deux variableset un tableau croisé à trois variables contiennent des numéros de lignes différents, carla variable « strate » est en fait emboîtée dans la variable de ligne dans l’affichage pardéfaut du tableau croisé à trois variables.

Figure 48-11Tableaux avec nombres d’éléments de ligne différents

Contrôle des éléments de colonne pour contrôler les variables du fichierde données

Dans la boîte de dialogue Options du panneau de configuration OMS, vous pouvezdésigner les éléments de dimension qui doivent apparaître dans les colonnes et quisont donc utilisés pour créer des variables dans le fichier de données généré. Celarevient à faire pivoter le tableau dans l’Editeur de résultats.

Page 792: SPSS Base Users Guide 14.0

766

Chapitre 48

Par exemple, la procédure Fréquences produit un tableau de statistiquesdescriptives avec les statistiques sur les lignes, alors que la procédure Descriptivesgénère le même tableau avec les statistiques dans les colonnes. Pour inclure de façonsignificative les deux types de tableaux dans le même fichier de données, vous devezmodifier la dimension de colonne de l’un des deux.

Les deux types de tableaux utilisant le nom d’élément « Statistiques » pour ladimension statistique, nous pouvons placer les statistiques du tableau de statistiquesde fréquences dans les colonnes en indiquant simplement « Statistiques » (entreguillemets) dans la liste des noms de dimension de la boîte de dialogue Options OMS.

Figure 48-12Boîte de dialogue Options OMS

Page 793: SPSS Base Users Guide 14.0

767

Système de gestion des résultats

Figure 48-13Combinaison de différents types de tableau dans un fichier de données par pivotementdes éléments de dimension

Des valeurs sont manquantes dans certaines variables, car les structures des tableauxne sont toujours pas exactement identiques aux statistiques des colonnes.

Noms de variable dans les fichiers de données générés par le système degestion des résultats

Le système OMS construit des noms de variable uniques et valides à partir desétiquettes de colonne :

Des noms de variables génériques sont attribués aux éléments de ligne et de strate(le préfixe Var suivi par un numéro séquentiel).

Page 794: SPSS Base Users Guide 14.0

768

Chapitre 48

Les caractères non autorisés dans les noms de variable (comme l’espace oules parenthèses) sont supprimés. Par exemple, le nom « Cette étiquette (decolonne) » devient la variable « Cetteétiquettedecolonne ».

Si l’étiquette commence par un caractère autorisé dans les noms de variable, maispas comme premier caractère (par exemple, un chiffre), le symbole @ est insérécomme préfixe. Par exemple, « 2ème » devient la variable « @2ème ».

Les traits de soulignement et les virgules à la fin des étiquettes sont supprimésdes noms de variable obtenus. (Les traits de soulignement situés à la fin desvariables Command_, Subtype_ et Label_ générées automatiquement ne sont passupprimés.)

Si plusieurs éléments figurent dans la dimension de colonne, les noms de variablesont construits par la combinaison des étiquettes de modalité avec des traits desoulignement entre ces étiquettes. Les étiquettes de groupe ne sont pas incluses.Par exemple, si VarB est emboîté sous VarA dans les colonnes, vous obtenez desvariables de type ModA1_ModB1, et non VarA_ModA1_VarB_ModB1.

Figure 48-14Noms de variable construits à partir d’éléments de tableau

Page 795: SPSS Base Users Guide 14.0

769

Système de gestion des résultats

Structure de tableau OXML

Le format Output XML (OXML) est un format XML conforme au schéma derésultat spss. Pour obtenir une description détaillée du schéma, reportez-vous aufichier SPSSOutputXML_schema.htm situé dans le dossier help\main du dossierd’installation de SPSS.

Les identificateurs de sous-type et de commande OMS sont utilisés commevaleurs des attributs command et subType au format OXML. Voir l’exemplecomme suit :

<command text="Effectifs" command="Effectifs"...><pivotTable text="Sexe" label="Sexe" subType="Effectifs"...>

Les valeurs d’attribut command et subType OMS ne sont pas affectées par lalangue de sortie ni par les paramètres d’affichage des étiquettes/noms de variableou des valeurs/étiquettes de valeur.

Le langage XML respecte la casse. La valeur d’attribut subType « effectifs » n’estpas identique à la valeur d’attribut subType « Effectifs ».

Toutes les informations affichées dans un tableau sont contenues dans lesvaleurs d’attribut en OXML. Au niveau de chaque cellule, OXML est composéd’éléments « vides » qui contiennent des attributs mais pas de « contenu » autreque celui des valeurs d’attribut.

En OXML, la structure de tableau est représentée ligne par ligne ; les élémentsqui représentent les colonnes sont emboîtés dans les lignes et les différentescellules sont emboîtées dans les éléments de colonne :

<pivotTable...><dimension axis=’ligne’...><dimension axis=’colonne’...>

<category...><cell text=’...’ number=’...’ decimals=’...’/>

</category><category...>

<cell text=’...’ number=’...’ decimals=’...’/></category>

</dimension>

Page 796: SPSS Base Users Guide 14.0

770

Chapitre 48

</dimension>...

</pivotTable>

L’exemple précédant est une représentation simplifiée de la structure qui présente lesrelations descendant/ancêtre de ces éléments. Cependant, l’exemple ne présente pasnécessairement les relations parent/enfant car il y a généralement insertion d’autresniveaux d’éléments emboîtés.

Le schéma suivant illustre un simple tableau de fréquences et la représentationOXML complète de ce tableau.

Figure 48-15Tableau d’effectifs simple

Figure 48-16OXML pour tableau d’effectifs simple

<?xml version="1.0" encoding="UTF-8" ?><outputTreeoutputTree xmlns="http://xml.spss.com/spss/oms"

xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="http://xml.spss.com/spss/omshttp://xml.spss.com/spss/oms/spss-output-1.0.xsd"><command text="Effectifs" command="Effectifs"displayTableValues="étiquette" displayOutlineValues="étiquette"displayTableVariables="étiquette" displayOutlineVariables="étiquette"><pivotTable text="Sexe" label="Sexe" subType="Effectifs"varName="sexe" variable="vrai"><dimension axis="ligne" text="Sexe" label="Sexe"varName="sexe" variable="vrai"><group text="Valide"><group hide="vrai" text="Factice"><category text="Femme" label="Femme" string="f"varName="sexe"><dimension axis="colonne" text="Statistiques">

Page 797: SPSS Base Users Guide 14.0

771

Système de gestion des résultats

<category text="Effectif"><cell text="216" number="216"/></category><category text="Pourcentage"><cell text="45,6" number="45,569620253165" decimals="1"/></category><category text="Pourcentage valide"><cell text="45,6" number="45,569620253165" decimals="1"/></category><category text="Pourcentage cumulé"><cell text="45,6" number="45,569620253165" decimals="1"/></category></dimension>

</category><category text="Homme" label="Homme" string="h" varName="sexe"><dimension axis="colonne" text="Statistiques"><category text="Effectif"><cell text="258" number="258"/></category><category text="Pourcentage"><cell text="54,4" number="54.430379746835" decimals="1"/></category><category text="Pourcentage valide"><cell text="54,4" number="54,430379746835" decimals="1"/></category><category text="Pourcentage cumulé"><cell text="100,0" number="100" decimals="1"/></category></dimension>

</category></group><category text="Total"><dimension axis="colonne" text="Statistiques"><category text="Effectif"><cell text="474" number="474"/></category><category text="Pourcentage"><cell text="100,0" number="100" decimals="1"/></category><category text="Pourcentage valide"><cell text="100,0" number="100" decimals="1"/></category>

Page 798: SPSS Base Users Guide 14.0

772

Chapitre 48

</dimension></category></group>

</dimension></pivotTable></command>

</outputTree>

Comme vous pouvez le constater, un petit tableau simple produit une quantitéimportante de code XML. En effet, le code XML contient des informations nonapparentes dans le tableau d’origine, des informations qui ne sont peut-être même pasdisponibles dans le tableau d’origine et une certaine quantité de redondances.

Le contenu du tableau tel qu’il apparaîtrait dans un tableau pivotant dans leViewer est contenu dans les attributs de texte. Voir l’exemple comme suit :

<command text="Effectifs" command="Effectifs"...>

Les attributs de texte peuvent être affectés par la langue de sortie et par lesparamètres qui influencent l’affichage des noms/étiquettes de variable et desvaleurs/étiquettes de valeur. Dans cet exemple, la valeur d’attribut texte diffèreselon la langue de sortie, alors que la valeur d’attribut commande reste identique,quelle que soit cette langue.

Que les variables ou les valeurs des variables soient utilisées dans des étiquettesde ligne ou de colonne, le code XML contiendra un attribut text et une ouplusieurs valeurs d’attribut supplémentaires. Voir l’exemple comme suit :

<dimension axis="ligne" text="Sexe" label="Sexe" varName="sexe">...<category text="Femme" label="Femme" string="f" varName="sexe">

Page 799: SPSS Base Users Guide 14.0

773

Système de gestion des résultats

Dans le cas d’une variable numérique, l’attribut string est remplacé par l’attributnumber. L’attribut label est présent uniquement si la variable ou les valeursdisposent d’étiquettes définies.

Les éléments <cell> qui contiennent des valeurs de cellule pour les chiffrescontiendront l’attribut text et une ou plusieurs valeurs d’attribut supplémentaires.Voir l’exemple comme suit :

<cell text="45,6" number="45,569620253165" decimals="1"/>

L’attribut nombre est la valeur numérique non arrondie réelle et l’attribut décimalesindique le nombre de décimales affichées dans le tableau.

Les colonnes étant emboîtées dans les lignes, l’élément de modalité qui identifiechaque colonne est répété pour chaque ligne. Par exemple, comme les statistiquessont affichées dans les colonnes, l’élément <category text="Effectif"> apparaîttrois fois dans le code XML : une fois pour la ligne Homme, une fois pour laligne Femme et une fois pour la ligne de total.

Identificateurs OMS

La boîte de dialogue Identificateurs OMS vous aide à écrire la syntaxe de commandeOMS. Vous pouvez l’utiliser pour coller une commande et des identificateurs desous-type sélectionnés dans une fenêtre de syntaxe de commande.

Page 800: SPSS Base Users Guide 14.0

774

Chapitre 48

Figure 48-17Boîte de dialogue Identificateurs OMS

Pour utiliser la boîte de dialogue Identificateurs OMS

E A partir des menus, sélectionnez :Outils

Identificateurs OMS...

E Sélectionnez les identificateurs de commande ou de sous-type souhaités. (Poursélectionner plusieurs identificateurs dans chaque liste, utilisez la touche Ctrl.)

E Cliquez sur Coller commandes et/ou sur Coller sous-types.

La liste des sous-types disponibles dépend des commandes sélectionnées. Siplusieurs commandes sont sélectionnées, la liste des sous-types disponiblesregroupe tous les sous-types disponibles pour les commandes sélectionnées. Siaucune commande n’est sélectionnée, tous les sous-types sont répertoriés.

Les identificateurs sont collés dans la fenêtre de syntaxe de commande désignée,à l’emplacement actuel du curseur. Si aucune fenêtre de syntaxe de commanden’est ouverte, une nouvelle fenêtre de syntaxe est automatiquement ouverte.

Page 801: SPSS Base Users Guide 14.0

775

Système de gestion des résultats

Lorsqu’un identificateur de commande et/ou de sous-type est collé, il est misentre guillemets car la syntaxe de la commande OMS requiert des guillemets.

Les listes d’identificateurs des mots-clés COMMANDS et SUBTYPES doivent êtremises entre crochets. Par exemple :

/IF COMMANDS=['Tableaux croisés' 'Descriptives']SUBTYPES=['Tableau croisé' 'Statistiques descriptives']

Copie des identificateurs OMS à partir de la légende du Viewer

Vous pouvez copier et coller des identificateurs de sous-type et de commande OMS àpartir du panneau de légende de l’Editeur de résultats.

E Dans le panneau de légende, cliquez avec le bouton droit de la souris sur l’entréecorrespondant à l’item concerné.

E Sélectionnez Copier l’identificateur de commande OMS ou Copier le sous-type de table

OMS.

Cette méthode est différente de celle liée à la boîte de dialogue Identificateurs OMSpour la raison suivante : L’identificateur copié n’est pas automatiquement collé dansune fenêtre de syntaxe de commande. Il est simplement copié dans le Presse-papiers ;vous pouvez le coller à l’emplacement de votre choix. Etant donné que les valeurs desidentificateurs de commande et de sous-type sont identiques aux valeurs des attributsde commande et de sous-type correspondantes dans les résultats au format XML(OXML), cette méthode de copier/coller peut vous être utile lorsque vous écrivez destransformations XSLT.

Copie d’étiquettes OMS

Au lieu de copier des identificateurs, vous pouvez copier des étiquettes pour lesutiliser avec le mot-clé LABELS. Vous pouvez utiliser des étiquettes pour différencierdes diagrammes ou des tableaux de même type dans lesquels le texte de la légendereflète un attribut de l’objet de sortie particulier (par exemple, les noms de variables

Page 802: SPSS Base Users Guide 14.0

776

Chapitre 48

ou les étiquettes). Cependant, il existe un certain nombre de facteurs qui peuventavoir une incidence sur le texte de l’étiquette :

Si le traitement du fichier scindé est activé, l’identification des classes de fichierscindé peut être ajoutée à l’étiquette.

Les étiquettes qui comprennent des informations sur les variables ou les valeurssont affectées par les paramètres d’affichage des noms de variables/étiquettes etdes valeurs/étiquettes de valeurs dans le panneau de légende (menu Modifier,Options, onglet Etiquettes Résultats).

Les étiquettes sont affectées par le paramètre lié à la langue des résultats (menuModifier, Options, onglet Général).

Pour copier des étiquettes OMS

E Dans le panneau de légende, cliquez avec le bouton droit de la souris sur l’entréecorrespondant à l’item concerné.

E Sélectionnez Copier l’étiquette OMS.

Comme pour les identificateurs de commande et de sous-type, les étiquettes doiventapparaître entre guillemets et la liste entre crochets. Par exemple :

/IF LABELS=['Catégorie d'emploi' 'Niveau d'enseignement']

Page 803: SPSS Base Users Guide 14.0

Annexe

AAdministrateur d’accès de basede données

L’Administrateur d’accès de base de données est un utilitaire conçu pour simplifierl’utilisation de sources de données volumineuses ou complexes avec l’assistant de basede données. L’Administrateur d’accès de base de données permet aux utilisateurs etaux administrateurs de personnaliser leurs sources de données de différentes façons :

Créer des alias pour des tableaux et des champs de bases de données

Créer des noms de variables pour des champs.

Masquer des tableaux et des champs accessoires.

En fait, l’Administrateur d’accès de base de données ne change pas votre base dedonnées. En réalité, il génère des fichiers qui contiennent toutes vos informations.Ces fichiers jouent le rôle d’affichages de base de données.

Vous pouvez utiliser l’Administrateur d’accès de base de données pour spécifierjusqu’à trois affichages différents par base de données : le niveau Entreprise, le niveauDépartement, le niveau Personnel. L’Administrateur d’accès de base de données etl’assistant de base de données reconnaissent ces fichiers par les noms suivants :

Niveau Entreprise : dba01.inf

Niveau Département : dba02.inf

Niveau Personnel : dba03.inf

Chaque fichier contient des informations spécifiques sur un nombre de sources dedonnées quelconque correspondant au niveau. Par exemple, votre fichier dba03.infpourrait contenir des informations d’affichage Personnel pour une base de données decomptes sociétés, la base de données des relevés d’heures de votre société et une basede données que vous utilisez pour effectuer le suivi de votre collection de CD.

777

Page 804: SPSS Base Users Guide 14.0

778

Annexe A

Lorsque vous ouvrez l’Administrateur d’accès de base de données, il cherche lechemin de ces fichiers dans le système et affiche automatiquement les informationspour l’ensemble des trois affichages de n’importe quelle source de données que vousavez configurée.

Héritage et priorités. Chaque fois que vous utilisez l’assistant de base de données, ilprésente l’affichage du niveau le plus bas de votre source de données qu’il a pu trouverdans le chemin d’accès de votre système, les niveaux étant, du plus élevé au plus bas,Entreprise, Département et Personnel. Les fichiers de chaque niveau conservent lesinformations sur toutes vos sources de bases de données pour ce niveau. Par exemple,votre département marketing aura un fichier, dba02.inf, contenant les informationsd’alias pour tous les affichages de bases de données établis pour le départementmarketing. Chaque personne du département marketing aura un fichier, dba03.inf,contenant les affichages personnalisés de toutes les bases de données utilisées.

Dans l’Administrateur d’accès de base de données, les alias, noms de variables, etcommandes masquées sont hérités du niveau supérieur.

Exemples :

Si le tableau des Régions est masqué au niveau Entreprise, il est invisible aussibien au niveau Département qu’au niveau Personnel. Ce tableau ne sera pasaffiché dans l’assistant de base de données.

Le champ CATEMPL dans le tableau Ventes Employés n’a pas d’alias au niveauEntreprise mais en a un au niveau Département : son nom est Modalités Emplois.Il apparaît comme Modalités Emplois au niveau Personnel De plus, si le tableauVentes Employés possède l’alias Information Employés au niveau Personnel, lechamp d’origine (Ventes Employés.JOBCAT) apparaîtra dans l’assistant de basede données comme ’Information Employés’.’Modalités Emplois’.

Pour démarrer l’Administrateur d’accès de base de données, exécutez le fichierspssdbca.exe installé dans votre répertoire SPSS. Pour plus d’informations surl’Administrateur d’accès de base de données, consultez l’Aide en ligne.

Page 805: SPSS Base Users Guide 14.0

Annexe

BPersonnalisation de documentsHTML

Vous pouvez automatiquement ajouter le code HTML personnalisé aux documentsexportés au format HTML, y compris :

Titres de documents HTML

Spécification du type de document

Balises Meta et code du script (par exemple, JavaScript)

Texte affiché avant et après la sortie exportée

Pour ajouter du code HTML personnalisé à des documents derésultat exportés

E Ouvrez le fichier htmlfram.txt (situé dans le répertoire d’installation de SPSS) dansun éditeur de texte.

E Remplacez les commentaires dans les « champs » sur les lignes entre les doubleschevrons ouverts (<<) par le texte ou le code HTML à insérer dans vos documentsHTML exportés.

E Enregistrez le fichier en fichier texte.

Remarque : si vous modifiez le nom ou l’emplacement du fichier texte, vous devezmodifier le registre système pour utiliser le fichier afin de personnaliser votre résultatHTML exporté.

779

Page 806: SPSS Base Users Guide 14.0

780

Annexe B

Contenu et format du fichier texte pour code HTML personnalisé

Le code HTML à ajouter automatiquement à vos documents HTML doit être spécifiédans un fichier texte simple contenant six champs, chacun délimité par deux chevronsouverts sur la ligne précédente (<<) :

<<Texte ou code à insérer en haut du document avant la spécification <HTML> (parexemple, des commentaires comprenant les spécifications du type de document)

<<Texte utilisé comme titre du document (affiché dans la barre de titre)

<<Balises Meta ou code du script (par exemple, code JavaScript)

<<Code HTML modifiant la balise <BODY> (par exemple, code indiquant la couleurd’arrière-plan)

<<Texte et/ou code HTML inséré après les résultats exportés (par exemple, avis decopyright)

<<Texte et/ou code HTML insérés avant les résultats exportés (par exemple, nom desociété, logo, etc.)

Pour utiliser un autre fichier ou emplacement pour le codeHTML personnalisé

Si vous modifiez le nom ou l’emplacement du fichier htmlfram.txt, vous devezmodifier le registre du système pour utiliser le fichier dans le résultat HTMLpersonnalisé.

E Dans le menu Démarrer de Windows, choisissez Exécuter, tapez regedit et cliquezsur OK.

Page 807: SPSS Base Users Guide 14.0

781

Personnalisation de documents HTML

E Dans la fenêtre de gauche de l’éditeur de la base de registres, sélectionnez :HHKEY_CURRENT_USER

LogicielSPSS

SPSS pour Windows14.0

Spsswin

E Dans la fenêtre de droite, double-cliquez sur la chaîne HTMLFormatFile.

E Dans la zone Données de la valeur, entrez le chemin complet et le nom dufichier texte contenant les spécifications HTML personnalisées (par exemple,c:\mesfichiers\html.txt).

Exemple de fichier texte pour code HTML personnalisé

<<<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN"><<NVI, Inc.

<<<META NAME="keywords" CONTENT="trucs, gadgets, bidules"><<bgcolor="#FFFFFF"<<<H4 align=center>Page réalisée par...<br><br><IMG SRC="spss2.gif" align=center></H4><<<h2 align=center>Département Ventes de NVI</h2><h3 align=center>Données régionales</h3>

Exemple de source HTML pour code HTML personnalisé

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN"><HTML><HEAD><TITLE>NVI, Inc.

Page 808: SPSS Base Users Guide 14.0

782

Annexe B

</TITLE><META NAME="keywords" CONTENT="trucs, gadgets, bidules"></HEAD><BODY bgcolor="#FFFFFF"><h2 align=center>Département Ventes de NVI</h2><h3 align=center>Données régionales</h3>

[Résultat exporté]

<H4 align=center>Page réalisée par...<br><br><IMG SRC="spss2.gif" align=center</H4></BODY></HTML>

Page 809: SPSS Base Users Guide 14.0

Index

Access (Microsoft), 31Affectation de mémoire

Dans l’analyse TwoStep Cluster, 529Affichage, 267, 322–323, 683

Barres d’outils, 683Etiquettes de dimension, 322Légendes, 323Lignes ou colonnes, 322Notes de bas de page, 323Résultats, 267Titres, 323

Affichage des données, 96Affichage des variables, 97affichages/panneaux multiples

Editeur de données, 117Agrégation de données, 227

Fonctions d’agrégation, 230Noms de variable et étiquettes, 231

Aide contextuelle, 316Recherche de définitions d’étiquette dans les

tableaux pivotants, 316Aide en ligne, 17

Assistant statistique, 14Ajout d’étiquettes de groupe, 314Ajustement de fonctions, 487

Analyse de la variance, 487Enregistrement d’intervalles de prévision, 492Enregistrement de prévisions, 492Enregistrement de résidus, 492Inclusion de la constante, 487Modèles, 491Prévision, 492

algorithmes, 17Alignement, 107, 269, 337, 662

Dans les cellules, 337éditeur de données, 107Résultats, 269, 662

Alpha de Cronbach

Dans l’analyse de fiabilité, 613, 616Alpha-maximisation, 515Analyse de données, 14

Etapes de base, 14Analyse de fiabilité, 613

Caractéristiques, 616Coefficient de corrélation intra-classe, 616Corrélations et covariances entre éléments, 616Exemple, 613Fonctionnalités supplémentaires, 618Kuder-Richardson 20, 616statistiques, 613, 616T2 de Hotelling, 616Tableau ANOVA, 616Test d’additivité de Tukey, 616

Analyse de la variance

Ajustement de fonctions, 487Dans ANOVA à 1 facteur, 425Dans la régression linéaire, 483Dans Moyennes, 402

Analyse de séries chronologiques

Prévision, 492Prévision d’observations, 492

Analyse discriminante, 495analyse des observations restantes, 708Coefficients de la fonction, 500

783

Page 810: SPSS Base Users Guide 14.0

784

Index

Critères, 501Définition d’intervalles, 499Diagrammes, 503Distance de Mahalanobis, 501Enregistrement des variables du classement, 505Exemple, 495Exportation des informations du modèle, 505Fonctionnalités supplémentaires, 505Lambda de Wilks, 501Matrice de covariance, 503Matrices, 500Méthodes de l’analyse discriminante, 501Méthodes pas à pas, 495Options d’affichage, 501, 503Probabilités a priori, 503Sélection d’observations, 499statistiques, 495, 500Statistiques descriptives, 500V de Rao , 501Valeurs manquantes, 503Variables de regroupement, 495Variables indépendantes, 495

Analyse en composantes principale, 507, 515Analyse factorielle, 507

analyse des observations restantes, 708Aperçu, 507Cartes factorielles, 517Convergence, 515, 517Descriptives, 514Exemple, 507Facteurs, 519Fonctionnalités supplémentaires, 520Format d’affichage des projections, 520Méthodes d’extraction, 515Méthodes de rotation, 517Sélection d’observations, 513

statistiques, 507, 514Valeurs manquantes, 520

Analyse multiréponses

Tableau croisé, 590Tableaux croisés des réponses multiples, 590tableaux de fréquences, 588Tableaux de fréquences des réponses multiples,588

Analyse TwoStep Cluster, 525Diagrammes, 532Enregistrer dans le fichier de travail, 533Enregistrer dans le fichier externe, 533Options, 529statistiques, 533

Andrew

Dans Explorer, 373Années, 676

valeurs à deux chiffres, 676ANOVA

Dans ANOVA à 1 facteur, 425dans GLM - Univarié, 435Dans Moyennes, 402Modèle, 439

ANOVA à 1 facteur, 425Comparaisons multiples, 429Contrastes, 428Contrastes polynomiaux, 428Fonctionnalités supplémentaires, 433Options, 432statistiques, 432Tests post hoc, 429Valeurs manquantes, 432Variables actives, 425

Aperçu, 777Aplatissement

Dans Effectifs, 358

Page 811: SPSS Base Users Guide 14.0

785

Index

Dans Explorer, 373Dans les cubes OLAP, 408Dans les tableaux de bord en colonnes, 607Dans les tableaux de bord en lignes, 600Dans Moyennes, 402Dans Récapituler, 395Descriptives, 365

Arbres hiérarchiques

Classification hiérarchique, 541Assistant script, 715Assistant statistique, 14Association de signets aux différents affichages

d’un tableau pivotant, 320Association linéaire par linéaire

Tableaux croisés, 383Astuces de script, 707, 712, 715, 721–722, 724,726–728, 731, 736

Ajout d’une description, 731Assistant script, 715Boîtes de dialogue personnalisées, 731Débogage, 736Déclaration de variables, 722Fenêtre de script, 712Fonctionnement des scripts, 721Navigateur d’objets, 727Obtention d’objets d’automatisation, 724Procédures, 728Propriétés et méthodes, 726

Asymétrie

Dans Effectifs, 358Dans Explorer, 373Dans les cubes OLAP, 408Dans les tableaux de bord en colonnes, 607Dans les tableaux de bord en lignes, 600Dans Moyennes, 402Dans Récapituler, 395

Descriptives, 365attribution d’un nouveau nom aux ensembles de

données, 122Attributs de variable, 107–108

Copie et collage, 107–108Automatisation OLE, 707, 721, 723–724,726–727

Aperçu, 721, 723–724, 727conventions d’appellation des variables, 723Méthodes, 726propriétés, 726Scripts, 707Utilisation d’objets, 721, 724, 727

Autoscripts, 679, 716, 718Création, 716Evénements déclenchants, 718Fichier d’autoscript, 720

B de Tukey

Dans ANOVA à 1 facteur, 429GLM, 445

Barre d’état, 9Affichage, 10Masquage, 10

Barres d’outils, 683–687Affichage dans des fenêtres différentes, 684Affichage et masquage, 683Création, 683, 685Création d’outils, 686Modification des icônes bitmap, 687Personnalisation, 683, 685

boîtes à moustaches

Comparaison des niveaux de facteur, 374Comparaison des variables, 374Dans Explorer, 374

Page 812: SPSS Base Users Guide 14.0

786

Index

Boîtes de dialogue, 12, 653, 655, 660, 731, 733Affichage des étiquettes de variable, 10, 660Affichage des noms de variable, 10, 660commandes, 11Définition de groupes de variables, 653icônes de variables, 13Informations sur les variables, 13Ordre d’affichage des variables, 660Réordonnance de listes cible, 656Script, 731, 733Sélection de variables, 12Sous-boîtes de dialogue, 12Spécifications facultatives, 12Utilisation de groupes de variables, 655Variables, 10

Bonferroni

Dans ANOVA à 1 facteur, 429GLM, 445

Bordures, 303, 331–332Affichage des bordures masquées, 332Viewer en mode brouillon, 303

Bordures de cellules, 303Viewer en mode brouillon, 303

Bouton Aide, 11Bouton Annuler, 11Bouton Coller, 11Bouton OK, 11Bouton Restaurer, 11Boutons, 687

Modification des icônes bitmap de la barre

d’outils, 687

C de Dunnett

Dans ANOVA à 1 facteur, 429GLM, 445

Calcul de variables, 163Calcul de nouvelles variables chaîne, 166

Carré de la distance euclidienne

Distances, 467Cartes factorielles

Dans Analyse factorielle, 517Cellules de tableaux pivotants, 323, 329, 333–334,336–339, 341

Affichage, 321Alignement, 337Contours, 339Formats, 329Formats des valeurs, 336Largeurs, 334Marges, 338Masquage, 321Modification de texte, 341Ombrage, 339Polices, 333

Centiles

Dans Effectifs, 358Dans Explorer, 373

Centrage de résultats, 269, 662Chi-deux, 554

Association linéaire par linéaire, 383Correction pour la continuité de Yates, 383Indépendance, 383Intervalle théorique, 557Options, 557Pearson :, 383Rapport de vraisemblance, 383statistiques, 557Tableaux croisés, 383Test à un échantillon, 554Test exact de Fisher, 383Valeurs manquantes, 557

Page 813: SPSS Base Users Guide 14.0

787

Index

Valeurs théoriques, 557Chi-deux de Pearson

Tableaux croisés, 383Chi-deux du rapport de vraisemblance

Tableaux croisés, 383Classification

Choix d’une procédure, 523Classification hiérarchique, 535Dans Courbe ROC, 647Efficacité, 548Nuées dynamiques, 543

Classification hiérarchique, 535Arbres hiérarchiques, 541Chaîne des agrégations, 540Classes d’affectation, 540–541Classification d’observations, 535Classification de variables, 535Diagrammes en stalactite, 541Enregistrement de nouvelles variables, 541Exemple, 535Fonctionnalités supplémentaires, 542Matrices de distance, 540Mesures de distance, 539Mesures de similarité, 539Méthodes de classification, 539Orientation du diagramme, 541statistiques, 535, 540Transformation de mesures, 539Transformation de valeurs, 539

Coefficient alpha

Dans l’analyse de fiabilité, 613, 616Coefficient d’incertitude

Tableaux croisés, 383Coefficient de contingence

Tableaux croisés, 383

Coefficient de corrélation de Spearman

Corrélations bivariées, 453Tableaux croisés, 383

Coefficient de corrélation intra-classe

Dans l’analyse de fiabilité, 616Coefficient de corrélation par rang

Corrélations bivariées, 453Coefficient de corrélation r

Corrélations bivariées, 453Tableaux croisés, 383

Coefficient de dispersion (COD)

Dans les statistiques de ratio, 631Coefficient de variation (COV)

Dans les statistiques de ratio, 631Coefficients bêta

Dans la régression linéaire, 483Coefficients de régression

Dans la régression linéaire, 483Collage, 276–278

Collage spécial d’objets, 278diagrammes, 276Tableaux pivotants, 276–277Tableaux pivotants en tant que tableaux, 276

Colonne de total

Dans les tableaux de bord, 608colonnes., 334, 341

Modification de la largeur des tableaux pivotants,334

Sélection dans les tableaux pivotants, 341Commande EXECUTE

Collée depuis les boîtes de dialogue, 353Comparaison des groupes

Dans les cubes OLAP, 411Comparaison des variables

Dans les cubes OLAP, 411

Page 814: SPSS Base Users Guide 14.0

788

Index

Comparaisons multiples

Dans ANOVA à 1 facteur, 429Comparaisons multiples post hoc, 429Comptage d’occurrences, 169Connexion à un serveur, 85Contrastes

Dans ANOVA à 1 facteur, 428GLM, 442

Contrastes à la précédente

GLM, 442Contrastes de Helmert

GLM, 442Contrastes déviation

GLM, 442Contrastes différence

GLM, 442Contrastes polynomiaux

Dans ANOVA à 1 facteur, 428GLM, 442

Contrastes simples

GLM, 442Convergence

Analyse de classification des nuées dynamiques,549

Dans Analyse factorielle, 515, 517Copie, 269, 274

diagrammes, 274Résultats, 269Tableaux pivotants, 274

Correction pour la continuité de Yates

Tableaux croisés, 383Corrélation de Pearson

Corrélations bivariées, 453Tableaux croisés, 383

Corrélations

Corrélations bivariées, 453

Dans Corrélations partielles, 459Ordre zéro, 462Tableaux croisés, 383

Corrélations bivariées

Coefficients de corrélation, 453Fonctionnalités supplémentaires, 457Options, 456Seuil de signification, 453statistiques, 456Valeurs manquantes, 456

Corrélations partielles, 459Corrélations simples, 462Dans la régression linéaire, 483Fonctionnalités supplémentaires, 463Options, 462statistiques, 462Valeurs manquantes, 462

Corrélations simples

Dans Corrélations partielles, 462Couleurs de tableaux pivotants, 331, 333, 339

Arrière-plan des cellules, 339Bordures, 331Police, 333Premier plan des cellules, 339

Courbe ROC, 647Diagrammes et statistiques, 650

Critères d’agrégation

Dans Agréger les données, 227Cubes OLAP, 405

statistiques, 408Titres, 412

D

Tableaux croisés, 383D de Somers

Tableaux croisés, 383

Page 815: SPSS Base Users Guide 14.0

789

Index

Data Editor, 681Envoi de données vers d’autres applications, 681plusieurs fichiers de données ouverts, 119

Data List, 77et GET DATA, 77

Débogage des scripts, 736, 738Exécution pas à pas des scripts, 736Points d’arrêt, 736Volet de débogage, 738

déclaration de variables

Conventions d’appellation, 723Déclaration de variables, 722–723

Dans des scripts, 722–723Décomposition hiérarchique, 440Définir les vecteurs multiréponses, 586

Définition des étiquettes, 586Définition des noms, 586Dichotomies, 586Modalités, 586

Définition de variables, 98, 101, 103–105,107–108, 124

Application d’un dictionnaire des données, 136Copie et collage d’attributs, 107–108Etiquettes de valeurs, 104, 124Etiquettes de variable, 103Modèles, 107–108Types de données, 101Valeurs manquantes, 105

Déplacement de lignes et de colonnes, 313Dernier

Dans les cubes OLAP, 408Dans Moyennes, 402Dans Récapituler, 395

Descriptives, 363Enregistrement des écarts z, 363Fonctionnalités supplémentaires, 366

Ordre d’affichage, 365statistiques, 365

Diagnostic des observations

Dans la régression linéaire, 483diagramme d’importance

Dans l’analyse TwoStep Cluster, 532Diagramme de répartition gaussien

Dans Explorer, 374Dans la régression linéaire, 478

Diagramme de répartition hors tendance

Dans Explorer, 374diagrammes, 267, 274–276, 279, 667, 694

Aperçu, 633Collage dans d’autres applications, 276Copie, 274Copie dans d’autres applications, 275Création, 633Dans Courbe ROC, 647Etiquettes d’observations, 487Exportation, 279, 694Masquage, 267Modèles, 645, 667Modification, 637Notes de bas de page, 641Rapport hauteur/largeur, 667Sous-titres, 641Titres, 641Valeurs manquantes, 642

Diagrammes d’importance des variables

Dans l’analyse TwoStep Cluster, 532Diagrammes de dispersion

Dans la régression linéaire, 478Diagrammes de profils

GLM, 443Diagrammes des résidus

dans GLM - Univarié, 449

Page 816: SPSS Base Users Guide 14.0

790

Index

Diagrammes dispersion/niveau

Dans Explorer, 374dans GLM - Univarié, 449

Diagrammes en bâtons

Dans Effectifs, 360diagrammes en secteurs

Dans Effectifs, 360Titres, 641

Diagrammes en stalactite

Classification hiérarchique, 541Diagrammes interactifs, 275, 672

Copie dans d’autres applications, 275Enregistrement des données avec un diagramme,672

Incorporation en tant qu’objets ActiveX, 275Options, 672

Diagrammes partiels

Dans la régression linéaire, 478Diagrammes tige et feuille

Dans Explorer, 374Dictionnaire, 67–68Dictionnaire des données

Application à partir d’un autre fichier, 136Différence de bêta

Dans la régression linéaire, 479Différence de prévision

Dans la régression linéaire, 479Différence la moins significative

Dans ANOVA à 1 facteur, 429GLM, 445

Différence significative de Tukey

Dans ANOVA à 1 facteur, 429GLM, 445

Différences entre les groupes

Dans les cubes OLAP, 411

Différences entre les variables

Dans les cubes OLAP, 411Différentiel lié au prix (PRD)

Dans les statistiques de ratio, 631Dimensionnement des diagrammes exportés, 286Distance de Cook

Dans la régression linéaire, 479GLM, 447

Distance de Mahalanobis

Analyse discriminante, 501Dans la régression linéaire, 479

Distance de Manhattan

Distances, 467Distance de Minkowski

Distances, 467Distance de Tchebycheff

Distances, 467Distance du Chi-deux

Distances, 467Distance euclidienne

Distances, 467Distances, 465

Calcul des distances existant entre des

observations, 465Calcul des distances existant entre des variables,465

Exemple, 465Fonctionnalités supplémentaires, 469Mesures de dissimilarité, 467Mesures de similarité, 468statistiques, 465Transformation de mesures, 467–468Transformation de valeurs, 467–468

Division

Division dans les colonnes de tableaux, 608

Page 817: SPSS Base Users Guide 14.0

791

Index

Division de tableaux, 343Contrôle des sauts de tableau, 343

Données au format CSV, 49Données de dimension, 62Données de séries chronologiques

Création de variables de séries chronologiques,205

Définition de variables de date, 203Fonctions de transformation, 207Remplacement de valeurs manquantes, 208Transformations de données, 203

Données pondérées, 263Et fichiers des données restructurées, 263

Données qualitatives, 129Conversion de données d’intervalle en modalités

discrètes, 150Données séparées par des espaces, 49Données séparées par des virgules, 49Droits d’accès, 92

Ecart absolu moyen (AAD)

Dans les statistiques de ratio, 631Ecart type

Dans Effectifs, 358Dans Explorer, 373dans GLM - Univarié, 449Dans les cubes OLAP, 408Dans les statistiques de ratio, 631Dans les tableaux de bord en colonnes, 607Dans les tableaux de bord en lignes, 600Dans Moyennes, 402Dans Récapituler, 395Descriptives, 365

Ecart z

Descriptives, 363Enregistrement sous forme de variables, 363

Ordonner les observations, 179Echantillon aléatoire, 39

Fichiers de base de données, 39Génération de nombres aléatoires, 167Sélection, 237

Echantillonnage

Echantillon aléatoire, 237Echantillons liés, 573, 581Echelle, 99

Dans l’analyse de fiabilité, 613Dans le positionnement multidimensionnel, 621Niveau de mesure, 99, 129

Editeur de données, 95, 98, 107, 109–118Affichage des données, 96Affichage des variables, 97affichages/panneaux multiples, 117Alignement, 107Définition de variables, 98Déplacement de variables, 115Impression, 118Insertion de nouvelles observations, 113Insertion de nouvelles variables, 114Largeur de colonne, 107Modification de données, 111–112Modification du type de données, 115Observations filtrées, 116Options d’affichage, 117Recherche d’observations, 115–116Restrictions concernant la valeur de données,111

Saisie de données, 109Saisie de données non numériques, 110Saisie de données numériques, 110

Effectif observé

Tableaux croisés, 387

Page 818: SPSS Base Users Guide 14.0

792

Index

Effectif théorique

Tableaux croisés, 387Effectifs, 355

diagrammes, 360Formats, 361Ordre d’affichage, 361statistiques, 358Suppression de tableaux, 361

Elimination descendante

Dans la régression linéaire, 476En-têtes, 294, 296Enregistrement de diagrammes, 279, 286–289,291, 672, 694

Enregistrement de diagrammes interactifs avec

des données, 672Fichiers BMP, 279, 286–287, 694Fichiers EPS, 279, 286, 289, 694Fichiers JPEG, 279, 286, 694Fichiers PICT, 279, 286–287, 694Fichiers PNG, 288Fichiers PostScript, 289Fichiers TIFF, 288Fichiers WMF, 279, 286, 291Format WMF, 694Métafichiers, 279, 286, 694

Enregistrement de fichiers, 68, 73, 89Fichiers de données, 73, 89Fichiers de données SPSS, 68Requêtes de fichiers de base de données, 47

Enregistrement des différents affichages d’un

tableau pivotant, 320Enregistrement des résultats, 279, 283–284, 299,310, 694, 706

Enregistrement d’un résultat en mode brouillon

en tant que texte, 310Format Excel, 279, 282

Format PowerPoint, 279, 283Format texte, 279, 284, 694Format Word, 279, 282HTML, 279, 282, 694Protection par mot de passe, 299Publication sur le Web, 706Résultat en mode brouillon, 310

ensembles de données

renommer, 122Erreur standard

Dans Courbe ROC, 650Dans Effectifs, 358Dans Explorer, 373Descriptives, 365GLM, 447, 449

Erreur standard d’aplatissement

Dans les cubes OLAP, 408Dans Moyennes, 402Dans Récapituler, 395

Erreur standard d’asymétrie

Dans les cubes OLAP, 408Dans Moyennes, 402Dans Récapituler, 395

Erreur standard de la moyenne

Dans les cubes OLAP, 408Dans Moyennes, 402Dans Récapituler, 395

Espace disque, 77, 79Temporaire, 77, 79

Espace disque temporaire, 77, 79Estimation de l’intensité des effets

dans GLM - Univarié, 449Estimations de Blom, 179Estimations de la proportion

Ordonner les observations, 179

Page 819: SPSS Base Users Guide 14.0

793

Index

Estimations de puissance

dans GLM - Univarié, 449Estimations de Rankit, 179Estimations de Tukey, 179Estimations de Van der Waerden, 179Estimations des paramètres

dans GLM - Univarié, 449eta

Tableaux croisés, 383êta

Dans Moyennes, 402Eta carré

dans GLM - Univarié, 449Dans Moyennes, 402

Etiquettes, 314et noms de sous-type dans le système OMS, 751Insertion d’étiquettes de groupe, 314Suppression, 314

Etiquettes de groupe, 314Etiquettes de valeurs, 104, 111, 117, 124, 665

Application à plusieurs variables, 130Copie, 130Dans des fichiers de données fusionnés, 224éditeur de données, 117Insertion de sauts de ligne, 105Panneau de légendes, 665Tableaux pivotants, 665Utilisation pour la saisie de données, 111

Etiquettes de variable, 103, 660, 665Boîtes de dialogue, 10, 660Dans des fichiers de données fusionnés, 224Insertion de sauts de ligne, 105Panneau de légendes, 665Tableaux pivotants, 665

Etude appariée

Test T pour échantillons appariés, 418

Etude de contrôle d’observation

Test T pour échantillons appariés, 418Evénements déclenchants, 718

Autoscripts, 718exclusion de résultats du Viewer avec OMS, 758Explorer, 369

Diagrammes, 374Fonctionnalités supplémentaires, 376Options, 376statistiques, 373Transformations de l’exposant, 375Valeurs manquantes, 376

Exportation de diagrammes, 279, 286–289, 291,691, 694

Production automatisée, 691Taille des diagrammes, 286

Exportation de données, 681Ajout d’éléments de menu pour l’exportation de

données, 681Exportation de résultats, 279, 283–284, 694, 706

Format Excel, 279, 282Format PowerPoint, 279Format Word, 279, 282HTML, 282OMS, 743Publication sur le Web, 706

F de R-E-G-W (Ryan-Einot-Gabriel-Welsch)

Dans ANOVA à 1 facteur, 429GLM, 445

F multiple de Ryan-Einot-Gabriel-Welsch

Dans ANOVA à 1 facteur, 429GLM, 445

Facteur d’inflation de la variance

Dans la régression linéaire, 483Facteurs, 519

Page 820: SPSS Base Users Guide 14.0

794

Index

Facteurs d’Anderson-Rubin, 519Facteurs de Bartlett, 519Factorisation en axes principaux, 515Factorisation en projections, 515Fenêtre active, 8Fenêtre de script, 712, 714, 727

Menu Mettre au point, 736Navigateur d’objets, 727Onglet Chargé, 738Onglet Espion, 738Onglet Immédiat, 738Onglet Pile, 738propriétés, 714

Fenêtre désignée, 8Fenêtres, 7

Fenêtre active, 8Fenêtre désignée, 8

Fenêtres d’aide, 17Fiabilité de Spearman-Brown

Dans l’analyse de fiabilité, 616Fiabilité Split-half

Dans l’analyse de fiabilité, 613, 616Fichier actif, 77, 79

Création d’un fichier actif temporaire, 79Fichier actif virtuel, 77Mise en mémoire cache, 79

Fichier actif temporaire, 79fichier de modèle

chargement de modèles enregistrés pour noter

des données, 212fichier-journal, 660fichiers, 273

Ajout d’un fichier texte dans le Résultats, 273Ouverture, 25

Fichiers BMP, 279, 286–287, 694Exportation de diagrammes, 279, 286–287, 694

Fichiers dBASE, 25, 28, 73Enregistrement, 73Ouverture, 25, 28

Fichiers de base de données, 30–31, 34–35,37–39, 42, 45, 47

Clause Where, 39connexion à une base de données, 34Conversion des chaînes en valeurs numériques,45

Création de relations, 37Définition de variables, 45Demande de valeur, 42Echantillonnage aléatoire, 39Enregistrement de requêtes, 47Expressions conditionnelles, 39Jointures de tables, 37–38Lecture, 30–31, 35Microsoft Access, 31Propriétés des relations, 38Requêtes de paramètres, 39, 42sécurité de base de données, 34Sélection d’une source de données, 31sélection de fichiers de données, 35Spécification de critères, 39Syntaxe SQL, 47Vérification des résultats, 47

Fichiers de données, 25–26, 49, 67–68, 73, 76,79, 88–90, 241

ajout de commentaires, 652Amélioration des performances pour des fichiers

volumineux, 79Dimensions, 62Enregistrement, 68, 73Enregistrement de sous-ensembles de variables,76

Page 821: SPSS Base Users Guide 14.0

795

Index

enregistrement des résultats sous forme de

fichiers de données au format SPSS, 743informations sur les dictionnaires, 67–68Informations sur les fichiers, 67–68mrInterview, 62Ouverture, 25–26plusieurs fichiers de données ouverts, 119protection, 77Quancept, 62Quanvert, 62Restructuration, 241Retournement, 219Serveurs distants, 88–90Texte, 49Transposition, 219

Fichiers de feuille de calcul, 25, 27–28, 77Ecriture de noms de variable, 77Lecture des noms de variable, 27Lecture des plages, 27Ouverture, 28

Fichiers délimités par des tabulations, 25, 27, 49,73, 77

Ecriture de noms de variable, 77Enregistrement, 73Lecture des noms de variable, 27Ouverture, 25

Fichiers EPS, 279, 286, 289, 694Exportation de diagrammes, 279, 286, 289, 694

Fichiers Excel, 25, 27, 73, 681Ajout d’éléments de menu pour l’envoi de

données vers Excel, 681Enregistrement, 73Ouverture, 25, 27

Fichiers JPEG, 279, 286, 694Exportation de diagrammes, 279, 286, 694

Fichiers Lotus 1-2-3, 25, 73, 681Ajout d’éléments de menu pour l’envoi de

données vers Lotus, 681Enregistrement, 73Ouverture, 25

Fichiers PICT, 279, 286–287, 694Exportation de diagrammes, 279, 286–287, 694

Fichiers PNG, 279, 288Exportation de diagrammes, 279, 288

fichiers portables

Noms de variable, 73Fichiers PostScript (encapsulés), 279, 289, 694

Exportation de diagrammes, 279, 289, 694Fichiers SAS

Enregistrement, 73Ouverture, 25

Fichiers Stata, 29Enregistrement, 73Lecture, 25Ouverture, 29

Fichiers SYSTAT, 25Ouverture, 25

Fichiers TIFF, 288Exportation de diagrammes, 279, 286, 288, 694

Fichiers WMF, 279, 286, 291, 694Exportation de diagrammes, 279, 286, 291, 694

Fonction Décalage négatif, 207Fonction Différence, 207Fonction Différence saisonnière, 207Fonction Lissage, 207Fonction Médiane mobile, 207Fonction Moyenne mobile centrée, 207Fonction Moyenne mobile précédente, 207Fonction Somme cumulée, 207fonctions, 166

Traitement des valeurs manquantes, 167

Page 822: SPSS Base Users Guide 14.0

796

Index

Format chaîne, 101Format de colonne, 336

Modification dans les tableaux pivotants, 336format de fichier SAV

acheminement des résultats dans un fichier de

données SPSS, 752, 759Format des fichiers de données SPSS

acheminement des résultats dans un fichier de

données, 752, 759Format dollar, 101, 103Format Excel

Exportation de résultats, 279, 282Format fixe, 49Format libre, 49Format numérique, 101, 103Format point, 101, 103Format PowerPoint

Exportation de résultats, 279Format virgule, 101, 103Format Word

Exportation de résultats, 279, 282Formatage, 303

Colonnes dans les tableaux de bord, 598Résultat en mode brouillon, 303

Formats d’affichage, 103Formats d’entrée, 103Formats de date, 101, 103, 676

années à deux chiffres, 676Formats monétaires, 677Formats monétaires personnalisés, 101, 677Fréquences de classe

Dans l’analyse TwoStep Cluster, 533fusion de modalités, 150Fusion des fichiers de données

Affectation d’un nouveau nom aux variables,223

Fichiers avec observations différentes, 220Fichiers avec variables différentes, 224informations sur les dictionnaires, 224

Gamma

Tableaux croisés, 383Gamma de Goodman et Kruskal

Tableaux croisés, 383Génération de nombres aléatoires, 167Gestion des pages

Dans les tableaux de bord en colonnes, 610Dans les tableaux de bord en lignes, 601

Gestion du bruit

Dans l’analyse TwoStep Cluster, 529GET DATA, 77

et Data List, 77et Get Capture, 77

GLM

Diagrammes de profils, 443Enregistrement de matrices, 447Enregistrement de variables, 447Modèle, 439Somme des carrés, 439Tests post hoc, 445

GLM - Univarié, 435, 451Affichage, 449Contrastes, 442Diagnostics, 449Moyennes marginales estimées, 449Options, 449

Groupement de lignes ou de colonnes, 314Groupes de variables, 653, 655

Définition, 653Utilisation, 655

GT2 de Hochberg

Dans ANOVA à 1 facteur, 429

Page 823: SPSS Base Users Guide 14.0

797

Index

GLM, 445

H de Kruskal-Wallis

Tests pour deux échantillons indépendants, 577Histogrammes

Dans Effectifs, 360Dans Explorer, 374Dans la régression linéaire, 478

HTML, 279, 282, 694, 779Ajout de code personnalisé, 779Exportation de résultats, 279, 282, 694

ICC. Voir Coefficient de corrélation intra-classe,616

Icônes, 687Boîtes de dialogue, 13Modification des icônes bitmap de la barre

d’outils, 687identificateurs de commande, 749Impression, 118, 291–292, 294, 296–297,308–309, 327, 332, 343

Aperçu avant impression, 292Contrôle des sauts de tableau, 343diagrammes, 291Données, 118En-têtes et pieds de page, 294, 296Espace entre les éléments de résultat, 297Mise en page, 294Numéros de page, 297Redimensionnement de tableaux, 327, 332Résultat en mode brouillon, 308–309Résultats texte, 291Strates, 291, 327, 332Tableaux pivotants, 291Taille des diagrammes, 297

incorporation

Diagrammes interactifs, 275Tableaux pivotants, 275

Index de concentration

Dans les statistiques de ratio, 631Informations sur les fichiers, 67–68Informations sur les variables, 651Insertion d’étiquettes de groupe, 314Intervalle multiple de Ryan-Einot-Gabriel-Welsch

Dans ANOVA à 1 facteur, 429GLM, 445

Intervalles de confiance

Dans ANOVA à 1 facteur, 432Dans Courbe ROC, 650Dans Explorer, 373Dans la régression linéaire, 483Enregistrement dans la régression linéaire, 479GLM, 442, 449Test T pour échantillon unique, 422Test T pour échantillons appariés, 420Test T pour échantillons indépendants, 417

Intervalles de prévision

Enregistrement dans l’ajustement de fonctions,492

Enregistrement dans la régression linéaire, 479Itérations

Analyse de classification des nuées dynamiques,549

Dans Analyse factorielle, 515, 517

Journal de session, 660Justification, 269, 662

Résultats, 269, 662

Kappa

Tableaux croisés, 383

Page 824: SPSS Base Users Guide 14.0

798

Index

Kappa de Cohen

Tableaux croisés, 383KR20

Dans l’analyse de fiabilité, 616Kuder-Richardson 20 (KR20)

Dans l’analyse de fiabilité, 616

LAG (fonction), 207Lambda

Tableaux croisés, 383Lambda de Goodman et Kruskal

Tableaux croisés, 383Lambda de Wilks

Analyse discriminante, 501Langage

Modification du langage des résultats, 660langage de commande, 345Largeur de colonne, 107, 327, 334, 673

Contrôle de la largeur maximale, 327Contrôle de la largeur par défaut, 673Contrôle de la largeur pour texte avec retour

automatique à la ligne, 327éditeur de données, 107Tableaux pivotants, 334

Lecteurs partagés, 92Légende, 270–272

Dans le Résultats, 270Développement, 271Modification des niveaux, 272Réduction, 271

Légendes, 342Ajout à un tableau, 342

Lignes, 341Sélection dans les tableaux pivotants, 341

Lissage T4253H, 207Liste des observations, 391

Listes cible, 656Listes de variables, 656

Réordonnance de listes cible, 656LSD de Fisher

GLM, 445

M-estimateur de Huber

Dans Explorer, 373M-estimateur redescendant de Hampel

Dans Explorer, 373M-estimateurs

Dans Explorer, 373Marges, 294, 338

Dans les cellules, 338Marges de page, 294Masquage, 267–268, 322–323, 683

Barres d’outils, 683Etiquettes de dimension, 322Légendes, 323Lignes et colonnes, 322Notes de bas de page, 323Résultats d’une procédure, 268Titres, 323

masquage (exclusion) de résultats du Viewer avec

OMS, 758Matrice de corrélation

Analyse discriminante, 500Dans Analyse factorielle, 507, 514

Matrice de covariance

Analyse discriminante, 500, 503Dans la régression linéaire, 483GLM, 447

Matrice de transformation

Dans Analyse factorielle, 507Matrice des projections factorielles

Dans Analyse factorielle, 507

Page 825: SPSS Base Users Guide 14.0

799

Index

Maximum

Comparaison des colonnes de tableaux, 608Dans Effectifs, 358Dans Explorer, 373Dans les cubes OLAP, 408Dans les statistiques de ratio, 631Dans Moyennes, 402Dans Récapituler, 395Descriptives, 365

Maximum de vraisemblance

Dans Analyse factorielle, 515Médiane

Dans Effectifs, 358Dans Explorer, 373Dans les cubes OLAP, 408Dans les statistiques de ratio, 631Dans Moyennes, 402Dans Récapituler, 395

Médiane de groupes

Dans les cubes OLAP, 408Dans Moyennes, 402Dans Récapituler, 395

Mémoire, 660menus, 9, 681

Personnalisation, 681Mesure d’écart de la taille

Distances, 467Mesure d’écart de structures

Distances, 467Mesure de dissimilarité de Lance et Williams, 467

Distances, 467Mesure de distance du Phi-deux

Distances, 467Mesures de distance

Classification hiérarchique, 539Distances, 467

Mesures de la dispersion

Dans Effectifs, 358Dans Explorer, 373Dans les statistiques de ratio, 631Descriptives, 365

Mesures de la distribution

Dans Effectifs, 358Descriptives, 365

Mesures de la tendance centrale

Dans Effectifs, 358Dans Explorer, 373Dans les statistiques de ratio, 631

Mesures de similarité

Classification hiérarchique, 539Distances, 468

Métafichiers, 279, 286, 694Exportation de diagrammes, 279, 286, 694

Méthodes, 726Objets d’automatisation OLE, 726

Méthodes de sélection, 341Sélection de lignes et de colonnes dans des

tableaux pivotants, 341Microsoft Access, 31Minimum

Comparaison des colonnes de tableaux, 608Dans Effectifs, 358Dans Explorer, 373Dans les cubes OLAP, 408Dans les statistiques de ratio, 631Dans Moyennes, 402Dans Récapituler, 395Descriptives, 365

Mise à l’échelle des diagrammes exportés, 286Mise en mémoire cache, 79

Fichier actif, 79

Page 826: SPSS Base Users Guide 14.0

800

Index

Mise en page, 294, 296–297En-têtes et pieds de page, 296Taille des diagrammes, 297

Modalité de référence

GLM, 442Mode

Dans Effectifs, 358Mode distribué, 83, 85, 88–90, 92–93, 699

Accès aux fichiers de données, 88, 90Chemins UNC, 93Enregistrement de fichiers de données, 89Procédures disponibles, 92Système de production, 699

Modèle composé

Ajustement de fonctions, 491Modèle cubique

Ajustement de fonctions, 491Modèle de croissance

Ajustement de fonctions, 491Modèle de Guttman

Dans l’analyse de fiabilité, 613, 616Modèle de puissance

Ajustement de fonctions, 491Modèle en S

Ajustement de fonctions, 491Modèle exponentiel

Ajustement de fonctions, 491Modèle inverse

Ajustement de fonctions, 491Modèle linéaire

Ajustement de fonctions, 491Modèle logarithmique

Ajustement de fonctions, 491Modèle logistique

Ajustement de fonctions, 491

Modèle parallèle

Dans l’analyse de fiabilité, 613, 616Modèle parallèle strict

Dans l’analyse de fiabilité, 613, 616Modèle quadratique

Ajustement de fonctions, 491Modèles, 107–108, 667

Définition de variable, 107–108Diagrammes, 645, 667Utilisation d’un fichier de données externe

comme modèle, 136Modèles de tableaux, 324–325

Application, 324Création, 325

Modèles factoriels complets

GLM, 439Modèles personnalisés

GLM, 439Modification de données, 111–112Modification de l’ordre des lignes et des colonnes,313

Moindres carrés généralisés

Dans Analyse factorielle, 515Moindres carrés non pondérés

Dans Analyse factorielle, 515moindres carrés pondérés

Dans la régression linéaire, 471Moyenne

Dans ANOVA à 1 facteur, 432Dans Effectifs, 358Dans Explorer, 373Dans les cubes OLAP, 408Dans les statistiques de ratio, 631Dans les tableaux de bord en colonnes, 607Dans les tableaux de bord en lignes, 600Dans Moyennes, 402

Page 827: SPSS Base Users Guide 14.0

801

Index

Dans Récapituler, 395Des colonnes de tableaux multiples, 608Descriptives, 365Sous-groupe, 399, 405

Moyenne géométrique

Dans les cubes OLAP, 408Dans Moyennes, 402Dans Récapituler, 395

Moyenne harmonique

Dans les cubes OLAP, 408Dans Moyennes, 402Dans Récapituler, 395

Moyenne pondérée

Dans les statistiques de ratio, 631Moyenne tronquée

Dans Explorer, 373Moyennes, 399, 708

Options, 402Résultats au format ASCII, 708statistiques, 402

Moyennes des groupes, 399, 405Moyennes des sous-groupes, 399, 405Moyennes marginales estimées

dans GLM - Univarié, 449Moyennes observées

dans GLM - Univarié, 449mrInterview, 62Multiplication

Multiplication dans les colonnes de tableaux,608

Navigateur d’objets, 727Newman-Keuls

GLM, 445Niveau de mesure, 99, 129

Définition, 99

icônes des boîtes de dialogue, 13Nombre d’observations

Dans les cubes OLAP, 408Dans Moyennes, 402Dans Récapituler, 395

Nombre maximal de branches

Dans l’analyse TwoStep Cluster, 529Nominal, 99

Niveau de mesure, 99, 129Noms de variable, 99, 660

affichage des noms de variables longs dans les

résultats, 99Boîtes de dialogue, 10, 660fichiers portables, 73généré par le système de gestion des résultats,767

noms de variables d’observation mixtes, 99Règles, 99troncation des noms de variable longs dans les

versions précédentes, 73notation, 211

affichage de modèles chargés, 215chargement de modèles enregistrés, 212

Notation scientifique, 101, 336, 660Suppression dans le résultat, 660Tableaux pivotants, 336

Notes de bas de page, 328, 340, 342Ajout à un tableau, 342Diagrammes, 641Marques, 328, 340Renumérotation, 340

Nouvelles fonctionnalités

SPSS 14.0, 2Nuées dynamiques, 543

Aperçu, 543Classes d’affectation, 550

Page 828: SPSS Base Users Guide 14.0

802

Index

Critères de convergence, 549Distances entre les classes, 550Efficacité, 548Enregistrement des informations sur les classes,550

Exemples, 543Fonctionnalités supplémentaires, 552Itérations, 549Méthodes, 543statistiques, 543, 551Valeurs manquantes, 551

Numéros de port, 85Numérotation des pages, 294, 297

Dans les tableaux de bord en colonnes, 611Dans les tableaux de bord en lignes, 601

Objets, 721, 723–724, 727Aperçu, 721, 723conventions d’appellation des variables, 723Utilisation dans les scripts, 721, 724, 727

Objets ActiveX, 275Objets d’automatisation, 721, 723–724, 726–727

conventions d’appellation des variables, 723Méthodes, 726Navigateur d’objets, 727propriétés, 726Types, 723Utilisation dans les scripts, 721, 724, 727

Observations, 113, 115–116, 241Insertion de nouvelles observations, 113Pondération, 239Recherche dans l’éditeur de données, 115–116recherche des observations dupliquées, 147Restructuration en variables, 241Sélection de sous-groupes, 234, 236, 238Tri, 218

observations dupliquées (enregistrements)

recherche et filtrage, 147Observations filtrées, 116

éditeur de données, 116observations restantes, 708

Analyse, 708Ombrage, 339

Dans les cellules, 339OMS, 743, 773

contrôle des pivots de tableau, 752, 765exclusion des résultats du Viewer, 758format de fichier SAV, 752, 759Format des fichiers de données SPSS, 752, 759Format texte, 752identificateurs de commande, 749noms de variable dans les fichiers SAV, 767sous-types de tableau, 749types d’objet de sortie, 747utilisation de XSLT avec OXML, 775XML, 752, 769

Onglet Chargé, 738Fenêtre de script, 738

Onglet Espion, 738Fenêtre de script, 738

Onglet Immédiat, 738Fenêtre de script, 738

Onglet Pile, 738Fenêtre de script, 738

Options, 660, 662–663, 665, 667, 672–673,676–677, 679

années à deux chiffres, 676diagrammes, 667Diagrammes interactifs, 672Données, 676Etiquettes résultats, 665Générales, 660

Page 829: SPSS Base Users Guide 14.0

803

Index

Modèle de tableau pivotant, 673Monnaie, 677Répertoire temporaire, 660Scripts, 679Viewer, 662Viewer en mode brouillon, 663

Options de diagramme, 667Ordinal, 99

Niveau de mesure, 99, 129Ordonnancement des observations, 178

Centiles, 179Rangs fractionnaires, 179Scores de Savage, 179Valeurs ex aequo, 180

Ordre d’affichage, 313Ouverture de fichiers, 25–30, 49

Fichiers dBASE, 25, 28Fichiers de données, 25–26Fichiers de données texte, 49Fichiers de feuille de calcul, 25, 28Fichiers délimités par des tabulations, 25Fichiers Excel, 25, 27Fichiers Lotus 1-2-3, 25Fichiers Stata, 29Fichiers SYSTAT, 25

OXML, 775

Paires de variables, 241Création, 241

Paramètres de ligne de commande, 703Système de production, 703

Performances, 79Mise en mémoire cache des données, 79

Phi

Tableaux croisés, 383Pieds de page, 294, 296

Pivotement

contrôle avec OMS pour les résultats exportés,765

plage

Dans Effectifs, 358Dans les cubes OLAP, 408Dans les statistiques de ratio, 631Dans Moyennes, 402Dans Récapituler, 395Descriptives, 365

plusieurs fichiers de données ouverts, 119Points d’arrêt, 736

Dans des scripts, 736Polices, 117, 273, 308, 333

Couleurs, 333Dans les cellules, 333éditeur de données, 117Panneau de légendes, 273Viewer en mode brouillon, 308

Pondération d’observations, 239Pondérations fractionnelles dans des tableaux

croisés, 239Positionnement multidimensionnel, 621

Conditionnalité, 625Création de matrices de distance, 624Critères, 626Définition de la forme des données, 623Dimensions, 625Exemple, 621Fonctionnalités supplémentaires, 627Mesures de distance, 624Modèles de positionnement, 625Niveaux de mesure, 625Options d’affichage, 626statistiques, 621Transformation de valeurs, 624

Page 830: SPSS Base Users Guide 14.0

804

Index

pourcentages

Tableaux croisés, 387Pourcentages en colonne

Tableaux croisés, 387Pourcentages en ligne

Tableaux croisés, 387Pourcentages totaux

Tableaux croisés, 387PowerPoint, 283

exportation du résultat au format PowerPoint,283

Premier

Dans les cubes OLAP, 408Dans Moyennes, 402Dans Récapituler, 395

Prévision

Ajustement de fonctions, 492Prévisions

Enregistrement dans l’ajustement de fonctions,492

Enregistrement dans la régression linéaire, 479Prévisions pondérées

GLM, 447Procédures, 728

Scripts, 728Procédures fonctions, 728Procédures globales, 679, 729Procédures sous-routines, 728Production automatisée, 691Profondeur d’arborescence

Dans l’analyse TwoStep Cluster, 529programmation avec le langage de commande, 345propriétés, 326–327, 726

Objets d’automatisation OLE, 726Tableaux, 327Tableaux pivotants, 326

Protection par mot de passe, 299Proximités

Classification hiérarchique, 535Publication de résultat, 706

Avec le système de production, 705

Q de Cochran

Dans les tests pour plusieurs échantillons liés,582

Q de R-E-G-W (Ryan-Einot-Gabriel-Welsch)

Dans ANOVA à 1 facteur, 429GLM, 445

quadrillage, 332Tableaux pivotants, 332

Quancept, 62Quanvert, 62Quartiles

Dans Fréquences, 358

R multiple

Dans la régression linéaire, 483R2

Dans la régression linéaire, 483Dans Moyennes, 402modification R2, 483

R2 ajusté

Dans la régression linéaire, 483Rapport de covariance

Dans la régression linéaire, 479Rapport hauteur/largeur, 667Récapituler, 391

Options, 394statistiques, 395

Recodage de valeurs, 150, 172–174, 176, 181Redimensionnement de tableaux pivotants, 327,332

Page 831: SPSS Base Users Guide 14.0

805

Index

Régression

Diagrammes, 478Régression linéaire, 471Régression multiple, 471

Régression linéaire, 471Blocs, 471Diagrammes, 478Enregistrement de nouvelles variables, 479Exportation des informations du modèle, 479Fonctionnalités supplémentaires, 486Méthodes de sélection des variables, 476, 485Pondérations, 471Résidus, 479statistiques, 483Valeurs manquantes, 485Variable de sélection, 477

Régression multiple

Dans la régression linéaire, 471regroupement en bandes des valeurs de données,150

Remplacement de valeurs manquantes

Interpolation linéaire, 210Médiane des points voisins, 210Moyenne de la série, 210Moyenne des points voisins, 210Tendance linéaire, 210

Répertoire temporaire, 660Définition de la position en mode local, 660Variable d’environnement SPSSTMPDIR, 660

Réponses multiples

Fonctionnalités supplémentaires, 594Résidu non standardisé

GLM, 447Résidus

Enregistrement dans l’ajustement de fonctions,492

Enregistrement dans la régression linéaire, 479Tableaux croisés, 387

Résidus de Student

Dans la régression linéaire, 479Résidus standardisés

Dans la régression linéaire, 479GLM, 447

Résidus supprimés

Dans la régression linéaire, 479GLM, 447

Restructuration des données, 240–241, 244–247,250, 252–253, 255–256, 258–259, 261, 263

Aperçu, 240Création d’une variable d’index pour la

restructuration des variables en observations,253

Création de plusieurs variables d’index pour la

restructuration des variables en Observations,255

Création de variables d’index pour la

restructuration des variables en observations,250

Et données pondérées, 263Exemple d’index unique lors de la restructuration

de variables en observations, 252Exemple de deux index lors de la restructuration

de variables en observations, 252Exemple de restructuration d’observations en

variables, 245Exemple de restructuration de variables en

observations, 244Groupes de variables pour la restructuration de

variables en observations, 246Options de restructuration d’observations en

variables, 261

Page 832: SPSS Base Users Guide 14.0

806

Index

Options de restructuration des variables en

observations, 256Sélection de données pour la restructuration

d’observations en variables, 258Sélection de données pour la restructuration de

variables en observations, 247Tri de données pour la restructuration

d’observations en variables, 259Types de restructuration, 241

Résultats, 265, 267–275, 277–279, 297–298,301, 341, 662, 694

Affichage, 267Alignement, 269, 662Brouillon, 301Centrage, 269, 662Collage dans d’autres applications, 274Collage spécial d’objets, 278Copie, 268–269Copie dans d’autres applications, 275Copie de résultats, 269Copie et collage de plusieurs éléments, 277déplacement, 268Déplacement du résultat, 268Développement de la ligne de légende, 271Enregistrement, 298Enregistrement du document, 298Espace entre les éléments de résultat, 297Exportation, 279, 694Légende, 270Masquage, 267Masquage de résultats, 267Modification, 341modification de la police de la légende, 273Modification des niveaux de la ligne de légende,272

Modification des tailles de la légende, 272

Modification du langage des résultats, 660Panneau de légende, 265Panneau de résultats, 265Réduction de la ligne de légende, 271Résultats, 265Suppression, 268–269Suppression de résultats, 269

Retour à la ligne automatique, 327Contrôle de la largeur de colonne pour texte avec

retour automatique à la ligne, 327étiquettes de variable et de valeur, 105

Rho

Corrélations bivariées, 453Tableaux croisés, 383

Risque

Tableaux croisés, 383risque relatif

Tableaux croisés, 383Rotation d’étiquettes, 315Rotation equamax

Dans Analyse factorielle, 517Rotation oblimin directe

Dans Analyse factorielle, 517Rotation quartimax

Dans Analyse factorielle, 517Rotation Varimax

Dans Analyse factorielle, 517

Saisie de données, 109–111Non numérique, 110numérique, 110Utilisation d’étiquettes de valeurs, 111

Sauts de ligne

étiquettes de variable et de valeur, 105Sauts de tableau, 343Scores de Savage, 179

Page 833: SPSS Base Users Guide 14.0

807

Index

Scores normaux

Ordonner les observations, 179Scripts, 679, 681, 686, 707–709, 712, 715–716,731, 736

Ajout aux menus, 681Ajout d’une description, 731Aperçu, 707Assistant script, 715Autoscripts, 709, 716, 720Avec syntaxe de commande, 739–741Boîtes de dialogue, 731, 733Création, 712, 716Débogage, 736, 738Déclaration de variables, 722–723Exécution, 707Exécution avec les boutons de la barre d’outils,686

Fenêtre de script, 712, 714Fichier d’autoscript, 679, 720Fichier de procédures globales, 679, 729Utilisation d’objets d’automatisation, 721,723–724, 727

Scripts de procédures globales, 729Sélection ascendante

Dans la régression linéaire, 476Sélection d’observations, 234

Echantillon aléatoire, 237En fonction de critères de sélection, 236Intervalle de temps, 238Plage d’observations, 238Plage de dates, 238

Sélection progressive

Dans la régression linéaire, 476séparation de fenêtre

Editeur de données, 117

séparation de panneau

Editeur de données, 117Serveurs, 85

Ajout, 85Connexion, 85Modification, 85Noms, 85Numéros de port, 85

Serveurs distants, 83, 85, 88–90, 92–93, 699Accès aux fichiers de données, 88, 90Ajout, 85Chemins UNC, 93Connexion, 85Enregistrement de fichiers de données, 89Modification, 85Procédures disponibles, 92Système de production, 699

Seuil initial

Dans l’analyse TwoStep Cluster, 529Signets, 320Somme

Dans Effectifs, 358Dans les cubes OLAP, 408Dans Moyennes, 402Dans Récapituler, 395Descriptives, 365

Somme des carrés, 440GLM, 439

Sous-groupes d’observations

Echantillon aléatoire, 237Sélection, 234, 236, 238

Sous-titres

Diagrammes, 641Sous-totaux

Dans les tableaux de bord en colonnes, 610

Page 834: SPSS Base Users Guide 14.0

808

Index

sous-types, 749et étiquettes, 751

sous-types de tableau, 749et étiquettes, 751

SPSS

Etapes de base, 14Standardisation

Dans l’analyse TwoStep Cluster, 529Statistique de Brown-Forsythe

Dans ANOVA à 1 facteur, 432Statistique de Cochran

Tableaux croisés, 383Statistique de Durbin-Watson

Dans la régression linéaire, 483Statistique de Mantel-Haenszel

Tableaux croisés, 383Statistique de Welch

Dans ANOVA à 1 facteur, 432Statistique R

Dans la régression linéaire, 483Dans Moyennes, 402

Statistiques de ratio, 629statistiques, 631

Statistiques descriptives

Dans Effectifs, 358Dans Explorer, 373dans GLM - Univarié, 449Dans l’analyse TwoStep Cluster, 533Dans les statistiques de ratio, 631Dans Récapituler, 395Descriptives, 363

Strates, 291, 316, 318, 327, 332Affichage, 316, 318Création, 316Impression, 291, 327, 332Modification, 318

Tableaux croisés, 382Tableaux pivotants, 316

Stress

Dans le positionnement multidimensionnel, 621Stress S

Dans le positionnement multidimensionnel, 621Student-Newman-Keuls

Dans ANOVA à 1 facteur, 429GLM, 445

Suites de Wald-Wolfowitz

Tests pour deux échantillons indépendants, 570Suites en séquences, 561

Césures, 561, 563Fonctionnalités supplémentaires, 564Options, 564statistiques, 564Valeurs manquantes, 564

Suppression d’étiquettes de groupe, 314Suppression de plusieurs commandes EXECUTE

dans les fichiers de syntaxe, 353Suppression de résultats, 269Symbole dollar, 336

Tableaux pivotants, 336Symbole pourcentage, 336

Tableaux pivotants, 336Syntaxe, 345, 353, 660, 662–663, 685, 691, 739,741

accès à SPSS Command Syntax Reference, 17Avec scripts, 739–741Collage, 348Collage dans des scripts, 741Exécution, 353Exécution de la syntaxe de commande avec les

boutons de la barre d’outils, 685Fichier de résultat, 349fichier-journal, 351, 353, 660

Page 835: SPSS Base Users Guide 14.0

809

Index

Journal, 662–663Règles de syntaxe, 346Règles du système de production, 691

Syntaxe de commande, 345, 353, 660, 662–663,681, 686, 691

accès à SPSS Command Syntax Reference, 17Ajout aux menus, 681Collage, 348Exécution, 353Exécution avec les boutons de la barre d’outils,686

Fichier de résultat, 349fichier-journal, 351, 353, 660Formatage du système de production, 702Journal, 662–663Règles de syntaxe, 346Règles du système de production, 691

Système de gestion des résultats (OMS), 743, 773Système de mesure, 660Système de production, 660, 662–663, 691, 694,696, 698–700, 703, 705

Contrôle du format avec la syntaxe de commande,702

Contrôle du format des tableaux pivotants, 700exécution de plusieurs tâches de production, 703Exportation de diagrammes, 691, 694Exportation de résultats, 694Fichiers de résultat, 691Options, 699Paramètres de ligne de commande, 703Programmation des tâches de production, 703Publication de résultat, 705Publication sur le Web, 705Règles de syntaxe, 691Remplacement de valeurs dans des fichiers de

syntaxe, 696

Sollicitation de macros, 698Spécification d’un serveur distant, 699Utilisation de la syntaxe de commande à partir

d’un fichier-journal, 660Utilisation de la syntaxe de commande à partir

du journal, 662–663

T2 de Hotelling

Dans l’analyse de fiabilité, 613, 616T2 de Tamhane

Dans ANOVA à 1 facteur, 429GLM, 445

T3 de Dunnett

Dans ANOVA à 1 facteur, 429GLM, 445

Tableau croisé

Multiréponses, 590Tableaux croisés, 379

Tableaux, 343Contrôle des sauts de tableau, 343

Tableaux croisés, 379Affichage de cellules, 387Diagrammes en bâtons juxtaposés, 383Formats, 389Pondérations fractionnelles, 239statistiques, 383Strates, 382Suppression de tableaux, 379Variables de contrôle, 382

Tableaux croisés des réponses multiples, 590Appariement des variables entre les vecteurs,593

Définition des plages de valeurs, 592Pourcentages basés sur les observations, 593Pourcentages basés sur les réponses, 593Pourcentages dans les cellules, 593

Page 836: SPSS Base Users Guide 14.0

810

Index

Valeurs manquantes, 593Tableaux de bord

Colonne de total, 608Comparaison des colonnes, 608Division des valeurs de colonnes, 608Multiplication des valeurs de colonnes, 608Tableaux de bord en colonnes, 604Tableaux de bord en lignes, 595Totaux composites, 608

Tableaux de bord en colonnes, 604Colonne de total, 608Fonctionnalités supplémentaires, 611Format de colonne, 598Gestion des pages, 610Mise en page, 602Numérotation des pages, 611Sous-totaux, 610Total général, 611Valeurs manquantes, 611

Tableaux de bord en lignes, 595Critères d’agrégation, 595Espacement de ventilation, 600Fonctionnalités supplémentaires, 611Format de colonne, 598Gestion des pages, 600Mise en page, 602Numérotation des pages, 601Pieds de page, 603Séquences de tri, 595Titres, 603Valeurs manquantes, 601Variables dans les titres, 603Variables en colonnes, 595

Tableaux de contingence, 379tableaux de effectifs

Dans Effectifs, 355

tableaux de fréquences

Dans Explorer, 373Tableaux de fréquences des réponses multiples, 588

Valeurs manquantes, 588Tableaux pivotants, 267, 274–277, 279, 291,311–316, 321, 324, 326–329, 331–332, 334,341–343, 673, 694, 700

Affichage des bordures masquées, 332Affichage et masquage des cellules, 321Ajout de légendes, 342Ajustement de la largeur de colonne par défaut,673

Bordures, 331Collage dans d’autres applications, 274Collage en tant que métafichiers, 276Collage en tant que texte, 277Collage sous forme de tableaux, 274, 276Contrôle des sauts de tableau, 343Contrôle du format des tâches de production,700

Copie, 274Copie dans d’autres applications, 275Copie et collage de plusieurs tableaux, 277Déplacement de lignes et de colonnes, 313Dissociation de lignes ou de colonnes, 314Exportation au format HTML, 279, 694Formats de cellule, 329Groupement de lignes ou de colonnes, 314Identification des dimensions, 313Impression de grands tableaux, 343Impression de strates, 291Incorporation en tant qu’objets ActiveX, 275Insertion d’étiquettes de groupe, 314Largeur des cellules, 334Manipulation, 311Masquage, 267

Page 837: SPSS Base Users Guide 14.0

811

Index

Modèle de tableau par défaut des nouveaux

tableaux, 673Modification, 311Modification de l’aspect, 324Modification de l’ordre d’affichage, 313Modification de plusieurs tableaux, 311Pivotement, 311–312propriétés, 326Propriétés des notes de bas de page, 328Propriétés générales, 327quadrillage, 332Recherche de définitions d’étiquette, 316Redimensionnement à des fins d’ajustement à

la page, 327, 332Rétablissement des valeurs par défaut, 316Rotation d’étiquettes, 315Sélection de lignes et de colonnes, 341Strates, 316Suppression d’étiquettes de groupe, 314Texte de suite, 332Transposition de lignes et de colonnes, 313Utilisation d’icônes, 312

Tailles, 272Dans la légende, 272

Tau de Goodman et Kruskal

Tableaux croisés, 383Tau de Kruskal

Tableaux croisés, 383Tau-b

Tableaux croisés, 383Tau-b de Kendall

Corrélations bivariées, 453Tableaux croisés, 383

Tau-c

Tableaux croisés, 383

Tau-c de Kendall , 383Tableaux croisés, 383

Termes construits, 440Termes d’interaction, 440Test binomial, 558

Dichotomies, 558Fonctionnalités supplémentaires, 561Options, 560statistiques, 560Valeurs manquantes, 560

Test d’additivité de Tukey

Dans l’analyse de fiabilité, 613, 616Test d’intervalle multiple de Duncan

Dans ANOVA à 1 facteur, 429GLM, 445

Test de comparaison par paire de Gabriel

Dans ANOVA à 1 facteur, 429GLM, 445

Test de comparaison par paire de Games et Howell

Dans ANOVA à 1 facteur, 429GLM, 445

Test de Friedman

Dans les tests pour plusieurs échantillons liés,582

Test de la médiane

Tests pour deux échantillons indépendants, 577Test de Levene

Dans ANOVA à 1 facteur, 432Dans Explorer, 374dans GLM - Univarié, 449

Test de Lilliefors

Dans Explorer, 374Test de McNemar

Tableaux croisés, 383Tests pour deux échantillons liés, 573

Page 838: SPSS Base Users Guide 14.0

812

Index

test de Scheffé

Dans ANOVA à 1 facteur, 429GLM, 445

Test de Shapiro-Wilks

Dans Explorer, 374Test de sphéricité de Bartlett

Dans Analyse factorielle, 514Test de Wilcoxon

Tests pour deux échantillons liés, 573Test des réactions extrêmes de Moses

Tests pour deux échantillons indépendants, 570Test des signes

Tests pour deux échantillons liés, 573Test exact de Fisher

Tableaux croisés, 383Test Kolmogorov-Smirnov pour un échantillon, 565

Distribution à tester, 565Fonctionnalités supplémentaires, 568Options, 567statistiques, 567Valeurs manquantes, 567

Test M de Box

Analyse discriminante, 500Test T

dans GLM - Univarié, 449Test T pour échantillon unique, 421Test T pour échantillons appariés, 418Test T pour échantillons indépendants, 413

Test t de Dunnett

Dans ANOVA à 1 facteur, 429GLM, 445

Test t de Sidak

Dans ANOVA à 1 facteur, 429GLM, 445

test t de Student, 413

Test t de Waller-Duncan

Dans ANOVA à 1 facteur, 429GLM, 445

Test t dépendant

Test T pour échantillons appariés, 418test t pour deux échantillons

Test T pour échantillons indépendants, 413Test T pour échantillon unique, 421

Fonctionnalités supplémentaires, 423Intervalles de confiance, 422Options, 422Valeurs manquantes, 422

Test T pour échantillons appariés, 418Options, 420Sélection de variables appariées, 418Valeurs manquantes, 420

Test T pour échantillons indépendants, 413Définition de groupes, 416Intervalles de confiance, 417Options, 417Valeurs manquantes, 417Variables chaîne, 416Variables de regroupement, 416

Tests d’homogénéité de la variance

Dans ANOVA à 1 facteur, 432dans GLM - Univarié, 449

Tests de colinéarité

Dans la régression linéaire, 483Tests de l’indépendance

Chi-deux, 383Tests de linéarité

Dans Moyennes, 402Tests de normalité

Dans Explorer, 374Tests non paramétriques

Chi-deux, 554

Page 839: SPSS Base Users Guide 14.0

813

Index

Suites en séquences, 561Test Kolmogorov-Smirnov pour un échantillon,565

Tests pour deux échantillons indépendants, 568Tests pour deux échantillons liés, 573Tests pour plusieurs échantillons indépendants,577

Tests pour plusieurs échantillons liés, 581Tests pour deux échantillons indépendants, 568

Définition de groupes, 571Fonctionnalités supplémentaires, 572Options, 572statistiques, 572Types de test, 570Valeurs manquantes, 572Variables de regroupement, 571

Tests pour deux échantillons liés, 573Fonctionnalités supplémentaires, 576Options, 576statistiques, 576Types de test, 575Valeurs manquantes, 576

Tests pour plusieurs échantillons indépendants, 577Définition de l’intervalle, 579Fonctionnalités supplémentaires, 580Options, 580statistiques, 580Types de test, 578Valeurs manquantes, 580Variables de regroupement, 579

Tests pour plusieurs échantillons liés, 581Fonctionnalités supplémentaires, 583statistiques, 583Types de test, 582

Texte, 49, 273, 279, 284, 301, 310, 341, 694Ajout au Résultats, 273

Ajout d’un fichier texte dans le Résultats, 273Création de résultats texte, 301Dans les cellules, 341Exportation d’un résultat en mode brouillon en

tant que texte, 310Exportation de résultat en tant que texte, 279,284, 694

Fichiers de données, 49Texte d’étiquette vertical, 315Texte de suite, 332

Pour les tableaux pivotants, 332Titres, 273

Ajout au Résultats, 273Dans les cubes OLAP, 412Diagrammes, 641

Tolérance

Dans la régression linéaire, 483Totaux, 708

Graissage automatique dans le résultat, 708Totaux généraux

Dans les tableaux de bord en colonnes, 611traitement d’un fichier scindé, 232Transformations conditionnelles, 165Transformations de données, 676

Calcul de variables, 163fonctions, 166Ordonnancement des observations, 178Recodage de valeurs, 172–174, 176, 181Retardement de l’exécution, 676Séries chronologiques, 203, 205Transformations conditionnelles, 165Variables chaîne, 166

Transformations de fichiers, 240–241Agrégation de données, 227Fusion des fichiers de données, 220, 224Pondération d’observations, 239

Page 840: SPSS Base Users Guide 14.0

814

Index

Restructuration des données, 240–241traitement d’un fichier scindé, 232Transposition des variables et des observations,219

Tri d’observations, 218Transposition de lignes et de colonnes, 313Transposition des variables et des observations, 219Tri d’observations, 218Tukey

Dans Explorer, 373types d’objet de sortie

dans OMS, 747Types de données, 101, 103, 115, 677

Définition, 101Devise personnalisée, 101, 677Formats d’affichage, 103Formats d’entrée, 103Modification, 115

U de Mann-Whitney

Tests pour deux échantillons indépendants, 570

V

Tableaux croisés, 383V de Crameré

Tableaux croisés, 383V de Rao

Analyse discriminante, 501Valeurs, 336

Format d’affichage des tableaux pivotants, 336Valeurs éloignées

Dans Explorer, 373Dans l’analyse TwoStep Cluster, 529Dans la régression linéaire, 478

valeurs extrêmes

Dans Explorer, 373

Valeurs influentes

Dans la régression linéaire, 479GLM, 447

Valeurs manquantes, 105Corrélations bivariées, 456Dans Analyse factorielle, 520Dans ANOVA à 1 facteur, 432Dans Corrélations partielles, 462Dans Courbe ROC, 650Dans Explorer, 376Dans la régression linéaire, 485Dans les suites en séquences, 564Dans les tableaux croisés des réponses multiples,593

Dans les tableaux de bord en colonnes, 611Dans les tableaux de bord en lignes, 601Dans les tableaux de fréquences des réponses

multiples, 588Dans Test Kolmogorov-Smirnov pour un

échantillon, 567Définition, 105Diagrammes, 642Fonctions, 167Remplacement dans des données de séries

chronologiques, 208Test binomial, 560Test du Chi-deux, 557Test T pour échantillon unique, 422Test T pour échantillons appariés, 420Test T pour échantillons indépendants, 417Tests pour deux échantillons indépendants, 572Tests pour deux échantillons liés, 576Tests pour plusieurs échantillons indépendants,580

Variables chaîne, 105Valeurs manquantes spécifiées par l’utilisateur, 105

Page 841: SPSS Base Users Guide 14.0

815

Index

Valeurs propres

Dans Analyse factorielle, 514–515Dans la régression linéaire, 483

Valeurs standardisées

Descriptives, 363Variable d’environnement SPSSTMPDIR, 660Variable de sélection

Dans la régression linéaire, 477Variables, 12, 98, 114–115, 241, 651, 653, 660

Affectation d’un nouveau nom aux fichiers de

données fusionnés, 223Boîtes de dialogue, 10Définition, 98Définition de groupes de variables, 653déplacement, 115Informations sur la définition, 651Informations sur les variables dans les boîtes de

dialogue, 13Insertion de nouvelles variables, 114Ordre d’affichage dans les boîtes de dialogue,660

Recodage, 172–174, 176, 181Restructuration en observations, 241Sélection dans des boîtes de dialogue, 12

Variables chaîne, 105, 110Boîtes de dialogue, 10Calcul de nouvelles variables chaîne, 166Recodage en nombres entiers consécutifs, 181Saisie de données, 110segmentation des chaînes longues dans les

versions précédentes, 73Valeurs manquantes, 105

Variables d’échelle

regroupement en bandes pour créer des variables

qualitatives, 150

Variables d’environnement, 660SPSSTMPDIR, 660

Variables de contrôle

Tableaux croisés, 382Variables de date

ajouter ou soustraire des variables date/heure,185

créer une variable date/heure à partir d’un

ensemble de variables, 185créer une variable date/heure à partir d’une

variable chaîne, 185Définition pour des données de séries

chronologiques, 203extraire une partie de la variable date/heure, 185

Variables de regroupement, 241Création, 241

Variance

Dans Effectifs, 358Dans Explorer, 373Dans les cubes OLAP, 408Dans les tableaux de bord en colonnes, 607Dans les tableaux de bord en lignes, 600Dans Moyennes, 402Dans Récapituler, 395Descriptives, 365

vecteurs multiréponses

Définition, 132Dichotomies multiples, 132Modalités multiples, 132

Viewer, 662, 665Affichage des étiquettes de valeurs, 665Affichage des étiquettes de variable, 665Affichage des noms de variable, 665Affichage des valeurs de données, 665exclusion de types de résultat avec OMS, 758Options d’affichage, 662

Page 842: SPSS Base Users Guide 14.0

816

Index

Viewer en mode brouillon, 301–303, 308–310,660, 663

Bordures de cellules, 303Bordures de colonnes, 303Bordures de lignes, 303Caractères de la boîte, 303Contrôle de l’affichage par défaut des résultats,660

Définition du type de Viewer par défaut, 302Enregistrement des résultats, 310Format de résultat, 303Impression, 308–309Modification des polices, 308Options d’affichage, 663

Vitesse, 79Mise en mémoire cache des données, 79

W de Kendall

Dans les tests pour plusieurs échantillons liés,582

Web, 706Publication de résultat, 706

XML

acheminement des résultats au format XML, 752enregistrement des résultats sous forme de

fichiers XML, 743résultat OXML depuis OMS, 775structure de tableau au format OXML, 769

XSLT

utilisation avec OXML, 775

Z de Kolmogorov-Smirnov

Dans Test Kolmogorov-Smirnov pour un

échantillon, 565Tests pour deux échantillons indépendants, 570