Download pdf - PASW Complex Samples 18 – Spécifications Produisez ... Complex Samples 18 F.pdf · PASW Complex Samples est disponible sous forme d’application cliente autonome, mais une version

Produisez facilement des statistiques d’échantillonnage avancées

PASW® Complex Samples 18 – Spécifications

Lorsque vous réalisez des enquêtes sur des échantillons,

utilisez un logiciel de statistiques spécialement conçu

pour produire des estimations exactes pour des données

d’échantillonnage complexes. PASW Complex Samples*

produit des statistiques avancées qui vous permettent de

calculer précisément des erreurs standard à partir de plans

d’échantillonnage complexes. Vous pouvez l’appliquer aux

domaines suivants :

n Enquêtes d’opinion : obtenez des statistiques descrip-

tives et inférentielles pour les données d’enquête

n Études de marché : analysez les données de satisfaction

de la clientèle

n Études médicales : analysez de vastes ensembles de

données sur des sujets médicaux tels que la santé et la

nutrition ou la consommation d’alcool et les accidents de

la route

n Sciences sociales : effectuez des recherches sur des

ensembles de données issues d’enquêtes

n Sondage d’opinion : caractérisez des attitudes sur des

questions politiques

PASW Complex Samples vous donne tout ce dont vous avez

besoin pour travailler avec des échantillons complexes. Il inclut :

n Un assistant d’échantillonnage intuitif qui vous guide pas

à pas tout au long du processus de conception d’un plan

et de tracé d’un échantillon

n Un assistant de préparation d’analyse convivial pour

vous aider à préparer les ensembles de données à usage

public qui ont été échantillonnés, comme les données

de la National Health Inventory Survey des Centers for

Disease Control and Prevention (CDC)

n Une prédiction des résultats numériques via le Modèle

linéaire général des échantillons complexes (CSGLM)

n Une prédiction des résultats ordinaux via la Régression

ordinale d’échantillons complexes (CSORDINAL)

n Une prédiction des résultats qualitatifs via la Régression

logistique d’échantillons complexes (CSLOGISTIC)

n La prédiction du délai d’un événement via la Régression

de Cox d’échantillons complexes (CSCOXREG)

Depuis la planification et l’échantillonnage jusqu’à l’analyse,

PASW Complex Samples permet d’obtenir facilement des

résultats précis et fiables. Puisque PASW Complex Samples

prend en compte jusqu’à trois états lors de l’analyse des

données d’un plan à plusieurs phases, vous parvenez à des

analyses plus précises. En plus de vous offrir la possibilité

d’évaluer l’impact de votre plan, PASW Complex Samples

dresse aussi un tableau plus précis de vos données parce

que les évaluations des sous-populations tiennent compte

d’autres sous-populations.

Vous pouvez utiliser les types d’informations de plans

d’échantillonnage suivants avec PASW Complex Samples :

n Échantillonnage stratifié : renforcez la précision de votre

échantillon ou assurez un échantillon représentatif à

partir de groupes-clés en choisissant d’échantillonner à

l’intérieur de sous-groupes de la population étudiée.

Par exemple, ces sous-groupes peuvent être un nombre

spécifique d’hommes ou de femmes, ou contenir

des personnes appartenant à certaines catégories

professionnelles ou à une certaine tranche d’âge.

* PASW Complex Samples et PASW Statistics Base, anciennement nommés SPSS Complex Samples™ et SPSS Statistics Base, font partie de la gamme Predictive Analytics Software de SPSS Inc.

n Échantillonnage en grappes : sélectionnez des classes, qui

sont des groupes d’unités d’échantillonnage, pour votre

enquête. Ces classes peuvent inclure des écoles, des

hôpitaux ou des zones géographiques avec comme

unités d’échantillonnage des étudiants, des patients ou

des citoyens. Cette technique permet souvent de réaliser

des enquêtes plus économiques.

n L’échantillonnage à plusieurs phases : sélectionnez un

échantillon initial ou de première phase basé sur des

groupes d’éléments de la population, puis créez un échan-

tillon de seconde phase en extrayant un sous-échantillon

de chaque unité sélectionnée dans l’échantillon de pre-

mière phase. En répétant cette opération, vous pouvez

sélectionner un échantillon de phase supérieure.

Chaque module de la famille PASW Statistics peut désormais

être installé et exécuté séparément ou conjointement avec

d’autres modules. PASW® Statistics Base* n’est plus néces-

saire, car des fonctionnalités telles que l’accès et la gestion

des données et la création de graphiques ont été ajoutées à

tous les modules. Cela vous donne une plus grande flexibilité

dans l’installation et l’utilisation de ce logiciel polyvalent. PASW

Statistics Base est toujours disponible et reste à la base de

beaucoup de déploiements, car il contient des procédures et

des tests statistiques fondamentaux pour beaucoup d’analyses.

Obtenez des résultats précis et sûrs

En tant que spécialiste des enquêtes, vous voulez avoir confi-

ance dans vos résultats. Les logiciels de statistiques classiques

supposent que vos données proviennent d’un échantillonnage

aléatoire simple. Cependant, dans la plupart des enquêtes

à grande échelle, l’échantillonnage aléatoire simple n’est

généralement ni faisable ni économique. Analyser des données

de tels échantillons avec des statistiques classiques risque

de produire des résultats incorrects. Par exemple, les erreurs

standard estimées des statistiques sont souvent trop petites,

ce qui vous donne une fausse impression de précision. PASW

Complex Samples vous permet d’obtenir des inférences statis-

tiquement valides pour des populations mesurées dans vos

données d’échantillons complexes parce qu’il intègre le plan

d’échantillonnage dans l’analyse de l’enquête.

Travaillez efficacement et facilement

Seul PASW Complex Samples vous permet de comprendre

et d’exploiter facilement les résultats de vos enquêtes

réalisées sur des échantillons complexes. Grâce à l’interface

intuitive, vous pouvez analyser les données et interpréter

les résultats. Lorsque vous avez terminé, vous pouvez

publier des ensembles de données et inclure vos plans

d’échantillonnage ou d’analyse. Chaque plan fait office de

modèle et vous permet d’enregistrer toutes les décisions

prises lors de sa création. Cela vous fait gagner du temps

et améliore la précision, tant pour vous que pour ceux qui

pourraient vouloir utiliser vos plans avec les données, soit

pour reproduire les résultats soit pour continuer là où vous

vous êtes arrêté.

Une épicerie souhaite déterminer si la fréquence à laquelle les clients effectuent leurs achats a un lien avec la somme dépensée, en contrôlant le sexe du client et en intégrant un plan d’échantillonnage. Tout d’abord, le magasin spécifie le plan d’échantillonnage utilisé dans l’Assistant de préparation d’analyse (en haut). Ensuite, le magasin configure le modèle dans le Modèle linéaire général des échantillons complexes (en bas).

2

PASW Complex Samples est disponible sous forme

d’application cliente autonome, mais une version serveur

est également disponible pour de meilleures performances.

Tirez un meilleur parti grâce à la collaboration

Pour partager et réutiliser efficacement les ressources,

protégez-les conformément aux exigences de conformité

internes et externes et publiez les résultats de manière à

ce qu’un plus grand nombre d’utilisateurs professionnels

puisse les voir et interagir avec. Pourquoi ne pas enrichir

votre logiciel PASW Statistics avec PASW® Collaboration

and Deployment Services (anciennement SPSS Predictive

Enterprise Services™) ? Vous aurez plus d’informations

sur ces précieuses fonctionnalités en téléchargeant

la brochure « Collaboration » sur www.spss.com/fr/

software/deployment/cds.

Pour commencer à travailler avec PASW Complex Samples,

utilisez les assistants, qui vous guident face aux nombreux

facteurs à prendre en considération. Si vous créez vos

propres échantillons, utilisez l’assistant d’échantillonnage

pour définir le schéma d’échantillonnage. Si vous utilisez

des ensembles de données qui ont été échantillonnés,

utilisez l’assistant de préparation d’analyse pour spécifier

la façon dont les échantillons ont été définis et comment

estimer les erreurs standard. Une fois que vous avez créé

un échantillon ou spécifié les erreurs standard, vous pouvez

créer des plans, analyser vos données et produire des résul-

tats (voir organigramme ci-dessus).

PASW Complex Samples permet d’apprendre et de travailler

facilement. Utilisez le système d’aide en ligne, explorez les

études de cas interactives ou exécutez le tutoriel en ligne

pour savoir comment vous servir de vos données avec le

logiciel. Avec PASW Complex Samples, vous pouvez :

n Parvenir à des estimations de points correctes pour les

statistiques telles que totaux, moyennes et rapports

n Obtenir les erreurs standard de ces statistiques

n Produire des intervalles de confiance et des tests

d’hypothèses corrects

n Prédire des résultats numériques

n Prédire des résultats ordinaux

n Prédire des résultats catégoriels

n Prédire le délai d’un événement

Assistant de plan d’échantillonnage

Assistant de préparation d’analyse

Fichiers du plan

Analyse des données

Résultats

Analyse précise des données d’enquête

Lorsque vous collectez des données :� Spécifiez l’échantillonnage� Dessinez l’échantillon

Lorsque vous travaillez avec des ensembles de données à usage public :� Spécifiez la façon dont l’échantillon a été dessiné

� Enregistrez et partagez avec vos collègues

� Analyse descriptive : mesurer les types continus, y compris les rapports� Analyse croisée : mesurer les types catégoriels, y compris les tableaux croisés� Modèle linéaire général des échantillons complexes : prédire les résultats numériques� Régression ordinale d’échantillons complexes : prédire les résultats ordinaux� Régression logistique d’échantillons complexes : prédire les résultats catégoriels� Régression de Cox d’échantillons complexes : prédire le délai d’un événement

L’analyse précise des données d’enquête est facile dans PASW Complex Samples. Commencez avec l’un des assistants (choisissez lequel selon votre source de données), puis utilisez l’interface interactive pour créer des plans, analyser des données et interpréter les résultats.

3

FonctionsComplex Samples Plan (CSPLAN)

Cette procédure fournit un point d’entrée général

pour spécifier la base d’échantillonnage afin de

créer un plan d’échantillonnage complexe ou une

spécification d’analyse utilisable par les autres

procédures du module PASW Complex Samples.

CSPLAN n’extrait pas l’échantillon et n’analyse

pas les données. Pour échantillonner les observa-

tions, utilisez un plan d’échantillonnage créé par

CSPLAN comme entrée de la procédure CSSELECT

(décrite à la page suivante). Pour analyser les

données d’échantillons, utilisez un plan d’analyse

créé par CSPLAN comme entrée des procédures

CSDESCRIPTIVES, CSTABULATE, CSGLM, CSLOGISTIC

et CSORDINAL (décrites aux pages suivantes).

n Créez un plan d’échantillonnage : utilisez-le pour

extraire des unités d’échantillonnage du fichier actif

n Créez un plan d’analyse : utilisez-le pour analy-

ser un échantillon complexe

n Lorsque vous créez un plan d’échantillonnage, la

procédure enregistre automatiquement un plan

d’analyse approprié dans le fichier de plan. Un

fichier de plan est créé pour concevoir un échan-

tillon et peut donc être utilisé à la fois pour la

sélection et pour l’analyse de l’échantillon.

n Affichez un plan d’échantillonnage ou un plan

d’analyse

n Spécifiez le plan dans un fichier externe

n Nommez les variables à créer au niveau du plan

lorsque vous extrayez un échantillon ou l’utilisez

comme entrée du processus de sélection ou

d’estimation avec la sous-commande PLANVARS

– Spécifiez les pondérations d’échantillon

finales pour chaque unité à utiliser par les

procédures d’analyse PASW Complex Samples

dans le processus d’estimation

– Indiquez les pondérations d’échantillon

générales qui seront générées lorsque le

plan d’échantillonnage sera exécuté dans la

procédure CSSELECT

– Sélectionnez les pondérations à utiliser lors

du calcul des pondérations d’échantillon

finales dans un plan à plusieurs phases

n Contrôlez la sortie de la procédure CSPLAN à

l’aide de la sous-commande PRINT

– Affichez un résumé des spécifications du plan

dans lequel la sortie reflète vos spécifications

à chaque étape du plan

– Affichez un tableau montrant les spécifica-

tions MATRIX

n Signalez les étapes du plan avec la commande

DESIGN. Vous pouvez aussi utiliser cette sous-com-

mande pour définir des variables de stratification

et des variables de classe ou créer des étiquettes

descriptives pour des étapes particulières.

n Spécifiez la méthode d’extraction d’échantillon à

l’aide de la sous-commande METHOD. Choisissez

parmi diverses méthodes de probabilité égale

et inégale, notamment l’échantillonnage

aléatoire simple ou systématique. Des

méthodes d’échantillonnage avec probabilité

proportionnelle à la taille (PPS) sont également

disponibles. Les unités peuvent être extraites

avec remplacement (WR) ou sans remplacement

(WOR) à partir de la population.

– SIMPLE_WOR : Sélection d’unités avec

probabilité égale. Extraction d’unités

sans remplacement.

– SIMPLE_WR : Sélection d’unités avec

probabilité égale. Extraction d’unités

avec remplacement.

– SIMPLE_SYSTEMATIC : Sélection d’unités

à intervalle fixe via la strate ou la base

d’échantillonnage. Un point de départ aléatoire

est choisi à l’intérieur du premier intervalle.

– SIMPLE_CHROMY : Sélection d’unités

l’une après l’autre avec probabilité égale.

Extraction d’unités sans remplacement.

– PPS_WOR : Sélection d’unités avec proba-

bilité proportionnelle à la taille. Extraction

d’unités sans remplacement.

– PPS_WR : Sélection d’unités avec probabilité

proportionnelle à la taille. Extraction d’unités

avec remplacement.

– PPS_SYSTEMATIC : Sélection d’unités par

échantillonnage aléatoire systématique avec

probabilité proportionnelle à la taille.

Extraction d’unités sans remplacement.

– PPS_CHROMY : Sélection séquentielle

d’unités avec probabilité proportionnelle à la

taille. Extraction d’unités sans remplacement.

– PPS_BREWER : Sélectionnez deux unités de

chaque strate avec probabilité proportion-

nelle à la taille. Extraction d’unités sans rem-

placement.

– PPS_MURTHY : Sélectionnez deux unités

de chaque strate avec probabilité propor-

tionnelle à la taille. Extraction d’unités sans

remplacement.

– PPS_SAMPFORD : Extension de la méthode

Brewer pour sélectionner plus de deux unités

de chaque strate avec probabilité proportion-

nelle à la taille. Extraction d’unités sans

remplacement.

– Contrôle du nombre ou du pourcentage

d’unités à extraire : défini à chaque étape

du plan. Vous pouvez aussi choisir des vari-

ables de sortie, comme des pondérations

d’échantillonnage au niveau de chaque étape,

qui sont créées lors de l’exécution du plan.

– Méthodes d’estimation : Avec remplacement,

probabilité égale sans remplacement dans

un premier temps et probabilité inégale sans

remplacement

– Vous pouvez choisir d’inclure ou pas la

correction de la population finie lors de

l’estimation de la variance dans le cadre

d’un échantillonnage aléatoire simple (SRS)

– Estimation de probabilité inégale sans rem-

placement : requête dans la première étape

seulement

– Spécification des variables : Spécifiez les

variables d’entrée du processus d’estimation,

notamment les pondérations d’échantillon

générales et les probabilités d’inclusion

n Spécifiez le nombre d’unités d’échantillonnage

extraites lors de l’étape actuelle à l’aide de la

sous-commande SIZE

n Spécifiez le pourcentage d’unités extraites

à l’étape actuelle. Par exemple, spécifiez la

fraction d’échantillonnage à l’aide de la sous-

commande RATE.

n Spécifiez le nombre minimum d’unités

extraites lorsque vous spécifiez RATE. Cela est

utile lorsque le taux d’échantillonnage d’une

strate particulière est très bas en raison de

l’arrondissement.

n Spécifiez le nombre maximum d’unités à

extraire lorsque vous spécifiez RATE. Cela est

utile lorsque le taux d’échantillonnage d’une

strate particulière est plus élevé que prévu

en raison de l’arrondissement.

n Spécifiez la mesure de la taille des unités de

population dans un plan PPS. Spécifiez une

variable qui contient les tailles ou demandez

que les tailles soient déterminées lorsque

la procédure CSSELECT explore la base

d’échantillonnage.

n Obtenez des variables d’information sur

l’échantillon au niveau de chaque étape

lorsque vous exécutez un plan

d’échantillonnage à l’aide de la sous-

commande STAGEVARS. Vous pouvez obtenir :

– La proportion d’unités extraites de la

population à une étape particulière en

utilisant les probabilités d’inclusion

(sélection) au niveau de chaque étape

– Les étapes précédentes utilisant la

pondération d’échantillonnage cumulée

pour une étape donnée

– Les unités identifiées de façon unique qui

ont été sélectionnées plus d’une fois lorsque

votre échantillon est créé avec remplacement,

avec un indice de duplication pour les unités

sélectionnées dans une étape donnée

– La taille de la population pour une étape

donnée

– Le nombre d’unités extraites à une étape

donnée

– Le taux d’échantillonnage au niveau de l’étape

– La pondération d’échantillonnage pour une

étape donnée

4

n Choisissez une méthode d’estimation pour

l’étape actuelle avec la sous-commande

ESTIMATOR. Vous pouvez indiquer :

– Les probabilités de sélection égales sans

remplacement

– Les probabilités de sélection inégales sans

remplacement

– La sélection avec remplacement

n Spécifiez la taille de population pour chaque

élément de l’échantillon avec la sous-commande

POPSIZE

n Spécifiez la proportion d’unités extraites de la

population à une étape donnée avec la sous-

commande INCLPROB

Complex Samples Selection (CSSELECT)CSSELECT sélectionne des échantillons complexes

basés sur des probabilités à partir d’une population.

Il choisit des unités selon un plan d’échantillonnage

créé via la procédure CSPLAN.

n Contrôlez la portée d’exécution et spécifiez une

valeur de générateur avec la sous-commande

CRITERIA

n Décidez si les valeurs manquantes utilisateur

des variables de stratification et de classification

doivent être traitées comme des valeurs valides

avec la sous-commande CLASSMISSING

n Utilisez le générateur de nombre aléatoire

Mersenne Twister le plus récent pour sélection-

ner l’échantillon

n Spécifiez les options générales concernant les

fichiers d’entrée et de sortie avec la sous-com-

mande DATA

– Choisissez de renommer les variables

existantes lorsque la procédure CSSELECT écrit

les variables de pondération d’échantillon et

les variables de sortie au niveau des étapes

demandées dans le fichier de plan, telles que

les probabilités d’inclusion

n Générez des unités échantillonnées dans un

fichier externe en utilisant une option pour

conserver/éliminer les variables spécifiées

n Enregistrez automatiquement les probabilités

d’inclusion jointes de la première étape dans un

fichier externe lorsque le fichier de plan spécifie

une méthode d’échantillonnage PPS_WR

n Choisissez de générer des fichiers texte conte-

nant une règle qui décrit les caractéristiques des

unités sélectionnées

n Contrôlez l’affichage de la sortie via la sous-

commande PRINT

– Résumez la distribution des cas sélectionnés

parmi les strates. L’information est rapportée

par étape de plan.

– Générez un résumé du traitement des cas

Complex Samples Descriptives (CSDESCRIPTIVES)CSDESCRIPTIVES estime les moyennes, sommes

et rapports, et calcule leurs erreurs standard,

les effets de plan, les intervalles de confiance

et les tests d’hypothèses pour des échantillons

extraits par des méthodes d’échantillonnage

complexes. La procédure estime les variances

en prenant en compte le plan d’échantillonnage

utilisé pour sélectionner l’échantillon, y compris

les méthodes de probabilité égale et PPS, ainsi

que les procédures d’échantillonnage WR et WOR.

CSDESCRIPTIVES peut également effectuer des

analyses de sous-populations.

n Spécifiez le nom d’un fichier de plan, qui est

écrit par la procédure CSPLAN, contenant les

spécifications du plan d’analyse avec la sous-

commande PLAN

n Spécifiez les noms des fichiers des probabilités

d’inclusion jointes

n Spécifiez les variables d’analyse utilisées par

les sous-commandes MEAN et SUM en utilisant

la sous-commande SUMMARY

n Demandez l’estimation des moyennes et des

sommes pour les variables spécifiées sur la

sous-commande SUMMARY via les sous-com-

mandes MEAN et SUM

– Demandez des tests t pour la ou les moyenne(s)

et somme(s) de population et donnez la ou les

valeur(s) d’hypothèse nulle(s) via le mot-clé

TTEST. Si vous définissez des sous-populations

à l’aide de la sous-commande SUBPOP, les

valeurs d’hypothèse nulle seront utilisées dans

le ou les test(s) pour chaque sous-population,

ainsi que pour la population toute entière.

n Demandez que les rapports soient estimés pour

les variables spécifiées sur la sous-commande

SUMMARY via la sous-commande RATIO

– Demandez des tests t des rapports de

population et donnez la ou les valeur(s)

d’hypothèse nulle(s) via le mot-clé TTEST

n Associez la syntaxe aux estimations de moy-

enne, de somme ou de rapport, notamment :

– le nombre d’observations valides dans

l’ensemble de données pour chaque estima-

tion de moyenne, de somme ou de rapport

– la taille de la population pour chaque estima-

tion de moyenne, de somme ou de rapport

– l’erreur standard pour chaque estimation de

moyenne, de somme ou de rapport

– le coefficient de variation

– les effets de plan

– la racine carrée des effets de plan

– l’intervalle de confiance

n Spécifiez les sous-populations pour lesquelles

les analyses doivent être effectuées à l’aide de

la sous-commande SUBPOP

– Affichez les résultats pour toutes les sous-

populations dans le même tableau ou dans

un tableau séparé

n Spécifiez comment gérer les données

manquantes

– Basez chaque statistique sur toutes les

données valides pour la ou les variable(s)

d’analyse utilisée(s) dans le calcul de la

statistique. Calculez les rapports en utilisant

toutes les observations avec des données

valides pour les deux variables spécifiées.

Vous pouvez baser les statistiques de dif-

férentes variables sur différentes tailles

d’échantillon.

– Utilisez uniquement les observations

avec des données valides pour toutes

les variables d’analyse lors du calcul des

statistiques. Basez toujours les statistiques

pour différentes variables sur la même taille

d’échantillon.

– Excluez les valeurs manquantes utilisateur

parmi les variables de strate, de classe et de

sous-population

– Incluez les valeurs manquantes utilisateur

parmi les variables de strate, de classe et

de sous-population Traitez les valeurs man-

quantes utilisateur pour ces variables comme

des données valides.

Complex Samples Tabulate (CSTABULATE)CSTABULATE affiche des tableaux de fréquence à

1 facteur ou des tableaux à double entrée et les

erreurs standard, les effets de plan, les intervalles

de confiance et les tests d’hypothèse associés

pour les échantillons extraits à l’aide de méth-

odes d’échantillonnage complexes. La procédure

estime les variances en prenant en compte le

plan d’échantillonnage utilisé pour sélection-

ner l’échantillon, y compris les méthodes de

probabilité égale et PPS, ainsi que les procédures

d’échantillonnage WR et WOR. CSTABULATE peut

aussi créer des tableaux pour des sous-populations.

n Spécifiez le nom d’un fichier XML, écrit par la

procédure CSPLAN, contenant le plan d’analyse

avec la sous-commande PLAN

n Spécifiez le nom de fichier des probabilités

d’inclusion jointes

n Utilisez les statistiques suivantes à l’intérieur

du tableau :

– Taille de population : estimation de la taille

de population pour chaque cellule et valeur

marginale dans un tableau

– Erreur standard : Calculez l’erreur standard

pour chaque estimation de taille de population

n Pourcentages des lignes et colonnes : Exprimez

l’estimation de taille de population pour chaque

cellule dans une ligne ou une colonne en tant

que pourcentage de l’estimation de taille de

population pour cette ligne ou colonne. Cette

fonctionnalité est disponible pour les tableaux

à double entrée.

– Pourcentages de tableau : Exprimez la taille

de population dans chaque cellule d’un tab-

leau en tant que pourcentage de l’estimation

de taille de population pour ce tableau 5Fonctions susceptibles de changer en fonction de la version finale du produit.

– Coefficient de variation

– Effets de plan

– Racine carrée des effets de plan

– Intervalle de confiance : spécifiez un nombre

entre zéro et 100 comme intervalle de confiance

– Nombres non pondérés : utilisez des nombres

non pondérés comme nombre d’observations

valides dans l’ensemble de données pour

chaque estimation de taille de population

– Estimations de taille de population cumulées :

utilisez les estimations de taille de population

cumulées seulement pour les tableaux de

fréquence à 1 facteur

– Pourcentages cumulés : utilisez les pourcent-

ages cumulés correspondant aux estimations

de taille de population seulement pour les

tableaux de fréquence à 1 facteur

– Estimations de taille de population prévues :

utilisez les estimations de taille de population

prévues si les estimations de taille de

population de chaque cellule des deux

variables du tableau à double entrée sont

statistiquement indépendantes. Cette

fonctionnalité est disponible seulement

pour les tableaux à double entrée.

– Résidus : montrez la différence entre les

estimations de taille de population observées

et prévues dans chaque cellule. Cette fonc-

tionnalité est disponible seulement pour les

tableaux à double entrée.

– Résidus de Pearson : Cette fonctionnalité

est disponible seulement pour les tableaux

à double entrée.

– Résidus de Pearson ajustés : Cette

fonctionnalité est disponible seulement

pour les tableaux à double entrée.

n Utilisez les statistiques et tests suivants pour le

tableau tout entier :

– Test des proportions homogènes

– Test d’indépendance

– Odds ratio

– Risque relatif

– Différence de risque

n Spécifiez les sous-populations pour lesquelles

les analyses doivent être effectuées à l’aide de

la sous-commande SUBPOP

– Affichez les résultats pour toutes les

sous-populations dans le même tableau

ou dans un tableau séparé

n Spécifiez comment gérer les données manquantes

– Visualisez chaque tableau sur toutes les don-

nées valides pour la ou les variable(s) de tab-

leau utilisée(s) dans la création du tableau. Vous

pouvez construire les tableaux pour différentes

variables sur différentes tailles d’échantillon.

– Utilisez uniquement des observations

avec des données valides pour toutes les

variables de tableau lors de la création des

tableaux. Visualisez toujours les tableaux

pour différentes variables sur la même

taille d’échantillon.

– Excluez les valeurs manquantes utilisateur

parmi les variables de strate, de classe et de

sous-population

– Incluez les valeurs manquantes utilisateur

parmi les variables de strate, de classe et

de sous-population Traitez les valeurs man-

quantes utilisateur pour ces variables comme

des données valides.

Complex Samples General Linear Model (CSGLM)Cette procédure vous permet de créer des modèles de

régression linéaire, d’analyse de variance (ANOVA) et

d’analyse de covariance (ANCOVA) pour des échantil-

lons extraits à l’aide de méthodes d’échantillonnage

complexes. La procédure estime les variances en pre-

nant en compte le plan d’échantillonnage utilisé pour

sélectionner l’échantillon, y compris les méthodes

de probabilité égale et PPS, ainsi que les procédures

d’échantillonnage WR et WOR. CSGLM peut égale-

ment effectuer des analyses de sous-populations.

n Modèles

– Effets principaux

– Toutes les interactions à n facteurs

– Entièrement croisés

– Personnalisés, incluant des termes emboîtés

n Statistiques

– Paramètres du modèle : estimations de coeffi-

cient, erreur standard pour chaque estimation

de coefficient, test t pour chaque estimation

de coefficient, intervalle de confiance pour

chaque estimation de coefficient, effet de

plan pour chaque estimation de coefficient

et racine carrée de l’effet de plan pour chaque

estimation de coefficient

– Moyennes de population des variables

dépendantes et des covariables

– Ajustement du modèle

– Informations sur le plan d’échantillonnage

n Tests d’hypothèse

– Statistiques de test : test F de Wald, test F

de Wald ajusté, test khi-deux de Wald et test

khi-deux de Wald ajusté

– Ajustement pour comparaisons multiples :

différence la moins significative, Bonferroni,

Bonferroni séquentiel, Sidak et Sidak

séquentiel

– Degrés de liberté d’échantillonnage : basés

sur le plan d’échantillonnage ou fixés par

l’utilisateur

n Moyennes estimées : Demande les moyennes

marginales estimées pour des facteurs et des

interactions du modèle

– Contrastes : simples, déviation, Helmert,

répétés ou polynomiaux

n Les variables du modèle peuvent être enregistrées

dans le fichier actif et/ou exportées vers des

fichiers externes qui contiennent les matrices

de paramètres

– Variables : valeurs prédites et résidus

– La matrice de covariance de paramètres et

ses autres statistiques, ainsi que la matrice

de corrélation de paramètres et ses autres

statistiques, peuvent être exportées en tant

que fichier de données PASW Statistics

– Les estimations de paramètres et/ou la

matrice de covariance de paramètres peuvent

être exportées vers un fichier XML

n Sortie


(telles que les strates et les unités de sond-

age de premier degré)

– Estimations du coefficient de régression et

tests t

– Informations récapitulatives sur la variable

dépendante, les covariables et les facteurs

– Informations récapitulatives sur l’échantillon,

notamment le nombre non pondéré et la taille

de population

– Limites de confiance pour les estimations

de paramètres et les niveaux de confiance

spécifiés par l’utilisateur

– Test F de Wald pour les effets de modèle

– Effets de plan

– R2 multiple

– Ensemble de matrices de coefficients de

contraste (L)

– Matrice de variance-covariance des

estimations du coefficient de régression

– Erreur quadratique moyenne

– Matrices de covariance et de corrélation

pour les coefficients de régression

n Gestion des données manquantes

– Suppression des valeurs manquantes

Listwise

n Autres

– Dénominateur spécifié par l’utilisateur, df,

utilisé dans le calcul des valeurs p pour

toutes les statistiques de test

– Diagnostics de colinéarité

– Le modèle peut être adapté à des

sous-populations

Complex Samples Ordinal (CSORDINAL) CSORDINAL effectue une analyse de régression

sur une variable dépendante polytomique binaire

ou ordinale en utilisant la fonction de lien cumulé

sélectionnée pour les échantillons extraits à l’aide

de méthodes d’échantillonnage complexes. La

procédure estime les variances en prenant en

compte le plan d’échantillonnage utilisé pour

sélectionner l’échantillon, y compris les méthodes

de probabilité égale et PPS, ainsi que les procé-

dures d’échantillonnage WR et WOR. CSORDINAL

peut également effectuer des analyses pour une

sous-population.

n Modèles




– Personnalisés, incluant des termes emboîtés6

n Statistiques :

– Paramètres du modèle : estimations de

coefficient, estimations exponentielles,

erreur standard pour chaque estimation




plan pour chaque estimation de coefficient,

racine carrée de l’effet de plan pour chaque

estimation de coefficient, covariances des

estimations de paramètres et corrélations

des estimations de paramètres

– Ajustement du modèle : pseudo R2 et tableau

de classification

– Tests des lignes parallèles : tests de Wald

d’égalité des pentes, estimations de

paramètres pour le modèle généralisé (pentes

inégales) et covariances des estimations

de paramètres pour le modèle généralisé

(pentes inégales)

– Statistiques récapitulatives pour les variables

de modèle



– Statistiques de test : test F de Wald, test F

de Wald ajusté, test khi-deux de Wald et

test khi-deux de Wald ajusté



Bonferroni séquentiel, Sidak et Sidak

séquentiel



l’utilisateur

n Les variables de modèle peuvent être

enregistrées dans le fichier actif et/ou

exportées vers des fichiers externes qui

contiennent les matrices de paramètres

– Variables : catégorie prédite, probabilité de

catégorie prédite, probabilité de catégorie

observée, probabilités cumulées (une vari-

able par catégorie), probabilités prédites

(une variable par catégorie)

– Exportez en tant que fichier de données

PASW : matrice de covariance des paramètres

et autres statistiques, matrice de corrélation

des paramètres et autres statistiques

– Exportation en tant que XML : estimations de

paramètres et/ou matrice de covariance de

paramètres vers un fichier XML

n Trois méthodes d’estimation : Newton-Raphson,

Fisher Scoring et Fisher Scoring suivie de

Newton-Raphson

n Fonction de lien cumulé pour spécifier le modèle :

Cauchit, log-log complémentaire, logit, log-log

négatif et probit

n Odds ratios cumulés pour le ou les facteur(s)

ou la ou les covariable(s) spécifiés. La

sous-commande est uniquement disponible

pour le lien LOGIT.

n Sortie


(telles que les strates et les unités de

sondage de premier degré)





de population


de paramètres et niveaux de confiance


– Statistiques récapitulatives du modèle

– Test F de Wald, test F de Wald ajusté, test

khi-deux de Wald et test khi-deux de Wald

ajusté pour les effets de modèle

– Effets de plan

– Tableau de classification


contraste (L)



– Tableau général des fonctions estimables

– Matrice de corrélation pour les coefficients

de régression



Listwise

n Autres





– Adaptation du modèle à une sous-population

Complex Samples Logistic Regression (CSLOGISTIC)Cette procédure effectue une analyse de régression

logistique binaire, ainsi qu’une analyse de régression

logistique multinomiale (MLR), pour les échantillons

extraits à l’aide de méthodes d’échantillonnage

complexes. CSLOGISTIC estime les variances en

prenant en compte le plan d’échantillonnage utilisé

pour sélectionner l’échantillon, y compris les

méthodes de probabilité égale et PPS, ainsi que

les procédures d’échantillonnage WR et WOR.

CSLOGISTIC peut également effectuer des analyses

pour des sous-populations.

n Modèles





n Statistiques







plan pour chaque estimation de coefficient,

racine carrée de l’effet de plan pour chaque

estimation de coefficient, covariances des

estimations de paramètres et corrélations


– Ajustement du modèle : pseudo R2 et tableau

de classification

– Statistiques récapitulatives pour les variables

de modèle



– Statistiques de test : test F de Wald, test F de

Wald ajusté, test khi-deux de Wald et

test khi-deux de Wald ajusté

n Ajustement pour comparaisons multiples :


Bonferroni séquential, Sidak et Sidak séquentiel

n Degrés de liberté d’échantillonnage : basés sur

le plan d’échantillonnage ou fixé par l’utilisateur

n Les variables du modèle peuvent être enregis-

trées dans le fichier actif et/ou exportées vers

des fichiers externes qui contiennent les matri-

ces de paramètres

– Variables : catégorie prédite et probabilités

prédites

– La matrice de covariance de paramètres et

ses autres statistiques, ainsi que la matrice

de corrélation de paramètres et ses autres

statistiques, peuvent être exportées en tant

que fichier de données PASW Statistics

– Les estimations de paramètres et/ou la

matrice de covariance de paramètres peuvent

être exportées vers un fichier XML

n Sortie


(telles que les strates et les unités de

sondage de premier degré)





de population


de paramètres et les niveaux de confiance


– Statistiques récapitulatives du modèle

– Test F de Wald pour les effets de modèle

– Effets de plan

– Tableau de classification


contraste (L)



– Erreur quadratique moyenne

– Matrices de covariance et de corrélation

pour les coefficients de régression7Fonctions susceptibles de changer en fonction de la version finale du produit.



Listwise

n Autres





– Le modèle peut être adapté à des

sous-populations

Complex Samples Cox Regression (CSCOXREG)**Cette procédure applique la régression des hasards

proportionnels de Cox à l’analyse des temps de

survie, c’est-à-dire au délai précédant la survenue

d’un événement, pour les échantillons extraits à

l’aide de méthodes d’échantillonnage complexes.

CSCOXREG prend en charge les prédicteurs continus

et qualitatifs, qui peuvent être chronologiques.

CSCOXREG offre un moyen facile de tenir compte des

différences dans les sous-groupes et d’analyser les

effets d’un ensemble de prédicteurs. Par ailleurs, la

procédure gère les données où il y a de multiples

cas (comme les visites de patients, les rencontres

et les observations) pour un seul sujet.

n Temps et événement : spécifiez les variables de

temps de survie et les valeurs qui indiquent que

l’événement étudié s’est produit

– Temps de survie

n Début de l’intervalle (commencement

du risque)

– Temps 0

– Varie par sujet

n Fin de l’intervalle

n Événement en tant que valeurs

individuelles ou plage de valeurs

n Prédicteurs :

– Facteurs

– Covariables

– Prédicteurs chronologiques

n Sous-groupes : stratifiez l’analyse et/ou

limitez-la à une sous-population particulière.

n Modèles




n Statistiques :


– Résumé de l’événement et de la censure

– Risque défini au moment de l’événement







plan pour chaque estimation de coefficient

et racine carrée de l’effet de plan pour chaque

estimation de coefficient, estimations des

covariances de paramètres et corrélations


– Hypothèses de modèle

n Test des hasards proportionnels

n Estimations de paramètres pour modèle

alternatif

n Matrice de covariance pour modèle alternatif

– Fonctions de survie et de hasard cumulé de

base

n Diagrammes :

– Fonction de survie

– Fonction de hasard

– Log moins log de la fonction de survie

– Un moins la fonction de survie

– Option pour afficher les intervalles de confiance

– Facteurs et covariables des diagrammes à des

niveaux spécifiés


– Statistiques de test : test F, test F ajusté, test

khi-deux. Test khi-deux ajusté



Bonferroni séquentiel, Sidak et Sidak séquentiel



l’utilisateur

n Enregistrez les variables du modèle sur le fichier

actif et/ou exportez les fichiers externes qui

contiennent les matrices de paramètres

– Variables : fonction de survie, limite inférieure

de l’intervalle de confiance pour la fonction

de survie, limite supérieure de l’intervalle de

confiance pour la fonction de survie, fonction

de hasard cumulé, limite inférieure de l’intervalle

de confiance pour la fonction de hasard cumulé,

limite supérieure de l’intervalle de confiance pour

la fonction de hasard cumulé, valeur prédite de

prédicteur linéaire, résidu de Schoenfeld (une

variable par paramètre de modèle), résidu de

Martingale, résidu de déviance, résidu de Cox-

Snell, résidu de score (une variable par paramètre

de modèle), intervalle pour la fonction de hasard

cumulé, résidu (une variable par paramètre

de modèle), résidu de Martingale agrégé,

résidu de déviance agrégé, résidu de Cox Snell

agrégé, résidu de Score agrégé (une variable par

paramètre de modèle) et résidu DFBETA agrégé

(une variable par paramètre de modèle)

n Exportez le modèle et/ou la fonction de survie

– Exportez en tant que fichier de données

PASW Statistics

– Exportez la fonction de survie en tant que

fichier de données PASW Statistics

– Exportez le modèle en tant que fichier XML

n Options pour spécifier les critères d’estimation,

méthodes de calcul des fonctions de survie

et des intervalles de confiance, et gestion des

valeurs manquantes utilisateur

– Estimation : maximum des itérations,

nombre maximum de dichotomies, limiter

les itérations basées sur les changements

dans les estimations de paramètres, limiter

les itérations basées sur les changements

dans les rapports de log-vraisemblance,

afficher l’historique des itérations et

méthode de départage pour l’estimation

des paramètres (Efron ou Breslow)

– Fonction de survie : méthode d’estimation

des fonctions de survie de base (Efron,

Breslow ou produit-limite) et intervalles de

confiance des fonctions de survie (unités

transformées ou originales)

– Spécifiez l’intervalle du niveau de confiance

– Gestion des données manquantes (traitées

comme valides ou invalides)

Configuration requisen La configuration requise varie selon la

plateforme. Pour plus de détails, voir

www.spss.com/fr/statistics.

Pour en savoir plus, visitez le site www.spss.com. Pour les sites SPSS et les numéros de téléphone, consultez www.spss.com/worldwide.

SPSS est une marque déposée et les autres produits SPSS Inc. cités sont des marques commerciales de SPSS Inc. Tous les autres noms sont des marques commerciales de leurs propriétaires respectifs. © 2009 SPSS Inc. Tous droits réservés. SCS18SPC-0709-FR

** Algorithme multithread, pour une performance et une évolutivité accrues sur les ma-chines multiprocesseurs ou multicœurs.

Fonctions susceptibles de changer en fonction de la version finale du produit.