Produisez facilement des statistiques d’échantillonnage avancées
PASW® Complex Samples 18 – Spécifications
Lorsque vous réalisez des enquêtes sur des échantillons,
utilisez un logiciel de statistiques spécialement conçu
pour produire des estimations exactes pour des données
d’échantillonnage complexes. PASW Complex Samples*
produit des statistiques avancées qui vous permettent de
calculer précisément des erreurs standard à partir de plans
d’échantillonnage complexes. Vous pouvez l’appliquer aux
domaines suivants :
n Enquêtes d’opinion : obtenez des statistiques descrip-
tives et inférentielles pour les données d’enquête
n Études de marché : analysez les données de satisfaction
de la clientèle
n Études médicales : analysez de vastes ensembles de
données sur des sujets médicaux tels que la santé et la
nutrition ou la consommation d’alcool et les accidents de
la route
n Sciences sociales : effectuez des recherches sur des
ensembles de données issues d’enquêtes
n Sondage d’opinion : caractérisez des attitudes sur des
questions politiques
PASW Complex Samples vous donne tout ce dont vous avez
besoin pour travailler avec des échantillons complexes. Il inclut :
n Un assistant d’échantillonnage intuitif qui vous guide pas
à pas tout au long du processus de conception d’un plan
et de tracé d’un échantillon
n Un assistant de préparation d’analyse convivial pour
vous aider à préparer les ensembles de données à usage
public qui ont été échantillonnés, comme les données
de la National Health Inventory Survey des Centers for
Disease Control and Prevention (CDC)
n Une prédiction des résultats numériques via le Modèle
linéaire général des échantillons complexes (CSGLM)
n Une prédiction des résultats ordinaux via la Régression
ordinale d’échantillons complexes (CSORDINAL)
n Une prédiction des résultats qualitatifs via la Régression
logistique d’échantillons complexes (CSLOGISTIC)
n La prédiction du délai d’un événement via la Régression
de Cox d’échantillons complexes (CSCOXREG)
Depuis la planification et l’échantillonnage jusqu’à l’analyse,
PASW Complex Samples permet d’obtenir facilement des
résultats précis et fiables. Puisque PASW Complex Samples
prend en compte jusqu’à trois états lors de l’analyse des
données d’un plan à plusieurs phases, vous parvenez à des
analyses plus précises. En plus de vous offrir la possibilité
d’évaluer l’impact de votre plan, PASW Complex Samples
dresse aussi un tableau plus précis de vos données parce
que les évaluations des sous-populations tiennent compte
d’autres sous-populations.
Vous pouvez utiliser les types d’informations de plans
d’échantillonnage suivants avec PASW Complex Samples :
n Échantillonnage stratifié : renforcez la précision de votre
échantillon ou assurez un échantillon représentatif à
partir de groupes-clés en choisissant d’échantillonner à
l’intérieur de sous-groupes de la population étudiée.
Par exemple, ces sous-groupes peuvent être un nombre
spécifique d’hommes ou de femmes, ou contenir
des personnes appartenant à certaines catégories
professionnelles ou à une certaine tranche d’âge.
* PASW Complex Samples et PASW Statistics Base, anciennement nommés SPSS Complex Samples™ et SPSS Statistics Base, font partie de la gamme Predictive Analytics Software de SPSS Inc.
n Échantillonnage en grappes : sélectionnez des classes, qui
sont des groupes d’unités d’échantillonnage, pour votre
enquête. Ces classes peuvent inclure des écoles, des
hôpitaux ou des zones géographiques avec comme
unités d’échantillonnage des étudiants, des patients ou
des citoyens. Cette technique permet souvent de réaliser
des enquêtes plus économiques.
n L’échantillonnage à plusieurs phases : sélectionnez un
échantillon initial ou de première phase basé sur des
groupes d’éléments de la population, puis créez un échan-
tillon de seconde phase en extrayant un sous-échantillon
de chaque unité sélectionnée dans l’échantillon de pre-
mière phase. En répétant cette opération, vous pouvez
sélectionner un échantillon de phase supérieure.
Chaque module de la famille PASW Statistics peut désormais
être installé et exécuté séparément ou conjointement avec
d’autres modules. PASW® Statistics Base* n’est plus néces-
saire, car des fonctionnalités telles que l’accès et la gestion
des données et la création de graphiques ont été ajoutées à
tous les modules. Cela vous donne une plus grande flexibilité
dans l’installation et l’utilisation de ce logiciel polyvalent. PASW
Statistics Base est toujours disponible et reste à la base de
beaucoup de déploiements, car il contient des procédures et
des tests statistiques fondamentaux pour beaucoup d’analyses.
Obtenez des résultats précis et sûrs
En tant que spécialiste des enquêtes, vous voulez avoir confi-
ance dans vos résultats. Les logiciels de statistiques classiques
supposent que vos données proviennent d’un échantillonnage
aléatoire simple. Cependant, dans la plupart des enquêtes
à grande échelle, l’échantillonnage aléatoire simple n’est
généralement ni faisable ni économique. Analyser des données
de tels échantillons avec des statistiques classiques risque
de produire des résultats incorrects. Par exemple, les erreurs
standard estimées des statistiques sont souvent trop petites,
ce qui vous donne une fausse impression de précision. PASW
Complex Samples vous permet d’obtenir des inférences statis-
tiquement valides pour des populations mesurées dans vos
données d’échantillons complexes parce qu’il intègre le plan
d’échantillonnage dans l’analyse de l’enquête.
Travaillez efficacement et facilement
Seul PASW Complex Samples vous permet de comprendre
et d’exploiter facilement les résultats de vos enquêtes
réalisées sur des échantillons complexes. Grâce à l’interface
intuitive, vous pouvez analyser les données et interpréter
les résultats. Lorsque vous avez terminé, vous pouvez
publier des ensembles de données et inclure vos plans
d’échantillonnage ou d’analyse. Chaque plan fait office de
modèle et vous permet d’enregistrer toutes les décisions
prises lors de sa création. Cela vous fait gagner du temps
et améliore la précision, tant pour vous que pour ceux qui
pourraient vouloir utiliser vos plans avec les données, soit
pour reproduire les résultats soit pour continuer là où vous
vous êtes arrêté.
Une épicerie souhaite déterminer si la fréquence à laquelle les clients effectuent leurs achats a un lien avec la somme dépensée, en contrôlant le sexe du client et en intégrant un plan d’échantillonnage. Tout d’abord, le magasin spécifie le plan d’échantillonnage utilisé dans l’Assistant de préparation d’analyse (en haut). Ensuite, le magasin configure le modèle dans le Modèle linéaire général des échantillons complexes (en bas).
2
PASW Complex Samples est disponible sous forme
d’application cliente autonome, mais une version serveur
est également disponible pour de meilleures performances.
Tirez un meilleur parti grâce à la collaboration
Pour partager et réutiliser efficacement les ressources,
protégez-les conformément aux exigences de conformité
internes et externes et publiez les résultats de manière à
ce qu’un plus grand nombre d’utilisateurs professionnels
puisse les voir et interagir avec. Pourquoi ne pas enrichir
votre logiciel PASW Statistics avec PASW® Collaboration
and Deployment Services (anciennement SPSS Predictive
Enterprise Services™) ? Vous aurez plus d’informations
sur ces précieuses fonctionnalités en téléchargeant
la brochure « Collaboration » sur www.spss.com/fr/
software/deployment/cds.
Pour commencer à travailler avec PASW Complex Samples,
utilisez les assistants, qui vous guident face aux nombreux
facteurs à prendre en considération. Si vous créez vos
propres échantillons, utilisez l’assistant d’échantillonnage
pour définir le schéma d’échantillonnage. Si vous utilisez
des ensembles de données qui ont été échantillonnés,
utilisez l’assistant de préparation d’analyse pour spécifier
la façon dont les échantillons ont été définis et comment
estimer les erreurs standard. Une fois que vous avez créé
un échantillon ou spécifié les erreurs standard, vous pouvez
créer des plans, analyser vos données et produire des résul-
tats (voir organigramme ci-dessus).
PASW Complex Samples permet d’apprendre et de travailler
facilement. Utilisez le système d’aide en ligne, explorez les
études de cas interactives ou exécutez le tutoriel en ligne
pour savoir comment vous servir de vos données avec le
logiciel. Avec PASW Complex Samples, vous pouvez :
n Parvenir à des estimations de points correctes pour les
statistiques telles que totaux, moyennes et rapports
n Obtenir les erreurs standard de ces statistiques
n Produire des intervalles de confiance et des tests
d’hypothèses corrects
n Prédire des résultats numériques
n Prédire des résultats ordinaux
n Prédire des résultats catégoriels
n Prédire le délai d’un événement
Assistant de plan d’échantillonnage
Assistant de préparation d’analyse
Fichiers du plan
Analyse des données
Résultats
Analyse précise des données d’enquête
Lorsque vous collectez des données :� Spécifiez l’échantillonnage� Dessinez l’échantillon
Lorsque vous travaillez avec des ensembles de données à usage public :� Spécifiez la façon dont l’échantillon a été dessiné
� Enregistrez et partagez avec vos collègues
� Analyse descriptive : mesurer les types continus, y compris les rapports� Analyse croisée : mesurer les types catégoriels, y compris les tableaux croisés� Modèle linéaire général des échantillons complexes : prédire les résultats numériques� Régression ordinale d’échantillons complexes : prédire les résultats ordinaux� Régression logistique d’échantillons complexes : prédire les résultats catégoriels� Régression de Cox d’échantillons complexes : prédire le délai d’un événement
L’analyse précise des données d’enquête est facile dans PASW Complex Samples. Commencez avec l’un des assistants (choisissez lequel selon votre source de données), puis utilisez l’interface interactive pour créer des plans, analyser des données et interpréter les résultats.
3
FonctionsComplex Samples Plan (CSPLAN)
Cette procédure fournit un point d’entrée général
pour spécifier la base d’échantillonnage afin de
créer un plan d’échantillonnage complexe ou une
spécification d’analyse utilisable par les autres
procédures du module PASW Complex Samples.
CSPLAN n’extrait pas l’échantillon et n’analyse
pas les données. Pour échantillonner les observa-
tions, utilisez un plan d’échantillonnage créé par
CSPLAN comme entrée de la procédure CSSELECT
(décrite à la page suivante). Pour analyser les
données d’échantillons, utilisez un plan d’analyse
créé par CSPLAN comme entrée des procédures
CSDESCRIPTIVES, CSTABULATE, CSGLM, CSLOGISTIC
et CSORDINAL (décrites aux pages suivantes).
n Créez un plan d’échantillonnage : utilisez-le pour
extraire des unités d’échantillonnage du fichier actif
n Créez un plan d’analyse : utilisez-le pour analy-
ser un échantillon complexe
n Lorsque vous créez un plan d’échantillonnage, la
procédure enregistre automatiquement un plan
d’analyse approprié dans le fichier de plan. Un
fichier de plan est créé pour concevoir un échan-
tillon et peut donc être utilisé à la fois pour la
sélection et pour l’analyse de l’échantillon.
n Affichez un plan d’échantillonnage ou un plan
d’analyse
n Spécifiez le plan dans un fichier externe
n Nommez les variables à créer au niveau du plan
lorsque vous extrayez un échantillon ou l’utilisez
comme entrée du processus de sélection ou
d’estimation avec la sous-commande PLANVARS
– Spécifiez les pondérations d’échantillon
finales pour chaque unité à utiliser par les
procédures d’analyse PASW Complex Samples
dans le processus d’estimation
– Indiquez les pondérations d’échantillon
générales qui seront générées lorsque le
plan d’échantillonnage sera exécuté dans la
procédure CSSELECT
– Sélectionnez les pondérations à utiliser lors
du calcul des pondérations d’échantillon
finales dans un plan à plusieurs phases
n Contrôlez la sortie de la procédure CSPLAN à
l’aide de la sous-commande PRINT
– Affichez un résumé des spécifications du plan
dans lequel la sortie reflète vos spécifications
à chaque étape du plan
– Affichez un tableau montrant les spécifica-
tions MATRIX
n Signalez les étapes du plan avec la commande
DESIGN. Vous pouvez aussi utiliser cette sous-com-
mande pour définir des variables de stratification
et des variables de classe ou créer des étiquettes
descriptives pour des étapes particulières.
n Spécifiez la méthode d’extraction d’échantillon à
l’aide de la sous-commande METHOD. Choisissez
parmi diverses méthodes de probabilité égale
et inégale, notamment l’échantillonnage
aléatoire simple ou systématique. Des
méthodes d’échantillonnage avec probabilité
proportionnelle à la taille (PPS) sont également
disponibles. Les unités peuvent être extraites
avec remplacement (WR) ou sans remplacement
(WOR) à partir de la population.
– SIMPLE_WOR : Sélection d’unités avec
probabilité égale. Extraction d’unités
sans remplacement.
– SIMPLE_WR : Sélection d’unités avec
probabilité égale. Extraction d’unités
avec remplacement.
– SIMPLE_SYSTEMATIC : Sélection d’unités
à intervalle fixe via la strate ou la base
d’échantillonnage. Un point de départ aléatoire
est choisi à l’intérieur du premier intervalle.
– SIMPLE_CHROMY : Sélection d’unités
l’une après l’autre avec probabilité égale.
Extraction d’unités sans remplacement.
– PPS_WOR : Sélection d’unités avec proba-
bilité proportionnelle à la taille. Extraction
d’unités sans remplacement.
– PPS_WR : Sélection d’unités avec probabilité
proportionnelle à la taille. Extraction d’unités
avec remplacement.
– PPS_SYSTEMATIC : Sélection d’unités par
échantillonnage aléatoire systématique avec
probabilité proportionnelle à la taille.
Extraction d’unités sans remplacement.
– PPS_CHROMY : Sélection séquentielle
d’unités avec probabilité proportionnelle à la
taille. Extraction d’unités sans remplacement.
– PPS_BREWER : Sélectionnez deux unités de
chaque strate avec probabilité proportion-
nelle à la taille. Extraction d’unités sans rem-
placement.
– PPS_MURTHY : Sélectionnez deux unités
de chaque strate avec probabilité propor-
tionnelle à la taille. Extraction d’unités sans
remplacement.
– PPS_SAMPFORD : Extension de la méthode
Brewer pour sélectionner plus de deux unités
de chaque strate avec probabilité proportion-
nelle à la taille. Extraction d’unités sans
remplacement.
– Contrôle du nombre ou du pourcentage
d’unités à extraire : défini à chaque étape
du plan. Vous pouvez aussi choisir des vari-
ables de sortie, comme des pondérations
d’échantillonnage au niveau de chaque étape,
qui sont créées lors de l’exécution du plan.
– Méthodes d’estimation : Avec remplacement,
probabilité égale sans remplacement dans
un premier temps et probabilité inégale sans
remplacement
– Vous pouvez choisir d’inclure ou pas la
correction de la population finie lors de
l’estimation de la variance dans le cadre
d’un échantillonnage aléatoire simple (SRS)
– Estimation de probabilité inégale sans rem-
placement : requête dans la première étape
seulement
– Spécification des variables : Spécifiez les
variables d’entrée du processus d’estimation,
notamment les pondérations d’échantillon
générales et les probabilités d’inclusion
n Spécifiez le nombre d’unités d’échantillonnage
extraites lors de l’étape actuelle à l’aide de la
sous-commande SIZE
n Spécifiez le pourcentage d’unités extraites
à l’étape actuelle. Par exemple, spécifiez la
fraction d’échantillonnage à l’aide de la sous-
commande RATE.
n Spécifiez le nombre minimum d’unités
extraites lorsque vous spécifiez RATE. Cela est
utile lorsque le taux d’échantillonnage d’une
strate particulière est très bas en raison de
l’arrondissement.
n Spécifiez le nombre maximum d’unités à
extraire lorsque vous spécifiez RATE. Cela est
utile lorsque le taux d’échantillonnage d’une
strate particulière est plus élevé que prévu
en raison de l’arrondissement.
n Spécifiez la mesure de la taille des unités de
population dans un plan PPS. Spécifiez une
variable qui contient les tailles ou demandez
que les tailles soient déterminées lorsque
la procédure CSSELECT explore la base
d’échantillonnage.
n Obtenez des variables d’information sur
l’échantillon au niveau de chaque étape
lorsque vous exécutez un plan
d’échantillonnage à l’aide de la sous-
commande STAGEVARS. Vous pouvez obtenir :
– La proportion d’unités extraites de la
population à une étape particulière en
utilisant les probabilités d’inclusion
(sélection) au niveau de chaque étape
– Les étapes précédentes utilisant la
pondération d’échantillonnage cumulée
pour une étape donnée
– Les unités identifiées de façon unique qui
ont été sélectionnées plus d’une fois lorsque
votre échantillon est créé avec remplacement,
avec un indice de duplication pour les unités
sélectionnées dans une étape donnée
– La taille de la population pour une étape
donnée
– Le nombre d’unités extraites à une étape
donnée
– Le taux d’échantillonnage au niveau de l’étape
– La pondération d’échantillonnage pour une
étape donnée
4
n Choisissez une méthode d’estimation pour
l’étape actuelle avec la sous-commande
ESTIMATOR. Vous pouvez indiquer :
– Les probabilités de sélection égales sans
remplacement
– Les probabilités de sélection inégales sans
remplacement
– La sélection avec remplacement
n Spécifiez la taille de population pour chaque
élément de l’échantillon avec la sous-commande
POPSIZE
n Spécifiez la proportion d’unités extraites de la
population à une étape donnée avec la sous-
commande INCLPROB
Complex Samples Selection (CSSELECT)CSSELECT sélectionne des échantillons complexes
basés sur des probabilités à partir d’une population.
Il choisit des unités selon un plan d’échantillonnage
créé via la procédure CSPLAN.
n Contrôlez la portée d’exécution et spécifiez une
valeur de générateur avec la sous-commande
CRITERIA
n Décidez si les valeurs manquantes utilisateur
des variables de stratification et de classification
doivent être traitées comme des valeurs valides
avec la sous-commande CLASSMISSING
n Utilisez le générateur de nombre aléatoire
Mersenne Twister le plus récent pour sélection-
ner l’échantillon
n Spécifiez les options générales concernant les
fichiers d’entrée et de sortie avec la sous-com-
mande DATA
– Choisissez de renommer les variables
existantes lorsque la procédure CSSELECT écrit
les variables de pondération d’échantillon et
les variables de sortie au niveau des étapes
demandées dans le fichier de plan, telles que
les probabilités d’inclusion
n Générez des unités échantillonnées dans un
fichier externe en utilisant une option pour
conserver/éliminer les variables spécifiées
n Enregistrez automatiquement les probabilités
d’inclusion jointes de la première étape dans un
fichier externe lorsque le fichier de plan spécifie
une méthode d’échantillonnage PPS_WR
n Choisissez de générer des fichiers texte conte-
nant une règle qui décrit les caractéristiques des
unités sélectionnées
n Contrôlez l’affichage de la sortie via la sous-
commande PRINT
– Résumez la distribution des cas sélectionnés
parmi les strates. L’information est rapportée
par étape de plan.
– Générez un résumé du traitement des cas
Complex Samples Descriptives (CSDESCRIPTIVES)CSDESCRIPTIVES estime les moyennes, sommes
et rapports, et calcule leurs erreurs standard,
les effets de plan, les intervalles de confiance
et les tests d’hypothèses pour des échantillons
extraits par des méthodes d’échantillonnage
complexes. La procédure estime les variances
en prenant en compte le plan d’échantillonnage
utilisé pour sélectionner l’échantillon, y compris
les méthodes de probabilité égale et PPS, ainsi
que les procédures d’échantillonnage WR et WOR.
CSDESCRIPTIVES peut également effectuer des
analyses de sous-populations.
n Spécifiez le nom d’un fichier de plan, qui est
écrit par la procédure CSPLAN, contenant les
spécifications du plan d’analyse avec la sous-
commande PLAN
n Spécifiez les noms des fichiers des probabilités
d’inclusion jointes
n Spécifiez les variables d’analyse utilisées par
les sous-commandes MEAN et SUM en utilisant
la sous-commande SUMMARY
n Demandez l’estimation des moyennes et des
sommes pour les variables spécifiées sur la
sous-commande SUMMARY via les sous-com-
mandes MEAN et SUM
– Demandez des tests t pour la ou les moyenne(s)
et somme(s) de population et donnez la ou les
valeur(s) d’hypothèse nulle(s) via le mot-clé
TTEST. Si vous définissez des sous-populations
à l’aide de la sous-commande SUBPOP, les
valeurs d’hypothèse nulle seront utilisées dans
le ou les test(s) pour chaque sous-population,
ainsi que pour la population toute entière.
n Demandez que les rapports soient estimés pour
les variables spécifiées sur la sous-commande
SUMMARY via la sous-commande RATIO
– Demandez des tests t des rapports de
population et donnez la ou les valeur(s)
d’hypothèse nulle(s) via le mot-clé TTEST
n Associez la syntaxe aux estimations de moy-
enne, de somme ou de rapport, notamment :
– le nombre d’observations valides dans
l’ensemble de données pour chaque estima-
tion de moyenne, de somme ou de rapport
– la taille de la population pour chaque estima-
tion de moyenne, de somme ou de rapport
– l’erreur standard pour chaque estimation de
moyenne, de somme ou de rapport
– le coefficient de variation
– les effets de plan
– la racine carrée des effets de plan
– l’intervalle de confiance
n Spécifiez les sous-populations pour lesquelles
les analyses doivent être effectuées à l’aide de
la sous-commande SUBPOP
– Affichez les résultats pour toutes les sous-
populations dans le même tableau ou dans
un tableau séparé
n Spécifiez comment gérer les données
manquantes
– Basez chaque statistique sur toutes les
données valides pour la ou les variable(s)
d’analyse utilisée(s) dans le calcul de la
statistique. Calculez les rapports en utilisant
toutes les observations avec des données
valides pour les deux variables spécifiées.
Vous pouvez baser les statistiques de dif-
férentes variables sur différentes tailles
d’échantillon.
– Utilisez uniquement les observations
avec des données valides pour toutes
les variables d’analyse lors du calcul des
statistiques. Basez toujours les statistiques
pour différentes variables sur la même taille
d’échantillon.
– Excluez les valeurs manquantes utilisateur
parmi les variables de strate, de classe et de
sous-population
– Incluez les valeurs manquantes utilisateur
parmi les variables de strate, de classe et
de sous-population Traitez les valeurs man-
quantes utilisateur pour ces variables comme
des données valides.
Complex Samples Tabulate (CSTABULATE)CSTABULATE affiche des tableaux de fréquence à
1 facteur ou des tableaux à double entrée et les
erreurs standard, les effets de plan, les intervalles
de confiance et les tests d’hypothèse associés
pour les échantillons extraits à l’aide de méth-
odes d’échantillonnage complexes. La procédure
estime les variances en prenant en compte le
plan d’échantillonnage utilisé pour sélection-
ner l’échantillon, y compris les méthodes de
probabilité égale et PPS, ainsi que les procédures
d’échantillonnage WR et WOR. CSTABULATE peut
aussi créer des tableaux pour des sous-populations.
n Spécifiez le nom d’un fichier XML, écrit par la
procédure CSPLAN, contenant le plan d’analyse
avec la sous-commande PLAN
n Spécifiez le nom de fichier des probabilités
d’inclusion jointes
n Utilisez les statistiques suivantes à l’intérieur
du tableau :
– Taille de population : estimation de la taille
de population pour chaque cellule et valeur
marginale dans un tableau
– Erreur standard : Calculez l’erreur standard
pour chaque estimation de taille de population
n Pourcentages des lignes et colonnes : Exprimez
l’estimation de taille de population pour chaque
cellule dans une ligne ou une colonne en tant
que pourcentage de l’estimation de taille de
population pour cette ligne ou colonne. Cette
fonctionnalité est disponible pour les tableaux
à double entrée.
– Pourcentages de tableau : Exprimez la taille
de population dans chaque cellule d’un tab-
leau en tant que pourcentage de l’estimation
de taille de population pour ce tableau 5Fonctions susceptibles de changer en fonction de la version finale du produit.
– Coefficient de variation
– Effets de plan
– Racine carrée des effets de plan
– Intervalle de confiance : spécifiez un nombre
entre zéro et 100 comme intervalle de confiance
– Nombres non pondérés : utilisez des nombres
non pondérés comme nombre d’observations
valides dans l’ensemble de données pour
chaque estimation de taille de population
– Estimations de taille de population cumulées :
utilisez les estimations de taille de population
cumulées seulement pour les tableaux de
fréquence à 1 facteur
– Pourcentages cumulés : utilisez les pourcent-
ages cumulés correspondant aux estimations
de taille de population seulement pour les
tableaux de fréquence à 1 facteur
– Estimations de taille de population prévues :
utilisez les estimations de taille de population
prévues si les estimations de taille de
population de chaque cellule des deux
variables du tableau à double entrée sont
statistiquement indépendantes. Cette
fonctionnalité est disponible seulement
pour les tableaux à double entrée.
– Résidus : montrez la différence entre les
estimations de taille de population observées
et prévues dans chaque cellule. Cette fonc-
tionnalité est disponible seulement pour les
tableaux à double entrée.
– Résidus de Pearson : Cette fonctionnalité
est disponible seulement pour les tableaux
à double entrée.
– Résidus de Pearson ajustés : Cette
fonctionnalité est disponible seulement
pour les tableaux à double entrée.
n Utilisez les statistiques et tests suivants pour le
tableau tout entier :
– Test des proportions homogènes
– Test d’indépendance
– Odds ratio
– Risque relatif
– Différence de risque
n Spécifiez les sous-populations pour lesquelles
les analyses doivent être effectuées à l’aide de
la sous-commande SUBPOP
– Affichez les résultats pour toutes les
sous-populations dans le même tableau
ou dans un tableau séparé
n Spécifiez comment gérer les données manquantes
– Visualisez chaque tableau sur toutes les don-
nées valides pour la ou les variable(s) de tab-
leau utilisée(s) dans la création du tableau. Vous
pouvez construire les tableaux pour différentes
variables sur différentes tailles d’échantillon.
– Utilisez uniquement des observations
avec des données valides pour toutes les
variables de tableau lors de la création des
tableaux. Visualisez toujours les tableaux
pour différentes variables sur la même
taille d’échantillon.
– Excluez les valeurs manquantes utilisateur
parmi les variables de strate, de classe et de
sous-population
– Incluez les valeurs manquantes utilisateur
parmi les variables de strate, de classe et
de sous-population Traitez les valeurs man-
quantes utilisateur pour ces variables comme
des données valides.
Complex Samples General Linear Model (CSGLM)Cette procédure vous permet de créer des modèles de
régression linéaire, d’analyse de variance (ANOVA) et
d’analyse de covariance (ANCOVA) pour des échantil-
lons extraits à l’aide de méthodes d’échantillonnage
complexes. La procédure estime les variances en pre-
nant en compte le plan d’échantillonnage utilisé pour
sélectionner l’échantillon, y compris les méthodes
de probabilité égale et PPS, ainsi que les procédures
d’échantillonnage WR et WOR. CSGLM peut égale-
ment effectuer des analyses de sous-populations.
n Modèles
– Effets principaux
– Toutes les interactions à n facteurs
– Entièrement croisés
– Personnalisés, incluant des termes emboîtés
n Statistiques
– Paramètres du modèle : estimations de coeffi-
cient, erreur standard pour chaque estimation
de coefficient, test t pour chaque estimation
de coefficient, intervalle de confiance pour
chaque estimation de coefficient, effet de
plan pour chaque estimation de coefficient
et racine carrée de l’effet de plan pour chaque
estimation de coefficient
– Moyennes de population des variables
dépendantes et des covariables
– Ajustement du modèle
– Informations sur le plan d’échantillonnage
n Tests d’hypothèse
– Statistiques de test : test F de Wald, test F
de Wald ajusté, test khi-deux de Wald et test
khi-deux de Wald ajusté
– Ajustement pour comparaisons multiples :
différence la moins significative, Bonferroni,
Bonferroni séquentiel, Sidak et Sidak
séquentiel
– Degrés de liberté d’échantillonnage : basés
sur le plan d’échantillonnage ou fixés par
l’utilisateur
n Moyennes estimées : Demande les moyennes
marginales estimées pour des facteurs et des
interactions du modèle
– Contrastes : simples, déviation, Helmert,
répétés ou polynomiaux
n Les variables du modèle peuvent être enregistrées
dans le fichier actif et/ou exportées vers des
fichiers externes qui contiennent les matrices
de paramètres
– Variables : valeurs prédites et résidus
– La matrice de covariance de paramètres et
ses autres statistiques, ainsi que la matrice
de corrélation de paramètres et ses autres
statistiques, peuvent être exportées en tant
que fichier de données PASW Statistics
– Les estimations de paramètres et/ou la
matrice de covariance de paramètres peuvent
être exportées vers un fichier XML
n Sortie
– Informations sur le plan d’échantillonnage
(telles que les strates et les unités de sond-
age de premier degré)
– Estimations du coefficient de régression et
tests t
– Informations récapitulatives sur la variable
dépendante, les covariables et les facteurs
– Informations récapitulatives sur l’échantillon,
notamment le nombre non pondéré et la taille
de population
– Limites de confiance pour les estimations
de paramètres et les niveaux de confiance
spécifiés par l’utilisateur
– Test F de Wald pour les effets de modèle
– Effets de plan
– R2 multiple
– Ensemble de matrices de coefficients de
contraste (L)
– Matrice de variance-covariance des
estimations du coefficient de régression
– Erreur quadratique moyenne
– Matrices de covariance et de corrélation
pour les coefficients de régression
n Gestion des données manquantes
– Suppression des valeurs manquantes
Listwise
n Autres
– Dénominateur spécifié par l’utilisateur, df,
utilisé dans le calcul des valeurs p pour
toutes les statistiques de test
– Diagnostics de colinéarité
– Le modèle peut être adapté à des
sous-populations
Complex Samples Ordinal (CSORDINAL) CSORDINAL effectue une analyse de régression
sur une variable dépendante polytomique binaire
ou ordinale en utilisant la fonction de lien cumulé
sélectionnée pour les échantillons extraits à l’aide
de méthodes d’échantillonnage complexes. La
procédure estime les variances en prenant en
compte le plan d’échantillonnage utilisé pour
sélectionner l’échantillon, y compris les méthodes
de probabilité égale et PPS, ainsi que les procé-
dures d’échantillonnage WR et WOR. CSORDINAL
peut également effectuer des analyses pour une
sous-population.
n Modèles
– Effets principaux
– Toutes les interactions à n facteurs
– Entièrement croisés
– Personnalisés, incluant des termes emboîtés6
n Statistiques :
– Paramètres du modèle : estimations de
coefficient, estimations exponentielles,
erreur standard pour chaque estimation
de coefficient, test t pour chaque estimation
de coefficient, intervalle de confiance pour
chaque estimation de coefficient, effet de
plan pour chaque estimation de coefficient,
racine carrée de l’effet de plan pour chaque
estimation de coefficient, covariances des
estimations de paramètres et corrélations
des estimations de paramètres
– Ajustement du modèle : pseudo R2 et tableau
de classification
– Tests des lignes parallèles : tests de Wald
d’égalité des pentes, estimations de
paramètres pour le modèle généralisé (pentes
inégales) et covariances des estimations
de paramètres pour le modèle généralisé
(pentes inégales)
– Statistiques récapitulatives pour les variables
de modèle
– Informations sur le plan d’échantillonnage
n Tests d’hypothèse
– Statistiques de test : test F de Wald, test F
de Wald ajusté, test khi-deux de Wald et
test khi-deux de Wald ajusté
– Ajustement pour comparaisons multiples :
différence la moins significative, Bonferroni,
Bonferroni séquentiel, Sidak et Sidak
séquentiel
– Degrés de liberté d’échantillonnage : basés
sur le plan d’échantillonnage ou fixés par
l’utilisateur
n Les variables de modèle peuvent être
enregistrées dans le fichier actif et/ou
exportées vers des fichiers externes qui
contiennent les matrices de paramètres
– Variables : catégorie prédite, probabilité de
catégorie prédite, probabilité de catégorie
observée, probabilités cumulées (une vari-
able par catégorie), probabilités prédites
(une variable par catégorie)
– Exportez en tant que fichier de données
PASW : matrice de covariance des paramètres
et autres statistiques, matrice de corrélation
des paramètres et autres statistiques
– Exportation en tant que XML : estimations de
paramètres et/ou matrice de covariance de
paramètres vers un fichier XML
n Trois méthodes d’estimation : Newton-Raphson,
Fisher Scoring et Fisher Scoring suivie de
Newton-Raphson
n Fonction de lien cumulé pour spécifier le modèle :
Cauchit, log-log complémentaire, logit, log-log
négatif et probit
n Odds ratios cumulés pour le ou les facteur(s)
ou la ou les covariable(s) spécifiés. La
sous-commande est uniquement disponible
pour le lien LOGIT.
n Sortie
– Informations sur le plan d’échantillonnage
(telles que les strates et les unités de
sondage de premier degré)
– Informations récapitulatives sur la variable
dépendante, les covariables et les facteurs
– Informations récapitulatives sur l’échantillon,
notamment le nombre non pondéré et la taille
de population
– Limites de confiance pour les estimations
de paramètres et niveaux de confiance
spécifiés par l’utilisateur
– Statistiques récapitulatives du modèle
– Test F de Wald, test F de Wald ajusté, test
khi-deux de Wald et test khi-deux de Wald
ajusté pour les effets de modèle
– Effets de plan
– Tableau de classification
– Ensemble de matrices de coefficients de
contraste (L)
– Matrice de variance-covariance des
estimations du coefficient de régression
– Tableau général des fonctions estimables
– Matrice de corrélation pour les coefficients
de régression
n Gestion des données manquantes
– Suppression des valeurs manquantes
Listwise
n Autres
– Dénominateur spécifié par l’utilisateur, df,
utilisé dans le calcul des valeurs p pour
toutes les statistiques de test
– Diagnostics de colinéarité
– Adaptation du modèle à une sous-population
Complex Samples Logistic Regression (CSLOGISTIC)Cette procédure effectue une analyse de régression
logistique binaire, ainsi qu’une analyse de régression
logistique multinomiale (MLR), pour les échantillons
extraits à l’aide de méthodes d’échantillonnage
complexes. CSLOGISTIC estime les variances en
prenant en compte le plan d’échantillonnage utilisé
pour sélectionner l’échantillon, y compris les
méthodes de probabilité égale et PPS, ainsi que
les procédures d’échantillonnage WR et WOR.
CSLOGISTIC peut également effectuer des analyses
pour des sous-populations.
n Modèles
– Effets principaux
– Toutes les interactions à n facteurs
– Entièrement croisés
– Personnalisés, incluant des termes emboîtés
n Statistiques
– Paramètres du modèle : estimations de
coefficient, estimations exponentielles,
erreur standard pour chaque estimation
de coefficient, test t pour chaque estimation
de coefficient, intervalle de confiance pour
chaque estimation de coefficient, effet de
plan pour chaque estimation de coefficient,
racine carrée de l’effet de plan pour chaque
estimation de coefficient, covariances des
estimations de paramètres et corrélations
des estimations de paramètres
– Ajustement du modèle : pseudo R2 et tableau
de classification
– Statistiques récapitulatives pour les variables
de modèle
– Informations sur le plan d’échantillonnage
n Tests d’hypothèse
– Statistiques de test : test F de Wald, test F de
Wald ajusté, test khi-deux de Wald et
test khi-deux de Wald ajusté
n Ajustement pour comparaisons multiples :
différence la moins significative, Bonferroni,
Bonferroni séquential, Sidak et Sidak séquentiel
n Degrés de liberté d’échantillonnage : basés sur
le plan d’échantillonnage ou fixé par l’utilisateur
n Les variables du modèle peuvent être enregis-
trées dans le fichier actif et/ou exportées vers
des fichiers externes qui contiennent les matri-
ces de paramètres
– Variables : catégorie prédite et probabilités
prédites
– La matrice de covariance de paramètres et
ses autres statistiques, ainsi que la matrice
de corrélation de paramètres et ses autres
statistiques, peuvent être exportées en tant
que fichier de données PASW Statistics
– Les estimations de paramètres et/ou la
matrice de covariance de paramètres peuvent
être exportées vers un fichier XML
n Sortie
– Informations sur le plan d’échantillonnage
(telles que les strates et les unités de
sondage de premier degré)
– Informations récapitulatives sur la variable
dépendante, les covariables et les facteurs
– Informations récapitulatives sur l’échantillon,
notamment le nombre non pondéré et la taille
de population
– Limites de confiance pour les estimations
de paramètres et les niveaux de confiance
spécifiés par l’utilisateur
– Statistiques récapitulatives du modèle
– Test F de Wald pour les effets de modèle
– Effets de plan
– Tableau de classification
– Ensemble de matrices de coefficients de
contraste (L)
– Matrice de variance-covariance des
estimations du coefficient de régression
– Erreur quadratique moyenne
– Matrices de covariance et de corrélation
pour les coefficients de régression7Fonctions susceptibles de changer en fonction de la version finale du produit.
n Gestion des données manquantes
– Suppression des valeurs manquantes
Listwise
n Autres
– Dénominateur spécifié par l’utilisateur, df,
utilisé dans le calcul des valeurs p pour
toutes les statistiques de test
– Diagnostics de colinéarité
– Le modèle peut être adapté à des
sous-populations
Complex Samples Cox Regression (CSCOXREG)**Cette procédure applique la régression des hasards
proportionnels de Cox à l’analyse des temps de
survie, c’est-à-dire au délai précédant la survenue
d’un événement, pour les échantillons extraits à
l’aide de méthodes d’échantillonnage complexes.
CSCOXREG prend en charge les prédicteurs continus
et qualitatifs, qui peuvent être chronologiques.
CSCOXREG offre un moyen facile de tenir compte des
différences dans les sous-groupes et d’analyser les
effets d’un ensemble de prédicteurs. Par ailleurs, la
procédure gère les données où il y a de multiples
cas (comme les visites de patients, les rencontres
et les observations) pour un seul sujet.
n Temps et événement : spécifiez les variables de
temps de survie et les valeurs qui indiquent que
l’événement étudié s’est produit
– Temps de survie
n Début de l’intervalle (commencement
du risque)
– Temps 0
– Varie par sujet
n Fin de l’intervalle
n Événement en tant que valeurs
individuelles ou plage de valeurs
n Prédicteurs :
– Facteurs
– Covariables
– Prédicteurs chronologiques
n Sous-groupes : stratifiez l’analyse et/ou
limitez-la à une sous-population particulière.
n Modèles
– Effets principaux
– Toutes les interactions à n facteurs
– Personnalisés, incluant des termes emboîtés
n Statistiques :
– Informations sur le plan d’échantillonnage
– Résumé de l’événement et de la censure
– Risque défini au moment de l’événement
– Paramètres du modèle : estimations de
coefficient, estimations exponentielles,
erreur standard pour chaque estimation
de coefficient, test t pour chaque estimation
de coefficient, intervalle de confiance pour
chaque estimation de coefficient, effet de
plan pour chaque estimation de coefficient
et racine carrée de l’effet de plan pour chaque
estimation de coefficient, estimations des
covariances de paramètres et corrélations
des estimations de paramètres
– Hypothèses de modèle
n Test des hasards proportionnels
n Estimations de paramètres pour modèle
alternatif
n Matrice de covariance pour modèle alternatif
– Fonctions de survie et de hasard cumulé de
base
n Diagrammes :
– Fonction de survie
– Fonction de hasard
– Log moins log de la fonction de survie
– Un moins la fonction de survie
– Option pour afficher les intervalles de confiance
– Facteurs et covariables des diagrammes à des
niveaux spécifiés
n Tests d’hypothèse
– Statistiques de test : test F, test F ajusté, test
khi-deux. Test khi-deux ajusté
– Ajustement pour comparaisons multiples :
différence la moins significative, Bonferroni,
Bonferroni séquentiel, Sidak et Sidak séquentiel
– Degrés de liberté d’échantillonnage : basés
sur le plan d’échantillonnage ou fixés par
l’utilisateur
n Enregistrez les variables du modèle sur le fichier
actif et/ou exportez les fichiers externes qui
contiennent les matrices de paramètres
– Variables : fonction de survie, limite inférieure
de l’intervalle de confiance pour la fonction
de survie, limite supérieure de l’intervalle de
confiance pour la fonction de survie, fonction
de hasard cumulé, limite inférieure de l’intervalle
de confiance pour la fonction de hasard cumulé,
limite supérieure de l’intervalle de confiance pour
la fonction de hasard cumulé, valeur prédite de
prédicteur linéaire, résidu de Schoenfeld (une
variable par paramètre de modèle), résidu de
Martingale, résidu de déviance, résidu de Cox-
Snell, résidu de score (une variable par paramètre
de modèle), intervalle pour la fonction de hasard
cumulé, résidu (une variable par paramètre
de modèle), résidu de Martingale agrégé,
résidu de déviance agrégé, résidu de Cox Snell
agrégé, résidu de Score agrégé (une variable par
paramètre de modèle) et résidu DFBETA agrégé
(une variable par paramètre de modèle)
n Exportez le modèle et/ou la fonction de survie
– Exportez en tant que fichier de données
PASW Statistics
– Exportez la fonction de survie en tant que
fichier de données PASW Statistics
– Exportez le modèle en tant que fichier XML
n Options pour spécifier les critères d’estimation,
méthodes de calcul des fonctions de survie
et des intervalles de confiance, et gestion des
valeurs manquantes utilisateur
– Estimation : maximum des itérations,
nombre maximum de dichotomies, limiter
les itérations basées sur les changements
dans les estimations de paramètres, limiter
les itérations basées sur les changements
dans les rapports de log-vraisemblance,
afficher l’historique des itérations et
méthode de départage pour l’estimation
des paramètres (Efron ou Breslow)
– Fonction de survie : méthode d’estimation
des fonctions de survie de base (Efron,
Breslow ou produit-limite) et intervalles de
confiance des fonctions de survie (unités
transformées ou originales)
– Spécifiez l’intervalle du niveau de confiance
– Gestion des données manquantes (traitées
comme valides ou invalides)
Configuration requisen La configuration requise varie selon la
plateforme. Pour plus de détails, voir
www.spss.com/fr/statistics.
Pour en savoir plus, visitez le site www.spss.com. Pour les sites SPSS et les numéros de téléphone, consultez www.spss.com/worldwide.
SPSS est une marque déposée et les autres produits SPSS Inc. cités sont des marques commerciales de SPSS Inc. Tous les autres noms sont des marques commerciales de leurs propriétaires respectifs. © 2009 SPSS Inc. Tous droits réservés. SCS18SPC-0709-FR
** Algorithme multithread, pour une performance et une évolutivité accrues sur les ma-chines multiprocesseurs ou multicœurs.
Fonctions susceptibles de changer en fonction de la version finale du produit.