Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
Codage des données de recensement: Une vue d’ensemble
Division de statistique des Nations Unies
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
Vue d’ensemble de la présentation
Qu’est-ce que le codage? Les méthodes de codage Les index de codage Types d’opérations de codage Types de codes Questions ouvertes Systèmes de codage Organisation du codage Sources d’erreurs de codage
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
1. Qu’est-ce que le codage? Processus dans lequel les données du
questionnaire sont transformées and valeurs numériques et/ou alphanumériques
Objectif est de préparer les données dans une forme utilisable par un ordinateur pour analyse ultérieure
Réalisé en déterminant les réponses possibles pour chaque question et établissant une table de correspondance entre ces réponses et les valeurs numériques et/ou alphanumériques
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
2. Méthodes de codage Simple
Limité à une seule question du questionnaire Direct: la réponse peut être codée selon une liste
Structuré Utilisé pour des variables complexes (profession,
activité économoqie, éducation, etc.) Référence peut être faite à plusieurs questions
(statut dans l’emploi, public/privé…) Des règles de codage peuvent être établies pour
guider les opérateurs
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
Méthodes de codage(cont.) Successif (ou hiérarchique)
S’applique aux caractéristiques pour lesquels il est nécessaire d’avoir plusieurs niveaux de détail avant d’assigner un code
Utilisé communément pour le codage des adresses:
Le codeur commence par chercher à identifier un niveau gégoraphique large (province), puis détermine la ville, puis la rue, puis le numéro dans la rue
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
3. Index de codage Quel que soit le système utilisé, il s’appuie sur des index Les index sont des liste de réponses caractéristiques
susceptibles d’être données et À chacune desquelles est affecté un code.
Doivent s’appuyer sur les déclarations des recensés et pas uniquement sur les libellés des postes de la nomenclature
Permet de répartir les réponses entre les diverses rubriques de la nomenclature
Qualité de ces index est primordiale; le temps et les efforts nécessaires ne doivent pas être sous-estimés
Les index ne sont pas statiques et doivent être mis à jour pour prendre en compte de nouvelles réponses
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
4. Types d'opérations de codageLes opérations de codage peuvent impliquer une des trois options :
Assigner des codes numériques aux réponses libéllées en clair, par exemple les variables tels que lieux géographique, métier, activité économique, etc.
Reporter des codes numériques sur une feuille de programmation séparée de faciliter la saisie de données.
Utiliser des entrées précodées sur les questionnaires qui peuvent être employés directement pour la saisie de données
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
5.Types de codage
Réponses pré-codées Codage manuel en bureau
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
(a) réponses pré-codées Adapté aux questions fermées; les nombres dans les cases du questionnaire
sont employés pour coder les réponses
Dans la mesure du possible, les réponses précodées devraient être employées pour le recensement avec des codes numériques ou alphanumériques
Les catégories de codage devraient être mutuellement exclusives et exhaustives
Pour: Plus facile Plus rapide
Contre: Ne peut pas être utilisé pour des questions ouvertes
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
(b) Codage manuel en bureau
Toutes les questions de recensement ne peuvent être précodées, par exemple, celles qui exigent des réponses ouvertes
L’étendue complète des réponses peut ne pas être connue et ne peut pas donc être codée sur place, ainsi le codage est fait après la collecte
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
Questions ouvertes: avantages
Permet aux répondants de s’exprimer par eux-mêmes, plutôt qu’avec les termes choisis par les organisateurs du recensement
Particulièrement approprié pour des concepts complexes comme la profession
Les chercheurs peuvent étudier comment les répondants parlent de leur profession par example, et trouver des informations de valeur pour eux
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
Questions ouvertes: inconvénients
Différents répondants peuvent aborder la même question de différentes perspectives de sorte que leurs réponses ne puissent pas être entièrement comparables
Les questions ouvertes sont une source commune d'erreur de mesure sur des recensements
Le codage peut impliquer de grouper ensemble les répondants qui ont apporté les réponses semblables. Puisqu'aucun deux répondants peuvent jamais ne pas donner des réponses identiques, le codeur peut compléter des détails d'une réponse en faisant des conjectures au sujet de quel répondant a voulu dire pour dire.
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
Questions ouvertes: problèmes autour du codage Toutes les questions d’un recensement ne peuvent être
précodées (par exemple, caractéristiques économiques)
Il est nécessaire de former le personnel pour déterminer des codes appropriés avec les listes des codes existantes sur la base de l'information fournie par des répondants
La catégorie « autre » est habituellement incluse parce que souvent la gamme complète des réponses n'est pas connue
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
6. systèmes de codage
Les réponses textuelles et verbales doivent être remplacées par des codes par intervention :
Manuelle Assistée par ordinateur Automatique Combinaison des précédentes
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
(a)Codage manuel Les codeurs assignent manuellement un code aux réponses en consultant l’index,
ou les livres de code
Ils écrivent alors manuellement les codes sur un formulaire pour la saisie et le traitement de données postérieurs
Pour: Simple
Contre: Long et pénible Sujet à des biais et au sur-codage (codeur trop zélé pour trouver un code même en
l’absence d’information suffisante) Plus sujet à erreurs que d'autres types de codage.
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
(b) Codage assisté par ordinateur Systèmes automatisés (ordinateurs centraux, PCs,
etc.) utilités pour aider les codeurs
Les index utilisés sont comme décrit auparavant, mais cette fois ils sont stockés sur l’ordinateur. Les codes associés sont stockés dans une base de données et accédés pendant l'opération de codage
Un codeur peut saisir soit à partir de feuilles de programmation soit saisir chaque réponse à partir du questionnaire directement
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
(b) Codage assisté par ordinateur (cont.) Exécution pratique :
Le codeur dactylographie quelques caractères de chaque mot dans la réponse
L'ordinateur renvoie une liste de valeurs possibles à partir de l'index de codage approprié
Le codeur choisit la valeur dans la liste de possibilités L'ordinateur enregistre automatiquement le code
correspondant Exemple : pour « éleveur de volaille » le codeur écrit «
elev vol »
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
(b) Codage assisté par ordinateur (cont.)
Pour: Relativement plus efficace Plus de règles de codage peuvent être incorporées au
système pour guider les codeurs, ce qui a pour conséquence des données de meilleure qualité
Approprié au codage structuré en particulier
Contre: Relativement complexe Long et coûteux à développer
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
(c) Codage automatique Un algorithme automatisé compare la réponse textuelle capturée
(par exemple, d'ICR) à des index, et assigne le numéro de code dans la majorité des cas sans intervention humaine
Implique typiquement un mécanisme de notation où un nombre minimum de points est exigé avant qu'une réponse soit considérée comme valide
Quand le score est au-dessous d'un certain niveau, l'intervention humaine est nécessaire
Les taux de codage dépendent des algorithmes utilisés et des types de variables
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
(c) Codage automatique (cont.) Pour:
Vitesse Grande efficacité Bonne qualité Particulièrement adapté au codage structuré
Contre: Complexe Coûts élevés Risques d’erreurs systématiques dans le cas de défauts
dans les algorithmes de correspondance et les index
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
7. Organisation du codage NSO élaborent souvent une liste de codes communs pour quelques
variables employées dans le recensement et dans les enquêtes ; par exemple, lieu de naissance, langue, appartenance ethnique/race, citoyenneté
L'exemple du code commun pour le « lieu géographique » pourrait être code hiérarchique de 3 chiffres avec pour le premier chiffre le plus large niveau de la géographie, et le troisième chiffre le niveau le plus fin
Le problème commun qui se pose est quand les définitions diffèrent ou changent entre les recensements (ou entre un recensement et une enquête) pour des variables telles que le travail ou l'appartenance ethnique ; le NSO doit développer une politique sur la façon dont prendre en considération ces changements
Pour le « codage simple », le NSO doit définir une liste de codes: Ex. Sexe : maaculin-1, féminin-2 ; Ex. Type d’inactivité : au foyer-0, étudiant-1, retraité-2, other-3
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
7. Organisation du codage (cont.) Pour « le codage structuré », il y a un certain nombre de
systèmes de classification internationaux que les NSOS peuvent employer directement ou adapter à leurs propres variantes nationales
Exemples:
(a) Classification Internationale Type par Industrie, de toutes les branches d’activité économique, CITI Rév. 4
Type de code Niveau Catégorie Code
Deux chiffres Division Fabrication de produits alimentaires 10
Trois chiffres Groupe Travail des grains, fabrication de produits amylacés
106
Quatre chiffres Classe Travail des grains 1061
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
7. Organisation du codage (cont.)
(b) Classification Internationale Type des Professions, CITP-08
Type de code Niveau Catégorie Code
Deux chiffres Sous-grands groupes
Métiers qualifiés du bâtiment et assimilés, sauf électriciens
71
Trois chiffres Sous-groupes Métiers qualifiés du bâtiment (gros oeuvre) et assimilés
711
Quatre chiffres Groupes de base Maçons 7112
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
8. Sources d’erreurs de codage
Les règles de codage peuvent être déficientes
Les règles de codage peuvent ne pas être correctement appliquées
Le codage peut être fortement subjectif
Les opérations de codage sont importantes dans les recensements et donc difficile à contrôler
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008
MERCI