25
Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008 Codage des données de recensement: Une vue d’ensemble Division de statistique des Nations Unies

Codage des données de recensement: Une vue d’ensemble

Embed Size (px)

DESCRIPTION

Codage des données de recensement: Une vue d’ensemble. Division de statistique des Nations Unies. Vue d’ensemble de la présentation. Qu’est-ce que le codage? Les méthodes de codage Les index de codage Types d’opérations de codage Types de codes Questions ouvertes Systèmes de codage - PowerPoint PPT Presentation

Citation preview

Page 1: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

Codage des données de recensement: Une vue d’ensemble

Division de statistique des Nations Unies

Page 2: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

Vue d’ensemble de la présentation

Qu’est-ce que le codage? Les méthodes de codage Les index de codage Types d’opérations de codage Types de codes Questions ouvertes Systèmes de codage Organisation du codage Sources d’erreurs de codage

Page 3: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

1. Qu’est-ce que le codage? Processus dans lequel les données du

questionnaire sont transformées and valeurs numériques et/ou alphanumériques

Objectif est de préparer les données dans une forme utilisable par un ordinateur pour analyse ultérieure

Réalisé en déterminant les réponses possibles pour chaque question et établissant une table de correspondance entre ces réponses et les valeurs numériques et/ou alphanumériques

Page 4: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

2. Méthodes de codage Simple

Limité à une seule question du questionnaire Direct: la réponse peut être codée selon une liste

Structuré Utilisé pour des variables complexes (profession,

activité économoqie, éducation, etc.) Référence peut être faite à plusieurs questions

(statut dans l’emploi, public/privé…) Des règles de codage peuvent être établies pour

guider les opérateurs

Page 5: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

Méthodes de codage(cont.) Successif (ou hiérarchique)

S’applique aux caractéristiques pour lesquels il est nécessaire d’avoir plusieurs niveaux de détail avant d’assigner un code

Utilisé communément pour le codage des adresses:

Le codeur commence par chercher à identifier un niveau gégoraphique large (province), puis détermine la ville, puis la rue, puis le numéro dans la rue

Page 6: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

3. Index de codage Quel que soit le système utilisé, il s’appuie sur des index Les index sont des liste de réponses caractéristiques

susceptibles d’être données et À chacune desquelles est affecté un code.

Doivent s’appuyer sur les déclarations des recensés et pas uniquement sur les libellés des postes de la nomenclature

Permet de répartir les réponses entre les diverses rubriques de la nomenclature

Qualité de ces index est primordiale; le temps et les efforts nécessaires ne doivent pas être sous-estimés

Les index ne sont pas statiques et doivent être mis à jour pour prendre en compte de nouvelles réponses

Page 7: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

4. Types d'opérations de codageLes opérations de codage peuvent impliquer une des trois options :

Assigner des codes numériques aux réponses libéllées en clair, par exemple les variables tels que lieux géographique, métier, activité économique, etc.

Reporter des codes numériques sur une feuille de programmation séparée de faciliter la saisie de données.

Utiliser des entrées précodées sur les questionnaires qui peuvent être employés directement pour la saisie de données

Page 8: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

5.Types de codage

Réponses pré-codées Codage manuel en bureau

Page 9: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

(a) réponses pré-codées Adapté aux questions fermées; les nombres dans les cases du questionnaire

sont employés pour coder les réponses

Dans la mesure du possible, les réponses précodées devraient être employées pour le recensement avec des codes numériques ou alphanumériques

Les catégories de codage devraient être mutuellement exclusives et exhaustives

Pour: Plus facile Plus rapide

Contre: Ne peut pas être utilisé pour des questions ouvertes

Page 10: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

(b) Codage manuel en bureau

Toutes les questions de recensement ne peuvent être précodées, par exemple, celles qui exigent des réponses ouvertes

L’étendue complète des réponses peut ne pas être connue et ne peut pas donc être codée sur place, ainsi le codage est fait après la collecte

Page 11: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

Questions ouvertes: avantages

Permet aux répondants de s’exprimer par eux-mêmes, plutôt qu’avec les termes choisis par les organisateurs du recensement

Particulièrement approprié pour des concepts complexes comme la profession

Les chercheurs peuvent étudier comment les répondants parlent de leur profession par example, et trouver des informations de valeur pour eux

Page 12: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

Questions ouvertes: inconvénients

Différents répondants peuvent aborder la même question de différentes perspectives de sorte que leurs réponses ne puissent pas être entièrement comparables

Les questions ouvertes sont une source commune d'erreur de mesure sur des recensements

Le codage peut impliquer de grouper ensemble les répondants qui ont apporté les réponses semblables. Puisqu'aucun deux répondants peuvent jamais ne pas donner des réponses identiques, le codeur peut compléter des détails d'une réponse en faisant des conjectures au sujet de quel répondant a voulu dire pour dire.

Page 13: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

Questions ouvertes: problèmes autour du codage Toutes les questions d’un recensement ne peuvent être

précodées (par exemple, caractéristiques économiques)

Il est nécessaire de former le personnel pour déterminer des codes appropriés avec les listes des codes existantes sur la base de l'information fournie par des répondants

La catégorie « autre » est habituellement incluse parce que souvent la gamme complète des réponses n'est pas connue

Page 14: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

6. systèmes de codage

Les réponses textuelles et verbales doivent être remplacées par des codes par intervention :

Manuelle Assistée par ordinateur Automatique Combinaison des précédentes

Page 15: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

(a)Codage manuel Les codeurs assignent manuellement un code aux réponses en consultant l’index,

ou les livres de code

Ils écrivent alors manuellement les codes sur un formulaire pour la saisie et le traitement de données postérieurs

Pour: Simple

Contre: Long et pénible Sujet à des biais et au sur-codage (codeur trop zélé pour trouver un code même en

l’absence d’information suffisante) Plus sujet à erreurs que d'autres types de codage.

Page 16: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

(b) Codage assisté par ordinateur Systèmes automatisés (ordinateurs centraux, PCs,

etc.) utilités pour aider les codeurs

Les index utilisés sont comme décrit auparavant, mais cette fois ils sont stockés sur l’ordinateur. Les codes associés sont stockés dans une base de données et accédés pendant l'opération de codage

Un codeur peut saisir soit à partir de feuilles de programmation soit saisir chaque réponse à partir du questionnaire directement

Page 17: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

(b) Codage assisté par ordinateur (cont.) Exécution pratique :

Le codeur dactylographie quelques caractères de chaque mot dans la réponse

L'ordinateur renvoie une liste de valeurs possibles à partir de l'index de codage approprié

Le codeur choisit la valeur dans la liste de possibilités L'ordinateur enregistre automatiquement le code

correspondant Exemple : pour « éleveur de volaille » le codeur écrit «

elev vol »

Page 18: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

(b) Codage assisté par ordinateur (cont.)

Pour: Relativement plus efficace Plus de règles de codage peuvent être incorporées au

système pour guider les codeurs, ce qui a pour conséquence des données de meilleure qualité

Approprié au codage structuré en particulier

Contre: Relativement complexe Long et coûteux à développer

Page 19: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

(c) Codage automatique Un algorithme automatisé compare la réponse textuelle capturée

(par exemple, d'ICR) à des index, et assigne le numéro de code dans la majorité des cas sans intervention humaine

Implique typiquement un mécanisme de notation où un nombre minimum de points est exigé avant qu'une réponse soit considérée comme valide

Quand le score est au-dessous d'un certain niveau, l'intervention humaine est nécessaire

Les taux de codage dépendent des algorithmes utilisés et des types de variables

Page 20: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

(c) Codage automatique (cont.) Pour:

Vitesse Grande efficacité Bonne qualité Particulièrement adapté au codage structuré

Contre: Complexe Coûts élevés Risques d’erreurs systématiques dans le cas de défauts

dans les algorithmes de correspondance et les index

Page 21: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

7. Organisation du codage NSO élaborent souvent une liste de codes communs pour quelques

variables employées dans le recensement et dans les enquêtes ; par exemple, lieu de naissance, langue, appartenance ethnique/race, citoyenneté

L'exemple du code commun pour le « lieu géographique » pourrait être code hiérarchique de 3 chiffres avec pour le premier chiffre le plus large niveau de la géographie, et le troisième chiffre le niveau le plus fin

Le problème commun qui se pose est quand les définitions diffèrent ou changent entre les recensements (ou entre un recensement et une enquête) pour des variables telles que le travail ou l'appartenance ethnique ; le NSO doit développer une politique sur la façon dont prendre en considération ces changements

Pour le « codage simple », le NSO doit définir une liste de codes: Ex. Sexe : maaculin-1, féminin-2 ; Ex. Type d’inactivité : au foyer-0, étudiant-1, retraité-2, other-3

Page 22: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

7. Organisation du codage (cont.) Pour « le codage structuré », il y a un certain nombre de

systèmes de classification internationaux que les NSOS peuvent employer directement ou adapter à leurs propres variantes nationales

Exemples:

(a) Classification Internationale Type par Industrie, de toutes les branches d’activité économique, CITI Rév. 4

Type de code Niveau Catégorie Code

Deux chiffres Division Fabrication de produits alimentaires 10

Trois chiffres Groupe Travail des grains, fabrication de produits amylacés

106

Quatre chiffres Classe Travail des grains 1061

Page 23: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

7. Organisation du codage (cont.)

(b) Classification Internationale Type des Professions, CITP-08

Type de code Niveau Catégorie Code

Deux chiffres Sous-grands groupes

Métiers qualifiés du bâtiment et assimilés, sauf électriciens

71

Trois chiffres Sous-groupes Métiers qualifiés du bâtiment (gros oeuvre) et assimilés

711

Quatre chiffres Groupes de base Maçons 7112

Page 24: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

8. Sources d’erreurs de codage

Les règles de codage peuvent être déficientes

Les règles de codage peuvent ne pas être correctement appliquées

Le codage peut être fortement subjectif

Les opérations de codage sont importantes dans les recensements et donc difficile à contrôler

Page 25: Codage des données de recensement:  Une vue d’ensemble

Atelier régional des Nations Unies sur le traitement des données de recensement: les technologies modernes pour la saisie et la correction des données - Bamako, Mali, 3-7 novembre 2008

MERCI