Click here to load reader
Upload
berenice-conte
View
109
Download
3
Embed Size (px)
Citation preview
CREPUQ - Atelier sur les données numériques 1
Les données numériques : Les données numériques : atelier d'information (et de atelier d'information (et de
démystification) - démystification) - Le rôle des données numériquesLe rôle des données numériques
Québec, le 5 février 1998 Montréal, le 6 février 1998
CREPUQ - Sous-groupe de travail sur les fichiers de données numériques
(http://brise.ERE.UMontreal.CA:80/~bullj/crepuq/)
par: Jerry Bull
CREPUQ - Atelier sur les données numériques 2
Le rôle des données numériques Le rôle des données numériques dans le contexte de la recherchedans le contexte de la recherche
Typologie de l'utilisation des données numériques : à quoi servent les données ?
Deux principaux types d'utilisation :
Recherche de statistiques quelques chiffres pour un rapport
dans des sources imprimées (bulletins ou annuaires statistiques)
dans la documentation accompagnant un fichier de données extraits à partir d'un fichier de données
CREPUQ - Atelier sur les données numériques 3
Recherche de statistiques (suite) un tableau statistique sommaire affichant un
nombre réduit de variables tableau pré-coordonné, imprimé ou sur CD-ROM tableau extrait à partir d'un fichier de données brutes
Typologie de l'utilisation des données numériques : à quoi servent les données ? (suite)
CREPUQ - Atelier sur les données numériques 4
Analyse statistique à partir des données brutes dans le but de valider une hypothèse de recherche– établir une relation entre des variables
Exemple :
Un chercheur désire démontrer qu'il y a une corrélation entre la capacité d'utiliser un ordinateur et le revenu de la personne
Hypothèse : les travailleurs qui ont des connaissances en informatique ont accès à des salaires supérieurs.
On trouve dans l'Enquête sociale générale de 1994 (cycle 9) de Statistique Canada, Études, travail et retraite les variables suivantes :
Répondant peut se servir d'un ordinateur
Revenu d'emploi
Une analyse statistique effectuée sur un sous-ensemble de données constitué de ces deux variables extraites du fichier de microdonnées de cette enquête permettrait au chercheur de déterminer s'il existe une corrélation entre les deux variables et donc de valider son hypothèse.
Typologie de l'utilisation des données numériques : à quoi servent les données ? (suite)
CREPUQ - Atelier sur les données numériques 5
Supports : caractéristiques et facilité d'utilisation imprimés
– tableaux pré-coordonnés
– utilisation et compréhension relativement faciles
Internet– tableaux pré-coordonnés, génération de tableaux individualisés,
extraction de sous-ensembles dans une variété de formats de sortie pour traitement et analyse ultérieurs, transfert par ftp de fichiers de données brutes pour traitement et analyse ultérieurs
– interfaces très variables mais relativement faciles à utiliser
Le rôle des données numériques Le rôle des données numériques dans le contexte de la recherche dans le contexte de la recherche
Choix du format des données utilisées et du support de distribution :
CREPUQ - Atelier sur les données numériques 6
Supports : caractéristiques et facilité d'utilisation CD-ROM (données avec logiciels [bundled])
– tableaux pré-coordonnés, génération de tableaux individualisés, extraction de sous-ensembles dans une variété de formats de sortie pour traitement et analyse ultérieurs
– interfaces relativement faciles à utiliser
CD-ROM (support de transport et stockage seulement)– données brutes seulement, ou– données brutes avec extracteur permettant de faire un choix de variables,
unités géographiques, années, pour analyse ultérieure– pour usagers expérimentés
Choix du format des données utilisées et du support de distribution :
CREPUQ - Atelier sur les données numériques 7
Supports : caractéristiques et facilité d'utilisation disquettes (surtout support de livraison de sous-produits
individualisés)– fichiers de données brutes au complet (fichiers de petite taille)– sous-ensembles de variables, unités géographiques, années (souvent créés à
la demande de l'usager) , pour analyse ultérieure– pour usagers expérimentés
fichiers reçus par FTP– fichiers de données intégraux généralement sans traitement (fichiers ASCII)– pour usagers expérimentés
Choix du format des données utilisées et du support de distribution :
CREPUQ - Atelier sur les données numériques 8
Critères de choix l'objectif de recherche visé disponibilité des données dans le format désiré
– (tableaux sommaires, fichiers bruts, fichiers bruts formatés SPSS, SAS, Beyond 2020, etc.)
disponibilité des données sur le support désiré– N.B. le contenu d'un produit peut varier selon le support
capacité de l'usager à utiliser le support
Choix du format des données utilisées et du support de distribution :
CREPUQ - Atelier sur les données numériques 9
Critères de choix (suite) capacité de l'usager à manipuler les données et à en
faire l'analyse le temps dont dispose l'usager
– temps requis pour l'acquisition des données
– temps requis pour la mise en place locale, le traitement et l'analyse des données
Choix du format des données utilisées et du support de distribution :