CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 &...

Preview:

Citation preview

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/1

CREPUQ - Sous-groupe de travail sur les fichiers de données numériques

Les données numériques: Atelier d’information et de démystification

EXTRACTION & UTILISATION DES DONNÉES

Anastassia KhouriService de données & resources électroniques

Université McGill

http://www.library.mcgill.ca/edrs/

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/2

EXTRACTION & UTILISATION DES DONNÉES

1. Introduction

2. Processus d’extraction et utilisation

3. Rôle de la documentation

4. Pré-extraction et Extraction

5. Utilisation

6. Conclusion

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/3

PROCESSUS D’EXTRACTION &

UTILISATION DES DONNÉES

IDENTIFICATION

ACCÈS

CONSULTATION

EXTRACTION TESTING

ANALYSE

ARCHIVAGE RAPPORT

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/4

IDENTIFICATION PROCESSUS D’EXTRACTION & UTILISATION DES DONNÉES

Identification des besoins

Identification des données

& Documentaion

Données brutes à organiser

Données Pré - organisées

Information& documentation

connexe

Guide d’utilisation(Code book)

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/5

ROLE DE LA DOCUMENTATIONIMPRIMÉE - ÉLECTRONIQUE (Suite) Complémentarité

Similarité et duplication

Exhaustivité

Disponibilité

Accessibilité

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/6

ROLE DE LA DOCUMENTATIONIMPRIMÉE vs ÉLECTRONIQUE (Suite)

Format unique

Format double Politique d’accès Politique de disponibilité / prêt

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/7

ROLE DE LA DOCUMENTATIONCONNEXE ET PÉRIPHÉRIQUE (Suite)

Facilite la recherche en général Piste de recherche préliminaire Source d’information spécifique sur:

Localisation Type Source Discipline, etc

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/8

ROLE DE LA DOCUMENTATION SPÉCIFIQUE - GUIDE “Code Book”

(Suite)

Clef de lecture, de compréhension et d’utilisation d’un fichier de données

Description des éléments et du contenu du fichier

Source d’information exclusive et exhaustive sur le fichier

Source d’information générale, spécifique et complémentaire

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/9

PRÉ - EXTRACTION (Données brutes)

Source d’information à extraire du guide ( Code book)

1. Structure des données

2. Variables indentifiées & choisies

3. Information supplémentaire

4. Etiquette d’identification

5. Eléments marginaux de base pour les tests

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/10

PRÉ - EXTRACTION (Données brutes)

Source d’information à extraire du guide ( Code book)(Suite)

1. Structures des données Structure rectangulaire (cliché d’enregistrement logique) Structure “Card image” (cliché d’enregistrement multiple) Structure hiérarchique Structure relationelle

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/11

2. Variables identifiées & choisies Localisation (colonne) Type (alpha / numérique) Formatage (decimal / vide “blank”)

3. Information supplémentaire Identification spécifique Poids

PRÉ - EXTRACTION (Données brutes) Source d’information à extraire du guide ( Code book)

(Suite)

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/12

4. Etiquettes d’identification

Etiquette de chaque variable Valeur individuelle d’extraction

5. Eléments marginaux de base pour les tests

PRÉ - EXTRACTION (Données brutes)Source d’information à extraire du guide ( Code book)

(Suite)

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/13

1. Choix de l’outil en fonction du type d’analyse à effectuer

Extraction seulement Extraction et analyse Extraction, analyse et rapport

PRÉ - EXTRACTION (Données brutes)

Outils d’extraction & éléments de transfert

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/14

2. Stratégies de transfert des données Commande d’archivage de chaque

“record” Commande de lecture Commande de sauvegarge Commande d’intégration des

différents niveaux de données Commande de compression, etc

PRÉ - EXTRACTION (Données brutes) Outils d’extraction & éléments de transfert

(Suite)

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/15

Exemple: Programme d’extraction SAS

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/16

Exemple: Programme d’extraction SAS (Suite)

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/17

Exemple: Programme d’extraction SAS (Suite)

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/18

Exemple: Programme d’extraction SAS (Suite)

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/19

OUTILS D’ANALYSE

Les “plateformes” Gros ordinateur (Mainframe) PC / réseaux Macintosh Unix

Logiciels SAS SPSS STATA, etc

Tableurs électroniques Lotus Excel, etc.

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/20

PROGRAMMATION, TEST & EXTRACTIONPARTENAIRES

Programmeur

Assistant de recherche Etudiant / Professeur / Chercheur Autre

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/21

UTILISATION

Utilisation multiple Utilisation diversifiée Utilisation illimitée

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/22

DONNÉES PRÉ-ORGANISÉES PROCESSUS D’EXTRACTION & UTILISATION DES DONNÉES

Données Pré-organisées

Imprimés

•Internet•CD•Disk

Copier Données•qq variables•Tableau

Papier

Analyse Utilisation

•Rapport imprimés•V. éléctronique•Archivage

Tableur éléctronique

Accès Extraction

•Tableaux•Graphiques

Rapport imprimé

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/23

DONNÉES PRÉ-ORGANISÉESPROCESSUS D’EXTRACTION & UTILISATION DES DONNÉES

Données Pré-organisées

Accès

•Internet•CD•Disk

Extraction

Différents formats

Différentes méthodes

Analyse Utilisation

•Rapport imprimés•V. éléctronique•Archivage

Tableur éléctronique

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/24

DONNEÉS BRUTES PROCESSUS D’EXTRACTION & UTILISATION DES DONNÉES

Données brutes à organiser

Methodologie d’extraction

Logiciels d’extraction Programmation

Extraction

Transfert des donnéesArchivage

Analyse des données

Rapport

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/25

UTILISATIONExemples

Ferret - Census USA http://ferret.bls.census.gov/egi-bin/ferret/

Cansim - Université de Toronto http://datacentre.chass.utoronto.ca:5680/cansim/cansim.html UNESCO - Stathttp://unescostat.unesco.org/

FAO - Stat http://apps.fao.org/

CREPUQ - Atelier sur les données numériques / Extraction & Utilisation des données / 5 & 6 février 1998 / Anastassia Khouri / Université McGill / khouri@lib1.lan.mcgill.ca http:/ /www.library.mcgill.ca/edrs/seminar.htm 5/26

CONCLUSION

La compréhension du processus de recherche, de

programmation, d’extraction, d’analyse et d’utilisation sont les éléments préliminaires de base d’un Service de données

Recommended