19
20 juin 2022 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du Conseil du CERN 1/19 Projet de numérisation Projet de numérisation des documents du Conseil du des documents du Conseil du CERN CERN - Sandrine Reyes - - Sandrine Reyes - Archives Historiques du CERN Archives Historiques du CERN

16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

Embed Size (px)

Citation preview

Page 1: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 1/19

Projet de numérisationProjet de numérisationdes documents du Conseil des documents du Conseil

du CERNdu CERN

- Sandrine Reyes - - Sandrine Reyes - Archives Historiques du CERNArchives Historiques du CERN

Page 2: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 2/19

Le Conseil du CERNLe Conseil du CERNLe Conseil : Organe de tutelle du CERN4 Réunions par anDélégations des 20 Etats MembresPrésident du Conseil + Directeur-Général

recherche en physique des particulesadopter les budgets approuver ses programmes fixer ses objectifsnommer les membres de sa Directionetc.…

Conformément à la Convention du CERN adoptée le 1er juillet 1953 , le Conseil a également établi

le Comité des Directives Scientifiques (SPC) et le Comité des Finances (FC)

Page 3: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 3/19

Projet de numérisationProjet de numérisation

En 2008, le Président du Conseil a demandé au groupe Information Scientifique de donner l’accès aux documents provenant du Conseil tout en respectant les règles d’accès

Ce projet de numérisation de documents et gestion des métadonnées a commencé en janvier et doit se terminer en décembre 2009

Page 4: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 4/19

SommaireSommaireAnalyse :

documents métadonnées outils

ObjectifsProcédure de travail :

Grille de saisie – Standardisation des champs Uploader – Format MARC21 Codes-Barres - Numérisation Titres français Xenu – OCR - Chkall

Résultats : Visualisation sur CERN Documents Server (CDS)

(format bref et détaillé) Recherche sur CDS

(dans les métadonnées et les fulltexts)

Page 5: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 5/19

Analyse : Documents du Analyse : Documents du ConseilConseil

Procès-verbaux édités généralement dans les 2 langues officielles du CERN : Anglais et françaisUn procès-verbal peut concerner 1-2 voire 3 comitésChaque document possède au minimum une référence : CERN/0250Respecter la confidentialité des documents

Page 6: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 6/19

Analyse : MétadonnéesAnalyse : Métadonnées

Provient d’une base FileMakerPro tenue par le Secrétariat du Conseil 7 000 Notices accessibles sur le Serveur de Documents du CERN (CDS)Notices manquantesMétadonnées non conformes au format MARC212 Notices : Anglais – Français

Page 7: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 7/19

Analyse : Outils Analyse : Outils

Notices accessibles sur CDS-Invenio : Extraction et Importation de données

Possibilité de travailler sur BibEdit pour un travail à l’unité (Editeur développé au CERN pour remplacer le module de catalogage du système d’automatisation utilisé par la bibliothèque)

Possibilité de travailler en série sous UNIX avec l’éditeur Emacs

Page 8: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 8/19

Analyse : OutilsAnalyse : OutilsExemples de notices sur BibEditExemples de notices sur BibEdit

Page 9: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 9/19

Objectifs :Objectifs :

Obtenir 1 notice pour les 2 versions Enregistrer les documents manquantsAdapter les notices au format MARC21Accéder à 2 fichiers électroniques incluant l’OCRRespecter les règles d’accèsConfidentiel : 30 ans – Non confidentiel : 5 ansDonner une visualisation plus appropriée de la notice sur CDS (format bref et détaillé)

Page 10: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 10/19

Procédure :Procédure :Grille de saisie - StandardisationGrille de saisie - Standardisation

Établir une grille de catalogage standard en décrivant l’ensemble des champs qui peuvent être utilisés dans cette série

Standardiser les champs 111, 711, 269 269__c : 16 / 17 juin 1965 ➩ 269__c : 16 -

17 Jun 1965

269__c : 6 février 1965 ➩ 269__c : 06 Feb 1965

Page 11: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 11/19

Procédure :Procédure :Uploader – Format MARC21Uploader – Format MARC21

Formater les métadonnées avec l’outil Uploader grâce à une configuration spécifique à cette source – Catalogage conforme au format MARC21

AVANT APRES

041 __ a eng 041 __ a eng 041 __ a fre

111 __ d 16 - 17 Jun 1965 111 __ 9 19650616 __ n C 30 __ a 30th Session of Council __ n 30

__ c CERN, Geneva, Switzerland __d 16 – 17 Jun 1965

__ f 1965 __ g cern19650616 __ w CH __ z 19650617

711 __d 20 – 21 jun 1965 711 __ 9 19650620 __n FC 25 __ a 25th Meeting of Finance Committee

__ n 25 __ c CERN, Geneva, Switzerland __ d 20 – 21 Jun 1965 __ f 1965 __ g cern19650620 __ w CH __ z 19650621

595 __ aSISARC-2009

Page 12: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 12/19

Procédure :Procédure :Codes-barres - NumérisationCodes-barres - NumérisationEquiper les documents d’un code-barre pour la numérisation Ajouter ces codes-barres dans le champs 088__9 des notices anglaises : Extraction et importation de données

Envoyer les documents au service du scanning

No System

No Rapport Excel

No SystemNo code barre

Emacs Unix

CDS-InvenioBase de données

Du Conseil

Page 13: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 13/19

Procédure :Procédure :Exemple tableau Excel – fichier Unix Exemple tableau Excel – fichier Unix

Page 14: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 14/19

Procédure :Procédure :Titres françaisTitres français

Ajouter les titres français en 246__a dans les notices anglaises : Extraction et importation de données

245__a 246__a

Page 15: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 15/19

Procédure :Procédure :Xenu – OCR - ChKallXenu – OCR - ChKall

Supprimer les notices françaises de la base

Programme Xenu pour détecter les adresses incorrectes des documents revenus du ScanningEnvoyer ces adresses au Service Informatique qui utilise le programme OCRopus développé par Google pour la reconnaissance de texteProgramme ChKall – Outil configuré pour contrôler le bon formatage et le bon contenu des métadonnées

Page 16: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 16/19

Résultats :Résultats :Visualisation sur CDSVisualisation sur CDS

En format Bref

En format Détaillé

Page 17: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 17/19

Résultats :Résultats :Recherche sur CDS dans les Recherche sur CDS dans les métadonnéesmétadonnées

Page 18: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 18/19

Résultats :Résultats :Recherche sur CDS dans les fulltextsRecherche sur CDS dans les fulltexts

Page 19: 16 décembre 2014 13/10/09 Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN Projet de numérisation des documents du

11 avril 202313/10/09

Sandrine Reyes – Groupe Information Scientifique (SI) - Archives Historiques du CERN

Projet de numérisation des documents du Conseil du CERN 19/19

Questions ?Questions ?