©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 2
La numérisation en bibliothèques
Quelques éléments de la problématique
Lausanne – 3 avril 2009
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 3
Depuis quand numérise-t-on?
début des années 1980, généralisation de l’information sous forme numérique, d’abord "native" (digital-born documents),puis projets de rétro-numérisation à partir de documents imprimés
Bibliothèque Ste Geneviève (iconogr.)Gallica (textes, sous forme image)CEVIS Martigny (iconogr.)StUB : collection Ryhiner (iconogr.), etc.didacticiel de Cornell University
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 4
Que numérise-t-on?
documents iconographiques (ex. KORA, les affiches suisses)
manuscrits (ex. E-codices)livres précieux (ex. Digi-archives, BPU
Neuchâtel, KORA)quotidiens (ex. La Liberté, le Journal de
Genève)revues scientifiques (backfiles Jstor, etc.)livres (ex. Gallica, Google)
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 5
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 6
s it e s mi ro ir
1 . s cann i ng
2. t r ai t em e nt OCR
3. ( r e )f o rm atag e
4 . m é tadonn é e s
S e r veurd'ac c ès( fo rm a t spo rt ab l es )
St ockagepé r enne( fo rm a t ri che )
R ˇ tr o -n u m ˇ r isat io n D ocum e nt s na t i fsnum ér ique s
à pa r t ir d edoc s im p r imé s
à pa r t ir d emi c r of ilm s ( exe m p l e :
th ès e s U nil )
( SER V A L, RER OD O C ,Goog l e Book s )
( B i b li o t h è qu e n a ti ona lepo u r l es th èse s )
( ex: M e s s agerbo it e u x)
( ex: o u vrag e sde l a R é se r ve )
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 7
Sélection et manipulation des ouvrages:
droit d'auteur
état physique des documents
manipulation des documents
mesure de préservation?
s it e s mi ro ir
1 . scann ing
2. t rai tem e nt OCR
3. ( re )f o rm atag e
4 . m é tadonn é es
S erveurd'ac c ès(fo rm a tspo rt ab les )
St ockagepé renne(fo rm a t ri che )
R ˇ tr o -n u m ˇ r isat io n D ocum e nt s na tifsnum ér ique s
à pa r tir d edoc s im p r imé s
à pa r tir d emi c rof ilm s (exe m p le :
th ès e s U nil )
(SER V A L, RER OD O C ,Goog le Book s )
(B ib li o th è qu e n a ti ona lepo u r l es th èse s )
(ex: M e ss agerbo it eu x)
(ex: o u vrag e sde l a R é se r ve )
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 8
choix du format de numérisation (densité en bpi)
choix du format d'archivage (TIFF, JPEG, etc.)
traitement OCR ou pas (pour accès sur les mots du texte)
Aspects techniques :
sites mi ro ir
1. scann ing
2. t rai tem ent OCR
3. ( re)form atag e
4 . métadonn ées
Serveurd'ac cès(fo rm atspo rtab les )
St ockagepé renne(fo rm at riche )
R ˇ tro-n um ˇ risat io n D ocum ent s na tifsnum ér ique s
à pa rtir dedoc s im primé s
à pa rtir demi crof ilm s (exe m ple :
th ès es Unil )
(SER VAL, RER ODOC,Goog le Book s)
(Bibliothèqu e nationa lepo ur les th èse s)
(ex: M essagerbo iteux)
(ex: ouvrag esde la R ése rve )
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 9
Métadonnées :
ensemble des informations qui caractérisent l'objet numérique
standards internationaux (Dublin Core, METS)
ontologies sit es mi ro ir
1 . scann ing
2. t rai tem ent OCR
3. ( re )f o rm atag e
4 . m é tadonn é es
S erveurd'ac c ès(fo rm atspo rt ab les )
St ockagepé renne(fo rm at ri che )
R ˇ tr o -n u m ˇ r isat io n D ocum e nt s na tifsnum ér ique s
à pa r tir d edoc s im p rimé s
à pa rtir demi crof ilm s (exe m ple :
th ès e s U nil )
(SER V A L, RER OD O C ,Goog le Book s)
(B ib li o th è qu e n a ti ona lepo u r l es th èse s )
(ex: M e ssagerbo it eu x)
(ex: ou vrag e sde l a R é se rve )
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 10
Accès aux documents :
gratuit ou payant?
restreint ou libre?
unifié via des portails thématiques?
sit es mi ro ir
1 . scann ing
2. t rai tem ent OCR
3. ( re)f orm atag e
4 . m étadonn ées
S erveurd'ac cès(fo rm atspo rt ab les )
St ockagepé renne(fo rm at ri che )
R ˇ tr o-n um ˇ risat io n D ocum ent s na tifsnum ér ique s
à pa rtir dedoc s im primé s
à pa rtir demi crof ilm s (exe m ple :
th ès es U nil )
(SER V AL, RER OD O C ,Goog le Book s)
(B ibli o thèqu e nati ona lepo u r l es th èse s)
(ex: M essagerbo it eu x)
(ex: ou vrag esde l a R ése rve )
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 11
Archivage pérenne :
avec accès aux documents garanti sur la durée
assure que les objets numériques seront toujours lisibles sur le long terme
normes internationales sit es mi ro ir
1 . scann ing
2. t rai tem ent OCR
3. ( re)f orm atag e
4 . m étadonn ées
S erveurd'ac cès(fo rm atspo rt ab les )
St ockagepé renne(fo rm at ri che )
R ˇ tr o-n um ˇ risat io n D ocum ent s na tifsnum ér ique s
à pa rtir dedoc s im primé s
à pa rtir demi crof ilm s (exe m ple :
th ès es U nil )
(SER V AL, RER OD O C ,Goog le Book s)
(B ibli o thèqu e nati ona lepo u r l es th èse s)
(ex: M essagerbo it eu x)
(ex: ou vrag esde l a R ése rve )
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 12
Mais aussi
financement des opérations?
sensibilisation des politiques?
statut des bibliothèques?
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 13