Upload
stephane-dufournet
View
731
Download
1
Embed Size (px)
DESCRIPTION
Compte de rendu de sessions du 80ème congrès mondial des bibliothèques IFLA 2014 : le dépôt légal des ebooks, la fouille de données (Text&Data Mining), les posters scientifiques, l'IdeasBox (médiathèque mobile pour camps de réfugiés)
Citation preview
Session 87 --- Digital
preservation of e-books: Best
practice in libraries
Session 96 --- Poster session
Session 119 — Research in
the big data era
Définition du livre numérique
Ouvrage édité et diffusé sous forme numérique, destiné à être lu sur un écran
Note :
1. Le livre numérique peut être un ouvrage composé directement sous forme numérique ou numérisé à partir
d'imprimés ou de manuscrits
2. Le livre numérique peut être lu à l'aide de supports électroniques très divers
3. On trouve aussi le terme « livre électronique », qui n'est pas recommandé en ce sens.
4, Équivalent étranger : e-book, electronic book
Source : JORF n°0081 du 4 avril 2012 page 6130 texte n° 118 « Vocabulaire de l'édition
et du livre (liste de termes, expressions et définitions adoptés) » (NOR: CTNX1206650K)
Le livre numérique peut être composé directement sous forme électronique ou bien numérisé à partir
d’imprimés ou de manuscrits. S’il est une version électronique d’un ouvrage imprimé, il est qualifié
d’homothétique et entre dans le cadre de la Loi n° 2011-590 du 26 mai 2011 relative au prix du livre
numérique.
SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES
INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.
SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN
LIBRARIES - INFORMATION TECHNOLOGY WITH PRESERVATION AND
CONSERVATION AND NATIONAL LIBRARIES.
• Le dépôt légal couvre tout les ouvrages de langue allemande publiés depuis
1913, qu’ils soient numérisés ou nativement produits sous forme numérique
• 1262593 ressources ont été collectées en 2014, dont 755000 ebooks et
thèses en ligne
• Le processus est entièrement automatisé mais les bibliothécaires interviennent
en entrée (choix des catalogues moissonnés…) et sortie de système (contrôle
des métadonnées)
L’automatisation du workflow nécessite que certaines caractéristiques techniques
soient correctement remplies :
• les métadonnées et les objets doivent être collectés ensemble
• le format des métadonnées doit être standard (ONix for Book 2.1, MARC XML,
XMETADISS+, tout comme celui des fichiers informatiques (PFD, EPUB, MP3,
JPEG, ZIP, etc.)
• des accords doivent être passés avec chaque éditeur
• les DRM sont refusés (comme à la BnF)
Allemagne : processus automatisé de collecte des livres
électroniques dans le cadre du dépôt légal
SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES
INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.
• Après dépôt par les éditeurs sur un répertoire ftp du
livre électronique, le fichier de métadonnées sous ONIX
est converti de l’XML vers l’INTERMARC : l’ONIX permet
la création automatique de liens vers les différentes
formats d’une même œuvre (version imprimable, etc.)
• Contrairement aux métadonnées, les fichiers d’ebook
ne sont jamais convertis : ils sont validés par
Epubcheck, un outil développé par l’International Digital
Publication Forum (IDPF)
• Ils doivent ensuite être préparés à rejoindre SPAR
(Scalable Preservation and Access Repository), le
répertoire digital de Gallica, qui traite notamment
l’identifiant persistant ARC de l’ebook
• les fichiers qui contiennent des éléments Flash ou
Javascript, potentiellement viraux, sont placés dans un
espace sécurisé.
France : Schéma d’intégration des ebooks dans Gallica
SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES
INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.
Japon : le dépôt légal des ebook à la bibliothèque
de la Diète
En 2012, la loi NDL donne à la National Diet Library le droit
d'enregistrer "les publications en ligne" issues du secteur privé.
• Les éditeurs privés sont alors tenus de communiquer à la NDL
leur publications numériques (contenu de sites web, livres
numériques, publications électroniques, etc.)
• Ils doivent permettre le cas échéant la collecte des fichiers
numériques sur l'Internet; mais la NDL ne peut recueillir que les
publications en ligne gratuites et non protégées par la gestion
des droits numériques (DRM)
Cette loi est difficile à appliquer car les éditeurs ne collaborent pas.
• seules 18000 publications issues du secteur marchand ont été
intégrées au dépôt légal.
• Pour contourner cet écueil, la NDL a passé avec des éditeurs
majeurs des accords de coopération temporairement d’une
durée de 3 ans...
SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES
INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.
la Bibliothèque nationale et universitaire de Zagreb est tenue de
recueillir et de conserver dans le cadre du dépôt légal (Law Library,
1997) toutes les publications électroniques (y compris les ressources
en ligne). Le développement de l'infrastructure de bibliothèque
numérique a donc débuté en 2004 avec l’archivage du web (Croatian
Web Archives) et s'est poursuivi avec la mise en place de systèmes
spécialisés de gestion des périodiques numérisés (2009), des thèses
(2010) et des e-books (2012).
La commercialisation de livres numériques en langue nationale n’est
apparue qu’en 2010 :
• Depuis cette date, 330 ebooks ont été commercialisés par quatre
éditeurs. Mais la protection par DRM est largement minoritaire.
• Il y aurait en effet plus de 1800 ebooks gratuits en langue croate,
produits pour la plupart en auto-édition.
• Tous les types de publications monographiques disponibles sous
forme numérique (livres numériques et numérisés, livres
audionumériques) sont archivés dans un système de bibliothèque
numérique (D-book).
Croatie : le dépôt légal des ebooks, élément de constitution d’une identité culturelle nationale
• la Bibliothèque nationale de Chine (NLC) prend la
responsabilité de la collecte des publications nationales et
étrangères pour mieux préserver le patrimoine culturel de
l’humanité dans son ensemble…
• Le National Digital Library Project a ainsi archivé plus de
quatre millions de volumes.
• La bibliothèque respecterait les règles internationales de
copyright lorsqu’elle importe des livres électroniques
commerciaux : l'ensemble des ressources peut être donc être
consulté dans et hors la bibliothèque, sous réserve
d’inscription sur son site web...
Description du projet :
http://www.dlib.org/dlib/may10/dawei/05dawei.html
SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES
INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL
LIBRARIES.
Chine : le dépôt légal des ebooks inclus les
publications étrangères
SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST
PRACTICE IN LIBRARIES - NFORMATION TECHNOLOGY WITH
PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.
Indonésie : numérisation de manuscrits
La bibliothèque nationale d’Indonésie (Museum and National Library of
Indonesia) est une agence gouvernementale chargée de la préservation du
patrimoine écrit.
• Il n’y a pas de dépôt légal des ebooks
• Le programme de numérisation est valorisé sur www.indonesiaheritage.org)
• La numérisation doit tenir compte de contrainte de coût, de faisabilité
technique et d’usages potentiels
Conclusion :
• Il reste difficile pour la plupart des bibliothèques nationales de mettre en place un système
de dépôt légal des livres numériques commerciaux, en raison d’une moindre collaboration
des éditeurs.
• Les processus techniques de moissonnage des fichiers sont relativement similaires
• Le processus est entièrement automatisé mais les bibliothécaires interviennent en entrée
(choix des catalogues moissonnées…) et sortie de système (contrôle des métadonnées).
• La formation continue des personnels est un facteur important de réussite.
SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES
INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.
Big data
• Le terme Bigdata (en français « mégadonnées » parfois appelées « données massives » désignent des ensembles de données si volumineux qu'ils en deviennent difficiles à travailler avec des outils classiques de gestion de base de données ou de gestion de l'information.
• Ces données sont brutes, semi-structurées voire non structurées provenant du web (Web Mining), au format texte (Text Mining) et images (Image Mining).
• Ces données peuvent être publiques (Open Data, Web des données), géographiques (adresses IP), ou relever de la propriété des consommateurs (Profils 360°).
Text & Data Mining (TDM) • La fouille de textes ou «extraction de connaissances » est un ensemble de traitements informatiques consistant
à extraire des connaissances selon un critère de nouveauté ou de similarité.
• La première étape, l'analyse, consiste à reconnaître les mots, les phrases, leurs rôles grammaticaux, leurs relations et leur sens. Cette première étape est commune à tous les traitements.
• La seconde étape, l'interprétation de l'analyse, permet de sélectionner des éléments du texte pertients parmi d'autres.
• Exemples d'applications : création automatique de résumé de texte
SESSION 119 — RESEARCH IN THE BIG DATA ERA: LEGAL, SOCIAL AND TECHNICAL APPROACHES TO LARGE
TEXT AND DATA SETS — ACADEMIC AND RESEARCH LIBRARIES WITH SERIALS AND OTHER CONTINUING RESOURCES
AND COMMITTEE ON COPYRIGHT AND OTHER LEGAL MATTERS (CLM)
SESSION 119 — RESEARCH IN THE BIG DATA ERA: LEGAL, SOCIAL AND TECHNICAL APPROACHES TO LARGE
TEXT AND DATA SETS — ACADEMIC AND RESEARCH LIBRARIES WITH SERIALS AND OTHER CONTINUING RESOURCES
AND COMMITTEE ON COPYRIGHT AND OTHER LEGAL MATTERS (CLM)
la réutilisation des données est un facteur intrinsèque au TDM : d'où système juridique
#wlic2014 #bigdata
Généralement les données ne sont protégées par copyright contrairement à la publication
#wlic2014
Le copyright intervient à partir du moment l'information brute est analysée (ex. les
métadonnées en catalogage) #wlic2014 #bigdata
au USA le « Fair use » exception réglementaire pour l'utilisation du TDM dans le cadre de le
Recherche #wlic2014
En France les licences autorisent la TDM uniquement sur les publications auxquelles
l'université est abonnée #wlic2014
La keynote de Susan Reilly (Liber) http://library.ifla.org/id/eprint/1007 #bigdata
"TDM saves lives" en médecine, le TDM permet de rapprocher des données issues de la biologie
#wlic2014 #bigdata
Selon S. Reilly, l'exception de copyright pour le TDM aux USA n'est pas claire. Situation à ne pas
transposer en UE #wlic2014 #bigfaya
Dans le cadre de Licences for Europe, la Commission a proposé d’autoriser le TDM par le biais
des licences des bases de données #wlic2014 #bigdata
Pour Liber, le régime des licences adaptées par les fournisseurs pour le TDM n'est pas
acceptable #wlic2014 #bigdata
Pour Liber, il faut un régime d'exception au droit d'auteur pour le TDM. C'est une garantie de
liberté pour la recherche #wlic2014 #bigdata
Pour des questions plus précises sur le TDM et le droit d'auteur, contacter Susan Reilly sur
@LIBEReurope #wlic2014 #bigdata
SESSION 119 — RESEARCH IN THE BIG DATA ERA: LEGAL, SOCIAL AND TECHNICAL APPROACHES TO LARGE
TEXT AND DATA SETS — ACADEMIC AND RESEARCH LIBRARIES WITH SERIALS AND OTHER CONTINUING RESOURCES
AND COMMITTEE ON COPYRIGHT AND OTHER LEGAL MATTERS (CLM)
La keynote de Sarah Jones (Digital Curation Center) http://library.ifla.org/id/eprint/958 #wlic2014
Le PGD (plan de gestion des données) est un outil web permettant de répondre aux demandes des
chercheurs pour le TDM #wlic2014 #bigdata
Ce PGD multilingue est développé par le DCC. Il vient en complément des outils de découverte,
d'analyse, de stockage des données #wlic2014
Le registre des données de recherche (REF) est un outil statistique à destination des financeurs
Outils gratuits pour le catalogage des données : Datafinder tools (Oxford), c4D, CKAF. #wlic2014
Un outil libre de découverte , le RDRDS; le traitement des métadonnées étant un exercice difficile,
le DCC améliore cet outil #wlic2014
SESSION 119 — RESEARCH IN THE BIG DATA ERA: LEGAL, SOCIAL AND TECHNICAL APPROACHES TO LARGE
TEXT AND DATA SETS — ACADEMIC AND RESEARCH LIBRARIES WITH SERIALS AND OTHER CONTINUING RESOURCES
AND COMMITTEE ON COPYRIGHT AND OTHER LEGAL MATTERS (CLM)
La gestion des données de recherche est facilitée par la définition d’un plan de gestion de données (PGD) ou
Data Management Plan (DMP), document formel explicitant la façon dont on obtient et analyse vous les
données. Il décrit dans le détail les méthodes et processus de création, de fourniture, de maintenance, de
conservation et de protection des données (des modèles de PGD sont téléchargeables ici)
Plan de gestion des données
(Research Data Management )
Outils gratuits pour le
catalogage des données :
Datafinder tools (Oxford),
c4D, CKAF et Un outil libre de
découverte , le RDRDS; le
traitement des métadonnées
Collaborative Assessment of
Research Data Infrastructure and
Objectives (CARDIO) : outil pour
l’évaluation collaborative des données
de recherche
Data Asset Framework (DAF) : outil
pour gérer les données de l'activité
des chercheurs ( bases utilisées;
prévisionnel de recherche)
Registre des données de recherche (REF) :
outil statistique à destination des financeurs
Outil de gestion des risques
de conservation dans un
dépôt numérique
SESSION 119 — RESEARCH IN THE BIG DATA ERA: LEGAL, SOCIAL AND TECHNICAL APPROACHES TO LARGE
TEXT AND DATA SETS — ACADEMIC AND RESEARCH LIBRARIES WITH SERIALS AND OTHER CONTINUING RESOURCES
AND COMMITTEE ON COPYRIGHT AND OTHER LEGAL MATTERS (CLM)
Niveau stratégique
Les Outils du DDC pour le TDM
IDEASBOX : MÉDIATHÈQUE MOBILE POUR
SITUATION DE CRISE
l’Ideas Box fournit aux réfugiés des outils
essentiels pour mieux se reconstruire.
Elle leur permet d’accéder à Internet, aux
livres, à des ressources pédagogiques et
multimédia…
1 médiathèque dans 4 boites
IDEASBOX : MÉDIATHÈQUE MOBILE POUR
SITUATION DE CRISE
Le coin bibliothèque
IDEASBOX : MÉDIATHÈQUE MOBILE POUR
SITUATION DE CRISE
Le cybercafé
Espace multimédia et coffre de
rangement pour les tablettes
tactiles
IDEASBOX : MÉDIATHÈQUE MOBILE POUR
SITUATION DE CRISE
Le coin jeux
Espace télévision et jeux de
société
ESPACE EXPOSANTS : LA MÉDIATHÈQUE DU FUTUR
Nouveau mobilier :
Distributeur de livres et fauteuils de lecture
SESSION 96 — POSTER SESSION
Le poster de recherche scientifique
Le poster est utilisé pour présenter des études et des résultats scientifiques lors de colloques professionnels
Il est généralement en anglais structuré selon la démonstration souhaitée et illustré de photos, schémas ou
graphiques. Les titres du poster utilisent souvent les mots suivants : résumé, introduction, objectif,
hypothèse, méthode, résultat (présenté sous forme de tableaux, de schémas ou d'images), conclusion,
discussion, référence.
Plus de 200 posters étaient exposés dans le hall du Palais des congrès
Au delà de la valeur scientifique des présentations, les participants ont rivalisé d’imagination pour faire
passer leur message.
SESSION 96 — POSTER SESSION
Le poster virtuellement tactile
Le poster du Danish Think Tank sur la
bibliothèque du futur
http://fremtidensbiblioteker.dk/in-english/
Le DTT est un établissement financé par le
privé et le public pour aider les
établissements danois à construire leur
bibliothèque numérique.
Le poster présente une image
intéressante, liée au numérique tactile :
une main démultipliée
SESSION 96 — POSTER SESSION
Le poster avec tracts
Le poster de l’association des directeurs de
CFCB :
http://assodircrfcb.files.wordpress.com/201
4/04/flyer-a5-francais.pdf
Il est disponible en quatre langues (anglais,
français, italien, espagnol)
SESSION 96 — POSTER 88
DIGITIZATION: COLLABORATIVE PROJECT DYNAMICS
Le poster le plus gracieux
Le poster de la BIU Cujas sur le programme de
numérisation réalisé en partenariat avec le Cines
et la BnF
SESSION 96 — POSTER 196
FADBEN: SUPPORTING AN INFORMATION-
DOCUMENTATION CURRICULUM
Le poster avec marque-pages
Le poster de la FADBEN (Fédération des
enseignants documentalistes de l'Éducation
Nationale) était l’un des rares posters à oser
être rédigé en français.
Il se caractérise par son dépouillement (un
QR code renvoi vers le site de l’association)
et l’ajout de marque-pages.
(D’autres posters étaient accompagnés de
cartes de visites, de blocs de post-it gratuits,
etc.)
SESSION 96 — POSTER 212
CYCLING FOR LIBRARIES - CYCLO-BIBLIO
Le poster avec cartes postales
Le poster de l’association Cycling for
libraries, une conférence internationale à
vélo pour les bibliothécaires, est
accompagné d’un gilet de cycliste et de
cartes postales.
• Cyclo-biblio mêle les rencontres
professionnelles, les visites de
bibliothèques et la randonnée à vélo.
• Cyclo-biblio soutient également des
valeurs environnementales et un mode
de vie écologique.
SESSION 96 — POSTER 69
THE MEDIA LIBRARY, A PLACE TO ENJOY
Le poster glamour
Le poster de la médiathèque Aimé Césaire de
Clermont-Ferrand développe le concept de
troisième lieu à l’extrême en promouvant l’image
de la bibliothèque comme lieu de rencontres
amoureuses…
http://www.dailymotion.com/video/xxh9cc_la-
nouvelle-mediatheque-de-blanzat_news
SESSION 96 — POSTER 204
NEREUS: THE FUTURE OF SOCIAL SCIENCES LIBRARIES
Le poster mystérieux
Le poster de l’association du consortium
européen Nereus (www.nereus4economics.info)
a attiré tous les regards.
Cette association vise à développer le
numérique dans les bibliothèques de sciences
sociales. Elle a pris le parti de présenter un
poster Steampunk (rétrofuturiste)
SESSION 96 — POSTER 156
THE LIBRARY OF NAUTILUS:
ACCUMULATING THE KNOWLEDGE OF
THE OCEAN
Le poster pour enfants
The Ocean Science Library (OSL)
est une bibliothèque universitaire
coréenne spécialisée dans les
sciences liés au monde maritime
Elle est rattaché au
Korea Institute of Ocean Science
& Technology.
La bibliothèque fait œuvre de
pédagogie en publiant des livres
pour enfants : le poster joue sur
le décalage entre le sérieux du
sujet et la présentation
graphique ludique.
SESSION 96 — POSTER 16
ALIA (AUSTRALIAN LIBRARY AND INFORMATION
ASSOCIATION): FUTURE OF THE PROFESSION
Le poster gagnant
Le prix The "Best IFLA Poster 2014« a été décerné à
l’association ALIA.
Le poster décrit l’évolution du métier de bibliothécaire
sous une forme simple et efficace voir humoristique
• Un trésor national (le koala) sur votre liseuse
• Un abonnement à la bibliothèque pour chaque
enfant dès sa naissance
• Une meilleure implication dans la vie économique