29
Session 87 --- Digital preservation of e-books: Best practice in libraries Session 96 --- Poster session Session 119 — Research in the big data era

Ifla2014 session 87 96_119

Embed Size (px)

DESCRIPTION

Compte de rendu de sessions du 80ème congrès mondial des bibliothèques IFLA 2014 : le dépôt légal des ebooks, la fouille de données (Text&Data Mining), les posters scientifiques, l'IdeasBox (médiathèque mobile pour camps de réfugiés)

Citation preview

Page 1: Ifla2014 session 87 96_119

Session 87 --- Digital

preservation of e-books: Best

practice in libraries

Session 96 --- Poster session

Session 119 — Research in

the big data era

Page 2: Ifla2014 session 87 96_119

Définition du livre numérique

Ouvrage édité et diffusé sous forme numérique, destiné à être lu sur un écran

Note :

1. Le livre numérique peut être un ouvrage composé directement sous forme numérique ou numérisé à partir

d'imprimés ou de manuscrits

2. Le livre numérique peut être lu à l'aide de supports électroniques très divers

3. On trouve aussi le terme « livre électronique », qui n'est pas recommandé en ce sens.

4, Équivalent étranger : e-book, electronic book

Source : JORF n°0081 du 4 avril 2012 page 6130 texte n° 118 « Vocabulaire de l'édition

et du livre (liste de termes, expressions et définitions adoptés) » (NOR: CTNX1206650K)

Le livre numérique peut être composé directement sous forme électronique ou bien numérisé à partir

d’imprimés ou de manuscrits. S’il est une version électronique d’un ouvrage imprimé, il est qualifié

d’homothétique et entre dans le cadre de la Loi n° 2011-590 du 26 mai 2011 relative au prix du livre

numérique.

SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES

INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.

Page 3: Ifla2014 session 87 96_119

SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN

LIBRARIES - INFORMATION TECHNOLOGY WITH PRESERVATION AND

CONSERVATION AND NATIONAL LIBRARIES.

• Le dépôt légal couvre tout les ouvrages de langue allemande publiés depuis

1913, qu’ils soient numérisés ou nativement produits sous forme numérique

• 1262593 ressources ont été collectées en 2014, dont 755000 ebooks et

thèses en ligne

• Le processus est entièrement automatisé mais les bibliothécaires interviennent

en entrée (choix des catalogues moissonnés…) et sortie de système (contrôle

des métadonnées)

L’automatisation du workflow nécessite que certaines caractéristiques techniques

soient correctement remplies :

• les métadonnées et les objets doivent être collectés ensemble

• le format des métadonnées doit être standard (ONix for Book 2.1, MARC XML,

XMETADISS+, tout comme celui des fichiers informatiques (PFD, EPUB, MP3,

JPEG, ZIP, etc.)

• des accords doivent être passés avec chaque éditeur

• les DRM sont refusés (comme à la BnF)

Allemagne : processus automatisé de collecte des livres

électroniques dans le cadre du dépôt légal

Page 4: Ifla2014 session 87 96_119

SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES

INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.

• Après dépôt par les éditeurs sur un répertoire ftp du

livre électronique, le fichier de métadonnées sous ONIX

est converti de l’XML vers l’INTERMARC : l’ONIX permet

la création automatique de liens vers les différentes

formats d’une même œuvre (version imprimable, etc.)

• Contrairement aux métadonnées, les fichiers d’ebook

ne sont jamais convertis : ils sont validés par

Epubcheck, un outil développé par l’International Digital

Publication Forum (IDPF)

• Ils doivent ensuite être préparés à rejoindre SPAR

(Scalable Preservation and Access Repository), le

répertoire digital de Gallica, qui traite notamment

l’identifiant persistant ARC de l’ebook

• les fichiers qui contiennent des éléments Flash ou

Javascript, potentiellement viraux, sont placés dans un

espace sécurisé.

France : Schéma d’intégration des ebooks dans Gallica

Page 5: Ifla2014 session 87 96_119

SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES

INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.

Japon : le dépôt légal des ebook à la bibliothèque

de la Diète

En 2012, la loi NDL donne à la National Diet Library le droit

d'enregistrer "les publications en ligne" issues du secteur privé.

• Les éditeurs privés sont alors tenus de communiquer à la NDL

leur publications numériques (contenu de sites web, livres

numériques, publications électroniques, etc.)

• Ils doivent permettre le cas échéant la collecte des fichiers

numériques sur l'Internet; mais la NDL ne peut recueillir que les

publications en ligne gratuites et non protégées par la gestion

des droits numériques (DRM)

Cette loi est difficile à appliquer car les éditeurs ne collaborent pas.

• seules 18000 publications issues du secteur marchand ont été

intégrées au dépôt légal.

• Pour contourner cet écueil, la NDL a passé avec des éditeurs

majeurs des accords de coopération temporairement d’une

durée de 3 ans...

Page 6: Ifla2014 session 87 96_119

SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES

INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.

la Bibliothèque nationale et universitaire de Zagreb est tenue de

recueillir et de conserver dans le cadre du dépôt légal (Law Library,

1997) toutes les publications électroniques (y compris les ressources

en ligne). Le développement de l'infrastructure de bibliothèque

numérique a donc débuté en 2004 avec l’archivage du web (Croatian

Web Archives) et s'est poursuivi avec la mise en place de systèmes

spécialisés de gestion des périodiques numérisés (2009), des thèses

(2010) et des e-books (2012).

La commercialisation de livres numériques en langue nationale n’est

apparue qu’en 2010 :

• Depuis cette date, 330 ebooks ont été commercialisés par quatre

éditeurs. Mais la protection par DRM est largement minoritaire.

• Il y aurait en effet plus de 1800 ebooks gratuits en langue croate,

produits pour la plupart en auto-édition.

• Tous les types de publications monographiques disponibles sous

forme numérique (livres numériques et numérisés, livres

audionumériques) sont archivés dans un système de bibliothèque

numérique (D-book).

Croatie : le dépôt légal des ebooks, élément de constitution d’une identité culturelle nationale

Page 7: Ifla2014 session 87 96_119

• la Bibliothèque nationale de Chine (NLC) prend la

responsabilité de la collecte des publications nationales et

étrangères pour mieux préserver le patrimoine culturel de

l’humanité dans son ensemble…

• Le National Digital Library Project a ainsi archivé plus de

quatre millions de volumes.

• La bibliothèque respecterait les règles internationales de

copyright lorsqu’elle importe des livres électroniques

commerciaux : l'ensemble des ressources peut être donc être

consulté dans et hors la bibliothèque, sous réserve

d’inscription sur son site web...

Description du projet :

http://www.dlib.org/dlib/may10/dawei/05dawei.html

SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES

INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL

LIBRARIES.

Chine : le dépôt légal des ebooks inclus les

publications étrangères

Page 8: Ifla2014 session 87 96_119

SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST

PRACTICE IN LIBRARIES - NFORMATION TECHNOLOGY WITH

PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.

Indonésie : numérisation de manuscrits

La bibliothèque nationale d’Indonésie (Museum and National Library of

Indonesia) est une agence gouvernementale chargée de la préservation du

patrimoine écrit.

• Il n’y a pas de dépôt légal des ebooks

• Le programme de numérisation est valorisé sur www.indonesiaheritage.org)

• La numérisation doit tenir compte de contrainte de coût, de faisabilité

technique et d’usages potentiels

Page 9: Ifla2014 session 87 96_119

Conclusion :

• Il reste difficile pour la plupart des bibliothèques nationales de mettre en place un système

de dépôt légal des livres numériques commerciaux, en raison d’une moindre collaboration

des éditeurs.

• Les processus techniques de moissonnage des fichiers sont relativement similaires

• Le processus est entièrement automatisé mais les bibliothécaires interviennent en entrée

(choix des catalogues moissonnées…) et sortie de système (contrôle des métadonnées).

• La formation continue des personnels est un facteur important de réussite.

SESSION 87 --- DIGITAL PRESERVATION OF E-BOOKS: BEST PRACTICE IN LIBRARIES

INFORMATION TECHNOLOGY WITH PRESERVATION AND CONSERVATION AND NATIONAL LIBRARIES.

Page 10: Ifla2014 session 87 96_119

Big data

• Le terme Bigdata (en français « mégadonnées » parfois appelées « données massives » désignent des ensembles de données si volumineux qu'ils en deviennent difficiles à travailler avec des outils classiques de gestion de base de données ou de gestion de l'information.

• Ces données sont brutes, semi-structurées voire non structurées provenant du web (Web Mining), au format texte (Text Mining) et images (Image Mining).

• Ces données peuvent être publiques (Open Data, Web des données), géographiques (adresses IP), ou relever de la propriété des consommateurs (Profils 360°).

Text & Data Mining (TDM) • La fouille de textes ou «extraction de connaissances » est un ensemble de traitements informatiques consistant

à extraire des connaissances selon un critère de nouveauté ou de similarité.

• La première étape, l'analyse, consiste à reconnaître les mots, les phrases, leurs rôles grammaticaux, leurs relations et leur sens. Cette première étape est commune à tous les traitements.

• La seconde étape, l'interprétation de l'analyse, permet de sélectionner des éléments du texte pertients parmi d'autres.

• Exemples d'applications : création automatique de résumé de texte

SESSION 119 — RESEARCH IN THE BIG DATA ERA: LEGAL, SOCIAL AND TECHNICAL APPROACHES TO LARGE

TEXT AND DATA SETS — ACADEMIC AND RESEARCH LIBRARIES WITH SERIALS AND OTHER CONTINUING RESOURCES

AND COMMITTEE ON COPYRIGHT AND OTHER LEGAL MATTERS (CLM)

Page 11: Ifla2014 session 87 96_119

SESSION 119 — RESEARCH IN THE BIG DATA ERA: LEGAL, SOCIAL AND TECHNICAL APPROACHES TO LARGE

TEXT AND DATA SETS — ACADEMIC AND RESEARCH LIBRARIES WITH SERIALS AND OTHER CONTINUING RESOURCES

AND COMMITTEE ON COPYRIGHT AND OTHER LEGAL MATTERS (CLM)

la réutilisation des données est un facteur intrinsèque au TDM : d'où système juridique

#wlic2014 #bigdata

Généralement les données ne sont protégées par copyright contrairement à la publication

#wlic2014

Le copyright intervient à partir du moment l'information brute est analysée (ex. les

métadonnées en catalogage) #wlic2014 #bigdata

au USA le « Fair use » exception réglementaire pour l'utilisation du TDM dans le cadre de le

Recherche #wlic2014

En France les licences autorisent la TDM uniquement sur les publications auxquelles

l'université est abonnée #wlic2014

Page 12: Ifla2014 session 87 96_119

La keynote de Susan Reilly (Liber) http://library.ifla.org/id/eprint/1007 #bigdata

"TDM saves lives" en médecine, le TDM permet de rapprocher des données issues de la biologie

#wlic2014 #bigdata

Selon S. Reilly, l'exception de copyright pour le TDM aux USA n'est pas claire. Situation à ne pas

transposer en UE #wlic2014 #bigfaya

Dans le cadre de Licences for Europe, la Commission a proposé d’autoriser le TDM par le biais

des licences des bases de données #wlic2014 #bigdata

Pour Liber, le régime des licences adaptées par les fournisseurs pour le TDM n'est pas

acceptable #wlic2014 #bigdata

Pour Liber, il faut un régime d'exception au droit d'auteur pour le TDM. C'est une garantie de

liberté pour la recherche #wlic2014 #bigdata

Pour des questions plus précises sur le TDM et le droit d'auteur, contacter Susan Reilly sur

@LIBEReurope #wlic2014 #bigdata

SESSION 119 — RESEARCH IN THE BIG DATA ERA: LEGAL, SOCIAL AND TECHNICAL APPROACHES TO LARGE

TEXT AND DATA SETS — ACADEMIC AND RESEARCH LIBRARIES WITH SERIALS AND OTHER CONTINUING RESOURCES

AND COMMITTEE ON COPYRIGHT AND OTHER LEGAL MATTERS (CLM)

Page 13: Ifla2014 session 87 96_119

La keynote de Sarah Jones (Digital Curation Center) http://library.ifla.org/id/eprint/958 #wlic2014

Le PGD (plan de gestion des données) est un outil web permettant de répondre aux demandes des

chercheurs pour le TDM #wlic2014 #bigdata

Ce PGD multilingue est développé par le DCC. Il vient en complément des outils de découverte,

d'analyse, de stockage des données #wlic2014

Le registre des données de recherche (REF) est un outil statistique à destination des financeurs

Outils gratuits pour le catalogage des données : Datafinder tools (Oxford), c4D, CKAF. #wlic2014

Un outil libre de découverte , le RDRDS; le traitement des métadonnées étant un exercice difficile,

le DCC améliore cet outil #wlic2014

SESSION 119 — RESEARCH IN THE BIG DATA ERA: LEGAL, SOCIAL AND TECHNICAL APPROACHES TO LARGE

TEXT AND DATA SETS — ACADEMIC AND RESEARCH LIBRARIES WITH SERIALS AND OTHER CONTINUING RESOURCES

AND COMMITTEE ON COPYRIGHT AND OTHER LEGAL MATTERS (CLM)

La gestion des données de recherche est facilitée par la définition d’un plan de gestion de données (PGD) ou

Data Management Plan (DMP), document formel explicitant la façon dont on obtient et analyse vous les

données. Il décrit dans le détail les méthodes et processus de création, de fourniture, de maintenance, de

conservation et de protection des données (des modèles de PGD sont téléchargeables ici)

Page 14: Ifla2014 session 87 96_119

Plan de gestion des données

(Research Data Management )

Outils gratuits pour le

catalogage des données :

Datafinder tools (Oxford),

c4D, CKAF et Un outil libre de

découverte , le RDRDS; le

traitement des métadonnées

Collaborative Assessment of

Research Data Infrastructure and

Objectives (CARDIO) : outil pour

l’évaluation collaborative des données

de recherche

Data Asset Framework (DAF) : outil

pour gérer les données de l'activité

des chercheurs ( bases utilisées;

prévisionnel de recherche)

Registre des données de recherche (REF) :

outil statistique à destination des financeurs

Outil de gestion des risques

de conservation dans un

dépôt numérique

SESSION 119 — RESEARCH IN THE BIG DATA ERA: LEGAL, SOCIAL AND TECHNICAL APPROACHES TO LARGE

TEXT AND DATA SETS — ACADEMIC AND RESEARCH LIBRARIES WITH SERIALS AND OTHER CONTINUING RESOURCES

AND COMMITTEE ON COPYRIGHT AND OTHER LEGAL MATTERS (CLM)

Niveau stratégique

Les Outils du DDC pour le TDM

Page 15: Ifla2014 session 87 96_119

IDEASBOX : MÉDIATHÈQUE MOBILE POUR

SITUATION DE CRISE

l’Ideas Box fournit aux réfugiés des outils

essentiels pour mieux se reconstruire.

Elle leur permet d’accéder à Internet, aux

livres, à des ressources pédagogiques et

multimédia…

1 médiathèque dans 4 boites

Page 16: Ifla2014 session 87 96_119

IDEASBOX : MÉDIATHÈQUE MOBILE POUR

SITUATION DE CRISE

Le coin bibliothèque

Page 17: Ifla2014 session 87 96_119

IDEASBOX : MÉDIATHÈQUE MOBILE POUR

SITUATION DE CRISE

Le cybercafé

Espace multimédia et coffre de

rangement pour les tablettes

tactiles

Page 18: Ifla2014 session 87 96_119

IDEASBOX : MÉDIATHÈQUE MOBILE POUR

SITUATION DE CRISE

Le coin jeux

Espace télévision et jeux de

société

Page 19: Ifla2014 session 87 96_119

ESPACE EXPOSANTS : LA MÉDIATHÈQUE DU FUTUR

Nouveau mobilier :

Distributeur de livres et fauteuils de lecture

Page 20: Ifla2014 session 87 96_119

SESSION 96 — POSTER SESSION

Le poster de recherche scientifique

Le poster est utilisé pour présenter des études et des résultats scientifiques lors de colloques professionnels

Il est généralement en anglais structuré selon la démonstration souhaitée et illustré de photos, schémas ou

graphiques. Les titres du poster utilisent souvent les mots suivants : résumé, introduction, objectif,

hypothèse, méthode, résultat (présenté sous forme de tableaux, de schémas ou d'images), conclusion,

discussion, référence.

Plus de 200 posters étaient exposés dans le hall du Palais des congrès

Au delà de la valeur scientifique des présentations, les participants ont rivalisé d’imagination pour faire

passer leur message.

Page 21: Ifla2014 session 87 96_119

SESSION 96 — POSTER SESSION

Le poster virtuellement tactile

Le poster du Danish Think Tank sur la

bibliothèque du futur

http://fremtidensbiblioteker.dk/in-english/

Le DTT est un établissement financé par le

privé et le public pour aider les

établissements danois à construire leur

bibliothèque numérique.

Le poster présente une image

intéressante, liée au numérique tactile :

une main démultipliée

Page 23: Ifla2014 session 87 96_119

SESSION 96 — POSTER 88

DIGITIZATION: COLLABORATIVE PROJECT DYNAMICS

Le poster le plus gracieux

Le poster de la BIU Cujas sur le programme de

numérisation réalisé en partenariat avec le Cines

et la BnF

Page 24: Ifla2014 session 87 96_119

SESSION 96 — POSTER 196

FADBEN: SUPPORTING AN INFORMATION-

DOCUMENTATION CURRICULUM

Le poster avec marque-pages

Le poster de la FADBEN (Fédération des

enseignants documentalistes de l'Éducation

Nationale) était l’un des rares posters à oser

être rédigé en français.

Il se caractérise par son dépouillement (un

QR code renvoi vers le site de l’association)

et l’ajout de marque-pages.

(D’autres posters étaient accompagnés de

cartes de visites, de blocs de post-it gratuits,

etc.)

Page 25: Ifla2014 session 87 96_119

SESSION 96 — POSTER 212

CYCLING FOR LIBRARIES - CYCLO-BIBLIO

Le poster avec cartes postales

Le poster de l’association Cycling for

libraries, une conférence internationale à

vélo pour les bibliothécaires, est

accompagné d’un gilet de cycliste et de

cartes postales.

• Cyclo-biblio mêle les rencontres

professionnelles, les visites de

bibliothèques et la randonnée à vélo.

• Cyclo-biblio soutient également des

valeurs environnementales et un mode

de vie écologique.

Page 27: Ifla2014 session 87 96_119

SESSION 96 — POSTER 204

NEREUS: THE FUTURE OF SOCIAL SCIENCES LIBRARIES

Le poster mystérieux

Le poster de l’association du consortium

européen Nereus (www.nereus4economics.info)

a attiré tous les regards.

Cette association vise à développer le

numérique dans les bibliothèques de sciences

sociales. Elle a pris le parti de présenter un

poster Steampunk (rétrofuturiste)

Page 28: Ifla2014 session 87 96_119

SESSION 96 — POSTER 156

THE LIBRARY OF NAUTILUS:

ACCUMULATING THE KNOWLEDGE OF

THE OCEAN

Le poster pour enfants

The Ocean Science Library (OSL)

est une bibliothèque universitaire

coréenne spécialisée dans les

sciences liés au monde maritime

Elle est rattaché au

Korea Institute of Ocean Science

& Technology.

La bibliothèque fait œuvre de

pédagogie en publiant des livres

pour enfants : le poster joue sur

le décalage entre le sérieux du

sujet et la présentation

graphique ludique.

Page 29: Ifla2014 session 87 96_119

SESSION 96 — POSTER 16

ALIA (AUSTRALIAN LIBRARY AND INFORMATION

ASSOCIATION): FUTURE OF THE PROFESSION

Le poster gagnant

Le prix The "Best IFLA Poster 2014« a été décerné à

l’association ALIA.

Le poster décrit l’évolution du métier de bibliothécaire

sous une forme simple et efficace voir humoristique

• Un trésor national (le koala) sur votre liseuse

• Un abonnement à la bibliothèque pour chaque

enfant dès sa naissance

• Une meilleure implication dans la vie économique