Interopérabilité et échanges de données pour les archives

Preview:

DESCRIPTION

L'échange de données pour les institutions culturelles : le protocole OAI-PMH, le format Dublin Core, les portails de ressources culturelles et patrimoniales

Citation preview

CC

BY-N

C-S

A V

icky

&C

hu

ck R

og

ers

, Fl

ickr

INTEROPERABILITÉ ET ÉCHANGES DE DONNÉES

Pauline Moirez – BnF – 26 juin 2012

AAF - Archives et Internet : les nouveaux enjeux

CC

BY-N

C-N

D J M

ark

Dod

ds,

Flic

kr

Mais qu’est-ce que c’est que ces gros mots…?!?

CC

BY-N

D H

elg

a W

eb

er,

Flic

kr

L’interopérabilité, pour vous… ?

INTEROPERABILITE = Permettre l'échange de données entre

systèmes d'information

Pouvoir se parler (transport des

données)

Se comprendre (sens des données

échangées)

CC

BY-N

C-N

D Josh

Fass

bin

d, Fl

ickr

La recette de l’interopérabilité de Grand-Maman

CC

BY-N

C-S

A Joan

a H

ard

, Fl

ickr

Des ingrédients de qualité

CC

BY-N

C-S

A Joan

a H

ard

, Fl

ickr

Des données hétérogènes… mais propres

Du matériel de pro

CC

BY-N

C C

ap

tain

Bla

ub

eere

, Fl

ickr

Des protocoles d’échange normalisés

De bonnes proportions

CC

BY-N

C-S

A p

alo

eti

c, F

lickr

Un langage commun

CC

BY R

ob

ert

Cou

se-B

ake

r, F

lickr

ECHANGER, POURQUOI ?

CC

BY-N

D Jere

my S

alm

on

, Fl

ickr

Améliorer la visibilité et la dissémination

des collections

Organiser l’accès à l’information pour

les usagers

CC

BY-N

C-N

D A

lain

Bach

elli

er,

Flic

kr

CC

BY-S

A e

30

00

, Fl

ickr

Dupliquer ?

Le contexte administratif et technique : le référentiel général d’interopérabilité

(RGI)

« détermine notamment les répertoires de données, les normes et les standards qui doivent être utilisés

par les autorités administratives »

Publié par la DGME en 2009

Les niveaux d’interopérabilité du RGI

Ex. modélisation, ontologies, mais aussi SEDA

Ex. formats d’images, de documents multimédia, formats bureautiques, langage XML

Ex. protocoles et langages Web et messagerie, téléphonie, annuaires LDAP

Pour parler la même langue : normaliser !

Normes et standards

archivistiquesRéférentiels

Formats de métadonnées

Schémas d’encodage

EAD

EAC

Thesaurus W

Rameau

DublinCore

METS

LanguesISO 639

PaysISO 3166

Où es-tu ?

UniquesPérennesCitables

Des identifiants pour les

ressources numériques

CC

BY-N

C-N

D x

cod

e, Fl

ickr

ARK : un format d’identification pérenne

CC

BY-N

C-N

D F

rid

ay F

lets

, Fl

ickr

ARK aux AD de la Somme

http://archives.somme.fr/ark:/58483/a011260969022JKSv1y/1/1

Le système ARK : structure et

organisationhttp://gallica.bnf.fr/ark:/12148/

bpt6k5809503p/f2.image

protocoletype

d’identifiant

numéro d’autoriténommante

(NAAN)

autorité d’adressage

(NMAH)

nom ARK

qualifieurs(facultatif)

Et dans la vraie vie…

CC

BY-N

C d

r co

op

, Fl

ickr

OAI-PMH

Un protocole d’échange

incontournable dans le domaine culturel

CC

BY

-NC

-ND

Mary

lise

Doct

rin

al,

F

lick

r

OAI-PMH =

Open Archives Initiative - Protocol for Metadata

Harvesting

Principes de fonctionnement du protocole OAI-PMH

© M

inis

tère

de la C

ult

ure

, 2

00

5

CC

BY-N

C-N

D G

err

y B

ald

ing

, Fl

ickr

Les acteurs de l’OAI-PMH

Le fournisseur de données (entrepôt)

Le fournisseur de services

(moissonneur)

The place to be ?

L’OAI-PMH en 2012, c’est :

1740 entrepôts enregistrésPlus de 25 millions d’enregistrements moissonnables C

C B

Y-N

C-N

D v

ally

gir

l_tk

a, Fl

ickr

Les concepts documentaires de

l’OAI-PMHRESSOURCE

Objet physique ou numérique

ITEMNotice

informatique (URL +

métadonnées)LOT / SET

Ensemble d’enregistrem

ents

ENREGISTREMENT

Unité documentaire

dans un entrepôt OAI

Exemple de notice

OAI

Qu’y a-t-il dans un enregistrement OAI-PMH ?

•Un en-tête : header

- identifier (obligatoire, non répétable)- datestamp (obligatoire, non répétable)- setSpec (facultatif, répétable)- attribut de statut pour les items supprimés

•Des métadonnées : metadata

- métadonnées encodées en XML avec leur élément racine et leur espace de nom - les entrepôts doivent fournir leurs métadonnées en Dublin Core simple ; ils peuvent proposer en plus d’autres formats

Qu’y a-t-il dans un enregistrement OAI-PMH ?

OAI-PMH a le vocabulaire d’un bébé de 18 mois !

CC

BY-N

C-N

D W

on

derm

on

key2

k, F

lickr

Parlez-vous OAI-PMH ?

La syntaxe de moissonnage : les 6

verbesIdentify : identifier l’entrepôt

ListMetadataFormats : lister les formats utilisés (Dubin Core, EAD, etc.)

ListSets : lister les ensembles d’enregistrements

ListRecords : lister les ressources décrites

ListIdentifiers : lister les références des ressources

GetRecord : récupérer une ressource particulière

CC BY-NC-SA Musebrarian, Flickr

OAI-PMHLes atouts

Il s'appuie sur les standards du Web, le moissonnage est simple à mettre en œuvre.Les contenus ne sont pas dupliqués.Les métadonnées collectées sont mises à jour simplement et automatiquement (moissonnage différentiel/incrémental).Il s’adapte à des besoins transdisciplinaires sans interdire des besoins plus spécialisés.

OAI-PMHLes limites

Problèmes de granularité et de hiérarchisationPas d’interrogation finePas de liens simples avec les ressources extérieuresLimité à la communauté des chercheurs et bibliothécaires

A VOUS DE JOUER…!

(n° 1-5)

CC

BY-N

C-N

D s

.red

, Fl

ickr

Dublin Core

À protocole d’échange générique… format de

métadonnées générique !

CC

BY

-NC

-SA

Davi

d S

herr

et,

Fli

ckr

15 éléments de description, facultatifs et répétables

CC

BY

-NC

-SA

Davi

d S

ky,

sou

rce

Améliorer la recherche de ressources sur le web, en définissant un

ensemble de métadonnées communes

Les 15 éléments du Dublin Core simple

Contenu Propriété intellectuelle

Instanciation

Title Creator Date

Subject Contributor Type

Description Publisher Format

Source Rights Identifier

Language

Relation

Coverage

Tous facultatifs

Tous répétables

Mais comment je fais du Dublin Core avec mes données à moi ?

CC

BY-S

A t

an

gi_

bert

in, Fl

ickr

La problématique des conversions

CC

BY-N

D t

om

aB

, Fl

ickr

http://www.cartolis.org/detail_notice.php?num=AA00000001&x=11&y=13

Une notice dans Cartolis

http://www.cartolis.org/oai/oai2.php?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:cartolis.org:AA00000001

La même en Dublin Core…

Et avec l’EAD ?

GRANULARITÉHIERARCHIE

CC

BY-N

C-N

D R

icky

david

, Fl

ickr

COMPLEXITÉ

Un fonds d’archives en EAD : les papiers Pierre et Marie Curie

Du fichier XML-EAD très structuré et hiérarchisé…

… à l’enregistrement en Dublin Core

… et c’est pas fini…

A partir d’informations contenues dans <archdesc>

Tableau de conversion EAD > Dublin Core

Dublin CoreLes atouts

Généricité : permet de décrire des ressources numériques ou physiques, utilisable par de nombreuses communautés

SimplicitéGrande souplesseUtilisation internationale

Les limites

Simplification des métadonnéesLibertés d’interprétation qui limitent l’interopérabilité sémantiqueValeurs des éléments non normalisées

Faiblesse des informations techniques

Dublin Core

OAI-PMH est simpleDublin Core est simple

Ce n’est pas une raison pour faire n’importe quoi !

CC

BY-N

D c

urs

eth

ing

, Fl

ickr

A VOUS DE JOUER…!

(n°6)

… et donc, finalement, à quoi ça sert…?

CC

BY-N

C p

cgn

7, Fl

ickr

… à participer à des portails collectifs !

Europeana, mère de tous les portails…

La nébuleuse des projets liés à Europeana

Le Portail archivistique européen

Des portails par type d’institution

Le « guichet unique » français : le moteur Collections

Des portails nationaux

Une dynamique est lancée... Les portails culturels locaux se multiplient

Banque numérique des savoirs aquitains

(BnsA)

GeoCulture en Limousin

Manioc, bibliothèque numérique des

Caraïbes

Mais aussi...

Isidore, plateforme de recherche pour les

sciences humaines et sociales (SHS)

Gallica et ses 41 bibliothèques partenaires

A VOUS DE JOUER…!

(n°7)

Pour aller plus loin…InteropérabilitéInteropérabilité : faire des choix, échanger, gérer le temps (S. Pouyllau, 2010)Voir EAD et interopérabilité :comment permettre le moissonnage demétadonnées normalisées par des portails (L. Grand, F. Rolland, 2010)

Identifiants pérennesIdentifiants pérennes (E. Bermès, 2009)Des identifiants pérennes pour les ressources numériques - L’expérience de la BnF (E. Bermès, 2006)ARK, qu’est-ce que c’est ? (2012).

OAI-PMHSite officiel de l’Open archive initiativeLe protocole OAI et ses usages en bibliothèque (MCC, 2005)Guide d'interopérabilité OAI-PMH pour un référencement des documents numériques dans Gallica (2010)Le Guide des Bonnes Pratiques Numériques - Entrepôt OAI-PMH (TGE Adonis, 2010)

Dublin CoreSite officiel de la Dublin Core Metadata initiativeGuide d’utilisation du Dublin Core à la BnF (2008).

Merci de votre attention

CC

BY-N

C G

o E

sew

here

, flic

kr

pauline.moirez@bnf.fr

Recommended