Evolution des catalogues et des formats de catalogage 2 : Web sémantique et bibliothèques

Preview:

DESCRIPTION

Journée de sensibilisation organisée par Média Centre-Ouest le 12 décembre 2013 à la BU à Limoges

Citation preview

Évolution des catalogues et des formats de catalogage

Limoges, 12 décembre 2013Journée de sensibilisation organisée

par Média Centre-Ouest

par Emilie Liard, SCD de l’Université de Poitiersbasé sur le travail du groupe national de formateurs RDA

disco ball par emmma peel http://www.flickr.com/photos/acracia/337831853

Partie 2 : Web sémantique et bibliothèques

Ce que nous voyons

http://www.culture.gouv.fr/documentation/joconde/fr/pres.htm 1

Ce que voit la machine

Brick wall http://www.flickr.com/photos/markhillary/3774707075/ 2

Les bibliothèques : des silos de données non connectés

Silos http://www.flickr.com/photos/docsearls/5500714140/ 3

Sérendipité...

Yoyogi Koen http://www.flickr.com/photos/runnerone/4659827202/ 4

Que va nous apporter le Web de données ?

• Relier les catalogues de bibliothèques

• Ouverture

• Navigation

• Visibilité

• Tirer parti des données

• Interopérabilité

String beam http://www.flickr.com/photos/h2oalchemist/250768067/5

•Web 1.0 : web de documents–permet aux usagers de naviguer facilement sur Internet en utilisant des liens hypertexte•une page = un document–format : HTML (HyperText Markup Language)•ne permet que la mise en forme•Web 2.0 : web collaboratif / web social•Web 3.0 : web de données / web sémantique–permet aux machines de trouver et d’exploiter les données contenues dans les documents–format : RDF (Resource Description Framework)

Histoire (rapide) du Web

6

Tim Berners-Lee at the BBC http://www.flickr.com/photos/christianpayne/3708792057/ http://www.w3.org/DesignIssues/LinkedData.html

Web sémantique, web de données, linked open data...

7

• Une grammaire RDF

• Des vocabulaires RDFS / OWLontologies

• Des règles d’écriture RDF/XMLN3, TurtleRDFa

• Des moyens de communication SPARQL

D’après Emmanuelle Bermès, Fulbi, 17/01/2013

Un langage pour les machines

8

Être visible

9

Publier des référentiels communs

Modèle « hub and spoke »Plusieurs bases de données partagent le même référentiel

Construire l’interopérabilité (1)

10

Publier des référentiels communs

Construire l’interopérabilité (2)

11

12

Créer des liens entre référentiels différents

Modèle « follow your nose »Interopérabilité fondée sur des liens

Construire l’interopérabilité (3)

13

Exemple :RAMEAU (bibliothèques)et le Thésaurus W (archives)

14

Thesaurus W

RAMEAU

LCSH

GND

Créer un réseau de données

15

Faire travailler les données

Enrichir le catalogue

16

Intégrer de l’information créée ailleurs

Source : notice d’autorité BnF

Source : Académie française

Enrichir le catalogue

17

http://www.bnf.fr/fr/professionnels/modelisation_ontologies/a.opencat.html

Agréger des données

18

Agréger des données

http://www.bbc.co.uk/nature/wildlife19

• Mieux intégrer des données hétérogèneso Description bibliographiqueo Description archivistiqueo Documentation électroniqueo Documentation pédagogiqueo etc.

• « Faire travailler les données » o Frises chronologiqueso Géolocalisationo etc.

De nouvelles interfaces

20

• Moins de catalogage natif

• Évolution du rôle du catalogueur

o Sélection et validation des données auxquelles lier les ressources possédées par la bibliothèque

o Sélection des ressources complémentaires externes destinées à enrichir le catalogue

Source Flickr : http://www.flickr.com/photos/davidgsteadman/4783421742 CC BY-NC

Quel impact sur le travail du catalogueur ?

21

Source Flick : http://www.flickr.com/photos/dullhunk/2071110042 CC-BY

• Des données structurées

• Des vocabulaires normalisés

• Des identifiants pérennes (URI)o pour désigner les ressourceso pour exprimer les relations entre les données

• Une syntaxe normalisée : RDF RDF = Resource Description Framework

Comment arriver à ces résultats ?

22

Des données structurées

23

000 cam 22 3 450 001FRBNF389105810000001003http://catalogue.bnf.fr/ark:/12148/cb38910581f010 $a2-200-26375-9$bbr.100 $a20021112d2002 m y0frey50 ba1010 $afre102 $aFR105 $a||||z 00|||106 $ar2001 $aˆL'‰Orient arabe$bTexte imprimé$earabisme et islamisme de 1798 à 1945 $fHenry Laurens205 $a2ème éd.210 $aParis$cArmand Colin$d2002215 $a1 vol. (336 p.)$d24 cm2250 $aU$iHistoire contemporaine410 0$034244335$tCollection U. Série Histoire contemporaine$x0768-4878$d2002606 $312010387$aNationalisme$yPays arabes$311975999$z19e siècle$2rameau606 $312010387$aNationalisme$yPays arabes$311975995$z20e siècle$2rameau606 $311967291$aPanarabisme$2rameau606 $314612334$aIslamisme$311931634$yPays arabes$311934444$xHistoire$2rameau700 1$312094651$aLaurens$bHenry$f1954-.... $4070801 0$aFR$bFR-751131015$c20021112$gAFNOR$hFRBNF389105810000001$2intermrc

http://catalogue.bnf.fr/ark:/12148/cb34244335j

http://catalogue.bnf.fr/ark:/12148/cb12094651t

24

Laurens, Henry (1954-....) http://catalogue.bnf.fr/ark:/12148/cb12094651t

http://catalogue.bnf.fr/ark:/12148/cb34244335jISSN 0768-4878 = Collection U. Série Histoire contemporaine

http://catalogue.bnf.fr/ark:/12148/cb38910581fL'Orient arabe : arabisme et islamisme de 1798 à 1945 / Henry Laurens. - 2ème éd.. - Paris : Armand Colin, 2002

Des URI pour désigner des ressources

25

pour exprimer les relations entre les données

2001 $aL'Orient arabe$earabisme et islamisme de 1798 à 1945

700 1$312094651$aLaurens$bHenry$f1954-.... $4070

200 $a Titre propreDC : Title ISBD : Title properRDA : Title proper

200 $e Complément du titreISBD : Other title informationRDA : Other title information

700 $4070 Auteur du texteDC : Creator RDA : CreatorRDA : Author

Des vocabulaires normalisés

26

Des URI pour exprimer des relations

27

ISBD : has title proper

DC : Creator

DC : Title

RDA : Authorhttp://rdvocab.info/roles/author

http://purl.org/dc/elements/1.1/title

http://purl.org/dc/elements/1.1/creator

http://iflastandards.info/ns/isbd/elements/P1004 RDA : Title proper http://rdvocab.info/Elements/titleProper

ISBD : has other title information http://iflastandards.info/ns/isbd/elements/P1006RDA : Other title information http://rdvocab.info/Elements/otherTitleInformation

Des URI pour exprimer des relations

28

Cet ouvrage

"L'Orient arabe"a pour titre propre

RDF

sujet

verbe

http://catalogue.bnf.fr/ark:/12148/cb38910581f

"L'Orient arabe" http://iflastandards.info/ns/isbd/elements/P1004

2001 $aL'Orient arabe

prédicat

sujet

Le sujet est toujours une URILe prédicat est toujours une URIL’objet peut êtreun texte (« littéral »)ou une URI

Une syntaxe normalisée

complément d’objet

objet

29

• Une déclaration est composée de 3 éléments qui forment un triplet.

• Un triplet est composé des 3 éléments suivants : sujet – prédicat – objet

Exemple :Honoré de Balzac a écrit « La comédie humaine »

• Sujet = ressource = Honoré de Balzac

• Prédicat = propriété (nature de la relation) = Creator

• Objet = valeur (caractéristique ou ressource liée) = La Comédie humaine

RDF : la notion de triplets

30

est né à

est un

a créé

est une

représente

est mort à

estcontemporain de

est né à

est conservée à

est situé à

1840est né en

est né en

1850 est mort en

RDF : la notion de graphe

31

• Les données des catalogues en MARC sont très structurées, donc ré exploitables.

• Tout le travail effectué jusqu’à présent sera exploité

• Définition d’ontologies en RDF • spécifiques aux données bibliographiques

• FRBRER, FRAD, FRSAD, FRBROO

• ISBD• RDA

• génériques• DC, Schema.org

• Définition de modèles de données en RDF • BIBFRAME

De MARC à RDF ?

32