37
Interopérabilité de l’information bibliographique et muséologique Mégadonnées et interopérabilité dans les humanités numériques 15 décembre 2015 MESHS-Lille dans le cadre du projet TECTONIQ (PEPS CNRS – Inter MSH, Université Lille 3) Patrick Le Bœuf Bibliothèque nationale de Franc

Interopérabilité de l'information bibliographique et muséologique

Embed Size (px)

Citation preview

Page 1: Interopérabilité de l'information bibliographique et muséologique

Interopérabilité de l’information bibliographique et muséologique

Mégadonnées et interopérabilitédans les humanités numériques

15 décembre 2015MESHS-Lille

dans le cadre du projetTECTONIQ (PEPS CNRS – Inter MSH, Université Lille 3)

Patrick Le BœufBibliothèque nationale de France

Page 2: Interopérabilité de l'information bibliographique et muséologique

POURQUOI ? COMMENT ?

Page 3: Interopérabilité de l'information bibliographique et muséologique

Musées et bibliothèques

apparentés…… mais différents

objets uniques essentiellemen

t

exemplaires de publications

essentiellement

Pourquoi en rendre les descriptions interopérables ?

Page 4: Interopérabilité de l'information bibliographique et muséologique

Musées et bibliothèques

différents…… mais apparentés

aussi des objets non uniques aussi des objets uniques… et des objets qui se

répondent…

Comment en rendre les descriptions interopérables ?

Page 5: Interopérabilité de l'information bibliographique et muséologique

5

Modélisation conceptuelle

« Belle Marquise, vos beaux yeux... »Structure de

données A

« Yeux Marquise !

beaux, belle, vos... »

« Beaux, vos yeux ; Marquise,

belle… »Structure de données B

Structure de données C

Formalisation des concepts communs

Page 6: Interopérabilité de l'information bibliographique et muséologique

Quelle coïncidence !

• 1998 : version préliminaire du modèle CIDOC CRM par l’ICOM CIDOC

• 1997 : modèle FRBR par l’IFLA

Page 7: Interopérabilité de l'information bibliographique et muséologique

7

CIDOC CRM(Conceptual Reference Model)

• Contexte organisationnel : ICOM : Conseil international des musées CIDOC : Comité international

pour la documentation• Matériau de départ :

CIDOC Relational Data Model• 430 entités en 1995 : devenu ingérable !• pas assez flexible

CIDOC Information Categories• liste des éléments de données communs

à 23 standards de description muséographique

Page 8: Interopérabilité de l'information bibliographique et muséologique

La vision de Martin Doerr

Legacy systemsLegacy systemsData

basesPhénomènes du monde

?Conceptualisation

abstractisedonne une

approximation de explique,motive

organisent

se rapportent à

Données sous diverses formes

Structures de donnéeset modèles de présentation

Page 9: Interopérabilité de l'information bibliographique et muséologique

9

FRBR(Functional Requirements for Bibliographic Records)

• Contexte organisationnel : IFLA : Fédération internationale des

associations de bibliothécaires et de bibliothèques

• Matériau de départ : Pas de modèle préalable Documents normatifs tels que ISBD

(International Standard Bibliographic Description)

Page 10: Interopérabilité de l'information bibliographique et muséologique

FRBR :toute une famille de modèles

• 1998 : Functional Requirements for Bibliographic Records, FRBR

• 2009 : Functional Requirements for Authority Data, FRAD

• 2011 : Functional Requirements for Subject Authority Data, FRSAD

• En cours : fusion des trois modèles,FRBR-LRM (Library Reference Model)

Page 11: Interopérabilité de l'information bibliographique et muséologique

11

Et si on se parlait ?• 2003 :

mise sur pied d’un groupe de travailsur l’harmonisation entre les modèles CIDOC CRM et FRBR

• Principe : « traduire » FRBR(entité-relation) en une extensiondu CIDOC CRM (orienté objet)

• Résultat : FRBROO

Page 12: Interopérabilité de l'information bibliographique et muséologique

TRÈS BRÈVE PRÉSENTATION DU CIDOC CRM

Page 13: Interopérabilité de l'information bibliographique et muséologique

13

Structure centraledu CIDOC CRM

E7 Activité

E39 Agent E28 Objet Conceptuel

E18 Chose Matérielle

E52 Laps de Temps E53 Lieu

E55 Type

E41

Appe

llatio

n

a pris part à a affecté

a occupé s’est déroulée dans

iden

tifie

sert à catégoriser

E5 Événement

Page 14: Interopérabilité de l'information bibliographique et muséologique

14

Quelques notions fondamentales• E2 Entité Temporelle

• E4 Période

• E5 Événement

• E7 Activité

• Réunion de phénomènes formant un ensemble cohérent dans l’espace et dans le temps

• Introduit la notion de la participation de personnes et de la présence de choses

• Introduit les notions d’intention et d’influence

• Introduit la notion d’outils

• Tout ce qui se produit dans le temps (événements ou états)

Page 15: Interopérabilité de l'information bibliographique et muséologique

Exemple• « L’artiste Théodore Géricault a peint son tableau Le Radeau

de la Méduse (INV4884) dans la ville de Paris en 1818-1819. »

15

E21 Personne

E41 Appellation

E55 Type

E41 Appellation

E65 Création

E12 Production

E38 Image

E35 Titre

E22 Objet Fabriqué

E42 Identifiant

E55 Type

E41 Appellation

E55 Type

E41 Appellation

E53 Lieu

E41 Appellation

E52 Laps de Temps

E50 Date

P1 est identifié par

P2 est de type

P1 est identifié par

P14 a été réalisé par

P14 a été réalisé par

P94 a crééP102 a pour titre

P65 présente comme visuel

P48 a pour identifiant préférentielP2 est d

e type

P1 est identifié par

P108 a produit

P7 a eu lieu dans

P1 est identifié parP2 est de type

P1 est identifié par

P4 a pour laps de temps

P78 est identifié par

= "Théodore Géricault"

= "artiste"= "Le Radeau de la Méduse"

= "INV4884"

= "tableau"= "Paris"= "ville"= "1818-1819"

E55 TypeP14.1 dans le rôle de= "peintre"

Page 16: Interopérabilité de l'information bibliographique et muséologique

La « famille CIDOC CRM »

16

CRMsci

FRBR

oo

CRM

CRMarcheo CRMdig

CRMgeo

CRMinf

PRES

Soo

FRBRoo : données bibliographiquesPRESSoo : données sur les périodiquesCRMinf : modèle d’inférencesCRMsci : observations scientifiquesCRMgeo : modèle spatio-temporelCRMarcheo : données archéologiquesCRMdig : métadonnées de provenance

Page 17: Interopérabilité de l'information bibliographique et muséologique

TRÈS BRÈVE PRÉSENTATION DE FRBROO ET PRESSOO

Page 18: Interopérabilité de l'information bibliographique et muséologique

18

FRBROO

• Contexte organisationnel : IFLA CIDOC CRM SIG (Special Interest

Group)• Matériau de départ :

FRBR, FRAD, FRSAD CIDOC CRM

Page 19: Interopérabilité de l'information bibliographique et muséologique

FRBROO :modéliser la notion de publication

F30 Publication

EventP4 has time-span

F32 Carrier Production

Event

F19 Publication

Work

F24 Publication Expression

F5 Item

E52 Time-Span

E50 Date

E52 Time-Span

E50 Date

P4 has time-span

P78 is identified by P78 is identified by

R3 is realised in

R6 carries

R24 created

R23 created a realisation of

R28 produced

Page 20: Interopérabilité de l'information bibliographique et muséologique

20

Une extension à l’extension…• FRBR insuffisant pour rendre

compte de la complexité des périodiques

• FRBROO ne résout pas ce problème• 2013 : Centre international ISSN +

BnF développent PRESSOO

Page 21: Interopérabilité de l'information bibliographique et muséologique

21

Démarched’élaboration de PRESSOO

• Matériau de départ : Manuel de l’ISSN expertise de spécialistes des périodiques

• Examen des éléments de donnéesrequis par le Manuel de l’ISSN traduction de leur sémantique

dans la structure de FRBROO

quand ça coince, déclarationde nouvelles classes et propriétés

Page 22: Interopérabilité de l'information bibliographique et muséologique

PRESSOO

Z1Serial

Transformation

Y… F18SerialWork

ContinuationsRemplacemen

tsScissions

FusionsZ2

AbsorptionZ3

Separation

Z5Issuing

Rule Change

Z12Issuing

Rule

Y16 replaced (was replaced through)

Y16 replaced with (was introduced through)

Page 23: Interopérabilité de l'information bibliographique et muséologique

USAGES CONCRETS DE LA FAMILLE CIDOC CRM

Page 24: Interopérabilité de l'information bibliographique et muséologique

CIDOC CRM et ses « fils » :des modèles adaptés aux techniques du Web sémantique ?

• OUI et NON à la fois OUI :

• Structure Classe – propriété – Classetrès proche de celle des triplets RDF

NON :• « Propriétés typées » difficiles à exprimer en RDF• Difficultés pour implémenter dates imprécises• Pas de préconisation pour traitement des chaînes

de caractères ou représentation des identifiants• Modèles conceptuels abstraits

plutôt qu’ontologies « prêtes à l’usage »

Page 25: Interopérabilité de l'information bibliographique et muséologique
Page 26: Interopérabilité de l'information bibliographique et muséologique
Page 27: Interopérabilité de l'information bibliographique et muséologique

27

Usages de FRBROO

• FRBROO conçu au départ pour la communauté bibliothéconomique (qui ne se l’est pas encore vraiment approprié)

• D’autres communautés y ont vu un potentiel pour leur domaine, notamment dans les humanités numériques : HuCit SAWS Biblissima …

Page 28: Interopérabilité de l'information bibliographique et muséologique

28

HuCit• Matteo Romanello (King’s College) : PhD sur la notion

de citations canoniques de textes de l’Antiquité : comment reconnaître automatiquement

ces citations au sein d’une publication moderne ? comment les traiter automatiquement

pour identifier le texte cité ? comment s’en servir pour accéder directement

au texte identifié (hypertexte)ou pour permettre des études sur l’intertextualité ?

• Avec Michele Pasin, développement de l’ontologie Humanities Citation (HuCit) « qui vise à caractériser la sémantique des citations telles qu’elles sont normalement conçues et utiliséesdans les disciplines humanistes* »

* : (Matteo Romanello, Michele Pasin,An Ontological view of canonical citations, 2011)

Page 29: Interopérabilité de l'information bibliographique et muséologique

29

HuCit et FRBROO

• HuCit développée comme uneextension de FRBROO, selonles mêmes principes que PRESSOO

• Chaque nouvelle classe introduitedans HuCit est une sous-classed’une classe de FRBROO ou du CIDOC CRM

• Idem pour les propriétés• Pas de modèle préexistant :

matériau de base = l’analyse de Matteo Romanello(son expertise, sa conceptualisation du domaine)

Page 30: Interopérabilité de l'information bibliographique et muséologique
Page 31: Interopérabilité de l'information bibliographique et muséologique

31

SAWS• Sharing Ancient WisdomS (SAWS)

Projet réunissant :• le King’s College (Londres)• l’institut Newman (Uppsala)• et l’Université de Vienne

focus :• étude des florilèges anciens

de propos et anecdotes (gnomologie)• comme outil d’approche de l’épistémé

des sociétés qui les ont produits ;• analyse de la complexité de ces matériaux• et de leurs interactions

Page 32: Interopérabilité de l'information bibliographique et muséologique

32

SAWS et techniquesdu Web sémantique

• Besoin d’une ontologiepour décrire les liens entre textes distincts

• entre deux florilèges• entre un florilège et les sources qu’il cite

et au sein d’un même texte• Ces liens sont représentés

et stockés en RDF

Page 33: Interopérabilité de l'information bibliographique et muséologique

33

SAWS et FRBROO

• Pour les mêmes raisons que HuCit, l’ontologie SAWS s’est construite comme une extension de FRBROO / CIDOC CRM

• Déclare des sous-classes très détaillées aux classes de FRBROO / CIDOC CRM

• Permet une description très fine de la structure (tant logique que matérielle)d’un manuscrit médiéval

• Les triplets RDF sont intégrésà l’encodage en TEI des florilèges édités

Page 34: Interopérabilité de l'information bibliographique et muséologique

34

Biblissima• Projet 2012-2019 visant à améliorer les

outils de recherche sur les manuscrits médiévaux, notamment en utilisant les techniques du Web sémantique permettre l’interopérabilité entre des

bases de données existantes hétérogènes via une ontologie s’appuyant sur FRBROO,

sur laquelle sera construit « l’observatoire Biblissima »

• <http://bbf.enssib.fr/consulter/bbf-2013-05-0023-005>

Page 35: Interopérabilité de l'information bibliographique et muséologique

35

Ontologie Biblissima• Domaine :

modélisation de l’histoire de la transmissiondes textes et de l’histoire des collections

• Type de questions auxquelles on espère pouvoir répondre grâce à cette ontologie : Combien de manuscrits à la feuille d’or

dans telle collection aujourd’hui dispersée ? Quelles copies de tel texte sont enluminées ? Combien de versions existe-t-il de tel texte ? Quels sont les seuls fragments par lesquels

tel texte est parvenu jusqu’à nous ? Etc.• <http://doc.biblissima-condorcet.fr/ontologie>

Page 36: Interopérabilité de l'information bibliographique et muséologique
Page 37: Interopérabilité de l'information bibliographique et muséologique

Merci de votre attention !