46
MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium MASA Maison de Sciences de l’Homme Val de Loire Laboratoire Archéologie et Territoires UMR 7324 CITERES CAA2014 PARIS

OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

OpenArchaeo

Jeux de données archéologiques

dans le web sémantique

Xavier Rodier & Olivier Marlet

Consortium MASA

Maison de Sciences de l’Homme Val de Loire

Laboratoire Archéologie et Territoires UMR 7324 CITERES

CAA2014

PARIS

Page 2: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Le consortium MASA« Mémoire des archéologues et des sites archéologiques »

• la Maison des Sciences de l’Homme du Val de Loire

• la Maison de la Recherche en Sciences Humaines de Caen

• la Maison de l’Orient et de la Méditerranée de Lyon

• la Maison Méditerranéenne des Sciences de l’Homme, d’Aix-en-Provence

• la Maison Archéologie & Ethnologie de Nanterre

• le Musée d’archéologie nationale de Saint Germain-en-Laye

• le Groupement de Services Frantiq

• l’INRAP (depuis le 1er janvier 2017)

Page 3: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Les données archéologiques

Accumulation des archives

Volonté de structurer et de publier ces données

Multiplication des bases de données et hétérogénéité des formats

Nécessité de mettre en place des bonnes pratiques :

- métadonnées normalisées et archivage pérenne

- mise en ligne des données

- alignement sur des vocabulaires normalisés

- interopérabilité des données

- alimentation des plateformes

Page 4: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Les données archéologiques dans le

Linked Open DataA

rch

ivin

g

Use and reuse

Vocabulary alignment

Publications

Interoperability

Ontology

Page 5: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

The FAIR Data Principles

Page 6: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Métadonnées et archivage

• Identification avec numéro ARK

• Mise en place de métadonnées en EAD

• Référencement avec Nakala (Huma-Num)

Page 7: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Publication de données

Page 8: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Vocabulaire normalisé : les PACTOLS

Page 9: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Interopérabilité des données

• Réaliser les appariements de chaque source de

données avec le CIDOC-CRM et ses extensions.

• Mettre en place une application unique pour

interroger ces sources de données hétérogènes.

Page 10: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Réutilisation des données

Page 11: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Evaluation des jeux de données (CITERES-LAT)

Data set Format 5 stars Linked

Open Data FAIR Start date Web

ArSol 4D *****

1990 http://arsol.univ-tours.fr/

Atlas Archéologique

de Touraine postgreSQL *****

2006 http://a2t.univ-tours.fr/

Iceramm mySQL *****

2007 http://iceramm.univ-tours.fr/

Toposources mySQL *****

2012 http://toposources.univ-tours.fr/

Outillage de la Gaule antique

XML *****

2016 http://outagr.huma-num.fr

Rigny XML *****

2016 (work in progress)

AERBA XML *****

2017 (work in progress)

Page 12: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

ArSol : « Archives du Sol »• Enregistrement archéologique de terrain 1990

• 4D (logiciel propriétaire)

• Données en ligne : http://arsol.univ-tours.fr

• Utilisation de ce cas particulier pour évaluer

l’interopérabilité au sein de MASA

Page 13: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Ap

par

iem

ent

des

ch

amp

s d

e la

tab

le "

Sép

ult

ure

"

Page 14: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Utiliser Ontop

• Protégé, logiciel d’ontology

• CIDOC au format OWL

• Charger les extensions CRM

• Explorer l’arborescence

• Connecter la base de données

• Ecrire les mappings

• Générer un fichier RDF

Page 15: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Requête SPARQL

• Interrogation dynamique

d’une base de données en

ligne, à partir des entités du

CIDOC

• Qui serait prêt à utiliser une

interface aussi peu

conviviale ?

Page 16: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Progression pour ArSol

• En ligne

• Données structurées

• Format libre

• standard W3C

• Interopérable

Faut-il migrer les données dans un format ouvert et standard,

alors que les données sont interopérables ?

Page 17: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Atlas des établissements ruraux de la Beauce antique

Inventaire des sites ruraux de Beauce connus par prospections aériennes et pédestres

Page 18: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Appariement des données XML d’AERBA avec le CIDOC

Page 19: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

3M

Page 20: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Progression pour AERBA

• En ligne

• Données structurées

• Format libre

• standard W3C

• Interopérable

Le seul fait de choisir le format XML permet d’avancer vite vers l’interopérabilité.

Les nouveaux projets demandent moins de travail que l’actualisation des anciens.

Page 21: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Rigny: The perspective of consultation

• too many publications

• not enough time to read everything

• required selection of readings

• we do not read, we consult

but we still write in the same way…

Is it possible to reconcile both speed-

reading and in-depth consultation in

the same publication?

Page 22: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

The archaeological excavation of Rigny

• Indre-et-Loire (France), from 1986 to 1999

• Retrace the formation and transformations

of a parish centre

• Study the population buried in the cemetery

• Occupation from 7th to 19th century

• Computerization since 1990 in ArSol Database

• Training excavation for students in archaeology at the University of Tours since 1989

Page 23: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

The logicism programme of Gardin

Paris, 1979

Cambridge University

Press, 1980

From the outset, a twofold objective:

1. of an epistemological nature:

clarify the mechanisms and foundations of the

reasoning used in archaeological constructions

2. of an editorial nature:

reduce the imbalance between the flood of

publications and our capacities of assimilation, to

solve the problem of scientific overproduction

Page 24: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

• The argumentation is a series of inference operations from the initial propositions {P0}

(basic data) to the final interpretative propositions {Pn}

Page 25: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Application to an electronic publication

• Logicism aims to make the steps of reasoning explicit by removing the cognitive

construction from its rhetorical packaging

Page 26: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Access to field data

In-depth examination of the evidence

Page 27: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

From field recording to logicist publication

Page 28: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

The architecture of the publication

Page 29: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Logicist diagrams in the publication

Diagrams provide a synoptic representation of the argumentation and allow a quick

assessment of its validity

Page 30: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Helping building logicist trees

Page 31: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Another work in progress

• medieval and modern ceramics

• material evidence from 40 sites

online DB

Page 32: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018Towards semantic interoperability

Page 33: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Typologies of propositions

Page 34: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Mapping with CRMinf

Observation data or comparison data

• S15_Observable_Entity → O11_was_described_by → S6_Data_evaluation (IsA

I5_Inference_Making IsA I1_Argumentation) → J2_conclued_that → I2_Belief → J4_that →

I4_Proposition_Set

• I5_Inference_Making → J3_applies → I3_Inference_Logic

Reference data

• E31_Document (IsA E73_Information_Object) → J7_is_evidence_for → I7_Belief_Adoption (IsA

I1_Argumentation) → J6_adopted → I2_Belief → J4_that → I4_Proposition_Set

Intermediate proposition

• I4_Proposition_Set → J4_is_subject_of → I2_Belief → J1_was_premise_for →

S8_Categorical_hypothesis_building (IsA I5_Inference_Making IsA I1_Argumentation) →

J2_conclued_that → I2_Belief → J4_that → I4_Proposition_Set

Page 35: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Formalisation of this mapping in TEI<div type="chapitre" xml:id="main_div">

<div type="section1" xml:id="sec1_1">

<div type="i4_proposition_set" xml:id="section1P0_1" subtype="evidence:observation">

<head>initial proposition title</head>

<figure>illustration</figure>

<p>comment

<ref>< !-- link to arsol data --></ref>

</p>

</div>

<div type="i4_proposition_set" xml:id="section1P1_1" subtype="proposition:function">

<head>intermediate proposition title</head>

<figure>illustration</figure>

<p>comment</p>

<div type="i5_inference_making">

<ptr subtype="j1_used_as_premise" target=” section1P0_1”>premise P0_1</ptr>

</div>

<div type="i5_inference_making">

<ptr subtype="j1_used_as_premise" target=” section1P0_2”>premise P0_2</ptr>

</div>

...

Page 36: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

There’s a growing

flood of

publication.

Our assimilation

capacities remain

unchanged.

We CAN’T read all.

We just consult.

Web development

provide access to

new tools.

Jean-Claude Gardin

presents the logicist

programme.

Online logicist publications

are feasible.

A new way of publishing ?

Reasoning

in archaeology need

to be clarified.

Page 37: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Progression pour Rigny

• En ligne

• Données structurées

• Format libre

• standard W3C

• Interopérable

Page 38: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

IHM MASA : OpenArchaeo

• Plateforme d’interrogation de jeux de données archéologique via le CIDOC-CRM

• Développement en cours par SPARNA (Thomas Francart)

• Choix des sources internes/externes

• Triplestore MASA

• Générateur de requêtes CIDOC-CRM SPARQL

• Modèle générique d’appariement jeux de données archéo/CIDOC-CRM

Page 39: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Application « Explorateur MASA »

Triplestore MASA (Virtuoso, GraphDB, autre)

Médiateur (endpoint SPARQL virtuel)

SPARQL endpoint

Adm

in

Source 1 Source n…

SPA

RQ

L

endp

oin

t

Adm

in

Triplestore

externe

SPARQL

Add

Update

Delete

data

Récupération des sources dans la query

Construction des requêtes à envoyer à chaque source

(Application d’une inférence CIDOC-CRM sur la query)

Envoi des requêtes à chaque source

Aggrégation résultats + interpréation ORDER BY / LIMIT / OFFSET

Spécification

sources

IHM SPARQL

« Simple Query

Generator »

{

config}

« Expansion sémantique de la query »{

config}

SPARQ

L simple

SPARQ

L étendu

SPARQL I/O

Affichage

Résultats

Traitements serveur Post traitement résultats SPARQL

Ajout des propriétés à afficher

Tablo

Carto

Tempo

Serveur (Java)

Client (javascript)

1

2

3

4

5

6

7

B

C

D

E

F

Fourniture référentiels

Ajout des sources

+ Choix des sourcesA

Page 40: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Modèle générique OpenArchaeo• Appliquer une

modélisation identique

aux jeux de données

archéologiques

• Sous-modèles type par

classes d’entités

Page 41: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Liste Initiale

Mobilier

U. S.

Site

Acteur

Fait

Mur

Sépulture

Page 42: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

relié à …

U.S.…

U. S.

Sépulture

Site

Type

Temps

Recherche…

Mobilier

Fait

Page 43: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

U. S.

U. S.

U. S.

U. S.

U. S.

U.S…Type

Interprétée comme

Contient

Trouvé à

Fait partie de

Site

Sépulture

Daté deTemps

Mobilier

U. S.Fait partie de

Fait

Page 44: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

relié à …

Mobilier…

U. S.

Sépulture

Site

Mobilier

Concept

Temps

Recherche…

Page 45: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Mobilier…Mobilier Type

Utilisé pour

Fait en

MobilierTrouvé dans

U. S.

MobilierTrouvé dans

MobilierTrouvé dans

Site

Sépulture

MobilierDaté de

Temps

Page 46: OpenArchaeo Jeux de données archéologiques …...MASA MOM Lyon 2018 OpenArchaeo Jeux de données archéologiques dans le web sémantique Xavier Rodier & Olivier Marlet Consortium

MASA

MOM

Lyon

2018

Conclusion• Besoin de sources de données archéologiques en ligne pour tester l'interopérabilité des

jeux de données appariés avec le CIDOC-CRM via OpenArchaeo.

• Tester l'interopérabilité à différentes échelles pour des bases de granularités différentes

(régionales, fouille).

• Formation des archéologues de MASA avec l'organisation d'une école thématique en

2019.

• Intégration dans ARIADNEplus