79
Le projet « Guides de Paris » et la production d’un corpus textuel connecté Emmanuel Château, Marianne Cojannot-Le Blanc IFT6282, séminaire de Guy Lapalme, 9 novembre 2017

Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Le projet « Guides de Paris » et la production d’un corpus

textuel connecté

Emmanuel Château, Marianne Cojannot-Le Blanc IFT6282, séminaire de Guy Lapalme, 9 novembre 2017

Page 2: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 2/80

Sommaire

1. L’instrumentation d’un corpus textuel en histoire de l’art

2. La création d’une API textuelle3. L’exposition du corpus sous

forme de données liées

Page 3: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

1. L’instrumentation d’un corpus textuel en histoire de l’art

Page 4: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

1.1 La constitution du corpus et ses enjeux

Page 5: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 5/80

Les Guides de ParisLes historiens d’art

& les corpus numériques

EA4414 HISTOIRE DES ARTS ET REPRÉSENTATIONS

Page 6: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 6/80

abondance - - ~10 auteurs - - du 16e au 18e siècles, 35 textes, + 300 éditionsvariété - - formats, publics - - taille, illustrationsréemplois & réécritures - - intertextualité - - plagiats

Le corpus

Page 7: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 7/80

35 titres (XVIe-XVIIIe siècles)= 300 éditions (Gilles Chabaud)- Gilles Corrozet (1510-1568) - - 19 éditions 1531 - 1586- Pierre Bonfons (15??-16??) - - 3 éditions 1605 - 1608- Jacques Du Breul (1528-1614) - - 6 éditions 1608 - 1640

- 1608, Paris, N. Bonfons - 1612, Paris, C. de La Tour- 1612, Paris, P. Chevalier - 1614, Paris, ex typographia Petipas- 1618, Paris, La Tour - 1639, Paris, Société des imprimeurs- 1640, Paris, P. Rocolet

- Claude Malingre (1580?-1653?) - - 1 édition 1640- Henri Sauval (1620?-1676) - - 2 éditions 1724 - 1733- Germain Brice (1653?-1727) - - 9 édition 1684 - 1752- Charles Le Maire (16..-16..?) - - 2 editions 1685 - 1698- etc.

Le corpus cible

Page 8: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 8/80

Germain Brice, Description de la ville de Paris, 1752

Henri Sauval, Histoire et recherches des antiquités de la ville de Paris, 1724

Page 9: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 9/80

Gilles Corrozet, Les Antiquitez..., 1550. http://www.ericgrangeon.com/home/57-corrozet-gilles-.html

Page 10: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 10/80

Pierre Bonfons, Les Antiquitez..., 1608 Jacques Du Breul, Le Theatre des antiquitez,..., 1612

Page 11: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 11/80

Jacques Du Breul, Le Theatre des antiquitez,..., 1612

Page 12: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 12/80

Germain Brice, Description de la ville de Paris,... 1752.

Page 13: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 13/80

Germain Brice, Description de la ville de Paris,... 1752.

Page 14: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 14/80

Estienne, Charles (1504?-1564). La guide des chemins de France. Paris : C. Estienne, 1552.

Page 15: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 15/80

Piganiol de la Forge, Description de Paris,... 1742. [Volume I. Plan dépl. en reg. du Titre : plan de Paris.] Plan général des vingt quartiers de la ville et faubourgs de Paris (...).[Volume V. Plan dépl. en reg. p.419 : Paris. ] Plan et escription du Quartier de Saint-André-des-Arts (...).

Page 16: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 16/80

La nature du corpus

pas de cohérence interne - - genre non constitué - - usage actuel des chercheursdifficulté de maniement - - volumes matériels, nombre des éditions, etc. - - absence de numérisation (avant le projet)pas d’existence en tant que tel - - textes envisagés isolément - - phénomènes d’intertextualité, polémiques - - sollicitations ponctuelles

Page 17: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 17/80

Des questions préalables

l’émergence des notions d’œuvre d’art et d’artiste - - que désigne-t-on, pourquoi - - naissance de la critiquel’émergence d’une conscience patrimoniale - - production de la valeur - - étude des entrées et des sorties

Page 18: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

1.2 Un corpus outillé

Page 19: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 19/80

Systématiquement...

donner le texte à lire - - lecture linéaire - - base de données bibliographiquefournir des points d’accès multipliés - - index (noms, lieux, œuvres, ...) - - recherches plein-texteautoriser des lectures transversales - - collations, inter-textualité, réemplois, etc. - - entrées et sorties - - géolocalisations

Page 20: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 20/80

Un corpus instrumentépermettre une manipulation du matériau textuel et l’outiller au moyen de dispositifs pour favoriser son étude et son exploration¶ visualisations - - géolocalisations - - data-visualisations - - mashups ¶ explorer et annoter - - ontologie patrimoniale sur Paris - - textométrie - - annotation collaborative

Page 21: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 21/80

Les « scholarly primitives »

“basic functions common to scholarly activity across disciplines, over time, andindependent of theoretical orientation.”john unsworth, dean and professor of graduate school library and information science,u.illinois

- - Discovering - - Annotating - - Comparing - - Referring - - Sampling - - Illustrating - - Representing

Page 22: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 22/80

http://vangoghletters.org, 2009

Page 23: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 23/80

http://www.sandrart.net, 2012

Page 24: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 24/80

Collation du texte

Collation de versions de Brice avec JuXta (http://www.juxtasoftware.org)Voir aussi l’algorithme CollateX (https://collatex.net)

Page 25: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 25/80

http://alpage.huma-num.fr/fr/

Page 26: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 26/80

ex. Pundit

http://thepund.it

Page 27: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

1.3 Un corpus connecté

Page 28: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 28/80

Contexte LOD

contexte de l’ouverture des données - - contexte réglementaire européen d’ouverture des données de recherche - - feuille de route web 3.0 du MCCpolitique interne du Labex - - politique d’ouverture des données assumée - - définition d’un modèle de données commun - - groupe ModRef

Page 29: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 29/80

Qu’est-ce que le LOD ?

LOD Linked Open Datarépose sur le web semantique - - ressources & représentation - - indentifiants (URI) - - utilisation de RDF et d’ontologies (RDFs, OWL, ...)une manière d’utiliser le web - - pour connecter des données en rapport - - pour exposer des données et des informations sur le web sémantique

Page 30: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 30/80

TEI +Un corpus connecté

Faire partie du Linked Open Data - - pour la distribution et les réutilisations - - pour l’enrichissement

Page 31: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 31/80

Veuë du Pont neuf et de l’Isle du Palais a Paris, Israël Silvestre sculp. et ex., 154 x 109Cette image fait partie de la suite 53 : Vues de Paris et de France.

Page 32: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

2. La création d’une API textuelle

Page 33: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

2.1 Structuration du corpus avec XML-TEI

Page 34: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 34/80

La TEI comme véhicule

¶ modélisation ODD ¶ guide d’encodage¶ modélisation centrée sur - - transcription diplomatique (typographie, pages de titre, etc.) - - structuration du corpus

- - identifiants canoniques (liages, etc.) - - entités-nommées et référentiel patrimonial

TEI +

Page 35: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 35/80

Les documents TEI ont trois couches sémantiques

Hugh A. Cayless, TEI Journal, 2013

- texte unicode- balisage sémantique- méta-structures

Page 36: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 36/80

Pourquoi encoder en XML-TEI ?

¶ production de métadonnées - - documenter le texte qu’on édite - - pour la publication, le moissonnage ¶ enrichissement éditorial - - signaler la structure du document - - changements de pages, ratures, etc.¶ enrichissement sémantique - - nom de personnes, lieux, dates, abréviations, etc.

Page 37: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 37/80

Tirer parti de la TEI ?

¶ documenter son travail - - spécification formelle - - production d’une documentation¶ validation contre un schéma - - contrôle du travail des éditeurs (collectif) - - assurer la consistance des fichiers¶ utilisation comme format pivot - - chaîne d’édition multimodale - - formats de sorties (html, epub, etc.)

Page 38: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 38/80

Présentation du corpusXML-TEI

Page 39: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

2.2 Un cadre léger de publication avec XQuery

Page 40: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 40/80

ÉditionTEI

PublicationWEB

AnnotationOA

Outils mis en œuvre

Page 41: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 41/80

SynopsXhttp://synopsx.github.io

cadre léger de publication XQuery - - publier et exposer des corpus XML sur le web - - application XQuery avec BaseX - - scalabilité et personnalisation - - système de templating

¶ exemples fonctionnels - - http://rey.huma-num.fr - - http://montesquieu.huma-num.fr - - http://editions.ihpc.huma-num.fr/skepsis

Page 42: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 42/80

SynopsX

collaboration non-institutionnelle - - initié par l’Atelier des Humanités Numériques (AHN) de ENS Lyon http://ahnenslyon.hypotheses.org - - plusieurs projets de recherche (Ampère, Guides de Paris, etc.)¶ modèle du logiciel libre - - GNU General Public License >3 - - http://synopsx.github.io

https://github.com/guidesDeParis/

Page 43: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 43/80

Pourquoi SynopsX ?

¶ Collaborer - - labex = recherche par projet - - qualité du code & bonnes pratiques¶ Mutualiser - - ne pas réinventer la roue - - soutenabilité¶ Génériciser - - maintenabilité - - réutilisabilité

Page 44: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 44/80

persistance

business logic

presentation

SQL + PHP+ XSLT

(X)HTML5JavaScript

XML

Structures traditionnelles des applications

Page 45: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 45/80

persistanceXML

business logicXQuery+ XSLT

presentation(X)HTML5JavaScript

SQL + PHP+ XSLT

(X)HTML5JavaScript

XML

des technologies uniformes(XML)

Page 46: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 46/80

Principes de dévt de SynopsX¶ keep it simple ! - - un cadre de publication léger - - facile d’accès¶ entièrement personnalisable - - ressources & représentation définies par l’utilisateur - - libre choix du scheme d’URIs - - surcharge et mécanismes d’héritage ¶ ~ MVC - - séparation du contenu et du rendu - - méchanisme de templating complet (mappings)

Page 47: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 47/80

Bases de données XML

¶ avantages - - préservation des structures de données XML - - utilisation des spécifications de schémas - - indexation des structures XML - - accès à travers des API XML (XPath, XQuery, etc.)¶ solutions libres & open source - - BaseX http://basex.org - - eXistDB http://exist-db.org

Page 48: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 48/80

Composants & APIs de BaseX

serveur http

processeurXQuery

donnéesGUI

client

clientwebdav webservice

Page 49: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 49/80

RESTXQ

¶ proposition de spécification - - équivalent à l’API Java JAX-RS - - annotation XQuery - - proposition de spécification d’Adam Retterhttp://exquery.github.io/exquery/exquery-restxq-specification/restxq-1.0-specification.html

¶ basé sur le protocole HTTP - - RFC7230, RFC7232, RFC7233, RFC7234, RFC7235 - - cf. Roy Thomas Feldinghttp://www.ics.uci.edu/%7Efielding/pubs/dissertation

Page 50: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 50/80

ex. de fonction ressourceen XQuery

xquery version ‘3.0’ ;module namespace demo = ‘demo’ ;declare default function namespace ‘demo’ ;

declare %restxq:path(‘/demo’) %rest:produces(‘text/html’) %output:method(‘html’) %output:html-version(‘5.0’) function titres() { <p>Hello World !</p> };

Page 51: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 51/80

De multiples formats de sortie

WEB appTEI

TEI

XML sources representations

SPARQL end-point

Page 52: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 52/80

Ressource

sauval1724http://guidesdeparis.net/corpus/sauval1724

URI

MétadonnéesContent-Type: text/html; charset=UTF-8Données<html xmlns="http://www.w3.org/1999/xhtml" lang="fr" xml:lang="fr"> <head> <meta charset="utf-8"/> <title > { Titre du document } </title> </head> <body> { page content } </body></html>

Représentation

identifie

représente

Resource, URI, représentations

Page 53: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 53/80

Négociation de contenu

GET

Client HTTP Serveur

<a href=’guidesdeparis.net’>...</a>

/home

/303 See other

GET

application/html 200 OK

HTTP/1.1 303 See OtherLocation: /home

...

application/tei+xmlapplication/rdf+xmlapplication/x-turtle

...

Page 54: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 54/80

démonstration de l’application SynopsX

Page 55: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

3. L’exposition du coprus sous forme de

données liées

Page 56: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

3.1 Le web de données culturel

Page 57: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 57/80

Données disponibles IDs URIs LOD yes yes yes +++ yes - - next ++ yes yes yes ++++ geo yes yes yes ++ + ISNI yes yes no ++ AN yes - - - - ++ AKL yes no no +++

Page 58: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 58/80

Web de données culturelquelques ex. structurants

¶ thesaurus - - Linked Open data Getty vocabularies (AAT, TGN, ULAN) http://www.getty.edu/research/tools/vocabularies/lod/ - - Vocabulaires du MCC (France) http://data.culture.fr/thesaurus/¶ jeux de données - - http://data.bnf.fr - - https://www.wikidata.org - - http://www.geonames.org

Page 59: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 59/80

Web de données culturelex. domaine muséal

- - Amsterdam Museumhttps://hart.amsterdam/nl/page/12686/amsterdam-museum-en-linked-open-data - - British Museum https://collection.britishmuseum.org/resource/About - - American Art collaboratory (AAC)http://americanartcollaborative.org - - Musée du Pradohttps://www.museodelprado.es/en/modelo-semantico-digital/modelo-ontologico

Page 60: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 60/80

Web de données culturelbiblio

Januals, B. et Minel, J-L. (2016). “ La construction d’un espace patrimonial partagé dans le Web de données ouvert ”. Communication, 34/1. En ligne : http://communi-cation.revues.org/6650. DOI : 10.4000/communication.6650

Pascaline Tchienehom, «ModRef Project: from Creation to Exploitation of CIDOC-CRM Triplestores», The Fifth International Conference on Building and Exploring Web Based Environments (WEB 2017), May 21 - 25, 2017 - Barcelona, Spain - Regular paper - https://hal.archives-ouvertes.fr/hal-01578878

Pascaline Tchienehom, «Humanités Numériques et Web Sémantique : du lan-gage naturel à une représentation computationnelle structurée et sémantique des données», Digital Humanities - Alliance of Digital Humanities Organizations (ADHO), August 8 - 11, 2017 - Montréal, Canada - Résumé long - https://hal.ar-chives-ouvertes.fr/hal-01579338

Page 61: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 61/80

EDMEuropeana Data Model

https://pro.europeana.eu/resources/standardization-tools/edm-documentation

Page 62: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 62/80

HadocHarmonisation des données

culturelles (MCC, France)http://www.culturecommunication.gouv.fr/Divers/Harmonisation-des-donnees-culturelles

- - Ginco- - Onoma

Page 63: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 63/80

Feuille de route web 3.0(MCC, France)

Métadonnées culturelles & transition Web 3.0http://www.enssib.fr/bibliotheque-numerique/documents/64776-feuille-de-route-strategique-metadonnees-culturelles-et-transition-web-3-0.pdfhttps://www.inha.fr/fr/agenda/parcourir-par-annee/en-2016/decembre-2016/le-web-semantique-pour-les-donnees-culturelles.htmlBiblioSajus, B. & Leroi, M. (2016). Le développement du web des données culturelles: Les enjeux pour le ministère de la Culture et de la Communication. I2D – Information, données & documents, volume 53,(2), 46-47. https://www.cairn.info/revue-i2d-information-donnees-et-documents-2016-2-page-46.htm

Page 64: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 64/80

POC duLabex les Passés dans le Présent

http://triplestore.modyco.fr:8080/ModRef

https://hal.archives-ouvertes.fr/hal-01578878

Page 65: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

3.2 La représentation des entités historiques du corpus

Page 66: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 66/80

Entités & formats

textes - - RDA (FRBR) - - XML-TEIagent historiques - - dénominations, informations historiques - - XML-TEI ou EAC-CPFlieux - - dénominations, informations historiques - - XML-TEIobjects culturels - - dénominations, informations historiques - - LIDO (CIDOC-CRM), XML-TEI (object) à venir ?

Page 67: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 67/80

CIDOC-CRMUn modèle conceptuel de référence - - conçu pour l’interopérablité - - une ontologie de domaine

propose des définitions et des structures formelles pour décrire explicitement ou implicitement des concepts et leurs relations pour une utilisation dans la documentation du patrimoine culturel

- - version OWL http://erlangen-crm.orgMappings - - avec EAD (2001) - - convergence avec FRBR (FRBR-oo) - - SIG TEI ontology

Page 68: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 68/80

TEI & CIDOC-CRM

Mappings - - pour les métadonnées - - pour les entités place, person, org - - intégrées aux XSL Stylesheets

BiblioØyvind Eide (2014). Ontologies, Data Modeling, and TEI. TEI-Journal, n° 8. https://jtei.revues.org/1191

Page 69: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 69/80

workfind its realisation in

is concretize with

is reprented by

expression

manifestation

item

FRBR group 1

Page 70: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 70/80

use relatedItem instead ?

Page 71: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 71/80

??

La TEI est-elle appropriée pour les objets cultuels ?

TEI

Page 72: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 72/80

Descriptive and administrative groups of information of a LIDO record

– Object Classifications –Object / Work Type Classification– Object Identifications –Title / Name (mandatory) InscriptionsRepository / LocationState / EditionObject Description Measurements– Events –EventSet– Relations –Subject SetRelated Works– Administrative Metadata – RightsRecord (mandatory)Resource

Events in LIDOEvent– Event Identifier– Event Type– Role in Event– Event Name– Event Actor– Culture– Event Date– Period– Event Place– Event Method– Materials / Technique – Thing Present– Event Related– Event Description

Content / Subject in LIDOSubject– Extent Subject– Subject Concept– Subject Actor– Subject Date– Subject Place– Subject Event– Subject Object

LIDO overview

Page 73: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 73/80

enregistrement LIDO

Page 74: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 74/80

Créer un élément TEI personnalisé pour les objets culturels ?

LIDO un format d’échangeAgents et Lieux déjà dans la TEI - - ensemble du corpus édité en TEI - - modèle de contenu person suffisant pour nous - - modèle de contenu places suffisant pour nous‘traits’, ‘events’, ‘states’ paraissent bien correspondre aux besoins

Page 75: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 75/80

Objectifs du projet

produire des mappings & construire une API - - donner accès aux ressources via HTTP - - offrir différentes représentations des ressources (html, tei, DC, rdf, txt)offrir un SPARQL-endpoint - - nourrir un SPARQL endpoint avec les triplets issus des mappings - - enrichissements

Page 76: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 76/80

Ressources publiées

transcriptions des textes - - toutes dans le domaine publicédition critique - - textes annotés - - textes encodés en XML-TEIréférentiels & métadonnées - - référentiel sur le patrimoine parisien - - métadonnées réutilisables (MCC, Bnf)

Page 77: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Conclusions

Page 78: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

Emmanuel Château-Dutier / Marianne Cojannot-Le Blanc | IFT6282 | 9 novembre 2017 | 78/80

Vannevar Bush, « As we May Think », Atlantic Monthly, Juillet 1945.

Page 79: Le projet « Guides de Paris » et la production d’un corpus ...lapalme/ift6282/Chateau-Dutier.pdfLe projet « Guides de Paris » et la production d’un corpus textuel connecté

http://www.guidesdeparis.net (bientôt !)[email protected]@emchateau

http://passes-present.eu