24
Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Embed Size (px)

Citation preview

Page 1: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Antoine ISAACProjet STITCH

Journée BNF2 octobre 2007

Page 2: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Contexte

• STITCH• SemanTic Interoperability To access Cultural

Heritage

• Échange et intégration de méta-données

• Projet de recherche appliqué au domaine patrimonial

• Collaboration avec la BnF• 1 an (2006-2007)

Page 3: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

KB Illustrated Manuscripts

Page 4: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

KB Illustrated Manuscripts

Page 5: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Mandragore

Page 6: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Mandragore

Page 7: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Le problème: hétérogénéité des vocabulaires

• Des objets conceptuels distinctsavec des sens parfois comparables

• “Sainte Marie” / “la Vierge Marie”

• “ruines antiques” / “paysage avec ruines”

• Des représentations différentes• Formats: XML ou pas, MARC, …

• Des modélisations différentes: classes, concepts, termes, etc.

Page 8: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Le problème

Page 9: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Une solution en deux étapes

1. Homogénéiser la représentation des vocabulaires• Représentation standard

• Représentation compatible avec l’alignement

2. Aligner les vocabulaires• Trouver des correspondances sémantiques

entre les éléments de vocabulaires différents• “ruines antiques” ≈ “paysage avec ruines”

• “Sainte Marie” = “la Vierge Marie”

Page 10: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

SKOS (Simple Knowledge Organisation System)

• World Wide Web Consortium (W3C)

• Modèle simple pour représenter des vocabulaires conceptuels (thesauri, classifications,…) sur le WS• Comparable à Dublin Core, au niveau des vocabulaires

• SKOS propose des primitives pour créer des données XML/RDF• Concepts et ConceptSchemes

• Propriétés lexicales (prefLabel, altLabel)

• Liens sémantiques (broader, related)

• Notes (scopeNote, definition)

Page 11: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

SKOS: exemplehttp://[...]/mandragore/descripteurs/c_230

http://[...]/mandragore/descripteurs/c_235

skos:Concept

rdf:type skos:broader

skos:prefLabel “saints et bienheureux”@fr

• Attention; c’est un standard, tout n’est pas représenté• Publication et échange de données• Celles qui nous intéressent!

Page 12: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Alignement des vocabulaires

• Trouver des correspondances sémantiques• “ruines antiques” ≈ “paysage avec ruines”

• “Sainte Marie” = “la Vierge Marie”

• Le faire (semi-)automatiquement

• Inspiré de ce qui se fait pour le Web Sémantique • alignement d’ontologies

Page 13: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Approches pour l’alignement de vocabulaires

• Lexicales • Structurelles• Statistiques• Utilisation de connaissances de contexte

Page 14: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Alignement lexical

• Libellés des concepts, gloses

avancée à la perchebarque BarquebroaderMatch

Page 15: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Après

Page 16: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Démo

• http://prauw.cs.vu.nl/rp33333/MANDRA-SV-ICE-mandraNewNONE , amphibiens

• Blé

Page 17: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Conclusions : Représentation

• Il est possible de produire des représentations WS standardisées (SKOS) des vocabulaires conceptuels• Et des méta-données qui les utilisent

• Les techniques existantes pour accéder aux méta-données et vocabulaires (OAI-PMH, XML) facilitent le travail

• C’est utile • Réutilisation/interopérabilité des composants applicatifs

utilisant les vocabulaires

• Facilité de la représentation de liens avec des éléments extérieurs au vocabulaire représenté

Page 18: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Conclusions : Alignement

• Les techniques simples permettent d'obtenir des résultats rapides• 12300 concepts de Mandragore “accessibles” depuis

Iconclass

• Leur fiabilité ne permet pas de les considérer comme sources uniques• Combinaison avec travail manuel (vérification, complétion)

• L’alignement sémantique est toujours un problème de recherche difficile• Aucune technique n’est parfaite• Il faut sélectionner/combiner, en fonction des cas applicatifs

Page 19: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Merci !

Page 20: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Liens

• STITCH http://stitch.cs.vu.nl

• Projets d’intégration dans le domaine des bibliothèques:

• MSAC http://sigma.nkp.cz

• MACS http://macs.cenl.org

• Liens Web Sémantique

• au W3C http://www.w3.org/2001/sw/

• SKOS http://www.w3.org/2004/02/skos/

• Semantic Web projects dans le domaine patrimonial

• MuseumFinland http://www.museosuomi.fi/

• eCulturehttp://e-culture.multimedian.nl/

Page 21: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires ConceptuelsDemo (1)

Subject vocabulary, collection 1

Subjects

Page 22: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Demo (2)

Hierarchical path from root to selected

subject

Possible specialization for selected subject

Page 23: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Document from Collection 2

Semantic alignment of subjects activated

Demo (3)

Page 24: Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH Journée BNF 2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Demo (4)

Subject from voc2 aligned to voc1:amphibians”

Back