Web Sémantique et Interopérabilité des Vocabulaires Conceptuels Antoine ISAAC Projet STITCH...

Preview:

Citation preview

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Antoine ISAACProjet STITCH

Journée BNF2 octobre 2007

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Contexte

• STITCH• SemanTic Interoperability To access Cultural

Heritage

• Échange et intégration de méta-données

• Projet de recherche appliqué au domaine patrimonial

• Collaboration avec la BnF• 1 an (2006-2007)

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

KB Illustrated Manuscripts

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

KB Illustrated Manuscripts

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Mandragore

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Mandragore

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Le problème: hétérogénéité des vocabulaires

• Des objets conceptuels distinctsavec des sens parfois comparables

• “Sainte Marie” / “la Vierge Marie”

• “ruines antiques” / “paysage avec ruines”

• Des représentations différentes• Formats: XML ou pas, MARC, …

• Des modélisations différentes: classes, concepts, termes, etc.

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Le problème

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Une solution en deux étapes

1. Homogénéiser la représentation des vocabulaires• Représentation standard

• Représentation compatible avec l’alignement

2. Aligner les vocabulaires• Trouver des correspondances sémantiques

entre les éléments de vocabulaires différents• “ruines antiques” ≈ “paysage avec ruines”

• “Sainte Marie” = “la Vierge Marie”

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

SKOS (Simple Knowledge Organisation System)

• World Wide Web Consortium (W3C)

• Modèle simple pour représenter des vocabulaires conceptuels (thesauri, classifications,…) sur le WS• Comparable à Dublin Core, au niveau des vocabulaires

• SKOS propose des primitives pour créer des données XML/RDF• Concepts et ConceptSchemes

• Propriétés lexicales (prefLabel, altLabel)

• Liens sémantiques (broader, related)

• Notes (scopeNote, definition)

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

SKOS: exemplehttp://[...]/mandragore/descripteurs/c_230

http://[...]/mandragore/descripteurs/c_235

skos:Concept

rdf:type skos:broader

skos:prefLabel “saints et bienheureux”@fr

• Attention; c’est un standard, tout n’est pas représenté• Publication et échange de données• Celles qui nous intéressent!

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Alignement des vocabulaires

• Trouver des correspondances sémantiques• “ruines antiques” ≈ “paysage avec ruines”

• “Sainte Marie” = “la Vierge Marie”

• Le faire (semi-)automatiquement

• Inspiré de ce qui se fait pour le Web Sémantique • alignement d’ontologies

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Approches pour l’alignement de vocabulaires

• Lexicales • Structurelles• Statistiques• Utilisation de connaissances de contexte

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Alignement lexical

• Libellés des concepts, gloses

avancée à la perchebarque BarquebroaderMatch

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Après

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Démo

• http://prauw.cs.vu.nl/rp33333/MANDRA-SV-ICE-mandraNewNONE , amphibiens

• Blé

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Conclusions : Représentation

• Il est possible de produire des représentations WS standardisées (SKOS) des vocabulaires conceptuels• Et des méta-données qui les utilisent

• Les techniques existantes pour accéder aux méta-données et vocabulaires (OAI-PMH, XML) facilitent le travail

• C’est utile • Réutilisation/interopérabilité des composants applicatifs

utilisant les vocabulaires

• Facilité de la représentation de liens avec des éléments extérieurs au vocabulaire représenté

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Conclusions : Alignement

• Les techniques simples permettent d'obtenir des résultats rapides• 12300 concepts de Mandragore “accessibles” depuis

Iconclass

• Leur fiabilité ne permet pas de les considérer comme sources uniques• Combinaison avec travail manuel (vérification, complétion)

• L’alignement sémantique est toujours un problème de recherche difficile• Aucune technique n’est parfaite• Il faut sélectionner/combiner, en fonction des cas applicatifs

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Merci !

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Liens

• STITCH http://stitch.cs.vu.nl

• Projets d’intégration dans le domaine des bibliothèques:

• MSAC http://sigma.nkp.cz

• MACS http://macs.cenl.org

• Liens Web Sémantique

• au W3C http://www.w3.org/2001/sw/

• SKOS http://www.w3.org/2004/02/skos/

• Semantic Web projects dans le domaine patrimonial

• MuseumFinland http://www.museosuomi.fi/

• eCulturehttp://e-culture.multimedian.nl/

Web Sémantique et Interopérabilité des Vocabulaires ConceptuelsDemo (1)

Subject vocabulary, collection 1

Subjects

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Demo (2)

Hierarchical path from root to selected

subject

Possible specialization for selected subject

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Document from Collection 2

Semantic alignment of subjects activated

Demo (3)

Web Sémantique et Interopérabilité des Vocabulaires Conceptuels

Demo (4)

Subject from voc2 aligned to voc1:amphibians”

Back

Recommended