21
Laboratoire d'InfoRmatique en Image et Systèmes d'information LIRIS FRE 2672 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université Lumière Lyon 2/Ecole Centrale de Lyon Université Claude Bernard Lyon 1, bâtiment Nautibus 43, boulevard du 11 novembre 1918 — F-69622 Villeurbanne cedex http://liris.cnrs.fr/ FRE 2672 Séminaire Ontologies Multiples – 9 septembre 2004 Séminaires ontologies multiples – 9 sept. 2004 Interopérabilité des ressources sémantiques pour la conception coopérative P. Ghodous, L. Médini

Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Laboratoire d'InfoRmatique en Image et Systèmes d'informationLIRIS FRE 2672 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université Lumière Lyon 2/Ecole Centrale de Lyon

Université Claude Bernard Lyon 1, bâtiment Nautibus43, boulevard du 11 novembre 1918 — F-69622 Villeurbanne cedex

http://liris.cnrs.fr/

FRE 2672

Séminaire Ontologies Multiples – 9 septembre 2004

Séminaires ontologies multiples – 9 sept. 2004

Interopérabilité desressources sémantiques

pour la conception coopérative

P. Ghodous, L. Médini

Page 2: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 2

Plan de la présentation

Présentation de l’équipeModélisation génériqueModélisation collaborativeModélisation sémantique

Aspects « multi-ontologies »ApplicationPerspectives

Page 3: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 3

Aspects « multi-ontologies »

Présentation de l’équipeAspects « multi-ontologies »

Problématique de l’interopérabilité des ressources hétérogènesApproches existantesDémarche adoptée

ApplicationConclusion et perspectives

Page 4: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 4

Problématique

Hétérogénéité des Ressources Sémantiques (RS)Au niveau des modèles utilisés

Différents types de ressourcesTaxonomies, classifications« Linguistiques » : vocabulaires, thésaurus, dictionnairesOntologies

Différents formats de représentationTexte, MS-Word, (X)HTML…XML, RDF, DAML+OIL, OWLKIF, KL-One, UML+OCL

Différentes « utilisabilités »CompréhensibilitéInterprétabilité (computabilité, calculabilité, …)

Page 5: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 5

Problématique

Hétérogénéité des Ressources SémantiquesAu niveau des données représentées

Différences de contenuDonnées utilisées, concepts définis (heureusement !)

Différences de « points de vue »Cohérence des donnéesStructuration des connaissances

Différences de portée, véracitéExemples : données physiques, terminologies techniques,

réglementations locales, modèles d’activité

Page 6: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 6

Problématique

Ce que l’on rechercheIdentités

Données identiques sans traitementSimilarités

Données identiques après traitement(s)Interdépendances

Données reliées par des relations connuesCorrespondances

Relations permettant de mettre en évidence les similarités et les interdépendances

Règles de mappingContraintes

Page 7: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 7

Problématique

Objectif à atteindre : l’interopérabilitéDes données

Identifier une valeur à partir de données identiques ou similaires extraites d’autres points de vueDéterminer une telle valeur à partir de correspondances

Des sources d’informationIdentifier les documents pertinents à travers les points de vue

Des connaissancesTraiter les connaissances existantes pour générer des règles

de correspondances non pré-établies et cohérentes

Page 8: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 8

Problématique

Contraintes (liées au domaine de l’ingénierie coopérative)

Conserver les modèles et outils appropriés pour les tâches des co-opérateursPermettre leur évolution

⇒Ne pas modifier les RS existantes (C1)

Identifier les interactions pertinentes entre les points de vue pour éliminer les informations inutilesGérer l’ensemble des relations entre les données pour ne pas limiter les traitements

⇒Disposer d’un référentiel de conception pour positionner ces modèles (C2)

Page 9: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 9

Approches existantes

Approche intégrée ou « médiation centralisée »Fusion d’ontologies

Création d'une ontologie à partir d'ontologies existantesLes ontologies d’origine cessent d’être utilisées

⇒Incompatible avec C1Intégration d’ontologies

Construction ou enrichissement d’une ontologie à partir d’ontologies existantesLes ontologies d’origine peuvent continuer à être utilisées.

⇒Lourde à réaliser avec des sources nombreuses et très hétérogènes

⇒Nécessite une re-génération de l’ontologie de haut niveau àchaque modification d’une composante

Page 10: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 10

Approches existantes

Approche fédérée ou « ontologies multiples »Alignement

Établissement de correspondances binaires entre concepts de deux ontologies

Appariement (« matching »)Établissement de correspondances n-aires entre concepts de plusieurs ontologies

Doivent aboutir à un ensemble « pertinent et cohérent »[Klein, 2001]

⇒« Légères modifications » des ontologies acceptées pour conserver la cohérence

⇒Stockage des correspondances dans une « ontologie d’articulation » si les RS ne doivent pas être modifiées

Page 11: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 11

Approches existantes

Approche hybride ou unifiéeSemblable à l’approche fédéréeUtilise un vocabulaire partagé comme ontologie de plus haut niveau

⇒Facilite l’établissement de correspondances⇒Facilite les traitements ultérieurs⇒Nécessite la mise au point d’un vocabulaire partagé

Remarque : ces trois approches sont issues du standard ISO 14258, présenté dans [Chen & Doumeingts 2003]

Page 12: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 12

Démarche adoptée

Approche fédérée « contextualisée »Conserver les RS d’origine et les « traduire » dans un format pivotIdentifier les correspondancesValuer ces correspondances par un calcul de distance dans l’espace de conception

Page 13: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 13

Démarche adoptée

Homogénéisation des formats de représentationTypologie des formats de représentation

TaxonomiesGraphesOntologies

Élaboration de méta-modèles UMLSélection d’un format pivot : OWL DLConversion de formats générique vers ce format pivot

Algorithme de Binding/Unmarshalling pour créer des classes Java à partir de schémas XMLUtilisation de l’API Jena2 pour obtenir les instances des classes OWL

Page 14: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 14

Démarche adoptée

Méta-modèle OWL

InverseFunctionalProperty

TransitivePropertySymmetricProperty

DatatypePropertyFunctionalPropertyAnnotationProperty

rdfs:label rdfs:commentrdfs:seeAlsordfs:isDefinedBy

instance

instance instanceinstance

rdfs:subPropertyOf

equivalentProperty

propertysubPropertyOf

owl:Thing sameAsdifferentFrom

AllDifferent

rdf:List

distinctMembers

owl:Class

equivalentClass

disjointWith

unionOfoneOf

intersectionOf

complementOf

Individual

ObjectProperty

inverseOf

Ontologyimports

priorVersion

backwardCompatibleWith

incompatibleWith

OntologyProperty

imports

priorVersion

backwardCompatibleWith

incompatibleWith

rdfs:Literal

DeprecatedClass

DeprecatedProperty

rdfs:subClassOf

equivalentClass

subPropertyOf

NonNegativeInteger

Restriction

cardinality

minCardinalitymaxCardinality

Nothing

rdfs:Resource

rdfs:comment

rdfs:label

rdfs:seeAlso

rdfs:isDefinedBy

rdf:Property equivalentPropertyrdfs:subPropertyOf

onProperty

rdfs:range

rdfs:Class

rdfs:subClassOf

allValuesFrom hasValue

someValuesFrom

rdfs:domain

Page 15: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 15

Démarche adoptée

Élaboration de correspondancesEntre ontologies exprimées dans le format pivotCréation d’une ontologie d’articulationAlignement/appariement automatiques

Appariement de contenus textuels (nœud à nœud)Adaptation de techniques d’appariement de textes (parties de graphes)

Structuration des correspondancesRègles de mapping valuéesContraintes

Page 16: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 16

Démarche adoptée

Calcul de distances sémantiquesCaractérisation de l’espace de conception fondée sur la notion de contextes d’activité

Calcul d’un vecteur sémantique contextuel pour chaque domaine

« Types d’activités »Méta-donnéesProduction documentaire

Appariement « offline » des RSIndique une distance contextuelle entre deux RSCalcul réalisé a priori

Appariement « online » spécifique à l’utilisateurNorme d’un vecteur comprenant les vecteurs sémantiques précédents et des informations spécifiques à l’utilisateurCalculé dynamiquement

Page 17: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 17

Application

Présentation de l’équipeAspects « multi-ontologies »Application

Contexte opérationnelRésultats obtenus

Conclusion et perspectives

Page 18: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 18

Contexte opérationnel

Projet FUNSIEC, suite du projet européen e-Cognos :

Étude de faisabilité portant sur l’élaboration ainsi que de la maintenance d’une infrastructure sémantique ouverte pour le secteur européen de construction

Domaine d’application : secteur européen du bâtiment et de la constructionPorteur du projet : CSTBBut : un « Serveur d’ontologies » (e-Coser) reçoit des requêtes sur des concepts et doit les apparier

Page 19: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 19

Contexte opérationnel

Les RSOntologie e-Cognos

Vocabulaire de termes,Super-ontologie des RS du domaineLangage d’origine DAML, mais utilisation de l’espace de noms RDFS

Graphe bcXMLVocabulaires multilingues de construction dédiés au e-BusinessPropose un « méta-schéma » permettant de définir une taxonomie : XTD (eXtensible Taxonomy Definition)Format des données : XML

Taxonomie EdibatecCatalogue électronique pour la constructionFormat des données : fichiers de données séparés ou XLS

Page 20: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 20

Résultats obtenus

Requêtes d’appariement de concept sourceRéponse : liste ordonnée de concepts pertinents

Requêtes d’actualisation des règles de correspondancesRéponses : actualisation faite ou erreur.

Requêtes de conversion d’une ontologie source –Réponses : conversion faite ou erreur.

Architecture d’intégration syntaxique et sémantique des ressources hétérogènesTrois types de requêtes

Conversion Mise à jourAppariement

Éléments pris en chargeRessources

Ontologies converties en OWLOntologie d’articulation

ModulesConversionLiaisonGestion de l’ontologie de

correspondance

Page 21: Interopérabilité des ressources sémantiques pour la ... · Présentation de l’équipe ... zTaxonomie Edibatec zCatalogue électronique pour la construction zFormat des données

Séminaire Ontologies Multiples – 9 septembre 2004 21

Conclusion et perspectives

Présentation de l’équipeAspects « multi-ontologies »ApplicationConclusion et perspectives