22
Linguistique et Alignement d’ontologies TP3 du cours IFT6010 Jean François DJOUFAK KENGUE

Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

Linguistique et Alignement d’ontologies

TP3 du cours IFT6010

Jean François DJOUFAK KENGUE

Page 2: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 2

PLAN

1. Le Web Sémantique2. Les ontologies3. Quelques problématiques liées aux ontologies4. L’alignement des ontologies5. Que peux apporter l’alignement d’ontologies

en linguistique ?

Page 3: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 3

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

Le Web aujourd'hui

Plus de 109 pagesContenu destiné à être lu par les ordinateurs.Contenu non compréhensible pour les ordinateurs.Aucun sens n’est associé aux liens hypertexte.Métadonnées peu ou mal utilisées.Beaucoup de redondances, peu organisé.Difficile à analyser automatiquement (par des programmes).Moteurs de recherche ultra sophistiqués mais imparfaits...

Nécessité de liens et de métadonnées structurées, sûres et significatives.

Page 4: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 4

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

Le Web de demain [B-Lee et al et al 2001]

Tim Berners-Lee

Beaucoup plus de pages.Contenu structuré, commenté et compréhensibles par les ordinateurs.Facilité de partage et d’accès (les agents).Répertoire de connaissance.Capable de raisonner.Utilisé pour générer de nouvelles connaissances.

Donner de la sémantique au web : Web Sémantique

James A. Hendler

Ora Lassila

Page 5: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 5

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

Exemple illustratif

Maman

Agent du Médecin

Agent de Lucy

Traitementrequis

Agent de PeteOrganisationd’emploi du temps

Compagnie d’ass.

Sites de cliniques

Coûts

plan?proximité?Spécialiste?

Prise de RDV

Illustration de l’exemple introductif de [B-Lee et al

2001], tirée de la présentation de Stephen

Decker intitulée « The Semantic Web ».

Page 6: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 6

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

L’architecture

Fiabilité

Preuve des résultats

Règles et requêtes

Structure

Sens et Contraintes

Description formelle

Ressource

Tim Berners-Leehttp://www.w3.org/2000/Talks/1206-xml2k-tbl/Overview.html

Page 7: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 7

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

Définition

Philosophiethéorie à propos de la nature de l'existence, des types de choses qui existent.

Intelligence ArtificielleFormalisation d’une conceptualisation. [Grub 1993]

Pratiquement: Organisation hiérarchique de la connaissance sur un ensemble d'objets par leur regroupement en sous-catégories suivant leurs caractéristiques essentielles.

Socrate

Page 8: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 8

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

Pour quoi faire?

Standardisation du sens (lever les ambigüité) de chacun des termes employés dans un domaine de connaissance.

Terme: mot de la langue naturelle qui désigne un concept.

Description des relations existantes entres les concepts représentés par les termes.

Relations ={est une sorte de, est une propriété de, est une instance de}

Compréhension entre personnes et logiciels.

Page 9: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 9

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

Exemple d’ontologie

Merci à Marc Ehrig (Karlsruhe) pour l’exemple

Page 10: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 10

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

Conception

Humaine (consortiums d’experts)Supervisée

1. Identifier un domaine de connaissance.2. Identifier un corpus.3. Analyser le corpus.4. Recenser les termes du vocabulaire et normaliser leur

sens5. Identifier concepts, instances, propriétés et les relations

qui existent entre eux.6. Construire la hiérarchie représentant l’ontologie.7. Opérationnaliser dans un langage formel (OWL, KIF).

Tiré de la présentation de Olivier Corby (INRIA, Sophia Antipolis) intitulée « Ontologies »

Page 11: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 11

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

L’hétérogénéité Syntaxique[Bouquet et al 2004, Euzénat et al 2004,]

Format de représentation (des langages différents sont utilisés pour représenter la même ontologie)

Solution : Mettre sur pied des fonctions de traduction.

Mise en œuvre:-Parseurs+Mapping

-Compilateurs

Page 12: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 12

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

L’hétérogénéité terminologique[Bouquet et al 2004, Euzénat et al 2004]

Synonymie (des mots différents désignent le même concept)Polysémie (le même mot désigne plusieurs concepts)Langage (Français, Anglais, Italien…)Variations syntaxiques (abréviations, préfixes, suffixes …)

Solution: Établir des correspondance (calcul de similarité!) entre termes.Mise en œuvre:-Comparaison de chaines (égalité, distance de Hamming …)

-Comparaison de sous-chaines (test de sous-chaine, distance de n-gram, …)

-Distance d’édition

-Techniques NLP (morphologie, syntaxe, traduction, sémantique, morphosyntaxe, …)

Page 13: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 13

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

L’hétérogénéité conceptuelle[Bouquet et al 2004, Euzénat et al 2004]

Couverture

monde mondemondeGranularité Perspective

Solution : Établir des correspondances (calcul de similarité!) de modèle.Mise en œuvre:-Comparaison des concepts ( type de donnée des attributs, domaine de valeur, multiplicité, instances)

-Comparaison des hiérarchies de concepts (taxonomie, méréologie, relations entre concepts, instances de concepts)

Page 14: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 14

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

L’hétérogénéité sémiotique[Bouquet et al 2004, Euzénat et al 2004]

Sens donné à l’ontologie : (des individus/Communautés peuvent interpréter une même ontologie de différentes manières dans différents contexte).

Solution : Établir des correspondances (calcul de similarité!) de sens entre modèles.

Mise en œuvre :-Satisfiabilité de propositions [Guinchiglia et Shvaiko 2004]

-Logiques de description

Page 15: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 15

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

En quoi ça consiste?Déterminer, par un processus global, les correspondances (similarité!) entre deux ontologies en utilisant ou en mettant en œuvre des solutions aux différents problèmes d’hétérogénéité.

Merci à Marc Ehrig (Karlsruhe) pour l’exemple

Page 16: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 16

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

Une première approche[Melnik et al 2002, Euzénat et Valtchev 2004]

Graphe, similarité et équation du point fixeConstruire un graphe représentant les ontologies.Calcul itératif de la similarité de chaque nœud du graphe en utilisant les similarités des nœuds adjacents.Arrêter lorsque les similarités des nœuds se stabilisent.Utiliser une valeur seuil pour déduire l’alignement.

))'('),((

))'('),((

))'('),((

))'(),(()',(

cAcAMSim

cScSMSim

cIcΙMSim

cccc

PCA

CCS

OCI

LCLC

π

π

π

λλσπσ

+

+

+

= [Euzénat et Valtchev 2004]

1=+++ CA

CS

CI

CL ππππ

Page 17: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 17

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

Une deuxième approche[Doan et al 2004]

Apprentissage d’une distribution probabiliste et similarité

Apprendre les classes des ontologies par une distribution statistique des instances.Évaluer la probabilité d’appartenance des instances de chaque ontologie à des couples de classes des ontologies à alignerUtiliser le probabilités calculées pour évaluer la similarité entre les concepts des ontologies

)',()',()',()',()',(

ccPccPccPccPccC ++

=σ (de la similaritéde Jaccard)

Page 18: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 18

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

Utilité

Fusion d’ontologies : Création d’une nouvelle ontologie à partir d’ontologies existantes.Mapping d’ontologies : Expression formelle des relations sémantiques entre ontologies.Réconciliation d’ontologies : Harmonisation des contenus d’otologies.Négociation de sens : Protocole par lequel des agents (humains ou logiciels) s’accordent sur les changement nécessaires pour réconcilier leurs ontologies.Coordination d’ontologies : Utilisation de la connaissance en provenance de plusieurs ontologies pour réaliser une tâche donnée.

Page 19: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 19

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

Notre visionFaciliter la construction d’une(des) ontologie(s) modélisant la(les) langue(s) à partir de l’alignement d’ontologies existantes.

La traduction se ferait par un ensemble de règles et de calculs résultant de l’alignement des différents aspects des langues source et cible (Plus proche de la réalité!).

Le tagging consisterait à aligner une phrase à l’un des concepts syntaxiques de l’ontologie correspondante (relativement plus aisé!)

Interconnexion des lexiques (Ex : WordNet et EuroNet)

Et plus encore … Le futur passe par les ontologies!

Page 20: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 20

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

Références

[B-Lee et al 2001] T. Berners-Lee, J. Hendler and O. Lassila. The semanticweb. Scientific American, 2001.

[Grub 1993] T. Gruber. A Translation Approach to Portable OntologySpecifications. Knowledge Acquisition, 5(2):199-220, 1993.

[Bouquet et al 2004] P. Bouquet, J. Euzénat, E. Franconi, L. Serafini, G. Stamou and S. TEssaris. D2.2.1: Specification of a common frameworkcharacterizing alignment. http://www.aifb.uni-karlsruhe.de/WBS/phi/pub/kweb-221.pdf

[Euzénat et al 2004] J. Euzénat, T. Le Bach, J. Barrasa, P. Bouquet, J. De Bo, R. Dieng, M. Ehrig, M. Hauswirth, M. Jarrar, R. Lara, D. Maynard, A. Napoli, G. Stamou, H. Stuckenschmidt, P. Shvaiko, S. Tessaris, S. Van Acker and I. Zaihrayeu. D.2.2.3: State of the art on ontology alignment. http://www.starlab.vub.ac.be/research/ projects/knowledgeweb/kweb-223.pdf

Page 21: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 21

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

Références

[Guinchiglia et Shvaiko 2004] F. Guinchiglia and P. Shvaiko. Semanticmatching. The Knowledge Engineering Review, 18(3):265-280, 2004.

[Melnik et al 2002] S. Melnik, H. Garcia-Molina and E. Rahm. Similarityflooding : a versatile graph matching algorithm. In Proc. 18th International Conference on Data Engineering(ICDE), San Jose (CA US), 2002.

[Euzénat et Valtchev 2004] J. Euzénat and P. Valtchev. Similarity-basedontology alignment in OWL-lite. In Proc. 15th ECAI, Valencia (ES), 2004.

[Doan et al 2004] A.-H. Doan, J. Madhavan, P. Domingos and A. Halevy. Ontology matching : a machine learning approach. In Steffen Staaband Rudi Studer, editors, Handbook of ontologies, International handbookon informations systems, chapter 18, pages 385-404. Springer Verlag, Berlin (DE), 2004.

Page 22: Linguistique et Ontologie - Université de Montréalfelipe/IFT6010-Automne2005/Devoirs/... · 2005. 12. 8. · Ontology matching : a machine learning approach. In Steffen Staab and

djoufakj @ GEODES TP3, IFT6010 22

1. Le Web Sémantique2. Les Ontologies3. Quelques problématiques liées aux ontologies

4. L’alignement d’ontologies5. Que peux apporter l’alignement d’ontologies en linguistique ?

FIN !

Merci pour votre attention!

Question ?