36
Laboratoire de Recherche Opérationnelle, de DEcision et de Contrôle de processus ISG Tunisie Evaluation d’associations sémantiques dans une ontologie de domaine Thabet Slimani Boutheina Ben Yaghlane Khaled Mellouli IC2009 Conférence d'Ingénierie des connaissances: 25- 29 mai 2009, Hammamet, Tunisie

Evaluation d'associations sémantiques dans une ontologie de domaine

Embed Size (px)

DESCRIPTION

Présentation de Thabet Slimani, Boutheina Ben Yaghlane et Khaled Mellouli à IC 2009.

Citation preview

Page 1: Evaluation d'associations sémantiques dans une ontologie de domaine

Laboratoire de Recherche Opérationnelle, de DEcision et de Contrôle de processus

ISG Tunisie

Evaluation d’associations sémantiques dans une ontologie de domaine

Thabet Slimani

Boutheina Ben Yaghlane

Khaled Mellouli

IC2009 Conférence d'Ingénierie des connaissances: 25- 29 mai 2009, Hammamet, Tunisie

Page 2: Evaluation d'associations sémantiques dans une ontologie de domaine

Plan

� Introduction

� Travaux liés

� Lien sémantique / Association sémantique

� Degré d’un lien sémantique / d’une association sémantique

� Exemple d’évaluation d’associations sémantiques

� Résultats expérimentaux

� Conclusion

Page 3: Evaluation d'associations sémantiques dans une ontologie de domaine

Introduction (1)

Page 4: Evaluation d'associations sémantiques dans une ontologie de domaine

Introduction (2)

Concepts

Entités

Evénements

Association sémantique

Des liens complexes significatifs et appropriés entre des entités, des événements et des concepts

Associations sémantiques

Extraction d’un chemin entre deux entités reliées indirectement par des relations (propriétés) contenues dans un graphe RDF.

Extraction Associations sémantiques

Mesurer les relations entre concepts basés sur différents types de liens sémantiques dans une ontologie

Comment ?

Page 5: Evaluation d'associations sémantiques dans une ontologie de domaine

Domaines d’application

Recherche d’information

Recherche documentaire

Recherche des services web

Page 6: Evaluation d'associations sémantiques dans une ontologie de domaine

Objectifs

Fonctions sémantiques et

statistiques

Lien sémantique Association sémantique

Page 7: Evaluation d'associations sémantiques dans une ontologie de domaine

Objectifs

Requête DocumentDegré de pertinence

ConceptS ConceptDDegré d’association

ConceptS ConceptD

Degré d’association

L1 and L2

ConceptIL1 L2

Page 8: Evaluation d'associations sémantiques dans une ontologie de domaine

Approches intéressées par les relations entre les

mots/concepts

Travaux liés (1)

Approches orientées structures (structure-

driven)

Watabe &

Kawaoka,

2001

Approches orientées données

(data-driven)

Cao et al.

20058

Page 9: Evaluation d'associations sémantiques dans une ontologie de domaine

Travaux liés (2)

Notre approche dérive des approches statistiques basées sur un modèle de langage statistique

Song & Croft (1999) →→→→ la pertinence d’un document

avec une requête est évaluée par la probabilité

d’association d’un document vis-à-vis d’une requête

bien déterminée.

Tian et al (2007) →→→→ une approche qui mesure les

relations sémantiques dans une ontologie.

9

Page 10: Evaluation d'associations sémantiques dans une ontologie de domaine

Lien et association sémantique

Se rapporte à une relation directe entre deux entitésLien

sémantique

Se rapporte à un chemin connectant deux entités d’une manière indirecte

Association sémantique

10

Page 11: Evaluation d'associations sémantiques dans une ontologie de domaine

Student

Professor

Degree_from

University

Offers

Course

Related_to

Project

Author_ofPublication

Author_of

P0 Degree_from U0 Offers C0 Related_to Pr0

St0Author_ofPu0

Author_of

Lien et association sémantique

11

Page 12: Evaluation d'associations sémantiques dans une ontologie de domaine

Signature d’un lien sémantique

La signature d’un lien sémantique entre deux entités est définie par les paires de concept/classe source et concept/classe cible.

Professor University

(Professor , University )

P0 Degree_from U0 Offers C0 Related_to Pr0

St0Author_ofPu0

Author_of

Signature du LS Degree_From

12

Page 13: Evaluation d'associations sémantiques dans une ontologie de domaine

Types d’un lien sémantique

Si A est défini comme une

"SuperClassof" de B, alors B est

contenu dans A

Lien hiérarchique

(LH)

B ⊂⊂⊂⊂ A

Si A est défini comme une

"EquivalentClassof" de B, alors A

est équivalent à B.

Lien d’équivalence

(LE)

A ≡≡≡≡ B

Si A est défini comme ‘’PropertyOf"

de B ou B est défini comme

"PropertyOf" de A, on dit que A et B

possèdent une AS directe

Lien d’association

(LS)

A ∝∝∝∝ B

13

Page 14: Evaluation d'associations sémantiques dans une ontologie de domaine

Degré d’un lien sémantique

S’il y a un lien sémantique entre deux concepts A et B, le

degré d’un lien sémantique DLS est défini comme le poids

qui mesure le lien entre A et B.

14

Page 15: Evaluation d'associations sémantiques dans une ontologie de domaine

Exemples des LS extraits à

partir de l’ontologie MeSH

LS Exemple dérivé de MeSH

Représentationgraphique

A ∝ B L= Formalin Test ∝ {Pain,

Intractable}

SL

B ⊂ A Pain ⊂ Headache SubClassOf

A ≡ B Pain ≡ Postoperative

A B

A B

B A

15

Page 16: Evaluation d'associations sémantiques dans une ontologie de domaine

Signature d’une association sémantique (1/3)

( , )

P0 Degree_from U0 Offers C0 Related_to Pr0

St0Author_ofPu0

Author_of

SPAS

Signature des propriétés d’une association sémantique

(SPAS) définie par les propriétés contenues dans le chemin

d’une association sémantique.

Degree_from Offers Related_to

, 16Degree_from Offers Related_to

Page 17: Evaluation d'associations sémantiques dans une ontologie de domaine

Signature d’une association sémantique (2/3)

( , )

P0 Degree_from U0 Offers C0 Related_to Pr0

St0Author_ofPu0

Author_of

SIAS

Signature d’instances d’une association sémantique (SIAS)

définie par les instances contenues dans un lien

sémantique.

U0

C017

U0

Page 18: Evaluation d'associations sémantiques dans une ontologie de domaine

Signature d’une association sémantique (3/3)

( , )

P0 Degree_from U0 Offers C0 Related_to Pr0

St0Author_ofPu0

Author_of

SCAS

Signature de classes d’une association sémantique (SCAS)

définie par les classes des entités intermédiaires dans une

AS.

CourseUniversity

18University Course

Page 19: Evaluation d'associations sémantiques dans une ontologie de domaine

Degré d’une association

sémantique (DAS)Cas 1: A ≡≡≡≡ B ou B ≡≡≡≡ A

DAS(A, B)=1

Cas 2: A ⊂⊂⊂⊂ B ou A ∝∝∝∝ B

DAS(A, B)=DLSA(B,l)

Cas 3: A et B possèdent une AS

19

Page 20: Evaluation d'associations sémantiques dans une ontologie de domaine

A

L5

B

D

L4

L3

C EL2

A B C D E

A 1 0 0 DLSA(D,L5) 0

B DLSB(A,L4) 1 0 DLSB(A,L4)DLSA(D,L5)Log(4)

0

C DLSC(A,L3) 0 1 DLSC(A,L3)DLSA(D,L5)Log(4)

0

D 0 0 0 1 0

E DLSE(C,L2)DLSC(A,L3)Log(4)

0 DLSE(C,L2) 1DLSE(C,L2)DLSC(A,L3)DLSA(D,L5)Log(9)

Degré d’une association

sémantique (DAS)

20

Page 21: Evaluation d'associations sémantiques dans une ontologie de domaine

DAS-PE est le degré maximum des propriétés entrantes qui relient une entité destination d’une association par un lien l déjà connu

RE1 ResearchArea….

RE1 ?

Has-Subject-Area

Exemple d’évaluation

d’association sémantique

21

Page 22: Evaluation d'associations sémantiques dans une ontologie de domaine

RE1

P0 R01

P03

P04

P02 R02

DAS-PE=0.25

DAS-PE=0.75

RE1 Expert-in R01

Exemple d’évaluation

d’association sémantique

22

Page 23: Evaluation d'associations sémantiques dans une ontologie de domaine

Dragon Toolkit: paquet de développement Java utile pour

l’utilisation académique dans l’extraction sémantique

Expansion des requêtes: l’ontologie MeSH et l’ensemble

des données CFC (CFC data)

Nom du concept Pain

Type des liens Related-To Intractable

Subclass-Of Headache

SynonymOf Postoperative

Résultats expérimentaux

23

Page 24: Evaluation d'associations sémantiques dans une ontologie de domaine

Documents appropriés

Précision (30)

MAP (30)

Intuition 22 81.32% 85.12%

DAS 29 91.34% 93.48%

DLS 27 95.33% 97.24%

Résultats expérimentaux

24

Page 25: Evaluation d'associations sémantiques dans une ontologie de domaine

25

DLS: permet de mesurer les liens sémantiques directsentre des entités contenues dans une base de connaissance

DAS: permet d’évaluer le degré d’une associationsémantique entre deux entités qui sont liées d’une manièreindirecte.

Les mesures proposées pour l’évaluation des liens et desassociations sémantiques ont été appliquées sur uneontologie de domaine et du corpus sous format des résumés.

Les résultats obtenus montrent une améliorationremarquable au niveau de la précision dans le domaine del’extraction des documents approprié.

Conclusion

Page 26: Evaluation d'associations sémantiques dans une ontologie de domaine

26

Un travail conséquent reste à faire d’une part en amont surl’analyse théorique de ces mesures, et d’autre part sur leurimplémentation à grande échelle.

Perspective

Page 27: Evaluation d'associations sémantiques dans une ontologie de domaine

Merci pour votre attention

27

Page 28: Evaluation d'associations sémantiques dans une ontologie de domaine

Résultats expérimentaux (2)

La valeur a été fixée à 0.5

MAP (Mean Average Precision): Outil d’évaluationtraditionnel qui est adopté dans le domaine de la recherchedocumentaire

MAP (n): est employée dans notre travail pour évaluer ndocuments recherchés

précision (n): bien connue pour l’examen de la qualité desdocuments appropriés.

PM (Average Precision): tient en compte la moyenne des scores de précision des documents appropriés parmi top-k documents recherchés par une requête simple..

28

Page 29: Evaluation d'associations sémantiques dans une ontologie de domaine

Résultats expérimentaux (3)

PMi(k): désigne la précision moyenne d’une requête i

ni: désigne le nombre des documents appropriés del’ième requête

k: désigne le nombre de documents extraits

Rij: est le rang du jème document approprié de l’ièmerequête

29

Page 30: Evaluation d'associations sémantiques dans une ontologie de domaine

Résultats expérimentaux (4)

MAP(k): permet de calculer le rang des k-premiersdocuments recherchés avec une précision (n)

qn: désigne le nombre des requêtes exécutées

30

Page 31: Evaluation d'associations sémantiques dans une ontologie de domaine

Estimation des expressions de DLS

Estimer PAi (Bj , l), P(B) et P(l|B) avec MLE method

Estimation de PAi (Bj , l)

T: l’ensemble de termes dérivés du corpus basé sur

l’ontologie de domaine et t le terme ayant un lien l avec Ai

et/ou Bj.

PAi (Bj , l) désigne la probabilité d’apparition du terme Ai et Bj avec le lien l.

Si l est un lien sémantique (LS), il faut imposer uneportion de texte qui ne dépasse pas une certaine limite (TL :Limite du texte en nombre de mots) et dans laquelle nouspouvons calculer les co-occurrences de Ai et Bj.

31

Page 32: Evaluation d'associations sémantiques dans une ontologie de domaine

Estimation de PAi (Bj , l)

(3)

Si l est un lien hiérarchique (LH), nous définissons lemodèle de co-occurrence TLS comme caractéristiquelexique-syntaxique du lien sémantique se produisant dans letexte TL.

(4)

TL et TLS peuvent être différents lorsque les ontologies varient d’un domaine à un autre.

32

Page 33: Evaluation d'associations sémantiques dans une ontologie de domaine

Estimation de P(B) (1)

Structure de l’ontologie

5

|lB|: le nombre des liens du terme B

c: Désigne un concept dans l’ontologie de domaine

|lc| : désigne le nombre des liens du concept c.

33

Page 34: Evaluation d'associations sémantiques dans une ontologie de domaine

Estimation de P(B) (2)

fq(c): désigne la fréquence de l’apparition des instances du concept c dans le corpus C correspondant à l’ontologie de domaine,

6

fqB :désigne la fréquence de l’apparition du terme B dans le corpus C

34

Page 35: Evaluation d'associations sémantiques dans une ontologie de domaine

Estimation de P(B) (3)

7

: est un coefficient permettant de combiner la structurede l’ontologie avec le corpus. Ce coefficient est adopté pouroptimiser la performance de recherche de l’information.

Ce modèle mixte devient Pot(B) si =0 et Pst(B) si =1.

Nous avons attribué une valeur constante, par intuition,comme valeur pour .

35

Page 36: Evaluation d'associations sémantiques dans une ontologie de domaine

Estimation de P(l|B)

8

|lB|r désigne le nombre des liens des relations l avec B

|lB| désigne le nombre des tous les liens ayant des relations avec le concept B.

36