Upload
conference-ic-2009
View
3.143
Download
1
Embed Size (px)
DESCRIPTION
Présentation de Thabet Slimani, Boutheina Ben Yaghlane et Khaled Mellouli à IC 2009.
Citation preview
Laboratoire de Recherche Opérationnelle, de DEcision et de Contrôle de processus
ISG Tunisie
Evaluation d’associations sémantiques dans une ontologie de domaine
Thabet Slimani
Boutheina Ben Yaghlane
Khaled Mellouli
IC2009 Conférence d'Ingénierie des connaissances: 25- 29 mai 2009, Hammamet, Tunisie
Plan
� Introduction
� Travaux liés
� Lien sémantique / Association sémantique
� Degré d’un lien sémantique / d’une association sémantique
� Exemple d’évaluation d’associations sémantiques
� Résultats expérimentaux
� Conclusion
Introduction (1)
Introduction (2)
Concepts
Entités
Evénements
Association sémantique
Des liens complexes significatifs et appropriés entre des entités, des événements et des concepts
Associations sémantiques
Extraction d’un chemin entre deux entités reliées indirectement par des relations (propriétés) contenues dans un graphe RDF.
Extraction Associations sémantiques
Mesurer les relations entre concepts basés sur différents types de liens sémantiques dans une ontologie
Comment ?
Domaines d’application
Recherche d’information
Recherche documentaire
Recherche des services web
Objectifs
Fonctions sémantiques et
statistiques
Lien sémantique Association sémantique
Objectifs
Requête DocumentDegré de pertinence
ConceptS ConceptDDegré d’association
ConceptS ConceptD
Degré d’association
L1 and L2
ConceptIL1 L2
Approches intéressées par les relations entre les
mots/concepts
Travaux liés (1)
Approches orientées structures (structure-
driven)
Watabe &
Kawaoka,
2001
Approches orientées données
(data-driven)
Cao et al.
20058
Travaux liés (2)
Notre approche dérive des approches statistiques basées sur un modèle de langage statistique
Song & Croft (1999) →→→→ la pertinence d’un document
avec une requête est évaluée par la probabilité
d’association d’un document vis-à-vis d’une requête
bien déterminée.
Tian et al (2007) →→→→ une approche qui mesure les
relations sémantiques dans une ontologie.
9
Lien et association sémantique
Se rapporte à une relation directe entre deux entitésLien
sémantique
Se rapporte à un chemin connectant deux entités d’une manière indirecte
Association sémantique
10
Student
Professor
Degree_from
University
Offers
Course
Related_to
Project
Author_ofPublication
Author_of
P0 Degree_from U0 Offers C0 Related_to Pr0
St0Author_ofPu0
Author_of
Lien et association sémantique
11
Signature d’un lien sémantique
La signature d’un lien sémantique entre deux entités est définie par les paires de concept/classe source et concept/classe cible.
Professor University
(Professor , University )
P0 Degree_from U0 Offers C0 Related_to Pr0
St0Author_ofPu0
Author_of
Signature du LS Degree_From
12
Types d’un lien sémantique
Si A est défini comme une
"SuperClassof" de B, alors B est
contenu dans A
Lien hiérarchique
(LH)
B ⊂⊂⊂⊂ A
Si A est défini comme une
"EquivalentClassof" de B, alors A
est équivalent à B.
Lien d’équivalence
(LE)
A ≡≡≡≡ B
Si A est défini comme ‘’PropertyOf"
de B ou B est défini comme
"PropertyOf" de A, on dit que A et B
possèdent une AS directe
Lien d’association
(LS)
A ∝∝∝∝ B
13
Degré d’un lien sémantique
S’il y a un lien sémantique entre deux concepts A et B, le
degré d’un lien sémantique DLS est défini comme le poids
qui mesure le lien entre A et B.
14
Exemples des LS extraits à
partir de l’ontologie MeSH
LS Exemple dérivé de MeSH
Représentationgraphique
A ∝ B L= Formalin Test ∝ {Pain,
Intractable}
SL
B ⊂ A Pain ⊂ Headache SubClassOf
A ≡ B Pain ≡ Postoperative
A B
A B
B A
15
Signature d’une association sémantique (1/3)
( , )
P0 Degree_from U0 Offers C0 Related_to Pr0
St0Author_ofPu0
Author_of
SPAS
Signature des propriétés d’une association sémantique
(SPAS) définie par les propriétés contenues dans le chemin
d’une association sémantique.
Degree_from Offers Related_to
, 16Degree_from Offers Related_to
Signature d’une association sémantique (2/3)
( , )
P0 Degree_from U0 Offers C0 Related_to Pr0
St0Author_ofPu0
Author_of
SIAS
Signature d’instances d’une association sémantique (SIAS)
définie par les instances contenues dans un lien
sémantique.
U0
C017
U0
Signature d’une association sémantique (3/3)
( , )
P0 Degree_from U0 Offers C0 Related_to Pr0
St0Author_ofPu0
Author_of
SCAS
Signature de classes d’une association sémantique (SCAS)
définie par les classes des entités intermédiaires dans une
AS.
CourseUniversity
18University Course
Degré d’une association
sémantique (DAS)Cas 1: A ≡≡≡≡ B ou B ≡≡≡≡ A
DAS(A, B)=1
Cas 2: A ⊂⊂⊂⊂ B ou A ∝∝∝∝ B
DAS(A, B)=DLSA(B,l)
Cas 3: A et B possèdent une AS
19
A
L5
B
D
L4
L3
C EL2
A B C D E
A 1 0 0 DLSA(D,L5) 0
B DLSB(A,L4) 1 0 DLSB(A,L4)DLSA(D,L5)Log(4)
0
C DLSC(A,L3) 0 1 DLSC(A,L3)DLSA(D,L5)Log(4)
0
D 0 0 0 1 0
E DLSE(C,L2)DLSC(A,L3)Log(4)
0 DLSE(C,L2) 1DLSE(C,L2)DLSC(A,L3)DLSA(D,L5)Log(9)
Degré d’une association
sémantique (DAS)
20
DAS-PE est le degré maximum des propriétés entrantes qui relient une entité destination d’une association par un lien l déjà connu
RE1 ResearchArea….
RE1 ?
Has-Subject-Area
Exemple d’évaluation
d’association sémantique
21
RE1
P0 R01
P03
P04
P02 R02
DAS-PE=0.25
DAS-PE=0.75
RE1 Expert-in R01
Exemple d’évaluation
d’association sémantique
22
Dragon Toolkit: paquet de développement Java utile pour
l’utilisation académique dans l’extraction sémantique
Expansion des requêtes: l’ontologie MeSH et l’ensemble
des données CFC (CFC data)
Nom du concept Pain
Type des liens Related-To Intractable
Subclass-Of Headache
SynonymOf Postoperative
Résultats expérimentaux
23
Documents appropriés
Précision (30)
MAP (30)
Intuition 22 81.32% 85.12%
DAS 29 91.34% 93.48%
DLS 27 95.33% 97.24%
Résultats expérimentaux
24
25
DLS: permet de mesurer les liens sémantiques directsentre des entités contenues dans une base de connaissance
DAS: permet d’évaluer le degré d’une associationsémantique entre deux entités qui sont liées d’une manièreindirecte.
Les mesures proposées pour l’évaluation des liens et desassociations sémantiques ont été appliquées sur uneontologie de domaine et du corpus sous format des résumés.
Les résultats obtenus montrent une améliorationremarquable au niveau de la précision dans le domaine del’extraction des documents approprié.
Conclusion
26
Un travail conséquent reste à faire d’une part en amont surl’analyse théorique de ces mesures, et d’autre part sur leurimplémentation à grande échelle.
Perspective
Merci pour votre attention
27
Résultats expérimentaux (2)
La valeur a été fixée à 0.5
MAP (Mean Average Precision): Outil d’évaluationtraditionnel qui est adopté dans le domaine de la recherchedocumentaire
MAP (n): est employée dans notre travail pour évaluer ndocuments recherchés
précision (n): bien connue pour l’examen de la qualité desdocuments appropriés.
PM (Average Precision): tient en compte la moyenne des scores de précision des documents appropriés parmi top-k documents recherchés par une requête simple..
28
Résultats expérimentaux (3)
PMi(k): désigne la précision moyenne d’une requête i
ni: désigne le nombre des documents appropriés del’ième requête
k: désigne le nombre de documents extraits
Rij: est le rang du jème document approprié de l’ièmerequête
29
Résultats expérimentaux (4)
MAP(k): permet de calculer le rang des k-premiersdocuments recherchés avec une précision (n)
qn: désigne le nombre des requêtes exécutées
30
Estimation des expressions de DLS
Estimer PAi (Bj , l), P(B) et P(l|B) avec MLE method
Estimation de PAi (Bj , l)
T: l’ensemble de termes dérivés du corpus basé sur
l’ontologie de domaine et t le terme ayant un lien l avec Ai
et/ou Bj.
PAi (Bj , l) désigne la probabilité d’apparition du terme Ai et Bj avec le lien l.
Si l est un lien sémantique (LS), il faut imposer uneportion de texte qui ne dépasse pas une certaine limite (TL :Limite du texte en nombre de mots) et dans laquelle nouspouvons calculer les co-occurrences de Ai et Bj.
31
Estimation de PAi (Bj , l)
(3)
Si l est un lien hiérarchique (LH), nous définissons lemodèle de co-occurrence TLS comme caractéristiquelexique-syntaxique du lien sémantique se produisant dans letexte TL.
(4)
TL et TLS peuvent être différents lorsque les ontologies varient d’un domaine à un autre.
32
Estimation de P(B) (1)
Structure de l’ontologie
5
|lB|: le nombre des liens du terme B
c: Désigne un concept dans l’ontologie de domaine
|lc| : désigne le nombre des liens du concept c.
33
Estimation de P(B) (2)
fq(c): désigne la fréquence de l’apparition des instances du concept c dans le corpus C correspondant à l’ontologie de domaine,
6
fqB :désigne la fréquence de l’apparition du terme B dans le corpus C
34
Estimation de P(B) (3)
7
: est un coefficient permettant de combiner la structurede l’ontologie avec le corpus. Ce coefficient est adopté pouroptimiser la performance de recherche de l’information.
Ce modèle mixte devient Pot(B) si =0 et Pst(B) si =1.
Nous avons attribué une valeur constante, par intuition,comme valeur pour .
35
Estimation de P(l|B)
8
|lB|r désigne le nombre des liens des relations l avec B
|lB| désigne le nombre des tous les liens ayant des relations avec le concept B.
36