Upload
milton
View
30
Download
0
Embed Size (px)
DESCRIPTION
Université Mouloud Mammeri de Tizi-Ouzou R 2 I 12-14 Juin 2011 . Modèle de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens. Mme Farida Achemoukh - Adouane Mr Rachid Ahmed-Ouamer Laboratoire LARI Université Mouloud Mammeri de Tizi-Ouzou. - PowerPoint PPT Presentation
Citation preview
Modèle de Recherche d’InformationPersonnalisée Basé sur les Réseaux
Bayésiens
Université Mouloud Mammeri de Tizi-Ouzou R2I 12-14 Juin 2011
Mme Farida Achemoukh - AdouaneMr Rachid Ahmed-Ouamer
Laboratoire LARI Université Mouloud Mammeri de Tizi-Ouzou
R2I 12-14 juin 2011 2
Plan de la présentation Introduction
Problématique
Accès Personnalisé à l’ Information
Contribution
Conclusion & perspectives
R2I 12-14 juin 2011
Introduction
12/06/2011 3
Doc 1
Collectiondocument
s
Q=‘virus’
Doc N
Q=‘virus’
SRI
La vocation d’un système de recherche d’information est de fournir à l’utilisateur des informations utiles
Doc 1Doc N
Virus biologiqu
eVirus
informatique
Requête C’est l’expression
d’un besoin en information
R2I 12-14 juin 2011 4
Introduction
12/06/2011
12/06/2011jz
Collectiondocument
s
Q=‘virus’
SRI
Le système tiens compte de la requête utilisateur et des informations qui le décrivent
Doc 1Doc M
Virus informatiq
ue
Profil utilisateur Domaine d’intérêt :
informatique
Personnalisation de l’information
Profil utilisateurinformations décrivant
ses centres d’intérêts et ses préférences
R2I 12-14 juin 2011 5
Problématique
Comment modélisation l'utilisateur ?
Comment inclure l’utilisateur dans le processus d'accès à l'information ?
12/06/2011
R2I 12-14 juin 2011 6
Accès Personnalisé à l’ Information
12/06/2011
Modèlisation de l’utilisateur
Representation du Profil Vectorielle (Gowan 2003) Hiérarchique (Micarelli et al.2004) Multidimensionnlle (Kostadinov 2003)
Construction du Profil Explicite (Kraft et al.2005) Implicite (Gauch et al.2003)
R2I 12-14 juin 2011 712/06/2011
Accès Personnalisé à l’ Information
Exploitation du Profil Utilisateur dans le processus de recherche Reformulation de la requête(Sieg et al. 2004), (Koutrika et al.2005) augmentation de la requête par des termes issus du profil utilisateur Appariement Requête- Documents (Haveliwala et al.2002), (Zemirli et al. 2008) compte tenu de la requête et du profil utilisateur dans le
calcul de pertinence de documents Présentation des résultats de recherche
(Gowan 2003),(Liu et al.2004) Le score final est la combinaison de score de similarité entre
le document et le profil avec le score d’appariement initial du document
R2I 12-14 juin 2011 8
Contribution
12/06/2011
Idée directriceLes Réseaux Bayésiens constituent un outil puissant pour la représentation des connaissances
Les utiliser pour la présentation des différentes informationsparticipantes à la définition du modèle de recherche Définition d’un module d’appariement intégrant le profil
utilisateur
R2I 12-14 juin 2011 9
Contribution
12/06/2011
Démarche adoptée1. Définition de la librairie des centres d’intérêts
chaque centre d’intérêt ck est défini comme un vecteur de termes ti pondérés selon la formule BM25 (Kassab R et al. 2005)
N :le nombre total de documents de la collection ; n : le nombre de documentsde la collection contenant le terme ti ; R : le nombre de documents pertinents face à une requête utilisateur ; r : le nombre de documents pertinents contenant le terme ti.
R2I 12-14 juin 2011 10
Contribution
12/06/2011
2. Présentation du modèle
Le modèle consiste en un graphe G= (V, E) acyclique orienté
Nœuds V englobent la requête, les documents de la collection et la librairie de centres d’intérêts
Arcs E orientés des termes constituant l’espace d’indexation, vers les documents, les requêtes et les centres d’intérêts.
requête Termes
Documents
Centres d’intérêts
R2I 12-14 juin 2011 11
Contribution
12/06/2011
3. Calcul de la Pertinence
L’espace de termes est réduit à la configuration couverte par la requête q P(q/u)= 1 si q=u 0 sinon
(1)
Le modèle « réseau bayésien » généralise « le modèle vectoriel » l’équation (1) peut être écrite
U : l’ensemble des configurations u possibles de termes. P(u) : la probabilité à priori associée à une configuration de termes
R2I 12-14 juin 2011 12
Contribution4. Exemple illustratifSoit une collection= {d1, d2, d3, d4, d5} d1= {10t1, 2t2, 4t3, 5t5}, d2= {4t1, 9t2, 7t6}, d3= {5t2, 7t3,
12t4, 9t6} d4= {2t1, 11t4, 3t5, 7t6} , d5= {10t2, 15t3, 5t4, 8t5, 14t6}
Libraire des centres d’intérêts Requêtes Q= {q1, q2, q3, q4, q5 }
q1= {t1} ,q2= {t2} , q3= {t3} , q4= {t4}, q5= {t5}
12/06/2011
Table 1. Librairie de centres d’intérêts
R2I 12-14 juin 2011 13
Contribution
12/06/2011
t1
t2
t6
t3
t4
t5
d1
d2
d3
d4
d5
C1
C2
c3
c4
c5
Q
Centres d’intérêts
Termes d’indexatio
n
Collectiondocuments
Requête utilisateur
Architecture du modèle
ordre de pertinence Avec intégration du profil + D5
D2 D3 D4 - D1
+ D2 D5 D4 D3 - D1
c4
R2I 12-14 juin 2011 14
Conclusion
12/06/2011
Le modèle proposé mesure la pertinence comme un degrés de convergence des trois concepts document, requête utilisateur et centre d’intérêt
La prise en compte du profil utilisateur modélisé
par son centre d’intérêt dans le module d’appariement permet un bon ordonnancement des résultats.
R2I 12-14 juin 2011 15
Perspectives
12/06/2011
Validation du modèle proposé sur une collection
personnalisée
Prise en compte de l’évolution du profil utilisateur dans le modèle proposé
R2I 12-14 juin 2011 16
Merci de votre attention!
12/06/2011