16
Modèle de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens Université Mouloud Mammeri de Tizi-Ouzou R 2 I 12-14 Juin 2011 Mme Farida Achemoukh - Adouane Mr Rachid Ahmed-Ouamer Laboratoire LARI Université Mouloud Mammeri de Tizi-Ouzou

Modèle de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

  • Upload
    milton

  • View
    30

  • Download
    0

Embed Size (px)

DESCRIPTION

Université Mouloud Mammeri de Tizi-Ouzou R 2 I 12-14 Juin 2011 . Modèle de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens. Mme Farida Achemoukh - Adouane Mr Rachid Ahmed-Ouamer Laboratoire LARI Université Mouloud Mammeri de Tizi-Ouzou. - PowerPoint PPT Presentation

Citation preview

Page 1: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

Modèle de Recherche d’InformationPersonnalisée Basé sur les Réseaux

Bayésiens

Université Mouloud Mammeri de Tizi-Ouzou R2I 12-14 Juin 2011

Mme Farida Achemoukh - AdouaneMr Rachid Ahmed-Ouamer

Laboratoire LARI Université Mouloud Mammeri de Tizi-Ouzou

Page 2: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

R2I 12-14 juin 2011 2

Plan de la présentation Introduction

Problématique

Accès Personnalisé à l’ Information

Contribution

Conclusion & perspectives

Page 3: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

R2I 12-14 juin 2011

Introduction

12/06/2011 3

Doc 1

Collectiondocument

s

Q=‘virus’

Doc N

Q=‘virus’

SRI

La vocation d’un système de recherche d’information est de fournir à l’utilisateur des informations utiles

Doc 1Doc N

Virus biologiqu

eVirus

informatique

Requête C’est l’expression

d’un besoin en information

Page 4: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

R2I 12-14 juin 2011 4

Introduction

12/06/2011

12/06/2011jz

Collectiondocument

s

Q=‘virus’

SRI

Le système tiens compte de la requête utilisateur et des informations qui le décrivent

Doc 1Doc M

Virus informatiq

ue

Profil utilisateur Domaine d’intérêt :

informatique

Personnalisation de l’information

Profil utilisateurinformations décrivant

ses centres d’intérêts et ses préférences

Page 5: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

R2I 12-14 juin 2011 5

Problématique

Comment modélisation l'utilisateur ?

Comment inclure l’utilisateur dans le processus d'accès à l'information ?

12/06/2011

Page 6: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

R2I 12-14 juin 2011 6

Accès Personnalisé à l’ Information

12/06/2011

Modèlisation de l’utilisateur

Representation du Profil Vectorielle (Gowan 2003) Hiérarchique (Micarelli et al.2004) Multidimensionnlle (Kostadinov 2003)

Construction du Profil Explicite (Kraft et al.2005) Implicite (Gauch et al.2003)

Page 7: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

R2I 12-14 juin 2011 712/06/2011

Accès Personnalisé à l’ Information

Exploitation du Profil Utilisateur dans le processus de recherche Reformulation de la requête(Sieg et al. 2004), (Koutrika et al.2005) augmentation de la requête par des termes issus du profil utilisateur Appariement Requête- Documents (Haveliwala et al.2002), (Zemirli et al. 2008) compte tenu de la requête et du profil utilisateur dans le

calcul de pertinence de documents Présentation des résultats de recherche

(Gowan 2003),(Liu et al.2004) Le score final est la combinaison de score de similarité entre

le document et le profil avec le score d’appariement initial du document

Page 8: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

R2I 12-14 juin 2011 8

Contribution

12/06/2011

Idée directriceLes Réseaux Bayésiens constituent un outil puissant pour la représentation des connaissances

Les utiliser pour la présentation des différentes informationsparticipantes à la définition du modèle de recherche Définition d’un module d’appariement intégrant le profil

utilisateur

Page 9: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

R2I 12-14 juin 2011 9

Contribution

12/06/2011

Démarche adoptée1. Définition de la librairie des centres d’intérêts

chaque centre d’intérêt ck est défini comme un vecteur de termes ti pondérés selon la formule BM25 (Kassab R et al. 2005)

N :le nombre total de documents de la collection ; n : le nombre de documentsde la collection contenant le terme ti ; R : le nombre de documents pertinents face à une requête utilisateur ; r : le nombre de documents pertinents contenant le terme ti.

Page 10: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

R2I 12-14 juin 2011 10

Contribution

12/06/2011

2. Présentation du modèle

Le modèle consiste en un graphe G= (V, E) acyclique orienté

Nœuds V englobent la requête, les documents de la collection et la librairie de centres d’intérêts

Arcs E orientés des termes constituant l’espace d’indexation, vers les documents, les requêtes et les centres d’intérêts.

requête Termes

Documents

Centres d’intérêts

Page 11: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

R2I 12-14 juin 2011 11

Contribution

12/06/2011

3. Calcul de la Pertinence

L’espace de termes est réduit à la configuration couverte par la requête q P(q/u)= 1 si q=u 0 sinon

(1)

Le modèle « réseau bayésien » généralise « le modèle vectoriel » l’équation (1) peut être écrite

U : l’ensemble des configurations u possibles de termes. P(u) : la probabilité à priori associée à une configuration de termes

Page 12: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

R2I 12-14 juin 2011 12

Contribution4. Exemple illustratifSoit une collection= {d1, d2, d3, d4, d5} d1= {10t1, 2t2, 4t3, 5t5}, d2= {4t1, 9t2, 7t6}, d3= {5t2, 7t3,

12t4, 9t6} d4= {2t1, 11t4, 3t5, 7t6} , d5= {10t2, 15t3, 5t4, 8t5, 14t6}

Libraire des centres d’intérêts Requêtes Q= {q1, q2, q3, q4, q5 }

q1= {t1} ,q2= {t2} , q3= {t3} , q4= {t4}, q5= {t5}

12/06/2011

Table 1. Librairie de centres d’intérêts

Page 13: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

R2I 12-14 juin 2011 13

Contribution

12/06/2011

t1

t2

t6

t3

t4

t5

d1

d2

d3

d4

d5

C1

C2

c3

c4

c5

Q

Centres d’intérêts

Termes d’indexatio

n

Collectiondocuments

Requête utilisateur

Architecture du modèle

ordre de pertinence Avec intégration du profil + D5

D2 D3 D4 - D1

+ D2 D5 D4 D3 - D1

c4

Page 14: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

R2I 12-14 juin 2011 14

Conclusion

12/06/2011

Le modèle proposé mesure la pertinence comme un degrés de convergence des trois concepts document, requête utilisateur et centre d’intérêt

La prise en compte du profil utilisateur modélisé

par son centre d’intérêt dans le module d’appariement permet un bon ordonnancement des résultats.

Page 15: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

R2I 12-14 juin 2011 15

Perspectives

12/06/2011

Validation du modèle proposé sur une collection

personnalisée

Prise en compte de l’évolution du profil utilisateur dans le modèle proposé

Page 16: Modèle  de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens

R2I 12-14 juin 2011 16

Merci de votre attention!

12/06/2011