Transcript
Page 1: Poster Recherche d'Information Sociale

Ismail [email protected]

IRIT, Université Paul Sabatier, Toulouse

RI sociale : intégration de propriétés sociales dans un

modèle de recherche

• Comment identifier ces informations sociales et quelle est leur nature ?

• Comment traduire et quantifier ces informations sociales en propriétés de pertinence sociale ?

• Quelles propriétés sociales utiles  pouvant être exploitées pour améliorer la recherche d’information (ex. pages web, vidéos, etc) ?

Problématique

1) Estimation de la fraicheur à partir de la date de la dernière mention associée à la ressource :

: lien URL de la ressource r

2) Estimation de la popularité et l’importance de la ressource :

Avec :

3) Le score social global :

Q : Requête et G : Réseau social

4) Combinaison de la pertinence thématique et la pertinence sociale :

Modèle de recherche proposé

h𝐹𝑟𝑎𝑖𝑐 𝑒𝑢𝑟 𝑆𝑜𝑐𝑖𝑎𝑙𝑒( 𝑙𝑟)=𝑇𝑒𝑚𝑝𝑠𝐷𝑒𝑟𝑛𝑖è 𝑟𝑒𝑚𝑒𝑛𝑡𝑖𝑜𝑛

(𝑙𝑟 )𝑀𝐴𝑋 𝑙𝑟 (𝑇𝑒𝑚𝑝𝑠𝐷𝑒𝑟𝑛𝑖è 𝑟𝑒𝑚𝑒𝑛𝑡𝑖𝑜𝑛

(𝑙𝑟 ) )

𝑃𝑜𝑝 𝐼𝑚𝑝𝑆𝑜𝑐𝑖𝑎𝑙 𝑒𝑠 (𝑙𝑟 )=∑𝑖=1

9

𝑓 𝐶𝑟𝑖𝑡è 𝑟𝑒𝑖 ( 𝑙𝑟 )

SCORE (Q, r, G) = α * SCOREThématique (Q, r) + (1 α) * SCORESocial (Q, lr , G)

𝑆𝐶𝑂𝑅𝐸 𝑆𝑜𝑐𝑖𝑎𝑙 (𝑄 ,𝑙𝑟 ,𝐺 )=𝛽 h𝐹𝑟𝑎𝑖𝑐 𝑒𝑢𝑟 𝑆𝑜𝑐𝑖𝑎𝑙𝑒 (𝑙𝑟)+ (1− 𝛽 )𝑃𝑜𝑝 𝐼𝑚𝑝𝑆𝑜𝑐𝑖𝑎𝑙𝑒 (𝑙𝑟)

𝑀𝐴𝑋𝑙 𝑟(𝑆𝐶𝑂𝑅𝐸𝑆𝑜𝑐𝑖𝑎𝑙(𝑄 , 𝑙𝑟 ,𝐺))

1) Collection de test

• 8433 films issus du site « imdb.com ».• CGUs collectés depuis 8 réseaux sociaux à travers des APIs.• 10 requêtes / 10 utilisateurs.

2) Résultats

Evaluation expérimentale

Systèmes nDCG@20 P@20Système 1 : Lucene Solr 0.76 0.38Système 2 : Lucene Solr + Propriétés sociales 0.942 (+24%) 0.73

nDCG@20 P@20

Fig.1 : Schéma de la RI sociale par rapport à notre proposition.

Vidéos

Photos

Pages Web

Ressources accessibles via internet

Autres

Utilisateurs des réseaux sociaux

Contenu généré par l’utilisateur (CGU)

Marques (Tags)Commentaires/Avis

Partages/RecommandationMentions/Votes

Clicks

Extraction et quantification des propriétés sociales

Modèle de Tri (Ranking)

RequêteRésultats

PopularitéImportanceInfluenceFraicheur

Intégration

Recherche d’information sociale : Estimation de la pertinence d’une ressource à partir des propriétés sociales issues des réseaux sociaux.

Introduction

Contenu généré par l’utilisateur :• Interactions utilisateur-ressource.• Relations entre utilisateurs.

Quantification des propriétés sociales à partir de ces CGUs.

Fig.2 : Les CGUs exploités dans la quantification des propriétés sociale.

CGU et propriétés sociales

ACEBOOKJ’aime

PartageCommentaireDate de la mentionAmisAbonnés

WITTERTweetFollower

GOOGLE+(Mention) +1

Partage

LINKEDINTEREST

DIGGDELICIOUSSTUMBLEUPONMarque

Influence & Importance

Auteur

Popularité & Importance

Ressource

Fraicheur

Ressource

Propriétés sociales

F ( Requête, Contenu, Propriétés )

Fig.3 : Ajustement des paramètres α avec

Fig.4 : Comparaison des mesures entre les deux systèmes.

0.000.100.200.300.400.500.600.700.800.901.000.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

Paramètre α

P@

20

F ( Requête, Contenu )

00.10.20.30.40.50.60.70.80.9

1

0.76

0.38

0.942

0.73

Système 1 : Lucene Solr

Système 2 : Lucene Solr+Propriétés sociale s