Cecile Bothorel 2010 La Cantine Réseaux Sociaux pour la recommandation

Preview:

DESCRIPTION

Analysis of social network to support recommendation systems

Citation preview

Réseaux sociaux comme support d'outils de recommandation

Analyse de réseaux socio-sémantiquesCécile Bothorel Département LUSSI

Cécile Bothorelpage 2 Département LUSSI

Sommaire

Web, recherche d'information, web social, naviguerrance, filtrage et popularité

Vers un accès synthétique et personnalisé • Analyse de réseaux socio-sémantiques

Du browsing au subscribing, une affaire de filtrage et de popularité

Cécile Bothorelpage 4 Département LUSSI

Types d'accès à l'information = « browsing » et « searching »

Browsing

• Navigation, de page html en page html

• Le fil conducteur, mon propre intérêt Searching

• Requête + navigation

• Matching entre des termes et des contenus

• L'algorithmique du moteur de recherche devient le prescripteur

• Pertinence

Cécile Bothorelpage 5 Département LUSSI

Types d'accès à l'information : « wilfing »

Partage Souscription

• web 2.0 + médias sociaux + RSS

• Navigation sans but, trouvailles surprenantes, sérendipité

• Internautes producteurs• Choix de ses internautes « prescripteurs »

What was I Looking For?

Cécile Bothorelpage 6 Département LUSSI

Accès à l'information

Toujours plus d'infobésité

• De liens hypertextes

• De contenus

• De prescripteurs potentiels

Tout est question de filtrage et de recommandation

… et de popularité

1 trillion de liens internet, 27 milliards de pages web indexées

75 millions de comptes Twitter dont 15 millions actifs

Plus d'1 milliard de vidéos visionnées par jour sur YouTube

4 milliards de photos sur FlickR

15 millions de français sur FaceBook

2 millions de profils consultés sur Viadéo

http://www.slideshare.net/jmlouche/mdias-sociaux-les-chiffres-retenir

Cécile Bothorelpage 7 Département LUSSI

Filtrage et popularité

http://complexnetworks.fr/

• 1998 PageRank de Google : mesure de pertinence dans l’ordonnancement des réponses aux requêtes

Cécile Bothorelpage 8 Département LUSSI

Filtrage et popularité

Cécile Bothorelpage 9 Département LUSSI

Vers un filtrage plus fin

Challenger le principle de pareto : 20% des contenus génèrent 80% des ventes

Analyse de réseaux socio-sémantiques et recommandation

Cécile Bothorelpage 11 Département LUSSI

Analyser un réseau

Cécile Bothorelpage 12 Département LUSSI

Graphes réels

Graphes réels, grands graphes terrain, complex networks

Propriétés structurelles communes

• faible densité en arcs,

• en moyenne des chemins courts (effet petit monde),

• existence de zones denses en arcs,

• incidence des sommets en loi de puissance. Structure de graphe rare d’un point de vue

probabiliste → un domaine de recherche jeune

→puise ses concepts dans l'analyse de réseaux sociaux

Cécile Bothorelpage 13 Département LUSSI

Détection de communautés

La délimitation en groupes n'est pas un a priori • On ne cherche pas qui

appartient à une famille, communauté ethnique ...

• Mettre en évidence une catégorie émergente, basée sur l'analyse de la topologie

Karate Club in an AmericanUniversity [Zachary 1977]

Cécile Bothorelpage 14 Département LUSSI

Détection de communautés

Quatre types d’approches (thèse P. Pons, 2007)• Classiques• Séparatives• Agglomératives• Marches aléatoires

P. Pons, 2007

Trouver la partitionP = {C1, . . . , Ck} qui optimise la

fonction de qualité Q(P)

Cécile Bothorelpage 15 Département LUSSI

Détection de communautés

Quatre types d’approches (thèse P. Pons, 2007)• Classiques

• Séparatives

• Agglomératives

• Marches aléatoires

Calcul de positions clés locales à une communauté

• Centralité, PageRank, Hits

• Elements « frontières »

• Etiquetage des groupes par les thématiques saillantes (textmining, folksonomy mining)P. Pons, 2007

Trouver la partitionP = {C1, . . . , Ck} qui optimise

la fonction de qualité Q(P)

25

31

6

15

horreur DiCaprio

Cécile Bothorelpage 16 Département LUSSI

Réseaux sociaux et similarité

Méthodes locales

• Nombre de voisins communs

• Coefficient de Jaccard

• Adamic/Adar Measure

Méthodes globales

• Longeur des plus courts chemins

• Katz

• Hits, PageRank

• SimRank tagging

co-tagging

Cécile Bothorelpage 17 Département LUSSI

Réseaux sociaux et confiance

Comprendre, modéliser le réseau de confiance/opinions

• TrustRank (lutte anti spam) : mesure gloabale

• TidalTrust : mesure locale

• Propagation de confiance

Networks, Crowds, and Markets: Reasoning About a Highly Connected World By David Easley and Jon Kleinberg, à paraître en 2010

Cécile Bothorelpage 18 Département LUSSI

Modélisation Réseaux et contenus et ...

Cécile Bothorelpage 19 Département LUSSI

Conclusion

Analyse de réseaux

• Détection de communautés, calcul de similarité, propagation de confiance

Modélisation des échanges sur les médias sociaux

• Vers des réseaux socio-sémantiques Compréhension des usages

• Cartographie des échanges

• Visualisation Réseaux égo-centrés

• Prédiction de liens

• Recommendation de contenus, popularité locale

• Visualisation/exploration de un point de vue

Cécile Bothorelpage 20 Département LUSSI

Merci