Upload
romain-picot-clemente
View
29
Download
2
Embed Size (px)
Citation preview
Institut Mines-Télécom
Origines
• Personnalisation de la présentation (feuille de style, disposition des éléments, etc.)
• Personnalisation de la navigation (modification du graphe hypermédia)
• Personnalisation du contenu (modification de la complexité du contenu selon contexte, profil, etc.)
21/07/2015 Les systèmes de recommandations - Introduction 3
Systèmes hypermédia adaptatifs
Systèmes de recommandations
Systèmes hypermédia adaptatifs (Brusilovsky et al., 1996)
Introduit initialement
pour le e-learning
Institut Mines-Télécom
Origines
Personnalisation de la navigation (modification du graphe hypermédia)
21/07/2015 Les systèmes de recommandations - Introduction 4
Systèmes hypermédia adaptatifs
Systèmes de recommandations
Systèmes de recommandations
Institut Mines-Télécom 21/07/2015 Les systèmes de recommandations - Introduction 5
Pour l’utilisateur
Pour le fournisseur
Intérêt utilisateur
Systèmes de recommandations :
A quoi ça sert ?
• Réduire le temps de recherche d’information
• Découvrir des produits difficiles à trouver
• …
𝐴𝑚é𝑙𝑖𝑜𝑟𝑒𝑟 𝑙′𝑒𝑥𝑝é𝑟𝑖𝑒𝑛𝑐𝑒 𝑢𝑡𝑖𝑙𝑖𝑠𝑎𝑡𝑒𝑢𝑟
Institut Mines-Télécom 21/07/2015 Les systèmes de recommandations - Introduction 6
Pour l’utilisateur
Pour le fournisseur
Intérêt pour fournisseur du service
Systèmes de recommandations :
A quoi ça sert ?
• Garder/engager/fidéliser les clients
• Orienter les clients
• Augmenter les bénéfices
• …
Institut Mines-Télécom
Applications
21/07/2015 Les systèmes de recommandations - Introduction 7
Exemples de domaines d’application
• Films (Netflix, Allocine, …)
• Musiques (Deezer, …)
• Jeux vidéo (Steam, Microsoft Xbox Live, ...)
• Livres (Amazon, Fnac, …)
• « Amis » (Facebook, Twitter, Google+, …)
• Tourisme (Expedia, …)
• e-Shopping (Cdiscount, eBay, Amazon, Fnac, …)
• Publicité ciblée (Criteo, …)
• Nutrition/sport/bien-être (Withings, Fitnext, …)
• Médical
• …
Institut Mines-Télécom
Définitions, types de
systèmes de recommandation
21/07/2015 Les systèmes de recommandations 8
Institut Mines-Télécom
• Utilisateurs : individus cibles de la recommandation
• Items : ensemble des éléments possiblement recommandables aux utilisateurs
Items, utilisateurs, matrice d’usage
21/07/2015 Les systèmes de recommandations 9
Deux classes d’entités
Matrice d’usage
Items et utilisateurs
Institut Mines-Télécom
Items, utilisateurs, matrice d’usage
21/07/2015 Les systèmes de recommandations 10
Deux classes d’entités
Matrice d’usage
Matrice d’usage : relie utilisateurs et items par une matrice de score
HP1 HP2 HP3 TW SW1 SW2 SW3
A 4 5 1
B 5 5 4
C 2 4 5
D 3 3
Valeur inconnue
Utilis
ate
urs
Items
Le score peut représenter
différents types d’interaction : une
note, un nombre d’utilisation, une
durée, un « like », etc.
Institut Mines-Télécom
Deux grands groupes de systèmes de
recommandations
21/07/2015 Les systèmes de recommandations 11
Basé sur la similarité du profil de l’utilisateur avec le profil des items
Basé sur le contenu (content-based)
Filtrage collaboratif (collaborative filtering)
Systèmes de recommandations basés sur le contenu
Institut Mines-Télécom
Deux grands groupes de systèmes de
recommandations
21/07/2015 Les systèmes de recommandations 12
Basé sur la similarité de comportement (achats, visites, clics, notes, etc.) entre les utilisateurs
Basé sur le contenu (content-based)
Filtrage collaboratif (collaborative filtering)
Systèmes de recommandations par filtrage collaboratif
Institut Mines-Télécom
Systèmes de recommandations
basés sur le contenu
21/07/2015 Les systèmes de recommandations 13
Institut Mines-Télécom
Principe général de la recommandation
basée sur le contenu
21/07/2015 Les systèmes de recommandations 14
Profilage items et utilisateur
Recommandation par distance
• Profil items : vecteur de scores sur des attributs/descripteurs
• Profilage utilisateurs :
─ Implicite (selon les interactions avec les items)
─ Explicite (question directe)
Utilisateur
Profil
utilisateur
(vecteur
d’attributs)
Items
Profilage
items Profils
items
(vecteurs
d’attributs)
Profilage
utilisateur
Interactions
Faire attention aux échelles entres attributs
Institut Mines-Télécom
Principe général de la recommandation
basée sur le contenu
21/07/2015 Les systèmes de recommandations 15
Profilage items et utilisateur
Recommandation par distance
Utilisateur
Profil
utilisateur
(vecteur
d’attributs)
Items
Profilage
items Profils
items
(vecteurs
d’attributs)
Calcul de
distances
Les items avec
des profils
proches sont
recommandés
Profilage
utilisateur
Interactions
• Calcul de distances entre profils utilisateur-items (distance cosinus, jaccard (pour 0-1 scores), Pearson, …)
• Recommandation des items les plus proches
Institut Mines-Télécom
• Bob a aimé A et C
─ Vecteur utilisateur :
• Profilage de Bob
─ Vecteur profil :
• Recommandation
─ Distance de Pearson entre 𝑝 et chaque vecteur film/genre (ligne de 𝐼)
─ Recommandation des films dont les distances avec 𝑝 sont les plus proches
21/07/2015 Les systèmes de recommandations 16
Approche classique
Horreur Epouvante Action Romance Comédie Animation Sci-Fi Film
d’auteur
A 1 1 1
B 1 1 1
C 1 1 1
D 1 1
E 1 1
Film
s
Genre
Matrice 𝐼 =
𝑢 = 1 0 1 0 0
𝑝 = 𝑢. 𝐼 = 1 0 2 0 2 1 0 0
Horreur Epouvante Action Romance Comédie Animation Sci-Fi Film
d’auteur
A B C D E
Autres approches
Approche classique : exemple
Approches pour la recommandation basée
sur le contenu
Institut Mines-Télécom 21/07/2015 Les systèmes de recommandations 17
Approches pour la recommandation basée
sur le contenu
Approche classique
Autres approches
• Passage dans un espace latent de dimensions plus faibles, pour augmenter la densité de la matrice item-attribut (classification non-supervisée des items). Calcul de distance utilisateur-item dans cet espace.
• Réduction de dimension par utilisation d’ontologies pour relier des attributs dont les concepts sont plus ou moins éloignés (ex: maths et physiques en sciences). Toujours dans le but d’augmenter la densité de la matrice item-attribut.
• Modèle d’apprentissage pour chaque utilisateur (réseau de neurones, arbre de décision, forêt aléatoire, SVM, etc.) pour prédire si un item va correspondre à l’utilisateur ou non.
Autres approches
Institut Mines-Télécom
Système de recommandation
basé sur le filtrage collaboratif
21/07/2015 Les systèmes de recommandations 18
Institut Mines-Télécom
Principe de base de la recommandation par
filtrage collaboratif
21/07/2015 Les systèmes de recommandations 19
Interaction utilisateurs sur items
Matrice d’usage
Similarités entre les utilisateurs
sim(Alice, Bob) > sim(Chris, Bob)
Recommandation basée sur la similarité des usages entre utilisateurs
Matrice d’usage
1 11 1
0 −1−1 1
0 −11 0
1 0−1 0
Les recommandations pour un utilisateur U sont les items qui sont aimés par les utilisateurs qui lui sont similaires
Institut Mines-Télécom
Approches pour la recommandation par
filtrage collaboratif
21/07/2015 Les systèmes de recommandations 20
HP1 HP2 HP3 TW SW1 SW2 SW3
A 4 5 1
B 5 5 4
C 2 4 5
D 3 3
Utilis
ate
urs
Films
HP1 HP2 HP3 TW SW1 SW2 SW3
A 2/3 5/3 -7/3
B 1/3 1/3 -2/3
C -5/3 1/3 4/3
D 0 0
Utilis
ate
urs
Films
A savoir: Il existe aussi le
filtrage collaboratif par voisinage item
Approche classique : voisinage utilisateur
Factorisation matricielle
Exemple 1 : filtrage collaboratif par voisinage utilisateur
• Matrice d’usage
• Utilisateur cible 𝐴
• Normalisation par ligne (soustractions de la valeur moyenne)
• Similarités de Pearson 𝑠𝑖𝑚(𝐴, 𝐵) = 0,06 ; 𝑠𝑖𝑚(𝐴, 𝐶) = −0,69 ; 𝑠𝑖𝑚(𝐴, 𝐷) = 0
• Recommandations : 𝑠𝑐𝑜𝑟𝑒 𝐴, 𝑖𝑡𝑒𝑚 = sim A,u × score u,itemu∈utilisateurs
sim A,uu∈utilisateurs
𝑠𝑐𝑜𝑟𝑒 𝐴,𝐻𝑃2 = 0,03 ; 𝑠𝑐𝑜𝑟𝑒 𝐴, 𝐻𝑃3 = −0,05 ; 𝑠𝑐𝑜𝑟𝑒(𝐴, 𝑆𝑊2) = −1,23 ; 𝑠𝑐𝑜𝑟𝑒(𝐴, 𝑆𝑊3) = 0
Inconvénients - Temps de calcul important s’il y a beaucoup d’utilisateurs/items - Difficile de trouver des similarités dans des matrices d’usage peu dense (ce qui est généralement le cas)
Clustering
Autres
Institut Mines-Télécom
Approches pour la recommandation par
filtrage collaboratif
21/07/2015 Les systèmes de recommandations 21
Approche classique : voisinage utilisateur
Factorisation matricielle
Exemple 2 : filtrage collaboratif par regroupement (clustering)
• Matrice d’usage
• Regroupement des items
• Le score d’un utilisateur pour un item est le score pour son cluster. Exemple : 𝑠𝑐𝑜𝑟𝑒(𝐴, 𝐻𝑃2) = 4
• S’il n’y a aucune valeur (ou 𝑠𝑐𝑜𝑟𝑒 = 0) alors calcul du score basé sur similarité des utilisateurs (comme exemple précédent) sur la matrice de utilisateurs- clusters
Clustering
Autres
HP1 HP2 HP3 TW SW1 SW2 SW3
A 4 5 1
B 5 5 4
C 2 4 5
D 3 3 U
tilis
ate
urs
Films
Le clustering peut se faire sur les
utilisateurs et/ou items, et plusieurs fois
si besoin
HP TW SW
A 4 5 1
B 4,67
C 2 4,5
D 3 3 Utilis
ate
urs
Cluster de films
Institut Mines-Télécom
Approches pour la recommandation par
filtrage collaboratif
21/07/2015 Les systèmes de recommandations 22
Approche classique : voisinage utilisateur
Factorisation matricielle
Exemple 3: filtrage collaboratif par factorisation matricielle SVD
• Soit une matrice d’usage 𝑀 ∶ 𝑈𝑡𝑖𝑙𝑖𝑠𝑎𝑡𝑒𝑢𝑟𝑠 × 𝐼𝑡𝑒𝑚𝑠
• Factorisation matricielle 𝑆𝑉𝐷 (singular value decomposition) 𝑀 = 𝑈𝑆𝑉𝑇
• Les 𝑛 premières valeurs singulières de 𝑆 sont gardées et donne une nouvelle matrice diagonale 𝑆’
• Nouvelle matrice de score selon les valeurs singulières sélectionnées 𝑀’ = 𝑈𝑆′ 𝑉𝑇
• Les items avec les plus grands scores sont recommandés à l’utilisateur
Clustering
Autres
Il existe de nombreux autres types de
factorisation matricielle
Institut Mines-Télécom
Approches pour la recommandation par
filtrage collaboratif
21/07/2015 Les systèmes de recommandations 23
Approche classique : voisinage utilisateur
Factorisation matricielle
Clustering
Autres
De nombreuses autres approches
• Règles d’association
• Parcours de graphe
• Modèle d’apprentissage
Institut Mines-Télécom
Avantages et inconvénients
des deux approches
21/07/2015 Les systèmes de recommandations 24
Institut Mines-Télécom
Avantages et inconvénients des deux
approches
21/07/2015 Les systèmes de recommandations 25
SR basé sur le contenu
• Avantages
─ Permet des recommandations de nouveaux items
─ Un nouvel utilisateur peut recevoir des recommandations dés ses premières interactions avec le système
• Inconvénient
─ Nécessite une quantité importante de descripteurs sur les items et/ou utilisateurs
Systèmes de recommandations basés sur le contenu
SR basé sur le filtrage collaboratif
Institut Mines-Télécom 21/07/2015 Les systèmes de recommandations 26
SR basé sur le contenu
• Avantage
─ Pas besoin de descripteurs sur les items/utilisateurs
• Inconvénient
─ Problème de démarrage à froid, pas de recommandations possibles s’il n’y a pas eu suffisamment d’interactions utilisateurs/items
Systèmes de recommandations basés sur le filtrage collaboratif
SR basé sur le filtrage collaboratif
Avantages et inconvénients des deux
approches
Institut Mines-Télécom 21/07/2015 Les systèmes de recommandations 27
SR basé sur le contenu
SR basé sur le filtrage collaboratif
Ces deux approches ne sont pas disjointes et sont la plupart du temps
combinées
Avantages et inconvénients des deux
approches
Institut Mines-Télécom
Recommandation tenant compte
d’informations additionnelles
21/07/2015 Les systèmes de recommandations 28
Institut Mines-Télécom
De nombreuses informations additionnelles
21/07/2015 Les systèmes de recommandations 29
Sur utilisateurs/items
Informations additionnelles sur utilisateurs/items
• Informations personnels (âge, métier, genre, …)
• Réseau social
• Tags
• Positions géographiques
• Commentaires, avis textuels
Sur interactions U-I
Institut Mines-Télécom
De nombreuses informations additionnelles
21/07/2015 Les systèmes de recommandations 30
Sur utilisateurs/items
Sur interactions U-I
Informations contextuelles associées aux interactions U-I
• Temps (Heure)
• Météo
• Humeur
• Position géographique
Institut Mines-Télécom
De nombreuses informations additionnelles
21/07/2015 Les systèmes de recommandations 31
Sur utilisateurs/items
Sur interactions U-I
Vers des systèmes de plus en plus sensibles au contexte, au temps, aux habitudes, aux interactions sociales, aux sentiments, …
Institut Mines-Télécom
Approches tenant compte d’informations
additionnelles sur utilisateurs/items
21/07/2015 Les systèmes de recommandations 32
Matrice
U-I
Voisinage
utilisateur/item
Informations
additionnelles
utilisateurs
Voisinage
utilisateur
Voisinage
item
Information
additionnelles
items
Recommandations
Approches par voisinages
Voisinages
Modèles à facteurs latents
Modèles d’apprentissage
Graphes
Institut Mines-Télécom
Approches tenant compte d’informations
additionnelles sur utilisateurs/items
21/07/2015 Les systèmes de recommandations 33
Voisinages
Modèles à facteurs latents
Modèles d’apprentissage
Graphes
Matrice
U-I Paramètres
Informations
additionnelles
utilisateurs
Informations
additionnelles
items
Apprentissage d’un
modèle prédictif
basé sur les
paramètres
Paramètres
Paramètres
Recommandations
Approches par modèles d’apprentissage
Institut Mines-Télécom
Approches tenant compte d’informations
additionnelles sur utilisateurs/items
21/07/2015 Les systèmes de recommandations 34
Voisinages
Modèles d’apprentissage
Graphes
Approches par modèles à facteurs latents
Modèle prédictif
Matrice
U-I U
Informations
additionnelles
utilisateurs
Informations
additionnelles
items
Recommandations
V
U P
V Q
Factorisation de U-I sous contrainte des informations additionnelles
Modèles à facteurs latents
Institut Mines-Télécom
Approches tenant compte d’informations
additionnelles sur utilisateurs/items
21/07/2015 Les systèmes de recommandations 35
Voisinages
Modèles d’apprentissage
Graphes
Approches par graphes
Modèles à facteurs latents
Matrice
U-I
Informations
additionnelles
utilisateurs
Informations
additionnelles
items
Approches par
exploration du
graphe
Recommandations
Graphe incluant
utilisateurs, items,
entités issues des
informations
additionnelles, et
leurs relations
Institut Mines-Télécom 21/07/2015 Les systèmes de recommandations 36
Approches Complexité du
modèle
Complexité
spatiale
Complexité
temporelle
Explicabilité
des résultats
Voisinages Moyenne Importante Importante Importante
Modèles Importante Faible Importante Faible
Graphes Faible Moyenne Importante Moyenne
Approches tenant compte d’informations
additionnelles sur utilisateurs/items
Propriétés succinctes des approches
Institut Mines-Télécom
Approches tenant compte d’informations
contextuelles liées aux interactions U-I
21/07/2015 Les systèmes de recommandations 37
Dépendantes du temps
« Factorization Machines »
Factorisation tensorielle
Graphes
Méthodes par filtrage collaboratif dépendantes du temps
Méthodes qui favorisent les interactions plus récentes afin de proposer des recommandations plus en phase avec les profils courants.
Méthodes très spécifiques à l’information temporelle, ne sont
pas généralisable aux autres données contextuelles
Institut Mines-Télécom
Approches tenant compte d’informations
contextuelles liées aux interactions U-I
21/07/2015 Les systèmes de recommandations 38
Dépendantes du temps
« Factorization Machines »
Factorisation tensorielle
Graphes
Méthodes par factorisation tensorielle
Matrice
U-I
Informations
contextuelles
liées aux
interactions
Tenseur
Utilis
ate
urs
Items
U
V
Modèle
prédictif
Recommandations
Institut Mines-Télécom
Approches tenant compte d’informations
contextuelles liées aux interactions U-I
21/07/2015 Les systèmes de recommandations 39
Dépendantes du temps
« Factorization Machines »
Factorisation tensorielle
Graphes
Méthodes par « Factorization Machines » [Rendle, 2010]
• Est une généralisation des méthodes à base de factorisation
• Permet de considérer à la fois les informations de contexte et les informations en rapport avec items/utilisateurs
« one-hot encoding »
Où il s’agit de déterminer
Factorization machine de degré 2:
Institut Mines-Télécom
Approches tenant compte d’informations
contextuelles liées aux interactions U-I
21/07/2015 Les systèmes de recommandations 40
Dépendantes du temps
« Factorization Machines »
Factorisation tensorielle
Graphes
Méthodes par graphes
Matrice
U-I
Informations
additionnelles
Approches par
exploration du
graphe
Recommandations
Graphe incluant
utilisateurs, items,
entités issues des
informations
additionnelles, et
leurs relations
Permet de considérer à la fois les informations de contexte et les informations en rapport avec
items/utilisateurs
Institut Mines-Télécom 21/07/2015 Les systèmes de recommandations 41
Approches Complexité du
modèle
Complexité
spatiale
Complexité
temporelle
Explicabilité
des résultats
Tenseurs Importante Faible Importante Faible
Factorization
machines Importante Faible Importante Faible
Graphes Faible Moyenne Importante Moyenne
Les méthodes FC dépendantes du temps ne sont pas pertinentes dans cette comparaison elles ne représentent pas un framework général d’utilisation d’information contextuelle pour la recommandation, elles se limitent à l’utilisation du temps
Propriétés succinctes des approches
Approches tenant compte d’informations
contextuelles liées aux interactions U-I
Institut Mines-Télécom
Recommandation de lieux pour des réseaux
sociaux géographiques
21/07/2015 Les systèmes de recommandations 43
Informations géographiques
Réseau social
Réseau social de partage de lieux (Location-Based Social Network)
Réseau social géographique ?
Institut Mines-Télécom
Graph-based approach for location
recommendation in LBSNs using Katz Centrality
21/07/2015 Les systèmes de recommandations 44
𝑪 =𝜶𝑺 𝜷𝑭
𝜷𝑭𝑻 𝜸𝑮
Places
Places
Users
Users
F=
⋯ ⋯ ⋯⋮ ⋱ ⋮⋯ ⋯ ⋯
Users
Places Graphe de fréquentation (matrice d’usage)
S=0 ⋯ ⋯⋮ ⋱ ⋮⋯ ⋯ 0
Users
Users Graphe social
Graphe géographique?
Graphe considérant frequentations, social et positions géographiques (des lieux)
Institut Mines-Télécom
𝑪 =𝜶𝑺 𝜷𝑭
𝜷𝑭𝑻 𝜸𝑮
Places
Places
Users Users
21/07/2015 Les systèmes de recommandations 45
G =
0 ⋯⋯ 0
⋯ ⋯ ⋯⋯ ⋯ ⋯
⋯ ⋯⋯ ⋯⋯ ⋯
0 ⋯ ⋯⋯⋯
0⋯
⋯0
Places
Places
𝑓(𝑥) = 𝑎𝑥𝑏
𝑓(𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒(𝑃𝑙𝑎𝑐𝑒𝑖 , 𝑃𝑙𝑎𝑐𝑒𝑗))
Global distribution of all users visits according to the mutual distances
Low distances between places gives high values in G, and inversely Scores are computed according to
the distances between places
Graph-based approach for location
recommendation in LBSNs using Katz Centrality
Graphe géographique
Institut Mines-Télécom 21/07/2015 Les systèmes de recommandations 46
𝐾𝑎𝑡𝑧 𝐶 = 𝛽𝐶 + 𝛽2𝐶2 + 𝛽3𝐶3 +⋯ converge pour 0 ≤ 𝛽 <
1
max ( 𝜆 𝐶 )
max ( 𝜆 𝐶 ) est la plus grande valeur propre de 𝐶 (appelé rayon spectral)
𝐾𝑎𝑡𝑧(𝐶) = ⋯ 𝐹′⋯ ⋯
Matrice des scores de prédiction après propagation de Katz
Users
Users
Places
Places
Complexité algorithmique:
𝑂 𝑁𝑢 × 𝑛𝑛𝑧 , avec 𝑁𝑢, le nombre de
d’utilisateurs et 𝑛𝑛𝑧, le nombre de
« non-zero » dans 𝐹𝐹𝑇 𝑘
𝐾𝑎𝑡𝑧 𝐶 12 = 𝛽 𝐹 + 𝛽2 𝑆𝐹 + 𝐹𝐺+ 𝛽3 𝑆2𝐹 + 𝐹𝐹𝑇𝐹 + 𝑆𝐹𝐺 + 𝐹𝐺2 +⋯
Graph-based approach for location
recommendation in LBSNs using Katz Centrality
Centralité de Katz [Katz, 1953] Permet d’identifier des relations distantes entre des nœuds d’un graphe
Institut Mines-Télécom 21/07/2015 Les systèmes de recommandations 47
𝐾𝑎𝑡𝑧 𝐶 12 = 𝛽 𝐹 + 𝛽2 𝑆𝐹 + 𝐹𝐺+ 𝛽3 𝑆2𝐹 + 𝐹𝐹𝑇𝐹 + 𝑆𝐹𝐺 + 𝐹𝐺2 +⋯
Places visited by friends Places close to the
visited places
Places visited by friends of friends
Places visited by users that have visited the
same places
Places close to places visited by friends
Places close to places close to the visited
places
Graph-based approach for location
recommendation in LBSNs using Katz Centrality
Les chemins considérés dans 𝑲𝒂𝒕𝒛 𝑪 𝟏𝟐
Institut Mines-Télécom
Context and social based recommender
system using association rules
21/07/2015 Les systèmes de recommandations 48
DB History
Learning partOffline
Recommendation partOnline
Association rules mining
All users' past visiting sessions
Rules selection
DB Association
Rules
Rules scoringItems selection
- visiting session- position- desired TOR- friends
Profile
selected ruleswith scores
recommendations
Recommandation contextuelle et sociale de lieux qui dépend du type de recommandation désiré par l’utilisateur
• Contexte :
─ Session de visites
─ Position courante
─ Type de recommandation désiré (veut-il des recommandations évidentes ? surprenantes ? rares ? populaires ?)
• Visites passées des amis
Institut Mines-Télécom
Context and social based recommender
system using association rules
21/07/2015 Les systèmes de recommandations 49
Partie hors-ligne, apprentissage de règles d’association
Learning part
Recommendation part
• Transaction : session de visites (ensemble de lieux)
• Extraction de toutes les règles d’association
Institut Mines-Télécom
Context and social based recommender
system using association rules
21/07/2015 Les systèmes de recommandations 50
Partie en-ligne, temps-réelle, moteur de recommandation
Learning part
Recommendation part
• Sélection de règles correspondantes à la session de visites de l’utilisateur
• Calcul de scores de pertinences pour chaque règles sélectionnées selon une mesure de pertinence
• Pondération et sélection des items à recommander
𝑀𝑝 𝑟𝑖 = 𝑀𝑔 𝑟𝑖 𝛼𝑀𝑖 𝑟𝑖 + 1 − 𝛼 𝑀𝑠 𝑟𝑖
• 𝑴𝒊 dépend du type de recommandation désiré:
Confiance, Surprise, Rareté, Popularité
• 𝑴𝐠 dépend de la position géographique courante de
l’utilisateur. Elle met en avant les règles dont le lieu conséquent n’est pas trop éloigné de l’utilisateur.
• 𝑴𝐬 dépend des visites des utilisateurs amis. Elle met en avant les règles qui se sont vérifiées souvent chez les amis de l’utilisateur courant.
Institut Mines-Télécom
Evaluation de la qualité des
recommandations
21/07/2015 Les systèmes de recommandations 51
Institut Mines-Télécom 21/07/2015 Les systèmes de recommandations 52
Hors ligne
Evaluation hors ligne
• Jeux d’apprentissage et de test
─ Pas de convention pour définir ces jeux
• Algorithme de recommandation sur jeu d’apprentissage
• Matrice de score prédis ou k-recommandations
• Mesures de qualité
─ RMSE entre scores prédis et scores réels
─ Rappel, Précision, F1-Score, ROC
En ligne
Problème Chercher à « améliorer la prédiction des futures scores/actions des utilisateurs », diffère de « améliorer la qualité des recommandations »
Evaluation de la qualité des recommandations
Institut Mines-Télécom
Evaluation de la qualité des recommandations
21/07/2015 Les systèmes de recommandations 53
Hors ligne
Evaluation en ligne
• A/B testing
─ Test de recommandations différentes sur un groupe A et un groupe B d’individus
─ Validation méthode dont les recommandations ont amélioré une fonction objectif (augmentation du nombre d’achat, du bénéfice, du temps passé par les utilisateurs sur les pages, satisfaction des utilisateur, etc.)
En ligne
Problème Très couteux à mettre en place
Institut Mines-Télécom
Quelques perspectives du
domaine
Quelles pistes pour améliorer les
recommandations ?
21/07/2015 Les systèmes de recommandations 54
Institut Mines-Télécom
Quelques perspectives du domaine
o Social • Identification d’utilisateurs plus enclins à la recommandation sociale • Quelle est la nature exacte de la corrélation entre les intérêts utilisateurs et les relations sociales ?
Quel impact sur les recommandations ? • Recommandation considérant les relations sociales négatives
o Recommandation pour un groupe • Etude de la structure/dynamique d’un groupe pour la recommandation (qui est le chef ? qui est
influençable ? comment se propage l’information ?)
o Recommandations interactives • Profilage interactif de l’utilisateur par des questions/propositions explicites
o Profilage plus précis par analyse textuelle o Intégration des interactions textuelles, analyse de sentiments o Acquisition et intégration des tendances relatives aux habitudes
o Méthodes à apprentissage profond, deep learning o Formalisation des conditions d’évaluation des systèmes de
recommandation selon les caractéristiques du jeu de données et les objectifs de recommandation
o Recommandation combinatoire (cf. ma thèse) o Est-ce que les recommandations fournies par mon modèle tendent à
uniformiser les profils des utilisateurs ? Quelle est sa convergence ? o Plus généralement : systèmes de recommandation sensibles au temps
(TARS) et sensibles au contexte (CARS)
21/07/2015 Les systèmes de recommandations 55
Institut Mines-Télécom
Conclusion
o Un système de recommandation demande un(e): • Analyse/modélisation des interactions, comportements
• Analyse/profilage des utilisateurs, items
• Méthode/algorithme de recommandation basé sur ces analyses/modèles et dépendante des contraintes, objectifs de recommandation
• Méthode d’évaluation détaillée, comparaison avec d’autres méthodes dans les mêmes conditions
o De nombreuses pistes à développer dans le domaine
21/07/2015 Les systèmes de recommandations 57