View
110
Download
2
Category
Preview:
Citation preview
Réseaux de lecteurs et outils de médiation
ENSSIB – Mars 2014
Analyse de la prescription de livres en ligne
La recommandation automatisée de lecture
L’enrichissement d’OPAC en contenus 2.0
Un réseau de lecteur : mécanique et contenus
Réseaux de lecteurs et outils de médiation
2
1
2
3
4
Analyse de la prescription de livres en ligne
La recommandation automatisée de lecture
L’enrichissement d’OPAC en contenus 2.0
Un réseau de lecteur : mécanique et contenus
Réseaux de lecteurs et outils de médiation
3
1
2
3
4
Premier site français sur le livre
4
130 000 lecteurs membres
partagent leurs lectures, critiques et citations
1,8 million de visiteurs chaque
moisconsultent les notices enrichies du site à la
recherche de leur prochaine lecture
Première communauté de lecteurs
Site numéro 1 en trafic
1 2
La communauté des grands lecteurs
(Source : Enquête de lectorat Babelio – juin 2011) 5
Lecteurs lisant plus d’un livre par mois
96% 16%de la communauté
Babeliode la population française
1 130 000 lecteurs membres
Une communauté de très grands lecteurs
En tous genres
6
7
8
Une notice enrichie avec les informations bibliographiques de base et…
9
450 000 critiques de lecteurs Plus de 500 nouvelles par jour
La labellisation externe : 35 000 critiques de la presse généraliste et spécialisée
10
Encore besoin des vieilles autorités littéraires
75 000 vidéos de partenaires (médias, INA, éditeurs etc.) associés aux auteurs
11
1500 listes éditoriales communautaires
12
7 000 podcasts littéraires
13
Analyse de la prescription de livres en ligne
La recommandation automatisée de lecture
L’enrichissement d’OPAC en contenus 2.0
Un réseau de lecteur : mécanique et contenus
Réseaux de lecteurs et outils de médiation
14
1
2
3
4
15
… origine de la majorité des découvertes de livres
1.0%
28.4%
49.9%
20.1%
0.6%
Au moins une part importante de mes lecturesPour 79,3 % des lecteurs
Une faible part de mes lecturesPour 21% des lecteurs
Question : Diriez-vous que le bouche à oreille vous fait découvrir
Une part très importante Une part
importante
Une faible part Une part nulle … de mes lecturesLa totalité
Base lecteurs Babelio (942 int.)
16
Les auteurs les plus découverts par bouche à oreilleEncore plus jeune…Pourriez-vous citer entre un et trois auteurs que vous avez découverts par bouche à oreille?
Top 30 des auteurs, classés par nombre d’occurrences
1° Haruki Murakami
2° MaximeChattam
3° FranckThilliez
4° SuzanneCollins
5° JeanTeulé
7° RobinHobb
6° KatherinePancol
8° GuillaumeMusso
9° JoëlDicker
10° Carlos Ruiz Zafon
11° Eric-Emmanuel
Schmitt
Et du 12° au 30° : George R R Martin, Katarina Mazetti , Stephenie meyer, Stieg Larsson, David Foenkinos , Henning Mankell, Ken Follett , Carole Martinez , Mary Ann Shaffer, Stefan Zweig, Anna Gavalda , Camilla Lackberg , Fred Vargas , Marc
Levy , Delphine de Vigan , Amélie Nothomb , Barbara Constantine , Bernard Werber , Harlan Coben
17
Une forte présence des auteurs de genreEncore plus jeune…
1° Haruki Murakami
2° MaximeChattam
3° FranckThilliez
4° SuzanneCollins
5° JeanTeulé
7° RobinHobb
6° KatherinePancol
8° GuillaumeMusso
9° JoëlDicker
10° Carlos Ruiz Zafon
11° Eric-Emmanuel
Schmitt
Et du 12° au 30° : George R R Martin, Katarina Mazetti , Stephenie Meyer, Stieg Larsson, David Foenkinos , Henning Mankell, Ken Follett , Carole Martinez , Mary Ann Shaffer, Stefan Zweig, Anna Gavalda , Camilla Lackberg , Fred Vargas , Marc
Levy , Delphine de Vigan , Amélie Nothomb , Barbara Constantine , Bernard Werber, Harlan Coben
18
Des best-sellers de littérature générale
1° Haruki Murakami
2° MaximeChattam
3° FranckThilliez
4° SuzanneCollins
5° JeanTeulé
7° RobinHobb
6° KatherinePancol
8° GuillaumeMusso
9° JoëlDicker
10° Carlos Ruiz Zafon
11° Eric-Emmanuel
Schmitt
Et du 12° au 30° : George R R Martin, Katarina Mazetti , Stephenie meyer, Stieg Larsson, David Foenkinos , Henning Mankell, Ken Follett , Carole Martinez , Mary Ann Shaffer, Stefan Zweig, Anna Gavalda , Camilla Lackberg , Fred Vargas , Marc
Levy , Delphine de Vigan , Amélie Nothomb , Barbara Constantine , Bernard Werber , Harlan Coben
19
Des nouveaux auteurs découverts au premier roman
1° Haruki Murakami
2° MaximeChattam
3° FranckThilliez
4° SuzanneCollins
5° JeanTeulé
7° RobinHobb
6° KatherinePancol
8° GuillaumeMusso
9° JoëlDicker
10° Carlos Ruiz Zafon
11° Eric-Emmanuel
Schmitt
Et du 12° au 30° : George R R Martin, Katarina Mazetti , Stephenie meyer, Stieg Larsson, David Foenkinos , Henning Mankell, Ken Follett , Carole Martinez , Mary Ann Shaffer, Stefan Zweig, Anna Gavalda , Camilla Lackberg , Fred Vargas , Marc
Levy , Delphine de Vigan , Amélie Nothomb , Barbara Constantine , Bernard Werber , Harlan Coben
20
Au-delà du top 30 : la longue traîne du BO
Haruki Murakami Richelle Mead J.M. Coetzee Anthony E. ZuikerEdwin Abbott India DesjardinsLara B Sparrow Paul Veyne theorin0
5
10
15
20
25
30
35
40
45
1157 auteurs découverts
21
Davantage de bouche à oreille positif que négatif
Il y a davantage de critiques de livres très positives que très négativesComparatif sur la base des critiques Babelio associées à une note de 5/5 (positive) ou 1/5 (négative)
Critiques positives Critiques négatives0
10,000
20,000
30,000
40,000
50,000
60,000
70,000
80,000
22
Le BO sert plus à qualifier qu’à disqualifier un livre
Les critiques positives sont jugées plus utiles que les critiques négatives
x 3,5 x 2,2
Analyse de la prescription de livres en ligne
La recommandation automatisée de lecture
L’enrichissement d’OPAC en contenus 2.0
Un réseau de lecteur : mécanique et contenus
Réseaux de lecteurs et outils de médiation
23
1
2
3
4
Bookrank : algorithme de rapprochement de livres
24(Source : Google Analytics, mars 2012)
Statistique, sémantique, sociologique, Algorithmique?
Refaire société Vivre la fin des temps
Après lacrise
CapitalismeDésir et serviture
La fabrique deL’homme endetté
Application : le moteur de recommandation personnel…
Application : le moteur de recommandation thématisé
Application : le moteur de recommandation justifié
Quelles difficultés?
28
1 Pertinence qualitative
2 Pertinence quantitative
3Arbitrage sensibilité/précision
Ex : GEB => Musique ? Logique? Intelligence artificielle?
Ex : Favoriser la longue traîne?Rousseau => Voltaire ou Bachofen
Prendre des risques?
Quelles difficultés?
29
4 Data sparsity
5 Scalabilité algorithmique
6 Performance
Qualification d’un nouvel entrantLivre avec peu d’infos/nouveautés
Robustesse aux changements d’échelle
50 000 membres2 millions de titres3 millions de métadonnées…
Des problématiques propres au livre
Répétition d’auteur
Répétition de série/collections
Thématiques semi-structurées
1
2
3
Titre de Kundera => Titre de Kundera?
Gallimard Noire => Gallimard Noire ?
BD/Essai/Roman …
Besoin de mesurer les présupposés cognitifs du lecteur
Deux champs de R&D
31
Collecte et traitement de métadonnées
Algorithme de ranking user/book centric
• Prime aux réseaux sociaux : captation de données• Nouveaux enjeux : structuration de métadonnées
Métadonnées qualifiées
32
1 Métadonnées d’usage
(Source : Google Analytics, mai 2012)
• Lectures• Notes • Clics• Visites• Taux d’ajout, Etc.
2 Métadonnées descriptives
3Métadonnées non structurées
• Critiques• Extraits• Résumés• Titres
4 Métadonnées structurées
• Taxinomie• Date• Nationalité • Ontologie, etc.
Exemples de traitements de métadonnées
33
• Association des inflexions linguistiques : {roman, romans}• Association d’erreurs orthographiques : {cuisine, cuisne}• Association synonymique : {deuxième guerre mondiale, ww2}• Association thématique de premier ordre : {roman policier, polar et roman noir}
Algorithmie classique / Statistique
• Notation explicite/implicite• Clusters de populations• Corrélation statistique• Analyse qualitative prédictive
Traitements sémantiques
Traitement documentaire assisté
34(Source : Google Analytics, mai 2012)
Clusterisation algorithmique
35(Source : Google Analytics, mai 2012)
Algorithmes de filtrage
36
1 Filtrage collaboratif
(Source : Google Analytics, mai 2012)
Importance des notes, clusters de lecteurs«philosophie» => Musso«philosophie» => SchopenhauerDimension temporelle
2 Filtrage CB
3 Réseau neuronal
Feedback pertinenceIdentification des effets de bordsAlgorithmes autocorrectifs
Analyse de la prescription de livres en ligne
La recommandation automatisée de lecture
L’enrichissement d’OPAC en contenus 2.0
Un réseau de lecteur : mécanique et contenus
Réseaux de lecteurs et outils de médiation
37
1
2
3
4
Un service de
39
Un catalogue sans Babelthèque
40
5.Critiques de professionnels
3.Recommandations de lecture
précises sur 180 000 titres
2.Consultation et ajout de
citations
6.Notes d’internautes
7.Vidéos et podcasts d’auteur
(entretiens, bandes-annonces
etc.)
1. Consultation et ajout de
critiques
4.Etiquettes de classement, avec navigation dans le
catalogue
Un catalogue avec Babelthèque
Les critiques de Babelio et d’usagers
Fenêtre d’affichage des critiques de
Babelio et d’usagers
L’OPAC ne sera jamais un espace de contribution
42
La mise en avant des critiques de nouveautés
Pour mettre en valeur les acquisitions et l’enrichissement du catalogue
Un module pour afficher sur le portail les critiques des dernières acquisitions
Un outil de navigation et de découverte utilisant le langage des usagers 4 500 000 étiquettes en janvier 2014
La zone étiquettes associées
La zone « livres portant cette étiquette »
Traitement documentaire et algorithmique des étiquettes pour améliorer la qualification des œuvres et la navigation dans le catalogue
Identification des
étiquettes thématiques
proches
Les titres de votre
catalogue portant cette
étiquette
Les étiquettes navigables de classement
44
Extrait de la convention entre Babelio et la bibliothèque
« En cas de cessation du service Babelthèque, la Bibliothèque Contractante pourra obtenir sur demande une copie sous format Excel de l’ensemble des contenus saisis par les usagers dans l’OPAC de la Bibliothèque Contractante via Babelthèque. La licence relative à ces contenus concédée à Babelio sera alors transférée à la Bibliothèque Contractante »
2 - La bibliothèque reste propriétaire des contenus
générés dans l’OPAC
1 - Intégration transparente, en marque blanche
Sans logo Babelio, sans liens indésirables
3 - Vos usagers contribuent directement dans l’OPAC
Sans avoir besoin de s’inscrire sur Babelio
Intégration transparente et contrôlée
Testez Babelthèque dans les catalogues de Nîmes et de Toulouse
Limonov, d’Emmanuel Carrère, à Toulouse
45
http://goo.gl/tw6s5 http://goo.gl/YMZGs
Portugal, de Cyril Pedrosa, à Nîmes
Découvrir Babelthèque
Recommended