Algorithme de suggestion: Vos données au service de Netflix

Embed Size (px)

Citation preview

1. Algorithme de suggestionVos donnes au service de NetflixEmmanuel Nunes de Pontes et Cedric JollecL3 Industries Culturelles, Arts et SocitUniversit Lille 3 Charles-De-Gaulle 2. En quelques mots...- Netflix est un service de vido la demande par abonnement. Ils proposent devisionner en streaming et en illimit un catalogue compos de films et de sries.- L'entreprise a t fonde en 1997 Los Gatos aux Etats-Unis par Reed Hastings.- Netflix compte aujourd'hui plus de 50 millions d'abonns dans 15 pays, dont la France,o le service est disponible depuis le 18 septembre 2014.- L'abonnement cote environ entre 8 et 13. Le forfait dpend du nombre d'cransprofitant du service en simultan et de la qualit de l'image (standard, HD, ou ultra-HD).Le service est financ dans sa quasi-totalit par ses abonns et non par la publicit, cesont donc 50 millions de personnes qui chappent ainsi aux annonceurs.- Le flux continu de diffusion web de Netflix est responsable du tiers de laconsommation de la bande passante mondiale. 3. Qu'est-ce qu'un algorithme ?Un algorithme est une suite dfinie d'oprations ou de rgles appliquer dans un ordre determin, un nombre dfini dedonnes, pour arriver un resultat en un nombre fini d'tapes.Par exemple : Faire une recherche dans un dictionnaire est uneforme d'algorithme : On cherche d'abord notre mot grce lapremire lettre, puis en cherchant par rapport la seconde lettredu mot etc Appliqu l'informatique, il s'agit d'un systme qui vaautomatiquement suivre une suite d'oprations coposed'actions lmentaires appeles instructions. 4. L'Algorithme de Suggestion - Particularit propre Netflix et qui le dmarque de ses concurrents : Son systme de suggestion pouss.Il s'agit d'un systme brevet et exclusif Netflix. Ils n'ont jamais voulu cder les droits d'autres servicesde SVOD ou d'autres sites, marchands par exemple.- Il s'agit d'un algorithme complexe permettant, via plusieurs moyens de rcupration de donnes, deproposer un programme bien dfinit un utilisateur prcis. En valuant ses gots, cet algorithme permetau service de mettre en avant du contenu qui est susceptible de plaire l'utilisateur.- Cet algorithme est en amlioration constante. De 2006 2009, Netflix offrait le Prix Netflix et 1M dedollars quiconque pourrait amliorer lalgorithme Aujourd'hui, ces amliorations se basent sur des testseffectus sur des chantillons d'utilisateurs, souvent leur insu.- C'est Neil Hunt est la tte d'une quipe de 800personne charges du dveloppement de lalgorithme ausein de l'entreprise et de son amlioration. Cette sectionreprsente elle seule 8% des investissements de Netflix.75 % des programmes consomms le sont grce son systme derecommandations et non pas par le biais du moteur de recherche. 5. Le systme de suggestion en actionPour mettre en image le systme de suggestion et montrer sa pertinence, nous avons cre deuxcomptes factices, bass sur des strotypes. Nous avons bas ce test sur le premier moyen qu'al'algorithme pour valuer les gots de l'utilisateur : Le service vous demande, la cration ducompte, de choisir trois films ou sries dans une liste pour crer une base sur laquellefonder ses propositions.Pour le compte de Michel , nous avons choisi des films d'action, et pour le compte Marie , plutt des films romantiques. 6. Nous avons donc choisi trois films d'actionpour ce compte. Aprs un temps derecherche, l'algorithme trouve dans lecatalogue ce qui peut correspondre auxgots de Michel .Pour tablir cette premire liste, l'algorithmese base sur les choix l'inscription, maisaussi sur d'autres moyens pour hirarchiserles contenus selon leur intrt via desprocessus que nous voquerons ensuite. 7. Mme chose pour le compte Mariepour lequel nous avons choisi troisfilms comdies romantiques. Lersultat est diffrent et probant. 8. Ce qu'en pensent les utilisateurs43%57%ToujoursJamaisLa plupart dutemps Je me laisse souvent guider par ce que mepropose Netflix, car mme si a manqueencore un peu de contenu, a nous permetde dcouvrir de nouvelles sries et d'toffernos connaissances. (Nathan L., 24 ans, en concubinage, Expertrseau et tlphonie, La Madeleine)En gnral, trouvez-vous que le service desuggestion marche bien, que les films etsries proposs correspondent vosgots ? A mon inscription, j'ai moi-mme cherchles programmes que je voulais regarder.Maintenant, je fais rarement de recherches,je regarde ce que Netflix propose jusqu'trouver quelque chose qui m'intresse. (Celia A., 22 ans, clibataire, tudiante, Lille) Je cherche moi mme les programmesmais cela peut s'avrer intressant quand ilme suggre des films qui collent auxdiffrents genres que j'ai l'habitude deregarder et que je n'ai pas vu (Frdric P., 36ans, mari, agent essai SNCF, Tours) 9. Comment a marche ? Dis-moi ce que tu regardes je te dirai qui tu es - Ds l'inscription, choisir dans une liste trois programmes pour valuer les gots.- Les films sont alors hirarchiss mais avant tout, les genres sont hirarchiss eux aussi par intrtdans la page (exemple : Le genre film d'action arrivera en premier sur la page de Michel alors quela catgorie Comdie Romantique arrivera en premier sur la page de Marie )- Une fois que vous avez commenc utiliser le service, l'algorithme va analyser ce que vous regardez etvous proposera d'autres programmes lis celui que vous venez de voir.- Le principal point de repre pour l'algorithme, ce sont les autres utilisateurs. Ainsi, les propositions quisont faites aprs le visionnage sont bases sur ce qu'ont regard d'autres utilisateurs qui ont visionn lemme film. Et si vous ne suivez pas cette liste de proposition et que vous en choisissez autre chose,l'algorithme entrera ce nouveau film dans ses calculs pour le prochain utilisateur qui regardera ce film. Etainsi de suite.Propositions aprs avoir regard StarTrek 10. - L'algorithme prend aussi en compte si un usager regarde un programme dans sonentiret. Ainsi, il prendra en compte ou non dans ses calculs le programme qu'il vient devisionner, selon si le visionnage est abandonn au bout de deux minutes ou si l'usager avisionner toutes les saisons d'un coup.Episode regard dans sa totalitRegard partiellement- Pour amliorer ses suggestions, Netflix demande dsl'inscription de participer des valuations . Ilsdemandent ainsi de noter des films avec un systme d'toiles.En comparant les valuations d'un usagers avec ce qu'ilregarde, l'algorithme pourra affiner le profil de l'utilisateur etainsi s'en servir comme point de repre pour d'autres qui ontregard les mmes contenus.- A la base, l'algorithme de suggestion se basaituniquement sur ces valuations et ce systme d'toiles.Mais Netflix remarqua que les rsultats n'taient pas assezprcis et ils choisirent de complter ce systme par d'autresplus efficaces. 11. Quand un utilisateur sassoit pour choisir quelque chose regarder, nousn'avons que quelques minutes et au mieux 50 propositions possibles pour capterson attention. Donc si nous pouvons utiliser le systme de recommandation pourtre plus pertinents dans ces 50 premires propositions nous augmentons leschances de le satisfaire - Neil Hunt, responsable du dveloppement de l'algorithme de suggestionCes 50 propositions possibles correspondent la pages daccueil de Netflix. C'est pour cela qu'unehirarchisation des genre et des films en fonction des gots de l'utilisateur est si important : Pouravoir immdiatement ce qu'il attend et ce qu'il est cens aim devant les yeux. 12. - L'algorithme prend aussi en compte la plate-forme utilise et propose des programmes en fonction. (Unprogramme humoristique court sera plus propice un visionnage sur tlphone mobile alors qu'un filmsera plutt propos sur des plate-formes relies la tl.)- Pour une recommandation encore plus prcise, Netflix voudrait intgrer dans son algorithme desuggestion une nouvelle option : Celle des recommandations en fonction de l'heure de lajourne. Par exemple, plus de dessins-anims aprs 16h quand les enfants rentrent de lcole.- Pour constamment amliorer son algorithme, Netflix procde aussi des tests sur desgroupes d'utilisateurs leur insu. Ainsi, ils peuvent tre scruts en particulier et en dtail, ouencore tre l'objet de test sur lergonomie de la page. Ils observent ainsi les ractions sans que lapersonne ne le sache.Note : On peut tout de mme refuser d'tre un cobaye en fouillant dans les options. 13. - Pour augmenter encore la prcision et allerau-del d'une catgorisation basique de sesfilms par genre, l'algorithme se base sur dessous-catgories ultra-prcises, ajoute lamain par les ingnieurs avec des tagsallant l'extrme dans le dtail. (exemple : films traitant du voyage dans le temps etraliss dans les annes 80 ).Rcemment, un journaliste de The Atlantic arfrenc tout ces tags : Il y en a 76 897(pour le moment). Ces sous-rfrencespermettent de donner des tags ultra-prcis etd'valuer un contenu selon des micro-critresqui colleront au profil d'un utilisateurpour lui tre propos. 14. Rcupration de donnes d'utilisation :Quels avantages pour Netflix ?- L'utilit de ces analyses de donnes ne se limite pas au systme de suggestion mais vabeaucoup plus loin. Elle ne sert pas qu' amliorer lexprience de l'utilisateur mais aussi aider Netflix dans son dveloppement en tant que service et en tant quesocit cratrice de contenus.- Pour ce qui est de l'utilisation du service, un exemple trs simple et voqu par NeilHunt : Les images utilises pour illustrer les programmes. En analysant le comportementde 500 000 usagers leur insu travers 300 tests, ils ont pu s'apercevoir que le simplefait de changer une image d'illustration pour modifier le nombre de visionnaged'une srie ou d'un film : En choisissant une image plutt quune autre pour proposer Breaking Bad, lenombre de visionnages ntait pas le mme. - Neil Hunt 15. Dans le mme ordre d'ide, la diffrence entre lergonomie des pages de prsentation deprogrammes produits par Netflix et ceux qui ne le sont pas : Alors que les productions Netflixhritent d'une ergonomie faite pour plaire l'utilisateur selon les donnes tudie, lesprogrammes qui ne sont pas produits par Netflix possdent une prsentation plus austre .Page de prsentation d'un programmeproduit par NetflixPage de prsentation d'un contenu quin'est pas produit par Netflix 16. - Non seulement Netflix met en avant ses programmes en utilisant une ergonomie plus attrayantepour ces derniers, base sur les prfrences de ses usagers, mais surtout, ils utilisent cesdonnes en tant que socit cratrice de contenus.- La srie House Of Cards , produite par Netflix, a t cre en suivant les donnesamenes par le systme de suggestion : Pour House of Cards, nous savions grce nos donnes, que nous avions un publicprt pour un drame politique qui se passerait Washington avec une storyline dramatique.Et nous tions capables didentifier dans notre base, les personnes spcifiquementconcernes. - Neil Hunt 17. Utilisation de donnes lies l'utilisation : Des utilisateursheureux ou inquiets ?- Netflix avoue de manire assume comment leur systme d'observation des donnesd'utilisation marche.- Comme tout systme d'observation, il est lgitime de se poser des questions sur sa lgitimit etsurtout si cela drange ou non le public du service. Je ne vois pas a comme une intrusion oude l'espionnage. Je sais quand j'utilise desservices comme Netflix que mon activit estanalyse. J'utilise normment Spotify aussiet au final a ne me drange pas; aucontraire, a me permet de dcouvrir dessries/films que je ne connaissais pas -(Celia A., 22 ans, clibataire, tudiante, Lille) a ne m'inquite absolument pas. Lesystme marche dans les deux sens et il estpositif pour mon exprience Tant qu'ils nesimmiscent pas plus loin dans la vie prive Et qu'ils n'utilisent pas mes donnes pourcrer des publicits cibles. (Nathan L., 24ans, en concubinage, Expert rseau et tlphonie,La Madeleine) Pour moi, c'est est une intrusion voiremme de l'espionnage. - (Frdric P., mari,agent d'essai frroviaire, Jou-ls-Tours (37)) 18. Selon cette tude du Boston Consulting Group Le Big Data face au dfi de laconfiance , 78 % des personnes en moyenne pensent qu'il est ncessaire d'treprudent lorsqu'il s'agit de partager ses donnes, mais concernant l'usage desmdias et les prfrences, 50 % des gens pensent que a ne fait pas partie de lasphre prive. 19. Alors pourquoi tant de gens font confiance Netflix alors que ces derniers scrutent desdonnes que 50 % des sondes jugent tout de mme comme tant prives ?- En fait, il est surtout question de confiance entre collecteur et collect. Il existe une forme d'acceptation del'utilisateur quand il s'agit de l'utilisation de ses donnes si celles-ci sont utilises raisonnablement et leurprofit. C'est une sorte contrat symbolique que l'tude du Boston Consulting Group dcrit : La confiance est llment cl qui lie lentreprise ses clients. Elle est longue stablir mais peut treruine trs rapidement. Les tudes du BCG ont dmontr que, dans un domaine aussi sensible que le BigData, la confiance sera llment dterminant pour permettre lentreprise davoir le plus large accspossible aux donnes de ses clients, condition quils soient convaincus que ces donnes seront utilisesde faon loyale et contrle.[] Le Big Data est au point de rencontre de trois volonts contradictoires :- Celles des entreprises davoir accs au maximum de donnes personnelles de leurs clients afindamliorer leurs offres de produits et services et leurs rsultats conomiques ;- Celle de certains tats et des instances de rgulation qui entendent encadrer le plus troitement possiblelaccs ces donnes et leur utilisation ;- Celle des consommateurs qui souhaitent bnficier dun service individualis et pertinent, tout en gardantle contrle sur lutilisation de leurs donnes.Seules les entreprises qui sauront tablir un lien de confiance avec leurs clients et le rgulateur, par uneutilisation raisonne des donnes personnelles, seront en mesure de rconcilier ces trois volontscontradictoires. 20. Finalement, on pourrait en conclure que Netflix russit plutt bien sa part ducontrat et que, l'utilisateur y trouvant son compte, est satisfait en gnral duservice, comme le montre ce sondage que nous avons initi :4%96%Satisfait duservicePas satisfait 21. Pour rsumer :- Netflix propose un algorithme de suggestion de plus en plus pouss pour coller au maximum aux gotsde ses utilisateurs et lui proposer ce qu'il veut voir.- Il se sert aussi des donnes recueillies par l'algorithme pour laborer et produire ses propresprogrammes en les fondant sur ce que les utilisateurs veulent voir.- Tout cela se fait en analysant et en rcoltant un maximum d'informations sur les habitudes de visionnagesdes utilisateurs, via diffrentes mthodes, et parfois leur insu.- Pourtant, les avis des utilisateurs sur cette pratique diverge. Si certains acceptent, comme s'il s'agissaitd'un accord qui va dans leur sens, qui leur offre en contre-partie d'avantages dans l'utilisation du service etde son contenu, d'autres se montrent plus rticent cette pratique.- Mais comme l'a montr l'tude du BCG, il existe un contrat implicite entre l'utilisateur et le service :L'utilisateur est plus enclin partager ses donnes si ces dernires sont utilises son profit, bonescient, et avec transparence. En contre-partie, si ce contrat est respect, le service a la confiance de sesusagers en ce qui concerne ses donnes, l'entreprise peut perdurer. Leffondrement de la confiancesignifierai aussi la fin de l'entreprise.- Netflix, qui continue de perdurer et de se dvelopper, prouve qu'il a la confiance de ses utilisateurs et quece contrat est respect. 22. WEBOGRAPHIE- Analle Grondin. Netflix mise beaucoup sur son systme de recommandation personnalis [en ligne]. 20 Minutes, 15septembre 2014, mise jour le 16 septembre 2014 [consult le 7 novembre 2014]. Disponible sur:http://www.20minutes.fr/medias/1443351-20140915-video-netflix-mise-beaucoup-systeme-recommandation-personnalisee- Amlie Charnay. Interview : comment Netflix scrute l'activit de visionnage de ses abonns [en ligne]. 01.net, 6octobre 2014 [consult le 7 novembre 2014]. Disponible sur:http://www.01net.com/editorial/627544/interview-comment-netflix-scrute-lactivite-de-visionnage-de-ses-abonnes/- Emmanuelle Delsol. L'homme qui se cache derrire les algorithmes de Netflix explique le succs du service de SVOD[en ligne]. L'Usine Digitale, 18 septembre 2014 [consult le 8 novembre 2014]. Disponible sur:http://www.usine-digitale.fr/article/l-homme-qui-se-cache-derriere-les-algorithmes-de-netflix-explique-le-succes-du-service-- Fabien Major. 8 faits tonnants sur Netflix [en ligne]. Canoe.ca, le 15 septembre 2014 [consult 9 novembre 2014].Disponible sur: http://fr.canoe.ca/argent/chroniques/fabienmajor/archives/2014/09/20140915-094720.html- Thomas Destouches. Netflix : le directeur technique nous explique comment a marche ! [en ligne]. Allocin [consultle 8 novembre 2014]. Disponible sur : http://www.allocine.fr/article/fichearticle_gen_carticle=18636717.html- ACM Recsys. RecSys 2014 Keynote by Neil Hunt: Quantifying the Value of Better Recommendations. Youtube.com. partir de 56:00.http://www.youtube.com/watch?v=lYcDR8z-rRY (consulte le 10 novembre 2014) 23. - Vincent Coquaz, Comment Netflix cerne vos dsirs (mme inexprims) [en ligne], arrt sur image, 7 juillet 2014[consult le 7 novembre 2014]. Disponible sur :http://www.arretsurimages.net/breves/2014-07-07/Comment-Netflix-cerne-vos-desirs-meme-inexprimes-id17672- Alexis C. Madrigal, How Netflix Reverse Engineered Hollywood [en ligne], The Atlantic, 2 janvier 2014 [consult le 7novembre 2014]. Disponible sur :http://www.theatlantic.com/technology/archive/2014/01/how-netflix-reverse-engineered-hollywood/282679/?fb_action_ids==[]- Sbastian Seibt, Netflix et le culte du big data : la traque des habitudes du tlespectateur, France 24 [consult le 7novembre 2014]. Disponible sur :http://www.france24.com/fr/20140521-netflix-france-big-data-house-cards-television-algorithme-recommandation-internet-- Phillipe Flajolet, Etienne Parisot: Quest-ce quun algorithme ? , Interstices [consult le 27/11/2014]. Disponible sur:https://interstices.info/jcms/c_5776/quest-ce-quun-algorithmeArticle de recherche- Umhoefer, C ; Rof, J ; Lemarchand, S ; Baltassis, E ; Stragier, F ; Telle, N Le Big Data au dfi de la confiance (juin 2014), The Boston Consulting Group et DLA Piper. Disponible sur : http://www.bcg.fr/documents/file172040.pdf