19
LA DATA SELON WEBORAMA

La data selon Weborama

Embed Size (px)

Citation preview

Page 1: La data selon Weborama

la dataselon weborama

Page 2: La data selon Weborama

data

application

de la segmentation

d’audience

au pilotage du média

par la

Page 3: La data selon Weborama

l’univers

data

la montée en puissance du digital

et les nouvelles possibilités qu’il offre

en matière de publicité ont chamboulé

l’écosystème publicitaire qui, depuis

l’âge d’or de madison avenue, était

principalement fondé sur la création.

pour autant, il ne faut pas perdre de vue

que la data (désormais à portée de main

grâce au plus jeune des médias)

« n’est pas en train de tuer la créativité,

mais simplement de changer notre

manière de raconter des histoires. »

(alex Williams, journaliste Tech Crunch)*

big * “(Data) is not killing creativity, it’s just changing how we tell stories”.

Page 4: La data selon Weborama

ès l’apparition des métiers publi citaires, les profes-sionnels du marke ting ont rêvé de ne s’adresser qu’à des audiences utiles, c’est-à-dire poten-tiellement intéressées par leur offre. le monde de la communication a connu de très bonne heure la définition de « cibles marketing » : la ménagère de moins de 50 ans, les csp+, les

early adopters ou les seniors. le développement du marketing direct et des bases de données crm

– ou prm – ont permis d’affiner et de préciser le ci-blage, et de s’adresser véritablement au consommateur.

le média internet et les nouvelles technologies ont boule-versé le con cept même de la cible. le rêve devient désor-mais réalité puisque la navigation des internautes est tra-çable. les annonceurs peuvent toucher leurs clients et prospects en se basant non seulement sur les actions déjà accomplies par l’internaute (achat, demande de conseil, essai d’un produit, etc.), mais également sur ses besoins futurs, prédictibles grâce au suivi et à l’analyse mathéma-tique de leur comportement en ligne.le phénomène big data prend de l’ampleur, les marques peuvent désormais centraliser et exploiter toutes les sour-ces de données disponibles, qu’elles soient offline ou on-line, média ou crm. avec comme finalité, d’une part, d’en-richir la connaissance de leurs clients avec les données de navigation sur internet pour mieux les fidéliser, et d’autre part de créer des bases d’internautes potentiellement acheteurs de leurs produits et services.

« J’ai en tête cette fameuse illustration de Pierre Steiner parue dans le New Yorker en 1993 : “Sur Internet, person-ne ne sait que vous êtes un chien.” De nos jours, ce serait davantage : “Sur Internet, tout le monde sait quelle mar-que de nourriture pour chien vous achetez.”*.

Le big data ne concerne pas seulement le marketing, même si ce secteur en tire évidemment les bénéfices.

il y a également la finance, la santé, le sport, la météorolo-gie… selon le journaliste John edwards, « Comme la mort et les impôts, la météo est une certitude. Et, grâce au Big Data, elle est désormais une certitude plus prévisible. »** dans tous ses domaines, le big data confère plusieurs avantages déterminants : la fiabilité, la fraîcheur et la perti-

nence des données. pourtant, à l’état brut, les données ne possèdent pas de valeur. les technologies adaptées et l’intelligence humaine sont nécessaires pour leur donner du sens.

les difficultés liées au big data concernent surtout le vo-lume et l’hétérogénéité des données qui doivent être trai-tées à très grande vitesse. stephen gold (ibm) estime en 2012 que « 90 % de l’ensemble des données du monde ont été créées ces deux dernières années ». mais le grand en-jeu pour tout data scientist n’est pas seulement de dispo-ser d’un espace de stockage illimité ou de mettre au point des algorithmes rapides et puissants : il s’agit de rendre la data pertinente et vivante, de la faire parler, ce qui consti-tue une tâche plus complexe. Comme exemple : un algorithme se donne pour but de déceler les lieux de vie d’une personne, ingérant les don-nées de géolocalisation liées à son mobile. Les premiers résultats aboutissent à trois lieux : le domicile de la per-sonne, son bureau et... un feu rouge sur une grande ar-tère. Sans intelligence humaine, les traitements du Big Data ne peuvent aboutir à un résultat pertinent.

Pour relever ces défis, le big data puise non seulement dans les technologies les plus modernes, mais aussi

dans les acquis scientifiques du passé. la mise au point de tests statistiques d’hypothèse, des premiers arbres de dé-cision, très utilisés dans le domaine de la segmentation marketing, date de 1900. ces modèles continuent d’être améliorés aujourd’hui. À l’inverse, « map reduce » est un algorithme de traitement de la donnée moderne, fondé sur un mode de calcul des données distribué en parallèle, très en vue dans le monde du big data, apparu en 2004. les nouveaux modèles de stockage (par exemple le cloud) et de bases de données rendent en partie obsolète les bases relationnelles comme sQl. l’univers du big data est en mouvement perpétuel.

en ce qui concerne les experts data, ils possèdent des compétences variées. mais ce qu’ils ont tous en commun, c’est l’ouverture aux nouvelles technologies et la capacité à les accorder aux acquis (théorèmes, algorithmes) parfois anciens. une connaissance historique des mathématiques et des statistiques est un atout de tout expert data.

“I think of that famous 1993 New Yorker cartoon by Peter Steiner: ‘On the Internet, nobody knows you’re a dog.’ Now it’s more like, ‘On the Internet, everybody knows what brand of dog food you buy”*.Geoff Nunberg enseigne la linguistique à l’université de Californie, à Berkeley. Il est l’auteur de The Way We Talk Now, Going Nucular, Talking Right and The Years of Talking Dangerously. Son dernier ouvrage paru est Ascent of the A-Word. Il intervient comme consultant linguistique dans l’émission de NPR Fresh Air, animée par Terry Gross.

D’aPrèS DougLaS MerriLL, fonDateur et Ceo De ZeStfinanCe.CoM, « With too little data, you won’t be able to make any conclusions that you trust. With loads of data you will find relationships that aren’t real… Big data isn’t about bits, it’s about talent  ».(avec trop peu de données, vous ne serez pas capables de tirer des conclusions dans lesquelles vous puissiez avoir confiance. en collectant des tas de données, vous allez établir des relations qui ne sont pas réelles… le big data n’est pas une affaire de bits, mais de talent).

“Like death and taxes, weather is a certainty. And, thanks to Big Data, it’s now a more predictable certainty”.

*

**

Page 5: La data selon Weborama

la vision

data SCIeNCede Weborama

‘‘ ‘‘La data au cœur de L’activité de Weborama

Depuis sa création il y a 15 ans, Weborama est enga-gée dans la science de la data au service du marke-

ting en ligne.

pionnier de l’innovation technologique sur son marché, Weborama investit constamment dans son service r&d, dont l’effectif constitue 52 % des effectifs totaux de la so-ciété. la data est au cœur de son expertise, grâce aux data strategists, aux consultants data, aux linguistes-informati-ciens, aux statisticiens, aux mathématiciens et aux déve-loppeurs.

le big data est aujourd’hui le moteur des développements de Weborama et il continuera de l’être dans le futur. avec toujours le même souci de collecter des données anony-mes, l’individu bénéficie des recherches et des études construites et calibrées sur la masse.

Le respect de La vie privée

Depuis sa fondation en 1998, Weborama porte une at-tention particulière au respect de la vie privée des in-

ternautes. la société participe activement aux nombreux chantiers e-privacy de l’industrie digitale française.

précurseur dans le domaine, Weborama milite depuis plusieurs années pour la transparence des acteurs de son marché envers les consommateurs. parmi les nombreuses initiatives entreprises par la société, la co-rédaction du li-vre blanc « ciblage publicitaire et respect de l’internaute » de l’iab, signature de la charte paneuropéenne de la publi-cité comportementale ou bien de la charte de l’union fran-çaise du marketing direct et digital (uFmd).

en accord avec les législations en vigueur, les internautes peuvent se désinscrire à tout moment du programme de collecte de Weborama, soit à partir d’opt-out sur le site du groupe, soit via l’icône Ad Choices, présente sur toute publicité ciblée et renvoyant vers le site YourOnlineChoi-ces de l’iaB europe.

Page 6: La data selon Weborama

les questions de la vie privée des internautes ont fait l’ob-jet de l’ouvrage d’alain levy, président de Weborama, « sur les traces de big brother, la vie privée à l’ère numéri-que »*. prônant l’importance de l’éducation du grand public au digital, il conclut : « […] pour que les internautes accep-tent cette quête incessante de données, il est fon damental que les sociétés de ce domaine soient mieux connues du grand public, en communiquant davantage sur leurs prin-cipes éthiques, et en consolidant un socle de bonnes prati-ques. […] elles doivent engager le dialogue avec leurs clients, leurs salariés, leurs actionnaires, leur environnement politique, les associations, les consommateurs. […] nous ne “fliquons” personne. nous essayons de mieux comprendre les goûts et les habitudes des internautes afin de ne les exposer qu’à des messages qui collent à leur profil et ré-pondent à leurs attentes. c’est l’application du principe de développement durable à la publicité. »

une vision sémantique d’internet

L’approche « data science » de Weborama consiste à collecter et à traiter les données, afin de les analyser

et de les segmenter de façon à ce qu’elles puissent être déployées au sein des campagnes publicitaires. Webo-rama considère le web comme un espace lexical infini où les mots entretiennent des relations de proximité ou de distance en fonction du contexte dans lequel ils apparais-sent, tel que ce contexte est révélé par les requêtes des internautes (le « search ») et par le contenu lexical des sites qu’ils visitent (le « surf »). provenant de 300 000 sites sour-ces, les données sont collectées de façon anonyme, via les cookies, et instantanément traitées. cette classification de l’audience constitue un processus stratégique au sein de chaque base de données. grâce à cette méthodologie, Weborama dispose d’une base de données de 110 millions de profils comportemen-taux, sociodémographiques et intentionnistes en europe, dont 70 millions en France.

33 m d’urls actives

300 000 sites analysés chaque jour

110 m de profils actifs par mois

3,5 m d’internautes qualifiés par jour

25 mots par jour et par internaute

Weborama identifie ce jour près de 200 clusters (centres d’intérêt) basés sur le comportement des internautes et répartis dans 23 segments (un segment étant une « fa-mille » de clusters).

la base sociodémographique de Weborama est cons-truite à partir d’un panel. celui-ci est constitué de 300 000 in ternautes actifs en France ayant répondu à un questionnaire de leur plein gré et ayant renseigné leur âge, sexe et catégorie socioprofessionnelle. grâce au croise-ment des clusters comportementaux et du panel sociodé-mographique de Weborama, les données du panel sont extrapolées à l’ensemble de la base.

La technoLogie au service de La « data science »

L’ensemble des solutions de Weborama est alimenté par les technologies brevetées, basées sur les algo-

rithmes propriétaires et le traitement automatique du lan-gage (tal). la robustesse des outils de collecte et de stockage, ainsi que la solidité de l’infrastructure, permet-tent le traitement instantané de très importants volumes de données.grâce à la navigation intuitive, la dimension technologi-que s’efface au profit d’une expérience utilisateur cen-trée sur la data.

* alain levy, « sur les traces de big brother, la vie privée à l’ère numérique », l’éditeur, 2010, paris.

Page 7: La data selon Weborama

- Weborama Audience Insight (outil d’analyse compor-tementale d’audience des sites internet) ;

teChnoLogy : - Weborama Campaign Manager (outil d’adserving permettant la gestion et l’optimisation des campagnes publicitaires).

grâce à ces outils, Weborama réussit le passage de la micro donnée au big data, c’est-à-dire d’une suite d’évé-nements insignifiants produits par l’internaute lors de sa navigation, à la construction de son profil marketing complet.

annonCeurS- Data CrM- Data Du Site internet- Data MéDia

éDiteurS- Data reLative à L’auDienCe Du Site

traCking

aD exChangeS

Data“3rD Party”

Le dépLoiement du savoir-faire de Weborama au sein du marché pubLicitaire

La base de données 3rd party* de Weborama, une véri-table source d’enrichissement des données 1st party**,

constitue le pilier de l’ensemble des outils mis à disposition des clients. l’efficacité de sa data est éprouvée par We-borama, son premier utilisateur depuis 15 ans, aussi bien au sein des campagnes publicitaires branding et perfor-mance (bundle data & media, proposé par Weborama au sein de sa plateforme publicitaire, Weborama Audience exchange, et testé par rapport aux campagnes non-ci-blées), que pour les études marketing.

Weborama propose trois solutions technologiques com-plémentaires et communicantes :

Data SCienCe- Weborama Audience Manager (data management platform) ;

* données d’un acteur tiers, n’appartenant pas à un annonceur ou un éditeur, mais mises à sa disposition pour le déploiement au sein de ses actions marketing

en ligne.

** données propriétaires d’un annonceur ou d’un éditeur.

Page 8: La data selon Weborama

applications possibles de la

&usage de la

data SCIeNCe

data 3rd PARTy

Page 9: La data selon Weborama

la segmentation pour les annonceurs

La démarche

Les informations récoltées sur internet constituent une vraie mine de savoir. pour en tirer profit, il est néces-

saire de traiter et d’analyser un volume de données dispo-nibles très important, après avoir déterminé celles qui sont susceptibles d’améliorer le roi digital d’un annonceur.

il existe de nombreuses techniques de ciblage des inter-nautes. souvent basées sur les cibles marketing histori-ques de l’annonceur, ces techniques ne se montrent pas toujours aussi efficaces qu’on le voudrait. pour déterminer les ciblages plus précis, il convient donc de regarder les performances des campagnes média, en prenant en comp te le profil des internautes exposés ou « cliqueurs » et les données relatives aux « transformations » (souscrip-tions aux produits proposés par la campagne).

la segmentation de l’audience d’un site internet ou d’une campagne publicitaire permet de déterminer les cibles utiles en fonction de l’offre de l’annonceur. ces cibles pourront être déployées au sein des campagnes média à venir. dans l’optique de l’extension d’audience, il est désor-mais possible de cibler les « look alike », c’est à dire les in-ternautes ayant le profil similaire à celui des internautes qui « transforment ». cela permet de leur proposer une pu-blicité personnalisée en fonction de leur profil.

première appLication pratique par un annonceur

La première application de la segmentation d’audience des campagnes média a été réalisée en 2012. ce dé-

ploiement de la segmentation a eu lieu pour un annonceur dont le catalogue d’offres était très fourni, ce qui rendait plus complexe la définition de ses cibles marketing. bien que disposant d’une base crm très fournie, cet acteur souhaitait mieux connaître les cibles potentiellement inté-

ressées par chacune des offres et chacun des produits sur le digital, dans une optique de recrutement de nouveaux clients, mais également de ventes croisées.

l’objectif poursuivi était ainsi d’optimiser les campagnes digitales pour augmenter le taux de transformations et li-miter la déperdition des investissements média. pour at-teindre cet objectif, l’annonceur a fait appel à Weborama afin de construire un dispositif correspondant à son cata-logue commercial.

méthodoLogie Weborama

La segmentation d’audience pour les annonceurs com-prend plusieurs étapes. après la phase de modélisa-

tion, suit une phase de validation des modèles, puis une phase de tests au sein de campagnes média. la démarche s’inscrit dans l’ensemble des processus data proposés par Weborama : collecte de la data brute, traitement, analyse, segmentation et enfin déploiement média.

dans le cadre de la segmentation au service du pilotage du média par la data, les étapes de la démarche se tradui-sent de la façon suivante :- la constitution d’une base de datamining, provenant d’une ou de plusieurs campagnes média de l’annonceur ;- l’entraînement du modèle, au cours duquel sont émises des hypothèses sur les cibles utiles des offres ou produits concernés ;- le calcul des arbres de segmentation ;- la mise au point du modèle de ciblage publicitaire ;- la simulation d’une campagne média ayant pour but de confirmer les hypothèses émises lors de l’entraînement du modèle ;- la diffusion d’une campagne ciblée et a/b testing (compa-raison des résultats de la population ciblée et non ciblée).

Page 10: La data selon Weborama

Constitution d’une base de dataminingavant de segmenter l’audience de l’annonceur, Webora-ma a construit une base d’internautes exposés aux cam-pagnes de celui-ci, ou ayant visité son site. cette base est enrichie par des critères sociodémographiques et com-portementaux pour les internautes dont Weborama con-nait le profil, grâce à sa base de données de 70 millions de profils qualifiés en France. ces données sont croisées avec celles de Weborama Campaign Manager. l’ensemble de ces informations anonymes est accessible via l’identi-fiant de l’internaute (qui est une suite de caractères propre à chaque individu contenue dans les cookies déposés dans le navigateur internet). cet identifiant unique permet à Weborama de retrouver dans sa base de données, en temps réel, le profil complet de l’internaute.

Weborama a appliqué dans cette démarche les données provenant du search (requêtes dans les moteurs de re-cherche) et du surf (navigation à travers la toile) des inter-nautes, afin de leur attribuer le profil correspondant à leur sexe, âge et catégorie socioprofessionnelle, ainsi qu’à leurs centres d’intérêt et leur comportement en ligne.

pendant plusieurs semaines, Weborama a récolté les in-formations sur les transformations post view (à la suite d’une publicité servie par Weborama, sans qu’il y ait un clic direct lors du visionnage).

la base de datamining ainsi constituée pour l’annonceur comporte quelque 60 millions de profils qualifiés sur envi-ron 300 colonnes, parmi lesquelles : les publicités auxquel-les l’internaute a été exposé, sa réactivité face à la publicité (visite, clic), son comportement sur le site (catégories de produits recherchées, produits mis en panier, conversion, etc.), son profil sociodémographique et son profil com-portemental.

entraînement du modèle (calcul des arbres de décision et mise au point du ciblage publicitaire)après la constitution de la base exploitée pour la segmen-tation, Weborama a construit une représentation graphi-que des critères de ciblage permanents. la solution rete-nue, à savoir les arbres de segmentation, permet d’extraire les critères les plus pertinents pour chaque offre. ces cri-

tères sont basés sur les transformations des internautes exposés à une campagne publicitaire et sur les impres-sions générées lors de celle-ci. le logiciel choisi a permis de tester chaque critère, afin de déduire les critères à rete-nir, présents dans les cookies des internautes exposés.

avant la constitution des arbres de segmentation, l’algo-rithme de segmentation de Weborama a permis, en par-tant de la racine, d’associer à chaque nœud de l’arbre le critère et le seuil d’affinité le plus pertinent. ensuite, We-borama a calculé le gain de taux de transformations pour chaque nœud des arbres. seuls les nœuds présentant les gains de taux de transformations les plus avantageux se-ront sélectionnés pour les campagnes média ciblées. We-borama a également calculé un intervalle de confiance pour tous les gains de taux de transformations. contenu entre une valeur minimum et une valeur maximum, cet in-tervalle permettra, d’une part, de confirmer chaque mo-dèle lors de la phase de simulation d’une campagne mé-dia, d’autre part, de surveiller les résultats de futures campagnes ciblées de l’annonceur (cf infra).

l’offre de l’annonceur est complexe et inclut les différen-tes variantes (5 produits au total). la segmentation de l’audience se fera donc en fonction de ces caractéristi-ques, avec un arbre de segmentation correspondant à un produit.

Page 11: La data selon Weborama

CLUSTER 3 >= 32,03p=1362,3%

l’arbre de segmentation se lit de bas en haut, en remon-tant de la racine vers les branches supérieures. À la racine, l’ensemble de la population exposée à la campagne, avec le gain de taux de transformations égal à 1 et servant de comparaison avec les différents niveaux de branches, le nombre d’exemples positifs (les internautes ayant trans-formé) et le pourcentage d’impressions publicitaires diffu-sées auprès de la population (ici égal à 100 %).

les branches de l’arbre comportent 4 informations clés :- le cluster comportemental ou critère sociodémographi-que discriminant, avec le quantile correspondant ;- le gain de taux de transformations par rapport à la popu-lation globale exposée. celui-ci est pertinent pour le ci-

exemple d’arbre de segmentation et de son analyse en vue des futures campagnes média

blage au sein d’une campagne média s’il est strictement supérieur à 1. dans le cas inverse, il peut être utilisé pour exclure du dispositif de communication en ligne les inter-nautes qui ne transforment pas ;- le nombre d’exemples positifs au sein de la population appartenant à un critère ou cluster ;- le pourcentage d’impressions publicitaires diffusées auprès de cette population. nous pouvons considérer qu’il s’agit d’un pourcentage approximatif de la population ex-posée à la campagne.

l’analyse d’un arbre de segmentation repose sur une ca-pacité à trouver un équilibre entre la performance, donc les cibles utiles (le gain de taux de transformations supé-rieur à 1) et le pourcentage d’impressions suffisant pour la puissance de la campagne.

* le critère « usage »

correspond aux internautes dont la navigation sur internet est soutenue.

CLUSTER 4 >= 1

4,92p=4082,8%

1p=2845100%

CLUSTER 2 < 10,4

p=54948,8%

CLUSTER 2 >= 11,05p=78526,3%

USAGE < 130,67

p=25513,5%

Sd 3 < 61,3

p=45212,2%

Sd 1 < 22,89

p=122614,6%

Sd 2 < 100,52

p=503,4%

Sd 1 >= 21,05p=30710,3%

Sd 2 >= 101,31p=2576,9%

Sd 3 >= 64,23p=780,6%

USAGE >= 131,45p=53012,8%

CLUSTER 1 < 10,62

p=131475,1%

CLUSTER 1 >= 12,13p=153324,9%

CLUSTER 4 < 1

2,4p=81811,8%

CLUSTER 3 < 3

0,94p=1214,6%

*

Page 12: La data selon Weborama

les deux branches du même niveau sont à chaque fois complémentaires, les internautes ne peuvent pas faire partie des deux côtés à la fois. il est donc possible d’addi-tionner plusieurs groupes d’internautes (cf. les critères rouges dans l’exemple ci-dessus), pour une diffusion plus large.

exemple de lecture : concentrons-nous sur les deux po-pulations marquées en rouge sur l’arbre de décision. nous avons d’un côté les internautes qui ont, dans leur cookie, le cluster 1 avec le quantile supérieur ou égal à 1. nous savons qu’ils ont été exposés à la campagne et ont transformé 2,13 fois plus que la population au global. nous savons également qu’ils constituent près de 25 % de la population exposée.

sur la branche opposée, nous sommes intéressés par les internautes qui ont À LA FOIS le cluster 1 avec le quantile inférieur à 1 (donc égal à 0) eT le cluster 2 dont le quantile est supérieur ou égal à 1 eT qui sont des sur-feurs importants (ce critère doit atteindre le quantile mi-nimum de 13). ces internautes constituent près de 13 % de la population exposée et transforment 1,45 fois plus que l’ensemble des internautes ayant potentiellement vu la campagne.

Simulation d’une campagne média (confirmation des hypothèses)la définition d’un modèle d’audience pour chaque offre et produit n’est qu’une phase de modélisation. celle-ci né-cessite d’être confirmée par une simulation de campagne média. aucun ciblage n’est mis en place. les résultats de cette campagne sont croisés avec le fichier de datamining, afin de voir les corrélations avec le modèle défini aupara-vant, lors de l’entraînement du modèle.

dans le cas de la simulation pour l’annonceur évoqué plus haut, Weborama a observé de parfaites corréla-tions entre la base de datamining et la simulation d’une campagne. ces résultats de l’application des arbres de segmentation ont permis de confirmer la justesse des ci-blages proposés pour chaque offre et produit. les profils qui transforment sont bien ceux que Weborama a mis en avant dans les arbres de décision. les futures actions

de communication pourront désormais bénéficier d’un ciblage bien précis afin d’augmenter le roi digital de chaque campagne.

Diffusion d’une campagne ciblée et aB testingaprès la définition des modèles de ciblage dédiés à cha-que offre et à la suite de la confirmation des arbres de décision lors d’une simulation de campagne, la data jouera son rôle final. elle sera désormais valorisée au sein des campagnes média afin d’augmenter leur efficacité et de diminuer la déperdition.

Simultanément et dans exactement les mêmes condi-tions, Weborama a diffusé deux campagnes média : l’une ciblée et l’autre auprès d’une population non ciblée. Le rapprochement des résultats des deux types de cam-pagnes a confirmé une fois de plus la justesse des cibles définies auparavant au sein des arbres de décision. L’augmentation du nombre de transformations attendue a bien été réalisée.

des variations du gain de taux de transformations ont été notées par rapport à ceux exposés dans l’arbre de déci-sion. toutefois, les résultats n’ont pas dépassé l’intervalle de confiance.

les variations des résultats versus les prévisions peuvent avoir lieu pour plusieurs raisons : elles peuvent être liées aux créations publicitaires ou bien aux facteurs externes à la campagne, comme un événement calendaire ou une période de vacances, durant lesquels les internautes chan-gent leurs habitudes de navigation. l’intérêt de définir en amont les intervalles de confiance réside dans la prise en compte de l’ensemble de ces facteurs.

Déploiement et futur de la segmentation d’audiencela segmentation d’audience, et plus particulièrement les arbres de segmentation, peuvent être utilisés à des fins différentes. dans le cadre du pilotage du média par la data, au-delà de l’amélioration du roi digital d’une cam-pagne média par le ciblage des internautes potentielle-ment intéressés par les produits, il est possible d’appliquer les arbres dans l’optique de ventes croisées ou de calcul de valeur potentielle d’un internaute.

Page 13: La data selon Weborama

CLUSTER 4 >= 1

4,92p=4082,8%

1p=2845100%

CLUSTER 2 < 10,4

p=54948,8%

CLUSTER 2 >= 11,05p=78526,3%

USAGE < 130,67

p=25513,5%

Sd 3 < 61,3

p=45212,2%

Sd 1 < 22,89

p=122614,6%

Sd 2 < 100,52

p=503,4%

Sd 1 >= 21,05p=30710,3%

Sd 2 >= 101,31p=2576,9%

Sd 3 >= 64,23p=780,6%

USAGE >= 131,45p=53012,8%

CLUSTER 1 < 10,62

p=131475,1%

CLUSTER 1 >= 12,13p=153324,9%

CLUSTER 4 < 1

2,4p=81811,8%

CLUSTER 3 < 3

0,94p=1214,6%

*

CLUSTER 4 >= 1

4,92p=4082,8%

1p=2845100%

CLUSTER 2 < 10,4

p=54948,8%

CLUSTER 2 >= 11,05p=78526,3%

USAGE < 130,67

p=25513,5%

Sd 3 < 61,3

p=45212,2%

Sd 1 < 22,89

p=122614,6%

Sd 2 < 100,52

p=503,4%

Sd 1 >= 21,05p=30710,3%

Sd 2 >= 101,31p=2576,9%

Sd 3 >= 64,23p=780,6%

USAGE >= 131,45p=53012,8%

CLUSTER 1 < 10,62

p=131475,1%

CLUSTER 1 >= 12,13p=153324,9%

CLUSTER 4 < 1

2,4p=81811,8%

CLUSTER 3 < 3

0,94p=1214,6%

*

% de la population

6

5

4

3

2

1

taux de transformations

+

24,9 %  37,7 %

2,13

1,89

CLuSter 1 > = 12,13p=153324,9 %

0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100

uSage >= 131,45 p=53012,8 %

Weborama développe l’intégration de ce dispositif au sein d’un de ses outils marketing pilotés par la data : les c-clones. les c-clones, ou les « look alike », sont une ex-tension d’audience basée sur les transformations des in-ternautes. comme dans la démarche décrite ci-dessus, il s’agit d’allier la performance et la puissance d’une cam-

pagne média efficace, en choisissant une population qui est susceptible de souscrire aux produits de la campagne et qui est suffisamment large pour la diffusion. l’interface c-clones sera intégrée dans la data management plate-form Weborama Audience Manager. l’intégration des arbres de segmentation permettra, en un coup d’œil, de déterminer le profil utile de la campagne.

CLuSter 1 > = 12,13p=153324,9 %

Page 14: La data selon Weborama

la segmentation pour les éditeurs

La démarche

La connaissance de leur audience est devenue un enjeu majeur pour les éditeurs, qui souhaitent valoriser au

mieux leur inventaire publicitaire afin d’optimiser sa moné-tisation. la segmentation de l’audience du site offre à l’édi-teur de nombreuses opportunités.

opportunités d’expLoitation

avant tout, les éditeurs souhaitent organiser leur offre dans le but de proposer aux annonceurs et aux

agences, en complément du volet contextuel, des packs d’au dien ce ciblés, enrichis par la data 3rd party. le second enjeu est de construire des packs d’audience spécifiques grâce aux cibles ad hoc, basées sur l’alliage de ciblages sociodémographique et comportemental (prenant en compte les centres d’intérêt des internautes). l’exploita-tion de la data permettra donc de piloter la commerciali-sation de l’inventaire du site et de diffuser les publicités auprès des contacts utiles, tout en « désengorgeant » les rubriques surchargées. le coût par mille (cpm) de vente des emplacements publicitaires sera ainsi revalorisé par la vente d’audience utile.

Quant aux formats publicitaires dits événementiels, ils sont principalement commercialisés de façon forfaitaire, sur une base journalière. grâce à la data, ils pourront égale-ment être ciblés et mis à la disposition des acheteurs au cpm. À titre d’exemple, un « habillage comportemental » ne sera plus visible pendant seulement une journée et uni-quement sur la home page, mais plutôt sur une période de 15 jours, sur l’ensemble des pages du site et affiché en fonction du profil de l’internaute, correspondant à la cible en affinité avec la campagne.

la segmentation d’audience d’un site permet d’apercevoir des profils de visiteurs qui vont au-delà de sa thématique. il est fort probable qu’un site d’actualité ait, au sein de son audience, des amateurs d’autres domaines (finance, beau-té, mode, cuisine, voyage…). cela donnera à l’éditeur la possibilité de valoriser non seulement son contenu de qualité, mais également son audience, ceci en élargissant la typologie des clients.

engagement

Weborama s’engage auprès des éditeurs à collecter les données brutes et anonymes de navigation. l’analyse

de l’audience, suivie d’une proposition de cibles marketing pertinentes, sera effectuée dans un délai de trois semaines à compter de la pose des tags Weborama sur le site de l’éditeur. les données servant au ciblage seront transfé-rées sous un mois et les cibles seront ensuite optimisées quotidiennement, afin de répondre au mieux aux attentes de l’éditeur.

par là même, Weborama ne commercialise pas la data de l’éditeur seule et ne redéfinit pas les packs d’audience du site. les informations liées à l’audience de ce dernier étant strictement confidentielles, Weborama s’interdit de les communiquer aux autres acteurs.

Page 15: La data selon Weborama

méthodoLogie Weborama

Weborama propose aux éditeurs deux méthodes de l’en richissement de leur data par les données

3rd party.

la première méthode consiste à synchroniser et projeter les critères sociodémographiques et clusters comporte-mentaux de Weborama sur l’audience du site de l’éditeur. cela est possible grâce à l’identification des profils recon-nus au sein de l’audience du site, qui font déjà partie de la base de données de Weborama.

Synchronisation et projection des clusters et du sociodémographiquedans ce cas précis, l’adserver de l’éditeur appelle la base de données Weborama pour chaque internaute. si la base de données de Weborama reconnaît le profil socio-démographique ou comportemental du visiteur du site, ce dernier est transféré à l’adserver éditeur.

l’adserver éditeur dispose alors des profils sociodémogra-phi ques et comportementaux de la majorité de ses inter-nautes.

internauteS Du Site De L’éDiteur

aD Server éDiteur

interrogation De La BaSe De DonnéeS WeBoraMa

reConnaiSSanCe Du ProfiL

iDentifiCation DeS CentreS

D’intérÊt & Du ProfiL

SoCioDéMograPhique

WeBoraMa tranSfère

La LiSte De vaLeur

Du ProfiL anaLySé

Page 16: La data selon Weborama

la seconde méthode identifie et d’analyse le profil des in-ternautes du site afin de créer des cibles ad hoc corres-pondant aux secteurs d’activité des annonceurs.

identification, analyse et création de cibles ad hoccet enrichissement est axé sur l’analyse des profils des internautes du site éditeur afin de créer des cibles ad hoc qui lui sont propres et qui pourront être exploitées par la régie.

cette approche se traduit en trois étapes : tout d’abord l’identification et l’analyse des cibles, ensuite l’enrichisse-ment du ciblage et la création de cibles customs pour la régie, et enfin le processus de transfert de profils.

- Identification & analyse des ciblesdans cette étape, Weborama met en place l’outil d’ana-lyse comportementale et sociodémographique du site, Weborama Audience Insight (Wai). WAI permet d’iden tifier et de classer les segments et clusters compor-

iDentifiCation & anaLySe

Site

et/ou

ruBrique autoMoBiLe

et/ou

région ÎLe-De-franCe

rotation généraLe régie

enriChiSSeMent via La BaSe De

DonnéeS WeBoraMa

Création DeS CiBLeS aD hoC

DiffuSion

3rD Party

CiBLe 1

CiBLe 2

CiBLe 3

tranSfert

tranSfert

tranSfert

tementaux par puissance et/ou affinité, en croisant l’au-dience du site avec la base de données de Weborama. les profils les plus discriminants sont déduits en compa-rant l’audience du site de l’éditeur avec la moyenne relevée au sein de la base de données de Weborama.

- enrichissement du ciblage et création de cibles ad hocl’étude WAI permet la création de cibles ad hoc, alliant les critères sociodémographiques aux clusters comporte-mentaux. trouver un équilibre entre les indicateurs de puissance et d’affinité est ici déterminant afin de définir une volumétrie de profils pertinente.

- Transfert des cibles ad hocle transfert des cibles ad hoc précédemment définies est pos sible grâce à une liste de différents pixels adserver. ce transfert se fait par l’intermédiaire d’un appel des pixels gé né rés par l’adserver éditeur. les volumes souhaités de pro fils par cible sont alors disponibles directement dans l’adserver.

Page 17: La data selon Weborama

digitalpilotÉ par la

marKeting

data

a data ne conditionnera pas que les ac-tions liées à la communication digitale. de plus en plus présente, elle prendra une place importante dans tous les aspects de notre vie, aussi bien dans la sphère personnelle que dans la sphère professionnelle. afin de profiter des opportunités offertes par « l’or de demain », les entreprises devront revoir leur organisation interne, souvent structu-rée en silos : media digital, site marchand, crm, etc.

en ce qui concerne le marché publicitaire, la data devient une composante à part entière au marketing. aujourd’hui, son déploiement au sein de tous les leviers du marketing digital est une nécessité pour les marques. celles-ci re-cherchent toujours à toucher les clients et prospects de façon plus pertinente afin de rendre plus efficaces les ac-tions de communication en ligne. en parallèle, la dichoto-mie offline et online tend à disparaître.

depuis 15 ans, Weborama offre des solutions data inno-vantes et complètes. la segmentation d’audience et les arbres de décision ne constituent qu’une partie de la data science de Weborama. soucieux de rendre facilement accessible aux utilisateurs cette science basée sur les al-gorithmes complexes et les technologies de stockage et de traitement robustes, Weborama entend poursuivre ses efforts de recherche et développement. la passion des données fait partie intégrante de l’adn de la société, renommée sur le marché publicitaire européen pour son approche lexicale du digital. le claim « From data to va-lue » illustre bien son savoir-faire et la volonté de rendre les données utiles en leur donnant une dimension humaine.

Page 18: La data selon Weborama

Weborama est le leader européen de la data et dispose d’une base de données de 110 m de profils.

depuis 15 ans, Weborama développe des solutions d’ad-serving, dmp, analyse d’audience, segmentation des don-nées et ciblages.

plus de 300 clients utilisent ses solutions innovantes pour piloter et optimiser leurs investissements online en France, en espagne, en italie, au portugal, aux pays-bas, au uK et en russie :

Weborama Audience Manager : data management platform pour la segmentation des différentes sources de données 1st party (crm, média et site) et enrichissement par les données 3rd party, via l’accès à la data propriétaire de Weborama

Weborama Audience Insight : outil d’analyse compor-tementale et sociodémographique d’audience des sites internet

Weborama Campaign Manager : outil d’adserving et d’ad analytics pour la gestion et l’optimisation des campa-gnes publicitaires

Weborama Advanced Rich Media : outil de gestion des campagnes rich media/vidéo

Weborama Audience exchange : plateforme d’audien-ce premium et multi device, via deux canaux (WaX for agency, WaX for trading desk). Formats classiques, rich media et in stream.

Weborama est cotée sur Alternext depuis juin 2006 (ALWeB). Son chiffre d’affaires a atteint 24,3 M d’€ en 2012.

© 2013, Weborama

tous droits réservés pour tous pays.

toute reproduction même partielle est strictement interdite.

imprimé en France.

conception graphique et réalisation © les 5 sur 5 .com

*

Weborama, From data to Value

Page 19: La data selon Weborama

www.weborama.com