La data selon Weborama

Transcription

La data selon Weborama
la data
selon weborama
Application
de la segmentation
d’audience
au pilotage du média
par la
data
La montée en puissance du digital
et les nouvelles possibilités qu’il offre
en matière de publicité ont chamboulé
l’écosystème publicitaire qui, depuis
L’univers
big
data
l’âge d’or de Madison Avenue, était
principalement fondé sur la création.
Pour autant, il ne faut pas perdre de vue
que la data (désormais à portée de main
grâce au plus jeune des médias)
« n’est pas en train de tuer la créativité,
mais simplement de changer notre
manière de raconter des histoires. »
(Alex Williams, journaliste Tech Crunch)*
* “(Data) is not killing creativity, it’s just changing how we tell stories”.
ès l’apparition des métiers publi­citaires, les professionnels du marke­ting ont rêvé de ne s’adresser
qu’à des audiences utiles, c’est-à-dire potentiellement intéressées par leur offre. Le monde
de la communication a connu de très bonne
heure la définition de « cibles marketing » : la
ménagère de moins de 50 ans, les CSP+, les
early adopters ou les seniors. Le développement
du marketing direct et des bases de données CRM
– ou PRM – ont permis d’affiner et de préciser le ciblage, et de s’adresser véritablement au consommateur.
*
“I think of that
famous 1993 New
Yorker cartoon
by Peter Steiner:
‘On the Internet,
nobody knows
you’re a dog.’
Now it’s more
like, ‘On the
Internet,
everybody knows
what brand
of dog food
you buy”*.
Geoff Nunberg
enseigne la
linguistique à
l’université de
Californie, à
Berkeley. Il est
l’auteur de The
Way We Talk
Now, Going
Nucular, Talking
Right and The
Years of Talking
Dangerously. Son
dernier ouvrage
paru est Ascent
of the A-Word. Il
intervient comme
consultant
linguistique dans
l’émission
de NPR Fresh Air,
animée par Terry
Gross.
Le média Internet et les nouvelles technologies ont bouleversé le con­cept même de la cible. Le rêve devient désormais réalité puisque la navigation des internautes est traçable. Les annonceurs peuvent toucher leurs clients et
prospects en se basant non seulement sur les actions déjà
accomplies par l’internaute (achat, demande de conseil,
essai d’un produit, etc.), mais également sur ses besoins
futurs, prédictibles grâce au suivi et à l’analyse mathématique de leur comportement en ligne.
Le phénomène Big Data prend de l’ampleur, les marques
peuvent désormais centraliser et exploiter toutes les sources de données disponibles, qu’elles soient offline ou online, média ou CRM. Avec comme finalité, d’une part, d’enrichir la connaissance de leurs clients avec les données de
navigation sur Internet pour mieux les fidéliser, et d’autre
part de créer des bases d’internautes potentiellement
acheteurs de leurs produits et services.
« J’ai en tête cette fameuse illustration de Pierre Steiner
parue dans le New Yorker en 1993 : “Sur Internet, personne ne sait que vous êtes un chien.” De nos jours, ce serait
davantage : “Sur Internet, tout le monde sait quelle marque de nourriture pour chien vous achetez.”*.
L
e Big Data ne concerne pas seulement le marketing,
même si ce secteur en tire évidemment les bénéfices.
Il y a également la finance, la santé, le sport, la météorologie… Selon le journaliste John Edwards, « Comme la mort
et les impôts, la météo est une certitude. Et, grâce au Big
Data, elle est désormais une certitude plus prévisible. »**
Dans tous ses domaines, le Big Data confère plusieurs
avantages déterminants : la fiabilité, la fraîcheur et la perti-
nence des données. Pourtant, à l’état brut, les données ne
possèdent pas de valeur. Les technologies adaptées et
l’intelligence humaine sont nécessaires pour leur donner
du sens.
Les difficultés liées au Big Data concernent surtout le volume et l’hétérogénéité des données qui doivent être traitées à très grande vitesse. Stephen Gold (IBM) estime en
2012 que « 90 % de l’ensemble des données du monde ont
été créées ces deux dernières années ». Mais le grand enjeu pour tout data scientist n’est pas seulement de disposer d’un espace de stockage illimité ou de mettre au point
des algorithmes rapides et puissants : il s’agit de rendre la
data pertinente et vivante, de la faire parler, ce qui constitue une tâche plus complexe.
Comme exemple : un algorithme se donne pour but de
déceler les lieux de vie d’une personne, ingérant les données de géolocalisation liées à son mobile. Les premiers
résultats aboutissent à trois lieux : le domicile de la personne, son bureau et... un feu rouge sur une grande artère. Sans intelligence humaine, les traitements du Big
Data ne peuvent aboutir à un résultat pertinent.
P
our relever ces défis, le Big Data puise non seulement
dans les technologies les plus modernes, mais aussi
dans les acquis scientifiques du passé. La mise au point de
tests statistiques d’hypothèse, des premiers arbres de décision, très utilisés dans le domaine de la Segmentation
Marketing, date de 1900. Ces modèles continuent d’être
améliorés aujourd’hui. À l’inverse, « Map Reduce » est un
algorithme de traitement de la donnée moderne, fondé
sur un mode de calcul des données distribué en parallèle,
très en vue dans le monde du Big Data, apparu en 2004.
Les nouveaux modèles de stockage (par exemple le cloud)
et de bases de données rendent en partie obsolète les
bases relationnelles comme SQL. L’univers du Big Data est
en mouvement perpétuel.
En ce qui concerne les experts data, ils possèdent des
compétences variées. Mais ce qu’ils ont tous en commun,
c’est l’ouverture aux nouvelles technologies et la capacité
à les accorder aux acquis (théorèmes, algorithmes) parfois
anciens. Une connaissance historique des mathématiques
et des statistiques est un atout de tout expert data.
**
“Like
death and taxes,
weather is
a certainty. And,
thanks to Big
Data, it’s now a
more predictable
certainty”.
D’après
Douglas
Merrill,
fondateur
et CEO de
ZestFinance.
com, « With too
little data, you
won’t be able
to make any
conclusions that
you trust. With
loads of data
you will find
relationships
that aren’t real…
Big data isn’t
about bits, it’s
about talent ».
(Avec trop peu
de données,
vous ne serez pas
capables de tirer
des conclusions
dans lesquelles
vous puissiez
avoir confiance.
En collectant des
tas de données,
vous allez établir
des relations
qui ne sont
pas réelles…
Le Big Data n’est
pas une affaire
de bits,
mais de talent).
La data au cœur de l’activité
de Weborama
D
epuis sa création il y a 15 ans, Weborama est engagée dans la science de la data au service du marketing en ligne.
Pionnier de l’innovation technologique sur son marché,
Weborama investit constamment dans son service R&D,
dont l’effectif constitue 52 % des effectifs totaux de la société. La data est au cœur de son expertise, grâce aux data
strategists, aux consultants data, aux linguistes-informaticiens, aux statisticiens, aux mathématiciens et aux développeurs.
la vision
‘‘
data
‘‘
science
de weborama
Le Big Data est aujourd’hui le moteur des développements
de Weborama et il continuera de l’être dans le futur. Avec
toujours le même souci de collecter des données anonymes, l’individu bénéficie des recherches et des études
construites et calibrées sur la masse.
Le respect de la vie privée
D
epuis sa fondation en 1998, Weborama porte une attention particulière au respect de la vie privée des internautes. La société participe activement aux nombreux
chantiers e-privacy de l’industrie digitale française.
Précurseur dans le domaine, Weborama milite depuis
plusieurs années pour la transparence des acteurs de son
marché envers les consommateurs. Parmi les nombreuses
initiatives entreprises par la société, la co-rédaction du livre blanc « Ciblage publicitaire et respect de l’internaute »
de l’IAB, signature de la charte paneuropéenne de la publicité comportementale ou bien de la charte de l’Union française du marketing direct et digital (UFMD).
En accord avec les législations en vigueur, les internautes
peuvent se désinscrire à tout moment du programme de
collecte de Weborama, soit à partir d’opt-out sur le site
du groupe, soit via l’icône Ad Choices, présente sur toute
publicité ciblée et renvoyant vers le site YourOnlineChoices de l’IAB Europe.
Les questions de la vie privée des internautes ont fait l’objet de l’ouvrage d’Alain Levy, président de Weborama,
« Sur les traces de Big Brother, la vie privée à l’ère numérique »*. Prônant l’importance de l’éducation du grand public
au digital, il conclut : « […] Pour que les internautes acceptent cette quête incessante de données, il est fon­damental
que les sociétés de ce domaine soient mieux connues du
grand public, en communiquant davantage sur leurs principes éthiques, et en consolidant un socle de bonnes pratiques. […] Elles doivent engager le dialogue avec leurs
clients, leurs salariés, leurs actionnaires, leur environnement
politique, les associations, les consommateurs. […] Nous ne
“fliquons” personne. Nous essayons de mieux comprendre
les goûts et les habitudes des internautes afin de ne les
exposer qu’à des messages qui collent à leur profil et répondent à leurs attentes. C’est l’application du principe de
développement durable à la publicité. »
Une vision sémantique
d’Internet
L’
approche « Data science » de Weborama consiste à
collecter et à traiter les données, afin de les analyser
et de les segmenter de façon à ce qu’elles puissent être
déployées au sein des campagnes publicitaires. Weborama considère le web comme un espace lexical infini où
les mots entretiennent des relations de proximité ou de
distance en fonction du contexte dans lequel ils apparaissent, tel que ce contexte est révélé par les requêtes des
internautes (le « search ») et par le contenu lexical des sites
qu’ils visitent (le « surf »). Provenant de 300 000 sites sources, les données sont collectées de façon anonyme, via les
cookies, et instantanément traitées. Cette classification de
l’audience constitue un processus stratégique au sein de
chaque base de données.
Grâce à cette méthodologie, Weborama dispose d’une
base de données de 110 millions de profils comportementaux, sociodémographiques et intentionnistes en Europe,
dont 70 millions en France.
*
Alain Levy, « Sur les traces de Big Brother, la vie privée à l’ère numérique »,
l’Éditeur, 2010, Paris.
Weborama identifie ce jour près de 200 clusters (centres
d’intérêt) basés sur le comportement des internautes et
répartis dans 23 segments (un segment étant une « famille » de clusters).
La base sociodémographique de Weborama est cons­
truite à partir d’un panel. Celui-ci est constitué de
300 000 in­ternautes actifs en France ayant répondu à un
questionnaire de leur plein gré et ayant renseigné leur âge,
sexe et catégorie socioprofessionnelle. Grâce au croisement des clusters comportementaux et du panel sociodémographique de Weborama, les données du panel sont
extrapolées à l’ensemble de la base.
La technologie au service
de la « data science »
L’
ensemble des solutions de Weborama est alimenté
par les technologies brevetées, basées sur les algorithmes propriétaires et le traitement automatique du langage (TAL). La robustesse des outils de collecte et de
stockage, ainsi que la solidité de l’infrastructure, permettent le traitement instantané de très importants volumes
de données.
Grâce à la navigation intuitive, la dimension technologique s’efface au profit d’une expérience utilisateur centrée sur la data.
33 M d’urls actives
300 000 sites analysés chaque jour
110 M de profils actifs par mois
3,5 M d’internautes qualifiés par jour
25 mots par jour et par internaute
tracking
ad exchanges
annonceurs
éditeurs
- Data CRM
- Data du site Internet
- Data média
- Data relative
à l’audience du site
data
“3rd party”
Le déploiement du savoir-faire
de Weborama au sein
du marché publicitaire
L
a base de données 3rd party* de Weborama, une véritable source d’enrichissement des données 1st party**,
constitue le pilier de l’ensemble des outils mis à disposition
des clients. L’efficacité de sa data est éprouvée par Weborama, son premier utilisateur depuis 15 ans, aussi bien
au sein des campagnes publicitaires branding et performance (bundle data & media, proposé par Weborama au
sein de sa plateforme publicitaire, Weborama Audience
Exchange, et testé par rapport aux campagnes non-ciblées), que pour les études marketing.
Weborama propose trois solutions technologiques complémentaires et communicantes :
Data science
- Weborama Audience Manager (data management
platform) ;
- Weborama Audience Insight (outil d’analyse comportementale d’audience des sites Internet) ;
Technology :
- Weborama Campaign Manager (outil d’adserving
permettant la gestion et l’optimisation des campagnes
publicitaires).
Grâce à ces outils, Weborama réussit le passage de la
micro donnée au Big Data, c’est-à-dire d’une suite d’événements insignifiants produits par l’internaute lors de sa
navigation, à la construction de son profil marketing
complet.
*
Données d’un acteur tiers, n’appartenant pas à un annonceur ou un éditeur,
mais mises à sa disposition pour le déploiement au sein de ses actions marketing
en ligne.
** Données propriétaires d’un annonceur ou d’un éditeur.
applications possibles de la
&
usage de la
data data
science
3 party
rd
la segmentation
pOUr les annonceurs
La démarche
L
es informations récoltées sur Internet constituent une
vraie mine de savoir. Pour en tirer profit, il est nécessaire de traiter et d’analyser un volume de données disponibles très important, après avoir déterminé celles qui sont
susceptibles d’améliorer le ROI digital d’un annonceur.
Il existe de nombreuses techniques de ciblage des internautes. Souvent basées sur les cibles marketing historiques de l’annonceur, ces techniques ne se montrent pas
toujours aussi efficaces qu’on le voudrait. Pour déterminer
les ciblages plus précis, il convient donc de regarder les
performances des campagnes média, en prenant en
comp­te le profil des internautes exposés ou « cliqueurs » et
les données relatives aux « transformations » (souscriptions aux produits proposés par la campagne).
La segmentation de l’audience d’un site Internet ou d’une
campagne publicitaire permet de déterminer les cibles
utiles en fonction de l’offre de l’annonceur. Ces cibles
pourront être déployées au sein des campagnes média à
venir. Dans l’optique de l’extension d’audience, il est désormais possible de cibler les « look alike », c’est à dire les internautes ayant le profil similaire à celui des internautes
qui « transforment ». Cela permet de leur proposer une publicité personnalisée en fonction de leur profil.
Première application pratique
par un annonceur
L
a première application de la segmentation d’audience
des campagnes média a été réalisée en 2012. Ce déploiement de la segmentation a eu lieu pour un annonceur
dont le catalogue d’offres était très fourni, ce qui rendait
plus complexe la définition de ses cibles marketing. Bien
que disposant d’une base CRM très fournie, cet acteur
souhaitait mieux connaître les cibles potentiellement inté-
ressées par chacune des offres et chacun des produits sur
le digital, dans une optique de recrutement de nouveaux
clients, mais également de ventes croisées.
L’objectif poursuivi était ainsi d’optimiser les campagnes
digitales pour augmenter le taux de transformations et limiter la déperdition des investissements média. Pour atteindre cet objectif, l’annonceur a fait appel à Weborama
afin de construire un dispositif correspondant à son catalogue commercial.
Méthodologie Weborama
L
a segmentation d’audience pour les annonceurs comprend plusieurs étapes. Après la phase de modélisation, suit une phase de validation des modèles, puis une
phase de tests au sein de campagnes média. La démarche
s’inscrit dans l’ensemble des processus data proposés par
Weborama : collecte de la data brute, traitement, analyse,
segmentation et enfin déploiement média.
Dans le cadre de la segmentation au service du pilotage
du média par la data, les étapes de la démarche se traduisent de la façon suivante :
- la constitution d’une base de datamining, provenant
d’une ou de plusieurs campagnes média de l’annonceur ;
- l’entraînement du modèle, au cours duquel sont émises
des hypothèses sur les cibles utiles des offres ou produits
concernés ;
- le calcul des arbres de segmentation ;
- la mise au point du modèle de ciblage publicitaire ;
- la simulation d’une campagne média ayant pour but de
confirmer les hypothèses émises lors de l’entraînement du
modèle ;
- la diffusion d’une campagne ciblée et A/B testing (comparaison des résultats de la population ciblée et non ciblée).
Constitution d’une base de datamining
Avant de segmenter l’audience de l’annonceur, Weborama a construit une base d’internautes exposés aux campagnes de celui-ci, ou ayant visité son site. Cette base est
enrichie par des critères sociodémographiques et comportementaux pour les internautes dont Weborama con­
nait le profil, grâce à sa base de données de 70 millions de
profils qualifiés en France. Ces données sont croisées avec
celles de Weborama Campaign Manager. L’ensemble
de ces informations anonymes est accessible via l’identifiant de l’internaute (qui est une suite de caractères propre
à chaque individu contenue dans les cookies déposés
dans le navigateur Internet). Cet identifiant unique permet
à Weborama de retrouver dans sa base de données, en
temps réel, le profil complet de l’internaute.
Weborama a appliqué dans cette démarche les données
provenant du search (requêtes dans les moteurs de recherche) et du surf (navigation à travers la toile) des internautes, afin de leur attribuer le profil correspondant à leur
sexe, âge et catégorie socioprofessionnelle, ainsi qu’à leurs
centres d’intérêt et leur comportement en ligne.
Pendant plusieurs semaines, Weborama a récolté les informations sur les transformations post view (à la suite
d’une publicité servie par Weborama, sans qu’il y ait un
clic direct lors du visionnage).
La base de Datamining ainsi constituée pour l’annonceur
comporte quelque 60 millions de profils qualifiés sur environ 300 colonnes, parmi lesquelles : les publicités auxquelles l’internaute a été exposé, sa réactivité face à la publicité
(visite, clic), son comportement sur le site (catégories de
produits recherchées, produits mis en panier, conversion,
etc.), son profil sociodémographique et son profil comportemental.
Entraînement du modèle (calcul des arbres
de décision et mise au point du ciblage publicitaire)
Après la constitution de la base exploitée pour la segmentation, Weborama a construit une représentation graphique des critères de ciblage permanents. La solution retenue, à savoir les arbres de segmentation, permet d’extraire
les critères les plus pertinents pour chaque offre. Ces cri-
tères sont basés sur les transformations des internautes
exposés à une campagne publicitaire et sur les impressions générées lors de celle-ci. Le logiciel choisi a permis
de tester chaque critère, afin de déduire les critères à retenir, présents dans les cookies des internautes exposés.
Avant la constitution des arbres de segmentation, l’algorithme de segmentation de Weborama a permis, en partant de la racine, d’associer à chaque nœud de l’arbre le
critère et le seuil d’affinité le plus pertinent. Ensuite, Weborama a calculé le gain de taux de transformations pour
chaque nœud des arbres. Seuls les nœuds présentant les
gains de taux de transformations les plus avantageux seront sélectionnés pour les campagnes média ciblées. Weborama a également calculé un intervalle de confiance
pour tous les gains de taux de transformations. Contenu
entre une valeur minimum et une valeur maximum, cet intervalle permettra, d’une part, de confirmer chaque modèle lors de la phase de simulation d’une campagne média, d’autre part, de surveiller les résultats de futures
campagnes ciblées de l’annonceur (cf infra).
L’offre de l’annonceur est complexe et inclut les différentes variantes (5 produits au total). La segmentation de
l’audience se fera donc en fonction de ces caractéristiques, avec un arbre de segmentation correspondant à un
produit.
Exemple d’arbre de segmentation
et de son analyse en vue
des futures campagnes média
sd 3 < 6
1,3
p=452
12,2%
USAGE < 13
0,67
p=255
13,5%
CLUSTER 2 < 1
0,4
p=549
48,8%
CLUSTER
3<3
0,94
p=121
4,6%
sd 3 >= 6
4,23
p=78
0,6%
USAGE >= 13
1,45
p=530
12,8%
CLUSTER
4<1
2,4
p=818
11,8%
*
CLUSTER 2 >= 1
1,05
p=785
26,3%
CLUSTER
4 >= 1
4,92
p=408
2,8%
sd 2 < 10
0,52
p=50
3,4%
sd 1 < 2
2,89
p=1226
14,6%
CLUSTER
3 >= 3
2,03
p=136
2,3%
sd 2 >= 10
1,31
p=257
6,9%
sd 1 >= 2
1,05
p=307
10,3%
CLUSTER 1 >= 1
2,13
p=1533
24,9%
CLUSTER 1 < 1
0,62
p=1314
75,1%
1
p=2845
100%
L’arbre de segmentation se lit de bas en haut, en remontant de la racine vers les branches supérieures. À la racine,
l’ensemble de la population exposée à la campagne, avec
le gain de taux de transformations égal à 1 et servant de
comparaison avec les différents niveaux de branches, le
nombre d’exemples positifs (les internautes ayant transformé) et le pourcentage d’impressions publicitaires diffusées auprès de la population (ici égal à 100 %).
blage au sein d’une campagne média s’il est strictement
supérieur à 1. Dans le cas inverse, il peut être utilisé pour
exclure du dispositif de communication en ligne les internautes qui ne transforment pas ;
- le nombre d’exemples positifs au sein de la population
appartenant à un critère ou cluster ;
- le pourcentage d’impressions publicitaires diffusées
auprès de cette population. Nous pouvons considérer qu’il
s’agit d’un pourcentage approximatif de la population exposée à la campagne.
Les branches de l’arbre comportent 4 informations clés :
- le cluster comportemental ou critère sociodémographique discriminant, avec le quantile correspondant ;
- le gain de taux de transformations par rapport à la population globale exposée. Celui-ci est pertinent pour le ci-
L’analyse d’un arbre de segmentation repose sur une capacité à trouver un équilibre entre la performance, donc
les cibles utiles (le gain de taux de transformations supérieur à 1) et le pourcentage d’impressions suffisant pour la
puissance de la campagne.
*
Le critère
« USAGE »
correspond
aux internautes
dont la
navigation
sur Internet
est soutenue.
Les deux branches du même niveau sont à chaque fois
complémentaires, les internautes ne peuvent pas faire
partie des deux côtés à la fois. Il est donc possible d’additionner plusieurs groupes d’internautes (cf. les critères
rouges dans l’exemple ci-dessus), pour une diffusion plus
large.
Exemple de lecture : concentrons-nous sur les deux populations marquées en rouge sur l’arbre de décision.
Nous avons d’un côté les internautes qui ont, dans leur
cookie, le CLUSTER 1 avec le quantile supérieur ou égal à
1. Nous savons qu’ils ont été exposés à la campagne et
ont transformé 2,13 fois plus que la population au global.
Nous savons également qu’ils constituent près de 25 %
de la population exposée.
Sur la branche opposée, nous sommes intéressés par les
internautes qui ont À LA FOIS le CLUSTER 1 avec le
quantile inférieur à 1 (donc égal à 0) ET le cluster 2 dont
le quantile est supérieur ou égal à 1 ET qui sont des surfeurs importants (ce critère doit atteindre le quantile minimum de 13). Ces internautes constituent près de 13 %
de la population exposée et transforment 1,45 fois plus
que l’ensemble des internautes ayant potentiellement vu
la campagne.
Simulation d’une campagne média
(confirmation des hypothèses)
La définition d’un modèle d’audience pour chaque offre et
produit n’est qu’une phase de modélisation. Celle-ci nécessite d’être confirmée par une simulation de campagne
média. Aucun ciblage n’est mis en place. Les résultats de
cette campagne sont croisés avec le fichier de datamining,
afin de voir les corrélations avec le modèle défini auparavant, lors de l’entraînement du modèle.
Dans le cas de la simulation pour l’annonceur évoqué
plus haut, Weborama a observé de parfaites corrélations entre la base de datamining et la simulation d’une
campagne. Ces résultats de l’application des arbres de
segmentation ont permis de confirmer la justesse des ciblages proposés pour chaque offre et produit. Les profils
qui transforment sont bien ceux que Weborama a mis
en avant dans les arbres de décision. Les futures actions
de communication pourront désormais bénéficier d’un
ciblage bien précis afin d’augmenter le ROI digital de
chaque campagne.
Diffusion d’une campagne ciblée et AB testing
Après la définition des modèles de ciblage dédiés à chaque offre et à la suite de la confirmation des arbres de
décision lors d’une simulation de campagne, la data jouera
son rôle final. Elle sera désormais valorisée au sein des
campagnes média afin d’augmenter leur efficacité et de
diminuer la déperdition.
Simultanément et dans exactement les mêmes conditions, Weborama a diffusé deux campagnes média :
l’une ciblée et l’autre auprès d’une population non ciblée.
Le rapprochement des résultats des deux types de campagnes a confirmé une fois de plus la justesse des cibles
définies auparavant au sein des arbres de décision.
L’augmentation du nombre de transformations attendue
a bien été réalisée.
Des variations du gain de taux de transformations ont été
notées par rapport à ceux exposés dans l’arbre de décision. Toutefois, les résultats n’ont pas dépassé l’intervalle
de confiance.
Les variations des résultats versus les prévisions peuvent
avoir lieu pour plusieurs raisons : elles peuvent être liées
aux créations publicitaires ou bien aux facteurs externes à
la campagne, comme un événement calendaire ou une
période de vacances, durant lesquels les internautes changent leurs habitudes de navigation. L’intérêt de définir en
amont les intervalles de confiance réside dans la prise en
compte de l’ensemble de ces facteurs.
Déploiement et futur de la segmentation d’audience
La segmentation d’audience, et plus particulièrement les
arbres de segmentation, peuvent être utilisés à des fins
différentes. Dans le cadre du pilotage du média par la
data, au-delà de l’amélioration du ROI digital d’une campagne média par le ciblage des internautes potentiellement intéressés par les produits, il est possible d’appliquer
les arbres dans l’optique de ventes croisées ou de calcul
de valeur potentielle d’un internaute.
Weborama développe l’intégration de ce dispositif au
sein d’un de ses outils marketing pilotés par la data : les
C-Clones. Les C-Clones, ou les « look alike », sont une extension d’audience basée sur les transformations des internautes. Comme dans la démarche décrite ci-dessus, il
s’agit d’allier la performance et la puissance d’une cam-
taux de
transformations
6
USAGE < 13
0,67
p=255
13,5%
USAGE >= 13
1,45
p=530
12,8%
*
CLUSTER
4<1
2,4
p=818
11,8%
CLUSTER 2 >= 1
1,05
p=785
26,3%
CLUSTER 2 < 1
0,4
p=549
48,8%
5
CLUSTER
3<3
0,94
p=121
4,6%
Sd 3 >= 6
4,23
p=78
0,6%
Sd 3 < 6
1,3
p=452
12,2%
pagne média efficace, en choisissant une population qui
est susceptible de souscrire aux produits de la campagne
et qui est suffisamment large pour la diffusion. L’interface
C-Clones sera intégrée dans la data management plateform Weborama Audience Manager. L’intégration des
arbres de segmentation permettra, en un coup d’œil, de
déterminer le profil utile de la campagne.
CLUSTER
4 >= 1
4,92
p=408
2,8%
Sd 2 < 10
0,52
p=50
3,4%
Sd 2 >= 10
1,31
p=257
6,9%
Sd 1 < 2
2,89
p=1226
14,6%
CLUSTER 1 >= 1
CLUSTER
1>=1
2,13
p=1533
2,13
24,9%
p=1533
24,9 %
CLUSTER 1 < 1
0,62
p=1314
75,1%
USAGE < 13
0,67
p=255
13,5%
CLUSTER 2 < 1
0,4
p=549
48,8%
1
p=2845
100%
4
CLUSTER
3<3
0,94
p=121
4,6%
Sd 3 >= 6
4,23
p=78
0,6%
Sd 3 < 6
1,3
p=452
12,2%
Sd 1 >= 2
1,05
p=307
10,3%
USAGE >= CLUSTER
13
*
4<1
1,45
2,4
p=818
p=530
11,8%
12,8 %
USAGE >= 13
1,45
p=530
12,8%
CLUSTER 2 >= 1
1,05
p=785
26,3%
CLUSTER
4 >= 1
4,92
p=408
2,8%
Sd 2 >= 10
1,31
p=257
6,9%
Sd 1 < 2
2,89
p=1226
14,6%
Sd 1 >= 2
1,05
p=307
10,3%
CLUSTER 1 > = 1
2,13
p=1533
24,9 %
CLUSTER 1 >= 1
2,13
p=1533
24,9%
CLUSTER 1 < 1
0,62
p=1314
75,1%
3
Sd 2 < 10
0,52
p=50
3,4%
1
p=2845
100%
+
2,13
2
1,89
1
0
5
10
15
20
25
24,9 % 30
35
40
37,7 %
45
50
55
60
65
70
75
80
85
90
95
100
% de la population
la segmentation
pOUr les éditeurs
La démarche
L
a connaissance de leur audience est devenue un enjeu
majeur pour les éditeurs, qui souhaitent valoriser au
mieux leur inventaire publicitaire afin d’optimiser sa monétisation. La segmentation de l’audience du site offre à l’éditeur de nombreuses opportunités.
Opportunités d’exploitation
A
vant tout, les éditeurs souhaitent organiser leur offre
dans le but de proposer aux annonceurs et aux
agences, en complément du volet contextuel, des packs
d’au­dien­ce ciblés, enrichis par la data 3rd party. Le second
enjeu est de construire des packs d’audience spécifiques
grâce aux cibles ad hoc, basées sur l’alliage de ciblages
sociodémographique et comportemental (prenant en
compte les centres d’intérêt des internautes). L’exploitation de la data permettra donc de piloter la commercialisation de l’inventaire du site et de diffuser les publicités
auprès des contacts utiles, tout en « désengorgeant » les
rubriques surchargées. Le coût par mille (CPM) de vente
des emplacements publicitaires sera ainsi revalorisé par
la vente d’audience utile.
Quant aux formats publicitaires dits événementiels, ils sont
principalement commercialisés de façon forfaitaire, sur
une base journalière. Grâce à la data, ils pourront également être ciblés et mis à la disposition des acheteurs au
CPM. À titre d’exemple, un « habillage comportemental »
ne sera plus visible pendant seulement une journée et uniquement sur la home page, mais plutôt sur une période de
15 jours, sur l’ensemble des pages du site et affiché en
fonction du profil de l’internaute, correspondant à la cible
en affinité avec la campagne.
La segmentation d’audience d’un site permet d’apercevoir
des profils de visiteurs qui vont au-delà de sa thématique.
Il est fort probable qu’un site d’actualité ait, au sein de son
audience, des amateurs d’autres domaines (finance, beauté, mode, cuisine, voyage…). Cela donnera à l’éditeur la
possibilité de valoriser non seulement son contenu de
qualité, mais également son audience, ceci en élargissant
la typologie des clients.
engagement
W
eborama s’engage auprès des éditeurs à collecter les
données brutes et anonymes de navigation. L’analyse
de l’audience, suivie d’une proposition de cibles marketing
pertinentes, sera effectuée dans un délai de trois semaines
à compter de la pose des tags Weborama sur le site de
l’éditeur. Les données servant au ciblage seront transférées sous un mois et les cibles seront ensuite optimisées
quotidiennement, afin de répondre au mieux aux attentes
de l’éditeur.
Par là même, Weborama ne commercialise pas la data de
l’éditeur seule et ne redéfinit pas les packs d’audience du
site. Les informations liées à l’audience de ce dernier étant
strictement confidentielles, Weborama s’interdit de les
communiquer aux autres acteurs.
Méthodologie Weborama
W
eborama propose aux éditeurs deux méthodes
de l’en­­richissement de leur data par les données
3rd party.
La première méthode consiste à synchroniser et projeter
les critères sociodémographiques et clusters comportementaux de Weborama sur l’audience du site de l’éditeur.
Cela est possible grâce à l’identification des profils reconnus au sein de l’audience du site, qui font déjà partie de la
base de données de Weborama.
Synchronisation et projection des clusters
et du sociodémographique
Dans ce cas précis, l’adserver de l’éditeur appelle la base
de données Weborama pour chaque internaute. Si la
base de données de Weborama reconnaît le profil sociodémographique ou comportemental du visiteur du site, ce
dernier est transféré à l’adserver éditeur.
L’adserver éditeur dispose alors des profils sociodémogra­
phi­ques et comportementaux de la majorité de ses internautes.
RECONNAISSANCE
DU PROFIL
INTERROGATION
DE LA Base
De Données
WEBORAMA
AD SERVER
ÉDITEUR
INTERNAUTES du site
de l’ÉDITEUR
WEBORAMA
TRANSFÈRE
LA LISTE
DE VALEUR
DU PROFIL
ANALYSÉ
IDENTIFICATION
DES CENTRES
D’INTÉRÊT
& DU PROFIL
SOCIODÉMOgraphique
La seconde méthode identifie et d’analyse le profil des internautes du site afin de créer des cibles ad hoc correspondant aux secteurs d’activité des annonceurs.
Identification, analyse et création de cibles ad hoc
Cet enrichissement est axé sur l’analyse des profils des
internautes du site éditeur afin de créer des cibles ad hoc
qui lui sont propres et qui pourront être exploitées par la
régie.
Cette approche se traduit en trois étapes : tout d’abord
l’identification et l’analyse des cibles, ensuite l’enrichissement du ciblage et la création de cibles customs pour la
régie, et enfin le processus de transfert de profils.
- Identification & analyse des cibles
Dans cette étape, Weborama met en place l’outil d’analyse comportementale et sociodémographique du site,
Weborama Audience Insight (WAI). WAI permet
d’iden­tifier et de classer les segments et clusters compor-
identification
& analyse
enrichissement
via la base de
données weborama
tementaux par puissance et/ou affinité, en croisant l’au­
dience du site avec la base de données de Weborama.
Les profils les plus discriminants sont déduits en comparant l’audience du site de l’éditeur avec la moyenne relevée
au sein de la base de données de Weborama.
- Enrichissement du ciblage et création de cibles ad hoc
L’étude WAI permet la création de cibles ad hoc, alliant
les critères sociodémographiques aux clusters comportementaux. Trouver un équilibre entre les indicateurs de
puissance et d’affinité est ici déterminant afin de définir
une volumétrie de profils pertinente.
- Transfert des cibles ad hoc
Le transfert des cibles ad hoc précédemment définies est
pos­sible grâce à une liste de différents pixels adserver. Ce
transfert se fait par l’intermédiaire d’un appel des pixels
gé­né­rés par l’adserver éditeur. Les volumes souhaités de
pro­fils par cible sont alors disponibles directement dans
l’adserver.
création
des cibles AD HOC
diffusion
site
tr
et/ou
rubrique
automobile
et/ou
région
ÎLE-DE-FRANCE
an
CIBLE 1
sf
er
t
transfert
3rd party
CIBLE 2
t
CIBLE 3
t
er
sf
n
ra
ROTATION
GéNéRALE
RÉGIE
MARKETING
DIGITAL
PILOTÉ PAR la
data
a data ne conditionnera pas que les actions liées à la communication digitale. De plus en plus
présente, elle prendra une place importante dans tous les
aspects de notre vie, aussi bien dans la sphère personnelle
que dans la sphère professionnelle. Afin de profiter des
opportunités offertes par « l’or de demain », les entreprises
devront revoir leur organisation interne, souvent structurée en silos : media digital, site marchand, CRM, etc.
En ce qui concerne le marché publicitaire, la data devient
une composante à part entière au marketing. Aujourd’hui,
son déploiement au sein de tous les leviers du marketing
digital est une nécessité pour les marques. Celles-ci recherchent toujours à toucher les clients et prospects de
façon plus pertinente afin de rendre plus efficaces les actions de communication en ligne. En parallèle, la dichotomie offline et online tend à disparaître.
Depuis 15 ans, Weborama offre des solutions data innovantes et complètes. La segmentation d’audience et les
arbres de décision ne constituent qu’une partie de la data
science de Weborama. Soucieux de rendre facilement
accessible aux utilisateurs cette science basée sur les algorithmes complexes et les technologies de stockage et
de traitement robustes, Weborama entend poursuivre
ses efforts de recherche et développement. La passion
des données fait partie intégrante de l’ADN de la société,
renommée sur le marché publicitaire européen pour son
approche lexicale du digital. Le claim « From data to value » illustre bien son savoir-faire et la volonté de rendre les
données utiles en leur donnant une dimension humaine.
WEBORAMA,
FROM DATA TO VALUE
Weborama est le leader européen de la data et dispose
d’une base de données de 110 M de profils.
Depuis 15 ans, Weborama développe des solutions d’adserving, DMP, analyse d’audience, segmentation des données et ciblages.
Plus de 300 clients utilisent ses solutions innovantes pour
piloter et optimiser leurs investissements online en France,
en Espagne, en Italie, au Portugal, aux Pays-Bas, au UK et
en Russie :
Weborama Audience Manager : data management
platform pour la segmentation des différentes sources de
données 1st party (CRM, média et site) et enrichissement
par les données 3rd party, via l’accès à la data propriétaire
de Weborama
Weborama Audience Insight : outil d’analyse comportementale et sociodémographique d’audience des sites
Internet
Weborama Campaign Manager : outil d’adserving et
d’ad analytics pour la gestion et l’optimisation des campagnes publicitaires
Weborama Advanced Rich Media : outil de gestion des
campagnes Rich Media/vidéo
© 2013, Weborama
Tous droits réservés pour tous pays.
Toute reproduction même partielle est strictement interdite.
Imprimé en France.
Conception graphique et réalisation © LES 5 SUR 5 .COM
Weborama Audience Exchange : plateforme d’audience premium et multi device, via deux canaux (WAX for
agency, WAX for trading desk). Formats classiques, Rich
Media et in stream.
*
Weborama
est cotée sur
Alternext
depuis juin 2006
(ALWEB).
Son chiffre
d’affaires a
atteint 24,3 M d’€
en 2012.
www.weborama.com