La data selon Weborama
Transcription
La data selon Weborama
la data selon weborama Application de la segmentation d’audience au pilotage du média par la data La montée en puissance du digital et les nouvelles possibilités qu’il offre en matière de publicité ont chamboulé l’écosystème publicitaire qui, depuis L’univers big data l’âge d’or de Madison Avenue, était principalement fondé sur la création. Pour autant, il ne faut pas perdre de vue que la data (désormais à portée de main grâce au plus jeune des médias) « n’est pas en train de tuer la créativité, mais simplement de changer notre manière de raconter des histoires. » (Alex Williams, journaliste Tech Crunch)* * “(Data) is not killing creativity, it’s just changing how we tell stories”. ès l’apparition des métiers publicitaires, les professionnels du marketing ont rêvé de ne s’adresser qu’à des audiences utiles, c’est-à-dire potentiellement intéressées par leur offre. Le monde de la communication a connu de très bonne heure la définition de « cibles marketing » : la ménagère de moins de 50 ans, les CSP+, les early adopters ou les seniors. Le développement du marketing direct et des bases de données CRM – ou PRM – ont permis d’affiner et de préciser le ciblage, et de s’adresser véritablement au consommateur. * “I think of that famous 1993 New Yorker cartoon by Peter Steiner: ‘On the Internet, nobody knows you’re a dog.’ Now it’s more like, ‘On the Internet, everybody knows what brand of dog food you buy”*. Geoff Nunberg enseigne la linguistique à l’université de Californie, à Berkeley. Il est l’auteur de The Way We Talk Now, Going Nucular, Talking Right and The Years of Talking Dangerously. Son dernier ouvrage paru est Ascent of the A-Word. Il intervient comme consultant linguistique dans l’émission de NPR Fresh Air, animée par Terry Gross. Le média Internet et les nouvelles technologies ont bouleversé le concept même de la cible. Le rêve devient désormais réalité puisque la navigation des internautes est traçable. Les annonceurs peuvent toucher leurs clients et prospects en se basant non seulement sur les actions déjà accomplies par l’internaute (achat, demande de conseil, essai d’un produit, etc.), mais également sur ses besoins futurs, prédictibles grâce au suivi et à l’analyse mathématique de leur comportement en ligne. Le phénomène Big Data prend de l’ampleur, les marques peuvent désormais centraliser et exploiter toutes les sources de données disponibles, qu’elles soient offline ou online, média ou CRM. Avec comme finalité, d’une part, d’enrichir la connaissance de leurs clients avec les données de navigation sur Internet pour mieux les fidéliser, et d’autre part de créer des bases d’internautes potentiellement acheteurs de leurs produits et services. « J’ai en tête cette fameuse illustration de Pierre Steiner parue dans le New Yorker en 1993 : “Sur Internet, personne ne sait que vous êtes un chien.” De nos jours, ce serait davantage : “Sur Internet, tout le monde sait quelle marque de nourriture pour chien vous achetez.”*. L e Big Data ne concerne pas seulement le marketing, même si ce secteur en tire évidemment les bénéfices. Il y a également la finance, la santé, le sport, la météorologie… Selon le journaliste John Edwards, « Comme la mort et les impôts, la météo est une certitude. Et, grâce au Big Data, elle est désormais une certitude plus prévisible. »** Dans tous ses domaines, le Big Data confère plusieurs avantages déterminants : la fiabilité, la fraîcheur et la perti- nence des données. Pourtant, à l’état brut, les données ne possèdent pas de valeur. Les technologies adaptées et l’intelligence humaine sont nécessaires pour leur donner du sens. Les difficultés liées au Big Data concernent surtout le volume et l’hétérogénéité des données qui doivent être traitées à très grande vitesse. Stephen Gold (IBM) estime en 2012 que « 90 % de l’ensemble des données du monde ont été créées ces deux dernières années ». Mais le grand enjeu pour tout data scientist n’est pas seulement de disposer d’un espace de stockage illimité ou de mettre au point des algorithmes rapides et puissants : il s’agit de rendre la data pertinente et vivante, de la faire parler, ce qui constitue une tâche plus complexe. Comme exemple : un algorithme se donne pour but de déceler les lieux de vie d’une personne, ingérant les données de géolocalisation liées à son mobile. Les premiers résultats aboutissent à trois lieux : le domicile de la personne, son bureau et... un feu rouge sur une grande artère. Sans intelligence humaine, les traitements du Big Data ne peuvent aboutir à un résultat pertinent. P our relever ces défis, le Big Data puise non seulement dans les technologies les plus modernes, mais aussi dans les acquis scientifiques du passé. La mise au point de tests statistiques d’hypothèse, des premiers arbres de décision, très utilisés dans le domaine de la Segmentation Marketing, date de 1900. Ces modèles continuent d’être améliorés aujourd’hui. À l’inverse, « Map Reduce » est un algorithme de traitement de la donnée moderne, fondé sur un mode de calcul des données distribué en parallèle, très en vue dans le monde du Big Data, apparu en 2004. Les nouveaux modèles de stockage (par exemple le cloud) et de bases de données rendent en partie obsolète les bases relationnelles comme SQL. L’univers du Big Data est en mouvement perpétuel. En ce qui concerne les experts data, ils possèdent des compétences variées. Mais ce qu’ils ont tous en commun, c’est l’ouverture aux nouvelles technologies et la capacité à les accorder aux acquis (théorèmes, algorithmes) parfois anciens. Une connaissance historique des mathématiques et des statistiques est un atout de tout expert data. ** “Like death and taxes, weather is a certainty. And, thanks to Big Data, it’s now a more predictable certainty”. D’après Douglas Merrill, fondateur et CEO de ZestFinance. com, « With too little data, you won’t be able to make any conclusions that you trust. With loads of data you will find relationships that aren’t real… Big data isn’t about bits, it’s about talent ». (Avec trop peu de données, vous ne serez pas capables de tirer des conclusions dans lesquelles vous puissiez avoir confiance. En collectant des tas de données, vous allez établir des relations qui ne sont pas réelles… Le Big Data n’est pas une affaire de bits, mais de talent). La data au cœur de l’activité de Weborama D epuis sa création il y a 15 ans, Weborama est engagée dans la science de la data au service du marketing en ligne. Pionnier de l’innovation technologique sur son marché, Weborama investit constamment dans son service R&D, dont l’effectif constitue 52 % des effectifs totaux de la société. La data est au cœur de son expertise, grâce aux data strategists, aux consultants data, aux linguistes-informaticiens, aux statisticiens, aux mathématiciens et aux développeurs. la vision ‘‘ data ‘‘ science de weborama Le Big Data est aujourd’hui le moteur des développements de Weborama et il continuera de l’être dans le futur. Avec toujours le même souci de collecter des données anonymes, l’individu bénéficie des recherches et des études construites et calibrées sur la masse. Le respect de la vie privée D epuis sa fondation en 1998, Weborama porte une attention particulière au respect de la vie privée des internautes. La société participe activement aux nombreux chantiers e-privacy de l’industrie digitale française. Précurseur dans le domaine, Weborama milite depuis plusieurs années pour la transparence des acteurs de son marché envers les consommateurs. Parmi les nombreuses initiatives entreprises par la société, la co-rédaction du livre blanc « Ciblage publicitaire et respect de l’internaute » de l’IAB, signature de la charte paneuropéenne de la publicité comportementale ou bien de la charte de l’Union française du marketing direct et digital (UFMD). En accord avec les législations en vigueur, les internautes peuvent se désinscrire à tout moment du programme de collecte de Weborama, soit à partir d’opt-out sur le site du groupe, soit via l’icône Ad Choices, présente sur toute publicité ciblée et renvoyant vers le site YourOnlineChoices de l’IAB Europe. Les questions de la vie privée des internautes ont fait l’objet de l’ouvrage d’Alain Levy, président de Weborama, « Sur les traces de Big Brother, la vie privée à l’ère numérique »*. Prônant l’importance de l’éducation du grand public au digital, il conclut : « […] Pour que les internautes acceptent cette quête incessante de données, il est fondamental que les sociétés de ce domaine soient mieux connues du grand public, en communiquant davantage sur leurs principes éthiques, et en consolidant un socle de bonnes pratiques. […] Elles doivent engager le dialogue avec leurs clients, leurs salariés, leurs actionnaires, leur environnement politique, les associations, les consommateurs. […] Nous ne “fliquons” personne. Nous essayons de mieux comprendre les goûts et les habitudes des internautes afin de ne les exposer qu’à des messages qui collent à leur profil et répondent à leurs attentes. C’est l’application du principe de développement durable à la publicité. » Une vision sémantique d’Internet L’ approche « Data science » de Weborama consiste à collecter et à traiter les données, afin de les analyser et de les segmenter de façon à ce qu’elles puissent être déployées au sein des campagnes publicitaires. Weborama considère le web comme un espace lexical infini où les mots entretiennent des relations de proximité ou de distance en fonction du contexte dans lequel ils apparaissent, tel que ce contexte est révélé par les requêtes des internautes (le « search ») et par le contenu lexical des sites qu’ils visitent (le « surf »). Provenant de 300 000 sites sources, les données sont collectées de façon anonyme, via les cookies, et instantanément traitées. Cette classification de l’audience constitue un processus stratégique au sein de chaque base de données. Grâce à cette méthodologie, Weborama dispose d’une base de données de 110 millions de profils comportementaux, sociodémographiques et intentionnistes en Europe, dont 70 millions en France. * Alain Levy, « Sur les traces de Big Brother, la vie privée à l’ère numérique », l’Éditeur, 2010, Paris. Weborama identifie ce jour près de 200 clusters (centres d’intérêt) basés sur le comportement des internautes et répartis dans 23 segments (un segment étant une « famille » de clusters). La base sociodémographique de Weborama est cons truite à partir d’un panel. Celui-ci est constitué de 300 000 internautes actifs en France ayant répondu à un questionnaire de leur plein gré et ayant renseigné leur âge, sexe et catégorie socioprofessionnelle. Grâce au croisement des clusters comportementaux et du panel sociodémographique de Weborama, les données du panel sont extrapolées à l’ensemble de la base. La technologie au service de la « data science » L’ ensemble des solutions de Weborama est alimenté par les technologies brevetées, basées sur les algorithmes propriétaires et le traitement automatique du langage (TAL). La robustesse des outils de collecte et de stockage, ainsi que la solidité de l’infrastructure, permettent le traitement instantané de très importants volumes de données. Grâce à la navigation intuitive, la dimension technologique s’efface au profit d’une expérience utilisateur centrée sur la data. 33 M d’urls actives 300 000 sites analysés chaque jour 110 M de profils actifs par mois 3,5 M d’internautes qualifiés par jour 25 mots par jour et par internaute tracking ad exchanges annonceurs éditeurs - Data CRM - Data du site Internet - Data média - Data relative à l’audience du site data “3rd party” Le déploiement du savoir-faire de Weborama au sein du marché publicitaire L a base de données 3rd party* de Weborama, une véritable source d’enrichissement des données 1st party**, constitue le pilier de l’ensemble des outils mis à disposition des clients. L’efficacité de sa data est éprouvée par Weborama, son premier utilisateur depuis 15 ans, aussi bien au sein des campagnes publicitaires branding et performance (bundle data & media, proposé par Weborama au sein de sa plateforme publicitaire, Weborama Audience Exchange, et testé par rapport aux campagnes non-ciblées), que pour les études marketing. Weborama propose trois solutions technologiques complémentaires et communicantes : Data science - Weborama Audience Manager (data management platform) ; - Weborama Audience Insight (outil d’analyse comportementale d’audience des sites Internet) ; Technology : - Weborama Campaign Manager (outil d’adserving permettant la gestion et l’optimisation des campagnes publicitaires). Grâce à ces outils, Weborama réussit le passage de la micro donnée au Big Data, c’est-à-dire d’une suite d’événements insignifiants produits par l’internaute lors de sa navigation, à la construction de son profil marketing complet. * Données d’un acteur tiers, n’appartenant pas à un annonceur ou un éditeur, mais mises à sa disposition pour le déploiement au sein de ses actions marketing en ligne. ** Données propriétaires d’un annonceur ou d’un éditeur. applications possibles de la & usage de la data data science 3 party rd la segmentation pOUr les annonceurs La démarche L es informations récoltées sur Internet constituent une vraie mine de savoir. Pour en tirer profit, il est nécessaire de traiter et d’analyser un volume de données disponibles très important, après avoir déterminé celles qui sont susceptibles d’améliorer le ROI digital d’un annonceur. Il existe de nombreuses techniques de ciblage des internautes. Souvent basées sur les cibles marketing historiques de l’annonceur, ces techniques ne se montrent pas toujours aussi efficaces qu’on le voudrait. Pour déterminer les ciblages plus précis, il convient donc de regarder les performances des campagnes média, en prenant en compte le profil des internautes exposés ou « cliqueurs » et les données relatives aux « transformations » (souscriptions aux produits proposés par la campagne). La segmentation de l’audience d’un site Internet ou d’une campagne publicitaire permet de déterminer les cibles utiles en fonction de l’offre de l’annonceur. Ces cibles pourront être déployées au sein des campagnes média à venir. Dans l’optique de l’extension d’audience, il est désormais possible de cibler les « look alike », c’est à dire les internautes ayant le profil similaire à celui des internautes qui « transforment ». Cela permet de leur proposer une publicité personnalisée en fonction de leur profil. Première application pratique par un annonceur L a première application de la segmentation d’audience des campagnes média a été réalisée en 2012. Ce déploiement de la segmentation a eu lieu pour un annonceur dont le catalogue d’offres était très fourni, ce qui rendait plus complexe la définition de ses cibles marketing. Bien que disposant d’une base CRM très fournie, cet acteur souhaitait mieux connaître les cibles potentiellement inté- ressées par chacune des offres et chacun des produits sur le digital, dans une optique de recrutement de nouveaux clients, mais également de ventes croisées. L’objectif poursuivi était ainsi d’optimiser les campagnes digitales pour augmenter le taux de transformations et limiter la déperdition des investissements média. Pour atteindre cet objectif, l’annonceur a fait appel à Weborama afin de construire un dispositif correspondant à son catalogue commercial. Méthodologie Weborama L a segmentation d’audience pour les annonceurs comprend plusieurs étapes. Après la phase de modélisation, suit une phase de validation des modèles, puis une phase de tests au sein de campagnes média. La démarche s’inscrit dans l’ensemble des processus data proposés par Weborama : collecte de la data brute, traitement, analyse, segmentation et enfin déploiement média. Dans le cadre de la segmentation au service du pilotage du média par la data, les étapes de la démarche se traduisent de la façon suivante : - la constitution d’une base de datamining, provenant d’une ou de plusieurs campagnes média de l’annonceur ; - l’entraînement du modèle, au cours duquel sont émises des hypothèses sur les cibles utiles des offres ou produits concernés ; - le calcul des arbres de segmentation ; - la mise au point du modèle de ciblage publicitaire ; - la simulation d’une campagne média ayant pour but de confirmer les hypothèses émises lors de l’entraînement du modèle ; - la diffusion d’une campagne ciblée et A/B testing (comparaison des résultats de la population ciblée et non ciblée). Constitution d’une base de datamining Avant de segmenter l’audience de l’annonceur, Weborama a construit une base d’internautes exposés aux campagnes de celui-ci, ou ayant visité son site. Cette base est enrichie par des critères sociodémographiques et comportementaux pour les internautes dont Weborama con nait le profil, grâce à sa base de données de 70 millions de profils qualifiés en France. Ces données sont croisées avec celles de Weborama Campaign Manager. L’ensemble de ces informations anonymes est accessible via l’identifiant de l’internaute (qui est une suite de caractères propre à chaque individu contenue dans les cookies déposés dans le navigateur Internet). Cet identifiant unique permet à Weborama de retrouver dans sa base de données, en temps réel, le profil complet de l’internaute. Weborama a appliqué dans cette démarche les données provenant du search (requêtes dans les moteurs de recherche) et du surf (navigation à travers la toile) des internautes, afin de leur attribuer le profil correspondant à leur sexe, âge et catégorie socioprofessionnelle, ainsi qu’à leurs centres d’intérêt et leur comportement en ligne. Pendant plusieurs semaines, Weborama a récolté les informations sur les transformations post view (à la suite d’une publicité servie par Weborama, sans qu’il y ait un clic direct lors du visionnage). La base de Datamining ainsi constituée pour l’annonceur comporte quelque 60 millions de profils qualifiés sur environ 300 colonnes, parmi lesquelles : les publicités auxquelles l’internaute a été exposé, sa réactivité face à la publicité (visite, clic), son comportement sur le site (catégories de produits recherchées, produits mis en panier, conversion, etc.), son profil sociodémographique et son profil comportemental. Entraînement du modèle (calcul des arbres de décision et mise au point du ciblage publicitaire) Après la constitution de la base exploitée pour la segmentation, Weborama a construit une représentation graphique des critères de ciblage permanents. La solution retenue, à savoir les arbres de segmentation, permet d’extraire les critères les plus pertinents pour chaque offre. Ces cri- tères sont basés sur les transformations des internautes exposés à une campagne publicitaire et sur les impressions générées lors de celle-ci. Le logiciel choisi a permis de tester chaque critère, afin de déduire les critères à retenir, présents dans les cookies des internautes exposés. Avant la constitution des arbres de segmentation, l’algorithme de segmentation de Weborama a permis, en partant de la racine, d’associer à chaque nœud de l’arbre le critère et le seuil d’affinité le plus pertinent. Ensuite, Weborama a calculé le gain de taux de transformations pour chaque nœud des arbres. Seuls les nœuds présentant les gains de taux de transformations les plus avantageux seront sélectionnés pour les campagnes média ciblées. Weborama a également calculé un intervalle de confiance pour tous les gains de taux de transformations. Contenu entre une valeur minimum et une valeur maximum, cet intervalle permettra, d’une part, de confirmer chaque modèle lors de la phase de simulation d’une campagne média, d’autre part, de surveiller les résultats de futures campagnes ciblées de l’annonceur (cf infra). L’offre de l’annonceur est complexe et inclut les différentes variantes (5 produits au total). La segmentation de l’audience se fera donc en fonction de ces caractéristiques, avec un arbre de segmentation correspondant à un produit. Exemple d’arbre de segmentation et de son analyse en vue des futures campagnes média sd 3 < 6 1,3 p=452 12,2% USAGE < 13 0,67 p=255 13,5% CLUSTER 2 < 1 0,4 p=549 48,8% CLUSTER 3<3 0,94 p=121 4,6% sd 3 >= 6 4,23 p=78 0,6% USAGE >= 13 1,45 p=530 12,8% CLUSTER 4<1 2,4 p=818 11,8% * CLUSTER 2 >= 1 1,05 p=785 26,3% CLUSTER 4 >= 1 4,92 p=408 2,8% sd 2 < 10 0,52 p=50 3,4% sd 1 < 2 2,89 p=1226 14,6% CLUSTER 3 >= 3 2,03 p=136 2,3% sd 2 >= 10 1,31 p=257 6,9% sd 1 >= 2 1,05 p=307 10,3% CLUSTER 1 >= 1 2,13 p=1533 24,9% CLUSTER 1 < 1 0,62 p=1314 75,1% 1 p=2845 100% L’arbre de segmentation se lit de bas en haut, en remontant de la racine vers les branches supérieures. À la racine, l’ensemble de la population exposée à la campagne, avec le gain de taux de transformations égal à 1 et servant de comparaison avec les différents niveaux de branches, le nombre d’exemples positifs (les internautes ayant transformé) et le pourcentage d’impressions publicitaires diffusées auprès de la population (ici égal à 100 %). blage au sein d’une campagne média s’il est strictement supérieur à 1. Dans le cas inverse, il peut être utilisé pour exclure du dispositif de communication en ligne les internautes qui ne transforment pas ; - le nombre d’exemples positifs au sein de la population appartenant à un critère ou cluster ; - le pourcentage d’impressions publicitaires diffusées auprès de cette population. Nous pouvons considérer qu’il s’agit d’un pourcentage approximatif de la population exposée à la campagne. Les branches de l’arbre comportent 4 informations clés : - le cluster comportemental ou critère sociodémographique discriminant, avec le quantile correspondant ; - le gain de taux de transformations par rapport à la population globale exposée. Celui-ci est pertinent pour le ci- L’analyse d’un arbre de segmentation repose sur une capacité à trouver un équilibre entre la performance, donc les cibles utiles (le gain de taux de transformations supérieur à 1) et le pourcentage d’impressions suffisant pour la puissance de la campagne. * Le critère « USAGE » correspond aux internautes dont la navigation sur Internet est soutenue. Les deux branches du même niveau sont à chaque fois complémentaires, les internautes ne peuvent pas faire partie des deux côtés à la fois. Il est donc possible d’additionner plusieurs groupes d’internautes (cf. les critères rouges dans l’exemple ci-dessus), pour une diffusion plus large. Exemple de lecture : concentrons-nous sur les deux populations marquées en rouge sur l’arbre de décision. Nous avons d’un côté les internautes qui ont, dans leur cookie, le CLUSTER 1 avec le quantile supérieur ou égal à 1. Nous savons qu’ils ont été exposés à la campagne et ont transformé 2,13 fois plus que la population au global. Nous savons également qu’ils constituent près de 25 % de la population exposée. Sur la branche opposée, nous sommes intéressés par les internautes qui ont À LA FOIS le CLUSTER 1 avec le quantile inférieur à 1 (donc égal à 0) ET le cluster 2 dont le quantile est supérieur ou égal à 1 ET qui sont des surfeurs importants (ce critère doit atteindre le quantile minimum de 13). Ces internautes constituent près de 13 % de la population exposée et transforment 1,45 fois plus que l’ensemble des internautes ayant potentiellement vu la campagne. Simulation d’une campagne média (confirmation des hypothèses) La définition d’un modèle d’audience pour chaque offre et produit n’est qu’une phase de modélisation. Celle-ci nécessite d’être confirmée par une simulation de campagne média. Aucun ciblage n’est mis en place. Les résultats de cette campagne sont croisés avec le fichier de datamining, afin de voir les corrélations avec le modèle défini auparavant, lors de l’entraînement du modèle. Dans le cas de la simulation pour l’annonceur évoqué plus haut, Weborama a observé de parfaites corrélations entre la base de datamining et la simulation d’une campagne. Ces résultats de l’application des arbres de segmentation ont permis de confirmer la justesse des ciblages proposés pour chaque offre et produit. Les profils qui transforment sont bien ceux que Weborama a mis en avant dans les arbres de décision. Les futures actions de communication pourront désormais bénéficier d’un ciblage bien précis afin d’augmenter le ROI digital de chaque campagne. Diffusion d’une campagne ciblée et AB testing Après la définition des modèles de ciblage dédiés à chaque offre et à la suite de la confirmation des arbres de décision lors d’une simulation de campagne, la data jouera son rôle final. Elle sera désormais valorisée au sein des campagnes média afin d’augmenter leur efficacité et de diminuer la déperdition. Simultanément et dans exactement les mêmes conditions, Weborama a diffusé deux campagnes média : l’une ciblée et l’autre auprès d’une population non ciblée. Le rapprochement des résultats des deux types de campagnes a confirmé une fois de plus la justesse des cibles définies auparavant au sein des arbres de décision. L’augmentation du nombre de transformations attendue a bien été réalisée. Des variations du gain de taux de transformations ont été notées par rapport à ceux exposés dans l’arbre de décision. Toutefois, les résultats n’ont pas dépassé l’intervalle de confiance. Les variations des résultats versus les prévisions peuvent avoir lieu pour plusieurs raisons : elles peuvent être liées aux créations publicitaires ou bien aux facteurs externes à la campagne, comme un événement calendaire ou une période de vacances, durant lesquels les internautes changent leurs habitudes de navigation. L’intérêt de définir en amont les intervalles de confiance réside dans la prise en compte de l’ensemble de ces facteurs. Déploiement et futur de la segmentation d’audience La segmentation d’audience, et plus particulièrement les arbres de segmentation, peuvent être utilisés à des fins différentes. Dans le cadre du pilotage du média par la data, au-delà de l’amélioration du ROI digital d’une campagne média par le ciblage des internautes potentiellement intéressés par les produits, il est possible d’appliquer les arbres dans l’optique de ventes croisées ou de calcul de valeur potentielle d’un internaute. Weborama développe l’intégration de ce dispositif au sein d’un de ses outils marketing pilotés par la data : les C-Clones. Les C-Clones, ou les « look alike », sont une extension d’audience basée sur les transformations des internautes. Comme dans la démarche décrite ci-dessus, il s’agit d’allier la performance et la puissance d’une cam- taux de transformations 6 USAGE < 13 0,67 p=255 13,5% USAGE >= 13 1,45 p=530 12,8% * CLUSTER 4<1 2,4 p=818 11,8% CLUSTER 2 >= 1 1,05 p=785 26,3% CLUSTER 2 < 1 0,4 p=549 48,8% 5 CLUSTER 3<3 0,94 p=121 4,6% Sd 3 >= 6 4,23 p=78 0,6% Sd 3 < 6 1,3 p=452 12,2% pagne média efficace, en choisissant une population qui est susceptible de souscrire aux produits de la campagne et qui est suffisamment large pour la diffusion. L’interface C-Clones sera intégrée dans la data management plateform Weborama Audience Manager. L’intégration des arbres de segmentation permettra, en un coup d’œil, de déterminer le profil utile de la campagne. CLUSTER 4 >= 1 4,92 p=408 2,8% Sd 2 < 10 0,52 p=50 3,4% Sd 2 >= 10 1,31 p=257 6,9% Sd 1 < 2 2,89 p=1226 14,6% CLUSTER 1 >= 1 CLUSTER 1>=1 2,13 p=1533 2,13 24,9% p=1533 24,9 % CLUSTER 1 < 1 0,62 p=1314 75,1% USAGE < 13 0,67 p=255 13,5% CLUSTER 2 < 1 0,4 p=549 48,8% 1 p=2845 100% 4 CLUSTER 3<3 0,94 p=121 4,6% Sd 3 >= 6 4,23 p=78 0,6% Sd 3 < 6 1,3 p=452 12,2% Sd 1 >= 2 1,05 p=307 10,3% USAGE >= CLUSTER 13 * 4<1 1,45 2,4 p=818 p=530 11,8% 12,8 % USAGE >= 13 1,45 p=530 12,8% CLUSTER 2 >= 1 1,05 p=785 26,3% CLUSTER 4 >= 1 4,92 p=408 2,8% Sd 2 >= 10 1,31 p=257 6,9% Sd 1 < 2 2,89 p=1226 14,6% Sd 1 >= 2 1,05 p=307 10,3% CLUSTER 1 > = 1 2,13 p=1533 24,9 % CLUSTER 1 >= 1 2,13 p=1533 24,9% CLUSTER 1 < 1 0,62 p=1314 75,1% 3 Sd 2 < 10 0,52 p=50 3,4% 1 p=2845 100% + 2,13 2 1,89 1 0 5 10 15 20 25 24,9 % 30 35 40 37,7 % 45 50 55 60 65 70 75 80 85 90 95 100 % de la population la segmentation pOUr les éditeurs La démarche L a connaissance de leur audience est devenue un enjeu majeur pour les éditeurs, qui souhaitent valoriser au mieux leur inventaire publicitaire afin d’optimiser sa monétisation. La segmentation de l’audience du site offre à l’éditeur de nombreuses opportunités. Opportunités d’exploitation A vant tout, les éditeurs souhaitent organiser leur offre dans le but de proposer aux annonceurs et aux agences, en complément du volet contextuel, des packs d’audience ciblés, enrichis par la data 3rd party. Le second enjeu est de construire des packs d’audience spécifiques grâce aux cibles ad hoc, basées sur l’alliage de ciblages sociodémographique et comportemental (prenant en compte les centres d’intérêt des internautes). L’exploitation de la data permettra donc de piloter la commercialisation de l’inventaire du site et de diffuser les publicités auprès des contacts utiles, tout en « désengorgeant » les rubriques surchargées. Le coût par mille (CPM) de vente des emplacements publicitaires sera ainsi revalorisé par la vente d’audience utile. Quant aux formats publicitaires dits événementiels, ils sont principalement commercialisés de façon forfaitaire, sur une base journalière. Grâce à la data, ils pourront également être ciblés et mis à la disposition des acheteurs au CPM. À titre d’exemple, un « habillage comportemental » ne sera plus visible pendant seulement une journée et uniquement sur la home page, mais plutôt sur une période de 15 jours, sur l’ensemble des pages du site et affiché en fonction du profil de l’internaute, correspondant à la cible en affinité avec la campagne. La segmentation d’audience d’un site permet d’apercevoir des profils de visiteurs qui vont au-delà de sa thématique. Il est fort probable qu’un site d’actualité ait, au sein de son audience, des amateurs d’autres domaines (finance, beauté, mode, cuisine, voyage…). Cela donnera à l’éditeur la possibilité de valoriser non seulement son contenu de qualité, mais également son audience, ceci en élargissant la typologie des clients. engagement W eborama s’engage auprès des éditeurs à collecter les données brutes et anonymes de navigation. L’analyse de l’audience, suivie d’une proposition de cibles marketing pertinentes, sera effectuée dans un délai de trois semaines à compter de la pose des tags Weborama sur le site de l’éditeur. Les données servant au ciblage seront transférées sous un mois et les cibles seront ensuite optimisées quotidiennement, afin de répondre au mieux aux attentes de l’éditeur. Par là même, Weborama ne commercialise pas la data de l’éditeur seule et ne redéfinit pas les packs d’audience du site. Les informations liées à l’audience de ce dernier étant strictement confidentielles, Weborama s’interdit de les communiquer aux autres acteurs. Méthodologie Weborama W eborama propose aux éditeurs deux méthodes de l’enrichissement de leur data par les données 3rd party. La première méthode consiste à synchroniser et projeter les critères sociodémographiques et clusters comportementaux de Weborama sur l’audience du site de l’éditeur. Cela est possible grâce à l’identification des profils reconnus au sein de l’audience du site, qui font déjà partie de la base de données de Weborama. Synchronisation et projection des clusters et du sociodémographique Dans ce cas précis, l’adserver de l’éditeur appelle la base de données Weborama pour chaque internaute. Si la base de données de Weborama reconnaît le profil sociodémographique ou comportemental du visiteur du site, ce dernier est transféré à l’adserver éditeur. L’adserver éditeur dispose alors des profils sociodémogra phiques et comportementaux de la majorité de ses internautes. RECONNAISSANCE DU PROFIL INTERROGATION DE LA Base De Données WEBORAMA AD SERVER ÉDITEUR INTERNAUTES du site de l’ÉDITEUR WEBORAMA TRANSFÈRE LA LISTE DE VALEUR DU PROFIL ANALYSÉ IDENTIFICATION DES CENTRES D’INTÉRÊT & DU PROFIL SOCIODÉMOgraphique La seconde méthode identifie et d’analyse le profil des internautes du site afin de créer des cibles ad hoc correspondant aux secteurs d’activité des annonceurs. Identification, analyse et création de cibles ad hoc Cet enrichissement est axé sur l’analyse des profils des internautes du site éditeur afin de créer des cibles ad hoc qui lui sont propres et qui pourront être exploitées par la régie. Cette approche se traduit en trois étapes : tout d’abord l’identification et l’analyse des cibles, ensuite l’enrichissement du ciblage et la création de cibles customs pour la régie, et enfin le processus de transfert de profils. - Identification & analyse des cibles Dans cette étape, Weborama met en place l’outil d’analyse comportementale et sociodémographique du site, Weborama Audience Insight (WAI). WAI permet d’identifier et de classer les segments et clusters compor- identification & analyse enrichissement via la base de données weborama tementaux par puissance et/ou affinité, en croisant l’au dience du site avec la base de données de Weborama. Les profils les plus discriminants sont déduits en comparant l’audience du site de l’éditeur avec la moyenne relevée au sein de la base de données de Weborama. - Enrichissement du ciblage et création de cibles ad hoc L’étude WAI permet la création de cibles ad hoc, alliant les critères sociodémographiques aux clusters comportementaux. Trouver un équilibre entre les indicateurs de puissance et d’affinité est ici déterminant afin de définir une volumétrie de profils pertinente. - Transfert des cibles ad hoc Le transfert des cibles ad hoc précédemment définies est possible grâce à une liste de différents pixels adserver. Ce transfert se fait par l’intermédiaire d’un appel des pixels générés par l’adserver éditeur. Les volumes souhaités de profils par cible sont alors disponibles directement dans l’adserver. création des cibles AD HOC diffusion site tr et/ou rubrique automobile et/ou région ÎLE-DE-FRANCE an CIBLE 1 sf er t transfert 3rd party CIBLE 2 t CIBLE 3 t er sf n ra ROTATION GéNéRALE RÉGIE MARKETING DIGITAL PILOTÉ PAR la data a data ne conditionnera pas que les actions liées à la communication digitale. De plus en plus présente, elle prendra une place importante dans tous les aspects de notre vie, aussi bien dans la sphère personnelle que dans la sphère professionnelle. Afin de profiter des opportunités offertes par « l’or de demain », les entreprises devront revoir leur organisation interne, souvent structurée en silos : media digital, site marchand, CRM, etc. En ce qui concerne le marché publicitaire, la data devient une composante à part entière au marketing. Aujourd’hui, son déploiement au sein de tous les leviers du marketing digital est une nécessité pour les marques. Celles-ci recherchent toujours à toucher les clients et prospects de façon plus pertinente afin de rendre plus efficaces les actions de communication en ligne. En parallèle, la dichotomie offline et online tend à disparaître. Depuis 15 ans, Weborama offre des solutions data innovantes et complètes. La segmentation d’audience et les arbres de décision ne constituent qu’une partie de la data science de Weborama. Soucieux de rendre facilement accessible aux utilisateurs cette science basée sur les algorithmes complexes et les technologies de stockage et de traitement robustes, Weborama entend poursuivre ses efforts de recherche et développement. La passion des données fait partie intégrante de l’ADN de la société, renommée sur le marché publicitaire européen pour son approche lexicale du digital. Le claim « From data to value » illustre bien son savoir-faire et la volonté de rendre les données utiles en leur donnant une dimension humaine. WEBORAMA, FROM DATA TO VALUE Weborama est le leader européen de la data et dispose d’une base de données de 110 M de profils. Depuis 15 ans, Weborama développe des solutions d’adserving, DMP, analyse d’audience, segmentation des données et ciblages. Plus de 300 clients utilisent ses solutions innovantes pour piloter et optimiser leurs investissements online en France, en Espagne, en Italie, au Portugal, aux Pays-Bas, au UK et en Russie : Weborama Audience Manager : data management platform pour la segmentation des différentes sources de données 1st party (CRM, média et site) et enrichissement par les données 3rd party, via l’accès à la data propriétaire de Weborama Weborama Audience Insight : outil d’analyse comportementale et sociodémographique d’audience des sites Internet Weborama Campaign Manager : outil d’adserving et d’ad analytics pour la gestion et l’optimisation des campagnes publicitaires Weborama Advanced Rich Media : outil de gestion des campagnes Rich Media/vidéo © 2013, Weborama Tous droits réservés pour tous pays. Toute reproduction même partielle est strictement interdite. Imprimé en France. Conception graphique et réalisation © LES 5 SUR 5 .COM Weborama Audience Exchange : plateforme d’audience premium et multi device, via deux canaux (WAX for agency, WAX for trading desk). Formats classiques, Rich Media et in stream. * Weborama est cotée sur Alternext depuis juin 2006 (ALWEB). Son chiffre d’affaires a atteint 24,3 M d’€ en 2012. www.weborama.com