Ordonnancement de campagnes marketing email

Transcription

Ordonnancement de campagnes marketing email
Ordonnancement de campagnes marketing email
Julien Autuori, Cédric Hervet, Nourredine Tabia
SOCIO Logiciels - 7 rue du Pasteur Wagner - 75011 Paris, France
{jautuori,chervet,ntabia}@socio.fr
Mots-clés : ordonnancement,campagne d’e-mails,heuristique,local solver
1
Introduction
Le management de campagnes marketing via le canal email [2] est une activité soumise
à des contraintes de plus en plus fortes, qui fait naître le besoin d’une approche rationnelle
d’optimisation des ressources (les destinataires disponibles dans la base de prospects) à utiliser
adéquatement pour les tâches à réaliser (les campagnes email, i.e. un email type à diffuser). Les
approches telles que le datamining et la modélisation [4] permettent de prédire les réactions d’un
prospect (i.e. destinataire d’un email) en fonction du message qui lui est envoyé. Néanmoins,
la quantité de messages qu’un prospect peut recevoir est limitée par sa tolérance à la pression
marketing qui, si elle est dépassée, pourra occasionner sa désinscription de la base (ou attrition
du prospect), voire sa plainte auprès du Fournisseur d’Accès Internet (FAI) qui entraine le
blocage de futurs emails. Par ailleurs, chaque campagne email cherche à remplir des objectifs de
performance, tout en ayant des modes de rémunération qui lui sont propres. L’optimisation de
ce processus peut se modéliser comme un problème d’ordonnancement stochastique de grande
taille [3]. Nous proposons un modèle mathématique modélisant le processus de planification
des envois de campagnes emails se basant sur de la donnée prédite, et donc probabiliste.
Nous résolvons par méthode approchée en deux étapes, d’abord en agrégeant les prospects
par similarité dans des groupes qui permettent de réduire drastiquement la taille du problème
Ensuite, la planification est établie au sein de chaque groupe de prospects. Du fait de la
non-linéarité des problèmes et leur taille, la résolution est faite sous Local Solver [1]. Nous
comparons les résultats obtenus dans l’optimisation avec des ordonnancements obtenus avec
deux heuristiques simulant les plannings d’envois de campagnes créés en réalité.
2
Modèle pour l’ordonnancement de campagnes marketing
Nous modélisons le problème d’ordonnancement de campagnes marketing en posant un ensemble I de prospects et un ensemble J de campagnes à envoyer éventuellement vers ces
prospects sur un horizon de temps décomposé en T périodes d’envoi possibles. Chaque campagne j ∈ J peut être envoyée à des prospects sur une sous-période Tj ⊆ T , pour un nombre
minimal d’envois vj . Par ailleurs, chaque campagne possède des caractéristiques intrinsèques
(visuel, message, offre commerciale, etc.) qui, d’un individu à l’autre, ne déclencheront pas les
mêmes réactions. Ces réactions sont de 4 types :
— l’ouverture : l’email est ouvert
— le clic : le prospect clique sur un lien dans l’email
— l’attrition : désabonnement de la liste de diffusion à partir du lien fourni dans l’email
— la plainte : le prospect se plaint auprès de son FAI de la réception non désirée d’un email
Technologiquement, les routeurs d’email ont la capacité de collecter, la ou les réactions
pour chaque prospect (par exemple, Bob a ouvert le mail et cliqué sur un lien, alors qu’Alice
s’est désabonnée). Par hypothèse, ces réactions peuvent être prédites pour chaque individu
par des approches de type modélisation prédictive. Nous supposons détenir cette donnée pour
l’ouverture, le clic, l’attrition et la plainte, notée respectivement poij , pcij , paij , ppij et qui
reflètent l’intérêt des prospects pour les différents contenus des campagnes. Les différentes
réactions possibles à la réception d’un email sont les sources de gain et/ou de perte pour le
marketing. En effet, l’ouverture et le clic peuvent générer, des achats ou être achetés par des
agences de communications qui payent en fonction du nombre d’ouvertures ou de clics sur
la campagne. A l’inverse, l’attrition et la plainte génèrent des pertes importantes. On associe
donc des valeurs de gains goj , gcj , gaj et gpj à chaque campagne j ∈ J. Enfin, pour limiter la
pression marketing, au maximum un seul email tous les mi jours est envoyé à un prospect (mi
étant également une donnée prédite).
La variable de décision est le booléen xijt qui est égal à 1 si et seulement si la campagne j
est envoyée au prospect i à la période t. Les objectifs sont de maximiser les gains et minimiser l’attrition tout en respectant les limitations propres à chaque campagne (nombre d’envoi,
période d’envoi) ainsi que celles des prospects (pression marketing maximale).
3
Décomposition du problème et résolution approchée
Les instances réelles de ce problème sont de très grande taille et correspondent à un contexte
Big Data. Un cas classique comporte plusieurs centaines de milliers de prospects, des dizaines
de campagnes, sur des horizons de planification de plusieurs dizaines de périodes. Il convient
donc d’avoir une méthode de résolution approchée. Nous proposons une décomposition de ce
problème pour le résoudre en deux étapes. Dans une première étape, nous faisons l’observation que les prospects se regroupent autour de profils similaires d’intérêts. Nous réalisons un
clustering par apprentissage non-supervisé sur les prospects pour les regrouper par similarité.
Nous résolvons le problème en considérant qu’un groupe de prospects comme un individu pour
réaliser un premier niveau d’optimisation globale et répartir les campagnes entre les groupes.
Puis dans un second temps, le planning est optimisé au sein de chaque groupe d’individus.
Le nombre de problèmes à résoudre est très conséquent (plusieurs centaines sur des instances
réelles) mais obtient de bonnes solutions en moins d’une heure. Nous comparons les gains de
solutions optimisées de façon globale avec des solutions produites par des algorithmes gloutons
et constatons des écarts de gain entre 50% et 400% selon les configurations.
4
Conclusion et perspectives
La planification de campagnes emails est un problème d’ordonnancement stochastique complexe que nous résolvons par une décomposition du problème. Néanmoins, la donnée prédite
est ici considérée comme certaine, ce qui est une hypothèse forte car les modèles prédictifs ont
des intervalles de confiance. Intégrer cette incertitude de la prédiction dans les modèles nous
semble être une voie de recherche intéressante et qui se retrouvent dans d’autres applications
de l’optimisation à des données prédites.
Références
[1] Thierry Benoist, Bertrand Estellon, Frédéric Gardi, Romain Megel and Karim Nouioua.
LocalSolver 1.x : a black-box local-search solver for 0-1 programming. Springer-Verlag, 9
(3) :299-316, 2011.
[2] Michael G Foulger, Thomas R Chipperfield, Jeremy S Cooper and Andrew C Storms.
System and method related to generating an email campaign. Google Patents, 2008.
[3] Pinedo Michael L. Scheduling : theory, algorithms, and systems. Springer Science & Business Media, 2012.
[4] Stéphane Tufféry Data mining et statistique décisionnelle : l’intelligence des données.
Editions Technip, 2010.

Documents pareils