Le CRM analytique Les outils d`analyse OLAP et le Data Mining

Transcription

Le CRM analytique Les outils d`analyse OLAP et le Data Mining
Faculté des Sciences économiques et sociales
Université de Fribourg
Le CRM analytique
Les outils d’analyse OLAP et le Data Mining
Dans le cadre du séminaire « Customer Relationship Management »
Professeur Dr. Andreas Meier
Assistant Darius Zumstein
Rédigé et présenté par
Géraldine Graf
Case postale 11
1610 Oron-la-Ville
[email protected]
Julien Stern
Edouard Payot 8
1005 Lausanne
[email protected]
Fribourg, le 26 avril 2008
TABLE DES MATIÈRES
Introduction
1.1 Définition du CRM
1.1 Le CRM : une culture d’entreprise
1.2 Les trois phases du CRM
2. Les trois dimensions du Customer Relationship Management
2.1 Le CRM opérationnel
2.2 Le CRM collaboratif
2.3 Le CRM analytique
3. Le data warehouse, une définition
3.1 Le data warehouse à la croisée des trois CRM
3.2 Le stockage des données dans l’entrepôt de données
4. Des systèmes d’information OLTP au data warehouse
4.1 L’analyse des données : le data warehouse et les outils OLAP
4.2 Le cube OLAP, Drill Down – Roll Up et Slicing
4.3 Exemples d’application des outils d’analyse OLAP
5. Définition du data mining
5.1 Les facteurs de succès du data mining
5.2 La préparation des données
5.3 Les tâches effectuées par le data mining
5.3.1 La description
5.3.2 L’estimation
5.3.3 La segmentation
5.3.4 La classification
5.3.5 La prévision
5.3.6 L’association
6. La Poste et le CRM
6.1 La fin annoncée d’un monopole
6.2 L’importance de l’émotion dans la relation client
6.3 La qualité et la mise à jour constante des données
6.4 Siebel et le CRM analytique, un exemple concret
Conclusion
Bibliographie
2
Introduction
Ce travail porte sur le Customer Relationship Management (CRM), soit la gestion de
la relation client. Nous avons abordé ce concept en nous focalisant sur sa dimension
analytique, orientation justifiée par le choix de notre sujet de séminaire, à savoir les
outils d’analyse OLAP et le data mining.
Comme nous le verrons par la suite, le CRM analytique repose en grande partie sur
l’informatique. Que ce soit au niveau de la production des données, de leur stockage
ou enfin de l’analyse, utile en outre à l’optimisation des processus et à la prise de
décision, l’informatique est omniprésente. En tant qu’étudiants en gestion
d’entreprise, nous avons donc choisi de laisser parfois de côté certains aspects
particulièrement techniques. Ceci étant, ce travail espère offrir une vision la plus
large possible des principaux enjeux liés au CRM analytique en particulier, ainsi qu’à
la gestion de la relation client en général.
Notre travail se divise en six parties. Après une brève introduction présentant le CRM
de manière générale, nous présentons les trois dimensions, que l’on retrouve
régulièrement citées dans la littérature pour le définir. La partie suivante définit le
concept de data warehouse, en français l’entrepôt de données, qui joue un rôle
primordial dans le processus d’analyse. Les parties quatre et cinq traitent
respectivement des outils OLAP et du data mining. Nous terminons avec un exemple
concret de l'application du CRM au sein d’une entreprise, en l’occurrence « La
Poste ».
La conclusion sera enfin l’occasion d’apporter un regard critique sur notre travail, sur
l’application du CRM analytique dans la réalité ainsi que sur la définition voire la
promotion de la gestion de la relation client dans les livres comme sur Internet.
3
1. Définition du CRM
De nos jours, l’évolution des technologies, la mondialisation des marchés et le
raccourcissement du cycle de vie des produits rendent la concurrence toujours plus
rude. Il devient très difficile pour une entreprise de conserver sa part de marché en
se basant uniquement sur les prix et les produits.
Le fort déclin de la publicité de masse illustre cette difficulté à gagner et à conserver
des parts de marché en se focalisant uniquement sur le produit. Dès les années 80,
les techniques de marketing de masse n’apportant guère de résultats positifs pour
les entreprises, elles cèdent leurs places à un marketing direct, orienté vers le client,
qu’il faut comprendre, satisfaire et avec qui il faut communiquer « directement » afin
d’optimiser le succès futur de l’entreprise. Le CRM s’inscrit clairement dans cette
évolution et représente, d’une certaine manière, le dernier marketing direct.
Afin de construire une relation avec le client dans le but d’aboutir à une fidélité de ce
dernier, les entreprises s’orientent donc actuellement et de plus en plus vers la
gestion de la relation client. Le CRM est un processus qui consiste à gagner, à
conserver, à élargir et à fidéliser une clientèle. Sa stratégie est de placer le client au
centre des préoccupations de l’entreprise en instaurant un dialogue, une relation de
confiance et un respect mutuel avec les clients.
La communication bidirectionnelle ainsi que la circulation de l’information sont des
données primordiales pour élaborer une stratégie CRM. Il est effectivement
indispensable pour l’entreprise de comprendre ce que veut le client, ce dernier étant
placé au centre des préoccupations. Les connaissances que l’entreprise se doit
d’avoir du marché sur lequel elle se trouve ainsi que l’acquisition des informations
récoltées sur le client à chaque contact avec celui-ci, vont permettre à l’entreprise,
pour autant qu’elles soient utilisées à bon escient, d’optimiser la satisfaction de sa
clientèle.
Comme nous le verrons plus tard dans le travail, la technologie revêt un rôle
essentiel dans le CRM. Elle va permettre d’extraire des connaissances à partir de
données stockées et gérées dans un entrepôt de données, puis analysées grâce aux
outils OLAP et au data mining.
1.1 Le CRM : une culture d’entreprise
Le succès du CRM nécessite un engagement réel qui ne concerne pas seulement un
département de vente ou de marketing mais nécessite l’engagement de l’ensemble
du personnel concerné. La culture d’entreprise est ainsi un facteur de réussite
déterminant dans la gestion de la relation client. L’entreprise se doit ainsi d’évoluer
dans une atmosphère et un climat favorable afin que le client se sente en confiance,
à l’aise et apprécié.
Le développement de la culture d’entreprise passe par le bien être et la motivation
des employés. L’identification de l’employé envers son entreprise amène celui-ci à
rester fidèle à son employeur. Ceci étant, l’employé pourra construire une relation à
long terme et personnelle avec le client, ce qui conduira à la compréhension des
4
besoins du client par l’employé. Si la communication entre les différents
départements de l’entreprise est réalisée, l’employé va se transformer en vecteur de
communication et va ainsi permettre à l’entreprise entière de comprendre les besoins
de la clientèle.
1.2 Les trois phases du CRM
Dans « La gestion de la relation client », Stanley Brown divise la stratégie CRM en
trois phases qu’il nous paraît important de citer. En effet, elles résument à elles
seules les enjeux et fondements du Customer Relationship Management :
-
La conquête permanente de nouveaux clients.
La fidélisation de ces derniers.
La gestion stratégique du service client : l’entreprise doit identifier ses clients
les plus prometteurs et ainsi, tout en conservant un service de bonne qualité à
l’ensemble de ses clients, leurs offrir des services de qualité encore plus
élevés.
Le concept de fidélisation est central. Son but est l’optimisation de la relation client et
il représente la clé de l’augmentation des recettes au sein d’une entreprise. A l’instar
de son importance dans le CRM, il sera en outre le fil conducteur de notre travail.
Pour ce faire, l’entreprise devra faire évoluer sa relation avec le client comme une
relation amoureuse, en construisant progressivement les valeurs de loyauté et de
confiance et ce, afin de se démarquer de ses concurrents. En se montrant à l’écoute,
l’entreprise va faire évoluer ces valeurs afin d’installer une alliance entre les deux
parties.
Les intérêts des clients étant compris, il sera alors possible pour l’entreprise
d’adresser des messages ainsi que des services ciblés au client, services pouvant
être des avantages offerts par l’entreprise. Dès lors que le client devient un réel
partisan de l’entreprise, la fidélité est établie et ce dernier va véhiculer une image
positive de l’entreprise en la recommandant à d’autres personnes.
2. Les trois dimensions du Customer Relationship Management
Au cours de notre recherche, nous avons fréquemment retrouvé le CRM divisé en
trois domaines d’activité interdépendants : le CRM opérationnel, le CRM
collaboratif et le CRM analytique. La collaboration de ces trois parties a pour finalité
de réaliser l’objectif ultime de la stratégie CRM de l’entreprise, c’est-à-dire le
développement et l’optimisation de la relation client. Le tableau ci-dessous montre de
manière schématique les trois éléments du CRM et leur interdépendance.
5
Schéma 1: extrait de l’article « The designing of CRM based on Data Warehouse »1
Notre travail se focalisera essentiellement sur l’analytique (à droite dans le schéma)
et spécifiquement à la fonction du data warehouse (ou entrepôt de données), des
outils d’analyse OLAP et du data mining. Cependant, afin de mieux comprendre le
CRM dans son ensemble et de bien se représenter le rôle et la participation de
chacun des ses éléments dans le fonctionnement optimal du tout, il est nécessaire
de définir ce que l’on entend par CRM opérationnel et collaboratif.
2.1 Le CRM opérationnel
Le CRM opérationnel peut être défini comme l’automatisation et l’amélioration
constante des processus de vente, de marketing et de service client. Celles-ci sont
rendues possibles grâce à l’analyse des données qui sont produites lors des
différentes opérations, analyse qui par effet « boomerang » permet d’apporter des
améliorations à ces mêmes processus. Par exemple, le public cible d’une action
marketing sera défini plus précisément ou encore le canal de distribution d’un produit
sera adapté selon les préférences de chaque client.
2.2 Le CRM collaboratif
Le CRM collaboratif fait référence aux moyens de communication au travers
desquels l’entreprise entre directement en contact avec le client. On pense
notamment au call center, à Internet ou encore à la correspondance par emails. Un
des objectifs du CRM collaboratif est de donner une image de l’entreprise positive et
uniforme au client et d’établir une relation de confiance avec lui en proposant un
service personnalisé et de qualité. C’est également, dans cette même idée,
l’occasion de récolter de très précieuses informations sur le client, qui seront
stockées et permettront de mieux cibler ses besoins et ses attentes. Enfin, un des
enjeux principaux du CRM collaboratif est d’assurer à chaque employé l’accès à une
information la plus complète et la plus récente possible sur son interlocuteur, afin que
ce dernier se sente suivi et considéré personnellement.
1
Dans le partie opération, relevons les abréviations suivantes: SFA pour Sales Force automation, MA pour
Marketing automation, CSS pour Client Support Service.
6
2.3 Le CRM analytique
Le rôle du CRM analytique est la véritable clé de voûte du système. Nous
l’aborderons plus dans les détails par la suite mais en résumé, il consiste à stocker et
à analyser la très vaste quantité de données générées en bonne partie par le CRM
opérationnel et collaboratif. A partir de ces données, les différents outils d’analyse se
chargent d’extraire des connaissances qui servent de support à la prise de décision
et permettent d’améliorer notamment les processus du CRM opérationnel et
collaboratif.
3. Le data warehouse, une définition
Lorsque l’on pense CRM, parler de data warehouse est incontournable. Il permet le
stockage et l’analyse de données, et est à la base du partage de l’information et de
la création des connaissances indispensables à la compréhension des clients et à la
prévision de leurs comportements. Avant d’aborder ses activités, donner une
définition d’un entrepôt de données nous donnera des éléments de compréhension
utiles pour la suite. Celle-ci comporte quatre points principaux sur lesquels nous
allons nous attarder dans ce chapitre.
« A Data warehouse is a subject oriented, integrated, non-volatile, and time variant
collection of data in support of management’s decisions » (Inmon, 1996).
« L’entrepôt de données est « orienté sujet », c’est-à-dire organisé autour des
thèmes majeurs qui touchent au métier de l’entreprise » (Grenier, C. et Moine, C.,
2003). Les données sont à l’origine regroupées par processus fonctionnels, alors
qu’ici elles sont structurées par thème.
Ces données se doivent donc d’être intégrées à l’entrepôt de données. Elles sont de
fait mises en forme et réunies à partir de systèmes hétérogènes et de sources
externes dans une seule et même base de données. Cette phase du processus est
la plus complexes du data warehousing.
Troisièmement, l’entrepôt de données stocke des données « non-volatiles », ce qui
veut dire qu’elles ne sont pas mises à jour, ni modifiables. Elles sont comme
photographiées, seule leur lecture est possible ce qui n’est pas le cas des données
contenues dans les systèmes d’information opérationnels.
Enfin, dans la continuité, les données sont simplement ajoutées les unes après les
autres au sein de l’entrepôt de manière chronologique. Chaque donnée est ainsi
associée à une date à laquelle elle a été créée.
7
3.1 Le data warehouse à la croisée des trois CRM
Avant d’aller plus en avant dans le CRM analytique, dans la définition et l’usage des
outils de recherche OLAP et du Data mining, il est important de parler du rôle
fondamental que tient le data warehouse au sein du CRM.
Schéma 3 : extrait de l’article « Customer Analytics Making the Difference in CRM : Customer
Analytics Amplify the value of integrated CRM Solutions »
A l’image du tableau ci-dessus, parler de data warehouse ou d’entrepôt de données
s’inscrit dans un concept plus général qui est celui de l’intégration de systèmes
d’information hétérogènes. Le data warehouse fait référence en l’occurrence, à
l’intégration par les données qui sont partagées par des systèmes autonomes. En
observant le schéma ci-dessus, on peut constater que l’entrepôt de données fait
littéralement office de pivot entre chacun des éléments du CRM.
Prenons un exemple. Que l’on parle de l’analyste, du chef de produit, du marqueteur
ou encore du collaborateur du centre d’appels, chacun a accès, grâce à l’entrepôt de
données, à la même source de données et aux mêmes informations.
L’analyste utilise ses outils d’analyse pour trouver dans le « Customer Data
Warehouse » les résultats de ses requêtes et des nouvelles connaissances qui
aideront les managers ou les ingénieurs dans leurs décisions comme dans
l’optimisation des différents processus opérationnels de l’entreprise. Le chef de
produit focalisera son attention sur les ventes de son produit, par région, par période
et ce, souvent par l’intermédiaire d’un data mart2. A l’aide de ces même data marts,
le marqueteur a la possibilité de voir l’efficacité ou non d’une campagne de publicité
et de la réajuster si besoin est. Et finalement, le collaborateur du centre d’appels aura
accès à l’information la plus complète possible sur chacun des clients avec qui il est
amené à communiquer grâce au « Operational Data Stores »3.
2
Un data mart est une partie du data warehouse. Il permet de faire des requêtes sur une base de données plus
petite qui regroupe les données qui correspondent aux besoins de l’utilisateur. Le responsable marketing, le chef
de vente disposent ainsi chacun d’un extrait du data warehouse spécifique à leur domaine d’activité. Les données
y sont moins nombreuses et permettent des analyses plus rapides et ciblées.
3
Un « Operational Data Stores » est comme un intermédiaire entre l’utilisateur et l’entrepôt de données. Il est
remis à jour tout au long des opérations commerciales et permet des requêtes simples sur une petite quantité de
8
3.2 Le stockage des données dans l’entrepôt de données
Comme on l’a vu ci-dessus, le CRM analytique a pour fonction de permettre le
stockage et l’analyse des données générées notamment par les opérations de
marketing, de vente, le service client ainsi que les informations récoltées sur le client
lors de contacts téléphoniques, électroniques ou encore grâce à des questionnaires.
Comme on peut le voir dans le tableau ci-dessous, l’étape qui précède l’analyse est
celle qui consiste à extraire les données de là où elle se trouve et de les stocker dans
un entrepôt de données ou un data warehouse. Cette phase du processus est
cruciale et comporte certaines difficultés et des risques qu’il est important d’énoncer
ici.
Schéma 2 : extrait de l’article « The designing of CRM based on Data Warehouse »
On peut constater tout d’abord, que les données que l’on va intégrer au data
warehouse ne proviennent pas seulement des CRM opérationnel et collaboratif. En
effet, il existe deux autres sources qui viennent compléter l’entrepôt de données et
permettre d’affiner la qualité des résultats du travail d’analyse. Il s’agit des données
internes à l’entreprise contenues dans les progiciels de gestion intégrée (ERP),
celles produites par le Supply Chain Management et enfin celles qui proviennent que
des sources externes.
La diversité des sources desquels vont être extraites les données vers le data
warehouse implique une première difficulté technologique. Effectivement, il s’agit ici
d’intégrer ou de regrouper des données de nature différente, provenant de sources
et de systèmes d’information distincts les uns des autres. Cette tâche est réalisée par
un logiciel middleware appelé ici ETL4. Comme son nom l’indique, ce logiciel
primordial permet d’extraire des données de sources multiples, de les transférer et
de les charger dans l’entrepôt de données.
Un autre aspect à ne pas minimiser dans cette étape du processus est le choix des
données que l’on va choisir d’intégrer à l’entrepôt de données. En effet, il s’agit ici de
définir préalablement les besoins des utilisateurs afin d’y répondre le plus
données comme définir l’état d’une commande. C’est l’équivalent de la mémoire à court terme au contraire de
l’entrepôt de données qui stockent des données qui peuvent entre cinq et dix ans.
4
Extraction-transfer-Load
9
précisément possible mais également pour éviter que l’entrepôt de données soit
« une prison de données »5 , dans laquelle on ne puisse finalement pas accéder à ce
que l’on recherche.
4. Des systèmes d’information OLTP au data warehouse
Comme nous l’avons vu, le data warehousing est un élément fondamental du CRM
analytique puisqu’il permet d’extraire et de stocker les données dans un seul endroit
afin d’y être analysées et d’en tirer des connaissances qui serviront de support à la
prise de décisions et à l’amélioration des processus au sein de l’entreprise.
La distinction qui fait l’objet de ce chapitre entre les systèmes OLTP, soit Online
Transactional Processing, et OLAP ou Online Analytical Processing a été à plusieurs
reprises abordées plus haut. Nous avons cependant délibérément choisis d’attendre
avant d’évoquer plus spécifiquement ces deux concepts. En effet, bien qu’il eut été
possible de les énoncer dans la partie sur le data warehousing, il nous a semblé plus
simple de ne pas tout mélanger et d’en faire un chapitre à part entière.
L’abréviation OLTP fait référence aux systèmes d’information qui facilitent et gèrent
les transactions opérationnelles de l’entreprise. Comme nous l’avons vu
précédemment, ce sont justement ces derniers qui produisent de manière
indépendante les uns des autres, les données que la tâche du data warehousing va
réunir dans une seule et même base de données afin d’y être analysées grâce aux
outils OLAP et au data mining.
En résumé, « l’information qu’il [le data warehouse] contient provient, pour la majeure
partie, de systèmes opérationnels configurés en systèmes transactionnels ou OLTP,
conçus à l’origine pour traiter et enregistrer un grand nombre de petites transactions.
La structure des bases de données OLTP vise au traitement rapide de telles
transactions, ce qui réduit autant que possible le délai de réaction d’un système
opérationnel. L’entrepôt de données, quant à lui, consiste en un ou plusieurs
systèmes aptes non seulement à répondre rapidement à des questions demandant
un important volume de données mais aussi à stocker ces dernières de manière
efficace » (Ed Peelen, 2006).
4.1 L’analyse des données : le data warehouse et les outils OLAP
Nous l’avons vu précédemment, les systèmes OLTP s’occupent de gérer les
processus opérationnels au sein de l’entreprise à l’inverse du data warehouse qui
sert à stocker les données et des outils OLAP qui sont destinés à leur analyse.
N’ayant pas les connaissances de l’informaticien de gestion, nous avons choisis
concernant les outils d’analyse OLAP, de nous arrêter à la présentation du cube
OLAP6. Ce concept est effectivement souvent utilisé pour représenter les possibilités
que les outils d’analyse offrent à l’utilisateur.
5
Tiré de l’article scientifique « Building a Data Warehouse step by step », p. 2
Nous n’aborderons notamment pas les différentes modèles OLAP, à savoir MOLAP, ROLAP, HOLAP et
DOLAP, bien trop techniques et compliqués à comprendre pour nous.
6
10
Avant de poursuivre dans le chapitre suivant sur les usages et le potentiel du cube
OLAP, citons encore l’extrait d’un article qui explique la relation qui lie le data
warehouse et les outils OLAP.
« Les applications OLAP sont intimement associées aux entrepôts de données c'est-à-dire les bases qui, au sein d'une plate-forme de business intelligence7, se
chargent de consolider (par le biais d'outils d'intégration de données notamment)
l'ensemble des informations métier d'une activité, en vue d'en permettre ensuite
l'analyse. En fait, un datawarehouse se résume en une architecture trois tiers :
-
Une base relationnelle qui stocke et structure les contenus,
La couche d'analyse OLAP en tant que telle (ou serveur OLAP),
Les interfaces client de reporting » (Antoine Crochet-Damais, 2008).
4.2 Le cube OLAP, Drill Down – Roll Up et Slicing
Comme nous l’avons évoqué plus haut, le concept OLAP fait référence à une
méthode d’analyse qui peut être représentée par un cube. Comme nous pouvons le
voir dans le schéma ci-dessous, le cube s’organise autour de deux concepts
fondamentaux, le fait et les dimensions. Le fait, en principe numérique, est
l’information que l’on veut mesurer puis analyser alors que les dimensions (par
exemple la période de temps, la zone géographique ou la gamme de produits),
constituées d’une hiérarchie d’attributs, représentent les axes à partir desquels le fait
est calculé.
Schéma extrait du cours intitulé « Systèmes d’information de l’entreprise », dispensé par le Dr. Stefan
Huesemann à l’Université de Fribourg au semestre d’automne 2007-2008.
Un des grands avantages d’une telle organisation des données est la flexibilité et la
facilité avec lequel l’utilisateur peut adapter ses requêtes selon ses besoins. Le
schéma ci-dessus, constitué du chiffre d’affaire pour le fait et du temps, du lieu et du
produit pour les dimensions (elles peuvent être plus nombreuses), suggère
7
La Business Intelligence, en français informatique décisionnelle, désigne l’ensemble des technologies qui
permettent de collecter les données d’une entreprise et de les analyser dans le but de servir de support à la prise
de décisions et à l’élaboration de stratégies.
11
intuitivement les vastes possibilités offertes par un tel dispositif. A l’instar de l’image
de droite qui montre comment on peut savoir le nombre de vidéo vendue en 2001 à
Bern, les alternatives d’un tel modèle sont en réalité aussi nombreuses qu’il y a
d’utilisateurs et de besoins spécifiques. Voyons pour illustrer cela les deux schémas
suivants :
Schéma extrait du cours intitulé « Systèmes d’information de l’entreprise », dispensé par le Dr. Stefan
Huesemann à l’Université de Fribourg au semestre d’automne 2007-2008.
Le premier schéma décrit une fonction extrêmement intéressante qui permet de
répondre de manière très flexible aux différentes questions que l’utilisateur peut se
poser. En effet, à l’aide des dimensions, elles-mêmes constituées d’une hiérarchie
d’attributs, il est possible de savoir combien de vidéos ont été vendues par jour, par
mois ou encore par année en ajustant simplement la dimension en fonction des
besoins. De la même manière, en centrant sa requête sur la dimension « lieu », on
pourra déterminer combien de vidéos furent vendues dans un canton, dans une ville
ou encore pour chaque magasin.
Le second dessin, quant à lui, démontre lui aussi la richesse et la flexibilité qu’offrent
un tel outil d’analyse. En effet, on constate que l’on peut également littéralement
« couper le cube en tranches ». Le directeur financier cherchera à savoir combien de
produits ont été vendus dans le monde pour une période précise. Le directeur
régional des ventes quant à lui, cherchera à connaître le chiffre d’affaire total pour la
zone dont il est responsable. Enfin, le chef de produit, s’intéressant à un produit
spécifique, cherchera à connaître le nombre total des ventes dans le monde sans
préciser une période particulière.
4.3 Exemples d’application des outils d’analyse OLAP
Pour avoir une vision plus pragmatique de l’utilité des outils OLAP, exposons trois
cas pratiques dans lesquels ils sont mis à contribution et à quoi ils peuvent
concrètement servir. Pour ce faire, nous nous inspirerons en grande partie de l’article
OLAP applications disponible gratuitement sur le site www.olapreport.com.
12
Le marketing de base de données est l’application des outils d’analyse OLAP,
souvent combinés aux technologies de data mining, qui est la plus directement liée à
la gestion de la relation client. En effet, il permet par exemple au professionnel de
déterminer les meilleurs clients et de fidéliser ces derniers en leur proposant des
offres promotionnelles. A l’inverse, l’utilisateur peut en profiter pour identifier « les
mauvais clients » ou encore certains profils de clients auxquels une offre ne
correspond pas, afin soit de réajuster celle-ci soit de l’abandonner.
L’analyse des ventes est une autre des fonctions essentielles des outils OLAP. Ces
derniers peuvent effectivement apporter des connaissances profitables pour les
entreprises, en particulier dans l’industrie des biens de consommation et des
services financiers ainsi que dans le commerce de détails. Le seul fait d’évoquer
quelques-unes des questions auxquelles ces outils sont en mesure d’apporter une
réponse décrit tout l’intérêt de ces derniers :
-
Est-on en mesure d’atteindre nos objectifs de ventes par produit et par région
dans une période donnée ?
L’évolution des ventes d’un nouveau produit est-elle identique partout ?
Est-ce que les actions de promotions ont un effet sur les ventes ?
Etc.
L’analyse des « clic » de l’internaute sur un site Internet peut également être d’une
très grande utilité, en particulier pour les entreprises consacrées au e-business.
Pratiquement, les outils OLAP rendent possible par exemple la récolte de données
démographiques, parfois personnelles, sur le client, l’identification du chemin par
lequel il est arrivé sur le site de l’entreprise ou encore le calcul du nombre de
« clics » que celui-ci a dû faire pour trouver sur le site Internet ce qu’il est venu y
chercher.
5. Définition du data mining
Le data mining signifie littéralement « fouille de données » ou « forage de données ».
Ce procédé, basé sur une série d’algorithmes8 ou modèles de data mining que nous
n’allons pas aborder dans ce travail, permet d’extraire des informations à partir de
données, informations qui, grâce à l’analyse, se convertissent en connaissances.
« Le data mining est l’analyse d’un ensemble d’observations qui a pour but de
trouver des relations insoupçonnées et résumer les données d’une nouvelle manière,
de façon qu’elles soient plus compréhensibles et utiles pour leurs détenteurs »
(David Hand, 2001). Autrement dit, il consiste à analyser des informations collectées
dans des entrepôts de données afin d’y détecter des relations qu’il serait a priori
impossible d’identifier sans cet outil. C’est un élément essentiel dans la relation client
et de système d’aide à la décision.
Partant de là, on comprend mieux pourquoi le data mining est annoncé comme étant
« un des développements technologiques les plus révolutionnaires des dix
8
Par exemple : les arbres de décisions, les réseaux de neurones, les réseaux de Kohonen ou encore les
algorithmes de la méthode de classification hiérarchique. Voir les chapitres 5, 6, 7, 8 et 9 de « Des données à la
Connaissance, une introduction au Data mining » de Daniel T. Larose.
13
prochaines décennies » selon le magasine en ligne ZDNET News. (Rachel Konrad,
février 2001). En effet, cette technologie est perçue comme étant réellement
indispensable de nos jours à l’analyse de la quantité toujours plus vaste
d’informations produites par tous les systèmes d’information de l’entreprise.
Enfin, comme nous l’avons dit, en tant que processus, il est pertinent de souligner ici
que le data mining ne se réfère pas seulement à des outils et à une technologie
informatique très développée. Effectivement, il faut également relever le rôle
fondamental de l’humain dont l’implication se doit d’être totale dans chaque phase du
processus. Il est erroné de penser que le data mining est une entité qui fonctionne de
manière autonome.
5.1 Les facteurs de succès du data mining
Lorsque nous passons à la caisse d’un supermarché, il est difficile de ne pas
entendre les « bip, bip » des scanners lisant les codes barres sur les produits. Mais à
quoi servent ces données enregistrées ?
Chacune d’entre elles, c’est-à-dire chaque « bip » représente une nouvelle
« observation », une nouvelle information concernant nos habitudes d’achat. Toutes
ces informations sont collectées et stockées dans des bases de données destinées à
l’analyse et vont permettre ensuite à l’entreprise d’identifier, par exemple, les
mauvais clients ou alors, au contraire, de lancer une campagne de fidélisation en
offrant des produits à ses meilleurs clients.
A l’image des scanners des caisses qui enregistrent quotidiennement des milliers et
des milliers de transactions, l’augmentation de la production de données représente
un des facteurs déterminants de la montée en puissance du data mining. D’autres
causes alimentent ce phénomène, comme par exemple, « la pression
concurrentielle pour accroître la part de marché dans un marché mondialisé, le
développement de logiciels de data mining prêts à l’emploi, l’énorme croissance de la
puissance informatique et de la capacité de stockage » et, enfin, « le stockage des
informations dans les entrepôts de données qui permettent à toute l’entreprise
d’accéder à une base de données fiable ». (« Des données à la connaissance »,
2005)
5.2 La préparation des données
Il est très important, avant toute opération de data mining, de procéder à un
nettoyage des données se trouvant dans le data warehouse. Celles-ci ont besoin
d’être préparées et transformées afin d’être exploitables pour le data mining.
En effet, les data warehouse contiennent très souvent des données incomplètes qui
peuvent être :
-
des champs obsolètes ou redondants
des valeurs aberrantes,
Des données manquantes,
Des valeurs dénuées de sens pour la logique,
14
-
Des données sous une forme non adaptée au modèle de data mining.
Il est ainsi très important et même capital de minimiser les déchets afin d’optimiser
au maximum le travail de data mining.
Ce travail de nettoyage est énorme et il représente à lui tout seul 60% du temps de
travail lors du processus de data mining. (Selon Daorian Pyle dans son livre Data
Preparation for Data Mining).
5.3 Les tâches effectuées par le data mining
Après avoir défini ce qu’est le data mining, il convient de présenter les tâches que
celui-ci peut effectuer. Ces dernières sont au nombre de six, chacune d’entre elles
revêt une fonction spécifique pour l’analyse et est réalisée grâce à des algorithmes
différents. Bien qu’on retrouve ces six alternatives dans toute la littérature sur le
sujet, nous nous sommes à nouveau inspiré pour ce chapitre du livre « Des données
à la connaissance » de Daniel T. Larose.
5.3.1. La description
L’importance de cette tâche est de permettre à l’analyste d’interpréter les résultats
d’un modèle de data mining, soit d’un algorithme, de manière la plus transparente et
efficace possible.
« Ainsi, les résultats du modèle de data mining doivent décrire des caractéristiques
claires qui puissent amener à une interprétation et à une explication intuitive.
Certaines méthodes de data mining sont plus adaptées que d’autres pour une
interprétation transparente » (Daniel T. Larose, 2005)
5.3.2 L’estimation
La variable cible9 est numérique. L’estimation permet par exemple d’estimer la
somme d’argent qu’un couple va dépenser pour des produits solaires cet été ou
encore d’estimer le nombre de buts que va marquer l’équipe de Suisse lors de l’Euro.
On pourra également estimer le revenu d’une famille en fonction de divers critères
(profession, catégorie de voiture...).
L’intérêt principal de cette tâche est de pouvoir ordonner les résultats afin d’avoir la
possibilité de retenir seulement les meilleurs valeurs, technique qui sera surtout
utilisée en marketing dans le but de pouvoir proposer des offres aux meilleurs clients
potentiels de l’entreprise.
9
On peut définir ici la variable cible comme étant celle que l’on cherche, à l’aide des modèles de data mining, à
expliquer ou prédire la valeur.
15
5.3.3 La segmentation
Ici, la variable cible n’est pas numérique, mais catégorielle, comme par exemple le
revenu, qui peut être divisé en trois catégories : faible revenu, revenu moyen et
revenu élevé.
« La segmentation consiste à répartir les clients en groupes homogènes, qu’il
convient ensuite d’aborder par des moyens spécifiques et adaptés aux
caractéristiques et attentes de chaque groupe. Les membres d’un même groupe
réagissent de la même manière aux stimuli marketing. Ils ont en commun un mode
de communication, des comportements d’achat et/ou des besoins spécifiques » (Ed
Peelen, 2006).
5.3.4 La classification
La classification est différente de la segmentation en ce sens qu’il n’y a pas de
variable cible pour segmenter. La classification va s’intéresser au regroupement de
données ou d’observations en groupes d’objets similaires. En d’autres termes, elle va
segmenter l’ensemble des données afin de former des sous-groupes homogènes.
Ceux-ci s’appellent des clusters, à savoir des classes, qui sont des groupes dans
lesquels les données sont similaires entre elles et, par définition différente des autres
groupes.
5.3.5 La prévision
Les résultats de la prévision portent, comme son nom l’indique, sur le futur, ce qui la
différencie de l’estimation. Pour le reste, elle est similaire à ces deux tâches
expliquées précédemment.
La prévision permet par exemple de prévoir quels vont être les gagnants du
championnat de basket-ball en tenant compte de la comparaison des résultats de
chaque équipe ou encore de prévoir quel va être la taux de décroissance des décès
sur la route l’année suivante en prenant compte de l’augmentation des limitations de
vitesse et des mesures de réprimande plus strictes adoptées par la police en ce qui
concerne l’alcool au volant.
5.3.6 L’association
Cette fonction du data mining permet de découvrir quelles variables vont ensemble,
quelles sont les règles qui vont permettre de quantifier les relations entre deux ou
plusieurs variables.
Par exemple, si l’on s’intéresse à 500 clients qui viennent faire leurs courses au
supermarché le vendredi soir et que l’on constate que sur ces 500 clients, 100
achètent des fruits et que sur ce nombre, 30 achètent du lait, ainsi, la règle
d’association est « si l’on achète des fruits, alors on achète du lait », avec une
mesure de support de 100/500 = 20% et un seuil de confiance de 30/100 = 33%.
16
6. La Poste et le CRM
Dans le cadre de ce travail de séminaire, il était demandé de réaliser une étude de
terrain en collaboration avec une entreprise afin d’aborder la question de la gestion
de la relation client de façon plus pragmatique. Pour ce faire, nous avons choisi de
nous adresser à La Poste.
Ce choix s’est fait relativement par hasard. En effet, en faisant quelques recherches
sur Internet, nous sommes « tombés » sur plusieurs documents très intéressants et
détaillés sur le marketing direct en général et le CRM en particulier. Après avoir lu les
différents dossiers mis à disposition par la Poste sur leur site10, nous avons décidé
d’écrire un mail à la société en demandant s’il serait possible d’obtenir un entretien
avec la personne responsable du CRM au sein de l’entreprise. Très rapidement,
Monsieur Peter Kohler, responsable de la gestion de la relation client au sein de la
Poste, nous a répondu et proposé de nous rencontrer.
Il est intéressant de relever que ce n’était pas la première fois que Monsieur Kohler
présentait à des étudiants l’intérêt de la Poste pour le CRM. Son enthousiasme et
notre intérêt pour le sujet nous ont mené dans un entretien réalisé en allemand de
près de 3 heures. Monsieur Kohler nous a exposé la stratégie CRM de la Poste à
l’aide d’une présentation PowerPoint, destinée a priori aux clients plutôt qu’à des
étudiants. Pendant celle-ci, nous avons retenu plusieurs points importants sur
lesquels nous allons revenir ici.
6.1 La fin annoncée d’un monopole
Depuis le premier janvier 2004, PosteColis, c’est-à-dire l’envoi de paquets, évolue
dans un environnement ouvert à la concurrence. En avril 2006, la limite du monopole
pour les lettres est passée à cent grammes et va être baissée à cinquante grammes
dès avril 2009. Nous constatons de ce fait que le monopole, détenu jusque –là par la
Poste s’estompe petit à petit et qu’il va céder sa place à une ouverture totale du
marché suisse des télécommunications en 2012. C’est dans cet environnement
qu’est né l’intérêt de la Poste pour la gestion de la relation client et pour la solution
CRM Siebel11.
Sans entrer dans une définition des enjeux d’une telle libéralisation (cela pourrait
faire l’objet d’un travail de séminaire à part entière), il est essentiel de comprendre
que la Poste se doit, dans cette situation, de réorganiser en conséquence sa
stratégie, son organisation et son offre, afin de faire face à la croissance
exponentielle de la concurrence. Il s’agit désormais de considérer le client comme
une ressource sans laquelle l’entreprise ne peut pas survivre. C’est dans ce contexte
que le concept de la gestion de la relation client a pris toute son importance pour la
Poste et qu’elle va devenir capitale au vu de la libéralisation du marché.
10
http://www.postmail.ch/fr/index_pm/pm-geschaeftskunden/pm-directpoint/pm-dm-wissen/pm-dmpublikationen/pm-directexpert.htm
11
Siebel est leader mondial sur le marché des solutions de CRM.
17
A l’image d’un des « slides » de la présentation de Monsieur Kohler, La Poste ne
peut donc plus se contenter d’être un simple livreur de courrier. Avec les concurrents
allemands ou français contre lesquels la Poste suisse ne pourra à terme pas lutter,
Monsieur Kohler nous a expliqué que la nouvelle stratégie est dans un futur proche
de se positionner sur des marchés de niche, en proposant des services
personnalisés, de qualité supérieure. Du simple livreur, le but est de devenir un
conseiller stratégique, qui anticipe les besoins de ses clients et leur propose des
solutions adaptées, un partenaire disponible et compétent sur lequel le client pourra
compter en tout temps.
6.2 L’importance de l’émotion dans la relation client
L’aspect que nous allons aborder dans cette partie, sur lequel Monsieur Kohler s’est
beaucoup attardé et qui nous a particulièrement marqué est l’importance donnée à la
dimension sentimentale dans la gestion de la relation client.
En effet, que ce soit le simple individu qui se rend à la Poste faire ses paiements ou
l’entreprise, comme Nestlé, qui représente une manne financière primordiale, la
Poste, par l’intermédiaire de notre interlocuteur, montre attacher beaucoup
d’importance au développement d’une relation qui ne se limite pas seulement aux
simples transactions mais qui, en plus, les « emballent dans un paquet » de
sympathie et de confiance. A l’image de sa publicité institutionnelle réalisée pour
l’année 2008, la Poste se positionne donc comme une entreprise proche et à l’écoute
de ses clients et de ses besoins, comme en témoigne le slogan : « nous avons la
Poste dans le sang ».
Dans cette même idée, Monsieur Kohler nous a révélé les résultats d’une recherche,
pas encore publiée, effectuée auprès de ses clients commerciaux, qui démontre que
pour plus de 60% d’entre eux, l’avenir du CRM est dans le face-à-face et non,
comme on pourrait le penser, dans l’informatique.
6.3 La qualité et la mise à jour constante des données
18
Un des points sur lesquels Monsieur Kohler a également beaucoup insisté sur
l’investissement énorme que requièrent la récolte et surtout la mise à jour des
données. Sans parler des conséquences que peuvent avoir des données
incomplètes ou fausses dans le travail d’analyse par exemple, évoquer seulement la
tâche énorme qui découle du seul fait d’avoir la bonne adresse de chaque client, qu’il
soit privé ou commercial, donne une bonne idée de son ampleur.
Si l’on s’intéresse aux clients privés dans un premier temps, nous avons été très
surpris d’apprendre que 20% d’entre eux changent d’adresse chaque année. Sur 9.4
millions de clients (une personne peut avoir plusieurs adresses), l’investissement en
temps et en argent que représente la mise à jour d’environ 1.9 millions d’adresses
par année est considérable.
Quant à la clientèle privée, et plus particulièrement les 500 « Top Kunden », qu’il
s’agit de « soigner » tout particulièrement, il est également fondamental que toutes
les adresses, ainsi que les personnes de référence soient correctes. En effet, si l’on
prend l’exemple de Nestlé qui possède au moins 50 adresses rien qu’à Vevey, nous
imaginons facilement le labeur lié au fait d’avoir, pour chaque département, l’adresse
juste et surtout le nom de la bonne personne de contact.
6.4 Siebel et le CRM analytique, un exemple concret
Pour des raisons de manque de temps et de connaissances sur les solutions CRM
telles que Siebel, mais aussi à cause des limites liées à notre maîtrise relative de la
langue allemande, nous ne nous sommes pas attardé avec Monsieur Kohler sur le
fonctionnement et toutes les possibilités offertes par la solution CRM de la Poste.
Nous avons cependant récoltés quelques informations pertinentes que nous allons
évoquer ci-dessous.
La Poste a décidé de travailler avec le software Siebel sous sa forme standard.
C’était effectivement une décision stratégique que de ne pas investir plus que le prix
du software, et de ne pas se lancer dans un processus de programmation qui aurait
coûté encore bien plus de temps et d’argent.
En s’intéressant plus particulièrement aux fonctions analytiques de ce software (basé
sur un moteur OLAP et une architecture data mart), nous avons appris que, sous sa
forme standard, il propose pas moins de 48 modèles d’analyse permettant
notamment d’effectuer des segmentation de clientèle ou encore toute une série de
mesures très pertinentes, dont nous allons présenter deux exemples. Avant cela,
ajoutons encore que la Poste ne fait pas recours aux outils de data mining. Elle limite
effectivement son travail d’analyse au potentiel de son système CRM.
Le premier exemple est la découverte que plus de 80% du chiffre d’affaire est dû à
seulement 500 clients (« Top Kunden »). La conséquence de cette observation fût
immédiate. En effet, conscient de l’importance que représentaient ces 500 clients, la
Poste a décidé de créer des équipes destinées exclusivement à la gestion de la
relation avec ces clients privilégiés dont la perte d’un seul peut se révéler
dangereuse pour l’entreprise dans sa globalité.
19
La seconde illustration de l’utilité d’un pareil système d’analyse pour la Poste s’est
révélée en apprenant que seulement trois produits réalisaient 44% du chiffre d’affaire
total et que 10 produits étaient garants du 83%. Ces connaissances ont eu pour effet
d’augmenter d’une part la promotion de ces produits « phares », et d’autre part, d’en
développer de nouveaux pour tenter de réduire les risques en diversifiant le
portefeuille d’activité de l’entreprise.
20
Conclusion
L’objectif de ce travail était de définir le CRM analytique et de comprendre ses enjeux
en nous focalisant sur les outils d’analyse OLAP et le data mining. Nous avons
réalisé au long de ce travail que le Customer Relationship Management est bien plus
qu’une théorie sur la fidélisation du client. En effet, à l’instar du rôle fondamental qu’y
joue l’informatique, le CRM est extrêmement complexe et difficile à définir.
Malgré les difficultés rencontrées, nous sommes toutefois parvenu à décrire les
principes fondamentaux de la gestion de la relation client en partant du sujet que
nous avions choisi au départ. Nous avons défini le CRM et montré son importance de
manière générale. Nous avons ensuite présenté les notions indispensables à la
compréhension de la partie analytique du CRM pour enfin aboutir à un exemple
concret dans le but de confronter la théorie à la pratique.
Bien que nous ayons atteints la plupart de nos objectifs, nous avions le sentiment
qu’à force de faire des recherches et de réfléchir sur le CRM, celui-ci nous paraissait
toujours plus flou, vaste et difficile à saisir. En effet, les multiples manières d’aborder
le CRM nous ont en quelques sortes empêchées d’en avoir une vision globale. Outre
sa dimension informatique, son intérêt stratégique ou encore sa place dans
l’évolution du marketing en général, c’est la culture d’entreprise que nous retenons
comme étant l’élément central de la gestion de la relation client. Que ce soit au
niveau de la communication à l’interne ou vers l’extérieur, le CRM est avant tout une
philosophie qui doit permettre idéalement de redéfinir l’ensemble des processus et
des valeurs de l’entreprise.
Sans revenir sur le contenu de notre travail, nous tenons finalement à évoquer deux
questions importantes qui apparaissent dans la littérature et qui nous ont hantées
tout au long de nos recherches : le CRM analytique, défini comme étant fondamental
en théorie, l’est-il réellement dans la pratique ? Est-ce que le CRM n’est-il pas un
simple phénomène de mode promu par les sociétés désireuses de vendre leur
solution informatique ?
21
Bibliographie
Ed Peelen, Frédéric Jallat, Éric Stevens et Pierre Volle : Gestion de la relation client,
2ème édition, Pearson Education Benelux, Gap, 2006.
Grenier, C. et Moine, C. : Construire le système d’information de l’entreprise, Editions
Foucher, Paris, 2003.
Line Lasserre et Bernard Legrand : CRM, les attentes des clients, Village Mondial
Press, Paris, 2002.
Pierre Morgat : Fidélisez
d’Organisation, Paris, 2000.
vos
clients,
Stratégies,
outils
et
GRC, Édition
Jean-Marc Lehu : La fidélisation client, Édition d’Organisation, Paris, 1999.
Amrit Tiwana : Gestion des connaissances, Applications CRM et e-business,
CampusPress, Paris, 2001.
Daniel T.Larose, Des données à la connaissance, une introduction au data mining,
Editions Vuibert Informatique, Paris, 2005.
Stanley Brown, Customer Relationship Management, La gestion de la relation client,
Pearson Education France, 2006.
Pierre Mayor, CRM, Etude des besoins du segment de la clientèle d’affaires, The iimt
University Press, Fribourg/Suisse, 2003.
Articles scientifiques tiré d’internet
Dominique Crié : De l’extraction des connaissances au Knowledge Management,
Revue française de gestion 2003/5, n°145, p.59-79.
Disponible :http://www.cairn.info/article_p.php?ID_ARTICLE=RFG_146_0059, accédé le 7 avril
2008.
Jean-Fabrice Lebraty : Les systèmes décisionnels. Disponible : http://www.gestionsic.net/documents/SAD.pdf, accédé le 7 avril 2008.
Jiayi Yao, Yuying Zhang: The Designing of CRM Based on Data Warehouse.
Disponible :
http://www.china-review.org/news/manage/image/12The%20Designing%20of%20ACRM%20Based%20on.pdf, accédé le 7 avril 2008.
Michael J. Schroeck : Customer Analytics Making the Difference in CRM : Customer
Analytics Amplify the value of integrated CRM Solutions. Disponible :
http://www.dmreview.com/issues/20010901/3955-1.html, accédé le 8 avril 2008.
Prof. Manole Velicanu, Ph. D. et Gh. Matei, Ph.D : Building a Data Warehouse step
by step. Disponible : http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1028461, accédé le 7
avril 2008.
22
Mihaela Muntean, Claudiu Brandas : Business Intelligence Support Systems and
Infrastructure.
Disponible :
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1082465,
accédé le 7 avril 2008.
Eric
Goldman :
Data
Mining
and
Attention Consumption. Disponible :
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=685241, accédé le 7 avril 2008.
Gerrit H. van Bruggen and Berend Wierenga : When are CRM Systems Successful ?
The Perspective of the User and of the Organization. Disponible :
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=828168, accédé le 7 avril 2008.
René Lefébure, Gilles Venturi : Gestion de la relation client, édition 2005.
Disponible : http://www.softcomputing.com/documents/pdf_generaux/gestion-relation-client-c13.pdf,
accédé le 7 avril 2008.
The
OLAP
Report :
OLAP
applications.
http://www.olapreport.com/Applications.htm, accédé le 13 avril 2008.
Disponible :
Antoine Crochet-Damais, JDNet : OLAP pour Online Analytical Processing.
Disponible : http://www.journaldunet.com/solutions/0301/030108_olap.shtml, accédé le 15 avril
2008.
Georges El Helou et Charbel Abou Khalil : Data mining, Techniques d’extraction des
connaissances. Disponible : http://www.lri.fr/~mdr/DataMining.Doc, accédé le 12 avril 2008.
Stéphane Tufféry : Datamining et statistique décisionnelle, L’intelligence dans les
bases
de
données,
édition
TECHNIP,
2005.
Disponible :
http://books.google.ch/books?isbn=2710808676, accédé le 12 avril 2008.
23