Chapitre 6 L`analyse statistique de la clientèle

Transcription

Chapitre 6 L`analyse statistique de la clientèle
Chapitre 6 L'analyse
statistique de la
clientèle
NRC - Gestion de clientèle - 1ère année
Document Étudiant
Jean-Alain LARREUR
1.0
Table des
matières
Introduction
3
I - Les variables qualitatives
4
II - Les variables quantitatives discrètes
6
1. Introduction ................................................................................................................................. 6
2. Les caractéristiques de position .................................................................................................... 7
2.1. Le mode ................................................................................................................................................. 7
2.2. La médiane ............................................................................................................................................ 7
2.3. La moyenne ........................................................................................................................................... 8
3. Les caractéristiques de dispersion ................................................................................................. 9
3.1. Le calcul de la variance ........................................................................................................................... 9
3.2. Le calcul de l'écart type ........................................................................................................................... 9
III - Les variables quantitatives continues
11
1. Introduction ............................................................................................................................... 11
2. Les caractéristiques de position .................................................................................................. 12
2.1. Le mode ............................................................................................................................................... 12
2.2. La médiane ........................................................................................................................................... 12
2.3. La moyenne .......................................................................................................................................... 13
3. Les caractéristiques de dispersion ............................................................................................... 13
IV - Synthèse : vers un Modus Operandi...
15
1. Tableau pour les variables quantitatives discrètes ..................................................................... 15
2. Tableau pour les variables quantitatives continues .................................................................... 16
Introduction
Une étude statistique consiste à étudier différents éléments relatifs à une population donnée, par
exemple l'ensemble des clients d'une entreprise.
Elle peut être menée de façon exhaustive sur l'ensemble de la population : on parle alors de recensement
. Dans le cas où la population à étudier est trop importante, l'étude est menée sur un échantillon.
L'étude de la population porte sur différentes caractéristiques appelées « variables statistiques » :
montant des achats, nombre de commandes, articles commandés, etc. Les variables étudiées peuvent être
de deux ordres, qualitatives ou quantitatives.
3
Les variables qualitatives
Les variables
qualitatives
I
Les variables qualitatives sont des variables non mesurables (nature des produits achetés,
type de client, activité du client, profession etc.) ; elles ne peuvent pas prendre de valeur
numérique, mais font l'objet d'un dénombrement. Les résultats d'une étude statistique sont
généralement présentés sous forme de tableaux.
À l'issue du dépouillement des observations, on obtient un tableau d'effectifs récapitulatif
reprenant :
les différentes modalités de la variable ;
l'effectif associé à chaque modalité ;
l'effectif total.
Pour ce type de variable, il est nécessaire de recenser les différentes modalités prises par la
variable, puis de déterminer l'effectif correspondant à chaque modalité.
Exemple : Exemple Buroplus - Contexte
L'entreprise Buroplus analyse la répartition géographique de sa clientèle suivant le département
; les modalités prises par la variable sont donc qualitatives : Nord, Pas-de-Calais, etc.
Localisation
Nord Pas de Calais Aisne Oise Ardennes
Nombre de Clients n 45
36
25
22
22
Total
(N)
150
i
Un tableau de fréquences permet ensuite d'effectuer des comparaisons entre plusieurs séries
statistiques et de suivre l'évolution d'une variable dans le temps ou dans l'espace . Il
nécessite le calcul de la proportion correspondant à chacune des modalités. La fréquence est
donnée par la formule :
Exemple : Exemple Buroplus - Calculs
On obtient pour le département du Nord :
fi = 45/150 × 100 = 30 %.
Localisation Nord Pas de Calais Aisne
Oise
Ardennes
Total
(N)
Fréquences 30 % 24 %
fi (en %)
14,67
%
14,66 %
100 %
16,67
%
La fréquence peut enfin être représentée sous la forme d'un graphique circulaire.
4
Les variables qualitatives
Graphique Circulaire représentant l'origine géographique des clients
5
Les variables quantitatives discrètes
Les variables
quantitatives discrètes
II
Introduction
6
Les caractéristiques de position
7
Les caractéristiques de dispersion
9
1. Introduction
Les variables quantitatives sont des variables mesurables. Quand la variable quantitative
prend une valeur identifiée, finie, on parle de variable quantitative discrète.
Exemple : Exemple Buroplus - Contexte
À partir du nombre de commandes par client, on obtient le tableau d'effectifs figurant en
annexe 2.
On obtient ensuite le tableau de fréquences suivant :
Nombre de 1
commandes
fi (en %)
25 %
2
3
4
5
6
Total
37,5 %
20,83 %
10 %
5%
1,67 %
100 %
Quelle que soit la variable étudiée – discrète ou continue –, il est possible de présenter un
tableau d'effectifs et/ou de fréquences cumulés. Les effectifs ou les fréquences cumulés peuvent
être :
– cumulés croissants : ils s'obtiennent par additions successives des effectifs ou des fréquences
correspondants ;
– cumulés décroissants : ils se calculent par soustractions successives des effectifs ou des
fréquences, à partir de l'effectif total.
Exemple : Exemple Buroplus - Calculs
À partir de la variable discrète précédente, on obtient le tableau des effectifs cumulés croissants
et décroissants suivant :
Nombre de 1
commandes
2
3
4
5
6
Total
Nombre de 30
clients
45
25
12
6
2
120
75
100
112
118
120
90
45
20
8
2
Effectifs
cumulés
croissants
30
Effectif
120
cumulés
décroissants
6
Les variables quantitatives discrètes
L'évolution de la variable quantitative peut enfin être représentée sous la forme d'un diagramme
en bâtons.
Exemple
Diagramme en batons représentant l'évolution du nombre de clients en fondu nombre de
commandes
Les tableaux et graphiques étudiés permettent de regrouper les données afin d'en faciliter
l'exploitation. Pour compléter l'analyse d'une série statistique, il est cependant nécessaire de
calculer un certain nombre de paramètres permettant d'apprécier les tendances générales du
phénomène étudié : les caractéristiques de position et de dispersion.
2. Les caractéristiques de position
Les caractéristiques de position renseignent sur les tendances centrales de la série statistique
considérée. Il en existe trois types : le mode, la médiane, la moyenne.
2.1. Le mode
Le mode est la valeur de la variable statistique pour laquelle l'effectif observé est le plus élevé
ou pour laquelle la fréquence est la plus grande.
Exemple : Exemple Buroplus
À partir de la série étudiée, on remarque que l'effectif le plus élevé est de 45. Le mode (Mo)
est donc la valeur correspondante prise par la variable statistique, soit Mo = 2. Cela signifie que
les clients passent le plus souvent deux commandes par mois
2.2. La médiane
La médiane est la valeur de la variable qui partage en deux parties égales l'ensemble des
observations.
En cas d'effectif impair, le rang de la médiane se détermine facilement : par exemple, si N = 11,
le rang de la médiane correspond à la 6e observation, soit 5 observations avant et 5 observations
après.
Si N est pair, il convient en revanche de déterminer un intervalle médian.
Exemple
7
Les variables quantitatives discrètes
Exemple Buroplus
En reprenant le tableau des effectifs croissants et décroissants, il n'est pas possible de
déterminer avec précision la valeur de la médiane (Me), étant donné que l'effectif est pair. Il est
possible néanmoins de déterminer un intervalle médian :
Nombre de 1
commandes
2
3
4
5
6
Total
Nombre de 30
clients
45
25
12
6
2
120
75
100
112
118
120
90
45
20
8
2
Effectifs
cumulés
croissants
30
Effectif
120
cumulés
décroissants
Si on prend comme médiane 1 commande, on aura 90 clients au-dessus et 30 au-dessous, et non
la moitié de l'effectif total.
De même, si on prend Me = 2, on aura 75 clients au-dessous et 45 au-dessus.
On peut donc en conclure que la médiane d'une série à variable discrète ne peut être
déterminée avec justesse, conformément à sa définition.
Il est possible de déterminer graphiquement la médiane à partir des effectifs cumulés croissants
et décroissants, obtenus à partir d'un cumul des effectifs correspondant à chaque modalité prise
par la variable.
2.3. La moyenne
La moyenne arithmétique d'un ensemble d'observations est le quotient de leur somme par leur
nombre. Elle est donnée par la formule :
Exemple : Exemple Buroplus
En reprenant l'exemple précédent, on obtient :
Nombre de
commandes xi
1
2
3
4
5
6
Total
Nombre de
clients ni
30
45
25
12
6
2
120
(ni) x (xi)
30
90
75
48
30
12
285
Un client passe en moyenne 2,375 commandes par mois.
8
Les variables quantitatives discrètes
3. Les caractéristiques de dispersion
L'étude des caractéristiques de dispersion complète celle des tendances centrales de la série. Les
paramètres de dispersion indiquent comment les valeurs de la série se situent autour de ces
valeurs centrales. Ils permettent ainsi de comparer des séries entre elles en étudiant les
variations ou les dispersions des données par rapport à la tendance centrale.
Exemple : Exemple Buroplus
Soit le nombre de commandes obtenues par deux commerciaux au cours de la même période :
Semaine
1
2
3
4
5
6
7
Moyenne
Commercial 18
A
20
20
22
24
24
26
154/7=22
Commercial 10
B
14
18
22
26
30
34
154/7=22
La première série est faiblement dispersée : le commercial A obtient ses commandes de façon
régulière (de 18 à 26).
La seconde série est au contraire fortement dispersée : le commercial B obtient des résultats
assez hétérogènes selon les semaines (de 10 à 34).
3.1. Le calcul de la variance
La variance est donnée par la formule :
Avec : xi = valeurs prises par la variable
ni = effectifs correspondants
N = effectif total
3.2. Le calcul de l'écart type
L'écart type est donné par la formule :
Exemple : Exemple Buroplus
À partir de la série relative au nombre de commandes passées par les clients au cours du dernier
mois, on obtient :
Nombre de
commandes (xi)
1
2
3
4
5
6
Total
Effectifs (ni)
30
45
25
12
6
2
120
-1,375
-0,375
0,625
1,625
2,625
3,625
1,891
0,141
0,391
2,641
6,891
13,141
56,73
6.345
9,775
31,692
41,346
26,282
172,17
9
Les variables quantitatives discrètes
En moyenne, le nombre de commandes s'écarte de 1,20 par rapport au nombre moyen, qui
représente 2,375 commandes.
10
Les variables quantitatives continues
Les variables
quantitatives
continues
III
Introduction
11
Les caractéristiques de position
12
Les caractéristiques de dispersion
13
1. Introduction
Quand la variable quantitative prend une multitude de valeurs possibles dans un intervalle de
variations, on parle de variable quantitative continue. Les variables statistiques continues
peuvent prendre des valeurs très variées. Il est donc nécessaire de les regrouper en classes.
Exemple : Exemple Buroplus
En annexe 3, les commandes obtenues au cours du dernier mois sont réparties par tranches de
chiffre d'affaires (amplitude de 200 euros). Après comptage, on obtient le tableau suivant
indiquant la répartition des commandes obtenues au cours du dernier mois par tranches de
chiffre d'affaires :
Chiffre d'affaires en €
0
à 200 à 400
200
Nombre de commandes 8
fi (en %)
16 %
400 à 600
600 à 800
+
800
d e Total
12
15
10
5
50
24 %
30 %
20 %
10 %
100
%
Pour représenter graphiquement cette série, deux cas peuvent se présenter selon que les classes
sont d'amplitude égale ou inégale.
Lorsque les classes sont d'amplitude égale, il suffit de tracer des rectangles de hauteur
correspondant aux effectifs.
11
Les variables quantitatives continues
Histogramme représentant l'évolution du nombre de commandes en fonction du CA
Il est nécessaire de « borner » la dernière classe en utilisant une amplitude identique à celle des
autres classes ; la surface des rectangles de l'histogramme est alors proportionnelle
aux effectifs.
Lorsque les classes sont d'amplitude inégale, puisque l'effectif doit être proportionnel à l'aire
du rectangle et non à sa hauteur, il est nécessaire de corriger en conséquence, en ramenant la
série à une série d'amplitude égale. Par exemple, si une classe a une amplitude double des
autres, on divisera son effectif, et donc la hauteur du rectangle, par deux.
2. Les caractéristiques de position
2.1. Le mode
À l'effectif le plus grand correspond dans ce cas une « classe modale ». On prend alors comme
mode le centre de cette classe modale.
Exemple : Exemple Buroplus
En reprenant les données relatives au chiffre d'affaires réalisé au cours du dernier mois, on
constate que l'effectif le plus élevé est de 15 et concerne la classe [400, 600[, donc : Mo = centre
de la classe modale, soit 500.
On peut aussi déterminer le mode graphiquement : c'est l'abscisse du point le plus élevé.
Si les classes n'ont pas la même amplitude, on effectue une correction des classes identique à
celle réalisée pour la représentation graphique en histogramme. On retient alors comme classe
modale la classe pour laquelle l'effectif corrigé est le plus élevé.
2.2. La médiane
On commence par déterminer la classe qui contient la médiane, grâce au calcul des effectifs
cumulés croissants, soit la classe correspondant à l'effectif N/2 où les fréquences cumulées
croissantes correspondent à 50 %. On détermine ensuite de façon précise la médiane, par
interpolation linéaire, c'est-à-dire en effectuant un partage proportionnel.
Exemple : Exemple Buroplus
À partir du tableau du chiffre d'affaires réalisé au cours du dernier mois, on obtient :
Chiffre d'affaires en €
0
à 200 à 400
200
Nombre de commandes 8
16 %
12
400 à 600
600 à 800
+
800
12
15
10
5
24 %
30 %
20 %
10 %
d e Total
50
Les variables quantitatives continues
fi (en %)
100
%
fi cumulés croissants
16 %
40 %
70 %
90 %
100 %
La médiane correspond à 50 % des effectifs et se trouve donc dans la classe [400,600[.
Pour calculer la médiane par interpolation linéaire, on peut établir la relation suivante :
Valeur de la variable xi
400
Me
600
Effectifs cumulés croissant en % 4 0
%
50
%
70
%
La moitié des commandes représente moins de 467 euros par mois, et l'autre moitié, plus de 467
euros.
Comme pour la variable discrète, la médiane peut également être déterminée graphiquement, à
partir des effectifs cumulés croissants et décroissants.
2.3. La moyenne
La formule de calcul est la même que dans le cas d'une variable discrète, mais les valeurs xi sont
représentées par les centres de classes.
Exemple : Exemple Buroplus
En reprenant la série précédente, on obtient :
Chiffre d'affaires en €
Centre de classe xi
Effectifs ni
ni * x i
0
à 200
200
400
à 400
600
à 600
800
à 800
1000
à Total
100
300
500
700
900
8
12
15
10
5
50
800
3600
7500
7000
4500
23400
Note : il est nécessaire de borner la dernière classe pour en déterminer le centre, en retenant ici
une amplitude de 200.
Les vendeurs font en moyenne 468 € de CA
La moyenne peut également être calculée à partir des fréquences. La formule devient dans ce cas
:
3. Les caractéristiques de dispersion
Les formules utilisées sont les mêmes que pour la variable discrète. Dans ce dernier cas, les
calculs sont effectués sur les centres de classe, comme pour la moyenne arithmétique.
13
Les variables quantitatives continues
Exemple : Exemple Buroplus
À partir de la série du montant des commandes passées par les clients, on obtient
Montant des commandes
en €
Centre de classe xi
Effectifs ni
0 à 200
200
400
à 400
600
à 600
800
100
300
500
700
900
8
12
15
10
5
-368
-168
32
232
432
13 5424
28 224
1 024
53 824
186 624
15 360
538 240
933 120
1
0 8 3 338 688
392
à 800
1000
à Total
50
2
908
800
En moyenne, les montants des commandes s'écartent de 241,20 euros par rapport au montant
moyen, 468 euros.
14
Synthèse : vers un Modus Operandi...
Synthèse : vers un
Modus Operandi...
IV
Tableau pour les variables quantitatives discrètes
15
Tableau pour les variables quantitatives continues
16
1. Tableau pour les variables quantitatives discrètes
Présenter le tableau
Valeurs de la variable (xi)
Total
Effectifs (ni)
N=
Lecture de la Médiane
(soit à partir des
Effectifs cumulés
croissants ou soit à
partir des Fréquences
cumulées croissantes en
%)
Effectifs
cumulés
croissants
Effectifs
cumulés
décroissants
N =
N =
Fréquences fi
(en %)
100 %
Fréquences
cumulées
croissantes
(en %)
100
%
Fréquences 100
cumulées
%
décroissantes
(en %)
Calcul de la Moyenne
ni * x i
Calcul de la Variance
Résoudre les questions
Mode
Médiane
Déterminer le Mode en analysant le tableau
Déterminer l'intervalle médian dans le tableau
en fonction soit :
15
Synthèse : vers un Modus Operandi...
- des effectifs cumulés croissants et
décroissants
ou
- des fréquences cumulées croissantes et
décroissantes
Moyenne
Variance
Écart-Type
2. Tableau pour les variables quantitatives continues
Présenter le tableau
Classes de la variable (xi)
de ...
à ...
[0,
....[
de
...
... à
...
[... ,
...[
...
...
...
Effectifs (ni)
Calcul de Médiane par
interpolation linéaire
(soit à partir des
Effectifs cumulés
croissants ou soit à
partir des Fréquences
cumulées croissantes
en %)
N=
Effectifs
cumulés
croissants
Effectifs
cumulés
décroissants
(Optionnel)
N =
N =
Fréquences fi
(en %)
Fréquences
cumulées
croissantes
(en %)
Fréquences 100
cumulées
%
décroissantes
en % (
Optionnel)
Calcul de la Moyenne
Centre de
classes xi
ni * x i
Calcul de la Variance
Répondre aux questions
16
Total
100 %
100
%
Synthèse : vers un Modus Operandi...
Mode
Déterminer le Mode en analysant le tableau
(Rappel : Le Mode est est le centre de la
classe modale qui a l'effectif le plus élevé)
Médiane
Déterminer la médiane par interpolation
linéaire (partage proportionnel)
Moyenne
Note : Les valeurs xi sont représentées part
les centres de classes
Variance
Note : Les valeurs xi sont représentées part
les centres de classes
Écart-Type
17

Documents pareils