Chapitre 6 L`analyse statistique de la clientèle
Transcription
Chapitre 6 L`analyse statistique de la clientèle
Chapitre 6 L'analyse statistique de la clientèle NRC - Gestion de clientèle - 1ère année Document Étudiant Jean-Alain LARREUR 1.0 Table des matières Introduction 3 I - Les variables qualitatives 4 II - Les variables quantitatives discrètes 6 1. Introduction ................................................................................................................................. 6 2. Les caractéristiques de position .................................................................................................... 7 2.1. Le mode ................................................................................................................................................. 7 2.2. La médiane ............................................................................................................................................ 7 2.3. La moyenne ........................................................................................................................................... 8 3. Les caractéristiques de dispersion ................................................................................................. 9 3.1. Le calcul de la variance ........................................................................................................................... 9 3.2. Le calcul de l'écart type ........................................................................................................................... 9 III - Les variables quantitatives continues 11 1. Introduction ............................................................................................................................... 11 2. Les caractéristiques de position .................................................................................................. 12 2.1. Le mode ............................................................................................................................................... 12 2.2. La médiane ........................................................................................................................................... 12 2.3. La moyenne .......................................................................................................................................... 13 3. Les caractéristiques de dispersion ............................................................................................... 13 IV - Synthèse : vers un Modus Operandi... 15 1. Tableau pour les variables quantitatives discrètes ..................................................................... 15 2. Tableau pour les variables quantitatives continues .................................................................... 16 Introduction Une étude statistique consiste à étudier différents éléments relatifs à une population donnée, par exemple l'ensemble des clients d'une entreprise. Elle peut être menée de façon exhaustive sur l'ensemble de la population : on parle alors de recensement . Dans le cas où la population à étudier est trop importante, l'étude est menée sur un échantillon. L'étude de la population porte sur différentes caractéristiques appelées « variables statistiques » : montant des achats, nombre de commandes, articles commandés, etc. Les variables étudiées peuvent être de deux ordres, qualitatives ou quantitatives. 3 Les variables qualitatives Les variables qualitatives I Les variables qualitatives sont des variables non mesurables (nature des produits achetés, type de client, activité du client, profession etc.) ; elles ne peuvent pas prendre de valeur numérique, mais font l'objet d'un dénombrement. Les résultats d'une étude statistique sont généralement présentés sous forme de tableaux. À l'issue du dépouillement des observations, on obtient un tableau d'effectifs récapitulatif reprenant : les différentes modalités de la variable ; l'effectif associé à chaque modalité ; l'effectif total. Pour ce type de variable, il est nécessaire de recenser les différentes modalités prises par la variable, puis de déterminer l'effectif correspondant à chaque modalité. Exemple : Exemple Buroplus - Contexte L'entreprise Buroplus analyse la répartition géographique de sa clientèle suivant le département ; les modalités prises par la variable sont donc qualitatives : Nord, Pas-de-Calais, etc. Localisation Nord Pas de Calais Aisne Oise Ardennes Nombre de Clients n 45 36 25 22 22 Total (N) 150 i Un tableau de fréquences permet ensuite d'effectuer des comparaisons entre plusieurs séries statistiques et de suivre l'évolution d'une variable dans le temps ou dans l'espace . Il nécessite le calcul de la proportion correspondant à chacune des modalités. La fréquence est donnée par la formule : Exemple : Exemple Buroplus - Calculs On obtient pour le département du Nord : fi = 45/150 × 100 = 30 %. Localisation Nord Pas de Calais Aisne Oise Ardennes Total (N) Fréquences 30 % 24 % fi (en %) 14,67 % 14,66 % 100 % 16,67 % La fréquence peut enfin être représentée sous la forme d'un graphique circulaire. 4 Les variables qualitatives Graphique Circulaire représentant l'origine géographique des clients 5 Les variables quantitatives discrètes Les variables quantitatives discrètes II Introduction 6 Les caractéristiques de position 7 Les caractéristiques de dispersion 9 1. Introduction Les variables quantitatives sont des variables mesurables. Quand la variable quantitative prend une valeur identifiée, finie, on parle de variable quantitative discrète. Exemple : Exemple Buroplus - Contexte À partir du nombre de commandes par client, on obtient le tableau d'effectifs figurant en annexe 2. On obtient ensuite le tableau de fréquences suivant : Nombre de 1 commandes fi (en %) 25 % 2 3 4 5 6 Total 37,5 % 20,83 % 10 % 5% 1,67 % 100 % Quelle que soit la variable étudiée – discrète ou continue –, il est possible de présenter un tableau d'effectifs et/ou de fréquences cumulés. Les effectifs ou les fréquences cumulés peuvent être : – cumulés croissants : ils s'obtiennent par additions successives des effectifs ou des fréquences correspondants ; – cumulés décroissants : ils se calculent par soustractions successives des effectifs ou des fréquences, à partir de l'effectif total. Exemple : Exemple Buroplus - Calculs À partir de la variable discrète précédente, on obtient le tableau des effectifs cumulés croissants et décroissants suivant : Nombre de 1 commandes 2 3 4 5 6 Total Nombre de 30 clients 45 25 12 6 2 120 75 100 112 118 120 90 45 20 8 2 Effectifs cumulés croissants 30 Effectif 120 cumulés décroissants 6 Les variables quantitatives discrètes L'évolution de la variable quantitative peut enfin être représentée sous la forme d'un diagramme en bâtons. Exemple Diagramme en batons représentant l'évolution du nombre de clients en fondu nombre de commandes Les tableaux et graphiques étudiés permettent de regrouper les données afin d'en faciliter l'exploitation. Pour compléter l'analyse d'une série statistique, il est cependant nécessaire de calculer un certain nombre de paramètres permettant d'apprécier les tendances générales du phénomène étudié : les caractéristiques de position et de dispersion. 2. Les caractéristiques de position Les caractéristiques de position renseignent sur les tendances centrales de la série statistique considérée. Il en existe trois types : le mode, la médiane, la moyenne. 2.1. Le mode Le mode est la valeur de la variable statistique pour laquelle l'effectif observé est le plus élevé ou pour laquelle la fréquence est la plus grande. Exemple : Exemple Buroplus À partir de la série étudiée, on remarque que l'effectif le plus élevé est de 45. Le mode (Mo) est donc la valeur correspondante prise par la variable statistique, soit Mo = 2. Cela signifie que les clients passent le plus souvent deux commandes par mois 2.2. La médiane La médiane est la valeur de la variable qui partage en deux parties égales l'ensemble des observations. En cas d'effectif impair, le rang de la médiane se détermine facilement : par exemple, si N = 11, le rang de la médiane correspond à la 6e observation, soit 5 observations avant et 5 observations après. Si N est pair, il convient en revanche de déterminer un intervalle médian. Exemple 7 Les variables quantitatives discrètes Exemple Buroplus En reprenant le tableau des effectifs croissants et décroissants, il n'est pas possible de déterminer avec précision la valeur de la médiane (Me), étant donné que l'effectif est pair. Il est possible néanmoins de déterminer un intervalle médian : Nombre de 1 commandes 2 3 4 5 6 Total Nombre de 30 clients 45 25 12 6 2 120 75 100 112 118 120 90 45 20 8 2 Effectifs cumulés croissants 30 Effectif 120 cumulés décroissants Si on prend comme médiane 1 commande, on aura 90 clients au-dessus et 30 au-dessous, et non la moitié de l'effectif total. De même, si on prend Me = 2, on aura 75 clients au-dessous et 45 au-dessus. On peut donc en conclure que la médiane d'une série à variable discrète ne peut être déterminée avec justesse, conformément à sa définition. Il est possible de déterminer graphiquement la médiane à partir des effectifs cumulés croissants et décroissants, obtenus à partir d'un cumul des effectifs correspondant à chaque modalité prise par la variable. 2.3. La moyenne La moyenne arithmétique d'un ensemble d'observations est le quotient de leur somme par leur nombre. Elle est donnée par la formule : Exemple : Exemple Buroplus En reprenant l'exemple précédent, on obtient : Nombre de commandes xi 1 2 3 4 5 6 Total Nombre de clients ni 30 45 25 12 6 2 120 (ni) x (xi) 30 90 75 48 30 12 285 Un client passe en moyenne 2,375 commandes par mois. 8 Les variables quantitatives discrètes 3. Les caractéristiques de dispersion L'étude des caractéristiques de dispersion complète celle des tendances centrales de la série. Les paramètres de dispersion indiquent comment les valeurs de la série se situent autour de ces valeurs centrales. Ils permettent ainsi de comparer des séries entre elles en étudiant les variations ou les dispersions des données par rapport à la tendance centrale. Exemple : Exemple Buroplus Soit le nombre de commandes obtenues par deux commerciaux au cours de la même période : Semaine 1 2 3 4 5 6 7 Moyenne Commercial 18 A 20 20 22 24 24 26 154/7=22 Commercial 10 B 14 18 22 26 30 34 154/7=22 La première série est faiblement dispersée : le commercial A obtient ses commandes de façon régulière (de 18 à 26). La seconde série est au contraire fortement dispersée : le commercial B obtient des résultats assez hétérogènes selon les semaines (de 10 à 34). 3.1. Le calcul de la variance La variance est donnée par la formule : Avec : xi = valeurs prises par la variable ni = effectifs correspondants N = effectif total 3.2. Le calcul de l'écart type L'écart type est donné par la formule : Exemple : Exemple Buroplus À partir de la série relative au nombre de commandes passées par les clients au cours du dernier mois, on obtient : Nombre de commandes (xi) 1 2 3 4 5 6 Total Effectifs (ni) 30 45 25 12 6 2 120 -1,375 -0,375 0,625 1,625 2,625 3,625 1,891 0,141 0,391 2,641 6,891 13,141 56,73 6.345 9,775 31,692 41,346 26,282 172,17 9 Les variables quantitatives discrètes En moyenne, le nombre de commandes s'écarte de 1,20 par rapport au nombre moyen, qui représente 2,375 commandes. 10 Les variables quantitatives continues Les variables quantitatives continues III Introduction 11 Les caractéristiques de position 12 Les caractéristiques de dispersion 13 1. Introduction Quand la variable quantitative prend une multitude de valeurs possibles dans un intervalle de variations, on parle de variable quantitative continue. Les variables statistiques continues peuvent prendre des valeurs très variées. Il est donc nécessaire de les regrouper en classes. Exemple : Exemple Buroplus En annexe 3, les commandes obtenues au cours du dernier mois sont réparties par tranches de chiffre d'affaires (amplitude de 200 euros). Après comptage, on obtient le tableau suivant indiquant la répartition des commandes obtenues au cours du dernier mois par tranches de chiffre d'affaires : Chiffre d'affaires en € 0 à 200 à 400 200 Nombre de commandes 8 fi (en %) 16 % 400 à 600 600 à 800 + 800 d e Total 12 15 10 5 50 24 % 30 % 20 % 10 % 100 % Pour représenter graphiquement cette série, deux cas peuvent se présenter selon que les classes sont d'amplitude égale ou inégale. Lorsque les classes sont d'amplitude égale, il suffit de tracer des rectangles de hauteur correspondant aux effectifs. 11 Les variables quantitatives continues Histogramme représentant l'évolution du nombre de commandes en fonction du CA Il est nécessaire de « borner » la dernière classe en utilisant une amplitude identique à celle des autres classes ; la surface des rectangles de l'histogramme est alors proportionnelle aux effectifs. Lorsque les classes sont d'amplitude inégale, puisque l'effectif doit être proportionnel à l'aire du rectangle et non à sa hauteur, il est nécessaire de corriger en conséquence, en ramenant la série à une série d'amplitude égale. Par exemple, si une classe a une amplitude double des autres, on divisera son effectif, et donc la hauteur du rectangle, par deux. 2. Les caractéristiques de position 2.1. Le mode À l'effectif le plus grand correspond dans ce cas une « classe modale ». On prend alors comme mode le centre de cette classe modale. Exemple : Exemple Buroplus En reprenant les données relatives au chiffre d'affaires réalisé au cours du dernier mois, on constate que l'effectif le plus élevé est de 15 et concerne la classe [400, 600[, donc : Mo = centre de la classe modale, soit 500. On peut aussi déterminer le mode graphiquement : c'est l'abscisse du point le plus élevé. Si les classes n'ont pas la même amplitude, on effectue une correction des classes identique à celle réalisée pour la représentation graphique en histogramme. On retient alors comme classe modale la classe pour laquelle l'effectif corrigé est le plus élevé. 2.2. La médiane On commence par déterminer la classe qui contient la médiane, grâce au calcul des effectifs cumulés croissants, soit la classe correspondant à l'effectif N/2 où les fréquences cumulées croissantes correspondent à 50 %. On détermine ensuite de façon précise la médiane, par interpolation linéaire, c'est-à-dire en effectuant un partage proportionnel. Exemple : Exemple Buroplus À partir du tableau du chiffre d'affaires réalisé au cours du dernier mois, on obtient : Chiffre d'affaires en € 0 à 200 à 400 200 Nombre de commandes 8 16 % 12 400 à 600 600 à 800 + 800 12 15 10 5 24 % 30 % 20 % 10 % d e Total 50 Les variables quantitatives continues fi (en %) 100 % fi cumulés croissants 16 % 40 % 70 % 90 % 100 % La médiane correspond à 50 % des effectifs et se trouve donc dans la classe [400,600[. Pour calculer la médiane par interpolation linéaire, on peut établir la relation suivante : Valeur de la variable xi 400 Me 600 Effectifs cumulés croissant en % 4 0 % 50 % 70 % La moitié des commandes représente moins de 467 euros par mois, et l'autre moitié, plus de 467 euros. Comme pour la variable discrète, la médiane peut également être déterminée graphiquement, à partir des effectifs cumulés croissants et décroissants. 2.3. La moyenne La formule de calcul est la même que dans le cas d'une variable discrète, mais les valeurs xi sont représentées par les centres de classes. Exemple : Exemple Buroplus En reprenant la série précédente, on obtient : Chiffre d'affaires en € Centre de classe xi Effectifs ni ni * x i 0 à 200 200 400 à 400 600 à 600 800 à 800 1000 à Total 100 300 500 700 900 8 12 15 10 5 50 800 3600 7500 7000 4500 23400 Note : il est nécessaire de borner la dernière classe pour en déterminer le centre, en retenant ici une amplitude de 200. Les vendeurs font en moyenne 468 € de CA La moyenne peut également être calculée à partir des fréquences. La formule devient dans ce cas : 3. Les caractéristiques de dispersion Les formules utilisées sont les mêmes que pour la variable discrète. Dans ce dernier cas, les calculs sont effectués sur les centres de classe, comme pour la moyenne arithmétique. 13 Les variables quantitatives continues Exemple : Exemple Buroplus À partir de la série du montant des commandes passées par les clients, on obtient Montant des commandes en € Centre de classe xi Effectifs ni 0 à 200 200 400 à 400 600 à 600 800 100 300 500 700 900 8 12 15 10 5 -368 -168 32 232 432 13 5424 28 224 1 024 53 824 186 624 15 360 538 240 933 120 1 0 8 3 338 688 392 à 800 1000 à Total 50 2 908 800 En moyenne, les montants des commandes s'écartent de 241,20 euros par rapport au montant moyen, 468 euros. 14 Synthèse : vers un Modus Operandi... Synthèse : vers un Modus Operandi... IV Tableau pour les variables quantitatives discrètes 15 Tableau pour les variables quantitatives continues 16 1. Tableau pour les variables quantitatives discrètes Présenter le tableau Valeurs de la variable (xi) Total Effectifs (ni) N= Lecture de la Médiane (soit à partir des Effectifs cumulés croissants ou soit à partir des Fréquences cumulées croissantes en %) Effectifs cumulés croissants Effectifs cumulés décroissants N = N = Fréquences fi (en %) 100 % Fréquences cumulées croissantes (en %) 100 % Fréquences 100 cumulées % décroissantes (en %) Calcul de la Moyenne ni * x i Calcul de la Variance Résoudre les questions Mode Médiane Déterminer le Mode en analysant le tableau Déterminer l'intervalle médian dans le tableau en fonction soit : 15 Synthèse : vers un Modus Operandi... - des effectifs cumulés croissants et décroissants ou - des fréquences cumulées croissantes et décroissantes Moyenne Variance Écart-Type 2. Tableau pour les variables quantitatives continues Présenter le tableau Classes de la variable (xi) de ... à ... [0, ....[ de ... ... à ... [... , ...[ ... ... ... Effectifs (ni) Calcul de Médiane par interpolation linéaire (soit à partir des Effectifs cumulés croissants ou soit à partir des Fréquences cumulées croissantes en %) N= Effectifs cumulés croissants Effectifs cumulés décroissants (Optionnel) N = N = Fréquences fi (en %) Fréquences cumulées croissantes (en %) Fréquences 100 cumulées % décroissantes en % ( Optionnel) Calcul de la Moyenne Centre de classes xi ni * x i Calcul de la Variance Répondre aux questions 16 Total 100 % 100 % Synthèse : vers un Modus Operandi... Mode Déterminer le Mode en analysant le tableau (Rappel : Le Mode est est le centre de la classe modale qui a l'effectif le plus élevé) Médiane Déterminer la médiane par interpolation linéaire (partage proportionnel) Moyenne Note : Les valeurs xi sont représentées part les centres de classes Variance Note : Les valeurs xi sont représentées part les centres de classes Écart-Type 17