TP Classification Segmentation de clientèle d`un magazine

Transcription

TP Classification Segmentation de clientèle d`un magazine
STID 2 - DMST421a Fouilles de données Data mining
TP Classification
Segmentation de clientèle d’un magazine
Le fichier de données popu_mag.txt contient des informations sur une population de lecteurs réguliers d’un
magazine :
ID
sexe age habitat enfants
1
F
21 50
2
2
H
26 500
1
3
H
62 10
0
4
H
26 50
0
5
F
35 250
0
6
F
34 250
0
7
H
27 500
1
8
H
23 1000
0
9
H
33 2000
0
10
H
24 50
0
(...) (...) (...) (...)
(...)
4206 H
31 1000
1
4207 H
23 1000
0
4208 H
34 250
1
- sexe : H ouF
- âge
- habitat (taille de leur agglomération, en milliers, ramenée à 10 modalités de 5 à 2000)
- nombre d’enfants.
1. Le magazine souhaite ajuster son contenu en fonction de quelques segments de clientèles.
2. La question « Souhaitez-vous plus d'infos politiques dans le magazine ? » a été posée aux mêmes lecteurs.
cas A
le fichier Q_politique.txt contient les réponses à la question :
non
non
oui
non
oui
(...)
non
Le magazine souhaite analyser la réponse à cette question, pour ajuster son contenu à son lectorat.
cas B
Le fichier Q_politique.txt contient les réponses à la question « Souhaitez-vous plus d'infos politiques dans le
magazine ? » posée aux mêmes lecteurs. Mais l’enquête a été effectuée par appel téléphonique aux lecteurs, et
un certain nombre n’ont pu être contactés (réponse NC = « non communiqué »).
non
NC
oui
NC
(...)
NC
Exploitez le plus complétement possible les informations de ce fichier.