TP Classification Segmentation de clientèle d`un magazine
Transcription
TP Classification Segmentation de clientèle d`un magazine
STID 2 - DMST421a Fouilles de données Data mining TP Classification Segmentation de clientèle d’un magazine Le fichier de données popu_mag.txt contient des informations sur une population de lecteurs réguliers d’un magazine : ID sexe age habitat enfants 1 F 21 50 2 2 H 26 500 1 3 H 62 10 0 4 H 26 50 0 5 F 35 250 0 6 F 34 250 0 7 H 27 500 1 8 H 23 1000 0 9 H 33 2000 0 10 H 24 50 0 (...) (...) (...) (...) (...) 4206 H 31 1000 1 4207 H 23 1000 0 4208 H 34 250 1 - sexe : H ouF - âge - habitat (taille de leur agglomération, en milliers, ramenée à 10 modalités de 5 à 2000) - nombre d’enfants. 1. Le magazine souhaite ajuster son contenu en fonction de quelques segments de clientèles. 2. La question « Souhaitez-vous plus d'infos politiques dans le magazine ? » a été posée aux mêmes lecteurs. cas A le fichier Q_politique.txt contient les réponses à la question : non non oui non oui (...) non Le magazine souhaite analyser la réponse à cette question, pour ajuster son contenu à son lectorat. cas B Le fichier Q_politique.txt contient les réponses à la question « Souhaitez-vous plus d'infos politiques dans le magazine ? » posée aux mêmes lecteurs. Mais l’enquête a été effectuée par appel téléphonique aux lecteurs, et un certain nombre n’ont pu être contactés (réponse NC = « non communiqué »). non NC oui NC (...) NC Exploitez le plus complétement possible les informations de ce fichier.