TD1bis: Analyse Factorielle des Correspondances:

Transcription

TD1bis: Analyse Factorielle des Correspondances:
TD1bis: Analyse Factorielle des Correspondances:
1
Questions de cours
1. Quels sont les objectifs de l’AFC?
2. Quel est l’indicateur souvent utilisé pour décrire la liaison entre deux variables qualitatives? Quel est la
particularité de l’inertie en AFC?
3. A quoi correspond une valeur propre de 1 en AFC?
2
Vote des lecteurs des médias français
Le jour du scrutin des élections présidentielles de 2002, un sondage sorti des urnes a été réalisé par l’institut
CSA (pour le journal Télérama) auprès d’un échantillon national représentatif. Des électeurs volontaires ont
répondu par écrit à 2 questions :
• Pour quel candidat avez-vous voté?
• Quels sont vos quotidiens préférés?
Les réponses à ces deux questions ont permis d’établir le tableau telerama.txt. Au croisement de la ie ligne et
de la j e colonne on trouve le pourcentage de personnes ayant voté pour le candidat j parmi les personnes ayant
déclaré préférer le média i.
L’objectif est de réaliser une typologie des médias selon leur profil politique établi pour les candidats. On
décide pour cela de soumettre ce tableau à une AFC.
1. Importer le jeu de données "telerama.txt"
2. Analyser le tableau de données à l’aide d’une AFC: (ligne de commande ou interface graphique + regarder
les objects résultats)
res= CA(telerama)
res
plot.CA(res,invisible="row")
plot.CA(res,invisible="col")
3. Comment interpréter la proximité entre deux candidats?
4. Comment interpréter la proximité entre deux journaux?
5. Qu’est ce qu’on peut dire sur la proximité entre un candidat et un journal?
6. Quelle est la première grosse tendance qui se dégage de l’analyse?
7. Quel est le journal "le plus à gauche"?, "le plus à droite"?
8. Commenter l’électorat de Chevenement, de Jospin, de Bayrou...
9. Que peut-on dire sur les journaux Le Monde, Marianne, Le Parisien et l’Express?
10. Que peut-on dire sur le journal télérama?
1
3
Description de parfums de grandes marques
On dispose d’un tableau de contingence contenant 12 parfums décrits par 39 mots. Une valeur xij correspond
au nombre de fois où le descripteurs j a été utilisé pour decrire le parfum i. Nous voulons savoir quels sont les
parfums qui ont le même profil de mots? Quels sont les mots qui se ressemblent c’est à dire qui sont associés
de la même façon aux mêmes parfums?
1. Importer le jeu de données "perfume.txt".
2. Analyser le tableau de données à l’aide d’une AFC.
library(FactoMineR)
perfume = read.table("perfume.txt",header=T,sep="\t",row.names=1)
res.ca = CA(perfume,col.sup=16:39)
plot(res.ca,invisible="row")
plot(res.ca,invisible=c("col","col.sup"))
3. Interpréter globalement le premier plan factoriel.
4. Interpréter la proximité entre J’adore eau de parfum et J’adore eau de toilette.
5. Comment caractériser le parfum Lolita Lempika? Quel est l’adjectif qui lui correspond le mieux? Interpréter finement les positions des modalités "Lolita Lempika" de la variable "parfums" et "sugary" et
"vanilla" de la variable "descripteurs".
6. Quelles sont les modalités qui contribuent le plus à la création du premier plan factoriel? Peut-on retrouver
ce résultat sur le graphique?
2

Documents pareils