La catégorisation - e-agrocampus

Transcription

La catégorisation - e-agrocampus
La catégorisation
François Husson
Laboratoire de mathématiques appliquées
Agrocampus ouest
[email protected]
Quantitative descriptive Analysis
Stone et al. (1974)
Le test le plus utilisé pour obtenir une description complète d’un
espace produit
Jury entraîné
Notation sur une liste prédéfinie de descripteurs sensoriels
Inconvénients :
Coûteux, temps (= argent)
Liste limitée de descripteurs sensoriels
On peut vouloir prendre en compte les points de vue différents de
plusieurs personnes
Approches holistiques
Du grec öλος (holos), un mot qui signifie global, entier, totalité
Produits évalués dans leur globalité
Deux principales méthodes de recueil :
Catégorisation ou tri libre (sorting task) : a priori plus synthétique
Napping : a priori plus riche
Analytique
X
Quantitative
Descriptive
Analysis
Analytique/Spontanée
X
Profil flash
Spontanée
X
Approches holistiques
(catégorisation,
napping)
La catégorisation
Description
La catégorisation est un processus cognitif souvent utilisé pour reccueillir les données
La première étape consiste à regrouper les objets en fonction de leur ressemblance
La seconde étape consiste à verbaliser chacun des groupes d’objets pour les décrire
Intérêts
Etape préliminaire/complémentaire du profil sensoriel
Obtention de descripteurs
Etude consommateur
Description facile
Description rapide
Exemple sur des parfums…
Les produits
Angel
Lolita
Lempicka
Aromatics Chanel n°5
Elixir
Pleasures
Pure Poison
Cinéma
Shalimar
Coco
Mademoiselle
L'instant
J'adore
(ET)
J'adore (EP)
Les juges
Etape 1
Etape 1
Etape 2
« épicé, aldehyde »
« gourmand,
vanille, boisé »
« vanille, orange »
« oriental,
boisé,
Patchouli oil »
« floral,
vert »
Etape 2
« léger, vanille,
orange »
« fort,
boisé »
« vieux, WC »
Traitement statistique
Comment recueillir les données ? (i.e. quel tableau de
données construire ?)
Quelle méthode statistique utiliser ?
gourmand
orange
boisé
vieux
épicé
vieux
vanille
fort
vanille
fort
vanille
fort
gourmand
fort
floral
fort
boisé
vieux
boisé
vieux
floral
orange
floral
orange
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
…
Un tableau avec en lignes les parfums, en colonnes les juges,
un juge est considéré comme une variable qualitative, les
mots qu’il utilise comme des modalités
produit
Angel
Aromatic Elixir
Chanel n°5
Cinéma
Coco Mademoiselle
J'adore (EP)
J'adore (ET)
L'instant
Lolita Lempicka
Pleasures
Pure Poison
Shalimar
juge 12
fleuri doux
fort homme
Gr 4
fleuri artificiel herbe
fleuri doux
fleuri doux
fleuri artificiel herbe
fleuri doux
fleuri doux
fort homme
fleuri doux
fleuri artificiel herbe
juge 13
fruité fort
capiteux grand-mère
capiteux grand-mère
fruité moyen
fruité moyen
sucré faible
sucré faible
fruité fort
fruité moyen
fruité fort
acidulé désodorisant
fort lavande eau de cologne
juge 14
vanillé épicé esprit des îles
rude fort
toilettes
sucré
douceur fleuri
douceur fleuri
douceur fleuri
sucré
vanillé épicé esprit des îles
sucré
douceur fleuri
renfermé agressif
juge 15
à manger sucré
le vieux
savon
doux
doux
fleuri
fleuri
le vieux
à manger sucré
fleuri
doux
le vieux
juge 16
nourriture épice
ménager cire
connu classique
nourriture épice
connu classique
connu classique
connu classique
fleuri
nourriture épice
fleuri
fleuri
ménager cire
Traitement statistique par Analyse des Correspondances Multiples (ACM)
Pourquoi ça marche ?
vieux
fort
orange
orange
0
0
1
vieux
1
0
0
vieux
1
0
0
fort
0
1
0
fort
0
1
0
fort
0
1
0
fort
0
1
0
fort
0
1
0
vieux
1
0
0
vieux
1
0
0
orange
0
0
1
orange
0
0
1
vieux
fort
orange
orange
0
0
1
vieux
1
0
0
vieux
1
0
0
=2
=0
La distance entre deux produits est nul s’ils sont systématiquement ensemble
Deux produits sont d’autant plus proches (resp. éloigné) qu’ils ont été mis ensemble
par beaucoup (resp. peu) de consommateurs
Plus précisément, la modalité k contribue à cette distance de façon inverement
proportionnelle à sa taille (ainsi, un parfum seul dans son groupe est éloigné)
Distance entre modalités
Deux modalités (ici des mots) sont d’autant plus éloignées qu’elles ont peu
d’individus (ici des parfums) en commun. Autrement dit, que le nombre
d’individus qui ont pris la modalité k et la modalité k’ est petit
Graphiques associés
Graphiques des individus et des modalités (i.e. des parfums et des mots) :
deux parfums sont d’autant plus proches qu’ils ont été mis ensemble par
beaucoup de consommateurs et qu’ils ont été décrits par les mêmes mots
deux mots sont d’autant plus proches qu’ils décrivent les mêmes parfums
un parfum est proche d’un mot s’il est souvent décrit par ce mot
Graphique des variables (i.e. des consommateurs) : deux consommateurs sont
d’autant plus proches qu’ils ont fait la même catégorisation (qu’ils ont construit
des groupes de parfums similaires)
Co-occurences entre parfums
J adore (EP)
Pleasures
Coco Mademoiselle
Cinéma
Pure Poison
L instant
Lolita Lempicka
Angel
Chanel 5
Aromatics Elixir
J adore (EP)
Pleasures
Coco Mademoiselle
Cinéma
Pure Poison
L instant
Lolita Lempicka
Angel
Chanel 5
Aromatics Elixir
Shalimar
J adore (ET)
> res.fast <- fast(perfume)
> res.fast$cooccur
56
48
38
24
28
22
18
12
14
7
7
98
38
28
23
29
28
18
11
12
12
6
98
28
22
30
23
18
11
14
11
6
98
30
33
20
21
10
11
12
9
98
28
26
42
18
9
8
10
98
25
18
10
21
12
11
98
22
14
10
13
13
98
36
8
6
9
98
15
27
21
98
51
30
98
42
Analyse textuelle
Description des produits Angel et Chanel n°5 par les mots les plus carécatéristiques
Angel
vanillé
épicé
sucré
fort
Intern % glob % Intern freq Glob freq p.value v.test
4.032 0.841
5
13
0.005 2.829
4.839 1.488
6
23
0.015 2.426
12.097 6.598
15
102
0.026 2.225
13.710 8.215
17
127
0.041 2.042
Chanel n°5
savon
toilettes
grand-mère
chimique
fort
vieux
Intern%
7.752
3.101
6.202
3.876
13.953
3.876
glob% Intern freq Glob freq p.value v.test
1.423
10
22
0.000 4.515
0.712
4
11
0.019 2.341
2.523
8
39
0.025 2.236
1.164
5
18
0.026 2.220
8.215
18
127
0.029 2.183
1.229
5
19
0.033 2.126
Représentation des parfums
SortingTask factor map
1.5
Angel
0.5
Cinéma
Shalimar
0.0
L instant
-0.5
Coco Mademoiselle
Pure Poison
Aromatics Elixir
J adore (EP) Pleasures
J adore (ET)
Chanel 5
-1.0
Dim 2 (13.64%)
1.0
Lolita Lempicka
-1.0
-0.5
0.0
0.5
1.0
1.5
Dim 1 (17.8%)
Plan défini par les dimensions 1 et 2 de l’ACM
2.0
Représentation des mots
sucré
épicé
sucre candy
chocolat
jeune
vieux
fort
aggressif
entêtant
floral
exotique
léger
Plan défini par les dimensions 1 et 2 de l’ACM
Représentation des parfums avec ellipse de
confiance
Dim 2 (13.64%)
-1.5 -1.0 -0.5 0.0 0.5 1.0 1.5
2.0
Confidence ellipses for sorting task
Angel
Lolita Lempicka
Cinéma
L instant
Shalimar
Coco Mademoiselle
Pure Poison
adore(ET)
(EP)
J JPleasures
adore
Aromatics Elixir
Chanel 5
-1
0
1
Dim 1 (17.8%)
2
Plan défini par les dimensions 1 et 2 de l’ACM
1.0
Représentation des consommateurs
31
40
0.2
Dim 2 (13.64%)
0.4
0.6
0.8
Shalimar
Aromatics Elixir
Chanel n°5
Coco Mademoiselle
J'adore (EP)
J'adore (ET)
L'instant
Pleasures
Pure Poison
Angel
Cinéma
Lolita Lempicka
93
juge 18
2
2
3
3
1
3
2
3
1
3
3
1
juge 31
1
2
4
1
1
1
1
1
2
5
3
3
0.0
18
0.0
0.2
0.4
0.6
0.8
1.0
Dim 1 (17.8%)
Plan défini par les dimensions 1 et 2 de l’ACM
juge 40
4
5
5
2
1
1
2
1
2
6
3
3
juge 93
4
3
3
2
1
2
1
1
2
1
2
2
2.0
Représentation des parfums et mots consensuels
1.5
Angel
0.5
Cinéma
boisé
-0.5
0.0
fruité
alcool
L instant
Shalimar
faible
doux fleuri
discret
léger Coco Mademoiselle
frais rose
bébé été
Pure Poison
Pleasures
J
adore
(ET)
J adore (EP)
naturel
muguet
grand-mère
oriental
vieux
Aromatics Elixir
entretien
Chanel 5
-1.0
Dim 2 (13.64%)
1.0
Lolita Lempicka
-1.0
-0.5
0.0
0.5
Dim 1 (17.8%)
1.0
1.5
2.0