La catégorisation - e-agrocampus
Transcription
La catégorisation - e-agrocampus
La catégorisation François Husson Laboratoire de mathématiques appliquées Agrocampus ouest [email protected] Quantitative descriptive Analysis Stone et al. (1974) Le test le plus utilisé pour obtenir une description complète d’un espace produit Jury entraîné Notation sur une liste prédéfinie de descripteurs sensoriels Inconvénients : Coûteux, temps (= argent) Liste limitée de descripteurs sensoriels On peut vouloir prendre en compte les points de vue différents de plusieurs personnes Approches holistiques Du grec öλος (holos), un mot qui signifie global, entier, totalité Produits évalués dans leur globalité Deux principales méthodes de recueil : Catégorisation ou tri libre (sorting task) : a priori plus synthétique Napping : a priori plus riche Analytique X Quantitative Descriptive Analysis Analytique/Spontanée X Profil flash Spontanée X Approches holistiques (catégorisation, napping) La catégorisation Description La catégorisation est un processus cognitif souvent utilisé pour reccueillir les données La première étape consiste à regrouper les objets en fonction de leur ressemblance La seconde étape consiste à verbaliser chacun des groupes d’objets pour les décrire Intérêts Etape préliminaire/complémentaire du profil sensoriel Obtention de descripteurs Etude consommateur Description facile Description rapide Exemple sur des parfums… Les produits Angel Lolita Lempicka Aromatics Chanel n°5 Elixir Pleasures Pure Poison Cinéma Shalimar Coco Mademoiselle L'instant J'adore (ET) J'adore (EP) Les juges Etape 1 Etape 1 Etape 2 « épicé, aldehyde » « gourmand, vanille, boisé » « vanille, orange » « oriental, boisé, Patchouli oil » « floral, vert » Etape 2 « léger, vanille, orange » « fort, boisé » « vieux, WC » Traitement statistique Comment recueillir les données ? (i.e. quel tableau de données construire ?) Quelle méthode statistique utiliser ? gourmand orange boisé vieux épicé vieux vanille fort vanille fort vanille fort gourmand fort floral fort boisé vieux boisé vieux floral orange floral orange … … … … … … … … … … … … … … … … … … … … … … … … Un tableau avec en lignes les parfums, en colonnes les juges, un juge est considéré comme une variable qualitative, les mots qu’il utilise comme des modalités produit Angel Aromatic Elixir Chanel n°5 Cinéma Coco Mademoiselle J'adore (EP) J'adore (ET) L'instant Lolita Lempicka Pleasures Pure Poison Shalimar juge 12 fleuri doux fort homme Gr 4 fleuri artificiel herbe fleuri doux fleuri doux fleuri artificiel herbe fleuri doux fleuri doux fort homme fleuri doux fleuri artificiel herbe juge 13 fruité fort capiteux grand-mère capiteux grand-mère fruité moyen fruité moyen sucré faible sucré faible fruité fort fruité moyen fruité fort acidulé désodorisant fort lavande eau de cologne juge 14 vanillé épicé esprit des îles rude fort toilettes sucré douceur fleuri douceur fleuri douceur fleuri sucré vanillé épicé esprit des îles sucré douceur fleuri renfermé agressif juge 15 à manger sucré le vieux savon doux doux fleuri fleuri le vieux à manger sucré fleuri doux le vieux juge 16 nourriture épice ménager cire connu classique nourriture épice connu classique connu classique connu classique fleuri nourriture épice fleuri fleuri ménager cire Traitement statistique par Analyse des Correspondances Multiples (ACM) Pourquoi ça marche ? vieux fort orange orange 0 0 1 vieux 1 0 0 vieux 1 0 0 fort 0 1 0 fort 0 1 0 fort 0 1 0 fort 0 1 0 fort 0 1 0 vieux 1 0 0 vieux 1 0 0 orange 0 0 1 orange 0 0 1 vieux fort orange orange 0 0 1 vieux 1 0 0 vieux 1 0 0 =2 =0 La distance entre deux produits est nul s’ils sont systématiquement ensemble Deux produits sont d’autant plus proches (resp. éloigné) qu’ils ont été mis ensemble par beaucoup (resp. peu) de consommateurs Plus précisément, la modalité k contribue à cette distance de façon inverement proportionnelle à sa taille (ainsi, un parfum seul dans son groupe est éloigné) Distance entre modalités Deux modalités (ici des mots) sont d’autant plus éloignées qu’elles ont peu d’individus (ici des parfums) en commun. Autrement dit, que le nombre d’individus qui ont pris la modalité k et la modalité k’ est petit Graphiques associés Graphiques des individus et des modalités (i.e. des parfums et des mots) : deux parfums sont d’autant plus proches qu’ils ont été mis ensemble par beaucoup de consommateurs et qu’ils ont été décrits par les mêmes mots deux mots sont d’autant plus proches qu’ils décrivent les mêmes parfums un parfum est proche d’un mot s’il est souvent décrit par ce mot Graphique des variables (i.e. des consommateurs) : deux consommateurs sont d’autant plus proches qu’ils ont fait la même catégorisation (qu’ils ont construit des groupes de parfums similaires) Co-occurences entre parfums J adore (EP) Pleasures Coco Mademoiselle Cinéma Pure Poison L instant Lolita Lempicka Angel Chanel 5 Aromatics Elixir J adore (EP) Pleasures Coco Mademoiselle Cinéma Pure Poison L instant Lolita Lempicka Angel Chanel 5 Aromatics Elixir Shalimar J adore (ET) > res.fast <- fast(perfume) > res.fast$cooccur 56 48 38 24 28 22 18 12 14 7 7 98 38 28 23 29 28 18 11 12 12 6 98 28 22 30 23 18 11 14 11 6 98 30 33 20 21 10 11 12 9 98 28 26 42 18 9 8 10 98 25 18 10 21 12 11 98 22 14 10 13 13 98 36 8 6 9 98 15 27 21 98 51 30 98 42 Analyse textuelle Description des produits Angel et Chanel n°5 par les mots les plus carécatéristiques Angel vanillé épicé sucré fort Intern % glob % Intern freq Glob freq p.value v.test 4.032 0.841 5 13 0.005 2.829 4.839 1.488 6 23 0.015 2.426 12.097 6.598 15 102 0.026 2.225 13.710 8.215 17 127 0.041 2.042 Chanel n°5 savon toilettes grand-mère chimique fort vieux Intern% 7.752 3.101 6.202 3.876 13.953 3.876 glob% Intern freq Glob freq p.value v.test 1.423 10 22 0.000 4.515 0.712 4 11 0.019 2.341 2.523 8 39 0.025 2.236 1.164 5 18 0.026 2.220 8.215 18 127 0.029 2.183 1.229 5 19 0.033 2.126 Représentation des parfums SortingTask factor map 1.5 Angel 0.5 Cinéma Shalimar 0.0 L instant -0.5 Coco Mademoiselle Pure Poison Aromatics Elixir J adore (EP) Pleasures J adore (ET) Chanel 5 -1.0 Dim 2 (13.64%) 1.0 Lolita Lempicka -1.0 -0.5 0.0 0.5 1.0 1.5 Dim 1 (17.8%) Plan défini par les dimensions 1 et 2 de l’ACM 2.0 Représentation des mots sucré épicé sucre candy chocolat jeune vieux fort aggressif entêtant floral exotique léger Plan défini par les dimensions 1 et 2 de l’ACM Représentation des parfums avec ellipse de confiance Dim 2 (13.64%) -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 Confidence ellipses for sorting task Angel Lolita Lempicka Cinéma L instant Shalimar Coco Mademoiselle Pure Poison adore(ET) (EP) J JPleasures adore Aromatics Elixir Chanel 5 -1 0 1 Dim 1 (17.8%) 2 Plan défini par les dimensions 1 et 2 de l’ACM 1.0 Représentation des consommateurs 31 40 0.2 Dim 2 (13.64%) 0.4 0.6 0.8 Shalimar Aromatics Elixir Chanel n°5 Coco Mademoiselle J'adore (EP) J'adore (ET) L'instant Pleasures Pure Poison Angel Cinéma Lolita Lempicka 93 juge 18 2 2 3 3 1 3 2 3 1 3 3 1 juge 31 1 2 4 1 1 1 1 1 2 5 3 3 0.0 18 0.0 0.2 0.4 0.6 0.8 1.0 Dim 1 (17.8%) Plan défini par les dimensions 1 et 2 de l’ACM juge 40 4 5 5 2 1 1 2 1 2 6 3 3 juge 93 4 3 3 2 1 2 1 1 2 1 2 2 2.0 Représentation des parfums et mots consensuels 1.5 Angel 0.5 Cinéma boisé -0.5 0.0 fruité alcool L instant Shalimar faible doux fleuri discret léger Coco Mademoiselle frais rose bébé été Pure Poison Pleasures J adore (ET) J adore (EP) naturel muguet grand-mère oriental vieux Aromatics Elixir entretien Chanel 5 -1.0 Dim 2 (13.64%) 1.0 Lolita Lempicka -1.0 -0.5 0.0 0.5 Dim 1 (17.8%) 1.0 1.5 2.0