Concevoir un système de recommandation de vins - KIWI
Transcription
Concevoir un système de recommandation de vins - KIWI
Sujet 3 Concevoir un système de recommandation de vins : des données à la modélisation et à l’implantation Proposé par : Armelle Brun Informations générales Encadrants Adresse Téléphone Email Bureau Page Web Armelle Brun LORIA, Campus Scientifique - BP 239, 54506 Vandœuvre-lès-Nancy 03 54 95 84 78 [email protected] C 034 http ://members.loria.fr/ABrun Motivations Un système de recommandation vise à proposer à des utilisateurs d’un système, des ressources correspondant à leurs préférences. Pour cela, le système de recommandation doit non seulement connaître ses utilisateurs : leurs habitudes, goûts, attentes, etc. mais également connaître les ressources qu’il peut recommander (ce qui caractérise ces ressources, les différencie des autres, quels utilisateurs les ont aimées ou non, etc.). Pour un utilisateur donné, l’objectif d’un système de recommandation est donc d’identifier quelle(s) ressources correspondent au mieux à cet utilisateur. Les systèmes de recommandation sont étudiés depuis plus de 20 ans maintenant, et de nombreuses approches (filtrage collaboratif, approches par contenu, approches hybrides) et méthodes (fouille de données, apprentissage statistique) ont été étudiées et proposées (Adomavicius et al., 2005). Aucune méthode n’a prouvé sa supériorité sur les autres, chacune d’elles étant plus adaptée à certains contextes : type de données, type d’utilisateurs, contexte de recommandation, objectif de recommandation, etc. Le contexte du sujet proposé ici est la recommandation de vins. La recommandation de vins a des spécificités qu’on retrouve rarement dans d’autres contextes : apprécier un vin dépend des vins déjà bus par la personne (un palais s’éduque), recommander un vin dépend du contexte dans lequel la demande de recommandation est faite et le contexte dans lequel le vin sera consommé (contrairement à d’autres domaines, où le contexte de consommation n’influence pas l’appréciation de l’objet recommandé), recommander un vin nécessite de bien identifier les goûts (exprimés et constatés) et attentes du client (qui sont très subjectives), etc. Toutes ces caractéristiques soulèvent plusieurs questions et défis relatifs aux données à exploiter (sources « officielles », traces de consommations ?), à l’approche de recommandation la plus adéquate, à l’algorithme de recommandation à concevoir, etc. Sujet Les systèmes de recommandation dédiés à la recommandation de vins ont été rarement étudiés dans la littérature (Javanmardian, 2005 ; Mahapatra et al., 2011) et les algorithmes proposés sont relativement peu évolués. Ceci est du non seulement à la nature des données qui sont et peuvent être collectées dans ce contexte (plus subjectives que dans des contextes de recommandation plus standards : recommandation de livres, films, etc.), probablement moins nombreuses, plus bruitées, mais surtout très dépendantes du contexte, mais également à leur variété (préférences, traces d’achat, traces d’interaction, etc.). L’objectif de ce sujet est de concevoir un sommelier virtuel : un système de recommandation qui, sachant les goûts d’un client, ses attentes au moment de la demande de recommandation, le contexte de consommation, les vins qu’il a déjà bus (avec les appréciations liées), les vins qu’il a déjà achetés, etc. recommande un/des vins qui lui plairont, tel que le ferait un sommelier humain. Les points-clés relatifs à ce sujet sont multiples : — identifier les données collectées et collectables : données à propos des clients/utilisateurs, à propos des vins et à propos des sommeliers. Cette étape se fera en lien avec un site de vente en ligne de vins existant. — étudier et comprendre le comportement d’un sommelier (sachant que chaque sommelier est unique) : quelles informations il utilise, quelle connaissance, etc. ? notamment dans le cadre d’une interaction entre sommelier et client (quelles questions le sommelier pose). Une discussion avec des sommeliers est envisageable. 7 — modéliser le comportement d’un sommelier en exploitant les informations et connaissances listées cidessus. — chaque sommelier étant différent, étudier les différences et les points communs entre sommeliers de façon à envisager de concevoir un méta-sommelier, agrégeant les caractéristiques de chacun ou de façon à pouvoir identifier quel sommelier est plus adéquat à un client donné. Cadre du travail Le stage se déroulera en trois étapes principales, et comprendra à la fois une dimension conceptuelle et une dimension réalisation. 1. État de l’art : Dans un premier temps, l’étudiant devra se familiariser avec les systèmes de recommandation (approches par contenu, filtrage collaboratif, systèmes de recommandation conversationnels), identifier les travaux déjà menés dans le contexte de la recommandation de vin, les approches proposées dans ce cadre et se renseigner sur les systèmes de recommandation commerciaux existants. Une étude critique devra être réalisée. 2. Proposition d’un modèle : Dans un second temps, après avoir identifié les différentes données collectables, un modèle de recommandation de vin devra être proposé. 3. Implantation : Enfin le modèle conçu devra être implanté, soit en Java soit en Matlab pour être validés sur des données réelles. Des compétences en modélisation, en apprentissage automatique, en probabilités et statistiques et en programmation sont fortement souhaitées. Le sujet se déroule dans le cadre d’une collaboration débutante entre une startup de vente de vin en ligne et l’équipe KIWI du LORIA. La personne aura donc également interagir avec les représentants de la société, notamment pour connaître de façon plus précise leurs attentes, et avec des sommeliers pour comprendre leur fonctionnement. Références [1] G. Adomavicius, R. Sankaranarayanan, S. Sen et A. Tuzhilin. Incorporating contextual information in recommender systems using a multidimensional approach. ACM Transactions on Information Systems, 23(1), 2005. [2] S. Mahapatra, A. Tareen et Y. Yang. A Cold Start Recommendation System Using Item Correlation and User Similarity. CSE 635 2011. http://bit.ly/2fD86Mc. [3] K. Javanmardian. A Wine Pairing Recommendation System. IR. http://bit.ly/2fWA6ve. 8