Concevoir un système de recommandation de vins - KIWI

Transcription

Concevoir un système de recommandation de vins - KIWI
Sujet 3
Concevoir un système de recommandation
de vins : des données à la modélisation et à
l’implantation
Proposé par : Armelle Brun
Informations générales
Encadrants
Adresse
Téléphone
Email
Bureau
Page Web
Armelle Brun
LORIA, Campus Scientifique - BP 239, 54506 Vandœuvre-lès-Nancy
03 54 95 84 78
[email protected]
C 034
http ://members.loria.fr/ABrun
Motivations
Un système de recommandation vise à proposer à des utilisateurs d’un système, des ressources correspondant à leurs préférences. Pour cela, le système de recommandation doit non seulement connaître ses utilisateurs : leurs habitudes, goûts, attentes, etc. mais également connaître les ressources qu’il peut recommander
(ce qui caractérise ces ressources, les différencie des autres, quels utilisateurs les ont aimées ou non, etc.).
Pour un utilisateur donné, l’objectif d’un système de recommandation est donc d’identifier quelle(s) ressources
correspondent au mieux à cet utilisateur.
Les systèmes de recommandation sont étudiés depuis plus de 20 ans maintenant, et de nombreuses approches (filtrage collaboratif, approches par contenu, approches hybrides) et méthodes (fouille de données, apprentissage statistique) ont été étudiées et proposées (Adomavicius et al., 2005). Aucune méthode n’a prouvé
sa supériorité sur les autres, chacune d’elles étant plus adaptée à certains contextes : type de données, type
d’utilisateurs, contexte de recommandation, objectif de recommandation, etc.
Le contexte du sujet proposé ici est la recommandation de vins. La recommandation de vins a des spécificités
qu’on retrouve rarement dans d’autres contextes : apprécier un vin dépend des vins déjà bus par la personne (un
palais s’éduque), recommander un vin dépend du contexte dans lequel la demande de recommandation est faite
et le contexte dans lequel le vin sera consommé (contrairement à d’autres domaines, où le contexte de consommation n’influence pas l’appréciation de l’objet recommandé), recommander un vin nécessite de bien identifier
les goûts (exprimés et constatés) et attentes du client (qui sont très subjectives), etc. Toutes ces caractéristiques
soulèvent plusieurs questions et défis relatifs aux données à exploiter (sources « officielles », traces de consommations ?), à l’approche de recommandation la plus adéquate, à l’algorithme de recommandation à concevoir,
etc.
Sujet
Les systèmes de recommandation dédiés à la recommandation de vins ont été rarement étudiés dans la littérature (Javanmardian, 2005 ; Mahapatra et al., 2011) et les algorithmes proposés sont relativement peu évolués.
Ceci est du non seulement à la nature des données qui sont et peuvent être collectées dans ce contexte (plus
subjectives que dans des contextes de recommandation plus standards : recommandation de livres, films, etc.),
probablement moins nombreuses, plus bruitées, mais surtout très dépendantes du contexte, mais également à
leur variété (préférences, traces d’achat, traces d’interaction, etc.).
L’objectif de ce sujet est de concevoir un sommelier virtuel : un système de recommandation qui, sachant les
goûts d’un client, ses attentes au moment de la demande de recommandation, le contexte de consommation, les
vins qu’il a déjà bus (avec les appréciations liées), les vins qu’il a déjà achetés, etc. recommande un/des vins qui
lui plairont, tel que le ferait un sommelier humain. Les points-clés relatifs à ce sujet sont multiples :
— identifier les données collectées et collectables : données à propos des clients/utilisateurs, à propos des
vins et à propos des sommeliers. Cette étape se fera en lien avec un site de vente en ligne de vins existant.
— étudier et comprendre le comportement d’un sommelier (sachant que chaque sommelier est unique) :
quelles informations il utilise, quelle connaissance, etc. ? notamment dans le cadre d’une interaction entre
sommelier et client (quelles questions le sommelier pose). Une discussion avec des sommeliers est envisageable.
7
— modéliser le comportement d’un sommelier en exploitant les informations et connaissances listées cidessus.
— chaque sommelier étant différent, étudier les différences et les points communs entre sommeliers de
façon à envisager de concevoir un méta-sommelier, agrégeant les caractéristiques de chacun ou de façon
à pouvoir identifier quel sommelier est plus adéquat à un client donné.
Cadre du travail
Le stage se déroulera en trois étapes principales, et comprendra à la fois une dimension conceptuelle et une
dimension réalisation.
1. État de l’art : Dans un premier temps, l’étudiant devra se familiariser avec les systèmes de recommandation (approches par contenu, filtrage collaboratif, systèmes de recommandation conversationnels), identifier les travaux déjà menés dans le contexte de la recommandation de vin, les approches proposées dans
ce cadre et se renseigner sur les systèmes de recommandation commerciaux existants. Une étude critique
devra être réalisée.
2. Proposition d’un modèle : Dans un second temps, après avoir identifié les différentes données collectables,
un modèle de recommandation de vin devra être proposé.
3. Implantation : Enfin le modèle conçu devra être implanté, soit en Java soit en Matlab pour être validés
sur des données réelles.
Des compétences en modélisation, en apprentissage automatique, en probabilités et statistiques et en programmation sont fortement souhaitées. Le sujet se déroule dans le cadre d’une collaboration débutante entre
une startup de vente de vin en ligne et l’équipe KIWI du LORIA. La personne aura donc également interagir
avec les représentants de la société, notamment pour connaître de façon plus précise leurs attentes, et avec des
sommeliers pour comprendre leur fonctionnement.
Références
[1] G. Adomavicius, R. Sankaranarayanan, S. Sen et A. Tuzhilin. Incorporating contextual information in recommender systems using a multidimensional approach. ACM Transactions on Information Systems, 23(1),
2005.
[2] S. Mahapatra, A. Tareen et Y. Yang. A Cold Start Recommendation System Using Item Correlation and User
Similarity. CSE 635 2011. http://bit.ly/2fD86Mc.
[3] K. Javanmardian. A Wine Pairing Recommendation System. IR. http://bit.ly/2fWA6ve.
8