Prise en compte des recommandations de l`utilisateur dans

Transcription

Prise en compte des recommandations de l`utilisateur dans
Sujet de thèse
Prise en compte des recommandations de
l’utilisateur dans les services numériques
intelligents
Directeur de thèse : Bruno Zanuttini
GREYC, UMR 6072 UNICAEN/CNRS/ENSICAEN, équipe MAD
Démarrage : octobre 2015
Mots-clefs : Services numériques intelligents, robotique de service, intelligence artificielle,
interaction homme-robot
L’objectif général de cette thèse est de proposer de nouvelles techniques d’intelligence artificielle (modèles et algorithmes) pour l’interaction entre l’être humain et des agents artificiels
(robots de service, robots compagnons, services numériques intelligents. . .). Les techniques proposées devront permettre à un utilisateur d’un tel système de fournir des recommandations, ou
encore d’indiquer des préférences, qui seront prises en compte par le système dans son processus
de décision automatique.
Applications visées
Les applications types visées par ce projet sont de plusieurs ordres.
Calcul d’itinéraires Des sites internets tels que ceux de Michelin 1 , Mappy 2 , GoogleMaps 3 ,
permettent de calculer des itinéraires optimaux entre deux localisations, selon certains critères.
Les travaux menés dans ce projet pourraient permettre à un utilisateur d’un tel système, par
exemple, de demander une feuille de route pour aller de Caen à Dijon sans passer par la région
parisienne, même si, du point de vue du système, le meilleur chemin y passe.
De façon plus subtile, l’utilisateur pourrait demander à longer la Loire le plus longtemps
possible. Dans ce cas, non seulement l’itinéraire à calculer est très loin de l’optimal, mais les
préférences sont de plus spécifiées de façon floue. On peut également envisager un mode d’interaction encore plus intuitif, dans lequel l’utilisateur dessine grossièrement une portion du chemin
qu’il souhaite suivre sur une carte interactive, et le système intègre cette recommandation dans
les contraintes à respecter.
1. http://www.viamichelin.fr/web/Itineraires
2. http://fr.mappy.com/itineraire
3. https://www.google.fr/maps/
1
Application aux parcours touristiques De plus en plus d’applications pour terminaux
mobiles permettent aux visiteurs d’une ville ou d’une région d’obtenir des informations et des
parcours personnalisés. Par exemple, à Caen, l’application iStoryPath 4 est développée par la
société SoyHuce, et labellisée par le Ministère de la Culture et du Patrimoine ainsi que par le
pôle de compétitivité « Transactions Électroniques Sécurisées ».
De telles applications pourraient être très largement enrichies, si elles donnaient à l’utilisateur la possibilité, à nouveau, de spécifier des préférences ou des recommandations sur les
informations et les parcours. À titre d’exemple, un utilisateur pourrait spécifier sa préférence
pour l’Histoire, ou pour l’architecture. Il pourrait également fournir des recommandations plus
ponctuelles, comme celle de proposer un parcours de visite se terminant au plus à 17 h.
Robots de services Les robots, bientôt omniprésents dans notre environnement, posent des
questions d’« acceptabilité sociale » par le grand public. Une interaction naturelle avec eux, et
la possibilité d’influer sur leur processus de décision, peuvent renforcer leur acceptation par les
utilisateurs.
Citons l’exemple du projet Européen COACHES, porté par l’équipe « Modèles, Agents,
Décision » (MAD) du GREYC, équipe dans laquelle cette thèse prendra place. Ce projet prévoit,
en partenariat avec l’agglomération de Caen la Mer, l’expérimentation de robots de service à
la personne dans le centre commercial « Les Rives de L’Orne ». Parmi les missions qui leur
seront confiées, ils participeront à la surveillance, avec pour objectif, par exemple, de repérer
une personne ayant eu un malaise et de prévenir les secours. Une manière intéressante d’influer
sur les processus de décision sous-jacents, pour un autre usager, consisterait à recommander une
vigilance accrue à certains moments ; par exemple, lors d’une épidémie sévère.
On notera la différence avec une approche qui consisterait, pour les robots, à acquérir en
continu des informations (dans ce cas, sur les épidémies) de façon automatique, et à déduire que
sa vigilance doit être accrue. Les approches seront bien évidemment complémentaires, mais celle
que nous proposons est centrée sur l’interaction entre les utilisateurs et les agents artificiels.
Autres exemples De nombreuses autres applications des travaux de cette thèse peuvent être
envisagées. Par exemple, le pilote d’un avion pourrait faire part à son pilote automatique d’informations qu’il ne peut pas obtenir (par exemple, qu’il y a une tempête à plusieurs kilomètres,
alors que les capteurs de l’avion ne peuvent pas la détecter). Dans le cadre général des services
numériques intelligents, recommandation et spécification de préferences peuvent permettre d’influer sur les décisions du système en lui fournissant des informations qu’il ne peut pas obtenir
par ailleurs, et d’obtenir des services ainsi contextualisés et personnalisés.
Travail de recherche
La thèse de Nicolas Côté, encadrée par Maroua Bouzid et Abdel-Illah Mouaddib et soutenue
en décembre 2013 dans l’équipe MAD [Côté, 2013], a défriché la question de la recommandation, lorsque le modèle sous-jacent est un processus de décision markovien. De tels processus
consistuent une modélisation générique, classique en intelligence artificielle, de situations dans
lesquels un système
— doit prendre des décisions : prévenir les secours, choisir l’étape suivante sur un itinéraire,
afficher une information touristique, etc.,
— dans un environnement incertain : incertitude sur le temps d’arrivée des secours, sur le
trafic routier, sur l’intérêt de l’utilisateur pour une information, etc.,
4. http://istorypath.soyhuce.fr/
2
— en prenant en compte la suite du processus (ce qui pourra se passer après exécution de
la décision prise).
Ces processus constituent donc une abstraction formelle, et fournissent des outils, pour les
applications réelles telles que celles décrites ci-dessus. De nombreux algorithmes sont développés
pour ces problèmes dans la littérature scientifique [Puterman, 1994], et mis en œuvre dans des
systèmes réels allant des systèmes de trading automatique pour la bourse, aux robots explorant
le sol d’autres astres.
Ces modèles et algorithmes nécessitent toutefois la spécification a priori d’une notion de
but, ou de récompense, qui détermine les objectifs que le système cherchera à optimiser. On
peut évidemment permettre à l’utilisateur de formuler certains types de recommandations ou
de préférences pour influencer ce processus, et les intégrer dans ces buts et récompenses avant
de calculer les décisions, mais cette approche a deux limites :
— la nécessité de fixer a priori quel type de recommandations peuvent être prises en compte,
et leur conversion en une fonction de récompense ; on retombe donc sur un ensemble fixé
et limité d’options, comme dans les applications existantes de calcul d’itinéraires,
— la nécessité de recalculer entièrement les décisions à chaque fois qu’une nouvelle recommandation est donnée, avec un impact négatif évident sur la réactivité du système.
Objectifs Cette thèse se portera sur ces deux limitations, en proposant des modèles et techniques permettant d’intégrer des recommandations et des préférences à des décisions déjà calculées, sur la base d’un modèle de la situation (buts et récompenses) donné a priori. On pourra
se placer dans un cadre formel dans lequel le système a un modèle du processus de décision,
et l’utilisateur en a un autre. Dans l’exemple donné ci-dessus pour la robotique de service, le
robot utilise un modèle a priori du processus dans lequel il n’y a pas d’épidémie sévère (ou, plus
exactement, la probabilité qu’il y en ait une est faible), et l’utilisateur a, lui, un modèle dans
lequel il y a effectivement une épidémie.
Les questions scientifiques qui en découlent sont en particulier les suivantes :
— (interaction) dans quel langage d’interaction permettre à l’utilisateur de communiquer
au système les informations suffisantes pour qu’il s’adapte à son modèle ?
— (confiance) à quel point l’agent doit-il « suivre » les recommandations, c’est-à-dire, dans
quelle mesure doit-on supposer qu’un utilisateur a un modèle correct du processus ? Que
faire, par exemple, si la décision optimale d’un robot auquel on a recommandé une vigilance accrue implique qu’il abandonne toutes ses autre tâches ?
— (information) dans quel mesure doit-on informer l’utilisateur du modèle utilisé par le
système, pour que l’utilisateur puisse l’influer de façon éclairée ?
— (intégration) comment intégrer les recommandations de façon efficace (réactive) dans la
prise de décision ?
Approche et verrous scientifiques Les questions listées ci-dessus peuvent être abordées
sous différents angles. D’une part, on peut utiliser des techniques de l’apprentissage artificiel [Cornuéjols and Miclet, 2011] pour en formaliser certaines, et en particulier les questions
de l’interaction et de l’information. Notamment, traiter la question de l’information comme un
problème d’apprentissage fournira un point de vue novateur sur la question de l’interaction
humain-agent artificiel, en plaçant l’humain comme « apprenant ».
D’autre part, on peut utiliser des langages et des outils de logique, épistémiques et dynamiques en particulier [van Ditmarsch et al., 2007], pour modéliser les connaissances que chacun,
système et utilisateur, a sur les connaissances de l’autre à un instant donné. L’interaction de
3
connaissances logiques et de processus de décision est également, en soi, un champ de recherche
largement inexploré et particulièrement prometteur.
Le déroulement de la thèse peut être envisagé comme suit :
— l’étude, en premier lieu, du contexte restreint, et déjà balisé [Côté, 2013], de l’intégration
de recommandations dans le calcul des décisions,
— la définition de modèles formels et la mise au point d’algorithmes génériques pour ce
problème,
— puis, la généralisation de ce cadre à des contextes d’interaction plus génériques,
— enfin, l’étude de modèles de décision séquentielle plus complexes, incluant l’observabilité
partielle et des aspects multi-agents.
On veillera à s’inspirer des applications réelles mentionnées ci-dessus. On pourra envisager des
collaborations avec des partenaires institutionnels ou industriels, en fonction des résultats obtenus.
Environnement de la thèse
La thèse se déroulera dans l’équipe « Modèles, Agents, Décision » (MAD) du laboratoire
GREYC (UNICAEN/CNRS/ENSICAEN, UMR 6072). L’encadrement sera assuré par Bruno
Zanuttini, mais la plupart des thèmes de l’équipe sont concernés, la décision et l’interaction
humain-agent étant au cœur de ses problématiques. L’équipe est en particulier reconnue pour
ses travaux autour des processus de décision markovien et de leur algorithmique.
Des travaux ont été menés dans l’équipe sur des sujets connexes à cette thèse. Outre les
travaux précurseurs menés dans la thèse de Nicolas Côté [Côté et al., 2013, Côté, 2013], on
peut citer [Lang and Zanuttini, 2013] pour l’intégration de connaissances logiques dans la prise
de décision, [Koriche and Zanuttini, 2010, Weng and Zanuttini, 2013] pour l’apprentissage de
préférences en interaction avec l’utilisateur, ainsi que [Karami et al., 2010] pour des travaux sur
l’interaction homme-robot.
La thèse bénéficiera en outre des projets menés dans l’équipe en collaboration avec d’autres
partenaires. Le projet européen COACHES, évoqué plus haut, est porté par Abdel-Illah Mouaddib, en collaboration avec des universités belge, turque et italienne, ainsi qu’une entreprise italienne. Le projet ETHICAA, financé par l’ANR et porté par Grégory Bonnet, en collaboration
avec plusieurs laboratoires français, d’informatique et de philosophie, et avec une PME, traite
des questions d’éthique pour les agents autonome, une question cruciale pour les questions envisagées dans cette thèse. Enfin, Bruno Zanuttini a soumis à l’appel 2015 de l’ANR un projet
concernant l’interaction dans la décision multi-agents, avec plusieurs autres laboratoires d’informatique (projet AEIOU, sur lequel le pôle « Transactions Électroniques Sécurisées » a émis un
avis favorable).
4
Références
[Cornuéjols and Miclet, 2011] Cornuéjols, A. and Miclet, L. (2011). Apprentissage artificiel :
concepts et algorithmes. Editions Eyrolles.
[Côté, 2013] Côté, N. (2013). Raisonnement et décision mixte pour l’autonomie ajustable et
le partage d’autorité. PhD thesis, Université de Caen Basse-Normandie. https://tel.
archives-ouvertes.fr/tel-01082677/.
[Côté et al., 2013] Côté, N., Bouzid, M., and Mouaddib, A.-I. (2013). Integrating Human Recommendations in the Decision Process of Autonomous Agents. In IEEE/WIC/ACM International Conferences on Web Intelligence and Intelligent Agent Technology, page 6 p., atlanta,
United States. https://hal.archives-ouvertes.fr/GREYC-MAD/hal-00953732v1.
[Karami et al., 2010] Karami, A.-B., Jeanpierre, L., and Mouaddib, A.-I. (2010). Humanrobot collaboration for a shared mission. In Proc. of the 5th ACM/IEEE international
conference on Human-robot interaction (HRI 10), pages p155–156, Osaka, Japan. https:
//hal.archives-ouvertes.fr/GREYC-MAD/hal-00969223.
[Koriche and Zanuttini, 2010] Koriche, F. and Zanuttini, B. (2010). Learning Conditional Preference Networks. Artificial Intelligence, 174(11) :685–703. https://hal.archives-ouvertes.
fr/GREYC-MAD/lirmm-00485498v1.
[Lang and Zanuttini, 2013] Lang, J. and Zanuttini, B. (2013). Knowledge-Based Programs as
Plans : Succinctness and the Complexity of Plan Existence. In Proc. 14th conference on
Theoretical Aspects of Rationality and Knowledge (TARK 2013), pages –, France. Schipper,
Burkhard C. https://hal.archives-ouvertes.fr/GREYC-MAD/hal-00924121v1.
[Puterman, 1994] Puterman, M. L. (1994). Markov Decision Processes — Discrete Stochastic
Dynamic Programming. Wiley Series in Probability and Statistics. Wiley.
[van Ditmarsch et al., 2007] van Ditmarsch, H., Van Der Hoek, W., and Kooi, B. (2007). Dynamic epistemic logic, volume 337. Springer Verlag.
[Weng and Zanuttini, 2013] Weng, P. and Zanuttini, B. (2013). Interactive Value Iteration for Markov Decision Processes with Unknown Rewards. In Proc. 23th International Joint Conference Artificial Intelligence (IJCAI2013), pages –, China. https://hal.
archives-ouvertes.fr/GREYC-MAD/hal-00942290v1.
5