Prise en compte des recommandations de l`utilisateur dans
Transcription
Prise en compte des recommandations de l`utilisateur dans
Sujet de thèse Prise en compte des recommandations de l’utilisateur dans les services numériques intelligents Directeur de thèse : Bruno Zanuttini GREYC, UMR 6072 UNICAEN/CNRS/ENSICAEN, équipe MAD Démarrage : octobre 2015 Mots-clefs : Services numériques intelligents, robotique de service, intelligence artificielle, interaction homme-robot L’objectif général de cette thèse est de proposer de nouvelles techniques d’intelligence artificielle (modèles et algorithmes) pour l’interaction entre l’être humain et des agents artificiels (robots de service, robots compagnons, services numériques intelligents. . .). Les techniques proposées devront permettre à un utilisateur d’un tel système de fournir des recommandations, ou encore d’indiquer des préférences, qui seront prises en compte par le système dans son processus de décision automatique. Applications visées Les applications types visées par ce projet sont de plusieurs ordres. Calcul d’itinéraires Des sites internets tels que ceux de Michelin 1 , Mappy 2 , GoogleMaps 3 , permettent de calculer des itinéraires optimaux entre deux localisations, selon certains critères. Les travaux menés dans ce projet pourraient permettre à un utilisateur d’un tel système, par exemple, de demander une feuille de route pour aller de Caen à Dijon sans passer par la région parisienne, même si, du point de vue du système, le meilleur chemin y passe. De façon plus subtile, l’utilisateur pourrait demander à longer la Loire le plus longtemps possible. Dans ce cas, non seulement l’itinéraire à calculer est très loin de l’optimal, mais les préférences sont de plus spécifiées de façon floue. On peut également envisager un mode d’interaction encore plus intuitif, dans lequel l’utilisateur dessine grossièrement une portion du chemin qu’il souhaite suivre sur une carte interactive, et le système intègre cette recommandation dans les contraintes à respecter. 1. http://www.viamichelin.fr/web/Itineraires 2. http://fr.mappy.com/itineraire 3. https://www.google.fr/maps/ 1 Application aux parcours touristiques De plus en plus d’applications pour terminaux mobiles permettent aux visiteurs d’une ville ou d’une région d’obtenir des informations et des parcours personnalisés. Par exemple, à Caen, l’application iStoryPath 4 est développée par la société SoyHuce, et labellisée par le Ministère de la Culture et du Patrimoine ainsi que par le pôle de compétitivité « Transactions Électroniques Sécurisées ». De telles applications pourraient être très largement enrichies, si elles donnaient à l’utilisateur la possibilité, à nouveau, de spécifier des préférences ou des recommandations sur les informations et les parcours. À titre d’exemple, un utilisateur pourrait spécifier sa préférence pour l’Histoire, ou pour l’architecture. Il pourrait également fournir des recommandations plus ponctuelles, comme celle de proposer un parcours de visite se terminant au plus à 17 h. Robots de services Les robots, bientôt omniprésents dans notre environnement, posent des questions d’« acceptabilité sociale » par le grand public. Une interaction naturelle avec eux, et la possibilité d’influer sur leur processus de décision, peuvent renforcer leur acceptation par les utilisateurs. Citons l’exemple du projet Européen COACHES, porté par l’équipe « Modèles, Agents, Décision » (MAD) du GREYC, équipe dans laquelle cette thèse prendra place. Ce projet prévoit, en partenariat avec l’agglomération de Caen la Mer, l’expérimentation de robots de service à la personne dans le centre commercial « Les Rives de L’Orne ». Parmi les missions qui leur seront confiées, ils participeront à la surveillance, avec pour objectif, par exemple, de repérer une personne ayant eu un malaise et de prévenir les secours. Une manière intéressante d’influer sur les processus de décision sous-jacents, pour un autre usager, consisterait à recommander une vigilance accrue à certains moments ; par exemple, lors d’une épidémie sévère. On notera la différence avec une approche qui consisterait, pour les robots, à acquérir en continu des informations (dans ce cas, sur les épidémies) de façon automatique, et à déduire que sa vigilance doit être accrue. Les approches seront bien évidemment complémentaires, mais celle que nous proposons est centrée sur l’interaction entre les utilisateurs et les agents artificiels. Autres exemples De nombreuses autres applications des travaux de cette thèse peuvent être envisagées. Par exemple, le pilote d’un avion pourrait faire part à son pilote automatique d’informations qu’il ne peut pas obtenir (par exemple, qu’il y a une tempête à plusieurs kilomètres, alors que les capteurs de l’avion ne peuvent pas la détecter). Dans le cadre général des services numériques intelligents, recommandation et spécification de préferences peuvent permettre d’influer sur les décisions du système en lui fournissant des informations qu’il ne peut pas obtenir par ailleurs, et d’obtenir des services ainsi contextualisés et personnalisés. Travail de recherche La thèse de Nicolas Côté, encadrée par Maroua Bouzid et Abdel-Illah Mouaddib et soutenue en décembre 2013 dans l’équipe MAD [Côté, 2013], a défriché la question de la recommandation, lorsque le modèle sous-jacent est un processus de décision markovien. De tels processus consistuent une modélisation générique, classique en intelligence artificielle, de situations dans lesquels un système — doit prendre des décisions : prévenir les secours, choisir l’étape suivante sur un itinéraire, afficher une information touristique, etc., — dans un environnement incertain : incertitude sur le temps d’arrivée des secours, sur le trafic routier, sur l’intérêt de l’utilisateur pour une information, etc., 4. http://istorypath.soyhuce.fr/ 2 — en prenant en compte la suite du processus (ce qui pourra se passer après exécution de la décision prise). Ces processus constituent donc une abstraction formelle, et fournissent des outils, pour les applications réelles telles que celles décrites ci-dessus. De nombreux algorithmes sont développés pour ces problèmes dans la littérature scientifique [Puterman, 1994], et mis en œuvre dans des systèmes réels allant des systèmes de trading automatique pour la bourse, aux robots explorant le sol d’autres astres. Ces modèles et algorithmes nécessitent toutefois la spécification a priori d’une notion de but, ou de récompense, qui détermine les objectifs que le système cherchera à optimiser. On peut évidemment permettre à l’utilisateur de formuler certains types de recommandations ou de préférences pour influencer ce processus, et les intégrer dans ces buts et récompenses avant de calculer les décisions, mais cette approche a deux limites : — la nécessité de fixer a priori quel type de recommandations peuvent être prises en compte, et leur conversion en une fonction de récompense ; on retombe donc sur un ensemble fixé et limité d’options, comme dans les applications existantes de calcul d’itinéraires, — la nécessité de recalculer entièrement les décisions à chaque fois qu’une nouvelle recommandation est donnée, avec un impact négatif évident sur la réactivité du système. Objectifs Cette thèse se portera sur ces deux limitations, en proposant des modèles et techniques permettant d’intégrer des recommandations et des préférences à des décisions déjà calculées, sur la base d’un modèle de la situation (buts et récompenses) donné a priori. On pourra se placer dans un cadre formel dans lequel le système a un modèle du processus de décision, et l’utilisateur en a un autre. Dans l’exemple donné ci-dessus pour la robotique de service, le robot utilise un modèle a priori du processus dans lequel il n’y a pas d’épidémie sévère (ou, plus exactement, la probabilité qu’il y en ait une est faible), et l’utilisateur a, lui, un modèle dans lequel il y a effectivement une épidémie. Les questions scientifiques qui en découlent sont en particulier les suivantes : — (interaction) dans quel langage d’interaction permettre à l’utilisateur de communiquer au système les informations suffisantes pour qu’il s’adapte à son modèle ? — (confiance) à quel point l’agent doit-il « suivre » les recommandations, c’est-à-dire, dans quelle mesure doit-on supposer qu’un utilisateur a un modèle correct du processus ? Que faire, par exemple, si la décision optimale d’un robot auquel on a recommandé une vigilance accrue implique qu’il abandonne toutes ses autre tâches ? — (information) dans quel mesure doit-on informer l’utilisateur du modèle utilisé par le système, pour que l’utilisateur puisse l’influer de façon éclairée ? — (intégration) comment intégrer les recommandations de façon efficace (réactive) dans la prise de décision ? Approche et verrous scientifiques Les questions listées ci-dessus peuvent être abordées sous différents angles. D’une part, on peut utiliser des techniques de l’apprentissage artificiel [Cornuéjols and Miclet, 2011] pour en formaliser certaines, et en particulier les questions de l’interaction et de l’information. Notamment, traiter la question de l’information comme un problème d’apprentissage fournira un point de vue novateur sur la question de l’interaction humain-agent artificiel, en plaçant l’humain comme « apprenant ». D’autre part, on peut utiliser des langages et des outils de logique, épistémiques et dynamiques en particulier [van Ditmarsch et al., 2007], pour modéliser les connaissances que chacun, système et utilisateur, a sur les connaissances de l’autre à un instant donné. L’interaction de 3 connaissances logiques et de processus de décision est également, en soi, un champ de recherche largement inexploré et particulièrement prometteur. Le déroulement de la thèse peut être envisagé comme suit : — l’étude, en premier lieu, du contexte restreint, et déjà balisé [Côté, 2013], de l’intégration de recommandations dans le calcul des décisions, — la définition de modèles formels et la mise au point d’algorithmes génériques pour ce problème, — puis, la généralisation de ce cadre à des contextes d’interaction plus génériques, — enfin, l’étude de modèles de décision séquentielle plus complexes, incluant l’observabilité partielle et des aspects multi-agents. On veillera à s’inspirer des applications réelles mentionnées ci-dessus. On pourra envisager des collaborations avec des partenaires institutionnels ou industriels, en fonction des résultats obtenus. Environnement de la thèse La thèse se déroulera dans l’équipe « Modèles, Agents, Décision » (MAD) du laboratoire GREYC (UNICAEN/CNRS/ENSICAEN, UMR 6072). L’encadrement sera assuré par Bruno Zanuttini, mais la plupart des thèmes de l’équipe sont concernés, la décision et l’interaction humain-agent étant au cœur de ses problématiques. L’équipe est en particulier reconnue pour ses travaux autour des processus de décision markovien et de leur algorithmique. Des travaux ont été menés dans l’équipe sur des sujets connexes à cette thèse. Outre les travaux précurseurs menés dans la thèse de Nicolas Côté [Côté et al., 2013, Côté, 2013], on peut citer [Lang and Zanuttini, 2013] pour l’intégration de connaissances logiques dans la prise de décision, [Koriche and Zanuttini, 2010, Weng and Zanuttini, 2013] pour l’apprentissage de préférences en interaction avec l’utilisateur, ainsi que [Karami et al., 2010] pour des travaux sur l’interaction homme-robot. La thèse bénéficiera en outre des projets menés dans l’équipe en collaboration avec d’autres partenaires. Le projet européen COACHES, évoqué plus haut, est porté par Abdel-Illah Mouaddib, en collaboration avec des universités belge, turque et italienne, ainsi qu’une entreprise italienne. Le projet ETHICAA, financé par l’ANR et porté par Grégory Bonnet, en collaboration avec plusieurs laboratoires français, d’informatique et de philosophie, et avec une PME, traite des questions d’éthique pour les agents autonome, une question cruciale pour les questions envisagées dans cette thèse. Enfin, Bruno Zanuttini a soumis à l’appel 2015 de l’ANR un projet concernant l’interaction dans la décision multi-agents, avec plusieurs autres laboratoires d’informatique (projet AEIOU, sur lequel le pôle « Transactions Électroniques Sécurisées » a émis un avis favorable). 4 Références [Cornuéjols and Miclet, 2011] Cornuéjols, A. and Miclet, L. (2011). Apprentissage artificiel : concepts et algorithmes. Editions Eyrolles. [Côté, 2013] Côté, N. (2013). Raisonnement et décision mixte pour l’autonomie ajustable et le partage d’autorité. PhD thesis, Université de Caen Basse-Normandie. https://tel. archives-ouvertes.fr/tel-01082677/. [Côté et al., 2013] Côté, N., Bouzid, M., and Mouaddib, A.-I. (2013). Integrating Human Recommendations in the Decision Process of Autonomous Agents. In IEEE/WIC/ACM International Conferences on Web Intelligence and Intelligent Agent Technology, page 6 p., atlanta, United States. https://hal.archives-ouvertes.fr/GREYC-MAD/hal-00953732v1. [Karami et al., 2010] Karami, A.-B., Jeanpierre, L., and Mouaddib, A.-I. (2010). Humanrobot collaboration for a shared mission. In Proc. of the 5th ACM/IEEE international conference on Human-robot interaction (HRI 10), pages p155–156, Osaka, Japan. https: //hal.archives-ouvertes.fr/GREYC-MAD/hal-00969223. [Koriche and Zanuttini, 2010] Koriche, F. and Zanuttini, B. (2010). Learning Conditional Preference Networks. Artificial Intelligence, 174(11) :685–703. https://hal.archives-ouvertes. fr/GREYC-MAD/lirmm-00485498v1. [Lang and Zanuttini, 2013] Lang, J. and Zanuttini, B. (2013). Knowledge-Based Programs as Plans : Succinctness and the Complexity of Plan Existence. In Proc. 14th conference on Theoretical Aspects of Rationality and Knowledge (TARK 2013), pages –, France. Schipper, Burkhard C. https://hal.archives-ouvertes.fr/GREYC-MAD/hal-00924121v1. [Puterman, 1994] Puterman, M. L. (1994). Markov Decision Processes — Discrete Stochastic Dynamic Programming. Wiley Series in Probability and Statistics. Wiley. [van Ditmarsch et al., 2007] van Ditmarsch, H., Van Der Hoek, W., and Kooi, B. (2007). Dynamic epistemic logic, volume 337. Springer Verlag. [Weng and Zanuttini, 2013] Weng, P. and Zanuttini, B. (2013). Interactive Value Iteration for Markov Decision Processes with Unknown Rewards. In Proc. 23th International Joint Conference Artificial Intelligence (IJCAI2013), pages –, China. https://hal. archives-ouvertes.fr/GREYC-MAD/hal-00942290v1. 5