ecole doctorale des sciences pour l`ingenieur - EDSPI - Clermont-Fd

Transcription

ecole doctorale des sciences pour l`ingenieur - EDSPI - Clermont-Fd
ECOLE DOCTORALE DES SCIENCES POUR L’INGENIEUR Sujet de thèse: Apprentissage distribué, estimation d'incertitude et contrôle prédictif de systèmes sensorimoteurs Directeur de thèse : Youcef Mezouar Co-­‐encadrants : Jean-­‐Charles Quinton Laboratoire ou UR : Institut Pascal Université : IFMA / Université Blaise Pascal Email et téléphone: [email protected] / +33 (0)4 73 40 75 89 Co-­‐directeur de these: / Laboratoire ou UR : Université : Résumé: La ligne de recherche poursuivie par ce contrat doit permettre l'extension de modèles distribués et prédictifs pour la perception et le contrôle sensorimoteur, afin d'y intégrer la notion d'incertitude. Ces modèles adoptent une approche de type bayésienne distribuée [Denève et al., 2007], où une fonction ou transformation complexe est approximée par un ensemble discret mais fortement adaptatif de prédicteurs simples. L'utilisation de mécanismes anticipatifs au coeur des modèles permet d'estimer la variabilité des signaux sensoriels et la précision de la commande motrice en continu durant l'apprentissage. On peut connecter historiquement ce type de modèles aux systèmes de classeurs appliqués aux systèmes décisionnels séquentiels [Sigaud, 2007]. Les versions intégrant l'anticipation ou la gestion de la précision (XCS, ACS) permettent une représentation compacte des états, et sont ainsi adaptés à la modélisation et à l'apprentissage en ligne sur des systèmes complexes. D'autres travaux ont plus récemment avancés dans ce sens, en reprenant les principes généraux des systèmes de classeurs. On peut en particulier citer des architectures neuro-­‐inspirées adaptées à la planification de mouvement, telles que SURE-­‐REACH [Herbort et al., 2010], les réseaux PerAc [Cuperlier et al., 2007], ou encore [Martinet & Arleo, 2010], mais aussi des algorithmes adaptés à l'apprentissage dans un espace continu de forte dimensionnalité, tel que LWPR [Klanke et al., 2008]. D'autres travaux ont tenté d'unifier ces approches en insistant sur les apports de l'anticipation [Quinton & Buisson 2008]. Il s'agit là d'alternatives à l'approximation et l'inversion directe de la matrice jacobienne, ou aux méthodes issues de l'automatique. Elles sont en particulier efficaces si le nombre de dimensions, la redondance, l'incertitude, ou le nombre de singularités sont élevés. Elles sont également pratiques pour des tâches dynamiques où des cycles limites loin de l'équilibre mécanique doivent être recherchés, par exemple pour la marche bipède [Wisse et al. 2005]. Ces approches permettent également l'atteinte d'optima globaux, à l'inverse de méthodes localistes de type champ de force ou remontée de gradient. Néanmoins, l'incertitude et le non-­‐déterminisme observé, pourtant répandus dans les systèmes interactifs, sont rarement gérés dans ce type de modèles distribués, hormis dans des Ecole Doctorale des Sciences Pour l’Ingénieur – 24, avenue des Landais – BP 80026 - 63171 AUBIERE CEDEX
site web : http://edspi.univ-bpclermont.fr/
Directrice : Françoise Paladian
tél. 04.73.40.72.09
E-mail : [email protected]
Secrétariat : Aurélie Brisard
tél. 04.73.40.76.09
E-mail : [email protected]
ECOLE DOCTORALE DES SCIENCES POUR L’INGENIEUR environnements virtuels discrets [Perotto, 2012]. Dans le contexte de la manipulation dextre pour laquelle l'institut a fait l'acquisition de ressources matérielles adéquates, certaines configurations des effecteurs ne permettent pas un contrôle précis, mais peuvent permettre des mouvements d'approche rapides. L'optimalité du comportement doit donc localement et dynamiquement intégrer ces différents critères, dont l'évolution peut être anticipée par les systèmes distribués présentés précédemment. Dans le cadre de la navigation sur robots mobiles, pour laquelle le laboratoire a déjà une expertise certaine, il est possible d'étendre les algorithmes de mémoire visuelle déjà développés [Courbon et al., 2009]. L'enrichissement des amers visuels avec des mesures de stabilité et de prédictibilité devraient les rendre plus discriminants, et ainsi limiter les erreurs d'appariement, et alléger les traitements en réduisant leur nombre. Au niveau de la planification de trajet, il sera également possible d'explorer ou d'éviter les parties de l'environnement les moins maîtrisées. Références : [1] S. Denève, J.-­‐R. Duhamel, and A. Pouget, “Optimal sensorimotor integration in recurrent cortical networks: A neural implementation of kalman filters”, Journal of Neuroscience, vol. 27, no. 21, pp. 5744–5756, 2007. [2] Sigaud, O. (2007). Les systèmes de classeurs : un état de l'art. Revue d'Intelligence Artificielle, Hermès, publisher. Vol 21 Pages 75-­‐106. [3] Herbort, O., Butz, M. V. & Pedersen G. (2010). The SURE REACH Model for Motor Learning and Control of a Redundant Arm: From Modeling Human Behavior to Applications in Robots. In J. Peters and O. Sigaud (Eds.), From motor to interaction learning in robots (pp 85-­‐106). Berlin Heidelberg: Springer. [4] Cuperlier, N., Quoy, M., & Gaussier, P. (2007). Neurobiologically inspired mobile robot navigation and planning. Frontiers in Neurorobotics, 1(3), 1-­‐15. [5] L.-­‐E. Martinet and A. Arleo, “A cortical column model for multiscale spatial planning,” in Simulation of Adaptive Behavior, ser. LNAI 6226. Springer-­‐Verlag, 2010, pp. 347–358. [6] Stefan Klanke, Sethu Vijayakumar and Stefan Schaal, A library for Locally Weighted Projection Regression, Journal of Machine Learning Research (JMLR), vol. 9, pp. 623-­‐626 (2008). [7] Jean-­‐Charles Quinton and Jean-­‐Christophe Buisson. Multilevel anticipative interactions for goal oriented behaviors. In Proceedings of EpiRob'08 -­‐ International Conference on Epigenetic Robotics, pages 103-­‐110. Lund University Cognitive Studies, 2008. [8] Martijn Wisse and Arend L. Schwab and Richard Quint van der Linde and Frans C. T. van der Helm: How to keep from falling forward: elementary swing leg action for passive dynamic walkers. IEEE Transactions on Robotics (2005), 393-­‐401. [9] Perotto, F.S. (2012). Toward Sophisticated Agent-­‐Based Universes : statements to introduce some realistic features into classic AI/RL problems. In: International Conference on Agents and Artificial Intelligence (ICAART). [10] J. Courbon, Y. Mezouar, P. Martinet. Autonomous navigation of vehicles from a visual memory using a generic camera model. Intelligent Transport System (ITS), 10:392-­‐402, 2009. Ecole Doctorale des Sciences Pour l’Ingénieur – 24, avenue des Landais – BP 80026 - 63171 AUBIERE CEDEX
site web : http://edspi.univ-bpclermont.fr/
Directrice : Françoise Paladian
tél. 04.73.40.72.09
E-mail : [email protected]
Secrétariat : Aurélie Brisard
tél. 04.73.40.76.09
E-mail : [email protected]

Documents pareils