Télécharger HDR - UFR STAPS Paris-Sud - Université Paris-Sud

Transcription

Télécharger HDR - UFR STAPS Paris-Sud - Université Paris-Sud
UNIVERSITE PARIS-SUD
ÉCOLE DOCTORALE :
Sciences du Sport, de la Motricité et du Mouvement Humain
HABILITATION A DIRIGER DES RECHERCHES
soutenue le 10/07/2014
par
Isabelle SIEGLER
« Contrôle, couplages information-mouvement et
apprentissage de tâches motrices rythmiques :
de l’enfant à l’adulte, vers le robot »
Composition du jury :
Olivier Bruneau
Cathy Craig
Mahn-Cuong Do
Gilles Montagne
Denis Mottet
William Warren
MCF-HDR
Professeure
Professeur
Professeur
Professeur
Professeur
Université Versailles Saint-Quentin-en-Yvelines, rapporteur
Université de Belfast (Royaume-Uni)
Université Paris-Sud
Aix-Marseille Université, rapporteur
Université de Montpellier I, rapporteur
Brown University (Etats-Unis)
VOLUME 1 (Note de synthèse)
Je remercie toutes les personnes qui ont contribué de près ou de loin au travail qui fait l’objet de ce mémoire, ainsi que les membres de mon jury pour avoir accepté d’en faire une critique constructive. Tabledesmatières Avant‐Propos ........................................................................................................................................... 3 1. Synthèse de travaux choisis ............................................................................................................. 5 1.1 Genèse des travaux présentés ................................................................................................ 5 1.2 Contrôle d’un système « balle‐raquette » par l’exploitation de ses propriétés dynamiques . 7 1.2.1 Introduction : régime de stabilité du système balle‐raquette ........................................ 8 1.2.2 Existence d’un contrôle « passif » et d’un contrôle « actif » ........................................ 10 1.2.3 La stabilité passive et le contrôle actif sont combinés dans un régime « mixte » ........ 12 1.2.4 Le délai d’un système de réalité virtuelle peut modifier le type de contrôle utilisé (même s’il est subliminal) .............................................................................................. 15 1.3 Couplages information‐mouvement dans la frappe cyclique de balle ................................. 21 1.3.1 Introduction ................................................................................................................... 21 1.3.2 Identification des variables informationnelles utilisables pour le contrôle du timing de la frappe......................................................................................................................... 23 1.3.3 Utilisation préférentielle des durées d’envol de la balle .............................................. 24 1.3.4 Une dissociation plus forte des variables informationnelles permet de mieux comprendre leurs rôles respectifs dans le contrôle du cycle de raquette .................... 25 1.4 Développement visuo‐moteur .............................................................................................. 31 1.4.1 Introduction ................................................................................................................... 31 1.4.2 Des changements rapides à l’âge de 7 ans dans la frappe cyclique de balle ................ 32 1.4.3 Les enfants n’utilisent pas la même variable informationnelle que les adultes ........... 33 1.5 Apprentissage moteur ........................................................................................................... 39 1.5.1 Apprentissage d’une nouvelle coordination visuo‐motrice et découverte du régime de stabilité passive ............................................................................................................. 39 1.5.2 Apprentissage de la marche athlétique : rôle de la dépense énergétique métabolique et de la perception de l’effort ....................................................................................... 45 1.6 Questions ouvertes ............................................................................................................... 52 1 2. Projets de recherche ...................................................................................................................... 61 2.1 Y a‐t‐il réduction ou augmentation de la dimensionnalité du contrôle au cours de l’apprentissage de la marche athlétique ? ............................................................................ 61 2.2 Etude des stratégies oculomotrices dans le contrôle de la frappe cyclique de balle ........... 65 2.3 Robotique bio‐inspirée .......................................................................................................... 69 2.3.1 Robot jongleur (jonglerie avec le membre supérieur) .................................................. 69 2.3.2 Locomotion bipède anthropomorphique ...................................................................... 73 Références bibliographiques ................................................................................................................. 75 2 Avant‐Propos
A ce stade de ma carrière, je me suis décidée à réaliser cette note de synthèse sur mes travaux scientifiques pour l’obtention de l’Habilitation à Diriger les Recherches. J’aurais sans doute pu effectuer ce travail un peu plus tôt, mais j’ai délibérément attendu quelques années supplémentaires afin de pouvoir produire ce document à partir d’une sélection de mes travaux de recherche. En effet, j’ai décidé de présenter ici les principaux travaux que j’ai réalisés depuis l’obtention de mon poste de MCF à l’Université Paris‐Sud en Septembre 2002. Ce recrutement a marqué un net changement dans mes thématiques de recherche, que j’ai vraiment apprécié, et il me paraissait aujourd’hui difficile d’inclure dans ce document mes travaux antérieurs de thèse et années post‐doctorales. Toutefois, dans cet avant‐propos, je vais vous retracer rapidement mon parcours scientifique entre le début de ma thèse à l’automne 1996 et mon recrutement à l’Université Paris‐Sud. Mes années d’école d’ingénieur à Strasbourg m’ont confirmé que je ne voulais pas être ingénieur mais chercheur, et après une Licence de Physique pendant mon cursus, qu’étudier la physique des particules ou l’électronique n’était pas ma vocation… je voulais que mon objet de recherche porte sur l’être humain. J’ai eu la possibilité de faire un Diplôme d’Etudes Approfondies (DEA) de Biomécanique à l’Université de Strasbourg en parallèle de ma spécialité en Ingénierie Biomédicale et de valider mon stage d’ingénieur dans un laboratoire de recherche, à savoir le LPPA (Laboratoire de Physiologie de la Perception et de l’Action) dirigé par le Pr Alain Berthoz au Collège de France. En effet, à la veille des grandes grèves de l’automne 1995, j’avais envoyé des CVs dans plusieurs laboratoires de neurosciences du CNRS pour trouver un stage de DEA. Je me souviens très bien du jour où Pr Berthoz m’a téléphoné pour me proposer de le rencontrer à Paris après la reprise du trafic à la SNCF ! Et me voilà donc « accueillie » dans le monde du vestibule et des mouvements oculaires. En 1996, je commençai ma formation de chercheur grâce à Alain Berthoz et Simon Bouisset qui m’ont permis d’obtenir une allocation de recherche pour faire ma thèse au LPPA. Merci à eux ! Co‐encadrée par Isabelle Israël, chargée de recherche au CNRS, et Alain Berthoz, mon travail de doctorat a porté sur l’étude de la perception vestibulaire du mouvement de soi et des relations entre cette perception et le réflexe vestibulo‐oculaire. Dans cette thématique, sans évoquer la notion de « couplage », j’étudiais déjà les liens entre les mécanismes perceptifs et la motricité. Mes travaux de thèse m’ont permis de publier 5 articles en 1er auteur (Siegler et al. 1998; Siegler et al. 1999; Siegler 2000; Siegler et al. 2000; Siegler & Israel 2002) et 4 autres par le jeu des collaborations avec les chercheurs, doctorants et post‐doctorants du LPPA (Ivanenko et al. 1998; Viaud‐Delmon et al. 2000; Gaymard et al. 2000; Israel et al. 2006). 3 Forte de mes connaissances sur les mouvements oculaires et du logiciel que j’avais développé pendant ma thèse sous Matlab pour les analyser, je suis partie en 1999‐2000 faire plusieurs courts séjours post‐doctoraux à l’IRCCS Santa Lucia à Rome dans le laboratoire de Neuropsychologie dirigé par le Pr Pizzamiglio. J’ai collaboré avec Pr Doricchi qui étudiait notamment comment rééduquer les patients héminégligents par des stimulations opto‐cinétiques et vestibulaires. Nous avons mené une étude sur les mouvements oculaires réflexes des patients héminégligents, et une autre sur les mouvements oculaires d’un patient héminégligent pendant son sommeil. Ce travail post‐doctoral a donné lieu à 3 publications (Doricchi et al. 2002; Figliozzi et al. 2005; Doricchi et al. 2007). Plus récemment, en 2009, cette même équipe m’a recontactée pour une étude évaluant l’influence que peut avoir une stimulation vestibulaire sur la perception du temps dans une expérience dite de “tapping” où les participants devaient maintenir le rythme d’un métronome tout en étant en train de tourner dans le noir sur un fauteuil rotatoire. Nous avons publié ensemble 2 papiers où je figure en 2ème auteur (Binetti et al. 2010; Binetti et al. 2013), mais cela a constitué bien sûr un travail de recherche annexe à mon activité scientifique principale. Après mes séjours post‐doctoraux en Italie, le LPPA m’a financé un post‐doctorat sur un projet européen (CARDS) porté par le groupe Simulations de Renault, dirigé par Andras Kemeny. J’ai passé un an au Technocentre de Renault à Guyancourt (78) pour réaliser la validation scientifique d’un nouveau simulateur de conduite, dont le développement était l’objet du projet européen. J’ai notamment évalué la contribution des stimuli kinesthésiques produits par une plate‐forme mobile pendant l’exécution de tâches élémentaires de conduite (freinage et virage en intersection). Ce travail n’a donné lieu qu’à une communication dans un congrès (Siegler et al. 2001), ce qui ne l’empêche pas d’être très citée (50 fois d’après le référencement Google), car disponible en ligne. Enfin, l’année précédant mon recrutement, je suis partie à l’UFR STAPS de Marseille pour occuper un demi‐poste d’ATER. L’année est passée vite en découverte du milieu universitaire, de l’ensei‐
gnement, et à préparer la campagne de recrutements des enseignants‐chercheurs. Cela a été fructueux puisque j’ai été recrutée sur un poste de Maître de Conférences à l’Université Paris‐Sud, pour intégrer en Septembre 2002 le Département (futur UFR) STAPS et le laboratoire CRESS (Centre de Recherche en Sciences du Sport) dirigé par Pr Benoît Bardy. Ce document contient deux grands chapitres. Dans le premier, je ferai la synthèse des travaux que j’ai choisis de présenter ici. Après une petite partie portant sur la genèse des travaux présentés (1.1), je développerai quatre sous‐parties thématiques : le régime de contrôle (1.2), les couplages information‐mouvement (1.3), le rôle du développement dans le contrôle de la tâche de frappe cyclique de balle (1.4). La quatrième sera consacrée à l’apprentissage moteur de deux activités motrices très différentes : la frappe cyclique de balle et la marche athlétique (1.5). Je conclurai ce chapitre par une partie (1.6) où je développerai des questions que soulèvent les études présentées ici. Dans le deuxième chapitre, je présenterai plusieurs projets que je souhaite mettre en œuvre à court ou moyen terme. 4 1. Synthèsedetravauxchoisis
1.1 Genèsedestravauxprésentés
Une grande partie de mon travail de recherche que je présente ici concerne la tâche de frappe cyclique de balle, ou « ball bouncing » en anglais. Cette tâche peut paraître relativement simple puisque qu’elle n’implique au maximum que deux degrés de liberté, les articulations du coude et du poignet, quand elle est exécutée dans le système de réalité virtuelle que nous avons utilisé pour nos expériences. La principale difficulté du contrôle provient en fait de la nécessaire coordination entre l’individu et la balle, objet en mouvement de l’environnement qui possède sa propre dynamique. Cette tâche s’est avérée très riche en questionnements et m’a permis d’aborder plusieurs thèmes différents, à savoir : le régime de contrôle, le couplage entre l’information visuelle et le mouvement, le développement et l’apprentissage moteur. Ce document en sera l’illustration. L’année précédent mon recrutement à l’Université Paris‐Sud, William Warren était en congé sabbatique au CRESS. Deux raisons principales ont fait que William Warren et Benoît Bardy se sont intéressés à la frappe cyclique de balle et m’ont proposé d’intégrer l’aventure avec eux à mon arrivée au CRESS. La première de ces raisons est que cette tâche, s’apparentant à de la jonglerie, permet d’étudier l’interaction entre un individu et son environnement, caractérisée en termes de « couplage perception‐action » (Warren 2006). En effet, l’individu utilise des informations prélevées dans l’environnement pour coordonner les forces qu’il applique sur cet environnement (la balle). Sous l’effet de ces forces, cet environnement va donc changer suivant les lois de la physique, ce qui va générer de nouvelles informations. Les deux systèmes, l’individu et son environnement, sont donc couplés à la fois mécaniquement par les forces exercées, et par l’information sensorielle grâce aux variables optiques, acoustiques, haptiques, etc. La deuxième raison qui a motivé l’étude de cette tâche est que le système balle‐raquette présente un régime de stabilité dynamique passive qui a été décrit et modélisé par des physiciens du chaos et des roboticiens et qui est propice à l’étude de la motricité humaine. En effet, l’existence de ce régime de stabilité, permet de se poser la question de savoir si les opérateurs humains exploitent les propriétés de stabilité inhérentes au système, ce qui peut faciliter le contrôle du rebond. Les parties 1.2 et 1.3 du présent chapitre sont consacrées à la présentation de mes travaux portant sur l’étude du régime de contrôle, de l’information visuelle utilisée dans ce contrôle et l’expression de lois information‐mouvement. A partir de 2009, Christophe Bazile, psychomotricien qui avait repris des études en STAPS en L3 puis en Master, a souhaité que j’encadre sa recherche de master puis sa thèse. Etant donné son intérêt pour la motricité des enfants, il nous est paru intéressant d’étudier le développement des couplages information‐mouvement, d’autant plus que Nicolas Benguigui, qui avait déjà mené des études 5 développementales, acceptait de co‐encadrer son doctorat. Je présenterai ce travail dans la partie 1.4 de ce chapitre de synthèse. Enfin, avant de conclure ce chapitre par une partie où je développerai des questions que posent les études présentées (Partie 1.6), j’exposerai nos travaux concernant l’apprentissage moteur (Partie 1.5). Avec mon premier doctorant Antoine Morice, ainsi qu’avec Benoît Bardy et William Warren, nous avons cherché à comprendre comment des individus confrontés à une tâche motrice nouvelle pour eux découvrent les propriétés physiques intéressantes (le régime de stabilité) et arrivent à exploiter les nouvelles solutions de stabilité lors d’un processus d’apprentissage moteur. Toujours dans le contexte de la frappe cyclique de balle, les participants ont dû apprendre à faire rebondir la balle en présence d’un délai dans l’environnement virtuel, ce qui se traduisait par un décalage de phase entre la raquette manipulée et la raquette virtuelle interagissant avec la balle virtuelle. Plus récemment, j’ai également étudié le phénomène d’apprentissage moteur à l’aide d’une tâche motrice fort différente : la marche athlétique. En effet, Anne‐Marie Heugas de Panafieu, une collègue du laboratoire avait choisi d’étudier cette locomotion particulière, réputée coûteuse sur le plan énergétique pour s’intéresser aux déterminants énergétiques de l’apprentissage moteur et des transitions marche‐course. Nous avons co‐encadré la thèse de Lina Majed sur cette thématique en prenant l’apprentissage de la marche athlétique comme paradigme. Cette activité motrice complexe n’était que peu, voire pas du tout étudiée dans le champ du contrôle moteur. Outre les aspects énergétiques de l’apprentissage, nous avons cherché à étudier les grandes étapes de la maîtrise des degrés de liberté pendant l’apprentissage. Ainsi, plus des trois‐quarts de ce document portent sur l’étude de la frappe cyclique de balle. Le but n’était pas de comprendre la jonglerie en tant que telle, mais d’utiliser cette tâche comme système‐
modèle pour nous permettre de mieux comprendre différents aspects de la motricité humaine et des liens perception‐action. L’utilisation de la réalité virtuelle nous a permis de manipuler les informations visuelles, de restreindre le mouvement de la balle à la dimension verticale et donc de limiter les degrés de liberté du système. Nous n’avons donc pas cherché à confronter les résultats obtenus en réalité virtuelle avec ce que serait la frappe cyclique de balle avec une balle réelle sur une vraie raquette de tennis de table. Dans le cas d’une frappe « réelle », le vecteur vitesse de la balle ne pourrait pas être systématiquement vertical ; la physique de la tâche serait donc différente de celle modélisée par les physiciens, qui nous sert de référence. 6 1.2 Contrôle d’un système «balle‐raquette» par l’exploitation de ses
propriétésdynamiques
Les systèmes biologiques vivent dans un monde matériel et doivent interagir avec ses propriétés physiques. Ceci peut être vu comme un obstacle pour effectuer des tâches, ou bien comme une partie intégrante de la solution au problème du contrôle. La question fondamentale abordée dans cette section est : comment la biologie exploite‐t‐elle la physique pour organiser le comportement ? Il y a un corpus grandissant de résultats montrant que les systèmes de perception‐action exploitent les propriétés dynamiques de l’environnement physique, et notamment les propriétés de « stabilité passive », pour générer des patrons stables du comportement (Turvey 1990). En parallèle, pour éviter d’être bloqué dans des patrons d’action rigides, ils utilisent les informations sensorielles pour moduler ces dynamiques, réussir une flexibilité et être ainsi capables de s’adapter (Warren 2006). Un problème général dans l’étude de la perception et de l’action est donc précisément de comprendre comment le contrôle actif utilisant l’information sensorielle est combiné avec l’exploitation des propriétés de stabilité dynamique passive pour réaliser des mouvements à la fois stables et adaptés. Dans mes travaux réalisés en collaboration avec William Warren et Benoît Bardy (Siegler et al. 2010, 2013), nous postulons l’existence d’un régime de contrôle dit « mixte » comme une solution générale à ce problème. Figure 1 : Comparaison du coût énergétique de la marche humaine, de la marche d’un robot classique (Asimo) et d’un robot dynamiquement passif (Image de Steve Collins http://www.andrew.cmu.edu/user/shc17/Robot/Robot_photos.htm) Dans le cas de la locomotion, il existe de nombreux exemples de cette combinaison entre la stabilité passive et le contrôle actif. En effet, la morphologie du système musculo‐squelettique humain procure une solution dynamiquement stable et efficiente sur le plan énergétique pour la marche bipède (Kuo 2007) ce qui a récemment inspiré la conception de robots passifs (Collins et al. 2005). Au lieu de nécessiter un contrôle actif et continu de tous les degrés de liberté comme dans le cas des robots « classiques », tel Asimo de Honda, ces robots sont conçus pour pouvoir exploiter des propriétés dynamiques passives (inertie, élasticité et compliance, pendule gravitaire, etc.). Ainsi, certains robots, bien que ne disposant d’aucune motorisation articulaire, peuvent marcher sur des 7 pentes douces avec des allures qui ressemblent beaucoup à la marche humaine. Pour d’autres robots marchant sur terrain plat, le contrôle actif est limité à quelques actions simples et discrètes au cours du cycle qui ne requièrent pas de calculs temps‐réels très complexes. Les robots « classiques » sont certes très coûteux en énergie (Figure 1), mais ils sont capables des produire des actions motrices plus variées que les robots dynamiquement passifs : Asimo sait courir, monter des escaliers, etc. De nouvelles technologies sont actuellement recherchées pour allier la capacité des robots à produire une grande variété d’actions à une meilleure efficience énergétique. Nous y reviendrons dans la partie sur la robotique bio‐inspirée (Partie 2.3) dans le deuxième chapitre consacré à mes projets de recherche. Si une telle combinaison de contrôle actif et passif existe dans la marche, il peut en être de même dans d’autres activités motrices impliquant le membre supérieur. Dans les paragraphes qui suivent, nous allons montrer que c’est le cas dans la tâche de frappe cyclique de balle. 1.2.1
Introduction:régimedestabilitédusystèmeballe‐raquette
Nous avons utilisé la tâche de frappe cyclique de balle comme un « système‐modèle » pour étudier la dynamique comportementale d’un mouvement rythmique (« behavioral dynamics », d’après Warren 2006). Frapper rythmiquement (cycliquement) une balle à une hauteur donnée sollicite le couplage entre la perception et l’action, comme déjà mentionné dans l’introduction de ce chapitre. La physique de cette tâche de frappe cyclique de balle est bien comprise et présente une solution de stabilité dynamique passive pour la frappe de période 1 (pour laquelle la période d’envol de la balle est égale à la période de la raquette et avec un rebond à hauteur constante). Figure 2 : Simulations numériques pour illustrer l’existence d’un régime de stabilité dynamique passive dans le système balle‐raquette. Pour des oscillations périodiques de la raquette, on distingue le régime neutre ( a r  0 ) où les petites perturbations sont entretenues, le régime instable ( a r  0 ) pour lequel les petites perturbations se trouvent amplifiées d’un cycle à l’autre, et le régime stable ( a r  0 ) pour lequel les petites perturbations s’atténuent au cours des cycles et la balle retrouve son cycle limite précédant l’introduction d’une perturbation (Sternad et al. 2000). 8 Le dispositif d’une bille qui rebondit sur une table vibrante a largement été étudié par les physiciens pour explorer la physique du chaos (Tufillaro & Albano 1986). Schaal et al. (1996) et Dijkstra et al. (2004) ont adapté ce modèle au cas d’un système balle‐raquette et démontré son intérêt pour étudier le contrôle moteur. Dans le modèle de Dijkstra et al. (2004), le mouvement de la raquette est sinusoïdal ; dans celui de Schaal et al. (1996), il est simplement périodique. Les deux seuls paramètres physiques de ces modèles sont l’accélération gravitationnelle g qui définit le mouvement balistique de la balle et le coefficient de restitution  (qui caractérise la quantité d’énergie restituée au moment de l’impact de la balle sur la raquette). Grâce à des analyses de stabilité (locale et non locale), les auteurs ont montré l’existence d’un régime de stabilité dynamique passive. Un système est dit « stable » si, quand on lui applique une perturbation transitoire, il revient ensuite à son état d’origine. Cette stabilité est dite « dynamique » si elle a lieu au cours d’un mouvement. Enfin, elle est dite « passive » si elle ne nécessite pas de mouvements correcteurs pour « ramener » le système (ici, la balle) à l’équilibre. Ainsi, si la balle est frappée dans la portion du cycle de raquette correspondant à ce régime de stabilité et que de petites perturbations surviennent dans le mouvement de la balle, celles‐ci disparaîtront naturellement après quelques cycles de raquette sans correction « active » par l’opérateur et la balle retrouvera sa trajectoire initiale (appelée « cycle limite ») (Figure 2). Ce régime de stabilité dynamique passive, appelé « attracteur », correspond à la portion du cycle dans laquelle la raquette est en train de monter (Vr > 0) et dont l’accélération au moment de l’impact ar est comprise dans l’encadrement suivant : 

 2g 1   2
< ar < 0. 1   2
Par exemple, avec g=9.81 m/s² et =0.5, l’accélération de la raquette doit être comprise entre 0 et ‐10.9 m/s². Une analyse de stabilité de Lyapunov a démontré l’existence d’une zone de stabilité maximale comprise entre ‐2 et ‐5 m/s² (Sternad et al. 2001). Intuitivement, on comprend bien que si la balle monte plus haut que prévu, elle retombera plus tard sur la raquette, qui aura donc une vitesse moins grande qu’à l’impact précédent (puisque la raquette est en train de décélérer). Ainsi, la balle montera moins haut au cycle suivant, ce qui va dans le sens de la correction de l’erreur initiale (« trop haut »). L’inverse est aussi vrai. Si la balle ne monte pas assez haut à un cycle donné, elle retombera plus tôt sur la raquette qui aura donc une vitesse plus grande que si aucune perturbation n’était survenue. Cette mécanique cesse de fonctionner si les perturbations sont trop grandes. En effet, si la balle monte au‐delà/en‐deçà d’une certaine plage de hauteurs, le temps d’envol sera tel que la raquette pourra être dans sa phase descendante à l’impact suivant, ce qui créera un amorti. Du point de vue du contrôle perceptivo‐moteur, l’exploitation des propriétés de stabilité passive rend donc inutiles les mouvements actifs de régulation de la raquette pour la correction de petites erreurs, puisque le rebond de la balle est stabilisé même dans le cas d’un système aveugle en boucle ouverte sans entrée sensorielle. En théorie, il suffirait de pouvoir réaliser un mouvement exactement périodique, une fois que l’attracteur a été trouvé, pour maintenir le rebond de la balle stable en dépit de petites perturbations. 9 A l’inverse, si la balle est frappée en dehors de ce régime de stabilité, avec une accélération positive, les petites perturbations pouvant survenir dans la trajectoire de la balle se trouveront amplifiées au fil des cycles si aucune correction n’est apportée au mouvement de la raquette. Ainsi, maintenir le rebond à une hauteur constante en dehors du régime de stabilité nécessite des régulations cycle‐à‐
cycle de la raquette, sur la base d’informations sensorielles. 1.2.2
Existenced’uncontrôle«passif»etd’uncontrôle«actif»
Exploitation du régime de stabilité Les premières études expérimentales menées par Sternad et al. (2001) ont confirmé que des participants experts dans cette tâche ont tendance à frapper la balle dans ce régime de stabilité, avec des valeurs d’accélération de la raquette à l’impact regroupées dans l’intervalle correspondant à la stabilité maximale. Comme prévu par les analyses de stabilité, la variabilité de l’accélération de la raquette à l’impact et de l’amplitude de rebond de la balle sont minimales dans cette gamme de stabilité maximale. Sternad et al. (2000) ont également observé qu’avec la pratique, les accélérations de la raquette à l’impact chez un novice deviennent progressivement négatives au fil des essais et convergent vers la zone de stabilité maximale. Cela montre que les participants exploitent cette stabilité passive. Tlili et al. (2004) ont montré qu’il en était de même lors de la jonglerie avec le pied d’un ballon de football. Figure 3 : Poste expérimental utilisé dans plusieurs études (Morice et al. 2008; Morice et al. 2007; Siegler et al. 2010; Siegler et al. 2013). Le participant se tient debout devant un grand écran. Il tient dans sa main préférentielle une raquette de tennis de table, appelée « raquette réelle » qu’il peut bouger librement en 3 dimensions. Un cache situé au‐dessus de sa main l’empêche de voir la « raquette réelle », dont le mouvement est mesuré grâce à un capteur électromagnétique (FOB, Ascension Technologies). La position verticale de la raquette réelle est utilisée pour calculer la position d’une « raquette virtuelle » matérialisée à l’écran par une barre horizontale et ses interactions avec une balle également virtuelle. Le but de la tâche est de faire rebondir la balle (animée d’un mouvement exclusivement vertical) jusqu’à une hauteur matérialisée par une cible, visible à droite de l’écran. Existence d’un contrôle actif Cependant, des études ultérieures ont montré que des participants peuvent activement stabiliser le rebond en frappant la balle en dehors du régime de stabilité passive (de Rugy et al. 2003; Morice et 10 al. 2007; Wei et al. 2007), ceci en utilisant forcément des informations sensorielles pour corriger les erreurs de rebonds. C’était le cas dans l’expérience menée par Antoine Morice (alors doctorant dans notre équipe) avec des participants complètement novices. Il s’agissait d’une expérience portant sur la découverte et l’apprentissage des solutions de stabilité présentes dans le système balle‐raquette, expérience dont je complèterai la description dans la section sur l’apprentissage moteur (1.4). Dans la première session de cette expérience, les participants ont réalisé une série de 10 blocs de 5 essais de 40 s de frappe cyclique de balle, avec un système de réalité virtuelle (Figure 3). La tâche consistait à faire rebondir la balle à une hauteur matérialisée par une cible. Parmi les indicateurs de performance, nous avons étudié la moyenne de l’erreur de rebond de la balle et sa variabilité. Par des ajustements aux moindres carrés de courbes exponentielles, nous avons estimé la constante de temps de l’apprentissage de cette tâche à 4.6 blocs pour l’erreur de rebond (Figure 4A). Autrement dit, au bout de 23 essais environ (soit 67% du chemin à parcourir du comportement novice initial au comportement expert théorique) l’erreur de rebond convergeait vers une valeur d’environ 4 cm, de l’ordre de grandeur du diamètre de la balle. Dans cette première étude, nous avons également étudié la moyenne de l’accélération des raquettes réelles et virtuelle au moment des impacts pour savoir si la balle était frappée dans le régime de stabilité passive. L’accélération de la raquette virtuelle au moment de l’impact diminuait au cours de la session d’apprentissage, mais elle restait en moyenne dans des gammes de valeurs positives (Figure 4B). Nous n’avons donc pas répliqué les résultats de Sternad et al. (Sternad et al. 2001; de Rugy et al. 2003) quant à l’exploitation par les participants de ce régime de stabilité. Figure 4 : A. Performance moyenne caractérisée par la moyenne (ERRB) et l’écart‐type de l’erreur de rebond (Std ERRB) au cours d’un essai, en fonction des blocs d’essais. B. Moyenne des accélérations au moment de l’impact des raquettes réelle (ACCP) et virtuelle (ACCV). Les barres verticales représentent les erreurs‐types calculées à partir des valeurs individuelles (N = 26 participants). Les courbes en trait plein proviennent de l’ajustement d’une fonction exponentielle, dont les constantes de temps (τ) et les valeurs de R² sont précisées au‐dessus des graphes (Morice et al. 2007). Ainsi, nos résultats montrent que cette population de novices a réussi à faire rebondir la balle avec un bon niveau de performance (justesse et régularité) tout en frappant la balle en dehors du régime 11 de stabilité passive. Nous pouvons en conclure que les participants ont forcément dû réaliser des ajustements du cycle de raquette pour corriger les petites perturbations pouvant survenir, et ce, sur la base d’informations sensorielles. Cela témoigne de l’existence d’un certain contrôle actif (Morice et al. 2007). Ce résultat nous a aussi convaincu que l’utilisation du régime de stabilité devait nécessiter un certain d’apprentissage. Les participants des expériences de Sternad et de ses collaborateurs étaient effectivement « experts » en « ball bouncing » ! Figure 5 : Gauche : Robot de Buehler et al. (1994) utilisant le contrôle miroir pour faire rebondir la balle. Droite : Simulation du modèle d’algorithme de contrôle miroir de Buehler et al. (1994) par Tjeerd Dijkstra (Communication personnelle) 1.2.3
Lastabilitépassiveetlecontrôleactifsontcombinésdansunrégime«mixte»
La suite de nos travaux a consisté à préciser comment le mode de contrôle actif est combiné avec l’exploitation du régime de stabilité passive par les participants (Siegler et al. 2010, 2013). Ces deux études ont également porté sur l’identification des variables informationnelles utilisées dans le contrôle de la raquette. Cette deuxième question fera l’objet d’une autre section de ce document (1.3). Dans notre étude de 2010, nous avons répertorié 4 grands types de contrôle théoriquement possibles : 1. Le contrôle dit « passif », où seul le régime de stabilité passive, décrit ci‐dessus, est exploité pour le maintien d’un rebond stable. Il s’agit de l’hypothèse que défendait Dagmar Sternad dans ses premiers travaux sur la frappe cyclique de balle (Sternad et al. 2001). Il s’agit d’un contrôle en boucle ouverte puisqu’il ne nécessite pas l’utilisation d’un signal de rétroaction sensorielle. Ainsi, ce mode de contrôle est théoriquement possible dès lors que le système balle‐raquette se trouve déjà dans l’attracteur et que le geste est périodique. 2. A l’opposé, nous citons le contrôle actif « pur », où le régime de stabilité n’est pas utilisé par les participants. Un exemple de contrôle actif est celui de l’algorithme miroir proposé par Buehler et al. (1994) (« mirror algorithm »). Dans cette solution, la raquette est animée d’un mouvement symétrique à celui de la balle, produisant des impacts dans la phase d’accélération positive de la 12 raquette. La Figure 5 est une simulation de ce modèle réalisée par Tjeerd Dijkstra. On remarque que le rebond est bien de hauteur constante alors que l’accélération de la raquette à l’impact est positive (puisque l’accélération de la balle est négative). 3. Entre les deux extrêmes, nous citons l’existence potentielle de deux autres types de contrôle. Le premier est appelé « contrôle mixte », où les participants utiliseraient un contrôle actif afin de rester dans ou proche du régime de stabilité. Dans cette hypothèse, les participants réguleraient cycle après cycle le mouvement de la raquette afin de corriger les erreurs de rebonds, que celles‐ci soient petites ou grandes. Cela permettrait de limiter la quantité de corrections nécessaires. 4. Enfin, le deuxième contrôle de type intermédiaire pourrait être un contrôle dit « hybride ». Dans ce type de contrôle, le contrôle actif interviendrait seulement quand les perturbations sont suffisamment larges pour faire sortir le système du régime de stabilité. Il y aurait donc un seuil de perturbation en dessous duquel les participants n’interviendraient pas activement et laisseraient le système revenir « tout seul » dans son cycle limite initial, grâce au régime de stabilité passive. Figure 6 : Définition des variables de raquette (ligne solide, indices r) et de la balle (pointillés et tirés, indices b) étudiées par Siegler et al. (2010). Les transitions de valeurs de g surviennent pendant le cycle C0 et celles dans  ont lieu dans le cycle qui précède.
Dans l’étude de Siegler et al. (2010), nous avons soumis treize participants à deux expériences successives, comprenant chacune deux sessions expérimentales dans lesquelles  (Session A) ou g (Session G) étaient modifiés (Figure 6). Ces volontaires avaient déjà participé à une ou deux autres expériences de frappe cyclique de balle et savaient donc maintenir un rebond régulier. L’Expérience 1 ne comportait que des essais dits « constants » (« steady‐state trials »), où les valeurs des paramètres étaient maintenues constantes pendant la durée de chaque essai, mais changeaient d’un essai à l’autre (voir Figure 7 pour les valeurs de  et g). L’Expérience 2 comportait des essais au cours desquels les valeurs de  ou de g étaient soudainement modifiées (« transition trials »). Cela permettait de faire sortir le système du régime de stabilité ou de l’y faire rentrer. Ainsi, certaines transitions étaient tantôt « stabilisatrices » (vers des valeurs négatives de l’accélération), tantôt « déstabilisatrices » (vers des valeurs positives), puisque la balle tombait soit plus tard (si g était 13 diminuée, ou  augmenté), soit plus tôt (si g était augmentée ou  diminué) dans le cycle de la raquette. Modifier g nous permettait également de tester si les participants utilisaient un modèle interne de g dans cette tâche (ou plus précisément utilisaient une variable informationnelle nécessitant cette connaissance). Si tel était le cas, nous faisions l’hypothèse que les participants mettraient plus de temps à rétablir un rebond stable après un changement de g qu’après un changement dans la valeur de . Nous reviendrons sur cette question à la section 1.3. Figure 7 : Moyenne (± std) de l’accélération de la raquette à l’impact dans les essais constants, dans les 5 conditions des Session A et Session G de l’Expérience 1 (Siegler et al. 2010) Exploitation non systématique du régime de stabilité. Dans l’Expérience 1 (Essais constants), la mesure de l’accélération de la raquette à l’impact (Figure 7) nous a montré que dans la plupart des conditions environnementales, les participants frappaient la balle dans le régime de stabilité (ar < 0), alors que dans deux autres, ils arrivaient à maintenir le rebond stable tout en étant « en dehors » de ce régime de stabilité (ar ≥ 0). C’était notamment le cas lorsque la gravité était élevée (g=11.66 et 13.69 m/s²). Les performances moyennes ne variaient pour autant pas significativement d’une condition à l’autre, ce qui confirme que les participants arrivent à bien réguler le mouvement sur la base d’informations visuelles pour maintenir le rebond de la balle au niveau de la cible visuelle, même si le régime de stabilité n’était pas exploité. Nous avons de plus observé que les participants arrivaient à contrôler de façon dissociée les paramètres d’amplitude et de période de la raquette (certaines conditions requérant par exemple un changement de vitesse à l’impact et donc d’amplitude du cycle, sans changement de la période). Ce dernier résultat est important car il laisse supposer qu’il peut y avoir deux lois de contrôle distinctes utilisées respectivement pour le contrôle de la période et de l’amplitude du cycle de raquette. Ajustements rapides après les transitions en faveur de l’utilisation d’un régime mixte. Dans tous les types de transition, « stabilisatrices » ou « déstabilisatrices », la période du 1er cycle de raquette suivant la transition (C1) était significativement modifiée par rapport au cycle précédant la transition 14 (C0), et ce, de façon adaptée (augmentation ou diminution de période, selon les transitions) (Figure 8). Le rapport entre la période du cycle C1 et du cycle C0 était toujours significativement différent de 1. Ces régulations rapides (même quand les perturbations n’étaient pas perceptibles) montrent d’une part que les régulations ont lieu cycle‐à‐cycle même après des perturbations stabilisatrices, qui pourraient ne pas nécessiter de telles régulations. Cela exclut le régime hybride. D’autre part, les comparaisons des valeurs d’accélération de la raquette nous ont montré que les ajustements étaient tels que les participants tentaient de se rapprocher à nouveau du régime de stabilité après des transitions déstabilisatrices. En conséquence, ces deux résultats s’avèrent compatibles avec l’hypothèse du contrôle mixte du mouvement de la raquette. Nous avons ultérieurement confirmé l’existence du régime mixte par une autre étude (Siegler et al. 2013). Nous détaillerons cette expérience dans la section portant sur les couplages information‐
mouvement (1.3). Figure 8 : Moyennes (± std) du rapport entre les périodes des cycles suivant une transition de valeur de g (C0, C1, …) et la période du cycle qui précède la transition (C‐1), dans le cas des transitions stabilisatrices (A) et déstabilisatrices (B). Les changements de valeurs de g sont indiqués dans les légendes. 1.2.4
Ledélaid’unsystèmederéalitévirtuellepeutmodifierletypedecontrôleutilisé
(mêmes’ilestsubliminal)
La technologie des environnements virtuels est désormais très répandue dans la recherche en neurosciences, en psychologie expérimentale et dans des protocoles de rééducation (voir Loomis et al. 1999 et Bohil et al. 2011 pour des revues de littérature). Plusieurs facteurs peuvent expliquer l’utilisation importante de ces technologies pour l’étude de la perception multi‐sensorielle et du contrôle de l’action. En effet, les grands écrans de projection ou les casques HMD (« head‐mounted displays ») permettent d’immerger les participants dans un monde créé de toutes pièces. Il est ainsi possible de manipuler les paramètres expérimentaux plus facilement que dans la réalité, voire de créer des situations impossibles à reproduire dans la réalité (comme par exemple modifier l’accélération gravitaire d’un objet visuel ou introduire des conflits entre les entrées des modalités sensorielles). Les propriétés d’interactivité des systèmes de réalité virtuelle (RV) en font un outil tout 15 spécialement adapté à l’étude du couplage perception‐action. Dans ces champs de recherche, le postulat essentiel est bien sûr que les connaissances obtenues par ces études en RV sont aussi fiables que si les expériences étaient ou avaient pu être menées dans le monde réel. La notion de « validité du simulateur » est donc cruciale pour pouvoir généraliser les conclusions au monde réel. Cependant, l’affichage dans le monde virtuel des actions de l’utilisateur ne peut être qu’en retard par rapport à ces actions. En effet, il existe un temps de mesure incompressible du mouvement de l’effecteur, de calculs pour simuler les conséquences de l’action dans le monde virtuel, d’affichage, etc. Ce délai de réaction du système de RV, ou latence, sera d’autant plus élevé que le monde simulé sera complexe. Cependant, il peut être pour partie compensé par des algorithmes de prédiction du mouvement (Filtres de Kalman, par exemple). Il a été démontré que cette latence peut être néfaste pour le sentiment de présence, la performance et le comportement des participants, et provoquer des cinétoses ; mais les conséquences précises de ce délai vont dépendre de l’action effectuée (voir Fuchs & Moreau 2006 pour une revue de littérature sur la réalité virtuelle). Ainsi, par exemple, dans le cas des études sur les coordinations sensorimotrices, ce délai sera d’autant plus délétère que le mouvement étudié sera rapide (Allison et al. 2001). Avant de mener la première expérience de frappe cyclique de balle avec notre nouveau système de réalité virtuelle, il nous a fallu, avec Antoine Morice, réaliser plusieurs études à caractère méthodologique et technologique pour mesurer le délai de notre système et valider les méthodes mises en œuvre pour tenter de réduire ce délai (Morice 2006). Plus tard, nous avons formalisé les conséquences de ce délai sur la dynamique de la tâche de frappe cyclique de balle et réalisé une étude psychophysique (Morice et al. 2008). Des études antérieures avaient déjà évalué par des méthodes psychophysiques la sensibilité des utilisateurs au délai qui s’écoule entre les actions réalisées et les conséquences de ces actions dans le monde virtuel (Allison et al. 2001). Il a été montré que les utilisateurs sont beaucoup plus sensibles à la latence du système lorsque le retour visuel est asservi au mouvement de la tête, comme dans le port d’un casque HMD (Head‐Mounted Display). En effet, du fait de l’extrême rapidité du réflexe vestibulo‐oculaire pendant les mouvements passifs de la tête (≈16 ms, Vercher & Gauthier 1990) et des mouvements anticipateurs pendant les mouvements actifs (≈‐10 ms, Vercher & Gauthier 1990), tout délai dans l’affichage de la scène visuelle va entraîner un glissement de l’image projetée sur la rétine (glissement rétinien). Au‐delà de 2‐3 deg/s, l’acuité visuelle chute et le glissement rétinien peut engendrer de l’oscillopsie, c’est‐à‐dire la perception que le monde bouge (Allison et al. 2001). Le seuil au‐delà duquel apparaît l’oscillopsie est de 60 ms de délai lorsque la tête bouge à 90 deg/s, et augmente à 200 ms quand la tête tourne beaucoup moins vite à 22.5 deg/s. Quand le monde visuel est asservi à la main de l’utilisateur, le seuil de détection du délai visuel a été estimé entre 80 ms (Leube et al. 2003) et 150 ms (Franck et al. 2001). Des études sur cette thématique sont parues encore assez récemment (Jerald & Whitton 2009) et la réactivité des casques de réalité virtuelle constitue même un argument commercial pour les joueurs de jeux vidéo. Un système de mesure du délai destiné au grand public vient même d’être commercialisé (Oculus Latency Tester) ! 16 Cependant, si l’utilisateur ne perçoit pas le délai, cela ne signifie pas pour autant que ce délai soit sans conséquence sur son comportement moteur, voire sur la validité des données collectées. En effet, des délais même subliminaux sont susceptibles d’affecter les régularités du couplage perception‐action. L’impact négatif du délai sur la performance motrice a été mis en évidence depuis les tout premiers travaux sur la télé‐opération (Ferrel 1963). Dans l’étude de Morice et al. (2008), nous avons voulu estimer le délai au‐delà duquel le comportement de l’utilisateur est significativement dégradé par rapport au comportement habituel. Nous avons donc cherché à identifier dans quelle mesure le délai peut limiter la validité fonctionnelle de notre simulateur, en plus de sa validité subjective perçue (Riccio 1995). De nos résultats (que je vais présenter ci‐dessous), nous avons conclu que la mise en œuvre d’une tâche virtuelle de frappe cyclique de balle pouvait être une méthode intéressante pour tester la validité fonctionnelle d’un environnement virtuel puisque des délais assez faibles peuvent empêcher les participants d’exploiter correctement le régime de stabilité passive, en forçant les valeurs de l’accélération de la raquette à l’impact vers des valeurs positives. Figure 9 : Méthodologie de la
première mesure du délai de notre système virtuel. A. On distingue trois étapes : la raquette est immobile, la raquette réelle est rapidement mise en mouvement, puis la raquette virtuelle se met à bouger. B. Le début du mouvement de la raquette réelle est déterminé grâce à un accéléromètre fixé sur la raquette. C. Une photodiode placée devant l’écran permet de détecter le début du mouvement de la raquette virtuelle. Le décalage entre les deux mouvements est la latence (ETEL) du système (Morice et al. 2008) Nous avions suspecté que les filtres utilisés par le capteur FOB afin d’enlever différents types de bruit dans le signal des positions mesurées rajoutaient du délai dans le système. Nous avons donc mesuré le délai de notre système en fonction de la présence ou l’absence des filtres du FOB. Il s’est avéré que le délai total de notre système était minimal lorsque les filtres du FOB étaient désactivés (38 ms). La première méthode de mesure du délai est décrite à la Figure 9. Une fois les filtres du FOB désactivés, pour continuer à supprimer le bruit tout en réduisant le délai, nous avons modifié le programme afin qu’il réalise une régression polynômiale d’ordre 3 sur les 10 dernières valeurs de position pour prédire les valeurs de position de la raquette. Au passage, il nous fallait déterminer la quantité de prédiction possible sans augmenter les erreurs de mesure. Nous 17 avons conclu que nous ne pouvions pas aller au‐delà de la prédiction du prochain point de mesure (la fréquence du FOB étant de 120 Hz, soit une estimation de où sera la raquette dans 8.33 ms). Pour valider l’intérêt de ce nouveau filtre prédictif, il fallait comparer le délai du système avec et sans ce filtre. La méthodologie initiale (cf. Figure 9) n’était pas appropriée parce qu’elle impliquait un mouvement bref de la raquette, alors que pour que ce filtre soit efficace il fallait que la raquette soit déjà en mouvement. Nous avons donc utilisé une deuxième méthode consistant à filmer simultanément avec une caméra vidéo numérique (25 Hz) le mouvement des raquettes réelle et virtuelle. Les positions des deux raquettes dans le repère de l’image vidéo ont été mesurées, ré‐
échantillonnées, et une cross‐corrélation entre les deux signaux de position a permis de calculer que le délai moyen entre les deux raquettes était autour de 30 ms, quand notre filtre prédictif était activé. Figure 10 : A. Moyennes (± std) de la transformée de l’erreur à la cible (log(ERRB + 1)) et de l’écart‐type de l’erreur de rebond au cours d’un essai (Std ERRB), en fonction du délai ETEL entre la raquette réelle et la raquette virtuelle. Les astérisques indiquent les valeurs significativement différentes des valeurs observées pour les délais les plus faibles. B. Moyennes (± std) des valeurs d’accélération des raquettes virtuelles (ACCV) et réelles (ACCP) au moment de l’impact en fonction du délai ETEL. Tandis que ACCP reste dans des gammes de valeurs négatives pour toutes les valeurs de délai, ACCV bascule de valeurs négatives à des valeurs positives pour un délai supérieur à 50 ms. Perception du délai. Quatorze personnes ont participé à notre étude psychophysique de perception du délai tout en faisant une tâche de frappe cyclique de balle. Les participants ont effectué 10 essais de 20 s, dans 9 conditions de délais. Pour créer ces conditions, nous avons artificiellement retardé le mouvement de la raquette virtuelle par rapport à la raquette réelle en ajoutant des délais compris entre 0 et 160 ms. Après chaque essai, les participants devaient indiquer s’ils avaient perçu un retard ou non dans le mouvement de la raquette virtuelle par rapport au mouvement imprimé à la raquette réelle. Classiquement, nous avons ajusté des fonctions logistiques aux réponses individuelles de détection du délai. La valeur moyenne du point d’égalité subjective (délai détecté dans 50% des cas) était de 80 ms tandis que la différence tout juste perceptible, ou seuil différentiel, était de 27 ms. La somme de ces deux valeurs nous indique qu’au‐delà d’une valeur de 107 ms, il est possible de dire que les participants sont en capacité de percevoir le délai quasi‐systématiquement. 18 Influence du délai sur le comportement. Nous avons calculé l’erreur moyenne entre l’apex de balle et la cible, et sa variabilité moyenne intra‐essai, dans les 9 conditions de délai (Figure 10). Les analyses ont montré qu’à partir d’un délai de 110 ms, la performance moyenne de contrôle du rebond de balle était significativement dégradée, tandis que la variabilité du rebond augmentait de façon linéaire avec le délai, dès 30 ms. La variabilité est donc plus sensible à la présence d’un délai, que ne l’est la performance moyenne. Ce seuil de 110 ms est du même ordre de grandeur que ceux trouvés dans un simulateur de vol (80 ms, Wildzunas et al. 1996) ou dans une tâche de télé‐opération (130 ms, Cunningham et al. 2001). Dans notre tâche de frappe cyclique de balle, 110 ms de délai total s’avère être une valeur critique tant pour la perception que pour le niveau de performance. Cependant, il est fort possible que le maintien d’un bon niveau de performance en présence d’un délai maximum de 100 ms ait été rendu possible grâce à une adaptation du comportement visuomoteur des participants qui a modifié de façon profonde le contrôle. Figure 11: Illustration du fait que l’accélération de la raquette virtuelle au moment de l’impact est supérieure à celle de la raquette réelle (Morice 2006) En effet, l’étude de l’accélération de la raquette virtuelle au moment de l’impact nous a permis de montrer que la dynamique de la tâche se trouve modifiée pour des valeurs de délai bien inférieures à 100 ms. Le signe de l’accélération de la raquette qui frappe la balle détermine si le système est dans un régime passivement stable ou non. Or, l’introduction d’un délai entre les deux raquettes fait que l’impact a lieu plus « tôt » dans le cycle de la raquette virtuelle que dans le cycle de la raquette réelle (voir Figure 11). Ainsi, si le participant veut frapper la balle avec une accélération négative de la raquette réelle (dans le régime de stabilité passive), il est possible que l’accélération de la raquette virtuelle soit positive, car elle est forcément plus grande que celle de la raquette réelle. Dans ce cas, le participant quitte sans le savoir le régime de stabilité passive. La Figure 10B nous montre qu’effectivement, au‐delà de 50 ms, la frappe de la raquette virtuelle a lieu dans le régime instable, alors que celle de la raquette réelle est dans le régime stable. Les participants sont donc « empêchés » de frapper la balle, comme ils le feraient dans la réalité. Ceci a lieu, rappelons‐le, pour des délais qui sont inférieurs au seuil de perception ! Un expérimentateur utilisant la RV pour étudier le comportement sensorimoteur fait donc une erreur importante s’il se contente de vérifier que le délai de son système de RV n’est pas perceptible, car l’utilisateur est obligé de changer de type de contrôle en passant d’un contrôle mixte à un contrôle actif. 19 Résumé
Nous avons cherché à comprendre dans quelle mesure des participants réalisant une tâche de frappe cyclique de balle exploitent les propriétés de stabilité dynamique passive du système et décrit plusieurs types de contrôle théoriquement possibles : contrôle passif (exploitation systématique du régime de stabilité dynamique passive ; contrôle en boucle ouverte), contrôle actif (pas d’utilisation du régime de stabilité ; régulations sur la base d’informations sensorielles), contrôle hybride (passif ou actif selon l’amplitude des perturbations à corriger) et contrôle mixte (passif et actif, quelle que soit l’amplitude des perturbations). Nous avons trouvé que les participants expérimentés utilisent un contrôle mixte, en frappant dans ou à proximité du régime de stabilité. Les régulations dans le mouvement de la raquette se font cycle‐à‐
cycle, sur la base d’informations sensorielles, notamment visuelles, prélevées dans la trajectoire de balle. Cependant, certaines conditions expérimentales peuvent être telles que les participants n’exploitent pas le régime de stabilité (ex : accélération gravitaire virtuelle élevée). Cela n’empêche pas pour autant de réaliser une bonne performance de contrôle de la hauteur de rebond de balle. Quant aux débutants, ils n’utilisent pas directement le contrôle mixte, même s’ils arrivent rapidement à faire rebondir la balle à une hauteur donnée. Le débutant doit réaliser plusieurs dizaines d’essais avant de pouvoir exploiter le régime de stabilité. Par ce travail, nous avons pu démontrer que l’être humain est capable, après un certain temps de pratique, de trouver des solutions motrices intéressantes qui lui permettent de simplifier le mode de contrôle. Enfin, nous avons utilisé le modèle de la frappe cyclique de balle et de son attracteur naturel (stabilité dynamique passive) pour analyser les conséquences que peut avoir un délai dans un système de réalité virtuelle. Au‐delà de 50 ms, les participants sont « empêchés » de frapper la balle, comme ils le feraient dans la réalité et quittent sans le savoir le contrôle mixte. Ceci a lieu pour des délais qui sont inférieurs au seuil de perception, que nous avons mesuré autour de 110 ms ! Un expérimentateur utilisant la RV pour étudier le comportement sensorimoteur fait donc une erreur importante s’il se contente de vérifier que le délai de son système de RV n’est pas perceptible. 20 1.3 Couplagesinformation‐mouvementdanslafrappecycliquedeballe
1.3.1
Introduction
Deux grandes questions sont abordées dans cette section : ‐
Peut‐on identifier les lois de contrôle de la tâche de frappe cyclique de balle ? ces lois expriment les relations existantes entre des propriétés de l’environnement (la balle) et des paramètres d’action. ‐
Quelles sont les informations visuelles qui spécifient ces propriétés et qui peuvent être utilisées par les individus dans ce contrôle ? Figure 12 : Concepts invoqués pour l’étude couplage information‐mouvement, dans le cadre de l’approche écologique de la perception, présentés par Bootsma (1998) Le couplage entre la perception et l’action peut être décrit à travers un certain nombre de lois, dites « lois de contrôle » (Warren 1988) qui sont centrales dans l’approche écologique. Ces lois opérationnalisent la mise en relation directe de l’information et d’une force (accélération, raideur, impulsion, …) et sont spécifiques à chaque action. Pour expliciter les différents concepts utilisés dans cette section et la suivante, je me réfèrerai principalement à un chapitre d’ouvrage proposé par Bootsma (1998) qui décrit très bien ces concepts essentiels du champ de la perception directe, notamment à l’aide d’un schéma présenté à la Figure 12. L’individu, dénommé ici « acteur », dont nous souhaitons comprendre les mouvements finalisés (« goal‐directed movements »), forme avec son environnement un système, que Bootsma appelle « Système Acteur‐Environnement » (SAE). Pour agir, l’acteur doit percevoir des propriétés pertinentes de ce SAE1 (ex : le temps que va mettre un ballon dirigé vers l’acteur pour l’atteindre, dit temps de pré‐contact). La perception d’une propriété du SAE est possible parce les propriétés pertinentes produisent des variations spécifiques 1
Il peut s’agir des propriétés des objets et des événements de l’environnement, ou du déplacement de l’acteur dans cet environnement. 21 du flux (« flow patterns ») du milieu environnant (ex : flux optique) qui correspondent de façon univoque à ces propriétés (ex : variation de l’angle optique sous‐tendu, au point d’observation de l’acteur, par le ballon qui s’approche). La détection de ces variations spécifiques du flux par un système perceptif permet donc la perception de cette propriété (Turvey 1990). Le pattern du flux, qui est informatif et qui spécifie la propriété du SAE, est donc nommé « information » sur cette propriété ; nous parlerons également de « variable informationnelle ». En produisant un mouvement, l’acteur influence l’état du SAE et modifie de ce fait l’information disponible qui peut être utilisée pour guider l’action. Il s’agit de la boucle perception‐action. La Figure 12 dresse un inventaire assez complet des questions qui, d’après Bootsma (1998) doivent être traitées pour comprendre comment est réalisé le contrôle de l’action. Une telle compréhension du contrôle de l’action nécessite notamment que : a) les propriétés pertinentes du SAE soient identifiées ; b) les variables informationnelles spécifiant ces propriétés soient formalisées ; c) la sensibilité des acteurs à ces informations soit démontrée ; d) les lois décrivant comment le mouvement est régulé par l’information soient identifiées. Une loi de contrôle est l’expression d’une correspondance (« mapping ») entre une variable informationnelle spécifique de la tâche (i) et une variable du mouvement (m) ou une force (F) produisant ce mouvement (Warren 2006): m = f(i) F = f(i) Mais d’autres formes peuvent également être proposées, telles que des relations entre des variations de forces F et des variations de l’information i (Warren 1988), ou entre les propriétés du SAE et les paramètres du mouvement (voir Temprado & Montagne 2001 pour une revue de littérature): F = f(i) La tâche de frappe cyclique de balle implique deux principales actions. Dans l’ordre d’importance, le participant jongleur doit : 1) contrôler le « timing » de la frappe, c’est‐à‐dire arriver au « bon moment » pour frapper la balle quand elle retombe à la position de l’impact précédent (à supposer que la hauteur du rebond en cours soit correcte). Nous sommes partis du postulat que les participants contrôlent la période du cycle Tr pour préparer le timing de la frappe. 2) corriger l’éventuelle erreur de rebond ou faire en sorte que la balle atteigne une hauteur donnée. Pour cela, le participant jongleur doit réguler la vitesse de la raquette Vr au moment de l’impact. Pour contrôler ces actions et préparer le « prochain impact », deux propriétés de l’environnement (balle, cible) sont très importantes : ‐
la durée d’envol de la balle Tb (entre le moment d’un impact et le suivant) ; 22 ‐
l’erreur de rebond  (différence entre la hauteur maximale atteinte par la balle et la hauteur de la cible). L’objectif principal des deux études présentées ici était d’identifier les variables informationnelles qui peuvent spécifier les propriétés du mouvement de la balle et qui sont utilisées par les participants pour contrôler le cycle de raquette. Nous avons également utilisé les données expérimentales pour formaliser les relations entre les propriétés du mouvement de la balle (Tb, ) et les paramètres du mouvement qui sont contrôlés (Tr, Vr). Trouver l’expression des lois de contrôle, entre les variables informationnelles et le mouvement, dans la frappe cyclique de balle constitue en quelque sorte notre « Saint Graal » ! Cependant, la route est longue et les étapes nombreuses avant d’y arriver… Pour rester dans la métaphore du chemin, je dirais que les deux études présentées ici ne représentent qu’une partie seulement du chemin à parcourir ! 1.3.2
Identification des variables informationnelles utilisables pour le contrôle du
timingdelafrappe
Il convient dans un premier temps d’identifier les variables informationnelles visuelles qui spécifient la durée d’envol de la balle d’un impact à l’autre (Tb, Figure 6 et Figure 14), et qui peuvent donc permettre de réguler la période de la raquette pour frapper la balle « au bon moment ». Il y a plusieurs variables optiques disponibles dans la trajectoire de la balle : (i) Vitesse de la balle après impact Vb. Si l’on suppose que la gravité g est connue, Tb est spécifiée par Vb : Tb 
2V b
g
(ii) Hauteur de rebond hp : Si l’on suppose que la gravité g est connue, la durée d’envol est également spécifiée par hp : Tb  2.
2h p
g
(iii) Demi‐période d’envol tup : la durée de la phase ascendante de la balle tup est égale à celle de la phase descendante tdown si la balle est frappée à la même hauteur aux deux impacts successifs. Tb  2.tup (iv) Tau‐gap : pendant la chute de la balle, le mouvement de la raquette pourrait être guidé par le « tau of motion‐gap », qui est l’estimation du temps de fermeture de l’écart spatial x entre les positions de balle et de raquette, si le taux de fermeture est maintenu constant :  c 
x
(Lee et x
al. 1999). A moins que la gravité ne soit prise en compte, cette variable surestime le temps avant 23 impact pour le cas d’une chute libre. Cependant, elle converge vers la bonne valeur à mesure que la balle se rapproche de sa position d’impact. Pour que les variables Vb, hp et c puissent spécifier la durée d’envol de la balle, il faut que l’individu « prenne en compte » la valeur de g, ce qui n’est pas nécessaire s’il utilise tup. De ce fait, tup semble être la variable informationnelle la plus pertinente dans le contrôle de la période du cycle de raquette car elle ne nécessite pas de modèle interne de la gravité. Nos travaux sur les couplages information‐mouvement visaient en premier lieu à vérifier que tup est bien la variable informationnelle exploitée par les participants pour contrôler le timing de la frappe. Figure 13 : Nature des variables étudiées dans nos travaux, en référence au modèle proposé par Bootsma (1998) 1.3.3
Utilisationpréférentielledesduréesd’envoldelaballe
Dans notre première étude sur cette thématique (Siegler et al. 2010), le protocole choisi consistait à modifier soudainement la valeur de g au cours de la jonglerie, épisodes que nous avons appelé « transitions » (protocole déjà mentionné à la page 13). Nous faisions l’hypothèse que si les participants utilisaient Vb, hp ou c, ils devraient apprendre une nouvelle valeur implicite de g avant de pouvoir retrouver une bonne performance. Cela se traduirait par des erreurs pendant quelques rebonds après les transitions. En effet, McIntyre et al. (2001) ont montré que les astronautes n’arrivaient pas à s’adapter en 90 essais à des conditions zero‐g, ce qui implique qu’il n’est sans doute pas facile de « réapprendre » une nouvelle valeur de g. A l’inverse, si les participants parvenaient à rétablir une bonne performance rapidement après les transitions de g, cela pouvait indiquer qu’ils utilisent plutôt tup comme variable informationnelle spécifiant le temps avant impact. C’est effectivement ce que nous avons observé. Le temps de relaxation pour retrouver un niveau de performance de référence n’était pas plus long après une modification de g qu’après une modification de  (qui n’était pas censé poser trop de difficulté aux participants puisque cela n’avait pas de conséquence sur les relations entre variables informationnelles). 24 Pour identifier les principales variables informationnelles utilisées pour le contrôle des paramètres d’action (notamment la période et l’amplitude du cycle de raquette), nous avons étudié les corrélations entre ces paramètres d’action et les différentes variables informationnelles candidates, pour les cycles survenant au moment des transitions. Concernant la période de la raquette, celle‐ci corrélait le mieux avec les demi‐périodes d’envol tup et tdown (r ≈ 0.8‐0.9), tandis que les corrélations avec la hauteur de rebond hp et avec la vitesse après impact de la balle Vb étaient bien plus faibles (r = .65 et r = .30, respectivement). L’interprétation de la corrélation de tdown avec la période est un peu délicate. En effet, si les participants sont par exemple amenés à raccourcir la période de la raquette (sur la base de la phase de montée de la balle et non de sa descente), cela aurait automatiquement comme conséquence de diminuer tdown puisque cette durée de la chute dépend du moment choisi par le participant pour frapper la balle. La durée de la chute de la balle tdown est donc largement définie par l’action du participant. Nous avons cependant observé que des régulations fines surviennent jusqu’au moment de l’impact, sans avoir identifié précisément quelle pourrait être l’information exacte utilisée dans la phase de chute de la balle ; peut‐être tau‐gap. Il est à signaler que nous n’avons pas pu trouver de corrélation notable, même faible (r > .30), entre les variables informationnelles et l’amplitude du cycle de raquette, alors que nous avons également montré dans cette étude que les deux variables du mouvement‐ la période et l’amplitude de la raquette ‐ pouvaient être contrôlées séparément. L’amplitude de la raquette semblait effectivement régulée après les transitions, mais le rapport signal sur bruit était sans doute trop faible pour mettre en évidence la variable informationnelle utilisée pour son contrôle. De plus, les transitions dans les valeurs de g ne permettaient pas de dissocier les variables tup et hp au sein d’un même cycle, car le changement de valeur de g avait lieu au moment de l’apex de la balle. Cette dissociation entre les deux variables informationnelles n’était effective qu’en groupant tous les cycles de transitions dans la même analyse de corrélations (mélangeant ainsi des valeurs de g différentes, pour des hauteurs de rebond similaires en moyenne). Nous avons donc voulu poursuivre cette première étude par une seconde, sur la même thématique. 1.3.4
Une dissociation plus forte des variables informationnelles permet de mieux
comprendreleursrôlesrespectifsdanslecontrôleducyclederaquette
Dans la deuxième étude, nous avons sophistiqué les perturbations introduites pour augmenter la dissociation entre les variables informationnelles et trancher plus fermement quant aux rôles respectifs de chacune d’entre elles dans le contrôle de la raquette (Siegler et al. 2013). Plus précisément, il s’agissait de : 1) confirmer le rôle principal de la variable informationnelle « tup » dans le contrôle de la période du cycle de raquette, 2) identifier le rôle de la variable « erreur de rebond à la cible » ( dans la régulation de la hauteur de rebond par le contrôle de la vitesse de frappe. Concernant la régulation de cette hauteur de rebond, deux hypothèses ont été formulées. La première, que nous nommerons hypothèse « absolue », postule que l’erreur de rebond (ε) permet 25 de définir la vitesse exacte qui est requise à la prochaine frappe pour que la balle arrive à la hauteur voulue. C’est ce scénario qui est utilisé dans des modèles computationnels de la frappe cyclique de balle, notamment celui de Ronsse et al. (2010). Cela suppose de croire que les participants sont capables de faire des calculs assez complexes, et qu’ils ont une connaissance de g et du coefficient de restitution du système balle‐raquette. La deuxième hypothèse, que nous nommerons hypothèse « relative », postule que ε est utilisée pour contrôler la variation de la vitesse Vr de raquette à l’impact « relativement » à celle de l’impact précédent (Warren 1988). Cela signifie simplement que le participant frappe avec une vitesse moins élevée (Vr < 0) ou plus élevée (Vr > 0) qu’à l’impact précédent, si la balle est montée, respectivement trop haut ou pas assez haut, par rapport à la consigne (cible). Cette solution n’est pas optimum sur le plan mathématique car la relation exacte entre l’erreur et la variation de vitesse n’est pas linéaire, mais elle pourrait s’avérer beaucoup simple à mettre en œuvre et suffisante pour la précision requise dans la tâche. Figure 14 : A. Définition des variables de la raquette et de la balle. B. Schéma des perturbations de la balle dans l’Expérience 1. La durée de la phase ascendante de la trajectoire de balle tup est perturbée tandis que l’amplitude de rebond de la balle H reste inchangée. C. Schéma des perturbations dans l’Expérience 2. L’amplitude de rebond de la balle H est perturbée tandis que la durée de la phase ascendante de la trajectoire de balle tup et la période de balle Tb restent inchangées (d’après Siegler et al. 2013). Nous avons réalisé deux expériences et testé deux sortes de perturbations dans le mouvement de la balle. Lors de la première expérimentation, le protocole expérimental a permis de faire varier la durée de la phase ascendante de la trajectoire de balle (tup) en gardant l’amplitude du rebond (H) et la position verticale de l’apex (hp) identiques à celles qui auraient dû être observées en l’absence de perturbation. Inversement, lors de la seconde expérimentation, tup était maintenue constante tandis que hp et H étaient perturbées (Figure 14 B&C). Techniquement, ces perturbations dissociées de tup et hp ont été réalisées grâce à des perturbations introduites dans la vitesse de la balle après impact Vb associées à des perturbations de la gravité g pendant une demi‐période (Expérience 1) ou une période entière (Expérience 2). L’amplitude des perturbations dans la vitesse de la balle Vb était aléatoire, dans une gamme [Vb ‐ 25% ; Vb + 25%]. Pour réaliser certaines analyses de la variance, nous avons regroupé ces perturbations en 10 catégories, selon leur signe et leur amplitude (Mag‐5, 26 Mag‐4, …, Mag5. Les valeurs négatives de perturbations (de Mag‐5 à Mag‐1) étaient associées à une valeur de g plus petite que 9.81 (pour que la hauteur de rebond soit inchangée, malgré une diminution de la vitesse initiale de la balle). Il en résultait une trajectoire de balle plus longue en durée, et inversement pour les valeurs positives de perturbations. Sur cette figure sont également représentées les durées théoriques d’envol de la balle perturbée, Tbth, dans les différentes catégories de perturbation, si la balle était frappée à la même hauteur dans les cycles C0 et C1 (courbe rouge). Cette durée d’envol est dite « théorique » car dans les faits, les participants ne frappaient pas toujours exactement la balle à la même position verticale. 1.3.4.1 ContrôledelapériodederaquetteTr
Sur la Figure 15A, nous pouvons comparer la période moyenne du cycle de raquette du cycle C1 au cours duquel la perturbation a eu lieu, à celle du cycle C0 précédant la perturbation et voir que dès le premier cycle, les participants ont « répondu » à la perturbation (durée d’envol de la balle) en régulant leur geste pour préparer l’impact suivant. Figure 15 : A. Période (moy ± erreur‐type) des cycles pré‐ et post‐perturbation (C0, C1) en fonction de l’amplitude des perturbations. La ligne rouge représente les durées théoriques d’envol de la balle si la balle est frappée à la même hauteur dans les cycles C0 et C1. B. Coefficients de corrélation entre les variables informationnelles et la période du cycle, pour les cycles pré‐ et post‐perturbation (C0, C1). (tup, durée de la phase ascendante de la balle ; tdown durée de la phase descendante de la balle ; hp position verticale atteinte par la balle à l’apex de la trajectoire ; Vb vitesse initiale de la balle après impact) (Siegler et al. 2013) Pour obtenir une expression de la loi de contrôle de la période de raquette, nous avons calculé une régression linéaire2 entre la durée d’envol théorique de la balle perturbée Tbth et la période du cycle de raquette suivant la perturbation Tr1, dont le résultat était le suivant : Tr1 = 0.77 × Tbth + 0.17, avec R²=0.9977 (1) 2
Dans l’équation, nous ne pouvons pas utiliser Tb la durée observée d’envol de la balle, car, calculée après la réalisation du mouvement, cette variable dépend du moment où le participant frappe la balle donc du mouvement réalisé. Dès lors, cela augmenterait artificiellement la corrélation entre Tb et Tr ! 27 Cette régression a été calculée à partir des valeurs moyennes de Tr1 et Tbth dans les dix catégories de perturbations (que nous pouvons visualiser à la Figure 15A), ce qui pourrait augmenter artificiellement la qualité de l’ajustement. Pour cette raison et à l’occasion de l’écriture de cette note de synthèse, j’ai souhaité analyser à nouveau les données pour calculer les paramètres de la loi de contrôle pour chaque participant. La moyenne sur tous les participants de la fonction de régression était la suivante : Tr1 = 0.866 × Tbth + 0.098, avec les R² individuels [0.70 ; 0.95]. (2) Pour analyser quelles pouvaient être les variables informationnelles spécifiant Tbth et utilisées par les participants, nous avons réalisé des analyses corrélationnelles entre Tr1 et différentes variables candidates (Figure 15B). Rappelons que dans cette expérience, la hauteur de rebond n’était pas perturbée. Elle variait néanmoins d’un cycle à l’autre, et pouvait garder une part de valeur informationnelle, ainsi que d’autres variables. Ces analyses ont montré qu’avant la perturbation (C0), plusieurs variables informationnelles corrélaient naturellement avec la période de raquette Tr0 (r ≈ 0.86). Après la perturbation (C1), la corrélation avec la durée de phase ascendante de la balle avec la période Tr1 restait élevée (r ≈ 0.85) et était significativement plus élevée que pour toutes les autres variables informationnelles testées. Nous en avons conclu que tup était bien la principale variable informationnelle utilisée pour le contrôle de la période de la raquette. 1.3.4.2 Loidecontrôlepourcorrigerl’erreurderebond
Dans l’Expérience 2, c’était la hauteur de rebond qui était perturbée. Une diminution de la vitesse de balle après impact Vb (Mag‐5,…, Mag‐1) provoquait un rebond moins haut par rapport à ce qu’il aurait dû être en l’absence de perturbation, sans que la durée d’envol ne soit modifiée. Les perturbations positives provoquaient un rebond plus haut. A la Figure 16A, nous pouvons voir que les participants ont adapté la vitesse de la raquette à l’impact suivant, en fonction de la perturbation : si la balle montait moins haut, ils frappaient à C1 avec une vitesse plus élevée qu’au cycle précédent, et avec une vitesse moins élevée si la balle montait artificiellement trop haut. Cependant, ce n’est pas parce que l’on observe une influence de la perturbation sur le paramètre d’action « vitesse de frappe », que les participants cherchent nécessairement à produire directement une telle valeur de vitesse de frappe (Vr), valeur dite « absolue » par opposition à la notion de « vitesse relative » par rapport à la frappe précédente (Vr). Les analyses de corrélations ont montré que la variable « erreur à la cible » corrélait mieux avec Vr qu’avec Vr (Figure 16B), ce qui suggère que les participants ont plutôt une stratégie de contrôle de la vitesse « relative » Vr pour corriger l’erreur de rebond, et non une stratégie de contrôle de la valeur exacte, « absolue », de la vitesse au moment de l’impact. 28 De ce fait, nous avons calculé des régressions linéaires entre Vr et  pour tous les participants. La moyenne des régressions linéaires individuelles entre Vr et indique une relation quasi‐ proportionnelle entre Vr et  : Vr = ‐1.57 × 0.03, avec les R² individuels [0.23 ; 0.53]. (3) On notera que la part de variance expliquée par cette loi de contrôle de la vitesse (Equation 3) est bien plus faible que celle expliquée par la loi de contrôle de la période de raquette (de l’ordre de 40% en moins de variance expliquée) (Equation 2). Enfin, parmi les résultats les plus intéressants, l’analyse de l’amplitude du mouvement de la raquette a montré que cette variable était significativement et linéairement influencée par les perturbations de la hauteur de rebond. Les variations de l’amplitude des oscillations peuvent donc participer à moduler la vitesse à l’impact. Figure 16 : A. Vitesse de la raquette (Vr) à l’impact (moy ± erreur‐type) dans les cycles C0 et C1, en fonction de l’amplitude des perturbations. B. Coefficients de corrélation entre l’erreur de rebond () et les paramètres de vitesse de la raquette au moment de l’impact (ΔVr, Vr) (Siegler et al. 2013). 29 Résumé
Deux études ont été menées pour identifier les variables informationnelles visuelles utilisées dans le contrôle de la frappe cyclique de balle, et pour formaliser les lois de de contrôle de deux principaux paramètres du mouvement de la raquette : (1) la période du cycle de raquette Tr pour réguler le timing de la frappe et, (2) la vitesse Vr de la raquette au moment de l’impact pour maintenir l’apex de la trajectoire de balle au niveau de la cible visuelle. Grâce à l’utilisation de la réalité virtuelle, nous avons pu perturber les valeurs de la gravité (visuelle) g et du coefficient de restitution , au moment de l’apex ou de l’impact. Cela a permis de dissocier les variables informationnelles visuelles qui spécifient la durée d’envol de la balle Tbth entre deux impacts, et qui sont dans la réalité fortement corrélées : durée de la phase ascendante de la trajectoire de balle (tup), position verticale de la balle au moment de l’apex (hp), vitesse de la balle après l’impact (Vb), tau‐
gap (c). Les résultats ont montré que, parmi les variables qui spécifient Tbth, les participants utilisent principalement tup pour contrôler la période de raquette. Nous avons pu exprimer deux lois de contrôle, en fonction des propriétés de la trajectoire de balle Tbth et . La loi de contrôle de la période de la raquette Tr est : Tr = 0.866 × Tbth + 0.098 Concernant la correction des erreurs de rebond (), les participants utilisent un contrôle de la vitesse relative Vr par rapport à la frappe précédente : Vr = ‐1.57 × 0.03 30 1.4 Développementvisuo‐moteur
1.4.1
Introduction
Après avoir identifié les couplages information‐mouvement impliqués dans le contrôle de la frappe cyclique de balle chez l’adulte, j’ai proposé à Christophe Bazile, psychomotricien de formation qui a été mon 2ème doctorant à soutenir (en 2012), d’étudier le rôle du développement dans ce contrôle chez l’enfant âgé de 5 à 12 ans. A notre connaissance, aucune étude n’avait alors été conduite pour caractériser le contrôle visuo‐manuel rythmique chez l’enfant d’âge scolaire. Cependant, plusieurs études portant sur le développement de coordinations auditivo‐motrices rythmiques (Volman & Geuze 2000; Getchell & Whitall 2003; Clizbe & Getchell 2010) ont montré qu’une inflexion dans le développement de telles coordinations est observée à l’âge de 7‐8 ans. Ainsi, en deçà de cette tranche d’âges, les enfants semblent avoir des difficultés importantes à réguler la période de leurs gestes quand ils doivent synchroniser leurs mouvements avec un métronome dont les expérimentateurs perturbent le rythme (ex : frappe dans les mains, marche). Ils présentent un comportement stéréotypé, une faible performance et une faible capacité de régulation. Au‐delà de 7‐8 ans, les enfants apparaissent de plus en plus aptes avec l’âge à réaliser ce type de coordination pour se synchroniser avec le métronome : le comportement est plus adaptatif et les performances à la fois de meilleure qualité et plus stables. Les recherches sur le développement dans les tâches d’attraper de balle et de tapping3 peuvent également fournir des éléments importants, éventuellement transposables à la tâche de frappe cyclique de balle. La capacité qu’ont les jeunes enfants à attraper une balle commence très tôt, d’abord avec les deux mains (von Hofsten 1980; von Hofsten 1982; von Hofsten & Fazel‐Zandy 1984). Des améliorations ont lieu au cours du développement de l’enfant, avec des modifications importantes entre 5 et 12 ans (Savelsbergh & van der Kamp 2000; Savelsbergh et al. 2003). En effet, à l’âge de 5 ans apparaît la capacité à attraper une balle avec une seule main, même si Alderson et al. (1974) ont montré que cela reste difficile pour des enfants de 7 ans qui préfèrent encore spontanément attraper à deux mains. A partir de l’âge de 8 ans, l’attraper à une main s’améliore progressivement jusqu’à 12 ans, âge auquel les enfants atteignent un niveau comparable à celui des adultes (Alderson et al. 1974; Fischman et al. 1992; Savelsbergh et al. 2003). A la lecture des travaux sur le développement des coordinations perceptivo‐motrices, il apparaît que la tranche d’âge de 7‐8 ans est une période au cours de laquelle surviennent des changements importants. Dans un ensemble de tâches de pointage, on observe une quasi‐absence de régulation visuelle du mouvement chez les enfants âgés de 5 à 7 ans, alors que cette régulation visuelle augmente entre 7 et 12 ans (Bard & Hay 1983). La stabilité de la performance motrice s’améliore significativement à partir de 7 ans (Fitzpatrick et al. 1996; Konczak et al. 2003; Getchell & Whitall 2003) ainsi que la précision du geste (Olivier et al. 1997; Robertson 2001; Konczak et al. 2003; 3
Tapping : tâche consistant à osciller l’index ou à cliquer sur une souris d’ordinateur en rythme avec un métronome, ou à poursuivre le mouvement après l’arrêt du métronome. 31 Lambert & Bard 2005). On note également des améliorations dans la capacité à prédire le mouvement d’une balle et une diminution du temps de réaction à partir de 7 ans (Olivier et al. 1997; Lefebvre & Reid 1998; Debrabant et al. 2012).
1.4.2
Deschangementsrapidesàl’âgede7ansdanslafrappecycliquedeballe
L’objectif de la première étude de la thèse de Christophe Bazile était donc de contribuer à une meilleure compréhension de la dynamique développementale du contrôle visuo‐moteur rythmique chez l’enfant âgé de 5 à 12 ans. Etant donnés les résultats des études citées ci‐dessus, nous pensions retrouver autour des âges de 7‐8 ans une non‐linéarité dans l’évolution du contrôle au cours du développement, ou tout du moins une période charnière, tant sur le plan quantitatif (performance et stabilité) que qualitatif (type de comportement observé). Nous avons constitué cinq groupes d’âge de 10 participants : 5‐6 ans, 7‐8 ans, 9‐10 ans, 11‐12 ans et adultes. Au cours de l’expérience, les participants devaient effectuer 16 essais de 40 s de frappe cyclique de balle devant un grand écran, où la cible visuelle était fixée à une hauteur de 0.65 m. Figure 17 : Hauteur moyenne de rebond (A) et fréquence moyenne d’oscillation de la raquette (B) au cours des 16 essais de frappe cyclique de balle chez les 5 groupes de participants (d’après Bazile et al. 2013). La première variable de performance étudiée était la hauteur moyenne de rebond de balle au cours des 16 essais. La performance moyenne du groupe des 5‐6 ans était significativement différente de celles des autres groupes, mais dès 7‐8 ans et au bout de quelques essais (environ 6‐7), la performance des enfants était relativement similaire à celle des adultes (Figure 17 A). Les résultats des autres variables de performance, comme par exemple le pourcentage de cycles avec zéro rebond ou des rebonds multiples, ont montré des différences plus nettes entre les enfants et les adultes (Figure 18). En effet, à la différence des adultes, qui dès le deuxième essai sont systématiquement capables de produire une seule frappe de balle par cycle de raquette (1 seul impact), les enfants sont d’abord confrontés à des rebonds multiples faute de pouvoir bien maîtriser le geste et le couplage avec la balle. C’est notamment le cas lorsque la balle tombe sur la raquette alors qu’elle est en train de descendre, ce qui provoque un rebond « amorti », ou lorsque la vitesse de la raquette n’est pas suffisante au moment de l’impact. La phase d’adaptation des enfants est plus longue que celle des 32 adultes. De plus, nous avons été surpris de constater que le groupe des petits adoptait au bout de quelques essais un comportement très spécifique, qui consistait à augmenter la fréquence d’oscillation de la raquette. Cela avait pour conséquence d’augmenter la proportion de cycles sans impact, mais également de frapper la balle avec une vitesse plus élevée. Il s’agissait sans doute d’une méthode trouvée spontanément pour réussir à faire monter la balle plus haut (Figure 17 B). Figure 18 : A. Nombre moyen d’impacts par cycle de raquette. B. Pourcentage moyen de cycles présentant 1 seul impact. C. Pourcentage moyen de cycles raquette ne comprenant aucun impact. D. Pourcentage moyen de cycles comprenant au moins deux impacts (Bazile et al. 2013). Nous pouvons citer un dernier résultat principal de cette étude concernant le couplage information‐
mouvement. Comme nous l’avions fait chez les adultes dans les études antérieures pour étudier la force du couplage entre la balle et la raquette, nous avons analysé chez les enfants la corrélation entre la variable tup (durée de montée de la balle) et la période du cycle de raquette. Ce coefficient était significativement plus petit chez le groupe des 5‐6 ans que chez les enfants plus âgés. Les 5‐6 ans étaient moins capables de réguler la période de raquette sur la base de l’information visuelle temporelle dans le mouvement de la balle pour préparer la prochaine frappe. Cette faible capacité de régulation associée à la production d’un mouvement de raquette très variable a produit des rebonds très chaotiques de la balle, ce qui en retour a sans doute rendu la sélection de l’information pertinente dans le mouvement de la balle plus difficile pour les enfants les plus jeunes. 1.4.3
Lesenfantsn’utilisentpaslamêmevariableinformationnellequelesadultes
La seconde étude avait pour objectif de caractériser les couplages information‐mouvement chez les enfants. En effet, nous sommes partis du postulat que les enfants ne sont pas forcément sensibles 33 aux mêmes informations que les adultes, de façon analogue au fait qu’un adulte débutant dans l’apprentissage d’une tâche visuo‐motrice n’est pas forcément sensible aux mêmes variables informationnelles qu’un adulte expert dans cette tâche (Savelsbergh et al. 2002). Notre étude est ici largement inspirée des travaux des équipes de John van der Kamp et de Geert Savelsbergh (van der Kamp et al. 2003) sur le développement et l’apprentissage du contrôle visuel du mouvement. Dans la comparaison des deux processus, van der Kamp et al. (2003) postulent que : « although the constraints that are imposed upon development and learning are vastly different, both are best characterized as a change towards the use of more useful and specifying optic variables ». La plupart des travaux ont porté sur le développement des bébés. Ainsi, van Hof et al.(2006) ont cherché à identifier les variables informationnelles utilisées par les bébés de 3 à 8 mois quand ils essayent d’attraper un objet, et étudié les changements au cours du développement. Une amélioration très nette des capacités des bébés à atteindre et attraper des objets survient entre 3 et 5 mois. Cela coïncide avec le début de la vision binoculaire. D’après les auteurs : « this co‐occurrence in time suggests that attunement to binocular information is one of the processes that underlies infants’ development to adaptively control goal‐directed arm movements ». Eleanor Gibson a également beaucoup étudié comment les bébés, grâce à un comportement exploratoire de leur environnement, sont progressivement capables de différentier les propriétés des objets (Gibson 1988). Cependant, l’amélioration avec l’âge de cette capacité à détecter l’information la plus utile n’a quasiment pas été étudiée chez les enfants plus âgés. Benguigui et al. (2008) ont montré que les enfants, jusqu’à l’âge de 10,5 ans utilisent plus souvent une variable spatiale qu'une variable temporelle pour estimer le temps de pré‐contact lorsqu’ils réalisent une tâche de jugement d’arrivée. Figure 19 : Moyenne (± std) des coefficients de corrélation (rup, rhp) entre la période du cycle de raquette (Tr) et chacune des deux variables informationnelles (tup, hp), pour les 4 groupes de participants (Bazile 2012). Les résultats de notre étude ont confirmé que les enfants utilisent plus l'information spatiale que l’information temporelle. Ainsi, si les adultes utilisent une information visuelle temporelle (tup), les enfants quant à eux utilisent majoritairement la hauteur de rebond (hp) pour contrôler la période d’oscillation de la raquette (Tr) même s’ils exploitent de plus en plus tup avec l’âge. La Figure 19 nous montre que le coefficient de corrélation entre la période de raquette et la hauteur de rebond (rhp) est plus élevé qu'entre la période et tup (rup), pour tous les groupes d’enfants. Contrairement aux résultats de Benguigui et al. (2008), les enfants de 11‐12 ans n’ont pas encore atteint le profil des 34 adultes. L’âge de transition entre l’utilisation d’une variable spatiale et une variable temporelle dépend sans doute de la difficulté de la tâche et n’a pas pu être déterminé dans notre expérience. Figure 20 : Valeurs individuelles des TDT (« time‐distance tendency »). Des valeurs négatives indiquent une utilisation préférentielle de la variable informationnelle hp tandis que des valeurs positives indiquent une utilisation préférentielle de tup dans le contrôle de la période de raquette (Bazile 2012). Des analyses individuelles ont été conduites afin de mieux comprendre la variabilité intra‐groupe en termes de distribution des couplages information‐mouvement impliqués dans le contrôle de la période de raquette. Pour ce faire, nous avons utilisé ici l’indice appelé « time‐distance tendency » (TDT) proposé par Benguigui et al. (2008). Cet indice correspond pour chaque participant à la soustraction des coefficients de corrélation rup ‐ rhp. Ainsi, et pour chaque participant, un TDT négatif traduit que la période de raquette est plus couplée avec l’information visuelle spatiale (hp) qu’avec l’information visuelle temporelle (tup) ; et inversement pour un TDT positif. Le calcul du TDT de chacun des participants a permis de montrer que pour 32 des 36 enfants âgés de 7 à 12 ans le couplage entre la hauteur de rebond de balle et la période d’oscillation de la raquette était plus important que celui entre la durée de la phase ascendante et la période (Figure 20). En revanche, 4 enfants appartenant au groupe d’âge de 11‐12 ans présentaient une corrélation rup supérieure à rhp. Pour ces 4 enfants, la transition du couplage entre la période et la variable informationnelle « erreur de rebond » à « durée de la phase ascendante de la trajectoire de balle » était déjà opérée. De la même manière que nous avons posé la question du développement des couplages information‐
mouvement impliqués dans la régulation de la période de raquette, nous avons également essayé d’identifier, chez l’enfant, les couplages information‐mouvement impliqués dans le contrôle de la variation de la vitesse de la raquette à l’impact par rapport à l’impact précédent (Vr) afin de corriger l’erreur de rebond à la cible (ε). Cependant, les corrélations entre Vr et les deux principales variables informationnelles (tup, hp) étaient vraiment faibles (r < .4), bien plus faibles que chez l’adulte. Il semblerait donc que cette deuxième loi de contrôle apparaisse bien plus tardivement que la première, à moins que nous n’ayons pas identifié la bonne variable informationnelle utilisée par les enfants (autre que tup ou hp). Cependant, cette hypothèse est moins probable. 35 Figure 21 : Modèle des 3 étapes de l’apprentissage (et du développement) d’une tâche visuo‐motrice. A. « Strengthening » : le renforcement d’un premier couplage entre une variable informationnelle (info1) et le mouvement (mov) qui devient plus fort avec la pratique (mais pas pour l’info 2, etc.). B. « Freeing » : l’individu peut passer d’un couplage à un autre. C. « Exploiting » : l’info 1 peut être utilisée pour différentes actions (mov1, mov2,etc.) et différentes informations (info1, info2, etc.) peuvent être utilisées pour le même mouvement (d’après Savelsbergh & van der Kamp 2000). Ces différents résultats peuvent être interprétés à la lumière du modèle de « freezing, freeing, exploiting » (Bernstein 1967), adapté par Savelsbergh et van der Kamp (2000) au contexte du développement (Figure 21). Les différents couplages information‐mouvement y sont assimilés aux degrés de liberté du modèle de Bernstein (nous reviendrons sur ce modèle dans la prochaine section dédiée à l’apprentissage moteur). Ainsi, d’après les auteurs, lorsque plusieurs informations sont disponibles pour le contrôle d’une certaine tâche sensorimotrice, le processus de développement commence par l'émergence et le renforcement d’un premier assemblage particulier entre une variable informationnelle et un paramètre du mouvement, ce qui permet aux enfants de répondre aux exigences de la tâche (la phase de « gel » ou « strenghtening »). Dans notre expérience, cela correspond à l’émergence chez les 7‐8 ans du couplage entre la hauteur de rebond de la balle et la période de raquette. Savelsbergh et van der Kamp (2000) ont également avancé qu'au cours de cette phase précoce du développement, un couplage alternatif n'est pas toujours disponible ou trop faible pour conduire à la réussite. La première variable utilisée n’est pas forcément la plus appropriée (efficace) pour réaliser l’action en question, mais elle est satisfaisante pour le jeune enfant. Puis, avec le développement ou la pratique, d’autres couplages information‐mouvement émergent. C’est la phase de « freeing ». Pendant cette phase, plusieurs couplages co‐existent. Il se pourrait ainsi que les enfants utilisent successivement différentes sources d’information au cours de la pratique et du temps, ou bien testent différentes lois de combinaison des informations disponibles dans 36 l’environnement. Enfin, les changements mènent à la dernière phase du développement, la phase d’« exploiting », dans laquelle la performance est caractérisée par l’exploitation des couplages information‐mouvement les plus efficaces. Cette capacité à prélever l’information optimale est observée chez les adultes qui utilisent la variable informationnelle tup qui spécifie la période de la balle Tb et permet de réguler la période de raquette et frapper la balle au « bon » moment. La Figure 22 est une application du modèle de Savelsbergh et van der Kamp (2000) à nos résultats. Figure 22 : Utilisation du modèle de Savelsbergh et van der Kamp (2000) pour modéliser le développement des couplages information‐mouvement dans le contrôle de la frappe cyclique de balle. Les enfants de 7‐8 ans utilisent la hauteur de rebond de balle (ou l’erreur de rebond) pour contrôler la période de la raquette. Ce couplage se renforce chez les enfants âgés de 9 à 12 ans, qui commencent également à pouvoir utiliser la variable informationnelle tup pour contrôler la période de raquette. Le contrôle de la vitesse à l’impact Vr émerge entre 9 et 12 ans, et se renforce entre 12 ans et l’âge adulte, sans doute à l’adolescence. 37 Résumé
L’objectif de la première des deux études présentées dans cette partie était de mieux comprendre la dynamique développementale du contrôle visuo‐moteur rythmique chez l’enfant âgé de 5 à 12 ans. Nos résultats ont confirmé que l’âge de 7‐8 ans est une période charnière du développement visuo‐
moteur. Tous les enfants sont d’abord confrontés à un rebond chaotique de la balle. Au fil des essais, les enfants de plus de 7 ans arrivent en moyenne à faire rebondir la balle comme les adultes, alors que les plus petits (5‐6 ans) restent plus en difficulté pour faire rebondir la balle à la hauteur demandée. Il est intéressant de constater qu’ils arrivent à augmenter progressivement la hauteur de rebond moyenne en augmentant la fréquence d’oscillation de la raquette. Cependant, le couplage entre la balle et la raquette est nettement plus faible chez les 5‐6 ans que chez les enfants plus âgés. La seconde étude avait pour objectif de caractériser, chez les enfants entre 7 et 12 ans, les couplages information‐mouvement impliqués dans le contrôle de la période de la raquette et de sa vitesse à l’impact. Même si des différences inter‐individuelles existent, les enfants utilisent préférentiellement la hauteur de rebond de la balle (hp) pour contrôler la période de la raquette, à la différence des adultes qui utilisent plutôt la demi‐période d’envol de la balle (tup). Les couplages information‐
mouvement impliqués dans le contrôle de la variation de la vitesse de la raquette à l’impact par rapport à l’impact précédent (Vr) afin de corriger l’erreur de rebond à la cible (ε) sont bien plus faibles que chez l’adulte. Il semblerait donc que ce deuxième couplage se développe bien plus tardivement que le premier. Ces résultats sont compatibles avec le modèle du développement des couplages information‐mouvement proposé par Savelsbergh et van der Kamp (2000). 38 1.5 Apprentissagemoteur
1.5.1
Apprentissaged’unenouvellecoordinationvisuo‐motriceetdécouvertedurégime
destabilitépassive
L’étude du contrôle de la frappe cyclique de balle m’a permis de m’intéresser également à la thématique de l’apprentissage moteur. Nous avons vu au paragraphe 1.2.3 sur le contrôle mixte de la frappe cyclique de balle que des individus sont capables d’exploiter les propriétés physiques intéressantes d’un système qu’ils contrôlent, sans connaître explicitement l’existence de ces propriétés. Ils ont en effet tendance à frapper la balle « dans » ou « à proximité » du régime de stabilité dynamique passive, ce qui est intéressant du point du vue du contrôle puisque cela permet sans doute d’alléger la quantité de régulation dans le mouvement de la raquette. Figure 23 : Introduction de différents délais entre la raquette réelle et la raquette virtuelle pour créer de nouvelles tâches motrices et étudier l’apprentissage de nouvelles coordinations visuo‐motrices (d’après Morice 2006) Avec mon premier doctorant Antoine Morice, ainsi qu’avec Benoît Bardy et William Warren, nous avons cherché à comprendre comment des individus, confrontés à une tâche motrice qu’ils ne connaissent pas, explorent puis découvrent justement ces propriétés physiques intéressantes pour arriver in fine à exploiter les solutions de stabilité grâce à un processus d’apprentissage moteur. Afin de créer des tâches sensori‐motrices « nouvelles » pour les participants mais dont nous, expérimentateurs, connaissions les propriétés dynamiques, différents délais t ont été introduits entre les mouvements de la raquette réelle et de la raquette virtuelle (t = 83.75, 167.5, 251.25, ou 335 ms). En imposant aux participants un rythme de raquette à l’aide d’un métronome, ce délai pouvait se traduire en termes de phases relatives entre les deux raquettes (45°, 90°, 135°, ou 180°) (Figure 23). Ainsi, pour que la balle soit toujours frappée pendant la phase ascendante de la raquette virtuelle et qu’elle puisse ainsi bien rebondir, les participants devaient apprendre à décaler les zones préférentielles de frappe dans le cycle de la raquette réelle, de 45° à 180° selon la phase relative imposée. Pour les phases relatives les plus grandes (135° ou 180°), ce décalage de la zone de frappe, voulu par l’expérimentateur, pouvait amener les participants à « frapper » la balle dans le 39 cycle descendant de la raquette réelle (Figure 23). Dans tous les cas, une nouvelle coordination entre la raquette réelle manipulée et la balle devait être apprise. Figure 24 : Conséquences de l’introduction d’un décalage temporel entre les deux raquettes sur (haut) la position du régime de stabilité passive dans le cycle de la raquette réelle et (bas) dans les cartes de Poincaré de premier ordre de l’espace des phases de l’impact (phase de l’impact dans le cycle i+1 en fonction de la phase dans le cycle i de la raquette réelle). Les zones gris foncé correspondent au nouvel attracteur sensori‐
moteur attendu dans la raquette réelle pour que le rebond de la balle soit dans le régime de stabilité passive de la raquette virtuelle. Les zones en gris clair correspondent à l’intégralité de la phase ascendante du cycle de raquette virtuelle qui permet de faire rebondir la balle. Le carré hachuré (en H) montre le régime de stabilité passive initial mis en évidence par Schaal et al. (1996). L’espace entre le carré hachuré (comportement initial théorique) et le petit carré gris foncé représente « l’écart » entre la coordination initiale et la coordination à apprendre (Morice et al. 2007). Depuis les premiers travaux de Kelso sur les coordinations bimanuelles (Kelso 1984), nous savons que les êtres humains sont capables de produire spontanément deux types de coordination intra‐ et inter‐segmentaires, dites « préférentielles » : le patron de coordination « en phase » (la phase relative entre les oscillations des segments est nulle) et le patron en « anti‐phase » (la phase relative est de 180°). Zanone et Kelso (1992; 1997) ont montré qu’il est possible d’apprendre à stabiliser un autre patron de coordination n’appartenant pas à ce répertoire initial. Cependant, la vitesse d’acquisition d’un nouveau mode de coordination dépend d’un processus de « compétition‐
coopération » entre le nouveau patron de coordination à apprendre et le répertoire initial de l’apprenant. Autrement dit, dans notre expérience, la dynamique d’apprentissage d’une nouvelle coordination entre la balle et la raquette réelle dépend à la fois de ce que le débutant sait déjà faire, et de la phase relative entre les deux raquettes à laquelle il est soumis. Citons également les travaux de Langenberg et al. (1998) qui ont étudié une tâche de poursuite visuo‐manuelle d’une cible en présence d’un délai. Les participants devaient suivre la cible, visible sur un écran et animée d’un mouvement sinusoïdal, à l’aide d’un curseur dont ils contrôlaient le mouvement grâce à un joystick. Comme dans notre expérience, un délai était introduit entre l’effecteur (joystick) et les conséquences visuelles du mouvement de l’effecteur (curseur). Pour toutes les fréquences de mouvement étudiées, 40 les relations de phase et les régularités spatiales avaient plus d’influence sur la vitesse d’apprentissage que la valeur absolue du délai introduit. De la même façon, nous avons fait l’hypothèse que les régularités spatio‐temporelles (phases relatives) entre les deux raquettes influenceraient la vitesse et peut‐être la nature de l’apprentissage. Dans notre expérience, 29 participants ont effectué 3 sessions expérimentales successives. Dans les Sessions 1 et 3, il n’y avait pas de délai introduit volontairement entre les mouvements des deux raquettes, hormis un délai intrinsèque (propre à notre système de RV) incompressible de 30 ms (soit 17° de phase relative). La Session 2 représentait la session d’apprentissage proprement dite. Les participants étaient répartis en 4 groupes, chaque groupe étant soumis à un délai donné pour correspondre à l’une des 4 phases relatives étudiées. La Figure 24 (A‐D) illustre les conséquences théoriques de ce délai sur la position du régime de stabilité passive dans le cycle de la raquette réelle4. Sur les courbes du cycle de raquette réelle, les portions en gris foncé correspondent aux moments où les impacts doivent avoir lieu pour que la balle soit frappée dans le régime de stabilité passive de la raquette virtuelle. On voit que ces portions de courbe se décalent d’autant plus que la phase relative entre les deux raquettes est grande. Pour les phases relatives de 45 et 90°, les participants pouvaient encore arriver à faire rebondir la balle s’ils la « frappaient » lors de la phase ascendante de la raquette réelle. En revanche, dans le cas des phases relatives 135 et 180°, les participants devaient « trouver » le « bon » moment de la frappe dans la phase descendante de la raquette réelle. La localisation temporelle des impacts était mesurée par les valeurs des phases de ces impacts dans les cycles de raquette5. Les cartes de Poincaré de premier ordre présentées à la Figure 24 (E‐H) sont utiles pour visualiser le déplacement du régime de stabilité passive dans l’espace des phases des impacts, en fonction des 4 phases relatives auxquelles les groupes de participants ont été soumis. Quelques précisions s’imposent ici pour expliquer comment ces cartes sont construites et se lisent, car nous nous en servirons ultérieurement pour visualiser deux exemples de dynamique d’apprentissage (Figure 27). Les coordonnées d’un point sur cette carte de Poincaré correspondent aux phases respectives de deux impacts successifs dans le cycle de la raquette réelle. Un point se situant dans le carré gris foncé représente l’occurrence de deux impacts successifs dans le régime de stabilité passive de la tâche à réaliser. Si un point se situe dans la zone gris clair, nous pouvons affirmer que les deux impacts ont eu lieu quand la raquette virtuelle était en train de monter. Ces impacts sont donc également viables 4
Nous n’évoquons pas le régime de stabilité passive dans le cycle de la raquette virtuelle, car il reste inchangé et le même pour toutes les conditions. Pour être dans ce régime, l’impact doit survenir quand l’accélération de la raquette virtuelle est négative et sa vitesse positive, ce qui correspond à un quart du cycle. Cette contrainte va induire l’apprentissage que nous mesurons en localisant la position des impacts dans le cycle de raquette réelle. 5
Le cycle de la raquette réelle servait de référence commune pour étudier et comparer les moments où survenaient les impacts dans le mouvement, exprimés par des variables de phases. Dans cette étude, un cycle de raquette réelle était défini entre deux minima de position successifs. Une phase d’impact p de 0° dans la raquette réelle correspondait donc à une frappe survenant au début de cycle, une phase de 180° au moment du maximum de position de la raquette, et une phase de 90° correspondait à une frappe au milieu de la montée de la raquette (approximativement à la vitesse maximale). 41 pour faire rebondir la balle correctement. A l’inverse, si un point de la carte se situe dans la zone blanche, cela signifie qu’au moins l’un des deux impacts a provoqué un rebond amorti de la balle. Sur la Figure 24H, la zone hachurée correspond à l’endroit où le participant frappe spontanément pour exploiter le régime de stabilité, avant d’être confronté à la présence du délai entre les deux raquettes. L’écart entre la zone hachurée et le petit carré gris foncé représente « l’écart » entre la coordination initiale et la coordination à apprendre. Figure 25 : Erreurs de rebond (ERRB) tracées en fonction du bloc d’essai pour les quatre groupes de participants (A à D) au cours des trois sessions expérimentales. Les barres verticales représentent l’erreur type de chaque valeur moyenne de bloc (Morice et al. 2007). La variable « erreur de rebond » nous a fourni un premier indicateur de performance pour étudier l’apprentissage. Par des ajustements de fonctions exponentielles, nous avons déterminé les constantes de temps  de l’apprentissage. L’apprentissage a été plus long pour les deux groupes qui ont dû inverser la relation spatiale entre les déplacements de la balle et de la raquette réelle, que pour les deux groupes qui ont pu continuer à frapper la balle dans la phase ascendante de la raquette réelle. De plus, nous avons observé que l’apprentissage était plus long pour une phase relative de 135° que 180°, même si le délai introduit y était moins important (Figure 25). Notre première conclusion à ce travail était que l’influence du délai n’est pas simplement linéaire (ce qui serait le cas si la durée d’apprentissage était proportionnelle au délai), mais que cette influence du délai est largement modulée par les régularités spatio‐temporelles de la coordination à apprendre (phase relative). 42 Figure 26 : Gauche : Histogramme des phases (P) de tous les impacts (cf. note de bas de page n°3) produits pour tous les participants à la Session 1. Droite : Histogrammes des phases des impacts pendant certains blocs d’essais de la Session 2 (de gauche à droite : du 1er au 5ème bloc et au 10ème bloc, de haut en bas : groupes 45°, 90°, 135° et 180°) (Morice et al. 2007) Les histogrammes de la Figure 26 illustrent la dynamique d’apprentissage dans les 4 groupes. Avant l’introduction des délais (Session 1), la distribution des phases des impacts présente un pic effilé autour de la phase à l’impact de 90°, ce qui représente le comportement de frappe moyen chez nos 29 participants. Lors de la Session 2, pour les phases relatives de 45° et 90°, la distribution uni‐
modale migre progressivement vers une nouvelle valeur de phase à l’impact, survenant plus tard à l’extrémité de la phase ascendante de la raquette réelle. Pour les phases relatives de 135° et 180°, le pattern de distribution est très différent. Au début de la Session 2, les distributions des phases à l’impact sont aplaties, ce qui correspond au fait que les participants sont initialement déstabilisés et qu’ils visitent la gamme complète des valeurs de phase lors des premiers blocs d’essais. Cependant, après deux ou trois blocs d’essais, un nouveau pic commence à émerger et s’effile pour présenter une zone de phase préférée clairement définie au cours des deux blocs suivants. Les participants arrivent de plus en plus à maintenir la frappe de la balle dans le nouveau régime de stabilité passive. L’inspection des cartes de Poincaré révèle un pattern similaire au sein des essais individuels. La Figure 27B nous montre le comportement d’un participant soumis à une phase relative de 180° entre les deux raquettes. Durant les 16 premiers essais, ce participant perd vraiment le contrôle de la phase à l’impact, explorant de ce fait les conséquences sur la balle des impacts survenant à différents moments du cycle de raquette. A ce premier stade de l’apprentissage, cette exploration est sans doute aléatoire, plutôt subie que recherchée. Avec la pratique, les zones d’impacts commencent à s’agglomérer avec une plus grande proportion autour de nouvelles valeurs de phase, survenant plus tard dans le cycle de la raquette réelle, lors de la phase descendante. Par comparaison, nous pouvons 43 observer à la Figure 27A que le comportement d’un participant soumis à un décalage de 90° est beaucoup moins chaotique. Figure 27 : Cartes de Poincaré de 1er ordre de l’espace des phases à l’impact dans la raquette réelle P (cf Figure 24) lors de la Session 2 (Essai 1 à Essai 49) d’un participant exposé à une phase relative de 90° (A) et d’un autre participant exposé à une phase relative de 180° (B). La ligne zigzaguant représente l’évolution des phases des impacts pour le rebond i+1 en fonction du rebond au cycle i, pour tous les rebonds de l’essai (Morice et al. 2007) 44 Les patterns d’apprentissage observés pour des valeurs importantes de phases relatives, lesquels impliquent le remplacement des phases à l’impact préférées par l’émergence et l’accentuation progressive d’autres valeurs de phase, reflètent la perte de stabilité d’un comportement perceptivo‐
moteur initial et la stabilisation d’un nouvel état (Zanone & Kelso 1992). Les nouvelles solutions peuvent être interprétées comme des attracteurs comportementaux dans le sens où les participants convergent vers une phase à l’impact préférée qui réduit la variabilité des performances et des comportements. Dans le cas présent, une recherche étendue et aléatoire de cet attracteur par les participants apparaît être un processus efficient d’exploration et d’identification d’une telle solution de stabilité. Goldfield et al. (1993) ont observé une exploration de l’espace des paramètres aussi étendue lors de l’apprentissage par de jeunes enfants d’un rebond stable lorsqu’ils étaient suspendus par un dispositif élastique. Les valeurs de rigidité des jambes et la fréquence d’impulsion étaient dispersées très largement, d’un bout à l’autre de l’espace des paramètres et convergeaient de manière soudaine vers une combinaison préférée lorsqu’ils commençaient à réaliser des rebonds réguliers. De tels résultats suggèrent une exploration non‐systématique, ou « aveugle » de l’espace des variables d’espace plus qu’une recherche focale, ou « systématique » des nouveaux attracteurs comportementaux (Newell et al. 1989). 1.5.2
Apprentissage de la marche athlétique: rôle de la dépense énergétique
métaboliqueetdelaperceptiondel’effort
Quelques années après la thèse d’Antoine Morice et notre expérience sur l’apprentissage d’un « nouvel attracteur » dans la tâche de frappe de balle, j’ai participé au co‐encadrement de la thèse de Lina Majed avec Anne‐Marie Heugas‐de Panafieu, ce qui m’a permis d’aborder la thématique de l’apprentissage moteur sous l’angle de l’influence des contraintes métaboliques sur cet apprentissage. Par l’étude de l’apprentissage de la marche athlétique, activité sportive réputée pour être coûteuse sur le plan énergétique, il s’agissait de déterminer si la recherche de minimisation de la dépense énergétique pouvait servir de principal stimulus pour guider l’apprentissage, tel que l’avaient défendu Sparrow et Newell (Sparrow 1983; Sparrow & Newell 1998) (Hypothèse 1). Dans cette hypothèse, l’effort perçu pourrait servir à l’apprenant d’indicateur sur la dépense énergétique concomitante à l’apprentissage (Sparrow et al. 1999) (Figure 28). L’alternative possible est que la minimisation de la dépense énergétique métabolique, qui est classiquement observée pendant l’apprentissage et la maîtrise du mouvement expert, ne soit « qu’une » conséquence de cet apprentissage qui est guidé par d’autres mécanismes (Hypothèse 2). En effet, conformément aux hypothèses de Bernstein (1967), l’expert réussit à mieux utiliser les forces musculaires internes (le cycle étirement‐détente) l’apprentissage permet une meilleure maîtrise des forces passives ainsi que l’exploitation des propriétés élastiques des muscles grâce à l’acquisition de nouvelles coordinations (Temprado & Montagne 2001, p 94). Une autre question abordée dans ce travail expérimental, qui est discutée dans la littérature depuis les travaux de Bernstein (1967), était celle de la maîtrise des d.d.l au cours de l’apprentissage. Le problème est celui de la redondance des d.d.l puisque, dans une activité motrice complexe, le 45 système présente davantage de d.d.l que nécessaires pour réaliser la tâche. Bernstein a proposé une description du processus d’apprentissage en trois étapes. Le débutant commencerait par figer ou coupler certaines articulations entre elles pour diminuer le nombre de d.d.l à contrôler et ainsi simplifier ce contrôle. Cette première phase, dite de « gel » des d.d.l (« freezing »), serait suivie par une phase de « libération » graduelle des d.d.l (« freeing ») et leur incorporation dans un système dynamique contrôlable. Les travaux de Vereijken et al. (1992) ont montré que c’est effectivement ce qui se produit lors de l’apprentissage d’une tâche s’apparentant à du slalom en ski. Il semblerait que cette augmentation du nombre de d.d.l mécaniques lors de l’apprentissage ne soit pas systématique. L’apprentissage d’autres tâches motrices se caractérise plutôt par une diminution des d.d.l (Newell & Vaillancourt 2001), mais il faut noter que différentes méthodes ont été utilisées pour caractériser l’évolution des d.d.l au cours de l’apprentissage. Dans notre étude, nous avons étudié les d.d.l dits « mécaniques », c’est‐à‐dire estimés à partir des amplitudes articulaires moyennes et de leur écart‐
type, et non les d.d.l « fonctionnels » dont je parlerai dans un des projets que je compte mener et décrit à la section 2.1. Figure 28 : Diminution concomitante de la consommation d’oxygène et de l’effort perçu lors de l’apprentissage de l’aviron (d’après Sparrow et al. 1999). La marche athlétique est un mode de locomotion sportive dans un cadre règlementaire strict, qui permet d’atteindre des vitesses élevées tout en maintenant un contact permanent au sol. La fédération internationale d’athlétisme (IAAF, 1995) définit la marche athlétique comme: « une progression de pas exécutés de telle manière que le marcheur maintienne un contact avec le sol sans qu’il ne survienne aucune perte de contact visible (pour l’œil humain). La jambe avant doit être tendue du moment du premier contact avec le sol jusqu’à ce qu’elle se trouve en position verticale » (Article 230). Bien que la marche athlétique ressemble à une marche normale exagérée, elle implique une organisation différente des segments corporels (cf Majed 2013 pour une revue de littérature), qui doit forcément être apprise. Cette activité sportive a été choisie pour notre étude car : 1) c’est une activité motrice complexe, dans la mesure où elle implique un grand nombre de d.d.l du corps entier, et qui nécessite un apprentissage, et 2) qu’elle est coûteuse sur le plan énergétique. En effet, dans une étude sur vingt marcheurs athlétique de compétition, Fougeron et al. (1998) montrent que le coût énergétique de la 46 marche athlétique est supérieur à celui de la course de marathoniens experts de même niveau de performance (Brisswalter & Legros 1992) aux mêmes intensités relatives d’effort (pourcentage de la VO2max). Figure 29 : Schéma du protocole expérimental de l’étude sur l’apprentissage de la marche athlétique (Majed et al. 2012). Après un test de VO2max, les participants ont réalisé un test visant à déterminer leurs vitesses de transition spontanée entre la marche et les course. Ces valeurs individuelles ont permis de calibrer les vitesses de pratique de la marche athlétique au cours des 7 sessions d’apprentissage. Un deuxième test de transition spontanée a été réalisé après la période d’apprentissage. Dans notre étude, sept participants, ayant une bonne condition physique, ont commencé un apprentissage de la marche athlétique, dont le protocole et les principales variables étudiées sont schématisés dans les Figure 29 et Figure 30. Ils devaient apprendre à marcher athlétiquement pour des vitesses supérieures ou égales à la vitesse de transition spontanée entre la marche et la course (VTS, ou PTS en anglais), qui était déterminée dans une session dédiée, avant les séances de pratique. Seules trois consignes étaient données, concernant le coude, le genou et l’attaque du pied au début du cycle. 47 Figure 30 : Schéma représentant les variables étudiées dans Majed et al. (2012) et pour lesquelles les principaux résultats sont rapportés dans ce document Outre des changements significatifs intervenant immédiatement dès la 1ère séance de pratique, nous avons observé que certaines variables de mouvement évoluaient significativement entre la 1ère et la 4ème séance de pratique (Figure 31 A‐E). Simultanément à cette réorganisation du mouvement, une tendance générale à l’optimisation métabolique a été observée (Figure 31 F‐G) ainsi qu’une diminution de l’effort périphérique perçu (Figure 31 H). En effet, ces variations concomitantes observées sur les graphiques étaient corroborées par des corrélations significatives entre une variable de mouvement dite « globale » (déplacement du haut du corps : STRN), le coût énergétique (EC) et l’effort périphérique perçu (PPE) (Tableau 1). Cependant, l’effet de l’apprentissage sur les variables métaboliques et l’effort perçu n’était significatif qu’à la 7ème séance. Cette apparition « plus tardive » des effets de l’apprentissage sur les variables physiologiques que sur les variables de mouvement pourrait suggérer que les variations des paramètres métaboliques seraient plus une conséquence de l’apprentissage moteur qu’une cause ou qu’un « guide »(stimulus) de celui‐ci. De plus, ces résultats réaffirment le rôle sans doute important que peut jouer la perception de l’effort périphérique (et non central) dans l’organisation générale du mouvement lors de l’apprentissage. La distinction entre la perception de l’effort central et périphérique s’avère pertinente. Toutefois, des recherches plus approfondies seraient nécessaires pour mieux comprendre l’origine, le rôle éventuel et la dynamique de ces variables de perception de l’effort dans le contexte de l’apprentissage moteur. L’analyse des amplitudes de déplacements angulaires et de leur variabilité (écarts‐types) a également montré que l’apprentissage, dans cette étude, s’effectuait selon une direction proximo‐
distale. Cependant, la diversité des résultats rapportés dans la littérature semble démontrer qu’il n’existe pas de direction universelle, et que la réorganisation des d.d.l dépend des contraintes de la 48 tâche (Newell & Vaillancourt 2001). Dans le cas présent, les articulations distales, telles que la cheville et le genou étaient fortement contraintes respectivement par le tapis roulant et par les consignes. Cela pourrait confirmer l’hypothèse de Teulier et Nourrit‐Lucas (2008) selon laquelle de fortes contraintes pourraient retarder l’émergence d’une coordination experte. *
*
*
*
*
*
*
*
Figure 31 : Effets significatifs de l’apprentissage sur les variables de mouvement (A‐E), physiologiques (F‐G) et sur l’effort périphérique perçu (H) (d’après Majed et al. 2012). STRN ECT VO2 PPE HR CPE STRN ECT VO2 PPE HR CPE ‐‐ 0.36* 0.11 0.44* <0.01 0.18 ‐‐
0.91*
0.53*
0.14
0.45*
‐‐
0.44*
0.37*
0.43*
‐‐
0.30
0.81*
‐‐
0.07 ‐‐ Tableau 1 : Coefficients de corrélation entre les variables suivantes : déplacement vertical du sternum (STRN), coût énergétique (ECT), consommation d’oxygène (VO2), l’effort périphérique perçu (PPE), l’effort central perçu (CPE), et fréquence cardiaque (Majed et al. 2012). 49 Une des limites de ce travail est que nous sommes restées à un niveau empirique et très descriptif des coordinations, en multipliant les variables cinématiques et physiologiques étudiées sans réussir à intégrer les résultats dans un modèle théorique. Concernant la réorganisation du mouvement, il eut été intéressant de pouvoir mettre en évidence la réduction de dimensionnalité autour d’un tout petit nombre de variables collectives, ce qui pourrait aller de pair avec une marche plus économique au fil de l’apprentissage. Notre analyse de la stabilité des coordinations est restée également assez pauvre avec la mesure très classique de l’écart‐type. Dans le cadre de la thèse de Lina Majed, nous avons réalisé une deuxième expérience d’apprentissage de la marche athlétique, au cours de laquelle nous avons enregistré les 4 premières séances d’apprentissage (contrairement à la première étude où les séances 2 et 3 n’avaient pas été enregistrées). Un de mes projets à court terme est d’utiliser l’analyse factorielle (ACP) pour analyser ces données et d’étudier de façon plus satisfaisante comment varie la dimension6 du système au cours de l’apprentissage. 6
La dimension d’un système renvoie à la notion de d.d.l fonctionnels, dont je parlerai dans la description du projet. 50 Résumé
L’introduction d’un délai entre les raquettes réelle et virtuelle nous a permis de créer une tâche motrice inédite et d’étudier le processus d’apprentissage d’une nouvelle coordination visuo‐motrice entre la raquette manipulée et la balle. Les régularités spatio‐temporelles (phases relatives) modulent la difficulté de la tâche, provoquée par ce délai. Ainsi, à partir d’une phase relative supérieure à 90°, les participants ont été initialement très déstabilisés car, sans aucune indication de la part de l’expérimentateur, ils devaient apprendre à frapper la balle pendant la phase descendante de la raquette réelle. L’apprentissage de la coordination correspondant à une phase relative 180° entre la balle et la raquette a été plus rapide que celui de 135°, car la coordination en anti‐phase (180°) appartient au répertoire intrinsèque des coordinations intra‐ et inter‐segmentaires des êtres humains. La déstabilisation initiale se matérialisait par un rebond chaotique de la balle, qui survenait dans la gamme complète de l’espace des phases possibles [0‐360°]. Cette expérience a permis d’observer et de caractériser un apprentissage où les participants réalisent une exploration « aléatoire » (ou plutôt paraissant comme telle puisque chaotique) de l’espace des variables, plus qu’une recherche focale, ou « systématique », des nouveaux attracteurs comportementaux (Newell et al. 1989). La deuxième étude a concerné l’apprentissage de la marche athlétique (MA), qui est une activité motrice complexe car impliquant un grand nombre de degrés de liberté (d.d.l), et coûteuse en énergie métabolique. L’analyse des variables de mouvement a montré que l’apprentissage de la MA s’effectue selon une direction proximo‐distale. Simultanément à cette réorganisation du mouvement, une tendance générale à l’optimisation métabolique a été observée ainsi qu’une diminution de l’effort périphérique perçu. Cependant, l’effet de l’apprentissage sur les variables métaboliques et l’effort perçu n’a été significatif qu’à la 7ème séance, contrairement à l’effet sur le mouvement qui est devenu significatif dès la 4ème séance. Cette apparition « plus tardive » des effets de l’apprentissage sur les variables physiologiques pourrait suggérer que les variations des paramètres métaboliques seraient une conséquence de l’apprentissage moteur, et non ce qui guide celui‐ci, comme proposé par Sparrow et Newell (1998). Ce travail doit être poursuivi pour savoir si l’apprentissage de la MA consiste en la réduction du nombre de d.d.l contrôlés indépendamment. 51 1.6 Questionsouvertes
Peut‐on trouver d’autres expressions des lois de contrôle de la frappe cyclique de balle ? Les lois de contrôle que nous avons mises en évidence mettent en relation des propriétés de l’environnement, la durée d’envol de la balle et l’erreur à la cible, avec des variables cinématiques de la raquette. Même si nous avons montré que les participants exploitent principalement tup, variable informationnelle qui spécifie la durée d’envol de la balle, pour contrôler de la période de raquette, cela n’exclut pas complètement les autres variables informationnelles disponibles, et notamment celles disponibles pendant la chute de la balle comme tau‐gap. Nous devons encore comprendre comment sont réalisés les ajustements fins et tardifs du cycle de raquette juste avant l’impact, quelles sont les variables informationnelles utilisées pour ces ajustements, et comment celles‐ci sont combinées (Bruno & Cutting 1988; Temprado & Montagne 2001). Nous pouvons également discuter de la pertinence des variables du mouvement qui ont été identifiées. Les variables cinématiques de la raquette (période et vitesse au moment de l’impact) sont le fruit du couple articulaire au niveau du coude7. Ce couple articulaire, ou moment net, correspond à la somme des moments de force musculaires, du moment gravitaire et des moments d’interaction8. Je pense qu’il serait souhaitable de trouver une expression des lois de couplages qui soit plus en rapport avec les moments de force ou l’accélération. Figure 32 : Vitesse de la raquette au cours des cycles moyens de deux participants confrontés à des conditions différentes. A. Dans cette condition, le parti‐
cipant doit réguler le timing de l’impact sans modifier la vitesse de frappe. B. Dans cette con‐
dition, le participant doit modifier la vitesse de frappe sans changer le timing de l’impact ( moment de l’impact, + moment où la balle atteint sa hauteur maximale) Dans ce souci‐là, nous avons bien tenté de comprendre comment l’accélération de la raquette est régulée sur la base de l’information visuelle, car pour faire varier la période de la raquette et la vitesse à l’impact, il est évident que l’accélération est régulée. S’il fallait s’en convaincre, nous 7
Nous demandions à nos participants de produire le mouvement de la raquette en bougeant l’avant‐bras autour du coude et non pas le poignet. 8
Par exemple, le mouvement de l’épaule génère un moment au niveau du coude. 52 pouvons regarder la Figure 32. Cette figure illustre la vitesse de la raquette au cours du cycle moyen produit par un participant qui doit raccourcir ou rallonger la période de raquette afin de pouvoir frapper une balle dont la durée d’envol a été perturbée. Le participant régule l’accélération de la raquette dans la phase ascendante jusqu’au moment de l’impact. Nous n’avons pas réussi à trouver de corrélations entre des valeurs d’accélération de la raquette mesurées à différents moments‐clés du cycle et des variables informationnelles ; et ces analyses ne figurent donc pas dans nos papiers. Cependant, il s’agissait de valeurs d’accélération mesurées dans un référentiel cartésien (X, Y, Z). Il serait plus intéressant de mettre en relation l’accélération angulaire du coude avec les variables informationnelles, ce qui nécessiterait de mesurer tout le mouvement du bras. Nous avons récemment réalisé une telle expérience en collaboration avec Brice Isableu et son ancien doctorant Clint Hansen. Les modèles par dynamique inverse nous permettent de calculer les différents moments de forces au niveau du coude, en plus de l’accélération angulaire du coude, mais nous n’avons pas encore eu le temps de traiter ces données, que j’espère prometteuses. Pour gagner en compréhension, il faudrait également étudier comment les deux lois de contrôle peuvent être combinées pour produire à la fois des régulations du timing et de la vitesse de frappe, voire également de la phase de l’impact dans le cycle pour exploiter le régime de stabilité dynamique passive. Dans une tâche de jonglerie réaliste, si la balle monte trop haut par rapport à la hauteur de consigne, le participant doit à la fois ralentir le geste (car la durée de trajectoire de la balle est plus grande) et produire une vitesse plus faible au moment de l’impact pour corriger l’erreur de rebond, ce qui semble compatible (un oscillateur dont la période augmente, voit également la vitesse maximum diminuer). Cependant, nous avons pu constater dans nos expériences où des perturbations non réalistes étaient générées grâce aux changements de la gravité (par exemple, durée d’envol augmentée sans perturbation de la hauteur de rebond) que les participants étaient capables de ralentir le geste sans diminuer la vitesse de frappe et vice‐versa comme le montre la Figure 32. Une telle dissociation est‐elle réellement possible à l’échelle d’un cycle de raquette, ou bien le résultat montré par cette figure n’est‐il qu’un artefact produit par le moyennage d’un grand nombre de cycles ? Pour progresser sur cette question, il serait nécessaire de trouver des solutions mathématiques théoriques, de développer un modèle, et de pouvoir simuler la cinématique de la raquette afin de la confronter aux données empiriques. Nous savons que les participants commencent à réguler le geste à peu près au moment où la balle atteint sa hauteur maximale (donc avant la fin de la phase descendante). Existe‐t‐il une ou des fonctions temporelles de l’accélération entre ce moment et le moment de l’impact qui permettent de remplir les contraintes spatio‐
temporelles de la tâche, tout en gardant à l’esprit que le geste accompli n’est pas nécessairement optimum à chaque cycle ? Si tel était le cas, il faudrait chercher les solutions les plus « biologiquement » probables, et non pas les plus exactes au sens de la performance car nous savons bien que les individus n’ont pas des réponses motrices parfaites (la hauteur du rebond reste toujours assez variable). La collaboration que je compte initier avec des roboticiens pourra, je l’espère, nous faire progresser sur ces aspects de modélisation de la dynamique du geste. 53 Calibration et apprentissage moteur Par quels processus l’adulte parvient‐il à exploiter des lois de contrôle qui sont propres à une tâche sensorimotrice et éventuellement dépendantes des conditions environnementales (ex : le type de balle qu’il faut faire rebondir) ? Cette question est vaste et peut renvoyer à différentes thématiques. Nous pouvons d’une part nous intéresser aux notions de calibration et d’apprentissage chez l’adulte, à la question du développement de ces lois au cours de l’enfance, ainsi qu’aux mécanismes de l’éducation de l’attention pendant l’apprentissage ou le développement. Parmi les deux lois de contrôle que nous avons mises en évidence, celle du contrôle de la vitesse à l’impact Vr en fonction de l’erreur de rebond  doit nécessairement être calibrée au début de l’action. En effet, les paramètres de cette loi (Equation 3, page 29), c’est‐à‐dire la pente et l’intercept de la fonction linéaire, dépendent des paramètres du système balle‐raquette (ex : élasticité de la balle) et de la tâche (ex : hauteur de la cible à atteindre). Par exemple, si une balle n°2 rebondit « moins » qu’une balle n°1, il faudra produire plus de variation de vitesse pour cette balle n°2 que pour la balle n°1 afin de corriger une erreur identique. Il pourrait donc être intéressant d’étudier cette phase de calibration d’une loi de contrôle. Figure 33 : Moyenne (± écart‐type) des pentes et des intercepts de la relation de la relation linéaire en Vr et à partir des 5 premiers essais de familiarisation de 30 participants. Chacune des 35 régressions linéaires est calculée à partir de 6 impacts successifs. La variation de la pente semble être linéaire dans cette échelle de temps, tandis que la variation de l’intercept semble être exponentielle (courbes rouges). Par curiosité, j’ai analysé les cinq premiers essais réalisés par les 30 participants novices de l’expérience de Morice et al. (2007). A partir de 42 impacts de chaque essai (soit 42 binômes de valeurs (, Vr)), j’ai calculé des régressions linéaires sur la base de 6 frappes successives (soit 7 régressions par essai, et 35 au total) pour voir comment évoluaient les valeurs de pente et de l’intercept. Chaque régression me permettait de faire une estimation des paramètres de la loi de contrôle utilisée à ce moment‐là. Les résultats de cette petite analyse sont présentés à la Figure 33. Nous y voyons qu’il y a bien une évolution rapide des paramètres de la loi étudiée. La valeur de l’intercept semble converger rapidement, au 3ème essai de 60 s, vers une valeur limite. Ce n’est pas le 54 cas de la calibration du paramètre « pente » qui semble plus longue. Creuser cette question de la calibration des lois de contrôle nécessiterait bien sûr de réaliser un protocole spécifique, où les propriétés du système balle‐raquette et de la tâche seraient manipulées par l’expérimentateur. Une phase de calibration consiste donc pour l’opérateur à « trouver » les bonnes valeurs d’une loi dont la nature est déjà connue, établie. Ainsi, dans le cas que nous venons de citer, l’adulte « sait » déjà qu’il faut frapper la balle avec une plus grande vitesse si à l’envol précédent la balle n’est pas montée assez haut. Il n’a « plus qu’à » affiner la relation entre l’information prélevée et le mouvement à réaliser pour répondre à une contrainte de la tâche (par ex : stabilité, précision). Dans le cas où la nature de la loi lui est inconnue, il/elle devra réaliser un apprentissage. Dans l’expérience où nous avons introduit un délai entre la raquette manipulée par l’opérateur et la raquette virtuelle, les lois de contrôle étaient alors inconnues des participants. Il leur fallait établir de nouvelles relations entre des informations prélevées dans le mouvement de la balle et leur propre mouvement. Dans le cas de l’étude de l’apprentissage d’une nouvelle loi, le chercheur peut vouloir s’intéresser à différents aspects, par exemple à l’éducation de l’attention (Gibson 1983, p 51). Il s’agit dans ce cas d’étudier comment l’apprenant découvre, parmi toutes les variables informationnelles disponibles, la ou les variables qui vont spécifier les propriétés du Système Acteur‐Environnement (cf. partie 1.3) et guider le plus efficacement son mouvement. Ce n’est pas l’option que nous avons choisie, dans notre étude sur l’apprentissage moteur chez l’adulte. Nous avons cherché à comprendre, comment certaines propriétés spatio‐temporelles de la nouvelle tâche à apprendre (phase relative, délai constant) pouvaient influencer la dynamique d’apprentissage. En fonction de ces caractéristiques spatio‐temporelles, certaines de ces nouvelles tâches motrices avaient pour conséquence de complètement déstabiliser la performance initiale des participants car les coordinations balle‐
raquette à apprendre étaient très différentes de celle déjà connue par les participants. Dans ces cas, les participants subissaient un rebond chaotique de la balle et les impacts parcouraient ainsi tout l’espace des phases possibles… la nouvelle solution motrice pouvait émerger quand la balle tombait par hasard dans le nouvel attracteur de la tâche. Exploration des contraintes de la tâche par l’adulte débutant et l’enfant A l’instar de l’adulte qui subit un rebond chaotique de la balle au cours de l’apprentissage d’une nouvelle coordination balle‐raquette, l’enfant est confronté à ce phénomène de rebond chaotique quand il découvre la tâche de frappe cyclique de balle. Les adultes débutants et les enfants doivent apprendre à coordonner leurs gestes avec un objet extérieur qui possède sa propre dynamique. Ne connaissant pas initialement la dynamique de l’interaction balle‐raquette ou la dynamique de la balle, ils ne contrôlent pas volontairement le moment où la balle va tomber sur la raquette. La balle tombera donc à différents moments du cycle de raquette, raison pour laquelle nous pouvons parler d’exploration passive de l’espace des phases. Cette exploration passive est vraisemblablement combinée avec une exploration active, volontaire. Le comportement d’exploration est une notion importante dans les théories écologiques et dynamiques de l’apprentissage (Newell et al. 1989) et du développement (Gibson 1988). Dans le contexte de la perception des affordances, ou possibilités 55 d’action, Michaels et Carello (1981) insistent sur la nature « active » de ce comportement d’exploration : “Exploration (attention) is not an unconscious shifting‐through and subsequent rejection of most inputs: it is directed control of what will be detected”. Dans notre étude sur le développement, nous avons observé que les enfants les plus jeunes avaient progressivement augmenté la fréquence du geste de la main pour réussir à faire rebondir la balle plus haut. Ce changement de comportement pourrait être le résultat d’une exploration active de leur part. Cependant, l’augmentation de cette fréquence pourrait également être favorisée par une contrainte liée l’organisme : les enfants présentent un tempo moteur spontané (« spontaneous motor tempo ») d’autant plus rapide qu’ils sont petits (Drake et al. 2000). Cette observation pourrait nous inciter à refaire une expérience en frappe cyclique de balle en adaptant la hauteur de la cible de sorte à ce que la contrainte rythmique imposée par la tâche soit plus en rapport avec les dispositions de l’enfant. Nous nous étions initialement posés la question de comment adapter la tâche en fonction des groupes d’âges, mais nous n’avions pas alors trouvé de réponse satisfaisante et avions in fine pris le parti de ne pas l’adapter du tout. Ayant pris connaissance, depuis, de ces résultats sur les rythmes spontanés de l’enfant, je pense qu’il serait important d’en tenir compte si nous devions mener d’autres expériences similaires. Le fait de présenter une cible plus basse aux jeunes enfants leur demanderait de réaliser l’oscillation de la raquette avec une fréquence proche de leur rythme moteur spontané, mais requerrait également une vitesse de la raquette moins élevée, et donc plus en rapport avec la taille de leur bras et leur force. L’amélioration de la performance au cours des sessions expérimentales prouve que les adultes novices ou les enfants arrivent à trouver des solutions sensorimotrices, grâce à ces explorations actives ou passives, qu’il s’agisse d’une phase de simple calibration ou d’apprentissage. Cependant, la solution trouvée et la rapidité avec laquelle ils la trouvent dépendent bien des propriétés dynamiques de la tâche à effectuer (ex : rôle de la phase relative) et de l’âge du participant. Comme nous l’avons vu précédemment, les petits trouvent une solution qui n’est pas forcément « idéale », mais qui est suffisante pour améliorer la performance. Ils mettent aussi plus de temps pour converger vers un comportement stable. La capacité à « explorer » et découvrir les nouvelles solutions est justement une aptitude qui se développe au cours de la croissance (Gibson 1988). Développement et lois de contrôle Si nous avions adapté les contraintes de la tâche à l’organisme des enfants comme évoqué ci‐dessus, il n’est pas impossible que la performance des plus jeunes enfants eut été un peu meilleure. Il n’en demeure pas moins que les couplages information‐mouvement se développent dès chez le bébé, puis au cours de l’enfance. De plus, en fonction de leur âge, les enfants ne sont pas forcément sensibles aux mêmes informations que les adultes pour réguler leur mouvement. Nous avons montré que les enfants sont plus sensibles à une information spatiale (erreur de rebond) qui n’est pas aussi optimum que l’information temporelle utilisée par les adultes. Le fait que le groupe des 5‐6 ans 56 présentait un comportement qualitativement différent de celui des enfants plus âgés peut être mis en relation avec une série d’études qui a montré qu’avant l’âge de 8 ans, les enfants s’appuient essentiellement, non pas sur les afférences visuelles, mais sur les afférences haptiques dans le cadre d’une réalisation perceptivo‐motrice (Manyam 1986; Hay et al. 1991; Lantero & Ringenbach 2007). Ainsi, si la tâche de frappe cyclique de balle a été choisie afin de limiter le nombre de degrés de liberté sensorimoteurs, l’absence de retour haptique a pu priver les participants les plus jeunes d’une information haptique essentielle pour eux dans le cadre de la réalisation de la tâche. Nous pourrions donc tester cette hypothèse en utilisant un petit bras à retour d’effort (Phantom Omni), dont le laboratoire a récemment fait l’acquisition. Il convient néanmoins d’avoir un regard critique quant à l’utilisation de notre environnement virtuel. Regard critique sur l’environnement virtuel L’utilisation de la réalité virtuelle a bien sûr été incontournable dans le cadre de travaux présentés ici. Sans elle, nous n’aurions pu manipuler et dissocier les informations visuelles qui sont naturellement couplées, grâce aux modifications de la gravité et du coefficient de restitution. Si l’on met de côté la question du délai du système que nous avons déjà discutée dans la partie 1.2.4, deux autres questions principales peuvent être soulevées : 1) Cela pose‐t‐il un problème de changer la gravité « visuelle » sans changer la gravité « physique » ?, 2) Quel problème cela pose‐t‐il de ne pas fournir de retour haptique au moment de l’impact de la balle sur la raquette ? Concernant la gravité, il n’est bien sûr pas possible de changer la gravité physiquement ressentie par les participants grâce au système proprioceptif (dont vestibulaire). Nous avons donc introduit un conflit entre la gravité perçue visuellement et celle perçue avec le système proprioceptif. Les participants ne semblent pas avoir été du tout gênés par les changements de la gravité visuelle, pas plus que les changements du coefficient de restitution. Ceux qui ont perçu des perturbations les ont interprétées en termes de modifications de la masse de la balle (ou de son « poids » en langage commun). Le fait que les participants n’aient pas été perturbés par ce conflit renforce l’idée qu’un modèle interne de la gravité n’est pas nécessaire pour exécuter la tâche de frappe cyclique de balle. L’absence de restitution haptique de la force de l’impact est à mon avis plus problématique. Nous venons de citer le fait que cette absence de retour haptique au moment de l’impact a pu pénaliser certains enfants. Qu’en est‐il de l’adulte ? Dans l’ensemble des expériences de frappe cyclique de balle que nous avons menées, les valeurs de l’accélération de la raquette au moment de l’impact étaient moins systématiquement négatives que ce qu’a observé l’équipe de Dagmar Sternad. Autrement dit, l’exploitation du régime de stabilité semble un peu moins systématique chez nos participants. Certes, leur niveau d’expertise explique pour partie cette différence dans nos résultats respectifs, mais les différences entre les postes expérimentaux peuvent également expliquer ces différences dans nos résultats. Dans le poste expérimental utilisé par l’équipe de Dagmar Sternad, la raquette est reliée par une tige métallique à un système qui permet à la fois de mesurer son mouvement et de freiner la raquette au moment de l’impact de la balle virtuelle sur la raquette virtuelle, pour permettre une restitution haptique de l’impact. D’après Sternad et al. (2001), la 57 présence d’un retour haptique au moment de l’impact aide les participants à exploiter le régime de stabilité. Nous allons très prochainement pouvoir vérifier ce résultat grâce au Phantom Omni, déjà mentionné ci‐dessus, qui est un système à retour d’effort. De plus, cette interface mesure la position (et la vitesse) à une fréquence nettement plus élevée (1000 Hz) que le système électro‐magnétique que nous avons utilisé jusqu’à présent (120 Hz). Cela nous permet de penser que les valeurs d’accélération seront plus fiables, et donc peut‐être plus négatives. Cela pose donc aussi la question du rôle respectif des différentes modalités sensorielles, et de leur intégration. Sur ce thème, dans le cadre d’une collaboration avec Dagmar Sternard, William Warren, et Kunlin Wei, nous étudions l’effet de la combinaison de différentes modalités sensorielles (vision, audition, sens haptique) sur la frappe cyclique de balle. Que nous apprennent les robots jongleurs développés récemment ? La question du contrôle dans la tâche de frappe cyclique de balle continue d’être surtout investie par les chercheurs en robotique, car la combinaison d’un évènement discret (l’impact) dans un mouvement continu (la trajectoire de raquette) constitue pour les automaticiens et roboticiens une problématique spécifique. Dans le cadre de la théorie du contrôle optimal (Todorov 2004), Kulchenko et Todorov (2011) ont proposé un modèle à commande prédictive (« Model‐predictive control », MPC) pour commander un robot jongleur. A chaque période d’échantillonnage du contrôleur, l’optimisation est réalisée en temps réel, alors que le comportement a lieu, pour calculer la future trajectoire optimale jusqu’à un horizon de temps donné. D’après Kulchenko et Todorov (2011), le MPC a été rarement utilisé pour commander des robots. La visualisation du robot jongleur (surface qui oscille verticalement) grâce à une vidéo en ligne associée à l’article est assez impressionnante, car le robot est capable de jongler avec deux balles et répond apparemment très bien à de grosses perturbations (http://notebook.kulchenko.com/juggling/robot‐juggles‐two‐ping‐pong‐balls). Cependant, comme on le voit sur la Figure 34 (courbe bleue), le mouvement de la raquette est très saccadé et ne ressemble pas au mouvement produit par l’être humain. En effet, à une fréquence similaire de 2 Hz, nous avons observé dans nos expériences que le mouvement humain dans cette tâche est beaucoup plus sinusoïdal. Dans les perspectives de ce travail, Kulchenko et Todorov (2011) déclarent justement vouloir comparer la performance du robot à celle de jongleurs humains pour rapprocher leur modèle de coût à celui que peuvent utiliser les individus. 58 Figure 34 : Gauche : Illustration du mouvement de la raquette et de la balle du robot jongleur de Kulchenko et Todorov (2011). Droite : Photo du robot jongleur. Ronsse et al. (2010) ont également proposé un modèle de la frappe cyclique et comparé les simulations de leur modèle à la performance humaine, simulations qui me semblent qualitativement plus satisfaisantes (Figure 35, cf. courbe jaune qui correspond à g = 9.81 m/s²). Ce modèle comporte deux couches. La première utilise la hauteur de rebond pour calculer la valeur attendue de la vitesse de la raquette au prochain impact, et la deuxième couche calcule la trajectoire optimum de la raquette permettant d’atteindre cette vitesse au moment où la balle retombera. Figure 35 : Cycles moyens de la position (A) et vitesse (C) de la raquette en fonction du temps (normalisé), dans 7 conditions de gravité différentes (g1=0.61 m/s² ; g7= 9.81 m/s²). Ces cycles de position et de vitesse peuvent être confrontés à ceux obtenus (B et D, respectivement) par un modèle de la frappe cyclique de balle (Ronsse et al. 2010). Comme nous le verrons dans la partie « Projets » de ce document, je prévois de collaborer avec des roboticiens pour que l’on développe ensemble une version plus « biofidèle » d’un robot jongleur. 59 Et la marche athlétique ? Il n’est pas évident d’établir des liens entre les résultats portant sur la frappe cyclique de balle et sur l’apprentissage d’une tâche motrice complexe telle que la marche athlétique. Il y a certes des pans communs de littérature que nous pouvons invoquer pour ces deux thématiques, mais j’estime que le travail portant sur les déterminants énergétiques de l’apprentissage moteur n’est pas encore assez complet et abouti pour tenter de tirer des enseignements ou conclusions qui risqueraient, pour l’instant, d’être fantaisistes. Etant donnée la lourdeur de l’expérience multidisciplinaire d’apprentissage de la marche athlétique et du traitement qui lui était associé (développement de tous les programmes d’analyse du mouvement par l’étudiante), nous n’avons pas eu le temps, pendant la thèse de Lina Majed, de dépasser le stade d’une analyse relativement descriptive des résultats. Nous avons étudié l’influence de la pratique sur un grand nombre de variables, comparé l’évolution des variables de natures différentes (mouvement, physiologie et perception de l’effort) et cherché à identifier les grandes étapes de l’apprentissage en nous inspirant largement des travaux de Karl Newell et collaborateurs. Je souhaite poursuivre cette thématique de recherche. L’étape suivante consiste à identifier et dénombrer les variables collectives du système pour comprendre comment varie la dimensionnalité du système au cours de l’apprentissage. Nous avons déjà commencé à tester l’utilisation des Analyses en Composantes Principales (ACP) dans cet objectif. Les résultats préliminaires sont prometteurs. Etant donné qu’il s’agit là du projet qui est le plus abouti parmi ceux sur lesquels je travaille actuellement, je commencerai le chapitre portant sur mes projets scientifiques par celui‐ci, en suivant ainsi une logique chronologique. 60 2. Projetsderecherche
J’ai choisi de vous présenter ici trois projets scientifiques distincts. La logique de présentation est simplement chronologique. Les deux premiers projets concernent en fait des études sur lesquelles je travaille actuellement et qui se situent dans la suite logique des travaux présentés dans le premier chapitre de ce document. Je présenterai d’abord l’étude sur l’évolution du recrutement des degrés de liberté au cours de l’apprentissage car c’est la plus avancée des études en cours, puis une étude portant sur les stratégies oculomotrices pendant la frappe cyclique de balle. Le troisième projet est un projet à plus long terme qui m’amènera, grâce à des collaborations avec des roboticiens, à utiliser des simulations de robotique bio‐inspirée offrant de nouvelles perspectives pour progresser dans la compréhension du contrôle moteur. 2.1 Y a‐t‐il réduction ou augmentation de la dimensionnalité du contrôle
aucoursdel’apprentissagedelamarcheathlétique?
Un de mes projets à court terme est d’utiliser l’Analyse en Composantes Principales (ACP) pour progresser dans mes recherches sur l’apprentissage des habilités motrices complexes. Depuis une vingtaine d’années, ce type d’analyse a souvent été utilisé pour l’étude de la locomotion (Borghese et al. 1996), et plus récemment pour celle de l’apprentissage moteur (Chen et al. 2005; Hong & Newell 2006), mais je pense que beaucoup reste à faire. L’étude des tâches motrices impliquant un grand nombre de degrés de liberté, rendue possible par le développement des technologies d’acquisition du mouvement, a été un facteur favorisant l’utilisation de méthodologies statistiques corrélationnelles permettant de réduire la complexité. En effet, l’ACP permet justement de réduire le nombre de dimensions nécessaires pour décrire un processus multidimensionnel. L’intérêt d’utiliser cette méthode est de pouvoir se poser la question de savoir si un ensemble de données comprenant un grand nombre de variables peut être représenté par seulement quelques sources de variance commune dites « composantes principales », qui contiendraient l’information essentielle de l’ensemble des données. Le groupe des composantes principales (Pj) capture l’essentiel de la variance des données d’entrée (Xi), suivant des directions orthogonales (les composantes principales ne corrèlent pas entre elles) ; ces composantes sont ordonnées en fonction de l’amplitude des variations qu’elles « expliquent ». La première composante explique la plus grande variance, la deuxième composante la deuxième plus grande variance, etc. S’il y a des relations linéaires entres les variables d’entrée, la réduction de dimensions dans les données sera importante. La composante principale Pj est simplement une combinaison linéaire des variables originales Xi : Pj  a j1 X1  a j2 X2  ...  a jN X N avec a ji ²  1 . Les coefficients a ji , i  1,...,N sont appelés les i
poids factoriels (« factor loadings »). L’amplitude des a ji est indicative de la quantité de variance dans la variable Xi qui est capturée par la composante principale Pj. Pour un ensemble de données, l’ACP produit un résultat unique. 61 Les premières études utilisant l’ACP ont principalement porté sur la marche normale et pathologique (revue proposée par Chau 2001). Chau (2001) explique que la réduction de dimensionnalité apportée par l’ACP doit pouvoir faciliter l’interprétation des données quand il y a un grand nombre de variables. Ainsi, Olney et al. (1998) ont enregistré la marche de 34 patients ayant eu une attaque cérébrale et ont réalisé des ACP sur une quarantaine de variables cinématiques et cinétiques. Ils ont trouvé 4 composantes principales identifiées de la façon suivante : (1) vitesse, (2) asymétrie entre les deux côtés, (3) biais de flexion posturale, (4) non interprétable. Un petit nombre de sources de variance (composantes) permettent de caractériser la marche normale. Ainsi, à partir des positions tridimensionnelles de 23 marqueurs, Daffertshofer et al. (2004) trouvent 4 composantes principales : les composantes principales 1 et 3 reflètent principalement les mouvements du pied et du bras, incluant toutes les composants qui oscillent à la fréquence du pas. Les composantes principales 2 et 4 semblent osciller à une fréquence deux fois plus élevées que celle du pas, reflétant la flexion du genou et de la cheville. Le problème de la redondance des degrés de liberté décrit par Bernstein (1967) trouve dans l’ACP une méthodologie permettant d’étudier l’hypothèse selon laquelle le contrôle pourrait s’effectuer par l’intermédiaire d’un nombre limité de variables de contrôle (les composantes principales) grâce à l’existence de synergies entre les différentes composantes du système (ou structures coordinatives). Il convient de distinguer ici les notions de degrés de liberté mécaniques des degrés de liberté fonctionnels. La notion de d.d.l mécaniques renvoie aux variables cinématiques, comme par exemple les amplitudes articulaires. Ainsi, dans une tâche d’apprentissage d’un mouvement s’apparentant à du slalom de ski, les participants ont progressivement augmenté les amplitudes de leurs mouvements articulaires, ce qui a été interprété comme un recrutement de d.d.l supplémentaires au cours de l’apprentissage (Vereijken et al. 1992). La théorie des systèmes dynamiques non linéaires postule qu’un mouvement (signal) quel qu’il soit peut être caractérisé par sa dimension9. Cette dimension peut correspondre au nombre de variables de contrôle indépendantes que l’individu doit contrôler pour exécuter ledit mouvement. On parlera dans ce cas de degrés de liberté fonctionnels ou actifs (Newell & Vaillancourt 2001). Le nombre de d.d.l fonctionnels d’un mouvement sera estimé par le nombre des composantes principales de celui‐ci grâce aux ACP. En 2004, Daffertshofer et al. (2004) ont publié un très bon tutoriel sur l’utilisation des ACP pour l’étude des coordinations et de la variabilité. Plus récemment, Rein (2012) détaille également les différentes méthodes utilisées pour étudier l’apprentissage moteur dans la perspective des systèmes dynamiques non linéaires. Les premiers travaux expérimentaux ont laissé penser que le nombre de d.d.l mécaniques augmentait avec l’apprentissage tandis que le nombre de d.d.l fonctionnels diminuait, allant de pair avec l’idée que l’expert va savoir exploiter les contraintes auxquelles il est confronté dans la tâche. Les modes de coordination de l’expert pourront être résumés par un plus petit nombre de variables collectives (voir Newell & Vaillancourt 2001 pour une revue de littérature sur les travaux fondateurs du champ). Cependant, des travaux plus récents montrent l’importance des contraintes liées à la 9
Ou plus précisément, la dimension de l’attracteur qui sous‐tend ce mouvement. 62 tâche motrice qu’il faut apprendre à exécuter et que cette diminution du nombre de d.d.l fonctionnels n’est pas systématique (Newell et al. 2003). Notre objectif est donc de comprendre comment s’organise le contrôle lors de l’apprentissage de la marche athlétique. Même si l’usage des ACP s’est développé récemment, les méthodes mises en œuvre restent assez disparates et le nombre de travaux expérimentaux portant sur l’apprentissage d’une tâche motrice aussi complexe que la marche athlétiques reste limité. A partir de 8 variables décrivant la cinématique de la locomotion, nous avons commencé à analyser comment varie le nombre des composantes principales, la part de variance que chacune explique et comment les différentes variables cinématiques composent ces variables principales au cours de l’apprentissage. Pour comparaison, nous analysons également la marche normale chez nos participants. Figure 36 : Part de variance expliquée par les 3 composantes principales (CP) dans la marche avant l’apprentissage et la marche athlétique à la 1ère séance de pratique, pour des vitesses identiques. Les trois premières CP expliquent ensemble plus de variance dans la marche normale que la marche athlétique. Ainsi, si l’on cherche à expliquer une proportion donnée de la variance totale (ex : 80%), il faut plus de CP donc de d.d.l à contrôler dans la marche athlétique que la marche normale. Les résultats préliminaires montrent que dès la première séance d’apprentissage, les participants recrutent plus de d.d.l (Figure 36) et que la part de variance expliquée par la troisième composante principale tend à augmenter au cours de l’apprentissage (p=0.07, Figure 37A). Afin de comprendre comment les coordinations se réorganisent au cours de l’apprentissage, nous analysons la présence simultanée des variables articulaires dans les mêmes CP, ce que nous interprétons comme un couplage (actif ou mécanique). De façon intéressante, nous observons qu’un couplage initialement présent dans la marche entre l’articulation du genou et la rotation du bassin autour de l’axe antéro‐
postérieur tend à disparaître au cours de l’apprentissage au profit de l’apparition d’un autre couplage entre l’angle du genou et la rotation du bassin autour de l’axe vertical (Figure 37B). 63 Figure 37 : A. Part de la variance totale expliquée par la 3ème composante principale lors des 4 séances de pratique. B. Nombre moyen de fois où le genou se trouve dans la même CP que l’angle de rotation du bassin autour de l’axe antéro‐postérieur (Genou & Bassin_X) et l’angle du bassin autour de l’axe vertical (Genou & Bassin_Z) dans la marche (S0) et au cours de la pratique (S1‐S4). Pour interpréter ces résultats, il nous faudra étudier également la marche athlétique chez des marcheurs experts pour comprendre l’influence des contraintes de la tâche sur cet apprentissage. Il est vraisemblable que la marche athlétique nécessite le recrutement de plus de d.d.l fonctionnels que la marche, du fait notamment des rotations particulières du bassin. Il serait donc logique d’observer une augmentation des d.d.l au cours de l’apprentissage si la locomotion apprise le nécessite ! 64 2.2 Etude des stratégies oculomotrices dans le contrôle de la frappe
cycliquedeballe
Après avoir étudié les variables informationnelles visuelles utilisées dans le contrôle de la frappe cyclique de balle par l’étude du mouvement de raquette en réponse à des perturbations dans la trajectoire de balle, je poursuis cette thématique en étudiant les stratégies oculomotrices des participants. En effet, nous faisons l’hypothèque que l’analyse de la position du regard par rapport à la trajectoire de balle pourra confirmer nos précédents résultats. Si les participants fixent le zénith (apex) de la trajectoire (et la cible à atteindre), il sera difficile de dissocier les rôles respectifs des principales variables informationnelles : durée de la montée de la balle (tup) et erreur de rebond (). A l’inverse, si les participants choisissent de regarder ailleurs qu’à l’apex et que la cible ne se trouve pas dans la région correspondant à la vision fovéale, nous pourrons confirmer que l’erreur à la cible n’est pas la principale source d’information utilisée pour le contrôle de la raquette. De plus, si la position du regard est telle que l’apex se trouve en vision périphérique qui est utile à la perception des mouvements, nous pourrons suggérer que cette stratégie permet aux participants de mieux percevoir le moment où la balle change de direction (commence à tomber), ce qui est requis pour déterminer tup. Mais cette stratégie empêche de bien percevoir . Depuis 1994, Peter Beek et ses collaborateurs ont mené plusieurs études visant à identifier les portions des trajectoires de balles qu’exploitent les participants dans des tâches de jonglerie à 1 balle (Amazeen et al. 1999; Amazeen et al. 2001) ou à 3 balles (van Santvoord & Beek 1994; Huys & Beek 2002). Les questions principales étaient de savoir : 1) si, pour prélever l’information nécessaire, les participants regardent une zone de trajectoire qui correspond à une position particulière de la balle (variable spatiale) ou une autre zone qui correspond plutôt à un moment spécifique du mouvement de la balle (variable temporelle), 2) si les experts et les participants de niveau intermédiaire présentent des stratégies oculaires différentes. Lors des deux premières études (van Santvoord & Beek 1994; Amazeen et al. 1999), les auteurs ont utilisé des lunettes à cristaux liquides qui permettent d’occulter une partie de la trajectoire de balle. La fréquence d’occultation était imposée et sa durée augmentait progressivement au cours de chaque essai. Sans être systématiques, les participants réalisaient le plus souvent les mouvements verticaux de la main avec la même fréquence que celle des lunettes, pour pouvoir voir la balle globalement autour du zénith de la trajectoire. Les participants choisissaient de regarder la balle plutôt à moment particulier de sa trajectoire (361 ms avant de l’attraper) qu’à un endroit précis (« in some region around the zenith, but not at a particular location »). Amazeen et al. (1999) ont également étudié le mouvement de la main et ont montré que les participants semblent utiliser le moment du zénith de la balle pour se préparer à l’attraper. Dans la même tâche de « lancer‐rattraper », Amazeen et al. (2001) ont remplacé le protocole d’occultation de la trajectoire par l’étude des mouvements oculaires et ont analysé des variables telles que le moment où les participants déplacent le regard vers le balle pour la première fois dans la trajectoire, le moment où le regard est le plus près de la balle, la durée de la phase de maintien du regard près de la balle. Quelle que soit la fréquence du geste, les participants de niveau 65 intermédiaire regardent plutôt autour du zénith de la balle. Les experts, quant à eux, commencent à regarder la balle d’autant plus tôt dans sa trajectoire que la fréquence est élevée, même s’ils continuent à la regarder jusqu’à son zénith. Concernant le mouvement de la main, les auteurs ont observé que les participants experts et de niveau intermédiaire initient la décélération finale de la main 89 ms après le zénith, ce qui suggère qu’ils ont besoin de connaître le moment où la balle arrive à son zénith pour réguler le geste. Enfin, Huys et Beek (2002) ont étudié le couplage entre la position du regard et le mouvement des 3 balles en jonglerie en fonction de l’expertise, du pattern du mouvement, et du tempo. Dans 64 % des essais, la position verticale du regard était asservie à la fréquence des balles (« frequency‐locked »). La force de couplage diminuait quand la fréquence des balles augmentait. Cependant, toutes les mesures de la position du regard présentaient de très grandes différences interindividuelles (« considerable differences »). Les experts faisaient globalement de plus petits mouvements du regard et adoptaient parfois une stratégie de fixation du regard au loin (« distant stare »). Ils gardaient moins souvent l’œil « sur la balle » que les participants de niveau intermédiaire. Le couplage avec la balle était donc moins fort. Ces résultats concordent avec le fait que les experts utilisent des stratégies oculaires plus parcimonieuses, comme l’ancrage du regard sur une position « pivot » (Savelsbergh et al. 2002). Par rapport aux participants de niveau intermédiaire, les experts semblent moins utiliser la vision fovéale et sans doute plus la vision para‐fovéale et périphérique, ainsi que l’information haptique. Williams et Davids (1998) ont en effet montré que les experts sont capables d’extraire des informations visuelles de meilleure qualité et de prélever plus efficacement de l’information en vision périphérique, ce qui contribue à une meilleure capacité d’anticipation. La tâche de frappe de balle cyclique que j’étudie s’apparente fortement à la tâche de « lancer‐
rattraper » à une balle, dans la mesure où la main doit être coordonnée avec une seule balle. Au vu des résultats présentés ci‐dessus, nous pouvons nous attendre à ce que les participants regardent autour du zénith de la trajectoire de balle ou un peu en‐dessous pour voir la balle plus tôt dans sa trajectoire. Cependant, la tâche de frappe cyclique de balle présente quelques différences avec les autres tâches de jonglerie. D’une part, il s’agit d’une tâche en réalité virtuelle où l’information visuelle est appauvrie (uniquement la cinématique 1D de la balle) et où le retour haptique du contact avec la balle est inexistant. De plus, les participants ne risquent pas de faire tomber la balle, et l’envoient forcément suivant l’axe vertical : cela la rend sans doute plus simple qu’une vraie tâche de jonglerie avec des balles réelles. Enfin, nous avons toujours étudié le comportement en présence d’une cible visuelle qui n’existe pas en jonglerie réelle. La première expérience que nous avons menée sur les stratégies oculomotrices est de nature exploratoire. Elle a eu pour objectif de savoir si les stratégies oculomotrices corroborent nos résultats concernant les informations visuelles utilisées dans le contrôle de la raquette. 66 Figure 38 : Exemple d’enregistrements des positions du regard, de la balle et de la raquette chez un même sujet dans une condition avec ou sans cible. Dans ces deux conditions, la fréquence du métronome est la même, ce qui doit conduire à des hauteurs de frappe similaires en moyenne. Pendant la thèse de Christophe Bazile, nous avons effectué une première expérience, mais les signaux de position de la raquette se sont avérés très bruités et les résultats préliminaires sont en fait inexploitables. Une deuxième expérience vient d’être réalisée avec une étudiante de Master, mais nous n’avons pas encore eu le temps de traiter les données, au‐delà d’une première analyse réalisée rapidement pour son mémoire (cf Figure 38 pour une illustration de ces données). Quatorze participants (7 hommes et 7 femmes) ont réalisé 6 essais de 40 secondes dans cinq conditions différentes, présentées en bloc. Pour 4 d’entre elles, les deux facteurs manipulés étaient : la présence ou non d’une cible visuelle, la hauteur de la cible (basse / haute). Pour pouvoir contraindre la hauteur de rebond en l’absence de cible, nous avons systématiquement demandé aux participants d’osciller la raquette en rythme avec un métronome. Dans ces 4 conditions, la fréquence du métronome correspondait à la durée de trajectoire d’une balle atteignant la hauteur souhaitée. Nous avons ajouté une 5ème condition présentant un conflit entre la consigne visuelle donnée par la 67 cible à atteindre (cible basse) et le rythme donné par le métronome (rythme lent, alors qu’il aurait dû être rapide) pour tester quelle modalité (Visuelle vs. Auditive) influençait le plus le comportement moteur dans cette tâche. Le mouvement de la balle et de la raquette étaient présentés sur un écran d’ordinateur et les mouvements oculaires étaient mesurés avec un système Eyelink1000 (SR Research) à 500 Hz. En plus de caractériser la position moyenne du regard et sa variabilité par rapport à la balle et à la cible à des moments‐clés (zénith, impact), il faudrait analyser la dynamique des mouvements du regard en relation avec les mouvements de la balle. Le travail d’analyse s’annonce assez ardu, d’autant plus que les différences interindividuelles sont importantes, tant au niveau de la performance à la tâche qu’en termes de stratégies oculomotrices. Toutefois, les résultats pourraient dévoiler de nouveaux éléments de compréhension des relations information‐mouvement. 68 2.3 Robotiquebio‐inspirée
Dans le cadre du projet de l’Institut Demenÿ‐Vaucanson des Sciences du Mouvement (soumis à l’AAP Recherche 2014 de l’Idex Paris‐Saclay), j’ai proposé avec des roboticiens deux projets de robotique bio‐inspirée que nous souhaiterions mener à bien ensemble. Mon envie est de pouvoir utiliser les formalismes et les outils de simulation du champ de la robotique pour tester : 1) les couplages information‐mouvement que nous avons identifiés dans le contrôle de la frappe cyclique de balle, et 2) les déclencheurs de la transition Marche‐Course que Lina Majed a discutés dans sa thèse (cette partie n’est pas mentionnée dans ce document car l’article n’est pas encore finalisé). Les roboticiens ont, quant à eux, l’objectif d'améliorer la génération de mouvements d'humanoïdes (personnages virtuels ou robots réels) en intégrant les lois de la perception et de l’action, ou plus généralement les théories du contrôle moteur. Ils souhaitent accroître la fluidité et la robustesse des mouvements réels ou simulés des humanoïdes face aux perturbations externes. Le but du projet est donc pour eux de développer de nouveaux algorithmes de contrôle afin d'améliorer la simulation des différents types de mouvements humains rythmiques (locomotion et frappe cyclique de balle) et de se rapprocher des mouvements naturels. Cette année, j’ai déposé une demande pour obtenir un semestre de Congé pour Recherche et Conversion Thématique (CRCT) afin d’avoir plus de temps pour m’investir et initier cette thématique. 2.3.1
Robotjongleur(jonglerieaveclemembresupérieur)
Un des principaux objectifs de ce projet est de valider, à l'aide de simulations de robotique, les deux lois de contrôle qui ont été identifiées dans les études antérieures menées chez l’homme (cf. Partie 1.2). Plus largement, il s’agira de tester des solutions visant à prouver qu’il est possible de faire jongler le personnage virtuel sans qu’il n’utilise de calculs analytiques très complexes. En effet, pour le moment, tous les robots jongleurs ou simulations existants utilisent les lois de la balistique qui permettent de calculer les positions futures de la balle dans sa descente et de calculer également la vitesse avec laquelle la balle devra être frappée au prochain impact pour corriger les éventuelles perturbations ou erreurs dans le rebond précédent (Ronsse et al. 2010; Kulchenko & Todorov 2011). Cependant, la tendance est maintenant de développer des robots qui exploitent des propriétés intéressantes des systèmes contrôlés pour simplifier ou alléger les algorithmes de contrôle comme sait le faire l’être humain et comme nous l’avons vu dans les premières parties de ce document. On voit apparaître des robots capables de stocker de l’énergie potentielle élastique dans ses constituants, comme le font les muscles, ou des articulations (actuateurs) à raideurs variables. Ainsi, Haddadin et al. (2011) ont réalisé un bras robotisé capable de dribbler une balle de handball, grâce aux propriétés élastiques de la partie « main » pour reproduire le mouvement réel d’un joueur semi‐
professionnel qu’ils avaient au préalable mesuré (Figure 39). 69 Figure 39 : A. Enregistrement du bras et de la main d’un joueur de handball pendant un dribble. B. Bras robotisé capable de dribbler une balle grâce à des propriétés élastiques du segment « main » du robot (d’après Haddadin et al. 2011) L’implémentation temps‐réel des stratégies de contrôle des robots est habituellement limitée par les ressources computationnelles des ordinateurs. Les modèles mathématiques qui décrivent la dynamique des robots sont complexes et les techniques d’optimisation utilisées pour le contrôle prédictif non linéaire sont coûteuses en temps et peuvent parfois s’avérer infaisables, selon les ressources computationnelles disponibles. L’être humain semble utiliser des modèles plus simples pour déterminer les meilleurs choix en termes de contrôle de trajectoire et de production du mouvement. Les roboticiens avec lesquels je vais collaborer sont intéressés pour utiliser la tâche de jonglerie avec le membre supérieur afin de valider de nouveaux modèles non analytiques (Figure 40). Ils espèrent que ces nouveaux algorithmes de contrôle seront moins coûteux en termes de ressources computationnelles requises. Figure 40 : Figure illustrative du projet d’implémentation des lois information‐mouvement dans le contrôle d’un robot jongleur (simulé) Pour la première étape du contrôle du bras robotisé qui est celle de la formation de trajectoires, nous testerons différents modèles et algorithmes. Nous comparerons les résultats des simulations avec les données expérimentales que j’ai déjà acquises dans la tâche de frappe cyclique de balle. Les robots que mes futurs collaborateurs utilisent ou simulent ont une raideur constante. Il s’agira de modifier les algorithmes de contrôle pour réaliser une articulation du coude dont la raideur sera variable. Le développement de robots à raideurs variables est actuellement un champ de recherche 70 très actif, notamment pour permettre aux robots d’interagir avec l’homme en toute sécurité (ex : Robot COMAN, Li et al. 2013). Figure 41 : Modèle proposé par Taga (1998), et adapté par de Rugy et al. (2002) pour simuler le passage d’obstacle dans la locomotion. Cependant, à plus long terme, nous pourrions nous inspirer des travaux ayant porté sur la modélisation de la locomotion lors du passage d’obstacles, activité motrice rythmique qui suppose un contrôle prospectif (Taga 1998; de Rugy et al. 2002). En effet, Taga proposa en 1995 un modèle du système neuro‐musculo‐squelettique pour la locomotion (Taga 1995a; Taga 1995b), qu’il adapta en 1998 pour simuler la régulation d’un événement discret tel que le passage d’un obstacle (Figure 41). Ce modèle comporte deux sous‐systèmes qui interagissent, le système neural et le système musculo‐
squelettique. Le système neural comporte un générateur de rythme (RG) qui contient lui‐même 7 paires d’oscillateurs neuraux pour autant d’articulations modélisées dans le système musculo‐
squelettique (8 segments rigides). Ainsi, dans le cas de la frappe cyclique de balle, le système musculo‐squelettique peut se réduire à deux segments et un seul oscillateur neural, comme l’ont déjà proposé de Rugy et al. (2003) dans un premier modèle de la frappe cyclique de balle. L’interaction entre le générateur de rythme et le système musculo‐squelettique engendre un comportement stable, appelé « cycle limite ». Pour les régulations nécessaires à des événements ponctuels, comme le passage d’un obstacle, Taga (1998) a ajouté à la version initiale de son modèle un générateur de mouvement discret (DM), qui reçoit une entrée du système visuel et qui envoie une commande permettant d’ajuster le pas précédent l’obstacle à franchir. Afin de mieux modéliser le comportement humain où l’on observe que l’ajustement du pas se réalise sur plusieurs cycles de marche avant l’obstacle, de Rugy et al. (2002) ont remplacé le générateur de mouvement discret par un contrôleur visuo‐moteur qui permet de moduler de façon continue l’amplitude de certains couples articulaires par couplage à une variable informationnelle visuelle pour réguler la longueur 71 des pas précédant l’obstacle. Ce couplage est caractérisé par deux paramètres : un seuil et un gain. Nous pourrions donc tenter d’en faire de même pour simuler la frappe cyclique de balle et implémenter les deux couplages information‐mouvement que nous avons mis en évidence dans nos expériences. Sur l’archive ouverte HAL, destinée à la diffusion des travaux scientifiques, j’ai récemment découvert qu’un mémoire de Master 2 en informatique (Jeannin‐Girardon 2011) avait porté sur la modélisation et simulation de nos résultats publiés en 2010 (Siegler et al. 2010). Comme dans le modèle de de Rugy et al. (2003), ce modèle comporte l’oscillateur constitué d'un réseau de deux neurones, initialement proposé par Matsuoka (1987). Ce modèle implémente deux couplages information‐
mouvement qui permettent de moduler séparément la période et l’amplitude de l’oscillateur. La modulation de la période de la raquette est réalisée dès que la demi‐période ascendante tup de la balle est « connue », c’est‐à‐dire quand la balle arrive à sa hauteur maximale. La modulation de l'amplitude doit permettre de conserver une phase à l'impact cohérente avec les critères de stabilité dynamique passive de la tâche et permettre de conserver une hauteur de rebond régulière. L’étudiante a simulé des changements de gravité, tels que ceux utilisés par Siegler et al. (2010). Ces simulations ont permis de mettre en évidence la capacité du système à s'adapter non seulement à différentes conditions environnementales maintenues constantes (ex : différentes valeurs de g), mais aussi à des perturbations survenant dans l'environnement. Ce modèle ne comporte pas de module simulant le comportement dynamique du système musculo‐squelettique mais n’en demeure pas moins une preuve, même modeste, qu’un tel mode de contrôle fondé sur des couplages information‐
mouvement peut permettre le contrôle de la frappe cyclique de balle. Figure 42 : A. Schéma proposé par Jeannin‐Girardon (2011) dans son mémoire de Master 2, qui implémente deux lois information‐mouvement. B. Résultats de simulations répliquant une des conditions expérimentales étudiées dans Siegler et al. (2010) où la gravité est soudainement augmentée. 72 2.3.2
Locomotionbipèdeanthropomorphique
La course rapide est un mouvement hautement dynamique facilement exécuté par l’être humain adulte. Pour l’heure, les robots sont encore loin de pouvoir courir aussi vite. Tandis que les sprinteurs olympiques atteignent des vitesses de l’ordre de 12 m/s, le robot Asimo de Honda qui est le plus rapide au monde, court avec les jambes fléchies à la vitesse maximale de 2,5 m/s (http://asimo.honda.com/asimotv/). La course des humanoïdes est donc encore très loin de ressembler à celles des êtres humains. Différentes approches sont utilisées par les roboticiens pour simuler la course bipède mais elles présentent toutes certaines limites pour intégrer en temps réel à la fois des capacités de réaction, de prédiction et d’adaptabilité semblables à celles de l’être humain. Ces capacités sont pourtant nécessaires pour assurer un comportement robuste sur un terrain inconnu et accidenté ou face à des forces perturbatrices quelconques. Dans ce cadre‐là, le projet consistera à améliorer les modèles de simulation de la course d’humanoïdes en s’inspirant des connaissances existantes sur la locomotion humaine, mais également à accroître cette connaissance en étudiant notamment les paramètres de la transition marche‐course de l’humanoïde. Figure 43 : Simulation d’un cycle de course d’un humanoïde capable de courir jusqu’à une vitesse maximale de 3,5 m/s (Bertrand & Bruneau 2012) Les chercheurs du LISV (Université Versailles Saint‐Quentin‐en‐Yvelines), avec lesquels je vais collaborer sur ce projet, développent actuellement des algorithmes de contrôle pour que les humanoïdes soient capables de courir et également de transiter de la marche à la course (Figure 44), lorsqu’un opérateur extérieur déclenche cette transition (Bertrand & Bruneau 2012)10. Dans le champ de la robotique, quand le contrôle de l’humanoïde est calculé en temps réel, cette transition marche‐course télécommandée est une nouveauté. A l’heure actuelle, si la consigne de vitesse de déplacement de l’humanoïde est augmentée, ces transitions ne sont pas « spontanées ». Une des prochaines étapes du développement des humanoïdes sera de les rendre capables de transiter spontanément de la marche à la course. Reste à savoir quel sera le paramètre déclencheur ! 10
https://mercure.lisv.uvsq.fr/~bruneau/simu_video.html 73 Figure 44 : Résultats de simulation de la course d’un humanoïde. Les graphiques montrent les données de 100 cycles de course successifs. Les cycles commencent et finissent au moment de la pose du pied gauche au sol (Bertrand & Bruneau 2012). La marche des robots humanoïdes a été plus étudiée que la course ; les contraintes sont moins fortes et le résultat est actuellement plus réaliste. Pour les chercheurs en contrôle moteur, l’existence de ces simulations de locomotion d’humanoïdes peut permettre d’accéder aux variables cinématiques et dynamiques de tous les degrés de liberté d’un système qui est censé reproduire la locomotion humaine. Nous nous intéresserons donc plus spécifiquement aux mécanismes de la transition Marche‐Course dont les déclencheurs ne sont pas encore clairement identifiés (Macleod et al. 2014). En effet, plusieurs hypothèses coexistent dans la littérature et nous tenterons de les confronter grâce aux simulations de la locomotion d’humanoïdes. L’influence de la vitesse de locomotion sur les différentes variables supposément critiques sera notamment étudiée. De quoi s’occuper encore pour de belles années, et former de nombreux thésards, voire animer une équipe de recherche sur ces thèmes ! 74 Référencesbibliographiques
Alderson GJ, Sully DJ, Sully HG (1974) An operational analysis of a one‐handed catching task using high speed photography. J Mot Behav 6:217–226. Allison RS, Harris LR, Jenkin M, et al. (2001) Tolerance of temporal delay in virtual environments. Proceedings of the 2001 IEEE Virtual Reality Conference (VR’01). pp 247–253 Amazeen EL, Amazeen PG, Post AA, Beek PJ (1999) Timing the Selection of Information During Rhythmic Catching. J Mot Behav 31:279–289. Amazeen EL, Andersen RA, Beek PJ (2001) Eye movements and the selection of optical information for catching. Ecol Psychol 13:71–85. Bard C, Hay L (1983) Etude ontogénétique de la coordination visuo‐manuelle. Can J Psychol 37:390–
413. Bazile C (2012) Identification des couplages information‐mouvement impliqués dans la regulation de la tâche de frappe cyclique de balle et leur développement chez l’enfant âgé de 5 à 12 ans. Doctorat de l’Université Paris‐Sud. ED 456 Sciences du Sport, de la Motricité‚ et du Mouvement Humain Bazile C, Siegler IA, Benguigui N (2013) Major changes in a rhythmic ball‐bouncing task occur at age 7 years. PLoS ONE 8:e74127. Benguigui N, Broderick MP, Baures R, Amorim MA (2008) Motion prediction and the velocity effect in children. Brit J Dev Psychol 26:389–407. Bernstein NA (1967) The co‐ordination and regulation of movements. Pergamon Press, Oxford Bertrand S, Bruneau O (2012) Simulation of Highly Dynamic Locomotion with a Bipedal Robot: A Fast Running Algorithm. Proceedings of the Dynamic Walking Conference, Pensacola, Florida Binetti N, Siegler IA, Bueti D, Doricchi F (2010) Time in motion: effects of whole‐body rotatory accelerations on timekeeping processes. Neuropsychologia 48:1842–1852. Binetti N, Siegler IA, Bueti D, Doricchi F (2013) Adaptive tuning of perceptual timing to whole body motion. Neuropsychologia 51:197–210. Bohil CJ, Alicea B, Biocca FA (2011) Virtual reality in neuroscience research and therapy. Nat Rev Neurosci 12:752–762. Bootsma RJ (1998) Ecological movement principles and how much information matters. In: Post AA, Pijpers JR, Bosch P, Boschker MSJ (eds) Models in human movement sciences. PrintPartners Ipskamp, Enschede, The Netherlands, pp 51–63 Borghese NA, Bianchi L, Lacquaniti F (1996) Kinematic determinants of human locomotion. J Physiol 494:863–879. Brisswalter J, Legros P (1992) Comparaison du coût énergétique dans trois populations de coureurs de longues et de moyennes distances. Sci Sports 7:223–228. 75 Bruno N, Cutting JE (1988) Minimodularity and the perception of layout. J Exp Psychol Gen 117:161–
170. Buehler M, Koditschek DE, Kindlmann PJ (1994) Planning and Control of Robotic Juggling and Catching Tasks. Int J Robot Res 13:101–118. Chau T (2001) A review of analytical techniques for gait data. Part 1: Fuzzy, statistical and fractal methods. Gait & Posture 13:49–66. Chen HH, Liu YT, Mayer‐Kress G, Newell KM (2005) Learning the pedalo locomotion task. J Mot Behav 37:247–256. Clizbe D, Getchell N (2010) The development of period correction processes in motor coordination: adaptation to temporal perturbation. Motor Control 14:59–67. Collins S, Ruina A, Tedrake R, Wisse M (2005) Efficient bipedal robots based on passive‐dynamic walkers. Science 307:1082–1085. Cunningham DW, Chatziastros A, von der Heyde M, Bulthoff HH (2001) Driving in the future: temporal visuomotor adaptation and generalization. J Vis 1:88–98. Daffertshofer A, Lamoth CJ, Meijer OG, Beek PJ (2004) PCA in studying coordination and variability: a tutorial. Clin Biomech 19:415–428. de Rugy A, Taga G, Montagne G, et al. (2002) Perception–action coupling model for human locomotor pointing. Biol Cybern 87:141–150. de Rugy A, Wei K, Muller H, Sternad D (2003) Actively tracking “passive” stability in a ball bouncing task. Brain Res 982:64–78. Debrabant J, Gheysen F, Vingerhoets G, Van Waelvelde H (2012) Age‐related differences in predictive response timing in children: Evidence from regularly relative to irregularly paced reaction time performance. Hum Mov Sci 31:801–810. Dijkstra TMH, Katsumata H, de Rugy A, Sternad D (2004) The dialogue between data and model: passive stability and relaxation behavior in a ball‐bouncing task. Nonlinear Stud 11:319–344. Doricchi F, Iaria G, Silvetti M, et al. (2007) The “ways” we look at dreams: evidence from unilateral spatial neglect (with an evolutionary account of dream bizarreness). Exp Brain Res 178:450–
461. Doricchi F, Siegler I, Iaria G, Berthoz A (2002) Vestibulo‐ocular and optokinetic impairments in left unilateral neglect. Neuropsychologia 40:2084–2099. Drake C, Jones MR, Baruch C (2000) The development of rhythmic attending in auditory sequences: Attunement, referent period, focal attending. Cognition 77:251–288. Ferrel WR (1963) Remote manipulative control with transmission delay. Percept Mot Skills 20:1070–
1072. Figliozzi F, Guariglia P, Silvetti M, et al. (2005) Effects of vestibular rotatory accelerations on covert attentional orienting in vision and touch. J Cogn Neurosci 17:1638–1651. 76 Fischman MG, Moore JB, Steele KH (1992) Children’s one‐hand catching as a function of age, gender, and ball location. Res Q Exerc Sport 63:349–355. Fitzpatrick P, Schmidt RC, Lockman JJ (1996) Dynamical patterns in the development of clapping. Child Dev 67:2691–2708. Fougeron B, Brisswalter J, Goubault C, Legros P (1998) Le coût énergétique de la marche athlétique: évolution en fonction de la vitesse de déplacement. Sci Sports 13:87–89. Franck N, Farrer C, Georgieff N, et al. (2001) Defective recognition of one’s own actions in patients with schizophrenia. Am J Psychiatry 158:454–459. Fuchs P, Moreau G (2006) Le traité de la réalité virtuelle, T.1 L’homme et l’environnement virtuel, Les Presses de l’Ecole des Mines. Gaymard B, Siegler I, Rivaud‐Pechoux S, et al. (2000) A common mechanism for the control of eye and head movements in humans. Ann Neurol 47:819–822. Getchell N, Whitall J (2003) How do children coordinate simultaneous upper and lower extremity tasks? The development of dual motor task coordination. J Exp Child Psychol 85:120–140. Gibson EJ (1988) Exploratory Behavior in the Development of Perceiving, Acting, and the Acquiring of Knowledge. Annu Rev Psychol 39:1–42. Gibson JJ (1983) The senses considered as perceptual systems. Greenwood Press, Westport, Conn Goldfield EC, Kay BA, Warren WH Jr (1993) Infant bouncing: the assembly and tuning of action systems. Child Dev 64:1128–1142. Haddadin S, Krieger K, Kunze M, Albu‐Schaffer A (2011) Exploiting potential energy storage for cyclic manipulation: An analysis for elastic dribbling with an anthropomorphic robot. IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). pp 1789–1796 Hay L, Bard C, Fleury M, Teasdale N (1991) Kinematics of aiming in direction and amplitude: A developmental study. Acta Psychol 77:203–215. Hong SL, Newell KM (2006) Change in the organization of degrees of freedom with learning. J Mot Behav 38:88–100. Huys R, Beek PJ (2002) The coupling between point‐of‐gaze and ball movements in three‐ball cascade juggling: the effects of expertise, pattern and tempo. J Sports Sci 20:171–186. Israel I, Siegler I, Rivaud‐Pechoux S, et al. (2006) Reproduction of self‐rotation duration. Neurosci Lett 402:244–248. Ivanenko YP, Viaud‐Delmon I, Siegler I, et al. (1998) The vestibulo‐ocular reflex and angular displacement perception in darkness in humans: adaptation to a virtual environment. Neurosci Lett 241:167–170. Jeannin‐Girardon A (2011) Couplage de systèmes dynamiques pour l’émergence de comportement en environnement virtuel : application au rebond de balle. Mémoire de M2 Recherche en Informatique, Université de Bretagne Occidentale 77 Jerald J, Whitton M (2009) Relating Scene‐Motion Thresholds to Latency Thresholds for Head‐
Mounted Displays. Proc IEEE Virtual Real Conf 211–218. Kelso J (1984) Phase transitions and critical behavior in human bimanual coordination. American Journal of Physiology: Regulatory, Integrative and Comparative Physiology 15:R1000–1004. Konczak JC, Jansen‐Osmann P, Kalveram KT (2003) Development of force adaptation during childhood. J Mot Behav 35:41–52. Kulchenko P, Todorov E (2011) First‐exit model predictive control of fast discontinuous dynamics: Application to ball bouncing. Robotics and Automation (ICRA), 2011 IEEE International Conference on. pp 2144–2151 Kuo AD (2007) The six determinants of gait and the inverted pendulum analogy: A dynamic walking perspective. Hum Mov Sci 26:617–656. Lambert J, Bard C (2005) Acquisition of visuomanual skills and improvement of information processing capacities in 6‐ to 10‐year‐old children performing a 2D pointing task. Neurosci Lett 377:1–6. Langenberg U, Hefter H, Kessler KR, Cooke JD (1998) Sinusoidal forearm tracking with delayed visual feedback. I. Dependence of the tracking error on the relative delay. Exp Brain Res 118:161–
170. Lantero DA, Ringenbach SD (2007) Developmental differences in the use of visual information during a continuous bimanual coordination task. J Mot Behav 39:139–155. Lee DN, Craig CM, Grealy MA (1999) Sensory and intrinsic coordination of movement. Proc Biol Sci 266:2029–2035. Lefebvre C, Reid G (1998) Prediction in ball catching by children with and without a developmental coordination disorder. Adap Phys Act Q 15:299–315. Leube DT, Knoblich G, Erb M, et al. (2003) The neural correlates of perceiving one’s own movements. Neuroimage 20:2084–2090. Li Z, Tsagarakis NG, Caldwell DG (2013) Walking pattern generation for a humanoid robot with compliant joints. Auton Robot 35:1–14. Loomis JM, Blascovich JJ, Beall AC (1999) Immersive virtual environment technology as a basic research tool in psychology. Behav Res Meth Instru Comput 31:557–564. Macleod TD, Hreljac A, Imamura R (2014) Changes in the preferred transition speed with added mass to the foot. J Appl Biomech 30:95–103. Majed L (2013) Réorganisation du mouvement avec l’apprentissage d’une habileté motrice complexe, la marche athlétique : rôle de l’énergie métabolique et de la perception de l’effort. Effet de cet apprentissage sur les transitions marche‐course. Doctorat de l’Université Paris‐Sud. ED 456 Sciences du Sport, de la Motricité‚ et du Mouvement Humain Majed L, Heugas A‐M, Chamon M, Siegler IA (2012) Learning an energy‐demanding and biomechanically constrained motor skill, racewalking: movement reorganization and contribution of metabolic efficiency and sensory information. Hum Mov Sci 31:1598–1614. 78 Manyam VJ (1986) A psychophysical measure of visual and kinaesthetic spatial discriminative abilities of adults and children. Perception 15:313–324. Matsuoka K (1987) Mechanisms of frequency and pattern control in the neural rhythm generators. Biol Cybern 56:345–353. Michaels CF, Carello C (1981) Direct perception. Prentice Hall, Englewood Cliffs, NJ Morice A (2006) Bases spatio‐temporelles des comportements moteurs exploratoires d’attracteurs inédits. Doctorat de l’Université Paris‐Sud. ED 456 Sciences du Sport, de la Motricité‚ et du Mouvement Humain Morice AHP, Siegler IA, Bardy BG (2008) Action‐perception patterns in virtual ball bouncing: combating system latency and tracking functional validity. J Neurosci Methods 169:255–266. Morice AHP, Siegler IA, Bardy BG, Warren WH (2007) Learning new perception‐action solutions in virtual ball bouncing. Exp Brain Res 181:249–265. Newell KM, Broderick MP, Deutsch KM, Slifkin AB (2003) Task goals and change in dynamical degrees of freedom with motor learning. J Exp Psychol Hum Percept Perform 29:379–387. Newell KM, Van Emmerik REA, McDonald PV (1989) Search strategies and the acquisition of coordination. In: Wallace SA (ed) Perspectives on the coordination of movement. Martinus Nijhoff, pp 85–122 Newell KM, Vaillancourt DE (2001) Dimensional change in motor learning. Hum Mov Sci 20:695–715. Olivier I, Ripoll H, Audiffren M (1997) Age differences in using precued information to preprogram interception of a ball. Percept Mot Skills 85:123–127. Olney SJ, Griffin MP, McBride ID (1998) Multivariate examination of data from gait analysis of persons with stroke. Phys Ther 78:814–828. Rein R (2012) Measurement Methods to Analyze Changes in Coordination During Motor Learning from a Non‐linear Perspective. Open Sports Sci 5:36–48. Riccio G (1995) Coordination of postural control and vehicular control: Implications for multimodal perception and simulation of self‐motion. In: Hancock PA (ed) Local applications of the ecologial approach to human machine systems. Lawrence Erlbaum Associates, Hillsdale, NJ, pp 122–181 Robertson SD (2001) Development of bimanual skill: the search for stable patterns of coordination. J Mot Behav 33:114–126. Ronsse R, Wei K, Sternad D (2010) Optimal control of a hybrid rhythmic‐discrete task: the bouncing ball revisited. J Neurophysiol 103:2482–2493. Savelsbergh G, Davids K, van der Kamp J, Bennett SJ (2003) Development of movement coordination in children: applications in the field of ergonomics, health sciences and sport. Routledge Savelsbergh GJ, van der Kamp J (2000) Information in learning to co‐ordinate and control movements: is there a need for specificity of practice? Int J Sport Psychol 31:467–484. 79 Savelsbergh GJP, Williams AM, Van der Kamp J, Ward P (2002) Visual search, anticipation and expertise in soccer goalkeepers. J Sports Sci 20:279–287. Schaal S, Atkeson CG, Sternad D (1996) One‐Handed Juggling: A Dynamical Approach to a Rhythmic Movement Task. J Mot Behav 28:165–183. Siegler I (2000) Idiosyncratic orientation strategies influence self‐controlled whole‐body rotations in the dark. Brain Res / Cogn Brain Res 9:205–207. Siegler I, Israel I (2002) The importance of head‐free gaze control in humans performing a spatial orientation task. Neurosci Lett 333:99–102. Siegler I, Israel I, Berthoz A (1998) Shift of the beating field of vestibular nystagmus: an orientation strategy? Neurosci Lett 254:93–96. Siegler I, Reymond G, Kemeny A, Berthoz A (2001) Sensorimotor integration in a driving simulator: contributions of motion cueing in elementary driving tasks. DSC’2001 (Driving Simulator Conference), Sophia‐Antipolis, 5‐7 Sept Siegler I, Reymond G, Leboucher P (1999) Role of otoliths in spatial orientation during passive travel in a curve. Ann NY Acad Sci 871:447–450. Siegler I, Viaud‐Delmon I, Israel I, Berthoz A (2000) Self‐motion perception during a sequence of whole‐body rotations in darkeness. Exp Brain Res 134:66–73. Siegler IA, Bardy BG, Warren WH (2010) Passive vs. active control of rhythmic ball bouncing: the role of visual information. J Exp Psychol Hum Percept Perform 36:729–750. Siegler IA, Bazile C, Warren WH (2013) Mixed control for perception and action: timing and error correction in rhythmic ball‐bouncing. Exp Brain Res 226:603–615. Sparrow WA (1983) The efficiency of skilled performance. J Mot Behav 15:237–261. Sparrow WA, Hughes KM, Russel AP, Le Rossignol PF (1999) Effects of practice and preferred rate on perceived exertion, metabolic variables and movement control. Hum Mov Sci 18:137–153. Sparrow WA, Newell KM (1998) Metabolic energy expenditure and the regulation of movement economy. Psychon Bull Rev 5:173–196. Sternad D, Duarte M, Katsumata H, Schaal S (2000) Dynamics of a bouncing ball in human performance. Phys Rev E 63:011902. Sternad D, Duarte M, Katsumata H, Schaal S (2001) Bouncing a ball: tuning into dynamic stability. J Exp Psychol Hum Percept Perform 27:1163–1184. Taga G (1995a) A model of the neuro‐musculo‐skeletal system for human locomotion. I. Emergence of basic gait. Biol Cybern 73:97–111. Taga G (1995b) A model of the neuro‐musculo‐skeletal system for human locomotion. II Real‐time adaptability under various constraints. Biol Cybern 73:113–121. Taga G (1998) A model of the neuro‐musculo‐skeletal system for anticipatory adjustment of human locomotion during obstacle avoidance. Biol Cybern 78:9–17. 80 Temprado JJ, Montagne G (2001) Les coordinations perceptivo‐motrices. Armand Colin Teulier C, Nourrit‐Lucas D (2008) L’évolution des coordinations lors de l’apprentissage d’habiletés motrices complexes. Sci Mot 64:35–47. Tlili M, Mottet D, Dupuy M‐A, Pavis B (2004) Stability and phase locking in human soccer juggling. Neurosci Lett 360:45–48. Todorov E (2004) Optimality principles in sensorimotor control. Nat Neurosci 7:907–915. Tufillaro NB, Albano AM (1986) Chaotic dynamics of a bouncing ball. Am J Phys 54:934–949. Turvey MT (1990) The challenge of a physical account of action: A personal view. In: Whiting HTA, Meijer OG, van Wieringen PCW (eds) The natural‐physical approach to movement control. VU University Press, Amsterdam, pp 57–93 van der Kamp J, Oudejans R, Savelsbergh GJ (2003) The development and learning of the visual control of movement: an ecological perspective. Infant Behav Dev 26:515. van Hof P, van der Kamp J, Savelsbergh GJ (2006) Three‐ to eight‐month‐old infants’ catching under monocular and binocular vision. Hum Mov Sci 25:18–36. van Santvoord AAM, Beek PJ (1994) Phasing and the pick‐up of optical information in cascade. Ecol Psychol 6:239–263. Vercher JL, Gauthier GM (1990) Eye‐head movement coordination: vestibulo‐ocular reflex suppression with head‐fixed target fixation. J Vestib Res 1:161–170. Vereijken B, Whiting HTA, Newell KM, Van Emmerik REA (1992) Free(z)ing degrees of freedom in skill acquisition. J Mot Behav 24:133–142. Viaud‐Delmon I, Siegler I, Israel I, et al. (2000) Eye deviation during rotation in darkness in trait anxiety: an early expression of perceptual avoidance? Biol Psychiatry 47:112–118. Volman MJ, Geuze RH (2000) Temporal stability of rhythmic tapping “on” and “off the beat”: a developmental study. Psychol Res 63:62–69. von Hofsten C (1980) Predictive reaching for moving objects by human infants. J Exp Child Psychol 30:369–382. von Hofsten C (1982) Eye‐hand coordination in the newborn. Dev Psychol 18:450–461. von Hofsten C, Fazel‐Zandy S (1984) Development of visually guided hand orientation in reaching. J Exp Child Psychol 38:208–219. Warren WH (2006) The dynamics of perception and action. Psychol Rev 113:358–389. Warren WH (1988) Action modes and laws of control for the visual guidance of action. In: Meijer O, Roth K (eds) Complex movement behavior: the motor‐action controversy. North Holland, Amsterdam, pp 339–380 Wei K, Dijkstra TM, Sternad D (2007) Passive stability and active control in a rhythmic task. J Neurophysiol 98:2633–2646. 81 Wildzunas RM, Barron TL, Wiley RW (1996) Visual display delay effetcs on pilot performance. Aviat Space Environ Med 67:214–221. Williams AM, Davids K (1998) Visual search strategy, selective attention, and expertise in soccer. Res Q Exerc Sport 69:111–128. Zanone PG, Kelso JA (1992) Evolution of behavioral attractors with learning: nonequilibrium phase transitions. J Exp Psychol Hum Percept Perform 18:403–421. Zanone PG, Kelso JA (1997) Coordination dynamics of learning and transfer: collective and component levels. J Exp Psychol Hum Percept Perform 23:1454–1480. 82 

Documents pareils