Apprentissage par renforcement appliqué au contrôle moteur : reproduction du principe d'isochronie
Résumé
Notre système moteur se caractérise par une redondance qui laisse une infinité de possibilités quant au mouvement que nous mettons en œuvre. Pourtant, l'expérience nous conduit a sélectionner des comportements bien spécifiques dans une situation donnée. Les spécialistes du contrôle moteur ont observé qu'il existait une relation linéaire entre la distance qui nous sépare d'un objectif et la durée du mouvement que nous effectuons pour l'atteindre, que l'on appelle principe d'isochronie. En robotique, les méthodes de commande optimale ne permettent pas d'obtenir des propriétés similaires. Nous proposons ici un modèle d'apprentissage du contrôle moteur bas sur l'utilisation de méthodes d'apprentissage par renforcement appelées Acteur-Critique. Nous illustrons sur une tâche de pointage simple que ce modèle est capable d'apprendre a réaliser celle-ci en vérifiant le principe d'isochronie.