Apprentissage de politiques efficaces avec XCSF et CEPS

Didier Marin; Jérémie Decock; Lionel Rigoux; Olivier Sigaud

Communication Dans Un Congrès Année : 2011

Apprentissage de politiques efficaces avec XCSF et CEPS

(1, 2) , (1) , (1, 2) , (1, 2)

1
2

Didier Marin

Fonction : Auteur
PersonId : 925852

Institut des Systèmes Intelligents et de Robotique

AMAC

Jérémie Decock

Fonction : Auteur
PersonId : 9199
IdHAL : jeremie-decock
IdRef : 184149681

Institut des Systèmes Intelligents et de Robotique

Lionel Rigoux

Fonction : Auteur
PersonId : 925854

Institut des Systèmes Intelligents et de Robotique

AMAC

Olivier Sigaud

Fonction : Auteur
PersonId : 14932
IdHAL : olivier-sigaud
ORCID : 0000-0002-8544-0229
IdRef : 072724714

Institut des Systèmes Intelligents et de Robotique

AMAC

Résumé

Nous proposons dans cette contribution une méthode qui permet d'obtenir une politique efficace dans un cadre où l'état et l'action sont continus. Le système contrôlé est un bras à deux degrés de liberté actionné par six muscles. Nous apprenons par démonstration une politique paramétrique avec le système de classeurs xcsf à partir de trajectoires quasi-optimales et nous étudions la capacité d'xcsf à généraliser ce qu'il a appris le long de ces trajectoires sur l'ensemble de l'espace atteignable. De plus, nous montrons qu'une méthode d'optimisation stochastique appelée Cross-Entropy Policy Search permet d'améliorer encore la performance du contrôleur paramétrique.

Domaines

Intelligence artificielle [cs.AI]

Didier Marin : Connectez-vous pour contacter le contributeur

https://hal.sorbonne-universite.fr/hal-00703774

Soumis le : lundi 4 juin 2012-13:08:59

Dernière modification le : mercredi 27 mars 2024-15:02:03

Dates et versions

hal-00703774 , version 1 (04-06-2012)

Identifiants

HAL Id : hal-00703774 , version 1

Citer

Didier Marin, Jérémie Decock, Lionel Rigoux, Olivier Sigaud. Apprentissage de politiques efficaces avec XCSF et CEPS. JFPDA 2011, 2011, Rouen, France. pp.298-310. ⟨hal-00703774⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UPMC CNRS ISIR SORBONNE-UNIVERSITE SU-SCIENCES ISIR_AMAC

127 Consultations

0 Téléchargements

Apprentissage de politiques efficaces avec XCSF et CEPS

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager