Learning Cost-Efficient Control Policies with XCSF: Generalization Capabilities and Further Improvement

Didier Marin; Jérémie Decock; Lionel Rigoux; Olivier Sigaud

Communication Dans Un Congrès Année : 2011

Learning Cost-Efficient Control Policies with XCSF: Generalization Capabilities and Further Improvement

(1, 2) , (1) , (1, 2) , (1, 2)

1
2

Didier Marin

Fonction : Auteur correspondant
PersonId : 925852

Connectez-vous pour contacter l'auteur

Institut des Systèmes Intelligents et de Robotique

AMAC

Jérémie Decock

Fonction : Auteur
PersonId : 9199
IdHAL : jeremie-decock
IdRef : 184149681

Institut des Systèmes Intelligents et de Robotique

Lionel Rigoux

Fonction : Auteur
PersonId : 925854

Institut des Systèmes Intelligents et de Robotique

AMAC

Olivier Sigaud

Fonction : Auteur
PersonId : 14932
IdHAL : olivier-sigaud
ORCID : 0000-0002-8544-0229
IdRef : 072724714

Institut des Systèmes Intelligents et de Robotique

AMAC

Résumé

In this paper we present a method based on the "learning from demonstration" paradigm to get a cost-efficient control policy in a continuous state and action space. The controlled plant is a two degrees-of-freedom planar arm actuated by six muscles. We learn a parametric control policy with xcsf from a few near-optimal trajectories, and we study its capability to generalize over the whole reachable space. Furthermore, we show that an additional Cross-Entropy Policy Search method can improve the global performance of the parametric controller.

Domaines

Intelligence artificielle [cs.AI]

Didier Marin : Connectez-vous pour contacter le contributeur

https://hal.sorbonne-universite.fr/hal-00703760

Soumis le : lundi 4 juin 2012-12:22:48

Dernière modification le : mercredi 27 mars 2024-15:02:03

Dates et versions

hal-00703760 , version 1 (04-06-2012)

Identifiants

HAL Id : hal-00703760 , version 1

Citer

Didier Marin, Jérémie Decock, Lionel Rigoux, Olivier Sigaud. Learning Cost-Efficient Control Policies with XCSF: Generalization Capabilities and Further Improvement. GECCO 2011, 2011, Dublin, Ireland. pp.1235-1242. ⟨hal-00703760⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UPMC CNRS ISIR SORBONNE-UNIVERSITE SU-SCIENCES ISIR_AMAC

140 Consultations

0 Téléchargements

Learning Cost-Efficient Control Policies with XCSF: Generalization Capabilities and Further Improvement

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager