Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Développement autonome des comportements de base d’un agent

Identifieur interne : 006375 ( Main/Merge ); précédent : 006374; suivant : 006376

Développement autonome des comportements de base d’un agent

Auteurs : Olivier Buffet [Australie, France] ; Alain Dutech [France] ; François Charpillet [France]

Source :

RBID : ISTEX:93C641E8E56556E40965F86B4990EEC602C8ECD7

Abstract

La problématique abordée dans cet article est celle de la conception automatique d’agents autonomes devant résoudre des tâches complexes mettant en œuvre plusieurs objectifs potentiellement concurrents. Nous proposons alors une approche modulaire s’appuyant sur les principes de la sélection d’action où les actions recommandées par plusieurs comportements de base sont combinées en une décision globale. Dans ce cadre, notre principale contribution est une méthode pour qu’un agent puisse définir et construire automatiquement les comportements de base dont il a besoin via des méthodes d’apprentissage par renforcement incrémentales. Nous obtenons ainsi une architecture très autonome ne nécessitant que peu de réglages. Cette approche est testée et discutée sur un problème représentatif issu du "monde des tuiles"
The problem addressed in this article is that of automatically designing autonomous agents having to solve complex tasks involving several -and possibly concurrent- objectives. We propose a modular approach based on the principles of action selection where the actions recommanded by several basic behaviors are combined in a global decision. In this framework, our main contribution is a method making an agent able to automatically define and build the basic behaviors it needs through incremental reinforcement learning methods. This way, we obtain a very autonomous architecture requiring very few hand-coding. This approach is tested and discussed on a representative problem taken from the “tile-world”.

Url:
DOI: 10.3166/ria.19.603-632

Links toward previous steps (curation, corpus...)


Links to Exploration step

ISTEX:93C641E8E56556E40965F86B4990EEC602C8ECD7

Le document en format XML

<record>
<TEI wicri:istexFullTextTei="biblStruct">
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr">Développement autonome des comportements de base d’un agent</title>
<author>
<name sortKey="Buffet, Olivier" sort="Buffet, Olivier" uniqKey="Buffet O" first="Olivier" last="Buffet">Olivier Buffet</name>
</author>
<author>
<name sortKey="Dutech, Alain" sort="Dutech, Alain" uniqKey="Dutech A" first="Alain" last="Dutech">Alain Dutech</name>
</author>
<author>
<name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">ISTEX</idno>
<idno type="RBID">ISTEX:93C641E8E56556E40965F86B4990EEC602C8ECD7</idno>
<date when="2005" year="2005">2005</date>
<idno type="doi">10.3166/ria.19.603-632</idno>
<idno type="url">https://api.istex.fr/ark:/67375/HT0-5T13C6BM-N/fulltext.pdf</idno>
<idno type="wicri:Area/Istex/Corpus">002240</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Corpus" wicri:corpus="ISTEX">002240</idno>
<idno type="wicri:Area/Istex/Curation">002210</idno>
<idno type="wicri:Area/Istex/Checkpoint">001464</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Checkpoint">001464</idno>
<idno type="wicri:doubleKey">0992-499X:2005:Buffet O:developpement:autonome:des</idno>
<idno type="wicri:Area/Main/Merge">006375</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title level="a" type="main" xml:lang="fr">Développement autonome des comportements de base d’un agent</title>
<author>
<name sortKey="Buffet, Olivier" sort="Buffet, Olivier" uniqKey="Buffet O" first="Olivier" last="Buffet">Olivier Buffet</name>
<affiliation wicri:level="1">
<country xml:lang="fr">Australie</country>
<wicri:regionArea>National ICT Australia/The Australian National University, RSISE Building 115 – ANU, Canberra, ACT0200</wicri:regionArea>
<wicri:noRegion>ACT0200</wicri:noRegion>
</affiliation>
<affiliation wicri:level="3">
<country xml:lang="fr">France</country>
<wicri:regionArea>Loria - INRIA-Lorraine / Campus Scientifique, BP 239, 54506Vandœuvre-lès-Nancy cedex</wicri:regionArea>
<placeName>
<region type="region" nuts="2">Grand Est</region>
<region type="old region" nuts="2">Lorraine (région)</region>
<settlement type="city">cedex</settlement>
</placeName>
</affiliation>
<affiliation wicri:level="1">
<country wicri:rule="url">Australie</country>
</affiliation>
</author>
<author>
<name sortKey="Dutech, Alain" sort="Dutech, Alain" uniqKey="Dutech A" first="Alain" last="Dutech">Alain Dutech</name>
<affiliation wicri:level="3">
<country xml:lang="fr">France</country>
<wicri:regionArea>Loria - INRIA-Lorraine / Campus Scientifique, BP 239, 54506Vandœuvre-lès-Nancy cedex</wicri:regionArea>
<placeName>
<region type="region" nuts="2">Grand Est</region>
<region type="old region" nuts="2">Lorraine (région)</region>
<settlement type="city">cedex</settlement>
</placeName>
</affiliation>
<affiliation wicri:level="1">
<country wicri:rule="url">France</country>
</affiliation>
</author>
<author>
<name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
<affiliation wicri:level="3">
<country xml:lang="fr">France</country>
<wicri:regionArea>Loria - INRIA-Lorraine / Campus Scientifique, BP 239, 54506Vandœuvre-lès-Nancy cedex</wicri:regionArea>
<placeName>
<region type="region" nuts="2">Grand Est</region>
<region type="old region" nuts="2">Lorraine (région)</region>
<settlement type="city">cedex</settlement>
</placeName>
</affiliation>
<affiliation wicri:level="1">
<country wicri:rule="url">France</country>
</affiliation>
</author>
</analytic>
<monogr></monogr>
<series>
<title level="j" type="main">Revue d'Intelligence Artificielle</title>
<title level="j" type="abbrev">Rev. Int. Artificielle</title>
<idno type="ISSN">0992-499X</idno>
<idno type="eISSN">1958-5748</idno>
<imprint>
<publisher>Lavoisier</publisher>
<date type="published" when="2005-07">2005</date>
<biblScope unit="vol">19</biblScope>
<biblScope unit="issue">4-5</biblScope>
<biblScope unit="page" from="603">603</biblScope>
<biblScope unit="page" to="632">632</biblScope>
<biblScope unit="page-count">30</biblScope>
<biblScope unit="ref-count">0</biblScope>
<biblScope unit="fig-count">0</biblScope>
<biblScope unit="table-count">0</biblScope>
</imprint>
<idno type="ISSN">0992-499X</idno>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<idno type="ISSN">0992-499X</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass></textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">La problématique abordée dans cet article est celle de la conception automatique d’agents autonomes devant résoudre des tâches complexes mettant en œuvre plusieurs objectifs potentiellement concurrents. Nous proposons alors une approche modulaire s’appuyant sur les principes de la sélection d’action où les actions recommandées par plusieurs comportements de base sont combinées en une décision globale. Dans ce cadre, notre principale contribution est une méthode pour qu’un agent puisse définir et construire automatiquement les comportements de base dont il a besoin via des méthodes d’apprentissage par renforcement incrémentales. Nous obtenons ainsi une architecture très autonome ne nécessitant que peu de réglages. Cette approche est testée et discutée sur un problème représentatif issu du "monde des tuiles"</div>
<div type="abstract" xml:lang="en">The problem addressed in this article is that of automatically designing autonomous agents having to solve complex tasks involving several -and possibly concurrent- objectives. We propose a modular approach based on the principles of action selection where the actions recommanded by several basic behaviors are combined in a global decision. In this framework, our main contribution is a method making an agent able to automatically define and build the basic behaviors it needs through incremental reinforcement learning methods. This way, we obtain a very autonomous architecture requiring very few hand-coding. This approach is tested and discussed on a representative problem taken from the “tile-world”.</div>
</front>
</TEI>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Merge
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 006375 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Main/Merge/biblio.hfd -nk 006375 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Main
   |étape=   Merge
   |type=    RBID
   |clé=     ISTEX:93C641E8E56556E40965F86B4990EEC602C8ECD7
   |texte=   Développement autonome des comportements de base d’un agent
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022