Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Construction de systèmes multi-agents par apprentissage collectif à base d’interactions

Identifieur interne : 000F19 ( Istex/Checkpoint ); précédent : 000F18; suivant : 000F20

Construction de systèmes multi-agents par apprentissage collectif à base d’interactions

Auteurs : Vincent Thomas [France] ; Christine Bourjot [France] ; Vincent Chevrier [France]

Source :

RBID : ISTEX:21107E3658F613302E7F635DE18FF3ABA903A3A3

Abstract

Cet article se focalise sur des approches formelles pour la construction de systèmes multi-agents et cherche à proposer des apprentissages décentralisés pour construire les comportements d’agents sociaux. Il propose un formalisme original, l’interac-DEC-POMDP inspiré des modèles markoviens au sein duquel les agents peuvent interagir directement et localement entre eux. A partir de ce formalisme, cet article propose un algorithme d’apprentissage décentralisé fondé sur une répartition heuristique des gains des agents au cours des interactions. Une démarche expérimentale valide sa capacité à produire automatiquement des comportements collectifs. Les techniques présentées pourraient alors constituer des moyens permettant aux agents de décider automatiquement et de manière décentralisée comment s’organiser avec les autres pour résoudre un problème donné.
This article deals with formal approaches to build multi-agent systems. The goal of the conducted works was to propose decentralized learning techniques to build the bejavior of social agents. This article presents an original formalism, the interac-DECPOMDP, in which agents can directly interact. On the basis of this formalism, this article proposes a decentralized learning algorithm based on a heuristic distribution of rewards during interactions. Experiments have validated its ability to automatically build collective behaviors. The presented techniques could then constitute a mean to operationalize self-organization in order to solve problems.

Url:
DOI: 10.3166/ria.21.643-672


Affiliations:


Links toward previous steps (curation, corpus...)


Links to Exploration step

ISTEX:21107E3658F613302E7F635DE18FF3ABA903A3A3

Le document en format XML

<record>
<TEI wicri:istexFullTextTei="biblStruct">
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr">Construction de systèmes multi-agents par apprentissage collectif à base d’interactions</title>
<author>
<name sortKey="Thomas, Vincent" sort="Thomas, Vincent" uniqKey="Thomas V" first="Vincent" last="Thomas">Vincent Thomas</name>
</author>
<author>
<name sortKey="Bourjot, Christine" sort="Bourjot, Christine" uniqKey="Bourjot C" first="Christine" last="Bourjot">Christine Bourjot</name>
</author>
<author>
<name sortKey="Chevrier, Vincent" sort="Chevrier, Vincent" uniqKey="Chevrier V" first="Vincent" last="Chevrier">Vincent Chevrier</name>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">ISTEX</idno>
<idno type="RBID">ISTEX:21107E3658F613302E7F635DE18FF3ABA903A3A3</idno>
<date when="2007" year="2007">2007</date>
<idno type="doi">10.3166/ria.21.643-672</idno>
<idno type="url">https://api.istex.fr/ark:/67375/HT0-LGR21QH5-Q/fulltext.pdf</idno>
<idno type="wicri:Area/Istex/Corpus">000746</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Corpus" wicri:corpus="ISTEX">000746</idno>
<idno type="wicri:Area/Istex/Curation">000741</idno>
<idno type="wicri:Area/Istex/Checkpoint">000F19</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Checkpoint">000F19</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title level="a" type="main" xml:lang="fr">Construction de systèmes multi-agents par apprentissage collectif à base d’interactions</title>
<author>
<name sortKey="Thomas, Vincent" sort="Thomas, Vincent" uniqKey="Thomas V" first="Vincent" last="Thomas">Vincent Thomas</name>
<affiliation></affiliation>
<affiliation wicri:level="1">
<country wicri:rule="url">France</country>
</affiliation>
</author>
<author>
<name sortKey="Bourjot, Christine" sort="Bourjot, Christine" uniqKey="Bourjot C" first="Christine" last="Bourjot">Christine Bourjot</name>
<affiliation></affiliation>
<affiliation wicri:level="1">
<country wicri:rule="url">France</country>
</affiliation>
</author>
<author>
<name sortKey="Chevrier, Vincent" sort="Chevrier, Vincent" uniqKey="Chevrier V" first="Vincent" last="Chevrier">Vincent Chevrier</name>
<affiliation></affiliation>
<affiliation wicri:level="1">
<country wicri:rule="url">France</country>
</affiliation>
</author>
</analytic>
<monogr></monogr>
<series>
<title level="j" type="main">Revue d'Intelligence Artificielle</title>
<title level="j" type="abbrev">Rev. Int. Artificielle</title>
<idno type="ISSN">0992-499X</idno>
<idno type="eISSN">1958-5748</idno>
<imprint>
<publisher>Lavoisier</publisher>
<date type="published" when="2007-09">2007</date>
<biblScope unit="vol">21</biblScope>
<biblScope unit="issue">5-6</biblScope>
<biblScope unit="page" from="643">643</biblScope>
<biblScope unit="page" to="672">672</biblScope>
<biblScope unit="page-count">30</biblScope>
<biblScope unit="ref-count">0</biblScope>
<biblScope unit="fig-count">0</biblScope>
<biblScope unit="table-count">0</biblScope>
</imprint>
<idno type="ISSN">0992-499X</idno>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<idno type="ISSN">0992-499X</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass></textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Cet article se focalise sur des approches formelles pour la construction de systèmes multi-agents et cherche à proposer des apprentissages décentralisés pour construire les comportements d’agents sociaux. Il propose un formalisme original, l’interac-DEC-POMDP inspiré des modèles markoviens au sein duquel les agents peuvent interagir directement et localement entre eux. A partir de ce formalisme, cet article propose un algorithme d’apprentissage décentralisé fondé sur une répartition heuristique des gains des agents au cours des interactions. Une démarche expérimentale valide sa capacité à produire automatiquement des comportements collectifs. Les techniques présentées pourraient alors constituer des moyens permettant aux agents de décider automatiquement et de manière décentralisée comment s’organiser avec les autres pour résoudre un problème donné.</div>
<div type="abstract" xml:lang="en">This article deals with formal approaches to build multi-agent systems. The goal of the conducted works was to propose decentralized learning techniques to build the bejavior of social agents. This article presents an original formalism, the interac-DECPOMDP, in which agents can directly interact. On the basis of this formalism, this article proposes a decentralized learning algorithm based on a heuristic distribution of rewards during interactions. Experiments have validated its ability to automatically build collective behaviors. The presented techniques could then constitute a mean to operationalize self-organization in order to solve problems.</div>
</front>
</TEI>
<affiliations>
<list>
<country>
<li>France</li>
</country>
</list>
<tree>
<country name="France">
<noRegion>
<name sortKey="Thomas, Vincent" sort="Thomas, Vincent" uniqKey="Thomas V" first="Vincent" last="Thomas">Vincent Thomas</name>
</noRegion>
<name sortKey="Bourjot, Christine" sort="Bourjot, Christine" uniqKey="Bourjot C" first="Christine" last="Bourjot">Christine Bourjot</name>
<name sortKey="Chevrier, Vincent" sort="Chevrier, Vincent" uniqKey="Chevrier V" first="Vincent" last="Chevrier">Vincent Chevrier</name>
</country>
</tree>
</affiliations>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Istex/Checkpoint
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000F19 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Istex/Checkpoint/biblio.hfd -nk 000F19 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Istex
   |étape=   Checkpoint
   |type=    RBID
   |clé=     ISTEX:21107E3658F613302E7F635DE18FF3ABA903A3A3
   |texte=   Construction de systèmes multi-agents par apprentissage collectif à base d’interactions
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022