Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Résolution optimale de DEC-POMDPs par recherche heuristique

Identifieur interne : 004C44 ( Main/Merge ); précédent : 004C43; suivant : 004C45

Résolution optimale de DEC-POMDPs par recherche heuristique

Auteurs : Daniel Szer [France] ; François Charpillet [France] ; Shlomo Zilberstein [États-Unis]

Source :

RBID : ISTEX:3E1980D7F90A8F33396C15CEDEEB3429AD98178F

Abstract

Nous présentons le premier formalisme de recherche heuristique permettant de résoudre les POMDPs décentralisés (DEC-POMDP). Notre algorithme peut être utilisé pour calculer des plans optimaux dans des domaines comme la multirobotique ou les réseaux de communication, et ceci à horizon fini comme à horizon infini. Nous présentons ici une nouvelle classe d’algorithmes qui fait le lien entre les méthodes de recherche heuristique classiques et la théorie du contrôle décentralisé. Nous prouvons l’optimalité de ce formalisme dans le cadre des politiques déterministes, et nous évaluons sa performance sur quelques exemples d’applications répandus dans le domaine du contrôle décentralisé.
We present the first generalized heuristic search formalism that is able to solve decentralized POMDPs of both finite and infinite horizon. Our algorithm is suitable for computing optimal plans for a cooperative group of agents that operate in a stochastic environment. These problems arise in domains such as multi-robot coordination, or network traffic control. We present a framework that is based on classical heuristic search on the one hand, and on decentralized control theory on the other hand. We prove that our approach is able to generate optimal deterministic controllers, and we study its performance on examples from the literature.

Url:
DOI: 10.3166/ria.21.107-128

Links toward previous steps (curation, corpus...)


Links to Exploration step

ISTEX:3E1980D7F90A8F33396C15CEDEEB3429AD98178F

Le document en format XML

<record>
<TEI wicri:istexFullTextTei="biblStruct">
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr">Résolution optimale de DEC-POMDPs par recherche heuristique</title>
<author>
<name sortKey="Szer, Daniel" sort="Szer, Daniel" uniqKey="Szer D" first="Daniel" last="Szer">Daniel Szer</name>
</author>
<author>
<name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
</author>
<author>
<name sortKey="Zilberstein, Shlomo" sort="Zilberstein, Shlomo" uniqKey="Zilberstein S" first="Shlomo" last="Zilberstein">Shlomo Zilberstein</name>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">ISTEX</idno>
<idno type="RBID">ISTEX:3E1980D7F90A8F33396C15CEDEEB3429AD98178F</idno>
<date when="2007" year="2007">2007</date>
<idno type="doi">10.3166/ria.21.107-128</idno>
<idno type="url">https://api.istex.fr/ark:/67375/HT0-B2V0R924-2/fulltext.pdf</idno>
<idno type="wicri:Area/Istex/Corpus">000E59</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Corpus" wicri:corpus="ISTEX">000E59</idno>
<idno type="wicri:Area/Istex/Curation">000E47</idno>
<idno type="wicri:Area/Istex/Checkpoint">000E91</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Checkpoint">000E91</idno>
<idno type="wicri:doubleKey">0992-499X:2007:Szer D:resolution:optimale:de</idno>
<idno type="wicri:Area/Main/Merge">004C44</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title level="a" type="main" xml:lang="fr">Résolution optimale de DEC-POMDPs par recherche heuristique</title>
<author>
<name sortKey="Szer, Daniel" sort="Szer, Daniel" uniqKey="Szer D" first="Daniel" last="Szer">Daniel Szer</name>
<affiliation wicri:level="3">
<country xml:lang="fr">France</country>
<wicri:regionArea>Equipe MAIA, INRIA-LORIA, B.P.239, 54506Vandœuvre-lès-Nancy</wicri:regionArea>
<placeName>
<region type="region" nuts="2">Grand Est</region>
<region type="old region" nuts="2">Lorraine (région)</region>
</placeName>
</affiliation>
<affiliation wicri:level="1">
<country wicri:rule="url">France</country>
</affiliation>
</author>
<author>
<name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
<affiliation wicri:level="3">
<country xml:lang="fr">France</country>
<wicri:regionArea>Equipe MAIA, INRIA-LORIA, B.P.239, 54506Vandœuvre-lès-Nancy</wicri:regionArea>
<placeName>
<region type="region" nuts="2">Grand Est</region>
<region type="old region" nuts="2">Lorraine (région)</region>
</placeName>
</affiliation>
<affiliation wicri:level="1">
<country wicri:rule="url">France</country>
</affiliation>
</author>
<author>
<name sortKey="Zilberstein, Shlomo" sort="Zilberstein, Shlomo" uniqKey="Zilberstein S" first="Shlomo" last="Zilberstein">Shlomo Zilberstein</name>
<affiliation wicri:level="4">
<country xml:lang="fr">États-Unis</country>
<wicri:regionArea>Department of Computer Science, University of Massachusetts Amherst, Amherst, MA01003</wicri:regionArea>
<placeName>
<region type="state">Massachusetts</region>
<settlement type="city">Amherst (Massachusetts)</settlement>
</placeName>
<orgName type="university">Université du Massachusetts à Amherst</orgName>
</affiliation>
<affiliation wicri:level="1">
<country wicri:rule="url">États-Unis</country>
</affiliation>
</author>
</analytic>
<monogr></monogr>
<series>
<title level="j" type="main">Revue d'Intelligence Artificielle</title>
<title level="j" type="abbrev">Rev. Int. Artificielle</title>
<idno type="ISSN">0992-499X</idno>
<idno type="eISSN">1958-5748</idno>
<imprint>
<publisher>Lavoisier</publisher>
<date type="published" when="2007-01">2007</date>
<biblScope unit="vol">21</biblScope>
<biblScope unit="issue">1</biblScope>
<biblScope unit="page" from="107">107</biblScope>
<biblScope unit="page" to="128">128</biblScope>
<biblScope unit="page-count">128</biblScope>
<biblScope unit="ref-count">0</biblScope>
<biblScope unit="fig-count">0</biblScope>
<biblScope unit="table-count">0</biblScope>
</imprint>
<idno type="ISSN">0992-499X</idno>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<idno type="ISSN">0992-499X</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass></textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Nous présentons le premier formalisme de recherche heuristique permettant de résoudre les POMDPs décentralisés (DEC-POMDP). Notre algorithme peut être utilisé pour calculer des plans optimaux dans des domaines comme la multirobotique ou les réseaux de communication, et ceci à horizon fini comme à horizon infini. Nous présentons ici une nouvelle classe d’algorithmes qui fait le lien entre les méthodes de recherche heuristique classiques et la théorie du contrôle décentralisé. Nous prouvons l’optimalité de ce formalisme dans le cadre des politiques déterministes, et nous évaluons sa performance sur quelques exemples d’applications répandus dans le domaine du contrôle décentralisé.</div>
<div type="abstract" xml:lang="en">We present the first generalized heuristic search formalism that is able to solve decentralized POMDPs of both finite and infinite horizon. Our algorithm is suitable for computing optimal plans for a cooperative group of agents that operate in a stochastic environment. These problems arise in domains such as multi-robot coordination, or network traffic control. We present a framework that is based on classical heuristic search on the one hand, and on decentralized control theory on the other hand. We prove that our approach is able to generate optimal deterministic controllers, and we study its performance on examples from the literature.</div>
</front>
</TEI>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Merge
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 004C44 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Main/Merge/biblio.hfd -nk 004C44 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Main
   |étape=   Merge
   |type=    RBID
   |clé=     ISTEX:3E1980D7F90A8F33396C15CEDEEB3429AD98178F
   |texte=   Résolution optimale de DEC-POMDPs par recherche heuristique
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022