Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Distribution sur les croyances pour la planification de Dec-POMDP

Identifieur interne : 001C87 ( Istex/Curation ); précédent : 001C86; suivant : 001C88

Distribution sur les croyances pour la planification de Dec-POMDP

Auteurs : Gabriel Corona [France] ; François Charpillet [France]

Source :

RBID : ISTEX:7CC4F50B4BB5A1385672B948EE1936C1F792F485

Abstract

Nous proposons une nouvelle méthode de calcul d’une politique approchée d’un Dec-POMDP qui surpasse les approches de l’état de l’art dont PBDP et MBDP. Notre approche est fondée sur une estimation de la distribution de probabilité des croyances atteignables pour un horizon donné. Cette estimation est faite en simulant l’exécution d’une politique heuristique du Dec-POMDP considéré. Cette distribution de probabilité des croyances est ensuite utilisée pour choisir les arbres de politique candidats à l’horizon considéré grâce à un critère simple qui cherche à minimiser l’erreur induite par l’élagage.
We propose a new method to compute an approximate policy of a Dec-POMDP which outperforms state of the art approaches including PBDP and MBDP. Our approach is based on an estimation of the probability distribution of beliefs reachable for a given horizon. This estimation is done by simulating the execution of an heuristic policy of the Dec-POMDP. This probability distribution over beliefs is then used to choose the candidate policy trees for the given horizon using a simple criterion which tries to minimise the error induced by pruning.

Url:
DOI: 10.3166/ria.24.525-544

Links toward previous steps (curation, corpus...)


Links to Exploration step

ISTEX:7CC4F50B4BB5A1385672B948EE1936C1F792F485

Le document en format XML

<record>
<TEI wicri:istexFullTextTei="biblStruct">
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr">Distribution sur les croyances pour la planification de Dec-POMDP</title>
<author>
<name sortKey="Corona, Gabriel" sort="Corona, Gabriel" uniqKey="Corona G" first="Gabriel" last="Corona">Gabriel Corona</name>
<affiliation wicri:level="1">
<mods:affiliation>E-mail: gabriel.corona@loria.fr</mods:affiliation>
<country wicri:rule="url">France</country>
</affiliation>
</author>
<author>
<name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
<affiliation wicri:level="1">
<mods:affiliation>E-mail: francois.charpillet@loria.fr</mods:affiliation>
<country wicri:rule="url">France</country>
</affiliation>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">ISTEX</idno>
<idno type="RBID">ISTEX:7CC4F50B4BB5A1385672B948EE1936C1F792F485</idno>
<date when="2010" year="2010">2010</date>
<idno type="doi">10.3166/ria.24.525-544</idno>
<idno type="url">https://api.istex.fr/ark:/67375/HT0-LV01NMVD-Z/fulltext.pdf</idno>
<idno type="wicri:Area/Istex/Corpus">001D08</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Corpus" wicri:corpus="ISTEX">001D08</idno>
<idno type="wicri:Area/Istex/Curation">001C87</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title level="a" type="main" xml:lang="fr">Distribution sur les croyances pour la planification de Dec-POMDP</title>
<author>
<name sortKey="Corona, Gabriel" sort="Corona, Gabriel" uniqKey="Corona G" first="Gabriel" last="Corona">Gabriel Corona</name>
<affiliation wicri:level="1">
<mods:affiliation>E-mail: gabriel.corona@loria.fr</mods:affiliation>
<country wicri:rule="url">France</country>
</affiliation>
</author>
<author>
<name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
<affiliation wicri:level="1">
<mods:affiliation>E-mail: francois.charpillet@loria.fr</mods:affiliation>
<country wicri:rule="url">France</country>
</affiliation>
</author>
</analytic>
<monogr></monogr>
<series>
<title level="j" type="main">Revue d'Intelligence Artificielle</title>
<title level="j" type="abbrev">Rev. Int. Artificielle</title>
<idno type="ISSN">0992-499X</idno>
<idno type="eISSN">1958-5748</idno>
<imprint>
<publisher>Lavoisier</publisher>
<date type="published" when="2010-07">2010</date>
<biblScope unit="vol">24</biblScope>
<biblScope unit="issue">4</biblScope>
<biblScope unit="page" from="525">525</biblScope>
<biblScope unit="page" to="544">544</biblScope>
<biblScope unit="page-count">20</biblScope>
<biblScope unit="ref-count">0</biblScope>
<biblScope unit="fig-count">0</biblScope>
<biblScope unit="table-count">0</biblScope>
</imprint>
<idno type="ISSN">0992-499X</idno>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<idno type="ISSN">0992-499X</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass></textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Nous proposons une nouvelle méthode de calcul d’une politique approchée d’un Dec-POMDP qui surpasse les approches de l’état de l’art dont PBDP et MBDP. Notre approche est fondée sur une estimation de la distribution de probabilité des croyances atteignables pour un horizon donné. Cette estimation est faite en simulant l’exécution d’une politique heuristique du Dec-POMDP considéré. Cette distribution de probabilité des croyances est ensuite utilisée pour choisir les arbres de politique candidats à l’horizon considéré grâce à un critère simple qui cherche à minimiser l’erreur induite par l’élagage.</div>
<div type="abstract" xml:lang="en">We propose a new method to compute an approximate policy of a Dec-POMDP which outperforms state of the art approaches including PBDP and MBDP. Our approach is based on an estimation of the probability distribution of beliefs reachable for a given horizon. This estimation is done by simulating the execution of an heuristic policy of the Dec-POMDP. This probability distribution over beliefs is then used to choose the candidate policy trees for the given horizon using a simple criterion which tries to minimise the error induced by pruning.</div>
</front>
</TEI>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Istex/Curation
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 001C87 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Istex/Curation/biblio.hfd -nk 001C87 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Istex
   |étape=   Curation
   |type=    RBID
   |clé=     ISTEX:7CC4F50B4BB5A1385672B948EE1936C1F792F485
   |texte=   Distribution sur les croyances pour la planification de Dec-POMDP
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022