Distribution sur les croyances pour la planification de Dec-POMDP
Identifieur interne : 001C87 ( Istex/Curation ); précédent : 001C86; suivant : 001C88Distribution sur les croyances pour la planification de Dec-POMDP
Auteurs : Gabriel Corona [France] ; François Charpillet [France]Source :
- Revue d'Intelligence Artificielle [ 0992-499X ] ; 2010.
Abstract
Nous proposons une nouvelle méthode de calcul d’une politique approchée d’un Dec-POMDP qui surpasse les approches de l’état de l’art dont PBDP et MBDP. Notre approche est fondée sur une estimation de la distribution de probabilité des croyances atteignables pour un horizon donné. Cette estimation est faite en simulant l’exécution d’une politique heuristique du Dec-POMDP considéré. Cette distribution de probabilité des croyances est ensuite utilisée pour choisir les arbres de politique candidats à l’horizon considéré grâce à un critère simple qui cherche à minimiser l’erreur induite par l’élagage.
We propose a new method to compute an approximate policy of a Dec-POMDP which outperforms state of the art approaches including PBDP and MBDP. Our approach is based on an estimation of the probability distribution of beliefs reachable for a given horizon. This estimation is done by simulating the execution of an heuristic policy of the Dec-POMDP. This probability distribution over beliefs is then used to choose the candidate policy trees for the given horizon using a simple criterion which tries to minimise the error induced by pruning.
Url:
DOI: 10.3166/ria.24.525-544
Links toward previous steps (curation, corpus...)
- to stream Istex, to step Corpus: Pour aller vers cette notice dans l'étape Curation :001D08
Links to Exploration step
ISTEX:7CC4F50B4BB5A1385672B948EE1936C1F792F485Le document en format XML
<record><TEI wicri:istexFullTextTei="biblStruct"><teiHeader><fileDesc><titleStmt><title xml:lang="fr">Distribution sur les croyances pour la planification de Dec-POMDP</title>
<author><name sortKey="Corona, Gabriel" sort="Corona, Gabriel" uniqKey="Corona G" first="Gabriel" last="Corona">Gabriel Corona</name>
<affiliation wicri:level="1"><mods:affiliation>E-mail: gabriel.corona@loria.fr</mods:affiliation>
<country wicri:rule="url">France</country>
</affiliation>
</author>
<author><name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
<affiliation wicri:level="1"><mods:affiliation>E-mail: francois.charpillet@loria.fr</mods:affiliation>
<country wicri:rule="url">France</country>
</affiliation>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">ISTEX</idno>
<idno type="RBID">ISTEX:7CC4F50B4BB5A1385672B948EE1936C1F792F485</idno>
<date when="2010" year="2010">2010</date>
<idno type="doi">10.3166/ria.24.525-544</idno>
<idno type="url">https://api.istex.fr/ark:/67375/HT0-LV01NMVD-Z/fulltext.pdf</idno>
<idno type="wicri:Area/Istex/Corpus">001D08</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Corpus" wicri:corpus="ISTEX">001D08</idno>
<idno type="wicri:Area/Istex/Curation">001C87</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title level="a" type="main" xml:lang="fr">Distribution sur les croyances pour la planification de Dec-POMDP</title>
<author><name sortKey="Corona, Gabriel" sort="Corona, Gabriel" uniqKey="Corona G" first="Gabriel" last="Corona">Gabriel Corona</name>
<affiliation wicri:level="1"><mods:affiliation>E-mail: gabriel.corona@loria.fr</mods:affiliation>
<country wicri:rule="url">France</country>
</affiliation>
</author>
<author><name sortKey="Charpillet, Francois" sort="Charpillet, Francois" uniqKey="Charpillet F" first="François" last="Charpillet">François Charpillet</name>
<affiliation wicri:level="1"><mods:affiliation>E-mail: francois.charpillet@loria.fr</mods:affiliation>
<country wicri:rule="url">France</country>
</affiliation>
</author>
</analytic>
<monogr></monogr>
<series><title level="j" type="main">Revue d'Intelligence Artificielle</title>
<title level="j" type="abbrev">Rev. Int. Artificielle</title>
<idno type="ISSN">0992-499X</idno>
<idno type="eISSN">1958-5748</idno>
<imprint><publisher>Lavoisier</publisher>
<date type="published" when="2010-07">2010</date>
<biblScope unit="vol">24</biblScope>
<biblScope unit="issue">4</biblScope>
<biblScope unit="page" from="525">525</biblScope>
<biblScope unit="page" to="544">544</biblScope>
<biblScope unit="page-count">20</biblScope>
<biblScope unit="ref-count">0</biblScope>
<biblScope unit="fig-count">0</biblScope>
<biblScope unit="table-count">0</biblScope>
</imprint>
<idno type="ISSN">0992-499X</idno>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt><idno type="ISSN">0992-499X</idno>
</seriesStmt>
</fileDesc>
<profileDesc><textClass></textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr">Nous proposons une nouvelle méthode de calcul d’une politique approchée d’un Dec-POMDP qui surpasse les approches de l’état de l’art dont PBDP et MBDP. Notre approche est fondée sur une estimation de la distribution de probabilité des croyances atteignables pour un horizon donné. Cette estimation est faite en simulant l’exécution d’une politique heuristique du Dec-POMDP considéré. Cette distribution de probabilité des croyances est ensuite utilisée pour choisir les arbres de politique candidats à l’horizon considéré grâce à un critère simple qui cherche à minimiser l’erreur induite par l’élagage.</div>
<div type="abstract" xml:lang="en">We propose a new method to compute an approximate policy of a Dec-POMDP which outperforms state of the art approaches including PBDP and MBDP. Our approach is based on an estimation of the probability distribution of beliefs reachable for a given horizon. This estimation is done by simulating the execution of an heuristic policy of the Dec-POMDP. This probability distribution over beliefs is then used to choose the candidate policy trees for the given horizon using a simple criterion which tries to minimise the error induced by pruning.</div>
</front>
</TEI>
</record>
Pour manipuler ce document sous Unix (Dilib)
EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Istex/Curation
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 001C87 | SxmlIndent | more
Ou
HfdSelect -h $EXPLOR_AREA/Data/Istex/Curation/biblio.hfd -nk 001C87 | SxmlIndent | more
Pour mettre un lien sur cette page dans le réseau Wicri
{{Explor lien |wiki= Wicri/Lorraine |area= InforLorV4 |flux= Istex |étape= Curation |type= RBID |clé= ISTEX:7CC4F50B4BB5A1385672B948EE1936C1F792F485 |texte= Distribution sur les croyances pour la planification de Dec-POMDP }}
![]() | This area was generated with Dilib version V0.6.33. | ![]() |