Serveur d'exploration sur la recherche en informatique en Lorraine - Checkpoint (PascalFrancis)

Index « Keywords » - entrée « Markov decision »
Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.
Markov chain < Markov decision < Markov model  Facettes :

List of bibliographic references

Number of relevant bibliographic references: 17.
Ident.Authors (with country if any)Title
000158 (2010) Gabriel Corona [France] ; François Charpillet [France]Distribution sur les croyances pour la planification de Dec-POMDP: PSMBDP
000307 (2006) Décision et planification dans l'incertain
000313 (2006) Laurent Peret [France] ; Frédérick Garcia [France]Recherche en ligne pour les processus décisionnels de Markov
000316 (2006) Florent Teichteil-Konigsbuch [France] ; Patrick Fabiani [France]Processus décisionnels de Markov décomposés et factorisés pour l'optimisation de stratégies d'exploration
000317 (2006) Paul Weng [France]Processus de décision markoviens et préférences non classiques
000318 (2006) Sébastien Paquet [Canada] ; Ludovic Tobin [Canada] ; Brahim Chaib-Draa [Canada]Prise de décision en temps-réel pour des POMDP de grande taille
000322 (2006) Pascal Garcia [France]Exploration guidée en apprentissage par renforcement : Connaissances a priori et relaxation de contraintes
000323 (2006) Olivier Buffet [France, Australie] ; Alain Dutech [France] ; Francois Charpillet [France]Etude de différentes combinaisons de comportements adaptatives
000326 (2006) Guillaume J. Laurent [France] ; Emmanuel Piat [France]Apprentissage par renforcement dans le cadre des processus décisionnels de Markov factorisés observables dans le désordre : Étude expérimentale du Q-Learning parallèle appliqué aux problèmes du labyrinthe et du New York Driving
000327 (2006) Olivier Gies [Canada] ; Brahim Chaib-Draa [Canada]Apprentissage de la coordination multiagent : Une méthode basée sur le Q-learning par jeu adaptatif
000329 (2006) Iadine Chades [France]Algorithmes de co-évolution pour la résolution approchée de PDM multi-agent
000438 (2005) Olivier Buffet [Australie, France] ; Alain Dutech [France] ; Francois Charpillet [France]Développement autonome des comportements de base d'un agent
000522 (2005) Daniel Szer [France] ; Francois Charpillet [France]An optimal best-first search algorithm for solving infinite horizon DEC-POMDPs
000816 (2002) Bruno Scherrer [France] ; Francois Charpillet [France]Cooperative co-learning: A model-based approach for solving multi agent Reinforcement problems
000840 (2002) Bruno Scherrer [France]A connectionist architecture that adapts its representation to complex tasks
000867 (2001) Pierre Laroche [France] ; Yann Boniface [France] ; René Schott [France]Décomposition de Processus Décisionnels de Markov sur machine parallèle MIMD à mémoire partagée
000983 (2000) Eitan Altman ; Sandjai Bhulai [Pays-Bas] ; Bruno Gaujal ; Arie Hordijk [Pays-Bas]Open-loop routeing to M parallel servers with no buffers

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/PascalFrancis/Checkpoint
HfdIndexSelect -h $EXPLOR_AREA/Data/PascalFrancis/Checkpoint/KwdEn.i -k "Markov decision" 
HfdIndexSelect -h $EXPLOR_AREA/Data/PascalFrancis/Checkpoint/KwdEn.i  \
                -Sk "Markov decision" \
         | HfdSelect -Kh $EXPLOR_AREA/Data/PascalFrancis/Checkpoint/biblio.hfd 

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    PascalFrancis
   |étape=   Checkpoint
   |type=    indexItem
   |index=    KwdEn.i
   |clé=    Markov decision
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022