Décision Markov And NotDaniel Szer

List of bibliographic references

Number of relevant bibliographic references: 16.

Ident.	Authors (with country if any)	Title
000158	Gabriel Corona [France] ; François Charpillet [France]	Distribution sur les croyances pour la planification de Dec-POMDP: PSMBDP
000307		Décision et planification dans l'incertain
000313	Laurent Peret [France] ; Frédérick Garcia [France]	Recherche en ligne pour les processus décisionnels de Markov
000316	Florent Teichteil-Konigsbuch [France] ; Patrick Fabiani [France]	Processus décisionnels de Markov décomposés et factorisés pour l'optimisation de stratégies d'exploration
000317	Paul Weng [France]	Processus de décision markoviens et préférences non classiques
000318	Sébastien Paquet [Canada] ; Ludovic Tobin [Canada] ; Brahim Chaib-Draa [Canada]	Prise de décision en temps-réel pour des POMDP de grande taille
000322	Pascal Garcia [France]	Exploration guidée en apprentissage par renforcement : Connaissances a priori et relaxation de contraintes
000323	Olivier Buffet [France, Australie] ; Alain Dutech [France] ; Francois Charpillet [France]	Etude de différentes combinaisons de comportements adaptatives
000326	Guillaume J. Laurent [France] ; Emmanuel Piat [France]	Apprentissage par renforcement dans le cadre des processus décisionnels de Markov factorisés observables dans le désordre : Étude expérimentale du Q-Learning parallèle appliqué aux problèmes du labyrinthe et du New York Driving
000327	Olivier Gies [Canada] ; Brahim Chaib-Draa [Canada]	Apprentissage de la coordination multiagent : Une méthode basée sur le Q-learning par jeu adaptatif
000329	Iadine Chades [France]	Algorithmes de co-évolution pour la résolution approchée de PDM multi-agent
000438	Olivier Buffet [Australie, France] ; Alain Dutech [France] ; Francois Charpillet [France]	Développement autonome des comportements de base d'un agent
000816	Bruno Scherrer [France] ; Francois Charpillet [France]	Cooperative co-learning: A model-based approach for solving multi agent Reinforcement problems
000840	Bruno Scherrer [France]	A connectionist architecture that adapts its representation to complex tasks
000867	Pierre Laroche [France] ; Yann Boniface [France] ; René Schott [France]	Décomposition de Processus Décisionnels de Markov sur machine parallèle MIMD à mémoire partagée
000983	Eitan Altman ; Sandjai Bhulai [Pays-Bas] ; Bruno Gaujal ; Arie Hordijk [Pays-Bas]	Open-loop routeing to M parallel servers with no buffers

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022