Décision Markov And NotDaniel Szer
List of bibliographic references
Number of relevant bibliographic references: 16.Ident. | Authors (with country if any) | Title |
---|---|---|
000158 | Gabriel Corona [France] ; François Charpillet [France] | Distribution sur les croyances pour la planification de Dec-POMDP: PSMBDP |
000307 | Décision et planification dans l'incertain | |
000313 | Laurent Peret [France] ; Frédérick Garcia [France] | Recherche en ligne pour les processus décisionnels de Markov |
000316 | Florent Teichteil-Konigsbuch [France] ; Patrick Fabiani [France] | Processus décisionnels de Markov décomposés et factorisés pour l'optimisation de stratégies d'exploration |
000317 | Paul Weng [France] | Processus de décision markoviens et préférences non classiques |
000318 | Sébastien Paquet [Canada] ; Ludovic Tobin [Canada] ; Brahim Chaib-Draa [Canada] | Prise de décision en temps-réel pour des POMDP de grande taille |
000322 | Pascal Garcia [France] | Exploration guidée en apprentissage par renforcement : Connaissances a priori et relaxation de contraintes |
000323 | Olivier Buffet [France, Australie] ; Alain Dutech [France] ; Francois Charpillet [France] | Etude de différentes combinaisons de comportements adaptatives |
000326 | Guillaume J. Laurent [France] ; Emmanuel Piat [France] | Apprentissage par renforcement dans le cadre des processus décisionnels de Markov factorisés observables dans le désordre : Étude expérimentale du Q-Learning parallèle appliqué aux problèmes du labyrinthe et du New York Driving |
000327 | Olivier Gies [Canada] ; Brahim Chaib-Draa [Canada] | Apprentissage de la coordination multiagent : Une méthode basée sur le Q-learning par jeu adaptatif |
000329 | Iadine Chades [France] | Algorithmes de co-évolution pour la résolution approchée de PDM multi-agent |
000438 | Olivier Buffet [Australie, France] ; Alain Dutech [France] ; Francois Charpillet [France] | Développement autonome des comportements de base d'un agent |
000816 | Bruno Scherrer [France] ; Francois Charpillet [France] | Cooperative co-learning: A model-based approach for solving multi agent Reinforcement problems |
000840 | Bruno Scherrer [France] | A connectionist architecture that adapts its representation to complex tasks |
000867 | Pierre Laroche [France] ; Yann Boniface [France] ; René Schott [France] | Décomposition de Processus Décisionnels de Markov sur machine parallèle MIMD à mémoire partagée |
000983 | Eitan Altman ; Sandjai Bhulai [Pays-Bas] ; Bruno Gaujal ; Arie Hordijk [Pays-Bas] | Open-loop routeing to M parallel servers with no buffers |
![]() | This area was generated with Dilib version V0.6.33. | ![]() |