Serveur d'exploration sur la recherche en informatique en Lorraine - Exploration (Accueil)

Index « KwdFr.i » - entrée « reinforcement learning »
Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.
reinforcement < reinforcement learning < reinforcement learning.  Facettes :

List of bibliographic references indexed by reinforcement learning

Number of relevant bibliographic references: 26.
[0-20] [0 - 20][0 - 26][20-25][20-40]
Ident.Authors (with country if any)Title
006E28 (2004) Daniel Szer [France] ; François Charpillet [France]Communication et apprentissage par renforcement pour une équipe d'agents
006F86 (2004) Daniel Szer [France] ; François Charpillet [France]Improving Coordination with Communication in Multiagent Reinforcement Learning
006F94 (2004) Rémi Coulom [France]High-Accuracy Value-Function Approximation with Neural Networks Applied to the Acrobot
007045 (2004) Daniel Szer [France] ; François Charpillet [France]Coordination through Mutual Notification in Cooperative Multiagent Reinforcement Learning
007046 (2004) Daniel Szer [France] ; François Charpillet [France]Coordination through Mutual Notification in Cooperative Multiagent Reinforcement Learning
007185 (2003-09) Rémi Coulom [France]A Model-Based Actor-Critic Algorithm in Continuous Time and Space
007957 (2003) Alain Dutech [France] ; Manuel Samuelides [France]Apprentissage par renforcement pour les processus décisionnels de Markov partiellement observés
007C37 (2003) Iadine Chadès [France] ; François Charpillet [France]Modèle de conception de SMA coopératifs par planification réactive
007C79 (2003) Olivier Buffet [France] ; Alain Dutech [France] ; François Charpillet [France]Etude de différentes combinaisons de comportements adaptatives au sein d'un agent.
007C82 (2003) Daniel Szer [France]Définition autonome de sous-problèmes dans l'apprentissage par renforcement
007D08 (2003) Alain Dutech [France] ; Olivier Buffet [France] ; François Charpillet [France]Apprentissage par renforcement pour la conception de Systèmes Multi-Agents Réactifs
007D70 (2003) Alain Dutech [France] ; Olivier Buffet [France]Proceedings of the Sixth European Workshop on Reinforcement Learning
007D85 (2003) Bruno Scherrer [France]Modular self-organization for a long-living autonomous agent
007D96 (2003) Romaric Charton [France] ; Anne Boyer [France] ; François Charpillet [France]Learning of Mediation Strategies for Heterogeneous Agents Cooperation
007E38 (2003) Raghav Aras [France]Decentralized control in the pursuit domain
007E60 (2003) Olivier Buffet [France] ; Alain Dutech [France] ; François Charpillet [France]Automatic Generation of an Agent's Basic Behaviors
007E93 (2003) Olivier Buffet [France] ; Alain Dutech [France]A Self-Made Agent Based on Action-Selection
008A19 (2002) Olivier Buffet [France]Apprentissage par Renforcement pour la Conception de Systèmes Multi-Agents
008A20 (2002) Laurent Jeanpierre [France] ; François Charpillet [France]Apprentissage de modèles en télémédecine
008B15 (2002) Olivier Buffet [France] ; Alain Dutech [France] ; François Charpillet [France]Learning to weigh basic behaviors in Scalable Agents
008B58 (2002) Bruno Scherrer [France] ; François Charpillet [France]Cooperative Co-learning: A Model-based Approach for Solving Multi Agent Reinforcement Problems

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Exploration
HfdIndexSelect -h $EXPLOR_AREA/Data/Main/Exploration/KwdFr.i -k "reinforcement learning" 
HfdIndexSelect -h $EXPLOR_AREA/Data/Main/Exploration/KwdFr.i  \
                -Sk "reinforcement learning" \
         | HfdSelect -Kh $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd 

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Main
   |étape=   Exploration
   |type=    indexItem
   |index=    KwdFr.i
   |clé=    reinforcement learning
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022