Serveur d'exploration sur la recherche en informatique en Lorraine - Checkpoint (PascalFrancis)

Index « Keywords » - entrée « Reinforcement learning »
Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.
Reinforcement < Reinforcement learning < Relation  Facettes :

List of bibliographic references

Number of relevant bibliographic references: 14.
Ident.Authors (with country if any)Title
000029 (2013) Raphael Fonteneau [Belgique] ; Susan A. Murphy [États-Unis] ; Louis Wehenkel [Belgique] ; Damien Ernst [Belgique]Strategies d'échantillonnage pour l'apprentissage par renforcement batch
000037 (2013) Edouard Klein [France] ; Bilal Piot [France] ; Matthieu Geist [France] ; Olivier Pietquin [France]Classification structurée pour l'apprentissage par renforcement inverse
000040 (2013) Olivier Sigaud [France] ; Freek Stulp [France]Adaptation de la matrice de covariance pour l'apprentissage par renforcement direct
000213 (2009) Christophe Thiery [France] ; Bruno Scherrer [France]Construction d'un joueur artificiel pour Tetris
000225 (2009) Olivier Buffet [France] ; Douglas Aberdeen [Suisse]The factored policy-gradient planner
000258 (2008) Fabrice Lauri [France] ; Francois Charpillet [France]Résolution du problème de la patrouille multi-agent en utilisant des colonies compétitives de fourmis
000313 (2006) Laurent Peret [France] ; Frédérick Garcia [France]Recherche en ligne pour les processus décisionnels de Markov
000322 (2006) Pascal Garcia [France]Exploration guidée en apprentissage par renforcement : Connaissances a priori et relaxation de contraintes
000323 (2006) Olivier Buffet [France, Australie] ; Alain Dutech [France] ; Francois Charpillet [France]Etude de différentes combinaisons de comportements adaptatives
000326 (2006) Guillaume J. Laurent [France] ; Emmanuel Piat [France]Apprentissage par renforcement dans le cadre des processus décisionnels de Markov factorisés observables dans le désordre : Étude expérimentale du Q-Learning parallèle appliqué aux problèmes du labyrinthe et du New York Driving
000438 (2005) Olivier Buffet [Australie, France] ; Alain Dutech [France] ; Francois Charpillet [France]Développement autonome des comportements de base d'un agent
000658 (2003) Alain Dutech [France] ; Manuel Samuelides [France]Apprentissage par renforcement pour les processus décisionnels de Markov partiellement observés. Apprendre une extension sélective du passé
000816 (2002) Bruno Scherrer [France] ; Francois Charpillet [France]Cooperative co-learning: A model-based approach for solving multi agent Reinforcement problems
000840 (2002) Bruno Scherrer [France]A connectionist architecture that adapts its representation to complex tasks

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/PascalFrancis/Checkpoint
HfdIndexSelect -h $EXPLOR_AREA/Data/PascalFrancis/Checkpoint/KwdEn.i -k "Reinforcement learning" 
HfdIndexSelect -h $EXPLOR_AREA/Data/PascalFrancis/Checkpoint/KwdEn.i  \
                -Sk "Reinforcement learning" \
         | HfdSelect -Kh $EXPLOR_AREA/Data/PascalFrancis/Checkpoint/biblio.hfd 

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    PascalFrancis
   |étape=   Checkpoint
   |type=    indexItem
   |index=    KwdEn.i
   |clé=    Reinforcement learning
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022