Serveur d'exploration sur la recherche en informatique en Lorraine - Checkpoint (PascalFrancis)

Index « FC03.fr.i » - entrée « Apprentissage renforcé »
Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.
Apprentissage probabilités < Apprentissage renforcé < Apprentissage statistique  Facettes :

List of bibliographic references

Number of relevant bibliographic references: 14.
Ident.Authors (with country if any)Title
000029 (2013) Raphael Fonteneau [Belgique] ; Susan A. Murphy [États-Unis] ; Louis Wehenkel [Belgique] ; Damien Ernst [Belgique]Strategies d'échantillonnage pour l'apprentissage par renforcement batch
000037 (2013) Edouard Klein [France] ; Bilal Piot [France] ; Matthieu Geist [France] ; Olivier Pietquin [France]Classification structurée pour l'apprentissage par renforcement inverse
000040 (2013) Olivier Sigaud [France] ; Freek Stulp [France]Adaptation de la matrice de covariance pour l'apprentissage par renforcement direct
000213 (2009) Christophe Thiery [France] ; Bruno Scherrer [France]Construction d'un joueur artificiel pour Tetris
000225 (2009) Olivier Buffet [France] ; Douglas Aberdeen [Suisse]The factored policy-gradient planner
000258 (2008) Fabrice Lauri [France] ; Francois Charpillet [France]Résolution du problème de la patrouille multi-agent en utilisant des colonies compétitives de fourmis
000313 (2006) Laurent Peret [France] ; Frédérick Garcia [France]Recherche en ligne pour les processus décisionnels de Markov
000322 (2006) Pascal Garcia [France]Exploration guidée en apprentissage par renforcement : Connaissances a priori et relaxation de contraintes
000323 (2006) Olivier Buffet [France, Australie] ; Alain Dutech [France] ; Francois Charpillet [France]Etude de différentes combinaisons de comportements adaptatives
000326 (2006) Guillaume J. Laurent [France] ; Emmanuel Piat [France]Apprentissage par renforcement dans le cadre des processus décisionnels de Markov factorisés observables dans le désordre : Étude expérimentale du Q-Learning parallèle appliqué aux problèmes du labyrinthe et du New York Driving
000438 (2005) Olivier Buffet [Australie, France] ; Alain Dutech [France] ; Francois Charpillet [France]Développement autonome des comportements de base d'un agent
000658 (2003) Alain Dutech [France] ; Manuel Samuelides [France]Apprentissage par renforcement pour les processus décisionnels de Markov partiellement observés. Apprendre une extension sélective du passé
000816 (2002) Bruno Scherrer [France] ; Francois Charpillet [France]Cooperative co-learning: A model-based approach for solving multi agent Reinforcement problems
000840 (2002) Bruno Scherrer [France]A connectionist architecture that adapts its representation to complex tasks

List of associated Author.i

Nombre de
documents
Descripteur
4Francois Charpillet
3Alain Dutech
3Bruno Scherrer
3Olivier Buffet
1Bilal Piot
1Christophe Thiery
1Damien Ernst
1Douglas Aberdeen
1Edouard Klein
1Emmanuel Piat
1Fabrice Lauri
1Freek Stulp
1Frédérick Garcia
1Guillaume J. Laurent
1Laurent Peret
1Louis Wehenkel
1Manuel Samuelides
1Matthieu Geist
1Olivier Pietquin
1Olivier Sigaud
1Pascal Garcia
1Raphael Fonteneau
1Susan A. Murphy

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/PascalFrancis/Checkpoint
HfdIndexSelect -h $EXPLOR_AREA/Data/PascalFrancis/Checkpoint/FC03.fr.i -k "Apprentissage renforcé" 
HfdIndexSelect -h $EXPLOR_AREA/Data/PascalFrancis/Checkpoint/FC03.fr.i  \
                -Sk "Apprentissage renforcé" \
         | HfdSelect -Kh $EXPLOR_AREA/Data/PascalFrancis/Checkpoint/biblio.hfd 

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    PascalFrancis
   |étape=   Checkpoint
   |type=    indexItem
   |index=    FC03.fr.i
   |clé=    Apprentissage renforcé
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022