Serveur d'exploration sur la recherche en informatique en Lorraine - Exploration (Accueil)

Index « PascalFr.i » - entrée « Apprentissage renforcé »
Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.
Apprentissage probabilités < Apprentissage renforcé < Apprentissage statistique  Facettes :

List of bibliographic references indexed by Apprentissage renforcé

Number of relevant bibliographic references: 14.
Ident.Authors (with country if any)Title
001686 (2013) Raphael Fonteneau [Belgique] ; Susan A. Murphy [États-Unis] ; Louis Wehenkel [Belgique] ; Damien Ernst [Belgique]Strategies d'échantillonnage pour l'apprentissage par renforcement batch
001692 (2013) Edouard Klein [France] ; Bilal Piot [France] ; Matthieu Geist [France] ; Olivier Pietquin [France]Classification structurée pour l'apprentissage par renforcement inverse
001694 (2013) Olivier Sigaud [France] ; Freek Stulp [France]Adaptation de la matrice de covariance pour l'apprentissage par renforcement direct
003859 (2009) Christophe Thiery ; Bruno ScherrerConstruction d’un joueur artificiel pour Tetris
003B64 (2009) Olivier Buffet [France] ; Douglas Aberdeen [Suisse]The factored policy-gradient planner
004239 (2008) Fabrice Lauri [France] ; François Charpillet [France]Résolution du problème de la patrouille multi-agent en utilisant des colonies compétitives de fourmis
005325 (2006) Olivier Buffet [Australie] ; Alain Dutech [France] ; François Charpillet [France]Etude de différentes combinaisons de comportements adaptatives
005571 (2006) Laurent Peret [France] ; Frédérick Garcia [France]Recherche en ligne pour les processus décisionnels de Markov
005578 (2006) Pascal Garcia [France]Exploration guidée en apprentissage par renforcement : Connaissances a priori et relaxation de contraintes
005581 (2006) Guillaume J. Laurent [France] ; Emmanuel Piat [France]Apprentissage par renforcement dans le cadre des processus décisionnels de Markov factorisés observables dans le désordre : Étude expérimentale du Q-Learning parallèle appliqué aux problèmes du labyrinthe et du New York Driving
006151 (2005) Olivier Buffet [Australie, France] ; Alain Dutech [France] ; François Charpillet [France]Développement autonome des comportements de base d’un agent
007957 (2003) Alain Dutech [France] ; Manuel Samuelides [France]Apprentissage par renforcement pour les processus décisionnels de Markov partiellement observés
008918 (2002) Bruno Scherrer [France] ; Francois Charpillet [France]Cooperative co-learning: A model-based approach for solving multi agent Reinforcement problems
008932 (2002) Bruno Scherrer [France]A connectionist architecture that adapts its representation to complex tasks

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Exploration
HfdIndexSelect -h $EXPLOR_AREA/Data/Main/Exploration/PascalFr.i -k "Apprentissage renforcé" 
HfdIndexSelect -h $EXPLOR_AREA/Data/Main/Exploration/PascalFr.i  \
                -Sk "Apprentissage renforcé" \
         | HfdSelect -Kh $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd 

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Main
   |étape=   Exploration
   |type=    indexItem
   |index=    PascalFr.i
   |clé=    Apprentissage renforcé
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022