Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Contrôle optimal stochastique et le jeu de Tetris

Identifieur interne : 005927 ( Hal/Corpus ); précédent : 005926; suivant : 005928

Contrôle optimal stochastique et le jeu de Tetris

Auteurs : Christophe Thiery

Source :

RBID : Hal:inria-00173248

Abstract

Le jeu de Tetris est un problème complexe auquel s'intéressent de nombreuses techniques d'apprentissage automatique. Le but de ce mémoire de Master est d'étudier les algorithmes appliqués au jeu de Tetris. Nous avons étudié en particulier deux approches, l'une utilisant le contrôle optimal stochastique (l'algorithme Lambda-Policy Iteration) et l'autre utilisant la méthode d'entropie croisée. Avec Lambda-Policy Iteration, nos résultats sont meilleurs qualitativement que dans l'expérience d'origine et nous proposons une explication à cette différence. Avec la méthode d'entropie croisée, nos expériences confirment que les résultats à Tetris sont nettement meilleurs qu'avec les techniques faisant appel au contrôle optimal stochastique. Enfin, à l'aide de cette méthode, nous avons obtenu une heuristique dont les performances dépassent d'un ordre de grandeur celles des meilleurs algorithmes à notre connaissance.

Url:

Links to Exploration step

Hal:inria-00173248

Le document en format XML

<record>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr">Contrôle optimal stochastique et le jeu de Tetris</title>
<author>
<name sortKey="Thiery, Christophe" sort="Thiery, Christophe" uniqKey="Thiery C" first="Christophe" last="Thiery">Christophe Thiery</name>
<affiliation>
<hal:affiliation type="researchteam" xml:id="struct-2355" status="OLD">
<idno type="RNSR">200218290B</idno>
<orgName>Autonomous intelligent machine</orgName>
<orgName type="acronym">MAIA</orgName>
<desc>
<address>
<country key="FR"></country>
</address>
<ref type="url">http://www.inria.fr/equipes/maia</ref>
</desc>
<listRelation>
<relation active="#struct-160" type="direct"></relation>
<relation name="UMR7503" active="#struct-441569" type="indirect"></relation>
<relation active="#struct-300009" type="indirect"></relation>
<relation active="#struct-300291" type="indirect"></relation>
<relation active="#struct-300292" type="indirect"></relation>
<relation active="#struct-300293" type="indirect"></relation>
<relation active="#struct-2496" type="direct"></relation>
</listRelation>
<tutelles>
<tutelle active="#struct-160" type="direct">
<org type="laboratory" xml:id="struct-160" status="OLD">
<orgName>Laboratoire Lorrain de Recherche en Informatique et ses Applications</orgName>
<orgName type="acronym">LORIA</orgName>
<desc>
<address>
<addrLine>Campus Scientifique BP 239 54506 Vandoeuvre-lès-Nancy Cedex</addrLine>
<country key="FR"></country>
</address>
<ref type="url">http://www.loria.fr</ref>
</desc>
<listRelation>
<relation name="UMR7503" active="#struct-441569" type="direct"></relation>
<relation active="#struct-300009" type="direct"></relation>
<relation active="#struct-300291" type="direct"></relation>
<relation active="#struct-300292" type="direct"></relation>
<relation active="#struct-300293" type="direct"></relation>
</listRelation>
</org>
</tutelle>
<tutelle name="UMR7503" active="#struct-441569" type="indirect">
<org type="institution" xml:id="struct-441569" status="VALID">
<idno type="ISNI">0000000122597504</idno>
<idno type="IdRef">02636817X</idno>
<orgName>Centre National de la Recherche Scientifique</orgName>
<orgName type="acronym">CNRS</orgName>
<date type="start">1939-10-19</date>
<desc>
<address>
<country key="FR"></country>
</address>
<ref type="url">http://www.cnrs.fr/</ref>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300009" type="indirect">
<org type="institution" xml:id="struct-300009" status="VALID">
<orgName>Institut National de Recherche en Informatique et en Automatique</orgName>
<orgName type="acronym">Inria</orgName>
<desc>
<address>
<addrLine>Domaine de VoluceauRocquencourt - BP 10578153 Le Chesnay Cedex</addrLine>
<country key="FR"></country>
</address>
<ref type="url">http://www.inria.fr/en/</ref>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300291" type="indirect">
<org type="institution" xml:id="struct-300291" status="OLD">
<orgName>Université Henri Poincaré - Nancy 1</orgName>
<orgName type="acronym">UHP</orgName>
<date type="end">2011-12-31</date>
<desc>
<address>
<addrLine>24-30 rue Lionnois, BP 60120, 54 003 NANCY cedex, France</addrLine>
<country key="FR"></country>
</address>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300292" type="indirect">
<org type="institution" xml:id="struct-300292" status="OLD">
<orgName>Université Nancy 2</orgName>
<date type="end">2011-12-31</date>
<desc>
<address>
<addrLine>91 avenue de la Libération, BP 454, 54001 Nancy cedex</addrLine>
<country key="FR"></country>
</address>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300293" type="indirect">
<org type="institution" xml:id="struct-300293" status="OLD">
<orgName>Institut National Polytechnique de Lorraine</orgName>
<orgName type="acronym">INPL</orgName>
<date type="end">2011-12-31</date>
<desc>
<address>
<country key="FR"></country>
</address>
</desc>
</org>
</tutelle>
<tutelle active="#struct-2496" type="direct">
<org type="laboratory" xml:id="struct-2496" status="OLD">
<orgName>INRIA Lorraine</orgName>
<desc>
<address>
<addrLine>615 rue du Jardin Botanique 54600 Villers-lès-Nancy</addrLine>
<country key="FR"></country>
</address>
<ref type="url">http://www.inria.fr/centre-de-recherche-inria/nancy-grand-est</ref>
</desc>
<listRelation>
<relation active="#struct-300009" type="direct"></relation>
</listRelation>
</org>
</tutelle>
</tutelles>
</hal:affiliation>
</affiliation>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">HAL</idno>
<idno type="RBID">Hal:inria-00173248</idno>
<idno type="halId">inria-00173248</idno>
<idno type="halUri">https://hal.inria.fr/inria-00173248</idno>
<idno type="url">https://hal.inria.fr/inria-00173248</idno>
<date when="2007">2007</date>
<idno type="wicri:Area/Hal/Corpus">005927</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="fr">Contrôle optimal stochastique et le jeu de Tetris</title>
<author>
<name sortKey="Thiery, Christophe" sort="Thiery, Christophe" uniqKey="Thiery C" first="Christophe" last="Thiery">Christophe Thiery</name>
<affiliation>
<hal:affiliation type="researchteam" xml:id="struct-2355" status="OLD">
<idno type="RNSR">200218290B</idno>
<orgName>Autonomous intelligent machine</orgName>
<orgName type="acronym">MAIA</orgName>
<desc>
<address>
<country key="FR"></country>
</address>
<ref type="url">http://www.inria.fr/equipes/maia</ref>
</desc>
<listRelation>
<relation active="#struct-160" type="direct"></relation>
<relation name="UMR7503" active="#struct-441569" type="indirect"></relation>
<relation active="#struct-300009" type="indirect"></relation>
<relation active="#struct-300291" type="indirect"></relation>
<relation active="#struct-300292" type="indirect"></relation>
<relation active="#struct-300293" type="indirect"></relation>
<relation active="#struct-2496" type="direct"></relation>
</listRelation>
<tutelles>
<tutelle active="#struct-160" type="direct">
<org type="laboratory" xml:id="struct-160" status="OLD">
<orgName>Laboratoire Lorrain de Recherche en Informatique et ses Applications</orgName>
<orgName type="acronym">LORIA</orgName>
<desc>
<address>
<addrLine>Campus Scientifique BP 239 54506 Vandoeuvre-lès-Nancy Cedex</addrLine>
<country key="FR"></country>
</address>
<ref type="url">http://www.loria.fr</ref>
</desc>
<listRelation>
<relation name="UMR7503" active="#struct-441569" type="direct"></relation>
<relation active="#struct-300009" type="direct"></relation>
<relation active="#struct-300291" type="direct"></relation>
<relation active="#struct-300292" type="direct"></relation>
<relation active="#struct-300293" type="direct"></relation>
</listRelation>
</org>
</tutelle>
<tutelle name="UMR7503" active="#struct-441569" type="indirect">
<org type="institution" xml:id="struct-441569" status="VALID">
<idno type="ISNI">0000000122597504</idno>
<idno type="IdRef">02636817X</idno>
<orgName>Centre National de la Recherche Scientifique</orgName>
<orgName type="acronym">CNRS</orgName>
<date type="start">1939-10-19</date>
<desc>
<address>
<country key="FR"></country>
</address>
<ref type="url">http://www.cnrs.fr/</ref>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300009" type="indirect">
<org type="institution" xml:id="struct-300009" status="VALID">
<orgName>Institut National de Recherche en Informatique et en Automatique</orgName>
<orgName type="acronym">Inria</orgName>
<desc>
<address>
<addrLine>Domaine de VoluceauRocquencourt - BP 10578153 Le Chesnay Cedex</addrLine>
<country key="FR"></country>
</address>
<ref type="url">http://www.inria.fr/en/</ref>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300291" type="indirect">
<org type="institution" xml:id="struct-300291" status="OLD">
<orgName>Université Henri Poincaré - Nancy 1</orgName>
<orgName type="acronym">UHP</orgName>
<date type="end">2011-12-31</date>
<desc>
<address>
<addrLine>24-30 rue Lionnois, BP 60120, 54 003 NANCY cedex, France</addrLine>
<country key="FR"></country>
</address>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300292" type="indirect">
<org type="institution" xml:id="struct-300292" status="OLD">
<orgName>Université Nancy 2</orgName>
<date type="end">2011-12-31</date>
<desc>
<address>
<addrLine>91 avenue de la Libération, BP 454, 54001 Nancy cedex</addrLine>
<country key="FR"></country>
</address>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300293" type="indirect">
<org type="institution" xml:id="struct-300293" status="OLD">
<orgName>Institut National Polytechnique de Lorraine</orgName>
<orgName type="acronym">INPL</orgName>
<date type="end">2011-12-31</date>
<desc>
<address>
<country key="FR"></country>
</address>
</desc>
</org>
</tutelle>
<tutelle active="#struct-2496" type="direct">
<org type="laboratory" xml:id="struct-2496" status="OLD">
<orgName>INRIA Lorraine</orgName>
<desc>
<address>
<addrLine>615 rue du Jardin Botanique 54600 Villers-lès-Nancy</addrLine>
<country key="FR"></country>
</address>
<ref type="url">http://www.inria.fr/centre-de-recherche-inria/nancy-grand-est</ref>
</desc>
<listRelation>
<relation active="#struct-300009" type="direct"></relation>
</listRelation>
</org>
</tutelle>
</tutelles>
</hal:affiliation>
</affiliation>
</author>
</analytic>
</biblStruct>
</sourceDesc>
</fileDesc>
<profileDesc>
<textClass></textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Le jeu de Tetris est un problème complexe auquel s'intéressent de nombreuses techniques d'apprentissage automatique. Le but de ce mémoire de Master est d'étudier les algorithmes appliqués au jeu de Tetris. Nous avons étudié en particulier deux approches, l'une utilisant le contrôle optimal stochastique (l'algorithme Lambda-Policy Iteration) et l'autre utilisant la méthode d'entropie croisée. Avec Lambda-Policy Iteration, nos résultats sont meilleurs qualitativement que dans l'expérience d'origine et nous proposons une explication à cette différence. Avec la méthode d'entropie croisée, nos expériences confirment que les résultats à Tetris sont nettement meilleurs qu'avec les techniques faisant appel au contrôle optimal stochastique. Enfin, à l'aide de cette méthode, nous avons obtenu une heuristique dont les performances dépassent d'un ordre de grandeur celles des meilleurs algorithmes à notre connaissance.</div>
</front>
</TEI>
<hal api="V3">
<titleStmt>
<title xml:lang="fr">Contrôle optimal stochastique et le jeu de Tetris</title>
<author role="aut">
<persName>
<forename type="first">Christophe</forename>
<surname>Thiery</surname>
</persName>
<email>christophe.thiery@loria.fr</email>
<idno type="halauthor">209667</idno>
<affiliation ref="#struct-2355"></affiliation>
</author>
<editor role="depositor">
<persName>
<forename>Christophe</forename>
<surname>Thiery</surname>
</persName>
<email>christophe.thiery@loria.fr</email>
</editor>
</titleStmt>
<editionStmt>
<edition n="v1" type="current">
<date type="whenSubmitted">2007-09-19 13:58:08</date>
<date type="whenModified">2016-05-18 08:54:52</date>
<date type="whenReleased">2007-09-19 14:17:14</date>
<date type="whenProduced">2007</date>
<date type="whenEndEmbargoed">2007-09-19</date>
<ref type="file" target="https://hal.inria.fr/inria-00173248/document">
<date notBefore="2007-09-19"></date>
</ref>
<ref type="file" subtype="author" n="1" target="https://hal.inria.fr/inria-00173248/file/rapport_master_tetris.pdf">
<date notBefore="2007-09-19"></date>
</ref>
</edition>
<respStmt>
<resp>contributor</resp>
<name key="120829">
<persName>
<forename>Christophe</forename>
<surname>Thiery</surname>
</persName>
<email>christophe.thiery@loria.fr</email>
</name>
</respStmt>
</editionStmt>
<publicationStmt>
<distributor>CCSD</distributor>
<idno type="halId">inria-00173248</idno>
<idno type="halUri">https://hal.inria.fr/inria-00173248</idno>
<idno type="halBibtex">thiery:inria-00173248</idno>
<idno type="halRefHtml">[Travaux universitaires] 2007, pp.42</idno>
<idno type="halRef">[Travaux universitaires] 2007, pp.42</idno>
</publicationStmt>
<seriesStmt>
<idno type="stamp" n="CNRS">CNRS - Centre national de la recherche scientifique</idno>
<idno type="stamp" n="INRIA">INRIA - Institut National de Recherche en Informatique et en Automatique</idno>
<idno type="stamp" n="INPL">Institut National Polytechnique de Lorraine</idno>
<idno type="stamp" n="LORIA2">Publications du LORIA</idno>
<idno type="stamp" n="INRIA-NANCY-GRAND-EST">INRIA Nancy - Grand Est</idno>
<idno type="stamp" n="LORIA">LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications</idno>
<idno type="stamp" n="LORIA-CSAI" p="LORIA">Systèmes complexes et intelligence artificielle</idno>
<idno type="stamp" n="INRIA2">INRIA 2</idno>
<idno type="stamp" n="INRIA-LORRAINE">INRIA Nancy - Grand Est</idno>
<idno type="stamp" n="LABO-LORIA-SET" p="LORIA">LABO-LORIA-SET</idno>
<idno type="stamp" n="UNIV-LORRAINE">Université de Lorraine</idno>
</seriesStmt>
<notesStmt>
<note type="audience" n="0">Not set</note>
<note type="report" n="1">University works</note>
</notesStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="fr">Contrôle optimal stochastique et le jeu de Tetris</title>
<author role="aut">
<persName>
<forename type="first">Christophe</forename>
<surname>Thiery</surname>
</persName>
<email>christophe.thiery@loria.fr</email>
<idno type="halAuthorId">209667</idno>
<affiliation ref="#struct-2355"></affiliation>
</author>
</analytic>
<monogr>
<imprint>
<biblScope unit="pp">42</biblScope>
<date type="datePub">2007</date>
</imprint>
</monogr>
</biblStruct>
</sourceDesc>
<profileDesc>
<langUsage>
<language ident="fr">French</language>
</langUsage>
<textClass>
<classCode scheme="halDomain" n="info.info-ai">Computer Science [cs]/Artificial Intelligence [cs.AI]</classCode>
<classCode scheme="halDomain" n="info.info-gt">Computer Science [cs]/Computer Science and Game Theory [cs.GT]</classCode>
<classCode scheme="halDomain" n="info.info-lg">Computer Science [cs]/Machine Learning [cs.LG]</classCode>
<classCode scheme="halTypology" n="REPORT">Reports</classCode>
</textClass>
<abstract xml:lang="fr">Le jeu de Tetris est un problème complexe auquel s'intéressent de nombreuses techniques d'apprentissage automatique. Le but de ce mémoire de Master est d'étudier les algorithmes appliqués au jeu de Tetris. Nous avons étudié en particulier deux approches, l'une utilisant le contrôle optimal stochastique (l'algorithme Lambda-Policy Iteration) et l'autre utilisant la méthode d'entropie croisée. Avec Lambda-Policy Iteration, nos résultats sont meilleurs qualitativement que dans l'expérience d'origine et nous proposons une explication à cette différence. Avec la méthode d'entropie croisée, nos expériences confirment que les résultats à Tetris sont nettement meilleurs qu'avec les techniques faisant appel au contrôle optimal stochastique. Enfin, à l'aide de cette méthode, nous avons obtenu une heuristique dont les performances dépassent d'un ordre de grandeur celles des meilleurs algorithmes à notre connaissance.</abstract>
</profileDesc>
</hal>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Hal/Corpus
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 005927 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Hal/Corpus/biblio.hfd -nk 005927 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Hal
   |étape=   Corpus
   |type=    RBID
   |clé=     Hal:inria-00173248
   |texte=   Contrôle optimal stochastique et le jeu de Tetris
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022