Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Performances des caches de textures multiprocesseurs

Identifieur interne : 00AA83 ( Main/Curation ); précédent : 00AA82; suivant : 00AA84

Performances des caches de textures multiprocesseurs

Auteurs : A. Vartanian [France]

Source :

RBID : Pascal:99-0431348

Descripteurs français

English descriptors

Abstract

L'évolution de la technologie des microprocesseurs permet aujourd'hui d'intégrer un moteur de rendu 3D temps réel complet sur un seul composant. Se pose alors le problème classique du décalage entre fréquence interne et fréquence externe. Or, le rendu texturé exige un nombre très important d'accès à la mémoire. Si on utilise un cache de textures, il est possible de réduire la bande passante externe pour pouvoir réaliser un circuit dessinant 200 millions de pixels par seconde avec un cache de 16 KO et un bus mémoire de PC. Ceci est rendu possible en utilisant le placement des textures par blocs et en acceptant plusieurs requêtes en cours sur le cache. Quand de tels composants seront disponibles en grande série, il pourrait être intéressant de les utiliser pour construire une machine parallèle réalisant de la 3D haute performance. Ceci n'est possible que si le cache ne limite pas les performances. Après avoir évalué par simulation l'impact du cache sur trois architectures parallèles différentes, on voit que les performances sont toujours mauvaises si on utilise le parallélisme image synchrone et sont presque linéaires avec le parallélisme triangle. Enfin, si on utilise le parallélisme image asynchrone, les performances peuvent être bonnes à condition de choisir minutieusement la taille du bloc image.

Links toward previous steps (curation, corpus...)


Links to Exploration step

Pascal:99-0431348

Le document en format XML

<record>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr" level="a">Performances des caches de textures multiprocesseurs</title>
<author>
<name sortKey="Vartanian, A" sort="Vartanian, A" uniqKey="Vartanian A" first="A." last="Vartanian">A. Vartanian</name>
<affiliation wicri:level="4">
<inist:fA14 i1="01">
<s1>LRI URA 410 du CNRS, Université Paris-Sud</s1>
<s2>91405 Orsay</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>France</country>
<placeName>
<region type="region" nuts="2">Île-de-France</region>
<settlement type="city">Orsay</settlement>
</placeName>
<orgName type="university">Université Paris-Sud</orgName>
</affiliation>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">INIST</idno>
<idno type="inist">99-0431348</idno>
<date when="1999">1999</date>
<idno type="stanalyst">PASCAL 99-0431348 INIST</idno>
<idno type="RBID">Pascal:99-0431348</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000B06</idno>
<idno type="wicri:Area/PascalFrancis/Curation">000D64</idno>
<idno type="wicri:Area/PascalFrancis/Checkpoint">000A47</idno>
<idno type="wicri:explorRef" wicri:stream="PascalFrancis" wicri:step="Checkpoint">000A47</idno>
<idno type="wicri:doubleKey">0752-4072:1999:Vartanian A:performances:des:caches</idno>
<idno type="wicri:Area/Main/Merge">00B135</idno>
<idno type="wicri:Area/Main/Curation">00AA83</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="fr" level="a">Performances des caches de textures multiprocesseurs</title>
<author>
<name sortKey="Vartanian, A" sort="Vartanian, A" uniqKey="Vartanian A" first="A." last="Vartanian">A. Vartanian</name>
<affiliation wicri:level="4">
<inist:fA14 i1="01">
<s1>LRI URA 410 du CNRS, Université Paris-Sud</s1>
<s2>91405 Orsay</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>France</country>
<placeName>
<region type="region" nuts="2">Île-de-France</region>
<settlement type="city">Orsay</settlement>
</placeName>
<orgName type="university">Université Paris-Sud</orgName>
</affiliation>
</author>
</analytic>
<series>
<title level="j" type="main">TSI. Technique et science informatiques</title>
<title level="j" type="abbreviated">TSI, Tech. sci. inform.</title>
<idno type="ISSN">0752-4072</idno>
<imprint>
<date when="1999">1999</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<title level="j" type="main">TSI. Technique et science informatiques</title>
<title level="j" type="abbreviated">TSI, Tech. sci. inform.</title>
<idno type="ISSN">0752-4072</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="KwdEn" xml:lang="en">
<term>Cache memory</term>
<term>Image</term>
<term>Image rendering</term>
<term>Image synthesis</term>
<term>Multiprocessor</term>
<term>Parallelism</term>
<term>Performance</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr">
<term>Antémémoire</term>
<term>Multiprocesseur</term>
<term>Synthèse image</term>
<term>Performance</term>
<term>Parallélisme</term>
<term>Image</term>
<term>Rendu image</term>
<term>Rendu texturé</term>
<term>Parallélisme image asynchrone</term>
<term>Parallélisme image synchrone</term>
<term>Parallélisme triangle</term>
<term>Processeur 3 dimensions</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">L'évolution de la technologie des microprocesseurs permet aujourd'hui d'intégrer un moteur de rendu 3D temps réel complet sur un seul composant. Se pose alors le problème classique du décalage entre fréquence interne et fréquence externe. Or, le rendu texturé exige un nombre très important d'accès à la mémoire. Si on utilise un cache de textures, il est possible de réduire la bande passante externe pour pouvoir réaliser un circuit dessinant 200 millions de pixels par seconde avec un cache de 16 KO et un bus mémoire de PC. Ceci est rendu possible en utilisant le placement des textures par blocs et en acceptant plusieurs requêtes en cours sur le cache. Quand de tels composants seront disponibles en grande série, il pourrait être intéressant de les utiliser pour construire une machine parallèle réalisant de la 3D haute performance. Ceci n'est possible que si le cache ne limite pas les performances. Après avoir évalué par simulation l'impact du cache sur trois architectures parallèles différentes, on voit que les performances sont toujours mauvaises si on utilise le parallélisme image synchrone et sont presque linéaires avec le parallélisme triangle. Enfin, si on utilise le parallélisme image asynchrone, les performances peuvent être bonnes à condition de choisir minutieusement la taille du bloc image.</div>
</front>
</TEI>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Curation
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 00AA83 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Main/Curation/biblio.hfd -nk 00AA83 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Main
   |étape=   Curation
   |type=    RBID
   |clé=     Pascal:99-0431348
   |texte=   Performances des caches de textures multiprocesseurs
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022