Serveur d'exploration sur la TEI

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

TEI (Text Encoding Initiative)

Identifieur interne : 000035 ( PascalFrancis/Corpus ); précédent : 000034; suivant : 000036

TEI (Text Encoding Initiative)

Auteurs : Francois Role

Source :

RBID : Pascal:05-0464054

Descripteurs français

English descriptors

Abstract

Depuis l'Antiquité, il est courant de marquer et d'annoter des textes en vue d'en faciliter l'étude ou la critique (pensons par exemple aux systèmes d'annotation médiévaux ou à l'appareil de symboles imaginé dès le IIIe siècle avant J.-C. par les philologues alexandrins). Dans l'univers numérique, le marquage électronique (défini ici comme l'insertion dans un fichier électronique de marques liées au texte mais n'en faisant pas directement partie) a longtemps servi presque exclusivement à piloter des dispositifs d'impression ou d'affichage (photocopieuses, imprimantes, écran). C'est ce marquage qu'utilisent implicitement (*) la plupart des chercheurs en sciences humaines au travers des outils PAO (Publication Assistée par Ordinateur) du commerce. Nota (*) : «implicitement» dans le sens où les manipulations effectuées via le clavier ou les dispositifs de pointage génèrent d'une manière ou d'une autre les informations de balisage physique sur lesquelles le logiciel de PAO s'appuie pour effectuer les opérations qu'on lui demande. Malgré ses mérites, ce marquage est, comme nous l'avons dit, orienté vers la production ou l'affichage du texte, et n'est donc pas conçu pour faciliter une exploration intellectuelle des documents. Peu à peu s'est donc imposée l'idée qu'il fallait recourir à un niveau de balisage moins dépendant des contraintes de production, et propice à des traitements de plus haut niveau sur les textes, parce qu'en décrivant la structure logique. SGML (Standard Generalized Markup Language) est la norme actuellement la plus utilisée pour baliser logiquement des textes. Elle permet à tout utilisateur de définir, via l'écriture d'une DTD (Définition du Type de Document) un langage de balisage logique adapté à ses besoins. La Text Encoding Initiative (TEI) est une DTD SGML accompagnée par un volume de «recommandations» ; les TEI «Guidelines» expliquant de quelle façon doit être utilisée la DTD. Cette DTD est adaptée principalement aux besoins de la communauté des chercheurs en sciences humaines (ou plus généralement à tout chercheur voulant explorer de vastes corpus textuels sous forme électronique). Elle permet au linguiste de baliser syntaxiquement des corpus, à l'historien de marquer dans un texte des dates, des noms de lieu ou de personnage, au chercheur en littérature d'étudier la stylistique ou la genèse d'un texte, etc. Après quelques rappels historiques et une présentation informelle de la structure d'un texte TEI, nous décrivons les mécanismes mis en oeuvre dans l'écriture de la DTD TEI (modularité, héritage, extensibilité). Cette partie plus technique que les autres nécessite une bonne connaissance de SGML. A la fin de cet article nous présentons quelques exemples de balisage TEI. Les concepts et techniques liés au SGML sont exposés dans l'article «SGML» du présent traité.

Notice en format standard (ISO 2709)

Pour connaître la documentation sur le format Inist Standard.

pA  
A05       @2 HC1
A06       @2 H7158
A08 01  1  FRE  @1 TEI (Text Encoding Initiative)
A11 01  1    @1 ROLE (Francois)
A14 01      @1 Université Paris 8 @3 FRA @Z 1 aut.
A20       @2 H7158.1-H7158.9
A21       @1 1999
A23 01      @0 FRE
A43 01      @1 INIST @2 27363Y @5 354000138344120010
A44       @0 0000 @1 © 2005 INIST-CNRS. All rights reserved.
A45       @0 9 ref.
A47 01  1    @0 05-0464054
A60       @1 P
A61       @0 A
A64 01  2    @0 Techniques de l'ingénieur. Documents numériques Gestion de contenu
A66 01      @0 FRA
A68 01  1  ENG  @1 TEI (Text Encoding Initiative)
C01 01    FRE  @0 Depuis l'Antiquité, il est courant de marquer et d'annoter des textes en vue d'en faciliter l'étude ou la critique (pensons par exemple aux systèmes d'annotation médiévaux ou à l'appareil de symboles imaginé dès le IIIe siècle avant J.-C. par les philologues alexandrins). Dans l'univers numérique, le marquage électronique (défini ici comme l'insertion dans un fichier électronique de marques liées au texte mais n'en faisant pas directement partie) a longtemps servi presque exclusivement à piloter des dispositifs d'impression ou d'affichage (photocopieuses, imprimantes, écran). C'est ce marquage qu'utilisent implicitement (*) la plupart des chercheurs en sciences humaines au travers des outils PAO (Publication Assistée par Ordinateur) du commerce. Nota (*) : «implicitement» dans le sens où les manipulations effectuées via le clavier ou les dispositifs de pointage génèrent d'une manière ou d'une autre les informations de balisage physique sur lesquelles le logiciel de PAO s'appuie pour effectuer les opérations qu'on lui demande. Malgré ses mérites, ce marquage est, comme nous l'avons dit, orienté vers la production ou l'affichage du texte, et n'est donc pas conçu pour faciliter une exploration intellectuelle des documents. Peu à peu s'est donc imposée l'idée qu'il fallait recourir à un niveau de balisage moins dépendant des contraintes de production, et propice à des traitements de plus haut niveau sur les textes, parce qu'en décrivant la structure logique. SGML (Standard Generalized Markup Language) est la norme actuellement la plus utilisée pour baliser logiquement des textes. Elle permet à tout utilisateur de définir, via l'écriture d'une DTD (Définition du Type de Document) un langage de balisage logique adapté à ses besoins. La Text Encoding Initiative (TEI) est une DTD SGML accompagnée par un volume de «recommandations» ; les TEI «Guidelines» expliquant de quelle façon doit être utilisée la DTD. Cette DTD est adaptée principalement aux besoins de la communauté des chercheurs en sciences humaines (ou plus généralement à tout chercheur voulant explorer de vastes corpus textuels sous forme électronique). Elle permet au linguiste de baliser syntaxiquement des corpus, à l'historien de marquer dans un texte des dates, des noms de lieu ou de personnage, au chercheur en littérature d'étudier la stylistique ou la genèse d'un texte, etc. Après quelques rappels historiques et une présentation informelle de la structure d'un texte TEI, nous décrivons les mécanismes mis en oeuvre dans l'écriture de la DTD TEI (modularité, héritage, extensibilité). Cette partie plus technique que les autres nécessite une bonne connaissance de SGML. A la fin de cet article nous présentons quelques exemples de balisage TEI. Les concepts et techniques liés au SGML sont exposés dans l'article «SGML» du présent traité.
C02 01  X    @0 001A01E02B
C02 02  X    @0 205
C03 01  X  FRE  @0 Document électronique @5 01
C03 01  X  ENG  @0 Electronic document @5 01
C03 01  X  SPA  @0 Documento electrónico @5 01
C03 02  X  FRE  @0 Texte @5 02
C03 02  X  ENG  @0 Text @5 02
C03 02  X  SPA  @0 Texto @5 02
C03 03  X  FRE  @0 Codage @5 03
C03 03  X  ENG  @0 Coding @5 03
C03 03  X  SPA  @0 Codificación @5 03
C03 04  X  FRE  @0 Balisage (document) @2 563 @5 04
C03 04  X  ENG  @0 Markup @2 563 @5 04
C03 04  X  SPA  @0 Etiqueta @2 563 @5 04
C03 05  X  FRE  @0 Structure document @5 05
C03 05  X  ENG  @0 Document structure @5 05
C03 05  X  SPA  @0 Estructura documental @5 05
C03 06  X  FRE  @0 Définition type document @5 06
C03 06  X  ENG  @0 Document type definition @5 06
C03 06  X  SPA  @0 Definición tipo documento @5 06
C03 07  X  FRE  @0 Langage SGML @5 07
C03 07  X  ENG  @0 SGML language @5 07
C03 07  X  SPA  @0 Lenguaje SGML @5 07
C03 08  X  FRE  @0 TEI (Text Encoding Initiative) @2 NI @4 INC @5 27
N21       @1 325
N44 01      @1 PSI
N82       @1 PSI

Format Inist (serveur)

NO : PASCAL 05-0464054 INIST
FT : TEI (Text Encoding Initiative)
ET : (TEI (Text Encoding Initiative))
AU : ROLE (Francois)
AF : Université Paris 8/France (1 aut.)
DT : Publication en série; Niveau analytique
SO : Techniques de l'ingénieur. Documents numériques Gestion de contenu; France; Da. 1999; Vol. HC1; No. H7158; H7158.1-H7158.9; Bibl. 9 ref.
LA : Français
FA : Depuis l'Antiquité, il est courant de marquer et d'annoter des textes en vue d'en faciliter l'étude ou la critique (pensons par exemple aux systèmes d'annotation médiévaux ou à l'appareil de symboles imaginé dès le IIIe siècle avant J.-C. par les philologues alexandrins). Dans l'univers numérique, le marquage électronique (défini ici comme l'insertion dans un fichier électronique de marques liées au texte mais n'en faisant pas directement partie) a longtemps servi presque exclusivement à piloter des dispositifs d'impression ou d'affichage (photocopieuses, imprimantes, écran). C'est ce marquage qu'utilisent implicitement (*) la plupart des chercheurs en sciences humaines au travers des outils PAO (Publication Assistée par Ordinateur) du commerce. Nota (*) : «implicitement» dans le sens où les manipulations effectuées via le clavier ou les dispositifs de pointage génèrent d'une manière ou d'une autre les informations de balisage physique sur lesquelles le logiciel de PAO s'appuie pour effectuer les opérations qu'on lui demande. Malgré ses mérites, ce marquage est, comme nous l'avons dit, orienté vers la production ou l'affichage du texte, et n'est donc pas conçu pour faciliter une exploration intellectuelle des documents. Peu à peu s'est donc imposée l'idée qu'il fallait recourir à un niveau de balisage moins dépendant des contraintes de production, et propice à des traitements de plus haut niveau sur les textes, parce qu'en décrivant la structure logique. SGML (Standard Generalized Markup Language) est la norme actuellement la plus utilisée pour baliser logiquement des textes. Elle permet à tout utilisateur de définir, via l'écriture d'une DTD (Définition du Type de Document) un langage de balisage logique adapté à ses besoins. La Text Encoding Initiative (TEI) est une DTD SGML accompagnée par un volume de «recommandations» ; les TEI «Guidelines» expliquant de quelle façon doit être utilisée la DTD. Cette DTD est adaptée principalement aux besoins de la communauté des chercheurs en sciences humaines (ou plus généralement à tout chercheur voulant explorer de vastes corpus textuels sous forme électronique). Elle permet au linguiste de baliser syntaxiquement des corpus, à l'historien de marquer dans un texte des dates, des noms de lieu ou de personnage, au chercheur en littérature d'étudier la stylistique ou la genèse d'un texte, etc. Après quelques rappels historiques et une présentation informelle de la structure d'un texte TEI, nous décrivons les mécanismes mis en oeuvre dans l'écriture de la DTD TEI (modularité, héritage, extensibilité). Cette partie plus technique que les autres nécessite une bonne connaissance de SGML. A la fin de cet article nous présentons quelques exemples de balisage TEI. Les concepts et techniques liés au SGML sont exposés dans l'article «SGML» du présent traité.
CC : 001A01E02B; 205
FD : Document électronique; Texte; Codage; Balisage (document); Structure document; Définition type document; Langage SGML; TEI (Text Encoding Initiative)
ED : Electronic document; Text; Coding; Markup; Document structure; Document type definition; SGML language
SD : Documento electrónico; Texto; Codificación; Etiqueta; Estructura documental; Definición tipo documento; Lenguaje SGML
LO : INIST-27363Y.354000138344120010
ID : 05-0464054

Links to Exploration step

Pascal:05-0464054

Le document en format XML

<record>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr" level="a">TEI (Text Encoding Initiative)</title>
<author>
<name sortKey="Role, Francois" sort="Role, Francois" uniqKey="Role F" first="Francois" last="Role">Francois Role</name>
<affiliation>
<inist:fA14 i1="01">
<s1>Université Paris 8</s1>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">INIST</idno>
<idno type="inist">05-0464054</idno>
<date when="1999">1999</date>
<idno type="stanalyst">PASCAL 05-0464054 INIST</idno>
<idno type="RBID">Pascal:05-0464054</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000035</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="fr" level="a">TEI (Text Encoding Initiative)</title>
<author>
<name sortKey="Role, Francois" sort="Role, Francois" uniqKey="Role F" first="Francois" last="Role">Francois Role</name>
<affiliation>
<inist:fA14 i1="01">
<s1>Université Paris 8</s1>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</analytic>
<series>
<title level="j" type="main">Techniques de l'ingénieur. Documents numériques Gestion de contenu</title>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<title level="j" type="main">Techniques de l'ingénieur. Documents numériques Gestion de contenu</title>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="KwdEn" xml:lang="en">
<term>Coding</term>
<term>Document structure</term>
<term>Document type definition</term>
<term>Electronic document</term>
<term>Markup</term>
<term>SGML language</term>
<term>Text</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr">
<term>Document électronique</term>
<term>Texte</term>
<term>Codage</term>
<term>Balisage (document)</term>
<term>Structure document</term>
<term>Définition type document</term>
<term>Langage SGML</term>
<term>TEI (Text Encoding Initiative)</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Depuis l'Antiquité, il est courant de marquer et d'annoter des textes en vue d'en faciliter l'étude ou la critique (pensons par exemple aux systèmes d'annotation médiévaux ou à l'appareil de symboles imaginé dès le III
<sup>e</sup>
siècle avant J.-C. par les philologues alexandrins). Dans l'univers numérique, le marquage électronique (défini ici comme l'insertion dans un fichier électronique de marques liées au texte mais n'en faisant pas directement partie) a longtemps servi presque exclusivement à piloter des dispositifs d'impression ou d'affichage (photocopieuses, imprimantes, écran). C'est ce marquage qu'utilisent implicitement (*) la plupart des chercheurs en sciences humaines au travers des outils PAO (Publication Assistée par Ordinateur) du commerce. Nota (*) : «implicitement» dans le sens où les manipulations effectuées via le clavier ou les dispositifs de pointage génèrent d'une manière ou d'une autre les informations de balisage physique sur lesquelles le logiciel de PAO s'appuie pour effectuer les opérations qu'on lui demande. Malgré ses mérites, ce marquage est, comme nous l'avons dit, orienté vers la production ou l'affichage du texte, et n'est donc pas conçu pour faciliter une exploration intellectuelle des documents. Peu à peu s'est donc imposée l'idée qu'il fallait recourir à un niveau de balisage moins dépendant des contraintes de production, et propice à des traitements de plus haut niveau sur les textes, parce qu'en décrivant la structure logique. SGML (Standard Generalized Markup Language) est la norme actuellement la plus utilisée pour baliser logiquement des textes. Elle permet à tout utilisateur de définir, via l'écriture d'une DTD (Définition du Type de Document) un langage de balisage logique adapté à ses besoins. La Text Encoding Initiative (TEI) est une DTD SGML accompagnée par un volume de «recommandations» ; les TEI «Guidelines» expliquant de quelle façon doit être utilisée la DTD. Cette DTD est adaptée principalement aux besoins de la communauté des chercheurs en sciences humaines (ou plus généralement à tout chercheur voulant explorer de vastes corpus textuels sous forme électronique). Elle permet au linguiste de baliser syntaxiquement des corpus, à l'historien de marquer dans un texte des dates, des noms de lieu ou de personnage, au chercheur en littérature d'étudier la stylistique ou la genèse d'un texte, etc. Après quelques rappels historiques et une présentation informelle de la structure d'un texte TEI, nous décrivons les mécanismes mis en oeuvre dans l'écriture de la DTD TEI (modularité, héritage, extensibilité). Cette partie plus technique que les autres nécessite une bonne connaissance de SGML. A la fin de cet article nous présentons quelques exemples de balisage TEI. Les concepts et techniques liés au SGML sont exposés dans l'article «SGML» du présent traité.</div>
</front>
</TEI>
<inist>
<standard h6="B">
<pA>
<fA05>
<s2>HC1</s2>
</fA05>
<fA06>
<s2>H7158</s2>
</fA06>
<fA08 i1="01" i2="1" l="FRE">
<s1>TEI (Text Encoding Initiative)</s1>
</fA08>
<fA11 i1="01" i2="1">
<s1>ROLE (Francois)</s1>
</fA11>
<fA14 i1="01">
<s1>Université Paris 8</s1>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</fA14>
<fA20>
<s2>H7158.1-H7158.9</s2>
</fA20>
<fA21>
<s1>1999</s1>
</fA21>
<fA23 i1="01">
<s0>FRE</s0>
</fA23>
<fA43 i1="01">
<s1>INIST</s1>
<s2>27363Y</s2>
<s5>354000138344120010</s5>
</fA43>
<fA44>
<s0>0000</s0>
<s1>© 2005 INIST-CNRS. All rights reserved.</s1>
</fA44>
<fA45>
<s0>9 ref.</s0>
</fA45>
<fA47 i1="01" i2="1">
<s0>05-0464054</s0>
</fA47>
<fA60>
<s1>P</s1>
</fA60>
<fA61>
<s0>A</s0>
</fA61>
<fA64 i1="01" i2="2">
<s0>Techniques de l'ingénieur. Documents numériques Gestion de contenu</s0>
</fA64>
<fA66 i1="01">
<s0>FRA</s0>
</fA66>
<fA68 i1="01" i2="1" l="ENG">
<s1>TEI (Text Encoding Initiative)</s1>
</fA68>
<fC01 i1="01" l="FRE">
<s0>Depuis l'Antiquité, il est courant de marquer et d'annoter des textes en vue d'en faciliter l'étude ou la critique (pensons par exemple aux systèmes d'annotation médiévaux ou à l'appareil de symboles imaginé dès le III
<sup>e</sup>
siècle avant J.-C. par les philologues alexandrins). Dans l'univers numérique, le marquage électronique (défini ici comme l'insertion dans un fichier électronique de marques liées au texte mais n'en faisant pas directement partie) a longtemps servi presque exclusivement à piloter des dispositifs d'impression ou d'affichage (photocopieuses, imprimantes, écran). C'est ce marquage qu'utilisent implicitement (*) la plupart des chercheurs en sciences humaines au travers des outils PAO (Publication Assistée par Ordinateur) du commerce. Nota (*) : «implicitement» dans le sens où les manipulations effectuées via le clavier ou les dispositifs de pointage génèrent d'une manière ou d'une autre les informations de balisage physique sur lesquelles le logiciel de PAO s'appuie pour effectuer les opérations qu'on lui demande. Malgré ses mérites, ce marquage est, comme nous l'avons dit, orienté vers la production ou l'affichage du texte, et n'est donc pas conçu pour faciliter une exploration intellectuelle des documents. Peu à peu s'est donc imposée l'idée qu'il fallait recourir à un niveau de balisage moins dépendant des contraintes de production, et propice à des traitements de plus haut niveau sur les textes, parce qu'en décrivant la structure logique. SGML (Standard Generalized Markup Language) est la norme actuellement la plus utilisée pour baliser logiquement des textes. Elle permet à tout utilisateur de définir, via l'écriture d'une DTD (Définition du Type de Document) un langage de balisage logique adapté à ses besoins. La Text Encoding Initiative (TEI) est une DTD SGML accompagnée par un volume de «recommandations» ; les TEI «Guidelines» expliquant de quelle façon doit être utilisée la DTD. Cette DTD est adaptée principalement aux besoins de la communauté des chercheurs en sciences humaines (ou plus généralement à tout chercheur voulant explorer de vastes corpus textuels sous forme électronique). Elle permet au linguiste de baliser syntaxiquement des corpus, à l'historien de marquer dans un texte des dates, des noms de lieu ou de personnage, au chercheur en littérature d'étudier la stylistique ou la genèse d'un texte, etc. Après quelques rappels historiques et une présentation informelle de la structure d'un texte TEI, nous décrivons les mécanismes mis en oeuvre dans l'écriture de la DTD TEI (modularité, héritage, extensibilité). Cette partie plus technique que les autres nécessite une bonne connaissance de SGML. A la fin de cet article nous présentons quelques exemples de balisage TEI. Les concepts et techniques liés au SGML sont exposés dans l'article «SGML» du présent traité.</s0>
</fC01>
<fC02 i1="01" i2="X">
<s0>001A01E02B</s0>
</fC02>
<fC02 i1="02" i2="X">
<s0>205</s0>
</fC02>
<fC03 i1="01" i2="X" l="FRE">
<s0>Document électronique</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="ENG">
<s0>Electronic document</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="SPA">
<s0>Documento electrónico</s0>
<s5>01</s5>
</fC03>
<fC03 i1="02" i2="X" l="FRE">
<s0>Texte</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="ENG">
<s0>Text</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="SPA">
<s0>Texto</s0>
<s5>02</s5>
</fC03>
<fC03 i1="03" i2="X" l="FRE">
<s0>Codage</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="ENG">
<s0>Coding</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="SPA">
<s0>Codificación</s0>
<s5>03</s5>
</fC03>
<fC03 i1="04" i2="X" l="FRE">
<s0>Balisage (document)</s0>
<s2>563</s2>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="ENG">
<s0>Markup</s0>
<s2>563</s2>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="SPA">
<s0>Etiqueta</s0>
<s2>563</s2>
<s5>04</s5>
</fC03>
<fC03 i1="05" i2="X" l="FRE">
<s0>Structure document</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="ENG">
<s0>Document structure</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="SPA">
<s0>Estructura documental</s0>
<s5>05</s5>
</fC03>
<fC03 i1="06" i2="X" l="FRE">
<s0>Définition type document</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="ENG">
<s0>Document type definition</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="SPA">
<s0>Definición tipo documento</s0>
<s5>06</s5>
</fC03>
<fC03 i1="07" i2="X" l="FRE">
<s0>Langage SGML</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="ENG">
<s0>SGML language</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="SPA">
<s0>Lenguaje SGML</s0>
<s5>07</s5>
</fC03>
<fC03 i1="08" i2="X" l="FRE">
<s0>TEI (Text Encoding Initiative)</s0>
<s2>NI</s2>
<s4>INC</s4>
<s5>27</s5>
</fC03>
<fN21>
<s1>325</s1>
</fN21>
<fN44 i1="01">
<s1>PSI</s1>
</fN44>
<fN82>
<s1>PSI</s1>
</fN82>
</pA>
</standard>
<server>
<NO>PASCAL 05-0464054 INIST</NO>
<FT>TEI (Text Encoding Initiative)</FT>
<ET>(TEI (Text Encoding Initiative))</ET>
<AU>ROLE (Francois)</AU>
<AF>Université Paris 8/France (1 aut.)</AF>
<DT>Publication en série; Niveau analytique</DT>
<SO>Techniques de l'ingénieur. Documents numériques Gestion de contenu; France; Da. 1999; Vol. HC1; No. H7158; H7158.1-H7158.9; Bibl. 9 ref.</SO>
<LA>Français</LA>
<FA>Depuis l'Antiquité, il est courant de marquer et d'annoter des textes en vue d'en faciliter l'étude ou la critique (pensons par exemple aux systèmes d'annotation médiévaux ou à l'appareil de symboles imaginé dès le III
<sup>e</sup>
siècle avant J.-C. par les philologues alexandrins). Dans l'univers numérique, le marquage électronique (défini ici comme l'insertion dans un fichier électronique de marques liées au texte mais n'en faisant pas directement partie) a longtemps servi presque exclusivement à piloter des dispositifs d'impression ou d'affichage (photocopieuses, imprimantes, écran). C'est ce marquage qu'utilisent implicitement (*) la plupart des chercheurs en sciences humaines au travers des outils PAO (Publication Assistée par Ordinateur) du commerce. Nota (*) : «implicitement» dans le sens où les manipulations effectuées via le clavier ou les dispositifs de pointage génèrent d'une manière ou d'une autre les informations de balisage physique sur lesquelles le logiciel de PAO s'appuie pour effectuer les opérations qu'on lui demande. Malgré ses mérites, ce marquage est, comme nous l'avons dit, orienté vers la production ou l'affichage du texte, et n'est donc pas conçu pour faciliter une exploration intellectuelle des documents. Peu à peu s'est donc imposée l'idée qu'il fallait recourir à un niveau de balisage moins dépendant des contraintes de production, et propice à des traitements de plus haut niveau sur les textes, parce qu'en décrivant la structure logique. SGML (Standard Generalized Markup Language) est la norme actuellement la plus utilisée pour baliser logiquement des textes. Elle permet à tout utilisateur de définir, via l'écriture d'une DTD (Définition du Type de Document) un langage de balisage logique adapté à ses besoins. La Text Encoding Initiative (TEI) est une DTD SGML accompagnée par un volume de «recommandations» ; les TEI «Guidelines» expliquant de quelle façon doit être utilisée la DTD. Cette DTD est adaptée principalement aux besoins de la communauté des chercheurs en sciences humaines (ou plus généralement à tout chercheur voulant explorer de vastes corpus textuels sous forme électronique). Elle permet au linguiste de baliser syntaxiquement des corpus, à l'historien de marquer dans un texte des dates, des noms de lieu ou de personnage, au chercheur en littérature d'étudier la stylistique ou la genèse d'un texte, etc. Après quelques rappels historiques et une présentation informelle de la structure d'un texte TEI, nous décrivons les mécanismes mis en oeuvre dans l'écriture de la DTD TEI (modularité, héritage, extensibilité). Cette partie plus technique que les autres nécessite une bonne connaissance de SGML. A la fin de cet article nous présentons quelques exemples de balisage TEI. Les concepts et techniques liés au SGML sont exposés dans l'article «SGML» du présent traité.</FA>
<CC>001A01E02B; 205</CC>
<FD>Document électronique; Texte; Codage; Balisage (document); Structure document; Définition type document; Langage SGML; TEI (Text Encoding Initiative)</FD>
<ED>Electronic document; Text; Coding; Markup; Document structure; Document type definition; SGML language</ED>
<SD>Documento electrónico; Texto; Codificación; Etiqueta; Estructura documental; Definición tipo documento; Lenguaje SGML</SD>
<LO>INIST-27363Y.354000138344120010</LO>
<ID>05-0464054</ID>
</server>
</inist>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Ticri/explor/TeiVM2/Data/PascalFrancis/Corpus
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000035 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/PascalFrancis/Corpus/biblio.hfd -nk 000035 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Ticri
   |area=    TeiVM2
   |flux=    PascalFrancis
   |étape=   Corpus
   |type=    RBID
   |clé=     Pascal:05-0464054
   |texte=   TEI (Text Encoding Initiative)
}}

Wicri

This area was generated with Dilib version V0.6.31.
Data generation: Mon Oct 30 21:59:18 2017. Site generation: Sun Feb 11 23:16:06 2024