TEI (Text Encoding Initiative)
Identifieur interne : 000017 ( PascalFrancis/Curation ); précédent : 000016; suivant : 000018TEI (Text Encoding Initiative)
Auteurs : Francois Role [France]Source :
- Techniques de l'ingénieur. Documents numériques Gestion de contenu
Descripteurs français
- Pascal (Inist)
- Wicri :
- topic : Document électronique, Codage.
English descriptors
- KwdEn :
Abstract
Depuis l'Antiquité, il est courant de marquer et d'annoter des textes en vue d'en faciliter l'étude ou la critique (pensons par exemple aux systèmes d'annotation médiévaux ou à l'appareil de symboles imaginé dès le IIIe siècle avant J.-C. par les philologues alexandrins). Dans l'univers numérique, le marquage électronique (défini ici comme l'insertion dans un fichier électronique de marques liées au texte mais n'en faisant pas directement partie) a longtemps servi presque exclusivement à piloter des dispositifs d'impression ou d'affichage (photocopieuses, imprimantes, écran). C'est ce marquage qu'utilisent implicitement (*) la plupart des chercheurs en sciences humaines au travers des outils PAO (Publication Assistée par Ordinateur) du commerce. Nota (*) : «implicitement» dans le sens où les manipulations effectuées via le clavier ou les dispositifs de pointage génèrent d'une manière ou d'une autre les informations de balisage physique sur lesquelles le logiciel de PAO s'appuie pour effectuer les opérations qu'on lui demande. Malgré ses mérites, ce marquage est, comme nous l'avons dit, orienté vers la production ou l'affichage du texte, et n'est donc pas conçu pour faciliter une exploration intellectuelle des documents. Peu à peu s'est donc imposée l'idée qu'il fallait recourir à un niveau de balisage moins dépendant des contraintes de production, et propice à des traitements de plus haut niveau sur les textes, parce qu'en décrivant la structure logique. SGML (Standard Generalized Markup Language) est la norme actuellement la plus utilisée pour baliser logiquement des textes. Elle permet à tout utilisateur de définir, via l'écriture d'une DTD (Définition du Type de Document) un langage de balisage logique adapté à ses besoins. La Text Encoding Initiative (TEI) est une DTD SGML accompagnée par un volume de «recommandations» ; les TEI «Guidelines» expliquant de quelle façon doit être utilisée la DTD. Cette DTD est adaptée principalement aux besoins de la communauté des chercheurs en sciences humaines (ou plus généralement à tout chercheur voulant explorer de vastes corpus textuels sous forme électronique). Elle permet au linguiste de baliser syntaxiquement des corpus, à l'historien de marquer dans un texte des dates, des noms de lieu ou de personnage, au chercheur en littérature d'étudier la stylistique ou la genèse d'un texte, etc. Après quelques rappels historiques et une présentation informelle de la structure d'un texte TEI, nous décrivons les mécanismes mis en oeuvre dans l'écriture de la DTD TEI (modularité, héritage, extensibilité). Cette partie plus technique que les autres nécessite une bonne connaissance de SGML. A la fin de cet article nous présentons quelques exemples de balisage TEI. Les concepts et techniques liés au SGML sont exposés dans l'article «SGML» du présent traité.
pA |
|
---|
Links toward previous steps (curation, corpus...)
- to stream PascalFrancis, to step Corpus: Pour aller vers cette notice dans l'étape Curation :000035
Links to Exploration step
Pascal:05-0464054Le document en format XML
<record><TEI><teiHeader><fileDesc><titleStmt><title xml:lang="fr" level="a">TEI (Text Encoding Initiative)</title>
<author><name sortKey="Role, Francois" sort="Role, Francois" uniqKey="Role F" first="Francois" last="Role">Francois Role</name>
<affiliation wicri:level="1"><inist:fA14 i1="01"><s1>Université Paris 8</s1>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>France</country>
</affiliation>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">INIST</idno>
<idno type="inist">05-0464054</idno>
<date when="1999">1999</date>
<idno type="stanalyst">PASCAL 05-0464054 INIST</idno>
<idno type="RBID">Pascal:05-0464054</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000035</idno>
<idno type="wicri:Area/PascalFrancis/Curation">000017</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title xml:lang="fr" level="a">TEI (Text Encoding Initiative)</title>
<author><name sortKey="Role, Francois" sort="Role, Francois" uniqKey="Role F" first="Francois" last="Role">Francois Role</name>
<affiliation wicri:level="1"><inist:fA14 i1="01"><s1>Université Paris 8</s1>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>France</country>
</affiliation>
</author>
</analytic>
<series><title level="j" type="main">Techniques de l'ingénieur. Documents numériques Gestion de contenu</title>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt><title level="j" type="main">Techniques de l'ingénieur. Documents numériques Gestion de contenu</title>
</seriesStmt>
</fileDesc>
<profileDesc><textClass><keywords scheme="KwdEn" xml:lang="en"><term>Coding</term>
<term>Document structure</term>
<term>Document type definition</term>
<term>Electronic document</term>
<term>Markup</term>
<term>SGML language</term>
<term>Text</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr"><term>Document électronique</term>
<term>Texte</term>
<term>Codage</term>
<term>Balisage (document)</term>
<term>Structure document</term>
<term>Définition type document</term>
<term>Langage SGML</term>
<term>TEI (Text Encoding Initiative)</term>
</keywords>
<keywords scheme="Wicri" type="topic" xml:lang="fr"><term>Document électronique</term>
<term>Codage</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr">Depuis l'Antiquité, il est courant de marquer et d'annoter des textes en vue d'en faciliter l'étude ou la critique (pensons par exemple aux systèmes d'annotation médiévaux ou à l'appareil de symboles imaginé dès le III<sup>e</sup>
siècle avant J.-C. par les philologues alexandrins). Dans l'univers numérique, le marquage électronique (défini ici comme l'insertion dans un fichier électronique de marques liées au texte mais n'en faisant pas directement partie) a longtemps servi presque exclusivement à piloter des dispositifs d'impression ou d'affichage (photocopieuses, imprimantes, écran). C'est ce marquage qu'utilisent implicitement (*) la plupart des chercheurs en sciences humaines au travers des outils PAO (Publication Assistée par Ordinateur) du commerce. Nota (*) : «implicitement» dans le sens où les manipulations effectuées via le clavier ou les dispositifs de pointage génèrent d'une manière ou d'une autre les informations de balisage physique sur lesquelles le logiciel de PAO s'appuie pour effectuer les opérations qu'on lui demande. Malgré ses mérites, ce marquage est, comme nous l'avons dit, orienté vers la production ou l'affichage du texte, et n'est donc pas conçu pour faciliter une exploration intellectuelle des documents. Peu à peu s'est donc imposée l'idée qu'il fallait recourir à un niveau de balisage moins dépendant des contraintes de production, et propice à des traitements de plus haut niveau sur les textes, parce qu'en décrivant la structure logique. SGML (Standard Generalized Markup Language) est la norme actuellement la plus utilisée pour baliser logiquement des textes. Elle permet à tout utilisateur de définir, via l'écriture d'une DTD (Définition du Type de Document) un langage de balisage logique adapté à ses besoins. La Text Encoding Initiative (TEI) est une DTD SGML accompagnée par un volume de «recommandations» ; les TEI «Guidelines» expliquant de quelle façon doit être utilisée la DTD. Cette DTD est adaptée principalement aux besoins de la communauté des chercheurs en sciences humaines (ou plus généralement à tout chercheur voulant explorer de vastes corpus textuels sous forme électronique). Elle permet au linguiste de baliser syntaxiquement des corpus, à l'historien de marquer dans un texte des dates, des noms de lieu ou de personnage, au chercheur en littérature d'étudier la stylistique ou la genèse d'un texte, etc. Après quelques rappels historiques et une présentation informelle de la structure d'un texte TEI, nous décrivons les mécanismes mis en oeuvre dans l'écriture de la DTD TEI (modularité, héritage, extensibilité). Cette partie plus technique que les autres nécessite une bonne connaissance de SGML. A la fin de cet article nous présentons quelques exemples de balisage TEI. Les concepts et techniques liés au SGML sont exposés dans l'article «SGML» du présent traité.</div>
</front>
</TEI>
<inist><standard h6="B"><pA><fA05><s2>HC1</s2>
</fA05>
<fA06><s2>H7158</s2>
</fA06>
<fA08 i1="01" i2="1" l="FRE"><s1>TEI (Text Encoding Initiative)</s1>
</fA08>
<fA11 i1="01" i2="1"><s1>ROLE (Francois)</s1>
</fA11>
<fA14 i1="01"><s1>Université Paris 8</s1>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</fA14>
<fA20><s2>H7158.1-H7158.9</s2>
</fA20>
<fA21><s1>1999</s1>
</fA21>
<fA23 i1="01"><s0>FRE</s0>
</fA23>
<fA43 i1="01"><s1>INIST</s1>
<s2>27363Y</s2>
<s5>354000138344120010</s5>
</fA43>
<fA44><s0>0000</s0>
<s1>© 2005 INIST-CNRS. All rights reserved.</s1>
</fA44>
<fA45><s0>9 ref.</s0>
</fA45>
<fA47 i1="01" i2="1"><s0>05-0464054</s0>
</fA47>
<fA60><s1>P</s1>
</fA60>
<fA61><s0>A</s0>
</fA61>
<fA64 i1="01" i2="2"><s0>Techniques de l'ingénieur. Documents numériques Gestion de contenu</s0>
</fA64>
<fA66 i1="01"><s0>FRA</s0>
</fA66>
<fA68 i1="01" i2="1" l="ENG"><s1>TEI (Text Encoding Initiative)</s1>
</fA68>
<fC01 i1="01" l="FRE"><s0>Depuis l'Antiquité, il est courant de marquer et d'annoter des textes en vue d'en faciliter l'étude ou la critique (pensons par exemple aux systèmes d'annotation médiévaux ou à l'appareil de symboles imaginé dès le III<sup>e</sup>
siècle avant J.-C. par les philologues alexandrins). Dans l'univers numérique, le marquage électronique (défini ici comme l'insertion dans un fichier électronique de marques liées au texte mais n'en faisant pas directement partie) a longtemps servi presque exclusivement à piloter des dispositifs d'impression ou d'affichage (photocopieuses, imprimantes, écran). C'est ce marquage qu'utilisent implicitement (*) la plupart des chercheurs en sciences humaines au travers des outils PAO (Publication Assistée par Ordinateur) du commerce. Nota (*) : «implicitement» dans le sens où les manipulations effectuées via le clavier ou les dispositifs de pointage génèrent d'une manière ou d'une autre les informations de balisage physique sur lesquelles le logiciel de PAO s'appuie pour effectuer les opérations qu'on lui demande. Malgré ses mérites, ce marquage est, comme nous l'avons dit, orienté vers la production ou l'affichage du texte, et n'est donc pas conçu pour faciliter une exploration intellectuelle des documents. Peu à peu s'est donc imposée l'idée qu'il fallait recourir à un niveau de balisage moins dépendant des contraintes de production, et propice à des traitements de plus haut niveau sur les textes, parce qu'en décrivant la structure logique. SGML (Standard Generalized Markup Language) est la norme actuellement la plus utilisée pour baliser logiquement des textes. Elle permet à tout utilisateur de définir, via l'écriture d'une DTD (Définition du Type de Document) un langage de balisage logique adapté à ses besoins. La Text Encoding Initiative (TEI) est une DTD SGML accompagnée par un volume de «recommandations» ; les TEI «Guidelines» expliquant de quelle façon doit être utilisée la DTD. Cette DTD est adaptée principalement aux besoins de la communauté des chercheurs en sciences humaines (ou plus généralement à tout chercheur voulant explorer de vastes corpus textuels sous forme électronique). Elle permet au linguiste de baliser syntaxiquement des corpus, à l'historien de marquer dans un texte des dates, des noms de lieu ou de personnage, au chercheur en littérature d'étudier la stylistique ou la genèse d'un texte, etc. Après quelques rappels historiques et une présentation informelle de la structure d'un texte TEI, nous décrivons les mécanismes mis en oeuvre dans l'écriture de la DTD TEI (modularité, héritage, extensibilité). Cette partie plus technique que les autres nécessite une bonne connaissance de SGML. A la fin de cet article nous présentons quelques exemples de balisage TEI. Les concepts et techniques liés au SGML sont exposés dans l'article «SGML» du présent traité.</s0>
</fC01>
<fC02 i1="01" i2="X"><s0>001A01E02B</s0>
</fC02>
<fC02 i1="02" i2="X"><s0>205</s0>
</fC02>
<fC03 i1="01" i2="X" l="FRE"><s0>Document électronique</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="ENG"><s0>Electronic document</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="SPA"><s0>Documento electrónico</s0>
<s5>01</s5>
</fC03>
<fC03 i1="02" i2="X" l="FRE"><s0>Texte</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="ENG"><s0>Text</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="SPA"><s0>Texto</s0>
<s5>02</s5>
</fC03>
<fC03 i1="03" i2="X" l="FRE"><s0>Codage</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="ENG"><s0>Coding</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="SPA"><s0>Codificación</s0>
<s5>03</s5>
</fC03>
<fC03 i1="04" i2="X" l="FRE"><s0>Balisage (document)</s0>
<s2>563</s2>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="ENG"><s0>Markup</s0>
<s2>563</s2>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="SPA"><s0>Etiqueta</s0>
<s2>563</s2>
<s5>04</s5>
</fC03>
<fC03 i1="05" i2="X" l="FRE"><s0>Structure document</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="ENG"><s0>Document structure</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="SPA"><s0>Estructura documental</s0>
<s5>05</s5>
</fC03>
<fC03 i1="06" i2="X" l="FRE"><s0>Définition type document</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="ENG"><s0>Document type definition</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="SPA"><s0>Definición tipo documento</s0>
<s5>06</s5>
</fC03>
<fC03 i1="07" i2="X" l="FRE"><s0>Langage SGML</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="ENG"><s0>SGML language</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="SPA"><s0>Lenguaje SGML</s0>
<s5>07</s5>
</fC03>
<fC03 i1="08" i2="X" l="FRE"><s0>TEI (Text Encoding Initiative)</s0>
<s2>NI</s2>
<s4>INC</s4>
<s5>27</s5>
</fC03>
<fN21><s1>325</s1>
</fN21>
<fN44 i1="01"><s1>PSI</s1>
</fN44>
<fN82><s1>PSI</s1>
</fN82>
</pA>
</standard>
</inist>
</record>
Pour manipuler ce document sous Unix (Dilib)
EXPLOR_STEP=$WICRI_ROOT/Wicri/Ticri/explor/TeiVM2/Data/PascalFrancis/Curation
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000017 | SxmlIndent | more
Ou
HfdSelect -h $EXPLOR_AREA/Data/PascalFrancis/Curation/biblio.hfd -nk 000017 | SxmlIndent | more
Pour mettre un lien sur cette page dans le réseau Wicri
{{Explor lien |wiki= Wicri/Ticri |area= TeiVM2 |flux= PascalFrancis |étape= Curation |type= RBID |clé= Pascal:05-0464054 |texte= TEI (Text Encoding Initiative) }}
This area was generated with Dilib version V0.6.31. |