Text Encoding Initiative : Différence entre versions
imported>Jacques Ducloy (→Voir aussi) |
imported>Jacques Ducloy (→Voir aussi) |
||
(7 révisions intermédiaires par le même utilisateur non affichées) | |||
Ligne 2 : | Ligne 2 : | ||
==Un exemple introductif== | ==Un exemple introductif== | ||
{{Wicri tp | {{Wicri tp | ||
− | |titre=Pourquoi ce paragraphe d'initiation ? | + | |titre=Pourquoi ce paragraphe d'initiation dans un wiki destiné aux spécialistes du document numérique ? |
|texte=Cette section a été introduite à des fins pédagogiques pour montrer l'aspect « encyclopédique » des wikis du réseau Wicri. | |texte=Cette section a été introduite à des fins pédagogiques pour montrer l'aspect « encyclopédique » des wikis du réseau Wicri. | ||
+ | |||
+ | En fait cette section devrait à terme être remplacée par une synthèse rédigée à partir des explorations des corpus. | ||
}} | }} | ||
Pour illustrer la philosophie de la TEI, voici comment pourrait être codé un extrait du [[wikipedia:Le Cid (Corneille)|Cid]] de [[wikipedia:Pierre Corneille|Pierre Corneille]]<ref> | Pour illustrer la philosophie de la TEI, voici comment pourrait être codé un extrait du [[wikipedia:Le Cid (Corneille)|Cid]] de [[wikipedia:Pierre Corneille|Pierre Corneille]]<ref> | ||
Ligne 85 : | Ligne 87 : | ||
Cette section introduit le « [[Serveur d'exploration sur la TEI]] ». | Cette section introduit le « [[Serveur d'exploration sur la TEI]] ». | ||
Il contient [[A pour volumétrie (serveur d'exploration)::{{TeiVM2, Explor size|stream=Area|step=Corpus|index=biblio}}]] documents. | Il contient [[A pour volumétrie (serveur d'exploration)::{{TeiVM2, Explor size|stream=Area|step=Corpus|index=biblio}}]] documents. | ||
+ | <!-- | ||
+ | {{Wicri travaux|texte=Serveur en cours de mise à jour, incohérences ou pertes de liens possibles}} | ||
+ | --> | ||
===Navigation=== | ===Navigation=== | ||
{| class="wikitable" | {| class="wikitable" | ||
Ligne 216 : | Ligne 221 : | ||
<references/> | <references/> | ||
;Bibliographie: | ;Bibliographie: | ||
− | <span id="bib.bur.96">[BUR 96]</span> [[A pour auteur cité::Lou Burnard]] et [[A pour auteur cité::Michael Sperberg-McQueen C. M. Sperberg-McQueen]], traduction de François Role. ''La TEI simplifiée : une introduction au codage des textes électroniques en vue de leur échange''<br/><http://www.tei-c.org.uk/Lite/teiu5_fr.html> | + | <span id="bib.bur.96">[BUR 96]</span> [[A pour auteur cité::Lou Burnard]] et [[A pour auteur cité::Michael Sperberg-McQueen|C. M. Sperberg-McQueen]], traduction de François Role. ''La TEI simplifiée : une introduction au codage des textes électroniques en vue de leur échange''<br/><http://www.tei-c.org.uk/Lite/teiu5_fr.html> |
+ | ;Sur ce wiki: | ||
+ | * [[Curation de données avec le serveur d'exploration sur la TEI]] | ||
{{Wicri voir aussi, norme}} | {{Wicri voir aussi, norme}} | ||
[[catégorie:Schéma de métadonnées]] | [[catégorie:Schéma de métadonnées]] | ||
+ | [[Catégorie:Serveur d'exploration]] | ||
{{Wicri voir|référence=Ticri}} | {{Wicri voir|référence=Ticri}} | ||
+ | Sur Wicri/Ticri, voir aussi le [[ticri.fr:Serveur d'exploration sur la TEI|Serveur d'exploration sur la TEI]] | ||
__SHOWFACTBOX__ | __SHOWFACTBOX__ |
Version actuelle datée du 10 octobre 2016 à 18:22
La Text Encoding Initiative désigne à la fois le nom d'un groupe de travail international et d'un standard. Le sujet qu'ils traitent est la codification de toutes sortes de documents dans une approches structurée et plus précisément, en SGML au début, puis maintenant, en XML.
Sommaire
Un exemple introductif
Pour illustrer la philosophie de la TEI, voici comment pourrait être codé un extrait du Cid de Pierre Corneille[1]. Pour un ouvrage d'introduction plus complet voir |BUR 96].
On cherche à représenter :
|
Avec le langage HTML, on aurait une codification limitée aux aspects « mise en page ».
<h1>Acte II, Scène 2</h1>
<br/> <b>DON RODRIGUE</b> À moi Comte, deux mots.
<br/> <b>LE COMTE</b> ... Parle
Avec le schéma TEI, on obtiendrait ceci :
<div type="Act" n="I"><head>Acte II</head>
<div type="Scene" n="1"><head>Scène 2</head>
<sp><speaker>Rodrigue</speaker>
<l part="i">À moi, comte, deux mots.</l></sp>
<sp><speaker>Comte</speaker><l part="m">Parle</l></sp>
<sp><speaker>Rodrique</speaker>
<l part="f">Ôte-moi d'un doute</l></sp>
<sp><speaker>Comte</speaker>
<l part="i">Connais-tu bien Don Diègue ?</l></sp>
<sp><speaker>Comte</speaker><l part="m">Oui</l></sp>
<sp><speaker>Rodrigue</speaker>
<l part="f">Parlons bas, écoute.</l>
<l>Sais-tu que ce vieillard fut la même vertu,</l>
<l>La vaillance et l'honneur de son temps ? Le sais-tu ?</l></sp>
...
</div>
...
</div>
La TEI permet de décrire la structuration du texte tel qu'il a été conçu et non son rendu final (présentation). Cet exemple montre notamment :
- L'imbrication des actes et des paragraphes (2 éléments div imbriqués). Avec un langage comme XPath, il est alors possible d'extraire un acte ou une scène.
- Le découpage du dialogue par des éléments "sp".
- La définition des interlocuteurs par des éléments "speaker" (il est possible facilement de lancer des requêtes pour localiser les endroits où Rodrigue cite Chimène).
- La précision de la description de la versification par des éléments "l" (ligne) avec des indications sur la position d'un élément de dialogue en début, fin ou milieu de vers grâce aux attributs "part".
Serveur d'exploration
Cette section introduit le « Serveur d'exploration sur la TEI ». Il contient 692 documents.
Ce flux donne accès 536 documents ISTEX (et 536 après curation). | |||
Ce flux traite 115 références, dont 51 venant de Francis, et 64 venant de Pascal.
Après curation le volume est réduit à 106. | |||
Ce flux traite 41 références téléchargées de HAL. Après curation le volume est réduit à 41. | |||
Flux principal | Ce flux fusionne 683 références issues des étapes précédentes.
Ce volume est ramené à 683 après dédoublonnage par DOI. Enfin, il est réduit à 644 par clé de dédoublonnage IDAT. | ||
Zoom | France | Ce flux donne accès à une bibliographie contenant 64 références ayant au moins un auteur avec une affiliation française. | |
Zoom | UK | Ce flux donne accès à une bibliographie contenant 101 références ayant au moins un auteur avec une affiliation du Royaume-Uni. | |
Zoom | USA | Ce flux donne accès à une bibliographie contenant 181 références ayant au moins un auteur avec une affiliation des Etats-Unis d'Amérique. | |
Zoom | Allemagne | Ce flux donne accès à une bibliographie contenant 39 références ayant au moins un auteur avec une affiliation allemande. |
Projections géographiques
|
|
Listes de résultats bruts
|
|
|
|
|
|
- Sur le Zoom France
|
|
|
|
|
|
Voir aussi
- Notes
- ↑ Cet exemple est inspiré d'un article de Lou Burnard, a fait l'objet d'un article sur le site ARTIST (http://artist.inist.fr/article.php3?id_article=59 ARTIST) et a été enfin adapté à Wikipédia
- Bibliographie
[BUR 96] Lou Burnard et C. M. Sperberg-McQueen, traduction de François Role. La TEI simplifiée : une introduction au codage des textes électroniques en vue de leur échange
<http://www.tei-c.org.uk/Lite/teiu5_fr.html>
- Sur ce wiki
Sur ce wiki:(génération automatique par des requêtes sémantiques)
Liste des pages de ce wiki où cette norme est citée :
- CIDE (1998) Richy (titre :: Édition comparative et hypertextuelle)
- CIDE (2007) Pierrel (titre :: Valorisation et exploitation scientifiques de documents numériques pour la recherche en linguistique : l’exemple du CNRTL)
- CIDE (2009) Faure (titre :: Manuscrits de Stendhal : Du patrimoine papier au document électronique.)
- CIDE 2007 Nancy (titre :: CIDE.10 Nancy)
- Dans le réseau Wicri :
La page de référence « Text Encoding Initiative » est sur le wiki Wicri/Ticri. Sur Wicri/Ticri, voir aussi le Serveur d'exploration sur la TEI