ISTEX, fulltext TEI : Différence entre versions

De Wicri Métadonnées
imported>Jacques Ducloy
(Application dans Wicri)
imported>Jacques Ducloy
(Application dans Wicri)
Ligne 10 : Ligne 10 :
 
* La commande {{Wicri lien avec icône|wiki=Outils|page=IstexGetCorpus}}, avec notamment ses options « -A » et « -O tei ».
 
* La commande {{Wicri lien avec icône|wiki=Outils|page=IstexGetCorpus}}, avec notamment ses options « -A » et « -O tei ».
 
* La commande {{Wicri lien avec icône|wiki=Outils|page=IstexToSxml}} qui convertit des flots XML issus de l'api Istex pour les rendre conforme aux [[Dilib, flots de données Sxml|recommandations Sxml]].
 
* La commande {{Wicri lien avec icône|wiki=Outils|page=IstexToSxml}} qui convertit des flots XML issus de l'api Istex pour les rendre conforme aux [[Dilib, flots de données Sxml|recommandations Sxml]].
 +
===Balisage du fulltext===
 +
Quelques adaptations ont été introduites par les commandes IstexGetCorpus et IstexToSxml.
 +
* l'élément TEI d'ISTEX est renommé istex:fulltextTEI par la commmande IstexGetCorpus avec l'option « -A ».
 +
* Pour faciliter les traitements du fulltext TEI, deux éléments de balisage (p et l) ont été introduits par la commande IstexToSxml.

Version du 28 avril 2015 à 08:18

logo lien externe logo import Wikipedia Cette page est en phase de création pour des raisons de cohérence des liens au sein du réseau Wicri.
Pour en savoir plus, prendre les liens interwikis ou consulter l'onglet pages liées de la boîte à outils de navigation.

Cette page est un point d'entrée pour les réflexions normatives liées au traitement du fulltext du projet ISTEX avec un balisage TEI.

Les documents fulltext TEI d'ISTEX

L'api ISTEX permet de télécharger le texte intégral d'un document ISTEX avec un balisage TEI.

Application dans Wicri

Une première application pilote est ouverte sur le wiki Wicri/Linguistique, voir le Serveur d'exploration sur la philologie( LogoWicriWicriFrMars2010.png ), et plus précisément la page Wicri:PhilologieVM2( LogoWicriWicriFrMars2010.png ).

Elle a notamment permis la mise en place ou l'amélioration de 2 outils de la Bibliothèque Dilib.

Balisage du fulltext

Quelques adaptations ont été introduites par les commandes IstexGetCorpus et IstexToSxml.

  • l'élément TEI d'ISTEX est renommé istex:fulltextTEI par la commmande IstexGetCorpus avec l'option « -A ».
  • Pour faciliter les traitements du fulltext TEI, deux éléments de balisage (p et l) ont été introduits par la commande IstexToSxml.