TEI, adaptation ISTEX

De Wicri Métadonnées

Cette page est un point d'entrée pour les observations concernant l'adaptation TEI réalisée par l'INIST pour l'unification des documents issus d'ISTEX.

Accès à l'adaptation TEI d'ISTEX

Pour chaque document ISTEX, une version TEI, plus ou moins élaborée, est disponible.

Plus précisément elle est téléchargeable à partir d'une url du type :

  • https://api.istex.fr/document/identifiant ISTEX/fulltext/tei

Exemple :

Pour localiser précisément cette url, l'API ISTEX permet de télécharger des métadonnées dans le format JavaScript Object Notation (JSON). Ce document permet d'accéder à l'URL TEI via l'arborescence :

{
  "total": ...,
  ...
  "hits": [
    {
      "corpusName": "elsevier",
      "author": [
        ...
      ],

      ...
      "id": "1C874AD82F323AFBF3C6AA004C2AD7DA8C21F942",
      "fulltext": [
       ...
        {
          "original": false,
          "mimetype": "application/tei+xml",
          "extension": "tei",
          "uri": "https://api.istex.fr/document/1C874AD82F323AFBF3C6AA004C2AD7DA8C21F942/fulltext/tei"
        }
      ],
      "metadata": [
          ...
      ],
    }
  ]
}

Contenu de l'adaptation

Partie TeiHeader

La description bibliographique d'un document ISTEX est essentiellement contenue dans un élément sourceDesc (lui-même étant inclus dans l'élément fileDesc du teiHeader).

Plus précisément, l'élément sourceDesc est principalement composé d'un élément biblStruct, lui-même découpé en 3 parties : analytic, monogr et series.

L'élément analytic contient l'essentiel des métadonnées propres à l'article comme notamment les auteurs et affiliations.

Dans le réseau WICRI

Le réseau Wicri s'appuie sur ces adaptations pour réaliser une unification des formats bibliographiques manipulés dans les wikis, et plus spécifiquement dans les serveurs d'exploration.

La Bibliothèque Dilib fournit un ensemble d'outils permettant de télécharger des documents ISTEX avec différents niveaux de consolidation (voir notamment sur le wiki Wicri/Outils, la commande IstexGetCorpus).

Dans un document numérique appartenant à un flux de curation, l'élément TEI produit par l'INIST est contenu dans un élément istex:fulltextTEI qui est localisé par le chemin (XPATH) :

  • record/istex/fulltext/istex:fulltextTEI

L'élément TEI adapté par WICRI (DILIB) est accessible ici :

  • record/TEI