TEI, adaptation ISTEX : Différence entre versions

De Wicri Métadonnées
imported>Jacques Ducloy
(Dans le réseau WICRI)
imported>Jacques Ducloy
m (19 révisions importées)
 
(16 révisions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
{{Wicri avertissement création lien}}
 
 
Cette page est un point d'entrée pour les observations concernant l'adaptation TEI réalisée par l'INIST pour l'unification des documents issus d'ISTEX.
 
Cette page est un point d'entrée pour les observations concernant l'adaptation TEI réalisée par l'INIST pour l'unification des documents issus d'ISTEX.
 +
==Accès à l'adaptation TEI d'ISTEX==
 +
Pour chaque document ISTEX, une version TEI, plus ou moins élaborée, est disponible.
 +
 +
Plus précisément elle est téléchargeable à partir d'une url du type :
 +
* <code><nowiki>https</nowiki>://api.istex.fr/document/</code>''identifiant ISTEX''<code>/fulltext/tei</code>
 +
Exemple :
 +
* <code>https://api.istex.fr/document/D9E6B25362FB4E9F6D50A1803824A4994FDACD7B/fulltext/tei</code>
 +
Pour localiser précisément cette url, l'API ISTEX permet de télécharger des métadonnées dans le format '''''[[JavaScript Object Notation]]'' (JSON)'''. Ce document permet d'accéder à l'URL TEI via l'arborescence :
 +
<source lang="js">
 +
{
 +
  "total": ...,
 +
  ...
 +
  "hits": [
 +
    {
 +
      "corpusName": "elsevier",
 +
      "author": [
 +
        ...
 +
      ],
 +
 +
      ...
 +
      "id": "1C874AD82F323AFBF3C6AA004C2AD7DA8C21F942",
 +
      "fulltext": [
 +
      ...
 +
        {
 +
          "original": false,
 +
          "mimetype": "application/tei+xml",
 +
          "extension": "tei",
 +
          "uri": "https://api.istex.fr/document/1C874AD82F323AFBF3C6AA004C2AD7DA8C21F942/fulltext/tei"
 +
        }
 +
      ],
 +
      "metadata": [
 +
          ...
 +
      ],
 +
    }
 +
  ]
 +
}
 +
</source>
 +
 +
==Contenu de l'adaptation==
 +
===Partie TeiHeader===
 +
La description bibliographique d'un document ISTEX est essentiellement contenue dans un élément [[TEI, élément sourceDesc|sourceDesc]] (lui-même étant inclus dans l'élément [[TEI, élément fileDesc|fileDesc]] du [[TEI, élément teiHeader|teiHeader]]).
 +
 +
Plus précisément, l'[[TEI, élément sourceDesc|élément sourceDesc]] est principalement composé d'un élément [[TEI, élément biblStruct|biblStruct]], lui-même découpé en 3 parties : [[TEI, élément analytic|analytic]], [[TEI, élément monogr|monogr]] et [[TEI, élément series|series]].
 +
 +
L'[[TEI, élément analytic|élément analytic]] contient l'essentiel des métadonnées propres à l'article comme notamment les auteurs et affiliations.
 +
 
==Dans le réseau WICRI==
 
==Dans le réseau WICRI==
 
Le réseau Wicri s'appuie sur ces adaptations pour réaliser une unification des formats bibliographiques manipulés dans les wikis, et plus spécifiquement dans les [[Serveur d'exploration|serveurs d'exploration]].
 
Le réseau Wicri s'appuie sur ces adaptations pour réaliser une unification des formats bibliographiques manipulés dans les wikis, et plus spécifiquement dans les [[Serveur d'exploration|serveurs d'exploration]].
  
Dans un document numérique appartenant à un flux de curation, l'élément TEI produit par l'INIST est localisé par le chemin (XPATH) :
+
La [[Bibliothèque Dilib]] fournit un ensemble d'outils permettant de télécharger des documents ISTEX avec différents niveaux de consolidation (voir notamment sur le wiki Wicri/Outils, la commande [[wicri.fr:Dilib, module Istex, commande IstexGetCorpus|IstexGetCorpus]]).
* record/istex/fulltext/istex:fulltextTEI
+
 
 +
Dans un document numérique appartenant à un flux de curation, l'élément TEI produit par l'INIST est contenu dans un élément [[ISTEX, fulltext TEI|istex:fulltextTEI]] qui est localisé par le chemin (XPATH) :
 +
* <code>record/istex/fulltext/istex:fulltextTEI</code>
 +
L'élément TEI adapté par WICRI (DILIB) est accessible ici :
 +
* <code>record/TEI</code>

Version actuelle datée du 17 juin 2017 à 21:36

Cette page est un point d'entrée pour les observations concernant l'adaptation TEI réalisée par l'INIST pour l'unification des documents issus d'ISTEX.

Accès à l'adaptation TEI d'ISTEX

Pour chaque document ISTEX, une version TEI, plus ou moins élaborée, est disponible.

Plus précisément elle est téléchargeable à partir d'une url du type :

  • https://api.istex.fr/document/identifiant ISTEX/fulltext/tei

Exemple :

Pour localiser précisément cette url, l'API ISTEX permet de télécharger des métadonnées dans le format JavaScript Object Notation (JSON). Ce document permet d'accéder à l'URL TEI via l'arborescence :

{
  "total": ...,
  ...
  "hits": [
    {
      "corpusName": "elsevier",
      "author": [
        ...
      ],

      ...
      "id": "1C874AD82F323AFBF3C6AA004C2AD7DA8C21F942",
      "fulltext": [
       ...
        {
          "original": false,
          "mimetype": "application/tei+xml",
          "extension": "tei",
          "uri": "https://api.istex.fr/document/1C874AD82F323AFBF3C6AA004C2AD7DA8C21F942/fulltext/tei"
        }
      ],
      "metadata": [
          ...
      ],
    }
  ]
}

Contenu de l'adaptation

Partie TeiHeader

La description bibliographique d'un document ISTEX est essentiellement contenue dans un élément sourceDesc (lui-même étant inclus dans l'élément fileDesc du teiHeader).

Plus précisément, l'élément sourceDesc est principalement composé d'un élément biblStruct, lui-même découpé en 3 parties : analytic, monogr et series.

L'élément analytic contient l'essentiel des métadonnées propres à l'article comme notamment les auteurs et affiliations.

Dans le réseau WICRI

Le réseau Wicri s'appuie sur ces adaptations pour réaliser une unification des formats bibliographiques manipulés dans les wikis, et plus spécifiquement dans les serveurs d'exploration.

La Bibliothèque Dilib fournit un ensemble d'outils permettant de télécharger des documents ISTEX avec différents niveaux de consolidation (voir notamment sur le wiki Wicri/Outils, la commande IstexGetCorpus).

Dans un document numérique appartenant à un flux de curation, l'élément TEI produit par l'INIST est contenu dans un élément istex:fulltextTEI qui est localisé par le chemin (XPATH) :

  • record/istex/fulltext/istex:fulltextTEI

L'élément TEI adapté par WICRI (DILIB) est accessible ici :

  • record/TEI