TEI, adaptation ISTEX : Différence entre versions

De Wicri Métadonnées
imported>Jacques Ducloy
imported>Jacques Ducloy
m (19 révisions importées)
 
(10 révisions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
 
Cette page est un point d'entrée pour les observations concernant l'adaptation TEI réalisée par l'INIST pour l'unification des documents issus d'ISTEX.
 
Cette page est un point d'entrée pour les observations concernant l'adaptation TEI réalisée par l'INIST pour l'unification des documents issus d'ISTEX.
==Premiers éléments==
+
==Accès à l'adaptation TEI d'ISTEX==
{{Wicri travaux|texte=paragraphe en cours de rédaction}}
+
Pour chaque document ISTEX, une version TEI, plus ou moins élaborée, est disponible.
  
 +
Plus précisément elle est téléchargeable à partir d'une url du type :
 +
* <code><nowiki>https</nowiki>://api.istex.fr/document/</code>''identifiant ISTEX''<code>/fulltext/tei</code>
 +
Exemple :
 +
* <code>https://api.istex.fr/document/D9E6B25362FB4E9F6D50A1803824A4994FDACD7B/fulltext/tei</code>
 +
Pour localiser précisément cette url, l'API ISTEX permet de télécharger des métadonnées dans le format '''''[[JavaScript Object Notation]]'' (JSON)'''. Ce document permet d'accéder à l'URL TEI via l'arborescence :
 +
<source lang="js">
 +
{
 +
  "total": ...,
 +
  ...
 +
  "hits": [
 +
    {
 +
      "corpusName": "elsevier",
 +
      "author": [
 +
        ...
 +
      ],
  
La description bibliographique d'un document ISTEX est essentiellement contenue dans un élément [[TEI, élément sourceDesc|sourceDesc]] (lui-même étant inclus dans l'élément [[TEI, élément fileDesc|fileDesc]] du [[TEI, élément teiHeader|teiHeader]]).
+
      ...
 +
      "id": "1C874AD82F323AFBF3C6AA004C2AD7DA8C21F942",
 +
      "fulltext": [
 +
      ...
 +
        {
 +
          "original": false,
 +
          "mimetype": "application/tei+xml",
 +
          "extension": "tei",
 +
          "uri": "https://api.istex.fr/document/1C874AD82F323AFBF3C6AA004C2AD7DA8C21F942/fulltext/tei"
 +
        }
 +
      ],
 +
      "metadata": [
 +
          ...
 +
      ],
 +
    }
 +
  ]
 +
}
 +
</source>
 +
 
 +
==Contenu de l'adaptation==
 +
===Partie TeiHeader===
 +
La description bibliographique d'un document ISTEX est essentiellement contenue dans un élément [[TEI, élément sourceDesc|sourceDesc]] (lui-même étant inclus dans l'élément [[TEI, élément fileDesc|fileDesc]] du [[TEI, élément teiHeader|teiHeader]]).
 +
 
 +
Plus précisément, l'[[TEI, élément sourceDesc|élément sourceDesc]] est principalement composé d'un élément [[TEI, élément biblStruct|biblStruct]], lui-même découpé en 3 parties : [[TEI, élément analytic|analytic]], [[TEI, élément monogr|monogr]] et [[TEI, élément series|series]].
 +
 
 +
L'[[TEI, élément analytic|élément analytic]] contient l'essentiel des métadonnées propres à l'article comme notamment les auteurs et affiliations.
  
 
==Dans le réseau WICRI==
 
==Dans le réseau WICRI==
 
Le réseau Wicri s'appuie sur ces adaptations pour réaliser une unification des formats bibliographiques manipulés dans les wikis, et plus spécifiquement dans les [[Serveur d'exploration|serveurs d'exploration]].
 
Le réseau Wicri s'appuie sur ces adaptations pour réaliser une unification des formats bibliographiques manipulés dans les wikis, et plus spécifiquement dans les [[Serveur d'exploration|serveurs d'exploration]].
 +
 +
La [[Bibliothèque Dilib]] fournit un ensemble d'outils permettant de télécharger des documents ISTEX avec différents niveaux de consolidation (voir notamment sur le wiki Wicri/Outils, la commande [[wicri.fr:Dilib, module Istex, commande IstexGetCorpus|IstexGetCorpus]]).
  
 
Dans un document numérique appartenant à un flux de curation, l'élément TEI produit par l'INIST est contenu dans un élément [[ISTEX, fulltext TEI|istex:fulltextTEI]] qui est localisé par le chemin (XPATH) :
 
Dans un document numérique appartenant à un flux de curation, l'élément TEI produit par l'INIST est contenu dans un élément [[ISTEX, fulltext TEI|istex:fulltextTEI]] qui est localisé par le chemin (XPATH) :

Version actuelle datée du 17 juin 2017 à 21:36

Cette page est un point d'entrée pour les observations concernant l'adaptation TEI réalisée par l'INIST pour l'unification des documents issus d'ISTEX.

Accès à l'adaptation TEI d'ISTEX

Pour chaque document ISTEX, une version TEI, plus ou moins élaborée, est disponible.

Plus précisément elle est téléchargeable à partir d'une url du type :

  • https://api.istex.fr/document/identifiant ISTEX/fulltext/tei

Exemple :

Pour localiser précisément cette url, l'API ISTEX permet de télécharger des métadonnées dans le format JavaScript Object Notation (JSON). Ce document permet d'accéder à l'URL TEI via l'arborescence :

{
  "total": ...,
  ...
  "hits": [
    {
      "corpusName": "elsevier",
      "author": [
        ...
      ],

      ...
      "id": "1C874AD82F323AFBF3C6AA004C2AD7DA8C21F942",
      "fulltext": [
       ...
        {
          "original": false,
          "mimetype": "application/tei+xml",
          "extension": "tei",
          "uri": "https://api.istex.fr/document/1C874AD82F323AFBF3C6AA004C2AD7DA8C21F942/fulltext/tei"
        }
      ],
      "metadata": [
          ...
      ],
    }
  ]
}

Contenu de l'adaptation

Partie TeiHeader

La description bibliographique d'un document ISTEX est essentiellement contenue dans un élément sourceDesc (lui-même étant inclus dans l'élément fileDesc du teiHeader).

Plus précisément, l'élément sourceDesc est principalement composé d'un élément biblStruct, lui-même découpé en 3 parties : analytic, monogr et series.

L'élément analytic contient l'essentiel des métadonnées propres à l'article comme notamment les auteurs et affiliations.

Dans le réseau WICRI

Le réseau Wicri s'appuie sur ces adaptations pour réaliser une unification des formats bibliographiques manipulés dans les wikis, et plus spécifiquement dans les serveurs d'exploration.

La Bibliothèque Dilib fournit un ensemble d'outils permettant de télécharger des documents ISTEX avec différents niveaux de consolidation (voir notamment sur le wiki Wicri/Outils, la commande IstexGetCorpus).

Dans un document numérique appartenant à un flux de curation, l'élément TEI produit par l'INIST est contenu dans un élément istex:fulltextTEI qui est localisé par le chemin (XPATH) :

  • record/istex/fulltext/istex:fulltextTEI

L'élément TEI adapté par WICRI (DILIB) est accessible ici :

  • record/TEI