Dilib, module Istex, commande IstexGetCorpusById

De Wicri Outils
(Redirigé depuis IstexGetCorpusById)
LogoDilib.gif
Panneau travaux.png
Bibliothèque Dilib (ressources numériques)
Module Istex

Cette page décrit la commande IstexGetCorpusById qui permet de télécharger des corpus Istex à partir d'une liste d'identifiants ISTEX pour alimenter un flot de traitement.

Elle sera disponible à partir de la version V0.6.06

Voir aussi la commande IstexGetCorpus qui utilise une requête (query) pour sélectionner les documents du corpus.

 

Synopsis

IstexGetCorpusById -cI [ -j outputSpec ] [ -J outputSpec ] [-T traceLevel] [-k identifiant] ...

Paramètres

logo travaux évolution des paramètres à partir de la version V0.6.27 -i ..-> -k

Prise en compte des identifiants

Les options -k et -I (input) offrent 3 modes de fonctionnement.

  • en leur absence, en fonctionnement implicite, les identifiants sont acquis dans le flot d'entrée standard (stdin) avec identifiant par ligne ;
  • l'option «  -k identifiant » permet de sélectionner un document par son identifiant dans la ligne de commande. Elle inhibe la fonction d'entrée sur stdin.
  • l'option «  -I », utilisée avec l'option «  -k », permet une acquisition par stdin en complément des options.

Types et formats des résultats

-j (pour json)
Cette option, renvoie les métadonnées d'un document au format Json (JavaScript Object Notation) avec la spécification donnée en paramètre (pour faciliter l'écriture des scripts en shell, la valeur 3 désigne l'option *).
-J (pour json sxml)
Cette option renvoie les données json correspondant au format donné en paramètre et converties en Sxml (voir la page relative à JSON).
-a (pour all)
Cette option entraine la constitution d'un document intégrant toutes les métadonnées d'un document ISTEX (Voir aussi -M et -t). Les documents importés contiennent notamment les métadonnées XML. Ils doivent donc être nettoyés pour être mis en ligne sur un site public.
-A (pour all with fulltext)
Cette option, en cours de développement, entraine la constitution d'un document intégrant toutes les métadonnées d'un document ISTEX et la version fulltext TEI.
-M (pour Mods étendu)
Cette entraine la constitution d'un document intégrant les métadonnées de base (json) et celles en format MODS (Voir aussi -a)
-o type
Cette option, précise le type de métadonnées à télécharger (mods)
-O type
Cette option, à partir de la version V0.6.04, précise le type de fulltext à télécharger (tei)

Divers

-c
Cette option (disponible à partir de la version V0.6.19, pour le format MODS) retire les données en accès restreint.
-T traceLevel
Cette option précise le niveau de trace.
-u type
Cette option demande l'affichage de l'url du type de métadonnée donné en paramètre.
-U type
Cette option demande l'affichage de l'url des documents fulltext dont le type est donné en paramètre.

Exemples d'emploi

IstexGetCorpusById -A -k CEF1922B35E636913D568AD5142C1BAAE733EA67 \
  | IstexToSxml       \
  | IstexModsToTei    \
  | IstexAffiliationSetPays
 cat maListeDidentifieurs    \
 | IstexGetCorpusById -A     \
 | IstexToSxml               \
 | HfdBuild -bh monRepertoire
  IstexGetCorpusById -o mods -c  -k 9B1BDDEE8E565F9AB07EA963B49EA26ADBD4680E   \
    | SxmlIndent 
    | more