Dilib, module Istex, commande IstexGetCorpusById

De Wicri Outils
LogoDilib.gif
Panneau travaux.png
Bibliothèque Dilib (ressources numériques)
Module Istex

Cette page décrit la commande IstexGetCorpusById qui permet de télécharger des corpus Istex à partir d'une liste d'identifiants ISTEX pour alimenter un flot de traitement.

Elle sera disponible à partir de la version V0.6.06

Voir aussi la commande IstexGetCorpus qui utilise une requête (query) pour sélectionner les documents du corpus.

 

Synopsis

IstexGetCorpusById -cI [ -j outputSpec ] [ -J outputSpec ] [-T traceLevel] [-k identifiant] ...

Paramètres

logo travaux évolution des paramètres à partir de la version V0.6.27 -i ..-> -k

Prise en compte des identifiants

Les options -k et -I (input) offrent 3 modes de fonctionnement.

  • en leur absence, en fonctionnement implicite, les identifiants sont acquis dans le flot d'entrée standard (stdin) avec identifiant par ligne ;
  • l'option «  -k identifiant » permet de sélectionner un document par son identifiant dans la ligne de commande. Elle inhibe la fonction d'entrée sur stdin.
  • l'option «  -I », utilisée avec l'option «  -k », permet une acquisition par stdin en complément des options.

Types et formats des résultats

-j (pour json)
Cette option, renvoie les métadonnées d'un document au format Json (JavaScript Object Notation) avec la spécification donnée en paramètre (pour faciliter l'écriture des scripts en shell, la valeur 3 désigne l'option *).
-J (pour json sxml)
Cette option renvoie les données json correspondant au format donné en paramètre et converties en Sxml (voir la page relative à JSON).
-a (pour all)
Cette option entraine la constitution d'un document intégrant toutes les métadonnées d'un document ISTEX (Voir aussi -M et -t). Les documents importés contiennent notamment les métadonnées XML. Ils doivent donc être nettoyés pour être mis en ligne sur un site public.
-A (pour all with fulltext)
Cette option, en cours de développement, entraine la constitution d'un document intégrant toutes les métadonnées d'un document ISTEX et la version fulltext TEI.
-M (pour Mods étendu)
Cette entraine la constitution d'un document intégrant les métadonnées de base (json) et celles en format MODS (Voir aussi -a)
-o type
Cette option, précise le type de métadonnées à télécharger (mods)
-O type
Cette option, à partir de la version V0.6.04, précise le type de fulltext à télécharger (tei)

Divers

-c
Cette option (disponible à partir de la version V0.6.19, pour le format MODS) retire les données en accès restreint.
-T traceLevel
Cette option précise le niveau de trace.
-u type
Cette option demande l'affichage de l'url du type de métadonnée donné en paramètre.
-U type
Cette option demande l'affichage de l'url des documents fulltext dont le type est donné en paramètre.

Exemples d'emploi

IstexGetCorpusById -A -k CEF1922B35E636913D568AD5142C1BAAE733EA67 \
  | IstexToSxml       \
  | IstexModsToTei    \
  | IstexAffiliationSetPays
 cat maListeDidentifieurs    \
 | IstexGetCorpusById -A     \
 | IstexToSxml               \
 | HfdBuild -bh monRepertoire
  IstexGetCorpusById -o mods -c  -k 9B1BDDEE8E565F9AB07EA963B49EA26ADBD4680E   \
    | SxmlIndent 
    | more