Dilib, module Istex, commande IstexGetCorpusById
De Wicri Outils
Module Istex |
Cette page décrit la commande IstexGetCorpusById
qui permet de télécharger des corpus Istex à partir d'une liste d'identifiants ISTEX pour alimenter un flot de traitement.
Elle sera disponible à partir de la version V0.6.06
Voir aussi la commande IstexGetCorpus qui utilise une requête (query) pour sélectionner les documents du corpus.
Liste des modules Dilib
Module Istex
|
Synopsis
IstexGetCorpusById -cI [ -j outputSpec ] [ -J outputSpec ] [-T traceLevel] [-k identifiant] ...
Paramètres
Prise en compte des identifiants
Les options -k
et -I
(input) offrent 3 modes de fonctionnement.
- en leur absence, en fonctionnement implicite, les identifiants sont acquis dans le flot d'entrée standard (stdin) avec identifiant par ligne ;
- l'option «
-k identifiant
» permet de sélectionner un document par son identifiant dans la ligne de commande. Elle inhibe la fonction d'entrée sur stdin. - l'option «
-I
», utilisée avec l'option «-k
», permet une acquisition par stdin en complément des options.
Types et formats des résultats
- -j (pour json)
- Cette option, renvoie les métadonnées d'un document au format Json (JavaScript Object Notation) avec la spécification donnée en paramètre (pour faciliter l'écriture des scripts en shell, la valeur 3 désigne l'option *).
- -J (pour json sxml)
- Cette option renvoie les données json correspondant au format donné en paramètre et converties en Sxml (voir la page relative à JSON).
- -a (pour all)
- Cette option entraine la constitution d'un document intégrant toutes les métadonnées d'un document ISTEX (Voir aussi -M et -t). Les documents importés contiennent notamment les métadonnées XML. Ils doivent donc être nettoyés pour être mis en ligne sur un site public.
- -A (pour all with fulltext)
- Cette option, en cours de développement, entraine la constitution d'un document intégrant toutes les métadonnées d'un document ISTEX et la version fulltext TEI.
- -M (pour Mods étendu)
- Cette entraine la constitution d'un document intégrant les métadonnées de base (json) et celles en format MODS (Voir aussi -a)
- -o type
- Cette option, précise le type de métadonnées à télécharger (mods)
- -O type
- Cette option, à partir de la version V0.6.04, précise le type de fulltext à télécharger (tei)
Divers
- -c
- Cette option (disponible à partir de la version V0.6.19, pour le format MODS) retire les données en accès restreint.
- -T traceLevel
- Cette option précise le niveau de trace.
- -u type
- Cette option demande l'affichage de l'url du type de métadonnée donné en paramètre.
- -U type
- Cette option demande l'affichage de l'url des documents fulltext dont le type est donné en paramètre.
Exemples d'emploi
IstexGetCorpusById -A -k CEF1922B35E636913D568AD5142C1BAAE733EA67 \
| IstexToSxml \
| IstexModsToTei \
| IstexAffiliationSetPays
cat maListeDidentifieurs \
| IstexGetCorpusById -A \
| IstexToSxml \
| HfdBuild -bh monRepertoire
IstexGetCorpusById -o mods -c -k 9B1BDDEE8E565F9AB07EA963B49EA26ADBD4680E \
| SxmlIndent
| more