Dilib, module Istex, commande IstexCleanFullText

De Wicri Outils
LogoDilib.gif
Panneau travaux.png
Bibliothèque Dilib (ressources numériques)
Module Istex

La commande IstexCleanFullText retire d'un document téléchargé de l'api ISTEX les éléments dont la visibilité est réduite pour des contraintes commerciales.

 

Introduction

Cette commande est notamment appelée dans l'étape Corpus des serveurs d'exploration contenant des flux ISTEX. IstexCleanFullText.png

Le type d'usage principalement visé par LorExplor est la rédaction de dossiers de synthèse à destination d'un public quelconque, et notamment le grand public (exemple la page sur Aussois sur Wicri/France, ou le serveur d'exploration sur l'hypertexte). Le lecteur (en bas à droite) navigue principalement dans le réseau de wikis mais il peut aussi explorer les corpus s'il veut en savoir plus. Pour respecter les contraintes juridiques d'ISTEX, seuls des éléments en libre accès peuvent donc lui être accessibles.

En haut de la figure on trouve les informations non libres de droits qui ne peuvent être manipulées que par un contributeur appartenant à l'ESR français. Celui-ci peut extraire des éléments du full-text s'il respecte les usages liées au citation (une série d'exemples figurent sur les liens donnés plus haut).

Pour assurer cette séparation, la commande IstexCleanFullText réalise un nettoyage des documents ISTEX pour y retirer les informations à accès réservé.

Synopsis

IstexCleanFullText -k < inputStream

L'option « -k » (disponible à partir de la version V0.6.04) permet d'introduire la clé HFD dans la balise istex:metadataXml par l'attribut wicri:rec).

Voir aussi

Applications test :