Dilib, module Istex, commande IstexCleanFullText
Module Istex |
La commande IstexCleanFullText
retire d'un document téléchargé de l'api ISTEX les éléments dont la visibilité est réduite pour des contraintes commerciales.
Sommaire |
Liste des modules Dilib
Module Istex
|
Introduction
Cette commande est notamment appelée dans l'étape Corpus des serveurs d'exploration contenant des flux ISTEX.
Le type d'usage principalement visé par LorExplor est la rédaction de dossiers de synthèse à destination d'un public quelconque, et notamment le grand public (exemple la page sur Aussois sur Wicri/France, ou le serveur d'exploration sur l'hypertexte). Le lecteur (en bas à droite) navigue principalement dans le réseau de wikis mais il peut aussi explorer les corpus s'il veut en savoir plus. Pour respecter les contraintes juridiques d'ISTEX, seuls des éléments en libre accès peuvent donc lui être accessibles.
En haut de la figure on trouve les informations non libres de droits qui ne peuvent être manipulées que par un contributeur appartenant à l'ESR français. Celui-ci peut extraire des éléments du full-text s'il respecte les usages liées au citation (une série d'exemples figurent sur les liens donnés plus haut).
Pour assurer cette séparation, la commande IstexCleanFullText réalise un nettoyage des documents ISTEX pour y retirer les informations à accès réservé.
Synopsis
IstexCleanFullText -k < inputStream
L'option « -k » (disponible à partir de la version V0.6.04) permet d'introduire la clé HFD dans la balise istex:metadataXml par l'attribut wicri:rec).
Voir aussi
Applications test :