Mise en place d'un flux de curation et d'exploration ISTEX

De Wicri Manuel

Cette page introduit la mise en place d'une plateforme de curation et l'exploration portant sur un corpus ISTEX (de métadonnées dans un premier temps).

Sa lecture suppose que les notions abordées dans Génération d'un serveur d'exploration simple avec ISTEX ont été acquises.

Paramétrage sur wiki

L'approche actuellement mise en place dans LorExplor repose sur un paramétrage sur wiki.

Pour une plateforme donnée, 5 pages sont à considérer. Par exemple, un ensemble de plateformes sur les chartes (médiévales) a été mis en place à partir du wiki Wicri/Linguistique. La première version technique a pour code CharterV1. Les 5 pages sont les suivantes :

  1. Une première page, visible par l'internaute, présente la plateforme et sa thématique : ( LogoWicriWicriFrMars2010.png ) Serveur d'exploration sur les chartes.
  2. Une page d'introduction technique ( LogoWicriWicriFrMars2010.png ) Wicri:CharterV1. Elle contient notamment la commande qui permet de créer le corpus (et donc de rendre l'expérimentation reproductible).

Paramétrage de la commande de génération des pages

Une commande, ExplorGenerAreaPages, permet d'obtenir une version initiale des pages de paramétrage.

Sur la page ( LogoWicriWicriFrMars2010.png ) Wicri:CharterV1, on trouve un exemple d'appel :

 ExplorGenerAreaPages \
      -a CharterV1   \
      -m   \
      -s Istex   \
      -w ticri-linguitique.fr  \
      -W Wicri/Linguistique   \
      -t "Serveur d'exploration sur les chartes"   

Toutes les options doivent être vérifiées :

-a
introduit le code de la plateforme (ici du flux) (c'est un nom de répertoire Unix, les caractères spéciaux ou accentués sont donc à éviter.
-w
introduit le code de lien interwiki. Ce code sera utilisé pour faciliter la génération d'un lien vers une page d'un serveur d'exploration (pour les codes voir Modèle:Explor lien/Liste des wikis)
-W
introduit le chemin d'accès au Wiki dans une hiérarchie recommandée (voir également Modèle:Explor lien/Liste des wikis)

Mise en place des pages et du serveur

Les 2 opérations sont à effectuer conjointement.

Page de présentation

Cette étape est relativement simple :

  • créer une page dont le nom correspond à l'option -t de la commande de génération
  • lancer la commande de génération (avec une redirection vers more) pour faciliter les manipulations, exemple :
ExplorGenerAreaPages ...   -t "Serveur d'exploration sur les chartes"  | more
  • faire un copier coller du début entre la fenêtre shell et la page wiki.

Installation de la page d'introduction technique

  • Créer la page d'introduction technique à partir de la page de présentation. (première ligne du paragraphe Aspects techniques
  • faire un copier coller du début de cette page (jusqu'à la rubrique récupération des corpus).
  • vérifier la commande de génération des pages
  • créer la variable d'environnement $EXPLOR_AREA par copier/coller
  • créer les répertoires racine de la plateforme et Import

Récupération du coupus

  • sur le wiki remplacer les "..." de la commande de récupération par la requête d'extraction de corpus (prendre exemple sur ( LogoWicriWicriFrMars2010.png ) Wicri:CharterV1).
  • exécuter la commande (cela prend environ 1 minute ou deux pour 500 documents).

Génération de la partie données de la plateforme

Une fois des données récupérées dans le répertoire Import, on peut sans difficultés particulières poursuivre les copier/coller jusqu'en fin de page.

De même, on peut copier/coller, sans adaptations particulières, le page « Paramètres, data - génération des données ».