Génération d'un serveur d'exploration simple avec ISTEX : Différence entre versions

De Wicri Manuel
imported>Jacques Ducloy
(Estimer la taille d'un corpus)
imported>Jacques Ducloy
(Estimer la taille d'un corpus)
Ligne 24 : Ligne 24 :
 
   ]
 
   ]
 
   }
 
   }
La ligne total donne le nombre de documents contenu dans le corpus.
+
La ligne total donne le nombre de documents contenus dans le corpus.

Version du 1 mars 2015 à 01:12

Un serveur d'exploration est un outil d'exploration de corpus qui s'applique naturellement à ISTEX.

Savoir lancer une commande sous Unix

La technologie utilisée dans les serveurs d'exploration repose sur Unix. Ceci devrait devenir transparent pour une première approche. Dans la situation actuelle, il est nécessaire de savoir se connecter dans une fenêtre “ terminal Unix » où l'on peut lancer des commandes (par copier coller) en modifiant des paramètres.

La seule difficulté dans les premières expérimentations est relative à l'initialisation de la session. Sur un site correctement configuré, il suffit de faire dans la fenêtre shell :

~/Dilib/init.sh

Pour vérifier, il faut faire :

echo $DILIB_VERSION

On provoque alors l'impression de

V0.6.36

Estimer la taille d'un corpus

Pour des utilisations simples, la taille optimale d'un corpus tourne autour de 1000 notices de métadonnées - ce qui permet d'obtenir un résultat en quelques minutes.

La commande IstexGetCorpus, avec l'option « -s 1 » (size 1) permet de connaître instantanément la taille d'un corpus. Exemple :

IstexGetCorpus -s 1 -q rabelais

provoque l'impression de :

575 bytes retrieved
 {
 "total": 1266,
 "hits": [
   {
      ...
   }
  ]
 }

La ligne total donne le nombre de documents contenus dans le corpus.