Dilib, module Istex, Explor data

De Wicri Outils
LogoDilib.gif
Panneau travaux.png
Bibliothèque Dilib (ressources numériques)
Module Istex

Cette page introduit les paramètres de génération des données d'un espace d'exploration (Dilib, module Explor) relatifs à des flux de données provenant du projet Istex.

Pour la signification des paramètres,voir Dilib, module Istex, paramètres des serveurs.

 

Définitions

Configuration Multibase, flux IstexMulti

Ce paramétrage convient pour un flux de moins de 5000 documents

type item value
langTable/en Istex:IstexMulti $DILIB/data/Istex/ExplorParam.en.tab
langTable/fr Istex:IstexMulti $DILIB/data/Istex/ExplorParam.fr.tab
list#listSteps Istex:IstexMulti Corpus ; Curation ; Checkpoint

Configuration Multibase, flux IstexMultiBig

Ce paramétrage convient pour un flux de moins de 5000 documents.

type item value
langTable/en Istex:IstexMultiBig $DILIB/data/Istex/ExplorParam.en.tab
langTable/fr Istex:IstexMultiBig $DILIB/data/Istex/ExplorParam.fr.tab
list#listSteps Istex:IstexMultiBig Corpus ; Curation ; Checkpoint

Configuration Monobase, flux IstexSolo

type item value
langTable/en Istex:IstexSolo $DILIB/data/Istex/ExplorParam.en.tab
langTable/fr Istex:IstexSolo $DILIB/data/Istex/ExplorParam.fr.tab
list#listSteps Istex:IstexSolo Corpus ; Curation ; Exploration

Éléments généraux

type item value
list#listIndexes Istex/Corpus RBID.i ; Author.i ; IstexKwd.i ; AutAff.i ; ISSN.i
list#listIndexes Istex/Curation RBID.i ; ISSN.i ; Author.i ; AffPays.i ; AffPaysInc.i ; AffOrg.i ; AffRegion.i ; AffVille.i ; KwdEn.i ; AbsEn.i
list#listIndexes Istex/Checkpoint RBID.i ; ISSN.i ; Author.i ; AffOrg.i ; AffPays.i ; AffRegion.i ; AffVille.i ; AffRegInc.i ; Teeft.i ; EntPers.i  ; EntOrg.i ; EntPlace.i ; EntGeog.i ; Wicri.i ; KwdEn.i ; Title.i ; AbsEn.i
list#listIndexes Istex/Exploration RBID.i ; ISSN.i ; Author.i ; AffOrg.i ; AffPays.i ; AffRegion.i ; AffVille.i  ; AffRegInc.i ; Teeft.i ; EntPers.i  ; EntOrg.i ; EntPlace.i ; EntGeog.i ; Wicri.i ; KwdEn.i ; Title.i  ; AbsEn.i
list#listFiles Istex/Exploration AbsEnRules.dict
list#listAssoc Istex/Exploration KwdEn.a ; Author.a ; TitleEn.a
list#listCluster Istex/Exploration Author.cf ; Author.cc ; KwdEn.cf ; KwdEn.cc ; TitleEn.cf ; TitleEn.cc
list#listCross Istex/Exploration Pays2author ; Region2author ; Author2KwdEn ; Region2aff
hasType */*/IstexKwd.i Istex:IstexKwd
list#indexType Istex:IstexKwd shell ; SxmlSelect -s record/istex/metadata/mods/relatedItem/subject/topic/1 -p @s1 -p @1
hasType Istex/Corpus/AutAff.i Istex:AutAff
list#indexType Istex:AutAff builtin

Commandes de Génération

type item value
generDataShells Istex:IstexMulti IstexExplorDataShells
generDataShells Istex:IstexMultiBig IstexExplorDataShells
generDataShells Istex:IstexSolo IstexExplorDataShells
generSiteShell Istex:IstexMulti IstexExplorSiteShell
generSiteShell Istex:IstexMultiBig IstexExplorSiteShell
generSiteShell Istex:IstexSolo IstexExplorSiteShell
generSiteHtmlPhp Istex:IstexMulti IstexExplorSiteHtmlPhp
generSiteHtmlPhp Istex:IstexMultiBig IstexExplorSiteHtmlPhp
generSiteHtmlPhp Istex:IstexSolo IstexExplorSiteHtmlPhp

Mise en œuvre et paramétrage

Corpus

La procédure ISTEX actuelle fournit un fichier compressé à partir qui est éclaté sur un répertoire.

Le module Corpus prend ce répertoire en entrée qui est déclaré par : Istex:IstexImportDir

Jeux de test

Voir : ticri-h2ptm.fr:Wicri:HypertextIstexSampleV1

Operations

WicriGetPage -l wicri-outils.fr -p "Dilib, module Istex, Explor data"  \
   > $DILIB_IMPORT/Istex/Data/IstexExplorParam.data.wiki