Wicri:WilliamByrdV1 : Différence entre versions

De Wicri Musique
(Transfert par scp)
(Retour vers la machine de développement)
Ligne 95 : Ligne 95 :
 
gunzip Import.tar.gz
 
gunzip Import.tar.gz
 
tar -xvf Import.tar  
 
tar -xvf Import.tar  
 +
</source>
 +
====Construction des métadonnées ISTEX====
 +
;ISTEX, création du HFD Corpus Biblio:En cas de reprise:
 +
<source lang="sh">
 +
rm -rf $EXPLOR_AREA/Import/IstexMetadata.h*
 +
 +
</source>
 +
;Construction corpus biblio:
 +
<source lang="sh">
 +
HfdCat $EXPLOR_AREA/Import/IstexRepository.hfd  \
 +
  | SgmlFast -c1                                \
 +
  | IstexToTei                                  \
 +
  | IstexCleanFullText                          \
 +
  | TeiPutRefToIdno -t wicri:Area/Main/Corpus  -c ISTEX -s Corpus -S Main \
 +
  | HfdBuild -h $EXPLOR_AREA/Import/IstexMetadata
 +
 
</source>
 
</source>

Version du 9 février 2021 à 08:30

Cette page introduit les aspects techniques de la version WilliamByrdV1 du « Serveur d'exploration sur William Byrd ».

Voir aussi :

Mise en œuvre

Sur la machine de développement

Initialisations

Génération des pages wikis
source IstexGetCorpusSize -q "query"
 IstexGenerAreaPages \
       -a WilliamByrdV1   \
       -m   \
       -g WilliamByrd   \
         -x1   \
       -p Musique   \
       -w wicri-musique.fr  \
       -W Wicri/Musique   \
       -z France   \
       -z UK   \
       -z USA   \
       -q "query"   \
       -t "Serveur d'exploration sur William Byrd"
Définition $EXPLOR_AREA
EXPLOR_AREA=$WICRI_ROOT/Musique/explor/WilliamByrd.storage/WilliamByrdV1
export EXPLOR_AREA
export LC_ALL='C'
Création des répertoires
mkdir $WICRI_ROOT/Musique/explor/WilliamByrd.storage
mkdir $EXPLOR_AREA
mkdir $EXPLOR_AREA/Import

Sur la machine Demo.Istex

newgrp wicri
source /applis/Dilib/init.sh
Définition $EXPLOR_AREA
EXPLOR_AREA=$WICRI_ROOT/Musique/explor/WilliamByrd.storage/WilliamByrdV1
export EXPLOR_AREA
export LC_ALL='C'
Création des répertoires
mkdir $WICRI_ROOT/Musique/explor/WilliamByrd.storage
cd $WICRI_ROOT/Musique/explor/WilliamByrd.storage
mkdir WilliamByrdV1.corpus
mkdir WilliamByrdV1.corpus/Import
mkdir WilliamByrdV1.20210208
ln -s WilliamByrdV1.20210208 WilliamByrdV1
ln -s WilliamByrdV1.20210208 WilliamByrdV1.new

Construction du Repository ISTEX

cd WilliamByrdV1.corpus/Import

En cas de reprise au niveau du téléchargement

rm -rf Import/IstexRepository.h*
IstexGetCorpus -q '"william byrd" AND musi*' -s 2000    -l          \
     | IstexGetCorpusById -A   \
     | SxmlUnIndent                           \
     | HfdBuild -bh   Import/IstexRepository

Vérification

HfdCat  Import/IstexRepository.hfd | wc

Préparation au transfert

tar -cvf Import.tar Import
gzip Import.tar

Retour vers la machine de développement

Transfert par scp

scp   $ISTEX_PAR  $ISTEX_SCP:$WICRI_TARGET_ROOT/Musique/explor/WilliamByrd.storage/WilliamByrdV1.corpus/Import.tar.gz .
gunzip Import.tar.gz
tar -xvf Import.tar

Construction des métadonnées ISTEX

ISTEX, création du HFD Corpus Biblio
En cas de reprise:
rm -rf $EXPLOR_AREA/Import/IstexMetadata.h*
Construction corpus biblio
HfdCat $EXPLOR_AREA/Import/IstexRepository.hfd   \
  | SgmlFast -c1                                 \
  | IstexToTei                                   \
  | IstexCleanFullText                           \
  | TeiPutRefToIdno -t wicri:Area/Main/Corpus  -c ISTEX -s Corpus -S Main \
  | HfdBuild -h $EXPLOR_AREA/Import/IstexMetadata