Wicri:ChansonRolandV6 : Différence entre versions
De Wicri Chanson de Roland
(→Sur la machine de développement) |
(→Sur la machine cible) |
||
(15 révisions intermédiaires par le même utilisateur non affichées) | |||
Ligne 18 : | Ligne 18 : | ||
-m \ | -m \ | ||
-g ChansonRoland \ | -g ChansonRoland \ | ||
+ | -x 1 \ | ||
+ | -p Europe/ChansonRoland \ | ||
+ | -W Europe/ChansonRoland \ | ||
-s PascalFrancis \ | -s PascalFrancis \ | ||
+ | -s Hal \ | ||
-w wicri-france.fr \ | -w wicri-france.fr \ | ||
-W Wicri/France \ | -W Wicri/France \ | ||
-z France \ | -z France \ | ||
-z Allemagne \ | -z Allemagne \ | ||
+ | -q "((chanson OR song) AND roland)" \ | ||
-t "Serveur d'exploration sur la Chanson de Roland" | -t "Serveur d'exploration sur la Chanson de Roland" | ||
Ligne 39 : | Ligne 44 : | ||
</source> | </source> | ||
− | ==== | + | ====Construction du Repository ISTEX==== |
− | + | <source> | |
+ | cd ChansonRolandV6.corpus/Import | ||
+ | </source> | ||
+ | |||
+ | ''En cas de reprise au niveau du téléchargement'' | ||
<source lang="sh"> | <source lang="sh"> | ||
− | rm -rf | + | rm -rf Import/IstexRepository.h* |
</source> | </source> | ||
<source lang="sh"> | <source lang="sh"> | ||
− | IstexGetCorpus -q "((chanson OR song) AND roland)" -s | + | IstexGetCorpus -q "((chanson OR song) AND roland)" -s 4500 -l \ |
− | | | + | | IstexGetCorpusById -A \ |
− | | HfdBuild -bh | + | | SxmlUnIndent \ |
+ | | HfdBuild -bh Import/IstexRepository | ||
</source> | </source> | ||
− | + | Vérification | |
<source lang="sh"> | <source lang="sh"> | ||
− | + | HfdCat Import/IstexRepository.hfd | wc | |
</source> | </source> | ||
+ | ====Préparation au transfert==== | ||
+ | <source lang="sh"> | ||
+ | tar -cvf Import.tar Import | ||
+ | gzip Import.tar | ||
+ | </source> | ||
+ | ===Retour vers la machine de développement=== | ||
+ | ====Transfert par scp==== | ||
+ | <source lang="sh"> | ||
+ | scp $ISTEX_PAR $ISTEX_SCP:$WICRI_TARGET_ROOT/Europe/ChansonRoland/explor/ChansonRoland.storage/ChansonRolandV6.corpus/Import.tar.gz . | ||
+ | gunzip Import.tar.gz | ||
+ | tar -xvf Import.tar | ||
+ | </source> | ||
+ | |||
====Construction des métadonnées ISTEX==== | ====Construction des métadonnées ISTEX==== | ||
;ISTEX, création du HFD Corpus Biblio:En cas de reprise: | ;ISTEX, création du HFD Corpus Biblio:En cas de reprise: | ||
Ligne 65 : | Ligne 88 : | ||
<source lang="sh"> | <source lang="sh"> | ||
HfdCat $EXPLOR_AREA/Import/IstexRepository.hfd \ | HfdCat $EXPLOR_AREA/Import/IstexRepository.hfd \ | ||
− | |||
| SgmlFast -c1 \ | | SgmlFast -c1 \ | ||
| IstexToTei \ | | IstexToTei \ | ||
+ | | IstexCleanFullText \ | ||
| TeiPutRefToIdno -t wicri:Area/Istex/Corpus -c ISTEX -s Corpus -S Istex \ | | TeiPutRefToIdno -t wicri:Area/Istex/Corpus -c ISTEX -s Corpus -S Istex \ | ||
| HfdBuild -h $EXPLOR_AREA/Import/IstexMetadata | | HfdBuild -h $EXPLOR_AREA/Import/IstexMetadata | ||
</source> | </source> | ||
+ | |||
+ | ====Téléchargement des autres corpus==== | ||
+ | ;PascalFrancis: | ||
+ | Site :http://stan2.demo.inist.fr/fr/ | ||
+ | |||
+ | Requête : | ||
+ | |||
+ | Télécharger avec les onglets : Serveur / SGML / SGML / LF | ||
+ | *résultat dans $EXPLOR_AREA/Import | ||
+ | mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistServer.txt | ||
+ | Télécharger avec les onglets : SGML / SGML / SGML / LF | ||
+ | *résultat dans $EXPLOR_AREA/Import | ||
+ | mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistStandard.txt | ||
+ | ;Hal: | ||
+ | Sur : https://hal.archives-ouvertes.fr/ | ||
====Génération de la plateforme==== | ====Génération de la plateforme==== | ||
Ligne 114 : | Ligne 152 : | ||
;Transfert par scp: | ;Transfert par scp: | ||
<source lang="sh"> | <source lang="sh"> | ||
− | scp Site.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Europe/ | + | scp $ISTEX_PAR Site.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Europe/ChansonRoland/explor/ChansonRoland.storage/ChansonRolandV6.new |
− | scp Data.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Europe/ | + | scp $ISTEX_PAR Data.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Europe/ChansonRoland/explor/ChansonRoland.storage/ChansonRolandV6.new |
− | scp | + | scp $ISTEX_PAR ImportMetadata.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Europe/ChansonRoland/explor/ChansonRoland.storage/ChansonRolandV6.new |
</source> | </source> | ||
Ligne 136 : | Ligne 174 : | ||
;Transfert par FileZilla: | ;Transfert par FileZilla: | ||
Transférer les fichiers Site.tar.gz, Data.tar.gz de ChansonRolandV6 (émetteur) vers ChansonRolandV6 (cible). | Transférer les fichiers Site.tar.gz, Data.tar.gz de ChansonRolandV6 (émetteur) vers ChansonRolandV6 (cible). | ||
+ | |||
+ | |||
;Installation: | ;Installation: | ||
<source lang="sh"> | <source lang="sh"> | ||
Ligne 153 : | Ligne 193 : | ||
gzip ImportMetadata.tar | gzip ImportMetadata.tar | ||
− | cd Data/ | + | cd Data/Istex/Corpus |
rm biblio.hcs | rm biblio.hcs | ||
rm biblio.hfd | rm biblio.hfd | ||
− | ln -s ../../../Import/ | + | ln -s ../../../Import/istexMetadata.hcs biblio.hcs |
− | ln -s ../../../Import/ | + | ln -s ../../../Import/istexMetadata.hfd biblio.hfd |
</source> | </source> |
Version actuelle datée du 21 juin 2021 à 11:18
Cette page introduit les aspects techniques de la version ChansonRolandV6 du « Serveur d'exploration sur la Chanson de Roland ».
Voir aussi :
- Wicri:ChansonRolandV6/Paramètres, data - génération des données
- Wicri:ChansonRolandV6/Paramètres, fr - génération de l'interface
- Wicri:ChansonRolandV6/Paramètres, génération des cartes - génération de cartes géographiques
- Wicri:ChansonRolandV6/Paramètres, templates size - paramétrage des modèles liés aux valeurs numériques
- Wicri:ChansonRolandV6/Paramètres, template include - génération du modèle d'affichage des résultats bruts
Sommaire
Mise en œuvre
Sur la machine de développement
Initialisations
- Génération des pages wikis
source IstexGetCorpusSize -q "query"
IstexGenerAreaPages \
-a ChansonRolandV6 \
-m \
-g ChansonRoland \
-x 1 \
-p Europe/ChansonRoland \
-W Europe/ChansonRoland \
-s PascalFrancis \
-s Hal \
-w wicri-france.fr \
-W Wicri/France \
-z France \
-z Allemagne \
-q "((chanson OR song) AND roland)" \
-t "Serveur d'exploration sur la Chanson de Roland"
- Définition $EXPLOR_AREA
EXPLOR_AREA=$WICRI_ROOT/Europe/ChansonRoland/explor/ChansonRoland.storage/ChansonRolandV6
export EXPLOR_AREA
export LC_ALL='C'
- Création des répertoires
mkdir $WICRI_ROOT/Europe/ChansonRoland/explor/ChansonRoland.storage
mkdir $EXPLOR_AREA
mkdir $EXPLOR_AREA/Import
Construction du Repository ISTEX
cd ChansonRolandV6.corpus/Import
En cas de reprise au niveau du téléchargement
rm -rf Import/IstexRepository.h*
IstexGetCorpus -q "((chanson OR song) AND roland)" -s 4500 -l \
| IstexGetCorpusById -A \
| SxmlUnIndent \
| HfdBuild -bh Import/IstexRepository
Vérification
HfdCat Import/IstexRepository.hfd | wc
Préparation au transfert
tar -cvf Import.tar Import
gzip Import.tar
Retour vers la machine de développement
Transfert par scp
scp $ISTEX_PAR $ISTEX_SCP:$WICRI_TARGET_ROOT/Europe/ChansonRoland/explor/ChansonRoland.storage/ChansonRolandV6.corpus/Import.tar.gz .
gunzip Import.tar.gz
tar -xvf Import.tar
Construction des métadonnées ISTEX
- ISTEX, création du HFD Corpus Biblio
- En cas de reprise:
rm -rf $EXPLOR_AREA/Import/IstexMetadata.h*
- Construction corpus biblio
HfdCat $EXPLOR_AREA/Import/IstexRepository.hfd \
| SgmlFast -c1 \
| IstexToTei \
| IstexCleanFullText \
| TeiPutRefToIdno -t wicri:Area/Istex/Corpus -c ISTEX -s Corpus -S Istex \
| HfdBuild -h $EXPLOR_AREA/Import/IstexMetadata
Téléchargement des autres corpus
- PascalFrancis
Site :http://stan2.demo.inist.fr/fr/
Requête :
Télécharger avec les onglets : Serveur / SGML / SGML / LF
- résultat dans $EXPLOR_AREA/Import
mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistServer.txt
Télécharger avec les onglets : SGML / SGML / SGML / LF
- résultat dans $EXPLOR_AREA/Import
mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistStandard.txt
- Hal
Sur : https://hal.archives-ouvertes.fr/
Génération de la plateforme
- Importation des paramètres de génération
WicriGetPage -l wicri-france.fr -p "Wicri:ChansonRolandV6/Paramètres, data"\
> $EXPLOR_AREA/Import/WicriAreaParam.data.wiki
Si reprise
sh $EXPLOR_AREA/bin/AreaReset.sh
ExplorAreaDataCreate -d $EXPLOR_AREA
make -f $EXPLOR_AREA/bin/area.mk
- Importation des paramètres de navigation
WicriGetPage -l wicri-france.fr -p "Wicri:ChansonRolandV6/Paramètres, fr"\
> $EXPLOR_AREA/Import/WicriAreaSiteParam.fr.wiki
- Génération de l'interface
sh $EXPLOR_AREA/bin/AreaCreateSite.fr.sh
Génération des FTP
cd $EXPLOR_AREA
rm Site.tar.gz
tar -cvf Site.tar Site
gzip Site.tar
rm Data.tar.gz
tar -cvf Data.tar Data
gzip Data.tar
rm ImportMetadata.tar.gz
tar -cvf ImportMetadata.tar Import/istexMetadata.hcs Import/istexMetadata.hfd
gzip ImportMetadata.tar
Transfert vers la machine LorExplor
- Transfert par scp
scp $ISTEX_PAR Site.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Europe/ChansonRoland/explor/ChansonRoland.storage/ChansonRolandV6.new
scp $ISTEX_PAR Data.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Europe/ChansonRoland/explor/ChansonRoland.storage/ChansonRolandV6.new
scp $ISTEX_PAR ImportMetadata.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Europe/ChansonRoland/explor/ChansonRoland.storage/ChansonRolandV6.new
Sur la machine cible
Aller sur le répertoire corpus correspondant au wiki cible
. ... Dilib/init.sh
newgrp ticri
EXPLOR_AREA=$WICRI_ROOT/Wicri/France/corpus/ChansonRoland.storage/ChansonRolandV6.20151025
Si nouveau code générique :
mkdir $WICRI_ROOT/Wicri/France/corpus/ChansonRoland.storage
Création du répertoire plateforme
mkdir $EXPLOR_AREA
- Transfert par FileZilla
Transférer les fichiers Site.tar.gz, Data.tar.gz de ChansonRolandV6 (émetteur) vers ChansonRolandV6 (cible).
- Installation
cd $EXPLOR_AREA
gunzip Site.tar.gz
tar -xvf Site.tar
gzip Site.tar
gunzip Data.tar.gz
tar -xvf Data.tar
gzip Data.tar
gunzip ImportMetadata.tar.gz
tar -xvf ImportMetadata.tar
gzip ImportMetadata.tar
cd Data/Istex/Corpus
rm biblio.hcs
rm biblio.hfd
ln -s ../../../Import/istexMetadata.hcs biblio.hcs
ln -s ../../../Import/istexMetadata.hfd biblio.hfd