Wicri:PaulMeyerV1 : Différence entre versions
De Wicri Chanson de Roland
(→Retour vers la machine de développement) |
(→Construction des métadonnées ISTEX) |
||
Ligne 111 : | Ligne 111 : | ||
</source> | </source> | ||
+ | ====Téléchargement des autres corpus==== | ||
+ | ;PascalFrancis: | ||
+ | Site :http://stan2.demo.inist.fr/fr/ | ||
+ | |||
+ | Requête : | ||
+ | |||
+ | Télécharger avec les onglets : Serveur / SGML / SGML / LF | ||
+ | *résultat dans $EXPLOR_AREA/Import | ||
+ | mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistServer.txt | ||
+ | Télécharger avec les onglets : SGML / SGML / SGML / LF | ||
+ | *résultat dans $EXPLOR_AREA/Import | ||
+ | mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistStandard.txt | ||
+ | ;Hal: | ||
+ | Sur : https://hal.archives-ouvertes.fr/ |
Version du 22 novembre 2021 à 19:06
Cette page introduit les aspects techniques de la version PaulMeyerV1 du « Serveur d'exploration Paul Meyer ».
Voir aussi :
- Wicri:PaulMeyerV1/Paramètres, data - génération des données
- Wicri:PaulMeyerV1/Paramètres, fr - génération de l'interface
- Wicri:PaulMeyerV1/Paramètres, génération des cartes - génération de cartes géographiques
- Wicri:PaulMeyerV1/Paramètres, templates size - paramétrage des modèles liés aux valeurs numériques
- Wicri:PaulMeyerV1/Paramètres, template include - génération du modèle d'affichage des résultats bruts
Sommaire
Mise en œuvre
Sur la machine de développement
Initialisations
- Génération des pages wikis
source IstexGetCorpusSize -q ""Paul Meyer""
IstexGenerAreaPages \
-a PaulMeyerV1 \
-m \
-g PaulMeyer \
-x1 \
-p Europe/ChansonRoland \
-w wic-chan.rol.fr \
-W Europe/ChansonRoland \
-s PascalFrancis \
-s Hal \
-z France \
-z Allemagne \
-q '"Paul Meyer"' \
-t "Serveur d'exploration Paul Meyer"
- Définition $EXPLOR_AREA
EXPLOR_AREA=$WICRI_ROOT/Europe/ChansonRoland/explor/PaulMeyer.storage/PaulMeyerV1
export EXPLOR_AREA
export LC_ALL='C'
- Création des répertoires
mkdir $WICRI_ROOT/Europe/ChansonRoland/explor/PaulMeyer.storage
mkdir $EXPLOR_AREA
mkdir $EXPLOR_AREA/Import
Sur la machine Demo.Istex
newgrp wicri
source /applis/Dilib/init.sh
- Définition $EXPLOR_AREA
EXPLOR_AREA=$WICRI_ROOT/Europe/ChansonRoland/explor/PaulMeyer.storage/PaulMeyerV1
export EXPLOR_AREA
export LC_ALL='C'
- Création des répertoires
mkdir $WICRI_ROOT/Europe/ChansonRoland/explor/PaulMeyer.storage
cd $WICRI_ROOT/Europe/ChansonRoland/explor/PaulMeyer.storage
mkdir PaulMeyerV1.corpus
mkdir PaulMeyerV1.corpus/Import
mkdir PaulMeyerV1.20211122
ln -s PaulMeyerV1.20211122 PaulMeyerV1
ln -s PaulMeyerV1.20211122 PaulMeyerV1.new
Construction du Repository ISTEX
cd PaulMeyerV1.corpus/Import
En cas de reprise au niveau du téléchargement
rm -rf Import/IstexRepository.h*
IstexGetCorpus -q '"Paul Meyer"' -s 2000 -l \
| IstexGetCorpusById -A \
| SxmlUnIndent \
| HfdBuild -bh Import/IstexRepository
Vérification
HfdCat Import/IstexRepository.hfd | wc
Préparation au transfert
tar -cvf Import.tar Import
gzip Import.tar
Retour vers la machine de développement
Transfert par scp
scp $ISTEX_SCP:$WICRI_TARGET_ROOT/Europe/ChansonRoland/explor/PaulMeyer.storage/PaulMeyerV1.corpus/Import.tar.gz .
gunzip Import.tar.gz
tar -xvf Import.tar
Construction des métadonnées ISTEX
- ISTEX, création du HFD Corpus Biblio
- En cas de reprise:
rm -rf $EXPLOR_AREA/Import/IstexMetadata.h*
- Construction corpus biblio
HfdCat $EXPLOR_AREA/Import/IstexRepository.hfd \
| SgmlFast -c1 \
| IstexToTei \
| IstexCleanFullText \
| TeiPutRefToIdno -t wicri:Area/Istex/Corpus -c ISTEX -s Corpus -S Istex \
| HfdBuild -h $EXPLOR_AREA/Import/IstexMetadata
Téléchargement des autres corpus
- PascalFrancis
Site :http://stan2.demo.inist.fr/fr/
Requête :
Télécharger avec les onglets : Serveur / SGML / SGML / LF
- résultat dans $EXPLOR_AREA/Import
mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistServer.txt
Télécharger avec les onglets : SGML / SGML / SGML / LF
- résultat dans $EXPLOR_AREA/Import
mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistStandard.txt
- Hal