Wicri:TelematiV1 : Différence entre versions
(→Transfert vers la machine LorExplor) |
(→Transfert vers la machine LorExplor) |
||
Ligne 312 : | Ligne 312 : | ||
;Transfert par scp: | ;Transfert par scp: | ||
<source lang="sh"> | <source lang="sh"> | ||
− | scp $ISTEX_PAR Site.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/ | + | scp $ISTEX_PAR Site.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Sic/CIDE/explor/Telemati.storage/TelematiV1.new |
scp Data.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Ticri/CIDE/explor/Telemati.storage/TelematiV1.new | scp Data.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Ticri/CIDE/explor/Telemati.storage/TelematiV1.new | ||
scp ImportMetadata.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Ticri/CIDE/explor/Telemati.storage/TelematiV1.new | scp ImportMetadata.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Ticri/CIDE/explor/Telemati.storage/TelematiV1.new |
Version actuelle datée du 10 mars 2024 à 17:46
Cette page introduit les aspects techniques de la version TelematiV1 du « Serveur d'exploration sur la télématique ».
Voir aussi :
- Wicri:TelematiV1/Paramètres, data - génération des données
- Wicri:TelematiV1/Paramètres, fr - génération de l'interface
- Wicri:TelematiV1/Paramètres, génération des cartes - génération de cartes géographiques
- Wicri:TelematiV1/Paramètres, templates size - paramétrage des modèles liés aux valeurs numériques
Sommaire
Mise en œuvre
Sur la machine de développement
Initialisations
- Génération des pages wikis
source IstexGetCorpusSize -q "telemati*"
IstexGenerAreaPages \
-a TelematiV1 \
-m \
-g Telemati \
-p Ticri/CIDE \
-w ticri-cide.fr \
-W Ticri/CIDE \
-s PascalFrancis \
-s Hal \
-s PubMed \
-s Pmc \
-s Ncbi \
-z France \
-z UK \
-z USA \
-z Allemagne \
-z Télématique \
-q "telemati*" \
-d "4" \
-D "2500" \
-t "Serveur d'exploration sur la télématique"
- Définition $EXPLOR_AREA
EXPLOR_AREA=$WICRI_ROOT/Wicri/Ticri/CIDE/explor/Telemati.storage/TelematiV1
export EXPLOR_AREA
export LC_ALL='C'
- Création des répertoires
mkdir $WICRI_ROOT/Ticri/CIDE/corpus/Telemati.storage
mkdir $EXPLOR_AREA
mkdir $EXPLOR_AREA/Import
Récupération des corpus ISTEX
- En cas de reprise complète au niveau du téléchargement
rm -rf $EXPLOR_AREA/Import/IstexDownload.*.h*
time IstexGetCorpus -q "telemati*" -s 2500 -A -i $ISTEX_ID -p $ISTEX_PASS \
| IstexToSxml \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexDownload.000000
- Vérification
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.000000.hcs
time IstexGetCorpus -q "telemati*" -f 2500 -s 2500 -A -i $ISTEX_ID -p $ISTEX_PASS\
| IstexToSxml \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexDownload.002500
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.002500.hcs
time IstexGetCorpus -q "telemati*" -f 5000 -s 2500 -A -i $ISTEX_ID -p $ISTEX_PASS \
| IstexToSxml \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexDownload.005000
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.005000.hcs
time IstexGetCorpus -q "telemati*" -f 7500 -s 2500 -A \
| IstexToSxml \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexDownload.007500
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.007500.hcs
Reprise suite à incident
time IstexGetCorpus -q "telemati*" -f 2500 -s 500 -A -i $ISTEX_ID -p $ISTEX_PASS \
| IstexToSxml \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexDownload.002500
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.002500.hcs
time IstexGetCorpus -q "telemati*" -f 3000 -s 500 -A -i $ISTEX_ID -p $ISTEX_PASS \
| IstexToSxml \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexDownload.003000
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.003000.hcs
time IstexGetCorpus -q "telemati*" -f 3500 -s 500 -A -i $ISTEX_ID -p $ISTEX_PASS \
| IstexToSxml \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexDownload.003500
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.003500.hcs
time IstexGetCorpus -q "telemati*" -f 4000 -s 500 -A -i $ISTEX_ID -p $ISTEX_PASS \
| IstexToSxml \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexDownload.004000
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.004000.hcs
time IstexGetCorpus -q "telemati*" -f 4500 -s 500 -A -i $ISTEX_ID -p $ISTEX_PASS \
| IstexToSxml \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexDownload.004500
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.004500.hcs
time IstexGetCorpus -q "telemati*" -f 5000 -s 1000 -A -i $ISTEX_ID -p $ISTEX_PASS \
| IstexToSxml \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexDownload.005000
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.005000.hcs
time IstexGetCorpus -q "telemati*" -f 6000 -s 1000 -A -i $ISTEX_ID -p $ISTEX_PASS \
| IstexToSxml \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexDownload.006000
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.006000.hcs
time IstexGetCorpus -q "telemati*" -f 7000 -s 1000 -A -i $ISTEX_ID -p $ISTEX_PASS \
| IstexToSxml \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexDownload.007000
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.007000.hcs
time IstexGetCorpus -q "telemati*" -f 8000 -s 1000 -A -i $ISTEX_ID -p $ISTEX_PASS \
| IstexToSxml \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexDownload.008000
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.008000.hcs
time IstexGetCorpus -q "telemati*" -f 9000 -s 1000 -A -i $ISTEX_ID -p $ISTEX_PASS \
| IstexToSxml \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexDownload.009000
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.009000.hcs
Construction du Repository ISTEX
En cas de reprise au niveau du téléchargement
rm -rf $EXPLOR_AREA/Import/IstexRepository.h*
(
HfdCat $EXPLOR_AREA/Import/IstexDownload.000000.hfd
HfdCat $EXPLOR_AREA/Import/IstexDownload.002500.hfd
HfdCat $EXPLOR_AREA/Import/IstexDownload.005000.hfd
HfdCat $EXPLOR_AREA/Import/IstexDownload.007500.hfd
) | SgmlFast -c 1 \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexRepository
Vérification
HfdCat $EXPLOR_AREA/Import/IstexRepository.hfd | wc
- Reprise suite à incident
(
HfdCat $EXPLOR_AREA/Import/IstexDownload.000000.hfd
HfdCat $EXPLOR_AREA/Import/IstexDownload.002500.hfd
HfdCat $EXPLOR_AREA/Import/IstexDownload.003000.hfd
HfdCat $EXPLOR_AREA/Import/IstexDownload.003500.hfd
HfdCat $EXPLOR_AREA/Import/IstexDownload.004000.hfd
HfdCat $EXPLOR_AREA/Import/IstexDownload.004500.hfd
HfdCat $EXPLOR_AREA/Import/IstexDownload.005000.hfd
HfdCat $EXPLOR_AREA/Import/IstexDownload.006000.hfd
HfdCat $EXPLOR_AREA/Import/IstexDownload.007000.hfd
HfdCat $EXPLOR_AREA/Import/IstexDownload.008000.hfd
HfdCat $EXPLOR_AREA/Import/IstexDownload.009000.hfd
) | SgmlFast -c 1 \
| HfdBuild -bh $EXPLOR_AREA/Import/IstexRepository
Construction des métadonnées ISTEX
- ISTEX, création du HFD Corpus Biblio
- En cas de reprise:
rm -rf $EXPLOR_AREA/Import/IstexMetadata.h*
- Construction corpus biblio
HfdCat $EXPLOR_AREA/Import/IstexRepository.hfd \
| IstexCleanFullText \
| SgmlFast -c1 \
| IstexToTei \
| TeiPutRefToIdno -t wicri:Area/Istex/Corpus -c ISTEX -s Corpus -S Istex \
| HfdBuild -h $EXPLOR_AREA/Import/IstexMetadata
Téléchargement des autres corpus
- PubMed
Site : http://www.ncbi.nlm.nih.gov/pubmed
Requête :
Ranger le résultat dans $EXPLOR_AREA/Import/pubmed_result.xml
- PubMed Central
Site : http://www.ncbi.nlm.nih.gov/pmc
Requête :
Ranger le résultat dans $EXPLOR_AREA/Import/pmc_result.xml
- PascalFrancis
Site :http://stan2.demo.inist.fr/fr/
Requête :
Télécharger avec les onglets : Serveur / SGML / SGML / LF
- résultat dans $EXPLOR_AREA/Import
mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistServer.txt
Télécharger avec les onglets : SGML / SGML / SGML / LF
- résultat dans $EXPLOR_AREA/Import
mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistStandard.txt
- Hal
Sur : https://hal.archives-ouvertes.fr/
Génération de la plateforme
- Importation des paramètres de génération
WicriGetPage -l ticri-cide.fr -p "Wicri:TelematiV1/Paramètres, data"\
> $EXPLOR_AREA/Import/WicriAreaParam.data.wiki
Si reprise
sh $EXPLOR_AREA/bin/AreaReset.sh
ExplorAreaDataCreate -d $EXPLOR_AREA
make -f $EXPLOR_AREA/bin/area.mk
- Importation des paramètres de navigation
WicriGetPage -l ticri-cide.fr -p "Wicri:TelematiV1/Paramètres, fr"\
> $EXPLOR_AREA/Import/WicriAreaSiteParam.fr.wiki
- Génération de l'interface
sh $EXPLOR_AREA/bin/AreaCreateSite.fr.sh
Extraction télématique
(
HfdCat Import/IstexRepository.hfd | grep "[Tt]elematique" | SxmlSelect -g istex/id/1 -p "ISTEX:@g1"
HfdCat Import/IstexRepository.hfd | grep Nora | grep Minc | SxmlSelect -g istex/id/1 -p "ISTEX:@g1"
HfdCat Data/Pmc/Corpus/biblio.hfd | grep "[Tt]..l..matique" \
| SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=RBID/1 -p @g1
HfdCat Data/Main/Exploration/biblio.hfd | grep Nora | grep Minc \
| SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=RBID/1 -p @g1
HfdCat Data/Main/Exploration/biblio.hfd | grep [Tt]..l..matique \
| SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=RBID/1 -p @g1
) | sort -u > Import/TelematiqueListRBID.txt
cat Import/TelematiqueListRBID.txt \
| HfdIndexSelect -ISh Data/Main/Exploration/RBID.i \
| sort -u > Import/TelematiqueListHfdKey.txt
Génération des FTP
cd $EXPLOR_AREA
rm Site.tar.gz
tar -cvf Site.tar Site
gzip Site.tar
rm Data.tar.gz
tar -cvf Data.tar Data
gzip Data.tar
rm ImportMetadata.tar.gz
tar -cvf ImportMetadata.tar Import/istexMetadata.hcs Import/istexMetadata.hfd
gzip ImportMetadata.tar
Transfert vers la machine LorExplor
- Transfert par scp
scp $ISTEX_PAR Site.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Sic/CIDE/explor/Telemati.storage/TelematiV1.new
scp Data.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Ticri/CIDE/explor/Telemati.storage/TelematiV1.new
scp ImportMetadata.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Ticri/CIDE/explor/Telemati.storage/TelematiV1.new
Sur la machine cible
Aller sur le répertoire corpus correspondant au wiki cible
. ... Dilib/init.sh
newgrp ticri
EXPLOR_AREA=$WICRI_ROOT/Ticri/CIDE/corpus/Telemati.storage/TelematiV1.20160614
Si nouveau code générique :
mkdir $WICRI_ROOT/Ticri/CIDE/corpus/Telemati.storage
Création du répertoire plateforme
mkdir $EXPLOR_AREA
- Transfert par FileZilla
Transférer les fichiers Site.tar.gz, Data.tar.gz de TelematiV1 (émetteur) vers TelematiV1 (cible).
- Installation
cd $EXPLOR_AREA
gunzip Site.tar.gz
tar -xvf Site.tar
gzip Site.tar
gunzip Data.tar.gz
tar -xvf Data.tar
gzip Data.tar
gunzip ImportMetadata.tar.gz
tar -xvf ImportMetadata.tar
gzip ImportMetadata.tar
cd Data/Istex/Corpus
rm biblio.hcs
rm biblio.hfd
ln -s ../../../Import/istexMetadata.hcs biblio.hcs
ln -s ../../../Import/istexMetadata.hfd biblio.hfd