Wicri:InforLorV3
Cette page introduit les aspects techniques de la version InforLorV3 du « Serveur d'exploration sur la recherche en informatique en Lorraine/Version InforLorV3 ».
Voir aussi :
- Wicri:InforLorV3/Paramètres, data - génération des données
- Wicri:InforLorV3/Paramètres, fr - génération de l'interface
- Wicri:InforLorV3/Paramètres, génération des cartes - génération de cartes géographiques
- Wicri:InforLorV3/Paramètres, templates size - paramétrage des modèles liés aux valeurs numériques
Sommaire
Mise en œuvre
Sur la machine de développement
Initialisations
- Génération des pages wikis
source IstexGetCorpusSize -q "(vandoeuvre OR nancy OR lorraine) AND (loria OR crin OR informatique OR iucal OR tlf OR artlf OR iuca)"
 IstexGenerAreaPages \
       -a InforLorV3   \
       -m   \
       -g InforLor   \
       -p Wicri/Lorraine   \
       -w wicri-lor.fr  \
       -W Wicri/Lorraine   \
       -s PascalFrancis   \
       -s Hal   \
       -s Crin   \
       -s PubMed   \
       -s Pmc   \
       -s Ncbi   \
       -z UK   \
       -z USA   \
       -z Allemagne   \
       -q "(vandoeuvre OR nancy OR lorraine) AND (loria OR crin OR informatique OR iucal OR tlf OR artlf OR iuca)"   \
       -d "2"   \
       -D "2000"   \
       -t "Serveur d'exploration sur l'informatique en Lorraine"
- Définition $EXPLOR_AREA
EXPLOR_AREA=$WICRI_ROOT/Europe/France/Lorraine/explor/InforLor.storage/InforLorV3
export EXPLOR_AREA
export LC_ALL='C'
- Création des répertoires
mkdir $WICRI_ROOT/Wicri/Lorraine/corpus/InforLor.storage
mkdir $EXPLOR_AREA
mkdir $EXPLOR_AREA/Import
Récupération des corpus ISTEX
- En cas de reprise complète au niveau du téléchargement
rm -rf $EXPLOR_AREA/Import/IstexDownload.*.h*
time IstexGetCorpus -q "(vandoeuvre OR nancy OR lorraine) AND (loria OR crin OR informatique OR iucal OR tlf OR artlf OR iuca)" -s 2000 -A \
     | IstexToSxml     \
     | HfdBuild -bh    $EXPLOR_AREA/Import/IstexDownload.000000
- Vérification
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.000000.hcs
time IstexGetCorpus -q "(vandoeuvre OR nancy OR lorraine) AND (loria OR crin OR informatique OR iucal OR tlf OR artlf OR iuca)" -f 2000 -s 2000 -A \
     | IstexToSxml     \
     | HfdBuild -bh    $EXPLOR_AREA/Import/IstexDownload.002000
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexDownload.002000.hcs
Construction du Repository ISTEX
En cas de reprise au niveau du téléchargement
rm -rf $EXPLOR_AREA/Import/IstexRepository.h*
(
  HfdCat $EXPLOR_AREA/Import/IstexDownload.000000.hfd
  HfdCat $EXPLOR_AREA/Import/IstexDownload.002000.hfd
 )    | HfdBuild -bh    $EXPLOR_AREA/Import/IstexRepository
Vérification
HfdCat  $EXPLOR_AREA/Import/IstexRepository.hfd | wc
Construction des métadonnées ISTEX
- ISTEX, création du HFD Corpus Biblio
- En cas de reprise:
rm -rf $EXPLOR_AREA/Import/IstexMetadata.h*
- Construction corpus biblio
HfdCat $EXPLOR_AREA/Import/IstexRepository.hfd   \
 | SgmlFast -c1                                 \
  | IstexToTei                                   \
  | IstexCleanFullText                           \
  | TeiPutRefToIdno -t wicri:Area/Istex/Corpus  -c ISTEX -s Corpus -S Istex \
  | HfdBuild -h $EXPLOR_AREA/Import/IstexMetadata
Téléchargement des autres corpus
- PubMed
Site : http://www.ncbi.nlm.nih.gov/pubmed
Requête :
(crin[Affiliation]) OR loria[Affiliation]
Ranger le résultat dans $EXPLOR_AREA/Import/pubmed_result.xml
- PubMed Central
Site : http://www.ncbi.nlm.nih.gov/pmc Requête :
(crin[Affiliation]) OR loria[Affiliation]
Ranger le résultat dans $EXPLOR_AREA/Import/pmc_result.xml
- PascalFrancis
Site :http://stan2.demo.inist.fr/fr/
Requête :
Télécharger avec les onglets : Serveur / SGML / SGML / LF
- résultat dans $EXPLOR_AREA/Import
mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistServer.txt
Télécharger avec les onglets : SGML / SGML / SGML / LF
- résultat dans $EXPLOR_AREA/Import
mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistStandard.txt
- Hal
Sur : https://hal.archives-ouvertes.fr/
- Crin/BibTeX
Génération de la plateforme
- Importation des paramètres de génération
WicriGetPage -l wicri-lor.fr -p "Wicri:InforLorV3/Paramètres, data"\
      > $EXPLOR_AREA/Import/WicriAreaParam.data.wiki
Si reprise
sh $EXPLOR_AREA/bin/AreaReset.sh
ExplorAreaDataCreate -d $EXPLOR_AREA
make -f $EXPLOR_AREA/bin/area.mk
- Importation des paramètres de navigation
WicriGetPage -l wicri-lor.fr -p "Wicri:InforLorV3/Paramètres, fr"\
      > $EXPLOR_AREA/Import/WicriAreaSiteParam.fr.wiki
- Génération de l'interface
sh $EXPLOR_AREA/bin/AreaCreateSite.fr.sh
Génération des FTP
cd $EXPLOR_AREA
rm Site.tar.gz 
tar -cvf Site.tar Site 
gzip Site.tar 
rm Data.tar.gz 
tar -cvf Data.tar Data 
gzip Data.tar 
rm ImportMetadata.tar.gz
tar -cvf ImportMetadata.tar Import/istexMetadata.hcs Import/istexMetadata.hfd
gzip ImportMetadata.tar
Transfert vers la machine LorExplor
- Transfert par scp
scp Site.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Europe/France/Lorraine/explor/InforLor.storage/InforLorV3.new
scp Data.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Europe/France/Lorraine/explor/InforLor.storage/InforLorV3.new
scp ImportMetadata.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Europe/France/Lorraine/explor/InforLor.storage/InforLorV3.new
Sur la machine cible
Aller sur le répertoire corpus correspondant au wiki cible
. ... Dilib/init.sh  
newgrp ticri
EXPLOR_AREA=$WICRI_ROOT/Wicri/Lorraine/corpus/InforLor.storage/InforLorV3.20160519
Si nouveau code générique :
mkdir $WICRI_ROOT/Wicri/Lorraine/corpus/InforLor.storage
Création du répertoire plateforme
mkdir $EXPLOR_AREA
- Transfert par FileZilla
Transférer les fichiers Site.tar.gz, Data.tar.gz de InforLorV3 (émetteur) vers InforLorV3 (cible).
- Installation
cd $EXPLOR_AREA
gunzip Site.tar.gz 
tar -xvf Site.tar 
gzip Site.tar 
gunzip Data.tar.gz 
tar -xvf Data.tar 
gzip Data.tar
gunzip ImportMetadata.tar.gz 
tar -xvf ImportMetadata.tar 
gzip ImportMetadata.tar 
cd Data/Istex/Corpus 
rm biblio.hcs 
rm biblio.hfd 
ln -s ../../../Import/istexMetadata.hcs biblio.hcs 
ln -s ../../../Import/istexMetadata.hfd biblio.hfd


