Wicri:SidaGhanaV1 : Différence entre versions

De Wicri Santé
imported>Jacques Ducloy
(Construction des métadonnées ISTEX)
 
(Transfert vers la machine LorExplor)
 
Ligne 157 : Ligne 157 :
 
;Transfert par scp:
 
;Transfert par scp:
 
<source lang="sh">
 
<source lang="sh">
scp Site.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/SidaGhana.storage/SidaGhanaV1.new
+
scp $ISTEX_PAR Site.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/SidaGhana.storage/SidaGhanaV1.new
 
scp Data.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/SidaGhana.storage/SidaGhanaV1.new
 
scp Data.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/SidaGhana.storage/SidaGhanaV1.new
 
scp ImportMetadata.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/SidaGhana.storage/SidaGhanaV1.new
 
scp ImportMetadata.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/SidaGhana.storage/SidaGhanaV1.new

Version actuelle datée du 5 mars 2024 à 15:04

Cette page introduit les aspects techniques de la version SidaGhanaV1 du Serveur d'exploration « Le SIDA au Ghana (serveur d'exploration) ».

Pour ce serveur, les corpus ISTEX sont extraits sur le site LorExplor, mais les serveurs sont générés sur une machine locale (Mac).

Voir aussi :

Génération des pages wikis

IstexGetCorpusSize -q "IstexGetCorpusSize -q "aids AND hiv AND ghana"
 IstexGenerAreaPages \
       -a SidaGhanaV1   \
       -m   \
       -g SidaGhana   \
       -p Wicri/Sante   \
       -w wicri-sante.fr  \
       -W Wicri/Sante   \
       -s PascalFrancis   \
       -s PubMed   \
       -s Pmc   \
       -s Ncbi   \
       -q "aids AND hiv AND ghana"   \
       -d "2"   \
       -D "2000"   \
       -t "Le SIDA au Ghana (serveur d'exploration)"

Création des répertoires

Sur la machine de développement

Définition $EXPLOR_AREA
EXPLOR_AREA=$WICRI_ROOT/Wicri/Sante/explor/SidaGhana.storage/SidaGhanaV1
export EXPLOR_AREA
export LC_ALL='C'
Création des répertoires
mkdir $WICRI_ROOT/Wicri/Sante/explor/SidaGhana.storage
mkdir $EXPLOR_AREA
mkdir $EXPLOR_AREA/Import

Sur la machine LorExplor

newgrp wicri
source /applis/lorexplor/Dilib/init.sh
Définition $EXPLOR_AREA
EXPLOR_AREA=$WICRI_ROOT/Wicri/Sante/explor/SidaGhana.storage/SidaGhanaV1
export EXPLOR_AREA
export LC_ALL='C'
Création des répertoires
mkdir $WICRI_ROOT/Wicri/Sante/explor/SidaGhana.storage
mkdir $EXPLOR_AREA
mkdir $EXPLOR_AREA/Import

Construction du Repository ISTEX

En cas de reprise au niveau du téléchargement

rm -rf $EXPLOR_AREA/Import/IstexRepository.h*
time IstexGetCorpus -q "aids AND hiv AND ghana" -s 1000 -l \
    | IstexGetCorpusById -A                  \
     | SxmlUnIndent                            \
     | HfdBuild -bh    $EXPLOR_AREA/Import/IstexRepository


Vérification
SxmlSelect -g hfd/nrec/1 -p @g1 < $EXPLOR_AREA/Import/IstexRepository.hcs

HfdCat Import/IstexRepository.hfd | SxmlIndent | grep "</istex>" | wc
Création FTP
tar -cvf repository.tar Import/IstexRepository.*
gzip repository.tar

Sur la machine de développement

Récupération repository

scp $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/SidaGhana.storage/SidaGhanaV1/repository.tar.gz  .

gunzip repository.tar.gz
tar -xvf repository.tar

Construction des métadonnées ISTEX

ISTEX, création du HFD Corpus Biblio
En cas de reprise:
rm -rf $EXPLOR_AREA/Import/IstexMetadata.h*
Construction corpus biblio
HfdCat $EXPLOR_AREA/Import/IstexRepository.hfd   \
  | SgmlFast -c1                                 \
  | IstexToTei                                   \
  | IstexCleanFullText                           \
  | TeiPutRefToIdno -t wicri:Area/Istex/Corpus  -c ISTEX -s Corpus -S Istex \
  | HfdBuild -h $EXPLOR_AREA/Import/IstexMetadata

Téléchargement des autres corpus

PubMed

Site : http://www.ncbi.nlm.nih.gov/pubmed

Requête :

(aids OR hiv) AND ghana 

Ranger le résultat dans $EXPLOR_AREA/Import/pubmed_result.xml

PubMed Central

Site : http://www.ncbi.nlm.nih.gov/pmc

Requête :

aids AND hiv AND ("ghana"[MeSH Terms] OR "ghana"[abstract]) 

Ranger le résultat dans $EXPLOR_AREA/Import/pmc_result.xml

PascalFrancis

Site :http://stan2.demo.inist.fr/fr/

Requête :

Télécharger avec les onglets : Serveur / SGML / SGML / LF

  • résultat dans $EXPLOR_AREA/Import
 mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistServer.txt 

Télécharger avec les onglets : SGML / SGML / SGML / LF

  • résultat dans $EXPLOR_AREA/Import
 mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistStandard.txt

Génération des FTP

cd $EXPLOR_AREA
rm Site.tar.gz 
tar -cvf Site.tar Site 
gzip Site.tar 
rm Data.tar.gz 
tar -cvf Data.tar Data 
gzip Data.tar 

rm ImportMetadata.tar.gz
tar -cvf ImportMetadata.tar Import/IstexMetadata.hcs Import/IstexMetadata.hfd
gzip ImportMetadata.tar

Transfert vers la machine LorExplor

Transfert par scp
scp $ISTEX_PAR Site.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/SidaGhana.storage/SidaGhanaV1.new
scp Data.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/SidaGhana.storage/SidaGhanaV1.new
scp ImportMetadata.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/SidaGhana.storage/SidaGhanaV1.new

Sur la machine LorExplor

Installation
cd $EXPLOR_AREA
gunzip Site.tar.gz 
tar -xvf Site.tar 
gzip Site.tar 

gunzip Data.tar.gz 
tar -xvf Data.tar 
gzip Data.tar
gunzip ImportMetadata.tar.gz 
tar -xvf ImportMetadata.tar 
gzip ImportMetadata.tar 

cd Data/Istex/Corpus 
rm biblio.hcs 
rm biblio.hfd 
ln -s ../../../Import/IstexMetadata.hcs biblio.hcs 
ln -s ../../../Import/IstexMetadata.hfd biblio.hfd