Wicri:StressCovidV1

De Wicri Santé

Cette page introduit les aspects techniques de la version StressCovidV1 du « Serveur d'exploration Stress et Covid ».

Voir aussi :

Mise en œuvre

Sur la machine de développement

Initialisations

Génération des pages wikis
 IstexGenerAreaPages \
       -a StressCovidV1   \
       -m   \
       -g StressCovid   \
         -x  1 \
       -p Sante   \
       -w wicri-sante.fr  \
       -W Sante   \
       -s PubMed   \
       -s Pmc   \
       -s Ncbi   \
       -s Hal   \
       -s PascalFrancis   \
       -z France   \
       -z 2020   \
       -q "sars AND virus"   \
       -t "Serveur d'exploration Stress et Covid"
Définition $EXPLOR_AREA
EXPLOR_AREA=$WICRI_ROOT/Sante/explor/StressCovid.storage/StressCovidV1
export EXPLOR_AREA
export LC_ALL='C'
Création des répertoires
mkdir $WICRI_ROOT/Sante/explor/StressCovid.storage
mkdir $EXPLOR_AREA
mkdir $EXPLOR_AREA/Import

Sur la machine LorExplor

newgrp wicri
source /applis/lorexplor/Dilib/init.sh
Définition $EXPLOR_AREA
EXPLOR_AREA=$WICRI_ROOT/Sante/explor/StressCovid.storage/StressCovidV1
export EXPLOR_AREA
export LC_ALL='C'
Création des répertoires
mkdir $WICRI_ROOT/Sante/explor/StressCovid.storage
cd $WICRI_ROOT/Sante/explor/StressCovid.storage
mkdir StressCovidV1.corpus
mkdir StressCovidV1.corpus/Import
mkdir StressCovidV1.20200503
ln -s StressCovidV1.20200503 StressCovidV1
ln -s StressCovidV1.20200503 StressCovidV1.new

Construction du Repository ISTEX

cd StressCovidV1.corpus

En cas de reprise au niveau du téléchargement

rm -rf Import/IstexRepository.h*
IstexGetCorpus -q "(stress AND covid) OR (stress AND ((sars AND virus) OR (mres AND virus) OR H2N2)) OR (phobia AND virus)" -s 4000    -l          \
     | IstexGetCorpusById -A  \
     | SxmlUnIndent                           \
     | HfdBuild -bh   Import/IstexRepository

Vérification

HfdCat  Import/IstexRepository.hfd | wc

Préparation au transfert

tar -cvf Import.tar Import
gzip Import.tar

Retour vers la machine de développement

Transfert par scp

scp $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/StressCovid.storage/StressCovidV1.corpus/Import.tar.gz .
gunzip Import.tar.gz
tar -xvf Import.tar

Construction des métadonnées ISTEX

ISTEX, création du HFD Corpus Biblio
En cas de reprise:
rm -rf $EXPLOR_AREA/Import/IstexMetadata.h*
Construction corpus biblio
HfdCat $EXPLOR_AREA/Import/IstexRepository.hfd   \
  | SgmlFast -c1                                 \
  | IstexToTei                                   \
  | IstexCleanFullText                           \
  | TeiPutRefToIdno -t wicri:Area/Istex/Corpus  -c ISTEX -s Corpus -S Istex \
  | HfdBuild -h $EXPLOR_AREA/Import/IstexMetadata

Téléchargement des autres corpus

PubMed

Site : http://www.ncbi.nlm.nih.gov/pubmed

Requête :

  (stress OR phobia) AND (covid OR sars OR h2n2 OR influenza) 

Ranger le résultat dans $EXPLOR_AREA/Import/pubmed_result.xml

PubMed Central

Site : http://www.ncbi.nlm.nih.gov/pmc

Requête :

  (stress OR phobia) AND covid 

Ranger le résultat dans $EXPLOR_AREA/Import/pmc_result.xml

PascalFrancis

Site :http://stan2.demo.inist.fr/fr/

Requête :

 ( phobie ou  ( stress et psych* ) ) et virus

Télécharger avec les onglets : Serveur / SGML / SGML / LF

  • résultat dans $EXPLOR_AREA/Import
 mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistServer.txt 

Télécharger avec les onglets : SGML / SGML / SGML / LF

  • résultat dans $EXPLOR_AREA/Import
 mv $EXPLOR_AREA/Import/corpus.txt $EXPLOR_AREA/Import/inistStandard.txt 
Hal
 ( (stress AND psych*) OR phobie ) AND (virus OR sras OR epidem* OR covid)

Sur : https://hal.archives-ouvertes.fr/

Génération des FTP

cd $EXPLOR_AREA
rm Site.tar.gz 
tar -cvf Site.tar Site 
gzip Site.tar 
rm Data.tar.gz 
tar -cvf Data.tar Data 
gzip Data.tar 

rm ImportMetadata.tar.gz
tar -cvf ImportMetadata.tar Import/istexMetadata.hcs Import/istexMetadata.hfd
gzip ImportMetadata.tar

Transfert vers la machine LorExplor

scp $ISTEX_PAR Site.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/StressCovid.storage/StressCovidV1.new
scp $ISTEX_PAR  Data.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/StressCovid.storage/StressCovidV1.new
scp $ISTEX_PAR  ImportMetadata.tar.gz $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/StressCovid.storage/StressCovidV1.new

Sur la machine cible

Aller sur le répertoire corpus correspondant au wiki cible

Installation
cd $EXPLOR_AREA
gunzip Site.tar.gz 
tar -xvf Site.tar 
gzip Site.tar 

gunzip Data.tar.gz 
tar -xvf Data.tar 
gzip Data.tar
gunzip ImportMetadata.tar.gz 
tar -xvf ImportMetadata.tar 
gzip ImportMetadata.tar 

cd Data/Istex/Corpus 
rm biblio.hcs 
rm biblio.hfd 
ln -s ../../../Import/istexMetadata.hcs biblio.hcs 
ln -s ../../../Import/istexMetadata.hfd biblio.hfd