Wicri:EdenteV2

De Wicri Santé
Révision datée du 28 mars 2021 à 12:03 par Jacques Ducloy (discussion | contributions) (Récupération des modèles)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Cette page introduit les aspects techniques de la version EdenteV2 du « Serveur d'exploration sur le patient édenté ».

Voir aussi :

Mise en œuvre

Sur la machine de développement

Initialisations

Génération des pages wikis
IstexGenerAreaPages \
       -a EdenteV2   \
       -m   \
        -x 3         \
       -g Edente  \
       -p Sante   \
       -w wicri-sante.fr  \
       -W Wicri/Santé   \
       -s PascalFrancis   \
       -s Hal  \
       -s PubMed   \
       -s Pmc   \
       -s Ncbi   \
       -z France \
       -q "edent*"   \
       -d "2"   \
       -D "2000"   \
       -t "Serveur d'exploration sur le patient édenté"
Définition $EXPLOR_AREA
EXPLOR_AREA=$WICRI_ROOT/Sante/explor/Edente.storage/EdenteV2
export EXPLOR_AREA
export LC_ALL='C'
Création des répertoires
mkdir $WICRI_ROOT/Sante/explor/Edente.storage
mkdir $EXPLOR_AREA
mkdir $EXPLOR_AREA/Import

Sur la machine LorExplor

newgrp wicri
source /applis/lorexplor/Dilib/init.sh
Définition $EXPLOR_AREA
EXPLOR_AREA=$WICRI_ROOT/Sante/explor/Edente.storage/EdenteV2
export EXPLOR_AREA
export LC_ALL='C'
Création des répertoires
mkdir $WICRI_ROOT/Sante/explor/Edente.storage
mkdir $EXPLOR_AREA
mkdir $EXPLOR_AREA/Import
mkdir $WICRI_ROOT/Sante/explor/Edente.storage/EdenteV2.corpus

Téléchargement ISTEX

Sous $WICRI_ROOT/Sante/explor/Edente.storage/EdenteV1.corpus

(
IstexGetCorpus -q "(edente* OR edentu* OR toothless) AND publicationDate:[2010 TO 2016]" -l -s 4900
IstexGetCorpus -q "(edente* OR edentu* OR toothless) AND france" -l -s 4900
IstexGetCorpus -q "(edente* OR edentu* OR toothless) AND psycholog*" -l -s 4900
IstexGetCorpus -q "(edente* OR edentu* OR toothless) AND patient" -l -s 4900
) | sort -u > IstexRepository.list
time head -2000 IstexRepository.list  \
     | IstexGetCorpusById -A                  \
     | SxmlUnIndent                            \
     | HfdBuild -bh IstexPart00000
HfdCat IstexPart00000.hfd | SxmlIndent | grep "</istex>" | wc
time head -4000 IstexRepository.list |tail -2000  \
     | IstexGetCorpusById -A                  \
     | SxmlUnIndent                            \
     | HfdBuild -bh IstexPart02000
HfdCat IstexPart02000.hfd | SxmlIndent | grep "</istex>" | wc


time head -6000 IstexRepository.list |tail -2000  \
     | IstexGetCorpusById -A                  \
     | SxmlUnIndent                            \
     | HfdBuild -bh IstexPart04000
HfdCat IstexPart04000.hfd | SxmlIndent | grep "</istex>" | wc


time head -8000 IstexRepository.list |tail -2000  \
     | IstexGetCorpusById -A                  \
     | SxmlUnIndent                            \
     | HfdBuild -bh IstexPart06000
HfdCat IstexPart06000.hfd | SxmlIndent | grep "</istex>" | wc


time head -10000 IstexRepository.list |tail -2000  \
     | IstexGetCorpusById -A                  \
     | SxmlUnIndent                            \
     | HfdBuild -bh IstexPart08000
HfdCat IstexPart08000.hfd | SxmlIndent | grep "</istex>" | wc
time head -12000 IstexRepository.list |tail -2000  \
     | IstexGetCorpusById -A                  \
     | SxmlUnIndent                            \
     | HfdBuild -bh IstexPart10000
HfdCat IstexPart10000.hfd | SxmlIndent | grep "</istex>" | wc
time tail -662 IstexRepository.list   \
     | IstexGetCorpusById -A                  \
     | SxmlUnIndent                            \
     | HfdBuild -bh IstexPart12000
HfdCat IstexPart12000.hfd | SxmlIndent | grep "</istex>" | wc

Constitution du Repository

(
  HfdCat IstexPart00000.hfd 
  HfdCat IstexPart02000.hfd 
  HfdCat IstexPart04000.hfd 
  HfdCat IstexPart06000.hfd 
  HfdCat IstexPart08000.hfd 
  HfdCat IstexPart10000.hfd 
  HfdCat IstexPart12000.hfd 
) | SgmlFast -c1 | HfdBuild -bh  IstexRepository
HfdCat IstexRepository.hfd | SxmlIndent | grep "</istex>" | wc
cat IstexRepository.hcs
cd $EXPLOR_AREA/Import
ln -s ../../EdenteV2.corpus/IstexRepository.* .

Sur la machine de développement

Téléchargement des autres corpus

PubMed

Site : http://www.ncbi.nlm.nih.gov/pubmed

Requête :

mouth, edentulous

Ranger le résultat dans $EXPLOR_AREA/Import/pubmed_result.xml

PubMed Central

Site : http://www.ncbi.nlm.nih.gov/pmc

Requête :

edentulous AND patient 
Pascal/Francis Hal

Voir V1

Envoi sur LorExplor
scp Import/pmc_result.xml $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/Edente.storage/EdenteV2.corpus
scp Import/pubmed_result.xml $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/Edente.storage/EdenteV2.corpus

Sur la machine LorExplor

Construction des métadonnées ISTEX

ISTEX, création du HFD Corpus Biblio
En cas de reprise:
rm -rf $EXPLOR_AREA/Import/IstexMetadata.h*
Construction corpus biblio
HfdCat $EXPLOR_AREA/Import/IstexRepository.hfd   \
  | SgmlFast -c1                                 \
  | IstexToTei                                   \
  | IstexCleanFullText                           \
  | TeiPutRefToIdno -t wicri:Area/Istex/Corpus  -c ISTEX -s Corpus -S Istex \
  | HfdBuild -h $EXPLOR_AREA/Import/IstexMetadata

Sur la machine de développement

Récupération des modèles

scp $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/Edente.storage/EdenteV2/exportSize.xml .
scp $ISTEX_PAR $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/Edente.storage/EdenteV2/exportMaps.xml .
scp $ISTEX_SCP:$WICRI_TARGET_ROOT/Sante/explor/Edente.storage/EdenteV2/exportInclude.xml .