Wicri:IronSulferCluV1/Paramètres, corpus

De Wicri Bois
Révision datée du 21 novembre 2020 à 15:15 par imported>Jacques Ducloy (1 révision importée)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Cette page introduit les éléments pour la création des corpus de la version IronSulferCluV1 du « Serveur d'exploration cluster fer-soufre ».

Voir aussi :

Corpus PubMed Central

Création du fichier pmc_result.xml par téléchargement

Test initial
nombre de liens vers pmc dans le corpus
HfdCat $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd \
  | SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1  \
  | wc
Téléchargement
HfdCat $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd \
  | SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1  \
  | NlmPmcGetCorpusById > $EXPLOR_AREA/Import/pmc_result.xml
Vérification
nombre de documents téléchargés
cat $EXPLOR_AREA/Import/pmc_result.xml | grep "</article>" | wc

Voir aussi

Cette page est générée à partir de