Wicri:ExplorPubmed/Modèles/Paramètres, corpus

De Wicri Outils
Révision datée du 9 août 2020 à 09:09 par imported>Jacques Ducloy
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Cette page introduit les éléments pour la création des corpus de la version %areaCode du « %areaTitle ».

Voir aussi :

Corpus PubMed Central

Création du fichier pmc_result.xml par téléchargement

Test initial
nombre de liens vers pmc dans le corpus
HfdCat $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd \
  | SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1  \
  | wc
Téléchargement
HfdCat $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd \
  | SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1  \
  | NlmPmcGetCorpusById > $EXPLOR_AREA/Import/pmc_result.xml
Vérification
nombre de documents téléchargés
cat $EXPLOR_AREA/Import/pmc_result.xml | grep "</article>" | wc

Voir aussi

Cette page est générée à partir de