Wicri:CovidStanfordV1/Paramètres, corpus : Différence entre versions

De Wicri Santé
m (1 révision importée)
(Aucune différence)

Version du 30 janvier 2021 à 22:33

Cette page introduit les éléments pour la création des corpus de la version CovidStanfordV1 du « Serveur d'exploration sur le Covid à Stanford ».

Voir aussi :

Corpus PubMed Central

Création du fichier pmc_result.xml par téléchargement

Test initial
nombre de liens vers pmc dans le corpus
HfdCat $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd \
  | SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1  \
  | wc
Téléchargement
HfdCat $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd \
  | SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1  \
  | NlmPmcGetCorpusById > $EXPLOR_AREA/Import/pmc_result.xml
Vérification
nombre de documents téléchargés
cat $EXPLOR_AREA/Import/pmc_result.xml | grep "</article>" | wc

Voir aussi

Cette page est générée à partir de