Serveur d'exploration sur la grippe en Belgique/Faits épidémiques
De Wicri Santé
Révision datée du 1 août 2020 à 16:51 par imported>Jacques Ducloy (→Exploitation de texte intégral issu de PubMed Central)
Dans une phase d'initiation
Travaux pratiques d'exploration d'index avec Dilib
Imprimer, par ordre alphabétique, la liste des pays ayant publié sur la Belgique...
cd GrippeBelgiqueV2
HfdCat Data/Main/Exploration/AffPays.i.hfd \
| SgmlSelect -g idx/kw/1 -g idx/f/1 -p @g1 -p @g2 \
| sort
Le résultat attendu :
Allemagne 3 Australie 3 Autriche 2 Belgique 98 Canada 2 Croatie 2 France 5 Japon 1 Nouvelle-Zélande 1 Pays-Bas 5 Portugal 1 Royaume-Uni 4 Suisse 1 Suède 2 Viêt Nam 1 États-Unis 2
Exploitation de texte intégral issu de PubMed Central
Cette partie a été réalisée après le stage
HfdCat Data/Main/Exploration/biblio.hfd \
| SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1 \
| NlmPmcGetCorpusById > Import/pmc_result.xml
HfdCat Data/Main/Exploration/biblio.hfd | SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1 -p @1 | sort > Input/pmcToRefPubMed.dict
cat Import/pmc_result.xml \
| NlmPmc2Sxml \
| Utf8FromHexEntity \
| SxmlUnIndent \
| HcsSxmlRecordPutKey \
| NlmPmc2CorpusTei \
| TeiPutRefToIdno -t wicri:Area/Main/CorpusPmc -c PMC -S Main -s CorpusPmc \
| HfdBuild -bh Data/Main/Corpus/repositoryPmc
HfdCat Data/Main/Exploration/biblio.hfd \
| SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1 -p @1
HfdCat Data/Main/Corpus/repositoryPmc.hfd | SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1 -p @1 | sort > Input/pmcToRefPmc.dict