Serveur d'exploration sur la grippe en Belgique/Faits épidémiques : Différence entre versions
De Wicri Santé
imported>Jacques Ducloy (→Exploitation de texte intégral issu de PubMed Central) |
imported>Jacques Ducloy (→Exploitation de texte intégral issu de PubMed Central) |
||
(7 révisions intermédiaires par le même utilisateur non affichées) | |||
Ligne 36 : | Ligne 36 : | ||
<source lang="sh"> | <source lang="sh"> | ||
HfdCat Data/Main/Exploration/biblio.hfd \ | HfdCat Data/Main/Exploration/biblio.hfd \ | ||
− | | SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1 | + | | SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1 \ |
+ | | NlmPmcGetCorpusById > Import/pmc_result.xml | ||
+ | |||
+ | HfdCat Data/Main/Exploration/biblio.hfd | SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1 -p @1 | sort > Input/pmcToRefPubMed.dict | ||
+ | |||
+ | cat Import/pmc_result.xml \ | ||
+ | | NlmPmc2Sxml \ | ||
+ | | Utf8FromHexEntity \ | ||
+ | | SxmlUnIndent \ | ||
+ | | HcsSxmlRecordPutKey \ | ||
+ | | NlmPmc2CorpusTei \ | ||
+ | | TeiPutRefToIdno -t wicri:Area/Main/CorpusPmc -c PMC -S Main -s CorpusPmc \ | ||
+ | | HfdBuild -bh Data/Main/Corpus/repositoryPmc | ||
+ | |||
+ | HfdCat Data/Main/Exploration/biblio.hfd \ | ||
+ | | SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1 -p @1 | ||
+ | |||
+ | HfdCat Data/Main/Corpus/repositoryPmc.hfd | SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1 -p @1 | sort > Input/pmcToRefPmc.dict | ||
+ | |||
</source> | </source> |
Version actuelle datée du 1 août 2020 à 16:51
Dans une phase d'initiation
Travaux pratiques d'exploration d'index avec Dilib
Imprimer, par ordre alphabétique, la liste des pays ayant publié sur la Belgique...
cd GrippeBelgiqueV2
HfdCat Data/Main/Exploration/AffPays.i.hfd \
| SgmlSelect -g idx/kw/1 -g idx/f/1 -p @g1 -p @g2 \
| sort
Le résultat attendu :
Allemagne 3 Australie 3 Autriche 2 Belgique 98 Canada 2 Croatie 2 France 5 Japon 1 Nouvelle-Zélande 1 Pays-Bas 5 Portugal 1 Royaume-Uni 4 Suisse 1 Suède 2 Viêt Nam 1 États-Unis 2
Exploitation de texte intégral issu de PubMed Central
Cette partie a été réalisée après le stage
HfdCat Data/Main/Exploration/biblio.hfd \
| SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1 \
| NlmPmcGetCorpusById > Import/pmc_result.xml
HfdCat Data/Main/Exploration/biblio.hfd | SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1 -p @1 | sort > Input/pmcToRefPubMed.dict
cat Import/pmc_result.xml \
| NlmPmc2Sxml \
| Utf8FromHexEntity \
| SxmlUnIndent \
| HcsSxmlRecordPutKey \
| NlmPmc2CorpusTei \
| TeiPutRefToIdno -t wicri:Area/Main/CorpusPmc -c PMC -S Main -s CorpusPmc \
| HfdBuild -bh Data/Main/Corpus/repositoryPmc
HfdCat Data/Main/Exploration/biblio.hfd \
| SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1 -p @1
HfdCat Data/Main/Corpus/repositoryPmc.hfd | SxmlSelect -g record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=pmc/1 -p@g1 -p @1 | sort > Input/pmcToRefPmc.dict