Discussion:Serveur d'exploration sur les pandémies grippales
Cette page introduit des éléments de discussion, liés notamment à la curation, pour la version PandemieGrippaleV1 du « Serveur d'exploration sur les pandémies grippales ».
Sommaire
Index spécialisés pour la curation
|
|
|
Flux Istex
Flux PubMed
Effets de la curation
index teeft
Utilisation de PubMeb pour des filtrages ISTEX ciblés
Les zones idno rappellent les clés d'accès aux différents serveurs.
...
<idno type="wicri:Area/Istex/Corpus">000521</idno>
<idno type="wicri:Area/Istex/Curation">000521</idno>
<idno type="wicri:Area/Istex/Checkpoint">000065</idno>
...
<idno type="wicri:Area/PubMed/Corpus">000536</idno>
<idno type="wicri:Area/PubMed/Curation">000536</idno>
<idno type="wicri:Area/PubMed/Checkpoint">000523</idno>
...
<idno type="wicri:Area/Ncbi/Merge">001B55</idno>
<idno type="wicri:Area/Ncbi/Curation">001B55</idno>
<idno type="wicri:Area/Ncbi/Checkpoint">001B55</idno>
<idno type="wicri:Area/Main/Merge">000984</idno>
<idno type="wicri:Area/Main/Curation">000981</idno>
<idno type="wicri:Area/Main/Exploration">000981</idno>
Les clés de la bibliographie de Istex/Corpus et des documents Istex en texte intégral (Import/IstexRepository) sont alignés.
Constitution d'une liste de numéros internes (pour atteindre ISTEX repository) à partir de Main/Exploration.
HfdCat Data/Main/Exploration/biblio.hfd \
| grep -i pubmed | grep ISTEX \
| SxmlSelect -p @1 -s record/TEI/teiHeader/fileDesc/publicationStmt/idno -p @s1 \
| grep Area/Istex/Corpus | SxmlSelect -g idno/1 -p @g1 \
| sort > istexPubMed.list
Sur le même principe, constitution d'une liste de couples numéros internes (Main/Exploration ISTEX repository).
HfdCat Data/Main/Exploration/biblio.hfd \
| grep -i pubmed | grep ISTEX \
| SxmlSelect -p @1 -s record/TEI/teiHeader/fileDesc/publicationStmt/idno -p @s1 \
| grep Area/Istex/Corpus | SxmlSelect -g idno/1 -p @1 -p @g1 \
| sort > pubMed2Istex.tab
Programme de filtrage sur les villes allemandes.
cat istexPubMed.list \
| HfdSelect -h Import/IstexRepository -K \
| grep Germany \
| SxmlFindText -a 20 -b 20 -D geoNames/DE.villes.dict \
| grep body | more
On obtient des lignes telles que :
000199 1/20/3/2/1/1/1 istex/fulltext/istex:fulltextTEI/text/body/div/p 3607 University Hospital Salzburg , Salzburg, Austria&
Ici 000199 est la clé interne sur Istex/Corpus. Il faut alors aller sur le serveur pour accéder ensuite au texte intégral en ligne ; puis retrouver le lien vers le serveur d'exploration principal.
Une fois trouvée une information apparemment intéressante, il