Discussion:Serveur d'exploration sur les pandémies grippales

De Wicri Santé

Cette page introduit des éléments de discussion, liés notamment à la curation, pour la version PandemieGrippaleV1 du « Serveur d'exploration sur les pandémies grippales ».

Index spécialisés pour la curation

Étape Corpus
index AutAff, combinant auteurs (patronymes) et affiliations
 
Étape Curation
index PaysInc pays inconnus
 
Étape Checkpoint
index RegInc régions inconnues

Flux Istex

  1. Webster R (52)
  2. Kawaoka Y (47)
  3. Taubenberger J (39)
  4. Li Y (37)
  5. Murray R (35)
  6. Wu J (32)
  7. Morens D (30)
  8. Chowell G (30)
  9. Li J (29)
  10. Sprung C (28)
  11. Chen Z (27)
  12. Wang J (25)
  13. Viboud C (25)
  14. Kelly H (25)
  15. Wang X (23)
 
  1. University (17)
  2. and (10)
  3. BMJ (9)
  4. Hospital (8)
  5. ??? (8)
  6. 1London (8)
  7. D.C. (7)
  8. Victoria (6)
  9. Abergavenny (6)
  10. University of Bristol (5)
  11. Medicine (5)
  12. 5EQ (5)
  13. 1Geneva (5)
  14. University. (4)
  15. University of Liverpool (4)
 
  1. Ontario (21)
  2. Jerusalem (20)
  3. Victoria (18)
  4. ON (18)
  5. Queensland (16)
  6. Bangkok (16)
  7. Shanghai (15)
  8. Atlanta (13)
  9. Geneva (12)
  10. Brisbane (12)
  11. NSW (11)
  12. London SE5 8AF (11)
  13. Singapore (10)
  14. Hong Kong Special Administrative Region (10)
  15. Cambridge (10)

Flux PubMed

  1. Taubenberger J (50)
  2. Viboud C (45)
  3. Chowell G (43)
  4. Kawaoka Y (35)
  5. Wilson N (33)
  6. Simonsen L (32)
  7. Baker M (32)
  8. Wu J (28)
  9. Wang J (27)
  10. Zhang Y (26)
  11. Miller M (26)
  12. Shanks G (25)
  13. Webster R (24)
  14. Cowling B (24)
  15. Tumpey T (23)
 
  1. Wellington (6)
  2. ON (4)
  3. National Center for Emerging and Zoonotic Infectious Diseases (4)
  4. CPIP Task Group Chair. (4)
  5. Atlanta (4)
  6. and (3)
  7. Republic of Singapore (3)
  8. Victoria (2)
  9. United States of America (USA) (2)
  10. Tel Aviv University (2)
  11. NCIRD (2)
  12. Minneapolis (2)
  13. Laboratory of Infectious Diseases (2)
  14. Inc (2)
  15. Fujioka Pediatric Clinic Osaka Japan. (2)
 
  1. Ontario (34)
  2. Atlanta (19)
  3. Hong Kong Special Administrative Region (18)
  4. NSW (15)
  5. Wellington (14)
  6. Hong Kong SAR (14)
  7. Georgia 30333 (13)
  8. Victoria (12)
  9. Maryland 20892 (12)
  10. Geneva (12)
  11. Bilthoven (12)
  12. Bangkok (12)
  13. QLD (11)
  14. ON (10)
  15. New South Wales (10)

Effets de la curation

index teeft

  1. Influenza (42)
  2. Pandemic (34)
  3. Vaccine (26)
  4. Public health (26)
  5. Other hand (24)
  6. Influenza pandemic (24)
  7. Outbreak (21)
  8. Oxford university press (19)
  9. Twentieth century (18)
  10. Infectious diseases (18)
  11. First world (17)
  12. Vaccination (16)
  13. Second world (16)
  14. June (16)
  15. Soviet union (15)
 
  1. Influenza (672)
  2. Pandemic (631)
  3. Public health (448)
  4. Vaccine (421)
  5. Influenza pandemic (415)
  6. Other hand (271)
  7. World health organization (264)
  8. Infectious diseases (263)
  9. Outbreak (251)
  10. Disease control (231)
  11. June (211)
  12. Virus (203)
  13. Viral (193)
  14. Hong kong (190)
  15. Oxford university press (189)

Utilisation de PubMeb pour des filtrages ISTEX ciblés

Les zones idno rappellent les clés d'accès aux différents serveurs.

... 
<idno type="wicri:Area/Istex/Corpus">000521</idno>
<idno type="wicri:Area/Istex/Curation">000521</idno>
<idno type="wicri:Area/Istex/Checkpoint">000065</idno>
...
<idno type="wicri:Area/PubMed/Corpus">000536</idno>
<idno type="wicri:Area/PubMed/Curation">000536</idno>
<idno type="wicri:Area/PubMed/Checkpoint">000523</idno>
...
<idno type="wicri:Area/Ncbi/Merge">001B55</idno>
<idno type="wicri:Area/Ncbi/Curation">001B55</idno>
<idno type="wicri:Area/Ncbi/Checkpoint">001B55</idno>
<idno type="wicri:Area/Main/Merge">000984</idno>
<idno type="wicri:Area/Main/Curation">000981</idno>
<idno type="wicri:Area/Main/Exploration">000981</idno>

Les clés de la bibliographie de Istex/Corpus et des documents Istex en texte intégral (Import/IstexRepository) sont alignés.

Constitution d'une liste de numéros internes (pour atteindre ISTEX repository) à partir de Main/Exploration.


HfdCat Data/Main/Exploration/biblio.hfd          \
   | grep -i pubmed |  grep  ISTEX               \
   | SxmlSelect -p @1 -s record/TEI/teiHeader/fileDesc/publicationStmt/idno -p @s1 \
   | grep Area/Istex/Corpus | SxmlSelect  -g idno/1 -p @g1            \
   | sort > istexPubMed.list

Sur le même principe, constitution d'une liste de couples numéros internes (Main/Exploration ISTEX repository).

HfdCat Data/Main/Exploration/biblio.hfd          \
   | grep -i pubmed |  grep  ISTEX               \
   | SxmlSelect -p @1 -s record/TEI/teiHeader/fileDesc/publicationStmt/idno -p @s1 \
   | grep Area/Istex/Corpus | SxmlSelect  -g idno/1 -p @1 -p @g1            \
   | sort > pubMed2Istex.tab

Programme de filtrage sur les villes allemandes.

cat istexPubMed.list                            \
  | HfdSelect  -h Import/IstexRepository  -K      \
  | grep Germany                                  \
  | SxmlFindText -a 20 -b 20  -D geoNames/DE.villes.dict  \
  | grep body | more

On obtient des lignes telles que :

000199  1/20/3/2/1/1/1  istex/fulltext/istex:fulltextTEI/text/body/div/p        3607     University Hospital    Salzburg        , Salzburg, Austria&

Ici 000199 est la clé interne sur Istex/Corpus. Il faut alors aller sur le serveur pour accéder ensuite au texte intégral en ligne ; puis retrouver le lien vers le serveur d'exploration principal.

Une fois trouvée une information apparemment intéressante, il