Discussion:Serveur d'exploration sur les pandémies grippales : Différence entre versions

De Wicri Santé
imported>Jacques Ducloy
(Utilisation de PubMeb pour des filtrages ISTEX ciblés)
imported>Jacques Ducloy
(Utilisation de PubMeb pour des filtrages ISTEX ciblés)
Ligne 59 : Ligne 59 :
  
 
<source lang="sh">
 
<source lang="sh">
cat istexPubMed.tab                            \
+
cat istexPubMed.list                            \
 
   | HfdSelect  -h Import/IstexRepository  -K      \
 
   | HfdSelect  -h Import/IstexRepository  -K      \
 
   | grep Germany                                  \
 
   | grep Germany                                  \

Version du 1 juillet 2020 à 09:12

Cette page introduit des éléments de discussion, liés notamment à la curation, pour la version PandemieGrippaleV1 du « Serveur d'exploration sur les pandémies grippales ».

Index spécialisés pour la curation

Étape Corpus
index AutAff, combinant auteurs (patronymes) et affiliations
 
Étape Curation
index PaysInc pays inconnus
 
Étape Checkpoint
index RegInc régions inconnues

Flux Istex

  1. Webster R (52)
  2. Kawaoka Y (47)
  3. Taubenberger J (39)
  4. Li Y (37)
  5. Murray R (35)
  6. Wu J (32)
  7. Morens D (30)
  8. Chowell G (30)
  9. Li J (29)
  10. Sprung C (28)
  11. Chen Z (27)
  12. Wang J (25)
  13. Viboud C (25)
  14. Kelly H (25)
  15. Wang X (23)
 
  1. University (17)
  2. and (10)
  3. BMJ (9)
  4. Hospital (8)
  5. ??? (8)
  6. 1London (8)
  7. D.C. (7)
  8. Victoria (6)
  9. Abergavenny (6)
  10. University of Bristol (5)
  11. Medicine (5)
  12. 5EQ (5)
  13. 1Geneva (5)
  14. University. (4)
  15. University of Liverpool (4)
 
  1. Ontario (21)
  2. Jerusalem (20)
  3. Victoria (18)
  4. ON (18)
  5. Queensland (16)
  6. Bangkok (16)
  7. Shanghai (15)
  8. Atlanta (13)
  9. Geneva (12)
  10. Brisbane (12)
  11. NSW (11)
  12. London SE5 8AF (11)
  13. Singapore (10)
  14. Hong Kong Special Administrative Region (10)
  15. Cambridge (10)

Flux PubMed

  1. Taubenberger J (50)
  2. Viboud C (45)
  3. Chowell G (43)
  4. Kawaoka Y (35)
  5. Wilson N (33)
  6. Simonsen L (32)
  7. Baker M (32)
  8. Wu J (28)
  9. Wang J (27)
  10. Zhang Y (26)
  11. Miller M (26)
  12. Shanks G (25)
  13. Webster R (24)
  14. Cowling B (24)
  15. Tumpey T (23)
 
  1. Wellington (6)
  2. ON (4)
  3. National Center for Emerging and Zoonotic Infectious Diseases (4)
  4. CPIP Task Group Chair. (4)
  5. Atlanta (4)
  6. and (3)
  7. Republic of Singapore (3)
  8. Victoria (2)
  9. United States of America (USA) (2)
  10. Tel Aviv University (2)
  11. NCIRD (2)
  12. Minneapolis (2)
  13. Laboratory of Infectious Diseases (2)
  14. Inc (2)
  15. Fujioka Pediatric Clinic Osaka Japan. (2)
 
  1. Ontario (34)
  2. Atlanta (19)
  3. Hong Kong Special Administrative Region (18)
  4. NSW (15)
  5. Wellington (14)
  6. Hong Kong SAR (14)
  7. Georgia 30333 (13)
  8. Victoria (12)
  9. Maryland 20892 (12)
  10. Geneva (12)
  11. Bilthoven (12)
  12. Bangkok (12)
  13. QLD (11)
  14. ON (10)
  15. New South Wales (10)

Effets de la curation

index teeft

  1. Influenza (42)
  2. Pandemic (34)
  3. Vaccine (26)
  4. Public health (26)
  5. Other hand (24)
  6. Influenza pandemic (24)
  7. Outbreak (21)
  8. Oxford university press (19)
  9. Twentieth century (18)
  10. Infectious diseases (18)
  11. First world (17)
  12. Vaccination (16)
  13. Second world (16)
  14. June (16)
  15. Soviet union (15)
 
  1. Influenza (672)
  2. Pandemic (631)
  3. Public health (448)
  4. Vaccine (421)
  5. Influenza pandemic (415)
  6. Other hand (271)
  7. World health organization (264)
  8. Infectious diseases (263)
  9. Outbreak (251)
  10. Disease control (231)
  11. June (211)
  12. Virus (203)
  13. Viral (193)
  14. Hong kong (190)
  15. Oxford university press (189)

Utilisation de PubMeb pour des filtrages ISTEX ciblés

Les zones idno rappellent les clés d'accès aux différents serveurs.


Constitution d'une liste de numéros internes (pour atteindre ISTEX repository).

HfdCat Data/Main/Exploration/biblio.hfd          \
   | grep -i pubmed |  grep  ISTEX               \
   | SxmlSelect -p @1 -s record/TEI/teiHeader/fileDesc/publicationStmt/idno -p @s1 \
   | grep Area/Istex/Corpus | SxmlSelect  -g idno/1 -p @g1            \
   | sort > istexPubMed.list


HfdCat Data/Main/Exploration/biblio.hfd          \
   | grep -i pubmed |  grep  ISTEX               \
   | SxmlSelect -p @1 -s record/TEI/teiHeader/fileDesc/publicationStmt/idno -p @s1 \
   | grep Area/Istex/Corpus | SxmlSelect  -g idno/1 -p @1 -p @g1            \
   | sort > istexPubMed.tab
cat istexPubMed.list                            \
  | HfdSelect  -h Import/IstexRepository  -K      \
  | grep Germany                                  \
  | SxmlFindText -a 20 -b 20  -D geoNames/DE.villes.dict  \
  | grep body | more