Discussion:Serveur d'exploration sur les relations entre la France et l'Australie
De Wicri Asie
Contexte pédagogique
Sujet proposé aux étudiants
Le scénario proposé a été le suivant :
- Vous faites partie de la cellule d'analyse stratégique rattachée à la région Grand Est. Un chargé de mission du Vice Président chargé de la recherche et de l'innovation vous signale le lundi matin une visite impromptue du président de l'Université de Sydney pour le lendemain. Vous disposerez de 5 minutes le mardi matin pour lui signaler des points qui vous paraissent importants pour des coopérations éventuelles avec l'Australie.
Déroulement du projet
Ce projet entre dans le cadre d'une formation qui est décrite sur le wiki CIDE :
Les étudiants se sont familiarisé avec les wikis sémantiques et les serveurs d'exploration sur différentes applications.
Puis 3 sujets ont été proposés et discutés avec les étudiants :
- sur ce wiki : les relations entre la France et l'Australie,
- sur Wicri/Amérique : Les relations scientifiques de Pittsburgh
- sur Wicri/Santé :Le patient édenté complet
Un groupe de 2 étudiants s'est plus particulièrement impliqué sur ce sujet : Nicolas Vigour et Nathalie Schunck. Ils ont proposé des actions de curation et ont fait une restitution orale.
Curation des données
- retrait de documents volumineux
- correction d'un bug sur PubMed Central
Élimination de documents perturbants
Une première recherche sur les pays de faible poids donne des dizaines de documents avec plusieurs milliers d'auteurs.
Pour améliorer le processus, des filtres ont été mis au point.
PubMed
HfdCat Data/PubMed/Corpus/Author.i.hfd \
| SxmlSelect -s idx/l/e/1 -p @s1 -p @1 \
| sort \
| IndexBuildRec \
| SxmlSelect -g idx/k/1 -g idx/f/1 -p @g2 -p @g1 \
| sort -rn \
| SxmlSelect -p @2 -p @1 \
| HfdSelect -ih Data/PubMed/Corpus/biblio \
| SxmlSelect -s record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=RBID/1 \
-g record/TEI/teiHeader/fileDesc/sourceDesc/biblStruct/series/idno@type=ISSN/1 \
-p @s1 -p @g1 -p @2
- Résultat
- (sur 3 colonnes / identifiant article / ISSN / nb auteurs)
pubmed:25814839 1434-6044 3043 pubmed:25814842 1434-6044 3031 pubmed:25814837 1434-6044 3024 pubmed:25814841 1434-6044 3023 pubmed:25814840 1434-6044 3022 pubmed:25814838 1434-6044 2959 pubmed:26709345 1434-6044 2919 pubmed:25814860 1434-6044 2918 pubmed:25814867 1434-6044 2902 pubmed:25814911 1434-6044 2902 pubmed:25814852 1434-6044 2900 pubmed:25814898 1434-6044 2895 pubmed:25814855 1434-6044 2885 pubmed:25904819 1434-6044 2883 pubmed:25814900 1434-6044 2883 pubmed:25814863 1434-6044 2882 pubmed:25814856 1434-6044 2882 pubmed:25983636 1434-6044 2880 pubmed:25838792 1434-6044 2880 pubmed:25838794 1434-6044 2880 pubmed:25838797 1434-6044 2880
PubMed Central
HfdCat Data/Pmc/Corpus/Author.i.hfd \
| SxmlSelect -s idx/l/e/1 -p @s1 -p @1 \
| sort \
| IndexBuildRec \
| SxmlSelect -g idx/k/1 -g idx/f/1 -p @g2 -p @g1 \
| sort -rn \
| SxmlSelect -p @2 -p @1 \
| HfdSelect -ih Data/Pmc/Corpus/biblio \
| SxmlSelect -s record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=RBID/1 \
-g record/TEI/teiHeader/fileDesc/sourceDesc/biblStruct/series/idno@type=ISSN/1 \
-p @s1 -p @g1 -p @2
Vérification
HfdCat Data/Pmc/Curation/Author.i.hfd \
| SxmlSelect -s idx/l/e/1 -p @s1 -p @1 \
| sort \
| IndexBuildRec \
| SxmlSelect -g idx/k/1 -g idx/f/1 -p @g2 -p @g1 \
| sort -rn \
| SxmlSelect -p @2 -p @1 \
| HfdSelect -ih Data/Pmc/Curation/biblio \
| SxmlSelect -s record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=RBID/1 \
-g record/TEI/teiHeader/fileDesc/sourceDesc/biblStruct/series/idno@type=ISSN/1 \
-p @s1 -p @g1 -p @2
Istex
HfdCat Data/Istex/Corpus/Author.i.hfd \
| SxmlSelect -s idx/l/e/1 -p @s1 -p @1 \
| sort \
| IndexBuildRec \
| SxmlSelect -g idx/k/1 -g idx/f/1 -p @g2 -p @g1 \
| sort -rn \
| SxmlSelect -p @2 -p @1 \
| HfdSelect -ih Data/Istex/Corpus/biblio \
| SxmlSelect -s record/TEI/teiHeader/fileDesc/publicationStmt/idno@type=RBID/1 \
-g record/TEI/teiHeader/fileDesc/sourceDesc/biblStruct/series/idno@type=ISSN/1 \
-p @s1 -p @g1 -p @2
Index spécialisés pour la curation
|
|
|
Flux Istex
Flux PubMed
Effets de la curation
Affiliations
Régions
Pays
|
|
|
|