Serveur d'exploration sur la maladie de Parkinson
Cette page introduit un serveur d'exploration sur la maladie de Parkinson.
Sommaire
Le corpus
Le corpus est extrait de la plateforme ISTEX (17 000 000 documents au moment de l'extraction).
Le terme « Parkinson » était contenu dans 87 264 documents. La sélection finale a été réalisée sur le critère « Parkinson AND disease » qui réduit le volume à 44 645. Elle a été limitée aux 5000 premiers (avec les critères de pertinence du moteur de recherche Elastic Search).
Le corpus donne accès à 5000 documents ISTEX (et 4598 après curation). | |||
Zoom | France | Ce flux donne accès à une bibliographie contenant 330 références ayant au moins un auteur avec une affiliation française. | |
---|---|---|---|
Zoom | USA | Ce flux donne accès à une bibliographie contenant 1529 références ayant au moins un auteur avec une affiliation des Etats-Unis d'Amérique. | |
Zoom | Allemagne | Ce flux donne accès à une bibliographie contenant 444 références ayant au moins un auteur avec une affiliation allemande. |
Projections géographiques
|
|
Premiers résultats
- Test modèle de construction de listes
Attention ces données sont élaborées à partir d'un corpus qui n'a reçu aucune curation spécifique
|
|
|
|
|
- En France
Ces listes contiennent des auteurs, organismes et éléments géographiques français, ou des éléments d'origine étrangères dans le cadre de coopérations avec un organisme français.
- Quelques pages sur des acteurs et leur « chemin d'affiation »
Aspects techniques
Paramétrage
- Wicri:ParkinsonV1 - introduction
- Wicri:ParkinsonV1/Paramètres, data - génération des données
- Wicri:ParkinsonV1/Paramètres, fr - génération de l'interface
- Wicri:ParkinsonV1/Paramètres, génération des cartes - génération de cartes géographiques
- Wicri:ParkinsonV1/Paramètres, templates size - paramétrage des modèles liés aux valeurs numériques
- Wicri:ParkinsonV1/Paramètres, template include
Réalisations spécifiques à cette expérience
- mise au point d'une table de correspondance pour les éditions.
Voir Wicri:Liste pour l'édition d'ISSN en Santé
Curation
- Bugs
Mauvais traitement des tirets (UTF-8) dans les patronymes.
- Exemple pour Alim-Louis Benabid qui devient Alim Ouis Benabid - résolu
- Cardiologie
Le syndrome de Wolff-Parkinson-White amène des phénomènes d'homonymie dont les plus importantes sont repérables dans la liste des ISSN :
En particulier :
- l'abréviation AJC et l'ISSN 0002-9149 correspondent à la revue The American Journal of Cardiology, dont les articles doivent être éliminées du corpus.
- De même pour 0002-8703 (American Heart Journal)
Cela dit, on peut trouver, dans des revues traitant de cardiologie, des articles relatifs à la Maladie de Parkinson, exemple :
Le script qui a permis de repérer ce document est le suivant :
HfdIndexSelect -h $EXPLOR_AREA/Data/Main/Corpus/ISSN.i -Sk "0147-8389" \
| HfdSelect -Kh $EXPLOR_AREA/Import/IstexRepository \
| SxmlFindText -r "[Pp]arkinson..?.?[Dd]isease" | more