Serveur d'exploration sur la France dans PubMed : Différence entre versions
imported>Jacques Ducloy (→Éléments provisoires d'analyse) |
imported>Jacques Ducloy (→Éléments provisoires d'analyse) |
||
Ligne 14 : | Ligne 14 : | ||
La page relative aux {{Explor lien|area=FrancePubMed2005V1|type=pays|clé=États-Unis|étape=Checkpoint|texte= États-Unis}} montre deux éléments à prendre en compte : | La page relative aux {{Explor lien|area=FrancePubMed2005V1|type=pays|clé=États-Unis|étape=Checkpoint|texte= États-Unis}} montre deux éléments à prendre en compte : | ||
# French est un patronyme significatif, voir par exemple les variantes autour de {{Explor lien|area=FrancePubMed2005V1|url=Main/Corpus/autAff.php?index=AutAff.i&key=French%20S|texte=Susan ou Simone French}}. Il convient de les éliminer. | # French est un patronyme significatif, voir par exemple les variantes autour de {{Explor lien|area=FrancePubMed2005V1|url=Main/Corpus/autAff.php?index=AutAff.i&key=French%20S|texte=Susan ou Simone French}}. Il convient de les éliminer. | ||
− | # En revanche le terme « French » peut être significatif dans un résumé. | + | # En revanche le terme « French » peut être significatif dans un titre ou dans un résumé (voir {{Explor lien|area=FrancePubMed2005V1|url=Main/Checkpoint/bibRecord.php?hk=010407}}). |
==Voir aussi== | ==Voir aussi== |
Version du 2 novembre 2013 à 17:39
Cette page introduit un Serveur d'exploration sur la présence française dans la base PubMed.
Ce serveur vise à tester une chaîne de ventilation de documents émis par des auteurs français ou traitant de la France à partir de la base PubMed.
Le corpus rassemble 30000 références bibliographiques.
Éléments provisoires d'analyse
Un premier objectif des travaux actuels est d'améliorer la reconnaissance des noms de pays et de régions dans les chaînes de curation.
Au moment de la rédaction de ce paragraphe, le nombre total de références sélectionnées est de : 30 319.
L'index des pays reconnus (voir la liste des pays par fréquence décroissante) donne 22 000 notices ayant la France comme pays d'affiliation du premier auteur. Nous avons donc un lot de 8000 éléments qui demandent une analyse complémentaire.
La page relative aux États-Unis montre deux éléments à prendre en compte :
- French est un patronyme significatif, voir par exemple les variantes autour de Susan ou Simone French. Il convient de les éliminer.
- En revanche le terme « French » peut être significatif dans un titre ou dans un résumé (voir FrancePubMed2005V1).
Voir aussi
- pour les aspects techniques, voir Wicri:FrancePubMed2005V1.
- Serveur d'exploration sur la France dans PubMed Central
- Sur le réseau Wicri
- Une application d'entraînement sur Wicri/Luxembourg.