Nuvola apps important.png Attention, suite à une faille de sécurité, quelques liens vers les serveurs d'exploration sont désactivés.

-

Serveur d'exploration sur la France dans PubMed : Différence entre versions

De Wicri France
imported>Jacques Ducloy
(Éléments provisoires d'analyse)
imported>Jacques Ducloy
 
(16 révisions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
{{Wicri avertissement création lien}}
+
{{Wicri travaux|texte=Test de faisabilité (portage sur le Site LorExplor).}}
Cette page introduit un [[Serveur d'exploration]] sur la présence française dans la base PubMed.
+
Cette page introduit un [[Serveur d'exploration]] sur la présence française dans la base MEDLINE/PubMed.
{{Explor bandeau flux|type=PubMed|code=Main|path=FrancePubMed/FrancePubMed2005V1}}
+
 
 +
{{Explor bandeau flux|type=PubMed|code=Main|path=FrancePubMed2005V1|link=explor}}
 
Ce serveur vise à tester une chaîne de ventilation de documents émis par des auteurs français ou traitant de la France à partir de la base [[A pour base utilisée::PubMed]].
 
Ce serveur vise à tester une chaîne de ventilation de documents émis par des auteurs français ou traitant de la France à partir de la base [[A pour base utilisée::PubMed]].
  
Le corpus rassemble 30000 références bibliographiques.
+
Le corpus ici en ligre rassemble pour l'année 2004, 30000 références bibliographiques.
 
==Éléments provisoires d'analyse==
 
==Éléments provisoires d'analyse==
 
Un premier objectif des travaux actuels est d'améliorer la reconnaissance des noms de pays et de régions dans les chaînes de curation.
 
Un premier objectif des travaux actuels est d'améliorer la reconnaissance des noms de pays et de régions dans les chaînes de curation.
  
Au moment de la rédaction de ce paragraphe, le nombre total de références sélectionnées est de : {{Explor lien|area=FrancePubMed2005V1|url=Main/Checkpoint/index.html|texte=30 319}}.
+
Au moment de la rédaction de ce paragraphe, le nombre total de références sélectionnées est de : {{Explor lien|wiki=Wicri/France|site=LorExplor|area=FrancePubMed2005V1|url=Main/Checkpoint/index.html|texte=30 319}}.
  
L'index des pays reconnus (voir {{Explor lien|area=FrancePubMed2005V1|url=Main/Checkpoint/indexHead.php?index=AffPays.i|texte=la liste des pays par fréquence décroissante}}) donne 22 000 notices ayant la France comme pays d'affiliation du premier auteur. Nous avons donc un lot de 8000 éléments qui demandent une analyse complémentaire.
+
L'index des pays reconnus (voir {{Explor lien|wiki=Wicri/France|site=LorExplor|area=FrancePubMed2005V1|url=Main/Checkpoint/indexHead.php?index=AffPays.i|texte=la liste des pays par fréquence décroissante}}) donne 22 000 notices ayant la France comme pays d'affiliation du premier auteur. Nous avons donc un lot de 8000 éléments qui demandent une analyse complémentaire.
  
La page relative aux {{Explor lien|area=FrancePubMed2005V1|type=pays|clé=États-Unis|étape=Checkpoint|texte= États-Unis}} montre deux éléments à prendre en compte :
+
La page relative aux {{Explor lien|wiki=Wicri/France|site=LorExplor
# French est un patronyme significatif, voir par exemple les variantes autour de {{Explor lien|area=FrancePubMed2005V1|url=Main/Corpus/autAff.php?index=AutAff.i&key=French%20S|texte=Susan ou Simone French}}. Il convient de les éliminer.
+
|area=FrancePubMed2005V1|type=pays|clé=États-Unis|étape=Checkpoint|texte= États-Unis}} montre deux éléments à prendre en compte :
# En revanche le terme « French » peut être significatif dans un titre ou dans un résumé (voir {{Explor lien|area=FrancePubMed2005V1|url=Main/Checkpoint/bibRecord.php?hk=010407|texte=un titre significatif}}).
+
# French est un patronyme significatif, voir par exemple les variantes autour de {{Explor lien|wiki=Wicri/France|site=LorExplor|area=FrancePubMed2005V1|url=Main/Corpus/autAff.php?index=AutAff.i&key=French%20S|texte=Susan ou Simone French}}. Il convient de les éliminer.
 +
# En revanche le terme « French » peut être significatif dans un titre ou dans un résumé (voir {{Explor lien|wiki=Wicri/France|site=LorExplor|area=FrancePubMed2005V1|url=Main/Checkpoint/bibRecord.php?hk=010407|texte=un titre significatif}}).
  
Enfin, la page sur {{Explor lien|area=FrancePubMed2005V1|url=Main/Curation/indexHead.php?index=AffPaysInc.i|texte=les pays non reconnus}} donne des pistes assez simples à exploiter autour des tables de curation actuelles (voir par exemple sur Wicri/Métadonnées la [[wicri-meta.fr:Table des noms de pays en anglais|Table des noms de pays en anglais]]).
+
Enfin, la page sur {{Explor lien|wiki=Wicri/France|site=LorExplor|area=FrancePubMed2005V1|url=Main/Curation/indexHead.php?index=AffPaysInc.i|texte=les pays non reconnus}} donne des pistes assez simples à exploiter autour des tables de curation actuelles (voir par exemple sur Wicri/Métadonnées la [[wicri-meta.fr:Table des noms de pays en anglais|Table des noms de pays en anglais]]).
  
Concernant les noms de région, {{Explor lien|area=FrancePubMed2005V1|url=Main/Checkpoint/indexHead.php?index=AffRegion.i|texte=la page des régions par fréquence décroissante}} montre un premier niveau de reconnaissance d'environ 75 %). La {{Explor lien|area=FrancePubMed2005V1|url=Main/Checkpoint/indexHead.php?index=AffRegInc.i|texte=liste des régions non reconnues}} donne de bonnes pistes pour des améliorations significatives.
+
Concernant les noms de région, {{Explor lien|wiki=Wicri/France|site=LorExplor|area=FrancePubMed2005V1|url=Main/Checkpoint/indexHead.php?index=AffRegion.i|texte=la page des régions par fréquence décroissante}} montre un premier niveau de reconnaissance d'environ 75 %). La {{Explor lien|wiki=Wicri/France|site=LorExplor|area=FrancePubMed2005V1|url=Main/Checkpoint/indexHead.php?index=AffRegInc.i|texte=liste des régions non reconnues}} donne de bonnes pistes pour des améliorations significatives.
  
 
==Voir aussi==
 
==Voir aussi==
 +
* Un premier test sur PubMed et PubMed Central : [[Serveur d'exploration sur la toxicité du titane]],
 
* pour les aspects techniques, voir [[Wicri:FrancePubMed2005V1]].
 
* pour les aspects techniques, voir [[Wicri:FrancePubMed2005V1]].
 
* [[Serveur d'exploration sur la France dans PubMed Central]]
 
* [[Serveur d'exploration sur la France dans PubMed Central]]
 
;Sur le réseau Wicri:
 
;Sur le réseau Wicri:
 +
* Ce serveur est introduit sur [[wicri-source.fr:Visibilité de la France dans MEDLINE (test de faisabilité)|Wicri/Source]]
 
* Une application d'entraînement sur [[wicri-lux.fr:Serveur d'exploration sur la visibilité du Luxembourg sur PubMed|Wicri/Luxembourg]].
 
* Une application d'entraînement sur [[wicri-lux.fr:Serveur d'exploration sur la visibilité du Luxembourg sur PubMed|Wicri/Luxembourg]].
 +
 
[[Catégorie:Serveur d'exploration]]
 
[[Catégorie:Serveur d'exploration]]
 
__SHOWFACTBOX__
 
__SHOWFACTBOX__

Version actuelle datée du 18 juillet 2017 à 14:15

logo travaux Test de faisabilité (portage sur le Site LorExplor).

Cette page introduit un Serveur d'exploration sur la présence française dans la base MEDLINE/PubMed.

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur le flux PubMed/Medline

Pour aller sur l'étape de reformatage du corpus

Pour aller sur l'étape de curation

Pour aller sur l'étape de contrôle

Ce serveur vise à tester une chaîne de ventilation de documents émis par des auteurs français ou traitant de la France à partir de la base PubMed.

Le corpus ici en ligre rassemble pour l'année 2004, 30000 références bibliographiques.

Éléments provisoires d'analyse

Un premier objectif des travaux actuels est d'améliorer la reconnaissance des noms de pays et de régions dans les chaînes de curation.

Au moment de la rédaction de ce paragraphe, le nombre total de références sélectionnées est de : 30 319.

L'index des pays reconnus (voir la liste des pays par fréquence décroissante) donne 22 000 notices ayant la France comme pays d'affiliation du premier auteur. Nous avons donc un lot de 8000 éléments qui demandent une analyse complémentaire.

La page relative aux États-Unis montre deux éléments à prendre en compte :

  1. French est un patronyme significatif, voir par exemple les variantes autour de Susan ou Simone French. Il convient de les éliminer.
  2. En revanche le terme « French » peut être significatif dans un titre ou dans un résumé (voir un titre significatif).

Enfin, la page sur les pays non reconnus donne des pistes assez simples à exploiter autour des tables de curation actuelles (voir par exemple sur Wicri/Métadonnées la Table des noms de pays en anglais).

Concernant les noms de région, la page des régions par fréquence décroissante montre un premier niveau de reconnaissance d'environ 75 %). La liste des régions non reconnues donne de bonnes pistes pour des améliorations significatives.

Voir aussi

Sur le réseau Wicri