CIDE (2017) Ducloy

De CIDE
Révision datée du 17 novembre 2017 à 11:04 par imported>Jacques Ducloy (Dernières améliorations à la suite d'expérimentations en Santé)
Investissement Avenir Label-IA-mini.jpg  
Exploration de thématiques scientifiques ou techniques à l'aide de corpus ISTEX et la plateforme LorExplor
  LogoIstexSiteon0.png

Cette page introduit les démonstrations qui seront présentées au colloque CIDE.20.

Infrastructure Wicri LorExplor

Acfas (2017) Ducloy Diapositive07.png

L'infrastructure LorExplor permet d'explorer des ensembles de corpus afin de produire des résultats synthétiques. Elle s'appuie sur Wicri un réseau de wiki sémantiques.

Plateforme de curation et d'exploration LorExplor

La plateforme LorExplor permet d'explorer des corpus ISTEX avec un élargissant vers d'autres sources de données, et notamment les bases Pascal et Francis, les ressources bibliographiques de la NLM (PubMed, PubMed Central) et HAL.

Cette mise en commun implique diverses actions de curation et notamment :

  • homogénéisation des formats de données (XML-TEI),
  • homogénéisation des vocabulaires et descripteurs,
  • enrichissement par dédoublonnage.

Démonstrations

Dernières améliorations à la suite d'expérimentations en Santé

Deux expérimentations en santé ont demandé la mise en service de trois serveurs d'exploration :

Elles mettent en évidence plusieurs améliorations récentes :

  • prise en compte de volumes conséquents grâce à la machine virtuelle LorExplor,
  • introduction de facettes interactives dans les serveurs d'exploration,
  • utilisation de l'enrichissement TEEFT d'ISTEX (Term Extraction for English FullText),
  • introduction du MeSH en français pour favoriser les interactions entre les wikis et les serveurs.