CIDE (2017) Ducloy
Cette page introduit les démonstrations qui seront présentées au colloque CIDE.20.
Sommaire
Infrastructure Wicri LorExplor
L'infrastructure LorExplor permet d'explorer des ensembles de corpus afin de produire des résultats synthétiques. Elle s'appuie sur Wicri un réseau de wiki sémantiques.
Plateforme de curation et d'exploration LorExplor
La plateforme LorExplor permet d'explorer des corpus ISTEX avec un élargissant vers d'autres sources de données, et notamment les bases Pascal et Francis, les ressources bibliographiques de la NLM (PubMed, PubMed Central) et HAL.
Cette mise en commun implique diverses actions de curation et notamment :
- homogénéisation des formats de données (XML-TEI),
- homogénéisation des vocabulaires et descripteurs,
- enrichissement par dédoublonnage.
Démonstrations
Dernières améliorations à la suite d'expérimentations en Santé
Deux expérimentations en santé ont demandé la mise en service de trois serveurs d'exploration :
- A propos du SIDA en Afrique sub-saharienne
- un serveur « d'entraînement » (2.600 documents) : Le SIDA au Ghana
- l'application réelle (17.000 documents) : Le SIDA en Afrique subsaharienne
- Serveur d'exploration sur le lymphœdème (34.800 documents)
Elles mettent en évidence plusieurs améliorations récentes :
- prise en compte de volumes conséquents grâce à la machine virtuelle LorExplor,
- introduction de facettes interactives dans les serveurs d'exploration,
- utilisation de l'enrichissement TEEFT d'ISTEX (Term Extraction for English FullText),
- introduction du MeSH en français pour favoriser les interactions entre les wikis et les serveurs.
Utilisations pédagogiques pour les étudiants en science de l'information
La plateforme LorExplor est utilisée pour des formations dans les masters en science de l'information de l'Université de Lorraine et l'Université Paris 8.