CIDE (2017) Ducloy
Cette page introduit les démonstrations qui seront présentées au colloque CIDE.20.
Infrastructure Wicri LorExplor
L'infrastructure LorExplor permet d'explorer des ensembles de corpus afin de produire des résultats synthétiques. Elle s'appuie sur Wicri un réseau de wiki sémantiques.
Plateforme de curation et d'exploration LorExplor
La plateforme LorExplor permet d'explorer des corpus ISTEX avec un élargissant vers d'autres sources de données, et notamment les bases Pascal et Francis, les ressources bibliographiques de la NLM (PubMed, PubMed Central) et HAL.
Cette mise en commun implique diverses actions de curation et notamment :
- homogénéisation des formats de données (XML-TEI),
- homogénéisation des vocabulaires et descripteurs,
- enrichissement par dédoublonnage.
Une boîte à outils XML pour construire des serveur d'exploration
La plateforme produit des serveurs d'exploration où l'expert peut travailler à 3 niveaux :
- dans les pages du wikis (où il peut mettre des liens vers la bibliographie),
- en explorant les index des serveurs (et les outils de classification),
- dans l'environnement unix pour des filtrages plus spécialisés.
Tout ceci est réalisé grâce à une bibliothèque de composants XML.
A noter : le processus de génération est totalement itératif.
- Exemples d'interfaces entre les wikis et les serveurs
- Curation des données
Démonstrations
Dernières améliorations à la suite d'expérimentations en Santé
Deux expérimentations en santé ont demandé la mise en service de trois serveurs d'exploration :
- A propos du SIDA en Afrique sub-saharienne
- un serveur « d'entraînement » (2.600 documents) : Le SIDA au Ghana
- l'application réelle (17.000 documents) : Le SIDA en Afrique subsaharienne
- Serveur d'exploration sur le lymphœdème (34.800 documents)
Elles mettent en évidence plusieurs améliorations récentes :
- prise en compte de volumes conséquents grâce à la machine virtuelle LorExplor,
- introduction de facettes interactives dans les serveurs d'exploration,
- utilisation de l'enrichissement TEEFT d'ISTEX (Term Extraction for English FullText),
- introduction du MeSH en français pour favoriser les interactions entre les wikis et les serveurs.
Utilisations pédagogiques pour les étudiants en science de l'information
La plateforme LorExplor est utilisée pour des formations dans les masters en science de l'information de l'Université de Lorraine et l'Université Paris 8.
- Sujets abordés en 2016 - 2017
En relation avec des situations réelles
Le démonstrateur LorExplor a pour finalité le prototypage de services effectifs de proximité.
Les démonstrations citées plus haut sur le santé correspondent à ce type de situation.
3 autres sujets sont en cours de montage :
- En liaison avec une conférence de l'Académie Lorraine de Sciences reprise à l'association des émérites de Lorraine
- Le patient édenté total : http://emerites.blogspot.fr/2010/02/seminaires.html
- En liaison avec la Direction des Partenariats de l'Université de Lorraine :
200 démonstrations accessibles
Pendant la durée du programme ISTEX 1, plus de 200 démonstrations ont été développées.
- Une dizaines d'applications (citées ici) bénéficient de toutes les fonctionnalités décrites ici,
- Une cinquantaine ont bénéficié d'une mise à niveau à l'occasion du portage sur la machine virtuelle LorExplor.
- Environ 150 ont été générés avec des niveau de service moins sophistiqué, mais présentent cependant un intérêt démonstratif.