CIDE (2017) Ducloy
Cette page introduit les démonstrations qui seront présentées au colloque CIDE.20.
Infrastructure Wicri LorExplor
L'infrastructure LorExplor permet d'explorer des ensembles de corpus afin de produire des résultats synthétiques. Elle s'appuie sur Wicri un réseau de wiki sémantiques.
Plateforme de curation et d'exploration LorExplor
La plateforme LorExplor permet d'explorer des corpus ISTEX avec un élargissant vers d'autres sources de données, et notamment les bases Pascal et Francis, les ressources bibliographiques de la NLM (PubMed, PubMed Central) et HAL.
Cette mise en commun implique diverses actions de curation et notamment :
- homogénéisation des formats de données (XML-TEI),
- homogénéisation des vocabulaires et descripteurs,
- enrichissement par dédoublonnage.
Une boîte à outils XML pour construire des serveur d'exploration
La plateforme produit des serveurs d'exploration où l'expert peut travailler à 3 niveaux :
- dans les pages du wikis (où il peut mettre des liens vers la bibliographie),
- en explorant les index des serveurs (et les outils de classification),
- dans l'environnement unix pour des filtrages plus spécialisés.
Tout ceci est réalisé grâce à une bibliothèque de composants XML.
A noter : le processus de génération est totalement itératif.
- Exemples d'interfaces entre les wikis et les serveurs
- Curation des données
Démonstrations
Dernières améliorations à la suite d'expérimentations en Santé
Deux expérimentations en santé ont demandé la mise en service de trois serveurs d'exploration :
- A propos du SIDA en Afrique sub-saharienne
- un serveur « d'entraînement » (2.600 documents) : Le SIDA au Ghana
- l'application réelle (17.000 documents) : Le SIDA en Afrique subsaharienne
- Serveur d'exploration sur le lymphœdème (34.800 documents)
Elles mettent en évidence plusieurs améliorations récentes :
- prise en compte de volumes conséquents grâce à la machine virtuelle LorExplor,
- introduction de facettes interactives dans les serveurs d'exploration,
- utilisation de l'enrichissement TEEFT d'ISTEX (Term Extraction for English FullText),
- introduction du MeSH en français pour favoriser les interactions entre les wikis et les serveurs.
Utilisations pédagogiques pour les étudiants en science de l'information
La plateforme LorExplor est utilisée pour des formations dans les masters en science de l'information de l'Université de Lorraine et l'Université Paris 8.
Sujets abordés en 2016 - 2017
En 2017 sujets en relation avec des situations réelles
Le démonstrateur LorExplor a pour finalité le prototypage de services effectifs de proximité. Les démonstrations citées plus haut sur le santé correspondent à ce type de situation.
Les étudiants de master sont associés au montage de trois autres sujets :
- En liaison avec une conférence de l'Académie Lorraine de Sciences, reprise par l'association des émérites de Lorraine :
- sur Wicri/Santé : Le patient édenté total
- En liaison avec la Direction des Partenariats de l'Université de Lorraine :
- Sur Wicri/Amérique : Activités scientifiques dans la zone urbaine de Pittsburgh,
- Sur Wicri/Asie : Relations scientifiques entre la France et l'Australie,
200 démonstrations accessibles
Pendant la durée du programme ISTEX 1, plus de 200 démonstrations ont été développées.
- Une dizaines d'applications (citées ici) bénéficient de toutes les fonctionnalités décrites ici,
- Une soixantaine ont bénéficié d'une mise à niveau à l'occasion du portage sur la machine virtuelle LorExplor (voir la liste sur Wicri/Source).
- Environ 150 ont été générés avec des niveau de service moins sophistiqué. Elles ont dues subir un changement de site qui n'a pas conservé l'intégrité des liens. Elles présentent cependant un intérêt démonstratif et peuvent être assez facilement mise à niveau en cas de demande (voir la liste sur Wicri/Source).