CIDE (2017) Ducloy : Différence entre versions
imported>Jacques Ducloy (→Une boîte à outils XML pour construire des serveur d'exploration) |
imported>Jacques Ducloy (→Une boîte à outils XML pour construire des serveur d'exploration) |
||
Ligne 33 : | Ligne 33 : | ||
{{Clr}} | {{Clr}} | ||
{{Début 2 colonnes}} | {{Début 2 colonnes}} | ||
+ | [[Fichier:Master UL 2017 TD sémantique Diapositive07.png|350px]] | ||
{{Saut 2 colonnes}} | {{Saut 2 colonnes}} | ||
+ | [[Fichier:Master UL 2017 TD sémantique Diapositive09.png|350px]] | ||
{{Fin 2 colonnes}} | {{Fin 2 colonnes}} | ||
Version du 17 novembre 2017 à 11:55
Cette page introduit les démonstrations qui seront présentées au colloque CIDE.20.
Infrastructure Wicri LorExplor
L'infrastructure LorExplor permet d'explorer des ensembles de corpus afin de produire des résultats synthétiques. Elle s'appuie sur Wicri un réseau de wiki sémantiques.
Plateforme de curation et d'exploration LorExplor
La plateforme LorExplor permet d'explorer des corpus ISTEX avec un élargissant vers d'autres sources de données, et notamment les bases Pascal et Francis, les ressources bibliographiques de la NLM (PubMed, PubMed Central) et HAL.
Cette mise en commun implique diverses actions de curation et notamment :
- homogénéisation des formats de données (XML-TEI),
- homogénéisation des vocabulaires et descripteurs,
- enrichissement par dédoublonnage.
Une boîte à outils XML pour construire des serveur d'exploration
La plateforme produit des serveurs d'exploration où l'expert peut travailler à 3 niveaux :
- dans les pages du wikis (où il peut mettre des liens vers la bibliographie),
- en explorant les index des serveurs (et les outils de classification),
- dans l'environnement unix pour des filtrages plus spécialisés.
Tout ceci est réalisé grâce à une bibliothèque de composants XML.
A noter : le processus de génération est totalement itératif.
- Exemples d'interfaces entre les wikis et les serveurs
Démonstrations
Dernières améliorations à la suite d'expérimentations en Santé
Deux expérimentations en santé ont demandé la mise en service de trois serveurs d'exploration :
- A propos du SIDA en Afrique sub-saharienne
- un serveur « d'entraînement » (2.600 documents) : Le SIDA au Ghana
- l'application réelle (17.000 documents) : Le SIDA en Afrique subsaharienne
- Serveur d'exploration sur le lymphœdème (34.800 documents)
Elles mettent en évidence plusieurs améliorations récentes :
- prise en compte de volumes conséquents grâce à la machine virtuelle LorExplor,
- introduction de facettes interactives dans les serveurs d'exploration,
- utilisation de l'enrichissement TEEFT d'ISTEX (Term Extraction for English FullText),
- introduction du MeSH en français pour favoriser les interactions entre les wikis et les serveurs.
Utilisations pédagogiques pour les étudiants en science de l'information
La plateforme LorExplor est utilisée pour des formations dans les masters en science de l'information de l'Université de Lorraine et l'Université Paris 8.
- Sujets abordés en 2016 - 2017