CIDE (2017) Ducloy

De CIDE
Investissement Avenir Label-IA-mini.jpg  
Exploration de thématiques scientifiques ou techniques à l'aide de corpus ISTEX et la plateforme LorExplor
  LogoIstexSiteon0.png

Cette page introduit les démonstrations qui seront présentées au colloque CIDE.20.

Infrastructure Wicri LorExplor

Acfas (2017) Ducloy Diapositive07.png

L'infrastructure LorExplor permet d'explorer des ensembles de corpus afin de produire des résultats synthétiques. Elle s'appuie sur Wicri un réseau de wiki sémantiques.

Plateforme de curation et d'exploration LorExplor

La plateforme LorExplor permet d'explorer des corpus ISTEX avec un élargissant vers d'autres sources de données, et notamment les bases Pascal et Francis, les ressources bibliographiques de la NLM (PubMed, PubMed Central) et HAL.

Cette mise en commun implique diverses actions de curation et notamment :

  • homogénéisation des formats de données (XML-TEI),
  • homogénéisation des vocabulaires et descripteurs,
  • enrichissement par dédoublonnage.
Acfas (2017) Ducloy Diapositive24.png

Une boîte à outils XML pour construire des serveur d'exploration

La plateforme produit des serveurs d'exploration où l'expert peut travailler à 3 niveaux :

  • dans les pages du wikis (où il peut mettre des liens vers la bibliographie),
  • en explorant les index des serveurs (et les outils de classification),
  • dans l'environnement unix pour des filtrages plus spécialisés.

Tout ceci est réalisé grâce à une bibliothèque de composants XML.

A noter : le processus de génération est totalement itératif.

Exemples d'interfaces entre les wikis et les serveurs

Master UL 2017 TD sémantique Diapositive07.png

 

Master UL 2017 TD sémantique Diapositive09.png

Curation des données

Acfas (2017) Ducloy Diapositive06.png

 

Acfas (2017) Ducloy Diapositive16.png

Démonstrations

Dernières améliorations à la suite d'expérimentations en Santé

Deux expérimentations en santé ont demandé la mise en service de trois serveurs d'exploration :

Elles mettent en évidence plusieurs améliorations récentes :

  • prise en compte de volumes conséquents grâce à la machine virtuelle LorExplor,
  • introduction de facettes interactives dans les serveurs d'exploration,
  • utilisation de l'enrichissement TEEFT d'ISTEX (Term Extraction for English FullText),
  • introduction du MeSH en français pour favoriser les interactions entre les wikis et les serveurs.

Utilisations pédagogiques pour les étudiants en science de l'information

La plateforme LorExplor est utilisée pour des formations dans les masters en science de l'information de l'Université de Lorraine et l'Université Paris 8.

Sujets abordés en 2016 - 2017

Université de Lorraine

Sujets Serveur d'exploration / Wiki
Le scalaire (poisson) Wicri/Eau
L'oranger Wicri/Bois, Wicri/Agronomie
Libre accès en Belgique Wicri/Belgique, Wicri/Ticri, CIDE (ce wiki)
Visibilité du Havre Wicri/France ; Wicri/Eau
Le cobalt au Maghreb Wicri/Terre, Wicri/Maroc, Wicri/Afrique
 

Master 2 GSI et AVUN de l'Université Paris 8

Sujet sur wiki principal Autres wikis
Maladie de Parkinson en France (sur Wicri/Santé) Wicri/France, Wicri/Psychologie
Paléopathologie sur Wicri/Archéologie Wicri/Santé
Le nickel au Maghreb sur Wicri/Terre Wicri/Afrique, Wicri/Maroc
Université de Trèves sur Wicri/Rhénanie-Palatinat Wicri/Allemagne, Wicri/Grande Région
L'esturgeon sur Wicri/Eau Wicri/Agronomie
Thérapie familiale (contexte francophne) sur Wicri/Psychologie Wicri/France,

Wicri/Amérique, Wicri/Wallonie

Le renard en Europe de l'ouest sur Wicri/Bois Wicri/Europe,

Wicri/France, Wicri/Grande Région

Système d'information stratégique et agriculture Wicri/Agronomie Wicri/Informatique
Le chêne en Belgique sur Wicri/Bois Wicri/Belgique

En 2017 sujets en relation avec des situations réelles

Le démonstrateur LorExplor a pour finalité le prototypage de services effectifs de proximité. Les démonstrations citées plus haut sur le santé correspondent à ce type de situation.

Les étudiants de master sont associés au montage de trois autres sujets :

200 démonstrations accessibles

Pendant la durée du programme ISTEX 1, plus de 200 démonstrations ont été développées.

  • Une dizaines d'applications (citées ici) bénéficient de toutes les fonctionnalités décrites ici,
  • Une soixantaine ont bénéficié d'une mise à niveau à l'occasion du portage sur la machine virtuelle LorExplor (voir la liste sur Wicri/Source).
  • Environ 150 ont été générés avec des niveau de service moins sophistiqué. Elles ont dues subir un changement de site qui n'a pas conservé l'intégrité des liens. Elles présentent cependant un intérêt démonstratif et peuvent être assez facilement mise à niveau en cas de demande (voir la liste sur Wicri/Source).