CIDE (2017) Ducloy : Différence entre versions

De CIDE
imported>Jacques Ducloy
(Infrastructure LorExplor)
imported>Jacques Ducloy
(200 démonstrations accessibles)
 
(31 révisions intermédiaires par le même utilisateur non affichées)
Ligne 13 : Ligne 13 :
 
L'infrastructure LorExplor permet d'explorer des ensembles de corpus afin de produire des résultats synthétiques. Elle s'appuie sur Wicri un réseau de wiki sémantiques.
 
L'infrastructure LorExplor permet d'explorer des ensembles de corpus afin de produire des résultats synthétiques. Elle s'appuie sur Wicri un réseau de wiki sémantiques.
 
===Plateforme de curation et d'exploration LorExplor===
 
===Plateforme de curation et d'exploration LorExplor===
 +
La plateforme LorExplor permet d'explorer des corpus ISTEX avec un élargissant vers d'autres sources de données, et notamment les bases Pascal et Francis, les ressources bibliographiques de la NLM (PubMed, PubMed Central) et HAL.
 +
 +
Cette mise en commun implique diverses actions de curation et notamment :
 +
* homogénéisation des formats de données (XML-TEI),
 +
* homogénéisation des vocabulaires et descripteurs,
 +
* enrichissement par dédoublonnage.
 +
{{clr}}
 +
[[Fichier:Acfas (2017) Ducloy Diapositive24.png|right|300px]]
 +
===Une boîte à outils XML pour construire des serveur d'exploration===
 +
La plateforme produit des serveurs d'exploration où l'expert peut travailler à 3 niveaux :
 +
* dans les pages du wikis (où il peut mettre des liens vers la bibliographie),
 +
* en explorant les index des serveurs (et les outils de classification),
 +
* dans l'environnement unix pour des filtrages plus spécialisés.
 +
Tout ceci est réalisé grâce à une bibliothèque de composants XML.
 +
 +
A noter : le processus de génération est totalement itératif.
 +
 +
;Exemples d'interfaces entre les wikis et les serveurs:
 +
{{Clr}}
 +
{{Début 2 colonnes}}
 +
[[Fichier:Master UL 2017 TD sémantique Diapositive07.png|350px]]
 +
{{Saut 2 colonnes}}
 +
[[Fichier:Master UL 2017 TD sémantique Diapositive09.png|350px]]
 +
{{Fin 2 colonnes}}
 +
;Curation des données:
 +
{{Début 2 colonnes}}
 +
[[Fichier:Acfas (2017) Ducloy Diapositive06.png|350px]]
 +
{{Saut 2 colonnes}}
 +
[[Fichier:Acfas (2017) Ducloy Diapositive16.png|350px]]
 +
{{Fin 2 colonnes}}
 +
 +
==Démonstrations==
 +
===Dernières améliorations à la suite d'expérimentations en Santé===
 +
Deux expérimentations en santé ont demandé la mise en service de trois serveurs d'exploration :
 +
* A propos du SIDA en Afrique sub-saharienne
 +
** un serveur « d'entraînement » (2.600 documents) : '''''[[wicri-sante.fr:Le SIDA au Ghana (serveur d'exploration)|Le SIDA au Ghana]]'''''
 +
** l'application réelle (17.000 documents) : '''''[[wicri-sante.fr:Le SIDA en Afrique subsaharienne (serveur d'exploration)|Le SIDA en Afrique subsaharienne]]'''''
 +
* '''''[[wicri-sante.fr:Serveur d'exploration sur le lymphœdème|Serveur d'exploration sur le lymphœdème]]''''' (34.800 documents)
 +
Elles mettent en évidence plusieurs améliorations récentes :
 +
* prise en compte de volumes conséquents grâce à la machine virtuelle LorExplor,
 +
* introduction de facettes interactives dans les serveurs d'exploration,
 +
* utilisation de l'enrichissement TEEFT d'ISTEX (''Term Extraction for English FullText''),
 +
* introduction du MeSH en français pour favoriser les interactions entre les wikis et les serveurs.
 +
===Utilisations pédagogiques pour les étudiants en science de l'information===
 +
La plateforme LorExplor est utilisée pour des formations dans les masters en science de l'information de l'Université de Lorraine et l'Université Paris 8.
 +
====Sujets abordés en 2016 - 2017====
 +
{{Début 2 colonnes}}
 +
'''[[TD Master 2 Documentation numérique (Université de Lorraine 2016)|Université de Lorraine]]'''
 +
{| class = "wikitable"
 +
|-
 +
!Sujets
 +
!Serveur d'exploration / Wiki
 +
|-
 +
|[[TD UL M2 (2016) Shahin, Zhang|Le scalaire (poisson)]]
 +
|[[wicri-eau.fr:Serveur d'exploration sur le scalaire|Wicri/Eau]]
 +
|-
 +
|[[TD UL M2 (2016) Sinigaglia, Chobeau|L'oranger]]
 +
|[[wicri-bois.fr:Serveur d'exploration sur l'oranger|Wicri/Bois]], [[wicri-agronomie.fr:Serveur d'exploration sur l'oranger|Wicri/Agronomie]]
 +
|-
 +
||[[TD UL M2 (2016) Boninsegna, El Gharbaoui|Libre accès en Belgique]]
 +
|[[wicri-belgique.fr:Serveur d'exploration autour du libre accès en Belgique|Wicri/Belgique]], [[wicri-ticri.fr:Serveur d'exploration autour du libre accès en Belgique|Wicri/Ticri]], [[Serveur d'exploration autour du libre accès en Belgique|CIDE]] (ce wiki)
 +
|-
 +
|[[TD UL M2 (2016) Paumier, Thouvenin|Visibilité du Havre]]
 +
|[[wicri-france.fr:Serveur d'exploration sur la visibilité du Havre|Wicri/France]] ; [[wicri-eau.fr:Serveur d'exploration sur la visibilité du Havre|Wicri/Eau]]
 +
|-
 +
|[[TD UL M2 (2016) Courquet, El Maziane|Le cobalt au Maghreb]]
 +
|[[wicri-terre.fr:Serveur d'exploration sur le cobalt au Maghreb|Wicri/Terre]], [[wicri-maroc.fr:Serveur d'exploration sur le cobalt au Maghreb|Wicri/Maroc]], [[wicri-afrique.fr:Serveur d'exploration sur le cobalt au Maghreb|Wicri/Afrique]]
 +
|-
 +
|}
 +
{{Saut 2 colonnes}}
 +
'''[[TD Master 2 (Université Paris 8, 2016)|Master 2 GSI et AVUN de l'Université Paris 8]]'''
 +
{| class="wikitable sortable"
 +
|-
 +
!Sujet sur wiki principal
 +
!Autres wikis
 +
|-
 +
|[[wicri-sante.fr:La maladie de Parkinson en France (serveur d'exploration)|Maladie de Parkinson en France (sur Wicri/Santé)]]
 +
|[[wicri-france.fr:La maladie de Parkinson en France (serveur d'exploration)|Wicri/France]], [[wicri-psycho.fr:La maladie de Parkinson en France (serveur d'exploration)|Wicri/Psychologie]]
 +
|-
 +
|[[wicri-archeologie.fr:Serveur d'exploration sur la paléopathologie|Paléopathologie sur Wicri/Archéologie]]
 +
|[[wicri-sante.fr:Serveur d'exploration sur la paléopathologie|Wicri/Santé]]
 +
|-
 +
|[[wicri-terre.fr:Serveur d'exploration sur le nickel au Maghreb|Le nickel au Maghreb sur Wicri/Terre]]
 +
|[[wicri-afrique.fr:Serveur d'exploration sur le nickel au Maghreb|Wicri/Afrique]], [[wicri-maroc.fr:Serveur d'exploration sur le nickel au Maghreb|Wicri/Maroc]]
 +
|-
 +
|[[wicri-rhen-pal.fr:Serveur d'exploration sur l'Université de Trèves|Université de Trèves sur Wicri/Rhénanie-Palatinat]]
 +
|[[wicri-allemagne.fr:Serveur d'exploration sur l'Université de Trèves|Wicri/Allemagne]], [[wicri-gr.fr:Serveur d'exploration sur l'Université de Trèves|Wicri/Grande Région]]
 +
|-
 +
|[[wicri-eau.fr:Serveur d'exploration sur l'esturgeon|L'esturgeon sur Wicri/Eau]]
 +
|[[wicri-agronomie.fr:Serveur d'exploration sur l'esturgeon|Wicri/Agronomie]]
 +
|-
 +
|[[wicri-psycho.fr:La thérapie familiale en francophonie (serveur d'exploration)|Thérapie familiale (contexte francophne) sur Wicri/Psychologie]]
 +
|[[wicri-france.fr:La thérapie familiale en francophonie (serveur d'exploration)|Wicri/France]],
 +
[[wicri-amerique.fr:La thérapie familiale en francophonie (serveur d'exploration)|Wicri/Amérique]],
 +
[[wicri-wallonie.fr:La thérapie familiale en francophonie (serveur d'exploration)|Wicri/Wallonie]]
 +
|-
 +
|[[wicri-bois.fr:Serveur d'exploration sur le renard|Le renard en Europe de l'ouest sur Wicri/Bois]]
 +
|[[wicri-europe.fr:Serveur d'exploration sur le renard|Wicri/Europe]],
 +
[[wicri-france.fr:Serveur d'exploration sur le renard|Wicri/France]],
 +
[[wicri-gr.fr:Serveur d'exploration sur le renard|Wicri/Grande Région]]
 +
|-
 +
|[[wicri-agronomie.fr:Système d'information stratégique et agriculture (serveur d'exploration)|Système d'information stratégique et agriculture Wicri/Agronomie]]
 +
|[[wic-informatique.fr:Système d'information stratégique et agriculture (serveur d'exploration)|Wicri/Informatique]]
 +
|-
 +
|[[wicri-bois.fr:Serveur d'exploration sur le chêne en Belgique|Le chêne en Belgique sur Wicri/Bois]]
 +
|[[wicri-belgique.fr:Serveur d'exploration sur le chêne en Belgique|Wicri/Belgique]]
 +
|-
 +
|}
 +
{{Fin 2 colonnes}}
 +
 +
====En 2017 sujets en relation avec des situations réelles====
 +
Le démonstrateur LorExplor a pour finalité le prototypage de services effectifs de proximité. Les démonstrations citées plus haut sur le santé correspondent à ce type de situation.
 +
 +
Les étudiants de master sont associés au montage de  trois autres sujets :
 +
* En liaison avec une conférence de l'Académie Lorraine de Sciences, reprise par l'association des émérites de Lorraine :
 +
** sur Wicri/Santé : [[wicri-sante.fr:Serveur d'exploration sur le patient édenté|Le patient édenté total]]
 +
* En liaison avec la Direction des Partenariats de l'Université de Lorraine :
 +
** Sur Wicri/Amérique : [[wicri-amerique.fr:Serveur d'exploration sur Pittsburgh|Activités scientifiques dans la zone urbaine de Pittsburgh]],
 +
** Sur Wicri/Asie : [[wicri-asie.fr:Serveur d'exploration sur les relations entre la France et l'Australie|Relations scientifiques entre la France et l'Australie]],
 +
 +
===200 démonstrations accessibles===
 +
Pendant la durée du programme ISTEX 1, plus de 200 démonstrations ont été développées.
 +
* Une dizaines d'applications (citées ici) bénéficient de toutes les fonctionnalités décrites ici,
 +
* Une soixantaine ont bénéficié d'une mise à niveau à l'occasion du portage sur la machine virtuelle LorExplor (voir [[wicri-source.fr:Serveur d'exploration|la liste sur Wicri/Source]]).
 +
* Environ 150 ont été générés avec des niveau de service moins sophistiqué. Elles ont dues subir un changement de site qui n'a pas conservé l'intégrité des liens. Elles présentent cependant un intérêt démonstratif et peuvent être assez facilement mise à niveau en cas de demande ([[wicri-source.fr:Projets:Migration des serveurs d'exploration|voir la liste sur Wicri/Source]]).

Version actuelle datée du 1 décembre 2017 à 10:42

Investissement Avenir Label-IA-mini.jpg  
Exploration de thématiques scientifiques ou techniques à l'aide de corpus ISTEX et la plateforme LorExplor
  LogoIstexSiteon0.png

Cette page introduit les démonstrations qui seront présentées au colloque CIDE.20.

Infrastructure Wicri LorExplor

Acfas (2017) Ducloy Diapositive07.png

L'infrastructure LorExplor permet d'explorer des ensembles de corpus afin de produire des résultats synthétiques. Elle s'appuie sur Wicri un réseau de wiki sémantiques.

Plateforme de curation et d'exploration LorExplor

La plateforme LorExplor permet d'explorer des corpus ISTEX avec un élargissant vers d'autres sources de données, et notamment les bases Pascal et Francis, les ressources bibliographiques de la NLM (PubMed, PubMed Central) et HAL.

Cette mise en commun implique diverses actions de curation et notamment :

  • homogénéisation des formats de données (XML-TEI),
  • homogénéisation des vocabulaires et descripteurs,
  • enrichissement par dédoublonnage.
Acfas (2017) Ducloy Diapositive24.png

Une boîte à outils XML pour construire des serveur d'exploration

La plateforme produit des serveurs d'exploration où l'expert peut travailler à 3 niveaux :

  • dans les pages du wikis (où il peut mettre des liens vers la bibliographie),
  • en explorant les index des serveurs (et les outils de classification),
  • dans l'environnement unix pour des filtrages plus spécialisés.

Tout ceci est réalisé grâce à une bibliothèque de composants XML.

A noter : le processus de génération est totalement itératif.

Exemples d'interfaces entre les wikis et les serveurs

Master UL 2017 TD sémantique Diapositive07.png

 

Master UL 2017 TD sémantique Diapositive09.png

Curation des données

Acfas (2017) Ducloy Diapositive06.png

 

Acfas (2017) Ducloy Diapositive16.png

Démonstrations

Dernières améliorations à la suite d'expérimentations en Santé

Deux expérimentations en santé ont demandé la mise en service de trois serveurs d'exploration :

Elles mettent en évidence plusieurs améliorations récentes :

  • prise en compte de volumes conséquents grâce à la machine virtuelle LorExplor,
  • introduction de facettes interactives dans les serveurs d'exploration,
  • utilisation de l'enrichissement TEEFT d'ISTEX (Term Extraction for English FullText),
  • introduction du MeSH en français pour favoriser les interactions entre les wikis et les serveurs.

Utilisations pédagogiques pour les étudiants en science de l'information

La plateforme LorExplor est utilisée pour des formations dans les masters en science de l'information de l'Université de Lorraine et l'Université Paris 8.

Sujets abordés en 2016 - 2017

Université de Lorraine

Sujets Serveur d'exploration / Wiki
Le scalaire (poisson) Wicri/Eau
L'oranger Wicri/Bois, Wicri/Agronomie
Libre accès en Belgique Wicri/Belgique, Wicri/Ticri, CIDE (ce wiki)
Visibilité du Havre Wicri/France ; Wicri/Eau
Le cobalt au Maghreb Wicri/Terre, Wicri/Maroc, Wicri/Afrique
 

Master 2 GSI et AVUN de l'Université Paris 8

Sujet sur wiki principal Autres wikis
Maladie de Parkinson en France (sur Wicri/Santé) Wicri/France, Wicri/Psychologie
Paléopathologie sur Wicri/Archéologie Wicri/Santé
Le nickel au Maghreb sur Wicri/Terre Wicri/Afrique, Wicri/Maroc
Université de Trèves sur Wicri/Rhénanie-Palatinat Wicri/Allemagne, Wicri/Grande Région
L'esturgeon sur Wicri/Eau Wicri/Agronomie
Thérapie familiale (contexte francophne) sur Wicri/Psychologie Wicri/France,

Wicri/Amérique, Wicri/Wallonie

Le renard en Europe de l'ouest sur Wicri/Bois Wicri/Europe,

Wicri/France, Wicri/Grande Région

Système d'information stratégique et agriculture Wicri/Agronomie Wicri/Informatique
Le chêne en Belgique sur Wicri/Bois Wicri/Belgique

En 2017 sujets en relation avec des situations réelles

Le démonstrateur LorExplor a pour finalité le prototypage de services effectifs de proximité. Les démonstrations citées plus haut sur le santé correspondent à ce type de situation.

Les étudiants de master sont associés au montage de trois autres sujets :

200 démonstrations accessibles

Pendant la durée du programme ISTEX 1, plus de 200 démonstrations ont été développées.

  • Une dizaines d'applications (citées ici) bénéficient de toutes les fonctionnalités décrites ici,
  • Une soixantaine ont bénéficié d'une mise à niveau à l'occasion du portage sur la machine virtuelle LorExplor (voir la liste sur Wicri/Source).
  • Environ 150 ont été générés avec des niveau de service moins sophistiqué. Elles ont dues subir un changement de site qui n'a pas conservé l'intégrité des liens. Elles présentent cependant un intérêt démonstratif et peuvent être assez facilement mise à niveau en cas de demande (voir la liste sur Wicri/Source).