CIDE (2016) Ducloy

De CIDE

Expérimenter l'épistémè numérique avec ISTEX


 
 

 
Titre
Expérimenter l'épistémè numérique avec ISTEX
Auteur
Jacques Ducloy
Affiliation
Université de Lorraine
In
Actes du colloque CIDE.19 (Athènes 2016)
Résumé 
Dans le monde numérique mondialisé, Wikipédia est une construction collaborative de millions d'articles scientifiques par des millions de contributeurs. Réciproquement, les réservoirs tels qu'ISTEX mettent des millions de textes scientifiques, écrits par des millions d'auteurs à la portée de millions de chercheurs et de partenaires de la recherche. Le projet LorExplor cherche à associer étroitement ces deux « modalités de production et de consommation des connaissances ». Nous proposons ainsi un cadre pour expérimenter le concept d'épistémè à l'ère du numérique. Nous présenterons les particularités de notre approche avec son réseau de wiki sémantiques associé à un ensemble de composants logiciels de manipulation de corpus. A titre d'exemple, nous nous appuierons sur une exploration de la plateforme ISTEX à partir des articles qui font référence à l'épistémè.
Modalités d'organisation de l'atelier 
accompagner la présentation d'une véritable possibilité d'expérimentation par les participants à CIDE... (avant sur le wiki, pendant et présentiel et après)

Diapositives commentées

logo travaux Cette partie est en cours de rédaction
CIDE 2016 LorExplor Athènes Diapositive01.jpg

Cette présentation fait suite à plusieurs actions précédentes :

Pour télécharger les diapositives :

Avant de parcourir cet article :

une visite guidée du wiki Wicri/CIDE est conseillée.

Introduction

CIDE 2016 LorExplor Athènes Diapositive02.jpg
Autour du quatrième paradigme
Fpcover-full.jpg
CIDE 2016 LorExplor Athènes Diapositive03.jpg
Le rapport Atkins
  • janvier 2013
  • Revolutionizing Science and Engineering Through Cyberinfrastructure:
Report of the National Science Foundation Blue-Ribbon Advisory Panel on Cyberinfrastructure
Les articles dans les conférences CIDE 

Wikipédia et ISTEX

CIDE 2016 LorExplor Athènes Diapositive04.jpg
Créer et explorer la connaissance
CIDE 2016 LorExplor Athènes Diapositive05.jpg
CIDE 2016 LorExplor Athènes Diapositive06.jpg

Infrastructure LorExplor

CIDE 2016 LorExplor Athènes Diapositive07.jpg

Le projet LorExplor s'attaque aux résolutions de problèmes éventuellement complexes menées dans un contexte de coopération (accompagnement) entre les spécialistes du domaine d'application et ceux du numérique. En pratique, deux cibles sont privilégiées :

Aide au pilotage stratégique
  • La réponse à des besoins d'exploration avec des contraintes de temps. Par exemple, dans le cadre d'une procédure de réponse à un appel à projets européens : quelles sont, par exemple, les principales équipes européennes avec lesquelles l'Université Lille 3 pourrait s'allier sur une thématique portant sur les bibliothèques numériques.
  • A côté de services très fortement concernés par ce type d'approche (relations internationales, partenariats, valorisation), toute équipe de recherche peut tirer parti de ce type d'approche une à deux fois par an. Une estimation du nombre d'interventions de ce type est comprise entre 50 000 à 150 000 par an.
Association site encyclopédique - formation
  • La constitution de sites encyclopédique de références, s'incrivant sur du long terme. Par exemple, sur ce wiki, des portails sur différents sujets comme la Text Encoding Initiative ou l'OCR.
  • Des projets éditoriaux dans le cadre de formations en Master ou en dernière année d'école d'ingénieur. Ils reposent sur des sessions d'une à deux semaines où un groupe d'étudiants rédige collectivement un dossier de synthèse sur un wiki sémantique en explorant des corpus. La même approche pour une thèse dans la phase d'étude de l'existant est plus conséquente (ordre de grandeur un mois).

Une priorité, l'exploration des connaissances

CIDE 2016 LorExplor Athènes Diapositive08.jpg
Recherche
On sait qu'une information existe, mais on a perdu le chemin pour y accéder.
Exploration
On recherche des informations que l'on ne connait pas :

Pour la plus ancienne référence à l'hypertexte voir sur le wiki Ticri/H2PTM :

Un réseau sous MediaWiki

CIDE 2016 LorExplor Athènes Diapositive09.jpg

La nature de l'information, culturelle ou scientifique, amène de fortes contraintes éditoriales. La page Aussois, sur le wiki Wicri/France, donne un exemple d'introduction. Le début utilise « de façon classique » les outils et pratiques de Wikipédia. La fin de la page a été réalisée avec les techniques présentées ici.

Exemples plus significatifs
  • Sur ce wiki :
    • cette présentation pour le colloque CIDE est enrichie par un ensemble de démonstrations, avec notamment des liens vers des serveurs d'exploration dont le contenu évolue dans le temps.
  • Dans le réseau Wicri,
    • l'adaptation de la traduction française de la pièce de Pouchkine Mozart et Salieri demande de manipuler un outil de notation musicale (LilyPond).
    • elle est intégrée dans un [wicri-musique.fr:[Wolfgang Amadeus Mozart|dossier Mozart]] qui donne accès à environ 15 000 documents (en majorité ISTEX).
Aspects techniques concernant MediaWiki

La solution MediaWiki est puissante mais son utilisation avancée demande un dispositif d'accompagnement. Sur un plan informatique il faut un soutien logistique relativement léger en termes de temps d'intervention mais possédant une solide expertise technique. Au niveau des pratiques, elle demande une stratégie de formation et d'accompagnement des contributeurs.

Semantic MediaWiki

CIDE 2016 LorExplor Athènes Diapositive10.jpg

La souche MediaWiki est déjà très riche par ses mécanismes d'indexation et l'utilisation de modèles. Cette page contient d'ailleurs un grand nombre d'appels de modèles, visualisables par l'onglet « modifier ou voir le texte source ».

Par rapport à Wikipédia le réseau Wicri utilise une extension développée par l'Université de Karlsruhe : Semantic MediaWiki.

CIDE 2016 LorExplor Athènes Diapositive11.jpg

Un atelier flexible

CIDE 2016 LorExplor Athènes Diapositive12.jpg

On trouvera de nombreuses applications dans le réseau Wicri en utilisant (dans chaque wiki) la catégorie Serveur d'exploration.

Voici quelques exemples :

CIDE 2016 LorExplor Athènes Diapositive13.jpg

Serveur d'exploration

Listes d'index

CIDE 2016 LorExplor Athènes Diapositive15.jpg
Liens vers les serveurs : Listes brutes
un exemple sur les régions du serveur Cyberinfrastructure
  1. Californie (200)
  2. Maryland (88)
  3. État de New York (74)
  4. Pennsylvanie (66)
  5. Massachusetts (61)
  6. Illinois (60)
  7. Angleterre (57)
  8. Indiana (56)
  9. Texas (49)
  10. Arizona (45)
  11. Virginie (44)
  12. Caroline du Nord (40)
  13. Washington (État) (34)
  14. Nouveau-Mexique (30)
  15. Michigan (27)
CIDE 2016 LorExplor Athènes Diapositive17.jpg

Exemples de combinaisons sur les serveurs :

CIDE 2016 LorExplor Athènes Diapositive16.jpg
CIDE 2016 LorExplor Athènes Diapositive26.jpg
CIDE 2016 LorExplor Athènes Diapositive27.jpg
CIDE 2016 LorExplor Athènes Diapositive18.jpg
CIDE 2016 LorExplor Athènes Diapositive19.jpg

Curation des données

CIDE 2016 LorExplor Athènes Diapositive20.jpg
CIDE 2016 LorExplor Athènes Diapositive21.jpg
CIDE 2016 LorExplor Athènes Diapositive22.jpg
CIDE 2016 LorExplor Athènes Diapositive23.jpg
CIDE 2016 LorExplor Athènes Diapositive24.jpg
CIDE 2016 LorExplor Athènes Diapositive25.jpg

Expérimentations

CIDE 2016 LorExplor Athènes Diapositive28.jpg
CIDE 2016 LorExplor Athènes V3 Diapositive28.jpg
CIDE 2016 LorExplor CiTu Diapositive2.jpg
CIDE 2016 LorExplor Athènes V3 Diapositive30.jpg
CIDE 2016 LorExplor CiTu Diapositive5.jpg

Questions

CIDE 2016 LorExplor Athènes V3 Diapositive32.jpg

Un exemple de réflexion à partir de ces serveurs est donné dans une page de type « blog » :

CIDE 2016 LorExplor Athènes Diapositive35.jpg

Voir aussi

Sur ce wiki