WicriExplore (2020) Ducloy

De Wicri Wicri Fr

En guise de visite guidée du réseau Wicri

Une bibliothèque numérique encyclopédique, un atelier flexible d’analyse de corpus ; pour chercheurs et praticiens dans la diversité des sciences


 
 

Illustration évoquant le prodesseur Nimbus Visite guidée
Cette page est un point de départ pour une visite guidée du réseau Wicri

Elle utilise les diapositives présentées par Jacques Ducloy lors d'une conférence donnée le 9 décembre 2020 à l'Université de Lorraine. Le sous-titre a été modifié.

Les diapositives (introduction)
logo travaux Ce document est édité sur un environnement en cours d'installation (Voir le cahier de suivi). Il est donc indirectement utilisé pour la mise au point des outils sur le domaine « wicri-demo.istex.fr«.

L'ensemble des diapositives est stabilisé. En revanche les textes explicatifs sont dans un état embryonnaire. Les suggestions et remarques sont bienvenues.

Jacques Ducloy (discussion) 9 décembre 2020 à 08:21 (CET)

Introduction

SemCogni00intro.pdf

Le projet actuellement nommé WicriExplore, depuis son adoption par le laboratoire Paragraphe (Université Paris 8), trouve ses racines depuis les années 70 dans l'histoire informatique lorraine, avec par exemple le Trésor de la langue française (TLF), et dans celle de l'information scientifique et technique française.

Sur un plan technique, elle s'appuie sur quelques projets démarrés depuis 1990 :

  • en 1993, Dilib, une boîte à outils XML, issue d'une première expérience ("Ilib") à l'Inist, puis poursuivie au Loria, avec de nouveaux développements à l'Inist en 2000.
  • en 2008, Wicri, un réseau de wikis sémantiques pour la recherche et l'innovation, créé au Loria, avec Jean-Pierre Thomesse, alors DRRT Lorraine et Thierry Daunois (INPL puis Université de Lorraine).
  • LorExplor

Changements de paradigmes

De la tablette à l'hypertexte en passant par le codex

SemCogni00intro.pdf
Cuneiform tablet- private letter MET DP110638.jpg
Depuis plusieurs millénaires avant Jésus-Christ les messages ont été échangés avec des moyens divers tels que tablettes d'argiles (voir l'image active de gauche) ou des rouleaux de papyrus.
Codex Glazier.JPG

Le modèle du livre apparaît, quelques siècles avant notre ère, sous la forme d'un assemblage de manuscrits : le codex. L'arrivée de l'imprimerie conserve en fait ce modèle de document.

Dès les années 50, la défense américaine lance des actions pour la manipulation et la manipulation de documents textuels, comme par exemple avec la projet Fieldata. Dans les années 70, à Palo Alto, le PARC de la société Xerox développent des prototypes de systèmes WYSIWYG qui seront repris par Apple pour populariser MacWrite. Mais le modèle de document, même avec PDF, est toujours le même que celui du codes : un ensemble séquentiel de pages.

En 1965, Ted Nelson invente le terme hypertexte pour désigner un document composé d'unités textuelles autonomes et reliées par des liens. Dans un premier temps des applications individuelles ont été développées comme HyperCard d'Apple en 1987. En 1889, un saut paradigmatique est apporté par Tim Berners Lee en proposant le langage HTML, associé au protocole HTTP, pour une interconnexion d'hypertextes au niveau mondial : le World Wide Web. Enfin, dans les années 2000, Wikipédia démontre que des centaines de milliers de contributeurs peuvent participer à la réalisation d'un immense document commun : une encyclopédie.

Le projet WicriExplore s'intéresse à la généralisation de ce modèle éditorial aux productions de la recherche.

Mais en fait, ce changement de paradigme dépasse la document pour revisiter la notion même de bibliothèque.

La bibliothèque devient aussi un hypertexte

SemCogni00intro.pdf

Pendant plusieurs millénaires, une bibliothèque, comme celle de Celsus à Éphèse est un bâtiment. Les écrits, sous formes diverses, depuis la tablette jusqu'au CD-ROM, y sont « juxtaposés » sur des rayonnages.

Avec le numérique une bibliothèque devient un domaine internet identifié par une url. Le réseau Wicri propose un modèle où un rayonnage est remplacé par un site web, un wiki sémantique en l’occurrence.

WicriRéseauGabarit3.png

Pour aller sur Wicri/Wicri (fr)

Pour aller sur le wiki d'accueil du domaine lorexplor.ixtex.fr (fr)

Pour aller sur le pool d'images du réseau Wicri sur le domaine lorexplor.istex.fr

Pour aller sur le wiki d'accueil du réseau Wicri sur le domaine wicri-demo.istex.fr

Pour aller sur le pool d'images du réseau Wicri sur le domaine wicri-demo.istex.fr

Pour aller sur le wiki de service Wicri/Manuel (fr)

Pour aller sur le wiki de service Wicri/Base 1.28 (fr)

Pour aller sur le wiki de service Wicri/Base 1.31 (fr)

Pour aller sur le wiki de service Wicri/Métadonnées (fr)

Pour aller sur Wicri/Outils (fr)

Pour aller sur Wicri/Archéologie (fr)

Pour aller sur le wiki Wicri/Arts (fr)

Pour aller sur le wiki Wicri/Musique (fr)

Pour aller sur Wicri/Ingénierie (fr)

Pour aller sur Wicri/Informatique (fr)

Pour aller sur Wicri/Sic (fr)

Pour aller sur le wiki Wicri/Histoire des sciences (fr)

Pour aller sur le wiki Wicri/Histoire de l'IST (fr)

Pour aller sur Wicri/Linguistique (fr)

Pour aller sur Wicri/Mathématiques (fr)

Pour aller sur Wicri/Santé (fr)

Pour aller sur le wiki Wicri/Psychologie (fr)

Pour aller sur Wicri/Biomasse (fr)

Pour aller sur Wicri/Eau (fr)

Pour aller sur Wicri/Bois et forêts (fr)

Pour aller sur Wicri/Terre (fr)

Pour aller sur Wicri/Sols urbains (fr)

Pour aller sur Wicri/Agronomie (fr)

Pour lire les Mots de  l'Agronomie (fr)

Pour aller sur le wiki du réseau Médici (fr)

Pour aller sur Wicri/Artist (fr)

Pour aller sur Wic/Sic/Cide (fr)

Pour aller sur Wic/Sic/H2PTM (fr)

Pour aller sur Wicri Sic/VSST (fr)

Pour aller sur Wicri Musique/Musamat (fr)

Pour aller sur Wicri/Afrique (fr)

Pour aller sur Wicri/Amérique (fr)

Pour aller sur Wicri/Asie (fr)

Pour aller sur Wicri/Europe (fr)

Pour aller sur Wicri/Océanie (fr)

Pour aller sur Wicri/Belgique (fr)

Pour aller sur Wicri/Allemagne (fr)

Pour aller sur Wicri/France (fr)

Pour aller sur Wicri/Luxembourg (fr)

Pour aller sur Wicri/Maroc (fr)

Pour aller sur Wicri/Brésil (fr)

Pour aller sur Wicri/Canada (fr)

Pour aller sur Wicri/Grande Région (fr)

Pour aller sur Wicri/Rhénanie-Palatinat (fr)

Pour aller sur Wicri/Sarre (fr)

Pour aller sur Wicri/Wallonie (fr)

Pour aller sur Wicri/Chanson de Roland (fr)

Pour aller sur Wicri/Grand Est (fr)

Pour aller sur Wicri/Grand Est (fr)

Pour aller sur Wicri/Alsace (fr)

Pour aller sur Wicri/Lorraine (fr)

Pour aller sur Wicri/Histoire Lorraine (fr)

Pour aller sur Wicri/Nancy (fr)

Pour aller sur Wicri/Île-de-France (fr)

Enfin, même s'ils ont été conçus dans une approche éditoriale classique, les ouvrages peuvent être réédités pour entrer en relation avec leur voisinage par des mécanismes d'annotation et de liens sémantiques.

Nouvelles opportunités éditoriales

SemCogni00intro.pdf
Un exemple avec la musique

La musique offre de nombreux exemples de possibilités de réédition, avec un gain immédiat : la possibilité de rendre audible les aspects musicaux d'un ouvrage. Des exemple sont visibles sur Wicri/Musique. Voici un extrait du Dictionnaire de Musique de Jean-Jacques Rousseau :

Ce article fait appel à une partition qui se trouve dans une planche présente dans un autre tome. Le numérique permet de regrouper ces éléments et d'interpréter la partition pour la rendre audible au l'internaute qui ne sait pas solfier.

Le document peut être enrichi par des compléments ou par des liens vers des articles complémentaires. Ici par exemple la mélodie a été en fait composée par un horloger genevois qu'il est possible de renseigner.

Voici la musique décrite dans l'article :


\new Staff \with {
  midiInstrument = "bell"} {
  \relative c'' { 
   \time 3/4 \key c \major  c4 e8 g e c | g'4. c8 g e | c4 c'8 c, c c |
             a'4. c8 a f | c8 c' c c c c | \tuplet 3/2 { e,8 c' g  } g2 | g,8 b d g d b | g2. 
           g8 <e' g > <e g > <e g > <e g > <e g > | \tuplet 3/2 { g,8 g' g, } g2 | 
           g8 <d' f> <d f> <d f> <d f> <d f> | \tuplet 3/2 { g,8 g' g, } g2 | 
           \tuplet 3/2 { e'8 c c' } c4 c4 | \tuplet 3/2 { f,8 c c' } c4 c4 |
           \tuplet 3/2 { g8 e c' } c4 c4  | \tuplet 3/2 { a8 f c' } c4 c4 |
           e,8 c' c c c c | a c c c c c | c, e g c g e | c2.

  }
 
}

L'exploration de corpus

SemCogni00intro.pdf

Pour le chercheur, le paysage informationnel offre une multitude de sources volumineuses d'information.

En sciences humaines, des sites comme Gallica, Europeana, Internet Archive ou des sites de bibliothèques offrent des ressources qui exigeaient des déplacements physiques, il y a seulement 20 ans. Le réseau Wicri offre de nombreux exemples d'utilisation. De façon générale, la progression des principes de la Science Ouverte donnent accès aux archives publications, généralement en PDF.

Le projet WicriExplore s'intéresse plus particulièrement aux sources d'information qui proposent des documents en plein texte. Dans l'espace français, ISTEX offre plus de 20.000.000 de publications de ce type. La diapositive de droite est relativement ancienne. Les chiffres réactualisés fin décembre sont les suivants :

  • Mozart : 23 285
  • thulium : 7 924
  • "Moliere OR lully" : 11 778
  • "Moliere AND lully" : 145

Le projet WicriExplore offre des outils d'analyse avec une forte interface avec les wikis.

Si le texte plein pose de nombreux problèmes de curation de données (nous en parlerons plus loin), les sources de citations analysées, validées et indexées sont très riches et plus facilement analysable. Voici par exemple une carte permettant de repérer les équipes européennes qui publient sur la Covid et les lieux publics.

Cliquer sur les cercles pour atteindre les bibliographies et sur les toponymes pour aller dans les pages du wiki.

Santé

SemCogni00intro.pdf

La carte précédente a été obtenue à partir de la base PubMed maintenue par la NLM (National Library of Medicine) du département santé (NIH) du gouvernement américain.

Ce service donne accès à près de 30.000.000 de citations (validées et indexées par des experts).

La crise sanitaire de la Covid provoque une véritable explosion de publications. Dans la diapositive de droite les chiffres entre parenthèses datent de juillet 2020 (les autres de début décembre 2020)

Le projet WicriExplor est naturellement impliqué :


Plan

La suite de cette visite est détaillée sur des sections spécialisées.

Écrire science et culture dans un wiki

La première section aborde les pratiques de base pour une écriture compatible avec Wikipédia et qui offre des facilitées pour des spécialités comme la musique ou l'écriture mathématique.

logo travaux Suite de la visite en rédaction à partir de ce point

Développements par les chercheurs avec les modèles

Maîtriser les ontologies avec les wikis sémantiques

Coopérer, mutualiser avec les réseaux de wikis

Gérer la volumétrie avec XML pour explorer des corpus

Conclusion

diapositives de conclusion

SemCogni06conclusion.pdf

SemCogni06conclusion.pdf

SemCogni06conclusion.pdf

Voir aussi

Cette conférence a donné l'occasion de faire un premier test éditorial sur le wiki d'accueil du domaine wicri-demo.istex.fr :