Nuvola apps important.png Attention, suite à une faille de sécurité, les liens vers les serveurs d'exploration sont désactivés.

INFORSID Nancy (2004) Ducloy

De Wicri SIC
logo lien interne Cette page est en phase de création pour des raisons de cohérence des liens dans ce wiki (ou au sein du réseau Wicri).
Pour en savoir plus, consulter l'onglet pages liées de la boîte à outils de navigation ou la rubrique « Voir aussi ».


Analyser et écrire la science multidisciplinaire dans un réseau d’hypertextes sémantiques avec Wicri

Démonstration


 
 

Titre
Analyser et écrire la science multidisciplinaire dans un réseau d’hypertextes sémantiques avec Wicri
Auteurs
Jacques Ducloy
Affiliation
Laboratoire Paragraphe, (Université Paris 8)
In
INFORSID 2024 Nancy


Résumé
Le projet WICRI travaille notamment sur une alternative potentielle à la galaxie Wikipédia pour les communautés scientifiques. Il prend également en compte des besoins d’analyse de corpus avec une boîte à outil XML pour la création de systèmes d’informations. Enfin, dans ce réseau culturel, les rééditions hypertextes d’ouvrages ancien et de manuscrits est particulièrement adapté aux applications avancées dans les humanités numériques (avec notamment une bibliothèque numérique sur la Chanson de Roland).
Abstract
The WICRI project aims at a potential alternative to the Wikipedia galaxy for scientific communities. It also takes into account corpus analysis needs with an XML toolbox for the creation of information systems. Finally, in this cultural network, hypertext reissues of old works and manuscripts are particularly suited to advanced applications in digital humanities (including a digital library on the Song of Roland).
Mots-clés 
Semantic Mediawiki, Ingénierie XML, Réseau de Wikis, Exploration de corpus, Humanités numériques, Chanson de Roland
Keywords
Semantic Mediawiki, XML engineering, Wiki network, Corpus exploration, Digital humanities, Chanson de Roland

Introduction

Le projet présenté est issu de travaux de R&D démarrés à l’INIST en 1990. L’objectif était de construire un système de production des bases Pascal et Francis (500.000 analyses par an par environ 400 ingénieurs) avec des mécanismes d’indexation assistée intégrant les spécificités de chaque secteur scientifique. Pour favoriser les coopérations, il fallait également prendre en compte l’ensemble des besoins informationnels de la recherche et de l’innovation dans un espace mondialisé interdisciplinaire.

Puis, assez rapidement (en 1992), dans un contexte de bulle internet, le CNRS a engagé un virage à 180° en espérant créer un groupe commercial de type vente par correspondance. Le département de R&D a été dissous, en dépit de premiers résultats très prometteurs. Nous avons cependant décidé de garder ce cap pour travailler sur une réflexion allant de l’ingénierie aux pratiques avancées des chercheurs et des partenaires de la recherche

Nous disposons d’un démonstrateur qui apporte un début de preuve de concept. Il permet déjà de réaliser des premiers services opérationnels et de mener de multiples expérimentations, soit technologiques, sur les systèmes de réseau hypertexte, soit éditoriales, comme l’écriture hypertexte collaborative ou multidisciplinaire.


Histoire des projets Dilib et Wicri

En 1991, le premier résultat obtenu à l’INIST était une boîte à outil SGML (en préfiguration d’XML). Reprise par le Loria sous l’appellation Dilib, elle permettait de réaliser des serveurs d’exploration de corpus bibliographiques hétérogènes en associant des mécanismes de classification à des fonctions plus classiques de type moteur de recherche. Il était ainsi possible de réaliser des applications de taille modeste avec un grand niveau d’interdisciplinarité (comme une base iconographie et bibliographique sur l’art nouveau) ou des services à volumétrie conséquente (l’intégralité des bases Pascal et Francis).

Un deuxième axe a été initialisé par une réflexion autour de Wikipédia qui semblait apporter des éléments de réponse à la gestion des flux de contributions rencontrés dans la production des bases. Elle nous a amené à travailler sur une alternative à cette encyclopédie pour la production d’informations produites par la recherche (et donc souvent nouvelles et non sourcées). En effet, nous avons choisi de travailler sur une collection d’encyclopédies thématiques qui peuvent être pilotées et modérées par des comités scientifiques. En 2008, un démonstrateur (Wicri) a donc été construit sous la forme d’un réseau de wikis dopés par des mécanismes d’annotation sémantique (avec Semantic MediaWiki). Grâce un financement CPER le réseau a acquis une dimension multidisciplinaire, notamment dans les sciences liées à la santé et l’environnement.

Dans le cadre d’ISTEX, le projet LorExplor en 2013 a permis de rapprocher les deux approches. Plus précisément, des serveurs d’exploration ont été intégrés à la base Wiki sémantique. En amont, des mécanismes de curation sont basés sur des formalisations gérées dans les wikis. En aval, la bibliothèque XML offre des procédures de génération de modèles en utilisant par exemple les outils de visualisation géographique de Wikipédia.

La fin des financements ISTEX a réduit les capacités de coopération. Nous avons donc recherché des thématiques que nous pouvions explorer sans l’obligation technique de recourir à une expertise extérieure (comme la santé). Une première série d’expériences en musique a amené à enrichir notre panoplie de services avec des rééditions hypertexte d’ouvrages avec des éléments musicaux (comme le Dictionnaire de Jean-Jacques Rousseau). En 2020, une nouvelle étape a été franchie avec une bibliothèque numérique sur la Chanson de Roland. Ici, pratiquement chaque document (strophe d’un manuscrit, chapitre d’une édition critique, article de recherche, partition) demande un traitement numérique spécifique. Chaque mot d’un manuscrit (ou d’une note de philologue) peut devenir un élément hypertexte dont les explications peuvent de développer dans plusieurs wikis.


Le démonstrateur Wicri

Le réseau actuel comporte un ensemble expérimental encyclopédique étendu (avec par exemple des rééditions d’ouvrages et des extraits de bases de données) développé sur 150 wikis. Il offre également des applications stabilisées comme la revue les mots de l’agronomie de l’INRAE.

WicriRéseauGabarit3.png

Pour aller sur Wicri/Wicri (fr)

Pour aller sur le wiki d'accueil du domaine lorexplor.ixtex.fr (fr)

Pour aller sur le pool d'images du réseau Wicri sur le domaine lorexplor.istex.fr

Pour aller sur le wiki d'accueil du réseau Wicri sur le domaine wicri-demo.istex.fr

Pour aller sur le pool d'images du réseau Wicri sur le domaine wicri-demo.istex.fr

Pour aller sur le wiki de service Wicri/Manuel (fr)

Pour aller sur le wiki de service Wicri/Base 1.28 (fr)

Pour aller sur le wiki de service Wicri/Base 1.31 (fr)

Pour aller sur le wiki de service Wicri/Métadonnées (fr)

Pour aller sur Wicri/Outils (fr)

Pour aller sur Wicri/Archéologie (fr)

Pour aller sur le wiki Wicri/Arts (fr)

Pour aller sur le wiki Wicri/Musique (fr)

Pour aller sur Wicri/Ingénierie (fr)

Pour aller sur Wicri/Informatique (fr)

Pour aller sur Wicri/Sic (fr)

Pour aller sur le wiki Wicri/Histoire des sciences (fr)

Pour aller sur le wiki Wicri/Histoire de l'IST (fr)

Pour aller sur Wicri/Linguistique (fr)

Pour aller sur Wicri/Mathématiques (fr)

Pour aller sur Wicri/Santé (fr)

Pour aller sur le wiki Wicri/Psychologie (fr)

Pour aller sur Wicri/Biomasse (fr)

Pour aller sur Wicri/Eau (fr)

Pour aller sur Wicri/Bois et forêts (fr)

Pour aller sur Wicri/Terre (fr)

Pour aller sur Wicri/Sols urbains (fr)

Pour aller sur Wicri/Agronomie (fr)

Pour lire les Mots de  l'Agronomie (fr)

Pour aller sur Wicri/Animaux (fr)

Pour aller sur le wiki des émérites de Lorraine (fr)

Pour aller sur Wicri/Artist (fr)

Pour aller sur Wic/Sic/Cide (fr)

Pour aller sur Wic/Sic/H2PTM (fr)

Pour aller sur Wicri Sic/VSST (fr)

Pour aller sur le wiki du réseau Médici (fr)

Pour aller sur Wicri/Afrique (fr)

Pour aller sur Wicri/Amérique (fr)

Pour aller sur Wicri/Asie (fr)

Pour aller sur Wicri/Europe (fr)

Pour aller sur Wicri/Océanie (fr)

Pour aller sur Wicri/Belgique (fr)

Pour aller sur Wicri/Allemagne (fr)

Pour aller sur Wicri/France (fr)

Pour aller sur Wicri/Luxembourg (fr)

Pour aller sur Wicri/Francophonie (fr)

Pour aller sur Wicri/Maroc (fr)

Pour aller sur Wicri/Brésil (fr)

Pour aller sur Wicri/Canada (fr)

Pour aller sur Wicri/Grande Région (fr)

Pour aller sur Wicri/Rhénanie-Palatinat (fr)

Pour aller sur Wicri/Sarre (fr)

Pour aller sur Wicri/Wallonie (fr)

Pour aller sur Wicri/Chanson de Roland (fr)

Pour aller sur Wicri/Grand Est (fr)

Pour aller sur Wicri/Grand Est (fr)

Pour aller sur Wicri/Alsace (fr)

Pour aller sur Wicri/Lorraine (fr)

Pour aller sur Wicri/Histoire Lorraine (fr)

Pour aller sur Wicri Lorraine/Bul Nancy (fr)

Pour aller sur Wicri/Nancy (fr)

Pour aller sur Wicri/Île-de-France (fr)

Le réseau Wicri

En termes de volumétrie, le réseau contient 200.000 pages wiki (avec 40.000 articles conséquents et 13.000 fichiers multimédia). En complément, 150 serveurs d’exploration donnent accès à plus d’un demi-million de documents.


Démonstrations proposées

Le réseau propose un très vaste champ de démonstrations. De façon générale il est possible de voir la multiplicité des relations sémantiques et les mécanismes de cohérence dans le réseau de wikis. Au-delà de cette base, trois applications significatives sont proposées.

La Chanson de Roland est un ensemble qui contient déjà près de 4.000 pages significatives (chapitres d’ouvrage, verset de manuscrit avec différentes analyses critiques, etc).

L’Histoire de l’Information scientifique et technique est une thématique en cours de démarrage et qui doit se décliner dans l’ensemble des wikis du réseau.

Enfin, à l’occasion du COVID une vingtaine de serveurs d’explorations ont été réalisés avec une procédure rapide de mise en place (quelques minutes).


Remarques et perspectives

Le démonstrateur Wicri montre l’intérêt de cette technologie dans les applications de la recherche où les approches classiques des systèmes d’information échouent ou donnent lieu à des développements particulièrement laborieux.

Nous démarrons une nouvelle étape dans laquelle nous allons étudier une répartition du réseau Wicri sur plusieurs sites physiques. Avec des moyens limités (un seul permanent, le retraité auteur de cet article), nous allons démarrer avec 2 sites dans un premier temps et avec une augmentation du nombre des wikis (pour prendre en compte, par exemple, l’ensemble des régions françaises).

Pour aborder une vraie dimension internationale, compétitive avec la volumétrie de la Wikimedia Fundation, il faudrait passer à quelques milliers de wikis sur une centaine de sites. Cet objectif nous semble difficile et ambitieux mais techniquement abordable pour la communauté universitaire. De plus, il débouche sur l’enrichissement d’une infrastructurel de formation, expérimentation et même de services…