HIS 2021 Casablanca/Atelier Wicri/Résumé

De Wicri Chanson de Roland

Cette page reproduit le résumé envoyé à HIS.7 pour évaluation.

Les commentaires des relecteurs sont visibles en page Discussion.

Pour rejoindre la page d'accueil de l'atelier de rédaction de l'article.

Le texte soumis

Titre et mots-clés

Auteurs
Jacques Ducloy, Jean-Pierre Thomesse, Thierry Daunois, Frédérique Péguiron.
Titre
Bibliothèques encyclopédiques pour la valorisation du patrimoine
Sous-titre
des enluminures sémantiques à la rédaction collective
Mots-clés
patrimoine numérisé ; valorisation du patrimoine ; réédition hypertextuelle ; wikis sémantiques ; exploration de corpus ; musique et littérature

Résumé

Nous présentons un modèle de bibliothèque numérique qui intègre diverses pratiques de valorisation numérique du patrimoine écrit dans un vaste environnement collaboratif.

La bibliothèque repose sur un réseau d’encyclopédies thématiques (implémentées avec le moteur MediaWiki, choisi pour la richesse de ses mécanismes de personnalisation). Cet ensemble est complété par un autre réseau, organisé sur une base géographique. Une communauté (ou une institution) peut développer ses propres solutions adaptées à sa problématique scientifique, et contribuer sur l’ensemble commun. Un sujet peut ainsi être abordé avec des points de vue différents, par exemple, musical, linguistique, régional et contexte culturel (ou religieux).

Un mode d’action privilégié est la réédition hypertexte d’articles scientifiques (ou historiques). Un texte peut ainsi bénéficier de divers enrichissements et notamment par des annotations qui le relient au substrat encyclopédique, et bien sûr à d’autres ouvrages. Ceci s’applique notamment aux documents extraits de sources comme Persée, Gallica, Europeana ou Internet Archive. Les anciens dictionnaires et encyclopédies se révèlent particulièrement intéressants pour structurer un domaine dans son histoire. L’utilisation technique d’extensions sémantiques permet alors d’améliorer considérablement les processus de mise en cohérence des données et leur rapprochement.

Sur cette infrastructure, une boîte à outils XML permet de construire des systèmes d’exploration de corpus issus de services comme ISTEX ou PubMed. Les ontologies qui structurent les articles de référence au sein des encyclopédies vont être utilisées pour offrir au lecteur, sur un sujet donné, une navigation continue vers des ensembles « bruts » de plusieurs milliers d’articles.

Enfin, grâce à la généricité des outils utilisés, les applications peuvent être réalisées directement par les acteurs concernés, chercheurs ou praticiens. La formation joue donc un rôle fondamental.

Dans ce contexte, la musique, par son caractère universel, joue un rôle privilégié. La disponibilité du logiciel LilyPond (composition musicale) permet de montrer de façon quasi évidente un intérêt de ce montage. En effet, un lecteur, qui parcourt, par exemple, les articles du dictionnaire de musique de Jean-Jacques Rousseau, peut y écouter les partitions musicales. Il réalise immédiatement la différence entre la simple duplication d’un codex (le PDF) et un ouvrage réellement hypertextuel. Un wiki est ainsi dédié aux musiciens amateurs (les choristes…) où ils peuvent travailler leurs partitions et surtout en comprendre le contexte culturel. Sur ce même espace numérique, des musicologues abordent des sujets plus complexes, comme, par exemple, la transcription de partitions de la Renaissance.

Sur un thème donné, des documents hétérogènes peuvent être mis en interrelation. Par exemple, autour de la chanson de Roland, une expérimentation démarre avec un ouvrage annoté par Paul Meyer, des facsimilés indexés du manuscrit d’Oxford, des extraits de dictionnaires (dont le Trésor de la langue française), un serveur d’exploration, et… une composition musicale contemporaine pour chœurs et orchestre. On y manipule également des annotations sémantiques sur les variantes de dénomination.

Le démonstrateur actuel regroupe déjà plus de 10.000 articles conséquents, distribués sur des dizaines de wikis, avec 500.000 documents explorables. L’homogénéisation des ontologies est un point important pour lequel des solutions sont implémentées. Nous évoquerons les solutions pour changer d’échelle (aller vers des centaines de wikis pour des centaines de communautés).

Bibliographie

5 références relatives au projet (non détaillées pour anonymisation)

  • [1992] fondations de l’ingénierie XML utilisée
  • [2000] Application à la navigation dans une base iconographique sur l’Art nouveau
  • [2010] Conférence internationale où le réseau de wikis sémantiques a été présenté (en anglais)
  • [2018|Bilan sur l’exploration de corpus ISTEX
  • [2019] Article dans une revue (Systèmes d’information encyclopédiques pilotés par les scientifiques)

Références sur d’autres initiatives (extrait)

  • [Gray 2006] Gray J., et al. (2006). Scientific Data Management in the Coming Decade, ACM SIGMOD, New York, NY, USA
  • [Laborderie 2015] Arnaud Laborderie, Éditorialisation des bibliothèques numériques : le cas des Essentiels de Gallica, In: CIDE 2015, Montpellier
  • [Turgeon 2009] Turgeon L., Le patrimoine ethnologique et les nouvelles technologies web, In : CIDE 2009 Montréal

Références concernant des articles qui sont réédités sur les wikis (non détaillées pour anonymisation).