HIS (2023) Ducloy : Différence entre versions

De Wicri Chanson de Roland
(Un projet de bibliothèque numérique aux objectifs multiples)
(Introduction)
Ligne 27 : Ligne 27 :
 
Cet article propose quelques réflexions sur l'appropriation des technologies numériques pour la valorisation du patrimoine culturel.
 
Cet article propose quelques réflexions sur l'appropriation des technologies numériques pour la valorisation du patrimoine culturel.
  
Elle est motivée par une analyse de la situation française basée sur des expériences vécues dans des applications prestigieuses comme le dictionnaire du Trésor de la langue française ou les bases de données. Pour proposer des voies de redressement nous avons travaillé sur deux technologies complémentaires : l'ingénierie XML d'une part, les wikis sémantiques de l'autre.
+
Dans ses motivations, il s'appuie sur une analyse d'expériences vécues en France avec le dictionnaire du Trésor de la langue française ou la bases de données Francis. Après une phase vécue comme prestigieuse, elles ont été abandonnées. Pour proposer des voies de redressement nous avons travaillé sur deux technologies complémentaires : l'ingénierie XML d'une part, les wikis sémantiques de l'autre.
  
 
Appliquées initialement sur les publications scientifiques, elles se sont avérées très performantes sur la gestion et la publication de données complexes dans les humanités numériques. Par des concours de circonstances, nous avons été amené à mener des investigations sur la Chanson de Roland. Cette thématique apparemment très spécialisée se comporte en réalité comme un point d'entrée pour l'exploration de plus de 10 siècles d'histoire, de littérature, de musique, de linguistique à un niveau international.
 
Appliquées initialement sur les publications scientifiques, elles se sont avérées très performantes sur la gestion et la publication de données complexes dans les humanités numériques. Par des concours de circonstances, nous avons été amené à mener des investigations sur la Chanson de Roland. Cette thématique apparemment très spécialisée se comporte en réalité comme un point d'entrée pour l'exploration de plus de 10 siècles d'histoire, de littérature, de musique, de linguistique à un niveau international.

Version du 21 juillet 2023 à 06:42

Titre envisagé 

Appropriation joyeuse du numérique pour la valorisation du patrimoine culturel, un exemple avec la Chanson de Roland.

Résumé
Nous avons lancé il y a plus de deux ans un projet de bibliothèque numérique.
Avant-propos destiné aux évaluateurs

Cet article propose une réflexion motivée par un parcours professionnel avec des témoignages portant sur des évènements ayant eu large visibilité. Le cadre d'application résultant, un wiki sur la Chanson de Roland, est immédiatement identifiable. Enfin l'article propose un mode rédactionnel qui privilégie la lecture en ligne.

Pour cet ensemble de raisons, les contraintes du double aveugle sont impossibles à respecter et conduiraient à un résultat illisible. Nous avons donc décidé de ne pas appliquer les mécanismes d'anonymisation.

Avant-propos figurant dans l'article soumis


Quelques notes de bas de page ont été remplacées par des liens.

Avant-propos

Cet avant-propos est remplacé par une version propre à la version papier dans l'article soumis

Cet article reprend intégralement le texte d'un article présenté au symposium international sur l'HyperHeritage (HIS).

Introduction

Cet article propose quelques réflexions sur l'appropriation des technologies numériques pour la valorisation du patrimoine culturel.

Dans ses motivations, il s'appuie sur une analyse d'expériences vécues en France avec le dictionnaire du Trésor de la langue française ou la bases de données Francis. Après une phase vécue comme prestigieuse, elles ont été abandonnées. Pour proposer des voies de redressement nous avons travaillé sur deux technologies complémentaires : l'ingénierie XML d'une part, les wikis sémantiques de l'autre.

Appliquées initialement sur les publications scientifiques, elles se sont avérées très performantes sur la gestion et la publication de données complexes dans les humanités numériques. Par des concours de circonstances, nous avons été amené à mener des investigations sur la Chanson de Roland. Cette thématique apparemment très spécialisée se comporte en réalité comme un point d'entrée pour l'exploration de plus de 10 siècles d'histoire, de littérature, de musique, de linguistique à un niveau international.

Nous avons donc décidé d'investir sur la création d'une vaste bibliothèque numérique où l'on puisse expérimenter l'ensemble des actions liées à la recherche, depuis la transcription des données jusqu'à la diffusion de connaissances vers le grand public.

Appropriation du numérique par les chercheurs et acteurs de l'innovation dans les humanités

Cette partie propose une réflexion sur 60 ans d'engagement au service de l'appropriation du numérique par les chercheurs et acteurs de l'innovation.

Années 60 - 75 immersion des informaticiens dans les applications

Dans le contexte du Plan Calcul (1966) en France, le monde de la recherche s'est emparé de l'informatique avec des modes de fonctionnement très différents suivant les disciplines.

Les chercheurs confrontés au calcul numérique se sont rapidement appropriés des outils comme Algol 60 ou Fortran. Cette démarche n'était pas anodine. En effet, en 1956 à Nancy, dans son livre sur la résolution des équations aux dérivés partielles, Jean Legras, écrivait :

« L’ingénieur, le physicien se trouvent souvent devant les problèmes que les mathématiciens classiques n’ont pas pu résoudre. Il leur faut alors, ou renoncer à l’emploi de l’outil mathématique, ou utiliser des méthodes moins strictes, que réprouvent les mathématiciens, mais qui sont seules capables de les dépanner. »

Pour illustrer un véritable changement de paradigme, il ajoutait :

« Il est alors indispensable que l’ingénieur, le physicien et tous ceux qui s’occupent de mathématiques appliquées, soient capables de se dégager du complexe inhibitif de rigueur que leur a imposé leur éducation, et qu’ils osent se lancer à l’aventure : la vérification expérimentale sera là pour leur crier casse-cou le cas échéant. »

Au même moment, Paul Imbs, toujours à Nancy, lançait la réalisation sur 20 ans d'un dictionnaire de langue, le Trésor de la langue française, en utilisant des ordinateurs. Mais le mode d'action a été fondamentalement différent. En effet, les technologies disponibles, comme le langage machine dans un contexte technique souvent très complexe relevaient d'ingénieurs qui ont du s'approprier la problématique du domaine. Malheureusement ces équipes de haute compétence avaient souvent des durées de vie limitées au développement initial. Par exemple dans le cas du TLF, la compagnie Bull avaient affecté des ingénieurs pour constituer cette vitrine pour l'ordinateur « gamma 60 ».

Systèmes de recherche d'information

Les années 70 ont vu naitre les systèmes de recherche d'information comme IBM/Stairs aux Etats-Unis ou Mistral en France.

Les limites des systèmes intégrés dans les bibliothèques et la constitution des bases de données bibliographiques

Le projet Wicri

Un projet numérique sur la Chanson de Roland

Premières étapes

Le 15 aout 778, de retour d'Espagne, Charlemagne perd son arrière-garde, tombée, à titre de représailles, sous le feu des troupes des seigneurs basques dont il a attaqué les possessions. Lors de la bataille de Roncevaux, l'arrière-garde est écrasée, provoquant la mort de nombreux braves de l'entourage de Charlemagne, dont celle de Roland, préfet de la Marche de Bretagne.

Tels sont les faits racontés par Éginhard au chapitre neuvième de sa Vita Karoli Magni (Vie de Charlemagne), et, par exemple, rappelés par Léon Gautier dans son édition populaire de 1895.

Nous montrerons plus loin l'ampleur prise par cet événement pendant plus 10 siècles au niveau international. Nous voulons ici simplement rappeler les premières étapes du projet.

En 2014, suite à nos travaux sur la réédition d'articles anciens, nous avons été sollicité par Isabelle Turcan pour accompagner un étudiant d'une filière "Métiers du livre" pour numériser un ouvrage annoté. Plus précisément, il s'agissait d'une édition critique d'un manuscrit (celui d'Oxford) publiée en 1869 par Francique Michel. Cet ouvrage était annoté par Paul Meyer.

Figure 8 : exemples d’annotations

Le démarrage a été très rapide avec un expert en numérique (votre serviteur) à mi temps pour former le stagiaire et développer quelques modèles MediaWiki (pour réaliser la mise en page). L'étudiant a commencé à produire des résultats pertinents en quelques jours. A la fin du stage, toutes les pages annotées avaient été traitées et une partie conséquente de l'ouvrage avait été transcrit en code wiki. Nous avons alors profité de cette première étape pour faire une démonstration (à destination des philologues) sur l'utilisation des wikis sémantiques en annotant les variantes d'orthographe dans le nom des personnages.

En mai 2021 un nouveau stage a conduit à mettre en place un projet de plus conséquent en visant un nouveau public : celui des choristes. En effet dans le cadre de travaux sur une bibliothèque numérique en musique, nous avons localisé une suite pour chœur et orchestre basée justement sur le manuscrit d'Oxford. Nous avons demandé aux stagiaires de mettre en relation les vers de l'oratorio avec le texte de Francisque Michel, en introduisant, à titre d'illustration, des facsimilés de feuillets du manuscrit.

Après un démarrage plutôt satisfaisant sur les premières strophes, des incohérences de numérotation de vers sont rapidement apparues. En effet, Gilles Mathieu avait travaillé à partir d'une autre édition critique (Léon Gautier). Le modèle hypertexte s'est donc fondamentalement modifié, avec 2 éditions critiques à prendre en compte. Le manuscrit devient alors le composant fondamental pour l'organisation numérique.

HIS 2023 figure 2.jog.jpg

Il a donc fallu modifier en profondeur le modèle initial. Dans notre réflexion sur l'usage du numérique, ce premier problème, découvert au bout de quelques jours de développement, nous a semble particulièrement démonstratif. Nous avons donc décidé d'analyser le potentiel de cette thématique pour un grand projet de bibliothèque numérique.

Un projet de bibliothèque numérique aux objectifs multiples

En quelques mois, nous disposions d'un ensemble déjà démonstratif. Lors d'un séminaire de travail (avec des philologues) sur le fonds Paul Meyer, nous avons déjà découvert que nous pouvions déjà mettre en évidence des faits peu connus. Par exemple, nous avions localisé l'ouvrage cible des annotations de Paul Meyer. Nous avions commencé à identifier la communauté des chercheurs qui, autour de l’École des Chartes et de la revue Romania examinaient et commentaient des éléments fortement localisés (un mot dans une laisse donnée...). Il nous a donc paru intéressant d'étudier une infrastructure numérique utilisable par des chercheurs pour leurs investigations et pas seulement pour la diffusion des résultats. Le fonds Paul Meyer et sa valorisation offre un premier axe de réflexion.

Du côté musical, la perspective d'un concert ouvre deux axes complémentaires. S'agissant d'une suite qui n'a pas eu beaucoup de représentation, il faut envisager des « négociations » entre le compositeur et un directeur artistique. Nous avons donc décidé de transcrire en code LilyPond l'ensemble des partitions pour être capables générer de nouvelles partitions en quelques jours. Nous avons aussi cherché à donner des consignes de prononciation correctes pour les vers du manuscrit. Ceci implique un alignement très précis sur les vers du manuscrit en remontant vers un glossaire qui peut donner des indications.

A l'occasion de manifestations grand public comme les « fêtes de la science » nous avons été confronté à un phénomène de pertes de racines culturelles en quelques génération :

  • En 1881, était officiellement désignée comme l’un des textes classiques à l’usage des élèves de seconde,
  • En 1906, dans une revue de grande diffusion pour la jeunesse, on peut trouver une bande dessinée sur Roland.
  • Dans les années 50 à 60, la Chanson faisait encore l'objet d'études dans les lycées. Elle était également présentée dans les cours d'histoire pour les cours élémentaires. Le manuel d'Histoire de France diffusé par Nathan en 1955 consacre 2 pages (sur 80) à Roland (autant que pour Charlemagne, Louis XIV fait mieux avec 4 pages).

Données volumétriques

Bibliographie

[Ducloy 2019] DUCLOY, Jacques,  (2019). Systèmes d’information encyclopédiques édités par les scientifiques, Revue ouverte d’ingénierie des systèmes d’information, 1, 2019


Voir aussi