Roland de Lassus/Ateliers/CIDE 2019 : Différence entre versions

De Wicri Musique
imported>Jacques Ducloy
(Des produits nouveaux à l'accompagnement des nouvelles pratiques)
imported>Jacques Ducloy
(Des produits nouveaux à l'accompagnement des nouvelles pratiques)
Ligne 67 : Ligne 67 :
  
 
Pendant toute la durée du troisième paradigme, un slogan était martelé : l'ambition affichée était de « décharger le chercheur des tâches documentaires ». Avec le quatrième paradigme, il faut faire exactement le contraire et accompagner le chercheur dans la maîtrise des outils et pratiques de la connaissance numérisée !
 
Pendant toute la durée du troisième paradigme, un slogan était martelé : l'ambition affichée était de « décharger le chercheur des tâches documentaires ». Avec le quatrième paradigme, il faut faire exactement le contraire et accompagner le chercheur dans la maîtrise des outils et pratiques de la connaissance numérisée !
 +
 +
===Des sciences de l'information, à la musicologie, en passant par l'environnement===
 +
Après avoir pensé « outils et prestations pour les chercheurs », il nous paraissait donc important de nous immerger dans une activité scientifique afin de mieux comprendre les interrelations des pratiques.
 +
 +
Les orientations données au réseau Wicri concernaient les sciences de l'environnement. Il serait effectivement stratégique de mener une expérimentation dans une des disciplines où nous avons déjà posé des jalons, comme l'eau, le bois, la forêt, les matériaux ou la santé. Nos premières expériences ont montré qu'une expertise solide dans les fondements théoriques étaient indispensables pour interpréter les résultats d'une expérimentation et émettre de nouvelles hypothèses.
 +
 +
Nous avons naturellement mené des travaux d'investigation scientifique dans les approches numériques des sciences de l'information. Mais ce domaine présente une spécificité paradoxale. En effet, il n'est pas nécessaire de lire un article pour comprendre la démarche algorithmique d'un collègue. Une discussion suffit ! Un colloque comme CIDE offre un cadre unique pour la veille scientifique. Le fait d'y soumettre un article est fondamental pour clarifier des concepts. La présentation publique ou la démonstration sont importantes. Mais la lecture n'est que rarement indispensable et le besoin d'exploration de corpus est donc un peu marginal.
 +
 +
Nous avons donc cherché un domaine impliquant des traitements de corpus, où nous n'avions pas forcément de fortes compétences mais une forte motivation pour acquérir une expertise et une érudition. Les premières investigations lancées sur la musique de la Renaissance ont mis en évidence le fait que, dans ce domaine de la musicologie, les besoins d'exploration de corpus dépassent nos espérances...
  
 
==Bibliographie==
 
==Bibliographie==

Version du 29 novembre 2018 à 18:36

Pratiquer la musicologie dans une bibliothèque numérique encyclopédique


 
 

Théorème de Pythagore Expérimentation sur la rédaction d'un article proposé à un congrès
Cette page accueille une proposition d'article numérique complétant la version papier d'un l'article soumis au colloque CIDE 2019 Djerba.
logo travaux L'installation d'une version initiale à partir du manuscrit soumis au comité de lecture est en cours
Titre
Pratiquer la musicologie dans une bibliothèque numérique encyclopédique
Auteur
Jacques Ducloy, Thierry Daunois
Affiliation
Université de Lorraine
Résumé
Cet article présente une bibliothèque numérique structurée par une infrastructure encyclopédique réalisée avec des wikis sémantiques. Elle permet de mener simultanément et de façon collaborative la plupart des actions numériques de la recherche en sciences humaines. Nous présentons une application pilote en musicologie avec la rédaction d'articles sur Roland de Lassus pour laquelle on s'appuie sur des explorations de corpus et des éditions diplomatiques.
Avant-propos
Par rapport aux objectifs de CIDE.21, la rédaction de cet article est aussi une illustration des nouvelles pratiques rédactionnelles dans la recherche. En effet, il est travaillé et rédigé dans l'environnement hypertexte que nous présentons. Par construction, le manuscrit est donc déjà en ligne, il sera modifié suivant les remarques des relecteurs. Une version numérique, plus complète, permettant au lecteur d'analyser le travail en profondeur, est rédigée en parallèle.

Introduction

Comment vont évoluer les pratiques des chercheurs avec la connaissance dans un paysage où le numérique est omniprésent ? Cette question est au centre des préoccupations des services de soutien de la recherche, et plus particulièrement des bibliothèques. Pour apporter des éléments de réponse, nous avions lancé, en Lorraine, le projet LorExplor pour « mieux appréhender les besoins des chercheurs dans la diversité de leurs thématiques ».

Grâce au soutien d'ISTEX, nous avons multiplié des expériences d'exploration de corpus de publications scientifiques en texte intégral, à la fois avec des enseignants-chercheurs, des étudiants et des professionnels des bibliothèques. En pratique, nous avons utilisé un ensemble cohérent de sites encyclopédiques (le réseau de wikis sémantiques nommé Wicri) pour résoudre les interfaces homme-machine et mutualiser les actions de curation de données.

De façon indépendante, nous avons également utilisé cette souche encyclopédique pour gérer des collections de publications, pour réaliser des éditions diplomatiques numérisées de documents anciens ou mettre en place des systèmes d'information construits collaborativement. Autrement dit, nous avons déposé des ouvrages numériques sur un substrat encyclopédique, comme on peut déposer des livres sur les rayons d'une bibliothèque.

Le résultat est que nous disposons d'un embryon de bibliothèque numérique où des chercheurs et praticiens peuvent mener ensemble, dans le même espace, des activités qui se faisaient autrefois sur des supports différents. Nous retrouvons ici l'image d'une salle de travail dans une bibliothèque dont les murs et rayonnages sont remplacés par une base encyclopédique qui assure la cohésion de l'ensemble.

Cette approche peut-elle être généralisée ? Plus précisément, avec LorExplor, nous avons fait des simples tests de faisabilité dans de multiples domaines. Nous voulons maintenant aller en profondeur dans un domaine spécialisé. Nous avons choisi la musique, ou, plus précisément, la musicologie. Une première étude sur la Renaissance, s'avère déjà très riche en enseignements. Par exemple, les besoins d'exploration d'une très large diversité de corpus sont omniprésents.

Nous présentons ici les premiers résultats de cette expérience d'immersion dans le département musique d'une bibliothèque totalement numérique. Dans un premier temps, nous donnerons quelques éléments de réflexion sur les changements de paradigme dans les bibliothèques de la recherche, en y situant nos expériences antérieures. Nous introduirons ensuite les grandes lignes d'un travail en cours sur la musique de la Renaissance autour de Roland de Lassus.

Bibliothèques et pratiques numériques dans le nouveau paradigme de la recherche

Les bibliothèques dans les changements de paradigme de la recherche

Pour alerter les chercheurs sur la révolution numérique, Jim Gray, en 2005 (Gray 2005), avait défini quatre changements de paradigme dans les pratiques de la recherche.

Pour voir la diapositive utilisée par Jim Gray
  1. Pendant des millénaires, les premiers érudits utilisaient une méthodologie empirique basée sur l'observation.
  2. Puis, depuis quelques siècles, les scientifiques utilisent des modèles théoriques et font appel aux abstractions et généralisations.
  3. Depuis 1950, quelques décennies déjà, ils utilisent des ordinateurs pour modéliser des phénomènes complexes. La programmation devient un outil de travail et d'expression du chercheur.
  4. Nous entrons maintenant dans une quatrième étape, celle des big data où les scientifiques sont confrontés au déluge des données.

Cette notion de quatrième paradigme de la recherche nous semble particulièrement riche. Nous cherchons donc à l'appliquer à la connaissance devenue numérique et traditionnellement portée par les bibliothèques.

En 2005, cette réflexion s'appliquait essentiellement aux sciences physiques ou de l'environnement (génomique notamment). Avec la mise en ligne massive de corpus numériques, les chercheurs en sciences humaines sont à leur tour concernés. Ils doivent assimiler les pratiques de création ou d'exploration de corpus de documents. Par rapport aux physiciens, les données qu'ils traitent ne sont plus exogènes. En effet, ce sont des documents qui ont été produits à des fins éditoriales, comme leurs productions scientifiques.

Sur un plan technique, l'émergence du quatrième paradigme coïncide avec celle des wikis qui rendent possible un travail réellement collaboratif. Nous entrons donc dans une époque où la plupart des pratiques de certaines communautés scientifiques peuvent se réaliser en mode coopératif dans un même espace numérique. Au niveau du document, le wiki généralise la notion d'hypertexte à rédaction collective, là où les étapes précédentes (hypercard...) étaient caractérisées par la nécessité d'un rédacteur unique.

Les collections de documents qui étaient juxtaposés dans les rayons deviennent des corpus que l'on peut maintenant explorer par des méthodes statistiques ou de filtrage. Plus encore, ils peuvent être mis en interrelation. La bibliothèque n'est plus simplement un lieu de dépôt ou de lecture, elle devient un espace de travail. Paradoxalement, grâce au numérique, elle retrouve la position stratégique qu'elle avait antérieurement à l'apparition de l'imprimerie [1]: un espace où la connaissance s'écrit, se lit et se travaille.

En pratique, en s’appuyant sur nos expériences antérieures, nous proposons un modèle de bibliothèque où les murs et les rayonnages sont remplacés par un substrat encyclopédique.

Des produits nouveaux à l'accompagnement des nouvelles pratiques

Le travail décrit ici s'appuie sur des expérimentations démarrées à l'INIST.

En 1988 l'INIST a pris la suite des centres de documentation (CDST et CDSH) créés en 1949 en même temps que le CNRS, avec la mission de communiquer sur l'essentiel[2] des résultats de la recherche. La création récente des « essentiels de Gallica » à la BnF montre que les missions initiales de l'INIST sont encore d'une furieuse actualité. Conçu en 1985, le modèle de fonctionnement choisi pour l'INIST était écartelé entre la modernisation des acquis des centres de documentation du CNRS et la perception d'un changement de paradigme non encore verbalisé.

La renommée du CDST et du CDSH reposait sur les bulletins signalétiques du CNRS qui alimentaient les bases Pascal et Francis. Cette activité, notamment en sciences humaines, reposait sur un vaste réseau de coopérations avec les laboratoires. Ancré dans le paradigme numérique des années 80, la modernisation a pris la forme d'une « usine à transformer le savoir par des chaînes de production ». Mais un indéniable succès initial a aussi ouvert la voie aux difficultés actuelles de l'établissement. En effet, deux chemins s'ouvraient : celui de l'industrialisation, dans une perspective de volume et de chiffres - et, en particulier, de chiffre d'affaires -, ou celui de la connaissance. Le contexte de l'époque, et des choix dont il est aisé de dire aujourd'hui qu'ils étaient discutables, ont amené à privilégier le premier chemin.

Le fondateur de l'INIST, Goéry Delacôte, souvent qualifié de visionnaire, avait mis en place un département stratégique de Recherche et Développement, dont la durée de vue a été éphémère, mais qui a permis de dégager des options fondamentales qui sont encore au cœur de notre démarche. En effet, une orientation était de penser « station de travail du chercheur ». Cette directive, soutenue par l'expertise de Nathalie Dusoulier sur les standards d'échanges de documents, avait conduit à la création d'une première « boîte à outils SGML » pour construire cette station de travail, perçue comme très différenciée suivant les disciplines scientifiques visées. Ces résultats, acquis en 91, ont été largement validés par la suite au sein du monde du numérique. Au sein de l'INIST, ils ont été vécus comme une remise en cause du modèle informatique de production.

Cette approche s'est donc poursuivie dans un autre cadre, au Loria plus précisément, avec la boîte à outils Dilib, qui a intégré le standard XML et fait émerger la notion de serveur d'exploration. Elle est revenue à l'INIST en 2000, où elle a permis la création d'un service des prestations de veille et le lancement d'un plan de formation nommé « mutation technologique ». Mais une situation redevenue conflictuelle après un nouveau changement de direction a conduit à une mise en sommeil de cette activité. Le soutien d'ISTEX pour le projet LorExplor a permis de reprendre cette idée de boîte à outils, mais pour aller au-delà des métadonnées et traiter maintenant des corpus hétérogènes en texte intégral.

Cette « mise en sommeil » a dégagé du temps pour des actions éditoriales. D'abord à l'INIST, avec le projet Artist/Ametist, nous avons créé un ensemble éditorial multiforme (papier, numérique simple, numérique structuré, blog). À partir de 2008, au sein des universités de Lorraine et avec le soutien de la DRRT, nous avons lancé un réseau de wikis sémantiques, nommé Wicri, basé sur la technologie MediaWiki+Semantic MediaWiki, avec l’objectif initial de construire des observatoires de l'innovation. Nous avons par exemple constitué un inventaire très détaillé des projets européens dans lesquels des acteurs lorrains étaient impliqués.

Sur cette base, de façon un peu « opportuniste », nous avons multiplié les expérimentations à caractère éditorial. Nous avons d'abord procédé à la mise en ligne de collections d'articles scientifiques dans un environnement hypertexte : les trois numéros de la revue Ametist et quelques articles de Solaris. Nous avons également ouvert des wikis pour les communautés CIDE, H2PTM et VSST. Suivant ces exemples, des chercheurs de l'Inra ont lancé une publication originale, « Les mots de l'Agronomie ». Nous avons également procédé à l'édition diplomatique de textes anciens. Et, tout récemment, dans la dynamique ISTEX, nous avons complètement repensé l'interface avec les serveurs d'exploration.

En résumé, sur des maquettes, nous avons pu montrer que pratiquement toutes les activités entrant dans le champ de vision d'une bibliothèque ou de l'INIST pouvaient être menées dans un environnement collaboratif unifié.

Pendant toute la durée du troisième paradigme, un slogan était martelé : l'ambition affichée était de « décharger le chercheur des tâches documentaires ». Avec le quatrième paradigme, il faut faire exactement le contraire et accompagner le chercheur dans la maîtrise des outils et pratiques de la connaissance numérisée !

Des sciences de l'information, à la musicologie, en passant par l'environnement

Après avoir pensé « outils et prestations pour les chercheurs », il nous paraissait donc important de nous immerger dans une activité scientifique afin de mieux comprendre les interrelations des pratiques.

Les orientations données au réseau Wicri concernaient les sciences de l'environnement. Il serait effectivement stratégique de mener une expérimentation dans une des disciplines où nous avons déjà posé des jalons, comme l'eau, le bois, la forêt, les matériaux ou la santé. Nos premières expériences ont montré qu'une expertise solide dans les fondements théoriques étaient indispensables pour interpréter les résultats d'une expérimentation et émettre de nouvelles hypothèses.

Nous avons naturellement mené des travaux d'investigation scientifique dans les approches numériques des sciences de l'information. Mais ce domaine présente une spécificité paradoxale. En effet, il n'est pas nécessaire de lire un article pour comprendre la démarche algorithmique d'un collègue. Une discussion suffit ! Un colloque comme CIDE offre un cadre unique pour la veille scientifique. Le fait d'y soumettre un article est fondamental pour clarifier des concepts. La présentation publique ou la démonstration sont importantes. Mais la lecture n'est que rarement indispensable et le besoin d'exploration de corpus est donc un peu marginal.

Nous avons donc cherché un domaine impliquant des traitements de corpus, où nous n'avions pas forcément de fortes compétences mais une forte motivation pour acquérir une expertise et une érudition. Les premières investigations lancées sur la musique de la Renaissance ont mis en évidence le fait que, dans ce domaine de la musicologie, les besoins d'exploration de corpus dépassent nos espérances...

Bibliographie

[Gray 2005] Jim Gray et al.,  Scientific Data Management in the Coming Decade, In: ACM SIGMOD, New York, NY, USA

doi>10.1145/1107499.1107503
<http://research.microsoft.com/apps/pubs/default.aspx?id=64537>

Notes

  1. Voir par exemple la place stratégique de la bibliothèque dans le film tiré du roman Le nom de la Rose.
  2. Pierre Auger avait repris les ambitions des listes de grandeurs physiques : Nous relevions l'essentiel de ce qui se faisait dans toutes les langues intéressantes à l'époque. Cité par Jean Astruc dans le CNRS et l’information Scientifique et technique en France (Revue Solaris 1997)
    Voir l'article de Solaris sur Wicri/Ticri