HIS (2025) Ducloy

De Wicri Académies Grand Est
Révision datée du 19 septembre 2025 à 13:28 par Jacques Ducloy (discussion | contributions) (Où un article devient un hypertexte)

Révélation numérique du patrimoine culturel et immatériel des sociétés savantes.

Un exemple dans la Région Grand Est


 
 

Résumé

Nous présentons une expérience (en cours) de valorisation de l'ensemble des collections de l'Académie lorraine des Sciences dans la Région Grand Est. Cette société a été créée à Strasbourg avec un déménagement à Nancy en 1970. Ce fonds représente 200 ans de publications scientifiques pluridisciplinaires (et pluriculturelles). Il était dispersé sur plusieurs sites (une partie conséquente aux États-Unis) et sous forme de fichiers en format image.

Nous décrirons un premier niveau de valorisation « assez classique » où l'on donne accès aux articles proprement dits dans une vraie bibliothèque numérique. Mais surtout, nous montrerons qu'un traitement ultérieur dans un wiki sémantique permet de révéler, pour cette société, le patrimoine immatériel et sociologique porté par ces publications. De plus nous disposons d'un réseau de wikis sémantiques spécialisés (zoologie, botanique, informatique, etc) qui permet de révéler le patrimoine scientifique ou culturel porté par des ensembles d'articles sur un thème donné.

Nous discuterons des enseignements de cette action sur un plan individuel (par exemple, acquisition de connaissances scientifiques en réalisant leur modélisation sémantiques). Nous évoquerons également les retombées institutionnelles potentielles de cette action pour un grand projet numérique adapté aux algorithmes de l'intelligence artificielle.

Introduction

Cet article présente l'intégration des publications d'une société savante dans un wiki sémantique intégré dans un réseau de sites scientifiques ou culturels.

Cette société savante est l'Académie lorraine des sciences (ALS), actuellement basée à Nancy mais qui a été créée à Strasbourg en 1828. Elle a été déménagée à la suite de la guerre de 1870.

Nous présenterons, dans un premier temps, le contexte culturel et historique de cette action au sein d'une région qui a subi de nombreuses mutations au cours du temps. Nous présenterons également cette société.

Les publications de l'ALS, pour la période nancéienne sont essentiellement disponibles sous forme de fichiers PDF, copie des bulletins trimestriels. De plus, au départ de cette action, nous avons découvert les mémoires de la période strasbourgeoise numérisés dans des institutions américaines. Nous avons alors entrepris de réunir ces collections patrimoniales dans une seule et vraie bibliothèque numérique (avec un accès par sommaires et articles).

Nous avons alors décidé, avec les articles intéressants, de franchir une autre étape à l'aide de relations hypertexte et sémantiques. Le lecteur peut alors explorer le corpus et se faire une idée du patrimoine ainsi révélé. Pour les articles les plus pertinents sur un plan scientifique nous avons entrepris d'appliquer ce mécanisme au sein d'espaces numériques spécialisés (Botanique, Histoire de la Lorraine, histoire naturelle des animaux).

Dans une dernière partie, nous parlerons des retombées de ces pratiques dans l'acquisition des connaissances et nous aurons des réflexions d'un caractère institutionnel.

Les sociétés savantes du Grand Est

Le cadre général de nos actions est la valorisation du patrimoine historique ou culturel contenu dans les publications scientifiques de la Région Grand Est.

Voici quelques repères historiques pour placer le début de ce corpus potentiel dans le temps :

  • 1450, création de l'imprimerie européenne par Gutenberg,
  • 1572, création de l’université, de Pont-A-Mousson (ancêtre de l'université de Lorraine),
  • 1665, parution de la première revue scientifique, le journal des sçavants,
  • 1666, création de l'académie des sciences
  • 1750, création de la plus ancienne société savante en lorraine l'Académie de Stanislas

Plus modestement, dans ce projet, nous voulons traiter les publications de l'Académie Lorraine des sciences dont l'origine remonte à Strasbourg en 1828. Elle était portée le muséum d'histoire naturelle de Strasbourg (créé en 1804). Une grande partie des académiciens étaient professeurs à la faculté de médecine de Strasbourg. Celle-ci a des racines très anciennes avec Jean Sturm en 1538. Strasbourg était alors une ville libre du Saint-Empire germanique, qui a fondé une première université en 1621. Celle-ci a été supprimée par la Convention en 1792. Napoléon Bonaparte a créé une des trois facultés de médecine (avec Paris et Montpellier) en 1808.

Cette académie s'est rapidement diversifiée pour intégrer la géologie, puis la chimie, etc.

En 1870 éclate la guerre entre l'Allemagne et la France. Strasbourg devient une ville allemande et une très grande partie de l'Université rejoint Nancy. Les membres de la Société d'Histoire naturelle de Strasbourg modifient les statuts pour créer la Société des sciences de Nancy. Elle deviendra Académie lorraine des sciences en 1965 compte tenu de l'élargissement de ses activités.

D'un point de vue scientifique, l'ALS est organisée en 5 sections :

  • Section 1 : Mathématiques, Physique, Chimie, Electronique, Informatique, Génie des Procédés.
  • Section 2 : Biologie animale et végétale, Sciences de l’environnement.
  • Section 3 : Médecine, Médecine vétérinaire, Pharmacie.
  • Section 4 : Sciences du sol, de la terre et de l’univers.
  • Section 5 : Sciences humaines.

Notre objectif est de faire ressortir le gigantesque patrimoine porté par les contributions des chercheurs et praticiens du Grand Est, depuis 200 ans d'une histoire qui a en fait commencé il y a 500 ans.

Constitution d'un corpus numérique manipulable

De façon plus prosaïque, la première étape a consisté à ressemble et homogénéiser les publications.

La partie la plus importante du corpus est constituée par un ensemble de fichiers PDF, copies des bulletins produits par l'association depuis 1973 (à Nancy). Les ouvrages papiers avaient étés numérisés par l'INIST en 2005 pour créer un portail d'accès aux articles (par un service dénommé eRevues dans les années 2005). Malheureusement l'INIST a supprimé ce service en 2014. Le portail a été supprimé et l'INIST a remis à l'ALS une simple copie des ouvrages papiers sous forme de fichiers PDF.

Physiquement, cet ensemble est constitué de fichiers qui vont des quelques dizaines à plusieurs centaines de pages. La longueur des articles varie d'une simple page (pour des procès-verbaux de séance) à des mémoires de plus de 100 pages.

En démarrant cette action, nous avons découvert que les mémoires de la société strasbourgeoises n'étaient pas disponibles en France. En effet, ils avaient été perdus dans le déménagement ! Heureusement, dans le cadre d'échanges, entre sociétés savantes, des exemplaires étaient rangées dans des bibliothèques américaines qui les ont numérisées. Elle sont disponibles sur le site Biodiversity Heritage Library (BHL), géré, à Washington par les « Smithsonian Libraries and Archive ». Compte-tenu des changements politiques aux États-Unis, il nous a paru urgent de rapatrier ce précieux patrimoine. Physiquement, il est constitué de 6 volumes de 350 à 700 pages que l'on peut décharger en format jpeg. Nous avons également trouvé quelques articles en PDF sur le portail numérique du Jardin botanique royal de Madrid.

Nous avons donc commencé à créer un ensemble d'articles, en mode image au départ, sous forme de documents MediaWiki (dans un site wiki avec l'extension Semantic MediaWiki) . Plus précisément chaque « page MediaWiki » contient une en-tête bibliographique qui est suivie d'un ensemble de copies de pages PDG ou JPEG suivant le cas. L'en tête contient une description bibliographique ou, par exemple, les auteurs sont étiquetés par un attribut « A pour auteur:: ». Ceci permet de générer des listes d'articles par auteur.

Cette opération, obligatoire pour les article provenant de BHL, étant assez longue pour les PDF issus du site ALS, nous avons entrepris de constituer une liste des sommaires à partir des tables des matières. Cette opération était un peu fastidieuse car les PDF n'étaient pas de qualité suffisante pour un copier/coller (ni pour une reconnaissance OCR). Mais, par chance, nous avons trouvé sur Internet Archive des copies du site de l'ALS qui contenaient les sommaires des ouvrages traités par l'INIST. Là encore, une partie de notre patrimoine numérique perdu a pu être rapatrié des États-Unis...

Nous disposons donc d'un premier niveau de bibliothèque qui permet d'accéder aux articles par sommaire, index auteur etc.

Nous vous proposons maintenant trois catégories d'exemples de traitement hypertexte pour faire émerger le patrimoine porté par ces publications : au niveau des articles, puis de la collection et enfin de l'insertion dans un espace scientifique spécialisé.

Où un article devient un hypertexte

Les articles de la collection, nous l'avons dit, sont de taille très variable. Un article de 100 images de pages affiché sur une seule page wiki est alors illisible. Quand l'article est bien structuré (en chapitres ou sections) nous pouvons le distribuer sur plusieurs pages wiki, la première page wiki d'accueil donnant alors le sommaire.