Enjeux liés au portail ALS

De Wicri Académies Grand Est

Enjeux scientifiques des bibliothèques et encyclopédies numériques

En 1747, un natif de Langres, nommé Denis Diderot, lançait le vaste chantier éditorial de l'Encyclopédie ou Dictionnaire raisonné des sciences, des arts et des métiers,

En 1965, depuis Nancy, le Recteur Imbs lançait le chantier du dictionnaire du Trésor de la langue française avec des algorithmes préfigurateurs de l'intelligence artificielle. Après une phase héroïque sur un Gamma 60 de la Compagnie des Machines Bull, l'ordinateur alors le plus puissant de France, grâce à Jean Legras le projet a pris son ampleur sur un ordinateur Iris 80, le fleuron du Plan Calcul.

En 1988, autour de l'informatisation de l'INIST, Goéry Delacôte et Nathalie Dusoulier, en partant des bulletins signalétiques du CNRS, lançaient le chantier d'une gigantesque bibliothèque d'articles numérisés avec comme portail d'accès les bases Pascal et Français.

Ces grandes applications ont abouti à des réalisations disjointes.

Or, dans la même période, à partir des travaux théoriques de Claude Pair, au Crin, au TLF, puis au Loria, des chercheurs ont été moteurs autour du développement des formats numériques universels, comme Xml ou la TEI (Text Encoding Initiative).

Il devient maintenant possible d'utiliser le même formalisme pour unifier la codification des articles encyclopédiques, des articles de dictionnaires et des articles des livres scientifiques. Il est donc maintenant possible de créer des bibliothèques numériques encyclopédiques qui rassemblent tous les types de publications dans un même ensemble avec des mécanismes d’interrogation dopés par l'intelligence artificielle.

En 2025, plus modestement, autour du DataCenter Lorrain, en s'inspirant du modèle de croissance de Wikipedia, nous proposons un cabinet de curiosités numériques des sciences des arts et des métiers et de la technologie en partant avec les collections de l'Académie lorraine des sciences.

Enjeux politiques, les dangers et les limites de l'éclatement du patrimoine numérique

Pour des raisons souvent liées à une continuité avec l'édition traditionnelle évoquées précédemment les ressources numériques scientifiques, thématiques ou régionales, sont souvent dispersées sur de multiples sites spécialisés.

Logo ALS 2010.png Par exemple, l'Académie lorraine des sciences voit son patrimoine éclaté sur 2 sites. Cette société savante est née à Strasbourg en 1828 et a migré à Nancy en 1870. Les bulletins de la période nancéienne sont sur le site actuel de l'association. Mais, les mémoires de la Société des sciences naturelles de Strasbourg sont dans la bibliothèque numérique Biodiversity Heritage Library (BHL) gérée par l'administration américaine. Le changement de la politique de ce pays montre le danger de cette situation et la nécessité d'une réplication sur un site français. Biodiversity Heritage Library Logo.png

Certains articles de l'ALS sont relatifs à des sujets régionaux comme, par exemple, l'histoire de la Lorraine. Pour des sujets, les sources françaises de dépôt de documents (Persée, HAL) ne permettent pas d'interactions numériques (comme par exemple ajouter des liens pour résoudre les références bibliographiques). Il devient alors impératif de rééditer ces articles, dans un format modifiable, au voisinage des collections de l'ALS.

Le problème est identique dans les spécialités liées aux sections des membres de l'association. Par exemple, les publications anciennes de la société géologique de France sont accessibles sur le site Internet Archive, (à partir des collections de l'Université du Texas). En santé et sciences de la vie, autre point fort de l'ALS, la domination de la base PubMed gérée par le ministère de la médecine des USA. Là encore la sauvegarde de ces documents est indispensable.

Enfin, l'archivage de ce documents dans des formats hétérogènes exige une très haute maitrise du numérique pour réaliser des actions de valorisation, autour d'un auteur ou d'un point fort du patrimoine lorrain. Il faut donc une stratégie d'unification des documents dans un format facilement manipulable par des scientifiques formés au numérique mais non spécialistes.