Visite guidée d'une expérience pilote avec l'ALS
Société des sciences naturelles de Strasbourg // Société des sciences de Nancy // Académie lorraine des sciences |
Des cabinets de curiosités numériques pour les arts les sciences et les métiers
Une application pilote avec l'Académie lorraine des sciences
|
Cet article propose une visite de cabinets de curiosité numériques autour des collections de l'Académie lorraine des sciences (voir le contexte en page de discussion).
Un peu de didactique au passage...
|
Sommaire
- 1 Introduction, les réseaux de wikis édités par des entités scientifiques
- 2 Le portail de l'ALS et de ses collections
- 3 Traitement et enrichissement diversifié des articles
- 4 Les collections de l'ALS dans l'ensemble des wikis du Grand Est
- 5 Au delà du Grand Est, l'infrastructure de connaissances Wicri
- 6 L'ALS et les sociétés savantes au temps du numérique
Introduction, les réseaux de wikis édités par des entités scientifiques
Pour résoudre les problèmes présentés en introduction, nous expérimentons une démarche inspirée de Wikipédia et des projets associés, mais scientifiquement éditée et contrôlée.
Forces et faiblesses de Wikipédia
La croissance continue de Wikipédia démontre la puissance de la technologie sous-jacente en termes de démarche collective. La galaxie de services associés (le dictionnaire Wiktionnaire, la bibliothèque Wikisource etc) démontre la puissance d'adaptation du moteur associé : MediaWiki. Ce moteur repose sur un langage unifié, le wikicode, compatible avec HTML, mais avec des adaptations pour favoriser les contributions des non-spécialistes. Notre approche technologique repose sur l'utilisation de ce moteur (en libre accès).
En revanche, pour Wikipédia, l'anonymat des contributions dans un contexte de désinformation accéléré par l'intelligence artificielle devient problématique. Or, le moteur permet de limiter les contributions en rendant obligatoire les inscriptions, et donc, avec un mode de cooptation bien maitrisé par les sociétés savantes.
De plus, la galaxie Wikipédia se limite à un type de document par application (encyclopédie, bibliothèque, cours...). Les bibliothèques numériques institutionnelles permettent de faire inteeragir plusieurs types de documents dans un espace scientifique ou institutionnel.
Enfin, le monolithisme des services Wikipédia, avec de multiples problèmes d'ordre polysémique rend très difficile le traitement en profondeur des concepts scientifiques. Ce phénomène devient de moins en moins maitrisables avec la croissance des applications. Nous proposons de travailler dans un réseau de bibliothèques numériques encyclopédique. Celles-ci peuvent garder un multiculturel dans un espace institutionnel, ou devenir fédératifs pour un domaine scientifique déterminé.
Survol du réseau Wicri
Notre démarche s'appuie sur une expérimentation lorraine : le projet Wicri.
Wikis et Ingénierie des
Connaissances pour les Communautés de la Culture
de la Recherche et de l'Innovation
Il repose sur le moteur MediaWiki avec des extensions qui enrichissent les mécanismes de liens. Ils peuvent devenir sémantiques (nous en donnerons des exemples plus loin). Il sont également « interwikis » ce qui permet la navigation dans un ensemble de bibliothèques.
Suite à différentes actions (par un exemple projet LorExplor) le réseau Wicri est maintenant un ensemble multilingue de 150 wikis. La carte ci-dessous montre la partie francophone (pour l'ensemble, voir l'onglet communautés).
Nous allons montrer comment cette infrastructure peut être mise au service de la valorisation numérique des travaux de l'ALS.
Le portail de l'ALS et de ses collections
Depuis fin décembre 2024, une expérimentation est lancée pour mettre en version hypertexte l'ensemble des publications de l'Académie lorraine des sciences.
Nous vous proposons une visite de ce chantier où l'on cherche analyser les problèmes liées à l'utilisation des pratiques hypertextes avancées. La grande majorité des pages sont donc à l'état de maquettes. Nous vous invitons donc à visiter des « appartements témoin ».
Importation des articles des collections
Le site de l'ALS donne accès uniquement aux fascicules de la période nancéienne (après 1871). Les publications se présentent sous la forme de volumes qui peuvent contenir parfois une vingtaine d'articles sur plusieurs centaines de pages. A chaque volume correspond un fichier PDF.
Les mémoires de la période Strasbourgeoise (de 1828 à 1870) sont accessibles sur le site BHL où un volume est un ensemble de pages numérisées. Quelques articles (en PDF) sont également accessibles dans la Bibliothèque numérique du Jardin botanique royal de Madrid.
Signalons également quelques compte-rendus qui ont paru dans le journal l'Institut (voir la séance du 16 janvier 1838). Là encore, seuls quelques exemplaires sont disponibles sur des sites américains (par exemple : Internet Archive ou HathiTrust).
Un des premiers objectifs concrets de note action est d'obtenir une base d'articles, afin de faciliter les recherches bibliographiques simples, et de permettre des citations plus précises, vers ces articles.
Premiers signalements des articles en mode image
Pour un ouvrage donné, une fois les fichiers importés sur le wiki, la première étape consiste à trouver et éditer la page de sommaire.
Voici un exemple avec le numéro 3 du tome 9 de la série 7, publié en 1970. Ce volume a été choisi au hasard des premières explorations pour donner un premier exemple d'article lisible par tous publics, en l’occurrence un article un peu décalé sur l'usage du tabac. Il peut interpeler un large public. Il constitue ainsi un exemple attractif pour une présentation générale.
Dans un premier temps nous avons simplement créé une page wiki dédiée au volume correspondant. Puis nous avons importé (par copier/coller dans le PDF) le sommaire qui est visible dans sa version initiale en cliquant ici.
Pour chaque article, il est alors possible de créer une page contenant son contenu en mode image, avec un lien depuis le sommaire.
Le site de l'ALS donne accès aux volumes.
- Le wiki de l'ALS donne déjà accès aux articles.
Pour le tome cité dans ce paragraphe, voici la page sommaire actuelle et un article réduit à une version image (dans sa version archivée).
Un premier index, les auteurs
Il faut alors identifier les auteurs de manière à offrir un premier niveau de navigation par index associé.
- Il existe une catégorie Membres titulaires de la Société des sciences de Nancy.
- Pour un auteur repéré, exemple Jean-Paul Vuillemin, il est possible d'accéder à sa page encyclopédique. Elle contient des liens vers des documents où il est cité et d'autres où il est auteur
- Comme par exemple pour L'Enseignement de la botanique dans les Facultés de médecine.
L'identification des auteurs est souvent une tâche relativement complexe. En effet, avant 1950 les personnes ne sont souvent repérées que par leur nom de famille. Voici par exemple :
Le mode wiki qui autorise de modifier en permanence un site permet de mener ces identifications de façon progressive et donc d'enrichir en permanence le site (contrairement à un simple dépôt en PDF).
Un premier service : une base bibliographique d'articles
L'étape suivante consiste à enrichir légèrement les documents (toujours en mode image pour l'instant) pour introduire une identification par sujet.
Si le document PDF contient un résumé, la simple intégration de ce résumé permet au moteur de recherche de l'indexer. Voir par exemple toujours dans le fascicule de 1970 un article de Gérard Kilbertus et Jean-François Pierre contenant un résumé en format texte (de même pour un autre article de Pierre dans ce numéro).
Le moteur MediaWiki permet également d'associer des catégories (en fait des mots clés) à un article donné. Les articles précédents ont été enrichis avec la catégorie Analyse physico-chimique de l'eau qui permet de retrouver d'autres articles.
En l'absence de résumé auteur, la transcription rapide de l'introduction donne de bons résultats (Voir un autre article de Pierre, publié en 1962).
L'ensemble des documents ainsi traités se comporte comme une base bibliographique (avec un thésaurus).
Les relations sémantiques
Le réseau Wicri intègre une extension de MediaWiki nommée « Semantic MediaWiki ». Elles permet d'ajouter des attributs sémantiques aux liens internes au wiki.
Par exemple dans les boîtes de signalement bibliographique en haut à droite des articles, on trouve la mention :
- Auteur : lien vers l'auteur de l'article
Par exemple :
- Auteur : Jean Paul Vuillemin
Avec des liens simples, la syntaxe wiki est la suivante :
'''Auteur''' : [[Jean Paul Vuillemin]]
Avec des liens sémantiques, l'affichage étant identique pour le lecteur, cela devient :
'''Auteur''' : [[A pour premier auteur::Jean Paul Vuillemin]]
L'attribut va pouvoir être manipulé dans des expressions sémantiques pour construire, par exemple, la liste des publications où Jean Paul Vuillemin est le premier auteur. Voici la syntaxe d'une telle requête :
{{#ask:[[a pour premier auteur::Jean Paul Vuillemin]] | format=ul }}
Voici le résultat actuel :
Ainsi la partie « Voir aussi » de la page sur Jean Paul Vuillemin est construite de façon automatique. Sur ce wiki, les attributs sémantiques sont visibles en fin de page dans le cartouche Faits. Des formules plus complexes permettent des réponses plus complètes (Voir la rubrique Voir aussi de la page de Vuillemin et le texte du modèle provoquant cette génération).
Ce mécanisme puissant est utilisable dans le texte même des documents, à condition qu'ils aient été construit ou transformé en format texte, ou plus précisément wikitexte.
Traitement et enrichissement diversifié des articles
La section précédente a montré qu'un wiki permettait de transformer « assez rapidement » un « simple dépôt d'ouvrages » en une « base bibliographique avec accès au texte intégral ». Pour les articles les plus intéressants, il est possible d'aller beaucoup plus loin. Nous allons présenter quelques exemples significatifs.
Indexation sémantiques du texte des articles
Une fois le document transcrit en format texte, il est possible d'appliquer les mécanismes cités précédemment à l'ensemble du contenu.
Le repérage des localités donne un premier exemple. Dans l'introduction du résumé de l'article de J.-F. Pierre daté de 1962 on trouve par exemple Damelevières et Rosières-aux-Salines. Ces villes apparaissent alors dans la boîte de faits de l'article qui est alors automatiquement cité dans les pages Damelevières et Rosières-aux-Salines.
Il est également possible de naviguer sur une propriété sémantique, (voir par exemple la page de la propriété A pour localité citée).
Voici maintenant quelques articles représentatifs.
Un premier exemple : Observations sur les Bélemnites (de Voltz)
Il s'agit du tout premier article de notre collection. Il a été publié en 1828 par Philippe Louis Voltz. Il traite notamment de la collection des bélemnites du museum d'histoire naturelle de Strasbourg. En réalité, il s'agit d'un ouvrage de référence d'une centaine de pages. Il serait totalement illisible sous la forme d'une suite de 100 facsimilés dans une page wiki. Il doit donc être restructuré en profondeur. Voici le point d'entrée de la version hypertexte :
Cette page wiki est en fait un plan qui va orienter sur une arborescence d'une vingtaine d'articles plus ou moins volumineux.
La première partie « Des bélemnites en général » a été simplement transcrite avec un paragraphage explicite, avec des liens depuis le sommaire. Vous noterez que le texte est justifié avec dans la partie gauche des liens iconographiques où en cliquant sur les images de page, on peut accéder au facsimilé. La partie droite contient la numérotation initiale.
Le paragraphe « B. De l'Alvéole » contient, en fin du premier paragraphe, une mention qui renvoie vers l'intérieur des planches de l'article : pl. 1, fig. 1.
La deuxième partie est de type encyclopédique et chaque espèce fait l'objet d'une page particulière (avec un rappel des planches) (Voir par exemple l'espèce Belemnites ferruginosus).
Autre exemple : le Répertoire Archéologique du Département de la Moselle
Un autre cas intéressant est le numéro 1 du tome 9 de la série 6 qui ne contient qu'un seul article : Le Répertoire Archéologique du Département de la Moselle.
Il dispose d'un bandeau de navigation spécifique (en dessous du bandeau de navigation du portail ALS). Ce type de montage est relativement difficile à réaliser sur des générateurs de site Web et démontre la souplesse de la solution wiki.
La récupération du texte est assez difficile compte tenu de la qualité du document. Nous avons donc opté pour une formule mixte où la plupart des pages sont en mode image avec des possibilité de renvoi dans les marges. Quelques communes font l'objet d'un traitement avancé par exemple Creutzwald-la-Croix.
De même les pages de type sommaire ont fait l'objet d'un traitement avancé.
- Liste alphabétique par arrondissement et par canton des communes citées
- Liste alphabétique des communes citées
Autour de l'histoire de l'ALS
Un ensemble intéressants est celui des articles traitant de la vie de l'ALS, car ils sont en forte interaction.
Un exemple significatif concerne Jean Paul Vuillemin.
- Le docteur Jean-Paul Vuillemin (1861-1932) Dans ses rapports avec la Société des sciences de Nancy (par Gilbert Percebois)
Ce document fait de nombreuses références à des séances qui ont été intégrées en priorité (même en mode image) pour pouvoir créer des liens effectifs. Par exemple le texte mentionne la séance du 15 novembre 1882 qui devient accessible par un simple lien (vers une page en mode image, cela suffit ici).
Une catégorie permet de naviguer dans cette thématique.
Quelques autres articles significatifs
Il est parfois (souvent !) intéressant de suivre les conviction d'un auteur. Voici, par exemple, sur la rage, deux publications d'un vétérinaire (Martial Villemin) :
- A propos de la rage en Moselle, la destruction du renard est-elle nécessaire ? en 1969 ;
- Problèmes posés par le diagnostic expérimental de la rage en 1973.
Un auteur très présent à la société des sciences de lorraine, Pierre-Louis Maubeuge a rédigé en 1968, l'article suivant :
Il y fait référence à un article publié dans le bulletin de la société de Nancy « au début du siècle » par Jules Beaupré dans un féroce article de 9 pages, dit-il... Voici l'article en question (en un clic)
La transcription d'articles en mode hypertexte permet de réaliser ce type de liens.
Les collections de l'ALS dans l'ensemble des wikis du Grand Est
Dans la section précédente, nous avons montré comment construire un ensemble bibliographique homogène. Comme nous l'avons évoqué, le réseau Wicri est un ensemble de wikis. Une partie de cette infrastructure est dédiée à la Région Grand Est. Nous allons maintenant montrer comment valoriser les travaux de l'ALS dans un ensemble de wikis régionaux.
Le portail ALS dans le wiki des académies du Grand Est
Suite à la création de la Région Grand Est, un wiki a été créé pour constituer une bibliothèque de publications issues des sociétés savantes du Grand Est, enrichie naturellement, par un ensemble encyclopédique. Ce wiki est identifié par un logo en haut à gauche de cette page.
On y trouve par exemple un embryon de Chronologie des sociétés savantes dans le Grand Est où l'on peut voir la filiation entre la Société d'histoire naturelle de Strasbourg avec l'Académie lorraine des sciences.
Dans la technologie des wikis les collections de l'ALS sont organisées en portail. En pratique au début de chaque page wiki un bandeau permet de naviguer au sein des collections. Ainsi, le début de la page contenant cet article contient le bandeau du portail ALS.
Les relations entre les sociétés savantes du Grand Est
Le wiki des académies du Grand Est peut accueillir un portail pour chaque société savante. Ceci permet de traiter des évènements communs à l'ensemble de ces sociétés.
Pour l'ALS, notons la pertinence de la dimension Grand Est dans une histoire qui commence en Alsace et se poursuit en Lorraine.
Voici un exemple l'annexion de l'Alsace lorraine. Cet évènement est très riche en terme de proximité de sujets avec par exemple l'Académie nationale de Metz. Voir par exemple :
- Auguste Prost et l'exode d’académiciens messins après l’annexion par Pierre Marot (pour l'Académie nationale de Metz).
- et le Discours de Ferdinand Monoyer sur le transfert de Strasbourg à Nancy
De plus, les membres des sociétés forment en fait une communauté qui dépasse les appartenances. Voici par exemple un article issu d'une conférence donnée à l'ALS par Pierre Labrude de l'Académie de Stanislas.
Au delà du Grand Est, l'infrastructure de connaissances Wicri
Les travaux de l'ALS peuvent également bénéficier de l'ensemble des wikis du réseau Wicri. Voici quelques exemples.
Un réservoir partagé de modèles
La technologie wiki est basée sur l'utilisation de modèles qui enrichissent l'écriture numérique. Comme le texte courant, ces modèles sont écrits par des contributeurs et mis en commun. Une grande partie des modèles sont issus de Wikipédia.
En wikicode, un modèle est délimité par des doubles accolades, « {{
» et « }}
», avec des paramètres repérés par des barres verticales (|
). Par exemple, le modèle « Sc » pour Short capitals » peut être utilisé pour mettre un nom d'auteur en petites majuscules (et respecter ainsi le style des anciennes publications de l'ALS). Ainsi le code {{Sc|Émile Coué}}
engendre « Émile Coué ».
Ces modèles sont, par exemple, très intéressants pour normaliser la nomenclature des noms de région. Ainsi la page Belgique contient un modèle qui incite naturellement à nommer le noms de régions en conformité avec Wikipédia et le Web sémantique. Voici le résultat de l'appel {{Provinces régions belges}}
De même les pages relatives aux localités font appel à des modèles pour créer des infobox et pour appeler des requêtes sémantiques.
Par exemple, il suffit de quelques minutes pour créer la page Malzéville sur ce wiki par un copier/coller de la page correspondante sur Wicri/Nancy. Bien entendu, le résultat des requêtes sémantiques sera totalement différent.
Des bibliothèques thématiques au service de l'ALS
Le projet Wicri contient un ensemble de wikis thématiques potentiellement très intéressants pour valoriser les travaux de l'ALS..
Par exemple un wiki est dédié à l'histoire naturelle des animaux, avec un chantier sur l’histoire naturelle de Buffon(ouvert suite à une conférence de l'ALS).
Un autre wiki est dédié à la musique... On y trouve par exemple le livret, les partitions, des outils de travail pour une messe irlandaise qui a été interprétée par la Chorale universitaire de Nancy.
Un wiki est dédié à la Chanson de Roland pour valoriser au départ une édition critique de Francisque Michel acquise par la Bibliothèque Universitaire de Lettres (de Nancy) et annotée par Paul Meyer (Voir un couplet annoté).
Quelques exemples de valorisation croisée
En dehors de la vie des sociétés savantes, la plupart des sujets traités dans le portail de l'ALS relèvent d'une spécialité scientifique qu'il est souvent préférable de développer dans un espace éditorial plus spécialisé.
Voici un exemple avec l'article de Kilbertus sur le fleuve Kaboul. Sa compréhension demande la connaissance du réseau des affluents de l'Indus. Pour des raisons de cohérence informationnelle, ce sujet, évoqué une seule fois sur ce wiki ne justifie pas son développent sur le wiki.
En revanche, il peut être déployé dans le wiki Wicri/Eau et/ou sur Wicri/Asie (en attendant un Wicri/Inde).
Certains articles eux-mêmes demandent en fait à être reproduits sur un ou plusieurs wikis (avec des annotations ou compléments différents). Voici par exemple, un article de Bruno Condé sur quelques protoures de Lorraine qui est reproduit sur Wicri/Animaux. Sa première phrase est la suivante :
- Les Protoures prennent rang parmi les Insectes les plus humbles, au voisinage des Collemboles et des Diploures ;
Sur ce wiki les insectes sont cités avec 2 types de liens, sémantique pour le premier et interwiki avec icône pour les suivants.
- Les Protoures prennent rang parmi les Insectes les plus humbles, au voisinage des Collemboles (
) et des Diploures (
)
- Les Protoures prennent rang parmi les Insectes les plus humbles, au voisinage des Collemboles (
De même, l'article de Labrude| cité plus haut pourrait être valorisé sur Wicri/Nancy (où des articles encyclopédique seront développés pour chaque rue concernée).
Le dictionnaire du Trésor de la langue français et l'ALS
Le réseau Wicri a déjà une pratique de numérisation ou d'importation d'articles encyclopédiques. Par exemple, sur Wicri/Musique des entrées du Dictionnaire de musique de Jean-Jacques Rousseau ont été intégrés (voir notamment l'article Carillon).
De même, le Grand Dictionnaire universel du XIXe siècle est parfois utilisé comme par exemple pour l'article « Cor de Roland » sur Wicri/Chanson de Roland, ou pour la Bélemnite sur Wicri/Animaux
Compte tenu de l'importance du CNRS sur l'information numérique en Lorraine, le Dictionnaire du Trésor de la langue française a un statut particulier. En effet, un objectif du projet Wicri est de tester des procédures de mise à jour pour le TLF (dont la production a été arrêtée en 1985).
Des articles du TLF sont réédités avec quelques améliorations. Sur le wiki Wicri/Animaux, l'entrée sur le chat montre quelques améliorations. Par exemple, les noms des auteurs d'exemples sont normalisés. Ceci permet d'activer des liens sémantiques, comme le montre la page sur Victor Hugo.
Pour l'instant, les améliorations sont limitées à ajouter des exemples d'emploi (avec des liens dans le texte). Voir par exemple, toujours sur le chat, un complément issu d'un texte relayé par Victor Hugo.
Sur ce wiki, un premier exemple a été réalisé sur l'entrée Bélemnite.
Serveurs d'exploration, un exemple avec Bernhein
L'approche Wicri intègre l'exploration de corpus bibliographiques par un dispositif nommé Serveur d'exploration. Il permet de naviguer dans des collections de plusieurs milliers de publications.
Hippolyte Bernheim a fait l'objet d'un Serveur d'exploration. Il contient plus de 2000 documents. La carte ci dessous donne des statistiques par région sur le nombre de documents où il est question de Bernheim.
Ce serveur (en cours de curation) est exploité sur plusieurs wikis (par exemple Wicri/Psychologie). Ceci permet des approches complémentaires.
L'ALS et les sociétés savantes au temps du numérique
Le réseau Wicri dispose donc d'un ensemble de ressources au service potentiel de l'ALS. Elles peuvent déjà être utilisées pour des ateliers de formation.
Le traitement complet des collections de l'ALS est une opération conséquente de plusieurs hommes années. Les premières étapes (arriver à une base bibliographique) sont démarrées mais elles demandent une certaine pratique des des bibliothèques numériques.
En revanche, et paradoxalement les opérations dites avancées (transformation d'articles du mode image au mode hypertexte) constituent une mine quasi infinie d'actions pouvant être opérées par des contributeurs en formation. L'avantage du portail ALS et des wikis spécialisés est de permettre à chacun des sociétaires de trouver un espace correspondant à sa spécialité. Il est donc déjà possible de monter des projets éditoriaux collectifs.
Le rôle d'une société savante est également de s'approprier les espaces de connaissances pour contrôler la pertinence scientifique, définir des priorités de traitement, arbitrer des conflits. Autrement dit la mission d'un comité de rédaction est le même que celui de l'édition traditionnelle mais dans espace potentiellement infini de connaissances.
La numérisation avancée des collections savantes peut donc être considérée comme une phase d'entraînement pour la mutation des académies conservant leur rôle historique (comme l’école philosophique de Platon) dans un savoir-faire totalement intégrée au monde numérique.
Bien sur, il ne s'agit encore que d'un prototype mais on peut imaginer assez rapidement, en cas de succès, un mouvement fédératif impliquant d'autres sociétés régionales (région Grande Est), et aussi dans un contexte européen avec par exemple, dans la Grande Région, au sens européen, le Luxembourg ou la Belgique.
Bien entendu la multidisciplinarité de ALS est un atout pour impliquer l'ensemble des disciplines au niveau régional et, en cas de succès, impliquer des sociétés savantes thématiques internationales.