Utilisateur:Jacques Ducloy/Blog/Bonne année 2024 : Différence entre versions

De Wicri Wicri Fr
(Sur la liste Wicri IST)
(Sur la liste Wicri IST)
Ligne 6 : Ligne 6 :
 
Il venait de remporter une médaille d'or en photographie à l'exposition universelle de 1900 avant de lancer la construction de la Maison Bergeret qui a été le siège de la présidence de Nancy-Université...
 
Il venait de remporter une médaille d'or en photographie à l'exposition universelle de 1900 avant de lancer la construction de la Maison Bergeret qui a été le siège de la présidence de Nancy-Université...
 
[[Fichier:Villa Bergeret - Nancy - P1300758-P1300760.jpg|300px|center]]
 
[[Fichier:Villa Bergeret - Nancy - P1300758-P1300760.jpg|300px|center]]
Depuis Nancy je travaille sur une histoire de l'IST pour un groupe de travail sur les nouvelles pratiques informationnelles à l'heure de l'intelligence artificielle. Face aux défis de 2024, je voudrais rappeler deux évènements majeurs où le CNRS a su être un bâtisseur au niveau mondial.
+
Depuis Nancy je travaille sur une histoire de l'IST pour un groupe de travail sur les nouvelles pratiques informationnelles à l'heure de l'intelligence artificielle. Je vais donc travailler sur deux évènements majeurs où le CNRS a su être un bâtisseur au niveau mondial.
  
 
Dans les années 70 avec le recteur Imbs et le soutien de Jean Legras puis de Claude Pair, le CNRS,  a su lancer le dictionnaire TLF réalisé par des techniques préfiguratrices de l'intelligence artificielle (les groupes binaires).  
 
Dans les années 70 avec le recteur Imbs et le soutien de Jean Legras puis de Claude Pair, le CNRS,  a su lancer le dictionnaire TLF réalisé par des techniques préfiguratrices de l'intelligence artificielle (les groupes binaires).  

Version du 3 janvier 2024 à 17:54

Sur la liste Wicri IST

Chères et chers collègues.

Pour 2024 je vous propose de revisiter une carte postale d'Albert Bergeret, concepteur et imprimeur de cartes postales du mouvement école de Nancy.

Carte-postale-ancienne-nouvel-an-adieu-vieille-femme-1901-et-jeune-fille-qui-apporte-l-esperance-1902-par-bergeret.jpg

Il venait de remporter une médaille d'or en photographie à l'exposition universelle de 1900 avant de lancer la construction de la Maison Bergeret qui a été le siège de la présidence de Nancy-Université...

Villa Bergeret - Nancy - P1300758-P1300760.jpg

Depuis Nancy je travaille sur une histoire de l'IST pour un groupe de travail sur les nouvelles pratiques informationnelles à l'heure de l'intelligence artificielle. Je vais donc travailler sur deux évènements majeurs où le CNRS a su être un bâtisseur au niveau mondial.

Dans les années 70 avec le recteur Imbs et le soutien de Jean Legras puis de Claude Pair, le CNRS, a su lancer le dictionnaire TLF réalisé par des techniques préfiguratrices de l'intelligence artificielle (les groupes binaires).

Gamma60 du TLF.png

Au même moment, toujours au CNRS, sur les traces de Jean Wyard, Nathalie Dusoulier joue un rôle moteur dans l'informatisation des bulletins signalétiques du CNRS (400.000 analyses par an) pour produire les bases Pascal, dans un format ouvert aux coopérations internationales. Pascal sera accessible en 1975 avec le moteur français MISTRAL sur le réseau Cyclades, préfigurateur français de l'INTERNET.

Dans les années 1990, toujours au CNRS et depuis Nancy, Nathalie Dusoulier a su lancer l'INIST avec un succès technique incontestable : le premier système de fourniture numérique de documents, la reprise de la production des bases Pascal et Francis par l'INIST, et cerise sur le gâteau, le soutien à la mise des formats MARC sous SGML, 5 ans avant MarcXml de la Library of Congress. Toujours au CNRS et depuis Nancy, Jacques Dendien concevait le moteur Stella pour explorer les corpus textuels et développait la version initiale du futur TLFi qui a mis le CNRS en tête des services scientifiques les plus consultés dans les années 2000.

En 2023, quels sont les défis relevés par le CNRS ?


Comment porter les enjeux de la science ouverte du niveau français au niveau mondial

Comme nous l'avons souvent évoqué ici, nous sommes devenus de plus en plus dépendant des organisations américaines pour nos données scientifiques (PubMed, American Chemical Society, ...) ou citoyennes (Wikipédia, qui de plus est polué par l'anonymat). Cette dépendance s'accentue dramatiquement avec la généralisation de l'intelligence artificielle. En effet, celle-ci repose sur ces sources d'informations dans ses mécanismes d'apprentissages.

Le CNRS se positionne comme le leader français de la science ouverte, il nous parait fondamental d'étudier les mécanismes organisationnels qui répondent à cet objectif en gardant la maitrise de l'exploitation et de la fiabilisation de ces données. Le prototype Wicri propose une approche en réseau de sites qui peuvent être modérés et orientés par des comités scientifiques proches des laboratoires et des chercheurs. Avec des moyens modestes nos démonstrations valident la faisabilité de cette approche. Le prototype Wicri actuel peut jouer un rôle fondamental pour spécifier un modèle opérationnel.

Un enjeu pour la compétitivité des chercheurs des sciences humaines et expérimentales

Avec la Chanson de Roland, avons avons montré la puissance de notre prototype dans toutes les disciplines scientifiques où l'on doit explorer des corpus pour construire des hypertextes explicatifs et exploitables. Avec quelques journées d'assistance technique, le prototype Wicri peut devenir une plateforme immédiatement utilisable pour un ensemble conséquent de formations, d'expérimentations ou de réalisations.

Rappelons que Wikipédia a démarré des moyens très faibles au départ (moins de 10 personnes), sur cette base il a su mobiliser des millions de contributions. La version anglaise de Wikipédia revendique maintenant 46 millions d'utilisateurs inscrits dont 115.000 ont créés modifiés des pages depuis 30 jours. Avec des moyens modestes au départ, le CNRS, associé avec la CPU, en s'appuyant sur des réseaux européens (les universités européennes ou des réseaux spécialisés comme ERCIM) ou francophones, peuvent mobiliser des millions d'étudiants et des chercheurs, dûment identifiés...

L'INIST, opérateur du CNRS leader de la science ouverte, a largement la taille critique pour initier un tel processus. Mais n'importe quelle université disposant d'un service système correct (comme l'Université de Lorraine avec son Data Center) peut se lancer dans un programme de mutation numérique pour soutenir la compétitivité de ses chercheurs et la diffusion informationnelle de ses résultats. La première qui se lance dans une aventure au départ locale peut se positionner en leader pour animer un réseau potentiellement mondial.

Du côté de notre prototype

Avec des moyens encore très limités (votre serviteur et quelques contributions) je vous propose donc de faire progresser cette réflexion dans trois directions :

  • nous continuons à travailler sur la Chanson de Roland qui se révèle un excellent support de démonstration,
  • nous reprenons le travail sur l'histoire de l'IST, en y appliquant les mécanismes explorés avec la Chanson, avec comme axe directeur la rédaction d'un chapitre sur l'histoire IST dans un livre sur les pratiques informationnelles à heure de l'IA,
  • je propose enfin d'inscrire ces axes thématiques dans l'hypertexte du réseau Wicri avec la reprise des expérimentations XML avec la bibliothèque DILIB.
En guise d'apéritif

Je suis en train de de paramétrer un robot (réalisé avec DILIB) qui construit une page de statistiques à partir des API du réseau de wikis. Voici un résultat partiel sur 73 wikis :

  • cet ensemble contient déjà 130.000 pages wikis dont 26.000 documents significatifs et 11.000 fichiers images
  • pour voir le détail

Voici également un lien sur les serveurs d'explorations (qui sont en cours de portage depuis une ancienne machine virtuelle). 200.000 documents dans les thématiques des wikis sont explorables.

Et pour finir

Bonne année à tous...