Piia de Majorque (2024) Ducloy
Piia de Mallorca est un groupe de travail sur les pratiques informationnelles à l'heure de l'Intelligence Artificielle.
Sommaire
Vers un cinquième paradigme avec Wikipédia et l'IA
L'hypothèse de Jim Gray sur les pratiques scientifiques met en perspective quatre changements de paradigmes dans les pratiques scientifiques :
La groupe de réflexion Piia de Mallorca explore, notamment en SHS, un cinquième paradigme introduit par les pratiques numériques coopérativo-sémantique et par l'intelligence artificielle.
Les pratiques informationnelles
Dans la population, une simple phrase comme « j'ai lu dans Google que... » au lieu de « J'ai lu dans le Larousse » pose déjà le problème des pratiques informationnelles dans la société.
...
Aspects historiques
Dans les SIC et dans les SHS
- Années 60 - 70
- premières réalisations sur des initiatives individuelles.
Des ingénieurs qui ont découvert l'apport de l’analyse numérique dans leurs pratiques appliquent leur expérience dans des actions culturelles. Ils écrivent des programmes pour résoudre des problème rencontrés dans les SHS.
La Chanson de Roland a par exemple inspiré Joseph J. Duggan () qui a publié en 1969 des concordances sur le manuscrit d'Oxford. Sur ce même sujet, en Italie, Gian Piero Zarri a tenté des rapprochements entre plusieurs manuscrits.
A Nancy, nous avons écrit une version du jeux du mot le plus long sur les formes fléchies du Trésor de la Langue Française.
- Années 65 - 75
- démarrage des grandes applications dans les bibliothèques et sur les dictionnaires.
En 1965, à la Library of Congress, Henriette Avram développe les formats MARC pour l'informatisation des bibliothèques, dans la perspective d'échanges de catalogues.
A la même période, en France, le CNRS crée le CRTLF qui va réaliser le dictionnaire Trésor de la langue française. Pour ce projet, programmé sur 20 ans, le CNRS fait l'acquisition d'un Gamma 60, l'ordinateur le plus puissant réalisé en France et :et en œuvre des logiciels qui préfigurent l'intelligence artificielle. Les rédacteurs travaillent uniquement avec des listings et n'ont donc pas de « contact physique » avec le numérique.
Toujours en France et au CNRS, Nathalie Dusoulier et Pierre Buffet réalisent l'informatisation des bulletins signalétiques du CNRS (400.000 analyses pas an) pour fabriquer la base Pascal avec un formalisme basé sur la norme ISO 2709 utilisée pour les formats MARC. Pascal sera accessible sur le réseau Cyclades avec le logiciel MISTRAL. Cependant la rédaction des notices bibliographiques reste manuelle. En effet, les ingénieurs analystes rédigent des bordereaux qui sont traités par un imprimeur (Jouve SA).
Après un incontestable succès initial le CNRS n'a pas su maintenir le niveau d'expertise des équipes initiales. Les deux institutions ont rencontré des difficultés croissantes pour aborder les mutations informatiques.
Malgré un sursaut du TLF vers 2985 avec une version numérique du dictionnaire qui sera disponible sur le Web, le CNRS a renoncé à mettre à jour le TLF.
Du côté des bases Pascal et Francis, le CNRS a créé l'INIST autour de 1990. Dans une première phase, l'INIST a su informatiser la bibliothèque, la fourniture de documents et la fabrication de bases Pascal et Francis. Malheureusement le CNRS a engagé deux réformes qui se sont avérées catastrophiques. En 1992, une première étape visait à créer un groupe commercial de vente de documents numériques en ligne. Suite à un premier fiasco en 1998 le CNRS a décidé, sans aucune étude préalable, de réduire de 50% les effectifs et ressources de l'INIST avec l'intention de produire les bases par des moyens automatiques dans système centralisé basé sur un SGBD relationnel.
...
- Années 70 - 80
- Des progiciels pour la documentation et les bibliothèques.
Des informaticiens s’approprient les problématiques des Systèmes de Recherche d'information (SRI) puis des systèmes de gestion de bibliothèque pour réaliser des applications paramétrables.
En France, la Cii développe le logiciel MISTRAL.
...
- Années 80 - 90
- Unix, un système pour concevoir du génie logiciel s'applique au génie documentaire et éditorial
...
- Années 85 - 95
- De SGML à XML pour le Web et des boites à outils pour la manipulation des corpus
...
- Années 95 - 2005
- Des CMS pour les revues et le archives ouvertes
...
- Années 2005...
- Wikipédia démontre la puissance des wikis programmables puis sémantiques
problème : grandes difficultés avec la départ des concepteurs initiaux années 70 à 75, exemple, STAIRS aux USA exemple GEAC pour les bibliothèques les administrateurs SHS ont une action éventuellement conséquente de paramétrage les utilisateurs SHS n’ont aucune marge de manoeuvre et conservent leurs pratiques antérieures années 85 !- 2000 : boîtes à outils XML la conception des outils est complexe l’assemblage peut être réalisé par des informaticiens moins qualifiés en informatique mais double compétence (exemple iNRAE, INSERM) les utilisateurs très motivés peuvent devenir autonomes années 2000 CMS en PDP MySQL exemple OpenEdition, HAL, Omeka paramétrage par des équipes mixtes les pratiques restent traditionnelles années 2005 wikis puis wikis sémantiques les utilisateurs motivés deviennent concepteurs changement de paradigme du mode étitorial ‘hypertexte, hypermédia)