CIDE 14 Rabat
Cette page introduit un espace de discussion et de publication pour les participants au colloque CIDE 14. Pour ce colloque, vois aussi :
- la page de référence sur le wiki Wicri/Ticri,
- un Tutoriel sur Wicri/Maroc.
Sommaire
Articles en cours de mise en ligne
- Thierry Daunois. Edition hypertexte dans le réseau Wicri l'expérimentation sur les Principes d'agriculture et d'économie de Chrestien de Lihus (1804)
La table ronde
La table ronde avait pour thème général :
L'homme
au cœur du
document numérique
Exposés d'introduction
La table ronde a démarré par trois exposés interactifs. La suite du document reprend les diapositives utilisées pour introduire la table ronde (avec un texte ré-actualisé par les différents auteurs).
Jacques Ducloy
Les colloques CIDE traitent plus particulièrement de l'information numérique dans un contexte généralement technique scientifique ou culturel. S'interroger sur la place de l'homme au cœur du numérique concerne donc assez naturellement celle des ingénieurs, chercheurs, enseignants, conservateurs ou techniciens. Il sont tous impliqués en première ligne par le déluge des informations numériques.
On rappelle à ce propos l'hypothèse émise par Jim Gray à propos du quatrième paradigme de la science. Une majorité de chercheurs ont été directement impliqués par le troisième paradigme, celui qui introduit l'informatique au cœur des pratiques, et où l'ordinateur remplace de plus en plus souvent la traditionnelle paillasse. Dans bien des domaines, on peut considérer que le numérique a enrichi le pouvoir d'expression du chercheur, notamment en physique ou dans les sciences de l'ingénieur. Pour une catégorie de chercheurs on peut dire que l'homme a bien été mis au centre du numérique.
En revanche, compte tenu du coût des ordinateurs à cette époque, on a aussi cherché à mettre la priorité sur la rentabilité des ordinateurs, l'homme quittant alors la place centrale. Ce phénomène a été encore plus flagrant dans l'informatique d'organisation ou celle des bibliothèques et des centres de documentation. Or en 50 ans, le coût des ordinateurs a radicalement chuté. Pour 15 jours de travail au coût du SMIC tout un chacun peut acquérir un ordinateur dont la puissance est égale à celle dont disposait le centre serveur de Télésystèmes en 1978.
Comment utiliser ce bouleversement d'échelle pour favoriser la créativité des professionnels de l'information ?
Voici un exemple simple d'une démarche de type investigation documentaire. Comment avoir une idée du profil d'activité de l'INPT qui nous accueille à travers ses publications ? Pour y répondre, on veut par exemple traiter 20 000 notices bibliographiques sur la recherche au Maroc. Il faut simplement extraire ayant un auteur l'INPT afin de déterminer le profil scientifique du laboratoire. Il suffit de quelques secondes pour exprimer ce besoin. Combien de temps faut-il pour le satisfaire ?
- Dans les années 70, avec un ordinateur tel que le Gamma 60, on travaillait en assembleur. Il fallait plusieurs mois pour écrire un programme de filtrage de notices bibliographiques. Avec un ordre de grandeur d'une notice par seconde, son exécution pouvait durer quelques dizaines d'heures. C'est à cette époque que les méthodologies de type Merise ont été définies, avec l'émergence mythique cahier des charges pour que l'utilisateur puisse définir avec précision son besoin. En regard d'une opération demandant un mois de travail, le fait de passer une journée à le formuler et à le justifier n'est pas aberrant. De même un temps de négociation de quelques mois n'est pas déraisonnable. En effet, la mobilisation de moyens informatiques très coûteux demandait également une forte régulation des demandes.
- Le tableau montre ensuite une série d'évolutions technologiques qui se traduisent par des diminutions considérables des coûts de développement.
- La veille de cette table tonde, j'ai procédé à un essai sur mon Macbook personnel. En quelques minutes j'ai obtenu le résultat avec une extraction en Xquery sur un corpus de 20 000 notices de l'INIST (en utilisant le moteur BaseX) et quelques commandes de la plateforme Dilib.
Cet exemple me semble assez bien illustrer un aspect du changement de paradigme en montrant le côté de plus en plus absurde du cadre formel d'un cahier des charges pour des activités de type investigation documentaire. Il faut donc revoir en profondeur les relations des acteurs de l'information scientifique avec la technologie.
A titre indicatif, voici à quoi ressemblent les commandes qui ont permis de faire de traitement (On trouvera des explications dans la page CIDE 14 Rabat/Explication table ronde Ducloy) :
//fA14/s2[text() contains text "Rabat"]/ancestor::fA14/s1[text() contains text "INPT"]/ancestor::pA/fC03[@l="FRE"]/s0
Quelques minutes suffisent pour obtenir une liste de mots-clés triés par fréquence décroissante, exemple :
3 Traitement signal
3 Traitement image
...
Une formation à ce type d'outils demande quelques jours à quelques semaines, autrement dit le temps qu'il faut négocier avec un service informatique pour obtenir une réponse...
Dans ce contexte révolutionnaire, une histoire à succès, Wikipédia, donne un éclairage complémentaire.
A coté de sites collaboratifs où l'on cherche à obtenir une extrême facilité d'utilisation, Wikipédia a opté pour la puissance d'expression. Le contributeur volontaire éclairé manipule des expressions telles que :
Hubert Emptoz
- sur des diapositives de Joël Gardes.
Viviane Folcher
- sur des diapositives de Joël Gardes et Denis Chêne.
Quelques photos autour du colloque
Voir aussi sur La pool INPL.