CIDE 14 Rabat

De Artist
Révision datée du 2 janvier 2012 à 08:21 par imported>Jacques Ducloy (Un exemple en investigation documentaire)

Cette page introduit un espace de discussion et de publication pour les participants au colloque CIDE 14. Pour ce colloque, vois aussi :

Articles en cours de mise en ligne

La table ronde

Cide14TableRondeDucloyDiapositive1.jpg
IMG 8508.JPG

La table ronde avait pour thème général :

L'homme
au cœur du
document numérique

La table ronde a démarré par trois exposés interactifs. La suite du document reprend les diapositives utilisées pour introduire la table ronde (avec un texte ré-actualisé par les différents auteurs).

Introduction Jacques Ducloy

Un nouveau paradigme dans la recherche

Cide14TableRondeDucloyDiapositive2.jpg

Les colloques CIDE traitent plus particulièrement de l'information numérique dans un contexte généralement technique scientifique ou culturel. S'interroger sur la place de l'homme au cœur du numérique concerne donc assez naturellement celle des ingénieurs, chercheurs, enseignants, conservateurs ou techniciens. Il sont tous impliqués par le déluge des informations numériques, dans lequel « réussir à nager » devinet déjà une condition de survie.

On rappelle à ce propos l'hypothèse émise par Jim Gray à propos du quatrième paradigme de la science. Une majorité de chercheurs ont été directement impliqués par le troisième paradigme, celui qui démarre dans les années 50 et introduit l'informatique au cœur des pratiques. Dans bien des domaines l'ordinateur a remplacé de plus en plus souvent la traditionnelle paillasse. On peut souvent considérer que le numérique a enrichi le pouvoir d'expression du chercheur, notamment en physique ou dans les sciences de l'ingénieur. Pour cette catégorie de chercheurs on peut donc affirmer que l'homme a bien été mis au centre du numérique.

En revanche, le coût élevé des ordinateurs à cette époque a fait mettre la priorité sur la rentabilité des ordinateurs, l'homme quittant alors la place centrale. Ce phénomène a été encore plus flagrant dans l'informatique d'organisation, et notamment dans celle des bibliothèques et des centres de documentation. L'homme, transformé en opérateur de saisie n'est devenu qu'un rouage mineur au sein d'un système que l'on ne sait pas totalement automatiser.

Or en 50 ans, le coût des ordinateurs a radicalement chuté. Pour 15 jours de travail au coût du SMIC tout un chacun peut acquérir un ordinateur dont la puissance est égale à celle dont disposait le centre serveur de Télésystèmes en 1978. Comment utiliser ce bouleversement d'échelle pour redonner une place décente aux professionnels de l'information en augmentant leur créativité ?

Un exemple en investigation documentaire

Cide14TableRondeDucloyDiapositive6.jpg

Voici un exemple simple d'une démarche de type investigation documentaire ayant pour paysage l'INPT qui accueille notre colloque : comment avoir une idée de son profil d'activité à travers ses publications ? Pour y répondre, on dispose par exemple de 20 000 notices bibliographiques sur la recherche au Maroc. Il faut alors simplement extraire celles qui ont un auteur l'INPT afin de déterminer le profil scientifique du laboratoire.

Il suffit de quelques secondes pour exprimer ce besoin. Combien de temps faut-il pour le satisfaire ?

  • Dans les années 70, avec un ordinateur tel que le Gamma 60, on travaillait en assembleur. Il fallait plusieurs mois pour écrire un programme de filtrage de notices bibliographiques. Avec un ordre de grandeur d'une notice par seconde, son exécution pouvait durer quelques dizaines d'heures. C'est à cette époque que les méthodologies de type Merise ont été définies, avec l'émergence mythique cahier des charges pour que l'utilisateur puisse définir avec précision son besoin. En regard d'une opération demandant un mois de travail, le fait de passer une journée à le formuler et à le justifier n'est pas aberrant. De même un temps de négociation de quelques mois n'est pas déraisonnable. En effet, la mobilisation de moyens informatiques très coûteux demandait également une forte régulation des demandes.
  • Le tableau montre ensuite une série d'évolutions technologiques qui se traduisent par des diminutions considérables des coûts de développement.
  • La veille de cette table tonde, j'ai procédé à un essai sur mon Macbook personnel. En quelques minutes j'ai obtenu le résultat avec une extraction en Xquery sur un corpus de 20 000 notices de l'INIST (en utilisant le moteur BaseX) et quelques commandes de la plateforme Dilib.

Cet exemple me semble assez bien illustrer un aspect du changement de paradigme en montrant le côté de plus en plus absurde du cadre formel d'un cahier des charges pour des activités de type investigation documentaire. Il faut donc revoir en profondeur les relations des acteurs de l'information scientifique avec la technologie.

A titre indicatif, voici à quoi ressemblent les commandes qui ont permis de faire de traitement (On trouvera des explications dans la page CIDE 14 Rabat/Explication table ronde Ducloy) :

//fA14/s2[text() contains text "Rabat"]/ancestor::fA14/s1[text() contains text "INPT"]/ancestor::pA/fC03[@l="FRE"]/s0

Quelques minutes suffisent pour obtenir une liste de mots-clés triés par fréquence décroissante, exemple :

3       Traitement signal
3       Traitement image
...

Une formation à ce type d'outils demande quelques jours à quelques semaines, autrement dit le temps qu'il faut négocier avec un service informatique pour obtenir une réponse...

Une histoire à succès : Wikipédia

Cide14TableRondeDucloyDiapositive5.jpg

Dans ce contexte révolutionnaire, une histoire à succès, Wikipédia, donne un éclairage complémentaire.

A coté de sites collaboratifs où l'on cherche à obtenir une extrême facilité d'utilisation, Wikipédia a opté pour la puissance d'expression. Les contributeurs volontaires, éclairés, doivent manipuler des expressions telles que :

<includeonly>{{#ifeq:{{{display|}}}|compact
  |{{lien web 
    |url=http://www.cnrtl.fr/lexicographie/{{{1}}} 
    |titre={{{1}}} {{#if:{{{2|}}}|(sens {{{2}}})}} 
    |site=[[Centre national de ressources textuelles et lexicales|CNRTL]]}}
 ...

Ils le font avec comme motivation première la volonté de construire un savoir accessible au plus grand nombre de lecteurs potentiels ; autrement dit, de répondre à ce qui est une vocation première de la recherche.

Pour remettre l'homme au centre du numérique : la formation

Cide14TableRondeDucloyDiapositive4.jpg

Les deux exemples précédents illustrent la liberté que peut donner une maîtrise approfondie des technologies numériques.

Ils mettent en évidence une difficulté, notamment dans le monde des chercheurs ou praticiens des sciences de l'information : la culture informatique nécessaire pour « dominer » les outils du numérique. L'hypothèse du changement du paradigme de Jim Gray donne un éclairage intéressant sur le nécessité de changements profonds dans ce secteur scientifique et technique.

Pour prendre une comparaison historique, nous nous trouvons dans une situation analogue à celle des alchimistes lorsque la chimie a émergé en tant que discipline scientifique. Les chimistes ont du s'approprier les approches mathématiques, et maintenant informatiques.

La diapositive ci contre montre une stratégie concrète de scenarii de formation à l'usage de ingénieurs ; avec pour objectif de leur donner une maitrise du numérique et les remettre ainsi au centre du dispositif.

Introduction Hubert Emptoz

sur des diapositives de Joël Gardes.
Cide14TableRondeGardesDiapositive1.jpg
Cide14TableRondeGardesDiapositive2.jpg
Cide14TableRondeGardesDiapositive3.jpg
Cide14TableRondeGardesDiapositive4.jpg

Viviane Folcher

sur des diapositives de Joël Gardes et Denis Chêne.
Cide14TableRondeGardes2Diapositive1.jpg
Cide14TableRondeGardes2Diapositive2.jpg
Cide14TableRondeGardes2Diapositive3.jpg
Cide14TableRondeGardes2Diapositive4.jpg
Cide14TableRondeGardes2Diapositive5.jpg
Cide14TableRondeGardes2Diapositive6.jpg

Quelques photos autour du colloque

Voir aussi sur La pool INPL.

Khaldoun numérisant un homme de la garde royale au cœur de l'entrée du Mausolée