L’IST en France (1993) Dusoulier/Bases de données

De Histoire de l'IST

L’IST en France

Un secteur particulier : les bases de données


 
 

NathalieDousoulierInist20ans.png
   
INIST-Vandoeuvre-les-Nancy-02.JPG
logo travaux Document en cours de rédaction

Source : https://hal-lara.archives-ouvertes.fr/hal-01457371/document

Un secteur particulier : les bases de données

Si j'évoque ce point après en avoir parlé dans l'organisation de l'IST dans les divers pays, c'est qu'il s'agit d'un secteur dans lequel le plus important effort d'investissement a été fait dans chacun des pays et d'un secteur pour lequel les technologies sont les plus surveillées en raison de leur impact sur les coûts de production.

On l'a vu, près de 7 000 bases de données mises à disposition du public sont répertoriées dans le monde. Ces bases de données sont le support de production de nombreux produits dérivés : publications papier, CD ROM, accès on line, etc, dont la qualité dépend de la base de données. Les méthodes de fabrication des .,' bases évoluent très vite. Les activités actuelles des ingénieurs documentalistes n'ont rien à voir avec celles des Ingénieurs documentalistes des années 60 : capture automatique des données bibliographiques et des résumés, indexation assistée en semi-automatique, saisie sur postes de travail.

Malheureusement, les bases de données, dans leur état actuel, sont loin de constituer la panacée pour les services d'indexation.

Josephine Maxon-Dadd de Dialog Information Services a dressé dans "Trends in Database Design and Customer Services" publié par NFAIS, une liste des qualités que devrait présenter la base de données idéale :

  • fraîcheur de l'information,
  • données "propres",
  • accès facile au texte intégral,
  • graphiques,
  • vocabulaire contrôlé (hiérarchique) mis à jour en permanence pour tout le fichier,
  • vocabulaire non contrôlé également, pour les noms commerciaux, les noms propres ou les synonymes,
  • titre, nombre raisonnable d'auteurs, bon résumé,
  • données bibliographiques parfaitement identifiables et accessibles,
  • traitement de l'intégralité des revues dépouillées,
  • pas de doublons,
  • plan de classement matières (recherche possible par code ou mot du plan),
  • navigation,
  • données factuelles,
  • accès simple de la notation scientifique,
  • indexation multilingue.

Je pense que cette énumération éloquente peut donner à réfléchir à chaque producteur de bases de données, surtout au moment où ces mêmes bases sont de plus en plus utilisées pour fabriquer d'autres sous-produits ou font l'objet de traitements de plus en plus sophistiqué