Nuvola apps important.png Attention, suite à une faille de sécurité, les liens vers les serveurs d'exploration sont désactivés.

Métadonnées dans le contexte d’une cyberinfrastructure de la Recherche

De Wicri SIC
Révision datée du 25 septembre 2010 à 09:42 par imported>Jacques Ducloy
Ametist-titre-accroche-small.jpg
Cette page est une wicrification d'un article publié dans la revue AMETIST

Pour accéder à l'article original

Cet article est la traduction (légèrement modifiée et actualisée) d’un article original soumis et accepté à la conférence DC 2006. Il a été publié avec le titre suivant :


Metadata towards an e-research cyberinfrastructure
The case of francophone PhD theses

Le cas des thèses françaises

ARTIST, Jacques Ducloy,
INIST / CNRS
Jacques.Ducloy@inist.fr
Yann Nicolas,
ABES
nicolas@abes.fr
Diane Le Hénaff,
INRA - Centre de Versailles    
lehenaff@versailles.inra.fr
Muriel Foulonneau,
CCSD
muriel.foulonneau@ccsd.cnrs.fr
Luc Grivel,
Université Paris1
luc.grivel@univ-paris1.fr
Jean-Paul Ducasse,
Université Lyon 2
ducasse@mail.univ-lyon2.fr
Mots clés 
recherche scientifique, communauté scientifique, bibliothèque électronique, archive électronique, thèse, métadonnée, cyberinfrastructure.
Keywords 
scientific research, scientific community, digital library, digital archive, thesis, metadata, cyberinfrastructure
Résumé 
Cet article analyse les pratiques et besoins liés aux métadonnées produites par les communautés de recherche francophones. Il est ciblé sur les thèses dont le cycle de vie est totalement contrôlé par les institutions académiques. Les applications liées au pilotage de la recherche ont également été privilégiées comme étant représentatives du contexte de l’e-science. Trois études de cas illustrent le rôle fondamental de référentiels complémentaires sur les auteurs, affiliations ou éléments terminologiques. ARTIST, l’auteur collectif de cet article est également présenté.

Introduction

Attention : chargement et wicrification en cours de réalisation


Cet article est le résultat d’un travail collaboratif réalisé dans le cadre du projet ARTIST (Appropriation par la Recherche des Technologies de l’Information Scientifique et Technique ). Il a été écrit par un réseau d’auteurs, ingénieurs ou documentalistes, de différentes institutions. Notre première expérience collective tournait autour d’interventions terminologiques dans le cadre de la traduction d’un article écrit par Carl Lagoze et qui avait pour titre : “What Is a Digital Library anyway, anymore ?” (Qu’est-ce qu’une bibliothèque numérique, au juste ?). Celui-ci traitait de la structure profonde des bibliothèques numériques ‎[13]. Pour cette nouvelle expérience, la rédaction de cet article, nous avons choisi de traiter un sujet plus spécialisé : comment les métadonnées peuvent contribuer à aider la communauté de la recherche à bâtir des bibliothèques numériques.

Le rôle traditionnel des métadonnées est de « contribuer à améliorer la recherche d’information »‎[3]. Nous voudrions dépasser cette problématique pour prendre en compte l’ensemble des besoins des communautés scientifiques, et, par exemple, leurs attentes concernant la visibilité. A ce sujet, la publication annuelle du classement des meilleures universités au niveau mondial ‎[9] est devenu un indicateur essentiel pour les responsables de la politique scientifique. Les chercheurs suivent de très près cette évolution et manifestent un besoin vital de publier dans des revues à fort facteur d’impact. Le slogan « publish or perish » est utilisé par les établissements comme une incitation à déposer dans des archives ouvertes pour améliorer l’impact des productions scientifiques‎[7]. Dans ce contexte, « optimiser la qualité des métadonnées, notamment sur les affiliations » devient maintenant un élément stratégique pour atteindre un bon niveau de visibilité.

Les bibliothécaires et les communautés de chercheurs commencent donc à réaliser que les métadonnées ne sont pas seulement utiles pour rechercher des documents mais peuvent être appelées à jouer une fonction plus stratégique. Cette évolution est peut-être un premier pas vers une analyse plus globale sur le rôle potentiel de la publication scientifique dans ce qui est désigné outre-Atlantique par « cyberinfrastructure for e-science or e-research » ‎[14]‎[19]. Autrement dit, une réflexion est engagée sur la façon de « faire de la science » au temps des bibliothèques numériques. La publication est un élément essentiel de la vie scientifique, tant du point de vue de son animation que de son évaluation. Comment la repenser à l’ère du numérique ?

Le terme d’e-recherche identifie une thématique déjà ancienne sur le partage des ressources informatiques des établissements académiques [5]. En France les références des travaux sur les grilles d’ordinateurs en réseau, sont particulièrement visibles‎[4], malheureusement, on parfois tendance à se limiter à ce premier niveau. En revanche dans d’autres pays européens, comme le Royaume-Uni, l’accent est mis sur tous les aspects liés aux données produites par la recherche, avec par exemple la création du DCC (Data Curation Center) et également sur les services (comme les archives ouvertes). Dans ce contexte, cet article veut approfondir comment les métadonnées peuvent être utilisées pour le pilotage de la recherche en France. Nous avons choisi de spécialiser la discussion sur les thèses dont le cycle de vie est totalement contrôlé dans un cadre académique, sachant qu’une grande partie des réflexions peut s’appliquer à l’ensemble des productions de la communication scientifique.

Pour alimenter des systèmes d’information répondant à des besoins plus précis et plus variés les métadonnées doivent gagner en complexité. Or, dans un contexte d’archive ouverte, les solutions les plus populaires, telles que DSpace ‎[15] ou Eprints , ne sont pas suffisamment contraignantes pour inciter un déposant à élaborer des métadonnées consistantes ou détaillées. La plupart des recommandations se limitent donc souvent à un sous-ensemble basique du « Dublin Core » avec le moissonnage comme seule contrainte. Les thèses sont naturellement concernées par cette quête croissante de visibilité‎[8]. Nous verrons par exemple que leurs métadonnées doivent dépasser le seul cadre descriptif et inclure des éléments de gestion .

Comme pour toutes les productions numériques de la recherche, les métadonnées des thèses doivent pouvoir être utilisées dans tout portail (national, international, thématique) susceptible d’accroître leur visibilité. Dans un contexte de pilotage de la recherche, elles doivent également s’avérer aptes à la manipulation par des outils infométriques, en vue de produire des analyses de veille scientifique ou stratégique. A ce niveau, nous verrons l’importance fondamentale des affiliations et des vocabulaires d’indexation utilisées dans les métadonnées.

Nous commencerons cet article par une présentation du contexte français intégré dans un contexte international, puis nous décrirons sommairement plusieurs applications structurantes autour de la production des thèses, des catalogues collectifs et des archives institutionnelles. Enfin nous présenterons trois études de cas illustrant trois aspects des métadonnées et des vocabulaires.