Ingénierie des systèmes d'information (2019) Schöpfel

De Wicri SIC
Révision datée du 31 janvier 2020 à 10:40 par imported>Jacques Ducloy (Le terrain)
logo travaux Article en cours d'importation

Penser local

Développer une politique de données sur un campus SHS [1]


 
 

Titre
Penser local, Développer une politique de données sur un campus SHS
Auteur
Joachim Schöpfel
Affiliations
Université de Lille
Dates
Résumé
Dans le cadre du Plan national pour la science ouverte, la structuration et le partage des données de recherche font désormais partie des priorités de la politique scientifique de la France. Chaque établissement et chaque organisme scientifique doit se doter d’une politique de la science ouverte et mettre en place un ensemble de services et dispositifs pour la gestion des données de la recherche.
A partir d’enquêtes sur le terrain, l’article propose une feuille de route pour la mise en œuvre d’une telle politique sur un campus universitaire en sciences humaines et sociales. Dix principes indiquent des pistes pour la gouvernance et le pilotage de cette politique, pour déterminer les priorités de développement et d’investissements, et pour faire le lien avec les infrastructures de recherche, dont notamment Huma-Num.
Il s’agit d’une démarche bottom-up, qui met l’accent sur les pratiques et besoins des chercheurs et qui place les chercheurs au cœur d’une politique institutionnelle dans le domaine des données de recherche.

Les enjeux des données de la recherche

Avec le développement des données massives, la gestion des données de la recherche est devenue en quelques années l’un des enjeux majeurs des organismes et établissements de l’Enseignement Supérieur et de la Recherche (ESR). Depuis plusieurs années, l’Union européenne a inclus l’ouverture des données de la recherche dans sa politique scientifique, par le biais de ses programmes cadres (H2020), et par la définition d’une feuille de route pour la science ouverte. Ainsi, le Amsterdam Call for Action on Open Science de 2016 a adopté le principe selon lequel le partage et la gestion des données constituent l'approche par défaut pour toutes les recherches financées par des fonds publics [2], un principe confirmé par le Conseil européen en juin 2016.

La politique européenne poursuit plusieurs objectifs, dont l’efficience et l’efficacité de la recherche publique, le transfert des résultats vers la société civile et l’économie, la transparence de l’action publique et la science citoyenne (cf. Chartron 2018). Le développement des infrastructures de recherche, le changement des modalités et critères d’évaluation et les critères d’attribution des subventions figurent parmi les leviers de cette politique.

En France, la Loi pour une République numérique promulguée en octobre 2016 avait fixé le cadre pour une politique d'ouverture des données et des connaissances. Deux ans plus tard, deux documents stratégiques ont concrétisé cette politique. D’une part, le deuxième Plan d’action national 2018-2020 Pour une action publique transparente et collaborative [3] précise que la France « soutient la mise en œuvre des principes du gouvernement ouvert pour renforcer (…) l’accès aux matériaux et résultats de la recherche », dans la continuité des chantiers engagés par le gouvernement français sur la transformation numérique de l’Etat et sa modernisation.

D’autre part, le Plan National pour la Science Ouverte[4] , présenté en juillet 2018 à Lille, confirme l’engagement de l’Etat français pour une transformation durable de sa recherche publique vers un écosystème de la science ouverte, « dans lequel la science est plus cumulative, plus fortement étayée par des données, plus transparente, plus rapide et d’accès plus universel ». L’objectif est triple :

  • faire une science meilleure, plus intègre, plus performante, plus rapide ;
  • renforcer la confiance des citoyens dans la science, en particulier dans les domaines sensibles comme le changement climatique, les nouvelles énergies ou les sciences médicales ;
  • reprendre le contrôle sur le processus scientifique et sur la diffusion et l’exploitation des résultats de la recherche.

Le Plan national du Ministère propose trois volets pour réaliser cette transformation : une série de mesures et d’actions pour généraliser l’accès libre aux publications issues de la recherche publique ; d’autres mesures pour structurer et ouvrir les données de la recherche ; et plusieurs pistes pour mobiliser l’ensemble des acteurs afin d’intégrer la démarche nationale dans un paysage européen et international. L’approche est double, top-down pour déterminer la feuille de route, fixer les objectifs, créer des incitations et coordonner les actions notamment par la mise en place d’un Comité pour la Science Ouverte [5](CoSO), et bottom-up dans la mesure où la politique nationale s’appuie pour l’essentiel sur les initiatives et projets sur le terrain de l’ESR français.

Lors des Premières Journées Nationales de la Science Ouverte à Paris, Borgman (2018) a insisté sur l’importance de placer la gestion des données de la recherche dans le contexte d’une infrastructure de la connaissance (knowledge infrastructure), autour d’un écosystème de personnes, pratiques, technologies, institutions etc. Les répertoires des services et entrepôts de données témoignent de la diversité des réalisations[6] . De nombreux dispositifs sont opérationnels depuis de longues années, comme le système des World Data Centers ; d’autres en revanche sont en cours de déploiement (comme le réseau des plateformes DataVerse) ou seulement à l’étude. La compréhension de l’environnement concret est primordiale pour préparer et mettre en œuvre une politique de données. Il n’y a pas de solution unique.

Aussi, les mesures et actions du Plan national pour « structurer et ouvrir les données de la recherche » constituent les nouvelles conditions auxquelles les acteurs de l’ESR doivent trouver des réponses (obligation de la diffusion ouverte des données de la recherche, généralisation des plans de gestion, certification, création d’une fonction administrateur des données etc.) sans pour autant imposer un modèle de référence pour les initiatives sur le terrain. Le Collège Données de la recherche du nouveau CoSO[7] contribuera au développement de ces initiatives par le biais d’un « kit d’accompagnement », mais n’a pas vocation à proposer une solution clé en main.

Dans cet état d’esprit, deux enquêtes ont été menées sur le campus Pont de Bois de l’Université de Lille, dans le domaine des Sciences Humaines et Sociales : la première enquête a été réalisée en 2015 auprès de 270 enseignants-chercheurs, chercheurs, doctorants pour évaluer les pratiques, besoins et attentes en matière de gestion des données de la recherche (Prost et Schöpfel 2015) ; la deuxième enquête a pris la forme d’un audit auprès de 51 chefs de projets, directeurs de laboratoires, chargés de missions afin de mieux comprendre les incitations et verrous sur le terrain et proposer quelques perspectives de développement (Schöpfel 2018).

L’objectif de cet article est de faire une synthèse des recommandations issues de ces deux enquêtes, sous forme d’une liste de dix principes pour la mise en place d’une politique de données sur un campus universitaire en sciences humaines et sociales. Il s’agit donc d’une approche bottom-up qui place les pratiques et attentes des acteurs du terrain – chercheurs, enseignants-chercheurs, ingénieurs, doctorants – au cœur de l’action, dans une démarche que Chartron (2018) a caractérisée comme un « processus de co-construction (par les communautés scientifiques) avec les politiques et les corps intermédiaires ».



Le terrain

L’étude empirique des pratiques individuelles et collectives de gestion des données de recherche est nécessaire au développement de nouveaux services et dispositifs, comme par exemple des entrepôts, plates-formes, formations etc., pour une meilleure gestion. Ce qui est plus important encore, pour une politique de données institutionnelle, c’est la compréhension des priorités propres des chercheurs concernant les données de la recherche, les incitations et les verrous. Quel est leur agenda ? Quelles sont les opportunités et les menaces du développement d'une culture de données ? Voici un aperçu des principaux résultats de nos enquêtes qui sont convergents avec d’autres analyses, dont notamment l’enquête sur le campus de l’Université de Rennes 2 (Serres et al. 2017) et une autre enquête à Bordeaux-Montaigne (Duprat 2019).

Tout d’abord, que veut dire « données de recherche » ? L’acceptation du terme varie selon les disciplines, les approches, les contextes, révélant aussi bien une complexité épistémologique et sémantique qu’une construction communautaire et politique (Malingré et al. 2018). Certes, il est possible de distinguer plusieurs catégories de données (typologie), de déterminer leurs principales fonctions et finalités (données en tant que « valeur »), et de faire le lien entre données et processus scientifique (données primaires/sources et données secondaires/résultats) ; il reste cependant le constat d’une relation forte entre la compréhension exacte et spécifique de ce terme et les thématiques, disciplines, méthodes et équipements (Schöpfel et al. 2017).

En ce qui concerne leurs données, la priorité de la plupart des chercheurs interrogés n’est pas la gestion en tant que telle, la préservation ou le partage, mais bien la sécurité des données et, au sens large, la sécurité des dispositifs utilisés pour le stockage et l’analyse des données. Cette observation rejoint la conclusion de l'enquête rennaise, selon laquelle le manque de sécurité des données est l'un des points les plus cruciaux mis en évidence. La deuxième préoccupation des chercheurs interrogés est la communication de « données chaudes » (en cours d’analyse) tout au long du projet, au sein de l’équipe scientifique. Il ne s'agit pas de partager des données dans le sens d'une ouverture ou d'une diffusion vers un public plus large, mais bien d'un échange ou d'un transfert de données dans le cadre du cahier des charges d'un projet. La question cruciale est l'opposition entre ce besoin de communication et les contraintes d’une protection imposée par la réglementation. Quels facteurs favorisent les bonnes pratiques en matière de données ? Quelles sont les raisons pour lesquelles les chercheurs mettent en œuvre une gestion réfléchie de leurs données ? Selon nos résultats, six facteurs peuvent se chevaucher :

  • les critères des appels à projets du programme cadre H2020,
  • les appels à projets des programmes de l’Agence nationale de recherche (ANR),
  • les exigences d’une bonne gestion de projet, en particulier dans les projets d’envergure,
  • les contraintes juridiques liées à des données spécifiques (vie privée, santé, mineurs…),
  • les protocoles et normes éthiques et
  • la politique éditoriale d’un nombre croissant de revues académiques qui demandent la disponibilité des jeux de données associés aux articles.

Plusieurs mesures du Plan national du Ministère vont créer de nouvelles incitations, comme le lancement d’un « appel ANR Flash » pour accélérer l’adoption des principes FAIR [8] (Wilkinson et al. 2016) et l’ouverture des données, la généralisation de la mise en place de plans de gestion dans les appels à projets de l’ANR et d’autres agences à partir de 2019, la création d’un prix des données de la recherche pour récompenser les équipes et projets exemplaires, la construction d’un réseau de correspondants données sur le terrain, et l’adoption d’une politique de données ouvertes associées aux articles de revue.

Quant aux verrous, les études sur les pratiques scientifiques donnent parfois l’impression que le principal obstacle à une bonne gestion est le manque de motivation et/ou de compétences des chercheurs eux-mêmes. Les interviews sur le campus des sciences humaines et sociales (SHS) de l’Université de Lille dessinent une autre image. Le problème principal n’est pas la psychologie ou le savoir-faire, mais l’absence d’informatique dédiée (stockage, communication, bases de données, etc.) et de ressources humaines (département informatique et juridique, bibliothèque universitaire, laboratoires, etc.). Les chercheurs et les autres membres du personnel concernés sont généralement conscients de ce qui devrait être fait pour assurer un minimum de gestion efficace des données de la recherche, mais ils sont souvent incapables de le faire correctement en raison du manque de ressources et de la lourde charge de travail. Parmi les problèmes identifiés figurent le manque d'outils et d'assistance pour les doctorants, des programmes de formation insuffisants, des problèmes de conservation à long terme sur les serveurs de laboratoire, un manque de suivi des projets à grande échelle et un manque de procédures (cf. Serres et al. 2017 et Duprat 2019). A ceci s’ajoute le vécu d’ « injonctions contradictoires » (Corvol 2018) entre pratiques communautaires, dispositifs de valorisation, appels à l’ouverture et au partage et les contraintes réglementaires et techniques.


Des stratégies convergentes


Dix principes pour co-construire une politique de données en SHS

...

Notes

Cette section introduit les notes de l'article lors de sa soumission.

  1. Il s’agit d’une version abrégée et modifiée d’un rapport publié sur HAL
    (https://hal.archives-ouvertes.fr/hal-01846849).
    L’étude a été réalisée dans le cadre du projet D4Humanities, avec un financement de la Maison européenne des sciences humaines et sociales à Lille (MESHS) et du Conseil Régional Hauts-de-France.
  2. https://www.government.nl/documents/reports/2016/04/04/amsterdam-call-for-action-on-open-science
  3. https://www.etalab.gouv.fr/plan-daction-national
  4. http://www.bibliothequescientifiquenumerique.fr/plan-national-pour-la-science-ouverte/
  5. https://forum.ouvrirlascience.fr/
  6. Cf. re3data https://www.re3data.org/ et Cat-OPIDoR https://cat.opidor.fr
  7. Un ensemble de groupes de travail pour accompagner la politique de données de recherche du Ministère https://www.ouvrirlascience.fr/college-donnees-de-la-recherche/
  8. Findable, accessible, interoperable, reusable : des principes de bonnes pratiques qui cherchent à rendre les données de recherche plus facilement trouvables et utilisables, notamment par des machines

Bibliographie

[Averkamp S.] et al. (2014). Data Management at the University of Iowa: A University Libraries Report on Campus Research Data Needs. University of Iowa. http://ir.uiowa.edu/lib_pubs/153/

[Borgman 2018] Borgman C. L,  Big Science, Little Science, and Open Science: Sustainability, Stewardship, and Knowledge Infrastructures. JNSO 2018. Premières Journées Nationales de la Science Ouverte "De la stratégie à l'action", 4-6 décembre 2018, Paris.

[Chartron 2018] Chartron G.,  L'Open science au prisme de la Commission européenne. Education et sociétés, vol. 41, no 1, p. 177-193. doi:10.3917/es.041.0177

[Corvol 2018] Corvol P.,  (2018). Le chercheur et la science ouverte. Au cœur d'injonctions contradictoires ? JNSO 2018. Premières Journées Nationales de la Science Ouverte "De la stratégie à l'action", 4-6 décembre 2018, Paris.

[Cox 2018] Cox A.,  (2018). Exploring research data management, Facet, London.

[Duprat 2019] Duprat J.,  (2019). Les données de la recherche à l’Université Bordeaux Montaigne : Synthèse d’une enquête qualitative auprès des chercheurs. Rapport de recherché, Université Bordeaux Montaigne. 2019. https://hal.archives-ouvertes.fr/hal-02020141

Koltay T. (2016). Data literacy for researchers and data librarians. Journal of Librarianship and Information Science, vol. 49, no 1, p. 3-14. doi:10.1177/0961000615616450

LERU (2018). Open science and its role in universities: A roadmap for cultural change. League of European Research Universities, Leuven, Belgium. https://www.leru.org/publications/open-science-and-its-role-in-universities-a-roadmap-for-cultural-change

Liber (2012). Ten recommendations for libraries to get started with research data management. Final report. LIBER working group on E-Science / Research Data Management, The Hague. https://libereurope.eu/strategy/research-infrastructures/rdm/

[Malingré 2019] Malingré M.L.,  et al. (2019). Construction(s) et contradictions des données de recherche en SHS. Recherche d’information, document et web sémantique, vol. 2, n° 1. doi :10.21494/ISTE.OP.2019.0336

Neuroth H. et al. (dir.) (2013). Digital curation of research data. Experiences of a baseline study in Germany. vwh, Glückstadt.

[Prost 2015] Prost H. et Schöpfel J.,  (2015). Les données de la recherche en SHS. Une enquête à l'Université de Lille 3. Rapport final. Université de Lille 3, Villeneuve d'Ascq. http://hal.univ-lille3.fr/hal-01198379v1

Pryor G. et al. (dir.) (2014). Delivering research data management services: fundamentals of good practice. Facet, London.

Reyes A. (2017). La data literacy ou la "culture de la donnée", le prochain enjeu de nos sociétés. Les Echos, 20 février 2017 https://www.lesechos.fr/idees-debats/cercle/cercle-166504-la-data-literacy-ou-la-culture-de-la-donnee-le-prochain-enjeu-de-nos-societes-2066367.php

Reznik-Zellen R. et al. (2012). Tiers of Research Data Support Services. Journal of eScience Librarianship, vol. 1, no 1, p. 27-35. http://escholarship.umassmed.edu/jeslib/vol1/iss1/5/

Schirrwagen J. et al. (2018). Expanding the research data management service portfolio at Bielefeld University according to the three-pillar principle towards data FAIRness. CODATA RDM Symposium 2018, 18-20 mars 2018, Göttingen. https://pub.uni-bielefeld.de/publication/2919659

[Schöpfel 2017] Schöpfel J.,  et al. (2017). « Pour commencer, pourriez-vous définir ‘données de la recherche’ ? » CEUR Workshop Proceedings 1860, CEUR-WS.org 2017.
https://dblp.uni-trier.de/db/conf/inforsid/vador2017.html

[Schöpfel 2018] Schöpfel J.,  (2018). Vers une culture de la donnée en SHS. Une étude à l'Université de Lille. Rapport final. Université de Lille, Villeneuve d'Ascq.
https://hal.archives-ouvertes.fr/hal-01846849

Schöpfel J. et al. (2018). Research data management in the French National Research Center (CNRS). Data Technologies and Applications, vol. 52, n° 2, p.248-265. doi:10.1108/DTA-01-2017-0005

[Serres 2017] Serres A.,  et al. (2017). Données de la recherche en SHS. Pratiques, représentations et attentes des chercheurs : une enquête à l'Université Rennes 2. Rapport final. Université Rennes 2.
https://hal.archives-ouvertes.fr/hal-01635186


[Wilkinson 2016] Wilkinson M. D.,  et al. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, vol. 3, no 160018. doi:10.1038/sdata.2016.18

van Zeeland H. et Ringersma J. (2017). The development of a research data policy at Wageningen University & Research: best practices as a framework. LIBER Quaterly, vol. 27, no 1, p. 153-170. Doi :10.18352/lq.10215/



Voir aussi

Notes de la rédaction
  1. Cette date correspond en fait à la date initialement prévue pour l'édition de l'article.
Dans le réseau Wicri :

Ceci est la page de référence de « Ingénierie des systèmes d'information (2019) Schöpfel »