Utilisateur:Jacques Ducloy/Blog/Le trou lorrain

De CIDE
Cette sculpture de Luca della Robbia illustre une discussion entre Platon et Aristote.Elle est ici utilisée pour signaler un paragraphe sujet à controverses. A propos de la Cyberinfrastructure
Quelques observations relatives à une faiblesse, des positions lorraines et françaises, qui a été repérée dans le Serveur d'exploration Cyberinfrastructure
Un trou dans une façade de Nancy, le 1er janvier 1916

Pour ceux qui ne connaissent pas les spécialités lorraines, le « trou lorrain » est un intermède gustatif qui permet de faire une transition entre une entrée « légère » comme un pâté lorrain et un plat « diététique » comme une potée lorraine.. Il s'agit en fait d'un sorbet mirabelle arrosé d'un alcool de mirabelle... Un délice !

Malheureusement, une analyse de corpus sur la thématique « cyberinfrastructure » font découvrir un trou qui évoquerait plutôt une séquelle de bombardement.

La cyberinfrastructure est un concept particulièrement significatif aux Etats-Unis où la NSF a mis en place une ensemble d'initiatives sur ce thème. Sur ce wiki, un article du canadien Gérard Boismenu, « La communication scientifique et ses enjeux politiques : un regard transatlantique » donne un exemple caractéristique du coté incontournable de la mention de ce programme de la NSF, dès qu'il s'agit travailler sur les nouvelles pratiques de la science au temps du numérique. L'article précise notamment[1] :

[...]il est possible de penser la publication scientifique non seulement comme diffusion de la recherche, mais aussi comme matériau de première main (sources premières) pour de nouvelles recherches.'
De ce double constat découle l’idée de la cyberinfrastructure. Un récent rapport du American Council of Learned Societies insiste sur l’intérêt de considérer le système de publication universitaire comme un laboratoire de recherche, c’est-à-dire comme une infrastructure mise au service de protocoles de recherche particuliers. Particulièrement en sciences humaines et sociales, ce serait une contribution au développement d’un Cultural Commonwealth(Our Cultural Commonwealth, 2006)[2]. Par ce terme, on entend qu’une communauté de personnes, avec un intérêt commun, se définit et que le bien-être public, et l’avantage ou le bien général, est le premier objectif du système d’information qui se construit.
Partant de cette notion de communauté, une cyberinfrastructure peut être comprise en termes de constitution d’un système d’informations, d’expertises, de normes, de politiques, d’outils et de services, mis largement à la disposition de communautés partageant les mêmes intérêts de recherche. La cyberinfrastructure est plus large qu’un outil ou un type d’information particulier à un projet, mais reste plus spécifique qu’un réseau. Il s’agit d’uneperspective de travail, d’un projet en devenir, sans que les contours et l’architecture soient déjà déterminés,[...]

L'apparition du terme cyberinfrastructure » dans un article est donc un marqueur d'une réflexion internationale sur la connaissance numérique.

Or en France, dans les années 85, pour faire face à la crise sidérurgique, le Gouvernement de Laurent Fabius annonce la délocalisation en Lorraine des centres de documentation du CNRS, le CDST et le CDSH, pour fonder l'INIST... Près de 500 emplois (directs ou indirects) sont ainsi installés en Lorraine dans la perspective d'un grand projet à visibilité mondiale autour de l'information scientifique dans un contexte de révolution numérique annoncée.

Bénéficiant du capital des bases Pascal et Francis, de la présence du Trésor de la Langue Française, et de la venue de l'INRIA, la Lorraine bénéficiait de l'expertise de près d'un millier de spécialistes autour de la connaissance numérique... La Lorraine aurait donc du se situer au centre des réflexions sur la cyberinfrastructure en France.

Un ensemble de cartes produites avec le Serveur d'exploration Cyberinfrastructure montrent une réalité inverse.

Des cartes qui interpellent

Dans le cadre des travaux de réflexion sur l'expérimentation de l'épistémè numérique avec ISTEX, un ensemble de serveurs d'exploration ont été construits sur des thématiques complémentaires. Nous nous intéresseront principalement ici à 3 thématiques :

  • la cyberinfrastructure, qui est un marqueur pour une vision politique au niveau mondial,
  • l'OCR, qui témoigne d'une compétence technologique de base sur le document numérique,
  • la TEI, qui indique une compétence dans les humanités numériques.

Une étude menée dans un cadre pédagogique autour du libre accès renforce cette interpellation.

Sur les cartes françaises, le trou lorrain sur la cyberinstrastructure

Les cartes ci-dessous montrent l'activité scientifique autour de ces 3 thématiques (un clic sur les cercles permet d'atteindre la bibliographie associée).

La cyberinfrastructure

On peut constater, sur la carte de droite, une absence de la Lorraine généralement très présente sur les technologies de base du numérique, comme le montrent les cartes ci-dessous sous l'OCR ou la TEI.

 
L'OCR
 
La TEI
Corrélations avec le libre accès

Les cartes générées à partir du « Serveur d'exploration autour du libre accès en Belgique » font apparaître un phénomène analogue. Par sa proximité géographique ou politique avec la Belgique, la Lorraine, qui devrait être bien placée, est totalement absente.

Remarque : ce corpus dépasse le strict cadre des chercheurs publiant sur libre accès pour inclure les communautés qui publient en libre accès.

 

Sur les cartes européennes, la faiblesse française

En fait, la faiblesse constatée de la région Lorraine se retrouve pour la France dans son ensemble.

Dans la carte ci-dessous, sur la cyberinfrastructure en Europe, montre la France assez fortement distancée par rapport au Royaume-Uni ou à l'Allemagne.

En revanche, sur la thématique OCR la France fait quasiment jeu égal avec le Royaume-Uni et se situe avant l'Allemagne.

Éléments méthodologiques

Les serveurs d'exploration ont été créés avec des corpus assez comparables :

  • ISTEX qui donne un éclairage totalement international mais un peu ancien,
  • PubMed et Pubmed Central pour avoir une actualité dès que les sciences de la vie sont présentes (et elles sont ici très actives)
  • Pascal/Francis qui sont, pour peu de temps, encore d'actualité (avec un léger biais pour la France, la francophonie et l'Europe)
  • HAL qui est, par construction, franchement hexagonal.

Eléments sur la nature des publications

Un examen des titres montre que le majorité des documents français sont en en fait de simples participation de chercheurs français à de grands projets numériques internationaux (dans lesquels la NSF est impliquée) sur des applications telles que le génome ou l'observation des océans.

Les mots des titres pour les publications françaises.

  1. data (10)
  2. analysis (7)
  3. software (6)
  4. microbial (6)
  5. marine (5)
  6. genome (5)
  7. distributed (5)
  8. genomic (4)
  9. control (4)
  10. web (3)
 

Les mots des titres pour les publications internationales.

  1. data (258)
  2. science (138)
  3. research (111)
  4. analysis (100)
  5. cyberinfrastructure (96)
  6. system (73)
  7. information (71)
  8. web (69)
  9. scientific (59)
  10. digital (59)
  11. grid (58)
  12. software (56)
  13. new (53)
  14. american (52)
  15. management (49)

Éléments d'analyse

Bien entendu, ces résultats doivent être interprétés avec précautions, mais ils amènent à s'interroger sur les effets d'un politique nationale autour de la connaissance numérique avec un centre de gravité en Lorraine.

logo travaux article en cours de réécriture à partir de ce point

L'idée générale est d'avoir une discussion collective (ou quelques contributions)

  • d'analyser les faiblesses (a priori structurelles) de la situation.
  • d'analyser le potentiel (bonne base technologique, la plateforme ISTEX, de nouvelles stratégies type Wikipédia.

Cette section doit s'appuyer sur la conférence-atelier de CIDE Expérimenter l'épistémè numérique avec ISTEX.

Du côté de l'INIST, un témoignage

Cette sculpture de Luca della Robbia illustre une discussion entre Platon et Aristote.Elle est ici utilisée pour signaler un paragraphe sujet à controverses. Point de vue personnel et volontairement incomplet
Ce paragraphe n'engage que son auteur. Des points de vue contradictoires sont les bienvenus.

De plus le témoignage donné ici est plutôt un exemple de prise de décision au plus haut niveau et qui s'est avéré très destructrice dans le paysage de l'IST en France. Dans le cadre de l'atelier sur l'épistémè numérique, il faudrait partir de cet exemple pour essayer de comprendre pourquoi ce type de décision a été pris.

Après un démarrage plutôt réussi, la gouvernance française de l'IST a engagé l'INIST dans une stratégie commerciale qui s'est avérée assez catastrophique. En effet l'INIST est maintenant une unité de services qui a perdu en 20 ans 60% de ses effectifs.

En 2014, l'INIST a annoncé l'abandon de la production des bases de données bibliographiques Pascal et Francis. Or pendant plus de 20 ans, le discours de la direction de la direction CNRS (ou du Ministère en charge de la recherche) vis à vis des laboratoires qui produisaient des bases de données a été « déchargez vous de la constitution des bases de données sur l'INIST ». Toutes les institutions qui ont fait confiance dans ce discours se retrouvent maintenant flouées.

En ce qui me concerne personnellement, l'image d'une ville bombardée n'est pas fortuite mais elle illustre très clairement ce que j'ai ressenti, dans les années 2000, lorsque Alain Chanudet, alors directeur de l'INIST, m'a demandé de prendre la direction des produits et services. Le CNRS venait d'abandonner l'idée de « privatiser l'INIST » mais en demandant à l'institut de rendre au CNRS 20% de ses effectifs.

L'argument utilisé par le CNRS était alors le suivant : « avec l'intelligence artificielle, on a plus besoin d'ingénieur pour fabriquer des bases de données ». Or les effectifs de l'INIST avait été organisé sur un principe assez simple : chaque domaine scientifique doit être couvert par 1 ou 2 ingénieurs. La réduction des effectifs s'est faite de manière très simple : tout ingénieur d'un domaine scientifique qui souhaitait quitter l'INIST en trouvant un laboratoire d'accueil était encouragé à le faire. Conclusion de cette stratégie politique : les meilleurs ingénieurs des domaines scientifiques les plus porteurs du CNRS sont partis en premier.

Dans cette prise de décision rapide la direction du CNRS n'a pas réalisé que pour produire des bases de données de façon automatique, il fallait des spécialiste de haut niveau pour construire des bases des connaissance et programmer des heuristiques.

On m'avait demandé d'accompagner la mutation de Pascal et Francis dans une approche « intelligence artificielle » et il n'y avait plus d'expert dans les domaines prioritaires du CNRS ! L'image du bombardement qui frappe une ville au hasard était donc bien réelle...

Jacques Ducloy 18 novembre 2016 à 16:03 (CET)

Des atouts pour un rebond

La croissance financière de la Wikipedia Foundation

Une stratégie « à la Wikipédia » (voire même OCLC) est-elle possible ?

Voir aussi

Notes
  1. Voir le paragraphe : Vers une cyberinfrastructure
  2. Our Cultural Commonwealth, Report of the American Council of Learned Societies Commission on Cyberinfrastructure for the Humanities and Social Sciences, American Council of Learned Societies, 2006, 44p.