Nuvola apps important.png Attention, suite à une faille de sécurité, les liens vers les serveurs d'exploration sont désactivés.

Solaris (1995) Polanco 0

De Wicri SIC

Aux sources de la scientométrie

Introduction


 
 

Cette page contient une réédition hypertexte de l'introduction d'un article de Xavier Polanco, « Aux sources de la scientométrie », publié dans la revue Solaris[1], en 1995.

Le contenu et le style initial ont été respectés. La seule adaptation dans le corps de l'article concerne l'insertion de liens hypertextes.

Solaris Btnacc.gif Solaris Btncom.gif Solaris Btnsom.gif Solaris Btn.gif

Aux sources de la scientométrie

Xavier POLANCO

Ingénieur de recherche


Direction Groupe Infométrique de l'INIST-CNRS, Nancy


Solaris Sol2.gif

Cet essai se propose à travers l'analyse du travail fondateur de Derek John de Solla Price (1922-1983), de montrer la constitution de ce champ intitulé postérieurement scientométrie.

Dans l'introduction, on tâche de cerner le domaine de la scientométrie dans ses relations avec la bibliométrie et l'infométrie.

Dans la première partie, on présente d'abord le contexte dans lequel la scientométrie de Price s'est constituée : un réductionnisme bibliométrique ; une vision cumulative de la science ; l'idée d'une science de la science. Ensuite, on analyse les hypothèses de base et les règles méthodologiques de son dispositif scientométrique, ainsi que les cinq hypothèses fondamentales définissant la théorie scientométrique de Price :

  • la loi de croissance exponentielle (qui serait à son avis la loi fondamentale de toute analyse de la science) ;
  • la nature logistique ultime de la croissance scientifique ;
  • la forme hyperbolique des distributions bibliométriques (en particulier les lois de Lotka et de la racine carrée de Price) ;
  • le modèle fondamental de la distribution d'avantages cumulatifs (DAC) ;
  • la théorie sociométrique des collèges invisibles.

Un bilan clôture cette première partie et soulève le problème d'une scientométrie cognitive à l'égard de l'approche externaliste de Price.

La seconde partie expose le modèle bibliométrique de Price. On voit que dans ce modèle l'analyse des citations vient s'ajouter à la statistique de la littérature scientifique (exposée dans la première partie). On analyse la fonction que le modèle de Price assigne à l'article dans la pratique scientifique. On montre de quelle manière ce modèle établit la distinction entre « archive » et « front de recherche » (research front) dans un domaine scientifique, et il trace une ligne de démarcation empirique entre la science et les autres formes de connaissance. On montre également que la technique que Price utilise pour relever le réseau constitutif de la science (son structure socio-cognitive), lui permettant de concevoir par ailleurs le projet d'une cartographie de la science, est l'analyse des citations.
Dans les conclusions, cet essai propose une nouvelle orientation, ou si l'on préfère, un changement de paradigme : le projet d'une ingénierie de la connaissance utilisant des méthodes infométriques.

On entend par modèle une équation ou une structure (quand on ne travaille pas avec un modèle numérique) destinée à représenter, d'une manière simplifiée mais consistante, un processus ou un système. La construction d'un modèle statistique est destinée à analyser, prévoir ou décider à partir d'une base rigoureuse et fiable.


[Introduction] [Partie 1 : Un modèle statistique de la science] [Partie 2 : un modèle bibliométrique de la science]


Solaris Btnup2.gif Introduction : Le champ de la scientométrie dans ses relations avec la bibliométrie et l'infométrie

Les termes "scientométrie" et "études quantitatives de la science et de la technologie" seraient des synonymes. D'autre part, il y a un aspect bibliométrique fort au coeur de ces études quantitatives ou scientométriques. Parfois, on utilise le terme de "technométrie" pour signifier l'étude quantitative de la technologie.

 

En 1962, Price observait que "la mécanique statistique de la main-d'oeuvre et de la littérature scientifique obéit à des lois générales", et que "la méthode empirique traitant le nombre brut de périodiques ou d'articles comme indice du volume de la science trouve une justification théorique dans l'existence de courbes stables et régulières" [1].

En 1969, Pritchard définissait la bibliométrie comme "l'application des mathématiques et des méthodes statistiques aux livres, articles et autres moyens de communication" [2].

La même année Price définissait la scientométrie comme "les recherches quantitatives de toutes les choses concernant la science et auxquelles on peut attacher des nombres" [3]. Ce sens très large de la scientométrie s'est restreint à un sens bibliométrique dans la pratique, si l'on juge par ce qui est publié dans la revue Scientometrics, c'est-à-dire au calcul des publications (périodiques, articles, brevets), d'auteurs et de citations [4]. Ce phénomène a été aidé du fait de l'existence des bases de données bibliographiques dans le domaine de l'information scientifique et technique (publications et brevets). L'hypothèse étant que les publications scientifiques et les brevets constituent une source d'informations et jouent le rôle d'indicateurs de production de connaissances certifiées dans les domaines des sciences et des techniques.

 

Au début des années quatre-vingt est née en France la méthode des mots associés (co-word analysis en anglais), elle représente une autre alternative dans le champ de la scientométrie [5], à l'égard du comptage bibliométrique traditionnel et de l'analyse des citations et des co-citations.

 

La scientométrie désigne, dans son acception large comme il a été déjà indiquée ci-dessus, l'application de méthodes statistiques à des données quantitatives (économiques, humaines, bibliographiques) caractéristiques de l'état de la science. Ce domaine s'est développé, d'une part, comme une réponse à une demande provoquée par la politique de la science et par la gestion (ou management) de la recherche et, d'autre part, comme le résultat des études de la science utilisant des techniques statistiques et informatiques de traitement de données [6].

On a proposé récemment cette définition compréhensive du domaine :

"Les études quantitatives de la science et de la technologie représentent le champ de recherche où l'on utilise les méthodes et les techniques mathématiques, statistiques et de l'analyse des données en vue de rassembler, manipuler, interpréter et prévoir une variété de caractéristiques telles que la performance, le développement et la dynamique de la science et de la technologie" [7].

On a observé également que les études quantitatives de la science et de la technologie comportent un volet de recherche appliquée et un autre de recherche fondamentale. Le premier obéit principalement à la demande d'indicateurs quantitatifs de la science et de la technologie pour part de la politique scientifique [8]. Quant au second, on estime que les méthodes quantitatives et notamment l'analyse des données constituent un élément indispensable pour l'avancement de notre compréhension dans l'étude de la science en tant que système complexe de production et d'échange de connaissances [9].


En outre, le domaine scientométrique (ou des études quantitatives de la science et de la technologie) présenterait une division technique interne en trois sous-domaines partiellement recouvrants [10] :


  1. celui des méthodes et des techniques relatives au développement des indicateurs visant à mesurer les performances de la recherche, et lié aux problèmes de la politique scientifique et du management de la recherche ;
  2. un autre secteur ayant trait au développement des indicateurs concernant les performances technologiques, intéressant non seulement une politique de la technologie mais aussi le management de la R&D ;
  3. et enfin le sous-domaine des méthodes et des techniques quantitatives utilisées dans l'étude des processus cognitifs du développement des domaines scientifiques et techniques, et de l'interaction entre science et technologie.

Aujourd'hui, le terme infométrie est souvent utilisé pour désigner l'ensemble d'activités métriques dans le domaine de la documentation et en particulier de l'information scientifique et technique (IST) [11].

 

Pour conclure, voici donc ces trois définitions :


  1. Bibliométrie : définie en 1969 comme "l'application des mathématiques et des méthodes statistiques aux livres, articles et autres moyens de communication" (Pritchard) [12].
  2. Scientométrie : on peut la considérer comme la bibliométrie spécialisée au domaine de l'IST. Toutefois, la scientométrie désigne d'une manière générale l'application de méthodes statistiques à des données quantitatives (économiques, humaines, bibliographiques) caractéristiques de l'état de la science [13].
  3. Infométrie : terme adopté en 1987 par la F.I.D. (International Federation of Documentation, IFD) pour désigner l'ensemble des activités métriques relatives à l'information, couvrant aussi bien la bibliométrie que la scientométrie [14].

Dans les pages qui suivent, je montrerai de quelle façon le projet de Derek John de Solla Price (1922-1983) -- et que j'estime fondateur -- s'appliqua à constituer le domaine de la scientométrie dans le cadre d'une science de la science.


L'histoire et la sociologie des sciences se retrouvent d'une manière assez explicite avec l'analyse statistique de la littérature scientifique (ou scientométrie) dans l'approche de Price. Physicien de formation, Price se considérait lui-même plus historien des sciences et des techniques que sociologue. Cependant ses travaux ont eu un plus grand retentissement parmi les sociologues et les politologues de la science que parmi les historiens.


Dans un essai sur le problème de la théorie dans la science de l'information [15], Meadows signale que l'intérêt pour les caractéristiques quantitatives de l'information, c'est-à-dire pour une approche de type bibliométrique, s'est particulièrement développé à partir des années 1950, sous l'impact du travail de Shannon (1949), ayant comme fondement les lois bibliométriques de Lotka (1926), de Bradford (1934) et de Zipf (1935) [16]. Et toujours selon Meadows :

"'The key figure in this new quantitatives studies was Price, whose writings, especially Little Science, Big Science had a major impact on thinking about the growth and evolution of scientific journals. In part, he drew together ideas already under discussion. For example, the rapid growth in the amount of scientific literature had been debated by librarians and others since the First World War. Similarly, but separately, there had been work on relevant statistical distributions, such as Lotka's work on scientific productivity and Zipf's on word distributions. Price extended this earlier work to provide an integrated, quantitative picture of the scientific literature (...). One important area of Price's work covered the applications of citation analysis. In this, he relied on the contemporaneous activities of Garfield in developing the concept of a citation index" (p. 60).

De son côté, Garfield lui-même a remarqué le rôle pionnier de Price ; en raison notamment de la convergence dans ses travaux de l'histoire des sciences, de la scientométrie et de la science de l'information. Convergence que Price désignera "science de la science".


Utilisant l'analyse de citations, Garfield a identifié le coeur de l'oeuvre de Price. Il est constitué par les sept textes plus cités, en tête et de loin le célèbre Little Science, Big Science (1963). Ce livre serait donc l'oeuvre de référence, suivi de l'article "Network of scientific papers" (1965). Ensuite, vient son ouvrage d'histoire intitulé Science since Babylon (1961), et puis en ordre décroissant les articles : "Collaboration in an Invisible College" (1966), "Citation Measures of Hard Science, Soft Science, Technology, and Nonscience" (1970), "A General Theory of Bibliometric and other Cumulative Advantage Processes" (1976), et "Measuring the Size of Science" (1969) [17].


Le travail que je présente ici est une contribution non seulement à la connaissance de l’œuvre de Price et pour les raisons qu'on vient de citer, mais aussi et surtout à la théorie de la scientométrie.


Dans la première partie, j'analyse les prémisses et les hypothèses statistiques qui constituent l'architecture théorique de son modèle statistique de la science. Dans la seconde partie, son modèle bibliométrique de la science fondé essentiellement sur l'analyse des citations.


En ce qui me concerne, et pour conclure cette introduction, je tiens à préciser que je me place intellectuellement et professionnellement dans l'infométrie en ce qu'elle comporte de synthèse de la bibliométrie et de la scientométrie, mais aussi comme Brookes l'a très bien remarqué, en ce qu'elle signifie d'ouverture à l'étude mathématique de l'information sous ses formes aussi bien documentaire (science sociale de l'information) qu'électronique ou physique (science de l'ingénieur ou théorie de la communication de Shannon), et dans ce sens je suis de ceux qui pensent que la science de l'information, à être considérée du point de vue de l'infométrie, relève du domaine des sciences de l'ingénieur [18].


A l'heure actuelle, s'associant aux recherches en sciences cognitives et en informatique (notamment en intelligence artificielle), et en linguistique informatique, l'infométrie peut contribuer au développement d'une véritable ingénierie de la connaissance objective [19].



Solaris Btnup2.gif Notes

[1]

Price, Science et Suprascience. Traduction française de G. Lévy, Paris, Fayard, 1972, p. 83. Version original en anglais : Little Science, Big Science. New York, Columbia University Press, 1963, 118 p.

[2]

A. Pritchard, "Statistical Bibliography or Bibliometrics?", Journal of Documentation, vol. 25, nº 4, December 1969, p. 348-349.
Pour la préhistoire de cette discipline, voir F.R. Shapiro, "Origins of Bibliometrics, Citation Indexing, and Citation Analysis: The Neglected Legal Literature", Journal of the American Society for Information Science, vol. 43, nº 5, 1992, p. 337-339.
Du côté francophone, nous pouvons citer Alphonse de Candolle (1806-1893), Histoire des sciences et des savants depuis deux siècles (1873), dont la seconde édition de 1885 a été rééditée par Bruno Latour dans le "Corpus des Œuvres de Philosophie en Langue Française" dirigé par Michel Serres. Paris, Fayard, 1987 ;
voir à cet égard A.T. Szabó, "Alphonse de Candolle's early scientometrics (1883, 1885) with references to recent trends in the field (1978-1983)", Scientometrics, vol. 8, nº 1-2, 1985, p. 13-33.

[3]

D. de Solla Price, "The Structures of Publication in Science and Technology", dans H. Gruber et D.G. Marquis (éds.), Factors in the Transfer of Technology. Cambridge, Mass., The MIT Press, 1969, (p. 91-104), p. 91 : "quantitatives investigations of all the things about science to which numbers can be attached", et Price ajoute, "There has been long tradition of such work, counting papers and measuring man power, expenditure of money, and several other things, but most recently a better set of quantitative data than ever before has become available".
Price se réfère ici à l'analyse des citations à partir des données fournies par le Science Citation Index de l'ISI.

[4]

Voir R.N. Broadus, "Toward a Definition of « Bibliometrics », Scientometrics, vol. 12, nº 5-6, 1987, p. 373-379.

[5]

Pour une vision de la scientométrie du point de vue des auteurs de la méthode des mots associés, voir J-P. Courtial, Introduction à la scientométrie : de la bibliométrie à la veille technologique. Paris, Anthropos-Economica, 1990 ; M. Callon, J-P. Courtial et H. Penan, La scientométrie. Paris, Presses Universitaires de France, collection "Que sais-je?", volume nº 2727, 1993.

[6]

A.F.J. van Raan (éd.), Handbook of Quantitative Studies of Science and Technology. Amsterdam : North Holland, Elsevir Science Publishers, 1988. Van Raan, "Introduction to the Handbook", p. 1-8.

[7]

Ibid., "Quantitative studies of science and technology therefore represent the research field of utilisation of mathematical, statistical, and data-analytical methods and techniques for gathering, handling, interpreting, and predicting a variety of features of the science and technology enterprise, such as performance, development, dynamics" (p. 1).

[8]

Ibid., "On the applied side, the demand from science policy for `objective' data and specific manipulations of data (`science and technology indicators') is a continuous driving force for the development of quantitative studies of science and technology " (p. 1).

[9]

Ibid., "On the basic side, science is a complicated system of knowledge production and knowledge exchange, and the use of empirical methods in which sophisticated data-collection and data-handling techniques play a substantial role, is undoubtedly a prerequisite for the advancement of our understanding " (p. 1).

[10]

Ibid., p.énbsp;1-2.

[12]

Ainsi par exemple, A. Bookstein écrit : "My impression is that this termes [Bibliometrics] is being replaced in the literature by Informetrics, a term suggesting a wider range of applicability, and my usage in this paper is intended to be consistent with this evolution", voir A. Bookstein, "Informetric Distributions, Part I : Unified Overview", Journal of the American Society for Information Science, vol. 41, nº 5, 1990, p. 368-375, la note de la p. 368. Un même constat est fait du côté de l'Inde, voir par exemple I.K. Ravinchandra Rao et A. Neelameghan, "From Librametry to Informetrics: An Overview and Ranganathan's Contributions", Libri, vol. 42, nº 3, 1992, p. 242-257.

[12]

Pour suivre l'évolution de ce domaine de recherche dans le cadre des sciences et technologies de l'information, notamment dans le monde anglo-américain, voir :
F. Narin et J.K. Moll, "Bibliometrics", Annual Review of Information Science and Technology, vol. 12, 1977, p. 35-58 ;
H.D. White et K.W. McCain, "Bibliometrics", Annual Review of Information Science and Technology, vol. 24, 1989, p. 119-186 ;
pour une vision d'ensemble du domaine de la bibliométrie, voir le numéro spécial sous la direction de W.G. Potter, intitulé "Bibliometrics" de la revue Library Trends, vol. 30, nº 1, 1981.
Voir également L. Ikpaahindi, "An Overview of Bibliometrics: Its Measurements, Laws and Theirs Applications", Libri, vol. 35, nº 2, 1985, p. 163-177.

[13]

La référence est ici la revue Scientometrics fondée en 1978. Pour une introduction à la scientométrie, on profitera des références signalées ci-dessus dans les notes 5 et 6. Pour la signification biblio- scientométrique de cet ouvrage, voir. Il est intéressant de noter que L. Egghe, "Methodological Aspects of Bibliometrics", Library Science, vol. 25, nº 3, 1988, p. 179-191, réduit la scientométrie à l'analyse des citations.

[14]

L. Egghe et R. Rousseau, Introduction to Informetrics. Amsterdam, Elsevier, 1990.
L. Egghe et R. Rousseau, éds., Informetrics 87/88. Amsterdam, Elsevier, 1988, p. IV ;
dans ce même ouvrage, voir la référence de B. C. Brookes dans son article "Comments on the Scope of Bibliometrics", p. 29 ;
ici Brookes note justement : "A third term informetrics has recently been adopted by F.I.D. but, as far as I can see, it is been used to cover both sciento- and biblio- metrics impartially. It has produced no distinctively new ideas of its own but as it implicitly covers both documentary and electronic forms of information, it may have a future". Il est intéressant de remarquer que du point de vue de Brookes, l'infometrie couvre indistinctement dans son domaine de recherche la théorie mathématique de l'information bibliographique ou documentaire (bibliométrie traditionnelle), et la théorie mathématique de l'information electronique c'est-à-dire la théorie de l'information de Shannon.

[15]

A.J. Meadows, "Theory in information science", Journal of Information Science, vol. 16, nº 1, 1990, p. 59-63.

[16]

Pour la source originale de ces lois, voir :
A.J. Lotka, "The frequency distribution of scientific productivity", Journal of the Washington Academy of Sciences, vol. 16, nº 12, 1926, p. 317-323 ;
S.C. Bradford, "Sources of information on specific subjects", Engineering, vol. 137, nº 3550, 1934, p. 85-86 ;
G.K. Zipf, The psycho-biology of language. Boston, Houghton, 1935,
et également Human behaviour and the principle of least effort. Cambridge, Mass., Addison-Wesley, 1949.

[17]

E. Garfield, "In Tribute to Derek John de Solla Price: A Citation Analysis of Little Science, Big Science", Scientometrics, vol. 7, nº 3-6, 1985, p. 487-503.

[18]

La conséquence institutionnelle de cette position est que la science de l'information est à déplacer dans les écoles d'ingénieurs et les facultés des sciences, comme l'informatique, c'est-à-dire comme une branche des sciences de l'ingénieur. Par ailleurs, le philosophe des sciences Karl Popper dans son essai Misère de l'historicisme (1944), traduit de l'anglais par H. Rousseau (Paris, Librairie Plon, 1957), disait avec raison qu'il fallait développer en sciences sociales ce qu'il appellait une ingénierie sociale, c'est-à-dire "une méthode dont le but serait une science sociale technologique" (p. 47). Ceci est applicable au domaine des sciences sociales de l'information.

[19]

Ce projet est implicite dans X. Polanco et al., "L'infométrie, un programme de recherche", Journées d'études "Les systèmes d'information élaborée", organisées par la Société Française de Bibliométrie Appliquée, Ile Rousse, Corse, 9-11 juin 1993.
Cette position est explicitement exprimée dans mon texte intitulé "L'infométrie mode d'emploi", à paraître dans une publication de l'Université Catholique de Louvain (Belgique).


A suivre...



[Introduction] [Partie 1 : Un modèle statistique de la science] [Partie 2 : un modèle bibliométrique de la science]


© "Les sciences de l'information : bibliométrie, scientométrie, infométrie". In Solaris, nº 2, Presses Universitaires de Rennes, 1995.

Solaris Btnacc.gif Solaris Btncom.gif Solaris Btnsom.gif Solaris Btn.gif

Voir aussi

Notes
  1. Cet article a pu être réédité à partir du site de Gabriel Gallezot : http://gabriel.gallezot.free.fr/Solaris/d02/2polanco1.html
Dans le réseau Wicri :

Ceci est la page de référence de « Solaris (1995) Polanco 0 »

Cet article est repris sur Wicri/Histoire de l'IST