Nuvola apps important.png Attention, suite à une faille de sécurité, quelques liens vers les serveurs d'exploration sont désactivés.

-

Wicri France:Démonstration ISTEX/Wicri sur la visibilité internationale d'Aussois

De Wicri France

Cette page introduit une visite commentée d'un Serveur d'exploration sur la visibilité internationale d'Aussois. Elle fait partie d'un ensemble d'initiatives pour sensibiliser les chercheurs à l'utilisation des ressources acquises dans le cadre du programme d'investissement d'avenir ISTEX (plusieurs dizaines de millions de documents en texte intégral). Le réseau Wicri y apporte une plateforme pour l'exploration de corpus et la diffusion des connaissances issues de ces explorations.

Le contexte

Aussois, village bien connu des vacanciers en Maurienne, héberge le Centre Paul Langevin, bien connu des chercheurs du CNRS. En effet cette institution est à la fois un « vaste chalet de vacances » et un lieu d'accueil pour les colloques. En vacances à Ausssois, à l'occasion de discussions amicales en randonnées, j'ai été amené à proposer à quelques collègues une expérimentation, à partir d'ISTEX, sur la visibilité d'Aussois dans la littérature internationale.

Création d'un serveur d'exploration

Sur un plan technique, rappelons que le réseau Wicri s'appuie pour construire des connaissances sur un réseau de Wikis sémantiques qui utilise la solution bien stabilisée Semantic MediaWiki. Pour l'exploration de corpus dans leur diversité, nous avons repris le développement d'une bibliothèque d'outils logiciels, Dilib.

Extraction d'un corpus dans ISTEX

Dans un premier temps, nous avons pu extraire un corpus de 1500 documents contenant au moins une apparition du terme « Aussois ». Ce corpus a ensuite été traité, en mode semi-automatique, par les modules de génération de serveurs d'exploration. Cette opération demande quelques minutes de traitement informatique, mais le paramétrage qui demande la création de 4 pages wikis demande quelques dizaines de minutes pour un premier essai.

La plateforme et les serveurs

Un serveur d'exploration est l'étape finale d'une suite de bases bibliographiques intermédiaires.

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur le flux ISTEX

Pour aller sur l'étape de reformatage du corpus

Pour aller sur l'étape de curation

Pour aller sur l'étape d'exploration globale

Pour aller directement sur le site d'exploration du serveur de la plateforme AussoisV1 Cette icône permet d’accéder directement à la page principale du serveur d'exploration. Les documents sont visibles dans la phase finale (avec des données homogénéisées par des processus de curation).
Pour aller directement sur la phase Corpus du serveur de la plateforme AussoisV1 Cette icône ouvre la navigation vers la première étape de reformatage du corpus. Elle contient des documents xml dans lesquels les parties plein texte ont été retirées pour répondre aux conditions négociées avec les éditeurs. Sur une configuration interne cette base est alignée avec une base non visible sur Internet mais qui contient les textes en version intégrale.
Pour aller directement sur la phase Curation du serveur de la plateforme AussoisV1 Cette icône donne accès à une phase intermédiaire de curation des données. Par exemple, les données sur les pays d'affiliation des auteurs sont homogénéisées. Cette étape donne notamment accès à un index des « pays non reconnus ». Cet index permet aux contributeurs de mettre à jour des tables qui contiennent des règles de curation. Par exemple, dans une ancienne version l'index des pays non reconnus contenait la ville de Marseille[1]. La ville de Marseille a été ajoutée dans une table du wiki Wicri/Europe. Tous les documents contenant une mention de pays limitée à « Marseille » sont maintenant normalisés avec France (et la région PACA).

Premières observations

Une navigation dans ce corpus et quelques manipulations informatiques simples ont montré que très peu de documents concernaient directement Aussois. Par exemple 3 documents seulement contiennent la mention Aussois dans le titre, et tous les 3 sont des références d'actes de colloques.

En fait 90% des documents contiennent, en bibliographie ou en note, une référence à un colloque ayant eu lieu à Aussois.

Le corpus sélectionné ne permet pas de repérer de façon significative les travaux ayant été présentés à Aussois.
En revanche son volume déjà conséquent (1500 documents) permet de faire une première caractérisation des communautés présentes à Aussois.

Influence géographique

Toutes les observations de ce paragraphe sont faite à partir du serveur standard, sans manipulation particulière.

La liste inverse des noms de pays d'affiliation des auteurs montre une représentation forte de la France. Plus précisément : les Français sont ceux qui font le plus souvent référence à un colloque ayant eu lieu à Aussois.

Ceci se retrouve dans la projection sur l'Europe :

Ventilation thématique à partir des revues

Cette partie demande des petites manipulations informatiques dans les métadonnées des documents ISTEX. Il faut notamment utiliser les correspondances entre ISSN et les titres de revues.

Cette manipulation informatique avec une finalisation « à la main » a permis d'enrichir la page Aussois avec une liste dont le début est constitué ainsi :

  • Physique :
    • Nuclear Physics, Section A (0375-9474 - 51 références) ;
    • Nuclear Inst. and Methods in Physics Research, A (0168-9002 - 35 références)

Cette liste est composée à partir d'un script en shell (langage de commande Unix)[2]). La ventilation par domaine a été faite « à la main »[3].

Recherche des plus anciennes références de colloques

Cette partie demande des petites manipulations informatiques (filtrage) dans le texte intégral des documents ISTEX

On cherche à alimenter un tableau à trois colonnes : référence du colloque, liens vers les articles qui citent ce colloque, et des commentaires.

Date / colloque Article(s) citant(s) Commentaire
1969 (février) European Association for Experimental Social Psychology Colloquium Some models of balance applied to children's perceptions of international relations, (Nicholas B. Johnson European Journal of Social Psychology ; 1972-01.) En fait, il s'agit d'une auto-citation qui fait allusion à un colloque de 1969
A version of this paper was presented to the European Association for Experimental Social Psychology Colloquium, held in Aussois, France, in February 1969.

Pour retrouver les documents les plus anciens, la technique utilisée consiste à rechercher dans les 1500 documents en texte intégral les passages contenant « Aussois ». Dans l'exemple ci-dessus, l'extrait pertinent est « in Aussois, France, in February 1969 ». Il y a plusieurs milliers de passages contenant Aussois. Pour trouver les références les plus anciennes (avant 1970), il suffit de filtrer les extraits contenant « 196 ” pour limiter la sélection à une dizaine de passages. On peut ensuite continuer ce type de manipulation avec 1970, 1971 etc.

Pour réaliser l'affichage (avec les liens du wiki vers le serveur), l'affichage d'un document donne un appel de modèle MediaWiki qu'il suffit d'insérer dans la page wiki. Par exemple, pour le tableau précédent, la page du document « Some models ... relations » contient, en fin de page :

{{Explor lien
   |wiki=    Wicri/France
   |area=    AussoisV1
   |flux=    Main
   |étape=   Exploration
   |type=    RBID
   |clé=     ISTEX:0EBAB876D72E9EB8DAD6000816A768456FA50ED9
}}
Remarque

Un problème tel que :

  • trouver le colloque le plus cité

est nettement plus complexe à traiter dans l'état actuel des outils (et de la normalisation des références bibliographiques).

Valorisation des informations obtenues par sérendipité

Springer et les Lecture Notes in Computer Science

Les Lecture Notes in Computer Science figurent en première position de la liste des ISSN par fréquence décroissante. A partir de l'ISSN 0302-9743, on peut accéder à l'ensemble des articles de cette collection dans le serveur.

La première place de cette collection montre sa capacité à fédérer une communauté de chercheurs. Elle joue donc un rôle stratégique qui mérite un signalement dans le réseau de wikis.

On trouvera donc :

Les conférences Sagamore

Dans les conférences repérées, quelques-unes des plus anciennes citations concerne les conférences Sagamore.

Date colloque Article citant Commentaire
1970 (9-12 September 1970), Density of Electron Charge and Spin Ce colloque est annoncé dans 2 articles de la revue Physik in unserer Zeit Tagungskalender et Das Experiment

Il est cité dans Ninth General Assembly and International Congress of Crystallography de 1973

Enfin il est également évoqué dans l'oraison funèbre de Richard J. Weiss (1923–2008) en 2009 dans la revue Journal of Applied Crystallography.

Il s'agit en fait de la troisième édition d'une série de conférences internationales surnommées Sagamore.

Une fois le nom « Sagamore » repéré, une recherche sur Internet permet de localiser facilement :

La valorisation de ces informations donne lieu à de multiples créations de pages dans le réseau Wicri :

  • sur ce wiki :
    • Une page d'accueil pour les conférences Sagamore ;
    • Une page par conférences ayant eu lieu en France : Aussois et Brest.
    • Noter les relations sémantiques qui permettent de construire les listes, par exemple :

Erwin Félix Lewy-Bertaut

Erwin Félix Lewy-Bertaut est un cristallographe français qui a été ici identifié comme étant une personnalité ayant une forte influence internationale. En effet, il est à l'origine de la tenue à Aussois en 1970 de la première conférence Sagamore.

Une recherche sur Internet a mis en évidence une biographie particulièrement riche qui peut naturellement être déployée sur le réseau Wicri.

Exemples complémentaires de fouille de données

Les documents ISTEX ont été analysés avec des extractions basées sur une liste de termes relatifs à un domaine donné.

Identifications de documents relatifs à des travaux sur la Maurienne

Comment, parmi les 1500 documents contenant le terme « Aussois », identifier avec précision ceux qui portent sur des travaux liés à la région d'Aussois, et donc en Maurienne.

Dans cette perspective, une technique de filtrage par liste de termes a été utilisée.

Une page, Wicri:Maurienne a été créée pour contenir une table de termes liés à la Maurienne.

Elle a permis de repérer les documents qui figurent dans le paragraphe Quelques éléments bibliographiques sur les travaux concernant Aussois en Maurienne.

On remarquera notamment :

  • Etude de l'accumulation du fluor dans les lichens d'une vallee alpine polluee par Juliette Asta, laboratoire de biologie alpine, Université de Grenoble I, et Jean-Pierre Garrec, in Environmental Pollution.
    • Résumé : L'accumulation du fluor est étudiée chez diverses espèces lichéniques corticoles, terricoles et saxicoles durant trois années successives dans une vallée alpine polluée dont on présente les caractéristiques. La teneur en fluor des thalles diffère selon les espèces et reflète aussi les variations du niveau de pollution fluorée de l'air dans l'espace et dans le temps, comme celle de la végétation phanérogamique. La concentration en fluor des lichens corticoles présente des variations saisonnières en relation avec les précipitations et montre un parallélisme avec la teneur en fluor des phanérogames, alors que celle des lichens terricoles ne subit pas de telles variations et semble sous l'influence d'autres facteurs. On constate l'existence d'une teneur naturelle en fluor de lichens témoins prélevés dans des régions non polluées.

En effet, aucune référence explicite à Aussois (ni à la Maurienne) ne figure explicitement dans le titre et le résumé. Seul le filtrage du texte intégral a permis de repérer ce document.

Voir aussi

Notes
  1. L'adresse figurant dans un document est par exemple « Laboratoire de Microscopie Electronique Appliquée (ERA 545), Faculté des Sciences Saint‐Jérǒme, Marseille » sans mention de pays
  2. Pour les lecteurs avertis, ce script est visible sur la page Discussion:Aussois
  3. Ceci est automatisable par l'utilisation de catégories au niveau des revues