Wicri France:Démonstration ISTEX/Wicri sur la visibilité internationale d'Aussois
Cette page introduit une visite commentée d'un Serveur d'exploration sur la visibilité internationale d'Aussois. Elle fait partie d'un ensemble d'initiatives pour sensibiliser les chercheurs à l'utilisation des ressources acquises dans le cadre du programme d'investissement d'avenir ISTEX (plusieurs dizaines de millions de documents en texte intégral). Le réseau Wicri y apporte une plateforme pour l'exploration de corpus et la diffusion des connaissances issues de ces explorations.
Sommaire
Le contexte
Aussois, village bien connu des vacanciers en Maurienne, héberge le Centre Paul Langevin, bien connu des chercheurs du CNRS. En effet cette institution est à la fois un « vaste chalet de vacances » et un lieu d'accueil pour les colloques. En vacances à Ausssois, à l'occasion de discussions amicales en randonnées, j'ai été amené à proposer à quelques collègues une expérimentation, à partir d'ISTEX, sur la visibilité d'Aussois dans la littérature internationale.
Création d'un serveur d'exploration
Sur un plan technique, rappelons que le réseau Wicri s'appuie pour construire des connaissances sur un réseau de Wikis sémantiques qui utilise la solution bien stabilisée Semantic MediaWiki. Pour l'exploration de corpus dans leur diversité, nous avons repris le développement d'une bibliothèque d'outils logiciels, Dilib.
Extraction d'un corpus dans ISTEX
Dans un premier temps, nous avons pu extraire un corpus de 1500 documents contenant au moins une apparition du terme « Aussois ». Ce corpus a ensuite été traité, en mode semi-automatique, par les modules de génération de serveurs d'exploration. Cette opération demande quelques minutes de traitement informatique, mais le paramétrage qui demande la création de 4 pages wikis demande quelques dizaines de minutes pour un premier essai.
La plateforme et les serveurs
Un serveur d'exploration est l'étape finale d'une suite de bases bibliographiques intermédiaires.
|
Premières observations
Une navigation dans ce corpus et quelques manipulations informatiques simples ont montré que très peu de documents concernaient directement Aussois. Par exemple 3 documents seulement contiennent la mention Aussois dans le titre, et tous les 3 sont des références d'actes de colloques.
En fait 90% des documents contiennent, en bibliographie ou en note, une référence à un colloque ayant eu lieu à Aussois.
- Le corpus sélectionné ne permet pas de repérer de façon significative les travaux ayant été présentés à Aussois.
- En revanche son volume déjà conséquent (1500 documents) permet de faire une première caractérisation des communautés présentes à Aussois.
Influence géographique
Toutes les observations de ce paragraphe sont faite à partir du serveur standard, sans manipulation particulière.
La liste inverse des noms de pays d'affiliation des auteurs montre une représentation forte de la France. Plus précisément : les Français sont ceux qui font le plus souvent référence à un colloque ayant eu lieu à Aussois.
Ceci se retrouve dans la projection sur l'Europe :
Ventilation thématique à partir des revues
Cette partie demande des petites manipulations informatiques dans les métadonnées des documents ISTEX. Il faut notamment utiliser les correspondances entre ISSN et les titres de revues.
Cette manipulation informatique avec une finalisation « à la main » a permis d'enrichir la page Aussois avec une liste dont le début est constitué ainsi :
- Physique :
Cette liste est composée à partir d'un script en shell (langage de commande Unix)[2]). La ventilation par domaine a été faite « à la main »[3].
Recherche des plus anciennes références de colloques
Cette partie demande des petites manipulations informatiques (filtrage) dans le texte intégral des documents ISTEX
On cherche à alimenter un tableau à trois colonnes : référence du colloque, liens vers les articles qui citent ce colloque, et des commentaires.
Date / colloque | Article(s) citant(s) | Commentaire |
---|---|---|
1969 (février) European Association for Experimental Social Psychology Colloquium | Some models of balance applied to children's perceptions of international relations, (Nicholas B. Johnson European Journal of Social Psychology ; 1972-01.) | En fait, il s'agit d'une auto-citation qui fait allusion à un colloque de 1969
|
Pour retrouver les documents les plus anciens, la technique utilisée consiste à rechercher dans les 1500 documents en texte intégral les passages contenant « Aussois ». Dans l'exemple ci-dessus, l'extrait pertinent est « in Aussois, France, in February 1969 ». Il y a plusieurs milliers de passages contenant Aussois. Pour trouver les références les plus anciennes (avant 1970), il suffit de filtrer les extraits contenant « 196 ” pour limiter la sélection à une dizaine de passages. On peut ensuite continuer ce type de manipulation avec 1970, 1971 etc.
Pour réaliser l'affichage (avec les liens du wiki vers le serveur), l'affichage d'un document donne un appel de modèle MediaWiki qu'il suffit d'insérer dans la page wiki. Par exemple, pour le tableau précédent, la page du document « Some models ... relations » contient, en fin de page :
{{Explor lien
|wiki= Wicri/France
|area= AussoisV1
|flux= Main
|étape= Exploration
|type= RBID
|clé= ISTEX:0EBAB876D72E9EB8DAD6000816A768456FA50ED9
}}
- Remarque
Un problème tel que :
- trouver le colloque le plus cité
est nettement plus complexe à traiter dans l'état actuel des outils (et de la normalisation des références bibliographiques).
Valorisation des informations obtenues par sérendipité
Springer et les Lecture Notes in Computer Science
Les Lecture Notes in Computer Science figurent en première position de la liste des ISSN par fréquence décroissante. A partir de l'ISSN 0302-9743, on peut accéder à l'ensemble des articles de cette collection dans le serveur.
La première place de cette collection montre sa capacité à fédérer une communauté de chercheurs. Elle joue donc un rôle stratégique qui mérite un signalement dans le réseau de wikis.
On trouvera donc :
- sur Wicri/France (ce wiki)
- Une page relative à la collection Lecture Notes in Computer Science. Elle contient :
- une infobox qui crée des attributs sémantiques visibles en bas de page ;
- un lien vers le serveur d'exploration sur Aussois ;
- un lien vers la page de référence de cette revue (sur Wicri/Informatique).
- Une page sur l'éditeur Springer Science+Business Media (en abrégé Springer). Elle contient notamment :
- Une liste des revues de cet éditeur signalées sur Wicri/France. Cette liste est crée automatiquement par requête sémantique. On y trouve également la revue Lecture Notes in Physics
- Une page relative à la collection Lecture Notes in Computer Science. Elle contient :
- Sur le wiki Wicri/Informatique :
- La page de référence de la revue Lecture Notes in Computer Science pour l'ensemble du réseau Wicri. Elle contient notamment :
- la liste des wikis sur lesquels cette revue est citée. On trouve notamment un lien vers le wiki H2PTM.
- La page de référence de la revue Lecture Notes in Computer Science pour l'ensemble du réseau Wicri. Elle contient notamment :
- Sur le wiki Wicri/Ticri/H2PTM (wiki des conférences H2PTM) on trouve donc :
- Une page relative à la collection Lecture Notes in Computer Science. Elle contient :
- Un lien vers un article du wiki dont une citation fait référence à cette collection : Annotation multi-documents de points de vue exprimés.
- Un lien vers le serveur d'exploration sur l'hypertexte où Cette revue est également la plus citée avec plus de 500 articles.
- Une page relative à la collection Lecture Notes in Computer Science. Elle contient :
Les conférences Sagamore
Dans les conférences repérées, quelques-unes des plus anciennes citations concerne les conférences Sagamore.
Date colloque | Article citant | Commentaire |
---|---|---|
1970 (9-12 September 1970), Density of Electron Charge and Spin | Ce colloque est annoncé dans 2 articles de la revue Physik in unserer Zeit Tagungskalender et Das Experiment
Il est cité dans Ninth General Assembly and International Congress of Crystallography de 1973 Enfin il est également évoqué dans l'oraison funèbre de Richard J. Weiss (1923–2008) en 2009 dans la revue Journal of Applied Crystallography. |
Il s'agit en fait de la troisième édition d'une série de conférences internationales surnommées Sagamore. |
Une fois le nom « Sagamore » repéré, une recherche sur Internet permet de localiser facilement :
- La conférence Sagamore 2015 à Pula en Italie ;
- et à partir de ce site, l'histoire de ces conférences : http://alpha.uwb.edu.pl/sagamore/history1.html
La valorisation de ces informations donne lieu à de multiples créations de pages dans le réseau Wicri :
- sur ce wiki :
- Une page d'accueil pour les conférences Sagamore ;
- Une page par conférences ayant eu lieu en France : Aussois et Brest.
- Noter les relations sémantiques qui permettent de construire les listes, par exemple :
Erwin Félix Lewy-Bertaut
Erwin Félix Lewy-Bertaut est un cristallographe français qui a été ici identifié comme étant une personnalité ayant une forte influence internationale. En effet, il est à l'origine de la tenue à Aussois en 1970 de la première conférence Sagamore.
Une recherche sur Internet a mis en évidence une biographie particulièrement riche qui peut naturellement être déployée sur le réseau Wicri.
Exemples complémentaires de fouille de données
Les documents ISTEX ont été analysés avec des extractions basées sur une liste de termes relatifs à un domaine donné.
Identifications de documents relatifs à des travaux sur la Maurienne
Comment, parmi les 1500 documents contenant le terme « Aussois », identifier avec précision ceux qui portent sur des travaux liés à la région d'Aussois, et donc en Maurienne.
Dans cette perspective, une technique de filtrage par liste de termes a été utilisée.
Une page, Wicri:Maurienne a été créée pour contenir une table de termes liés à la Maurienne.
Elle a permis de repérer les documents qui figurent dans le paragraphe Quelques éléments bibliographiques sur les travaux concernant Aussois en Maurienne.
On remarquera notamment :
- Etude de l'accumulation du fluor dans les lichens d'une vallee alpine polluee par Juliette Asta, laboratoire de biologie alpine, Université de Grenoble I, et Jean-Pierre Garrec, in Environmental Pollution.
- Résumé : L'accumulation du fluor est étudiée chez diverses espèces lichéniques corticoles, terricoles et saxicoles durant trois années successives dans une vallée alpine polluée dont on présente les caractéristiques. La teneur en fluor des thalles diffère selon les espèces et reflète aussi les variations du niveau de pollution fluorée de l'air dans l'espace et dans le temps, comme celle de la végétation phanérogamique. La concentration en fluor des lichens corticoles présente des variations saisonnières en relation avec les précipitations et montre un parallélisme avec la teneur en fluor des phanérogames, alors que celle des lichens terricoles ne subit pas de telles variations et semble sous l'influence d'autres facteurs. On constate l'existence d'une teneur naturelle en fluor de lichens témoins prélevés dans des régions non polluées.
En effet, aucune référence explicite à Aussois (ni à la Maurienne) ne figure explicitement dans le titre et le résumé. Seul le filtrage du texte intégral a permis de repérer ce document.
Voir aussi
- Notes
- ↑ L'adresse figurant dans un document est par exemple « Laboratoire de Microscopie Electronique Appliquée (ERA 545), Faculté des Sciences Saint‐Jérǒme, Marseille » sans mention de pays
- ↑ Pour les lecteurs avertis, ce script est visible sur la page Discussion:Aussois
- ↑ Ceci est automatisable par l'utilisation de catégories au niveau des revues