Wicri Terre:Actualités
Cette page est simplement alimentée par des messages sur les listes de diffusion Wicri traitant de sujets propres au wiki Wicri/Terre.
Europium / Génération de tableaux de classification périodique / ingénierie et pratiques
publié sur Wicri-gt le 2 septembre 2014
Bonjour,
Dans un message précédent, votre attention a été attirée sur la perte de la présence française dans le monde de la connaissance numérique, et ses effets négatifs par rapport à une « sortie de crise ». La maîtrise de l'ingénierie de cette connaissance nous parait être une condition indispensable à une inversion de cette tendance. Dans son rôle de démonstrateur le projet Wicri, dopé par LorExplor, veut mettre l'accent sur l'intérêt de l'appropriation de cette ingénierie par les laboratoires de recherche.
Voici aujourd'hui une visite de chantier autour des métaux stratégiques et plus précisément sur l'Europium. Ce métal a été choisi en raison de sa présence modeste dans les corpus (la génération ex nihilo d'un serveur d'exploration prend moins de 30 secondes, ce qui nous facilite la mise au point des outils). Nous avions déjà présenté, sur l'Indium, des exemples de projection d'indicateurs d'activité scientifiques sur cartes géographiques.
Voici maintenant un premier exemple intermédiaire sur la génération de tableaux de classification périodique à partir d'analyses de la littérature scientifique. L'idée est simple : un résumé ou un mot-clé comportant une formule telle de EuCl3 fait progresser l'indicateur d'influence du chlore dans le corpus (ici extrait d'ISTEX). A partir d'un ensemble de fréquences d'apparition on génère une table périodique. D'un point de vue technique nous avons repris et modifié des modèles initialement mis au point dans Wikipédia. Pour accéder à cette démonstration :
Cette approche demande deux types d'action :
- l'écriture (ici par Ali Tebbakh) d'un ensemble de programmes pour extraire les formules chimiques et générer la table (et l'adaptation des modèles de Wikipédia).
- la consolidation des outils de la plateforme DILIB en relation avec le réseau de wikis.
La visualisation d'une notice bibliographique montre une difficulté : la codification des formules par l'éditeur Springer.
Vous aurez noté des caractères bizarroïdes. Pour de meilleurs résultats il faudra améliorer l'analyse des formules. Elle est réalisée par les modules présents sur cette page.
A noter : le wiki devient ci un mécanisme de gestion mutualisée de codes informatiques.
A travers cet exemple, nous voulons montrer que produire de la connaissance numérique demande une coopération étroite entre deux types de compétences avancées : en ingénierie proprement dite et dans le secteur d'application.
Bonne visite...