WicriExplore (2020) Ducloy/WicriExplore

De Wicri Wicri Fr

Une bibliothèque numérique encyclopédique, un atelier flexible d’analyse de corpus

Gérer la volumétrie avec l’ingénierie XML


 
 

Cette page présente les outils d'analyse de corpus du projet WicriExplore.

Illustration évoquant le prodesseur Nimbus Visite guidée
Cette page est la dernière étape d'une visite du réseau Wicri (pour aller au point de départ)
SemCogni05xml.pdf
logo travaux Chapitre en cours de rédaction

Avant propos : Istex, PubMed

Le projet WicriExplore utilise principalement 2 sources d'information ISTEX et PubMed.

  • ISTEX offre une très bonne volumétrie de documents en texte intégral (20.000.000) dans tous les domaines scientifiques ; mais avec quelques années d'ancienneté).
  • PubMed est une base de citations (références bibliographiques) indexées avec précision, mais sans texte intégral direct. PubMed traite de la santé et des scieences de la vie.

Pour un contexte pédagogique, PubMed permet d'obtenir très rapidement des résultats structurés grâce à son indexation.

Introduction au serveur d'exploration

SemCogni05xml.pdf

Un serveur d'exploration est un ensemble informatique généré par un atelier logiciel à partir d'un ou de plusieurs corpus. Le résultat permet de naviguer dans ces corpus en utilisant notamment des index.

Dans les différents wikis, les pages Serveur d'exploration donnent la volumétrie des corpus traités à partir de chaque serveur. Par exemple :

Un exemple avec la Covid et les espaces publics

Pour cette visite nous prendrons un exemple avec PubMed sur la Covid et les espaces publics (250 références). Il a été créé avec le critère suivant :

covid and (music or choir or restaurant or cinema or church)

Le résultat est donc un ensemble informatique permettant de naviguer dans ce corpus de 250 documents.

Le spécialiste peut explorer différents stades de traitement du corpus à partir d'un cartouche d'exploration. Chaque icône renvoie sur une page qui propose une liste d'index :

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur le flux PubMed/Medline

Pour aller sur l'étape de reformatage du corpus

Pour aller sur l'étape de curation

Pour aller sur l'étape d'exploration globale

Chaque icône pointe en fait vers un moteur de recherche intermédiaire (le livre représente le stade final)

D'autres dispositifs sont également disponible. La carte de droite est une projection des publications dans lesquelles un des auteurs est affilié à une unité de recherche implantée sans une région française donnée.

Dans le Serveur d'exploration sur la Covid et les espaces publics‎‎ , la France est peu représentée. En cliquant sur le cercle associé à la région Auvergne-Rhône-Alpes, on repère cependant un praticien chercheur Jean Louis Pépin.

Génération

SemCogni05xml.pdf

Les machines

Génération multisource

SemCogni05xml.pdf

Navigation

SemCogni05xml.pdf

Le réseau Wicri offre de nombreux exemples de serveurs dans lesquels l'internaute peut explorer un corpus en utilisant des projections géographiques, ou des listes d'index.

Un exemple sur les coopérations scientifiques d'une métropole 
Sur les épidémies grippales

Explorer les index

Exemples de pistes d'exploration, les listes auteurs et affiliations
Auteurs

Lien vers l'index complet (avec classification)

  1. Robin N. Thompson (6)
  2. Jonathan Dort (3)
  3. George M. Church (3)
  4. Zhicong Yang (2)
  5. Yuval Palgi (2)
  6. Yuguo Li (2)
  7. Vineetha Rijju (2)
  8. Vernon J M. Lee (2)
  9. Valerie T J. Koh (2)
  10. Uri Obolski (2)
  11. Uma Parameswaran (2)
  12. Trevor Van Schooneveld (2)
  13. Sushma Bhatnagar (2)
  14. Sunitha Daniel (2)
  15. Shoba Nair (2)
 
Affiliations

Lien vers l'index complet

  1. Université d'Oxford (11)
  2. Université de Cambridge (5)
  3. University College de Londres (5)
  4. Université de Washington (4)
  5. Université d'Édimbourg (4)
  6. Université nationale de Singapour (3)
  7. Université de Manchester (3)
  8. Université de Glasgow (3)
  9. Université chinoise de Hong Kong (3)
  10. Université du Sussex (2)
  11. Université du Maryland (2)
  12. Université de la Colombie-Britannique (2)
  13. Université de Toronto (2)
  14. Université de Pékin (2)
  15. Université de Nottingham (2)
SemCogni05xml.pdf

Associations et classifications

SemCogni05xml.pdf

Exemple : sur la grippe au Canada (grippe et antiviraux)

SemCogni05xml.pdf
SemCogni05xml.pdf

Déboublonnage

SemCogni05xml.pdf
SemCogni05xml.pdf
SemCogni05xml.pdf

Analyse lexicale

SemCogni05xml.pdf

Dilib

SemCogni05xml.pdf
SemCogni05xml.pdf
SemCogni05xml.pdf

Curation de données

SemCogni05xml.pdf
SemCogni05xml.pdf

La santé

SemCogni05xml.pdf
SemCogni05xml.pdf