WicriExplore (2020) Ducloy/WicriExplore : Différence entre versions

De Wicri Wicri Fr
(Introduction au serveur d'exploration)
(Introduction au serveur d'exploration)
Ligne 34 : Ligne 34 :
 
D'autres dispositifs sont également disponible. La carte de droite est une projection des publications dans lesquelles un des auteurs est affilié à une unité de recherche implantée sans une région française donnée.
 
D'autres dispositifs sont également disponible. La carte de droite est une projection des publications dans lesquelles un des auteurs est affilié à une unité de recherche implantée sans une région française donnée.
  
:Dans le [[serveur sur le Covid et les espaces publics]], la France est peu représentée.
+
:Dans le [[serveur sur la Covid et les espaces publics]], la France est peu représentée.
 
{{Clr}}
 
{{Clr}}
  

Version du 17 décembre 2020 à 00:37

Une bibliothèque numérique encyclopédique, un atelier flexible d’analyse de corpus

Gérer la volumétrie avec l’ingénierie XML


 
 

Cette page présente les outils d'analyse de corpus du projet WicriExplore.

Illustration évoquant le prodesseur Nimbus Visite guidée
Cette page est la dernière étape d'une visite du réseau Wicri (pour aller au point de départ)
SemCogni05xml.pdf

Avant propos : Istex, PubMed

Le projet WicriExplore utilise principalement 2 sources d'information ISTEX et PubMed.

  • ISTEX offre une très bonne volumétrie de documents en texte intégral (20.000.000) dans tous les domaines scientifiques ; mais avec quelques années d'ancienneté).
  • PubMed est une base de citations (références bibliographiques) indexées avec précision, mais sans texte intégral direct. PubMed traite de la santé et des scieences de la vie.

Pour un contexte pédagogique, PubMed permet d'obtenir très rapidement des résultats structurés grâce à son indexation.

Introduction au serveur d'exploration

SemCogni05xml.pdf

Un exemple est en cours de préparation sur la Covid et les espaces publics (250 références). Il a été créé avec le critère suivant :

covid and (music or choir or restaurant or cinema or church)

Dans les différents wikis, les pages Serveur d'exploration donnent la volumétrie des corpus traités à partir de chaque serveur.

Par exemple :

Le résultat est un ensemble informatique permettant de naviguer en utilisant des index.

Le spécialiste peut explorer différents stades de traitement du corpus à partir d'un cartouche d'exploration :

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur le flux PubMed/Medline

Pour aller sur l'étape de reformatage du corpus

Pour aller sur l'étape de curation

Pour aller sur l'étape d'exploration globale

Chaque icône pointe vers un moteur de recherche intermédiaire (le livre représente le stade final)

D'autres dispositifs sont également disponible. La carte de droite est une projection des publications dans lesquelles un des auteurs est affilié à une unité de recherche implantée sans une région française donnée.

Dans le serveur sur la Covid et les espaces publics, la France est peu représentée.

Génération

SemCogni05xml.pdf

Les machines

Génération multisource

SemCogni05xml.pdf

Navigation

SemCogni05xml.pdf
Un exemple sur les coopérations scientifiques d'une métropole 
Sur les épidémies grippales
SemCogni05xml.pdf

Associations et classifications

SemCogni05xml.pdf

Exemple : sur la grippe au Canada (grippe et antiviraux)

SemCogni05xml.pdf
SemCogni05xml.pdf

Déboublonnage

SemCogni05xml.pdf
SemCogni05xml.pdf
SemCogni05xml.pdf

Analyse lexicale

SemCogni05xml.pdf

Dilib

SemCogni05xml.pdf
SemCogni05xml.pdf
SemCogni05xml.pdf

Curation de données

SemCogni05xml.pdf
SemCogni05xml.pdf

La santé

SemCogni05xml.pdf
SemCogni05xml.pdf