Serveur d'exploration sur la recherche au Kazakhstan
Cette page introduit une expérimentation[1] portant sur l'exploration de corpus sur la recherche au Kazakhstan.
Pour permettre la mise au point du processus de génération, trois variantes sont ou vont être mises en œuvre à partir de ce corpus :
- Une première, codée KazakhstanV1, nom de code propose simplement une navigation sur un ensemble d'environ 1400 références extraites de la base Pascal.
- Une deuxième, codée KazakhstanV12, sert de base d'entrainement pour la mise au point d'un flux simple avec Zoom.
- Une troisième, codée KazakhstanV15, sert de base d'entrainement pour la mise au point du flux Inist:StanalystBig.
- Une quatrième, codée KazakhstanV2, met en oeuvre 3 flux de données, à partir de 2 sources (Pascal et Medline) qui convergent dans un flux final.
- Une cinquième, codée KazakhstanV25, met en oeuvre 5 flux de données, à partir de 2 sources (Pascal et Medline) qui convergent dans un flux final. Ce flux sert alors à alimenter 2 zooms.
- Pour accéder au chantier KazakhstanV2.
Sommaire
Première étape Kazakhstan V1
La première application porte sur une structure simple avec une seule source d'entrée (Pascal). La figure ci-dessous montre l'environnement du lecteur final, en partant de la droite, et la procédure de création, en partant de la gauche.
Kazakhstan V12
Flux principal | Ce flux traite environ 1400 notices issues des bases Pascal et Francis | ||
---|---|---|---|
Zoom | Échantillon | Ce flux affine un échantillon d'environ 700 notices (50% du corpus) | |
Zoom | Russie | Ce flux affine un échantillon de 180 notices ayant la Russie en affiliation |
Détails sur Kazakhstan V15
Cette plate forme est proche de la précédente. Le flux principal est remplacé par un flux de type référentiel, prévu pour des corpus de gros volumes.
Référentiel | La taille du corpus a été volontairement réduite à 1500 notices (au lieu de 3000 dans les exemples précédents et suivants) pour faciliter une génération ex nihilo et complète très rapide.
Les possibilités d'exploration du Référentiel sont limités à des index. | ||
---|---|---|---|
Zoom | Échantillon | Ce flux affine un échantillon d'environ 700 notices (50% du corpus) | |
Zoom | Russie | Ce flux affine un échantillon de 180 notices ayant la Russie en affiliation |
- Aspects techniques
- Wicri:KazakhstanV15.
KazakhstanV 2
La nouvelle version repose sur l'emploi de 2 corpus; l'un est extrait de Pascal (le même que pour la version précédente) et l'autre de Medline.
On distinguera 3 flux de curation (et d'analyse ou d'exploration).
Pascal Francis |
Ce flux traite environ 1400 notices issues des bases Pascal et Francis | ||
---|---|---|---|
Medline | |||
Flux principal |
L'utilisateur utilise principalement le site final d'exploration. Il peut également avoir intérêt à approfondir un sujet par des comparaisons sur les sites d'analyse des flux Pascal et Medline qui donnent des points de vue complémentaires.
Concernant le traitement des données,
- Le flux Pascal Francis comporte ici 4 étapes :
- Corpus.
- Fusion. Cette étape assure un dédoublonnage des notices Pascal et Francis qui sont quasiment identiques.
- Curation.
- Analyse.
Kazakhstan V25
On distinguera 2 flux de curation, un flux de convergence et 2 zooms.
Pascal Francis |
Ce flux traite environ 1400 notices issues des bases Pascal et Francis | |||
---|---|---|---|---|
Medline | Ce flux traite 2344 notices bibliographiques extraites de la bases PubMed (MEDLINE) de la NIM. | |||
Flux principal | ||||
Zoom | Échantillon | Ce flux affine un échantillon d'environ 700 notices (50% du corpus) | ||
Zoom | Russie | Ce flux affine un échantillon de 180 notices ayant la Russie en affiliation |
Voir aussi
- Notes
- ↑ Plus précisément dans les travaux préparatoires au projet LorExplor décrit sur le wiki Artist
- Pour les aspects techniques, voir
- Wicri:KazakhstanV1 - version monobase
- Wicri:KazakhstanV12
- Wicri:KazakhstanV15 - maquette gros corpus
- Wicri:KazakhstanV2 - version multibase
- Wicri:KazakhstanV25 - version multibase avec zooms
- Dans le réseau Wicri :
Ceci est la page de référence de « Serveur d'exploration sur la recherche au Kazakhstan »
Ce serveur est visible sur Wicri/Asie