Serveur d'exploration sur la recherche au Kazakhstan
Cette page introduit une expérimentation[1] portant sur l'exploration de corpus sur la recherche au Kazakhstan.
Pour permettre la mise au point du processus de génération, trois variantes sont ou vont être mises en œuvre à partir de ce corpus :
- Une première, codée KazakhstanV1, nom de code propose simplement une navigation sur un ensemble d'environ 1400 références extraites de la base Pascal.
- Une deuxième, codée KazakhstanV12, sert de base d'entrainement pour la mise au point d'un flux simple avec Zoom.
- Une troisième, codée KazakhstanV15, sert de base d'entrainement pour la mise au point du flux Inist:StanalystBig.
- Une quatrième, codée KazakhstanV2, met en oeuvre 3 flux de données, à partir de 2 sources (Pascal et Medline) qui convergent dans un flux final.
- Une cinquième, codée KazakhstanV25, met en oeuvre 5 flux de données, à partir de 2 sources (Pascal et Medline) qui convergent dans un flux final. Ce flux sert alors à alimenter 2 zooms.
- Pour accéder au chantier KazakhstanV2.
Sommaire
Première étape Kazakhstan V1
La première application porte sur une structure simple avec une seule source d'entrée (Pascal). La figure ci-dessous montre l'environnement du lecteur final, en partant de la droite, et la procédure de création, en partant de la gauche.
Kazakhstan V12
| Flux principal | Ce flux traite environ 1400 notices issues des bases Pascal et Francis | ||
|---|---|---|---|
| Zoom | Échantillon | Ce flux affine un échantillon d'environ 700 notices (50% du corpus) | |
| Zoom | Russie | Ce flux affine un échantillon de 180 notices ayant la Russie en affiliation | |
Détails sur Kazakhstan V15
Cette plate forme est proche de la précédente. Le flux principal est remplacé par un flux de type référentiel, prévu pour des corpus de gros volumes.
| Référentiel | La taille du corpus a été volontairement réduite à 1500 notices (au lieu de 3000 dans les exemples précédents et suivants) pour faciliter une génération ex nihilo et complète très rapide.
Les possibilités d'exploration du Référentiel sont limités à des index. | ||
|---|---|---|---|
| Zoom | Échantillon | Ce flux affine un échantillon d'environ 700 notices (50% du corpus) | |
| Zoom | Russie | Ce flux affine un échantillon de 180 notices ayant la Russie en affiliation | |
- Aspects techniques
- Wicri:KazakhstanV15.
KazakhstanV 2
La nouvelle version repose sur l'emploi de 2 corpus; l'un est extrait de Pascal (le même que pour la version précédente) et l'autre de Medline.
On distinguera 3 flux de curation (et d'analyse ou d'exploration).
| Pascal Francis |
Ce flux traite environ 1400 notices issues des bases Pascal et Francis | ||
|---|---|---|---|
| Medline | |||
| Flux principal | |||
L'utilisateur utilise principalement le site final d'exploration. Il peut également avoir intérêt à approfondir un sujet par des comparaisons sur les sites d'analyse des flux Pascal et Medline qui donnent des points de vue complémentaires.
Concernant le traitement des données,
- Le flux Pascal Francis comporte ici 4 étapes :
- Corpus.
- Fusion. Cette étape assure un dédoublonnage des notices Pascal et Francis qui sont quasiment identiques.
- Curation.
- Analyse.
Kazakhstan V25
On distinguera 2 flux de curation, un flux de convergence et 2 zooms.
| Pascal Francis |
Ce flux traite environ 1400 notices issues des bases Pascal et Francis | |||
|---|---|---|---|---|
| Medline | Ce flux traite 2344 notices bibliographiques extraites de la bases PubMed (MEDLINE) de la NIM. | |||
| Flux principal | ||||
| Zoom | Échantillon | Ce flux affine un échantillon d'environ 700 notices (50% du corpus) | ||
| Zoom | Russie | Ce flux affine un échantillon de 180 notices ayant la Russie en affiliation | ||
Voir aussi
- Notes
- ↑ Plus précisément dans les travaux préparatoires au projet LorExplor décrit sur le wiki Artist
- Pour les aspects techniques, voir
- Wicri:KazakhstanV1 - version monobase
- Wicri:KazakhstanV12
- Wicri:KazakhstanV15 - maquette gros corpus
- Wicri:KazakhstanV2 - version multibase
- Wicri:KazakhstanV25 - version multibase avec zooms
- Dans le réseau Wicri :
Ceci est la page de référence de « Serveur d'exploration sur la recherche au Kazakhstan »
Ce serveur est visible sur Wicri/Asie