Serveur d'exploration sur la recherche au Kazakhstan : Différence entre versions

De Wicri Europe
imported>Jacques Ducloy
(Détails sur l'étape KazakhstanV25)
(Voir aussi)
 
(17 révisions intermédiaires par un autre utilisateur non affichées)
Ligne 9 : Ligne 9 :
 
* Une cinquième, codée KazakhstanV25, met en oeuvre 5 flux de données, à partir de 2 sources (Pascal et Medline) qui convergent dans un flux final. Ce flux sert alors à alimenter 2 zooms.
 
* Une cinquième, codée KazakhstanV25, met en oeuvre 5 flux de données, à partir de 2 sources (Pascal et Medline) qui convergent dans un flux final. Ce flux sert alors à alimenter 2 zooms.
 
* {{Explor lien|area=KazakhstanV2|texte=Pour accéder au chantier KazakhstanV2|url=Main/index.html}}.
 
* {{Explor lien|area=KazakhstanV2|texte=Pour accéder au chantier KazakhstanV2|url=Main/index.html}}.
==Détails sur la première étape KazakhstanV1==
+
==Première étape Kazakhstan V1==
 
La première application porte sur une structure simple avec une seule source d'entrée ([[A pour base utilisée::Pascal (base de données)|Pascal]]). La figure ci-dessous montre l'environnement du lecteur final, en partant de la droite, et la procédure de création, en partant de la gauche.
 
La première application porte sur une structure simple avec une seule source d'entrée ([[A pour base utilisée::Pascal (base de données)|Pascal]]). La figure ci-dessous montre l'environnement du lecteur final, en partant de la droite, et la procédure de création, en partant de la gauche.
 
<center>
 
<center>
 
<div style="position:relative;width:550px;">
 
<div style="position:relative;width:550px;">
[[File:DilibExplorGabarit1.png|550px|link=corpus:Kazakhstan/KazakhstanV1/Site/fr/index.html]]
+
[[File:DilibExplorGabarit1.png|550px|link=explor:KazakhstanV1/Site/fr/index.html]]
 
<div style="position: absolute;  top: 6%; left: 30%;">
 
<div style="position: absolute;  top: 6%; left: 30%;">
 
[[File:ExplorGabarit1Arrow.png|280px]]
 
[[File:ExplorGabarit1Arrow.png|280px]]
 
</div>
 
</div>
 
<div style="position: absolute;  top: 20%; left: 6%;">
 
<div style="position: absolute;  top: 20%; left: 6%;">
[[File:InistPascalFrancisPourExplor.png|80px|link=corpus:Kazakhstan/KazakhstanV1/Site/fr/Main/index.html|Pour aller sur la page d'accueil du flux Pascal.]]
+
[[File:InistPascalFrancisPourExplor.png|80px|link=explor:KazakhstanV1/Site/fr/Main/index.html|Pour aller sur la page d'accueil du flux Pascal.]]
 
</div>
 
</div>
 
<div style="position: absolute;  top: 22%; left: 25%;">
 
<div style="position: absolute;  top: 22%; left: 25%;">
[[File:CD-ROM Icon.png|60px|link=corpus:Kazakhstan/KazakhstanV1/Site/fr/Main/Corpus/index.html|Pour voir l'état initial des notices]]
+
[[File:CD-ROM Icon.png|60px|link=explor:KazakhstanV1/Site/fr/Main/Corpus/index.html|Pour voir l'état initial des notices]]
 
</div>
 
</div>
 
<div style="position: absolute;  top: 26%; left: 40%;">
 
<div style="position: absolute;  top: 26%; left: 40%;">
[[File:ExplorMergingIcon.png|60px|link=corpus:Kazakhstan/KazakhstanV1/Site/fr/Main/Merge/index.html|Pour aller sur l'étape de dédoublonnage]]
+
[[File:ExplorMergingIcon.png|60px|link=explor:KazakhstanV1/Site/fr/Main/Merge/index.html|Pour aller sur l'étape de dédoublonnage]]
 
</div>
 
</div>
 
<div style="position: absolute;  top: 25%; left: 55%;">
 
<div style="position: absolute;  top: 25%; left: 55%;">
[[File:Information road sign hospital.svg.png|40px|link=corpus:Kazakhstan/KazakhstanV1/Site/fr/Main/Curation/index.html|Pour aller sur la base de curation]]
+
[[File:Information road sign hospital.svg.png|40px|link=explor:KazakhstanV1/Site/fr/Main/Curation/index.html|Pour aller sur la base de curation]]
 
</div>
 
</div>
 
<div style="position: absolute;  top: 20%; left: 75%;">
 
<div style="position: absolute;  top: 20%; left: 75%;">
[[File:Question book magnify.svg|70px|link=corpus:Kazakhstan/KazakhstanV1/Site/frfr/Main/Exploration/index.html|Pour aller sur la base d'exploration]]
+
[[File:Question book magnify.svg|70px|link=explor:KazakhstanV1/Site/fr/Main/Exploration/index.html|Pour aller sur la base d'exploration]]
 
</div>
 
</div>
 
<div style="position: absolute;  top: 5%; left: 90%;">
 
<div style="position: absolute;  top: 5%; left: 90%;">
Ligne 40 : Ligne 40 :
 
</div>
 
</div>
 
</center>
 
</center>
L'utilisateur, « simple lecteur » navigue dans les wikis, et notamment Wicri/Europe ou Wicri/Asie, et accède par des liens vers des pages du serveur.
+
{{Article principal|Serveur d'exploration sur la recherche au Kazakhstan (maquette Pascal)}}
  
Le traitement se fait en 4 étapes.
+
==Kazakhstan V12==
# '''Corpus''' : conversion de notices en format Inist vers la TEI. Cette étape est matérialisée par une icône de CD-ROM sur le schéma ci-dessus et sur le site.
 
# '''Dédoublonnage''' réduction des notices Pascal et Francis
 
# '''Curation''' : interprétation des codes des pays d'affiliation. Cette étape est matérialisée par un panneau Hôpital sur le schéma ci-dessus et sur le site.
 
# '''Exploration''' ; La curation se termine par une identification des codes INSEE en vue de la création d'un index des régions.
 
 
 
===Exemple de navigation autour des noms de pays===
 
 
 
La page [[Kazakhstan]] donne accès à un tableau qui pointe vers les 10 premiers pays qui coopèrent avec le Kazakhstan (avec comme critère le nombre de publication ayant en commun une affiliation d'auteur).
 
 
 
Le site d'exploration est visible depuis l'ensemble de l'internet et donc de l'ensemble du réseau Wicri. Par exemple la [[wicri-france.fr:Kazakhstan|page Kazakhstan du wiki Wicri/France]] utilise ce site pour mettre en avant les régions françaises.
 
 
 
==KazakhstanV12==
 
 
{{Wicri travaux|taille=30|texte=En cours de mise en place. Première étape : correspondance entre l'iconographie et le site sont testés}}
 
{{Wicri travaux|taille=30|texte=En cours de mise en place. Première étape : correspondance entre l'iconographie et le site sont testés}}
 
* [[Wicri:KazakhstanV12]]
 
* [[Wicri:KazakhstanV12]]
Ligne 61 : Ligne 49 :
 
!Flux principal
 
!Flux principal
 
|colspan=2|
 
|colspan=2|
{{Explor bandeau flux|type=StanalystSolo|code=Main|path=Kazakhstan/KazakhstanV12}}
+
{{Explor bandeau flux|type=StanalystSolo|code=Main|path=KazakhstanV12}}
 
|Ce flux traite environ 1400 notices issues des bases Pascal et Francis
 
|Ce flux traite environ 1400 notices issues des bases Pascal et Francis
 
|-
 
|-
Ligne 78 : Ligne 66 :
 
|}
 
|}
  
==Détails sur KazakhstanV15==
+
==Détails sur Kazakhstan V15==
 
Cette plate forme est proche de la précédente. Le flux principal est remplacé par un flux de type référentiel, prévu pour des corpus de gros volumes.
 
Cette plate forme est proche de la précédente. Le flux principal est remplacé par un flux de type référentiel, prévu pour des corpus de gros volumes.
 
{{Wicri travaux|taille=30|texte=Ce site est en cours de mise au point. La phase actuelle porte sur la correspondance de l'accès iconographique vers les étapes. Les contenus atteints ne sont pas encore significatifs.}}
 
{{Wicri travaux|taille=30|texte=Ce site est en cours de mise au point. La phase actuelle porte sur la correspondance de l'accès iconographique vers les étapes. Les contenus atteints ne sont pas encore significatifs.}}
Ligne 105 : Ligne 93 :
 
;Aspects techniques: [[Wicri:KazakhstanV15]].
 
;Aspects techniques: [[Wicri:KazakhstanV15]].
  
==Détails sur l'étape KazakhstanV2==
+
==KazakhstanV 2==
 
La nouvelle version repose sur l'emploi de 2 corpus; l'un est extrait de Pascal (le même que pour la version précédente) et l'autre de Medline.
 
La nouvelle version repose sur l'emploi de 2 corpus; l'un est extrait de Pascal (le même que pour la version précédente) et l'autre de Medline.
  
Ligne 113 : Ligne 101 :
 
!{{Explor icon number|n=1}}Pascal<br/>Francis
 
!{{Explor icon number|n=1}}Pascal<br/>Francis
 
|colspan=2|
 
|colspan=2|
{{Explor bandeau flux|type=Stanalyst|code=PascalFrancis|path=Kazakhstan/KazakhstanV2}}
+
{{Explor bandeau flux|type=Stanalyst|code=PascalFrancis|path=KazakhstanV2}}
 
|Ce flux traite environ 1400 notices issues des bases Pascal et Francis
 
|Ce flux traite environ 1400 notices issues des bases Pascal et Francis
 
|-
 
|-
 
!{{Explor icon number|n=2}}Medline
 
!{{Explor icon number|n=2}}Medline
 
|colspan=2|
 
|colspan=2|
{{Explor bandeau flux|type=Medline|code=PubMed|path=Kazakhstan/KazakhstanV2}}
+
{{Explor bandeau flux|type=Medline|code=PubMed|path=KazakhstanV2}}
 
|
 
|
 
|-
 
|-
Ligne 124 : Ligne 112 :
 
!{{Explor icon number|n=1}}{{Explor icon number|n=2}}
 
!{{Explor icon number|n=1}}{{Explor icon number|n=2}}
 
|
 
|
{{Explor bandeau flux|type=MainMerge|code=Main|path=Kazakhstan/KazakhstanV2}}
+
{{Explor bandeau flux|type=MainMerge|code=Main|path=KazakhstanV2}}
 
|
 
|
 
|-
 
|-
Ligne 139 : Ligne 127 :
 
** '''Analyse'''.
 
** '''Analyse'''.
  
==Détails sur l'étape KazakhstanV25==
+
==Kazakhstan V25==
 
On distinguera 2 flux de curation, un flux de convergence et 2 zooms.
 
On distinguera 2 flux de curation, un flux de convergence et 2 zooms.
 
{| class="wikitable"
 
{| class="wikitable"
Ligne 145 : Ligne 133 :
 
!{{Explor icon number|n=1}}Pascal<br/>Francis
 
!{{Explor icon number|n=1}}Pascal<br/>Francis
 
|colspan=3|
 
|colspan=3|
{{Explor bandeau flux|type=Stanalyst|code=PascalFrancis|path=Kazakhstan/KazakhstanV25}}
+
{{Explor bandeau flux|type=Stanalyst|code=PascalFrancis|path=KazakhstanV25}}
 
|Ce flux traite environ 1400 notices issues des bases Pascal et Francis
 
|Ce flux traite environ 1400 notices issues des bases Pascal et Francis
 
|-
 
|-
Ligne 151 : Ligne 139 :
 
!{{Explor icon number|n=2}}Medline
 
!{{Explor icon number|n=2}}Medline
 
|colspan=3|
 
|colspan=3|
{{Explor bandeau flux|type=Medline|code=PubMed|path=Kazakhstan/KazakhstanV25}}
+
{{Explor bandeau flux|type=Medline|code=PubMed|path=KazakhstanV25}}
 
||Ce flux traite 2344 notices bibliographiques extraites de la bases [[A pour base utilisée::PubMed]] (MEDLINE) de la NIM.
 
||Ce flux traite 2344 notices bibliographiques extraites de la bases [[A pour base utilisée::PubMed]] (MEDLINE) de la NIM.
 
|-
 
|-
Ligne 157 : Ligne 145 :
 
!{{Explor icon number|n=1}}{{Explor icon number|n=2}}
 
!{{Explor icon number|n=1}}{{Explor icon number|n=2}}
 
|colspan=2|
 
|colspan=2|
{{Explor bandeau flux|type=MainMerge|code=Main|path=Kazakhstan/KazakhstanV25}}
+
{{Explor bandeau flux|type=MainMerge|code=Main|path=KazakhstanV25}}
 
|
 
|
 
|-
 
|-
Ligne 180 : Ligne 168 :
 
;Pour les aspects techniques, voir :  
 
;Pour les aspects techniques, voir :  
 
* [[Wicri:KazakhstanV1]] - ''version monobase''
 
* [[Wicri:KazakhstanV1]] - ''version monobase''
 +
* [[Wicri:KazakhstanV12]]
 
* [[Wicri:KazakhstanV15]] - ''maquette gros corpus''
 
* [[Wicri:KazakhstanV15]] - ''maquette gros corpus''
 
* [[Wicri:KazakhstanV2]] - ''version multibase''
 
* [[Wicri:KazakhstanV2]] - ''version multibase''
 
* [[Wicri:KazakhstanV25]] - ''version multibase avec zooms''
 
* [[Wicri:KazakhstanV25]] - ''version multibase avec zooms''
 +
{{Wicri voir|dec=serveur d'exploration}}
 +
 +
Ce serveur est visible sur {{Wicri lien|wiki=Asie}}
 
[[Catégorie:Kazakhstan]]
 
[[Catégorie:Kazakhstan]]
 
[[Catégorie:Serveur d'exploration]]
 
[[Catégorie:Serveur d'exploration]]

Version actuelle datée du 5 mars 2024 à 15:44

Cette page introduit une expérimentation[1] portant sur l'exploration de corpus sur la recherche au Kazakhstan.

Pour permettre la mise au point du processus de génération, trois variantes sont ou vont être mises en œuvre à partir de ce corpus :

  • Une première, codée KazakhstanV1, nom de code propose simplement une navigation sur un ensemble d'environ 1400 références extraites de la base Pascal.
  • Une deuxième, codée KazakhstanV12, sert de base d'entrainement pour la mise au point d'un flux simple avec Zoom.
  • Une troisième, codée KazakhstanV15, sert de base d'entrainement pour la mise au point du flux Inist:StanalystBig.
  • Une quatrième, codée KazakhstanV2, met en oeuvre 3 flux de données, à partir de 2 sources (Pascal et Medline) qui convergent dans un flux final.
  • Une cinquième, codée KazakhstanV25, met en oeuvre 5 flux de données, à partir de 2 sources (Pascal et Medline) qui convergent dans un flux final. Ce flux sert alors à alimenter 2 zooms.
  • Pour accéder au chantier KazakhstanV2.

Première étape Kazakhstan V1

La première application porte sur une structure simple avec une seule source d'entrée (Pascal). La figure ci-dessous montre l'environnement du lecteur final, en partant de la droite, et la procédure de création, en partant de la gauche.

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur la page d'accueil du flux Pascal.

Pour voir l'état initial des notices

Pour aller sur l'étape de dédoublonnage

Pour aller sur la base de curation

Pour aller sur la base d'exploration

Pour aller sur Wicri/Europe (fr)

Pour aller sur Wicri/Asie (fr)

Kazakhstan V12

logo travaux En cours de mise en place. Première étape : correspondance entre l'iconographie et le site sont testés
Flux principal

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur le flux Pascal / Francis

Pour aller sur l'étape de reformatage du corpus

Pour aller sur l'étape de confluence / dédoublonnage

Pour aller sur l'étape de curation

Pour aller sur l'étape d'exploration globale

Ce flux traite environ 1400 notices issues des bases Pascal et Francis
Zoom Échantillon

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur la page d'accueil du Zoom

Pour aller sur la page d'accueil du Zoom

Pour aller sur l'étape de curation

Pour aller sur l'étape d'exploration globale

Ce flux affine un échantillon d'environ 700 notices (50% du corpus)
Zoom Russie

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur la page d'accueil du Zoom

Pour aller sur la page d'accueil du Zoom

Pour aller sur l'étape de curation

Pour aller sur l'étape d'exploration globale

Ce flux affine un échantillon de 180 notices ayant la Russie en affiliation

Détails sur Kazakhstan V15

Cette plate forme est proche de la précédente. Le flux principal est remplacé par un flux de type référentiel, prévu pour des corpus de gros volumes.

logo travaux Ce site est en cours de mise au point. La phase actuelle porte sur la correspondance de l'accès iconographique vers les étapes. Les contenus atteints ne sont pas encore significatifs.
Référentiel

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur le flux Pascal / Francis

Pour aller sur l'étape de reformatage du corpus

Pour aller sur l'étape d'exploration globale

La taille du corpus a été volontairement réduite à 1500 notices (au lieu de 3000 dans les exemples précédents et suivants) pour faciliter une génération ex nihilo et complète très rapide.

Les possibilités d'exploration du Référentiel sont limités à des index.

Zoom Échantillon

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur la page d'accueil du Zoom

Pour aller sur la page d'accueil du Zoom

Pour aller sur l'étape de curation

Pour aller sur l'étape d'exploration globale

Ce flux affine un échantillon d'environ 700 notices (50% du corpus)
Zoom Russie

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur la page d'accueil du Zoom

Pour aller sur la page d'accueil du Zoom

Pour aller sur l'étape de curation

Pour aller sur l'étape d'exploration globale

Ce flux affine un échantillon de 180 notices ayant la Russie en affiliation
Aspects techniques
Wicri:KazakhstanV15.

KazakhstanV 2

La nouvelle version repose sur l'emploi de 2 corpus; l'un est extrait de Pascal (le même que pour la version précédente) et l'autre de Medline.

On distinguera 3 flux de curation (et d'analyse ou d'exploration).

Logo Paris tram ligne1.svg
Pascal
Francis

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur le flux Pascal / Francis

Pour aller sur l'étape de reformatage du corpus

Pour aller sur l'étape de confluence / dédoublonnage

Pour aller sur l'étape de curation

Pour aller sur l'étape de contrôle

Ce flux traite environ 1400 notices issues des bases Pascal et Francis
Logo Paris tram ligne2.svg
Medline

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur le flux PubMed/Medline

Pour aller sur l'étape de reformatage du corpus

Pour aller sur l'étape de curation

Pour aller sur l'étape de contrôle

Flux principal
Logo Paris tram ligne1.svg
Logo Paris tram ligne2.svg

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur le flux de convergence qui donne accès au serveur

Pour aller sur l'étape de confluence / dédoublonnage

Pour aller sur l'étape de curation

Pour aller sur l'étape d'exploration globale


L'utilisateur utilise principalement le site final d'exploration. Il peut également avoir intérêt à approfondir un sujet par des comparaisons sur les sites d'analyse des flux Pascal et Medline qui donnent des points de vue complémentaires.

Concernant le traitement des données,

  • Le flux Pascal Francis comporte ici 4 étapes :
    • Corpus.
    • Fusion. Cette étape assure un dédoublonnage des notices Pascal et Francis qui sont quasiment identiques.
    • Curation.
    • Analyse.

Kazakhstan V25

On distinguera 2 flux de curation, un flux de convergence et 2 zooms.

Logo Paris tram ligne1.svg
Pascal
Francis

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur le flux Pascal / Francis

Pour aller sur l'étape de reformatage du corpus

Pour aller sur l'étape de confluence / dédoublonnage

Pour aller sur l'étape de curation

Pour aller sur l'étape de contrôle

Ce flux traite environ 1400 notices issues des bases Pascal et Francis
Logo Paris tram ligne2.svg
Medline

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur le flux PubMed/Medline

Pour aller sur l'étape de reformatage du corpus

Pour aller sur l'étape de curation

Pour aller sur l'étape de contrôle

Ce flux traite 2344 notices bibliographiques extraites de la bases PubMed (MEDLINE) de la NIM.
Flux principal
Logo Paris tram ligne1.svg
Logo Paris tram ligne2.svg

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur le flux de convergence qui donne accès au serveur

Pour aller sur l'étape de confluence / dédoublonnage

Pour aller sur l'étape de curation

Pour aller sur l'étape d'exploration globale

Zoom Échantillon

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur la page d'accueil du Zoom

Pour aller sur la page d'accueil du Zoom

Pour aller sur l'étape de curation

Pour aller sur l'étape d'exploration globale

Ce flux affine un échantillon d'environ 700 notices (50% du corpus)
Zoom Russie

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur la page d'accueil du Zoom

Pour aller sur la page d'accueil du Zoom

Pour aller sur l'étape de curation

Pour aller sur l'étape d'exploration globale

Ce flux affine un échantillon de 180 notices ayant la Russie en affiliation

Voir aussi

Notes
  1. Plus précisément dans les travaux préparatoires au projet LorExplor décrit sur le wiki Artist
Pour les aspects techniques, voir 
Dans le réseau Wicri :

Ceci est la page de référence de « Serveur d'exploration sur la recherche au Kazakhstan »

Ce serveur est visible sur Wicri/Asie