Aide:Navigation dans un serveur d'exploration
De CIDE
Révision datée du 16 novembre 2017 à 22:34 par imported>Jacques Ducloy (→Navigation)
Cette page présente sur un exemple, la Reconnaissance optique de caractères (OCR) la significations des différentes composantes d'une plateforme de curation et d'exploration.
icône | signification |
---|---|
Cette icône identifie le serveur qui permet de naviguer dans l'ensemble final des 7 533 notices bibliographiques issues des différents corpus. | |
Cette icône identifie le flux principal (Main) d'un serveur d'exploration. Ce flux se compose d'une étape de fusion, suivie d'une de curation pour produire le site d'exploration. | |
Cette icône identifie la première étape d'un flux. Cette étape se limite généralement à un reformatage en TEI. Pour le flux PascalFrancis, cette action est bien visible. Par exemple, l'article « Constraint propagation vs syntactical analysis for the logical structure recognition of Library references « est visible sous 4 formes :
| |
Cette icône indique une étape de confluence. Dans le cas du flux Pascal/Francis, il s'agit surtout de dédoublonner les notices Pascal et Francis. On peut comparer le nombre de documents dans l'étape Corpus, puis dans l'étape Merge de ce flux. | |
Cette icône indique une phase de curation. En fait, les actions de curation démarrent sur cette étape pointée par cette icône et se poursuivent sur la suivante. Par exemple, pour le flux ISTEX, comparer par exemple le nombre de villes repérées dans l'étape Curation et dans Checkpoint. | |
Cette icône indique une étape de vérification en fin de traitement d'un flux primaire. En fait, elle permet également une analyse partielle d'une thématique à partir du point de vue privilégié par la source. | |
Cette icône introduit un flux de type Zoom. Ici, France, Allemagne, Royaume-Uni et États-Unis. | |
Cette icône permet d'atteindre l'étape d'extraction d'un flus Zoom. Sur la page de paramétrage du serveur (Wicri:OcrV1/Paramètres, data), un paragraphe contient des exemples de critères (encore élémentaires) de sélection. | |
Cette icône permet d'atteindre l'étape finale d'analyse d'un flux de type Zoom, et donc de permettre une analyse plus fine et comparative. |
Exemple sur le Serveur d'exploration sur l'OCR
Ce flux donne accès à 6406 documents ISTEX (et 6070 après curation). | |||
Ce flux traite 1227 références, dont 32 venant de Francis, et 1195 venant de Pascal.
Après curation le volume est réduit à 1200. | |||
Ce flux traite 170 références téléchargées de HAL. Après curation le volume est réduit à 170. | |||
Ce flux traite 15 références, Après curation le volume est réduit à 15. | |||
Ce flux traite 215 références ou documents en provenance de l'archive PubMed (MEDLINE). Après curation le volume est réduit à 98. | |||
Ce flux traite 215 références ou documents en provenance de l'archive PubMed Central. Après curation le volume est réduit à 215. | |||
Ce flux traite 313 références, Après curation le volume est réduit à 294. | |||
Flux principal | Ce flux fusionne 7 749 références issues des étapes précédentes.
Ce volume est ramené à 7 736 après dédoublonnage par DOI. Enfin, il est réduit à 7 533 par clé de dédoublonnage IDAT. | ||
Zoom | France | Ce flux donne accès à une bibliographie contenant 435 références ayant au moins un auteur avec une affiliation française. | |
Zoom | UK | Ce flux donne accès à une bibliographie contenant 503 références ayant au moins un auteur avec une affiliation du Royaume-Uni. | |
Zoom | USA | Ce flux donne accès à une bibliographie contenant 1844 références ayant au moins un auteur avec une affiliation des Etats-Unis d'Amérique. | |
Zoom | Allemagne | Ce flux donne accès à une bibliographie contenant 420 références ayant au moins un auteur avec une affiliation allemande. |