Serveur d'exploration sur l'OCR : Différence entre versions
De CIDE
imported>Jacques Ducloy (→Listes de résultats bruts) |
imported>Jacques Ducloy (→Listes de résultats bruts) |
||
Ligne 157 : | Ligne 157 : | ||
|texte= Vegetation‐modulated landscape evolution: Effects of vegetation on landscape processes, drainage density, and topography | |texte= Vegetation‐modulated landscape evolution: Effects of vegetation on landscape processes, drainage density, and topography | ||
}}). | }}). | ||
− | * '''normalisation des noms d'auteurs''', avec ajout d'une affiliation implicite. Le wiki contient notamment une « [[Wicri:Liste de personnalités du document numérique|liste de spécialistes du document numérique]] ». | + | * '''normalisation des noms d'auteurs''', avec ajout d'une affiliation implicite. Le wiki contient notamment une « [[Wicri:Liste de personnalités du document numérique|liste de spécialistes du document numérique]] ». On notera une modification de l'ordre des auteurs et l'émergence de nouvelles affiliations dans le « top 15 » comme l'[[Université de Kyūshū]]. |
}} | }} | ||
{{Début 2 colonnes}} | {{Début 2 colonnes}} |
Version du 2 septembre 2016 à 08:48
Cette page introduit le « Serveur d'exploration sur l'OCR ». Il contient 8131 documents.
Sommaire
Ce flux donne accès à 6406 documents ISTEX (et 6070 après curation). | |||
Ce flux traite 1227 références, dont 32 venant de Francis, et 1195 venant de Pascal.
Après curation le volume est réduit à 1200. | |||
Ce flux traite 170 références téléchargées de HAL. Après curation le volume est réduit à 170. | |||
Ce flux traite 15 références, Après curation le volume est réduit à 15. | |||
Ce flux traite 215 références ou documents en provenance de l'archive PubMed (MEDLINE). Après curation le volume est réduit à 98. | |||
Ce flux traite 215 références ou documents en provenance de l'archive PubMed Central. Après curation le volume est réduit à 215. | |||
Ce flux traite 313 références, Après curation le volume est réduit à 294. | |||
Flux principal | Ce flux fusionne 7 749 références issues des étapes précédentes.
Ce volume est ramené à 7 736 après dédoublonnage par DOI. Enfin, il est réduit à 7 533 par clé de dédoublonnage IDAT. | ||
Zoom | France | Ce flux donne accès à une bibliographie contenant 435 références ayant au moins un auteur avec une affiliation française. | |
Zoom | UK | Ce flux donne accès à une bibliographie contenant 503 références ayant au moins un auteur avec une affiliation du Royaume-Uni. | |
Zoom | USA | Ce flux donne accès à une bibliographie contenant 1844 références ayant au moins un auteur avec une affiliation des Etats-Unis d'Amérique. | |
Zoom | Allemagne | Ce flux donne accès à une bibliographie contenant 420 références ayant au moins un auteur avec une affiliation allemande. |
Projections géographiques
|
|
production mondiale (détail Europe)
Aspects techniques
Paramétrage
- Wicri:OcrV1 - introduction
- Wicri:OcrV1/Paramètres, data - génération des données
- Wicri:OcrV1/Paramètres, fr - génération de l'interface
- Wicri:OcrV1/Paramètres, génération des cartes - génération de cartes géographiques
- Wicri:OcrV1/Paramètres, templates size - paramétrage des modèles liés aux valeurs numériques
- Wicri:OcrV1/Paramètres, template include
Curation
- revues portant sur des homonymies de OCR : The Laryngoscope (ISSN : 0023-852X)
- dans les articles de la revue Lecture Notes in Physics, par exemple : (Fundamentals of gas-dynamical simulations), une action d'OCR sur « α r » génère « ocr».
Résultats et investigations
Listes de résultats bruts
|
|
|
- Sur le Zoom France
Liste de résultats bruts
Ces résultats ont été obtenus sur un corpus où l'on a appliqué des règles de curation préalablement élaborées sur d'autres corpus.
|
|
|
|
|
|
A faire : test indexation
Construction d'une table d'indexation
Requêtes d'approfondissement
- Evaluation de la qualité d’un document,
- Tokenisation,
- Méthode par dictionnaire pour mesurer la qualité d’un document
Voir aussi
- Dans le réseau Wicri :
La page de référence « Serveur d'exploration sur l'OCR » est sur le wiki Wicri/Ticri. Ce serveur est également visible sur Wicri/Informatique.
… davantage au sujet de « Serveur d'exploration sur l'OCR »