Serveur d'exploration sur l'OCR : Différence entre versions
De CIDE
imported>Jacques Ducloy (→Listes de résultats bruts) |
imported>Jacques Ducloy (→Listes de résultats bruts) |
||
Ligne 148 : | Ligne 148 : | ||
{{Wicri tp|titre=Règles de curation spécifiques | {{Wicri tp|titre=Règles de curation spécifiques | ||
|texte=Une amélioration de la pertinence des listes a été obtenues par deux mécanismes différents. | |texte=Une amélioration de la pertinence des listes a été obtenues par deux mécanismes différents. | ||
− | * élimination de revues, avec notamment le « ''Journal of Geophysical Research: Oceans'' (ISSN 0148-0227) » où il est question de l' « ''Oregon Coast Range'' « (Chaîne côtière de l'Oregon), (voir sur par exemple {{Explor lien | + | * '''élimination de revues''', avec notamment le « ''Journal of Geophysical Research: Oceans'' (ISSN 0148-0227) » où il est question de l' « ''Oregon Coast Range'' « (Chaîne côtière de l'Oregon), (voir sur par exemple {{Explor lien |
|wiki= Ticri/CIDE | |wiki= Ticri/CIDE | ||
|area= OcrV1 | |area= OcrV1 | ||
Ligne 157 : | Ligne 157 : | ||
|texte= Vegetation‐modulated landscape evolution: Effects of vegetation on landscape processes, drainage density, and topography | |texte= Vegetation‐modulated landscape evolution: Effects of vegetation on landscape processes, drainage density, and topography | ||
}}). | }}). | ||
+ | * '''normalisation des noms d'auteurs''' avec ajout d'une affiliation implicite. | ||
}} | }} | ||
{{Début 2 colonnes}} | {{Début 2 colonnes}} |
Version du 2 septembre 2016 à 08:43
Cette page introduit le « Serveur d'exploration sur l'OCR ». Il contient 8131 documents.
Sommaire
Ce flux donne accès à 6406 documents ISTEX (et 6070 après curation). | |||
Ce flux traite 1227 références, dont 32 venant de Francis, et 1195 venant de Pascal.
Après curation le volume est réduit à 1200. | |||
Ce flux traite 170 références téléchargées de HAL. Après curation le volume est réduit à 170. | |||
Ce flux traite 15 références, Après curation le volume est réduit à 15. | |||
Ce flux traite 215 références ou documents en provenance de l'archive PubMed (MEDLINE). Après curation le volume est réduit à 98. | |||
Ce flux traite 215 références ou documents en provenance de l'archive PubMed Central. Après curation le volume est réduit à 215. | |||
Ce flux traite 313 références, Après curation le volume est réduit à 294. | |||
Flux principal | Ce flux fusionne 7 749 références issues des étapes précédentes.
Ce volume est ramené à 7 736 après dédoublonnage par DOI. Enfin, il est réduit à 7 533 par clé de dédoublonnage IDAT. | ||
Zoom | France | Ce flux donne accès à une bibliographie contenant 435 références ayant au moins un auteur avec une affiliation française. | |
Zoom | UK | Ce flux donne accès à une bibliographie contenant 503 références ayant au moins un auteur avec une affiliation du Royaume-Uni. | |
Zoom | USA | Ce flux donne accès à une bibliographie contenant 1844 références ayant au moins un auteur avec une affiliation des Etats-Unis d'Amérique. | |
Zoom | Allemagne | Ce flux donne accès à une bibliographie contenant 420 références ayant au moins un auteur avec une affiliation allemande. |
Projections géographiques
|
|
production mondiale (détail Europe)
Aspects techniques
Paramétrage
- Wicri:OcrV1 - introduction
- Wicri:OcrV1/Paramètres, data - génération des données
- Wicri:OcrV1/Paramètres, fr - génération de l'interface
- Wicri:OcrV1/Paramètres, génération des cartes - génération de cartes géographiques
- Wicri:OcrV1/Paramètres, templates size - paramétrage des modèles liés aux valeurs numériques
- Wicri:OcrV1/Paramètres, template include
Curation
- revues portant sur des homonymies de OCR : The Laryngoscope (ISSN : 0023-852X)
- dans les articles de la revue Lecture Notes in Physics, par exemple : (Fundamentals of gas-dynamical simulations), une action d'OCR sur « α r » génère « ocr».
Résultats et investigations
Listes de résultats bruts
|
|
|
- Sur le Zoom France
Liste de résultats bruts
Ces résultats ont été obtenus sur un corpus où l'on a appliqué des règles de curation préalablement élaborées sur d'autres corpus.
|
|
|
|
|
|
A faire : test indexation
Construction d'une table d'indexation
Requêtes d'approfondissement
- Evaluation de la qualité d’un document,
- Tokenisation,
- Méthode par dictionnaire pour mesurer la qualité d’un document
Voir aussi
- Dans le réseau Wicri :
La page de référence « Serveur d'exploration sur l'OCR » est sur le wiki Wicri/Ticri. Ce serveur est également visible sur Wicri/Informatique.
… davantage au sujet de « Serveur d'exploration sur l'OCR »