Serveur d'exploration sur l'OCR : Différence entre versions
De CIDE
imported>Jacques Ducloy |
imported>Jacques Ducloy |
||
Ligne 7 : | Ligne 7 : | ||
Au départ, il s'agit de répondre à des besoins d'information dans deux contextes complémentaires d'utilisation de cette technologie : | Au départ, il s'agit de répondre à des besoins d'information dans deux contextes complémentaires d'utilisation de cette technologie : | ||
* En amont, à l'INIST, le département dirigé par [[Laurent Schmitt]] conçoit et exploite la plateforme de services ISTEX appelée à rendre disponibles des dizaines de millions de documents traités en OCR. Dans ce contexte [[Valérie Mahut]] et son équipe doivent mettre en place des procédures pour améliorer la qualité de ces données. | * En amont, à l'INIST, le département dirigé par [[Laurent Schmitt]] conçoit et exploite la plateforme de services ISTEX appelée à rendre disponibles des dizaines de millions de documents traités en OCR. Dans ce contexte [[Valérie Mahut]] et son équipe doivent mettre en place des procédures pour améliorer la qualité de ces données. | ||
− | * En aval, le projet LorExplor [[Jacques Ducloy]] est confronté à l'analyse de corpus pour lesquels l'OCR amène parfois de très sérieuses contraintes de curation de données. | + | * En aval, le projet LorExplor ([[Jacques Ducloy]]) est confronté à l'analyse de corpus pour lesquels l'OCR amène parfois de très sérieuses contraintes de curation de données. |
Il permet également de valoriser les travaux des équipes françaises ou francophones dans un cadre de coopérations internationales. | Il permet également de valoriser les travaux des équipes françaises ou francophones dans un cadre de coopérations internationales. |
Version du 14 juin 2016 à 08:05
Cette page introduit le « Serveur d'exploration sur l'OCR ». Il contient 8131 documents.
Sommaire
Ce flux donne accès 6406 documents ISTEX (et 6070 après curation). | |||
Ce flux traite 1227 références, dont 32 venant de Francis, et 1195 venant de Pascal.
Après curation le volume est réduit à 1200. | |||
Ce flux traite 170 références téléchargées de HAL. Après curation le volume est réduit à 170. | |||
Ce flux traite 15 références, Après curation le volume est réduit à 15. | |||
Ce flux traite 215 références ou documents provenance de l'archive PubMed (MEDLINE). Après curation le volume est réduit à 98. | |||
Ce flux traite 215 références ou documents provenance de l'archive PubMed Central. Après curation le volume est réduit à 215. | |||
Ce flux traite 313 références, Après curation le volume est réduit à 294. | |||
Flux principal | Ce flux fusionne 7 749 références issues des étapes précédentes.
Ce volume est ramené à 7 736 après dédoublonnage par DOI. Enfin, il est réduit à 7 533 par clé de dédoublonnage IDAT. | ||
Zoom | France | Ce flux donne accès à une bibliographie contenant 435 références ayant au moins un auteur avec une affiliation française. | |
Zoom | UK | Ce flux donne accès à une bibliographie contenant 503 références ayant au moins un auteur avec une affiliation du Royaume-Uni. | |
Zoom | USA | Ce flux donne accès à une bibliographie contenant 1844 références ayant au moins un auteur avec une affiliation des Etats-Unis d'Amérique. | |
Zoom | Allemagne | Ce flux donne accès à une bibliographie contenant 420 références ayant au moins un auteur avec une affiliation allemande. |
Projections géographiques
|
|
production mondiale (détail Europe)
Aspects techniques
Paramétrage
- Wicri:OcrV1 - introduction
- Wicri:OcrV1/Paramètres, data - génération des données
- Wicri:OcrV1/Paramètres, fr - génération de l'interface
- Wicri:OcrV1/Paramètres, génération des cartes - génération de cartes géographiques
- Wicri:OcrV1/Paramètres, templates size - paramétrage des modèles liés aux valeurs numériques
Curation
- revues portant sur des homonymies de OCR : The Laryngoscope (ISSN : 0023-852X)
Voir aussi
- Dans le réseau Wicri :
La page de référence « Serveur d'exploration sur l'OCR » est sur le wiki Wicri/Ticri. Ce serveur est également visible sur Wicri/Informatique.
… davantage au sujet de « Serveur d'exploration sur l'OCR »