Curation de données géographiques sur des corpus ISTEX/Springer
De Wicri Manuel
Révision datée du 18 janvier 2014 à 14:33 par imported>Jacques Ducloy (→Les adresses comme source d'information)
Un des objectifs de l'analyse exploratoires de corpus ISTEX est le repérage des acteurs d'un domaine donné. Pour cela, il est souvent indispensable de clarifier les notions géographiques telles que pays, région ou villes, relatives aux affiliations.
Les plateformes de curation et d'exploration, associées au réseau de wikis communs, permettent d'y apporter des éléments de réponse.
Élaboration des éléments géographiques
Les données géographiques sur les flux ISTEX/Springer
Le cartouche ci-dessous pointe vers le serveur d'exploration sur le frêne du wiki Wicri/Bois. Les 3 icônes de droite pointent vers 3 étapes :
- Corpus : simple transcodage en TEI,
- Curation : où est effectuée une normalisation des noms de pays,
- Exploration : où est effectuées une normalisation des noms de villes ou de région.
L'étape d'exploration donne accès à tous les index géographiques actuellement traités :
- Pays d'affiliation : index pays reconnus. Cet index est généralement bien reconnu.
- Région d'affiliation : index des régions reconnues. Sur les fonds Springer, cet index commence à être significatif pour les régions françaises avec des premiers éléments pour l'Allemagne.
- Villes : index des villes reconnues. En dehors de la France, cet index n'est pas significatif sur ISTEX/Springer.
Les adresses comme source d'information
L'élaboration des éléments géographiques est réalisé à partir des adresses. Voici quelques exemples caractéristiques :
- notice ISTEX:468_1986_Article_BF0019702 (1986) :
<affiliation>Institut für Forstbotanik der Universität, Büsgenweg 2, D-3400, Göttingen, Germany</affiliation>
- Le pays est repéré par Germany et la ville et la région sont identifiable par un code postal à 4 chiffres (avant 1993 en Allemagne).