CIDE (2014) Tutorial, Curation

De CIDE
Révision datée du 3 décembre 2014 à 14:10 par imported>Jacques Ducloy (Curation des noms de région)
Cide 2014 Tutorial 6 Diapositive01.jpg

Cette page introduit la dernière partie du tutoriel de la conférence CIDE 17 qui a eu lieu à Fès en 2014.

Le tutorial proprement dit est organisé sur les pages :

Cide 2014 Tutorial 6 Diapositive02.jpg
Cide 2014 Tutorial 6 Diapositive03.jpg

Introduction à la curation

Le réseau Wicri joue 2 rôles par rapport aux serveurs d'exploration :

  • On a vu le rôle explicatif (avec par exemple les projections d'indicateurs d'actitivité scientifique sur des cartes).
  • il joue également un rôle de réservoir de règles de curation.
Les réactions pendant le tutoriel ont permis d'élaborer un schéma plus explicite
Cide 2014 Tutorial 6 Diapositive04.jpg
Cide 2014 Tutorial 6 Diapositive05.jpg

La curation des noms de pays est notamment utilisée pour donner des éléments de comparaison sur les productions scientifiques au niveau international.

Pour cela des modèles dérivés de ceux de Wikipédia permettent de projeter des disques sur des cartes.

Les point de projection sont définis dans les wikis relatifs aux régions et aux pays, voir par exemple :

On notera que les noms de pays sont alignés sur les entrées de Wikipédia (et donc du Web sémantique).

Curation des noms de pays

Cide 2014 Tutorial 6 Diapositive06.jpg

Sur le wiki Wicri/Métadonnées, on trouve une page extraite de Wikipédia qui donne la liste des codes ISO. Voir :

Cide 2014 Tutorial 6 Diapositive07.jpg

Dans les cas où les noms de pays sont identifiés par des adresses, une table spécifique est utilisée, voir :

Cide 2014 Tutorial 6 Diapositive08.jpg

Curation des noms de région

La mise en évidence des régions pose d'autres types de problèmes. En effet les régions ne sont pas explicitement citées dans les affiliations. Elles doivent donc être déduites.

Pour la France, la composition des codes postaux est souvent très efficace dans ce sens. Là encore, on utilise une page extraite de Wikipédia pour une normalisation des toponymes. Voir :

Cide 2014 Tutorial 6 Diapositive09.jpg

Pour l'Allemagne, les déductions sont plus complexes car les codes postaux ne permettent pas de déterminer facilement une zone géographique.

On utilise alors des tables d'associations entre des intervalles de codes et des agglomérations.

Cide 2014 Tutorial 6 Diapositive10.jpg
Cide 2014 Tutorial 6 Diapositive11.jpg
Cide 2014 Tutorial 6 Diapositive12.jpg

Conclusion