Dilib, module Tei, commande TeiTableCityFromWiki

De Wicri Outils
Révision datée du 24 octobre 2014 à 22:33 par imported>Jacques Ducloy (Particularités liées aux données)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
LogoDilib.gif
Panneau travaux.png
Bibliothèque Dilib (ressources numériques)
Module Tei

Cette commande accepte un flux de pages wiki préalablement traitées par MediaWikiTableTransformCol pour générer une table de type StrDict.

 

Synopsis

TeiTableCityFromWiki [-k baliseClés]] [-e baliseElément]]
< tableWikiEnSxml
> tableGraphieDeVilleVersElémentTei

Utilisation sans paramètres

Sans paramètre elle utilise des tables wiki de 3 colonnes préalablement traitée par la commande MediaWikiTableTransformCol :

  • La première contient un lien wiki avec la graphie de référence d'une ville.
  • La deuxième contient une liste de graphies rencontrées dans les textes (principalement les adresses). Ces graphies servent de clé dans la table cible.
  • La troisième contient des éléments relatifs au pays et aux régions dans lesquelles cette ville est insérée.

Elle produit une table :

  • dont la clé est une graphie de ville
  • et le contenu un élément Tei de type place.

Exemple

La table :

Gif-sur-Yvette Gif-sur-Yvette country : France ;
region @type=région @nuts=2 : Île-de-France

produira : une indentation a été ajoutée à des fins de lisibilité

Gif-sur-Yvette	
    <place>
       <placeName>
             <settlement type="city">Gif-sur-Yvette</settlement>
             <region type="région" nuts="2">Île-de-France</region>
       </placeName>
       <country>France</country>
    </place>

Utilisation avec paramètres

Exemple introductif

Des paramètres ont été introduits pour traiter des tables plus complexes, comme sur Wicri/Allemagne, la page Liste de codes postaux.

ville code 4 chiffres code 5 chiffres formes courantes district/land
Göttingen 3400 37001–37099 Göttingen region @type=land @nuts=2 : Basse-Saxe

La fabrication de la table $DILIB/data/Wicri/Allemagne/codePostal5.fr.tab utilise la séquence de filtres suivants :

cat $DILIB_IMPORT/Wicri/Data/Allemagne/codePostal.fr.wiki
      ...
  |  MediaWikiCleanTable                                        \
  |  MediaWikiTable2SxmlRowCol                                  \
  |  MediaWikiTableTransformCol -l1 -T4 -E5                     \
  |  TeiTableCityFromWiki -e c5 -k c3                           \
  |  sort

Paramètres

-k baliseClés
Cette option introduit la balise correspondant à la colonne contenant les graphies servant de clé dans la table cible.
-e baliseElément
Cette option introduit la balise correspondant à la colonne contenant l'élément Tei.

Particularités liées aux données

Dans le cas des agglomérations, les données en entrée peuvent contenir un élément "typeSettlement" (voir le code 3001 dans wicri-belgique.fr:Wicri:Liste de codes postaux de Belgique).