Dilib, module Tei, commande TeiTableCityFromWiki

De Wicri Outils
LogoDilib.gif
Panneau travaux.png
Bibliothèque Dilib (ressources numériques)
Module Tei

Cette commande accepte un flux de pages wiki préalablement traitées par MediaWikiTableTransformCol pour générer une table de type StrDict.

 

Synopsis

TeiTableCityFromWiki [-k baliseClés]] [-e baliseElément]]
< tableWikiEnSxml
> tableGraphieDeVilleVersElémentTei

Utilisation sans paramètres

Sans paramètre elle utilise des tables wiki de 3 colonnes préalablement traitée par la commande MediaWikiTableTransformCol :

  • La première contient un lien wiki avec la graphie de référence d'une ville.
  • La deuxième contient une liste de graphies rencontrées dans les textes (principalement les adresses). Ces graphies servent de clé dans la table cible.
  • La troisième contient des éléments relatifs au pays et aux régions dans lesquelles cette ville est insérée.

Elle produit une table :

  • dont la clé est une graphie de ville
  • et le contenu un élément Tei de type place.

Exemple

La table :

Gif-sur-Yvette Gif-sur-Yvette country : France ;
region @type=région @nuts=2 : Île-de-France

produira : une indentation a été ajoutée à des fins de lisibilité

Gif-sur-Yvette	
    <place>
       <placeName>
             <settlement type="city">Gif-sur-Yvette</settlement>
             <region type="région" nuts="2">Île-de-France</region>
       </placeName>
       <country>France</country>
    </place>

Utilisation avec paramètres

Exemple introductif

Des paramètres ont été introduits pour traiter des tables plus complexes, comme sur Wicri/Allemagne, la page Liste de codes postaux.

ville code 4 chiffres code 5 chiffres formes courantes district/land
Göttingen 3400 37001–37099 Göttingen region @type=land @nuts=2 : Basse-Saxe

La fabrication de la table $DILIB/data/Wicri/Allemagne/codePostal5.fr.tab utilise la séquence de filtres suivants :

cat $DILIB_IMPORT/Wicri/Data/Allemagne/codePostal.fr.wiki
      ...
  |  MediaWikiCleanTable                                        \
  |  MediaWikiTable2SxmlRowCol                                  \
  |  MediaWikiTableTransformCol -l1 -T4 -E5                     \
  |  TeiTableCityFromWiki -e c5 -k c3                           \
  |  sort

Paramètres

-k baliseClés
Cette option introduit la balise correspondant à la colonne contenant les graphies servant de clé dans la table cible.
-e baliseElément
Cette option introduit la balise correspondant à la colonne contenant l'élément Tei.

Particularités liées aux données

Dans le cas des agglomérations, les données en entrée peuvent contenir un élément "typeSettlement" (voir le code 3001 dans wicri-belgique.fr:Wicri:Liste de codes postaux de Belgique).