Dilib, module Tei, commande TeiTableCityFromWiki
Module Tei |
Cette commande accepte un flux de pages wiki préalablement traitées par MediaWikiTableTransformCol pour générer une table de type StrDict.
Liste des modules Dilib
Module Tei
|
Synopsis
- TeiTableCityFromWiki [-k baliseClés]] [-e baliseElément]]
- < tableWikiEnSxml
- > tableGraphieDeVilleVersElémentTei
Utilisation sans paramètres
Sans paramètre elle utilise des tables wiki de 3 colonnes préalablement traitée par la commande MediaWikiTableTransformCol :
- La première contient un lien wiki avec la graphie de référence d'une ville.
- La deuxième contient une liste de graphies rencontrées dans les textes (principalement les adresses). Ces graphies servent de clé dans la table cible.
- La troisième contient des éléments relatifs au pays et aux régions dans lesquelles cette ville est insérée.
Elle produit une table :
- dont la clé est une graphie de ville
- et le contenu un élément Tei de type place.
Exemple
La table :
Gif-sur-Yvette | Gif-sur-Yvette | country : France ; region @type=région @nuts=2 : Île-de-France |
produira : une indentation a été ajoutée à des fins de lisibilité
Gif-sur-Yvette
<place>
<placeName>
<settlement type="city">Gif-sur-Yvette</settlement>
<region type="région" nuts="2">Île-de-France</region>
</placeName>
<country>France</country>
</place>
Utilisation avec paramètres
Exemple introductif
Des paramètres ont été introduits pour traiter des tables plus complexes, comme sur Wicri/Allemagne, la page Liste de codes postaux.
ville | code 4 chiffres | code 5 chiffres | formes courantes | district/land |
---|---|---|---|---|
Göttingen | 3400 | 37001–37099 | Göttingen | region @type=land @nuts=2 : Basse-Saxe |
La fabrication de la table $DILIB/data/Wicri/Allemagne/codePostal5.fr.tab
utilise la séquence de filtres suivants :
cat $DILIB_IMPORT/Wicri/Data/Allemagne/codePostal.fr.wiki
...
| MediaWikiCleanTable \
| MediaWikiTable2SxmlRowCol \
| MediaWikiTableTransformCol -l1 -T4 -E5 \
| TeiTableCityFromWiki -e c5 -k c3 \
| sort
Paramètres
- -k baliseClés
- Cette option introduit la balise correspondant à la colonne contenant les graphies servant de clé dans la table cible.
- -e baliseElément
- Cette option introduit la balise correspondant à la colonne contenant l'élément Tei.
Particularités liées aux données
Dans le cas des agglomérations, les données en entrée peuvent contenir un élément "typeSettlement" (voir le code 3001 dans wicri-belgique.fr:Wicri:Liste de codes postaux de Belgique).