Dilib, module StrDict, commande StrDictSelect

De Wicri Outils
LogoDilib.gif
Panneau travaux.png
Bibliothèque Dilib (ressources numériques)
Module StrDict

La commande StrDictSelect est utilisée pour faire des opérations dans un flot de données Sxml ou tabulées à l'aide de tableaux tableaux associatifs.

 

Synopsis

StrDictSelect -srx -t dictTable [ -t dictTable ] ... [-k key] ...

Options

Options générales

-t dictTable :
Cette option (obligatoire et répétable) permet de désigner la ou les tables concernées par les opérations de sélection.

Options utilisables en mode clé

-k key :
Cette option implique un fonctionnement en mode clé. Si la table contient une entrée key la valeur est imprimée sur le flot de sortie.
-r
Si cette option est présente la clè est également imprimée sur le flot d'entrée.

Options utilisables en mode flot de données

-x
(élimination) Si la clé de l'enregistrement d'entrée est présente dans les tables, cet enregistrement n'est pas recopié sur le flot de sortie.
-s
(sélection) Si la clé de l'enregistrement d'entrée est présente dans les tables, cet enregistrement est recopié sur le flot de sortie.
-r
associé à l'option -s, cette option permet d'effectuer une substitution de clé avant la copie. La valeur associée à la clé dans la table devient la nouvelle clé de l'enregistrement recopié.

Exemple d'emploi

Dans la table multilingue EuroVoc, élimination des entrées correspondant à un pays.

StrDictSelect -x -t $DILIB/data/Wicri/Metadata/CountryToPays.tab < $DILIB/data/Eurovoc/En2Fr.tab

Fabrication d'une table « nom de pays en français vers nom de pays en anglais » à partir ces codes ISO à 3 caractères.

WicriGetPage -l wicri-meta.en -p "ISO_3166-1"          \
  | MediaWikiCleanTable |MediaWikiTable2SxmlRowCol     \
  | MediaWikiTableTransformCol -k3 -V1                 \
  | StrDictSelect -t /Users/ducloy/Documents/Dilib/V0.5/V0.5.70/Main/data/Wicri/Metadata/IsoC3ToPays.tab -sr