Dilib, module SgmlFast, commande SgmlFast

De Wicri Outils
LogoDilib.gif
Panneau travaux.png
Bibliothèque Dilib (ressources numériques)
Module SgmlFast

Cette commande permet de réaliser des extractions simples et rapides dans le cas des balisages simples (non récursifs).

Outre sa facilité d'utilisation dans les cas simples, elle permet d'accélérer l'exécution de traitements complexe en évitant de parser l'ensemble des documents.

 

Exemple

Cette commande permet des extractions rapides. Dans l'exemple qui suit un ensemble de notices sélectionnées par HfdCat sont filtrées par SgmlFast pour en extraire les métadonnées author. De celles-ci sont extraites, par SxmlSelect, les attributs sortKey de l'élément name.

HfdCat RabelaisV1/Data/Main/Exploration/biblio.hfd       \
      | SgmlFast -s author                               \
      | SxmlSelect -g author/name/attribute::sortKey -p @g1 -p @2

Synopsis

SgmlFast [ -gG grepTag]

Option g (grep simple)

Cette option est équivalente à :

SxmlSelect -g descendant::grepTag -p @1 -p @2

Option G (grep avec extraction)

Cette option est équivalente à :

SxmlSelect -g descendant::grepTag -p @1 -p @g1

Voir aussi

Dans le réseau Wicri :

Ceci est la page de référence de « Dilib, module SgmlFast, commande SgmlFast » Cette commande est également traitée sur le wiki Wicri/Manuel.