Dilib, module SgmlFast, commande SgmlFast : Différence entre versions

De Wicri Outils
imported>Jacques Ducloy
(Synopsis)
 
imported>Jacques Ducloy
m (1 révision importée)
 
(Aucune différence)

Version actuelle datée du 16 juin 2017 à 19:49

LogoDilib.gif
Panneau travaux.png
Bibliothèque Dilib (ressources numériques)
Module SgmlFast

Cette commande permet de réaliser des extractions simples et rapides dans le cas des balisages simples (non récursifs).

Outre sa facilité d'utilisation dans les cas simples, elle permet d'accélérer l'exécution de traitements complexe en évitant de parser l'ensemble des documents.

 

Exemple

Cette commande permet des extractions rapides. Dans l'exemple qui suit un ensemble de notices sélectionnées par HfdCat sont filtrées par SgmlFast pour en extraire les métadonnées author. De celles-ci sont extraites, par SxmlSelect, les attributs sortKey de l'élément name.

HfdCat RabelaisV1/Data/Main/Exploration/biblio.hfd       \
      | SgmlFast -s author                               \
      | SxmlSelect -g author/name/attribute::sortKey -p @g1 -p @2

Synopsis

SgmlFast [ -gG grepTag]

Option g (grep simple)

Cette option est équivalente à :

SxmlSelect -g descendant::grepTag -p @1 -p @2

Option G (grep avec extraction)

Cette option est équivalente à :

SxmlSelect -g descendant::grepTag -p @1 -p @g1

Voir aussi

Dans le réseau Wicri :

Ceci est la page de référence de « Dilib, module SgmlFast, commande SgmlFast » Cette commande est également traitée sur le wiki Wicri/Manuel.