Dilib, module SxmlNode, commande SxmlFindText

De Wicri Outils
LogoDilib.gif
Panneau travaux.png
Bibliothèque Dilib (ressources numériques)
Module SxmlNode

La commande SxmlFindText permet de repérer l'apparition de chaines de caractères identifiées par une expression régulière et d'en donner des éléments de localisation.

 

Définition

La commande SxmlFindText filtre un flux de documents Sxml pour en extraire des expressions accompagnées d'éléments de contexte. Ces éléments de contexte sont séparés par des tabulations et se pérsentent dans cet ordre :

  1. la clé Sxml du document (si elle existe)
  2. un chemin de balise sXpath absolu
  3. un chemin de balise par tag et position compatible Xpath
  4. l'offset de la chaîne reconnue
  5. si l'option -b (before) est présente, la chaîne qui précède la chaîne reconnue
  6. la chaîne reconnue
  7. si l'option -a (after) est présente, la chaîne qui suit la chaîne reconnue
Exemple

Soit le fichier jeuTest.xml réduit à :

000001	<r><t>ici se trouve le mot chien au milieu de la
phrase</t><voirAussi><a>beau chien</a><a>chien méchant</a></voirAussi></r>

La commande

SxmlFindText -s chien -a 10 -b 10 < jeuTest.xml

produit

000001	1/1	r/t	21	ve le mot 	chien	 au milieu
000001	1/2/1	r/voirAussi/a	5	beau 	chien	(null) 
000001	1/2/2	r/voirAussi/a[2]	0	(null)	chien	 méchant

Synopsis

SxmlFindText -l -s string | -r regexp | -D mainDict [ -B binomialDict] [-a after] [-b before] [-w]

Options

-w :
Cette option sans paramètre provoque une impression en mode wiki.
Exemple : sur le wiki Wicri/Lorraine, recherche de documents significatifs sur le ville de Jarville-la-Malgrange.

Exemples d'application