Dilib, module SxmlNode, commande SxmlFindText
De Wicri Outils
Module SxmlNode |
La commande SxmlFindText
permet de repérer l'apparition de chaines de caractères identifiées par une expression régulière et d'en donner des éléments de localisation.
Liste des modules Dilib
Module SxmlNode
|
Définition
La commande SxmlFindText
filtre un flux de documents Sxml pour en extraire des expressions accompagnées d'éléments de contexte. Ces éléments de contexte sont séparés par des tabulations et se pérsentent dans cet ordre :
- la clé Sxml du document (si elle existe)
- un chemin de balise sXpath absolu
- un chemin de balise par tag et position compatible Xpath
- l'offset de la chaîne reconnue
- si l'option -b (before) est présente, la chaîne qui précède la chaîne reconnue
- la chaîne reconnue
- si l'option -a (after) est présente, la chaîne qui suit la chaîne reconnue
- Exemple
Soit le fichier jeuTest.xml réduit à :
000001 <r><t>ici se trouve le mot chien au milieu de la
phrase</t><voirAussi><a>beau chien</a><a>chien méchant</a></voirAussi></r>
La commande
SxmlFindText -s chien -a 10 -b 10 < jeuTest.xml
produit
000001 1/1 r/t 21 ve le mot chien au milieu
000001 1/2/1 r/voirAussi/a 5 beau chien (null)
000001 1/2/2 r/voirAussi/a[2] 0 (null) chien méchant
Synopsis
SxmlFindText -l -s string | -r regexp | -D mainDict [ -B binomialDict] [-a after] [-b before] [-w]
Options
-w
:- Cette option sans paramètre provoque une impression en mode wiki.
- Exemple : sur le wiki Wicri/Lorraine, recherche de documents significatifs sur le ville de Jarville-la-Malgrange.
Exemples d'application
- Autour du Cardinal de Lorraine dans le Serveur d'exploration sur la philologie (sur Wicri/Linguistique), voir notamment la page de discussion)
- Autour des colloques dans le Serveur d'exploration sur Aussois