Discussion:Dilib, module Sgml, commande SgmlSelect

De Wicri Outils
Révision datée du 10 janvier 2014 à 12:21 par imported>Jacques Ducloy (Pour Ali)

Pour Ali

HfdCat RabelaisV1/Data/Main/Exploration/biblio.hfd    \
 | SgmlSelect -s record/TEI/teiHeader/fileDesc/titleStmt/author/affiliation/country#  \
              -g record/TEI/teiHeader/fileDesc/publicationStmt/date#                  \
              -p "@g1" -p "@s1" -p @1                                                 \
 | SgmlSelect -p "@2-@1" -p @3                                                        \
 | more

Commande TimeCurationClass

  • implicitement trouve la date dans la clé (avant \t).
    • ne garde que les années
  • options f t s (from to step) le nom de la classe est la date de début
HfdCat ... SgmlSelect | TimeCurationClass -f 1990 -t 2012 -s 2
    • piste : utiliser une boucle sur un Buffer pour lire le flot d'entrée.
  • option c ou C (classification rules)
    • -c ou -C pointe vers un fichier qui contient des règles
HfdCat ... SgmlSelect | TimeCurationClass -c myRules.dict

les règles sont exprimées dans des tableaux de 3 colonnes - le séparateur utilisé sera :

  • la tabulation avec -c
  • le ";" avec -C

Exemple :

0 ; 1989 ; avant 1990
1990 ; 1994 ; 1900 - 1994
...
2010 ; 3000 ; après 2010