Dilib, Module Tei, commande TeiSplitWordUsual
De Wicri Outils
Révision datée du 7 octobre 2016 à 10:50 par imported>Jacques Ducloy (→Exemples)
Module Utf8 |
Cette page introduit la commande TeiSplitWordUsual qui permet d'extraire des mots à partir de documents TEI.
Cette commande sera disponible à partir de la version 6.24
Sommaire |
Liste des modules Dilib
Module Tei
|
Description
Cette commande traite un flot de documents « clé - TEI » pour produire des triplets « uniterme - poids - clé ».
Options
Option -l
(lower case)
- Cette option entraîne une conversion des termes en minuscules.
Exemples
Sur Wicri/Musique wicri-musique.fr:Discussion Wicri:DiesIraeV1