Dilib, Module Tei, commande TeiSplitWordUsual : Différence entre versions
De Wicri Outils
imported>Jacques Ducloy (→Exemples) |
imported>Jacques Ducloy m (6 révisions importées) |
(Aucune différence)
|
Version actuelle datée du 16 juin 2017 à 19:37
Module Utf8 |
Cette page introduit la commande TeiSplitWordUsual qui permet d'extraire des mots à partir de documents TEI.
Cette commande sera disponible à partir de la version 6.24
Sommaire |
Liste des modules Dilib
Module Tei
|
Description
Cette commande traite un flot de documents « clé - TEI » pour produire des triplets « uniterme - poids - clé ».
Options
Option -l
(lower case)
- Cette option entraîne une conversion des termes en minuscules.
Exemples
Sur Wicri/Musique wicri-musique.fr:Discussion Wicri:DiesIraeV1