Dilib, Module Tei, commande TeiSplitWordUsual

De Wicri Outils
Révision datée du 7 octobre 2016 à 10:50 par imported>Jacques Ducloy (Exemples)
LogoDilib.gif
Panneau travaux.png
Bibliothèque Dilib (ressources numériques)
Module Utf8

Cette page introduit la commande TeiSplitWordUsual qui permet d'extraire des mots à partir de documents TEI.

Cette commande sera disponible à partir de la version 6.24

 

Description

Cette commande traite un flot de documents « clé - TEI » pour produire des triplets « uniterme - poids - clé ».

Options

Option -l (lower case)

Cette option entraîne une conversion des termes en minuscules.

Exemples

Sur Wicri/Musique wicri-musique.fr:Discussion Wicri:DiesIraeV1

Voir aussi