Dilib, Module Tei, commande TeiSplitWordUsual

De Wicri Outils
Révision datée du 16 juin 2017 à 18:37 par imported>Jacques Ducloy (6 révisions importées)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
LogoDilib.gif
Panneau travaux.png
Bibliothèque Dilib (ressources numériques)
Module Utf8

Cette page introduit la commande TeiSplitWordUsual qui permet d'extraire des mots à partir de documents TEI.

Cette commande sera disponible à partir de la version 6.24

 

Description

Cette commande traite un flot de documents « clé - TEI » pour produire des triplets « uniterme - poids - clé ».

Options

Option -l (lower case)

Cette option entraîne une conversion des termes en minuscules.

Exemples

Sur Wicri/Musique wicri-musique.fr:Discussion Wicri:DiesIraeV1

Voir aussi