Dilib, Module Utf8, commande Utf8SplitWordUsual

De Wicri Outils
Révision datée du 16 juin 2017 à 18:37 par imported>Jacques Ducloy (5 révisions importées)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
LogoDilib.gif
Panneau travaux.png
Bibliothèque Dilib (ressources numériques)
Module Utf8

Cette page introduit la commande Utf8SplitWordUsual qui permet d'extraire des mots à partir de textes en codage unicode UTF-8.

 

Synopsis

Description

Cette commande accepte en entrée une liste de couples « texte - clé HFD » et produit une liste de couples « terme -clé FHD ».

Options

Option -l (lower case)

Cette option entraîne une conversion des termes en minuscules.

Voir aussi