Dilib, Module Tei, commande TeiSplitWordUsual : Différence entre versions
De Wicri Outils
imported>Jacques Ducloy |
imported>Jacques Ducloy m (6 révisions importées) |
||
(2 révisions intermédiaires par le même utilisateur non affichées) | |||
Ligne 15 : | Ligne 15 : | ||
}} | }} | ||
{{Fin 2 colonnes}} | {{Fin 2 colonnes}} | ||
+ | ==Description== | ||
+ | Cette commande traite un flot de documents « clé - TEI » pour produire des triplets « uniterme - poids - clé ». | ||
+ | |||
+ | ==Options== | ||
+ | '''Option <code>-l</code>''' (''lower case'') | ||
+ | :Cette option entraîne une conversion des termes en minuscules. | ||
+ | ==Exemples== | ||
+ | Sur Wicri/Musique [[wicri-musique.fr:Discussion Wicri:DiesIraeV1]] | ||
+ | |||
==Voir aussi== | ==Voir aussi== | ||
* [[Dilib, Module Utf8, commande Utf8SplitWordUsual]] | * [[Dilib, Module Utf8, commande Utf8SplitWordUsual]] |
Version actuelle datée du 16 juin 2017 à 19:37
Module Utf8 |
Cette page introduit la commande TeiSplitWordUsual qui permet d'extraire des mots à partir de documents TEI.
Cette commande sera disponible à partir de la version 6.24
Sommaire |
Liste des modules Dilib
Module Tei
|
Description
Cette commande traite un flot de documents « clé - TEI » pour produire des triplets « uniterme - poids - clé ».
Options
Option -l
(lower case)
- Cette option entraîne une conversion des termes en minuscules.
Exemples
Sur Wicri/Musique wicri-musique.fr:Discussion Wicri:DiesIraeV1