Dilib, Module Tei, commande TeiSplitWordUsual : Différence entre versions

De Wicri Outils
imported>Jacques Ducloy
imported>Jacques Ducloy
m (6 révisions importées)
 
(2 révisions intermédiaires par le même utilisateur non affichées)
Ligne 15 : Ligne 15 :
 
}}
 
}}
 
{{Fin 2 colonnes}}
 
{{Fin 2 colonnes}}
 +
==Description==
 +
Cette commande traite un flot de documents « clé - TEI » pour produire des triplets « uniterme - poids - clé ».
 +
 +
==Options==
 +
'''Option <code>-l</code>''' (''lower case'')
 +
:Cette option entraîne une conversion des termes en minuscules.
 +
==Exemples==
 +
Sur Wicri/Musique [[wicri-musique.fr:Discussion Wicri:DiesIraeV1]]
 +
 
==Voir aussi==
 
==Voir aussi==
 
* [[Dilib, Module Utf8, commande Utf8SplitWordUsual]]
 
* [[Dilib, Module Utf8, commande Utf8SplitWordUsual]]

Version actuelle datée du 16 juin 2017 à 19:37

LogoDilib.gif
Panneau travaux.png
Bibliothèque Dilib (ressources numériques)
Module Utf8

Cette page introduit la commande TeiSplitWordUsual qui permet d'extraire des mots à partir de documents TEI.

Cette commande sera disponible à partir de la version 6.24

 

Description

Cette commande traite un flot de documents « clé - TEI » pour produire des triplets « uniterme - poids - clé ».

Options

Option -l (lower case)

Cette option entraîne une conversion des termes en minuscules.

Exemples

Sur Wicri/Musique wicri-musique.fr:Discussion Wicri:DiesIraeV1

Voir aussi