CIDE (1999) Mourad : Différence entre versions
De CIDE
imported>Jacques Ducloy |
imported>Jacques Ducloy |
||
Ligne 5 : | Ligne 5 : | ||
;Titre:[[A pour titre::La segmentation de textes par l'étude de la ponctuation]] | ;Titre:[[A pour titre::La segmentation de textes par l'étude de la ponctuation]] | ||
;Auteur:[[A pour premier auteur::Ghassan Mourad]] | ;Auteur:[[A pour premier auteur::Ghassan Mourad]] | ||
− | ;Affiilation: Equipe Langage, Logique, Informatique et Cognition (LaLIC), Centre d’Analyse et de Mathématique Sociales (CAMS), UMR 8557 du CNRS, EHESS, Paris-Sorbonne | + | ;Affiilation: Equipe Langage, Logique, Informatique et Cognition (LaLIC), Centre d’Analyse et de Mathématique Sociales (CAMS), UMR 8557 du CNRS, EHESS, [[A pour affiliation auteur::Université Paris 1 Panthéon-Sorbonne|Paris-Sorbonne]] |
;In: [[Est dans les actes::CIDE 1999 Damas|Actes du colloque CIDE.02]] (Damas 1999) | ;In: [[Est dans les actes::CIDE 1999 Damas|Actes du colloque CIDE.02]] (Damas 1999) | ||
;En ligne: | ;En ligne: |
Version actuelle datée du 20 septembre 2016 à 23:28
La segmentation de textes par l'étude de la ponctuation
|
- Résumé
- La segmentation de texte est une phase nécessaire pour un trèsgrand nombre d’applications en traitement automatique du langage : par exemple pour l'alignement des phrases dans les systèmes de TAO, pour l'analyse syntaxique, pour le résumé automatique, pour le filtrage de textes, etc.
- Nous essayerons, dans cet article, d'expliquer notre démarche pour développer un segmenteur de texte en segments textuels. Nous aborderons également les problèmes d’ambiguïté que suscitent les différents emplois des signes typographiques. Enfin nous signalerons brièvement ceux liés à la segmentation des textes d’autres langues et en particulier l’arabe.
- Mots-clefs
- exploration contextuelle, ponctuation, segmentation, segment textuel, TALN
… davantage au sujet de « CIDE (1999) Mourad »
La segmentation de textes par l'étude de la ponctuation +