CIDE (2009) Da Sylva : Différence entre versions

De CIDE
imported>Abdelhakim Aidene
(Implémentation)
imported>Abdelhakim Aidene
(Implémentation)
Ligne 117 : Ligne 117 :
 
#Identification, dans le texte, de paires de mots ou de multitermes qui pourront former des couples vedette principale/sous-vedette. Ces paires doivent relever de types précis, identifiés dans l’étude préalable (Da Sylva, 2004). Cette méthode permet de produire  des entrées structurées comme celle donnée en exemple au début de cet article.
 
#Identification, dans le texte, de paires de mots ou de multitermes qui pourront former des couples vedette principale/sous-vedette. Ces paires doivent relever de types précis, identifiés dans l’étude préalable (Da Sylva, 2004). Cette méthode permet de produire  des entrées structurées comme celle donnée en exemple au début de cet article.
 
#Pour chacun des éléments de la liste de candidats-termes (que sont les mots, termes et paires identifiés dans les étapes 2. et 3.), calcul d’un poids; pour chaque segment, on ne retiendra dans l’index que les candidats-termes dont les poids sont les plus élevés (au-delà d’un certain seuil).
 
#Pour chacun des éléments de la liste de candidats-termes (que sont les mots, termes et paires identifiés dans les étapes 2. et 3.), calcul d’un poids; pour chaque segment, on ne retiendra dans l’index que les candidats-termes dont les poids sont les plus élevés (au-delà d’un certain seuil).
5. Sélection des candidats-termes les plus saillants, regroupement sur la base des vedettes principales partagées et mise en ordre alphabétique.
+
# Sélection des candidats-termes les plus saillants, regroupement sur la base des vedettes principales partagées et mise en ordre alphabétique.
 
Charlet et al. (2004) et Nazarenko et Aït El-Mekki (2005) présentent un outil très similaire à celui que nous avons développé de manière indépendante. L’introduction, dans le processus de construction de l’index, d’un auteur humain leur permet de contourner plusieurs problèmes liés à la limite de l’analyse automatique de la langue.
 
Charlet et al. (2004) et Nazarenko et Aït El-Mekki (2005) présentent un outil très similaire à celui que nous avons développé de manière indépendante. L’introduction, dans le processus de construction de l’index, d’un auteur humain leur permet de contourner plusieurs problèmes liés à la limite de l’analyse automatique de la langue.
  

Version du 7 juillet 2016 à 15:57

Outil de butinage du contenu des documents de collections numériques


 
 

 
titre
Outil de butinage du contenu des documents de collections numériques
auteurs
Lyne Da Sylva.
Affiliations
École de bibliothéconomie et des sciences de l’information, Université de Montréal.
In
CIDE.12 (Montréal), 2009
En PDF 
CIDE (2009) Da Sylva.pdf
Mots-clés 
Indexation, collections numériques, index de livre, indexation automatique, accès à l’information, accès au contenu, aide à la lecture.
Keywords
Indexing, digital collections, back-of-the-book index, automatic indexing, access to information, access to contents, reading aid.
Résumé
Cette recherche se veut une contribution à la recherche d’information dans les documents numériques, non pas pour le repérage de documents mais pour l’aide à la lecture et donc l’évaluation de la pertinence de documents repérés. L’introduction d’un outil de butinage est proposée pour accéder au contenu de documents des bibliothèques numériques, soit l’index de livre traditionnel. Celui-ci présente plusieurs avantages en tant qu’outil de navigation, bien que sa création automatique pose quelques difficultés. L’implémentation d’un outil de ce type est esquissée dans ses grandes lignes.