CIDE (2009) Bessagnet : Différence entre versions

De CIDE
imported>Jacques Ducloy
imported>Jacques Ducloy
(Introduction)
Ligne 37 : Ligne 37 :
 
Dans notre cas, l'objectif est d’expliciter la sémantique informelle du thésaurus autour des termes décrivant un territoire en se restreignant à l’aspect spatial. L’information du corpus (ici les notices  descriptives) peut nous aider à spécifier des relations entre termes pouvant être ambigües dans un thésaurus afin de créer une première ontologie, L’analyse linguistique automatisée de ces notices doit ensuite nous permettre d’enrichir l’ontologie du domaine par de nouveaux concepts qualifiant un territoire.
 
Dans notre cas, l'objectif est d’expliciter la sémantique informelle du thésaurus autour des termes décrivant un territoire en se restreignant à l’aspect spatial. L’information du corpus (ici les notices  descriptives) peut nous aider à spécifier des relations entre termes pouvant être ambigües dans un thésaurus afin de créer une première ontologie, L’analyse linguistique automatisée de ces notices doit ensuite nous permettre d’enrichir l’ontologie du domaine par de nouveaux concepts qualifiant un territoire.
  
Dans une première partie ([[#Problématiques et objectif|&2]]), nous présenterons les problématiques et objectifs de notre travail de recherche. Nous développerons les travaux connexes dans le ([[#Travaux connexes|&3]]) puis notre approche (&4) pour construire de manière automatique un thésaurus particulier : le thésaurus TERRIDOC. Enfin, nous expliciterons notre démarche pour passer d’un thésaurus particulier à une ontologie de domaine (&4) puis nous conclurons (&5).
+
Dans une première partie ([[#Problématiques et objectif|&2]]), nous présenterons les problématiques et objectifs de notre travail de recherche. Nous développerons les travaux connexes dans le ([[#Travaux connexes|&3]]) puis notre approche ([[#Représentation sémantique de connaissances expertes|&4]]) pour construire de manière automatique un thésaurus particulier : le thésaurus TERRIDOC. Enfin, nous expliciterons notre démarche pour passer d’un thésaurus particulier à une ontologie de domaine ([[#Transformation du thésaurus en ontologie légère|&4]]) puis nous conclurons ([[#Conclusion|&5]]).
  
 
==Problématiques et objectifs==
 
==Problématiques et objectifs==

Version du 25 août 2016 à 21:36

Extraction de termes, reconnaissance et labellisation de relations dans un thésaurus – Vers une ontologie.


 
 

 
titre
Extraction de termes, reconnaissance et labellisation de relations dans un thésaurus – Vers une ontologie.
auteurs
Marie-Noelle Bessagnet(1), Eric Kergosien(2) et Mauro Gaio(2)
Affiliations
(1):UPPA, Laboratoire LIUPPA, IAE, Pau, France
(2) :UPPA, Laboratoire LIUPPA, Laboratoire LIUPPA, Département Informatique, Pau, France
In
CIDE.12 (Montréal), 2009
En PDF 
CIDE (2009) Bessagnet.pdf
Mots-clés 
Ingénierie des connaissances, Thésaurus, Représentation des connaissances, liste d’autorités, vedettes matière, ontologie
Keywords
Knowledge Engineering, thesaurus, Knowledge representation, Subject Headings, ontology
Résumé
Dans le domaine des systèmes de documentation, l’usage des thésaurus à des fins d’indexation puis de recherche d’information est courant voire obligatoire. Dans les bibliothèques et les médiathèques francophones, par exemple, les documents possèdent de par le travail effectué par les bibliothécaires de riches informations de description, sous la forme de notices descriptives, décrites sur la base du thésaurus RAMEAU. Nous exploitons ces deux types de ressources (documents et notices) afin de créer une première structure sémantique représentant le travail d’indexation des bibliothécaires pour élaborer le thésaurus TERRIDOC. Notre corpus de référence a une forte connotation territoriale. Nous nous intéressons également à la transformation de thésaurus en ontologie de domaine. En effet, nous souhaitons obtenir une ontologie de domaine offrant une représentation synthétique du territoire implicitement décrit par le fonds documentaire traité, en faisant appel à des ressources externes de type SIG.