CIDE (2009) Bessagnet : Différence entre versions

De CIDE
imported>Jacques Ducloy
(Introduction)
imported>Jacques Ducloy
(Conclusion)
Ligne 117 : Ligne 117 :
 
==Conclusion==
 
==Conclusion==
  
Comme nous l’avons expliqué, notre premier objectif est d’expliciter la sémantique informelle du thésaurus autour de concepts décrivant un territoire en se restreignant à l’aspect spatial dans le but de spécifier des relations ambigües entre termes présentes dans les thésaurus. Les traitements effectués sur le corpus de documents mis à disposition par la MIDR nous ont permis de modéliser la phase de création d’une ontologie enrichie du territoire reposant sur quatre étapes principales : (i) l’extraction d’informations du corpus via les notices XML associées aux documents que l’on organise sous forme d’un vocabulaire contrôlé, (ii) la définition  d’un  thésaurus  (thésaurus  TERRIDOC)  caractérisant   le
+
Comme nous l’avons expliqué, notre premier objectif est d’expliciter la sémantique informelle du thésaurus autour de concepts décrivant un territoire en se restreignant à l’aspect spatial dans le but de spécifier des relations ambigües entre termes présentes dans les thésaurus. Les traitements effectués sur le corpus de documents mis à disposition par la MIDR nous ont permis de modéliser la phase de création d’une ontologie enrichie du territoire reposant sur quatre étapes principales : (i) l’extraction d’informations du corpus via les notices XML associées aux documents que l’on organise sous forme d’un vocabulaire contrôlé, (ii) la définition  d’un  thésaurus  (thésaurus  TERRIDOC)  caractérisant le territoire issu du vocabulaire contrôlé et du thésaurus RAMEAU (thésaurus qui a assisté l’indexation manuelle par des documentalistes des documents du fonds documentaire de la MIDR), (iii) l’identification de toponymes du territoire et de relations les associant aux concepts déjà présents dans le thésaurus, (iv) la transformation du thésaurus en ontologie légère en l’enrichissant par les toponymes et relations spatiales identifiées.
  
territoire issu du vocabulaire contrôlé et du thésaurus RAMEAU (thésaurus qui a assisté l’indexation manuelle par des documentalistes des documents du fonds documentaire de la MIDR), (iii) l’identification de toponymes du territoire et de relations les associant aux concepts déjà présents dans le thésaurus, (iv) la transformation du thésaurus en ontologie légère en l’enrichissant par les toponymes et relations spatiales identifiées.
 
 
Le processus mis en place est automatique. Notre ontologie est utilisée à des fins de recherche d’information et d’explicitation du travail des experts bibliothécaires. Aussi, nous travaillons actuellement à la spécification des relations que nous créons lors de la phase de transformation d’un thésaurus en ontologie. Nous envisageons d’appliquer notre méthodologie sur le thésaurus RVM Laval afin de conforter notre approche.
 
Le processus mis en place est automatique. Notre ontologie est utilisée à des fins de recherche d’information et d’explicitation du travail des experts bibliothécaires. Aussi, nous travaillons actuellement à la spécification des relations que nous créons lors de la phase de transformation d’un thésaurus en ontologie. Nous envisageons d’appliquer notre méthodologie sur le thésaurus RVM Laval afin de conforter notre approche.
 
  
 
==Références bibliographiques==
 
==Références bibliographiques==

Version du 25 août 2016 à 21:37

Extraction de termes, reconnaissance et labellisation de relations dans un thésaurus – Vers une ontologie.


 
 

 
titre
Extraction de termes, reconnaissance et labellisation de relations dans un thésaurus – Vers une ontologie.
auteurs
Marie-Noelle Bessagnet(1), Eric Kergosien(2) et Mauro Gaio(2)
Affiliations
(1):UPPA, Laboratoire LIUPPA, IAE, Pau, France
(2) :UPPA, Laboratoire LIUPPA, Laboratoire LIUPPA, Département Informatique, Pau, France
In
CIDE.12 (Montréal), 2009
En PDF 
CIDE (2009) Bessagnet.pdf
Mots-clés 
Ingénierie des connaissances, Thésaurus, Représentation des connaissances, liste d’autorités, vedettes matière, ontologie
Keywords
Knowledge Engineering, thesaurus, Knowledge representation, Subject Headings, ontology
Résumé
Dans le domaine des systèmes de documentation, l’usage des thésaurus à des fins d’indexation puis de recherche d’information est courant voire obligatoire. Dans les bibliothèques et les médiathèques francophones, par exemple, les documents possèdent de par le travail effectué par les bibliothécaires de riches informations de description, sous la forme de notices descriptives, décrites sur la base du thésaurus RAMEAU. Nous exploitons ces deux types de ressources (documents et notices) afin de créer une première structure sémantique représentant le travail d’indexation des bibliothécaires pour élaborer le thésaurus TERRIDOC. Notre corpus de référence a une forte connotation territoriale. Nous nous intéressons également à la transformation de thésaurus en ontologie de domaine. En effet, nous souhaitons obtenir une ontologie de domaine offrant une représentation synthétique du territoire implicitement décrit par le fonds documentaire traité, en faisant appel à des ressources externes de type SIG.