VSST (2012) Hajlaoui : Différence entre versions

De VSST
imported>Jacques Ducloy
imported>Jacques Ducloy
Ligne 6 : Ligne 6 :
 
  |texte=
 
  |texte=
 
;Auteurs: [[A pour premier auteur::Kafil Hajlaoui]], [[A pour auteur::Pascal Cuxac]], [[A pour auteur::Jean Charles Lamirel]], [[A pour auteur::Claire François]].
 
;Auteurs: [[A pour premier auteur::Kafil Hajlaoui]], [[A pour auteur::Pascal Cuxac]], [[A pour auteur::Jean Charles Lamirel]], [[A pour auteur::Claire François]].
 +
;Affiliations:[[A pour affiliation auteur::Institut de l'information scientifique et technique]]
 
}}
 
}}
 
;Résumé:Ce travail s’inscrit dans le cadre du programme de recherche QUAERO1, un vaste projet de recherche et d’innovation se rapportant au traitement automatique de contenus multimédias et multilingues. L’objectif abordé dans cet article est de proposer une méthode de classification automatique d’articles dans un plan de classement international de brevets relevant du même domaine. La finalité applicative de ce travail est de proposer une aide aux experts dans le processus d’évaluation de l’originalité et la nouveauté d’un brevet, en lui proposant les citations scientifiques les plus pertinentes. Ce problème soulève de nouveaux défis en catégorisation liés du fait que le plan de classement des brevets n’est pas directement adapté à la structure des documents scientifiques et que la répartition des exemples disponibles n’est pas nécessairement équilibrée entre les différentes classes d’apprentissage. Nous proposons pour les résoudre d’appliquer une amélioration de l’algorithme des K-plus-proches-voisins (K-PPV) se basant sur l’exploitation des règles d’associations entre les termes descripteurs des documents et ceux des classes de brevets. En utilisant conjointement comme référentiels une base de brevets du domaine de la pharmacologie et une base bibliographique du même domaine issue de la collection Medline, nous montrons que cette nouvelle technique de catégorisation, qui combine les avantages des approches numériques et ceux des approches symboliques, permet d’améliorer sensiblement les performances de catégorisation, relativement aux méthodes de catégorisation usuelles, dans le cas du problème posé.
 
;Résumé:Ce travail s’inscrit dans le cadre du programme de recherche QUAERO1, un vaste projet de recherche et d’innovation se rapportant au traitement automatique de contenus multimédias et multilingues. L’objectif abordé dans cet article est de proposer une méthode de classification automatique d’articles dans un plan de classement international de brevets relevant du même domaine. La finalité applicative de ce travail est de proposer une aide aux experts dans le processus d’évaluation de l’originalité et la nouveauté d’un brevet, en lui proposant les citations scientifiques les plus pertinentes. Ce problème soulève de nouveaux défis en catégorisation liés du fait que le plan de classement des brevets n’est pas directement adapté à la structure des documents scientifiques et que la répartition des exemples disponibles n’est pas nécessairement équilibrée entre les différentes classes d’apprentissage. Nous proposons pour les résoudre d’appliquer une amélioration de l’algorithme des K-plus-proches-voisins (K-PPV) se basant sur l’exploitation des règles d’associations entre les termes descripteurs des documents et ceux des classes de brevets. En utilisant conjointement comme référentiels une base de brevets du domaine de la pharmacologie et une base bibliographique du même domaine issue de la collection Medline, nous montrons que cette nouvelle technique de catégorisation, qui combine les avantages des approches numériques et ceux des approches symboliques, permet d’améliorer sensiblement les performances de catégorisation, relativement aux méthodes de catégorisation usuelles, dans le cas du problème posé.

Version du 24 mai 2012 à 11:55

Aide à l'expertise des brevets par alignement avec les publications scientifiques


 
 

 
Auteurs
Kafil Hajlaoui, Pascal Cuxac, Jean Charles Lamirel, Claire François.
Affiliations
Institut de l'information scientifique et technique
Résumé
Ce travail s’inscrit dans le cadre du programme de recherche QUAERO1, un vaste projet de recherche et d’innovation se rapportant au traitement automatique de contenus multimédias et multilingues. L’objectif abordé dans cet article est de proposer une méthode de classification automatique d’articles dans un plan de classement international de brevets relevant du même domaine. La finalité applicative de ce travail est de proposer une aide aux experts dans le processus d’évaluation de l’originalité et la nouveauté d’un brevet, en lui proposant les citations scientifiques les plus pertinentes. Ce problème soulève de nouveaux défis en catégorisation liés du fait que le plan de classement des brevets n’est pas directement adapté à la structure des documents scientifiques et que la répartition des exemples disponibles n’est pas nécessairement équilibrée entre les différentes classes d’apprentissage. Nous proposons pour les résoudre d’appliquer une amélioration de l’algorithme des K-plus-proches-voisins (K-PPV) se basant sur l’exploitation des règles d’associations entre les termes descripteurs des documents et ceux des classes de brevets. En utilisant conjointement comme référentiels une base de brevets du domaine de la pharmacologie et une base bibliographique du même domaine issue de la collection Medline, nous montrons que cette nouvelle technique de catégorisation, qui combine les avantages des approches numériques et ceux des approches symboliques, permet d’améliorer sensiblement les performances de catégorisation, relativement aux méthodes de catégorisation usuelles, dans le cas du problème posé.