Nuvola apps important.png Attention, suite à une faille de sécurité, les liens vers les serveurs d'exploration sont désactivés.

-

H2PTM (2007) Gesche

De H2PTM

Annotation multi-documents de points de vue exprimés

Application à Porphyry


 
 

 
Titre
Annotation multi-documents de points de vue exprimés: Application à Porphyry
Auteur
Samuel Gesche(i), Guy Caplat(ii) et Sylvie Calabretto(i)
Affiliations
(i) LIRIS, INSA de Lyon, 20, avenue Albert Einstein, 69621 Villeurbanne Cedex – France
  • {Samuel.Gesche, Sylvie.Calabretto}@insa-lyon.fr
(ii) Dpt. Informatique, INSA de Lyon, 20, avenue Albert Einstein, 69621 Villeurbanne Cedex – France
  • Guy.Caplat@insa-lyon.fr
Dans
actes du colloque H2PTM 2007 Hammamet
publié dans H²PTM07 : Collaborer, échanger, inventer
Résumé
Nos travaux portent sur une méthodologie et une instrumentation de la confrontation des points de vue en Sciences Humaines et Sociales. Ces points de vue, non consensuels, sont exprimés sous forme de structures hypermédia représentées dans un formalisme à base de graphes. Les résultats des confrontations, sous la forme d’annotations multi-documents, peuvent à leur tour devenir des sujets d’étude et mener à la création de nouveaux points de vue qui viendront alimenter de manière itérative le système.
Mots-clés
point de vue-opinion, annotation, confrontation

Contexte

Nos travaux portent sur la confrontation de points de vue dans le cadre d’un projet interdisciplinaire visant à instrumenter par l’informatique des chercheurs en Sciences Humaines. Ainsi, une plateforme nommée Porphyry (Bénel, 2002) a été créée il y a quelques années et est actuellement en exploitation. Cette plateforme permet d’ores et déjà la construction de points de vue. L’objectif de ce projet interdisciplinaire est double. D’une part, il s’agit de fournir aux chercheurs des outils adaptés à leur méthode scientifique, de manière les aider au plus proche de leurs besoins. D’autre part, il s’agit de fournir des outils adaptables, afin de suivre l’évolution de la discipline scientifique et l’élaboration de nouvelles méthodes de travail par les chercheurs (Bénel, 2006). D’un point de vue informatique, la plateforme Porphyry permet de classer des documents numériques – ou des parties de ces documents – au sein d’une hiérarchie hypermédia, au moyen d’un formalisme appelé les Réseaux de Description. L’architecture est multi-tiers (Bénel, 2002), et comporte notamment un serveur de contenu pour les documents et un serveur de correspondance pour les structures hypermédia. Nous travaillons sur la confrontation de ces structures, au sein d’une extension de Porphyry nommée Platon (PLateforme d’Analyse et de Traitement d’Opinions Numérisées).

Confrontation de points de vue-opinions[1]

La principale caractéristique de Porphyry est la gestion de l’absence de consensus. En effet, l’approche de l’environnement est basée sur l’interprétation de faits épars et non sur la construction d’une théorie en ayant à disposition tous les éléments (Bénel, 2001). Cela veut dire que plusieurs avis divergents peuvent coexister au sein du système. Le principe de la confrontation des points de vue-opinion, dans ce contexte, est de trouver les divergences entre leurs auteurs. Ces différences sont principalement de deux types : – soit l’un des modèles pointe sur des fragments documentaires que l’autre n’a pas pris en considération. Dans ce cas, il est intéressant de savoir si les points de vue-opinion couvrent le même domaine, et le cas échéant à quel point la prise en compte de ces ressources supplémentaires pourrait enrichir –ou remettre en question– le second point de vue-opinion. En effet, soit elles ont été oubliées –ou méconnues–, soit elles ont été volontairement omises (ce qui n’apparaît pas explicitement dans les Réseaux de Description de Porphyry mais peut apparaître dans un autre formalisme) ; – ou bien, la manière d’agencer les ressources et leurs pointeurs est différente, bien que les ressources elles-mêmes soient les mêmes. Dans ce cas, il est intéressant de détecter ces divergences en tant qu’interprétations différentes du même corpus. L’objectif de la confrontation est de permettre l’émergence de nouvelles connaissances et de nouvelles pistes de réflexion. Pour cela, nous faisons intervenir l’expert aussi souvent que possible dans le processus. Qui plus est, les techniques d’alignement couramment utilisées dans le Web Sémantique (Ehrig, 2004) s’avèrent souvent insuffisantes, parce que le vocabulaire lui-même n’est pas toujours consensuel. Parce que la confrontation de points de vue-opinion est une activité instrumentée au même titre que leur expression, nous considérons le résultat comme un nouveau point de vue-opinion. En effet, la confrontation peut se construire de manière itérative en montant dans les niveaux d’interprétation, en commentant le sujet d’études, puis le commentaire du sujet d’études, puis le commentaire du commentaire et ainsi de suite.

Annotation multi-documents

L’annotation est, selon (Prié, 2000), l’action (ou le résultat) consistant à attacher à l’une des parties d’un document une description qui correspond à un usage que nous-mêmes – ou toute autre personne – souhaiterons en faire plus tard. Elle est donc signée, située, finalisée, et elle ajoute une information sans porter atteinte à l’intégrité du document. Il est peu courant d’envisager des annotations portant sur plusieurs documents distincts à la fois. Cependant, avec les architectures numériques d’annotations, la proximité peut être conservée entre les documents et l’annotation sans pour autant contraindre la localisation des documents eux-mêmes. En effet, (Bachimont, 1999) définit le document numérique comme le résultat délivré au lecteur sur un support de communication (un écran par exemple), par opposition au fichier stocké sur une mémoire digitale (qui est la ressource servant à générer, de manière calculatoire, le document). Un document numérique peut donc être généré avec un certain nombre d’annotations qui seront partagées par d’autres documents. La confrontation de points de vue-opinions, en tant que méthode de recherche, implique la production d’une structure se rapportant aux points de vue-opinions considérés. Cela se fait habituellement par le biais de références et non d’annotations. Cependant, le résultat de la confrontation est conservé par l’environnement pour un usage ultérieur. Il est donc possible, et préférable, que ce soit en étroite relation avec les documents confrontés. En effet, non seulement il est utile de retrouver les points de vue à partir de la confrontation, mais plus encore il est utile de retrouver les confrontations effectuées à partir d’un point de vue. C’est pourquoi nous privilégions la notion d’annotation par rapport à celle de référence. Ces annotations sont multi-documents, parce qu’elles font partie au même titre de tous les points de vue confrontés.

Application

Nous avons développé un premier prototype de Platon fondé sur une approche multi-langages de la confrontation. Cette version permet d’importer des points de vue-opinions exprimés dans des formalismes de graphes simples et d’en effectuer la confrontation. La méthodologie de confrontation est fondée sur une approche itérative, par essais et erreurs. Comme le résultat de la confrontation de points de vue-opinion annote ces points de vue, l’étape suivante consiste à le conserver dans la base documentaire, afin qu’il puisse être consulté et discuté à son tour.

Bibliographie

[Bachimont, 1999] Bachimont B., « Bibliothèques Numériques audiovisuelles : des enjeux scientifiques et techniques », Document Numérique, numéro spécial Les Bibliothèques Numériques. Volume 2 - n°3-4/1999, pp. 319-344.

[Bénel, 2006] Bénel A., « Porphyry au pays des paestans : usages d'un outil d'analyse qualitative de documents par des étudiantes de maîtrise en iconographie grecque », Actes du colloque international « Corpus en Lettres et Sciences sociales : des documents numériques à l'interprétation », Albi, juillet 2006, Texto!, vol. XI, n°2. pp.182-189.

[Bénel, 2002] Bénel A., Calabretto S., Iacovella A. et Pinon J-M., « Porphyry 2001: Semantics for scholarly publications retrieval », Proceedings of the thirteenth International Symposium on Methodologies for Intelligent Systems ISMIS’02, Lyon, June 2002, Lecture Notes in Artificial Intelligence, Vol. 2366, Springer Verlag, pp.351-361

[Bénel, 2001] Bénel A., Eyged-Zsigmond E., Prié Y., Calabretto S., Mille A. et Iacovella A., « Truth in the Digital Library: From Ontological to Hermeneutical Systems », Proceedings of the fifth European Conference on Research and Advanced Technology for Digital Libraries, Darmstadt, September 4-9, 2001. Lecture Notes in Computer Science, Vol. 2163, Springer-Verlag, pp.366-377.

[Ehrig, 2004] Ehrig M. et Euzenat J., « State of the art on ontology alignment », Knowledge Web Deliverable 2.2.3, University of Karlsruhe. August 2004.

[Prié, 2000] Prié Y., « Sur la piste de l’indexation conceptuelle de documents – Une approche par l’annotation », Document Numérique. Volume 4 – n°1-2/2000, pp. 11-35.

[Ribière, 2002] Ribière M. et Dieng R., « A Viewpoint Model for Cooperative Building of an Ontology », Proceedings of the tenth International Conference in Conceptual Structures ICCS’02, Borovets, Bulgaria, July 2002, Lecture Notes in Computer Science, Springer-Verlag, 2393, pp. 220-234.

Notes

  1. Pour « point de vue de type opinion », c'est-à-dire non consensuel, par opposition au « point de vue de type perspective » qui offre une vision consensuelle au sein d’une discipline (Ribière, 2002)