Nuvola apps important.png Attention, suite à une faille de sécurité, les liens vers les serveurs d'exploration sont désactivés.

-

H2PTM (2005) Nanard

De H2PTM

Saphir

Un cadre de référence pour une spécification des hypermédias par intention


 
 

 
Titre
Saphir: Un cadre de référence pour une spécification des hypermédias par intention
Auteurs
Marc Nanard, Jocelyne Nanard
Affiliations
LIRMM, 161 rue Ada, 34392 Montpellie
  • nanard@lirmm.fr
Dans
actes du colloque H2PTM 2005 Paris
publié dans H²PTM05 : Créer, jouer, échanger : expériences de réseaux

Sommaire

Résumé
La notion de"séries" de documents désigne des ensembles de documents ayant de fortes similaires structurelles, en particulier rhétoriques et stylistiques, mais qui ne peuvent être caractérisés par leur seule structure logique. De façon générale, une série est caractérisée par une intention de communication plutôt que par son contenu effectif et sa structure. La "spécification intentionnelle" de documents fournit un cadre unificateur pour spécifier et produire automatiquement des séries. Cet article montre les originalités de cette approche, utilisée dans le projet SAPHIR, après l'avoir resitué dans le contexte des principaux travaux du domaine. L'accent est mis sur la séparation entre la spécification d'une trame narrative et argumentative satisfaisant genre, thème et thèse et le support à la rhétorique et à l'ergonomie stylistique globale de la structure produite ainsi que l'utilisation de schémas et règles réutilisables. L'apport principal de cette approche est d'une part la spécification générique de la trame narrative et argumentative en termes d'intentions plutôt qu'en termes de contenu, et d'autre part et surtout l'isolement et le déport des règles générales d'ergonomie et de rhétorique, permettant leur emploi. Un mécanisme simple.
Mots-clés
document virtuel, génération de document, spécification de document, structure argumentative, rhétorique.


2.1. Introduction

Au-delà de la production automatisée de pages web ou de documents techniques, un certain nombre de travaux de recherche s’intéressent à l’aide à la production de séries de documents. Sous ce terme, on désigne des familles de documents ayant de fortes similarités structurelles qui ne peuvent se réduire à celle d’une structure logique. Le terme de série est utilisé dans le vocabulaire télévisuel pour désigner des productions partageant les mêmes personnages et ayant des scénarios apparentés. Son emploi est généralisé pour dénoter une unité thématique et stylistique : par exemple une série sur les « mammifères marins » ou sur la « guerre de 40 ». Déjà, des groupes de presse cherchent à valoriser leurs archives en produisant des séries de « dossiers thématiques » réorganisant l’information éparpillée dans les articles relatifs à un thème donné. Des prototypes spécialisés ont été développés à cette fin, par exemple (IKS,2002). De façon générale, l’aide à la production de séries est un enjeu important pour la valorisation des énormes volumes de ressources informationnelles, ou matière première, disponibles dans des institutions telles que l’INA, la BNF, la MSH, le CNRS, etc.

Mais, le plus souvent, ces documents sont encore réalisés au coup par coup par des spécialistes ou par des outils dédiés, en tirant profit d’une très grande spécialisation de leur cible ou de leur matière première (ex. musées (STU,2001), biographies, dossiers thématiques). Même si certains segments du processus de conception-production commencent à bénéficier d’un support plus général, aucun travail n’a actuellement fourni de cadre méthodologique unifié. Or une présentation systématique des ressources, sous une forme organisée, n’est rentable que si des moyens automatiques généraux permettent de la produire à très faible coût, avec un niveau de qualité suffisant.

Dans le prolongement des travaux d’OPALES (NAN,2003) que nous avons réalisés avec l’INA et la MSH pour l’indexation des documents audiovisuels, nous travaillons dans le cadre du projet SAPHIR[1] avec l’INA, par la spécification de séries de documents hypermédias à partir d’une matière première finement indexée. L’objectif est une économie d’échelle basée sur la réutilisation grâce à des spécifications séparant les différents facteurs intervenant dans une « série », par exemple son « thème » (la façon de choisir la matière première), son « genre » (les règles d’organisation du discours), sa thèse (la façon dont s’organise le discours sur le plan argumentatif). De façon générale, une série est caractérisée par une intention de communication plutôt que par son contenu effectif et sa structure. Le but de cet article est d’introduire le cadre unificateur Saphir pour la spécification par intention des séries d’hypermédias. Le principe consiste à décrire les causes profondes qui conduisent à l’élaboration d’un hypermédia plutôt que le seul résultat du processus de conception : la structure et le contenu de l’hypermédia. Il s’agit de spécifier l’intention de l’auteur ou du lecteur, la trame narrative choisie, et les contraintes que doit respecter le document. Nous introduisons l’expression « spécification constructive par intention » pour désigner une telle description et signifier que l’hypermédia avec sa structure et son contenu est le résultat de l’interprétation de la spécification. La structure logique n’est pas donnée a priori comme une sorte de réceptacle où se déverse la matière première mais apparaît comme la conséquence de l’interprétation. Dans la suite de l’article, après une analyse des travaux apparentés, nous présentons la spécification constructive par intention et les motivations qui la sous-tendent.

2. État de l’art en spécification par intention

Traditionnellement, de nombreux travaux sur la conception, la spécification et la génération de documents se sont appuyés sur la structure logique. Les méthodes classiques d’ingénierie d’hypermédia UWE (KRA,2002), OO-H (GOM,2001), WebML (COM,2001) visent la modélisation de la structure logique finale, résultat de la modélisation conceptuelle et de la navigation (SCH,1998). Les éléments de contenu de cette structure logique résultent directement de la modélisation ou sont obtenus par des requêtes explicites à des informations sources. En aucun cas le choix des contenus d’une part, l’organisation de la navigation et de la présentation d’autre part, n’explicite les intentions qui ont présidé à ces choix dans un but communicationnel précis. Les travaux sur les hypermédias adaptatifs génèrent dynamiquement des variantes de présentation le plus souvent modélisés à l’avance (FRA,2002). La production automatique de documents à partir de ressources informationnelles indexées dans les bibliothèques numériques a récemment conduit au développement de modèles sémantiques d’indexation riches (Web sémantique (BER,2001), RDF (W3,C), graphes conceptuels) et à une plus grande complexité du processus de spécification et de génération. Cependant, ces travaux évacuent la partie structuration du discours pour n’aborder que le passage de l’indexation sémantique vers la mise en forme (généralement en utilisant XML, XSL-T et CSS [W3C]). Alors que la recherche sur les hypermédias s’est très tôt préoccupée des effets rhétoriques des liens (LAN,1987) , (MOU,1992) et utilisé les hypermédias pour représenter des argumentations dans des situations de conception (CON,2001), on constate que peu de travaux proposent des solutions pour engendrer directement une structure respectant une rhétorique donnée, ou tout au plus le font-ils dans des situations très spécifiques. Apporter un support à la planification pour la construction de la structure logique apparaît indispensable pour produire à grande échelle des séries de documents présentant de façon bien organisée les contenus de bibliothèques numériques.

Nous analysons maintenant les travaux émergents qui introduisent des éléments de rhétorique et de théorie du discours pour générer les structures de navigation et la présentation. Ces travaux font appel à des techniques telles que : les ontologies pour définir des vocabulaires communs servant à l’expression des divers modèles ; les annotations sémantiques ; l’usage de la rhétorique, en particulier la RST (Rhetorical Structure Theory) (MAN,1988) et de façon générale la théorie du discours ; la génération est alors une génération basée sur modèles. Le moteur de rhétorique Vox Populi (BOC,2005) génère automatiquement la structure argumentative organisant des séquences vidéos à partir de ressources disponibles sous forme de segments vidéos annotés sémantiquement. Le rôle de l’auteur consiste à construire la sémantique de l’espace de ressources en rassemblant et en annotant les segments sans spécifier explicitement comment et dans quel ordre l’utilisateur accédera au contenu. Les annotations encodent l’information verbale contenue dans la piste audio, d’une part les affirmations, d’autre part les structures d’argumentation qui sont utilisées dans le discours pour émettre ces affirmations. Vox Populi utilise des connaissances sur les relations rhétoriques (telles que : opposition, similarité, généralisation, spécialisation) pour compléter et inférer un graphe sémantique entre les segments et déduire une nouvelle structure argumentative potentielle qui sous-tend un montage qu’il propose. Il s’agit donc d’une approche orientée données. Ce genre de recherche est à rapprocher des travaux dans (CRA,2001) qui distinguent les approches « supportées par une ontologie » des approches « dirigées par une ontologie » pour générer un hypermédia. Dans le premier cas, la génération de la navigation résulte de l’annotation de l’espace de ressources en utilisant les ontologies du domaine. Dans le deuxième cas, les ontologies sont utilisées pour définir un modèle de navigation cible qui est ensuite peuplé en fonction des ressources informationnelles disponibles et satisfaisant les propriétés requises par l’ontologie. Dans ces deux types de travaux, il y a distinction entre représentation des connaissances du domaine et des connaissances d’argumentation. Dans le premier cas, les représentations utilisent des modèles de représentation adaptés (par exemple le modèle Toulmin (TOU,1984) pour l’argumentation), dans le deuxième cas, des ontologies. De son côté, Terminal Time (MAT,2000) applique des stratégies rhétoriques pour générer des expériences cinématiques en s’appuyant sur l’interaction du lecteur avec le documentaire. Par rapport à Vox Populi, il utilise une stratégie orientée par le plan de la cible, reconstruit dynamiquement, et insert les médias items dans le plan rhétorique généré. Dans les deux systèmes, la thèse est embarquée dans les connaissances rhétoriques sur le discours.

Dans les travaux référencés précédemment, le modèle du domaine est utilisé pour organiser le document cible. Les connaissances rhétoriques servent à organiser le schéma narratif, que celui-ci soit produit en fonction des données disponibles ou selon un plan. Mais aucun de ces travaux n’explicite une notion générique de genre de document, ni le choix d’un type de support (ex. séquence vidéo, site web). Par opposition, le genre spécifique Biographie a fait l’objet de différents travaux. Par exemple, dans (GEU,2003), le graphe sémantique des ressources annotées est supposé construit ; le système élabore une progression structurée du discours à partir d’une ontologie du genre « Bibliographie » qui s’appuie sur des unités narratives. Les schémas appropriés sont sélectionnés en fonction des classes de concepts considérés dans les ressources selon le thème (ex. la classe artiste pour Rembrandt). Toutefois, la description simple des schémas sous forme d’ensemble de règles représentant des relations binaires ne permet de décrire que des situations très élémentaires, sans possibilité de véritable inférence. De façon similaire, notre cadre adopte la séparation explicite de la modélisation du discours par les schémas narratifs faisant apparaître des rôles et les connaissances sur le domaine qui permettront de sélectionner les ressources susceptibles de remplir ces rôles. D’autres travaux sur la génération de biographies s’appuient sur des « templates » tout prêts décrits en termes de RST (MAN,1988) ou à partir d’ontologies spécifiques, par exemple pour des biographies d’artistes. Little (LIT,2002) a proposé de générer des présentations multimédias directement à partir d’annotations utilisant Dublin Core, donc, de fait, relativement indépendantes du domaine. Mais ces travaux ne prennent pas en compte la structure du discours.

Le seul projet, à notre connaissance, qui introduit actuellement des aspects de sémantique et de discours relativement indépendants du domaine est Topia (RUT,2003). La structure du discours est dérivée selon un traitement générique de la sémantique du domaine (par clustering à partir de description en RDF) puis est transformée en une progression structurée associant des constructions de discours en fonction des propriétés des clusters, puis en une présentation multimédia en utilisant les techniques de communication appropriées. Cependant, l’hypermédia généré ne se préoccupe que du sujet d’intérêt (à partir de la requête de l’utilisateur) (thème), donc ne prend pas en compte la notion de genre. De plus, l’approche est dirigée par les données. Citons enfin les travaux adaptant la présentation finale (présentation médiatisée au lecteur / utilisateur) en fonction de choix rhétoriques (RUT,2000).

On constate donc que ces travaux visent soit un genre spécifique, soit un thème spécifique, soit un type de discours spécifique ou adaptent seulement la présentation. Nous proposons ici un cadre pour spécifier et générer des séries d’hypermédias de genre donné, de thème donné, avec une thèse spécifiée, à partir d’indexation sémantique riche de matières premières sources (NAN,2003). Il s’agit donc d’une approche dirigée par la cible et non par les données. Ce cadre permet de construire la structure logique comme une conséquence d’un processus intentionnel et plus comme le remplissage d’une structure préexistante avec des médias items remplissant certaines conditions. Notre cadre vise également un travail qualitatif sur l’organisation du discours et s’appuie sur la modélisation du discours aussi bien dans la matière première que dans les schémas narratifs utilisés pour la cible. La section suivante décrit le cadre Saphir.

3. Principe général

L’objectif de cette section est d’introduire, de façon simplifiée et informelle, les principes du cadre unificateur qui a été retenu pour le projet SAPHIR, la spécification constructive par intention (ou SCI) et d’expliquer les étapes qui transforment une telle spécification en un document effectif (voir figure 1). Ce dernier est produit de façon automatique à partir d’une matière première que l’on suppose être déjà indexée de façon fine et précise, dans l’espace du ‘domaine’. Un telle indexation, qui est un pré-requis, peut être élaborée par des outils comme OPALES (NAN,2003) et représenter les connaissances de façon précise et calculable ( par exemple par des graphes conceptuels (GEN,2000)(NAN,2001)) . La SCI est une spécification déclarative exécutable. En cela, elle se différencie d’une part des approches procédurales comme celle utilisées couramment pour le Web (ex : php), et d’autre part des approches par transformation de structure (ex : XSL-T) celles-ci engendrant souvent la structure de présentation directement à partir de celle des données. A l’opposé de ces approches, la SCI, spécifie le document cible sous forme de spécifications déclaratives reflétant l’activité qu’aurait un auteur pendant les différentes phases du processus naturel d’écriture (HAY,1986), (STR,1992).

  • La première spécification explicite l’activité de collecte d’information,

indépendamment de toute organisation ou même de présence effective dans le document final : le contenu intentionnel potentiel indique quels rôles peuvent jouer des éléments de la matière première, en quoi ils seraient utiles à ce document, s’ils étaient retenus.

  • La seconde spécification explicite l’activité de planification : la trame

narrative et argumentative décrit comment l’auteur organise son discours en termes de son intention de communication : Les rôles introduits dans le contenu intentionnel potentiel en rendent l’expression générique, indépendante du contenu effectif.

  • La troisième spécification explicite l’activité de révision : les contraintes

organisationnelles et rhétoriques définissent les transformations structurelles entre l’organisation narrative et la structure effective du document nécessaires ou souhaitables pour rendre la lecture de celui-ci efficace. Cette phase sélectionne et organise des éléments du contenu intentionnel potentiel en un document effectif, conformément à la trame narrative et argumentative et en élabore la structure logique effective.

  • Notons qu’une quatrième phase serait utile pour assurer la cohésion fine du

document. Cette phase, qui correspondrait à celle de « mise en phrase » dans le processus d’écriture, ne peut, avec les moyens actuels, être réalisée de façon totalement automatique. La construction du document reste réalisée par assemblage de segments, non altérés, extraits de la matière première. C’est pour cela qu’une phase de post-production manuelle est souhaitable pour affiner la cohésion et améliorer sa qualité, par exemple en ajustant des coupes dans la vidéo et en introduisant les liaisons souhaitables. Le besoin et le rôle de ces dernières peuvent être mentionnées par le système de génération sans toutefois que ce dernier soit en mesure d’en fournir le contenu effectif.

Ces spécifications étant rendues indépendantes, elles peuvent être éditées séparément, facilitant la maintenance, l’évolution, et la conception du document.

-images.4ever.eu- 162687.jpg Fig. 1 : Etapes de la production d’un document à partirde sa spécification par intention

3.1. Expression de l’intentionnalité du contenu

Du point de vue fonctionnel, ce niveau de description caractérise les motivations de l’auteur dans le choix des éléments de contenus. Il rend explicite le pourquoi et l’associe au quoi des éléments du contenu.

Du point de vue syntaxique et sémantique, il s’agit d’associer aux éléments de matière première, déjà indexés dans l’espace du ‘domaine’, de nouveaux attributs propres, cette fois, à l’espace du discours du document cible. Ceci est réalisé, à un niveau générique, au moyen de couples appelés « règles de désignation intentionnelle», ayant la forme suivante :

(caractérisation de l’intention, caractérisation du contenu)

La partie droite d’une règle caractérise le contenu qu’elle désigne et peut être spécifiée :

  • de façon explicite, la valeur effective étant désignée directement dans la règle

(un élément textuel, une portion d’image ou de séquence vidéo particulière),

  • de façon potentielle, c’est-à-dire en caractérisant ce contenu par ses propriétés

attendues, par exemple en fournissant la ou les requêtes qui permettent de le sélectionner au sein d’une matière première indexée. La syntaxe dépend alors de l’outil utilisé pour rechercher la matière première.

  • de façon potentielle, c’est-à-dire en caractérisant ce contenu par ses propriétés

attendues, par exemple en fournissant la ou les requêtes qui permettent de le sélectionner au sein d’une matière première indexée. La syntaxe dépend alors de l’outil utilisé pour rechercher la matière première.

  • de façon explicite, en fournissant directement l’objet intention,
  • de façon formelle, par une expression évaluable (ou ‘constructeur’) élaborant

une instance de l’objet intention au vu de propriétés du contenu effectif désigné par la partie droite et aussi des attributs mis en jeu dans sa sélection.

Ces règles assurent donc la mise en correspondance d’éléments de contenus explicites ou potentiels (au sens : « sélectionnables dans la matière première ») et d’attributs décrivant ceux-ci dans l’espace du discours, et éventuellement leurs interrelations. Nous attirons l’attention du lecteur sur le fait que l’objet intention n’est pas réductible à une simple dénomination d’un ensemble de requêtes, comme le serait une « procédure cataloguée sql ». Du point de vue pragmatique, pour l’auteur, il joue le rôle de représentant de l’ensemble d’information caractérisé par le membre de droite, et en facilite la manipulation.

Considérons comme exemple un dossier de presse relatif à une catastrophe naturelle. L’auteur souhaite y montrer en préambule que l’événement était pourtant tout à fait prévisible. Son intention relative à cette partie de discours est de trouver les arguments relatifs à cette prévisibilité. Il crée donc une ( ou plusieurs) « règles de désignation intentionnelle» qu’il baptise (partie gauche) « arguments relatifs à la prévisibilité ». Dès lors, il peut parler et manipuler cette partie de sa narration indépendamment de tout contenu effectif. Les règles de désignation indiquent comment obtenir ce contenu. Ainsi, dans le cas de La Nouvelle Orléans, les requêtes recherchent des éléments de discours disponibles dans les archives sur le thème de rupture de digues, d’inondation, de cyclone, de risques et dont la date est antérieure à celle de la catastrophe, et dont le lieu est cette ville. De plus, la présence d’attributs rend possible de caractériser les nuances des éléments sélectionnés significatives pour le discours. Il peut par exemple affecter à ses « arguments relatifs à la prévisibilité » des attributs pour en refléter la crédibilité, à partir de leur source, par exemple, simple prédiction, avis d’expert, article dans revue scientifique, rapport de commission d’étude, etc. Il peut aussi conserver un attribut de date , etc.

La désignation intentionnelle rend possible une structuration de la matière première en fonction de son usage possible et de ses propriétés, indépendamment de l’usage effectif. C’est ainsi que l’auteur pourra, dans sa trame narrative, prévoir de construire un document ayant, par exemple, la forme suivante :

« Comme pour toutes les villes, de nombreux prophètes avaient de longue date annoncés sa destruction, par exemple : EnumérerQuelques{arguments relatifs à la prévisibilité ; .crédibilité = prédiction}. Ceci n’interpelle en général pas les foules… Mais il était déjà beaucoup plus inquiétant de voir la communauté scientifique considérer depuis longtemps ce phénomène comme très probable et son ampleur prévisible catastrophique. EnumérerPlusieurs{arguments relatifs à la prévisibilité ; . crédibilité = scientifique ; .date =< 2002 }. Plus récemment, de nombreux rapports EnumérerPlusieurs{arguments relatifs à la prévisibilité ; .crédibilité = rapports ; .date >= 2002 } Etc.. »

Dans une telle rédaction l’auteur ne préjuge ni du sujet précis, ni du contenu, ni de la forme des requêtes qu’il utilise pour atteindre la matière première, il peut rester au niveau de son intention de communication. Ceci sépare les deux tâches : la recherche d’information et l’emploi de ces informations dans le discours. L’auteur pourra donc séparément, d’une part, améliorer les règles en raffinant et en complétant les requêtes sans devoir se préoccuper de sa trame narrative, mais d’autre part et surtout réutiliser la même trame narrative spécifiée en termes d’intentions de communication pour discourir sur tout instance de catastrophe prévisible (tremblement de terre, tsunami, marée noire,…).

Du point de vue implémentation, l’évaluation d’une règle de désignation intentionnelle a pour effet de sélectionner dans la matière première les éléments désignés par la partie droite de la règle, et pour chaque élément sélectionné :

  • d’instancier un objet « intention » tel que défini en partie gauche, dont les

valeurs d’attributs sont calculées relativement au contenu effectif ;

  • de lier chaque élément retenu à son intention

L’évaluation d’une règle de désignation intentionnelle met en jeu un moteur qui interprète en premier le membre de droite, pour obtenir le ou les éléments concernés, issus de la règle ou de la matière première. Il interprète alors le membre de gauche pour obtenir l’objet intention associé, le constructeur de celui-ci pouvant utiliser des attributs de l’élément associé (ALB,2003) (utilisation de ses méta-données ou de ses caractéristiques intrinsèques). La structure informatique effective d’un objet « intention » dépend du système qui implémente le moteur de construction. Il peut s’agir, dans le cas le plus simple d’une simple description XML, d’un objet java, ou même d’un graphe conceptuel. En pratique, deux approches d’implémentation sont possibles : une implémentation de type paresseuse, « lazy evaluation » dans laquelle les règles ne sont évaluées que lors de leur invocation pendant l’évaluation de la trame narrative, et une implémentation « extensive » dans laquelle tous les objets sélectionnables par les règles sont d’abord retrouvés et associés à leurs intentions.

3.2. Expression de la trame narrative et argumentative

Le rôle de cette trame est d’exprimer l’organisation de pensée que l’auteur souhaite donner à son document, indépendamment de tout contenu effectif. D’un point de vue fonctionnel, elle spécifie une structure ‘souhaitée’ de document, dont les futurs éléments ne sont identifiés qu’en termes d’intention et qui indique dans quels actes de discours ils interviennent, comme montré dans l’exemple précédent. Elle correspond en quelque sorte à ce que l’auteur noterait comme ‘plan’[2] de son document au moment où, celui-ci n’étant pas encore produit, il ne peut en parler que par intention. Cette indépendance vis-à-vis du contenu effectif rend possible la réutilisation directe de cette spécification sur d’autres données (divers domaine ou thèmes). D’un point de vue syntaxique et sémantique, la trame est spécifiée de façon déclarative comme une structure arborescente dont chaque nœud représente un élément possible du futur discours et dispose d’attributs indiquant le type d’acte de discours ou de forme rhétorique qui lui est associé et caractérise le contenu de façon générique par une spécification d’intention. D’un point de vue implémentation, l’évaluation de la spécification de la trame a pour effet d’effectuer le peuplement de la structure du document, par activation des règles de désignation intentionnelle associées aux intentions. Cette activation peut elle-même être récursive, lorsque les règles ou les actes du discours le sont, par exemple pour enchaîner un raisonnement. Par exemple, l’auteur peut spécifier une « énumération » (acte du discours) des « plus lourdes » (sélection par filtrage sur attributs de…) « conséquences écologiques » (l’objet intention, substitut générique de la matière première). Une telle spécification (ici : thèse) est directement réutilisable pour d’autres thèmes (marée noire, déversement toxique, feu de forêt…).

Pour des raisons d’unification, et en raison de leur aspect déclaratif, les diverses structures de contrôle telles que l’itération et le choix, sont simplement assimilées à des actes de discours particuliers et donc directement représentés comme des nœuds. Les paramètres de ces structures de contrôle sont notés dans la description de l’acte de discours correspondant. Les mécanismes de transformation de structure mis en jeu à l’étape suivante les prennent en compte. Le résultat de cette évaluation est la « structure potentielle » du document, un arbre, techniquement similaire à une structure logique de document, mais dont les nœuds restent décorés par les attributs d’intention, d’origine de contenu, et d’actes de discours. Cet arbre n’est pas le document effectif, mais seulement une matière première déjà pré-organisée, potentiellement en place pour être sélectionnée et réorganisée pour constituer le document cible. C’est un peu ce qu’obtiendrait un auteur qui aurait juste mis bout à bout, mais déjà conformément à son plan, tout ce qui lui a passé par la tête pour écrire un document, avant de réorganiser celui-ci. Du point de vue cinématographique, ce serait la première maquette rassemblant tous les rushs avant que le choix définitif de leur emploi ne soit effectué.

On remarque le caractère générique de cette spécification. En repérant les éléments de la trame au moyen du vocabulaire intentionnel, l’auteur préserve la généralité de sa construction. La séparation entre l’expression de l’intention et l’expression de la trame narrative favorise une plus grande clarté de la spécification : ainsi, l’auteur peut intervenir séparément d’un côté ou de l’autre par exemple pour affiner la sélection des éléments correspondant à son intention, ou pour affiner la façon de les présenter. De plus, cette séparation favorise la réutilisation. Libérée des contenus effectifs grâce à la désignation par intention, elle assure également une spécification plus maniable et plus lisible, donc plus facilement maintenable.

3.3. Expression des règles ergonomiques et rhétoriques

Le rôle des règles structurelles, ergonomiques et rhétoriques est de transformer la structure provisoire élaborée à partir de l’expression de la trame narrative et du contenu intentionnel du document, en la structure effective du document, de telle sorte que celle-ci possède les propriétés ergonomiques et rhétoriques souhaitables. Ces règles, liées aux actes de discours ou aux formes rhétoriques concernées, ont un caractère universel et sont donc réutilisables. De ce fait, il est souhaitable de les rassembler sous forme de bibliothèques de règles qui sont invoquées pour la traduction de la structure narrative en la structure effective du document.

D’un point de vue syntaxique et sémantique, une règle est décrite comme un patron de transformation (« design pattern ») :

  • son contexte d’application (position structurelle, ou acte de discours concerné)
  • la transformation à effectuer :
  • la caractérisation de la forme à modifier et de ses propriétés
  • la forme résultante, avec loi d’élaboration des nouvelles valeurs

d’attributs

Du point de vue implémentation, le mécanisme général le mieux adapté pour cette transformation d’arbres est celui des transformations de Markov, qui est par exemple employé dans le moteur d’analyse linguistique SIGMART [Chauché84] et qui a prouvé son efficacité pour la traduction. Une approche similaire à base de graphes conceptuels est en cours d’étude. Une solution très simplifiée, utilisée dans une maquette « proof of concept » est l’emploi de « templates XSLT », mais l’absence de récursivité et d’affectation d’attributs constitue un handicap pour son pouvoir expressif dans le cas général.

Un exemple simple de telles règles générales concerne la « limitation de longueur des énumérations » : la célèbre observation cognitive dite des « sept mnèmes » implique qu’il est inefficace de faire des énumérations de plus de sept items, or, il est impossible de prédire le nombre d’éléments de matière première qui répondent à une requête donnée. Ici, le contexte « énumération » active une règle générale de transformation qui, par exemple, en fonction du nombre d’items potentiellement présents, engendre une transformation de l’arbre, afin de tronquer l’énumération et optionnellement de construire une annexe contenant les autres éléments.

Si cette énumération apparaissait elle-même dans un acte « liste ordonnée d’arguments », une règle associée à cet acte aurait déjà classé les arguments en fonction d’un attribut de leur objet intention, pris comme « intérêt ». De ce fait par application de ces deux règles, l’énumération aurait conservé, de fait, les meilleurs arguments, sans que l’auteur n’ait à spécifier plus que les actes dans lesquels étaient utilisés des éléments caractérisés par intention.

Le caractère général de telles règles permet de décharger l’auteur occasionnel de la responsabilité de leur l’écriture qui ne relève pas de sa compétence. La matérialisation correcte des actes du discours n’est pas spécifique à un document. En conséquence, l’écriture de ces règles peut être confiée une fois pour toutes à un expert, et celles-ci peuvent être organisées en bibliothèques. L’intérêt d’avoir isolé de telles règles est de préserver leur caractère général et donc de permettre leur réemploi. Leur isolement du reste du document rend possible, sans devoir respécifier les choix narratifs, la commutation entre plusieurs bibliothèques de règles offrant des implémentations différentes. Par exemple, pour la règle des sept items, on peut disposer d’une implémentation spécifique pour le web, où l’éclatement d’une énumération engendrerait des pages complémentaires et mettrait en place la navigation associée, et une autre, plus simple, pour la forme imprimée. De plus, la mise en évidence et l’isolement des actes du discours dégage l’auteur en phase de conception de devoir assurer la cohérence du détail de son document. 4. Discussion et conclusion

Cet article a montré les originalités de la spécification intentionnelle utilisée dans le projet SAPHIR, en les resituant dans le contexte des principaux travaux du domaine. Notre cadre met l’accent sur la séparation entre la spécification d’une trame narrative et argumentative satisfaisant genre, thème et thèse et le support à la rhétorique et l’ergonomie stylistique globale de la structure produite ainsi que l’utilisation de schémas et règles réutilisables. L’apport principal de cette approche est d’une part la spécification générique de la trame narrative et argumentative en termes d’intentions plutôt qu’en termes de contenu, et d’autre part et surtout l’isolement et le déport des règles générales d’ergonomie et de rhétorique, permettant leur réemploi. Ceci n’est possible que par la mise en évidence de la notion de « structure potentielle » du document, arbre décoré par les intentions et les actes du discours, qui est peuplé grâce à la mise en correspondance matière première/intentions, puis réorganisé pour produire la structure effective. Les motivations qui nous ont entraînées dans cette démarche pour agencer et réordonner les éléments d’un discours prennent appui sur et s’insèrent dans la démarche de pensée et la tradition de la rhétorique[3] ((REB,2001), (DES,2000)), tout en étant conscient des limites des techniques automatiques. Il nous semble en effet important de commencer à intégrer, dans les techniques de génération de documents, des mécanismes généraux visant la qualité des liens, le contrôle de la rhétorique (CAR,2000), (CAR,2003) et de la cohérence dans la lignée de travaux tels que (URE,2005).

5. Références

[ALB,2003] Alberink, M.,,..., Finding the story – Broader applicability of semantics and discourse for hypermedia generation. In Proc. Hypertext’2003, ACM Press, 67-76

[BER,2001] Berners-Lee,..., « The Semantic Web. » Scientific American

[BOC,2005] Bocconi, S.,..., the Generation of Argument Structure within Video Sequences. In Proc. Hypertext’2005, ACM Press. (To appear 2005).

[CAR,2003] Carruthers, M, Le livre de la mémoire. Macula

[CAR,2000] Carter L.M., Arguments in hypertext: a rhetorical approach, in Proc. Hypertext’2000, ACM Press, 85-91.

[CHA,1984] Chauché. J, Un outil multidimensionnel de l’analyse de discours . In Proceedings of Coling84, 10th International Conference on COmputional LINGuistics, pages 11-15, Stanford University, California

[CON,2001] Conklin, J., Hypertext for Collective Sensemaking: 15 Years on from gIBIS. Proc. ACM Conf. Hypertext’2001, ACM Press, 2001

[CRA,1998] Crampes, J, Adaptive narrative abstraction. In Proc. Hypertext’98, ACM Press, 97-105

[CRA,2000] Crampes, M, Ontology-supported and ontology-driven conceptual navigation on the world wide web, in Proc. Hypertext 2000, ACM Press, 191-199.

[DES,1996] Desbordes, F., La Rhétorique antique. Hachette, Paris

[FRA,2002] Frasincar, F., Hypermedia Presentation adaptation on the semantic web. In Proc. Adaptive Hypermedia (AH2002), LNCS 2347, 2002, 133-142.

[GEN,2000] Genest, D., "Extension du modèle des graphes conceptuels pour la recherche d'informations". Thèse, Montpellier II

[GEU,2002] Geurst, J., Dynamic Generation of Intelligent Multimedia Presentations through Semantic Inferencing, in Proc. Conf. ECDL 2002, Springer, 2002, 158-189.

[GEU,2003] Geurts, et al., Towards Ontology-driven Discourse: From Semantic Graphs to Multimedia Presentations. In Second International Semantic Web Conference (ISWC2003), pages 597–612, Sanibel Island, Florida, USA, October 20-23, 2003

[HAY,1980] Hayes J., Identifying the organization of writing process, in L.W. Gregg, E.R. Steinberg (Eds.), Cognitive process in writing, Lawrence Erlbaum Associates

[IKS,2002] Iksal, S., Adaptive Special Reports for On-line News Papers, in Workshop Electronic Publishing, Adaptive Hypermedia (AH) 2002, S. Mizzaro and C. Tasso, Editors. 2002, Universidad de Malaga: Malaga, Espagne. p. 27 - 30

[KRA,2002] Kraus, A. and Koch, N.,., Generation of Web Applications from UML Models using an XML Publishing Framework. In 6th World Conference on Integrated Design and Process Technology (IDPT), 2002.


[LAN,1997] Landow, G., Relationally Encoded Links and the Rhetorics of hypertext. In Proc. Hypertext’87. 331-343.

[MAN,1988] Mann, W. C.; et al, Rhetorical structure theory: towards a functional theory of text organization, Text, 8 (3), pp. 243-281, 1988.

[MAT,2000] Mateas, M., Generation of ideologically biased documentaries, in Proc. AAAI, 2000, 36-42.

[MOU,1992] Moulthrop, S., Toward a rhetoric of informating texts, Proc. of the ACM Conf. On Hypertext’92, 171-180, ACM Press, 1992.

[NAN,2001] Nanard M., Nanard J. , Genest, D., Chein, M., Digital Video and HypermediaBased New Services for Working on Patrimonial Archives, Int. Conf. On Hypermedia and Interactivity in Museums, ICHIM’01, Milano, Sept. 2001.

[NAN,2003] Nanard M., A hypermedia-based model for integrating open services and metadata, in Proc. Conf. ACM Hypertext’2003, ACM Press, 2003.

[PER,1997] Perelman, C., L'empire de la rhétorique. Vrin, 1997.

[REB,2001] Reboul, O., Introduction à la rhétorique, PUF, 2001.


[RUT,2000] Rutledge, L., Davis, J.,, Interdimensional Hypermedia communicative devices for rhetorical Structure, in Proc. Conf. Multimedia Modeling, 2000, World Scientific, 89-105.

[SCH,1998] D. Schwabe, G., Rossi.: An Object-Oriented Approach to Web-Based Application Design. TAPOS, Vol 4, 1998, 207-225.

[STR,1992] Streitz, N. et al. Sepia, a Cooperative Hypermedia Authoring Environment, in Proc. Hypertext’92, ACM Press, 1992, 11-22.

[STU,2001] Stuer, P., Meersman, R., De Bruyne. S., The HyperMuseum Theme Generator System: Ontology-based Internet Support for the Active Use of Digital Museum Data for Teaching and Presentation. Museum and the Web 2001. Archimuse.

[TOU,1984] Toulmin, S., Rieke, R., and Janik, A., ntroduction to Reasoning. MacMillan Publishing Company, 2 edition, 1984.

[URE,2005] Uren,V., Buckingham Shum, S., Modelling Naturalistic Argumentation in Research Literatures : Representation and Interaction Design Issues. In Int. J. Intelligent Systems (IJIS 2005), special issue on Computational Models of Natural Argument. Chris Reed and Floriana Grasso Eds. (To appear 2005).

[W3,C] World Wide Web Consortium,, W3C, XML, XSLT, CSS, RDF, etc.

Notes

  1. SAPHIR : Système d'Assistance à la Publication Hypermédia par spécification Intentionnelle et modélisation Rhétorique
  2. Il faut ici considérer le mot plan avec son sens rédactionnel et non pas informatique car beaucoup d’outils appellent malheureusement ‘plan’ une simple sous-structure extraite du document effectif en n’en conservant que les titres.
  3. Traditionnellement (REB,2001), (DES,2000), la rhétorique comprend l'invention, la disposition, l'élocution et l'action. L'invention correspond au fait de trouver les arguments à mobiliser et déterminer le contenu. La disposition correspond à l'organisation du propos ; l'élocution aux choix stylistiques (choix lexicaux, figures de styles) ; l'action au fait d'exécuter le discours. Dans la SCI, il est hors de question de viser une quelconque et inaccessible subtilité oratoire, mais simplement déjà de fournir les moyens pour spécifier et produire une organisation d’éléments de discours respectant déjà des règles rhétoriques simples.