Nuvola apps important.png Attention, suite à une faille de sécurité, les liens vers les serveurs d'exploration sont désactivés.

-

H2PTM (2007) Vuillemot

De H2PTM

Vers un hyper-accès au moyen du profil utilisateur


 
 

 
Titre
Vers un hyper-accès au moyen du profil utilisateur
Auteurs
Romain Vuillemot(i), Béatrice Rumpler(i) et Jean-Marie Pinon(i)
Affiliations
(i) LIRIS, INSA-Lyon, F-69621, France
  • {romain.vuillemot, beatrice.rumpler, jean-marie.pinon}@insa-lyon.fr
Dans
actes du colloque H2PTM 2007 Hammamet
publié dans H²PTM07 : Collaborer, échanger, inventer
Résumé
Dans cet article, nous proposons la notion d'hyper-accès, dont l'objectif est de permettre un accès générique non-séquentiel pertinent à toute information, non limité aux hypermédias. L'idée est de modéliser à la fois les applications et les dispositifs d'interaction avec les hypermédias, et ensuite de les généraliser quelle que soit l'information contenue et manipulée. Nous proposons également un modèle de navigation à partir duquel nous identifions trois critères permettant de caractériser un environnement d’hyper-accès. Ces critères permettront la création d’un profil utilisateur d’hyper-accès, afin de réutiliser le capital apprentissage de ce dernier. Cette démarche s'inscrit dans l'amélioration du processus d'exploration de grandes quantités de données hétérogènes où les systèmes traditionnels atteignent leur limite. Nous illustrons et validons partiellement notre proposition au moyen d'un exemple d’hyper-accès, détournant un usage établi.
Mots-clés 
Hyper-Accès, Hypermédias, Masses de données, Profil Utilisateur.

Introduction

En 1964, McLuhan soutenait « The medium is the message » (McLuhan, 1964), à savoir que la façon de diffuser l'information prédomine sur le contenu lui-même. L'exemple typique est celui de la télévision, qui devient un média de masse dès lors qu'elle capte l'attention exclusive et unidirectionnelle de millions de foyers. Et cela quel que soit le contenu. Plusieurs approches d'analyse sont possibles afin d'interpréter cette déclaration : sociologique, économique, psychologique et technique entre autres. En se focalisant sur cette dernière approche, il est intéressant de se demander si 1) le moyen d'accès à l'information peut-il être différencié du contenu? 2) peut-on réutiliser ce moyen d'accès et le « poids » qu'il porte afin d'y diffuser d'autres informations? Vouloir dissocier l'information de son interaction est une tâche ambitieuse : la représentation est souvent intrinsèquement liée à une interaction, et toutes deux apportent une information sur le contenu (la structure physique reprend souvent une information sémantique, et réciproquement). Si l'on ne veut pas omettre d'information, il est nécessaire de prendre en compte non seulement l'information intégralement, mais aussi sa disposition physique et l'interaction nécessaire pour y accéder. Dès lors il est envisageable de la reformuler en la représentant autrement, accompagnée d’une autre forme d'interaction : le spectateur peut ainsi prendre la main sur le contenu dont la navigation a été préalablement définie par l'auteur. Dans le cas de grandes quantités de données, où l'a priori est faible sur les données, de nouvelles formes d'interaction sont à trouver (Van Dam, 1997)), mais tout en minimisant l'effort d'apprentissage et de prise en main. L'intérêt de pouvoir reformuler les données au gré du dispositif de navigation est très fort, car d'après la déclaration de McLuhan, il sera possible de donner à l'information une pertinence nouvelle. La question d'évaluation du poids du medium se pose alors : quels sont les critères permettant de rendre un contenu pertinent au moyen de son dispositif de perception et d'interaction ? Car de toute information ne peut pas forcément émerger un sens, même si elle passe à la télévision. Les hypermédias permettent un accès non-séquentiel aux données, et donc un gain de temps et d'efficacité à l'utilisateur en lui permettant d’accéder à l'information de manière plus ou moins analogue à sa démarche mentale. Voici les raisons qui nous poussent à utiliser cette stratégie spécifique d'accès aux données dans le cas de grandes quantités de données, où nous constatons que :

  • La navigation séquentielle est difficile en un temps raisonnable (à savoir l'intervalle temporel durant lequel l'utilisateur possède toutes ses capacités d'attention et d'analyse) il faut donc proposer des méthodes de navigation différentes.
  • Les temps de calcul explosent et les méthodes classiques sont inefficaces car elles perdent leur réactivité, intelligibilité (à cause de surcharge visuelle) ou ne sont pas assez fines pour différencier de nombreuses informations.
  • Les systèmes de recherche d'information sont inefficaces si l'on ne sait pas ce que l'on cherche (par exemple si l’on veut seulement explorer un jeu de données) ou si on ne sait pas formuler ses besoins avec les codes ou les symboles du système.

Notre proposition se base donc sur les systèmes hypermédias et consiste dans un premier temps en un modèle théorique de la navigation (Section 2). A partir de ce modèle nous allons identifier les caractéristiques spécifiques d'un accès non-séquentiel, afin de faire émerger la notion d’hyper-accès (Section 3). Nous terminerons par un exemple d'hyper-accès en détournant un usage établi (Section 4).

Modèle de navigation

Modéliser la navigation consiste à caractériser un processus qui a lieu à l’interface entre l’homme et la machine (Vuillemot, 2006). Notre modèle de navigation se focalise à la fois sur la représentation et l’interaction avec les données, mais aussi sur le parcours utilisateur qui intègre ces représentations et interactions en leur assignant une étape de parcours.

Modèle de représentation

Trois étapes de transformation successives des données constituent notre modèle de représentation de l'information (Figure 1). Ces étapes ont déjà fait l’objet d’études dans le cas de la représentation visuelle (Chi, 2000). Nous proposons un modèle plus généralisé et couplé au modèle d’interaction, dont les étapes sont :

  • Extraction de l'information : il s'agit d'extraire de manière exhaustive toutes les données internes et externes à l'information (métadonnées, formes, taille, ...) et de les rendre manipulables par l'ordinateur. Ainsi on se libère de la contrainte de stockage initiale de l’information. Cette étape correspondant à une phase d’indexation « ouverte » à toute application future.
Figure 1. Modélisation des étapes successives de représentation des données (rectangles) et de leur interaction (flèches) (Vuillemot, 2006)
  • Disposition de l'information extraite : l'extraction est projetée dans un espace de représentation de données 2D, 3D, hyperbolique ou autres. A savoir passer d'un espace multidimensionnel exhaustif à un espace réduit sous forme de projection, d’agrégation, et de sélection entre autres.
  • Rendu de l'information disposée : il s'agit de définir un support de rendu au moyen duquel seront perçues les données disposées. Le rendu peut être effectué sur le serveur (image, vidéo, animation 3D) ou alors localement (SVG, X3D..) pour être ensuite projeté sur l'interface de perception.

Chaque étape est dite métier et peut être considérée comme une boîte noire indépendante et interchangeable. Un assemblage de ces boîtes noires correspondra à une représentation et interaction possible avec les données. L’objectif est de converger vers un assemblage optimal, à savoir la meilleure représentation des données, via l’analyse des interactions utilisateur.

Modèle d'interaction

Les interactions interviennent à chaque étape de la représentation des données (Figure 1) et permettent de choisir quelles opérations respectives de sélection, reformulation et filtrage sont à effectuer. Chaque interaction possède une modalité, à savoir un moyen physique d'accès par l'utilisateur. Les interactions sont de trois natures : automatique (le système génère un événement qui ne demande pas d'intervention utilisateur comme la mise à jour périodique de données), semi-automatique (l'utilisateur génère un événement qui remplit une condition définie par le système et génère alors une action du système, comme les règles ou filtrages dynamiques) et manuelle (l'utilisateur effectue une action qui ne nécessite pas l'intervention du système comme le changement du point de vue local sur les données.)

Modèle de parcours utilisateur

La combinaison de représentations et d'interactions forment un parcours utilisateur (Figure 2). Le parcours est composé d'étapes dites contextuelles : les actions ont un sens lié aux actions précédentes. Les étapes de ce parcours ont déjà bien été identifiées, comme pour le parcours visuel (Shneiderman, 1996), mais de manière trop peu formelle. Le parcours utilisateur peut être vue comme une succession d'étapes de navigation réelle (représentations et interactions), qui deviennent des étapes de navigation mentale en étant dé-temporalisées et étiquetées.

Figure 2. Modélisation du parcours utilisateur (V: visualisation, N : navigation) sous forme d'étapes caractéristiques de la recherche visuelle d'information (Shneiderman, 1996)

L'hyper-accès

En se basant sur le modèle de navigation défini précédemment, nous souhaitons caractériser les informations implicitement contenues dans les hypermédias afin de les généraliser, et offrir un accès générique non-séquentiel non limité aux hypermédias. Un accès séquentiel suit le chemin prédéfini par le concepteur sans laisser le choix à l’utilisateur. Cet accès à l’information trouve ses limites dans le cas de masses de données où le temps de navigation devient important, comme lors d’une phase de recherche exploratoire. Il est alors nécessaire d’avoir une forme d'a priori ou de connaissance sur les différents formats et donc sur leurs représentations et interactions pertinentes. Ce qui n’est pas une des caractéristiques des masses de données hétérogènes. De même, la temporalité y t très forte et imprévisible : il peut y avoir une hétérogénéité temporelle qui nécessite des représentations adaptées. Ainsi, une approche sémantique, ou de sélection de l’information est difficile à mettre en place. Notre démarche est d’un côté étudier les techniques d’accès à l’information (intrinsèquement liées aux données) et d’un autre étudier les techniques de navigation dans les hypermédias (liées au modèle mental de l’utilisateur). L’objectif est de proposer un modèle hybride que nous qualifierons d’hyper-accès.

Techniques d’accès à l’information.

L'accès à l'information est un processus permanent, réalisé au moyen d'une interface plus ou moins visible et plus ou moins complexe à manipuler. Un accès est pertinent s'il combine à la fois une sélection judicieuse d'informations et de représentations adaptées au contexte. Il est alors nécessaire d'extraire différents niveaux de connaissance des données selon différentes perspectives (Chen, 2000) comme celles internes aux données (contenu, sémantique (Grosky, 2000), annotations, structure logique, structure physique, temporalité, …), externes aux données (structure d'arborescence, abstractions, agrégation, localisation géographique, …) et même celles de l'environnement (statistiques d’usages, commentaires, données sociales, ...). Une combinaison judicieuse de ces connaissances sur les données permettra à des environnements d'accès séquentiel de devenir non-séquentiel.

Techniques de navigation Hypermédia.

La navigation hypermédia est possible via l’utilisation d’une information supplémentaire, permettant au média d'être accédé automatiquement de manière non-séquentielle. Toute la difficulté réside dans la localisation de cette information, ce qui a déjà fait l'objet de nombreuses études dont le modèle de Dexter (Halasz, 1994). Ce dernier est composé de trois couches (Runtime Layer, Storage Layer et Within Component Layer) et permet ainsi de localiser et formaliser la connaissance intrinsèque à un hypermédia, permettant ainsi la conception d'environnements purement hypermédias. De même les hypermédias adaptatifs permettent d'adapter la conception autour de l'utilisateur en fonction de nombreux critères (Brusilovsky, 1996). Cependant, une contrainte très forte que nous souhaitons respecter est la minimisation de la surcharge d'apprentissage chez l'utilisateur : ainsi la limite de ces modèles réside dans leur application à la phase de conception uniquement. Notre approche est donc de proposer un nouveau cadre de navigation, permettant de choisir dynamiquement l’environnement qui convient au mieux à l’utilisateur (parmi ceux existants), tout en réutilisant le paradigme de navigation hypermédia.

Définition de l'hyper-accès

Un hyper-accès est un ensemble de représentations et d'interactions permettant un accès générique non-séquentiel pertinent à toute information, non limité aux hypermédias. Un environnement sera dit d’hyper-accès s’il permet de détourner la navigation initiale des données vers une navigation pertinente et semi-automatique, caractéristique des environnements hypermédias.

Critères d'hyper-accès

Trois critères semblent émerger afin de caractériser un environnement d'hyper-accès : l’interactivité, l’atemporalité et la réactivité. Ces critères servent à définir a posteriori si un environnement est d’hyper-accès, mais peuvent également servir en amont sous forme de guides de conception d’environnements d’hyper-accès. Interactivité. L'interactivité est la capacité d'un système à laisser le choix à l'utilisateur du contenu et du rythme de la navigation. L'interactivité est dite pertinente si elle offre un choix permettant d'explorer de manière efficace un contenu (en termes de cohérence et de gain de temps). En se basant sur notre modèle de navigation, l’interactivité est caractérisée dans la phase d'extraction (plusieurs graphes de parcours des données doivent être identifiés) et de rendu (qui doit permettre une navigation semi-automatique, permettant à l’utilisateur d’accéder au point de vue souhaité sur les données.) Atemporalité. L’atemporalité d’une information est sa capacité à ne pas évoluer au fil d’un facteur temps. Dans le cas d'une vidéo, l’atemporalité est nulle (car c’est une succession d'images à un rythme particulier). Par contre les images sont atemporelles. Il existe des techniques de de-temporalisation comme l’insertion de points d'arrêt ou d’agrégations sémantiques (chapitres, séquences annotées), comme dans le cas d’hypervidéos (Aubert, 2005). La temporalité peut cependant être intégrée dans la représentation de manière visuelle (couleurs, distances sur une carte, ..) même si elle n’intervient plus dans le défilement automatique des données. Réactivité. La réactivité est le temps de réponse du système suite à une interaction. Une forte réactivité est nécessaire car le processus de navigation est actif, c'est à dire que l'utilisateur effectue une réflexion en parallèle à l'utilisation du système. Cependant, tant que ce processus de réflexion n'est pas engagé, il peut y avoir au début une longue période de genèse de l'univers (phases d’extraction et de sélection) des données, et ensuite le rendu sera exploré de façon semi-automatique.

Caractéristiques d’un profil d'hyper-accès

Actuellement, il existe de nombreux environnements d’accès à l’information et l’utilisateur à une capacité d’apprentissage limitée. Il est alors nécessaire de porter notre réflexion sur une stratégie conciliant les méthodes existantes afin de ne pas apporter une nouvelle surcharge d'apprentissage. Notre priorité sera donc de proposer un environnement adapté aux connaissances déjà acquises par l’utilisateur (métaphores, sémiologie graphique, formes connues, ..). L'adaptation à l'utilisateur des hypermédias a déjà fait l'objet de travaux (Brusilovsky, 1996) qui prennent en compte les caractéristiques de l'utilisateur de manière initiale et progressive. Notre approche se situe dans la continuité, mais nous estimons que les diverses caractéristiques (culturelles, connaissances, ..) sont préalablement capitalisées dans les environnements et dispositifs d'accès à l'information. Ces derniers sont acquis et sont maîtrisés par l'utilisateur. Dès lors, toute la difficulté réside dans la coordination de l'environnement numérique existant, à savoir le choix ou la combinaison de logiciels et de matériels déjà disponibles. Pour cela il est nécessaire de caractériser d'un côté tous les environnements et d'un autre côté l'utilisateur en fonction des critères précédents (interactivité, atemporalité, réactivité). Ces derniers constituent donc les éléments de base d’un profil d'hyper-accès. Un hyper-accès sera dit pertinent si la distance entre le profil utilisateur et les caractéristiques de l'environnement d'hyper-accès est minimale.

Figure 3. A gauche Google Earth et à droite un navigateur Web ordinaire. Un contenu non-hypermédia identique (arborescence d'images) y a été inséré. La navigation s’effectue par simple clic à l’aide métadonnées, ce qui les transforme en environnements d’hyper-accès.

Exemples d'hyper-accès

Nous souhaitons désormais identifier des environnements d'hyper-accès existants. Certains sont originellement d'hyper-accès (exemple: le navigateur web) mais restreints à certains types de données (pages HTML). Ils peuvent devenir réellement d’hyper accès à quelques extraction/disposition/rendu de données près.

La métaphore du globe terrestre comme environnement d’hyper-accès

Le globe terrestre constitue une connaissance culturelle et scientifique commune. En effet, sont acquises les règles physiques qui le régissent (lois mécaniques) et la manipulation d’un globe miniature (où l'on peut varier la distance de visualisation). Ainsi la métaphore du globe terrestre (connaissance acquise par l'être humain et réutilisée dans la conception d'un système (Blackwell, 2006)) est universellement connue et un logiciel qui l'intègre comme Google Earth[1] ne nécessite aucun apprentissage particulier. Google Earth est un environnement d’hyper-accès dès lors qu'il ne se limite pas uniquement à de l’information à caractère géographique. Pour cela nous avons inclus dans Google Earth un contenu totalement distinct de celui initial. Il s'agit de la représentation visuelle de catégories contenant des images sous forme d'arbres planaires (Figure 3). L'accès aux données s’effectue en trois étapes de parcours utilisateur que sont la vue globale, le zoom et la vue détaillée. Google Earth est ainsi un environnement d'hyper-accès de part sa forte interactivité (un clic permet le déplacement semi-automatique de la vue virtuelle sur une nouvelle vue), l’atemporalité des données (disposées sous forme de cartes statiques) et la forte réactivité (c'est une application locale qui inclue un rendu effectué sur un serveur distant (et qui a généré la représentation visuelle d'un graphe avec 10 568 sommets en 116s, avec la librairie TULIP (Adai, 2004) sur une machine ordinaire)). Ainsi, bien que les données (base d’images) ne soient pas initialement des hypermédias, il a été possible d’extraire et réutiliser des informations intrinsèques aux données pour effectuer une exploration non-séquentielle.

D’un non hyper-accès à un hyper-accès

Un film est un ensemble de vues mémorisées et coordonnées sur un univers de données (le monde réel). Il peut être projeté au cinéma ou diffusé à la télévision, à savoir un cadre de diffusion temporel, non-interactif, qui n'est pas un hyper-accès. Cependant, dans le cadre d'une diffusion sous forme de DVD, un film devient une hypervidéo et possède de nombreuses vues qui permettent un accès non-séquentiel : l’environnement devient interactif grâce aux chapitres du DVD, atemporel avec le contrôle du temps via la télécommande, et réactif avec un système électronique performant. Cela va dans le sens d’initiatives telles qu’Advene (Aubert, 2005) qui permet d’accéder d’une manière plus fine à des vidéos et d’augmenter les capacités d’analyse de l’utilisateur. La représentation de toute forme d’information au moyen de cette application la transformera en un environnement d’hyper-accès.

Conclusion

Dans cet article nous avons proposé la notion d'hyper-accès, dont l’objectif est de permettre un accès générique non-séquentiel pertinent à toute forme d'information, non limité aux hypermédias. Nous avons également proposé un modèle de navigation à partir duquel nous avons identifié trois critères permettant de caractériser un environnement d’hyper-accès. Ces critères forment un profil utilisateur d’hyper-accès, afin de réutiliser le capital apprentissage de ce dernier. Nous avons également montré au moyen d’un exemple qu’il était possible de faire émerger de nouveaux usages innovants, et ainsi de prolonger le cycle de vie de logiciels en détournant leur usage initial. Nos principales perspectives de travail sont la caractérisation de nouveaux environnements sous le label d’hyper-accès et l’identification de profils types d’hyper-accès à l’aide de tests d’usage.

Remerciements

Cette recherche a été partiellement soutenue par le Ministère délégué à la Recherche et aux Nouvelles Technologies, dans le programme ACI Masse de Données, projet MD-33[2].

Bibliographie

[Adai, 2004] Adai A.T., Date S.V. et Marcotte E.M., « LGL : creating a map of protein function with an algorithm for visualizing very large biological networks », J Mol Biol, vol. 340, n° 1, p. 179-190, June, 2004.

[Aubert, 2005] Aubert O. et Prié Y., « Des hypervidéos pour créer et échanger des analyses de documents audiovisuels », H2PTM’05 : Hypermedia, Hypertexts, products, tools and methods, dec, 2005.

[Blackwell, 2006] Blackwell A.F., « The reification of metaphor as a design tool », ACM Trans. Comput.-Hum. Interact., vol. 13, n° 4, p. 490-530, 2006.

[Brusilovsky, 1996] Brusilovsky P., « Methods and Techniques of Adaptive Hypermedia », User Modeling and User-Adapted Interaction, vol. 6, n° 2-3, p. 87-129, 1996.

[Chen, 2000] Chen C., « Visualising Information : A Mosaic of Perspectives », VISUAL, p. 120-126, 2000.

[Chi, 2000] Chi E.H., « A Taxonomy of Visualization Techniques Using the Data State Reference Model », INFOVIS, p. 69-76, 2000.

[Grosky, 2000] Grosky W.I. et Stanchev P.L., « An Image Data Model », VISUAL ’00 : Proceedings of the 4th International Conference on Advances in Visual Information Systems, Springer-Verlag, London, UK, p. 14-25, 2000.

[Halasz, 1994] Halasz F. et Schwartz M., « The Dexter hypertext reference model », Communications of the ACM, vol. 37, n° 2, p. 30-39, 1994.

[McLuhan, 1964] McLuhan M., « Understanding Media : The Extensions of Man », McGraw Hill, New York, USA, 1964.

[Shneiderman, 1996] Shneiderman B., « The Eyes Have It : A Task by Data Type Taxonomy for Information Visualizations », VL ’96 : Proceedings of the 1996 IEEE Symposium on Visual Languages, IEEE Computer Society, Washington, DC, USA, p. 336, 1996.

[Van Dam, 1997] Van Dam A., « Post-WIMP User Interfaces », Communications of the ACM, vol. 40, n° 2, p. 63-67, 1997.

[Vuillemot, 2006] Vuillemot R., « Modèles de navigation dans de grands corpus de documents : décomposition, classification et personnalisation », IC2006 : 17e journées francophones d’Ingénierie des connaissances, Nantes, France. Session poster, 28-30 juin, 2006.

Notes