CIDE (2011) Mojahid(1)

Un modèle d’architecture de pages web pour une accessibilité augmentée destinée aux non-voyants

titre: Un modèle d’architecture de pages web pour une accessibilité augmentée destinée aux non-voyants
auteurs: Mustapha Mojahid, Bou Issa Youssef, Bernard Oriola et Nadine Vigouroux.
Affiliations: (1):Institut de Recherche en Informatique de Toulouse, Equipe Elipse.; (2):Etude de L’Interaction Personne Système.; (1):Université Paul Sabatier, Toulouse, France .
In: CIDE.14 (Rabat), 2011
En PDF: CIDE (2011) Mojahid(1).pdf
Mots-clés: Non-voyant, accessibilité augmentée, architecture textuelle, relations rhétoriques, image de page.

Sommaire

1 Introduction
2 Contexte
3 État de l’art
4 Le modèle MAP-RDF
5 Système de gestion des informations visuelles en vue de les rendre accessibles : vers un nouveau standard d’accessibilité
- 5.1 Module d’annotation
- 5.2 Module de génération
6 Résultats préliminaires
7 Conclusion et perspectives
8 Bibliographie
9 Notes

Introduction

La contribution de cet article se situe dans le cadre de l’amélioration de l’accessibilité à l’information visuelle des pages web pour les non voyants. Nous proposons un modèle qui prend en compte les informations visuelles qui restent cachées aux non-voyants telles que l’organisation globale (du « first glance » au « first touch ») de la page, certaines propriétés visuelles d’objets constituant la page web et certaines relations entre ces objets. Ce modèle se base fondamentalement sur : d’une part le concept des Images de Pages (IdP) (Luc, Mojahid et Virbel 2001, Mojahid 2011) et sur le modèle d’architecture textuelle (MAT) (Vibel 1988, Pascual 1991) où un objet textuel ou une relation peuvent être décrit par un méta-discours ou un ensemble de méta-phrases vérifiant un ensemble de règles ; et d’autre part, sur le modèle RDF (Resource Description Framework) (RDF-Schema, 2004) développé par le World Wide Web Consortium (W3C). Notre modèle, que nous appelons MAP-RDF (modèle d’architecture des pages web) permet de produire une image tactile de la page web à partir des métas-données des éléments visuels constituant la page.

Nous présentons d’abord le contexte et les problèmes qui se posent à un non voyant lorsqu’il souhaite consulter une page web (section 2) et nous dressons un état de l’art des recherches dans ce domaine (section 3). Nous présentons ensuite notre modèle MAP-RDF (section 4) et nous finirons par l’évaluation (section 5) du système GIVRA (Gestion des Informations Visuelles des pages web en vue de les Rendre Accessibles) (section 4) développé sur la base de ce modèle.

Contexte

L’organisation mondiale de la santé (OMS) estimait en 2003 à 180 millions le nombre de personnes atteintes d’incapacités visuelles, dont 40 à 45 millions sont non-voyants. Plus récemment, en mai 2009, les chiffres étaient de l’ordre de 314 millions de personnes souffrantes de déficiences visuelles dont 45 millions de non-voyants. Ces chiffres pourraient doubler d’ici 2020, en raison notamment de l’accroissement démographique et du vieillissement des populations.

Les interfaces classiques actuelles utilisant les écrans graphiques et la souris posent de sérieux problèmes contrairement aux outils de la génération d’avant où toute interaction s’effectuait avec un écran en mode texte et un clavier. Les solutions apportées consistent à transformer une information en mode graphique en un texte lu par une synthèse vocale ou affiché en braille, en prélevant à la source les informations en mode texte. Quant à la souris, on a compensé son utilisation par le clavier. Cela résout partiellement les problèmes posés puisqu’il arrive souvent que les consignes de rédaction formulées par le W3C ne soient pas suivies. Aussi, remplacer la souris par le clavier rend l’interaction difficile puisqu’il faut augmenter le langage de commande, ce qui provoque une grande charge cognitive vis-à-vis des traitements supplémentaires occasionnés.

Pour illustrer les problèmes de navigation rencontrés par un non-voyant, voici une liste non exhaustive :

les graphiques sans proposition d’alternative textuelle (un drapeau indiquant le choix de la langue pour un site ou un texte en image à recopier dans une boîte d’édition pour sécuriser l’accès à une page ou l’achat en ligne),
l’ouverture de nouvelles fenêtres lorsque l’on clique sur un lien, les pages qui se rafraîchissent régulièrement, l’utilisation de flash, les bandes sonores qui tournent en boucle sur un site et couvrant le son de la synthèse vocale,
les claviers logiciels,
les mises en évidences (couleur, gras, encadrement...),
les structures spatiales des pages composées de plusieurs objets et linéarisées pour une possible oralisation pour un non voyant,
le repérage des informations.

Les outils actuels (voir section 2) ont montré leur limite pour résoudre ces problèmes. Nous montrerons à l’aide de l’exemple suivant (site de Biarritz) que malgré les normes proposées par le W3C, la plupart de ces problèmes persistent et restent sans solution.

Pour vérifier l’accessibilité de ces sites, nous avons utilisé l’outil Wave de Webaim (Wave, 2010). Il s’agit d’un outil gratuit, permettant l’évaluation de l’accessibilité d’une page web. Wave aide à évaluer une page web, en se référant aux recommandations des WCAG et de la section 508 (Etats- unis) en indiquant s’il y a une erreur, sans toutefois pouvoir vérifier automatiquement l’accessibilité. À titre d’exemple, Wave ne peut pas dire si l’alternative textuelle est appropriée, il se contente de pointer son absence. En passant au test la page d’accueil, l’outil Wave a détecté 46 erreurs et alertes d’accessibilité. Nous avons constaté que parmi toutes ces erreurs signalées, aucune indication n’est mentionnée sur l’accessibilité de l’organisation spatiale de la page et les possibles relations entre les différents objets textuels ou non textuels de la page. L’accès à ce deuxième niveau, appelé accessibilité augmentée est validé par une expérimentation (voir section 6). Par ailleurs, l’observation des indices non captés nous a amené à étudier un corpus plus large (voir section 3) pour définir les objets visuels et les relations à modéliser et à intégrer dans notre modèle. Dans cet article, nous proposons un modèle et un outil qui fournissent des éléments de réponse aux problèmes correspondant à l’accessibilité augmentée apportée par les structures spatiales de la page. Une de nos hypothèses générales est de considérer que ces structures vont faciliter (voire permettre) le repérage des informations dans une page web.

Dans la section suivante, nous dressons un état de l’art des travaux qui ont oeuvré dans la thématique de l’accessibilité.

État de l’art

Dans cette section, nous présentons quelques travaux qui traitent l’accessibilité à l’information visuelle notamment liée à la structure de la page web et au contenu informationnel organisé visuellement.

Accessibilité des tableaux de données

Oogane & Asakawa (1998) ont proposé une méthode de conversion de représentations visuelles, et particulièrement les tableaux, en des représentations non visuelles.

Leur méthode traite de la représentation des tableaux à deux dimensions, mais ne convient pas pour les tableaux non cartésiens qui ont une représentation différente comportant par exemple des cellules fusionnées.

Dans le même contexte, Filepp et al. (2001) ont proposé le TTPML (Table To Prose Markup Language), un langage de balises compatible avec XML. Ce langage facilite la génération des descriptions discursives des tableaux HTML. La méthode consiste à transformer les données dans un tableau en des phrases explicitant les relations entre les lignes et les colonnes. Cette opération de transformation est réalisée en associant des règles de transformation des tableaux pour permettre aux lecteurs d’écrans de lire correctement les éléments du tableau.

Accessibilité des documents de présentation

Ishihara et al. (2006) ont travaillé sur l’accessibilité des diagrammes dans les documents de présentation. Un diagramme est formé d’objets ou de groupes d’objets qui sont visuellement reliés par des flèches. Les auteurs ont alors proposé une méthode pour créer un modèle de description concernant trois types de relations entre les objets : un objet visuellement inclus dans un autre ; plusieurs objets localisés et alignés par rapport aux autres objets de la même diapositive ; et un objet ou un groupe d’objets lié à un autre par une flèche.

En appliquant ce modèle aux différents objets et relations détectés, la méthode consiste à transformer le document en une organisation arborescente qui contient la structure visuelle du document et l’ordre d’apparition des objets. Cette méthode a été ainsi implémentée en développant DocExplorer qui permet de naviguer entre les différents objets et relations.

Accessibilité de la structure visuelle d’une page web

Asakawa et al. (2000) ont travaillé sur l’accessibilité de la structure de la page aux non voyants. Ils ont proposé un système de transformation basé sur l’annotation de la structure afin de distinguer les groupements visuels d’une page. Ces groupements ayant différents rôles (menu principal, sous-menu, publicité, liens) sont souvent identifiables par des indices visuels (couleur, forme, disposition des éléments). La séquence de balises HTML cependant lue par les lecteurs d’écrans ne reflète pas cette structure et n’explicite pas les relations liant les objets.

Dans leur système, les auteurs distinguent deux annotations : celle de la structure et celle du contenu textuel. Les annotations de la structure sont utilisées pour reconnaître les groupements visuellement fragmentés, et par conséquent pour montrer l’importance sémantique de chaque groupe. Les annotations du contenu textuel ont pour rôle de décrire les objets multimédias inaccessibles par le non-voyant. Le système produit une page reformulée, indiquant la réorganisation des groupes suivant leur rôle et leur importance. De son côté, le W3C par le biais de sa plate-forme ARIA (Accessible Rich Internet Applications) aborde le problème de l’accessibilité au contenu dynamique en utilisant le contenu des balises. Il fournit une méthode standard pour l’attribution de rôles et des états des éléments DHTML, et pour décrire la mise à jour de ces éléments dynamiques.

Ainsi, le non voyant dispose des descriptions textuelles concernant la composition de la page, mais il ne dispose toujours pas d’une représentation réelle bidimensionnelle de la page.

Pour sa part, IBM Accessibility (2009) a proposé une réorganisation de la page suivant les différents groupements et leurs rôles. Ceci altère la structure initiale de la page, et produit une structure modifiée qui reste toutefois non bidimensionnelle.

Comme on l’a vu, aucun des travaux pré-cités ne permet réellement à un déficient visuel d’appréhender la structure d’une page Web dans sa globalité par le concept du « premier toucher ». C’est pourquoi nous proposons donc notre modèle MAP-RDF, que nous allons décrire dans la section suivante.

Le modèle MAP-RDF

Pour élaborer notre modèle, nous avons commencé par analyser un corpus de pages web afin d’identifier les indices, les objets et relations qui posent problème aux non-voyants malgré le respect des directives du W3C. Dans cette étude, nous nous intéressons particulièrement à l’accessibilité des indices visuels indispensables à la compréhension de la structure de la page.

Nous avons choisi d’analyser des sites web touristiques^[1]. Ce choix est justifié d’une part, par la loi européenne qui consiste à rendre tous les sites officiels publics de l’Union Européenne accessibles par tous les internautes, sans discrimination, en suivant les recommandations. D’autre part, le choix des sites web correspondait à celui d’une étude psycholinguistique (Etcheverry, I. 2007 ; Etcheverry, I. Terrier, P. Marquie, J.C. 2007) qui a porté sur les difficultés de localisation visuelle et les exigences cognitives dans la recherche des informations dans une page web. Les critères du choix de ces sites web répondent ainsi aux exigences suivantes. Les pages doivent constituer un corpus homogène et comparable en termes de quantité de données textuelles et de graphiques et traiter les mêmes types de contenus d’information.

Ces sites web déclarent qu’ils respectent les règles du W3C conformément aux lois européennes. À titre d’exemple, le site web de la Grande Bretagne dédie une page à l’accessibilité^[2]. Ils déclarent que le site est développé « afin de servir un public aussi large que possible », en apportant « une attention toute particulière aux besoins des moins valides, en créant un site compatible aux programmes spécifiques qui leur sont destinés ». Le site se dit conforme à la « Web Accessibility Initiative » du « World Wide Web Consortium », et dit respecter les standards définis par les « UK Government Web Accessibility Guidelines ».

Nous avons analysé un corpus de huit sites web touristiques de pays ou de villes européennes : nicetourisme.com ; biarritz.fr ; parisinfo.com ; bordeaux-tourisme.com ; allemagne-tourisme.com ; visitbritain.fr ; visitportugal.com ; holland.com/fr.

Une évaluation avec l’outil Wave a été réalisée sur les 8 sites. Nous avons rejeté le site web de Bordeaux parce que nous avons constaté que sa page d’accueil est constituée d’objets flash avec animation audio-visuelle qui n’est pas accessible.

Cette évaluation a permis de vérifier que le corpus des sites web choisi est conforme aux normes Content Accessibility Guideline (WCAG) ; cela représente le point de départ pour tester le deuxième niveau d’accessibilité : celui de l’accessibilité augmentée. Les mêmes sites touristiques ont été consultés par des non-voyants avec le lecteur d’écran Jaws^[3]. Cette consultation a pour but d’identifier les objets visuels et les relations visuelles non pris en compte par Jaws.

D’une façon générale, Jaws, comme tous les lecteurs d’écran, lit linéairement le contenu textuel et ne fournit pas d’information concernant la disposition et l’emplacement des objets dans la page web. Cependant Jaws fournit à la demande, les couleurs des caractères, les couleurs de fond et le contraste entre les couleurs, les propriétés typographiques d’italique, de gras et de soulignement sous forme textuelle et par conséquent, cette restitution orale entraîne une énorme surcharge cognitive pour le non-voyant.

Dans notre observation des sites web, nous avons pu identifier les groupements d’objets visuels constitués par des « menus », « rubriques », « bandeaux », « agendas » et « formulaires ». Ces groupements visuels sont formés à partir d’objets visuels élémentaires possédant des propriétés visuelles ou discursives et permettant de les identifier isolément. Nous détaillons aux paragraphes suivants les caractéristiques des différents objets visuels et nous donnons l’exemple du groupement visuel, le menu.

Les objets visuels

Il s’agit essentiellement des :

blocs de texte : segments de texte constitués d’un ou de plusieurs mots, formant une ou plusieurs lignes avec les mêmes propriétés typographiques homogènes (police, graisse, italique, souligné, couleur de caractère et de fond) ;
titres : unités lexicales identifiées par des indices discursifs et des marqueurs organisationnels, par exemple la numérotation, ou « info plage, météo, culture, que faire, où se loger, et des indices dispositionnels, par exemple, les espaces avant, après à gauche et à droite (Virbel et al. 2005 ; Ho-Dac et al. 2010) ;
liens hypertextes : éléments (textuels ou graphiques) de la page web identifiés à partir des balises HTML. Ils sont différentiés visuellement par un habillage de texte et avec un lexique spécifique, par exemple, lire la suite, +Infos, > en savoir plus ;
images : elles peuvent avoir plusieurs rôles : images de fond, images- liens, logos, images informationnelles du contenu. Elles se caractérisent notamment par leurs dimensions, leurs formes et leurs couleurs ;
Champs d’entrée : il peut s’agir d’un champ à remplir dans un formulaire ou une zone de recherche, ou encore un bouton. Les champs d’entrée sont identifiés à partir des balises HTML et généralement, ils sont différentiés visuellement par des cadres et des habillages visuels spécifiques selon les fonctions.

L’ensemble de ces objets visuels forment des groupements visuels. Pour nous aider à définir et caractériser ces groupements, nous avons repris d’une part, les deux principes fondamentaux du modèle d’architecture textuel (Virbel 1989, Pascual 1991) concernant le principe de ressemblance et de différence et celui des équivalences de formulations discursives développées et à réalisation réduite et des lois de la théorie de la Gestalt (Guillaume 1937). Ces groupes d’objets dénotent et sont la manifestation de relations contextuelles intra ou inter objets visuels que nous nous allons illustrer.

A l’état actuel de ce travail (Bou Issa 2010), nous avons exploré les groupements visuels constitués par les différents menus, les rubriques et les bandeaux. Dans cet article, nous focaliserons la présentation sur les menus. Nous en donnons une définition, que nous avons pu dégager par l’étude du corpus et nous illustrons quelques problèmes liés à l’accessibilité de ces groupements et leurs relations par le non-voyant.

Les Groupement visuel : l’exemple du menu

Nous définissons un menu par un ensemble d’objets élémentaires liens hypertextes, groupés visuellement par une même typographie et qui sont adjacents. Les liens hypertextes des menus sont formés à partir d’un groupe de mots ou d’images labellisées formant une structure énumérative fonctionnellement parallèle (Luc 2001 ; Virbel et al. 2005 ; Ho-Dac et al. 2010).

Il peut s’agir en particulier du menu principal de la page, d’un sous-menu ou d’un menu secondaire. Dans le cas du menu principal, il est disposé horizontalement, dans la première moitié de la page et occupant une largeur supérieure à 50% de la largeur de la page. Si deux menus sont disposés horizontalement et que chaque menu occupe plus de 50% de la largeur de la première moitié de la page alors les attributs typographiques de saillance comme la différence de gras et la taille des caractères ou bien le gras et la couleur de fond du menu permet de caractériser le menu principal mis en saillance.

Problèmes liés à l’accessibilité aux menus

L’exemple du site d’Allemagne illustre les problèmes rencontrés dans la plupart des sites du corpus. Le menu principal est formé d’items disposés horizontalement dont la couleur du fond est la même, mais le côté inférieur du lien a une couleur différente des autres. C’est cette même couleur, mais avec un contraste plus faible, qui indique que le curseur est placé sur une case donnée. Cette même couleur est reprise dans le sous-menu qui contient trois niveaux de bleu différents et l’arborescence est réalisée par des effets de contraste de couleur, d’indentation et de soulignement vertical, effets qui ne sont également pas perçus par un lecteur d’écran.

Figure 1. Menu principal et sous-menu du site de l’Allemagne

Relations entre les groupements visuels=

Les groupements visuels peuvent être associés entre eux et entretenir des relations non perceptibles par un non-voyant. Ces relations complètent les éléments de l’accessibilité augmentée pour capter la structure d’une page web. Nous avons donc observé particulièrement deux types de relations : les relations de nature visuelle, et les relations contextuelles en rapport avec le contexte/les thèmes du site web.

Les relations visuelles

Deux types de relations visuelles ont été distinguées. Les relations géométriques ou spatiales sont définies par le voisinage entre objets (à gauche, à droite, en haut, en bas, symétrie) et les relations typographiques de ressemblance/différence fournies par les propriétés de la couleur, le style de police, ou la couleur de fond.

Les relations contextuelles

Ces relations concernent l’environnement, les circonstances, ou les développements qui précisent le contenu des groupements visuels. Nous distinguons deux types de relations contextuelles : les relations thématiques associées à un champ lexical commun donné par leurs titres. Il s’agit des groupements qui se rapportent à un même thème ou illustrent un même sujet. Par exemple les rubriques « Guide de voyage » et « Réservation d’hôtel » se rapportent au thème du voyage. Les relations de développement associent un objet et un groupement le détaillant, l’exemplifiant… Par exemple « où aller » du menu principal est détaillé dans la rubrique informationnelle dont le titre est « où aller ». Une relation contextuelle « détail » est donc dénotée entre les deux groupements visuels en question. Après cette phase d’analyse du corpus, nous avons élaboré le langage de formalisation des objets visuels élémentaires des groupements visuels et des relations. L’objectif est de préparer les données pour produire ensuite une présentation dans la modalité tactile.

Le langage MAP-RDF

Plusieurs modèles et théories nous ont servi : (1) le Modèle d’Architecture Textuelle développé par Virbel (1989) et Pascual (1991) pour représenter la dimension visuelle du texte et les équivalents langagiers des phénomènes textuels (métalangage) ; (2) la théorie des structures rhétoriques (RST) développée par Mann et Thomson (1981) pour représenter les relations rhétoriques entre les différents objets de la page ; (3) le modèle des Images de Page (IdP) développé par Luc et al. (2001), pour « matérialiser » visuellement les représentations architecturale et rhétorique obtenues grâce et à la RST et au modèle MAT. L’IdP est basée sur un langage notationnel s’inspirant de la théorie de notation de Goodman (Goodman 1990).

Les principaux avantages du modèle IdP se résument par : son expressivité : représentation facile et compréhensible des propriétés visuelles du texte ; - sa représentation bidimensionnelle des phénomènes textuels pour permettre une vue globale de la structure du texte ; - la possibilité de fournir des descriptions selon plusieurs niveaux de granularité. Étant donné le volume important et hétérogène d’informations contenues dans une page web (objets visuels, groupement et relations), le langage des images de page nous donne un outil efficace pour répartir ces informations dans plusieurs niveaux d’image de page selon des critères liés aux différents processus/métaphores de lecture (en diagonale, approfondie, recherche d’information…). Pour définir une stratégie d’affectation des objets/relations prélevés dans le corpus, nous avons réalisé une enquête auprès de 12 experts concepteurs de sites. Pour chacun des objets du corpus, les sujets devaient proposer une note de 0 à 10 évaluant selon eux, les degrés d’importance. Les résultats de l’enquête nous a amené à diviser l’affichage pour les non- voyants en trois niveaux, nous donnerons un exemple à la fin de cette section : - le niveau I (notes  6) contiendra les menus et leurs rôles ; les rubriques et leurs rôles ; le bandeau, son caractère visuel, formes visuelles des objets ; - le niveau II (4  notes  6) contiendra en plus des informations du niveau I, le caractère visuel des menus ; le caractère descendance des menus ; le caractère visuel du bandeau ; le caractère visuel des rubriques ; les titres des rubriques ; les relations contextuelles entre ces groupements. - le niveau III (notes  4) contiendra en plus des informations précédentes la disposition interne des groupements visuels ; les styles et les polices de caractères avec et sans effet souris ; la couleur principale des groupements. Nous avons également fait appel (4) au modèle RDF34 (Resource Description Framework) qui permet de décrire les propriétés des pages web. Les avantages de ce modèle se résument par : la possibilité de créer nos propres ontologies pour décrire les métadonnées de la page web ; la facilité de son implémentation ; et la compatibilité avec les navigateurs. Dans le modèle MAP-RDF, la page web est structurée suivant un ensemble de triplets : 1. le sujet ou la ressource : qui peut être un groupement visuel ou une relation entre deux groupements ;

34 Resource Description Framework (RDF) est un modèle de graphe destiné à décrire de façon formelle les ressources Web et leurs méta-données, de façon à permettre le traitement automatique de telles descriptions. Développé par le W3C, RDF est le langage de base du web sémantique. Une des syntaxes de ce langage est RDF/XML.

2. le prédicat : qui représente l’ensemble des propriétés visuelles et lexicales applicables à cette ressource. Nous distinguons trois types de prédicats : de mise en forme, de caractérisation et de présentation ; 3. l’objet : qui correspond à la valeur du prédicat concerné.

Les ressources « groupements visuels »

Dans le cadre de cet article, nous nous focalisons sur le cas des menus. Le lecteur se rapportera à (Bou Issa 2010) pour les rubriques et les bandeaux. Plusieurs prédicats sont nécessaires pour une modélisation complète, Nous citons quelques exemples : Prédicat de caractérisation : Caractère : {déroulant ; fixe} ; Rôle : {menu principal ; menu secondaire} Descendance : {menu ; sous-menu} ; Type des liens : {texte, texte imagé, image labellisé} Prédicat de mise en forme : Couleur originale du texte ; lors événement souris et après visite : {RGB} Couleur du texte du fond, avec événement souris : {RGB} Dimensions : {Dimension} ; Coordonnées : Abscisse Ordonnée Prédicats de présentation : Niveau d’affichage : {niveaux de granularité des IdP}. Pertinence : pour associer un degré d’importance dans la page. Modalité de sortie : dans cette version la seule modalité est tactile (voir perspective). Selon le même schéma, nous avons défini les ressources « relation ».

Génération de la présentation tactile à partir du modèle MAP-RDF Image de page web tactile

La perception visuelle est complètement différente de la perception tactile (Bingham et al. 2007). Il est nécessaire de retoucher les représentations visuelles afin de les reproduire en tactile. Nous nous référons aux travaux de (Socrate-Comenius, Project, 1999-2000) sur les consignes à suivre lors de la production d’un document tactile. Voici deux extraits à propos des distances minimales et des reliefs et perçues par le non-voyant.

Figure 2. Motif et profil caractéristique d’un trait en relief emprunté à Socrate-Comenius, Project, 1999- 2000

En tenant compte de ces consignes sur les limitations du tactile, nous avons conçu des symboles pour représenter les triplets de notre modèle MAT-RDF, par exemple (Figure 4) :

Figure 3. Exemples de symboles associés aux groupements visuels et aux relations

Pour illustrer une instanciation du modèle MAP-RDF, voici la représentation tactile de l’exemple du niveaux 1 de l’IdP de la page d’accueil du site d’Allemagne telle qu’elle est imprimée puis passée dans un four thermogonflable de type « ZY-Fuse » pour avoir une reproduction tactile de la page.

Figure 4. Premier niveau d’affichage d’une Image de Page Web et sa légende

Système de gestion des informations visuelles en vue de les rendre accessibles : vers un nouveau standard d’accessibilité

Le système de Gestion des Informations Visuelles des pages web en vue de les Rendre Accessibles (GIVRA) permet : d’annoter par des concepteurs web, les pages selon le modèle MAP- RDF ; de fournir et générer aux utilisateurs non voyants une interface de lecture des images de pages. Tout d’abord, le système extrait automatiquement certaines propriétés des groupements telles que leurs coordonnées, les dimensions et les propriétés de typographie. Ensuite, cette extraction automatique est complétée par une annotation manuelle selon la description du modèle MAP-RDF (voir section 3.). Le système pourra ainsi fournir une reformulation de ces propriétés selon les trois niveaux d’affichage défini par le modèle MAP-RDF.

Module d’annotation

Ce module propose au concepteur web d’annoter une page web en la décomposant selon les groupements visuels, en utilisant une interface graphique (figure 5). Cette interface propose les fonctionnalités nécessaires pour ajouter des objets, des groupements d’objets ainsi que leurs propriétés et les relations qui les relient.

Figure 5. Interface graphique du module d’annotation du système GIVRA

Module de génération

Une fois annoté les groupements et les relations dans une page web, le module de génération se charge de la transformation dans la modalité tactile. Cette opération est réalisée en plusieurs étapes :

la récupération des symboles visuels de la base des symboles développés sous Visio (voir 3.4.2).
l’arrangement des symboles et la génération de l’Image de Page correspondante à la page analysée, selon le niveau de granularité souhaité, en suivant les règles que nous avons défini dans le modèle (figure 3).
l’impression : l’image de page ainsi produite sera imprimée, puis passée dans un four du type « ZY-Fuse » pour avoir une reproduction tactile de la page.

Résultats préliminaires

Nous avons réalisé une expérience pour tester les productions tactiles des images de page auprès de six personnes non-voyantes. Tous les sujets utilisent régulièrement Internet pour des tâches quotidiennes (courriels, achats en ligne, consultation de factures…).

La première étape a consisté en une phase d’apprentissage du langage des éléments des images de pages afin de s’approprier les représentations tactiles associées. Aucun des sujets n’avait de mal à comprendre et à mémoriser les symboles proposés.

Nous avons cherché ensuite à tester quatre hypothèses qui avancent l’intérêt des IdP pour l’accès aux groupements visuels de la page ; aux propriétés visuelles des constituants de la page ; aux relations visuelles et contextuelles entre les constituants de la page ; et enfin pour l’accès global et non seulement séquentiel à la page. Les résultats obtenus nous permettent de valider toutes nos hypothèses (Bou Issa 2011). Les utilisateurs ont globalement bien perçu le rôle, le titre quand il y en avait un, et la position de chaque groupement dans la page.

Pour finir, l’enquête de satisfaction auprès des utilisateurs nous a montré qu’ils accueilleraient très favorablement un tel dispositif s’il était disponible.

Conclusion et perspectives

Nous avons montré dans cet article, que même si un site web respecte les normes d’accessibilité définies par le W3C, il reste un niveau inaccessible pour les non-voyants qui comprend toutes les informations visuelles des pages web, y compris la structure globale et les relations entre les objets et les groupements visuels. Des tests préliminaires et une étude d’un corpus de pages web nous a permis de cerner les problèmes posés aux non-voyants et les éléments à prendre en compte. Nous avons ensuite proposé un modèle d’architecture de page web qui améliore l’accessibilité à ces informations et nous l’avons illustré sur l’exemple des menus. Pour mener à bien ce travail, nous nous sommes appuyés sur les modèles d’architecture textuelle des images de pages et sur les théories notationnelles et des structures rhétoriques. Le modèle RDF a été utilisé pour formaliser le langage de représentation sous forme de triplets ressource-prédicat-valeur. Nous avons présenté l’architecture générale du système de gestion des informations visuelles qui permet aux concepteurs d’annoter les pages web et de générer automatiquement une sortie tactile. Cette production tactile est structurée sous forme d’images de pages selon trois niveaux de granularité identifiés expérimentalement et en tenant compte des règles à respecter pour les non-voyants. Nous avons pu valider notre modèle à l’aide d’une première expérience préliminaire qui a pu nous montré des résultats très prometteurs.

Nous projetons plusieurs perspectives à ce travail. Nous envisageons d’abord, de réaliser une expérience sur un plus grand nombre de sujets pour conforter nos premiers résultats. Nous examinerons un plus large corpus de sites web pour développer les concepts de groupements visuels et de relation afin de proposer un modèle encore plus représentatif de la diversité du web (formulaires, agendas, tableaux, etc.), au-delà des groupements particuliers déjà étudiés (menu, rubrique, bandeau). Nous comptons également réaliser améliorer l’outil GIVRA, notamment en ce qui concerne l’extraction automatique des propriétés visuelles et des relations dans les pages web.

Une dernière perspective à ce travail est d’étudier de nouvelles stratégies pour combiner les deux modalités tactile et orale et de réaliser l’affichage sur un écran tactile. En effet, la non-existence d’afficheur dynamique, nous a amenée à simuler une production tactile sur un papier thérmogonflable.

Bibliographie

ASAKAWA C., TAKAGI, H. (2000). Annotation-based transcoding for nonvisual web access. ASSETS’00 Proceedings of the fourth international ACM Conference on Assistive technologies (pp. 172-179). Arlington, Virginia, United States: ACM. Association Valentin Haüy. (2001). Code de Transcription en Braille des Textes Imprimés. Retrieved 9 3, 2008, from http://www.avh.asso.fr/rubriques/infos_braille/nouveau_code_braille.php

BINGHAM J., CAVENDER A., BRUDVIK J., WOBBRACK, J. (2007). A comparative analysis of blind and sighted browsing behavior. Assets’07: Proceedings of the 9th international ACM SIG ACCESS conference on Computers and Accessibility. Tempe, Arizona, USA. BOU ISSA Y. (2011) Accessibilité aux informations visuelles des pages web pour les non-voyants, thèse de l’université Paul Sabatier, Toulouse.

BOU ISSA Y., MOJAHID M., ORIOLA, B., VIGOUROUX N. (2010). Analysis and evaluation of the accessbility to visual information in web pages. ICCHP, International Conference on Computers Helping People with Special Needs. Vienna University of Technology, Austria.

CAUCHARD, F. (2008). Empan perceptif en lecture et en recherche d’information dans un texte : influence des signaux visuels. Thèse de Docotorat . Université de Toulouse II.

COLAS, S. (2008). Outils d’amélioration de l’accessibilité du web pour les personnes visuellement handicapées. Université de Tours.

ETCHEVERRY, I., TERRIER, P., & MARQUIE, J. C. (2011). Are older adults less efficient in making attributions about the origin of memories for web interaction? European Review of Applied Psychology - Special Issue on Information Searching (J. Dinet & A. Chevalier, Eds). Lorch, R. F., Jr, Lemarié, J., & Grant, R. A. (2011). Signaling Hierarchical and Sequential Organization in Expository Text. Scientific Studies of Reading.

HO-DAC, L. M., FABRE, C., PÉRY-WOODLEY, M. P., REBEYROLLE, J. On the signalling of macrodiscourse structures, 8th Multidiscplinary Approaches of Discourse - MAD2010, Moissac – France, 17-21 march 2010.

FILEPP, R., CHALLENGER, J., ROSU, D. (2001). Improving the accessibility of aurally rendered HTML tables. ASSETS’02: Proceedings of the fifth international ACM conference on Assistive technologies (pp. 9-16). Edinburgh, Scotland: ACM.

GUILLAUME, P. (1937). La psychologie de la forme. Paris, Flammarion, 1979. GOODMAN. (1990). Langages de l’Art. Trad. J. Morizot, Editions Jacqueline Chambon.

Hailpern, J., Guarino-Reid, L., Boardman, R., Annam, S. (2009). Web 2.0: blind to an accessbile new world. Proceedings of the 18th international conference on world wide web (pp. 821-830). Madrid, Spain: ACM. IBM, Human Ability and Accessibility Center. (2009). Retrieved 3 1, 2010, from Creating accessible microsoft powerpoint documents: http://www-306.ibm.com/able/guidelines/documentation/docmsppt.html.

ISHIHARA T., TAKAGI H., ITOH T., ASAKAWA C. (2006). Analyzing visual layout for a non-visual presentation-document interface. ASSETS’06: Proceedings of the 8th international ACM SIG ACCESS Conference on Computers and Accessibility (pp. 165-172). Portland, Oregon, USA: ACM.

[Luc 2001 (1)] ↑ LUC C., MOJAHID M., VIRBEL J. (2001). Système notationnel de l’architecture textuelle par image de page. Conférence Internationale sur le Document Electronique, Toulouse.

[Luc 2001 (2)] ↑ LUC C., Une typologie des énumérations basée sur les structures rhétoriques et architecturales du texte, Traitement Automatique du Langage Naturel.

MANN, W. C., THOMPSON, S. A. (1988). Rhetorical structure theory: toward a functional theory of text organization. Text , 8 (3), 243-281.

MOJAHID, M. (2011) Fondements du langage des Images de Page et sa mise à l’épreuve. 2nd International Conference on Linguistic & Psycholinguistic Approaches to Text Structuring, Louvain, Belgique.

OOGANE, T., ASAKAWA, C. (1998). An interactive method for accessing tables in HTML. ASSETS’98: Proceedings of the third international ACM conference on Assistive technologies (pp. 126-128). Marina del Rey, California, United States: ACM.

PASCUAL, E. (1991) Représentation de l’architecture textuelle et génération de textes. Thèse de l’Université Paul Sabatier, Toulouse.

RDF-Schema. (2004). RDF Schema, language for declaring basic class and types for describing the terms used in RDF. Retrieved from http://www.w3.org/TR/rdf-schema/

SOCRATE-COMENIUS, Project. (1999-2000). Recommendations for transcribing documents. Annexe technique 1. Documentation Michel Bris S.D.A.D.V. CNEFEI Suresnes.

VIRBEL J. (1989). The contribution of linguistic knowledge to the interpretation of text structures. In Structured documents (pp. 161-180). Cambridge University Press.

VIRBEL J., GARCIA-DEBANC C., BACCINO T., CARRIO L., DOMINGUEZ C., JACQUEMIN C., LUC C., MOJAHID M., PERY-WOODLEY M. P., SCHMIDS S. Approches cognitives de la spatialisation du langage. De la modélisation de structures spatiolinguistiques des textes à l’expérimentation psycholinguistique : le cas d’un objet textuel, l’énumération. Dans : Agir dans l’espace. Catherine Thinus-Blanc, Jean Bullier (Eds.), Editions de la Maison des sciences de l’homme, p. 233-254, Cognitique, 2005.

VIRBEL J., NESPOULOUS, J. L. (2004) Handicap langagier et recherches cognitives : apports mutuels. Revue parole.

WAVE : web accessibilty evaluation tool. (2010). Retrieved 8 9, 2009, from Webaim: http://wave.webaim.org

Notes

↑ Les analyses ont été effectuées courant juillet 2009.
↑ http ://www.visitbritain.fr/corporate/accessibility.aspx.
↑ Jaws (Job Access With Speech) est un lecteur d’écran : un logiciel pour les déficients visuels. Il transforme un texte affiché sur un écran en un texte oral (par un système de synthèse vocale) ou un texte enbraille, et permet d’interagir avec le systhème d’exploitation et les logiciels.

[1] Les analyses ont été effectuées courant juillet 2009.

[2] ttp ://www.visitbritain.fr/corporate/accessibility.aspx.

[3] Jaws (Job Access With Speech) est un lecteur d’écran : un logiciel pour les déficients visuels. Il transforme un texte affiché sur un écran en un texte oral (par un système de synthèse vocale) ou un texte enbraille, et permet d’interagir avec le systhème d’exploitation et les logiciels.

[1]

[2]

[3]