Du tag cloud au tag thunder : vers de nouvelles stratégies

Transcription

Du tag cloud au tag thunder : vers de nouvelles stratégies
Groupe de Recherche en Informatique, Image,
Automatique et Instrumentation de Caen
Contacts : [email protected][email protected][email protected]
CNRS – UMR
6072
Université de Caen Normandie & ENSICAEN
Du tag cloud au tag thunder : vers de nouvelles
stratégies de lecture orale pour non-voyants
PROBLEMATIQUE
La navigation visuelle sur internet permet d’accéder à la
fois à une vue précoce et globale d’une page Web
(stratégie dite d’écrémage ou skimming) puis de procéder
à une recherche active et rapide d’informations
spécifiques (stratégie dite de balayage ou scanning).
Dans les deux cas la typographie et la disposition des
éléments dans le document revêtent une importance
capitale [1] (titres, contenus proéminents, phrases
spécialement positionnées).
d’améliorer les possibilités d’accès à l’information pour
les usagers non-voyants (lecture rapide ou en diagonale).
UNE PREMIERE APPROCHE
Figure 3. Division d'une page web d'article de presse et
formation d'un tag cloud
L’idée que nous développons est de s’appuyer sur une
transposition à l’oral du concept, très présent sur le Web,
de représentation visuelle et interactive de mots-clefs : le
nuage de mot (ou tag cloud – voir Figure 2).
Figure 1. Comparaison entre le visuel d'une page web et sa
perception par un non-voyant avec les lecteurs d'écran
Figure 2. Exemple de tag cloud classique
Les usagers non-voyants n’ont que peu l’usage de cette
possibilité [2] (voir Figure 1), bien qu’ils aient développé
des stratégies palliatives telles que l’accélération du débit
de la synthèse de la parole [3], le saut de titres en titres
ou de liens hypertextes en liens hypertextes, la lecture
des premières ou dernières phrases de tous les
paragraphes. Néanmoins, la différence d’efficacité, en
comparaison avec la navigation visuelle, reste
significative [4]. Nous nous intéressons dans ce travail à
la conception de stratégies non linéaires de skimming et
de scanning adaptées à une navigation non visuelle afin
GREYC - Université de Caen, Bât. Sciences 3
Campus Côte de Nacre, CS14032
14032 CAEN cedex 5
Tél. 02 31 56 74 86 - Fax 02 31 56 73 30
Email : pré[email protected]
Si nous considérons visuellement une page Web, nous
pouvons la définir comme un ensemble de blocs. Chacun
est identifiable par un mot ou un ensemble de mots
représentants son type/structure (métadonnées) ou son
contenu (mots-clés). Si l’on efface tous les autres
éléments de la page, ces « tags » semblent inscrits
spatialement selon la position occupée par le bloc dont
ils proviennent et par l’importance typographique qui
leur est donnée. Ils forment finalement un effet visuel
proche de celui du tag cloud (Voir Figure 3). Etant
donnée la structure arborescente d’une page Web,
chacun des blocs peut récursivement contenir de
nouveaux ensembles de blocs auquel on peut appliquer
ce procédé d’extraction/effacement pour obtenir
finalement un arbre de tag clouds représentant chacun un
niveau de contenu. C’est une telle représentation de la
page
Web
que
nous
souhaitons
calculer
automatiquement.
Cette transformation d’une structure Web en une
représentation adaptée à la réalisation d’une telle version
audio, que nous dénommons « tonnerre de mots » (ou
tag thunder), devra permettre d’appréhender globalement
et précocement la structure logico-thématique de la page
et favoriser ainsi l’émergence de stratégies de scanning
non visuelles innovantes.
GREYC - ENSICAEN
6, Boulevard du Maréchal Juin –CS45053
14050 CAEN cedex 4
Tél. 02 31 45 25 04 - Fax 02 31 45 26 98
Email : pré[email protected]
Groupe de Recherche en Informatique, Image,
Automatique et Instrumentation de Caen
CNRS – UMR 6072
Université de Caen Normandie & ENSICAEN
TRAVAIL DEMANDE
Figure 1. Schéma de l'architecture logicielle
Le travail pourra s’appuyer sur les résultats de stages et
projets de recherche précédents, en particulier une
architecture logicielle (Voir Figure 4) basée sur un
plugin Firefox [5] et des algorithmes de segmentation
automatique de pages Web [6].
Deux étapes principales permettent d’envisager le
passage d’une structure visuelle Web à une structure
audio. Elles nécessitent la levée de verrous
technologiques et scientifiques originaux dans les
domaines de la Rechercher d’Information (RI), du
Traitement Automatique des Langues (TAL) ou de
l’Interaction Homme Machine (IHM) :
1.
2.
l’extraction d’expressions-clés, uniques pour
chaque bloc de document d’un niveau donné,
aura la particularité de s’appuyer sur des
mesures intégrant des aspects typographiques,
dispositionnels, hiérarchiques et thématiques
(globalement et localement). La constitution de
corpus de référence, et de nouvelles techniques
pour leur exploration, devront être adaptées à
cet objectif ;
de la même manière que les mots d’un tag cloud
sont distribués spatialement avec des effets
visuels divers (taille, couleur…), les tag thunder
distribueront les mots spatialement et
temporellement en jouant sur des effets sonores
variés (volume, débit, hauteur, genre de la voix,
fréquence de répétition, son 2D/3D). Comment
produire un effet « cocktail party » mis en
évidence dans [7] : nous sommes capables de
focaliser notre attention auditive sur un flux
verbal dans une ambiance bruyante ; mais
même si notre attention est fixée sur la parole
d’un interlocuteur, nous restons, dans une
certaine mesure, sensibles aux sons extérieurs.
Nous tiendrons compte tout au long de cette recherche
des questions générales d’interface et d’interactions
soulevées par les objectifs applicatifs : comment mettre
en place / évaluer / faire évoluer les structures et
algorithmes développés pour qu’ils soient conforment à
nos objectifs de skimming ? Quelles contraintes et
possibilités offre notre structure pour une navigation non
visuelle entre des contenus d’un même niveau
hiérarchique ou de niveaux d’imbrications différents ?
Cependant, dans le travail de cette thèse, le cœur de la
problématique abordée sera prioritairement celui évoqué
dans l’étape 1.
BIBLIOGRAPHIE
[1] Dias G., Conde B. Accessing the web on handheld devices for
visually impaired people. In K. Wegrzyn-Wolska and P.
Szczepaniak, editors, Advances in Intelligent Web Mastering,
volume 43 of Advances in Soft Computing, 2007, pages 80-86.
[2] Ahmed F., Borodin Y., Soviak A., Islam M., Ramakrishnan I.V.,
Hedgpeth T. Accessible skimming: Faster screen reading of web
pages. In UIST 2012, 2012, pages 367-378.
[3] Borodin Y., Bigham J.P., Dausch G., Ramakrishnan I.V.. More
than meets the eye: A survey of screen-reader browsing strategies.
In International Cross Disciplinary Conference on Web
Accessibility (W4A), 2010, pages 1–10.
[4] Bigham J.P., Cavender A.C., Brudvik J.T., Wobbrock J.O., Lander
R.E. Webinsitu: A comparative analysis of blind and sighted
browsing behavior. In 9th International ACM SIGACCESS
Conference on Computers and Accessibility (ASSETS), 2007,
pages 51–58.
[5] Maurel F., Beudin A., Ferrari S. Du tag cloud au tag thunder : vers
de nouvelles stratégies de lecture orale pour non-voyants,
IHM2015, Oct 2015, Toulouse, France. ACM, IHM-2015, 2015
[6] Safi W., Maurel F., Routoure J.-M., Beust P., Dias G. A Hybryd
Segmentation of Web Pages for Vibro-Tactile Access on TouchScreen Devices, Proceedings of VL’14, associated to COLLING
2014, 2014, pp 95-102.
[7] Guerreiro J. Using simultaneous audio sources to speed-up blind
people’s web scanning. In 10th International Cross-Disciplinary
Conference on Web Accessibility (W4A), pages 1–2, 2013.
Contacts :
Stéphane Ferrari : [email protected]
Fabrice Maurel : [email protected]
Marc Spaniol : [email protected]
GREYC - Université de Caen, Bât. Sciences 3
Campus Côte de Nacre, CS14032
14032 CAEN cedex 5
Tél. 02 31 56 74 86 - Fax 02 31 56 73 30
Email : pré[email protected]
GREYC - ENSICAEN
6, Boulevard du Maréchal Juin –CS45053
14050 CAEN cedex 4
Tél. 02 31 45 25 04 - Fax 02 31 45 26 98
Email : pré[email protected]