Du tag cloud au tag thunder : vers de nouvelles stratégies
Transcription
Du tag cloud au tag thunder : vers de nouvelles stratégies
Groupe de Recherche en Informatique, Image, Automatique et Instrumentation de Caen Contacts : [email protected] – [email protected] – [email protected] CNRS – UMR 6072 Université de Caen Normandie & ENSICAEN Du tag cloud au tag thunder : vers de nouvelles stratégies de lecture orale pour non-voyants PROBLEMATIQUE La navigation visuelle sur internet permet d’accéder à la fois à une vue précoce et globale d’une page Web (stratégie dite d’écrémage ou skimming) puis de procéder à une recherche active et rapide d’informations spécifiques (stratégie dite de balayage ou scanning). Dans les deux cas la typographie et la disposition des éléments dans le document revêtent une importance capitale [1] (titres, contenus proéminents, phrases spécialement positionnées). d’améliorer les possibilités d’accès à l’information pour les usagers non-voyants (lecture rapide ou en diagonale). UNE PREMIERE APPROCHE Figure 3. Division d'une page web d'article de presse et formation d'un tag cloud L’idée que nous développons est de s’appuyer sur une transposition à l’oral du concept, très présent sur le Web, de représentation visuelle et interactive de mots-clefs : le nuage de mot (ou tag cloud – voir Figure 2). Figure 1. Comparaison entre le visuel d'une page web et sa perception par un non-voyant avec les lecteurs d'écran Figure 2. Exemple de tag cloud classique Les usagers non-voyants n’ont que peu l’usage de cette possibilité [2] (voir Figure 1), bien qu’ils aient développé des stratégies palliatives telles que l’accélération du débit de la synthèse de la parole [3], le saut de titres en titres ou de liens hypertextes en liens hypertextes, la lecture des premières ou dernières phrases de tous les paragraphes. Néanmoins, la différence d’efficacité, en comparaison avec la navigation visuelle, reste significative [4]. Nous nous intéressons dans ce travail à la conception de stratégies non linéaires de skimming et de scanning adaptées à une navigation non visuelle afin GREYC - Université de Caen, Bât. Sciences 3 Campus Côte de Nacre, CS14032 14032 CAEN cedex 5 Tél. 02 31 56 74 86 - Fax 02 31 56 73 30 Email : pré[email protected] Si nous considérons visuellement une page Web, nous pouvons la définir comme un ensemble de blocs. Chacun est identifiable par un mot ou un ensemble de mots représentants son type/structure (métadonnées) ou son contenu (mots-clés). Si l’on efface tous les autres éléments de la page, ces « tags » semblent inscrits spatialement selon la position occupée par le bloc dont ils proviennent et par l’importance typographique qui leur est donnée. Ils forment finalement un effet visuel proche de celui du tag cloud (Voir Figure 3). Etant donnée la structure arborescente d’une page Web, chacun des blocs peut récursivement contenir de nouveaux ensembles de blocs auquel on peut appliquer ce procédé d’extraction/effacement pour obtenir finalement un arbre de tag clouds représentant chacun un niveau de contenu. C’est une telle représentation de la page Web que nous souhaitons calculer automatiquement. Cette transformation d’une structure Web en une représentation adaptée à la réalisation d’une telle version audio, que nous dénommons « tonnerre de mots » (ou tag thunder), devra permettre d’appréhender globalement et précocement la structure logico-thématique de la page et favoriser ainsi l’émergence de stratégies de scanning non visuelles innovantes. GREYC - ENSICAEN 6, Boulevard du Maréchal Juin –CS45053 14050 CAEN cedex 4 Tél. 02 31 45 25 04 - Fax 02 31 45 26 98 Email : pré[email protected] Groupe de Recherche en Informatique, Image, Automatique et Instrumentation de Caen CNRS – UMR 6072 Université de Caen Normandie & ENSICAEN TRAVAIL DEMANDE Figure 1. Schéma de l'architecture logicielle Le travail pourra s’appuyer sur les résultats de stages et projets de recherche précédents, en particulier une architecture logicielle (Voir Figure 4) basée sur un plugin Firefox [5] et des algorithmes de segmentation automatique de pages Web [6]. Deux étapes principales permettent d’envisager le passage d’une structure visuelle Web à une structure audio. Elles nécessitent la levée de verrous technologiques et scientifiques originaux dans les domaines de la Rechercher d’Information (RI), du Traitement Automatique des Langues (TAL) ou de l’Interaction Homme Machine (IHM) : 1. 2. l’extraction d’expressions-clés, uniques pour chaque bloc de document d’un niveau donné, aura la particularité de s’appuyer sur des mesures intégrant des aspects typographiques, dispositionnels, hiérarchiques et thématiques (globalement et localement). La constitution de corpus de référence, et de nouvelles techniques pour leur exploration, devront être adaptées à cet objectif ; de la même manière que les mots d’un tag cloud sont distribués spatialement avec des effets visuels divers (taille, couleur…), les tag thunder distribueront les mots spatialement et temporellement en jouant sur des effets sonores variés (volume, débit, hauteur, genre de la voix, fréquence de répétition, son 2D/3D). Comment produire un effet « cocktail party » mis en évidence dans [7] : nous sommes capables de focaliser notre attention auditive sur un flux verbal dans une ambiance bruyante ; mais même si notre attention est fixée sur la parole d’un interlocuteur, nous restons, dans une certaine mesure, sensibles aux sons extérieurs. Nous tiendrons compte tout au long de cette recherche des questions générales d’interface et d’interactions soulevées par les objectifs applicatifs : comment mettre en place / évaluer / faire évoluer les structures et algorithmes développés pour qu’ils soient conforment à nos objectifs de skimming ? Quelles contraintes et possibilités offre notre structure pour une navigation non visuelle entre des contenus d’un même niveau hiérarchique ou de niveaux d’imbrications différents ? Cependant, dans le travail de cette thèse, le cœur de la problématique abordée sera prioritairement celui évoqué dans l’étape 1. BIBLIOGRAPHIE [1] Dias G., Conde B. Accessing the web on handheld devices for visually impaired people. In K. Wegrzyn-Wolska and P. Szczepaniak, editors, Advances in Intelligent Web Mastering, volume 43 of Advances in Soft Computing, 2007, pages 80-86. [2] Ahmed F., Borodin Y., Soviak A., Islam M., Ramakrishnan I.V., Hedgpeth T. Accessible skimming: Faster screen reading of web pages. In UIST 2012, 2012, pages 367-378. [3] Borodin Y., Bigham J.P., Dausch G., Ramakrishnan I.V.. More than meets the eye: A survey of screen-reader browsing strategies. In International Cross Disciplinary Conference on Web Accessibility (W4A), 2010, pages 1–10. [4] Bigham J.P., Cavender A.C., Brudvik J.T., Wobbrock J.O., Lander R.E. Webinsitu: A comparative analysis of blind and sighted browsing behavior. In 9th International ACM SIGACCESS Conference on Computers and Accessibility (ASSETS), 2007, pages 51–58. [5] Maurel F., Beudin A., Ferrari S. Du tag cloud au tag thunder : vers de nouvelles stratégies de lecture orale pour non-voyants, IHM2015, Oct 2015, Toulouse, France. ACM, IHM-2015, 2015 [6] Safi W., Maurel F., Routoure J.-M., Beust P., Dias G. A Hybryd Segmentation of Web Pages for Vibro-Tactile Access on TouchScreen Devices, Proceedings of VL’14, associated to COLLING 2014, 2014, pp 95-102. [7] Guerreiro J. Using simultaneous audio sources to speed-up blind people’s web scanning. In 10th International Cross-Disciplinary Conference on Web Accessibility (W4A), pages 1–2, 2013. Contacts : Stéphane Ferrari : [email protected] Fabrice Maurel : [email protected] Marc Spaniol : [email protected] GREYC - Université de Caen, Bât. Sciences 3 Campus Côte de Nacre, CS14032 14032 CAEN cedex 5 Tél. 02 31 56 74 86 - Fax 02 31 56 73 30 Email : pré[email protected] GREYC - ENSICAEN 6, Boulevard du Maréchal Juin –CS45053 14050 CAEN cedex 4 Tél. 02 31 45 25 04 - Fax 02 31 45 26 98 Email : pré[email protected]