Les Critères Ergonomiques (1ère partie) Les méthodes d`évaluation

Transcription

Les Critères Ergonomiques (1ère partie) Les méthodes d`évaluation
Les Critères Ergonomiques (1ère partie)
Les méthodes d'évaluation ergonomique des logiciels interactifs
On ne peut présenter les Critères Ergonomiques sans aborder, dans un premier temps, les
méthodes d'évaluation des systèmes interactifs (ex., sites Web, logiciels, applications
nomades, applications vocales, Minitel, etc.).
Les méthodes d'évaluation des systèmes interactifs actuellement disponibles sont nombreuses
et variées. Toutes présentent des avantages et des inconvénients et aucune d'elles ne peut
prétendre à une évaluation complète de l'interface (non seulement la présentation des
informations mais aussi la navigation, le repérage au sein de l'application, ...).
On distingue généralement deux grandes catégories de méthodes :
•
•
les méthodes requérant la participation directe des utilisateurs,
et les méthodes s'appliquant aux caractéristiques de l'interface.
La première catégorie comprend notamment les tests utilisateurs, les outils logiciels, les
questionnaires et les entretiens. La deuxième catégorie comprend pour sa part les modèles,
méthodes et langages formels, le recours à l'expert, les méthodes d'inspection et les outils
d'évaluation automatique.
Les méthodes requérant la participation directe des utilisateurs
Dans cette catégorie de méthodes, l'utilisateur est la source des données de l'évaluation. Deux
sous-classes peuvent être identifiées : une première où l'utilisateur interagit avec le système
(les tests d'utilisation), et une deuxième où l'utilisateur est questionné à propos de l'interface
(questionnaires et entretiens) suite à une interaction avec le système interactif.
Les tests utilisateurs
Lors des tests d'utilisation (user testing) ou tests d'usage, un ou plusieurs utilisateurs
participent à l'exécution de tâches représentatives des tâches réelles (selon des scénarios
définis avant le test) ou encore, à l'exploration libre commentée (voir à ce propos [2] et [6]).
Ces deux approches donnent des résultats différents mais complémentaires. Cette dernière
approche est particulièrement utilisée dans le cas des sites Web (voir [1], pour une
présentation des méthodes d'évaluation des sites Web). Ces tests peuvent être menés sur le
terrain ou dans un environnement qui recrée autant que possible l'environnement réel du
travail quand ce dernier ne permet pas la conduite de tests.
Dans ce type d'évaluation, les sessions de test sont généralement enregistr&eacutees sur
support vidéo. On s'intéresse aux performances et aux comportements des utilisateurs lors
d'interactions avec le système. On mesurera par exemple, selon le contexte de l'étude, le
temps ou le nombre d'actions requis pour l'exécution d'une tâche, l'exactitude du résultat, le
nombre d'erreurs commises, leur type, la position du regard sur l'écran et/ou sur les différents
dispositifs d'entrée/sortie de données (souris, clavier/moniteur,...), etc.
Il s'agit donc ici, à partir des indices comportementaux et de performance, d'identifier les
choix de conception (par exemple la structure des menus, les libellés des options de menus,
les messages d'erreurs, etc.) qui peuvent entraîner des erreurs d'utilisation, susciter des
interrogations ou hésitations, alourdir l'utilisation de l'application, etc. S'il s'agit ici d'évaluer
la qualité d'un système donné, les résultats des tests d'utilisation peuvent aussi permettre de
comparer la qualité ergonomique de systèmes concurrents. On parle alors de « benchmark »
ou d'évaluation comparative.
Les outils logiciels : Les évaluateurs disposent d'outils extrêmement utiles à la fois pour
l'enregistrement des comportements ou des traces du comportement des utilisateurs tout
comme pour le codage et pour l'analyse de ces derniers. Bien que l'enregistrement des
comportements des utilisateurs puisse se faire à l'aide de techniques assez simples comme les
grilles d'observation (sur papier ou en format électronique), cette technique peut, dans certains
contextes s'avérer fort limitée, voire inapplicable. C'est le cas notamment des situations où les
comportements sont très fréquents ou très rapides (par exemple appuis sur les touches du
clavier, prise d'information visuelle furtive, etc.).
Parmi les outils d'usage relativement courants (autres que l'enregistrement vidéo) pour le
recueil et l'analyse des données, on peut noter les mouchards électroniques qui permettent
d'enregistrer tous les événements utilisateurs (lancement d'applications, ouverture de fenêtres,
sélection d'options de menus, etc.). Certains de ces outils sauvegardent les événements, tout
comme leurs moments d'occurrence, dans des fichiers (log files). À partir de ces fichiers, des
données descriptives sont calculées (durées moyennes, fréquences, fréquences relatives, etc.)
pour chaque événement et des données sur l'organisation temporelle de ces événements
peuvent aussi être fournies. C'est le cas notamment d'ErgoLight (www.ergolight-sw.com).
Dans le cas du Web, par exemple, ces log files permettent d'identifier des patterns de
navigation et ce à partir des requêtes adressées aux serveurs (voir l'article sur l'utilisation des
log files).
Lorsque l'interaction entre utilisateurs et systèmes interactifs est enregistrée sur vidéo, se pose
le problème et surtout la difficulté du codage de ces enregistrements. Des logiciels comme
« The Observer » (www.noldus.com) permettent d'assister l'évaluateur. Ce logiciel permet en
effet de définir les comportements à identifier (grille d'analyse) et de piloter le magnétoscope
ou la séquence vidéo numérisée. L'identification du début et de la fin des comportements s'en
trouve facilitée puisque la bande vidéo peut être codée image par image, ce qui permet une
très grande précision. Ce type d'outil est cependant lourd à utiliser (formation, temps
d'analyse, ...) et est généralement réservé à des études plus longues que celles généralement
demandées aux ergonomes en cours de conception ou d'évaluation (elle est plus généralement
utilisée en recherche).
Les questionnaires et les entretiens. Les questionnaires et les entretiens permettent le recueil
de données subjectives relatives aux attitudes, aux opinions des utilisateurs et à leur
satisfaction. Ces données sont généralement utilisées pour compléter les données objectives
recueillies lors des tests d'utilisation. Certains de ces questionnaires sont présentés sous forme
logicielle et peuvent être administrés sur site Web (Le lecteur pourra trouver une version Web
des questionnaires les plus connus sur le site de G. Perlman :
http://www.acm.org/~perlman/question.html). La conception de ce type d'instrument nécessite
des compétences et connaissances particulières (voir à ce propos [3]) pour assurer notamment
la validité et la fiabilité de ces instruments.
La plupart du temps, les utilisateurs sont invités à répondre à toutes les questions ou à
indiquer, pour chacune des affirmations présentées, s'ils sont en désaccord ou en accord sur
une échelle en 5, 7 ou 9 points. Si certains sont relativement simples et faciles à administrer,
d'autres sont par contre plutôt lourds. Le Nielsen's attribute of usability (NAU, [5]) par
exemple, ne comporte que cinq énoncés (par exemple « le système est facile à apprendre ») et
l'utilisateur doit indiquer sur une échelle en sept points si le système est « Mauvais » ou
« Bien » pour chacun des énoncés. À l'opposé, le PUTQ (Purdue Usability Questionnaire,
[4]) comporte 100 questions organisées autour de huit dimensions (Compatibilité, Cohérence,
Flexibilité, Facilité d'apprentissage, Actions minimales, Mémorisation, Limite perceptives,
Guidage). Ici encore les utilisateurs doivent répondre aux questions (par exemple « Les
actions requises sont-elles cohérentes ? ») sur une échelle en 7 points allant de « Mauvais » à
« Bien ».
Si ces questionnaires concernent généralement les applications « standards » certains
questionnaires ont été spécialement adaptés au Web. C'est le cas notamment du WAMMI
(Website Analysis and MeasureMent Inventory) [7]. Il s'agit d'un questionnaire en ligne
permettant aux utilisateurs de « noter » l'utilité et l'utilisabilité du site sur lequel il est
implémenté. Le questionnaire est composé d'affirmations portant sur l'attrait (Attractiveness),
le contrôle (Control), l'efficacité (Efficiency), l'utilité/aide (Helpfulness) et la facilité
d'apprentissage (Learnability).
Dans la suite de cet article nous aborderons les méthodes s'appliquant aux caractéristiques de
l'interface...
Pour en savoir davantage...
Cet article est un extrait de : Bastien, J. M. C., & Scapin, D. L. (2001). Évaluation des
systèmes d'information et Critères Ergonomiques. In C. Kolski (Ed.), Systèmes d'information
et interactions homme-machine. Environnement évolués et évaluation de l'IHM. Interaction
homme-machine pour les SI (Vol. 2, pp. 53-79). Paris : Hermes.
Le lecteur y trouvera de plus amples informations et de nombreuses références.
[1] Bastien, J. M. C., Leulier, C., & Scapin, D. L. (1998). L'ergonomie des sites web. In J.-C.
Le Moal & B. Hidoine (Eds.), Créer et maintenir un service Web (pp. 111-173). Paris :
ADBS. Disponible à l'adresse suivante : http://www.adbs.fr/uploads/ouvrages/inria98/p111173.pdf.
[2] Dumas J.S. & Redish J.C. (1993). A practical guide tu usability testing. Norwood, New
Jersey: Ablex Publishing.
[3] Kirakowski J. (2000). Questionnaires in usability engineering. A list of frequently asked
questions (3rd ed.). Disponible à l'adresse suivante :
http://www.ucc.ie/hfrg/resources/qfaq1.html.
[4] Lin H.X., Choong Y.-Y. & Salvendy G. (1997). A proposed index of usability: a method
for comparing the relative usability of different software systems, Behaviour & Information
Technology, 16, 267-278.
[5] Nielsen J. (1993). Usability engineering. San Diego, CA: Academic Press.
[6] Rubin J. (1994). Handbook of usability testing. How to plan, design, and conduct effective
tests. New York, NY: Wiley & Sons.
[7] WAMMI - Q - 2.3 EN (c) Copyright HFRG Ireland and Nomos Management AB Sweden,
1998. Informations sur l'Internet - http://www.ucc.ie/hfrg/questionnaires/wammi/index.html
Christian Bastien
Haut de page
Les Critères Ergonomiques (2ème partie)
Méthodes s'appliquant aux caractéristiques de l'interface
Cette catégorie de méthodes se distingue essentiellement de la précédente par l'absence
d'interaction directe entre un utilisateur et un système. Dans ces méthodes, les utilisateurs tout
comme leurs tâches sont représentés. Dans cette catégorie seront abordés : les modèles,
méthodes et langages formels ; le recours à l'expert ; et les méthodes d'inspection.
Les méthodes à base de modèles formels
Les évaluations qui s'appuient sur des modèles théoriques et/ou formels (discutés au
chapitre 3 de l'ouvrage de Kolski [4]) permettent de prédire la complexité d'un système (par
exemple, par le nombre de règles de production du type "Pour faire ceci Alors procéder
ainsi ") que doit connaître un utilisateur idéal pour accomplir une tâche avec le système qui lui
est proposé et par conséquent les performances des utilisateurs. L'évaluation à partir de ces
modèles constitue cependant une tâche très longue, très coûteuse et est difficile à mettre en
œuvre par les non spécialistes.
Le recours à l'expert
L'évaluation experte est généralement définie comme une évaluation informelle où l'expert
compare les performances, attributs et caractéristiques d'un système, que ce dernier soit
présenté sous forme de spécifications, sous forme de maquettes ou de prototypes, aux
recommandations ou normes existantes dans le but de détecter des défauts de conception.
Les méthodes d'inspection
Les méthodes d'inspection de l'utilisabilité (usability inspection methods) regroupent un
ensemble d'approches faisant appel au jugement d'évaluateurs, que ces derniers soient experts
ou non en utilisabilité. Bien que toutes ces méthodes aient des objectifs différents, elles visent
généralement la détection des aspects des interfaces pouvant entraîner des difficultés
d'utilisation ou alourdir le travail des utilisateurs. Les méthodes d'inspection se distinguent les
unes des autres par la façon dont les jugements des évaluateurs sont dérivés et par les critères
d'évaluation à la base de leurs jugements.
Parmi les méthodes d'inspection, celles qui nous intéressent plus particulièrement sont :
l'inspection cognitive (Cognitive walkthrough) ; l'analyse de la conformité à un ensemble de
recommandations (guideline reviews) ; et l'analyse de la conformité à des normes (standards
inspection), principes, dimensions, heuristiques. Cet intérêt tient en partie au fait que ces
dernières sont bien documentées et qu'elles ont fait l'objet de tests et de comparaisons.
L'inspection cognitive
L'inspection cognitive (Cognitive walkthrough) est une méthode d'inspection qui consiste à
évaluer la facilité d'apprentissage, par l'exploration d'un système interactif. Cette évaluation
requiert une description détaillée de l'interface (idéalement sous forme de maquette papier,
logiciel ou encore de prototype), une description de la tâche à réaliser, une description des
caractéristiques des utilisateurs potentiels et du contexte d'utilisation, et une description
précise de la séquence des actions que l'utilisateur doit effectuer pour accomplir les tâches
décrites.
Au cours de l'inspection, les évaluateurs passent en revue chacune des actions que l'utilisateur
doit effectuer. Pour chacune de ces actions, ils doivent s'interroger sur ce que l'utilisateur cible
sera tenté de faire, en se basant sur les objectifs d'utilisation et les connaissances de ces
derniers, et doivent comparer ces actions hypothétiques aux actions que permet le système à
cette étape de l'interaction.
Si l'interface est bien conçue, les actions permises ou proposées par le système devraient
correspondre à celles auxquelles l'utilisateur est en droit de s'attendre. En d'autres termes
l'inspection cognitive cherche à identifier les choix de conception qui peuvent entraver
l'apprentissage par l'exploration.
L'évaluation de la conformité à des recommandations
L'évaluation de la conformité à des recommandations (guideline reviews) consiste à juger la
conformité des éléments de l'interface aux recommandations (ergonomiques ou de style)
contenues dans divers types de recueils. On trouve ainsi des guides de style, c'est-à-dire des
recommandations que proposent des constructeurs, des développeurs, ou des consortiums, et
des recueils de recommandations. Les recommandations de style permettent généralement de
distinguer les interfaces des logiciels développés pour des environnements différents (par
exemple pour les environnements Unix, Windows et Macintosh). Le « Macintosh Human
Interface Guidelines » d'Apple, ou encore le « Window interface : An Application Design
Guide » de Microsoft sont des exemples de guides de style.
Les recommandations sont généralement présentées dans des recueils (voir par exemple
Scapin [11], Smith [12] et Vanderdonckt [13]) ou des guides généraux (voir par exemple
Mayhew [9]). Les recueils de recommandations constituent probablement la source la plus
importante des guides de conception.
L'évaluation de la conformité à des dimensions ergonomiques (normes, principes,
heuristiques)
Parallèlement aux recueils de recommandations, les connaissances ergonomiques ont été
rendues disponibles sous différentes formes. On trouve, par exemple, des guides de
conception, des principes, des heuristiques et des normes.
Les nombreux guides de conception disponibles répondent à des objectifs divers. Lorsque l'on
étudie ces guides, on constate clairement une absence d'uniformité dans la présentation des
recommandations et un nombre très variable de recommandations présentées. Ces dernières
sont parfois organisées par critères, principes ou thèmes de plus hauts niveaux qui tentent de
les organiser et de les synthétiser (par exemple l'homogénéité, la compatibilité stimulusréponse, la facilité d'apprentissage, etc.), ou parfois encore par thèmes issus d'un découpage
de l'interface (par exemple langage de commande, sélection de menus, entrée de données,
affichage de données, etc.).
Si certains guides abordent plus spécifiquement la conception des interfaces utilisateurs,
d'autres traitent principalement de l'évaluation. Ces derniers peuvent alors être plus ou moins
complexes et plus ou moins détaillés. On trouve aussi des chapitres de livre, succincts et assez
généraux (tel Marshall, Nelson & Gardiner [8]) ou encore des guides plus détaillés
comportant des check-lists (par exemple Clegg & al. [1]).
La distinction entre les diverses dimensions, du moins entre principes, normes et heuristiques
est parfois ténue. Dans certains cas, la distinction provient de leur caractère officiel (c'est le
cas notamment des normes) ; dans d'autres, elle peut être liée à la précision des définitions
voire au nombre d'exemples de recommandations accompagnant ces dimensions. Les normes
de conception et d'évaluation (design standards) présentent habituellement une série
d'énoncés généraux sur la conception des systèmes interactifs. Ce qui distingue ces documents
d'autres documents présentant aussi des énoncés généraux, comme les principes, est leur
caractère officiel et leur origine ; ces documents sont issus d'organismes de normalisation. On
trouve des normes nationales (par exemple DIN pour l'Allemagne, AFNOR pour la France) et
des normes internationales (par exemple ISO) (voir à ce propos l'article sur les normes).
Les principes sont des énoncés généraux qui s'appuient sur des données issues de recherches
sur la façon avec laquelle les gens apprennent et travaillent. Ainsi, le principe « être cohérent
dans le choix des mots, formats et procédures » est issu des recherches qui ont montré que les
gens apprenaient plus rapidement et transféraient mieux leurs acquis lorsque les informations
qu'on leur présentait et les procédures qu'ils devaient suivre étaient cohérentes. Les principes
constituent donc des objectifs à atteindre, sans que soient précisées les façons de les satisfaire.
Les outils d'évaluation automatique
Divers outils logiciels d'aide à l'évaluation ont déjà été proposés. Certains constituent des
versions logicielles de documents papier, d'autres sont des outils d'accompagnement de
l'évaluation, c'est-à-dire qu'ils aident l'évaluateur à structurer et à organiser l'évaluation,
finalement d'autres permettent de faire de l'évaluation automatique. C'est de cette dernière
catégorie dont il sera question ici. Il s'agit ici de décrire les outils qui permettent de récupérer
des fichiers de description de l'interface sur lesquels sont appliquées des analyses permettant
l'évaluation de la conformité à certaines recommandations ergonomiques, principes, critères
ou recommandations de style (par exemple ERGOVAL, KRI/AG, CHIMES, SYNOP, l'outil
de Mahajan et Shneiderman, etc.). Il ne s'agit donc pas ici des outils de capture d'événements
utilisateurs comme ceux présentés dans la première partie de cet article.
ERGOVAL (Farenc [2]) est un système d'évaluation à base de connaissances. Les règles
ergonomiques intégrées à la base de connaissance sont relatives aux interfaces graphiques et
ne nécessitent pas le recours à des connaissances approfondies sur le travail. Ces règles sont
issues de diverses compilations de recommandations et sont classifiées dans des catégories
qui s'apparentent aux Critères Ergonomiques (que nous verrons dans la 3ème partie de cet
article). En plus des règles ergonomiques, ERGOVAL comporte une décomposition
structurelle des objets de l'interface, établie à partir de la norme CUA (Common User Access).
Cette typologie des objets permet entre autres de rattacher des ensembles de règles à chaque
type d'objet. ERGOVAL fournit, à la fin du diagnostic, le texte justificatif de chacune des
règles non respectées.
KRI/AG (Löwgren & Nordqvist [6]) est un système expert connecté à un UIMS (TeleUse,
sous environnement X-Window) qui évalue les fichiers générés par ce dernier. Ce système
s'appuie sur une base d'environ cent recommandations ergonomiques et de style (Motif)
portant sur les aspects syntaxiques et de présentation de l'interface.
CHIMES (Jiang & al. [3]) est un système capable d'évaluer la conformité de l'interface aux
recommandations de style OSF/Motif et aux recommandations relatives à l'usage de la
couleur. Lors de l'évaluation, CHIMES fait des propositions d'amélioration.
SYNOP (Kolski & Millot [5]) est un système expert d'évaluation automatique de la
présentation statique de synoptiques industriels à partir de recommandations relatives à la
présentation des informations à l'écran. L'évaluation porte sur une description des pagesécrans créées à l'aide du logiciel graphique IMAGIN. Ce système permet aussi d'effectuer des
modifications automatiques et lorsque ces dernières s'avèrent impossibles, des
recommandations sont proposées. Ce système permettrait donc de détecter des erreurs liées à
certaines dimensions ergonomiques (par exemple Groupement/Distinction entre items par la
localisation et le format, Lisibilité, Densité informationnelle, et Cohérence).
Mahajan et Shneiderman [7] ont développé un outil d'évaluation de la cohérence de
l'interface. L'outil convertit l'interface créée à l'aide de Visual Basic sous forme d'un fichier
canonique de description d'objets. L'outil permet ensuite d'évaluer la cohérence de l'interface.
Plus précisément, l'outil évalue : le style et la taille des polices de caractères utilisées dans les
boîtes de dialogue, afin d'y détecter des incohérences ; les couleurs utilisées pour les fonds
d'écran ; l'interface, afin d'y détecter l'utilisation incohérente des majuscules dans les mots
apparaissant dans les boutons, labels, titres, menus, etc., et ce, dans toutes les boîtes de
dialogue ; la cohérence des caractéristiques des boutons de commande, c'est-à-dire leurs titres,
l'emploi des majuscules, leur localisation relative, leurs tailles (hauteur, largeur) ; et
l'orthographe des mots utilisés dans tous les objets, de même qu'une évaluation des
synonymes.
Pour l'instant, les aspects de la Qualité Ergonomique que permettent d'évaluer ces outils sont
relativement restreints, du moins dans l'état actuel. Les outils d'aide à l'évaluation doivent
donc être considérés comme des techniques complémentaires à l'inspection de la Qualité
Ergonomique des logiciels interactifs et aux tests d'utilisation.
Tous ces outils, bien qu'ils ne fassent aucunement référence aux tâches et aux caractéristiques
des utilisateurs n'en demeurent pas moins utiles. Rappelons, par exemple, que la seule
évaluation d'une interface du point de vue de la cohérence, et à plus forte raison si l'interface
est complexe, est une tâche extrêmement difficile à réaliser. Cette évaluation nécessite que la
valeur des paramètres d'un objet ou d'un ensemble d'objets (exemple, le positionnement relatif
des boutons d'annulation et de validation d'une boîte de dialogue) soit cohérente dans toute
l'interface (dans notre exemple, le positionnement relatif des boutons de commande devra être
le même dans toutes les boîtes de dialogue à moins de justifications contraires). De plus, pour
que cette évaluation soit exhaustive, l'évaluateur doit avoir une bonne représentation du
dialogue, ce qui n'est pas non plus une chose simple à obtenir. Ainsi tout outil facilitant ce
type d'évaluation permet à l'évaluateur de consacrer plus de temps aux aspects liés aux tâches.
Ces divers outils montrent que certaines dimensions ergonomiques, certaines
recommandations ou règles se prêtent assez bien à une évaluation automatique. Toutefois ces
outils devront, pour permettre une évaluation sur des aspects plus sémantiques, s'articuler à
des outils de description de tâches et à des outils de description de l'interface. On peut déjà
imaginer l'ampleur de la tâche. En effet, comment par exemple, à partir d'une description de la
tâche, peut-on déterminer automatiquement que le dialogue correspond à sa structure ? Pour
ce faire il faudra disposer d'une bonne description du dialogue de l'interface et articuler cette
dernière à la description de la tâche.
Pour en savoir davantage...
Cet article est un extrait de : Bastien, J. M. C., & Scapin, D. L. (2001). Évaluation des
systèmes d'information et Critères Ergonomiques. In C. Kolski (Ed.), Systèmes d'information
et interactions homme-machine. Environnements évolués et évaluation de l'IHM. Interaction
homme-machine pour les SI (Vol. 2, pp. 53-79). Paris : Hermes.
Le lecteur y trouvera de plus amples informations et de nombreuses références.
[1] Clegg, C. W., Warr, P. B., Green, T. R. G., Monk, A., Kemp, N., Allison, G., & Lansdale,
M. (1988). People and computers - How to evaluate your company's new technology.
Chichester: Ellis Horwood.
[2] Farenc, C. (1997). Ergoval : une méthode de structuration des règles ergonomiques
permettant l'évaluation automatique d'interfaces graphiques. Université de Toulouse I,
Toulouse, France.
[3] Jiang, J., Murphy, E., Bailin, S., Truszkowski, W., & Szczur, M. (1992). Prototyping a
knowledge based compliance checker for user-interface evaluation in Motif development
environments. In MOTIF'92: Second Annual International Motif Users Meeting Bethesda,
MD, Washington, DC: Open Systems, pp. 258-268.
[4] Kolski, C. (Ed.). (2001). Analyse et conception de l'IHM. Interactions homme-machine
pour les SI (Vol. 1). Paris : Hermès.
[5] Kolski, C., & Millot, P. (1991). A rule-based approach to the ergonomic "static"
evaluation of man-machine graphic interface in industrial processes. International Journal of
Man-Machine Studies, 35(5), 657-674.
[6] Löwgren, J., & Nordqvist, T. (1992). Knowledge-based evaluation as design support for
graphical user interfaces. In Proceedings of the Conference on Human Factors in Computing
Systems, CHI'92, New York, NY, USA, ACM Press, pp. 181-188.
[7] Mahajan, R., & Shneiderman, B. (1995). A family of user interface consistency checking
tools (Report CS-TR-3472). College Park: University of Maryland.
[8] Marshall, C., Nelson, C., & Gardiner, M. M. (1987). Design guidelines. In M. M. Gardiner
& B. Christie (Eds.), Applying cognitive psychology to user-interface design (pp. 221-278).
Chichester, UK: Wiley.
[9] Mayhew, D. J. (1992). Principles and guidelines in software user interface design.
Englewood Cliffs: Prentice Hall.
[10] Ravden, S. J., & Johnson, G. I. (1989). Evaluating usability of human-computer
interfaces: a practical method. Chichester, UK: John Wiley & Sons.
[11] Scapin, D. L. (1986). Guide ergonomique de conception des interfaces homme-machine
[Ergonomic guidelines for the design of human-computer interfaces] (Tech. Rep. 77).
Rocquencourt, France : Institut National de Recherche en Informatique et en Automatique.
[12] Smith, S. L. (1986). Standards versus guidelines for designing user interface software.
Behaviour & Information Technology, 5(1), 47-61.
[13] Vanderdonckt, J. (1995). Guide ergonomique des interfaces homme-machine
[Ergonomic guide for user interfaces]. Namur, Belgium : Presses Universitaires de Namur.
Christian Bastien
Haut de page
Les Critères Ergonomiques (3ème partie)
Cette troisième partie vise à préciser la nature des Critères Ergonomiques, à rappeler leur
développement, leur validation et à présenter les travaux en cours. Elle n'a pas pour objectif
de présenter les Critères Ergonomiques dans le détail. Le lecteur intéressé pourra consulter les
publications suivantes : [2] [4] [6] [7] [8] [9].
Développement et validation des Critères Ergonomiques
L'objectif initial des travaux effectués sur les Critères Ergonomiques a été de formaliser et de
structurer les connaissances ergonomiques, notamment telles qu'elles apparaissent dans les
publications scientifiques sous la forme de recommandations. Les Critères Ergonomiques
représentent d'abord un moyen de classification de ces recommandations, mais surtout, ils
représentent les dimensions ergonomiques majeures selon lesquelles un système d'information
peut être spécifié ou évalué.
Un ensemble important de recommandations a été collecté à partir de guides ergonomiques et
de l'examen des résumés d'articles scientifiques publiés dans la revue Ergonomics Abstracts
(http://www.tandf.co.uk/journals/tf/00462446.html). Cette approche a permis de répertorier
environ 800 recommandations. à partir de ces travaux, une première version des critères a été
produite [8]. La construction des Critères Ergonomiques a donc procédé de manière
empirique et a suivi une démarche itérative de classification et d'accord inter-juges. Il a
cependant semblé également nécessaire de valider la qualité et l'utilisabilité de ces critères de
façon expérimentale, ce qui représente une des rares validations de telles dimensions dans la
littérature.
Plus spécifiquement, une partie des études réalisées sur les Critères Ergonomiques a consisté
à valider les Critères Ergonomiques, à apprécier les performances d'évaluation résultant de
leur application par des experts et des novices du domaine de l'ergonomie du logiciel et à
comparer ces performances à celles obtenues par l'application des Principes de Dialogue ISO
9241-10. Ce faisant, la définition des Critères Ergonomiques allait permettre de :
•
•
•
•
Définir le concept de Qualité Ergonomique des systèmes interactifs en identifiant ses
composantes ;
Structurer les résultats du domaine de l'ergonomie des logiciels en proposant des
dimensions autorisant l'organisation de bases de données ou de bases de règles ;
Contribuer aux processus de normalisation (les critères ont été repris en majeure partie
dans la norme AFNOR Z 67-133-1) ;
Enfin, de contribuer à l'amélioration du diagnostic ergonomique, notamment dans son
exhaustivité, sa fiabilité et sa robustesse et ce par des non-spécialistes autant que par
des spécialistes de l'ergonomie des logiciels.
Compte tenu de la méthode utilisée pour leur développement et leur définition, on peut
prétendre que les Critères Ergonomiques sont valides. Les critères ont été développés sur la
base d'un ensemble de recommandations important, ce qui leur assure une certaine
exhaustivité. Parce qu'ils sont directement liés aux recommandations qui leur ont donné
naissance, les Critères Ergonomiques permettent de définir la Qualité Ergonomique des
systèmes interactifs.
La construction des critères a été suivie d'une étude au cours de laquelle des participants
devaient utiliser les Critères Ergonomiques pour classifier des erreurs de conception [2]. Cette
étude visait essentiellement à apprécier la clarté des définitions des critères et à identifier les
confusions pouvant apparaître entre critères élémentaires chez des novices et des experts.
Cette première étude a permis de modifier certaines définitions, d'ajouter des exemples de
recommandations et des commentaires permettant de mieux distinguer certains critères
élémentaires. Dans cette étude, la tâche n'était pas une tâche d'évaluation, mais bien
d'identification de critères à partir d'erreurs de conception. On pouvait donc se demander si,
malgré une certaine facilité d'utilisation pour la classification d'erreurs de conception déjà
détectées, ces critères apportaient une aide réelle à l'évaluation. C'est précisément pour
répondre à cette question qu'a été conçue l'étude suivante.
Une deuxième étude a été conduite afin de tester l'efficacité et l'utilisabilité des Critères
Ergonomiques [4]. Pour réaliser ce projet, deux groupes de spécialistes en ergonomie des
logiciels ont été invités à évaluer l'interface d'un système de gestion d'une base de données
musicales. Dans la première phase de l'étude, tous les participants devaient évaluer l'interface
en ne se basant que sur leur propre expertise. Au cours de la deuxième phase de l'étude, les
participants devaient évaluer l'interface une deuxième fois mais cette fois-ci en visionnant
l'enregistrement de leurs interactions précédentes. Les participants du groupe « Critères »,
contrairement à ceux du groupe « contrôle » devaient utiliser les Critères Ergonomiques. Les
résultats ont montré que les performances des participants du groupe « Critères » étaient
supérieures à celles des participants du groupe « contrôle ». En résumé, les critères
permettaient d'améliorer les performances d'évaluation des experts.
Dans une troisième étude [7], on s'est intéressé à l'utilisation des Critères Ergonomiques par
des non-spécialistes en ergonomie et à la comparaison des Critères Ergonomiques aux
Principes de Dialogue de la norme ISO 9241- Part 10 et ce, du point de vue des performances
de diagnostic. Trois groupes de participants (Contrôle ; Critères, ISO) ont été invités à évaluer
l'interface du prototype utilisé dans l'étude précédente. Au cours de la session expérimentale,
les participants des groupes « Critères » et « ISO » ont été invités à évaluer l'interface de
façon exhaustive. La consigne précisait qu'ils devaient procéder pas à pas : pour chaque pageécran, boîte de dialogue ou fenêtre à l'écran, il leur était demandé de reprendre un à un chacun
des Critères ou principes de dialogue décrits dans le document et d'indiquer les défauts de
conception s'y rapportant. Les participants appartenant au groupe « Contrôle », n'ayant pas de
documents, devaient s'en remettre à leur seul jugement lors de l'évaluation. L'analyse des
résultats a montré que le nombre de défauts détectés en moyenne par les participants du
groupe « Critères » était supérieur à ceux détectés par les participants des groupes
« Contrôle » et « ISO ». Par contre, le nombre de défauts détectés en moyenne par les
participants des groupes « Contrôle » et « ISO » ne différait pas de façon significative.
État actuel des Critères Ergonomiques
Les Critères Ergonomiques ont été développés à partir d'une base de recommandations
importante ; ils ont été testés du point de vue de leur indépendance, de la stabilité de leur
affectation, de leur utilisabilité et de leur rôle comme aide au diagnostic. Dans leur forme
actuelle, les critères apparaissent donc valides, fiables et utilisables. De plus, leur utilisation
augmente la performance d'évaluation. L'ensemble des Critères Ergonomiques est aujourd'hui
utilisé comme grille pour le diagnostic et pour la présentation des rapports d'évaluations
d'interfaces, notamment dans l'industrie.
Les Critères Ergonomiques
1. Guidage
1.1 Incitation*
1.2 Groupement/Distinction entre items
1.2.1 Groupement/Distinction par la
localisation*
1.2.2 Groupement/Distinction par le format*
1.3 Feed-back immédiat*
1.4 Lisibilité*
2. Charge de travail
2.1 Brièveté
2.1.1 Concision*
2.1.2 Actions minimales*
2.2 Densité informationnelle*
4. Adaptabilité
4.1 Flexibilité*
4.2 Prise en compte de l'expérience de
l'utilisateur*
5. Gestion des erreurs
5.1 Protection contre les erreurs*
5.2 Qualité des messages d'erreur*
5.3 Correction des erreurs*
6. Homogénéité/Cohérence*
7. Signifiance des codes et dénominations*
3. Contrôle explicite
3.1 Actions explicites*
3.2 Contrôle utilisateur*
8. Compatibilité*
* Critère élémentaire
Les Critères Ergonomiques sont actuellement au nombre de huit. Certains de ces critères se
subdivisent en sous-critères : on compte 18 critères élémentaires [3]. Chaque critère
élémentaire est accompagné d'une définition, de justifications et d'exemples de
recommandations (Voir un exemple ci-après pour le critère Incitation). Les Critères
Ergonomiques ont récemment été étendus au Web [5] et aux interactions avec des
environnements virtuels [1].
Définition :
Le terme Incitation a ici une définition plus large que celle qu'on lui confère généralement. Ce
critère recouvre les moyens mis en œuvre pour amener les utilisateurs à effectuer des actions
spécifiques, qu'il s'agisse d'entrée de données ou autre. Ce critère englobe aussi tous les
mécanismes ou moyens faisant connaître aux utilisateurs les alternatives, lorsque plusieurs
actions sont possibles, selon les états ou contextes dans lesquels ils se trouvent. L'Incitation
concerne également les informations permettant aux utilisateurs de savoir où ils en sont,
d'identifier l'état ou contexte dans lequel ils se trouvent, de même que les outils d'aide et leur
accessibilité.
Justification(s) :
Une bonne incitation guide les utilisateurs et leur évite par exemple d'avoir à apprendre une
série de commandes. Elle permet aussi aux utilisateurs de savoir quel est le mode ou l'état en
cours, où ils se trouvent dans le dialogue et ce qu'ils ont fait pour s'y trouver. Une bonne
incitation facilite donc la navigation dans une application et permet d'éviter les erreurs.
Exemples de recommandations :
•
•
•
•
•
•
•
Guider les entrées de données en indiquant le format adéquat et les valeurs
acceptables ; par exemple, fournir, au niveau du label, des indices supplémentaires sur
le format d'entrée des données (exemple : date (jj/mm/aa) : _ _ / _ _ / _ _ ).
Afficher les unités de mesure des données à saisir.
Indiquer toutes les informations d'état (exemple : modes, valeurs, etc.).
Pour chaque champ de données, fournir un label
Fournir des indices sur la longueur autorisée des entrées dans un champ.
Donner un titre à chaque fenêtre.
Fournir des aides accessibles en ligne.
Discussion sur les Critères Ergonomiques
Dans leur version actuelle, les Critères Ergonomiques, bien qu'ils apportent une aide avérée à
l'évaluation des systèmes interactifs, posent néanmoins certaines difficultés et présentent
certaines limites.
L'efficacité de l'aide apportée par les Critères Ergonomiques pourrait être améliorée en
définissant plus avant une méthode associée. En effet, dans l'état actuel des choses, l'ébauche
de méthode se résume à l'examen d'une interface en utilisant systématiquement chacun des
critères et sous-critères, selon l'ordre dans lequel ils sont décrits, à partir d'un document
présentant la version actuelle des Critères Ergonomiques.
Il ne s'agit pas encore d'une méthode d'évaluation complètement développée : par exemple, le
document ne précise ni les façons d'explorer systématiquement l'interface, ni ne donne de
méthode d'application détaillée de chaque critère. Il reste donc beaucoup à faire pour définir
une méthode complète et des outils précis d'évaluation.
Conclusion
Dans les trois parties sur les Critères Ergonomiques, les méthodes d'évaluation de la Qualité
Ergonomique des systèmes d'information n'ont été présentées que très brièvement. Il s'agissait
ici de présenter un aperçu des méthodes actuelles et d'introduire les travaux relatifs aux
Critères Ergonomiques.
Les Critères Ergonomiques font partie des « méthodes d'inspection» qui sont définies comme
des méthodes informelles d'analyse de l'utilisabilité consistant en l'examen d'une interface
spécifiée, prototypée ou existante avec l'objectif d'identifier les défauts ergonomiques de
conception. Ces dernières reposent sur l'expertise des évaluateurs (spécialistes des facteurs
humains, concepteurs de système, informaticiens) et/ou sur une certaine connaissance des
facteurs humains telle qu'elle est disponible dans les documents habituels cités plus haut
(guides, check-lists, etc.).
Les Critères Ergonomiques peuvent être considérés comme un moyen de garantir la
conformité des systèmes aux recommandations pour la conception d'interface, comme un
moyen d'évaluer, relativement rapidement les défauts ergonomiques pour les corriger avant de
passer aux tests utilisateurs. Une telle méthode peut être vue également comme un moyen aisé
de faire entrer dans les habitudes des concepteurs/évaluateurs la nécessité de préoccupations
ergonomiques, puis de faire appel à des ergonomes professionnels pour avancer dans la
conception. En effet, il ne s'agit pas de considérer que la totalité de l'approche ergonomique
sera du ressort du non-spécialiste en ergonomie, mais plutôt que certains de ses aspects les
plus flagrants pourront être traités rapidement, sous la forme d'une inspection ergonomique
systématique. Les ergonomes pourraient ainsi se consacrer à des problèmes plus difficiles
requérant les connaissances et les méthodes qu'ils ont à leur disposition. L'approche critères
devrait aussi aider certains d'entre eux à optimiser leur démarche évaluative.
Pour en savoir davantage...
Cet article est un extrait de : Bastien, J. M. C., & Scapin, D. L. (2001). Évaluation des
systèmes d'information et Critères Ergonomiques. In C. Kolski (Ed.), Systèmes d'information
et interactions homme-machine. Environnements évolués et évaluation de l'IHM. Interaction
homme-machine pour les SI (Vol. 2, pp. 53-79). Paris : Hermes.
Le lecteur y trouvera de plus amples informations et de nombreuses références.
Références
[1] Bach, C., & Scapin, D. L. (2003). Adaptation des critères ergonomiques aux interactions
homme-environnements virtuels. IHM'2003 - 15ème Conférences Francophone sur
l'Interaction Homme-Machine (Université de Caen, 25-28 novembre) New York, NY, ACM.
[2] Bastien J.M.C. et Scapin D.L., A validation of ergonomic criteria for the evaluation of
human-computer interfaces, International Journal of Human-Computer Interaction, 4, 183196, 1992.
[3] Bastien J.M.C. et Scapin D.L., Ergonomic criteria for the evaluation of human-computer
interfaces, Rapport Technique n° 156, Institut National de Recherche en Informatique et en
Automatique, Rocquencourt, France, 1993.
[4] Bastien J.M.C. et Scapin D.L., Evaluating a user interface with ergonomic criteria,
International Journal of Human-Computer Interaction, 7, 105-121, 1995.
[5] Bastien J.M.C., Leulier C. et Scapin D.L., L'ergonomie des sites web, In Le Moal J.-C. &
Hidoine B. (Eds.), Créer et maintenir un service Web, Paris : ADBS, p. 111-173, 1998.
http://www.adbs.fr/uploads/ouvrages/inria98/p111-173.pdf
[6] Bastien J.M.C., Scapin D.L. et Leulier C., Une comparaison des Critères Ergonomiques et
des Principes de dialogue ISO 9241-10 dans une tâche d'évaluation d'interface, Revue
d'Interaction Homme-Machine, 1(1), 33-63, 1998.
[7] Bastien J.M.C., Scapin D.L. et Leulier C., The Ergonomic Criteria and the ISO 9241-10
Dialogue Principles: A pilot comparison in an evaluation task, Interacting with Computers,
11, 299-322, 1999.
[8] Scapin D.L., Des critères ergonomiques pour l'évaluation et la conception d'interfaces
utilisateurs, Actes du XXVI Congrès de la SELF (1990), Montréal, Canada.
[9] Scapin D.L. et Bastien J.M.C., Ergonomic criteria for evaluating the ergonomic quality of
interactive systems, Behaviour & Information Technology, 16, 220-231, 1997.
Christian Bastien
Haut de page