4.3. Evaluation des environnements virtuels

4.3.1. Evaluation des environnements virtuels en tant que tel

Il n’existe pas de réel consensus sur l’évaluation des Environnements Virtuels d’un point de vue objectif. Comme nous avons pu l’expliquer dans la partie décrivant et définissant ce que l’on nomme aujourd’hui Environnement Virtuel, nous avons pu voir que beaucoup de critères dépendent en fait du concepteur et des exigences des chercheurs ou autres mandataires potentiels prescrivant la simulation. Outre les questionnaires (Slater, 1993a, 1993b, 1994, 1998 et 2000, Witmer & Singer 1998, Burkhardt, 2003, Klinger 2006), très largement utilisés, quelques données physiologiques telles que la conductance de la peau ou la mesure du rythme cardiaque sont quelque fois recueillies (Fuchs & Moreau 2002 puis 2007, Klinger, Marié et Fuchs, 2006), mais il manque de réelle mesure objective faisant l’unanimité.

On rencontre par ailleurs des études comme celle de Lapointe et Savard (2006) qui visent à la conception d’un outil, pour évaluer l’efficacité du déplacement d’un environnement virtuel. Ce type de travail, dont le but est de définir un outil, un critère de mesure, aurait pu nous mettre sur la voie pour l’évaluation des environnements virtuels mêmes, ou encore de la Présence dans les EV, même s’il portait sur des Environnements 3D permettant l’interaction utilisateur/interface. En effet, les auteurs ont présenté les éléments qu’ils estimaient nécessaires pour qu’un système informatisé permette l’étude de la performance de différentes techniques d’interaction pour le déplacement dans un environnement virtuel. La méthode proposée consistait à enregistrer et à analyser les données décrivant l’état et les actions de l’utilisateur au cours de ses déplacements dans la scène virtuelle. Ils se sont essentiellement intéressés aux techniques d’interaction utilisées pour le déplacement en environnement 3D, c’est-à-dire à la composante moteur de la navigation plutôt que la composante d’orientation, qui elle dépend de différents facteurs tels que les repères présents dans l’environnement virtuel. On considère généralement que l’évaluation d’une interface utilisateur requiert diverses métriques de performance et de préférence (Bowman, D., Kruijff, E., LaViola, J. J. Jr., & Poupyrev, I., 2005, Bowman, D., Johnson, D., & Hodges, L., 2001). Dans le but de faire une évaluation objective, les métriques de performances et la tâche de l’utilisateur proposées par Lapointe et Savard ont été contrôlées afin de faire ressortir les différences de performance entre les techniques d’interaction. La tâche à réaliser consistait à atteindre le plus rapidement possible la ligne d’arrivée dans la scène virtuelle. La position de la ligne d’arrivée était connue dès le départ afin de limiter l’effet de la performance d’orientation des utilisateurs sur la performance de déplacement, ceci afin de véritablement mesurer et évaluer la performance de déplacement. Pour permettre l’analyse et l’étude de la performance, plusieurs informations ont été enregistrées automatiquement :

- le temps : chronologie des actions et déplacements effectués par les utilisateurs. Chaque enregistrement contenait un identificateur temporel ou ‘dateur’, permettant d’analyser la performance de l’utilisateur et de mesurer le temps écoulé entre chaque événement important de la tâche.

- le point de vue : il s’agit de la position et de l’orientation perçues dans la scène virtuelle. Cette donnée est importante pour l’analyse de la performance. En effet elle rend possible de recréer précisément l’image présentée à l’utilisateur à un moment donné, en plus de pouvoir suivre la position de ce dernier dans la scène virtuelle. Cette information qui peut également s’avérer utile pour mesurer l’écart entre le parcours effectué et un chemin optimal théorique.

- la position du curseur : la position du curseur de la souris à l’écran était enregistrée afin d’observer et de mieux comprendre les actions de l’utilisateur lorsque le point de vue ne changeait pas, ou lors de problèmes avec la souris. Cette donnée pouvait également signaler un inconfort de l’utilisateur en détectant par exemple des mouvements répétés en sens inverse d’un mouvement qui aurait dû être continu, signalant ainsi une lacune au niveau de la sensibilité de l’interaction.

Enfin les « préférences» des participants étaient évaluées à la fin du test par un questionnaire.

Initialement, le temps d’exécution de la tâche devait être le seul critère de performance utilisé (les auteurs définissaient ainsi le temps écoulé entre le moment de départ et celui d’arrivée). Mais la comparaison avec le temps optimal estimé si l’utilisateur suivait la trajectoire prévue comme la plus efficace ne s’est pas révélée assez satisfaisante. Les autres critères enregistrés, supposés moins « objectifs », et simplement complémentaires, ont en fait révélés que le processus de déplacement dans un environnement virtuel est complexe. Les auteurs ont conclu que, pour une évaluation complète, la méthode de mesure et d’analyse devrait être composée de plusieurs mesures combinées à un questionnaire. Celui-ci devant recueillir les commentaires des utilisateurs ainsi que leurs réponses à des questions sur des échelles d’évaluation indépendante.

Cette conclusion argumente en faveur de notre point de vue : il paraît difficile de se fier à un seul critère. Mais quoi qu’il en soit, il nous semble surtout, et c’est aussi l’opinion de l’équipe de De Kort et Ijsselsteijn aux Pays Bas, ou de Slater et de ses équipes à Londres comme à Barcelone, qu’il n’y a que dans le cas où un environnement virtuel permet d’engendrer les mêmes réactions chez les sujets que s’ils se trouvaient dans la même situation en milieu réel, que la simulation pourraient être dite vraiment « réussie », « bonne » ou encore « efficace ». Il est alors, et alors seulement, possible de réaliser la comparaison avec la réalité et prévoir les réactions des sujets dans le monde réel.