3.2. Description et justification de notre choix : le morphing d’intensités d’expressions faciales émotionnelles

Dans nos expériences 2 et 3, nous avions un objectif commun à celui de Cooper et Wojan (1996, 2000) et de White (2002), c’est-à-dire étudier la manifestation supposée des relations spatiales visuelles métriques et catégorielles, grâce à un outil particulier : le visage. Cependant, il nous semble que la technique utilisée par ces auteurs ne soit pas très écologique : en effet, dans la vie quotidienne, on ne perçoit pas un visage ayant des yeux décalés l’un par rapport à l’autre (suite à une déformation d’ordre catégoriel) ou comportant un nez et un front disproportionnés (suite à une déformation d’ordre métrique). Ainsi, nous avons choisi d’adopter une technique identique à celle utilisée par Calder et al. (1996b) puis par Young et al. (1997). Cette technique consiste à utiliser des intensités d’expressions faciales créées et modifiées avec la technique du morphing, et variant selon un continuum. Outre le fait d’être plus écologique, cette technique nous semble plus précise, dans la mesure où un contrôle extrêmement fin a été opéré par les concepteurs de cette technique, en faisant varier très précisément l’intensité de différentes expressions faciales à l’intérieur même d’une émotion.

Dans leur étude réalisée en 1997, Young et al. ont demandé à des participants de catégoriser des photographies de visages en noir et blanc créés par Ekman et Friesen (1976), exprimant les six émotions de base (Expérience 1) auxquelles ensuite a été jointe l’expression neutre (Expérience 2). La technique utilisée par les auteurs a été appliquée au visage d’un seul individu (JJ), pour créer, à partir des six expressions de base, les quinze continua possibles (Expérience 1) puis six continua supplémentaires (Expérience 2). Cette technique provient de celle utilisée par Calder et al. (1996b) sur la même base de donnée, appliquée à seulement trois continua (joie - tristesse, tristesse - colère, colère - peur) sur les visages de trois individus différents (PF, WF, EM). Issue de Benson et Perrett (1991b), elle consiste en trois étapes. (i) La délinéation consiste à poser 186 points manuellement sur les photographies de visages. Les localisations de ces points ont été spécifiées en termes de frontières anatomiques, chaque trait facial étant représenté par un certain nombre de points (par exemple, la bouche a été représentée par 22 points et chaque sourcil par 8 points). Ces points ont ensuite été joints pour produire une représentation délinée comprenant 50 contours de traits. (ii) La deuxième étape est l’interpolation de la forme. Un continuum de formes d’expressions a été généré à partir de deux formes appartenant à deux expressions prototypiques délinées (par exemple, la joie et la tristesse). Une différence de vecteur pour chaque frontière a été calculée. Ce processus a été répété pour les 186 points pour générer cinq types d’expressions émotionnelles, considérées par les auteurs comme comportant 10% d’une émotion A et 90% d’une émotion B, 30% de A et 70% de B, 50% de A et 50% de B, 70% de A et 30% de B, 90% de A et 10% de B. (iii) Produire une image de bonne qualité pour chacune de ces expressions interpolées est la dernière étape. Elle consiste à prendre les deux expressions prototypiques (c’est-à-dire contenant 100% d’émotion) des deux émotions entre lesquelles on désire créer un continuum, à déformer ces deux expressions afin d’obtenir une forme commune, cette forme commune résultant d’un alignement entre tous les points représentant un même trait sur les deux expressions. Puis, on a accordé aux deux expressions un poids approprié au degré d’émotion que l’on souhaite obtenir. Par exemple, pour un visage contenant 90% de joie et 10% de tristesse, les intensités des pixels ont déformé l’expression prototypique de joie de 10% vers le visage de tristesse et l’expression prototypique de tristesse de 90% vers le visage de joie. Les niveaux de gris dans ces deux images ont alors été homogénéisés en prenant en considération le rapport de neuf parts provenant de l’expression prototypique de joie et d’une part provenant de l’expression prototypique de tristesse. Cependant, une différence majeure entre notre étude et celles de Calder et al. (1996b) et de Young et al. (1997, Expérience 1) est que, dans notre étude, le passage d’une émotion à une autre a été assuré par l’expression neutre (comme par exemple, Calder et al., 2000b ; Young et al., 1997, Expérience 2).

Comme nous l’avons énoncé dans le chapitre 2, plusieurs paramètres inhérents aux visages se situant hors de nos objectifs peuvent interagir avec le traitement de la valence émotionnelle des stimuli visuels. Ces paramètres pourraient être liés au degré de reconnaissance des visages (Bar et al., 2001 ; Grill-Spector, Kushnir, Hendler, & Malach, 2000), à l’intensité émotionnelle (Critchley et al., 2000b ; Lane et al., 1999 ; Taylor et al., 2000), aux traits catégoriels (c’est-à-dire les visages, les objets, Ishai, Ungerleider, Martin, Maisog, & Haxby, 1997 ; Kanwisher et al., 1997) et aux traits visuels (Lerner, Hendler, Ben-Baashat, Harel, & Malach, 2001 ; Malach et al., 1995). Dans notre étude, nous avons contrôlé tous ces facteurs, soit en rendant leurs effets nuls, soit en les manipulant pour étudier leur(s) manifestation(s). Nous avons rendu nulle l’influence possible des traits catégoriels et du degré de reconnaissance des visages par l’utilisation d’un seul type de stimulus (le visage) correspondant à celui d’un seul individu (la photographie du visage d’une femme, MM, extraite de la base de données de Young, Perrett, Calder, Sprengelmeyer, & Ekman, 2002). Afin de contrôler les traits visuels, certaines études ont manipulé l’expression faciale (Breiter et al., 1996 ; Critchley et al., 2000a ; Dolan & Morris, 2000). C’est aussi le choix que nous avons opéré de manière encore plus fine puisque le contrôle des traits visuels est assuré dans deux de nos études par des variations d’expressions faciales émotionnelles selon différents degrés, à l’intérieur d’une même émotion. Les expressions émotionnelles que nous avons sélectionnées varient dans leurs intensités et chacune diffère de sa voisine directe par une augmentation ou une diminution de 10% d’émotion.