4.2. L’hypothèse de perception catégorielle («Categorical Perception”, CP)

Etcoff et Magee (1992) ont été les premiers à soulever la question de savoir si les mécanismes perceptifs responsables de la reconnaissance des expressions faciales sont en réalité voués aux catégories émotionnelles, ou si la perception est continue, avec un membre de la catégorie ‘ « ’ ‘  (...) assigned by higher conceptual and linguistic systems but the actual perception would be of continuous variation, with category membership having no real effect at the perceptual level » ’(p.229). Etcoff et Magee (1992) ont créé des caricatures (des dessins au trait) des photographies d’Ekman et Friesen (1976) et des expressions par morphing selon dix étapes entre des paires de ces caricatures. Ils ont inclus un continuum de plusieurs expressions et ont trouvé que toutes les expressions, exceptée la surprise, étaient perçues de manière catégorielle. Leurs résultats ont donc posé un sacré défi pour défendre l’idée d’un espace continu d’émotions. L’étude d’Etcoff et Magee (1992) présentait néanmoins certaines limites : premièrement, les stimuli étaient des dessins, non des images de qualité. Deuxièmement, chaque participant était exposé à un seul continuum. Troisièmement, les résultats de la tâche de discrimination étant une tâche séquentielle de type ABX (consistant en la présentation séquentielle de trois stimuli, la tâche portant sur le troisième stimulus), ils pourraient refléter un phénomène de mémoire à court terme plutôt qu’un phénomène perceptif. D’après ces limites, Calder et al. (1996b) ont étendu les premières expériences avec des séquences de photographies de visages issues de morphing de bonne qualité d’image, chaque séquence utilisant un acteur différent ou un même acteur « J.J. ”, issu de la base de données d’Ekman et Friesen (1976). Dans l’ensemble, les résultats étaient cohérents avec l’hypothèse de perception catégorielle : des frontières de catégories nettes ont été observées et une meilleure discrimination près des frontières, indépendamment du fait qu’il y ait un seul ou plusieurs continua présents dans l’expérience et indépendamment du fait que la tâche de discrimination utilisée était séquentielle ou simultanée. Les expériences de Calder et al. (1996b) ont donc soutenu l’hypothèse de perception catégorielle des expressions faciales, mais les auteurs sont restés méfiants quant à l’interprétation forte d’Etcoff et Magee (1992), selon laquelle l’assignement des expressions faciales à une catégorie est irrépressible : ‘ « ’ ‘  People cannot help but see the face as showing one or another kind of emotion; discriminating facial expressions is easier for different emotions because it can be directed by the qualitatively distinct internal category representations  ’» (Etcoff & Magee, 1992, p.229). Ils ont plutôt proposé que la perception catégorielle serait ‘ « ’ ‘  (...) an emergent property of population coding in the nervous system; in other words, (…) categorical perception effects arise whenever populations of cells become tuned to distinct categories  ’» (Calder et al., 1996b, p.116).

De plus, Young et al. (1997) ont étudié l’hypothèse de perception catégorielle : ils ont demandé à des participants de catégoriser des photographies de visages en noir et blanc, issus de la base de données d’Ekman et Friesen (1976). Dans une première expérience, ces visages exprimaient les six émotions de base (joie, tristesse, peur, colère, dégoût et surprise) auxquelles l’expression neutre a été ajoutée dans une deuxième expérience. Les auteurs ont construit des continua d’expressions faciales issues d’un morphing, passant par toutes les combinaisons de paires possibles des sept expressions (c’est-à-dire dans l’expérience 1, quinze continua, puis six continua supplémentaires dans l’expérience 2). Cette technique provient de celle utilisée par Calder et al. (1996b) sur la même base de donnée, appliquée à seulement trois continua (joie - tristesse, tristesse - colère, colère - peur) sur les visages de trois individus différents (PF, WF, EM). Les auteurs ont rejeté l’idée d’un modèle à deux dimensions (selon deux polarités agréable - désagréable) dont les prédictions seraient doubles : (i) les transitions entre les expressions devraient être continues (c’est-à-dire des passages non abrupts) et (ii) au moins certaines transitions entre les expressions devraient passer par une expression centrale neutre ou une expression correspondant à une troisième émotion, signifiant que les images au centre de certains continua devraient être identifiées comme une expression autre que les deux expressions présentes aux antipodes. Or, Young et al. (1997) n’ont vérifié aucune de ces deux prédictions. Au contraire, toutes les images issues du morphing ont été identifiées comme des catégories d’expressions appartenant à l’un ou l’autre point du continuum, avec une frontière catégorielle nette au milieu.

Par ailleurs, s’inspirant de la technique de Brennan (1985), Calder et al. (2000b) ont utilisé des caricatures consistant à exagérer les positions des points des traits anatomiques par rapport aux localisations des points correspondants sur la norme d’un visage de référence (Benson & Perrett, 1991a ; Burt & Perrett, 1995 ; Calder, Young, Benson, & Perrett, 1996a ; Perrett, May, & Yoshikawa, 1994 ; Rhodes et al., 1987). L’avantage particulier de cette procédure est qu’elle est très objective. Pour les expressions faciales en particulier, son but principal est d’exagérer les traits distinctifs de l’expression (par exemple, le nez plissé, les sourcils relevés, etc.), tandis que les traits distinctifs du visage d’une personne sont relativement préservés (par exemple, un gros nez, des sourcils épais, etc.). Ainsi, Calder, Young, Rowland, et Perrett (1997)ont exagéré chaque expression faciale par rapport à une photographie de la même personne exprimant une émotion neutre (c’est-à-dire une norme d’expression faciale neutre). Notons que le choix de prendre des visages issus de morphing à partir d’une expression neutre est important et peut influencer la perception de l’expression faciale (Calder et al., 2000b).

D’autres expériences ont montré que les paires de visages, issues d’un morphing dont les expressions se situent près de la frontière catégorielle, sont mieux discriminées que des paires de visages présentant autant de différences physiques dans leurs expressions, mais se situant à l’un ou l’autre bout de la frontière (Calder et al., 1996b). L’ensemble de ces résultats a donc été interprété comme incohérent avec un modèle à deux dimensions.