Théorie de Cooper et Wojan (2000) reprise par White (2002)

Pour Diamond et Carey (1986), puisque tous les visages partagent les mêmes relations de premier ordre, leur reconnaissance requiert l’encodage de l’information portant sur des variations subtiles de la forme des traits faciaux ou de l’espace existant entre ces traits. Suivant le courant de cette idée et s’appuyant sur deux types de théories, les théories structurales et les théories proposant l’existence de relations coordonnées basées sur une référence, Cooper et Wojan (2000) puis White (2002) ont proposé d’opérer une dissociation entre les relations catégorielles et les relations coordonnées, appliquée aux visages. En effet, les auteurs ont tout d’abord considéré les théories de la reconnaissance de la forme (‘ « ’ ‘ structural description theories ’”) qui proposent l’existence de relations catégorielles basées sur les primitives de l’objet (‘ « ’ ‘ primitive-to-primitive categorical relations ’”), auxquelles ils feront par la suite référence simplement en tant que ‘«’ ‘ relations catégorielles ’” (‘ « ’ ‘ categorical relations ’”). D’après ces théories (voir Biederman, 1987 ; Hummel & Biederman, 1992 ; Sutherland, 1968), chaque primitive des relations catégorielles est reliée aux autres primitives dans une représentation utilisant des descripteurs catégoriels directionnels (par exemple, « au-dessus ”, « au-dessous ”, « à côté de ). Dans les relations catégorielles d’un visage, les distances entre les primitives ne sont pas spécifiées, seules les directions le sont (par exemple, un œil se situe à côté d’un autre œil). Cooper et Wojan (2000) et White (2002) ont apparenté les relations catégorielles aux relations de premier ordre. Par opposition aux théories structurales, d’autres théories ayant inspiré ces auteurs ont proposé l’existence de relations coordonnées basées sur une référence (‘ « ’ ‘ primitive-to-reference point coordinate relations ’”), qu’ils référenceront par la suite simplement en tant que « relations coordonnées ” ou « relations métriques ” (‘ « ’ ‘ metric or coordinate relations ’”). Ces théories (Bülthoff & Edelman, 1992 ; Poggio & Edelman, 1990 ; Ullman, 1989) considèrent que la distance précise de chaque primitive est représentée à partir d’un point ou groupe de points de référence fixes. Les relations coordonnées d’un visage consistent à rendre compte, par exemple, qu’un œil est près, ou à 55 mm, de l’autre œil. Cooper et Wojan (2000) et White (2002) ont apparenté ces relations aux relations de second ordre, et plus généralement aux relations de configuration (voir aussi Calder et al., 2000c ; Cooper & Wojan, 2000 ; Freire, Lee, & Symons, 2000 ; Leder & Bruce, 2000 ; Tanaka & Sengco, 1997). Les relations catégorielles et coordonnées (ou métriques), adaptées aux visages, sont représentées sur la Figure 2.

Figure 2. Un exemple de relations catégorielles (à gauche) et de relations coordonnées ou métriques (à droite) représentées sur un visage. Tiré de Cooper et Wojan (2000). Journal of Experimental Psychology: Learning, Memory, and Cognition, 26 (2), 470-488.

L’utilisation de relations catégorielles présente les avantages (i) de placer rapidement des objets spécifiques différents, présentant de grandes variations dans la position exacte de leurs éléments primitifs, dans la même catégorie de base (par exemple, une même représentation pour toutes les tasses), (ii) d’une plus grande tolérance au bruit (car les distances précises ne sont pas codées) permettant la reconnaissance malgré des points de vue différents. Malheureusement, ces relations sont inadéquates pour rendre compte de la capacité à reconnaître et à distinguer des visages (et par extension, des expressions faciales) différent(e)s. Les relations métriques présentent les avantages (i) d’avoir la capacité à capter de petites variations entre les stimuli qui ne peuvent pas être détectées dans une représentation catégorielle, (ii) de discriminer des visages (et par extension, des expressions faciales). Cependant, à cause de leur sensibilité aux variations inhérentes aux stimuli, ces relations ne peuvent pas regrouper dans une même classe d’objets des stimuli présentant de grandes variations dans leurs traits. Les forces et faiblesses des représentations catégorielles et métriques suggèrent que le type de représentations utilisées pourrait dépendre des exigences spécifiques de la tâche réalisée (Hummel & Stankiewicz, 1996). Spécifiquement, les représentations catégorielles seraient probablement très pertinentes dans la reconnaissance d’un objet à un niveau de base (par exemple, la reconnaissance d’un visage en tant que visage), tâche dans laquelle des stimuli très différents doivent être regroupés dans une même catégorie. Par contre, des représentations métriques permettraient des discriminations à l’intérieur d’une même classe d’objets (par exemple, l’identification d’un visage comme étant celui de Philippe), tâche dans laquelle des stimuli très ressemblants doivent être discriminés les uns des autres (même si celui de Philippe a quelque chose de vraiment unique).

Dans son étude, White (2002) a utilisé la même technique d’altération des deux types de relations spatiales que celle précédemment élaborée par Cooper et Wojan (1996), avec une base de données différente, celle d’Ekman et Friesen (1976). En 1996, Cooper et Wojan avaient utilisé une série de visages en couleur de personnalités auxquelles ils avaient fait subir des transformations coordonnées et des transformations catégorielles. Les premières consistaient à surélever la position des deux yeux (ce qui ne perturbe pas les relations catégorielles), tandis que les secondes consistaient à surélever la position d’un seul œil (ce qui perturbe quand même les relations métriques mais dans une moindre mesure que la première modification). Les modifications métriques avaient pour conséquence d’allonger la taille du nez et de raccourcir la taille du front. Ces modifications sont pionnières dans la littérature puisqu’elles permettent de montrer l’existence d’une dichotomie, non plus entre des modifications liées à des relations spatiales et des modifications liées aux composants eux-mêmes, mais entre des modifications inhérentes aux relations spatiales, c’est-à-dire entre les relations spatiales métriques et catégorielles. Dans une tâche de reconnaissance d’un visage, White (2002) a répliqué les résultats de l’expérience de Cooper et Wojan (2000) en montrant que la perturbation des relations coordonnées d’un visage entraînait des temps de réponse plus longs que la perturbation des relations catégorielles d’un visage. Il a conclu que la reconnaissance d’un visage utilise préférentiellement les relations coordonnées. Mais fait plus intéressant, il a mis en évidence, dans une tâche portant sur la discrimination d’expressions faciales, le pattern inverse, c’est-à-dire que la perturbation des relations coordonnées d’un visage entraînait des temps de réponse plus courts que la perturbation des relations catégorielles d’un visage, montrant ainsi, d’après lui, le rôle des relations catégorielles dans la discrimination d’expressions faciales d’un visage. Pour White (2002), il existe quatre raisons de penser que la reconnaissance des expressions faciales est différente de la reconnaissance des visages, et similaire à la reconnaissance des visages à un niveau de base ; ainsi, elle se baserait sur l’utilisation des relations catégorielles plutôt que sur l’utilisation des relations coordonnées. Une première raison est que, si notre capacité à identifier des centaines de visages requiert de l’information de configuration précise, notre capacité plus limitée à reconnaître des expressions (tristesse, joie, peur, colère, dégoût, surprise et peut être une poignée d’autres et des expressions mélangées) pourrait requérir de l’information seulement sur les traits eux-mêmes et sur leurs relations de direction. Par exemple, la tristesse pourrait être reconnue comme une conjonction d’un sourcil retroussé juste à côté d’un autre sourcil retroussé, les deux étant centrés au-dessus d’une bouche retroussée. Une seconde raison est la nature catégorielle de la reconnaissance des expressions, proposition de certains auteurs (par exemple, Calder, Young, Perrett, Etcoff, & Rowland, 1996b ; Etcoff & Magee, 1992), qui sera étudiée plus loin (section 4.2). Une troisième raison est, respectivement, la difficulté et la facilité, avec laquelle les visages et les expressions sont reconnus dans les dessins faits au crayon (Davies, Ellis, & Shepherd, 1978 ; McKelvie, 1973), les dessins dégradant les relations de configuration mais non les relations catégorielles (Leder, 1996). La quatrième raison est la dissociation générale trouvée entre les processus d’identification d’un visage et de reconnaissance de l’expression (Sergent, Ohta, MacDonald, & Zuck, 1994).