Introduction

Le visage est un stimulus dont l'importance et la particularité ont été fréquemment remarquées dans la littérature scientifique. Il est tout d'abord un élément prépondérant de la vie sociale. Il nous permet d'identifier une personne et ainsi de retrouver un ensemble d'informations sémantiques et épisodiques qui lui sont propres. Son nom, sa profession ou des souvenirs épisodiques sur ses dernières rencontres peuvent ainsi être utilisées dans l'échange. Par ailleurs, il nous apporte un grand nombre d'informations, que l'on connaisse ou non la personne. Par exemple, il permet de déterminer si on a affaire à une femme ou à un homme, à un enfant, un adolescent, un adulte ou une personne âgée ou, encore, à une personne d'origine caucasienne, africaine ou asiatique. Le visage est aussi un élément fondamental de la communication des états émotionnels ; il permet d'inférer l'état émotionnel d'un tiers et l'informe, parfois à notre insu, sur le nôtre. Il permet également de simuler certaines émotions. Enfin, il est une source d'inférences sur la personnalité ou les compétences. A ce titre, il est souvent utilisé pour se former une impression sur, par exemple, l'intelligence, l'honnêteté ou l'attirance.

Malgré cette multitude d'informations, le visage est un stimulus particulièrement facile à traiter. Sa reconnaissance se fait très rapidement, en moins d'une seconde, sans effort apparent et quasi automatiquement. De plus, le nombre de visages différents qu'il est possible d'apprendre ne semble pas limité et l'apprentissage d'un nouveau visage se fait rapidement et facilement. On peut ainsi reconnaître le visage de personnes qu'on n'a pas vu depuis 35 ans avec une très bonne précision (e. g., H. Bahrick, O. Bahrick, & Wittlinger, 1975). Cette capacité élevée conduit de nombreux chercheurs à considérer que tout homme est un "expert" de la reconnaissance du visage (e. g., Diamond & Carey, 1986 ; H. Ellis, 1981). Plusieurs recherches indiquent que cette capacité est très précoce : même si le nouveau-né n'est pas encore un expert, il discrimine dès les premiers jours le visage de leur mère de visages étrangers (e. g., Bushnell, Sai, & Mullin, 1989). Il se tourne aussi de préférence vers des visages, même schématiques, plutôt que vers d'autres objets de complexité pourtant équivalente (e. g., Goren, Sarty, & Wu, 1975 ; Johnson, Dziurawiec, H. Ellis, & Morton, 1991). Dans les 6 premiers mois, il distingue des visages jeunes de visages âgés et des visages féminins de visages masculins. Vers 5 à 7 mois, il parvient à apprendre et à reconnaître de nouveaux visages (voir Carey, 1992).

Le visage est pourtant un stimulus visuellement ambigu : deux visages se ressemblent beaucoup par comparaison à d'autres catégories de stimuli. La forme générale varie peu, les différentes parties qui le constituent sont toujours les mêmes, avec à peu près la même forme et la même position relative. Leur discrimination nécessite donc des mécanismes fins. De plus, la reconnaissance d'un visage implique de déterminer son unicité : il faut le distinguer de tous les autres exemplaires de la catégorie. Ceci constitue d'ailleurs une nouvelle particularité du visage par rapport aux autres catégories d'objets ou, généralement, il s'agit uniquement de déterminer si un stimulus appartient ou non à la catégorie.

Les particularités du visage ont conduit de nombreux chercheurs à postuler l'existence d'un "module" spécifiquement dédié au traitement de ce type d'information (e. g., Bruce & Young, 1986 ; Fodor, 1983 ; Kanwisher, McDermott, & Chun, 1997). Selon eux, seul un module spécialisé dans le traitement de ce type de stimuli, effectuant des opérations automatiques et "encapsulées", c'est à dire indépendantes du reste du système cognitif, peut permettre un traitement du visage aussi rapide et précis1. Ce module général pourrait être décomposé en différents sous-systèmes spécialisés dans le traitement d'informations faciales spécifiques. Par exemple, un module serait impliqué dans la reconnaissance du visage et serait distinct et indépendant du module chargé du traitement de l'expression faciale émotionnelle ou de celui chargé de la catégorisation du genre (ces deux derniers modules étant eux même indépendants). Ce découpage en modules est présenté comme la meilleure - voire la seule - architecture possible de la capacité humaine pour ce type de stimuli. De nombreuses recherches ont été conduites pour tenter de la valider dans des disciplines aussi diverses que la psychologie cognitive, la neuropsychologie ou la neurophysiologie. Ces recherches avaient pour objectif de parvenir à dissocier les modules hypothétiques spécialisés dans le traitement d'informations faciales spécifiques. Ainsi, le domaine d'étude de la reconnaissance du visage est devenu un point de convergence important des différentes disciplines constitutives des sciences cognitives.

Un modèle récapitule clairement cet état d'esprit de la théorie que nous venons de décrire ; il s'agit du modèle élaboré par Bruce et Young (1986). Il est d'ailleurs encore actuellement le modèle dominant du champ, même si de nouvelles propositions théoriques commencent à émerger (e. g., Haxby, Hoffman, & Gobbini, 2000). Depuis sa publication, ce modèle a été présenté à de très nombreuses reprises avec, parfois, quelques modifications ou précisions notables (e. g., Bruce, 1988, 1996 ; Bruce & Young, 1998 ; Burton, Bruce, & Johnston, 1990 ; Young, 1992, 1998 ; Young & Bruce, 1991). Mais l'hypothèse sous-jacente de modularité n'a jamais été remise en cause. Nous présenterons donc la version originale (Figure 1).

message URL FIG01.gif
Figure 1 : Adaptation du modèle de Bruce et Young (1986).

Selon ce modèle, la vue d'un visage donne d'abord lieu a un encodage structural où deux types de codes sont extraits. Le premier est un code "pictural", qui correspond à une description du visage dépendante du point de vue et qui capture les aspects proprement visuels de l'image (grain et texture, illumination, pose, expression). Le second est un code structural, qui correspond à une description indépendante du point de vue et qui capture les aspects structuraux et invariants du visage. Les informations changeantes (telles que la luminosité ou l'expression), ne sont pas codées à ce niveau. Par ailleurs, on dispose en mémoire d'un certain nombre de représentations mnésiques des visages des personnes que l'on connaît. Ces représentations, appelées Unités de Reconnaissance du Visage (URVs) dans le modèle, sont considérées comme des codes structuraux correspondant à la configuration du visage d'un individu donné. Il existe autant d'URVs que de personnes connues. Bruce et Young (1986) proposent même que plusieurs URVs existent pour une même personne selon les poses. Lorsque l'on voit un visage, le résultat de l'encodage structural est comparé au stock des URVs. Si le visage appartient à quelqu'un de connu, une URV est alors activée. Cette dernière activation permet au système cognitif de savoir que la personne lui est familière. L'activation de cette URV permet alors de retrouver les informations sémantiques qui concerne la personne (e. g. : profession, adresse, souvenirs épisodiques particuliers). La récupération du nom et l'identification complète de la personne est alors possible.

Parallèlement à la reconnaissance, plusieurs autres informations peuvent être extraites. L'analyse de l'expression faciale peut notamment s'effectuer à partir de la représentation dépendante du point de vue. Toujours à partir de cette représentation, il est possible de lire sur les lèvres pour anticiper les mots prononcés. Enfin, à partir des codes picturaux et structuraux, on peut extraire de nombreuses informations sémantiques dérivées de l'analyse visuelle de la structure du visage (par exemple, le genre ou l'âge). Bruce et Young (1986) considèrent que les différentes informations sont extraites en parallèle et indépendamment les unes des autres. En d'autres termes, la reconnaissance, l'analyse de l'expression, la lecture labiale, et les processus visuels dirigés opèrent sans interférence. Cette hypothèse d'indépendance des différents processus de traitement de l'information faciale est, encore aujourd'hui, vigoureusement défendue par de nombreux d'auteurs (e. g., Bruce & Young, 1998 ; Campbell, Brooks, De Haan, & Roberts, 1996 ; Nachson, 1995 ; Young & Bruce, 1991). Cependant, depuis quelques années, des données contradictoires, de plus en plus nombreuses, amènent plusieurs auteurs à nuancer cette hypothèse (e. g., Dolan, Fletcher, Morris, Kapur, Deakin, & Frith, 1996 ; Dubois, Rossion, Schiltz, Bodart, Michel, Bruyer, & Crommelinck, 1999 ; Sansone & Tiberghien, 1994 ; Schweinberger, Burton, & Kelly, 1999 ; Schweinberger & Soukup, 1998).

Tout au long de ce travail, nous nous intéresserons aux processus mis en oeuvre dans le traitement de l'information faciale. Dans un premier temps, nous ferons le point sur l'état actuel de la littérature concernant la reconnaissance du visage (Chapitre 1), le traitement de l'expression faciale émotionnelle et la catégorisation du genre (Chapitre 2). Nous analyserons aussi les données qui étayent ou contredisent l'hypothèse d'indépendance du traitement de ces trois informations (Chapitre 3). Nous tenterons alors de déterminer le poids des différentes parties du visage (Chapitre 4) et des différentes bandes de fréquences spatiales (Chapitre 5). Nous présenterons aussi les recherches que nous avons menées et qui indiquent que, d'une part, la reconnaissance peut être influencée par l'expression faciale émotionnelle et le genre du visage (Chapitre 6) et, d'autre part, la familiarité du visage peut influencer le traitement de son expression faciale émotionnelle (Chapitre 7). Nous présenterons, enfin, une étude des capacités de traitement de l'information faciale chez des patients schizophrènes (Chapitre 8), qui permettra d'éclairer, par une méthode pathologique, la nature cognitive des relations entre traitement de l'expression et traitement de l'identité. En conclusion, nous proposerons une nouvelle conception théorique et une nouvelle architecture des processus cognitifs de traitement de l'information faciale.

Notes
1.

Tout au long de ce mémoire, le terme de module fera toujours référence à la définition fodorienne de cette notion. Nous préférerons le terme de processus quand nous parlerons de traitements qui ne présentent pas, selon nous, les caractéristiques de modularité et d'encapsulation décrites par Fodor (1983).