1.3 Des neurones sélectifs au traitement des visages

Les premières séries de travaux réalisées chez le singe anesthésié (Bruce et coll., 1981; Desimone et coll., 1984) ou éveillé (Perrett et coll., 1982) ont permis de mettre en évidence l’existence de neurones spécialisés dans le traitement des visages (“face-cell”). La plupart de ces neurones ont été observés dans les régions du gyrus temporal inférieur (cortex IT) ainsi qu’au niveau de la fissure temporale supérieure (STS), avec toutefois une plus grande concentration des “cellules-visages” dans les aires TEm et TPO, respectivement situées dans la partie ventrale du cortex IT et dans la partie supérieure de STS (Figure 23). Ces neurones ne représentent en règle générale qu’environ 10 à 20% des cellules nerveuses de ces différentes régions, et seraient regroupés en colonnes perpendiculaires à la surface du cortex (Perrett et coll., 1982; Baylis et coll., 1987; Gross, 1992; Young et Yamane, 1992; pour revue, Desimone, 1991). Leur latence serait par ailleurs de seulement 80 à 140 ms (latence médiane autour de 100 ms) après l’apparition du stimulus (Robinson et Rugg, 1988; Oram et Perrett, 1992; Rolls, 1992; Tovee et coll., 1993; Rolls et Tovee, 1994; Tovee et Rolls, 1995; Fabre-Thorpe et coll., 1998; Sugase et coll., 1999; Keysers et coll., 2001). Les réponses des neurones sélectifs aux visages ont été décrites comme systématiquement plus importantes pour les stimuli faciaux que pour tout autre type de stimulus (mains, brosses, formes tri- ou bi-dimensionnelles, signifiantes ou non, et parfois à forte charge émotionnelle).

message URL fig23.gif
Figure 23. Représentation aplatie des aires visuelles des lobes occipital, temporal et pariétal chez le singe macaque (d’après Desimone, 1991). Réponses d’un neurone situé dans l’aire polysensorielle supérieure (STP) du cortex inféro-temporal (IT). Ce neurone répond préférentiellement aux dessins de visages de singes et d’hommes (taux de décharge les plus importants, 1ère ligne), les visages sans yeux et les caricatures de visage générant des réponses plus faibles (2ème ligne). En revanche, ce neurone ne répond pas à des dessins de visages mélangés, de mains ainsi qu’à des patterns de traits sans signification (3ème ligne, d’après Bruce et coll., 1981).

Il a par ailleurs été montré que les visages présentés sans les yeux ou sous forme de caricatures génèrent des réponses avec des amplitudes moins grandes (Bruce et coll., 1981; Baylis et coll., 1985; Saito et coll., 1986; pour revue, Desimone, 1991; Figure 23). La majorité des “cellules-visages” enregistrées ont des réponses qui varient peu ou pas en fonction de la taille, de la couleur, du contraste (fréquences spatiales), ou de l’orientation (dans un plan horizontal) des stimuli (Perrett et coll., 1982; Desimone et coll., 1984; Rolls et Baylis, 1986; Hasselmo et coll., 1989b; Yamane et coll, 1990). Ces “cellules-visages” ne sont généralement pas activées par des stimuli faciaux dont les composantes internes sont mélangées, et leur réponse est plus faible lorsqu’un trait facial est présenté isolément ou une composante interne du visage masquée (Perrett et coll., 1982, 1988; Desimone et coll., 1984; Rolls et coll., 1994). Ces résultats ont conforté l’hypothèse d’un encodage configural global des stimuli faciaux.

Bien que ces neurones aient été appelés d’une façon générique “cellules-visages”, en raison de leur réponse sélective et maximale à des représentations globales de visages, il semble exister des sous-populations neuronales qui répondent plus spécifiquement à certains traits faciaux, tels que la bouche, les cheveux, et en particulier les yeux (Bruce et coll., 1981; Perrett et coll., 1982; Desimone et coll., 1984; pour revue, Perrett et coll.,1987; Nahm et coll., 1997), avec des cellules sensibles à la direction du regard (Perrett et coll., 1985, Campbell et coll., 1990; Heywood et Cowey, 1992). D’autres études ont montré l’existence d’assemblées neuronales distinctes codant séparément les différents angles de vue des visages (rotation de la tête dans un plan tridimensionnel) : certaines assemblées répondraient préférentiellement à des vues de face impliquant des regards directs, d’autres à des vues de profil, tandis que certains neurones répondraient indépendamment de l’angle de rotation de la tête (Desimone et coll., 1984; Perrett et coll., 1985, 1988; Hasselmo et coll., 1989b; Harries et Perrett, 1991).

L’hypothèse interprétative la plus probable pour l’ensemble de ces résultats repose sur l’idée d’un codage distribué des représentations faciales sous-tendu par différentes assemblées neuronales situées, pour la plupart, dans le cortex temporal du singe. Cette hypothèse n’exclurait toutefois pas l’existence de cellules plus “gnostiques” codant la configuration globale des visages, et vers lesquelles pourraient converger les résultats des traitements des différentes informations faciales parallèlement sous-tendus par d’autres assemblées neuronales (Perrett et coll., 1984, 1987).

Les résultats obtenus par Hasselmo et collaborateurs (1989a), puis ultérieurement par Young et Yamane (1992), ont apporté un support neurophysiologique à cette hypothèse puisqu’ils suggèrent l’implication de populations neuronales distinctes dans le traitement de l’expression faciale et celui de l’identité. Ils ont en effet montré que les neurones présentant une sélectivité au traitement de l’expression faciale étaient principalement localisés dans la fissure temporale supérieure tandis que ceux impliqués dans le traitement de l’identité faciale (associée à une analyse des ressemblances physiques entre les visages) étaient surtout localisés dans le gyrus temporal inférieur. Des neurones répondant de façon sélective aux stimuli faciaux ont également été enregistrés dans des régions extérieures au cortex temporal, telles que le complexe amygdalien (Rolls, 1984), le gyrus cingulaire (Morecraft et coll., 1996), et le cortex préfrontal (Pigarev et coll., 1979; Wilson et coll., 1993; Bates et coll., 1994; O Scalaidhe et coll., 1997, 1999).

S’il semble bien exister des neurones spécialisés dans le traitement des visages, des études récentes ont soulevé la question de la véritable fonction de ces neurones. Il a en effet été montré que le surentraînement d’un animal pouvait conduire à l’apparition d’une sélectivité des réponses des neurones du cortex IT à un objet complexe ou tout autre stimulus visuel (par exemple, des figures fractales) nouvellement appris (Miyashita, 1988; Miyashita et Chang, 1988; Rolls et coll., 1989; Sakai et Miyashita, 1991; Tovee et coll., 1996).

Parallèlement, des études ont indiqué une modification des réponses neuronales (augmentation du temps de réaction de 10 à 60 ms et réduction de l’amplitude) pour des visages présentés à l’envers, mais seulement lorsque les singes ont été entraînés à distinguer des stimuli faciaux et non-faciaux (Perrett et coll., 1988; Hasselmo et coll., 1989b). Bien que les données comportementales sur l’effet d’inversion faciale chez les singes soient contradictoires, les unes indiquant une absence de cet effet (Rosenfeld et Van Hosen, 1979; Bruce, 1982; Overman et Doty, 1982; Dittrich, 1990), les autres rapportant un effet d’inversion faciale observé soit uniquement pour les visages humains (Phelps et Roberts, 1994; Wright et Roberts, 1996), soit à la fois pour des visages humains et des visages de singes de la même espèce que ceux testés (Tomonaga et coll., 1993; Tomonaga, 1994; Parr et coll., 1998; Vermeire et Hamilton, 1998), la question sur l’existence de neurones sélectifs à une catégorie d’objets, à savoir ici des visages, ou à n’importe quel objet pour lequel le singe aurait développé une expertise de traitement persiste.