3.3.3 Composantes associées au traitement des visages (N170/VPP-N400)

Seront successivement présentées dans ce paragraphe les composantes électrophysiologiques vers 200 ms et 400 ms, respectivement associées à des traitements faciaux de nature essentiellement perceptuelle et des traitements considérés de plus haut niveau sur les visages.

Deux principales ondes, respectivement appelées “VPP” (“Vertex Positive Potential”, Jeffreys, 1989) ou “P2 vertex” (Bötzel et Grüsser, 1989), et “N170” (Bentin et coll., 1996; George et coll., 1996), ont été associées à des mécanismes de détection de percepts faciaux et, plus particulièrement, au module d’encodage structural des visages tel qu’il a été initialement défini dans le modèle de Bruce et Young (1986). Bien qu’apparaissant à des latences similaires entre 140 et 200 ms après l’apparition du stimulus avec un pic de latence enregistré vers 170 ms pour l’onde N170, ces deux ondes diffèrent par leur polarité et leur topographie sur le scalp : l’onde VPP correspondont à une positivité maximale sur les régions centro-pariétales et l’onde N170 à une négativité bilatérale maximale sur les régions occipito-temporales. Des études ont montré que l’apparition de l’une ou l’autre de ces ondes pouvait être liée aux conditions d’enregistrement, et plus particulièrement au choix de l’électrode de référence, l’utilisation d’une référence mastoïdienne, comparativement à une référence nasale, pouvant en effet entraîner une disparition des négativités temporales (Bötzel et coll., 1995). La plupart des études ayant examiné l’onde VPP générée par des stimuli faciaux ont par ailleurs été effectuées avec un nombre limité d’électrodes, généralement six électrodes disposées le long de l’axe fronto-occipital (Oz, Pz, Cz, Fz) et sur les régions temporales médianes (T3, T4; pour revue, Jeffreys, 1996). Ces conditions d’enregistrement restreintes pourraient en partie expliquer les premières interprétations suggérant que l’onde VPP reflète une composante spécifique du traitement facial, alors que cette dernière ne pourrait être que la contrepartie positive de négativités temporales ultérieurement mises en évidence dans des conditions d’enregistrement différentes (électrode de référence nasale et plus grand nombre d’électrodes recouvrant toute la surface du scalp). Cette hypothèse interprétative confortait par ailleurs des résultats antérieurement rapportés indiquant des activités spécifiques pour les visages, autour de 170-200 ms, maximales sur les régions temporales bilatérales (Sobotka et coll., 1984; Srebro,1985a, 1985b).

La composante VPP a été considérée comme spécifique au traitement visuel des représentations faciales en raison d’une réponse préférentielle, mais non exclusive, à différents types de visages (photographies ou dessins de visages humains, de visages d’animaux, présentés de face, de profil ou sous d’autres vues exceptée la vue de dos, visages illusoires constitués d’éléments non-faciaux). Notons toutefois que plusieurs autres catégories d’objets vivants ou non-vivants, présentés sous forme d’images en deux dimensions (Figure 36), ont également entraîné une positivité vers 150-200 ms, maximale au vertex, seuls les patterns abstraits, non-représentatifs, n’engendrant pas d’onde VPP (Jeffreys, 1989; Jeffreys et Tukmachi, 1992). Même s’il existe une importante variabilité interindividuelle au niveau des amplitudes et des latences de l’onde VPP, en partie liée aux différences anatomiques existant entre les structures cérébrales des sujets, toutes les catégories d’objets testées ont toujours généré des ondes VPP avec des amplitudes plus faibles et des latences plus longues que celles enregistrées pour la catégorie des stimuli faciaux (Bötzel et Grüsser, 1987; Grüsser et coll., 1987; Jeffreys et Musselwhite, 1987; Bötzel et Grüsser, 1989; Bötzel et coll., 1989; Jeffreys, 1989; Grüsser et coll., 1991; Heusser et coll., 1991; Jeffreys et Tukmachi, 1992; Jeffreys, 1993). Une observation importante indique par ailleurs que l’onde VPP ne semble pas présenter de sensibilité particulière à des visages mélangés, inversés, ou encore à des stimuli faciaux réduits à leur simple contour ou à des traits internes (yeux, nez, bouche). Il a en effet été montré que ces différentes configurations faciales modifiées généraient une composante VPP aussi ample que celle produite par des visages entiers présentés à l’endroit, seule la latence étant légèrement retardée d’environ 20 à 40 ms (Jeffreys, 1989, 1993).

Les contreparties négatives sur les régions occipito-temporales ont par la suite été plus spécifiquement associées aux processus d’encodage structural des traits faciaux (Seeck et coll., 1989, 1990; Seeck et Grüsser, 1992; Bötzel et coll., 1995; Bentin et coll., 1996; George et coll., 1996; pour revue, Bruyer, 1988; Bötzel et coll., 1989; Jeffreys, 1996).

message URL fig36.gif
Figure 36. Exemples des différentes catégories d’objets testés pour examiner la spécificité des ondes VPP (A) et N170 (B) au traitement perceptif des visages (d’après Jeffreys et Tukmachi, 1992; Bentin et coll., 1996).

L’onde N170, maximale vers 170 ms après le début de la stimulation sous les électrodes T5 et T6, varie en fonction des configurations faciales évoquées ci-dessus (Figure 36). S’il a été montré que l’onde N170 était maximale pour des photographies de visages humains présentés à l’endroit, comparativement à des photographies de visages d’animaux, de mains, de voitures, de mobiliers, ou encore des images “brouillées” (Figure 37), sa latence s’est révélée plus tardive pour des visages humains présentés à l’envers et certains traits faciaux internes (nez et bouche), et son amplitude plus grande pour des visages dont les traits ont été mélangés et pour des yeux présentés isolément (Bentin et coll., 1996).

message URL fig37.gif
Figure 37. Distributions sur le scalp de la composante N170. Ces négativités bitemporales, plus importantes sur les régions occipito-temporales droites (voir les courbes correspondantes sous l’électrode T6) que gauches (T5), ont été enregistrées, à 172 ms pour des visages humains présentés à l’endroit (A), et des yeux présentés isolément en dehors d’un contexte facial (B). Notons que les autres traits internes faciaux, tels que la bouche (C) et le nez (D), génèrent une onde N170 d’amplitude plus faible que celle enregistrée pour les yeux et les visages entiers, respectivement à 212 et 232 ms (d’après Bentin et coll., 1996).

D’autres études ont conforté ces résultats et confirmé une prépondérance hémisphérique droite pour le traitement perceptif des visages (Bötzel et coll., 1995; George et coll., 1996, 1997; Eimer, 1998; Bentin et coll., 1999; Taylor et coll., 1999; Campanella et coll., 2000; Eimer, 2000; Halit et coll., 2000; Puce et coll., 2000; Rossion et coll., 2000).

En résumé, la composante N170 a été interprétée comme le reflet sur le scalp de mécanismes cérébraux spécifiquement impliqués dans la détection des patterns faciaux humains, les yeux représentant un des indices de détection les plus saillants parmi les traits internes.

S’il n’est pas exclu que les ondes N170 et VPP soient la résultante sur le scalp d’activités liées à des générateurs corticaux situés au sein d’une même large région bilatérale temporale inférieure (gyri inféro-temporal et fusiforme dans la fissure occipito-temporale latérale) et médiane (amygdale et hippocampe dans les structures limbiques profondes), il est également possible que des populations neuronales différentes, mais toutes situées dans cette même large région cérébrale, soient activées préférentiellement et distinctement pour l’encodage structural des informations configurales relatives aux objets d’une part, et aux patterns faciaux d’autre part, l’activité de ces différents générateurs se traduisant sur le scalp par une modulation des amplitudes des ondes positive (VPP) et négative (N170) associées (pour revue, Jeffreys et Tukmachi, 1992; Bentin et coll., 1996; George et coll., 1996; Jeffreys, 1996).

Quelle que soit la localisation de leurs générateurs, ces composantes, relativement insensibles à l’aspect familier des visages ont été associées à une étape de détection faciale antérieure aux processus, à proprement parler, de reconnaissance et de dénomination (Bötzel et Grüsser, 1989; Jeffreys et Tukmachi, 1992; Jeffreys, 1996; George et coll., 1997; Jemel et coll., 1999; Bentin et Deouell, 2000; Séverac Cauquil et coll., 2000; Guillaume et Tiberghien, 2001; mais voir aussi Pizzagalli et coll., 2000 pour des résultats contradictoires).

Contrairement aux études ayant examiné les mécanismes électrophysiologiques sous-tendant les traitements perceptifs dits de bas niveau sur les visages, les études ayant examiné les étapes neurophysiologiques impliquées dans les processus de reconnaissance faciale n’ont pas encore permis d’aboutir à des résultats consensuels.

La composante N400, précédemment décrite pour les traitements langagiers, a également été enregistrée dans des tâches de reconnaissance faciale dans des paradigmes d’amorçage sémantique manipulant des visages familiers. Dans ce type de protocoles, il est généralement demandé aux sujets de discriminer le plus vite possible des visages connus présentés parmi des visages inconnus, les visages connus pouvant être précédés d’autres visages de personnalités publiques appartenant ou non à la même catégorie professionnelle (hommes politiques, journalistes, acteurs, sportifs, etc.) ou de visages connus recomposés. L’analyse des PE de surface a montré la présence d’une large négativité, maximale sur les aires fronto-centrales entre 300 et 500 ms et associée à une onde de type N400. Certaines études ont toutefois cherché à différencier d’un point de vue topographique l’onde N400 générée par des mots de celle produite par des visages en utilisant au sein d’un même protocole ces deux types de stimuli (Schweinberger et coll., 1994; Burgess et Gruzelier, 1997). Les résultats ont indiqué une distribution des potentiels latéralisée sur l’hémiscalp gauche pour les mots et sur l’hémiscalp droit pour les visages.

Dans le but de mieux définir le rôle fonctionnel de l’onde N400 associée aux visages, plusieurs études ont examiné les paramètres qui pouvaient entraîner une modulation de cette composante. Il a par exemple été montré que l’amplitude de l’onde N400 générée par un visage d’homme politique célèbre était davantage réduite lorsque le visage était précédé par un visage familier d’un autre homme politique que par celui d’une célébrité appartenant à une autre catégorie sémantique (acteurs, sportifs, etc.). Ces observations ont ainsi permis d’associer cette composante tardive à des processus de recherche de nature sémantique mettant parfois en jeu des mécanismes d’inhibition pour les informations conceptuellement inappropriées (Smith et Halgren, 1987; Barrett et Rugg, 1989; Debruille et coll., 1989; Bentin et McCarthy, 1994; Bobes et coll., 1994; Debruille et coll., 1996; Jemel et coll., 1999; Chaby et coll., 2001; voir également, Koyama et coll., 1992; Tanaka et coll., 1999).

L’onde N400 ne semble en revanche pas être directement associée aux processus de maintien en mémoire de travail des visages nouvellement appris Schweinberger et Sommer, 1991; Sommer et coll., 1991; Begleiter et coll., 1993; Hertz et coll., 1994; Begleiter et coll., 1995; Endl et coll., 1998; Paller et coll., 1999, 2000; voir également, Mecklinger et Müller, 1996; Diedrich et coll., 1997; Ranganath et Paller, 1999).