IV.3.2. Etudes électrophysiologiques

Pulvermüller et ses collaborateurs (2001b), premiers auteurs à avoir examiné les réponses corticales lors du traitement de mots d’action, ont décrit des patterns d’activation spatio-temporelle distincts lors du traitement de mots liés à des actions du visage (majoritairement la bouche) et de la jambe dans une tâche de décision lexicale (réponse manuelle). Ainsi, les mots se référant à des actions de la bouche ont suscité une activité maximale, 250 ms après le début de leur présentation, sur les électrodes frontales latérales, localisées à proximité de la scissure sylvienne gauche et correspondant à la représentation motrice de la face. A l’inverse, les mots d’action de la jambe ont activé, plus tardivement, soit 300 ms après leur présentation, les régions centrales (vertex), proche de la représentation motrice de l’effecteur correspondant. Ce pattern temporel d’activation concordait en outre avec les mesures comportementales ayant révélé des temps de réponse plus courts pour les mots d’action de la bouche en regard de la jambe (différences de 16 à 32 ms entre les deux conditions). Selon le modèle de l’apprentissage « hebbien » (Pulvermüller, 1996a, 2001a), la vitesse d’activation d’une assemblée de cellules dépendrait de la distribution de ses neurones dans le cortex. Pour les mots désignant des actions de la bouche, l’activation au sein de l’assemblée serait donc rapide, les neurones étant regroupés dans la région périsylvienne. Au contraire, l’assemblée de cellules représentant les mots d’action de la jambe étant formée de neurones distribués jusque dans les régions motrices dorsales, le processus d’activation du réseau serait plus long en raison d’une transmission de l’information sur de plus longues distances axonales, expliquant de ce fait les résultats obtenus. Par ailleurs, un délai de 50 ms, en faveur des mots d’action de la bouche, entre l’activation des représentations corticales, et de 16 à 32 ms entre les réponses comportementales données avec la main, pourrait refléter la proximité spatiale des représentations motrices de la main et de la bouche, ou encore la prédisposition de la main pour le langage. Hauk et Pulvermüller (2004a) ont par la suite corroboré ces résultats dans une tâche de lecture silencieuse de mots désignant des actions réalisées par les différents effecteurs. Leurs résultats ont en effet mis en évidence des différences entre les catégories de mots dès 220 ms après leur présentation, les mots d’action de la bouche et de la jambe recrutant les aires frontales inférieures et dorsales gauches respectivement.

Les données de ces deux études démontrent donc, en accord avec la prédiction de Pulvermüller (2001a, 2005a), un recrutement précoce des aires corticales motrices lors de la perception des mots d’action, suggérant que ces régions participent aux processus d’accès à l’information lexicale et sémantique relative à ces mots (en accord avec Marslen-Wilson & Tyler, 1980 ; Pulvermüller et al., 2001c ; Sereno et al., 1998). Par ailleurs, et toujours en accord avec le modèle « hebbien », le traitement du sens des mots se référant à des actions réalisées par différentes parties du corps active des régions corticales distinctes selon l’organisation somatotopique du cortex moteur. Ces résultats sont également congruents avec ceux obtenus en imagerie cérébrale par Buccino et al. (2001) lors de l’observation d’actions réalisées par différents effecteurs, suggérant un rôle possible du système miroir dans les réponses électrophysiologiques observées. Hauk et Pulvermüller (2004a) ont alors proposé que les régions de traitement de l’action, incluant probablement des neurones miroir, et activées précocement lors du traitement des mots d’action, jouent un rôle majeur dans l’indentification de ces mots. Les données neuropsychologiques démontrant des déficits de traitement de mots d’action suite à des lésions frontales semblent conforter cette hypothèse (Bak et al., 2001 ; Daniele et al., 1994 ; Gainotti, 2000 ; mais voir Mahon & Caramazza, 2005 pour une discussion).

Si les deux premières prédictions du modèle avancé par Pulvermüller ont été étayées, à savoir que le traitement des mots d’action recrute le cortex moteur de manière somatotopique et rapide, l’hypothèse d’une activation de ces régions indépendamment de l’attention des participants restait encore à tester. Dans ce but, Shtyrov et ses collègues (2004) ont enregistré l’activité cérébrale de sujets auxquels des mots d’action étaient présentés de manière auditive, alors qu’ils devaient focaliser leur attention sur des séquences vidéo. La réponse choisie était la MMN 9 ou « Mismatch Negativity » : les mots, désignant des actions de la main (« pick » en anglais) ou du pied (« kick »), étaient présentés en tant que stimuli « déviants » dans une séquence continue de pseudo-mots « standard » (« hick »). Les résultats ont d’une part révélé la présence d’une onde, maximale sur les régions centrale et centro-pariétale, dont la latence variait en fonction du sens des mots (144 ms et 174 ms post-stimulus pour les mots d’action de la main et du pied respectivement). D’autre part, le sens des mots a affecté la topographie de cette réponse corticale : alors que le mot « pick » suscitait une MMN localisée dans les régions motrices latérales gauches, la réponse était plus prononcée sur les régions médio-dorsales gauches pour le mot « kick ». Ces résultats démontrent donc, pour la première fois, que les aires corticales motrices gauches, en sus d’être activées précocement et somatotopiquement (en accord avec Hauk & Pulvermüller, 2004a et Pulvermüller et al., 2001b), sont recrutées de manière automatique : elles constitueraient de fait une partie intégrante des réseaux fonctionnels sous-tendant le traitement des mots d’action. Dans un paradigme identique mais en utilisant la MEG, Pulvermüller et collègues (2005b) ont corroboré ces résultats en démontrant des patterns d’activation de la MMNm (composante magnétique de la MMN) distincts pour des mots se référant à des actions du visage (« hotki » en suédois/« eat » en anglais) et de la jambe (« potki/kick »). La perception passive du mot « hotki/eat » suscitait en effet une propagation d’activation des aires du langage aux aires motrices centrales inférieures, alors que le décours d’activation était observé des aires du langage aux aires centrales supérieuresdans le cas du mot « potki/kick » (Figure 4.4.a). Cette activité des régions motrices, de durée éphémère en regard de celle des régions périsylviennes du langage, était par ailleurs observée à des latences différentes pour les mots « hotki/eat» et « potki/kick », soit environ 176 ms et 200 ms après la présentation des mots respectivement (Figure 4.4.b). Il faut noter ici des discordances entre les patterns temporels obtenus dans cette étude et dans celle de Shtyrov et collègues (2004). Alors qu’un délai de 30 ms a été observé entre les activations corticales obtenues pour les mots d’action de la main et du pied par Shtyrov et al. (2004), un délai de 24 ms est apparu entre les activations correspondant aux mots d’action de la bouche et du pied. Or, les réseaux neuronaux sous-tendant les représentations de la bouche et du pied sont censés être plus éloignés que ceux représentant la main et le pied. Des différences méthodologiques pourraient expliquer ces divergences : les techniques utilisées étaient différentes (EEG à 65 canaux vs. MEG à 306 canaux), l’EEG étant particulièrement sensible aux sources radiales d’activité et la MEG aux sources tangentielles. En outre, le champ magnétique décroît plus rapidement que le potentiel électrique à mesure que la distance entre le capteur et le dipôle augmente, la contribution des sources profondes aux enregistrements étant plus importante en EEG qu’en MEG. A l’inverse, la MEG présente une meilleure résolution spatiale que l’EEG. D’autres différences entre les études peuvent être notées, à savoir la langue testée (anglais vs. suédois), la durée des stimuli acoustiques (330 ms vs. 350 ms) et leur nombre de syllabes (une vs. deux).

Figure 4.4 : (a) Propagation d’activation sous-tendant la MMNm dans l’hémisphère gauche lors de la présentation auditive de mots désignant des actions du visage et de la jambe (b) Décours temporel d’activation dans les régions temporale supérieure, frontale inférieure, centrales inférieure et supérieure dans les conditions mots d’action du visage et de la jambe.

L’ensemble de ces données EEG et MEG conforte, d’une part, l’idée d’un accès précoce à l’information sémantique des mots, soit dans les 250 premières millisecondes après leur présentation visuelle ou auditive. D’autre part, il révèle une activation somatotopique, précoce et automatique, des aires corticales motrices impliquées dans la programmation et l’exécution des actions lors du traitement de mots se référant à ces mêmes actions. Ainsi, l’identification de mots désignant des actions réalisées avec la bouche recrute préférentiellement, en sus des aires périsylviennes du langage, les représentations motrices de la bouche, tandis que lorsque les mots sont associés à des actions de la jambe et de la main, les représentations motrices des effecteurs correspondants sont activées, que l’attention des participants soit focalisée ou non sur la tâche. Autrement dit, la lecture de mots désignant des actions de la jambe par exemple ferait « bouger le pied de l’homunculus moteur » (de Lafuente & Romo, 2004).

Si ces études ont permis de mettre en évidence des patterns spatio-temporels d’activation motrice distincts en fonction de la sémantique des mots d’action, la faible résolution spatiale des techniques utilisées, et en particulier de l’EEG, a contraint les auteurs à préciser la localisation des régions corticales impliquées en faisant appel aux techniques d’imagerie cérébrale.

Notes
9.

La MMN est une onde négative produite lors de la détection automatique d’un changement inattendu (stimulus « déviant ») dans une séquence acoustique de stimuli « standard » (Alho, 1995 ; Kraus et al., 1995 ; Näätänen, 1995 ; Picton et al., 2000). Elle est censée refléter les traces mnésiques liées à l’expérience en général, et au langage en particulier (Korpilahti et al., 2001 ; Näätänen et al., 1997 ; Näätänen, 2001 ; Shtyrov et al., 2000 ; Shtyrov & Pulvermüller, 2002).