3.3.2. Bases neuronales de l’intégration chez l’homme

Certains chercheurs pensaient que le mécanisme d’intégration intervenait une fois les informations sensorielles traitées indépendamment (Felleman et Van Essen, 1991). Les travaux actuels apportent un nouvel éclairage sur ces processus d’intégration et proposent que les interactions multisensorielles pourraient avoir lieu très tôt dans les aires sensorielles. Les activations et intégrations interviendraient donc en cascade plutôt que successivement.

Par exemple, Giard et Peronnet (1999) ont mis en évidence des interactions bimodales très précoces dans une tâche d’identification d’objets définis par des composantes auditives et visuelles. Dans cette étude, les sujets devaient discriminer deux objets, nommés A et B. Chaque objet était défini, soit par une composante visuelle seule (déformation d’un cercle en ellipse horizontale (objet A) ou verticale (objet B)), soit par une composante auditive seule (son grave (A) ou aigu (B)), soit par la combinaison de ses deux composantes unimodales. Des exemples de stimuli visuels utilisés sont présentés sur la figure suivante.

Figure 22 : Exemple de stimuli utilisés par Giard et Peronnet (1999)
Figure 22 : Exemple de stimuli utilisés par Giard et Peronnet (1999)

Les résultats montrent que les objets sont mieux et plus rapidement identifiés sur la base de leurs composantes multimodales (TR moyen : 562msec) par rapport aux conditions « auditif seul » (TR moyen : 621 msec) ou « visuel seul » (TR moyen : 631 msec). Ainsi, il semblerait que les informations auditives et visuelles interagissent et permettent un traitement plus rapide et plus efficace de la cible. De plus, l’enregistrement des potentiels évoqués a montré que cette interaction est très précoce au niveau des aires sensorielles, dès 40 msec après la stimulation. Les analyses montrent aussi l’activation des cortex sensoriels spécifiques auditifs et visuels ainsi que de la région temporo-frontale droite (nous évoquerons plus en détail les bases neuronales de l’intégration dans la section suivante).

D’autres travaux confirment cette interaction multimodale précoce. Par exemple Foxe et al. (2000) ont présenté à leurs sujets un stimulus auditif (son pur 1000Hz) et/ou un stimulus somesthésique (stimulation électrique du nerf médian). Les sujets devaient ignorer ces stimulations et porter leur attention sur des photographies distractrices. Les résultats montrent l’existence d’une interaction précoce générée dans le cortex somesthésique puis dans le cortex auditif. En IRMf, Foxe et al. (2002) ont demandé à des sujets d’observer passivement des stimuli auditifs et somesthésiques présentés séparément. Les résultats ont confirmé ceux de Foxe et al. (2000) en mettant en évidence une zone de convergence des informations auditives et somesthésiques au niveau du cortex auditif (région commune activée séparément en conditions unimodales auditive et somesthésique).

En utilisant un enregistrement électrophysiologique, Fu et al., 2003 ; Schroeder et Foxe 2002 ; Schroeder et al. 2001, 2003 ont montré chez le singe une réponse à une stimulation visuelle et tactile dans le cortex auditif. Toujours chez le singe, Kayser et al. (2005) ont étudié l’intégration multisensorielle (toucher-audition) et ont montré que l’intégration multisensorielle intervient très tôt et dans des zones proches des aires sensorielles primaires.

Ainsi, l’un des résultats importants des travaux présentés dans cette section sur le traitement intermodal est l’implication des cortex dits modalités-spécifiques dans les processus intégratifs (voir aussi Pourtois et al., 2002 ; Falchier et al., 2002 ; Murray, 2005 ; Giard et Peronnet, 1999). En effet, de nombreux travaux en IRMf montrent des interactions multisensorielles précoces dans ou proche des aires considérées comme « unisensorielle » (Calvert, 2001 ; Foxe et Schroeder, 2005 ; Macaluso et Driver, 2005; Schroeder et Foxe 2005 ; Beauchamp, 2005 pour revue)

De plus, les données mettent en évidence l’existence d’un réseau distribué impliquant à la fois le cortex modalité-spécifique et des régions frontales, temporales et pariétales. Ainsi, c’est l’ensemble du cerveau qui est mis en jeu pour parvenir à un percept unifié et cohérent des objets ou des évènements.

En effet, dans une étude portant sur l’intégration visuo-tactile, Hadjikhani et Roland (1998) ont montré dans une étude en TEP une zone spécifiquement activée dans le transfert intermodal. Dans leur étude, il était demandé aux sujets de déterminer si deux objets tri-dimensionnels possédaient la même forme. L’expérience comportait 3 conditions expérimentales : deux conditions intramodales dans lesquelles les deux objets étaient soit explorés visuellement à l’aide d’un écran soit explorés manuellement et une condition intermodale où l’un des objets était exploré visuellement et l’autre tactilement. Les résultats montrent une activation spécifique de l’insula/clausrum droit en cas d’informations intermodales.

Banati et al. 2000 ont étudié, eux aussi, l’intégration de stimulus tactiles et visuels en TEP, la tâche des sujets étant de déterminer si la courbure d’un arc de cercle métallique exploré manuellement correspondait à l’un des 4 cercles (de diamètres différents) présentés simultanément sur un écran. Ils ont observé un réseau beaucoup plus large d’activation incluant le cortex cingulaire antérieur, le lobule pariétal inférieur, le cortex préfrontal dorso-latéral mais aussi l’insula/claustrum.

Ainsi, c’est bien un réseau distribué sur l’ensemble du cerveau qui participe aux processus d’intégration comme le postule notre modèle. De plus il apparaît que les composantes sensorielles d’un stimulus peuvent interagir très tôt. Cependant, il est important de noter que ces processus très précoces définis comme intégratifs par les auteurs pourraient être uniquement des « interactions » précoces. Par interaction, nous signifions une influence mutuelle entre les composants sans qu’il y ait eu d’intégration, de constitution d’une unité. Dans ce cas-là, les dimensions existent encore de façon indépendante et agissent indépendamment tout en s’influençant. En effet, comme l’ont montré Falchier et al. (2002) et Rockland et Ojima (2001) chez le singe, le cortex auditif peut directement moduler l’activité du cortex visuel par des connexions directes.

Les expériences suivantes vont aller plus loin en montrant que si le temps de présentation de l’objet est trop court l’intégration n’a pas le temps de se réaliser ce qui entraîne des activations indépendantes des composantes (une interaction comme nous venons de le signifier).

Stoet et Hommel (1999) montrent que la planification d’une action (B) peut être perturbée par le planification antérieure d’une autre action (A) qui est exécutée après l’action (B). Ainsi, les participants doivent réaliser deux tâches, une tâche A et une tâche B. Le stimulus A apparaît toujours avant le stimulus B mais la réponse correspondant au stimulus A est à donner après celle donnée au stimulus B (le paradigme est présenté sur la figure suivante). Cela implique que le participant doit mémoriser la réponse A pendant qu’il réalise la tâche B.

Figure 23 : Le paradigme « ABBA » utilisé par Stoet et Hommel (1999)
Figure 23 : Le paradigme « ABBA » utilisé par Stoet et Hommel (1999)

Les résultats montrent que la planification d’une action est perturbée par la planification préalable d’une autre action à exécuter plus tard si les deux actions partagent des composants moteurs. Ils font l’hypothèse que la planification d’une action nécessite un assemblage temporel (une intégration) d’étapes motrices, lesquelles sont moins disponibles pour la planification d’autres actions nécessitant ces mêmes étapes motrices.

En 2002, les mêmes auteurs se sont intéressés, toujours en utilisant le paradigme ABBA, au partage de dimensions motrices communes entre la représentation mentale issue de la perception d’un stimulus A et la planification motrice pour répondre à un stimulus B qui lui succède. Le stimulus A variait en fonction de sa position (droite ou gauche), de sa forme (ronde ou carrée) et de sa couleur (rouge ou vert). Il était demandé au participant de mémoriser le stimulus A en vue d’un futur rappel. Suite à ce stimulus A, un stimulus B (la lettre H ou la lettre X) était présenté au centre de l’écran et nécessitait pour sa réponse l’utilisation de l’index droit ou de l’index gauche. Les résultats montrent que si l’action nécessaire à la réponse de B partage des dimensions spatiales avec le stimulus A, comme par exemple la spatialité droite ou gauche, alors les temps pour répondre à B sont plus longs. En effet, si le stimulus A est à droite de l’écran et la réponse à B nécessite l’utilisation de la main droite alors les temps de réponse sont plus longs par rapport à une condition où il n’y a pas de chevauchement d’activations spatiales. Les auteurs suggèrent que cette baisse des performances résulte du partage des dimensions communes entre A et B. Les dimensions déjà activées par le stimulus A seraient moins disponibles pour la préparation de la réponse au stimulus B d’où une chute des performances. Même si cela n’est pas explicitement dit par les auteurs, on peut faire l’hypothèse que les dimensions du stimulus A ont été intégrées et n’existent plus indépendamment les unes des autres. C’est ce qui expliquerait la baisse des performances dans cette condition. Cette explication semble confirmée par le fait que les auteurs montrent aussi que si le temps séparant la présentation de A et de B, est plus court (100 msec), le ralentissement de l’action pour répondre à B disparaît et même, au contraire, le partage de dimensions spatiales a un effet facilitateur. Il semblerait que le stimulus A ait activé les dimensions spatiales mais le temps étant trop court entre A et B, ces dimensions ne se sont pas intégrées aux autres dimensions du stimulus et agissent donc de façon indépendante.

La possibilité d’un effet perturbateur de l’intégration apparaît également dans une expérience de Huang, Hollocombe et Pashler (2004). Les participants devaient détecter l’item qui différait par sa taille parmi 20 items (selon l’essai, la cible était le plus petit des items ou le plus grand) et donner son orientation à l’aide de deux touches du clavier. Chaque item pouvait varier selon son orientation (-45° ou 45°), ou sa couleur (noir ou blanc). Les résultats montrent que lorsque la taille de la cible dans deux essais consécutifs est la même, la répétition de la couleur entre ces cibles diminue le temps de réponse. En revanche lorsque la taille de la cible change entre deux essais consécutifs, le fait que ces deux cibles soient de la même couleur ralentit la réponse. Huang, Hollocombe et Pashler interprètent ces résultats par un phénomène d’amorçage dû à la réactivation de la trace mnésique de la dernière cible traitée. Lorsque toutes les dimensions constitutives sont congruentes entre les deux cibles successives, le traitement de la seconde cible sera facilité. En revanche, si une dimension diffère, le traitement de la seconde cible sera ralenti.

Un des objectifs de cette thèse est d’étudier ces processus intégratifs et de montrer que lorsque les dimensions d’un objet ont été intégrées, l’entité qui en résulte (l’objet dans sa globalité) n’est pas forcément équivalente à la somme des parties qui la compose. Ainsi les dimensions constitutives ne peuvent plus agir d’une manière isolée et leurs effets respectifs ne s’ajoutent plus.