1.1 Niveaux de traitement des mots écrits et corrélats électrophysiologiques

Le premier niveau de traitement reposait sur une analyse visuelle de bas niveau pouvant être réalisée aussi bien sur des stimuli orthographiques que sur des stimuli non-orthographiques : il était en effet demandé aux sujets de juger de la taille des stimuli. Les PE induits par les différents types de stimuli orthographiques (mots, pseudo-mots, non-mots) et non-orthographiques (séquences de symboles alphanumériques, séquences de formes) ont révélé des différences significatives dès 170 ms après le début de la stimulation. Ces résultats sont compatibles avec ceux obtenus en enregistrements intracrâniens (Allison et coll., 1994b; Nobre et coll., 1994), et suggèrent l’existence d’une analyse visuelle précoce commençant bien avant l’analyse phonologique des stimuli langagiers. Cependant, contrairement aux données intracrâniennes qui montrent que les différences de traitement entre les patterns orthographiques et non-orthographiques sont limitées à une fenêtre temporelle autour de 200 ms (N200), les enregistrements sur le scalp révèlent des différences qui sont maximales vers 170 ms et se poursuivent jusqu’à la disparition du stimulus (vers 600 ms).

Les analyses cartographiques des champs de potentiels et des densités de courant sur le scalp ont montré que la composante négative N170 était bilatéralement distribuée sur les régions occipito-temporales, avec toutefois des amplitudes plus grandes sur l’hémisphère gauche pour les stimuli orthographiques et sur l’hémisphère droit pour les stimuli non-orthographiques. Ces différences feront l’objet d’une plus ample discussion dans un paragraphe ultérieur consacré au problème de la sélectivité de traitement. Les premières étapes de perception d’un mot en tant que pattern orthographique semblent donc débuter avant 170 ms dans les régions du cortex extrastrié. Ces mécanismes cérébraux ne permettent toutefois pas de distinguer les patterns orthographiques légaux (mots et pseudo-mots) de ceux ne respectant pas les règles phonologiques de la langue (non-mots). Pour cette raison, ils ne sont probablement pas les seuls mécanismes impliqués dans les représentations orthographiques des mots stockés dans le lexique mental.

La distinction entre les stimuli verbaux prononçables et non-prononçables ne semble avoir lieu qu’une centaine de millisecondes plus tard. En effet, les PE générés par des mots et des pseudo-mots traités à un niveau phonético-phonologique, induit par une tâche de décision de rime, diffèrent vers 320 ms après le début de la stimulation de ceux générés par des non-mots, ne pouvant pas, par nature, être transformés en patterns phonologiques cohérents. La distribution sur le scalp de la composante négative N320 est très différente de celle relative à l’onde N170 : elle est en effet prédominante sur les sites temporo-pariétaux médians gauches. Cette distribution est compatible avec des données précédemment recueillies en neuroimagerie et en neuropsychologie clinique suggérant respectivement des activations temporo-pariétales lorsque les sujets effectuent une tâche de détection de rime sur des mots présentés en modalité visuelle ou auditive (Petersen et coll., 1989; Petersen et Fiez, 1993), et une incapacité à intégrer des sons en un discours cohérent chez des patients atteints de lésions dans la scissure sylvienne gauche englobant l’aire de Wernicke, le cortex insulaire et le gyrus supramarginal (MArshall, 1986).

Ces régions temporo-pariétales n’étant pas activées par des stimuli sonores élémentaires, tels que des sons purs (MAzziotta et coll., 1982; Lauter et coll., 1985), il est possible d’associer la composante N320 à des mécanismes de translation graphèmes/phonèmes même s’il est difficile de restreindre les tâches de jugement de rime à des processus pré-lexicaux excluant toute analyse lexicale. La comparaison des activations cérébrales obtenues au cours d’une tâche de décision de rime à celles obtenues au cours d’une tâche de décision lexicale permettra d’affiner nos hypothèses interprétatives.

Lors de la tâche de décision lexicale, les PE générés par les mots et les pseudo-mots diffèrent de ceux générés par les non-mots à des latences un peu plus tardives, autour de 350 ms après l’apparition du stimulus. Les distributions sur le scalp des composantes N320 et N350, bien que très proches, ne se recouvrent pas complètement : la distribution de la composante N350 est légèrement plus antérieure que celle de l’onde N320, incluant des régions pariétales et fronto-pariétales sur le scalp qui n’étaient pas activées lors de l’analyse phonético-phonologique. Ces différences temporelles et spatiales entre les ondes N320 et N350 suggèrent que les processus cognitifs impliqués dans les niveaux d’analyse phonético-phonologique et lexico-phonologique ne sont pas tout à fait identiques. Ces observations confortent l’hypothèse selon laquelle les unités phonologiques seraient activées au cours de ces deux niveaux d’analyse, avec toutefois une antériorité des processus de formation des codes phonétiques sur les processus lexicaux (ou post-lexicaux) nécessaires à toute décision lexicale.

En raison d’informations temporelles insuffisamment précises, beaucoup de modèles de lecture ont tendance à sous-évaluer le rôle des traitements lexicaux dans la reconnaissance des mots, et à suggérer que l’étape directe après l’analyse orthographique est l’activation de la signification du mot. La précision temporelle qu’offre la technique des PE permet de montrer qu’un stimulus langagier peut être correctement catégorisé comme appartenant à la classe des mots sans pour autant qu’il y ait accès à sa signification.

Les différences neuroanatomiques fonctionnelles entre les niveaux de traitement lexico-phonologique, induit par la tâche de décision lexicale, et lexico-sémantique, induit par la tâche de décision sémantique, sont reflétées sur le scalp par une composante négative tardive, apparaissant vers 450 ms après le début de la stimulation. Alors que la composante N350 est maximale sur les régions temporales médianes et supra-temporales gauches, la composante N450 implique des aires supplémentaires dans des régions plus antérieures du scalp, pouvant inclure la portion supérieure du lobe temporal gauche et/ou le lobe frontal adjacent gauche. Ces observations confortent l’hypothèse selon laquelle, bien que l’accès au sens d’un mot puisse avoir lieu parallèlement à son analyse lexicale, voire dans certains cas puisse faciliter les processus de décision lexicale, les décisions de nature sémantique entraînent des activations cérébrales généralement plus tardives. Ces données confortent des résultats précédemment obtenus en TEP (Démonet et coll., 1992) et en IRMf (McCarthy et coll., 1994), ainsi que l’observation d’une double dissociation entre des patients dyslexiques capables de lire des mots sans accéder à leur signification (Schwartz et coll., 1980) et des patients accédant au sens des mots sans pour autant être capables de les lire (pour revue, Ellis et Young, 1996). Dans la tâche de décision sémantique, des différences de traitement ont pu être observées entre les mots et les pseudo-mots (sans signification). Alors que vers 350 ms, les composantes négatives N350 ne diffèrent pas significativement entre ces deux types de stimuli, des différences de traitement apparaissent entre les mots et les pseudo-mots 100 ms plus tard, vers 450 ms après le début de la stimulation. Etonnamment, la composante N450 générée par les pseudo-mots est significativement plus ample que celle générée par les mots. Ces résultats plaident en faveur d’une dissociation fonctionnelle entre les processus de décision lexicale (N350), permettant l’accès aux patterns orthographiques respectant les règles de construction phonologique dans le lexique mental, et les processus ultérieurs de recherche de sens des mots (N450).

Cette composante négative tardive fronto-centrale ayant également été observée pour des stimuli non-langagiers, tels que des objets ou des visages familiers (Barrett et Rugg, 1989; Bentin et McCarthy, 1994), il semble probable qu’elle soit le reflet sur le scalp d’un réseau sémantique conceptuel, qui correspondrait partiellement au moins au réseau sémantique des mots.

Les corrélats électrophysiologiques associés aux différents niveaux de traitement psycholinguistique ne confortent ni l’idée d’un système d’analyse unifié pour les stimuli langagiers, ni celle d’une organisation séquentielle des étapes d’analyse linguistique. Les distributions sur le scalp des composantes propres à chaque niveau de traitement, bien que présentant parfois des recouvrements temporels et topographiques, sont suffisamment distinctes pour supposer l’existence de réseaux neuronaux interconnectés, chacun étant préférentiellement impliqué dans un niveau d’analyse psycholinguistique. Il semblerait par ailleurs que la profondeur de traitement des mots soit associée à un gradient postéro-antérieur des activations, les traitements superficiels impliquant des régions postérieures du scalp et les traitements plus élaborés des régions plus antérieures. La chronométrie des activations cérébrales associées aux différents niveau d’analyse des stimuli langagiers plaide davantage en faveur d’un modèle de reconnaissance des mots organisé en cascade (McClelland, 1979), dans lequel un traitement de plus haut niveau pourrait commencer avant que le traitement précédent ne soit achevé, qu’en faveur d’un modèle strictement séquentiel.