1.2. Les différents modèles de reconnaissance des mots écrits et la phonologie

De nombreux modèles s’intéressent au rôle de la phonologie dans le processus de reconnaissance des mots écrits chez le lecteur expert. La place de ce code en lecture varie cependant selon l’époque et la nature des modèles.

Les modèles issus de la théorie dite « de l’accès direct » (Baron, 1973) n’accordent aucun rôle à l’information phonologique en lecture silencieuse de mots écrits. Ainsi, seule l’information visuelle ou orthographique constituerait une base nécessaire à l’identification des mots écrits. La présentation visuelle d’un mot permettrait d’élaborer une représentation orthographique, activant à son tour la représentation orthographique lexicale stockée en mémoire. Cette représentation permettrait enfin la récupération du sens du mot et l’accès direct à sa représentation phonologique complète. Pour cette position extrême, l’identité et la signification d’un mot écrit pourraient être directement dérivées d’une analyse visuelle, sans utilisation d’un code phonologique intermédiaire. La possibilité de reconnaître certains mots à partir de leur seule représentation orthographique trouve des arguments en sa faveur dans de nombreux travaux. Seidenberg, Waters, Barnes et Tanenhaus (1984) montrent par exemple que le temps de lecture à haute voix pour les mots fréquents est aussi rapide quand ils sont réguliers ou irréguliers alors que les mots rares irréguliers sont traités plus lentement que les mots rares réguliers. La différence de vitesse de lecture des mots irréguliers (rares et fréquents) s’explique seulement si on admet que la connaissance orthographique du mot joue un rôle.

Selon les modèles de la double voie (Coltheart, 1978 ; Coltheart, Curtis, Atkins & Haller, 1993), les connaissances phonologiques sont par contre un moyen parmi d’autres d’accéder au lexique. Chez un lecteur-expert, la procédure par adressage permettrait d’accéder directement à la représentation orthographique d’un mot dans le lexique mental. La procédure par assemblage, qui s’engagerait en parallèle, consisterait à coder le mot écrit sous une forme phonologique grâce à l’application successive de règles de conversion graphèmes-phonèmes, afin de reconnaître à travers cette représentation phonologique une forme déjà connue à l’oral, ou afin de prononcer le mot ainsi reconstruit. Cette procédure étant lente et se réalisant indépendamment, sans coopérer avec la procédure par adressage, son rôle serait très limité chez le lecteur expert. Elle ne serait utilisée que pour prononcer des pseudo-mots ou des mots réguliers mais rares (Coltheart, Avons, Masterson & Laxon, 1991). Selon cette conception, les traitements orthographique et phonologique seraient encapsulés, et la voie par adressage, à la fois plus automatique et plus rapide, court-circuiterait la voie par assemblage, plus contrôlée et plus lente. La plupart du temps, le lecteur-expert n’utiliserait donc pas de connaissances phonologiques pour reconnaître des mots écrits. En pathologie, l’observation d’une double dissociation entre dyslexie de surface et dyslexie phonologique chez des patients cérébro-lésés constitue un argument neuropsychologique favorable à l’existence de deux procédures autonomes pour la reconnaissance des mots écrits (Coltheart, Masterson, Byng, Prior & Riddoch, 1983 ; Funnell, 1983 ; Shelton & Weinrich, 1997). De nombreux travaux soutenant ce type de modèles ont par ailleurs insisté sur le caractère optionnel du code phonologique en lecture (Peereman, 1991, pour une revue).

Cependant, une autre approche théorique accorde à la phonologie un rôle plus déterminant en lecture. Elle est notamment représentée par les travaux de Lukatela et Turvey (1991, 1993, 1994) et par les premiers travaux de Van Orden. Dans le modèle de vérification de Van Orden (1987, 1991), le codage phonologique exhaustif du mot écrit constitue une étape indispensable à l’activation de candidats lexicaux puisque le mot écrit serait converti en un code phonologique dit « pré-lexical » nécessaire à son identification. Une représentation phonologique complète du stimulus serait produite, activant à son tour une ou plusieurs représentation(s) lexicale(s) (candidats parmi lesquels une étape ultérieure de vérification orthographique permettrait de sélectionner le plus adapté). Cette conception, appelée théorie de la « Médiation Phonologique », remet en question l’existence d’un accès direct au lexique en lecture.

D’après des modèles plus récents, le code phonologique interviendrait rapidement dans le traitement de mots écrits, de manière systématique, sans être pour autant la base unique et nécessaire de la reconnaissance.

Le modèle révisé de la double voie (Coltheart, Rastle, Perry, Langdon & Ziegler, 2001) propose par exemple un fonctionnement beaucoup plus interactif des deux procédures puisque, dans un tel modèle, l’analyse phonologique et le lexique orthographique peuvent influencer l’analyse visuelle du stimulus écrit. Ces deux procédures n’étant plus totalement indépendantes, les relations entre traitements phonologiques, graphémiques et lexicaux sont modifiées et deviennent bidirectionnelles. Deux types de feed-back sont ainsi proposés. Le système de phonèmes activé par l’application des règles graphème-phonème lors de la procédure d’assemblage pourrait activer le lexique phonologique de sortie qui exercerait à son tour une action sur le lexique d’entrée orthographique pouvant lui-même influencer le traitement des lettres par une action en feed-back selon un cheminement représenté en gras dans la Figure 1. Par ailleurs, les auteurs décrivent dans leur article une relation bi-directionnelle entre les lettres et les règles graphème-phonème (Coltheart et al., 2001, p. 217),représentée en pointillés sur la Figure 1. Cela permet d’envisager la participation d’unités phonologiques infra-lexicales au processus de reconnaissance de mot écrit même s’il est en grande partie réalisé par une procédure d’adressage. Les unités phonologiques pourraient ainsi renforcer le traitement des lettres soit, comme l’illustre la Figure 1, en passant par le lexique orthographique, soit par une action en feed-back direct comme le décrivent les auteurs dans leur article, en complément envisagé pour une prochaine version du modèle.

Figure 1 : Illustration de la version en cascade du modèle révisé de la double voie,
Figure 1 : Illustration de la version en cascade du modèle révisé de la double voie,

d’après Coltheart, Rastle, Perry, Langdon & Ziegler (2001).

Etant donné que les deux procédures de cette version révisée de la double voie perdent leur « imperméabilité » et que la notion de bidirectionnalité des traitements est intégrée, ce modèle permet de rendre compte de deux choses : le système des phonèmes peut influencer directement le traitement des lettres sans passer par le lexique (ainsi, la phonologie pourrait influencer un traitement aussi élémentaire que celui des lettres) ; puisque cette influence peut aussi passer par les connaissances lexicales, ce modèle est propre à rendre compte d’une modulation des effets phonologiques par la nature, lexicale ou non, des stimuli présentés.

Le modèle connexionniste de l’activation interactive de McClelland et Rumelhart (1981) en lecture comporte trois niveaux de représentation (ou ‘nœuds’) : un niveau trait (correspondant aux éléments constitutifs des lettres), un niveau lettre et un niveau mot. Ce modèle décrit une montée de l’information visuelle par des relations bottom-up depuis le niveau des traits jusqu’au niveau des mots, en passant par le niveau des lettres. Il se produit ensuite une descente des signaux lexicaux par des mécanismes top-down qui « votent » pour la présence de leurs lettres. Par ailleurs, le modèle inclut une composante inhibitrice importante : les informations allant d’un niveau à l’autre peuvent être activatrices ou inhibitrices. Les auteurs décrivent ainsi une compétition intra-niveau, due à des liens inhibiteurs instaurés entre des candidats présentant une forte ressemblance à l’intérieur d’un niveau de représentation (Figure 2). Un seul des nœuds-mot correspond au stimulus, et un seul nœud-lettre correspond à la lettre effectivement présentée à une position donnée dans le mot. Bien que le modèle ait précisé ces notions dynamiques avant tout au niveau des traitements visuo-orthographiques en lecture, les auteurs n’isolent pas ces derniers des connaissances phonologiques, qui pourraient être animées par des relations activatrices et inhibitrices analogues.

Figure 2 : Représentation du modèle d’activation interactive, d’après McClelland & Rumelhart (1981).
Figure 2 : Représentation du modèle d’activation interactive, d’après McClelland & Rumelhart (1981).

Le modèle interactif de la résonance (Bosman & Van Orden, 1998) accorde quant à lui un rôle systématique aux connaissances phonologiques lors du traitement d’un mot écrit. Dans ce type de modèle (Figure 3), les notions d’étape de traitement et de stockage de représentations disparaissent pour laisser place à celles de résonance, cohérence ou encore configuration d’activation entre des nœuds. Il s’agit d’appliquer aux processus cognitifs la théorie des systèmes dynamiques (Van Orden & Goldinger, 1994). L’idée de règles de traduction graphèmes-phonèmes est également rejetée au profit de l’hypothèse d’un apprentissage par covariance (forte relation de cohérence entre des attributs apparaissant simultanément) (Bosman, 1994 ;Bosman & Van Orden, 1997 ;Van Orden, Jansen op de Haar & Bosman, 1997). Le traitement des mots écrits serait ainsi fortement influencé par la cohérence entre les attentes issues d’un niveau de traitement plus profond et le codage du stimulus à un niveau plus perceptif. La présentation d’un mot écrit activerait des nœuds correspondant aux lettres, activant immédiatement des nœuds phonémiques et sémantiques. En cas de forte correspondance entre les configurations, le cycle d’activation se maintiendrait et permettrait l’émergence d’un tout cohérent et dynamique (Bosman, 1994, p. 5). Les trois types de nœuds seraient connectés bidirectionnellement, avec toutefois des poids différents : dans les langues alphabétiques où les mêmes lettres et les mêmes phonèmes se produisent simultanément dans beaucoup de mots, les relations entre lettres et phonèmes présenteraient les corrélations bidirectionnelles les plus fortes, les relations phonème-signification et lettre-signification seraient quant à elles plus faibles. Il y aurait ainsi une très forte résonance d’activation entre la lettre « D » et le phonème /d/, par exemple ; d’où une implication majeure de la famille des nœuds phonologiques en lecture. On ne parle cependant pas d’unité-phonème /d/, mais plutôt d’une forte cohérence entre les traits de voisement, de lieu et mode d’articulation propres à cette consonne (sonore, dentale et occlusive). La perception de la lettre « D », dont la relation est peu ambiguë avec le phonème /d/ en français, s’accompagnerait ainsi d’une résonance d’activation très vite stabilisée grâce à la forte cohésion entre les configurations des différentes couches.

Figure 3 : Représentation schématique des trois familles de nœuds activées lors de la présentation d’un mot écrit, d’après Bosman & Van Orden (1998).
Figure 3 : Représentation schématique des trois familles de nœuds activées lors de la présentation d’un mot écrit, d’après Bosman & Van Orden (1998).