1.2. Les modèles connexionnistes

En rupture avec ces modèles à double voie d’accès à des entités lexicales localisées dans la mémoire à long terme du sujet, se développent depuis une vingtaine d’années des modèles connexionnistes dans lesquels la reconnaissance des mots ne consiste pas à retrouver un mot stocké dans le lexique mental mais résulte de l’activation de différentes unités spécialisées dans le traitement orthographique, phonologique et sémantique. Autrement dit, dans ce type de modèle, il n’y a plus à proprement parler de lexique mental, dans le sens où il n’y a pas de mots stockés comme des unités en mémoire à long terme. Toutes les connaissances sur le mot sont activées simultanément de façon automatique. Reconnaître un mot signifie alors atteindre un certain état d’activation de sa représentation. Chaque configuration différente d’activation correspond alors à la reconnaissance d’un mot différent. Les principales hypothèses qui sous-tendent ces modèles sont l’hypothèse d’interaction orthographe – phonologie et l’hypothèse d’auto-structuration du système basée sur le renforcement des connexions du réseau.

L’architecture générale du modèle connexionniste de Seidenberg et McClelland (1989) permet d’illustrer cette conception de la lecture. D’après ce modèle, l’identification d’un mot implique le calcul de trois types de codes orthographique, phonologique et sémantique. Le calcul de ces codes est pris en charge par chacune des trois couches d’unités orthographiques, phonologiques et sémantiques qui structurent le réseau mais également par des unités cachées qui assurent lien entre ces différentes couches. Lorsqu’un mot est présenté en réseau, ces unités interagissent jusqu’à ce que le réseau génère un patron d’activation stable appelé attracteur et qui correspond à l’interprétation du mot présenté. Les interactions entre unités sont régies par le poids de connexions qui encodent globalement la connaissance du système sur la façon dont les différents types d’informations sont reliés.

Figure 3 : Modèle connexionniste de Seidenberg et McClelland (1989)
Figure 3 : Modèle connexionniste de Seidenberg et McClelland (1989)

Par ailleurs, ce modèle possède une procédure d’apprentissage permettant de modifier les connexions automatiquement : cette procédure d’apprentissage est connue sous le nom de rétropropagation de l’erreur (Rumelhart, Hinton, & Williams, 1986). Elle consiste à présenter un stimulus (ou un ensemble de stimuli) au modèle, à laisser l’activation se propager à travers les couches successives du réseau hautement interconnecté et à comparer ensuite le résultat obtenu avec la réponse attendue. Les connexions sont ensuite modifiées de façon à diminuer l’erreur, c’est-à-dire l’écart entre la réponse désirée et la réponse obtenue. Ce modèle est donc capable d’apprendre les relations statistiques entre l’orthographe et la phonologie, sans utiliser des représentations symboliques des codes orthographiques et phonologiques.

Pour les mots les plus familiers, l’ensemble des unités orthographiques activées l’aurait été si souvent conjointement, que les liens entre ces unités, ainsi que ceux reliant ces unités à celles correspondant aux caractéristiques phonologiques et sémantiques de ces mots se renforceraient, ce qui permettrait que les unes et les autres s’inter-activent automatiquement autorisant la reconnaissance de ces mots comme des globalités. Cela serait de moins en moins vrai au fur et à mesure que les mots sont de moins en moins familiers.

Il n’y aurait donc qu’une seule voie pour reconnaître les mots quelles que soient leurs caractéristiques, les mots familiers bénéficiant de la rapidité d’activation consécutive aux lectures antérieures. Dans ce type de modèle, le fonctionnement est clairement interactif. Toutes les connaissances que le lecteur possède sur les mots (i.e., qui ont déjà été associées aux mots en cours de traitement) sont utilisées par le système. De plus, ce fonctionnement estautomatique. C’est-à-dire qu’il s’opère sans que le lecteur porte son attention sur aucune des caractéristiques individuelles des mots, que ce soit les caractéristiques orthographiques, phonologiques, sémantiques ou contextuelles.

Distinction entre modèles connexionnistes et modèles à double voie

Deux caractéristiques distinguent les modèles connexionnistes des modèles à double voie. La première concerne la nature des traitements opérés au cours de la lecture. Tandis que les modèles double voie renvoient à des traitements fonctionnellement distincts des différents types de mots (voie sublexicale pour les mots réguliers, voie lexicale pour les mots irréguliers), les modèles connexionnistes postulent, au contraire, des traitements similaires. La seconde renvoie à la façon dont les informations sur les mots sont stockées en mémoire. Dans les modèles à double voie, les mots sont représentés localement dans un endroit de la mémoire lexicale appelé représentation. Dans ces représentations, sont stockés des ensembles d’informations symboliques discrètes telles que les lettres, les sons, les morphèmes et les concepts qui composent ces mots. Des mots formellement proches possèdent des représentations localisées en mémoire de façon proche. A ces représentations symboliques et locales, l’approche connexionniste oppose des représentations distribuées représentées par des patrons d’activation d’ensemble d’unités orthographiques, phonologiques et sémantiques et de leurs connexions. Parce que le réseau apprend progressivement, des mots formellement proches possèdent des patrons d’activations proches.

Récemment, des unités correspondant à des unités phonologiques ont été insérées à la place des unités orthographiques d’entrée (trigrammes) utilisées dans le modèle de Seidenberg & McClelland (1989). Ces unités varient selon les modèles, ce sont soit des attaques/rimes (Zorzi, Houghton, & Butterworth, 1998), soit des graphèmes (Plaut, McClelland, Seidenberg, & Patterson, 1996) ou des syllabes (Ans, Carbonnel, & Valdois, 1998). Ce type de modélisation permet de s’approcher davantage des conditions de l’apprentissage de la lecture chez l’enfant qui suppose que les unités phonologiques sont associées aux représentations orthographiques.

Hormis le modèle de Harm et Seidenberg (1999), les simulations en réseaux connexionnistes ont une portée assez limitée en ce qui concerne l’apprentissage de la lecture tel qu’il se produit chez l’apprenti lecteur. A l’heure actuelle, ces modélisations ne peuvent parvenir à simuler l’existence préalable du lexique mental dans sa forme phonologique et ses associations avec le système sémantique. Leur capacité à simuler un apprentissage de la lecture proche des conditions naturelles est encore tout à fait insatisfaisante. Mais leur intérêt théorique est important puisqu’ils permettent de dresser des hypothèses sur l’utilisation des unités orthographiques liées à des représentations phonologiques dans une perspective interactive.