I.2. Le tribut de l’expertise : la rigidité fonctionnelle des réseaux sous-tendant l’apprentissage.

I.2.1. Limites des apprentissages dans les réseaux de neurones artificiels : l’exemple des modèles Hebbiens.

Les modèles connexionnistes du type de celui de Seidenberg et McClelland (1989) présenté au chapitre précédent, s’ils font preuve de remarquables capacités d’apprentissage, ne sont pas pour autant exempts de dommages causés par l’accumulation des connaissances. Ces réseaux de neurones entraînés par rétropropagation de l’erreur subissent fréquemment le phénomène d’interférence catastrophique qui, à un point donné de l’entraînement, provoque une perte totale des informations précédemment intégrées, des conséquences de l’ajout de quelques items supplémentaires. L’annulation des acquis dont sont victimes les réseaux dans ce contexte n’est bien entendu qu’un artéfact de leur fonctionnement et n’a aucune réalité psychologique, puisque comme le décrit French (1999) une telle situation reviendrait à décrire le cas d’un individu qui, pour avoir appris le nom de trois personnes supplémentaires, en serait venu à oublier le nom de toutes les autres personnes rencontrées jusqu’alors.

D’autres simulations connexionnistes ont néanmoins été directement conduites dans le but de reproduire la diminution progressive du potentiel humain à assimiler des informations nouvelles. Les modèles fonctionnant suivant la loi de Hebb sont d’ailleurs apparus très pertinents pour ce type d’approche. L’algorithme d’apprentissage implanté dans les modèles Hebbiens est inspiré, comme son nom l’indique, de la théorie de l’apprentissage établie par Hebb en 1949. Suivant ce principe, l’assimilation des connaissances est supposée procéder d’un apprentissage associatif, au cours duquel les neurones qui se trouvent fréquemment activés au même moment renforcent les connexions qui les unissent. Dans le même temps, les neurones dont l’activité est rarement corrélée voient la robustesse de leurs interconnexions diminuer. La plausibilité biologique de ce postulat a été confirmée par la découverte de la potentialisation à long terme par Bliss et Lomo qui démontrèrent en 1973 qu’une brève stimulation électrique d’une voie excitatrice afférente à l’hippocampe renforçait à long terme l’efficacité des synapses. La dépression à long terme, forme opposée de plasticité synaptique et caractérisée par la réduction de l’efficacité des synapses, fut mise en évidence dans les années suivantes (voir Bear, Connors & Paradiso, 1999 pour une description détaillée de ces deux mécanismes). De ce point de vue, le cortex est donc considéré comme une gigantesque mémoire associative, dans laquelle le renforcement synaptique peut se produire entre neurones adjacents ou situés dans des régions cérébrales distantes.

L’utilisation d’un réseau de neurones artificiel de type Hebbien dans le contexte de la description de l’impact de la période critique sur l’assimilation des caractéristiques d’une seconde langue a permis à McClelland et al. (1999) de démontrer que le fonctionnement et les capacités de traitement ultérieures du réseau étaient fortement déterminées par les particularités des informations constituant son environnement linguistique initial. Cette conclusion s’appuyait sur les résultats obtenus à l’issue de la modélisation de la perte de la capacité à discriminer les phonèmes /r/ et /l/ chez les chinois arrivés en Amérique à l’âge adulte. Pour les besoins de cette étude, deux groupes de réseaux avaient respectivement été placés dans un environnement « Anglais » ou « Japonais » du point de vue des phonèmes utilisés pour leur entraînement. Tous les réseaux étaient entraînés sur un ensemble de phonèmes simples, représentés par des patterns distincts. Toutefois, tandis que le groupe « Anglais » était confronté à deux patterns supplémentaires représentant le /r/ et le /l/ et qui se recouvraient partiellement, un phonème unique était appris au groupe « Japonais », associé à un pattern « central » comprenant certaines des caractéristiques communes aux patterns /r/ et /l/ Anglais. Placés par la suite dans l’environnement « Anglais », les réseaux « Japonais » activaient indifféremment leur unique représentation perceptive hybride lorsqu’ils étaient confrontés au /r/ comme au /l/. La constance dans l’association des inputs distincts avec la représentation unique a alors conduit à un renforcement des connexions impliquées, conformément au principe hebbien. Dès lors, en dépit d’un entraînement intensif sur les patterns séparés, les lois de fonctionnement du réseau l’empêchaient de construire les représentations distinctes adéquates, et donc de faire la différence entre les deux phonèmes.

Cette étude explique donc comment, dans une situation naturelle, la dynamique des apprentissages pourrait se trouver contrariée par la sur-spécialisation d’un réseau pour certains de ses acquis, diminuant progressivement son efficacité à assimiler de nouveaux items. Cette rigidité fonctionnelle est ainsi susceptible d’affecter le comportement humain de diverses manières, dont la plus étudiée est certainement la période critique ou sensible dans l’acquisition des langues (voir Bates, 1999). Une autre de ces manifestations a toutefois commencé à attirer l’attention de la communauté scientifique il y a quelques dizaines d’années. Depuis les travaux de Carroll et White (1973ab), l’idée s’est en effet développée que l’âge d’acquisition de la forme phonologique des mots (AdA par la suite) de la langue maternelle déterminait durablement l’efficacité avec laquelle ces mots étaient appréhendés par la suite. Cette influence particulière de l’AdA a été décrite comme conceptuellement distincte de la période critique ou sensible du développement (Zevin & Seidenberg, 2005), puisque ces effets semblaient ne devoir concerner qu’une portion restreinte d’items plutôt qu’une fonction cognitive globale, comme le développement du système visuel ou l’installation des capacités langagières, et n’empêchait pas l’acquisition de connaissances systématiques et généralisables passée la fenêtre d’opportunités favorisant son installation. Du fait de l’éclairage que cette nouvelle variable apporte à la description des apprentissages linguistiques un intérêt tout particulier lui a été accordé dans le présent travail.