L’activation comme principe de base de l’amorçage dans différents modèles

Les modèles cognitiviste et connexionniste sont décrits selon des formalismes très différents et reposent souvent sur une conception de la mémoire fondamentalement différente (Chapitre 1). Pourtant, plusieurs de ces modèles rendent compte des effets d’amorçage en adoptant le même principe de base : celui d’activation.

Les modèles cognitivistes en réseaux sémantiques (e.g., Anderson, 1983 ; Collins & Loftus, 1975 ; Collins & Quillian, 1969) et leur principe de diffusion d’activation permettent de rendre compte des effets d’amorçage. Rappelons que dans de tels réseaux, la mémoire est considérée comme un ensemble de noeuds interconnectés, chaque noeud représentant un concept. Les noeuds sont associés par des liens sémantiques. Lorsqu’un item (l’amorce) est présenté, le concept représentant l’item en mémoire est activé et l’activation se diffuse à travers le réseau, activant les concepts associés au noeud initialement activé (et activant ainsi la cible -dans le cas où l’amorce et la cible sont sémantiquement proches-, avant même que celle-ci ne soit réellement présentée). Ainsi, lorsque la cible apparaît effectivement, le concept la représentant en mémoire est déjà activé. Une réponse plus rapide et plus précise peut alors être donnée sur la cible. Meyer et Schvaneveldt (1971) ont été parmi les premiers à considérer la diffusion d’activation comme le mécanisme responsable de l’amorçage  en décision lexicale.  Ils présentaient à un groupe de sujets, le couple amorce/cible “pain/beurre” dans lequel la cible était associée sémantiquement à l’amorce, et à un autre groupe de sujets, le couple contrôle “herbe/beurre”. Ils ont observé que les temps de réponse à la cible “beurre” étaient plus courts quand celle-ci était précédée de l’amorce associée “pain” que lorsqu’elle était précédée de l’amorce contrôle “herbe”. Dans le cadre de la théorie de la diffusion d’activation, ce résultat a été interprété en terme de pré-activation. L’activation émise par le noeud “pain” diffuse vers les noeuds associés, dont le noeud “beurre”. Ce dernier se trouve pré-activé avant même sa présentation, de telle sorte qu’une moindre quantité d’information est requise, par la suite, pour l’activer totalement. Dans le cas où “beurre” est précédé de “herbe”, l’activation émise par le noeud “herbe” diffuse de la même manière vers les noeuds associés, mais “beurre” n’en fait pas partie. De ce fait, la décision lexicale sur “beurre” est plus longue à prendre que dans le cas précédent puisqu’elle n’est plus facilitée par le lien sémantique entre les mots.

Un raisonnement similaire peut s’appliquer dans le cadre d’un amorçage de répétition : le couple “beurre/beurre” doit engendrer un temps de réponse plus court que le couple “herbe/beurre”, parce que “beurre” est déjà activé dans le premier cas alors qu’il ne l’est pas du tout dans le second.

Contrairement au modèle précédent dans lequel les représentations sont localisées, les modèles de Hinton et Shallice (1991), Masson (1991, 1995) ou Sharkey (1989, 1990) s’en distinguent par le fait qu’ils utilisent une représentation distribuée en mémoire. Toutefois, la base de la simulation des effets d’amorçage, et plus particulièrement des effets d’amorçage sémantiques, dans ces modèles connexionnistes est un processus similaire à la diffusion d’activation : l’activation d’une unité de traitement est transmise à des unités voisines et est modulée par le poids des connexions reliant l’unité à ses voisins.

Le modèle de mémoire distribuée de Masson (1995) est basé sur un réseau de Hopfield (1982). Il s’agit d’un réseau connexionniste qui représente les connaissances dans le poids des connexions reliant un ensemble d’unités de traitement (unités orthographiques, phonologiques et sémantiques) entre elles et qui définit un concept par un patron d’activation à travers ces unités. Ce type de réseau ne différencie pas de couches d’unités (i.e., unités d’entrée, unités cachées, unités de sortie) comme c’est parfois le cas dans certains autres modèles connexionnistes (McClelland & Rumelhart, 1981) : pour chaque unité, les connexions pondérées sont établies avec toutes les autres unités du réseau. Les unités de ce réseau peuvent prendre deux valeurs d’activation (+1 ou -1). Pour encoder de nouveaux stimuli, les poids des connexions entre unités sont modifiés selon une règle d’apprentissage dérivée de celle de Hebb (1949). Dans ce modèle, l’activation est définie par la proportion d’unités dans un module dont les états d’activité (+1 ou -1) s’apparient avec le patron d’activation de l’item présenté au système. Au début du traitement, les unités prennent des états d’activité aléatoires et au fur et à mesure que la mise à jour progresse, la proportion d’unités acquièrant l’état d’activité approprié augmente. Ce processus est une mise à jour asynchrone : toutes les unités ne sont pas modifiées simultanément, les unités phonologiques et orthographiques sont activées avant les unités sémantiques. Le traitement de l’item est terminé dès que les états d’activité des unités se stabilisent. Masson (1995) simule les effets d’amorçage sémantiques en postulant que les mots sémantiquement reliés ont des patrons d’activation similaires à travers les unités de traitement sémantiques. En effet, il est supposé d’une part, que la signification d’un concept est construite à partir du contexte dans lequel le concept apparaît et d’autre part, que les concepts qui apparaissent fréquemment ensemble partagent beaucoup d’aspects sémantiques basés sur le contexte (e.g., des concepts tels que “pain” et “beurre” auraient des patrons d’activation similaires au niveau des unités sémantiques du fait de leur co-occurrence dans certains contextes, alors que “pain” et “crème” n’auraient pas de patron très similaire malgré la similarité entre “beurre” et “crème”). La similarité sémantique est cruciale pour la simulation des effets d’amorçage sémantiques parce qu’elle contribue à stabiliser plus vite le système. Lorsque le modèle commence à identifier l’amorce, les unités sémantiques évoluent vers son patron d’activation. Ce patron est similaire à celui de la cible à venir (dans le cas où elle est sémantiquement  reliée à l’amorce). Quand la cible est présentée (visuellement), son patron d’activation orthographique remplace celui de l’amorce ; les unités phonologiques et sémantiques doivent alors être mises à jour. Comme le patron d’activation au niveau des unités sémantiques est déjà similaire à celui de la cible, il peut aider à faire évoluer plus rapidement le patron des unités phonologiques vers le patron de la cible, d’où l’effet d’amorçage. Dans le cas d’une amorce et d’une cible non reliées, davantage de mises à jour sont nécessaires pour que les unités phonologiques atteignent un état stable. Les patrons d’activation des trois ensembles d’unités de traitement évoluent donc plus rapidement vers le patron d’activation de la cible lorsque l’amorce et la cible entretiennent un lien sémantique.

Masson n’aborde pas le cas de l’amorçage de répétition, mais il est logique de supposer que dans le cas où l’amorce et la cible sont identiques, les patrons d’activation le sont aussi et ceci dans les trois modules. Ainsi, le système n’a pas besoin de faire de mises à jour, et l’amorçage de répétition s’explique par le fait que le système maintient le patron d’activation initié par la présentation de l’amorce jusqu’à la présentation de la cible.