I.3. Illustration de ces deux conceptions de la mémoire

Les deux conceptions de la mémoire que nous venons de présenter ont donné lieu à différents modèles théoriques. Ces modèles varient quant à la nature de l’unité mnésique stockée en mémoire mais aussi sur le plan des processus impliqués dans les activités de catégorisation.

La conception multi-systèmes de la mémoire est représentée par de nombreux modèles théoriques que nous proposons de regrouper en deux grandes classes : les modèles en réseaux et les modèles par combinaison de traits.

Les modèles en réseaux reposent sur le principe suivant : les concepts sont représentés en mémoire sémantique comme des unités indépendantes (noeuds) pouvant être interconnectées par des liens (arcs). D’un point de vue fonctionnel, de tels modèles décrivent la récupération d’une information en mémoire sémantique par un processus de récupération d’un lien déjà stocké. Par exemple, la vérification de l’énoncé “un canari est un oiseau” nécessiterait la récupération en mémoire d’un lien entre l’unité de connaissance concernant les oiseaux et l’unité correspondant au canari, puis la confrontation de ce lien avec celui proposé dans l’énoncé. En d’autres termes, la distance sémantique entre deux concepts est évaluée à partir d’un processus de recherche et de découverte de l’information en mémoire guidé par la structure du réseau sémantique. L’organisation de ce réseau de connaissances a tout d’abord été décrite comme hiérarchique. Un des premiers modèles s’inscrivant dans cette perspective (Collins & Quillian, 1969) a en effet défendu l’idée que les noeuds étaient organisés de manière taxonomique, l’appartenance catégorielle d’un objet étant représentée par un arc entre une unité objet et une unité catégorie, celle-ci elle-même reliée par d’autres arcs à la représentation d’une catégorie supra-ordonnée. Cette organisation hiérarchique du réseau fut ensuite remise en question (Collins & Loftus, 1975) : les relations entre les noeuds du réseau ne seraient pas seulement de type hiérarchique, mais reflèteraient aussi, et principalement, d’autres types de relations sémantiques. Cela rend possible la représentation de la notion de distance sémantique. Par exemple, dans les modèles les plus anciens, rien ne relierait l’unité voiture de pompier et l’unité pomme, alors que cela est désormais possible par la représentation du double lien entre ces concepts et l’unité rouge.

Les modèles par combinaison de traits défendent que les concepts sont définissables par une liste de caractéristiques ou traits (ou encore propriétés). Dans ce type de modèle, un rôle central est donc donné aux attributs des objets qui déterminent l’organisation des connaissances en mémoire sémantique. Dans un des premiers modèles de ce type (Smith, Shoben & Rips, 1974), les traits associés à une catégorie variaient quant à leur importance pour la définition de celle-ci. Ainsi, une distinction était faite entre les traits définitoires (jugés comme nécessaires et suffisants pour la description de la catégorie) et les traits occasionnels. Contrairement aux modèles précédents, les modèles par traits décrivent la récupération d’une information en mémoire sémantique non plus par un processus de récupération mais par un processus de comparaison. Ainsi, si l’on considère le même énoncé “un canari est un oiseau”, sa vérification consisterait à comparer la liste des attributs reliés au concept “oiseau” à celle reliée au concept “canari” pour déterminer si elles concordent. La force de la relation entre ces deux concepts découlerait de cette comparaison entre les deux ensembles de traits. De ce fait, le temps de vérification de l’appartenance catégorielle de deux exemplaires est susceptible de varier, ce qui est un moyen de rendre compte de la typicalité de l’exemplaire (notion sur laquelle nous reviendrons plus loin).

La rupture entre les deux familles de modèles que nous venons de décrire et les modèles inspirés de la théorie unitaire est marquée par le changement de la façon de décrire la nature de l’unité mnésique. Dans les modèles précédents, un concept abstrait (e.g., animal) est stocké et récupérable en tant qu’unité, alors qu’il est considéré comme une entité abstraite émergeant temporairement à partir d’une activation d’épisodes variés dans les modèles inspirés de la conception unitaire.

Nous proposons de différencier deux familles de modèles inspirés de cette conception unitaire : les modèles par exemplaires et les modèles par traces dont nous avons déjà vu un exemple à travers la présentation du modèle MINERVA 2 d’Hintzman (1984) (voir partie I. 2. sur la conception unitaire). Cette distinction correspond à une évolution historique.

Les modèles par exemplaires postulent que les catégories sont définies à partir d’un ensemble d’expériences particulières (ou exemples). Ces exemples de nature épisodique seraient codés indépendamment les uns des autres en mémoire. Ils seraient contextualisés et multi-dimensionnels. Chacun de ces exemples serait représenté par une configuration particulière d’attributs. D’un point de vue fonctionnel, le traitement catégoriel d’un objet engagerait des procédures relevant à la fois de la récupération d’exemples et de la comparaison. Ainsi, pour reprendre notre énoncé “un canari est un oiseau”, ce modèle postule que le mot “oiseau” agirait comme un signal de récupération permettant de retrouver l’ensemble des représentations d’exemples s’y rapportant. Ceux-ci étant eux-mêmes représentés par des configurations particulières d’attributs, la procédure d’évaluation de cet énoncé consisterait à effectuer une comparaison entre chaque attribut du stimulus (c’est-à-dire “canari”) et chaque attribut des différents exemples de la catégorie oiseau.

Les modèles par traces proposent de représenter la mémoire par une matrice composée de multiples vecteurs (ou traces) représentant chacun une expérience vécue avec un objet ou un événement24. Ce type de modèle est proche de la famille de modèles par exemplaires dans le sens où les informations encodées sont épisodiques, localisées et multidimensionnelles. La principale différence entre les modèles par exemplaires et les modèles par traces réside dans le fait que, dans les modèles par traces, toutes les traces encodées peuvent être recrutées en parallèle lors d’une recherche d’information en mémoire25.

Actuellement, le connexionisme est la méthode la plus couramment utilisée pour implémenter ces différents modèles. On ne peut pas véritablement parler de “modèles connexionnistes” (même si l’expression est parfois rencontrée dans la littérature) car il ne s’agit pas d’une famille indépendante de modèles mais plutôt d’une manière de les faire fonctionner. D’un point de vue architectural, le principe connexionniste propose de représenter la mémoire comme un vaste réseau d’unités interconnectées par des liens pondérés. L’activation de ces unités serait comparable à celle des neurones humains (ces unités sont d’ailleurs parfois nommées neurones formels). La mémoire serait ainsi distribuée. Ces unités seraient plus ou moins excitables, leur activation étant sous-tendue par le dépassement d’un seuil d’excitabilité. Dans les réseaux de neurones, l’apprentissage se réalise sur la base des exemples, en suivant des règles qui peuvent être, par exemple, celle de la rétropropagation de l’erreur. La survenue d’un événement ou d’un objet correspondrait à une configuration d’activation transitoire particulière. Ce caractère transitoire permet aux unités de ce même réseau de servir rapidement à représenter d’autres objets. Ainsi, il n’y a pas de stockage véritable, ni du concept, ni de l’exemple. La reconnaissance d’objet est permise par le rétablissement de la configuration lors de la survenue d’un événement semblable. Plus une série de configurations proches a eu fréquemment l’occasion de se créer (c’est le cas si beaucoup d’exemplaires d’une même catégorie sont rencontrés), plus le poids des relations entre unités formant ce pattern d’activation augmente, favorisant ainsi l’émergence d’une configuration adéquate et stable lorsqu’il s’agira de reconnaître un nouvel exemplaire de cette même catégorie. Le rôle de la fréquence est donc central.

Les travaux de Puzenat et collaborateurs (Puzenat, 1997 ; Reynaud & Puzenat, 2001) permettent d’illustrer cette approche connexionniste et mettent en évidence que les recherches actuelles tendent à rassembler ces différentes approches. Ces auteurs ont en effet pour objectif de modéliser le fonctionnement de la mémoire associative, un sous-système mnésique du modèle computationnel de la mémoire proposé par Kosslyn et Koenig (1992). L’architecture de ce modèle est donc inspirée d’une conception multi-systèmes : le processus mnésique global est distribué entre plusieurs sous-systèmes qui réalisent des opérations de plus ou moins haut niveau. Dans ce modèle, la mémoire associative aurait pour fonction de réunir le résultat de ces différents processus. Puzenat propose de rapprocher le fonctionnement de ce sous-système de celui d’un modèle par exemplaires : dans cette mémoire, les concepts sont représentés par différents exemplaires. Le fonctionnement de ce “sous-système par exemplaires” reposerait sur un principe connexionniste. Sans entrer dans des détails techniques complexes (il faudrait alors évoquer l’architecture des réseaux connexionnistes utilisés, pour cela voir Reynaud, 2002), chaque concept serait représenté par une configuration particulière du réseau connexionniste.

Notes
24.

Toutefois, comme le note Nevers (2000), tous les modèles par traces ne représentent pas l’architecture de la mémoire par une matrice. Pour Logan (1988), la mémoire est une configuration de traits, pour Murdock (1982) elle est un vecteur unique composite...

25.

Pour rappel, le modèle MINERVA 2 présenté dans la partie I.2. est un modèle de ce type. Le passage de la sonde à travers la mémoire illustre ce traitement parallèle.