II.1.1. Importance de la fréquence de rencontre d’un objet pour sa reconnaissance

Il apparaît que la reconnaissance d’un item est liée à la fréquence de présentation de cet objet : plus il sera rencontré, plus sa reconnaissance sera facilitée. Les modèles de reconnaissance de mots ainsi que les modèles de reconnaissance d’objets, qui peuvent êtres considéré comme des modèles d’accès au système sémantique, prennent d’ailleurs en considération cette observation plus ou moins directement.

Reconnaissance de mots — Dans les modèles de reconnaissance de mot, la fréquence d’occurrence des mots est connue depuis longtemps comme l’un des facteurs les plus marquants pour les performances en lecture : les effets de fréquence sont décrits comme à la fois “massifs et robustes” (pour une revue, voir Monsell, 1991). Tout modèle de reconnaissance de mot s’est donc imposé de rendre compte de cet effet. Si l’on accepte de répartir les modèles en trois groupes (les modèles basés sur les “détecteurs de mots”, les modèles de recherche sérielle et les modèles de type connexionniste), on retrouve chez chacun une façon très différente de rendre compte des effets de fréquence.

D’après les modèles à détecteurs de mots (par exemple le modèle des logogènes de Morton, 1969), le lexique serait composé d’unités fonctionnant chacune comme un détecteur spécifique à un mot (c’est-à-dire un logogène) et dont le niveau d’activation varie dans le temps. Donnant lieu à la reconnaissance de mot lorsque son seuil d’activation est dépassé (que ce soit par des informations visuelles, phonologiques, voire même sémantiques et issues du contexte), un logogène pourrait être doté d’un seuil d’activation particulièrement bas lorsqu’il correspond à un mot fréquemment rencontré (voir par exemple Coltheart, Davelaar, Jonasson & Besner, 1977, cité par Monsell, 1991). Dans des approches plus récentes comme les modèles d’activation interactive (McClelland & Rumelhart, 1981), les unités-mots sont bidirectionnellement reliées à des unités plus petites (unités-lettres), mais leur niveau d’activation reste en partie déterminé par cette fréquence, selon le même principe.

Dans les modèles de recherche sérielle, en revanche, la fréquence des mots est considérée comme organisatrice des unités lexicales : lors de la tentative de reconnaissance de mot, le stimulus serait successivement comparé à toutes les unités lexicales, dans un ordre déterminé par la fréquence des mots (Forster, 1976, cité par Monsell, 1991). Dans le souci d’être plus réalistes, des modèles hybrides (Monsell (1991) cite, par exemple, les modèles d’activation-vérification proposés par Schvaneveldt et McDonald (1981) ; Paap, Newsome, McDonald et Schvaneveldt (1982) ; Paap, McDonald, Schvaneveldt et Noel (1987)) proposent simplement qu’une première étape d’activation rapide et exercée en parallèle permet la délimitation d’un petit ensemble de candidats, faisant ensuite l’objet d’une série de vérifications dans un ordre déterminé par la fréquence lexicale des candidats. Nous pouvons remarquer que chacun de ces modèles ne fait qu’essayer de rendre compte après coup des effets de fréquence et aucun ne confère aux effets de fréquence un rôle intrinsèquement structurant et essentiel à l’architecture du modèle. Comme le souligne Monsell (1991), de tels modèles pourraient tout à fait fonctionner même si les effets de fréquence n’existaient pas.

Or, ce n’est pas le cas des “modèles connexionnistes” de reconnaissance de mot. Le principe des modèles d’apprentissage connexionnistes est d’apprendre des configurations d’activation en fonction des expériences qu’ils en ont et leur capacité à répondre à une certaine configuration dépend du degré auquel ils ont appris la relation entre les parties de cette configuration. Les mots rares diffèreraient des mots fréquents par leur degré d’acquisition. Dans ces modèles de type PDP (voir par exemple Seidenberg & McClelland, 1989), le but de la simulation est de faire en sorte que, à la présentation d’une configuration orthographique, une configuration appropriée se réalise sur les unités de sortie (output units). Pour cela, le système est entraîné sur des configurations orthographiques toujours en association avec des configurations phonologiques et des configurations sémantiques. Apprendre à identifier, pour ces modèles, c’est apprendre quels éléments co-apparaissent dans les configurations d’entrée pour ces différents domaines simultanément. Au cours de l’apprentissage, les connexions se renforcent entre les unités représentant des éléments qui ont déjà été co-activés. Cette règle d’apprentissage des modèles connexionnistes est dérivée de la loi de Hebb : lors de la présentation d’un mot, les unités des trois modules entrant en activité simultanément s’associeraient (c’est-à-dire que les contacts synaptiques reliant les unités ayant des valeurs d’activation proches seraient renforcés par une augmentation du poids des connexions, alors que le poids des connexions des unités ayant des valeurs d’activation différentes serait réduit). Ainsi, lorsque ce même item sera représenté au système, la réponse sera plus rapide. La rapidité de traitement est donc liée à la fréquence de présentation de l’item. On peut noter que les modèles actuels (par exemple, le modèle interactif de la résonance proposé par Bosman et van Orden, 1998) repose sur ce même principe. La présentation d’un mot écrit active des noeuds correspondant aux lettres, activant simultanément des noeuds phonémiques et sémantiques. Lorsqu’une configuration d’activation à un certain niveau (par exemple celui des lettres) est souvent présente simultanément à une autre configuration d’un autre niveau, il y aurait alors création d’un pattern particulier d’activation dont la cohérence augmenterait et qui se stabiliserait dans le temps.

Les répétitions permettraient au système de prendre une forme de plus en plus stable et de reprendre cet état de façon plus rapide. Le rétablissement plus rapide et plus complet d’une configuration qui a été apprise permettrait alors une meilleure identification. L’apprentissage se manifesterait par le fait que la présentation d’une partie seulement de la configuration déjà rencontrée suscite l’activation ou l’inhibition appropriée des unités correspondant aux parties manquantes. Le système apprend de façon primordiale et continuelle. Pour les modèles connexionnistes, les effets de fréquence sont donc indissociables de cet apprentissage et ne sont plus simplement pris en compte de façon ad hoc, comme c’est le cas dans les autres modèles.

Reconnaissance d’objets — Cet effet facilitateur de la fréquence de rencontre d’un objet pour sa vérification est également reconnu dans les modèles de reconnaissance d’objets. À titre d’exemple, nous considérerons uniquement le modèle de “reconnaissance par les composantes”, proposé par Hummel et Biederman (1992). Selon ces auteurs, tous les objets du monde sont représentables par un ensemble d’unités volumétriques (géons). L’arrangement spatial particulier de 24 géons suffirait pour décrire tous les objets existant, de la même façon qu’un nombre fini de phonèmes permet de décrire tous les mots d’une langue. Ce modèle computationnel fonctionne en cascade et propose que la reconnaissance d’un objet se réalise en sept étapes successives. Autrement dit, l’accès à la représentation d’un objet serait sous-tendu par la reconstruction de la forme à partir de ces entités discrètes. Cette construction passerait par la reconnaissance des géons utilisés, par l’analyse de la jonction, des bords et de la structure globale de la forme, par la prise en compte des propriétés invariantes des géons (axe de courbure par exemple), par la prise en compte de la position et de la taille des géons les uns par rapport aux autres. Ce modèle prédit qu’un objet sera identifié plus rapidement si ses composantes ont été pré-activées par une présentation préalable. C’est d’ailleurs ce que ces auteurs confirment de façon expérimentale (Biederman & Cooper, 1991) : chez les sujets adultes, l’amplitude de l’amorçage pour des images d’objets composés de mêmes géons est plus forte que lorsque les objets utilisés ont le même nom mais ne sont pas construits à partir des mêmes géons.

La fréquence semble donc avoir un rôle particulièrement important dans la reconnaissance des objets : la multiplication des rencontres avec un objet spécifique favorise directement sa reconnaissance. Mais ces effets de fréquence ne sont pas les seuls décris. La fréquence semble également jouer un rôle dans la détermination de l’appartenance catégorielle d’objets jamais rencontrés. Plus précisément, la rencontre plus ou moins fréquente de différents exemplaires d’une même catégorie influencerait l’établissement de l’appartenance catégorielle d’un nouvel objet.

Les notions telles que la typicalité, la similarité, ou la banalité ont été développées par différentes approches théoriques pour rendre compte de ce phénomène. Après avoir développé ces points de vue, nous nous attacherons à démontrer la pertinence d’une nouvelle notion (la spécicalité) permettant de quantifier judicieusement les liens existant entre les connaissances conceptuelles en mémoire.