II.1.2. Importance de la fréquence de rencontre d’exemplaires d’une même catégorie pour l’appartenance catégorielle d’un nouvel objet

Selon la théorie prototypique, chaque concept serait stocké au sein de notre mémoire sémantique en une liste de traits ou caractéristiques (ou encore propriétés) le décrivant. À partir de ces différentes descriptions, une représentation abstraite (prototype) serait construite, pour chaque catégorie, en rassemblant les propriétés les plus largement partagées par les membres de cette catégorie. La fréquence de rencontre d’exemplaires d’une catégorie serait directement liée à la stabilité du prototype en mémoire : plus il serait construit à partir de multiples exemples, plus sa représentation en mémoire serait robuste. Ceci a été démontré expérimentalement par Homa, Sterling et Trepel (1981). Leur expérience consiste en une tâche de catégorisation dans laquelle des sujets ont pour consigne de classer des figures géométriques variant selon la taille en trois catégories. Dans la première phase de l’expérience (phase d’apprentissage), les sujets jugeaient l’appartenance catégorielle de 35 figures : 20 exemplaires appartenant à la première catégorie (A), 10 exemplaires relevant de la catégorie B et 5 exemplaires représentant la catégorie C. Ces 35 figures de la phase d’apprentissage étaient construites à partir de la distorsion du prototype de chacune des catégories. En cas d’erreurs de jugement (fréquentes au début de l’apprentissage car aucune règle de classement n’était a priori donnée aux sujets), la réponse correcte était indiquée au sujet. La phase d’apprentissage était jugée suffisante lorsque moins de deux erreurs étaient produites. Au cours de la deuxième phase de l’expérience (phase test), les sujets étaient invités à effectuer le même type de décision, sur des exemplaires déjà présentés dans la phase d’apprentissage, sur de nouveaux exemplaires construits sur le mêmes principes de distorsion que les stimuli anciens, sur les prototypes à partir desquelles ces formes étaient dérivées et sur des formes construites de manière aléatoire. Les résultats montrent que (1) les décisions concernant l’appartenance catégorielle des prototypes sont liées au nombre d’exemplaires présentés dans la phase d’apprentissage. Dans les deux expériences de cette étude, les performances de jugement du prototype de la catégorie A sont en effet significativement meilleures que celles obtenues sur le jugement du prototype construit à partir de 5 exemplaires (catégorie C) et (2) les sujets jugent plus correctement l’appartenance catégorielle des prototypes que celle des exemplaires nouveaux et ceux des exemplaires déjà vus dans la phase d’apprentissage. On peut noter que lorsque la phase test est séparée d’une semaine de la phase d’apprentissage, le bénéfice des prototypes est conservé. Ainsi, la présentation plus ou moins fréquente d’exemplaires particuliers permet la formation d’un prototype plus ou moins “fiable” et c’est ce prototype qui représente la catégorie et non pas les exemplaires qui la composent.

La similarité — Pour la théorie prototypique, la fréquence, n’est pas directement organisatrice de la structure de stockage des informations (nous verrons plus tard que celle-ci est supposée hiérarchique), mais elle permet l’enrichissement du prototype, élément prépondérant pour déterminer l’appartenance catégorielle de nouveaux objets. C’est à partir du calcul de la distance séparant le prototype du nouvel exemplaire que serait déterminée l’appartenance catégorielle d’un nouvel objet. Ainsi plus la similarité entre le prototype et l’objet serait élevée, plus cet objet serait susceptible d’appartenir à cette catégorie et d’en être plus ou moins typique. Dans ce type de modèle, le calcul du degré de similarité consiste à effectuer la somme des traits communs entre le prototype et l’objet présenté. Il s’agit donc d’une règle de calcul additive.

Pour les modèles par exemplaires, la décision de l’appartenance catégorielle d’un objet repose également sur ce calcul d’un degré de similarité. Cependant, deux différences fondamentales sont à souligner : les éléments à partir desquels le calcul de la similarité est effectué ainsi que les règles de calcul diffèrent. Pour rappel, cette approche considère que la mémoire stocke l’ensemble des exemplaires que nous rencontrons. Chacun de ces exemplaires serait décrit suivant de multiples caractéristiques en mémoire, mais aucun prototype ne serait construit à partir de ces attributs. Dès lors, si la question de l’appartenance catégorielle d’un objet se posait, la similarité ne serait plus calculée entre un prototype et un objet mais entre les attributs de cet objet et tous les attributs des exemplaires des catégories stockés en mémoire. La similarité entre deux traits définissant les objets aurait une valeur continue entre 0 et 1 (1 signifiant une similarité maximale). Ainsi, on obtiendrait un degré de similarité locale pour chacun des traits comparés. Le calcul de la similarité globale ne serait alors pas effectué selon une règle additive mais multiplicative : les différentes valeurs attribuées à chacun des traits seraient multipliées. Ainsi, un degré de similarité nul rendrait également nulle la similarité globale. Cette méthode de calcul semble particulièrement pertinente lorsqu’il s’agit de décider de l’appartenance catégorielle de deux objets particulièrement similaires d’un point de vue structural. Par exemple, si l’on considère un mannequin et un être humain, la règle additive de calcul de la similarité conduirait à conclure de l’équivalence de ces deux objets (ils partagent en effet une grande liste de traits communs) pourtant nous parvenons à les différencier assez rapidement. La règle multiplicative utilisée par le modèle de Medin et Schaffer (1978) parvient à rendre compte de ce phénomène. Cette règle sera rapidement complétée par d’autres modèles par exemplaires tels que celui proposé par Nosofsky (1986) qui enrichit ce calcul en tenant compte du fait que, selon les individus, les dimensions définissant les objets seraient plus ou moins saillantes et retiendraient plus ou moins l’attention. Estes (1986) propose également une autre méthode de calcul de la similarité en prenant en compte les valeurs de similarité lorsqu’il y a appariement mais également les valeurs de similarité lorsqu’un trait n’appartient qu’à un seul des exemplaires comparés.

Evolution du concept de similarité vers la spécicalité — Si l’on reconsidère les résultats obtenus par Homa, Sterling et Trepel (1981), nous avons vu que la représentation en mémoire du prototype était d’autant plus fiable qu’il était construit à partir de multiples exemplaires. Mais il ne s’agissait pas, dans cette expérience, de la présentation du même exemplaire. Aussi, il est possible que ce ne soit pas tant le nombre de stimuli présentés qui ait influencé la stabilité de la représentation en mémoire du prototype mais plutôt la diversité des exemplaires proposés. L’importance de cet aspect peut être perçue très simplement à travers la comparaison de deux situations dans lesquelles une inférence est à produire à partir de connaissances apprises à propos d’un même nombre d’exemplaires, ceux-ci variant par leur degré de typicalité. Si l’on sait, par exemple, que les autruches et les moineaux partagent la même propriété, la tendance générale est de penser que tous les oiseaux partagent eux aussi cette propriété. Par contre, si l’on sait que cette propriété est partagée par les pinsons et les fauvettes, on a alors tendance à penser que cette propriété concerne une catégorie plus restreinte d’oiseaux (par exemple, les petits oiseaux). C’est ce que théorisent Osherson et al. (1990) avec le développement de la notion de similarity coverage. Leurs travaux montrent en effet que les sujets prennent en compte la taille de l’échantillon mais aussi sa diversité pour raisonner et généraliser les informations. Notons toutefois que ce type de raisonnement n’est pas un phénomène universel chez les adultes : Coley et al. (1999) montrent par exemple que le niveau d’expertise des sujets relativise leur spontanéité à l’utiliser (cas des Indiens Itza Maya utilisant plutôt des analogies pour raisonner à propos des mammifères). Cette notion n’est pourtant jamais intégrée dans l’évaluation de la typicalité.

Pour rendre compte de ces phénomènes, il faudrait que la typicalité ne soit plus uniquement évaluée à partir de la similarité mais également en prenant en considération le fait que les attributs qui définissent un objet appartiennent ou non à d’autres catégories que celles dont l’objet fait partie. Le calcul de la similarité paraissant incomplet, nous pensons pertinent de prendre en considération dans nos expériences un niveau de spécicalité (Bedoin, 1992).

La spécicalité recouvre à la fois la notion de spécificité et de typicalité. Elle propose en effet de quantifier la mesure avec laquelle un attribut rend un exemplaire plus ou moins typique de sa catégorie en combinant des critères intra-catégoriels (relatifs à la catégorie de l’exemplaire) et extra-catégoriels (relatifs à une catégorie incompatible avec celle de l’exemplaire).

Par exemple, si l’on considère l’objet “chauve-souris”, cet animal est considéré comme un mammifère peu typique de cette catégorie, principalement en raison du fait qu’il possède un attribut particulièrement rare pour les mammifères (les ailes). La spécicalité rend compte du fait que cet animal possède un statut très particulier pour les mammifères non seulement parce qu’il est rare de rencontrer des mammifères ailés mais aussi parce que cet attribut est général dans une autre catégorie incompatible avec celle des mammifères : les oiseaux. Cet exemple permet de bien distinguer les deux composants de la spécicalité globale d’un attribut pour un objet : la spécicalité intra-catégorielle (le fait que l’attribut “avoir des ailes” est peu présent dans la catégorie des mammifères) et la spécicalité extra-catégorielle (le fait que cette même propriété soit largement présente dans une autre catégorie incompatible avec celle des mammifères). La spécicalité globale d’un attribut α pour un objet a (Sα a) est calculée en soustrayant la spécicalité extra-catégorielle (Seα a) à la spécicalité intra-catégorielle(Siα a), comme suit :

message URL IMG01.gif

La typicalité (T) est calculée par la somme de la spécicalité globale des attributs de l’objet, divisée par le nombre d’attributs (A) pris en compte.

message URL IMG02.gif

Des expériences de catégorisation utilisant du matériel composé de formes géométriques ont d’ores et déjà confirmé la validité de cette notion (Bedoin, 1992). La rapidité et l’exactitude de la catégorisation d’objets nouveaux dans deux catégories proposées sont en effet très fortement corrélées à la typicalité de l’objet calculée à partir de la spécicalité, en tout cas davantage qu’elles ne le sont avec l’indice calculé à partir de la formule proposée par Medin et Schaffer (1978) (Devinck, 1999 ; Boyer, Bedoin & Devinck, 2000). La spécicalité a également permis de rendre compte de façon efficace de performances dans une tâche de catégorisation de bruits par onomatopées (Bedoin & Dissard, 1992).

On peut noter que lorsqu’il s’agit de catégories naturelles et non plus artificielles, la répartition d’un attribut au sein d’une catégorie ne peut pas être évaluée avec autant de précision. Aussi, dans nos expériences, nous ne calculerons pas précisément une valeur numérique pour chaque attribut manipulé, mais prendrons en considération le degré plus ou moins élevé de la répartition intra- et extra-catégorielle des attributs en procédant à des prétests sur des personnes différentes de celles testées.