5-4-3 Simulation 4 : Erreurs d’inférence lexicale

Les prédictions pour les mots étant validées par nos simulations, nous pouvons alors clore ce chapitre par une simulation des erreurs d’inférence lexicale (lexicalisations et inférences incorrectes) commises à partir des stimuli pseudomots et mots (cf paragraphe 5-4).

Afin de simuler les erreurs de lexicalisations commises par les participants lors de la présentation d’un pseudomot, nous allons adopter une démarche identique à la simulation proposée pour les mots. Comme pour les mots, les CLIPs partiels, obtenus à partir d’un stimulus pseudomot, activent également les représentations lexicales des mots (voir par exemple, Coltheart et al., 1977 ; Grainger & Jacobs, 1996 ; McClelland & Rumelhart, 1981 ; Paap et al, 1982). Cependant, dans le cadre de la simulation des performances d’identification d’un mot, nous avons prédit la probabilité qu’un mot spécifique donné soit correctement rapporté ; au contraire, dans le cadre de la simulation d’une erreur de lexicalisation, il s’agit de prédire la probabilité que n’importe quel mot soit rapporté. Il faut souligner que, contrairement aux mots, les CLIPs partiels identifiés à partir d’un stimuli pseudomot ne sont pas tous susceptibles de donner lieu à la perception d’un mot. Par exemple, le CLIP partiel « BLO**E » identifié à partir du stimulus pseudomot « BLOISE » peut potentiellement entraîner la production des mots « BLOUSE » ou « BLONDE » par exemple ; en revanche, aucun mot ne peut être inféré à partir du CLIP « REP**L » (stimulus « REPRIL »).

Ainsi, parallèlement à la probabilité d’inférer un mot, estimée par l’équation (2) :

La probabilité d’inférence lexicale à partir d’un CLIP partiel donné (Cpi), P(Inf Lex) peut être estimée par l’équation (7) suivante :

P(Cpi) est la probabilité d’occurrence du CLIP partiel Cpi et P(Inf Lex /Cpi) est la probabilité de produire un mot à partir d’un CLIP partiel donné.

La probabilité de produire un mot P(Inf LexCpi), lorsqu’un CLIP partiel Cpi a été identifié, est fonction du nombre de « CLIPs partiels susceptibles de donner lieu à un mot » ou « CLIP lexical  ». La probabilité de produire un mot à partir d’un CLIP partiel donné (Cpi) peut ainsi être estimée par le rapport entre le nombre de « CLIPs lexicaux » et le nombre total de stimuli, soit l’équation (8) suivante :

Notez, que les CLIPs partiels identifiés à partir d’un stimulus mot étant tous « lexicaux », P(Inf LexCpi) prend toujours la valeur de 1 dans le cas des mots.

Ainsi, appliquée aux pseudomots, l’équation (7) prédit la probabilité de commettre une erreur de lexicalisation. Appliquée aux mots, elle prédit la probabilité de produire une inférence lexicale « totale », qu’elle soit « correcte »ou« incorrecte ».

La probabilité d’inférence correcte peut être estimée par la différence entre l’équation (2) et l’équation (3), soit, (2) – (3).

La probabilité d’inférence incorrecte peut être estimée par la différence entre (7) et ((2) – (3)).

Dans le but de déterminer si ces prédictions rendent compte des pourcentages d’erreurs d’inférence lexicale réellement commises par les participants (cf., paragraphe 5-3-2), nous avons calculé les courbes de l’EPR théoriques correspondantes selon une démarche strictement similaire à la simulation 3. Les résultats des simulations ainsi que les pourcentages d’erreurs d’inférence lexicale recueillies empiriquement sont présentés dans la Figure 29.

Figure 29. Pourcentages d’erreurs d’inférence lexicale théoriques (trait plein, symboles pleins) et empiriques (trait pointillé, symboles vides) en fonction de la position du regard dans le stimulus. À gauche, les probabilités d’erreurs de lexicalisation et à droite, les probabilités d’inférence incorrecte.

Ainsi, comme on peut le voir dans la Figure 29, les pourcentages d’erreurs d’inférence lexicale prédits par le modèle CLIP correspondent relativement bien aux données empiriques dans le cas des pseudomots (RMSD=.034) et des mots (RMSD=.035).

En résumé, l’expérience 1, réalisée dans le but d’explorer l’EPR dans les mots et dans les pseudomots via le modèle CLIP (Kajii, 2000), était basée sur la logique selon laquelle la différence observée entre les mots et les pseudomots serait due au processus d’inférence lexicale, qui tend à améliorer les performances d’identifications des mots. Les résultats obtenus à l’issue de ces simulations confortent cette hypothèse. L’ajout de la contrainte lexicale à la probabilité théorique d’identifier un pseudomot (estimée par la probabilité d’identifier le CLIP total) rend compte avec une remarquable précision de l’EPR dans les mots. Dans ce contexte, une mesure statistique de la contrainte lexicale des mots conforme aux données de la littérature a été établit.

Par ailleurs, une analyse qualitative des erreurs d’identification a permis de mettre en évidence trois processus sous-jacents à la reconnaissance d’un mot ou d’un pseudomot.

1. L’identification perceptive totale où les participants perçoivent toutes les lettres du stimulus et codent leurs positions dans la séquence (CLIP total). Ce processus est purement perceptif et s’applique aux mots et aux pseudomots de manière comparable. 2. L’inférence lexicale donne lieu à des inférences correctes et incorrectes dans le cas des stimuli mots et à des erreurs de lexicalisations dans le cas des pseudomots. 3. Enfin, lorsque aucun de ces processus n’a lieu, des erreurs d’omission se produisent, c’est le cas, en particulier, lorsque le nombre de lettres identifiées est trop faible, et/ou lorsque celles-ci ne sont pas compatibles avec un candidat lexical. L’apport principal de notre travail à l’issue des simulations des données de l’expérience 1 concerne la quantification théorique de ces trois processus via le modèle CLIP.

La probabilité d’occurrence de ces processus peut être résumée ainsi :

1. L’identification perceptive totale (CLIP total) est estimée par l’équation (3) :

2. La probabilité d’inférer un mot (correctement ou incorrectement) est estimée par l’équation (7) :

La probabilité de rapporter correctement un mot est estimée par l’équation (2) :

3. La probabilité de produire une erreur d’omission dans le cas des mots et des pseudomots est estimée par :

L’ensemble des observations, rapportées à l’issue de la première expérience, suggère que la mise en jeu de ces trois processus (identification perceptive totale, inférence lexicale, et omission) serait principalement dépendante des facteurs liés à la lisibilité des lettres et à la contrainte lexicale des mots.

Néanmoins, afin de s’assurer de la réalité de ces processus, tels que décrits dans le contexte de la tâche d’identification perceptive, il apparaît fondamental de déterminer leur conditions d’apparition en fonction du contexte expérimental. Autrement dit, si les processus cognitifs sont basés sur des principes généraux sous jacents à la reconnaissance visuelle des mots, leurs implications dans une autre tâchedevraient être « détectables ».

Nous allons, par conséquent, au cours de la seconde partie expérimentale, comparer la tâche d’identification perceptive à une tâche de décision lexicale où le participant doit simplement décider si la séquence brièvement présentée est un mot (réponse « oui ») ou un nonmot (réponse « non »). Étant donné que les demandes propres à chacune de ces deux tâches sont différentes (dans un cas, il s’agit de rapporter précisément toutes les lettres du stimulus et dans l’autre cas, il faut simplement décider si la séquence est un mot ou un nonmot), les réponses comportementales mesurées (i.e., les réponses correctes et incorrectes) diffèrent entre les deux tâches. Ainsi, dans le contexte de la tâche de décision lexicale, les prédictions suivantes peuvent être énoncées. 1 L’identification perceptive totale devrait donner lieu à des réponses correctes, pour les mots (« Hits »), et pour les pseudomots (rejets corrects). 2 Le processus d’inférence lexicale devrait améliorer les performances pour les mots (Hits), et diminuer les performances pour les pseudomots par l’occurrence de fausses alarmes (i.e., dire « oui » pour un pseudomot). 3 À l’inverse, lorsque l’information visuelle est insuffisante, donnant lieu à des erreurs d’omissions dans la tâche d’identification perceptive, les performances pour les pseudomots tendraient à augmenter ; les performances pour les mots, au contraire, tendraient à diminuer, entraînant des « Misses » (i.e., dire « non » pour un mot). La Figure 30 résume l’ensemble de ces prédictions.

Figure 30. Modèle du comportement et des processus impliqués dans les tâches d’identification perceptive et de décision lexicale lors de la présentation brève d’un mot ou d’un pseudomot. Les chiffres entre parenthèses font références aux équations précédemment décrites.