4-5-3 Reconnaissance du mot et position du regard

La probabilité théorique de reconnaître les mots à début informatif et les mots à fin informative a été calculée à partir des 7 CLIPs suivants: « L1L2L3L4L5 », « L1L2L3** », « **L3L4L5 », « *L2L3L4L5 », « L1*L3L4L5 », « L1L2L3L4* », « L1L2L3*L5 ». Le choix de ces CLIPs a été motivé par deux raisons. Premièrement, la probabilité d’occurrence de ces CLIPs est relativement élevée par rapport aux autres CLIPs, dont la contribution à la reconnaissance du mot a été considérée comme négligeable. Deuxièmement, les mesures empiriques de prédiction des mots disponibles dans cette expérience étaient limitées.

La probabilité d’inférer un mot lorsque toutes les lettres du mot ont été identifiées est de 100%. Par ailleurs, le nombre de mots pouvant être inféré à partir des CLIPs « L1L2L3** », « L1L2L3L4* » et « L1L2L3*L5 »a été considéré comme identique (Kajii, 2000). Par conséquent, les probabilités de prédire les mots à partir de ces CLIPs sont équivalentes, soit :

De même, les probabilités de prédire les mots à partir des CLIPs « **L3L4L5 », « *L2L3L4L5 », « L1*L3L4L5 » sont équivalentes, soit :

Les pourcentages de réponses correctes calculés pour les mots à début informatif et à fin informative en fonction de la position de la lettre fixée sont présentés dans la Figure 17. Afin d’obtenir la meilleure courbe théorique, le paramètre br a été ajusté afin d’obtenir un RMSD minimum (cf paragraphe 3-4). Ainsi, pour br = .05, les RMSD sont égales à .02 et .01 pour les mots à début informatif et à fin informative respectivement.

Figure 17. Probabilités de reconnaître un mot à début informatif (à gauche) et un mot à fin informative (à droite) en fonction de la position de la lettre fixée. Les lignes pointillées (symboles vides) représentent les données empiriques, les traits pleins (symboles pleins) représentent les données calculées d’après le modèle CLIP; enfin les lignes pointillées (symboles pleins) représentent la probabilité de coder le CLIP total (i.e., MPLI, Nazir et al., 1991).

Comme on peut le voir sur la figure, les courbes calculées théoriquement correspondent aux données obtenues empiriquement par Brysbaert et al. (1996). Ainsi, en ajoutant la contrainte lexicale à la composante visuelle (CLIP total), le modèle CLIP prédit de manière relativement précise les données empiriques. Autrement dit, les mesures de lisibilité des lettres utilisées en combinaison avec des estimations empiriques de la contrainte lexicale prédisent avec une grande justesse les données empiriques de Brysbaert et al. (1996).

En bref, le modèle CLIP (Kajii, 2000) de type visuo-lexical a été développé afin de rendre compte de l’EPR dans le mot dans la tâche d’identification perceptive. Il donne la probabilité de reconnaître un stimulus mot en fonction de la position du regard dans le mot. Selon ce modèle, la reconnaissance d’un mot a lieu en trois étapes. Dans une première étape, le participant identifie un CLIP visuel à partir de l’information sensorielle extraite du stimulus mot, ce CLIP peut être total (i.e., le participant a identifié toutes les lettres du stimulus) ou partiel (i.e., le participant n’a identifié que quelques lettres). Dans une seconde étape, le CLIP va « activer » un ensemble de candidats lexicaux (« voisins CLIP »), lesquels vont interférer avec la reconnaissance du stimulus mot. Selon le postulat que lorsqu’une lettre est identifiée, sa position est automatiquement codée (Kajii, 2000), ce modèle suppose qu’aucun mot ne vient interférer avec la reconnaissance du stimulus lorsque le CLIP identifié est total. Enfin, dans la dernière étape, le mot est identifié.

En résumé, les modèles de type « visuo-lexicaux » décrits dans le chapitre 4 sont des modèles de perception de lettres et de mots élaborés afin de rendre compte de l’EPR dans les mots dans le contexte de la tâche d’identification perceptive. Ces modèles sont inspirés des cadres théoriques classiques présentés plus haut (e.g., McClelland & Rumelhart, 1981 ; Paap et al., 1982) décrivant les processus mis en œuvre pour reconnaître un mot écrit.

En particulier, les mots sont reconnus sur la base de leurs lettres selon une identification totale (Stevens & Grainger, 2003), partielle (Clark & O’Regan, 1999) ou les deux (Kajii, 2000). Ces modèles prévoient explicitement un processus de compétition entre les mots lors de la reconnaissance visuelle des mots. Par ailleurs, dans les modèles de Clark et O’Regan (1999) et Kajii, (2000), la longueur du mot est codée et les lettres du mot le sont en fonction de leur position absolue à l’intérieur du mot. Seules les représentations des mots de même longueur compatibles avec les lettres identifiées s’activent lors de la présentation du stimulus visuel. En revanche, le modèle de Stevens et Grainger (2003) adopte un schéma de codage relatif de la position des lettres, indépendamment de la longueur des mots, lequel est par ailleurs davantage conforme aux données actuelles de la littérature. Ainsi, dans ce modèle, tous les mots ne partageant même qu’une seule lettre avec le stimulus s’activent lors de la perception d’un mot.

Plusieurs études ont souligné une asymétrie de la lisibilité des lettres avec de meilleures performances de perception des lettres lorsque les séquences sont présentées dans le CVD que dans le CVG (Bouma, 1973 ; Kajii & Osaka, 2000; Nazir et al., 1991 ; 1992 ; 1998). Cette variable n’est néanmoins pas pris en compte dans les modèles de Stevens et Grainger (2003) et Clark et O’Regan (1999), considérant uniquement la diminution de l’acuité visuelle et la réduction du masquage latéral sur la perception des lettres externes.

Afin de mieux souligner l’influence de l’asymétrie de la lisibilité des lettres sur les processus de reconnaissance des mots, nous avons réalisé une simulation des données empiriques de Brysbaert et al. (1996) via le modèle CLIP en supprimant l’asymétrie droite/gauche du modèle. La démarche suivie était en tous points similaire à celle réalisée au paragraphe 4-5, à l’exception de la valeur du paramètre bl qui était cette fois égale à celui de br (br = bl = .05). Les données sont présentées dans la Figure 18.

Figure 18. Probabilités de reconnaître un mot à début informatif (à gauche) et à fin informative (à droite) en fonction de la position de la lettre fixée. Les lignes pointillées (symboles vides) représentent les données empiriques, les traits pleins (symboles pleins) représentent les données calculées d’après le modèle CLIP, enfin les lignes pointillées (symboles pleins) représentent la probabilité de coder le CLIP total lorsque br = bl.

Les données théoriques ainsi obtenues prédisent correctement de meilleures performances de reconnaissance des mots à début informatif lorsque les fixations sont sur le début des mots que lorsqu’elles se situent sur la fin des mots. En revanche, lorsque les mots sont à fin informative, l’absence d’asymétrie de la lisibilité des lettres prédit incorrectement un avantage lorsque le regard se pose sur la fin des mots que lorsqu’il se situe sur le début des mots, allant par conséquent à l’encontre des hypothèses des modèles de Stevens et Grainger (2003) et Clark et O’Regan (1999).