Annexe 3. Caractéristiques des stimuli utilisés dans la seconde étude.

Remarque préliminaire :

Au moment de la construction de la présente expérience, la base de données informatisée Lexique (New, Pallier, Ferrand et Matos, 2001) n'avait pas encore été publiée. Alors que les informations lexicales présentées dans BRULEX avaient été établies sur la base d'un corpus de textes littéraires publiés entre 1919 et 1964, comprenant 23,5 millions de mots, les normes correspondantes dans LEXIQUE ont été obtenues à partir d'un ensemble de texte plus récent, parus entre les années 1950 et 2000, et comprenant 31 million de formes orthographiques. Le traitement de ces textes, extraits de la base FRANTEXT, a débouché sur la sélection de 130 000 entrées distinctes, comprenant notamment des déclinaisons verbales et formes de pluriel non répertoriées parmi les 35 746 items du Micro Robert (Robert, 1986) retenues par les auteurs de BRULEX. Cela considéré, il nous a semblé nécessaire de réévaluer la validité de notre sélection initiale en tenant compte de ces normes plus actuelles.

Variables contrôlées :

  1. Fréquence lexicale :
  1. Longueur des mots : cette variable a été estimée en termes de nombre de lettres, de phonèmes et de syllabes.
  2. Classe grammaticale: plusieurs recherches ayant suggéré l'existence de traitements spécifiques dépendants de la classe grammaticale des items considérés (Cole & Segui, 1994 ; Deutsch, Frost & Forster, 1998 ; Munte & collègues, 2001), seuls des noms ont été introduits dans les différentes listes expérimentales. Il faut cependant noter que 8 noms de la liste 1, 7 noms de la liste 2, 6 noms de la liste 3 et 5 noms de la liste 4 sont homographes homophones d’une déclinaison verbale et/ ou d’une forme adjectivale dans de rares cas. Les normes de fréquences disponibles dans MANULEX (Lété, Spenger-Charolles et Colé, 2003 ?) établissent toutefois la supériorité systématique de la fréquence cumulée des formes nominales à la fin de la scolarité élémentaire.
  3. Voisins orthographiques: des résultats robustes en faveur de l'influence du nombre de voisins orthographiques sur la reconnaissance des mots ont été rapportés, bien que la nature facilitatrice ou inhibitrice de ces effets sur les décisions lexicales reste encore discutée (Ziegler & Perry, 1998). La densité du voisinage orthographique d'un mot est définie par le nombre de mots différents qu'il est possible de créer en ne modifiant qu'une seule lettre du mot cible, tout en préservant les positions des lettres restantes (Coltheart, Davelaar, Jonasson & Besner, 1977). A partir de cette définition, la mesure des voisins orthographiques proposée dans le BRULEX a été obtenue au moyen d'un calcul effectué sur la forme orthographique de base des items, incluant les marques diacritiques.

Le tableau ci-dessous rappelle, pour chacune des 4 listes expérimentales, les valeurs moyennes de fréquence lexicale (FREQ et LOG FREQ), de fréquence des digrammes (DIGR), de nombre de phonèmes (PHON), de lettres (LETTRE) et de syllabes (SYLLABE), de voisins orthographiques (V.ORTH) et d'imageabilité (IMA). Le tableau rappelle également qu’en complément de BRULEX, la fréquence des mots sélectionnés a été ultérieurement vérifiée au moyen des normes de LEXIQUE (suivant un comptage d’occurrence basé sur des textes littéraires réunis dans le corpus de FRANTEXT, LEXIQUE 1 et suivant un comptage d’occurrence réalisé sur des pages Internet LEXIQUE 2) et de MANULEX. Les résultats des différentes analyses par items réalisées sur la base de ces données sont présentés dans la dernière colonne du tableau. Dans la majorité des cas, aucune différence significative n'a été observée entre les différentes listes. Les tests PLSD de Fisher révèlent toutefois une fréquence moyenne plus élevée pour les mots de la liste 1 que pour ceux de la seconde liste, d’après les normes de LEXIQUE (Lexique 1 : p=.0386 et Lexique 2 : p=.0432).

Liste des stimuli inclus dans la seconde expérience :
  LISTES  
  L1 L2 L3 L4 MOYENNE STATISTIQUES
FREQ 3847.00 2673.15 3264.84 3717.50 3375.62 [F(3,74)=.586, p=6262]
LOG FREQ 3.475 3.308 3.390 3.385 3.39 [F(3,74)=.728, p=.5386]
LEXIQUE (1) 28.80 13.45 25.02 22.94 22.55 [F(3,76)=1.606, p=.1930]
LEXIQUE (2) 5177.46 2348.45 3731.84 3113.03 3592.70 [F(3,76)=1.518, p=.2167]
MANULEX 87.41 67.44 64.56 54.10 68.38 [F(3,76)=.601, p=.6166]
DIGR 2.689 2.676 2.649 2.602 2.65 [F(3,76)=.145, p=.9326]
PHON 3.850 3.950 3.650 3.800 3.81 [F(3,76)=.300, p=.8255]
LETTRE 5.000 5.050 5.050 5.050 5.04 [F(3,76]=.018, p=.9967]
SYLLABE 1.500 1.500 1.400 1.500 1.48 [F(3,76)=.192, p=.9016]
V. ORTH 3.250 2.800 2.100 2.200 2.59 [F(3,76)=.973, p=.4100]
IMA 4.853 4.774 4.773 4.571 4.74 [F(3,76)=.983, p=.4054]
Liste des stimuli inclus dans la seconde expérience :
Pseudo-Mots Mots
Non-Homophones Homophones Listes Items Listes Items
Zave kave 1 lion 3 parc
Boif boix 1 bébé 3 drap
Rafe raje 1 rive 3 haie
Achar achas 1 arme 3 ours
Annas anner 1 café 3 hache
Noige naige 1 tige 3 grue
Preur queur 1 lait 3 veau
muidon meizon 1 barbe 3 glace
Jardan jardun 1 balle 3 gorge
Pripon prizon 1 lapin 3 filet
Vaxe vaze 1 sucre 3 verre
Brau brat 1 vigne 3 ruban
Joun jous 1 poire 3 fusil
Limpe lempe 1 foudre 3 cadeau
Nerbe jerbe 1 salade 3 beurre
Eclan éclas 1 poupée 3 viande
Poulic poulai 1 plante 3 chaise
Ontrée antrée 1 moulin 3 brebis
Papian papiée 1 fleuve 3 raisin
Mone mons 1 classe 3 muscle
Epon éper 2 four 4 camp
Etar étas 2 miel 4 pavé
Gamon gason 2 ange 4 vélo
Repec repau 2 toit 4 cerf
Nelée jelée 2 loup 4 képi
Dinéma sinéma 2 épine 4 gant
Profin profis 2 clou 4 tronc
Pefice aufice 2 nappe 4 front
Cliont cliant 2 sabre 4 forêt
Bonc bont 2 merle 4 bijou
Rano rant 2 sabot 4 tuile
Ronre janre 2 fruit 4 canne
Outin outis 2 botte 4 habit
Kivre jivre 2 lièvre 4 tiroir
Huine heine 2 légume 4 miroir
Effos effai 2 mouche 4 cendre
Firène cirène 2 barque 4 grille
Reflos reflai 2 navire 4 flamme
Taline talans 2 poudre 4 réveil
Minton manton 2 tortue 4 éclair