Annexe 2  Détail des mesures utilisées pour l’appariement des caractères Kanji Japonais.

Toutes les mesures ont été tirées de la base de donnée « Nihongo-no Goitokusei » (Propriétés Lexicales du Japonais) de Amano & Kondo (1999).

Fréquence des caractères  : un comptage de fréquence d’occurrence a été établi pour 340 000 mots et caractères apparaissant dans la totalité des articles du journal Asahi sur une période de 14 ans, s’étendant de 1985 à 1998, extraits par analyse morphologique.

Longueur de la forme orale des mots  : mesurée en nombre de morae. Le terme de mora désigne généralement les unités/temps des sons de parole, dont l’association forme les mots du discours oral en Japonais (Tsujimura, 1996). Les moraes font référence aux unités infra-syllabiques de longueurs variables transcrite par un kana unique, et correspondent suivant les cas au noyau vocalique, au noyau précédé de l’attaque syllabique, à la portion post vocalique de la syllabe ou à la portion étendue de la voyelle 27 . On notera que les caractères dont la lecture était allongée par une déclinaison faisant intervenir un kana (ex : déclinaisons verbales) ont été exclus.

Nombre de lectures alternatives  : cette mesure tient compte des deux modes de prononciation des caractères Kanji, renvoyant alternativement à une prononciation phonétique (« onyomi » ou lecture on) ou à une lecture dite explicative (« kunyomi » ou lecture kun). Dans la présente expérience, le choix de la prononciation est biaisé vers la lecture Kun, cette dernière étant préférentiellement rattachée aux mots transcrits par un caractère Kanji unique (Fushimi et al., 1999, Nishio communication personnelle).

Validité de la lecture  : l’emprunt graduel des caractères chinois à différentes périodes historiques et en diverses localisations géographiques a conduit à attribuer plusieurs lectures on et kun à un grand nombre de Kanji. Toutefois, seule une proportion restreinte de ces prononciations alternatives a conservé un usage commun.

Amano & Kondo (1999) ont prié 24 juges de langue maternelle Japonaise d’évaluer la plausibilité de chaque prononciation alternative pour l’ensemble des Kanji répertoriés dans la base lexicale. Plus précisément, 26 345 paires associant les Kanji à leurs prononciations (tirées des dictionnaires Shin meikai kanwa, Sanseido, 1990 et Shin meikai Kokugo, Kindaichi, 1989) ont été présentées et jugées sur la base d’une échelle en 7 points, où 1 désignait la prononciation la moins plausible et 7 la prononciation la plus plausible.

Complexité visuelle  : cette variable a entre autres été estimée d’après le nombre de traits entrant dans la composition de chaque idéogramme et selon la densité des points de la police de caractère des Kanji sur une matrice de 32 x 32.

Le tableau ci-dessous reprend les valeurs moyennes prises par chaque facteur dans chaque liste expérimentale constituée, associées à l’intervalle dans lequel ces valeurs étaient comprises, avec Frq : fréquence lexicale, Lg : longueur, Alt : nombre de prononciations alternatives, Vdt : validité de lecture, Cpx1 : complexité visuelle des caractères exprimée en nombre de traits, Cpx2 : complexité visuelle des caractères selon la densité des points de leur police de caractère sur une matrice de 32 x 32.

  Listes
  L1 L2 L3 L4 L5
Statistiques (1)
Liste 1 à 5
Statistiques (2)
Liste 2 à 5
Frq : moy.
rang
113898.45 58949.70 70836.80 52366.60 44117.90
[13704 ;278011] [7575 ;163867] [5988224067] [3428208528] [9757154501]
F[4,95]=4.377;
p=.0027
F[3, 76]=.950; p=.4210
Lth : moy.
rang
2.10 2.10 2.10 2.10 2.20
[1;3] [1;3] [1;3] [1;3] [2;3]
F[4,95]=.207;;
p=.9342
F[3, 76]=.260;p=.8538
Alt : moy.
rang
6,60 5,70 5,45 5,65 4.75
[2;16] [3;14] [3;11] [1;12] [1;11]
F[4,95]=1.064;
p=.3785
F[3, 76]=.550;p=.6497
Vdt : moy.
rang
6.76 6.74 6.70 6.66 6,61
[6.46;6.88] [6.46;6.88] [6.42;7] [6.25;7] [6.17;6.96]
F[4,95]=3.271;
p=.0147
F[3,76]=2,239;p=.0906
Cpx1 : moy.
rang
6.20 9.45 10.40 11.150 9.95
[3;12] [4;18] [5;16] [5;19] [5;13]
F[4,95]=8.538;
p<.0001
F[3,76]=1.100;p=.3544
Cpx2 : moy.rang 196.55 243.70 269.35 273.15 268.55 F[4,95]=12.757;p<.0001 F[3,76]=2.217;p=.0930
Notes
27.

La théorie des constituants décrit l’organisation de la syllabe suivant deux niveaux hiérarchiques, comprenant à un niveau supérieur l’attaque et la rime, et à un niveau inférieur le nœud rime lui même, formé d’un noyau et d’une coda. Encrevé (1988, p.81) précise que « l’attaque peut comporter une ou plusieurs consonnes suivant les langues ; la rime comprend toujours un noyau comportant au moins une voyelle et peut comprendre une coda comportant une ou plusieurs consonnes ».