5.3.4. La contrainte de fréquence lexicale

La contrainte de fréquence lexicale prédit que le composant le plus fréquent sera premier dans l’ordre linéaire. Cette contrainte est applicable à l’ensemble des composés syndétiques, asyndétiques et amalgamés étudiés. La fréquence lexicale a été mesurée à partir des données du BNC fournies par Kilgarriff (2004). Le calcul a été effectué sur les mots-formes lemmatisés qui apparaissent au moins à cinq reprises dans le BNC. Le Tableau 23 montre que la distribution des composés asyndétiques et amalgamés est aléatoire (respectivement  (1) = 0,24 ; p ≤ 1 et  (1) = 0,39 ; p ≤ 1), et que celle des composés syndétiques n’est pas statistiquement significative ( (1) = 3,54 ; p ≤ 0,1) :

Tableau 23 : Distribution des composés coordinatifs en fonction de la fréquence lexicale de leurs composants
composés coordinatifs composant gauche plus fréquent composant droit plus fréquent composants de même fréquence total
syndétiques 174 127 1 302
asyndétiques 40 34 74
amalgamés 59 70 129

En neutralisant le rôle de la contrainte de longueur en syllabes sur la classe des composés syndétiques 215 , les résultats sont modifiés : sur 180 composés équisyl-labiques, 93 ont un premier composant plus fréquent, et 87 un deuxième composant plus fréquent. Cette distribution est aléatoire ( (1) = 0,1 ; p ≤ 1), ce qui montre que la différence de fréquence n’est pas en soi un critère d’ordonnancement des composants.

Notes
215.

 La contrainte n’est pas opérante sur les composés asyndétiques et amalgamés. Voir supra, 5.3.2.