La contrainte de fréquence lexicale prédit que le composant le plus fréquent sera premier dans l’ordre linéaire. Cette contrainte est applicable à l’ensemble des composés syndétiques, asyndétiques et amalgamés étudiés. La fréquence lexicale a été mesurée à partir des données du BNC fournies par Kilgarriff (2004). Le calcul a été effectué sur les mots-formes lemmatisés qui apparaissent au moins à cinq reprises dans le BNC. Le Tableau 23 montre que la distribution des composés asyndétiques et amalgamés est aléatoire (respectivement (1) = 0,24 ; p ≤ 1 et (1) = 0,39 ; p ≤ 1), et que celle des composés syndétiques n’est pas statistiquement significative ( (1) = 3,54 ; p ≤ 0,1) :
composés coordinatifs | composant gauche plus fréquent | composant droit plus fréquent | composants de même fréquence | total |
syndétiques | 174 | 127 | 1 | 302 |
asyndétiques | 40 | 34 | — | 74 |
amalgamés | 59 | 70 | — | 129 |
En neutralisant le rôle de la contrainte de longueur en syllabes sur la classe des composés syndétiques 215 , les résultats sont modifiés : sur 180 composés équisyl-labiques, 93 ont un premier composant plus fréquent, et 87 un deuxième composant plus fréquent. Cette distribution est aléatoire ( (1) = 0,1 ; p ≤ 1), ce qui montre que la différence de fréquence n’est pas en soi un critère d’ordonnancement des composants.
La contrainte n’est pas opérante sur les composés asyndétiques et amalgamés. Voir supra, 5.3.2.