1.1.3. Problèmes de lexicalité

Le terme lexicalisation a deux acceptions principales clairement distinctes dans la littérature spécialisée 16 . En anglais, il désigne généralement le processus d’opacifi-cation progressive de la nature polymorphémique d’une unité lexicale (Lipka 2002:111, Bauer 2004:65). La lexicalisation1 se divise en trois composantes : la première est sémantique — Bauer (2004:53) parle alors d’idiomatization —, la seconde phono-logique et la troisième graphique, étant entendu que les trois processus sont souvent conjugués, comme dans holiday (< holy + day). En français, le terme lexicalisation renvoie communément à la transformation d’une construction polymorphémique (le plus souvent, d’une suite polylexémique) en une unité lexicale, et le terme lexicalité désigne le fait de constituer une unité lexicale (Noailly 1990:17-18, Kocourek 1991:135, Arnaud 2003:20, Fradin 2003:220-221) 17 . Les frontières sont évidemment poreuses, et l’on rencontre parfois lexicalisation 1 en français (Bassac 2004:285) et lexicalization 2 en anglais (Booij 2005:17). Pour compléter le tableau, il convient de signaler que les deux termes anglais correspondant à lexicalisation 2 sont institutionali-zation (Bauer 2004:56-57) et conventionalization (Blank 2001:1597), et que les deux termes français équivalents à lexicalization 1 sont démotivation et opacification. Afin de ne pas être accusé de circularité, il faut enfin préciser le sens donné au terme unité lexicale 18 . Je reprendrai ici la définition donnée par Arnaud (2003:20) : une suite polylexémique est une unité lexicale si elle forme “un signe de la langue, c’est-à-dire l’association stable d’un signifiant et d’un signifié, lequel signifié entretient des rapports encore mal compris avec un concept, représentation cognitive d’un denotatum du monde”. Une unité lexicale est linguistiquement codée — elle a une forme et un sens préconstruits, enregistrés dans le lexique mental d’une communauté de locuteurs —, et, si sa diffusion et sa fréquence en diachronie courte le justifient, elle accède au statut d’unité lexicographique, c’est-à-dire d’unité lexicale répertoriée par les dictionnaires. Le substantif frogman peut ici servir d’illustration. Comme le note Bauer (à paraître a), ce composé est parfaitement construit pour dénoter tout concept au sein duquel un homme entretient un rapport sémantique avec la grenouille : frogman pourrait légiti-mement désigner un scientifique qui étudie les grenouilles, un commerçant qui vend des grenouilles, un petit homme vert, un homme à la voix coassante, un être mi-homme mi-grenouille, etc. Plusieurs de ces sens sont d’ailleurs attestés en discours, comme le montrent les phrases suivantes, relevées dans Google Book Search et Wikipedia (= WIKI) :

‘“Mike Tyler has been mad about frogs since he was a boy, which is quite a while ago. He is known around the world as ‘The Frogman ’ and has found out enough about frogs and toads to write 24 books.”, It’s True! Frogs are Cannibals, de Michael J. Tyler, 2005, Allen & Unwin, p. 84.’ ‘“Clarence " Frogman " Henry is an American rhythm and blues singer. [...] His trademark croak, utilized to the max on his 1956 debut smash "Ain’t Got No Home," earned Henry his nickname [...].” (WIKI)’ ‘“The Frogman was, in truth, descended from the common frogs of Oz, and when he was first born he lived in a pool in the Winkie Country and was much like any other frog. [...] He did not hop any more, but stood upright on his hind legs and dressed himself in fine clothes and sat in chairs and did all the things that people do, so he soon came to be called the Frogman [...].”, The Lost Princess of Oz, de L. Frank Baum, 1999, Dover Publications, p. 40-42.’

Les hasards de la langue ont cependant fait que seule la relation sémantique désignant un homme muni de palmes est lexicalisée, avec le sens imprévisible de nageur de combat.

Plusieurs critères permettant de reconnaître le caractère lexical d’une suite polylexémique sont fréquemment évoqués dans la littérature spécialisée 19 . Le critère accentuel, qui veut qu’une suite accentuée sur son élément gauche soit obligatoirement lexicale, ne semble pas devoir être retenu, car Liberman et Sproat (1992:166) indiquent que certaines suites qu’on peut penser non lexicales, comme dental operation ou Capsicum leaf, sont accentuées à gauche. La fréquence de co-occurrence des éléments d’une suite n’est pas non plus un critère fiable de lexicalité, car il n’est pas suffisant : un degré de co-occurrence statistiquement remarquable 20 ne distingue pas les simples col-locations des unités lexicales (ex. : dans le Collins WordsbankOnline English Corpus (= CWOEC), harmless et fun ont un score d’information mutuelle de 6,16, steel et magnate un score de 7,25, mais les suites harmless fun et steel magnate ne sont pas des unités lexicales). Le critère de substitution paradigmatique, c’est-à-dire le remplacement en discours d’une suite polylexémique par un équivalent monolexémique, semble, lui, être un critère suffisant de lexicalité : le fait par exemple que le lexème béchamel soit substituable à la suite white sauce est une preuve de lexicalité de cette suite 21 . Kocourek (1991:136-137, 145) choisit d’écarter ce critère au motif que le fait que des syntagmes descriptifs comme unité syntagmatique à vocation lexicale ou unité lexicale à deux ou plus de deux éléments soient des équivalents du mot-terme lexie ne prouve pas que le syntagme en question est lexicalisé. S’il est évident que plus le syntagme est long, moins sa lexicalisation est probable, je considère aussi qu’à l’inverse, plus la suite est courte, plus le critère est fiable, et il semble suffisant pour des suites binaires. Il n’en reste pas moins que la recherche d’un critère plus largement applicable est nécessaire, car la grande majorité des unités lexicales polylexémiques ne possèdent pas d’équi-valent monolexémique. Le critère de cohésion interne de la suite est à ce titre intéressant. Il permet par exemple de distinguer white sauce de white tooth. Une suite lexicale n’admet en effet pas de modification interne de son élément-tête ou de modification de son élément-modificateur sans perte de sens (ex. : a white milk sauce ; a very white sauce), alors que ce n’est pas le cas pour une suite non lexicale (a white porcelain tooth ; a very white tooth) 22 . Cette cohésion interne est le reflet de la distinction fondamentale entre suite lexicale et suite non lexicale, à savoir la non-compositionnalité sémantique de l’ensemble. Le sens d’une unité lexicale n’est en effet pas égal à la somme des sens particuliers de chacun des composants. Ceci est évident en cas de non-littéralité de la suite (ex. : white elephant dans son sens métaphorique), mais ce critère est tout aussi important en cas de lecture littérale de chaque constituant. Il suffit en effet qu’un élément sémantique imprévisible s’agrège au sens littéral de l’assemblage pour que la suite ne soit plus une simple collocation : white sauce par exemple désigne bien une sauce de couleur blanche, mais pas n’importe quelle sauce de couleur blanche ; elle dénote uniquement un mélange de beurre, de farine et de lait. La non-compositionnalité est souvent considérée comme un critère suffisant, mais non nécessaire de lexicalité : Lehmann et Martin-Berthet (1998:173) affirment ainsi que sac à dos et mésange à tête bleue sont des unités lexicales parfaitement compositionnelles. Je contre-argumenterai que n’importe quel sac porté sur le dos n’est pas un sac à dos, le trait conceptuel [MUNI DE BRETELLES] devant par exemple être associé au concept SAC À DOS ; même chose pour le terme d’ornithologie mésange à tête bleue : toute mésange à la tête bleue n’est pas une mésange à tête bleue, car Parus caeruleus a pour caractéristique définitoire un plumage bleu cobalt au niveau de la calotte (et non de la tête toute entière), des ailes et de la queue (WN2.1 23 ) 24 . La présence d’un ajout sémantique imprévisible n’est pas toujours facile à déterminer, et l’utilisation de tests s’avère parfois utile pour déterminer la lexicalité d’une suite. Le critère dénominatif permet de séparer les dénominations (angl. names), préconstruites en langue, des syntagmes descriptifs, fabriqués discursivement 25 . Riegel (1991:149-150) mentionne six tests dénominatifs pour le français, et j’adapte ici à l’anglais les deux tests les plus puissants, qui utilisent la suite testée en tant qu’autonyme, c’est-à-dire “un signe [qui] renvoie à lui-même en tant que signe et non à l’objet, au monde” (DL 26 ) :

T1 : “ X Y is the name of a Y which...”
White sauce is the name of a sauce which consists of milk thickened with a butter and flour roux.
*White tooth is the name of a tooth which...’ ‘ T2 : “The word X Y is...”
The word white sauce is not on my list.
*The word white tooth is not on my list.’

Pour valider l’utilité de l’approche dénominative, Arnaud (2003:29-31) analyse les ré-ponses de quinze locuteurs sur la lexicalité de huit suites lexicales et non lexicales N N, et il obtient des résultats statistiquement significatifs. Il propose par ailleurs un autre critère probabiliste (op. cit.:31-32) : l’ajout d’un trait d’union à une suite N N graphiquement discontinue peut être considéré comme une forme de codage méta-linguistique de la lexicalité de la suite. Les résultats obtenus auprès de 37 informateurs pour 21 suites N N sont, comme précédemment, statistiquement probants.

Notes
16.

 Pour une étude détaillée des différents sens du terme lexicalization, voir Blank (2001) et Hohenhaus (2005).

17.

 Le terme lexicalité est attesté dans un autre sens chez Tournier (1985:39) : il y désigne “la conformité (d’une lexie) aux règles lexicogéniques d’une langue donnée”.

18.

 D’autres termes quasi-synonymes sont utilisés dans la littérature : lexie en français (Pottier 1974:265, 326 ; Tournier 1991:109), listeme (Di Sciullo & Williams 1987:3) et lexical item (Bauer 2004:64) en anglais.

19.

 La discussion est ici d’ordre général. Le cas spécifique des suites X AND Y fera l’objet d’un développement particulier au Chapitre 2. Voir infra, 2.2.1.

20.

 Le caractère statistiquement remarquable d’une collocation correspond communément à un score d’information mutuelle (angl. Mutual Information Score) supérieur à 3 (Church & Hanks 1990:24, Hunston 2002:71).

21.

 Pour le français, Benveniste (1967:18) mentionne les paires silure / poisson-chat et colibrioiseau-mouche, Arnaud (2004a:334) la paire kamikaze / avion-suicide.

22.

 Ce critère est quelquefois d’application délicate, comme le montre l’attestation des suites new and second-hand bookseller, cruise shipwreck et tropical birdwatcher (voir supra, 1.1.2.).

23.

 WN 2.1 = WordNet, version 2.1.

24.

 Pour une discussion plus étendue sur la non-compositionnalité des composés lexicaux, voir infra, 1.2.1.

25.

 Sur la génèse de l’approche dénominative, voir Kleiber (1984) et Riegel (1988, 1989).

26.

 DL = Dictionnaire de Linguistique.