1.1. Composition, mot composé et nom composé

C’est donc dans un souci de clarté que cette partie réunit les définitions de Tournier de toutes les unités présentant des points communs avec les noms composés. La connaissance des propriétés caractéristiques de chaque type d’unités devrait permettre l’identification des composés, au moins aux fins de ce travail.

Tournier définit la composition, le mot composé et ses dérivés (noms, adjectifs, verbes composés) dans plusieurs ouvrages : Introduction descriptive à la lexicogénique de l’anglais (1985), Précis de lexicologie anglaise (1991a), Structures lexicales de l’anglais (1991b). La composition, l’une des douze matrices lexicogéniques ¹⁶ de formation et de développement du lexique, est le processus de formation des mots composés. Un mot composé est :
‘un mot formé de plusieurs éléments, dont au moins deux peuvent, par ailleurs, être utilisés de façon autonome […]. Le mot composé doit être distingué de la séquence fortuite […]. (1991b : 38)’
Cette définition est enrichie de quelques exemples révélant la variété des mots composés anglais (house-dog, doghouse, cat’s eyes, centre of gravity, red-hot, hand-made, made by hand, stage-manage, look down). Étudier ces exemples permettra de comprendre la signification de « élément » et « autonome ». L’appellation élément renvoie à des formants de nature variée : des noms (dog, house, centre, hand, etc.), des adjectifs (red, hot, absent), des prépositions (of), des adverbes (down) et des verbes (look). Tous ont pour point commun d’être autonomes.

Il apparaît, à la lumière des exemples, que trois graphies sont possibles pour écrire les composés. Leurs éléments constitutifs sont accolés (doghouse), reliés par un trait d’union (red-hot, house-dog) ou séparés par un blanc (centre of gravity, look down). La nature grammaticale des composés est, elle aussi, variée. Peuvent être composés des adjectifs, des adverbes, des verbes et des noms. Cette diversité se retrouve en français et en espagnol. Les adjectifs composéssont formés de diverses manières. EN red-hot,FR aigre-doux et ES socioeconómico, azul marino sont des assemblages de deux adjectifs ; EN hand-made FR fait main, ES bien educado sont les combinaisons d’un nom et d’un participe passé et EN made by hand, FR commis par erreur, ES hecho a mano sont les associations d’un participe passé et d’un nom relié par une préposition. EN stage-manage¸ FR champlever sont des verbes composés construits avec un verbe et un nom ES maldecir comprend un verbe et un adverbe. Les adverbes EN in fact, FR en fin de compte et ES al fin y al cabo sont formés de noms, de prépositions et d’articles.

En ce qui concerne le nom composé, Tournier cite des exemples formés par quatre constructions : dans EN house-dog et doghouse deux noms sont reliés par un trait d’union ou accolés (FR avion-citerne, ES baloncesto), EN cat’s eyes est formé de deux noms reliés par le génitif et EN centre of gravity est une combinaison de deux noms reliés par une préposition (FR centre de gravité, ES centro de gravedad). Tournier parle de modèle germanique lorsque le déterminant d’un composé anglais précède le déterminé et que la relation n’est pas exprimée par une préposition (EN access control) et de modèle roman lorsque le déterminant suit le déterminé et qu’ils sont reliés par une préposition (EN denial of service) (1991b : 84).

Les composés néo-classiques se démarquent des composés cités jusqu’à présent, c'est-à-dire de ceux dont les éléments peuvent être utilisés de façon autonome. La principale caractéristique des composés néo-classiques réside dans la nature de leurs éléments que Tournier appelle quasi-morphèmes. Ces composés comportent « au moins deux quasi-morphèmes (ou combining forms) » (1991b : 127). Les quasi-morphèmes (q.m.) sont « des éléments du lexique qui ne peuvent apparaître que combinés avec d’autres. […] Les q.m. se combinent de préférence entre eux […] et ont la possibilité d’apparaître aussi bien à gauche qu’à droite […] » (1991b : 151-152). Leur contenu sémantique est semblable à celui des lexies simples. Tournier cite l’exemple de EN rhododendron dans lequel l’élément grec rhodo a le même sens que le mot anglais pink, et l’élément dendron a la même signification que l’anglais tree. Rhododendron équivaut donc à une formation composée non réalisée ¹⁷ de la langue anglaise, pink tree. Les quasi-morphèmes, qui sont dépourvus d’autonomie, peuvent se situer à gauche ou à droite, comme les éléments autonomes des composés : EN psycho path , path ology, phono gram et gramo phone . Le français et l’espagnol partagent les propriétés énoncées pour l’anglais. Si l’on reprend l’exemple de l’auteur, rhodon peut être remplacé par rose en français et par roso en espagnol et dendron par arbre et par árbol. FR arbre rose et ES árbol roso font partie du lexique potentiel du français et de l’espagnol. Les quasi-morphèmes se combinent aussi entre eux et peuvent avoir une position préfixale ou suffixale : FR psycho pathe / path ologie, ES psicó pata / pato logía, et FR phono gramme / gramo phone , ES fonó grafo / gramó fono .

Les quasi-morphèmes doivent être différenciés de ce que Kocourek (1991 : 129-133) appelle les pseudo-confixes. Ces derniers étant très présents dans la terminologie d’Internet, il est utile d’introduire cette notion dès à présent, même si elle n’est pas abordée par Tournier. Les lexies pseudo-confixées sont formées de mots abrégés, formellement semblables à des confixes – c’est-à-dire des racines savantes liées –, et de lexies autonomes. Ce sont des composés de type N abrégé + N, comme FR autoroute dans lequel auto- est la réduction de automobile et téléspectateur dans lequel télé- est la troncation de télévision. Auto- et télé- ne sont ni des confixes (ce sont des troncations et non des racines grecques ou latines), ni des quasi-morphèmes (ils sont associés à une base et non combinés entre eux). Dans la présente étude, ces unités lexicales proches des amalgames (voir infra p. 13) seront appelées composés pseudo-confixés. Voici quelques exemples de pseudo-confixes présents dans le lexique d’Internet : EN cyber- (troncation de cyberspace > cybercrime), web- (troncation de World Wide Web > website), FR hyper- (troncation de hypertexte > hyperlien), -naute (troncation de astronaute > entreprenaute), ES e- (troncation de electrónico > e-compra), -nauta (troncation de astronauta > jubilnauta). Les composés pseudo-confixés contiennent un seul élément tronqué (EN cybercafé < cyber (cyberspace) + café) et les amalgames en possèdent deux (EN modem < modulator + demodulator). ¹⁸

Lorsqu’une combinaison rassemble entre trois et cinq éléments autonomes – ou non autonomes dans le cas des quasi-morphèmes et des pseudo-confixes –, Tournier parle de surcomposition ¹⁹ (ibid. : 38) : EN electrocardiography, biozoology. L’auteur classe les surcomposés à trois éléments selon l’ordre déterminant-déterminé de leurs formants. Le déterminé est l’élément sémantiquement fondamental du composé et le déterminant est l’élément secondaire qui précise le sens du déterminé : ²⁰

AB + C (C + AB en français et espagnol). Le composé AB est le déterminant de l’élément C comme dans EN [[ad-blocking] program], FR [fournisseur d’[applications hébergées]], ES [bloqueador de [pop-up]],
A + BC (BC + A en français et espagnol). L’élément A est le déterminant du composé BC comme dans EN [electronic [newsletter]], FR [[newsletter] électronique], ES [[dirección IP] pública],
A + B + C. A et B déterminent C comme dans EN [[round] [unvarnished] tale], FR [copie [carbone] [invisible]] et ES [red [privada] [virtual]]

Autre type de composition étudié par Tournier, l’amalgame. ²¹ Dans un amalgame, « les signifiants des éléments du composé ne sont pas juxtaposés, mais emboîtés l’un dans l’autre » (1991b :17) comme dans EN Internet ( Inter national + net work).

Une autre propriété des composés doit être abordée, la centricité. Un nom composé est appelé endocentrique si « la classe d’objets à laquelle il correspond est la même que celle à laquelle correspond l’élément déterminé » (1991b : 68). Dans le cas contraire, lorsque « la classe d’objets à laquelle il correspond n’est pas la même que celle à laquelle correspond le déterminé (dans la mesure où on peut le distinguer d’un déterminant) » (1991b : 72), le composé est dit exocentrique. ²² Une EN mailbox est une box. Box est le « substantif-tête », ²³ mailbox est endocentrique. Un EN black hat n’est pas un hat dans le domaine d’Internet. Autrement dit, le sens du composé est différent de celui de la somme de ses formants : il est exocentrique.

Pour conclure provisoirement, un composé, d’après Tournier,

comprend au minimum deux éléments. Dans les composés juxtaposés (EN blind copy) et syntagmatiques, ou N + prép + N, (FR moteur de recherche, ES gestor de correo), les éléments sont autonomes. Dans les amalgames et composés pseudo-confixés, il s’agit de réductions de lexies autonomes (EN motel = mo tor + ho tel ). Dans les composés néo-classiques, sont présents des éléments non autonomes, les quasi-morphèmes (EN phonograph).
est formé de noms, d’adjectifs, de verbes, de prépositions, d’adverbes qui peuvent être des dérivés (EN comparison site, FR gestionnaire de fichiers, ES administrador web), des sigles (EN ADSL connection, FR fichier MP3, ES protocolo IP), des emprunts (EN browser cache, FR site underground, ES banner publicitario), des quasi-morphèmes (EN photography, chromolithograph, FR psychologie, ES democracia), des pseudo-confixes (EN web designer, FR e-business, ES metabuscador) et des amalgames (EN ADSL modem, FR accès Internet, ES módem externo).
possède un ordre de détermination. Certains sont endocentriques (EN chat server , FR adresse électronique, ES grupo de discusión) et d’autres exocentriques (EN black hat, FR agent intelligent, ES caballo de Troya). Comme le montrent les exemples, la métaphore (ou la métonymie) interfère avec la centricité. ²⁴

Un composé peut être confondu avec une séquence fortuite, c’est-à-dire un groupe de mots occasionnel, ou formé pour les besoins du discours. Des critères ont été mis en place pour tenter de différencier ces deux sortes d’unités :
‘Il existe des critères d’ordre graphique, sémantique, distributionnel, accentuel et fréquentiel, qui permettent le plus souvent au lexicographe de faire la distinction [entre le mot composé et la séquence fortuite] (Tournier, 1991b. : 38)’
Il est maintenant nécessaire de lever les ambiguïtés qui existent entre le mot composé et d’autres unités lexicales ou non qui partagent avec lui certains traits conceptuels (la distribution syntaxique dans un énoncé, par exemple) : le mot simple, le mot dérivé, la séquence fortuite, la collocation et l’expression idiomatique.

Notes

16.

« On appelle matrices les douze processus fondamentaux de formation et développement du lexique : préfixation, suffixation, dérivation inverse, composition (par juxtaposition), amalgame, onomatopée, conversion, métaphore, métonymie, troncation, siglaison, emprunt » (Tournier, 1991b : 115-116).

17.

L’ensemble des lexies possibles mais non réalisées d’une langue constitue le lexique potentiel. Les lexies réalisées d’une langue constituent le lexique réel. (Tournier 1991b : 111).

18.

Les composés pseudo-confixés anglais, français et espagnols font l’objet d’une étude détaillée (Part. II, Ch. 2, 3 et 4).

19.

D’autres dénominations existent. Clas utilise la désignation composés lourds pour parler des composés longs (1994 : 114).

20.

Par exemple, dans EN mailbox le déterminé est box et le déterminant mail.

21.

Cette notion est ultérieurement analysée en détail (Part. II, Ch. 2, Sec. 3.).

22.

Certains auteurs dont Boisson (1980) utilisent la terminologie sanscrite et parlent de dvandva (endocentrique) et de bahuvrihi (exocentrique).

23.

Terme employé par Gross (1996 : 35) qui correspond à head en anglais (Bauer 2002 : 1645).

24.

Des critères devront être mis en place pour définir jusqu’à quel degré de ressemblance entre deux concepts un composé sera endocentrique (Part. II, Ch. 2, Sec. 2.1.).