1.1.2. Les surcomposés à trois éléments

Tableau 28 : Structures compositionnelles endogènes et exogènes des surcomposés à trois éléments du corpus français
  Structures Fréquence « type » %
1 Composés endogènes : 93 94,89%
1.1 purs 59 60,20%
1.1.1 N + de + N + A 14 14,29%
1.1.2 N + de + N + de + N 11 11,22%
1.1.3 N + en + N 7 7,14%
1.1.4
N + à + N + A 5 5,10%
N + de + PS + N 5 5,10%
1.1.5 N + non + A 3 3,06%
1.1.6
N + de + N + en + N 2 2,04%
N + A + N 2 2,04%
N + N + N 2 2,04%
N + A + A 2 2,04%
1.1.7
N + à + N + N 1 1,02%
N + A + de + N 1 1,02%
N + N + A 1 1,02%
V + N + N 1 1,02%
N + sans + N 1 1,02%
N + hors + N 1 1,02%
1.2 hybrides 34 34,69%
1.2.1 N + de + N + N 7 7,14%
1.2.2 N + N + A 5 5,10%
1.2.3 N + PS + A 3 3,06%
1.2.4
N + N + N 2 2,04%
N + N + par + N 2 2,04%
1.2.5
N + de + N + A 1 1,02%
PS + N + de + N 1 1,02%
N + de + N + PS 1 1,02%
N + à + N + N 1 1,02%
N + de + N + à + N 1 1,02%
N + de + N + de + N 1 1,02%
N + A + N 1 1,02%
PS + N + N 1 1,02%
N + PS + N 1 1,02%
N + A + PS 1 1,02%
PS + sans + N 1 1,02%
N + sur + N 1 1,02%
N + en + N 1 1,02%
V + N + N 1 1,02%
N + non + A 1 1,02%
2 Composés exogènes 5 5,10%
  TOTAL 98 100,00%

Les surcomposés de la terminologie française d’Internet sont presque exclusivement endogènes (94,89%). Les termes exogènes sont moins présents chez les surcomposés que chez les binaires (5,10% contre 14,63%). La fréquence des composés hybrides à trois éléments est de 10 points inférieure à celle des binaires (34,69% contre 44,26%). Les emprunts entrant dans la formation de surcomposés sont : Internet (FR fournisseur d’accès Internet), proxy (FR pare-feu proxy), cracker (Fr cracker de mots de passe), les sigles (FR boîte aux lettres POP3, adresse IP publique) et les pseudo-confixes (FR cyberpunkitude, page Web musicale). Aucun surcomposé ne contient un emprunt monosyllabique.

Les raisons du faible taux d’emprunts ont été exposées (Part. II, Ch. 3, Sec. 1.1.1.). Seules les différences entre binaires et surcomposés à trois éléments seront maintenant étudiées. Pourquoi la longueur des termes influence-t-elle le nombre de termes hybrides et d’emprunts ?

Les spécialistes d’Internet privilégient l’utilisation des sigles, surtout dans le cas des anglicismes (WAP, FTP, HTML, POP3, etc.). Ils empruntent les sigles sans les modifier 113 (leurs formes développées sont citées dans les articles à titre d’information). Mais d’une manière générale, les surcomposés à trois éléments sont moins fréquents en français qu’en anglais (15,11% contre 27,78% du total du corpus anglais).

Pour le grand public, un composé endogène de plusieurs éléments est plus facile à déchiffrer qu’un emprunt long (FR mise à jour automatique < EN live update, FR serveur de courrier entrant < EN incoming mail server). Les calques sont donc préférables aux emprunts.

Tableau 29 : Structures compositionnelles des surcomposés endogènes à trois éléments du corpus français
  Structures Fréquence « type » %
  2 structures majeures : 27 29,03%
1 N + de + N + A 15 16,13%
2 N + de + N + de + N 12 12,90%
  7 structures moyennes : 39 41,94%
3 N + en + N 8 8,60%
4 N + de + N + N 7 7,53%
5 N + N + A 6 6,45%
7 N + à + N + A 5 5,38%
8 N + de + PS + N 5 5,38%
9 N + non + A 4 4,30%
10 N + N + N 4 4,30%
11 1148 structures mineures 115 27 29,03%
  Total 93 100,00%

Les quatre-vingt-treize surcomposés endogènes ont été créés par vingt-sept patrons, dont deux sont plus fréquents : N + de + N + A (type page d’accueil personnelle, fournisseur d’applications hébergées) et N + de + N + de + N (type site de comparaison de prix, système de détection d’intrusion). À elles deux, ces structures représentent presque un tiers de la totalité des surcomposés. Elles se démarquent des vingt-cinq autres puisque leur pourcentage est bien supérieur à la moyenne générale de 3,70%. Trois autres patrons dépassent la moyenne : N + en + N (type achat en ligne, dialogue en direct), N + de + N + N (type logiciel d’accès Internet, vitesse de connexion Internet), N + N + A (type Internet bande large, adresse IP dynamique).

Les formations comprenant un pseudo-confixe sont majoritaires. Avec quatorze termes elles totalisent 15,05% de l’ensemble de ces surcomposés endogènes. Cela confirme la tendance observée chez les composés et surcomposés anglais et chez les composés français.

La fréquence du premier patron N + de + N + A peut aisément être expliquée. Les composés N + de + N deviennent les bases de nouvelles créations et/ou sont des calques de composés anglais (gestionnaire de courrier électronique, page d'accueil personnelle, etc.). Cela s’applique également aux composés N + de + N + N (fournisseur d'accès Internet, logiciel de connexion Internet, etc.).

Les travaux de Humbley (2000), Kocourek (1991), Mitterrand (2000) ne parlent pas des composés longs. En revanche, l’étude du vocabulaire informatique (Béciri, 1999 : 137) fait ressortir une trentaine de surcomposés à trois éléments ou plus sur 222 termes (soit 13,51%, pourcentage similaire au nôtre).

Notes
113.

Dans la terminologie française de l’informatique, 74% des sigles sont anglais (corpus utilisé : Dictionnaire de l’informatique, Pierre Morvan dir., 1996, Paris, Larousse, 351 p.) (Walter, 1997 : 46-47).

114.
115.

N+A+N (3,23%), N+PS+A (3,23%), N+A+A (2,15%), V+N+N (2,15%), N+à+N+N (2,15%), N+N+par+N (2,15%), N+de+N+en+N (2,15%), N+hors+N (1,08%), N+sans+N (1,08%), PS+N+de+N (1,08%), N+de+N+PS (1,08%), N+A+de+N (1,08%), N+de+N+à+N (1,08%), PS+N+N (1,08%), N+PS+N (1,08%), N+A+PS (1,08%), PS+sans+N (1,08%), N+sur+N (1,08%).