1.1.3. Les surcomposés à quatre et cinq éléments

Tableau 30 : Structures compositionnelles endogènes et exogènes des surcomposés à quatre et cinq éléments du corpus français
  Structures Fréquence « type » %
1 Composés endogènes : 6 54,54%
1.1 purs 4 36,36%
1.1.1
N + de + N + A + A 1 9,09%
N + à + N + A + A 1 9,09%
N + de + N + sans +N 1 9,09%
N + par + N + A 1 9,09%
1.2 hybrides 2 18,18%
1.2.1
N + PS + A + N 1 9,09%
N + N + sans + N 1 9,09%
2 Composés exogènes 5 45,45%
  TOTAL 11 100,00%

Les termes endogènes du tableau 30 représentent 54,54% du corpus contre 94,89% chez les surcomposés à trois éléments. Comment expliquer la différence des pourcentages d’endogénéité et d’exogénéité entre les surcomposés à trois éléments et les termes plus longs ?

Pour répondre à cette question, nous nous pencherons sur la nature des surcomposés à quatre éléments et plus et sur les concepts qu’ils désignent. Ces onze termes longs sont tous relatifs à des aspects techniques et non à l’actualité d’Internet comme la majorité des termes analysés. Ils désignent des protocoles (Transmission Control Protocol/Internet Protocol), des langages (HyperText Markup Language) ou des modes de connexion (ligne d'abonnement numérique asymétrique, connexion à bande large permanente). Dans les textes, les formes réduites de ces termes techniques sont privilégiées. Cependant, pour informer et former le grand public sur un protocole ou un langage, les journalistes développent les sigles et utilisent donc des emprunts. La proportion de composés exogènes est plus importante que chez les binaires puisque les journalistes ne précisent pas les équivalents anglais des termes français courts dont les concepts ne sont pas désignés par des sigles.

Pour conclure, les termes très longs sont peu représentés dans notre corpus car : a) le côté technique d’Internet n’est pas le thème majeur des revues (qui est l’actualité) et b) les termes longs sont rapidement raccourcis (par troncation et siglaison). En outre, ces surcomposés rapprochent le lexique d’Internet des lexiques plus soutenus. Il est plus délicat de parler d’absence de frontière entre langue populaire et langue scientifique puisque par leur longueur les termes techniques d’Internet se rapprochent du prototype du terme.

Tableau 31 : Structures compositionnelles des surcomposés endogènes à quatre et cinq éléments du corpus français
  Structures Fréquence « type » %
1
N + de + N + A + A 1 16,67%
N + à + N + A + A 1 16,67%
N + de + N + sans +N 1 16,67%
N + PS + A + N 1 16,67%
N + N + sans + N 1 16,67%
N + par + N + A 1 16,67%
  Total 6 100,00%

Peu de composés forment cette catégorie : les six composés endogènes comptent quatre éléments. Les données dont nous disposons sont insuffisantes pour aboutir à des résultats satisfaisants. La présence des formations avec pseudo-confixe (16,67%) est similaire à celle de surcomposés à trois éléments (15,05%).

À l’inverse des surcomposés à trois éléments, nous avons des proportions de termes similaires en français (1,69%) et en anglais (1,08%). Nous en avons déjà évoqué la raison (Ch. 2, Sec. 1.1.3.). Les surcomposés à trois, quatre, cinq (et six) éléments sont moins nombreux en français qu’en anglais, contrairement aux composés binaires :

Tableau 32 : Répartition des noms composés anglais et français selon le nombre de formants
Nb de formants 2 3 4 5 6 Total
Corpus anglais 397 129 21 5 1 553
Corpus français 540 98 9 2 0 649

Ceci est vraisemblablement dû au fait que le français adapte les raccourcissements et les réductions des surcomposés anglais. Le nombre inférieur de surcomposés en français est compensé par un nombre supérieur de composés. D’autre part, les composés sont plus nombreux en français qu’en anglais parce qu’il existe une concurrence terminologique : plusieurs équivalents français remplacent un terme anglais. Par exemple, à EN log file correspondent trois équivalents français : fichier journal, fichier de log, log de connexion.