Conclusion

En introduction, nous avons formulé deux questions relatives aux noms composés du lexique d’Internet :

Quelles sont les particularités morphosyntaxiques et sémantiques des noms composés anglais, français et espagnols ?
Quel est le devenir des noms composés anglais en français et en espagnol ?

Notre objet scientifique étant de fonder une méthode pour traduire les noms composés anglais à venir d’Internet en français et en espagnol – après examen des composés anglais attestés et de leurs équivalents de traduction –, nous nous inscrivons dans une perspective d’aide à la traduction et de création néologique. Plusieurs éléments ont suscité la volonté d’élaborer un système d’équivalences types anglais-français et anglais-espagnol pour assister le traducteur spécialisé : les caractéristiques des noms composés anglais, français et espagnols, les difficultés de traduction que posent les composés anglais d’Internet, le manque de fiabilité des outils de TA dans la traduction des composés du domaine et la confirmation de la possibilité de créer des équivalences entre les composés anglais et français et les composés anglais et espagnols.

Pour répondre à la première question, il fallait commencer par cerner le phénomène de la composition et du nom composé, c’est-à-dire savoir comment isoler les composés parmi toutes les unités lexicales et analyser les caractéristiques morphosyntaxiques et sémantiques des unités identifiées comme des noms composés. Nous avons étudié les définitions de toutes les unités lexicales de Tournier puis examiné des critères de compositionnalité (Part. I). Aucun de ces critères n’est fiable à 100%. Pour recenser nos termes, nous avons donc eu recours à une définition peu restrictive, utilisé les critères réunissant un faisceau de présomptions et vérifié que les candidats-composés étaient répertoriés dans des ouvrages de référence et/ou qu’un moteur de recherche présentait cinq occurrences dans des contexte Internet différents. Cette démarche permet de tenir compte des catégories mineures. D’autre part, s’il est impossible de réunir toutes les particularités du nom composé ou de la séquence fortuite, alors les différences entre les deux sont extrêmement faibles. L’analyse des critères démontre que le type fondamental de construction est le même. Un composé a été une séquence libre avant d’être répertorié et sa fréquence peut diminuer au point qu’il peut perdre son statut de composé et redevenir une séquence libre. Par conséquent, les difficultés de traduction sont identiques.

La première partie s’est achevée avec l’étude de typologies des noms composés anglais, français et espagnols de la langue générale et de langues de spécialité. Nos buts étaient de disposer de modèles de construction où puiser les informations indispensables à la création de nos typologies et d’évaluer le degré d’affinage des catégories de notre classification. Le système d’équivalences types allait être basé sur un classement des composés anglais mais, les trois langues étant proches, étudier des classifications des composés français et espagnols élargissait notre choix.

Pour dresser le profil morphosyntaxique et sémantique des noms composés anglais, français et espagnols d’Internet nous avons réalisé divers classements (Part. II). ¹⁹⁰ Pour recueillir les noms composés à étudier, le choix de la constitution d’un corpus s’est imposé. Pour garantir la pertinence d’un système d’équivalences s’adressant à des traducteurs et rédacteurs spécialisés, les termes observés devaient être attestés et réellement utilisés par les internautes. Les composés ont été collectés dans des revues d’Internet écrites par les internautes, véritables experts du domaine. Les magazines et les articles constituant le corpus ont été sélectionnés car leurs thèmes variés – navigation, moteur de recherche, sécurité, piratage, e-commerce, réseau, messagerie instantanée, courrier électronique, chat, etc. – permettent de regrouper l’essentiel des termes du domaine et de toucher un très vaste public.

Les termes extraits du corpus ont d’abord servi à la création d’une typologie morphosyntaxique qui allait constituer la toile de fond du système d’équivalences types. L’organisation des noms composés nous a confronté à des obstacles principalement liés à la réalisation du système d’équivalences. En effet, nous avions prévu de créer les équivalents en langue cible en fonction du patron syntaxique des composés sources, c'est-à-dire à partir d’une typologie des noms composés anglais existants mettant en parallèle leurs équivalents de traduction français et espagnols pour dégager les tendances de traduction. L’insertion d’une structure secondaire, basée sur la nature précise de chaque élément constitutif des composés (N-ion, N-ment, par exemple), pour affiner notre typologie a été écartée. Elle engendrait des complications pour la création des équivalents français et espagnols.

L’analyse des noms composés a débuté par cette typologie morphosyntaxique. Au cours de nos observations, nous avons enregistré les caractéristiques suivantes :

82,10% des composés du corpus anglais sont formés d’après six structures compositionnelles (N+N, PS+N, A+N, N+N+N, A+N+N, PS+N+N) alors que 58 patrons ont été relevés. En français, les 45 patrons endogènes ont généré 86,29% des composés collectés. Cinq structures vives (N+de+N, N+N, N+A, PS+N et Emp2) ont produit 76,57% des termes. Les composés exogènes représentent 13,71% des termes français. Quant aux composés espagnols, 87,85% d’entre eux ont été formés par 44 patrons endogènes. Avec 72,74% des termes, cinq structures se démarquent (N+de+N, N+A, N+N, PS+N et N+PS). Les composés exogènes comptent pour 12,15% du total.
Le faible pourcentage de composés français et espagnols exogènes est aussi surprenant qu’intéressant étant donné la dépendance technologique des pays francophones et hispanophones en matière d’Internet. La brièveté généralement constatée des emprunts (or les unités considérées dans cette étude sont longues), le fait que le corpus exploité soit un corpus écrit excluant les revues underground (les emprunts fourmillent dans la communication orale et underground) et que seuls les emprunts morphosémantiques et les sigles sont comptabilisés ont été les raisons évoquées pour expliquer ce pourcentage. Paradoxalement de nombreux composés endogènes hybrides ont été relevés (44,26% des binaires français et 46,04% des binaires espagnols). Ces termes hybrides semblent être une particularité du lexique d’Internet. Ils le différencient des autres terminologies plus soutenues.
Des comparaisons ont révélé que les patrons compositionnels les plus fréquents dans le lexique d’Internet sont souvent les mêmes que ceux employés dans la langue générale et dans quelques terminologies spécialisées comme la physicochimie, l’informatique et la science fiction.
La formation de composés à partir de pseudo-confixes semble constituer une grande nouveauté. Les premiers termes pseudo-confixésdu domaine ont été créés en anglais mais la pseudo-confixation n’est pas une particularité du lexique anglais. Le corpus anglais compte sept pseudo-confixes (cyber-, e-, web-, -ware, net-, hyper- et meta-) et les corpus français et espagnols en comptent neuf (FR cyber-, web-, e-, télé-, net-, -ware, méta-, hyper- et -naute ; ES ciber-, web-, e-, -ware, hiper-, meta-, -nauta, tele- et -net). L’hypothèse selon laquelle chacun des pseudo-confixes a un sens précis a été confirmée. Par exemple, cyber- entre dans la formation de composés désignant des activités, choses et personnes du monde réel reproduites sur la Toile alors que meta- intervient dans la création de termes désignant un type d’application. Les pseudo-confixes sont employés dans des champs notionnels précis. Leur fréquence très disparate reflète l’importance des champs notionnels.

Pour finir de dresser le profil des composés anglais, français et espagnols, une analyse de la centricité et des relations sémantiques est venue compléter utilement l’analyse morphosyntaxique. L’étude sémantique était également entreprise pour tenter d’expliquer, au moyen d’un croisement de typologies, les exceptions du système d’équivalences types. Nos observations ont dévoilé les particularités suivantes des noms composés :

Dans les trois langues, les composés endocentriques sont massivement représentés : 94,21% du corpus anglais, 93,68% du corpus français et 94,79% du corpus espagnol. Cette prépondérance s’explique par le fait que l’endocentricité facilite la compréhension du nom composé. Les combinaisons endocentriques présentent un degré de motivation (elles exposent dans leur signifiant un rapport non arbitraire avec leur signifié). De nombreux composés ont une double motivation morphologique et sémantique.
En ce qui concerne les relations sémantiques, treize relations principales ont été identifiées en anglais, et quatorze en français et en espagnol. Pour les trois langues, les relations les plus fréquentes sont (ordre décroissant) : la fonction (N1 actif), le principe de fonctionnement, la nature et la fonction (N1 passif). En français et en espagnol, la relation de localisation est fortement représentée.

En raison de leurs particularités sémantiques (non compositionnalité due à la métaphore ou à la métonymie) et de leur origine (emprunts internes à la langue générale et à d’autres domaines), nous avions émis l’hypothèse que les composés exocentriques anglais entraveraient le système d’équivalences types. En effet, les termes français et espagnols équivalents des termes anglais exocentriques ne sont que rarement des calques contrairement aux endocentriques. Un nouveau sens est ajouté, probablement sous influence de l’anglais, à une lexie existante ou un emprunt externe partiel ou total est adopté.

Cette analyse morphosyntaxique et sémantique des noms composés anglais, français et espagnols permet de tirer d’enrichissantes conclusions :

Les lexiques français et espagnol sont dépendants du lexique anglais. L’influence de l’anglais est très marquée. Outre les emprunts, les composés français et espagnols sont massivement des calques des composés anglais. « Les calques sont une […] forme de trace d’une langue dans une autre langue » (Arnaud, 2004 : 346). Ils passent inaperçus car ils respectent la formation des composés en langue cible mais ils augmentent peut-être le nombre de composés. Les langues cibles auraient pu utiliser d’autres matrices lexicogéniques pour dénommer ces concepts rendus par des composés. Les particularités des composés anglais se retrouvent dans les composés français et espagnols : a) les patrons compositionnels sont identiques, b) plus les composés sont longs moins ils sont nombreux, c) les pseudo-confixes anglais ont des équivalents français et espagnols, eux aussi fréquents, d) les proportions d’endocentricité et d’exocentricité sont similaires et e) les relations déterminant-déterminé sont les mêmes. Cette dépendance terminologique est sans doute le reflet d’une dépendance technologique.
La communauté internaute n’est pas limitée à un petit groupe d’initiés, d’où la simplicité des termes qui se caractérise par une endocentricité massive, l’utilisation de la métaphore et la brièveté des composés. Les internautes francophones et hispanophones semblent disposer d’une culture leur permettant de s’approprier la majorité des composés. Cependant, seul un noyau d’internautes plus qualifiés (webmasters et programmateurs, par exemple) maîtrise réellement le domaine. En effet, notre corpus, constitué de revues grand public, contient peu de composés longs (trois éléments et plus) et d’emprunts qui sont la marque des termes techniques.
La conclusion la plus marquante est l’absence de frontière langue populaire-langue spécialisée dans le domaine d’Internet. Pour nommer une même réalité, le webmaster et l’internaute néophyte utilisent le même terme. Si ce lexique est loin des terminologies spécialisées généralement soutenues, c’est parce que ce domaine fait partie du quotidien des locuteurs francophones et hispanophones. Internet leur est familier et occupe une grande place dans leur vie privée et professionnelle et dans les médias. La fréquence d’utilisation de la métaphore due à l’emprunt de termes à la langue générale et à d’autres lexiques (navigation, médecine, par exemple) est peut-être également liée à l’utilisation abondante d’Internet par le grand public.

La troisième partie répond à la deuxième question. Avant de mettre en place un outil d’aide à la traduction des noms composés, il fallait en déterminer la nécessité. Nous avons procédé à une pré-enquête qui a permis a) d’étudier les difficultés liées à la traduction des noms composés d’Internet (identification, compréhension des noms composés et mise en correspondance avec un équivalent de traduction de la langue cible), et à l’acquisition des connaissances nécessaires à leur traduction (pertinence des sources terminologiques), b) de déterminer le sens de circulation des termes du domaine et c) de vérifier la faisabilité des équivalences types grâce à un échantillon de composés.

Nous nous sommes ensuite employée à la conception des équivalences. Cinq étapes ont présidé à la mise en place des modèles d’équivalences morphosyntaxiques anglais-français et anglais-espagnol : a) les composés anglais ont été regroupés en fonction de leur patron compositionnel (la typologie morphosyntaxique de l’anglais joue pleinement son rôle ici) ; b) le (les) terme(s) français et espagnol(s) équivalent(s) de traduction de chaque composé anglais ont été identifiés ; c) une base de données mettant en parallèle les termes anglais et leurs équivalents français et espagnols et faisant ressortir la structure de ces derniers a été créée ; d) la fréquence « type » des modèles morphosyntaxiques français et espagnols a été calculée et e) les structures françaises et espagnoles ont été classées selon leur fréquence « type », et ce pour chaque modèle compositionnel anglais. Ces étapes ont permis de savoir si un patron compositionnel anglais est traduit en langue d’arrivée par un ou plusieurs patrons compositionnels, ou par d’autres matrices lexicogéniques, et de connaître leur fréquence. Seuls les composés endocentriques anglais ont été mis en correspondance avec leurs équivalents de traduction en langue cible. L’exclusion des trente composés anglais exocentriques devait éviter de fausser les statistiques. Des conseils d’utilisation du système d’équivalences ont ensuite été donnés. Lorsqu’on crée un terme, il faut veiller à lui conférer les qualités et les propriétés requises dans le domaine pour garantir son implantation : brièveté, transparence, productivité, emprunt interne et hybridation.

Pour identifier les exceptions, nous avons appliqué notre système d’équivalences types aux composés anglais du corpus formés par le patron le plus fréquent (N + N). Notre outil s’est révélé être véritablement exploitable et efficace tout en étant fidèle au mode de formation des termes du domaine, c'est-à-dire en créant par calque. En ce qui concerne les composés exocentriques, la création d’un équivalent français ou espagnol au cas par cas est préférable à l’application d’un système d’équivalences. En effet, le potentiel d’implantation est nul pour un certain nombre des équivalents de composés exocentriques. Hormis l’exocentricité, aucune autre propriété ne semble gêner la formation de termes par calque à l’aide du système. Lorsqu’un néologisme anglais sera un composé exocentrique totalement ou partiellement métaphorique, il devra être transposé (avec respect des structures préconisées). Un croisement des typologies morphosémantiques n’a pas montré que des relations N1-N2 mettaient en cause la traduction de tel ou tel patron compositionnel anglais.

Le système d’équivalences étant opérationnel, les atouts de son informatisation pour le traducteur spécialisé ont été évalués grâce à une brève observation de son environnement de travail et par un test de l’efficacité de logiciels de TA et TAO. Ce dernier a révélé la piètre qualité générale de ces outils de TA. L’automatisation du système d’équivalences répondait donc à un réel besoin. Le système d’équivalences est peu à peu devenu une base de données terminologique multilingue de création néologique et a été nommé Générateur d’équivalents (GE). Le GE a pris forme grâce à des schémas et des plans retraçant les projets d’organisation. Une ossature générale, une interface utilisateur, le détail de la fonction principale « Recherche des équivalents », l’utilisation d’un SGDB pour exploiter les équivalences et la création de la base de données ont été présentés. Le produit fini a été dévoilé et agrémenté de commentaires de captures d’écran exemplifiées pour expliquer la navigation entre les options offertes à l’utilisateur.

En élaborant un système d’équivalences types anglais-français et anglais-espagnol, nous sommes parvenue à concevoir un outil d’aide à la traduction des noms composés visant un public francophone et hispanophone de traducteurs et rédacteurs spécialisés dans le domaine d’Internet et nous avons gagné le pari de son informatisation. Le GE est un outil évolutif. L’évolutivité est le maître mot garantissant la pertinence et la longévité des outils terminologiques informatisés. Pour ne pas perdre en efficacité, les mises à jour, qui devront être effectuées au rythme d’apparition des concepts et des créations néologiques les dénommant, demanderont rapidité et facilité d’exécution.

Quel est l’apport de la présente étude ? Comment améliorer le GE ?

Notre travail met en relief le profil morphosyntaxique et sémantique des noms composés anglais, français et espagnols, ce qui ouvre une porte pour l’élaboration de stratégies de traduction.
La méthode de création des équivalences types et le GE pourront être étendus à d’autres lexiques spécialisés.
Le principe novateur du GE pourra servir à l’amélioration d’outils terminologiques existants, voire être repris dans le développement de nouvelles applications.

Pour être plus performant, le GE devra être généralisé à toutes les unités lexicales et ne pas proposer uniquement des équivalents pour les noms composés anglais. Le traducteur disposera ainsi d’un outil complet couvrant tous les termes du domaine. Ensuite, il serait bénéfique d’élargir notre corpus aux revues underground et plus techniques. Le GE regrouperait ainsi tous les termes dénommant des concepts utilisés quotidiennement par les internautes débutants, expérimentés, les programmateurs, etc. De plus, dans les revues techniques nous pourrions collecter d’autres surcomposés (notre corpus est trop peu riche en termes très longs), ce qui permettrait d’établir des statistiques sur un nombre raisonnable de termes longs et donc d’inclure les surcomposés dans le GE. Enfin, le GE devra être soumis à un public de traducteurs pour voir en quoi il répond à leurs attentes et leurs besoins et quelles fonctions méritent d’être modifiées, complétées, ou ajoutées.

Notes
190.

Nous présenterons nos conclusions sur ce point uniquement après le rappel des principales particularités morphosyntaxiques et sémantiques.