3.3.1.3. Quelques remarques sur l’application des critères

Même si nous avons bien délimité un certain nombre de critères pour le choix des termes, nous avons montré, pour certains de ces critères, qu’ils posaient certains problèmes quand on cherchait à les mettre en œuvre. Un dernier point reste à mentionner : il se trouve des cas où il y a concurrence entre les différents critères. Nous nous en tiendrons à l’exemple de gaz / gas pour illustrer ce problème.

Le terme gaz / gas n’est pas propre au domaine de la volcanologie : il s’agit d’un terme de chimie qui, à la rigueur, pourrait être considéré comme un terme du VGOS. Par conséquent, comme ce terme ne répond pas à l’un de nos premiers critères, nous tendrions à la rejeter.

Cependant, si l’on s’intéresse au critère de fréquence, ce terme est l’un des noms simples les plus fréquents identifiés par Syntex : gaz a 600 occurrences dans le corpus français, et gas en a 743 dans le corpus anglais.

De plus, gaz / gas répond doublement au critère « appartenance à un paradigme lexical ». En effet, d’une part, il fait partie intégrante des risques volcaniques tels qu’ils sont définis dans le contexte suivant :

‘Sept types de risques volcaniques (coulées de lave, projections et retombées de tephra, nuées ardentes, gaz, coulées boueuses ou lahars, instabilités et glissement de terrain, raz de marée ou tsunami) menacent 500 millions de personnes dans le monde, plus particulièrement dans des pays pauvres. ABC-2-2’

D’autre part, c’est un hyponyme des produits volcaniques, sur le même plan que les coulées de lave, ou les tephra ou projections volcaniques, comme l’illustre le contexte suivant :

‘The materials associated with a volcanic eruption include (1) lava flows (pahoehoe flows, which resemble twisted braids, and aa flows, consisting of rough jagged blocks, both form from basaltic lavas) ; (2) gases (primarily in the form of water vapor) ; and (3) pyroclastic material (pulverized rock and lava fragments blown from the volcanoes vent, which include ash, pumice, lapilli, cinders, blocks, and bombs). MAN-1’

En effet, traditionnellement, on classe en trois catégories différentes les produits qui sont éjectés du volcan : d’une part les produits solides (tephra), d’autre part les produits liquides (laves), et enfin les produits gazeux (gaz). Gaz semble donc s’insérer dans un arbre du domaine traditionnel, comme le montre ce schéma, tiré d’une de nos sources pour le corpus (réf) :

Figure 22 : Possible arbre de domaine pour les produits éjectés du volcan
Figure 22 : Possible arbre de domaine pour les produits éjectés du volcan

Il semble donc difficile de rejeter le terme gaz. Se pose alors la question pour les paronymes de gaz, tels que dégazage, et les hyponymes, tels que : dioxyde de carbone, dioxyde de soufre, vapeur d’eau qui sont des types de gaz et qui sont très fréquents dans le corpus. Nous avons décidé de retenir dégazage, mais non les divers types de gaz pour les deux raisons suivantes : d’une part, ils nous paraissent d’une trop grande spécificité, et d’autre part, étant donné qu’il faut faire un choix, nous préférons donner la priorité aux hyponymes de lave et de projections, qui, eux, relèvent véritablement du domaine de la volcanologie.

Pour conclure sur le processus de sélection des termes, nous tenons à faire trois remarques.

Premièrement, la difficulté d’application des critères, que nous avons illustrée tout au long des pages précédentes, souligne en tout cas la nécessité d’un retour permanent aux contextes et au corpus. Tout au long du processus de sélection, nous avons utilisé parallèlement Syntex, qui permet de voir uniquement les trois phrases qui précédent ou qui suivent le contexte où se trouve le candidat-terme, et notre concordancier Cocoon, qui nous permet un retour au texte entier, et permet d’effectuer des recherches plus pointues. Ce va-et-vient nous a d’ailleurs permis de constater qu’outre le fait que Syntex produit beaucoup de bruit, il y a aussi des problèmes de silence : ainsi, par exemple, éteint et endormi n’apparaissent pas dans les adjectifs, car ils sont uniquement considérés comme des participes passés (alors que dormant et extinct, eux, apparaissent) ; nous avons donc dû les ajouter.

Deuxièmement, le processus de validation des candidats-termes fournis par un extracteur de termes tel que Syntex est extrêmement fastidieux et, s’il y a un gain en termes de quantité de données, le gain en temps est loin d’être démontré, comme l’explique fort justement L’Homme (2001 : 24-25). VERIF ?

Troisièmement, nous tenons à rappeler ici que la liste des termes retenues, présentée dans la section suivante, n’a rien d’absolu : elle ne se veut pas exhaustive, et constitue uniquement un point de départ pour l’analyse. Nous sommes bien consciente du fait qu’il existe une part d’arbitraire dans le processus de sélection des termes, particulièrement dans les cas litigieux dont nous avons débattu plus haut.