1.2.2. La nature des textes

Le domaine considéré ici se prête mal à un corpus oral tant sur le plan de la faisabilité que de la pertinence. Les internautes communiquent par le biais de leur ordinateur. Leur communication orale est réduite, contrairement à celle de biologistes travaillant en laboratoire, par exemple. Enregistrer des cours d’informatique prendrait plusieurs mois pour obtenir un nombre suffisant de composés du domaine d’Internet. Visiter des forums de discussion ou des messageries instantanées et noter les termes employés aurait pu être une solution. L’obstacle majeur de cette méthode est que le registre de discours de ces sites est assez familier 61 et les discussions, elles aussi décontractées, regorgent d’allusions, de « private jokes », de troncations et d’abréviations qui ne sont pas toujours connues ou comprises par la majorité des internautes (Brolles 2001 : 5).

La nature des textes à sélectionner est liée aux objectifs à atteindre. Pour que notre système d’équivalences types soitpertinent, il doit contenir les termes du lexique réel, ceux utilisés par les internautes. Les glossaires et les dictionnaires seront donc exclus de nos sources. Ils peuvent avoir des ambitions normatives, prescriptives et faire figurer des termes non employés par les internautes. 62 De plus, les dictionnaires spécialisés ne saisissent pas tout le lexique spécialisé. Dans un dictionnaire, général ou spécialisé, ne figurent pas tous les termes utilisés dans une revue technique ou scientifique (Kocourek, 1991). Compiler un dictionnaire prend des années et les domaines techno-scientifiques évoluent avec une telle rapidité que lorsque le dictionnaire est publié des termes nouveaux sont absents et des termes inusités sont répertoriés. Peu de dictionnaires sont entièrement consacrés à Internet. En règle générale, les termes d’Internet sont inclus dans les dictionnaires informatiques. 63 La macrostructure du Dictionnaire du Multimédia (Colombain, 1998) comporte 469 entrées et toutes ne concernent pas Internet (et moins de deux cents entrées sont des composés). La taille du dictionnaire est une autre contrainte des listes de termes basées sur dictionnaires (Bowker et Pearson, 2002 : 15). Un dictionnaire qui couvre la totalité d’un domaine peut être constitué de plusieurs volumes. Son prix et sa taille sont des obstacles à son achat et à son utilisation.

Une autre solution serait de se tourner vers les livres, les manuels, les notices d’utilisation et les cours plutôt que vers les dictionnaires. Collecter les composés dans des manuels d’apprentissage ou des cours ne nous conviendrait pas, même si leur vocabulaire est assez abondant, car ils utilisent une terminologie de base. Ce sont des ouvrages de vulgarisation qui excluent les notions complexes. Quant aux livres, ils ne seront pas pris en compte pour limiter les risques d’influence individuelle (par exemple, pour désigner un concept un auteur français peut préférer utiliser un terme endogène alors que le terme le plus fréquemment employé dans le domaine est un emprunt). Pour être sûr que les termes sélectionnés sont reconnus et employés par les experts du domaine, il faut consulter plusieurs livres. Or, les particularités linguistiques peuvent concerner plusieurs documents (Bowker et Pearson, ibid. : 17). Sélectionner de courts extraits est une solution mais les livres traduits étant nombreux, elle n’est pas envisageable. De plus, dans les livres comme dans les dictionnaires, certains termes peuvent avoir disparu avant la publication du livre (qui a lieu plusieurs mois au moins après l’écriture). En ce qui concerne les notices d’utilisation, les usagers les lisent rarement ou les parcourent seulement. Le discours étant très soutenu, les termes rencontrés ne sont pas forcément ceux employés par la majorité des internautes.

Parmi les différentes sources mentionnées, seules restent les revues spécialisées. Les composés étudiés seront recueillis dans des revues écrites par des experts du domaine : les internautes. Les thèmes variant en fonction des rubriques, des mois et des revues, les articles permettront de recueillir l’essentiel des termes du domaine.

Notes
61.

Joos (1967) décrit cinq styles de discours basés sur le degré de formalité (ordre croissant) : « intimate » (intime ; style employé entre époux, enfants, amis de longue date), « casual » (familier, décontracté ; emplois : entre amis, collègues, connaissances, lors d’activités de loisirs), « consultative » (consultatif ; emplois : entre inconnus, lors de réunions ou de transactions), « formal » (soutenu ; emplois : présentations, exposés) et « frozen » (oratoire, « glacé » ; emplois : publications, discours publics, œuvres littéraires). Le style familier se caractérise par l’utilisation de mots d’argot et d’ellipses.

62.

Par exemple, les glossaires de l’OLF et la DGLF évitent les anglicismes.

63.

En mai2004, une recherche avec le mot clé « dictionnaire Internet » sur le SCD de la bibliothèque de l’université Lyon 2 a comme résultat : Dictionnaire bilingue de la micro-informatique et de l’Internet (Marabout, 1997), Dictionnaire de l’informatique et de l’Internet (Micro Application, 1999), Dictionnaire français/anglais, anglais/français : cinéma, audiovisuel, son, multimédia, réseaux (Dirit, 2001), Grand dictionnaire Marabout de la micro-informatique et de l’Internet (Marabout, 1996).