4.1.2.2. Corpus

Notre analyse repose en grande partie sur l’utilisation de données tirées de corpus textuels. Suivant les nouvelles tendances de la lexicographie et de la terminologie, nous avons nous-même construit deux corpus électroniques rassemblant des textes de vulgarisation (en anglais et en français) du domaine de la volcanologie : un corpus de 800 000 mots (400 000 en anglais, et 400 000 en français) contenant des textes non-traduits, dit corpus comparable, et un corpus de 200 000 mots (soit 100 000 mots par langue) contenant des textes dans une langue ainsi que leur traduction dans l’autre langue, dit corpus traduit ⁷⁵ . Voilà en quelques mots comment nous pouvons les décrire de la manière la plus concise possible ; une présentation détaillée de la constitution et du contenu de ces corpus se trouve en effet dans le chapitre quatre.

Notes

75.

Nous reviendrons en temps voulu de manière plus approfondie sur la définition de corpus comparable et de corpus traduit (chapitre 5).