1.3.2. Introuvable corpus

Après quelques recherches (diffusion d’un message auprès de la liste Corpora 353 , consultation de la liste des corpus déjà constitués par l’ELRA 354 ), il a fallu se rendre à l’évidence : un tel corpus (sujet : volcanologie ; type de texte : vulgarisation) n’existait pas. Certes, de nombreux corpus destinés à la lexicographie générale (ex. : The Birmingham Collection of Texts, utilisé pour la rédaction du Collins Cobuild English Dictionary) incluent des textes de vulgarisation scientifique (Ahmad & Rogers (2001 : 729)), mais toujours en très petite quantité (Pearson 1999 : 21). La liste des domaines scientifiques couverts donc est loin d’être exhaustive et est établie parfois un peu au hasard.

Par conséquent, comme c’est souvent le cas en terminologie (Pearson (1999 : 21), Ahmad & Rogers (2001 : 729 et 732)) 355 , nous avons dû constituer nous-même notre corpus.

Notes
353.

Corpora est une liste de diffusion adressée à divers spécialistes de la linguistique de corpus.

354.

ELRA: European Language Resources Association.

355.

Ahmad & Rogers (2001 : 732-733) disent à cet égard : “Since terminologies are domain specific, terminologists will generally need to build a new corpus each time they embark in building a new terminology.”