2. Constitution du corpus

2.1. Remarques préliminaires

Etant donné que les données du corpus conditionnent les résultats, il semble qu'une réflexion préalable sur la constitution du corpus s'impose, comme le font remarquer à juste titre Engwall (1994 : 49-50), Delavigne (2001 : 249) et L’Homme (2004b : 126).

Pour commencer, il faut souligner que les problèmes méthodologiques relatifs à la constitution de corpus sont abondamment traités par de nombreux auteurs lorsqu’il s’agit de corpus de langue générale — on peut notamment citer Renouf (1987), Atkinset al. (1992), Sinclair (1991), Kennedy (1998) — mais la littérature sur le sujet vient à manquer lorsque l’on se préoccupe de corpus de langue de spécialité. C’est ce que notent Meyer & Mackintosh (1996 : 258), Ahmad & Rogers (2001 : 736), ainsi que Pearson (1998 : 56) : “Relatively little has been written about the design of special purpose corpora in general.” Un ouvrage récemment paru écrit par Bowker & Pearson vient tenter de combler cette lacune : Working with Specialized Language – A Practical Guide to Using Corpora (2002). Citons également l’ouvrage, encore plus récent, de L’Homme (2004b).

En suivant Biber (1998 : 246), Ahmad & Rogers (2001 : 726) ainsi que Bowker & Pearson (2002 : 10), insistons sur le fait qu'un corpus en linguistique n'est pas constitué de textes assemblés au hasard, mais, bien au contraire, de textes sélectionnés selon des critères bien définis. Une démarche sélective, correspondant à celle décrite par Engwall (1994) — “choice versus chance alternative” — a d'autant plus raison d'être à une époque où les ressources sont surabondantes, comme le font remarquer Bowker & Pearson (2002 : 10) : “You cannot start downloading texts haphazardly from the Web and then call your collection a 'corpus'.”

Ainsi, il est bien reconnu que les textes sélectionnés doivent être représentatifs de ce que l'on souhaite étudier : “The texts in a corpus are selected according to explicit criteria in order to be used as a representative sample of a particular language or subset of that language.” (Bowker & Pearson (2002 : 10)). Plus précisément, disons que les critères de sélection du corpus sont propres aux buts recherchés. « Qui dit corpus dit visée spécifique », résume Delavigne (2001 : 249).