2.2 JUSTIFICATION DU CHOIX D’UN CORPUS COMME BASE DE TRAVAIL

2.2.1 Place du corpus dans la lexicographie et la terminologie

L’utilisation d’un corpus devrait permettre de rendre compte de la “ réalité ” de la langue. Si le travail terminologique considère les textes comme le “ milieu naturel ” (Cabré, 1998 : 196) des termes, la lexicographie n’a pas toujours accordé à ce “ milieu ” l’importance qui est la sienne. En effet, une lexicographie excessivement, et essentiellement, normative pouvait considérer avec méfiance cet usage réel qui n’était pas toujours conforme aux normes. Les exemples des dictionnaires de langue sont d’ailleurs très souvent tirés de textes littéraires, et non pas de la langue parlée.

Ainsi, la langue des dictionnaires n’était pas la langue telle qu’on la parle, mais telle que le lexicographe pensait qu’on devait la parler. On peut penser que cette façon de procéder était exactement “ l’inverse ” du travail à partir d’un corpus : on élaborait une norme, une description de la langue, puis on l’appliquait à la langue “ réelle ” (qui entrait ou n’entrait pas dans ce cadre pré-établi), plutôt que de partir de la langue pour en inférer un modèle. Les exemples des dictionnaires étaient le plus souvent des énoncés fabriqués pour justifier un modèle, une théorie, et non pas une manifestation authentique de la langue.

Toutefois, ‘la lexicographie a depuis longtemps une tradition de “ collecte de citations ” (Grundy, 1996 : 130)’, mais, comme l’indique le mot “ citation ”, le corpus n’était souvent considéré que comme un réservoir d’exemples, d’illustrations. On peut se référer à ce sujet à l’introduction du Petit Robert, édition de 1993 : ‘“ (...) ce Petit Robert (...) bénéficie des techniques de l’informatique à trois stades de la production du texte : tout d’abord un corpus vaste et varié de citations pré-sélectionnées par les rédacteurs’ ”. Par contre, l’utilisation de corpus, et notamment de corpus électroniques qui permettent le stockage d’une information vaste, dans la rédaction des dictionnaires est un phénomène plus récent. On peut voir, à ce propos, les recherches relatées par Grundy (1996) ou Sinclair (1987 et 1991).

Dans le cadre du travail lexicographique, l’utilisation d’un corpus peut avoir des orientations et finalités diverses. Tout d’abord, il peut servir à constituer la nomenclature du dictionnaire. Ainsi, les dictionnaires dits “ fondamentaux ”, qui sont fondés sur des critères statistiques et présentent les mots les plus fréquents d’une langue, ont été élaborés à partir de corpus (on peut voir à ce sujet Gougenheim, 1967, à propos de l’élaboration du Français Fondamental). Ensuite, comme nous l’avons dit plus haut, le corpus peut fournir des contextes afin d’illustrer le sens et l’usage des mots. Il permet également de constater les changements de sens et de suivre l’évolution du vocabulaire (utilisation de nouveaux mots, disparition de mots ou de sens, etc.). Le corpus, surtout s’il est régulièrement mis à jour, constitue un excellent “ observatoire ” de la langue. Enfin, seul un corpus peut permettre de rendre compte des collocations. Nous rejoignons ici l’article de Grundy (1996) qui insiste sur l’importance des collocations dans les dictionnaires bilingues. Il semble aujourd’hui incontestable qu’un dictionnaire bilingue doive s’appuyer sur un corpus. Nous y reviendrons en 2.3.

Nous aimerions citer ici, pour ce qui concerne la langue portugaise (Brésil), les recherches de Biderman (1992 : 165) où il est question d’un projet d’élaboration d’un Dicionário de Frequências do Português Contemporâneo e Concordância de Textos ; le corpus de ce projet est constitué d’un ensemble de textes écrits (romans et contes, théâtre, scripts de télévision, revues et journaux, littérature technique et scientifique). Toutefois, l’utilisation d’un corpus est ici une évidence, car il s’agit d’un dictionnaire de fréquence.

Pour ce qui est de la terminologie, ses rapports avec les textes sont plus étroits. La documentation est une activité à part entière du travail terminologique. Pour reprendre les termes de ‘Cabré (1998 : 195) “ les unités terminologiques, faisant partie des langues de spécialité, figurent naturellement dans les textes spécialisés ”’. Les termes n’existent dans les dictionnaires que lorsqu’ils y ont été placés. Il nous semble incontestable que, s’agissant de langues de spécialité, on ne remet pas en question la “ légitimité ” du texte, sa pré-existence par rapport au dictionnaire. Si l’on se pose la question de savoir où se trouvent les termes spécialisés, la réponse semble logiquement être : dans les textes spécialisés, dans les discours des spécialistes. Si les débuts de la terminologie ont été strictement onomasiologiques, l’avènement de la linguistique de corpus a ramené les terminologues vers la sémasiologie, tout comme elle a conduit les lexicographes à travailler de plus en plus à partir de textes, de faits de langue.