2.3 TRAVAILLER A PARTIR D’ UN CORPUS : APPORTS ET LIMITES

2.3.1 Corpus et faits de langue

Il semble évident que les mots ne prennent leur véritable signification qu’en contexte. On n’utilise que très rarement un mot isolé, qui même s’il est “ linguistiquement ” isolé, se trouve tout de même dans un contexte d’énonciation. Pourtant, les dictionnaires prennent les mots isolément, tout au moins pour ce qui est de la présentation (la classification alphabétique perturbe d’ailleurs complètement la structure sémantique de la langue) ; ce qui explique que les lexicographes ressentent la nécessité, par le biais des exemples et citations, de remettre les mots en contexte. D’ailleurs, comme le dit ‘Sager (1990 : 157) “ the definition itself presents the term in a particular conceptual environment of other terms ”.’ Les mots existent donc au départ dans les textes qui sont (pour reprendre l’expression de Cabré), leur “ milieu naturel ”. Travailler à partir d’un corpus permet donc de travailler avec une langue réelle. Ainsi, ‘lorsque le lexicographe travaille par introspection, sans se reporter à des textes, il répertorie des “ usages potentiels ” plutôt que des “ usages réels ” (Grundy, 1996 : 131), alors que “ l’utilisateur est en droit d’attendre de son dictionnaire qu’il répertorie les usages réels et non ceux que le lexicographe a imaginé ” (idem : 132)’. L’utilisation d’un corpus permet donc de remettre en cause certaines certitudes des lexicographes, ou même des utilisateurs, quant au comportement des mots. Pendant longtemps le dictionnaire a eu le pouvoir de décider de ce qui faisait partie de l’usage, ce qui est peut-être moins le cas aujourd’hui. L’informatisation des dictionnaires a sans doute considérablement augmenté l’exigence des utilisateurs quant à l’information disponible, mais ceci est un autre problème.

Un autre point positif du corpus est qu’il permet de dater les termes. Il rend possible l’observation des changements de sens, de l’apparition des néologismes, etc. On peut également y remarquer les acceptions les plus fréquentes d’un mot, et celles qui le sont moins. La fréquence des mots et leur “ disponibilité ”, leur importance pour la communication, aspects qui ne sont observables que dans un corpus, revêtent une importance primordiale ‘lorsque l’utilisateur n’est pas un locuteur natif, et qu’il a besoin “ d’avoir accès à la langue telle qu’elle est réellement utilisée tous les jours ” (Grundy 1996 : 128)’.

L’article de Grundy nous intéresse particulièrement car il traite de l’utilisation d’un corpus lors de la rédaction d’un dictionnaire bilingue. L’utilisateur de dictionnaire bilingue a un besoin crucial d’informations sur la “ combinaison ” des unités lexicales entre elles. Grundy établit (Grundy 1996 : 135) deux catégories d’informations utiles à l’utilisateur : celles nécessaires au décodage, comprenant les informations sur la structure syntaxique, les collocations (quels mots se combinent entre eux), les compléments, et celles nécessaires à l’encodage, c’est-à-dire “ toutes les combinaisons dont le sens est différent ou plus vaste que la somme de leurs différentes parties ” (noms composés, syntagmes fixes). Toutes ces informations sont difficilement observables hors d’un corpus. Pour aussi qualifié que soit le lexicographe, il lui est impossible de répertorier de façon exhaustive tous ces usages sans avoir recours à des textes.

Les collocations revêtent une importance toute particulière dans les dictionnaires bilingues, car les différentes combinaisons ne se traduisent pas de la même façon dans l’autre langue, et les dictionnaires bilingues de conception classique, qui traitent les mots de façon isolée, laissent souvent l’utilisateur frustré, ou conduisent à des erreurs de traduction.

Nous nous sommes livrée à quelques sondages dans un dictionnaire bilingue français-portugais (Domingos de Azevedo, Bertrand Editora, 1987) à propos de certaines collocations qui avaient récemment posé problème à nos étudiants. Nous nous bornerons à donner trois exemples, car notre intention ici n’est pas de nous livrer à une étude critique des dictionnaires français-portugais.

A l’adresse “ roupillon ” on trouve très justement la traduction “ soneca ” ; toutefois, rien n’indique qu’en français ce mot s’emploie avec le verbe “ piquer ” (“ piquer un roupillon ”) alors qu’en portugais il s’emploie avec le verbe  dormir ” (“ dormir uma soneca ”). Autre exemple à notre avis plus grave, car beaucoup plus fréquent, celui de “ attention ”, traduit par “ atenção ”, “ cuidado ”, mais où rien n’indique la combinaison “ faire attention ” qui se rend en portugais par “ prestar atenção ” ou “ tomar cuidado ”. Nous avons par contre trouvé l’exemple de “ bandoulière ”, où l’on trouve très justement “ porter en bandoulière ” rendu par “ trazer a tiracolo ”.

Il nous semble clair que ce type de “ manque ” (car c’est plutôt d’un manque d’information que d’une inexactitude qu’il s’agit) peut être comblé par l’utilisation d’un corpus. Les recherches relatées par Grundy (1996), Howles (1996) nous semblent rendre compte d’une nouvelle orientation de la lexicographie bilingue qui lui permettra de véritablement répondre aux besoins des usagers.

Pour ce qui est de l’apport pédagogique du corpus, nous pouvons citer les travaux de Bowker (1998). Cet auteur relate une expérience de traduction, par des étudiants, à partir de sources conventionnelles (dictionnaires, encyclopédies, etc.) et à partir d’un corpus de textes de la spécialité en question (ici, l’informatique) ; les résultats comparés des deux traductions montrent que celle réalisée à partir du corpus donne de bien meilleurs résultats. L’auteur explique ces résultats par le fait que les dictionnaires sont souvent vieillis, surtout en ce qui concerne les domaines de connaissance en permanente évolution, et le fait qu’un corpus permet de voir les termes en contexte, et renseigne ainsi sur leur emploi réel, permettant d’éviter des erreurs de traduction. Cette expérience nous intéresse car elle peut, d’une certaine façon, éclairer notre propre choix : en effet, comme nous l’avons dit plus haut, l’économie est, au Brésil, un domaine soumis à des changements fréquents, et seul un corpus de textes d’actualité pouvait permettre d’accompagner cette instabilité, à la différence des supports plus traditionnels, comme les dictionnaires ou les textes théoriques de la spécialité. L’aspect contextuel et collocatif a également été déterminant.

On trouve également chez Frey (1997 : 249-252) des réflexions à propos des apports des corpus dans l’étude des faits de langue. Ainsi, cet auteur considère que les informations apportées par les corpus sont linguistiques mais aussi sociolinguistiques, pragmatiques et culturelles ; ces différents types d’informations nous ont paru essentiels lorsque nous avons choisi d’élaborer notre travail à partir d’un corpus. Comme le résume Frey, ‘“ les corpus (...) fournissent à la fois du texte et du contexte ” (Frey 1997 : 262).’