3.2. Outils d’exploitation

3.2.1. Choix des outils

Nous avons dû choisir quels outils étaient les plus en adéquation avec les objectifs que nous nous étions fixés 401 . Nous avons fait le choix méthodologique d’utiliser des textes authentiques comme point de départ de l’analyse, et avons donc cherché un outil d’extraction de termes pour opérer sur le corpus comparable. Cet outil devait remplir les conditions suivantes : nous permettre de travailler dans deux langues, à savoir le français et l’anglais ; ne pas utiliser de ressources sémantiques préalables comme des dictionnaires ou des ouvrages de référence, et, enfin, présenter un coût raisonnable. Notre choix s’est porté sur l’outil Syntex 402 , analyseur syntaxique de corpus.

Toutefois, la plupart des logiciels d’extraction de termes présentent souvent des listes un peu figées de termes, et il n’est pas possible de naviguer à l’intérieur même du corpus pour faire des recherches ponctuelles ou un peu sophistiquées. Par conséquent, nous avons utilisé, dans une moindre mesure, un concordancier qui nous permettait de faire des recherches plus poussées dans le corpus comparable : celui utilisé par le Dictionnaire Canadien Bilingue pour parcourir ses corpus, qui s’intitule Cocoon 403 .

Enfin, il nous fallait un outil qui puisse aligner les textes traduits et qui possède également des fonctions de concordancier bilingue, encore appelé bi-concordancier, pour permettre des recherches dans les deux langues. Notre choix s’est porté sur l’outil LogiTerm, puisque son obtention a été rendue rapide à Ottawa (c’est là qu’il est développé par la société Terminotix) et qu’il dispose d’un module d’alignement très puissant (celui du RALI de Montréal, qui s’est chargé d’aligner les textes du corpus du Hansard canadien 404 ).

Notes
401.

Pour une mise au point récente sur les divers outils d’exploitation des corpus, voir en particulier Bowker & Pearson (2002), ainsi que L’Homme (2004b).

402.

Nous remercions ici Didier Bourigault et Cécile Frérot pour leur contribution.

403.

Nous remercions ici Konrad Scherrer, du DCB, qui s’est occupé de la mise en ligne de notre corpus comparable afin de pouvoir l’interroger avec Cocoon.

404.

Corpus traduit anglais-français contenant le texte des débats au parlement canadien.