3. Exploitation du corpus

3.1. Préparation des textes en vue de leur exploitation

3.1.1. Etape préliminaire : « nettoyage et homogénéisation » (Habert et al. (1997 : 161))

Pour pouvoir exploiter les textes, il fallait d’abord passer par la fastidieuse étape de nettoyage, qui s’avère indispensable et qui ne doit pas être sous-estimée (Habertet al. (ibid. : 161)), que ce soit pour les textes à numériser ou pour les textes déjà sous forme numérique. Nous présentons tout d’abord un problème de préparation des textes commun aux deux types de corpus que nous avons élaborés, puis à un problème qui est propre au corpus traduit : celui de l’alignement.