IV.2.4.Méthode de validation croisée

Nous avons appliqué une méthode de validation croisée (leaving one out) au réseau TRN, pour augmenter la base d’apprentissage (cf. III.2.4). La validation croisée augmente les performances, et permet d’approcher un peu plus les performances obtenues avec les méthodes statistiques (Pellegrino et coll., 2002). Nous n’avons pas testé cette méthode dans le cadre d’une véritable validation aveugle (i.e. en effectuant la sélection pour chaque corpus d’apprentissage), car cette technique est trop gourmande en temps de calcul. Cette expérience prouve que l’ajout de connaissance dans la base d’apprentissage permet d’améliorer les performances.

Figure 3.8 Performance du réseau TRN avec la méthode d’accumulation,
Figure 3.8 Performance du réseau TRN avec la méthode d’accumulation, présentant les meilleures performances en validation, sur le corpus MULTEXT.

Nous avons montré que les langues du corpus MULTEXT peuvent être identifiées à partir d’une segmentation automatique en consonnes et voyelles, en employant un réseau récurrent qui respecte une contrainte temporelle. Seulement, cette information est bien loin de refléter la complexité du signal acoustique. En particulier, l’intonation, l’intensité et le timbre n’apparaissent pas dans cette représentation. Est-il possible d’intégrer ces dimensions pour l’IAL ?

Figure 3.9 Performance du réseau TRN avec une méthode de validation croisée (TRN), les performances des méthodes statistiques avec la pseudo-syllabe (Pellegrino et coll., 2002), et les résultats du TRN avec l’apprentissage basé sur une division en deux du corpus MULTEXT (cf. section IV.2.3).
Figure 3.9 Performance du réseau TRN avec une méthode de validation croisée (TRN), les performances des méthodes statistiques avec la pseudo-syllabe (Pellegrino et coll., 2002), et les résultats du TRN avec l’apprentissage basé sur une division en deux du corpus MULTEXT (cf. section IV.2.3).