V.2.Comparaison des performances

Pellegrino et coll. (2002) ont également proposé des résultats pour l’IAL sur le corpus MULTEXT, en utilisant une technique de validation croisée, pour une représentation incluant le rythme des consonnes et des voyelles (79 % en 20s ; > 60% pour 5s). En tenant compte d’une modélisation acoustique des voyelles, les performances atteignent 69 % en 5 secondes (Farinas, 2002). L’approche qu’ils retiennent est basée sur la description de pseudo-syllabe. En outre, ils emploient un détecteur automatique des voyelles. Nos performances sont donc comparables avec celles-ci pour 5 secondes de signal (63 %), alors que nous faisons appel à une caractérisation globale du signal acoustique sans segmentation.

Une des difficultés d’une application d’IAL est de passer d’un discours articulé pour des conditions de laboratoire à un signal téléphonique comme celui du corpus OGI-MLTS. Par exemple, pour la distinction entre le Français et l’Anglais les performances diminuent de 99 % à 76 % pour 2 secondes de signal de parole dans l’étude de Lamel et Gauvain (1994). La multiplicité des locuteurs peut être à l’origine de cette diminution de l’identification. Effectivement, le corpus OGI-MLTS contient une centaine de locuteurs par langues. En outre, des études perceptuelles ont confirmé les difficultés des adultes face à des langues inconnues, lorsqu’ils sont testés avec un nombre important de locuteur (Bond et coll., 1998).

L’application de nos méthodes à ce corpus est aussi problématique. Elles se révèlent inefficaces lorsque six langues doivent être identifiées, cependant les performances pour deux paires de langues du corpus OGI-MLTS avec l’Anglais sont nettement supérieures au hasard. En outre, les performances d’identification augmentent peu au cours du temps, suggérant la présence d’un indice tout comme pour le corpus MULTEXT. Mais ce profil de performance n’apparaît pas pour la paire de langues Allemand – Hindi. Il est ainsi vraisemblable que l’Anglais se différencie de toutes les autres langues sélectionnées. Cependant, ce problème n’a pas été soulevé par d’autres études effectuées sur le corpus OGI-MLTS.