I.1.Définition

Si le mythe de la tour de Babel peut être réalisé, la langue parlée devra être devinée à l’écoute d’un passage de parole énoncé par un locuteur inconnu (Muthusamy, Jain et Cole, 1994). Cette définition simple cache un axe de recherche complexe : L’Identification Automatique des Langues (IAL). La première motivation de l’IAL est d’utiliser des instruments qui puissent traiter le signal de parole le plus directement possible, sans utiliser des ressources linguistiques trop importantes et complexes. Les phrases doivent être analysées dans leur ensemble afin d’en extraire une signature de chaque langue. Cette tâche est ardue, puisque le signal de parole contient de multiples informations comme le sexe, l’âge, les accents, le statut émotionnel, qui s’ajoutent à la langue parlée. En outre, le signal acoustique est souvent altéré par des bruits dus à l’environnement, ou au canal de communication.

L’IAL, un domaine de recherche plutôt récent, devrait tirer parti du plus grand nombre possible de domaines d’expertise. Ces recherches s’appuient sur l’ingénierie du Traitement Automatique de la Parole, mais elle est maintenant rejointe par la psycholinguistique, et bien d’autres disciplines devraient suivre. La problématique de l’IAL se comprend mieux en évoquant un exemple concret. Les urgences américaines (911) gèrent 140 langues, avec des interprètes humains experts. On relève un délai de 3 minutes pour que la langue Tamil soit identifiée. L’interlocuteur, en effet, a été d’abord dirigé sans succès vers trois interprètes du Sud-est asiatique, et a écouté plusieurs enregistrements de remerciements dans d’autres langues. Le délai aurait encore été rallongé s’il n’avait pas prononcé le mot « Tamil » en Anglais (Muthusamy et coll., 1994).