2.2 L’Identification Automatique des Langues : un état de l’art

Les dix dernières décennies ont été témoins de l’avènement sans précédent d’un domaine, à savoir le Traitement Automatique de la Parole (désormais TAP) qui, jusqu’à la moitié de ce siècle, tenait plutôt de l’utopie. Son développement a été, et continue d’être, d’une telle envergure que la réalisation d’un état de l’art pourrait constituer une étude à part entière. Ce domaine est complété par celui du traitement de l’écrit, qui s’intéresse aux applications telles que la reconnaissance des caractères, la traduction automatique, l’indexation de documents, etc. Nous allons nous intéresser plus particulièrement aux applications qui concernent le domaine du TAP.

Il est inconcevable de nos jours de parler de nouvelles technologies touchant aux différents secteurs de la vie scientifique ou courante sans faire référence au TAP. Il suffit de regarder l’environnement artefactuel le plus proche (ordinateurs, téléphones portables, agendas électroniques...) pour croiser au moins un de ces outils qui tirent profit des recherches en traitement de la parole, comme, par exemple, un système à dictée vocale ou de traduction automatique ou bien encore un téléphone portable avec un système de reconnaissance du locuteur, tous désormais incontournables dans notre vie quotidienne.

Notre démarche, aussi éphémère qu’elle soit, étant donnée l’évolution rapide du domaine du TAP, sera consacrée aux principaux aspects qui le concernent et, plus particulièrement, aux réalisations les plus récentes en identification automatique des langues.

Le TAP est non seulement un domaine en plein essor, mais aussi en perpétuelle expansion. Si le rêve séculaire de l’humanité est de créer des robots qui «agissent comme les humains», on est encore loin aujourd’hui des ’têtes parlantes’ qui ont fait rêver les grands esprits de l’histoire, tels Albertus Magnus, Roger Bacon, ou plus proche de nous, Wolfgang von Kempelen (Pelton, 1993). Actuellement, le TAP incorpore diverses branches, telles que la synthèse et resynthèse de la parole, la reconnaissance, qu’il s’agisse de la langue ou d’un locuteur donné.

De ce vaste territoire technologique, nous retenons uniquement un sous domaine qu’est l’Identification Automatique de la Langue. L’IAL est le processus au cours duquel une entrée de type parole produite par un émetteur inconnu est identifiée du point de vue de son origine linguistique. L’IAL est également apparentée à deux autres grands domaines du TAP. Tout d’abord, il s’agit de la Reconnaissance Automatique de la Parole (la RAP), qui est le processus au cours duquel une entrée sonore, dont la langue d’extraction est connue, est traitée afin de fournir en sortie, le plus couramment, une transcription (ortho)graphique. Ensuite, le domaine de l’IAL est également lié au domaine de la Reconnaissance Automatique du Locuteur, dont l’objectif est, bien entendu, l’identification d’un individu émetteur à partir d’une entrée sonore généralement de courte durée.

Dans les paragraphes qui suivent nous allons nous pencher brièvement sur les enjeux multiples du domaine. Tout d’abord nous allons parler de son histoire récente et, de manière plus détaillée, des derniers acquis en termes d’approches méthodologiques. Par la suite, nous allons présenter les bases de données en parole qui sont mondialement utilisées. Finalement, nous allons nous pencher sur le rapport entre les systèmes d’identification automatiques et le ’système’ le plus performant dans la reconnaissance de langues, à savoir le système perceptif humain.