V.3.Perspectives pour l’IAL et la prosodie

L’identification Automatique des Langues nécessite encore des recherches approfondies pour tirer parti des informations prosodiques. Effectivement, notre étude conjointement aux études précédentes (Cummins et coll., 1999 ; Thymé-Gobbel et Hutchins, 1996 ; Itahashi et Du, 1995 ; Itahashi et coll., 1999 ; Pellegrino et coll., 2002) montrent l’écart de performances 93 entre les systèmes IAL classiques et les systèmes ayant recours à la prosodie. Il est particulièrement difficile d’obtenir un modèle global satisfaisant de la prosodie d’une langue, en particulier pour l’intonation d’une langue.

Cependant, la prosodie apparaît comme un indice potentiel au travers d’une étude perceptuelle effectuées avec des sujets adultes connaissant au moins une des langues à identifier (Muthusamy et coll., 1994). Lorsque les locuteurs ne connaissent pas la langue, seule la discrimination des langues est abordée (Stockmal et coll., 1996 ; Stockmal et Bond, 1998 ; Bond et coll., 1998 ; Lorch et Meara, 1989 et 1995). Ces articles soulignent alors les difficultés exprimées par les sujets.

En appliquant une technique de synthèse de parole, Ramus et coll. (1999) ont montré que des auditeurs ayant pour langue maternelle le Français pouvaient effectuer la distinction entre le Japonais et l’Anglais à partir de la seule succession des consonnes et des voyelles. Il conviendrait de tester si cette distinction est mieux perçue par les sujets natifs du Japonais et de l’Anglais, afin de savoir si ils ont une meilleure représentation de la prosodie de leurs langues.

Effectivement il est possible que les modèles employés en IAL pour décrire la prosodie soit incomplets. D’une part, il devrait y avoir plusieurs modèles prosodiques, et non un seul par langues. D’autre part, il devrait être établi en fonction d’autres unités linguistiques comme les phrases ou les mots. Les frontières des phrases et des propositions pourraient être retrouvées par l’intermédiaire de la prosodie à partir des pauses ou de la déclinaison de l’intonation. Ceci a été compris par les linguistiques étudiant la prosodie (Cutler, 1996), mais ils mettent en avant aussi les différences existant entre les langues (Hirst et Di Cristo, 1998). Ces différences prosodiques entre les langues sont le plus souvent définies en fonction du contenu d’une phrase.

La position de l’accent par rapport aux mots permet de distinguer les langues à accents fixes, et à accents variables. Ainsi, l’Anglais est caractérisé par un rythme trochaïque, alors que le rythme du Français est ïambique. Il est également possible de tenir compte des structures syntaxiques pour qualifier la prosodie d’une langue. Ainsi, en tenant compte de la déclinaison de la F0 et des pauses de longue durée, la structure en proposition peut être obtenue, la position des accents dans ces structures pourrait permettre d’identifier une langue.

La prosodie peut se révéler utile pour l’IAL en tant que guide afin de restreindre le nombre de langues à étudier (Leavers et Burley, 2001). Dans ce contexte, la prosodie pourrait être employée pour choisir le décodeur phonétique le mieux adapté à une langue.

Notes
93.

En terme de pourcentage d’identification, du nombre de langues testées, des conditions d’enregistrement des corpus (laboratoire ou spontanée, lignes téléphoniques).