VI.Conclusion

Nous montrons donc que le réseau récurrent temporel peut extraire les régularités acoustiques et prosodiques au cours du temps, pour identifier automatiquement les langues. Dans un premier temps, le réseau TRN a pu traiter des structures temporelles définies sur plusieurs dimensions prosodiques, s’étendant sur des passages de plusieurs secondes. Au cours de ces expériences, nous avons montré que le réseau TRN traite une représentation de plus en complète du signal : rythme, fréquence fondamentale, et formants sont traités dans une représentation commune et avec une grande précision temporelle (Cochléogramme).

Dans un second temps, le réseau TRN a traité la structure prosodique de phrases de langues appartenant à différentes classes rythmiques, montrant ainsi que le réseau TRN était toujours sensibles aux différences rythmiques, même lorsque les consonnes et voyelles ne sont pas désignées au sein du signal. Le réseau TRN distingue des langues uniquement lorsque leurs classes rythmiques différent, comme c’est le cas chez les nourrissons (Nazzi et coll., 1998).

Berkling (1996) précise que l’Identification Automatique des Langues se fonde sur une représentation sous forme d’unités discrètes de la parole. Nos premières expériences suivent ce principe, puisque le signal de parole est réduit à des segments fournis par la distinction entre consonnes et voyelles (Pellegrino, 1998). Nos dernières expérimentations montrent cependant qu’il est possible de ne pas chercher d’unité particulière, dans le signal de parole (cf. section III.4. Simulation de discrimination de langues).

L’objet de ce premier chapitre expérimental était de démontrer que le réseau TRN pouvait être employé pour identifier 5 langues pour une fenêtre temporelle longue, de l’ordre de plusieurs secondes, tout en étant influencé par le rythme propre d’une langue. Le premier point de l’hypothèse de Continuum Temporel est donc vérifié.

Est-il possible d’employer le réseau TRN pour identifier différentes attitudes prosodiques, exprimées dans une même langue ? Ainsi, ces expériences nous permettront de tester la validité du réseau TRN pour traiter différents contours de la fréquence fondamentale. Dans ce contexte également, les informations transmises seront uniquement acoustiques, de la même manière qu’un nourrisson appréhende les différentes expressions, que lui communiquent ces parents.