IV.1.2.Traitement de la structure temporelle

Les systèmes issus des travaux des neurosciences sont le plus souvent testés avec des séquences abstraites (Beiser et Houk, 1998 ; Buonomano, 2000 ; Joel et coll., 2000). La plupart des modèles des neurosciences testés pour le traitement automatique de la parole ont été appliqués à la reconnaissance de mots isolés (Liaw et Berger, 1998 ; Nachtschläger, Maass, et Zador, 2000 ; Näger, Storck et Deco, 2002). Cette tâche ne constitue qu’une partie des opérations effectuées, dans le cadre du traitement de la parole. Par exemple, le nourrisson doit executer un certain nombre de tâches pour apprendre sa langue maternelle, telles que l’identification des catégories lexicales, la segmentation en mots, l’apprentissage des régularités syllabiques, qui dépassent le cadre de la reconnaissances des mots isolés, et peuvent faire appel au traitement de la prosodie, dont la domaine de définition couvre un Continuum Temporel.

L’objectif de notre travail est de fournir un modèle connexionniste capable de traiter des structures définies de façon locale ou globale. Buonomano (2000) a proposé un réseau, sans constante de temps, qui utilise uniquement les propriétés synaptiques, pour s’adapter à la tâche. Cependant, les tâches qui ont été étudiées sont uniquement définies à un niveau local. En effet, il propose une discrimination de séquences simples contenant au plus quatre éléments symboliques (Buonomano, 2000). La discrimination de phrases appartenant à des langues de classes rythmiques différentes implique quinze à vingt syllabe pour le corpus LSCP. En outre cette même expérience ou la reconnaissance des attitudes prosodiques implique d’avoir à traiter la fréquence fondamentale, une dimension qui n’est pas discrète, mais continue dans le temps et l’espace.

Pour traiter des structures temporelles, le réseau TRN s’appuie sur trois propriétés, qui le distingue des réseaux récurrents :

L’apprentissage ne s’effectue pas à partir d’un algorithme difficilement reproductible par le cerveau (rétropagation du gradient au cours du temps, Pearlmutter, 1995) ;
Les unités du réseau sont des intégrateurs à fuite, ce qui permet de définir la sensibilité temporelle de ce réseau ;
Les poids des connexions récurrentes restent fixes.

Dans le modèle original (Dominey et Ramus, 2000), l’apprentissage s’effectuait à l’aide d’une mémoire associative de la couche State vers la couche de sortie. Dans notre travail, l’apprentissage est effectué à l’extérieur du modèle pour réduire le coût informatique des évaluations du réseau. Ces principes permettent de respecter la contrainte temporelle, par laquelle le signal analogique est transmis aux entrées du réseau, sans faire appel à une représentation symbolique.