III.3.2.Apprentissage à partir d’un prototype moyen

Dans ce modèle, il n’existe pas d’apprentissage dans les connexions récurrentes. Initialement, un simple apprentissage associatif relie les différents états internes de « State » aux réponses appropriées. Le support neurophysiologique de cet apprentissage associatif correspond à la plasticité des synapses cortico-striatales sous influence dopaminergique (Dominey et coll., 1995). Avec cet algorithme d’apprentissage par renforcement, la structure temporelle peut être traitée indépendamment de la structure sérielle. Le modèle a déjà été testé avec succès dans des tâches de discrimination de langues à partir du rythme (Dominey et Ramus, 2000), ce qui suggère qu’il est effectivement sensible à la structure rythmique de la parole. Dans le cadre de cette thèse, cette modélisation sera étendue à un plus grand nombre de langues, ainsi qu’au traitement direct du signal acoustique, et à des problèmes d’identification portant sur des échelles temporelles différentes.

Pour pouvoir tester le potentiel du réseau pendant la phase d’identification, il faut étudier l’état des neurones des couches du réseau. Cette analyse est courante dans l’utilisation des réseaux récurrents (Elman, 1990 ; Cleeremans, 1993). Ceux-ci tirent avantage de la représentation développée dans ses unités qui sont copiées dans la couche de contexte StateD. Pour chaque point d’une séquence, ces motifs formés par les unités de la première couche State codent la position de l’entrée courante dans la structure étudiée. La matrice des distances euclidiennes entre chaque vecteur d’activations permet de procéder à une analyse par regroupement (Cleeremans, 1993). Ce regroupement s’effectue en fonction du nœud de l’automate générant la grammaire apprise par le réseau.

Dans notre cas, les activations des unités sont stockées dans un vecteur de 50 unités, qui regroupe les activations enregistrées dans les deux couches State et StateD.

A chaque catégorie de séquences (langues, mots, attitudes prosodiques) correspond alors un vecteur prototype. Ce prototype est issu de la moyenne des activations des séquences du corpus d’apprentissage, pour un type de séquences données. Lors de l’identification d’une séquence, chaque distance avec le prototype d’une catégorie est calculée. La distance minimum indique alors la catégorie reconnue. L’évaluation d’un des états de la couche State se fait donc en deux temps :

  1. Prototypage : Obtention d’un prototype de l’état induit par chaque catégorie ;
  2. Evaluation de la distance entre un prototype et un état induit dans les couches Stateet StateD du réseau.

L’algorithme comporte trois boucles. Les deux premières passent en revue chaque matrice du corpus dont on veut connaître la catégorie qu’il décrit. Enfin, la troisième boucle permet de chiffrer la distance de la matrice étudiée avec chacun des prototypes des catégories. Finalement, le prototype présentant la plus petite distance indique la catégorie identifiée. Durant l’apprentissage, un prototype est créé à partir de la moyenne de l’ensemble des stimuli d’une même catégorie dans la base d’apprentissage.

Algorithme 1.1 Evaluation de la première couche du réseau
Algorithme 1.1 Evaluation de la première couche du réseau

La fonction position_minimumutilisée dans l’algorithme 1.1 renvoie la position du minimum.MOTIF désignele vecteur contenant l’activation de chaque neurone des couches State et StateD. MOYENNE désigne le tableau de la moyenne de la totalité des matrices de la base d’apprentissage pour une même catégorie. Le tableau CORRECT contient le nombre de séquences pour laquelle la catégorie a été correctement identifiée.

Chacun des problèmes étudiés pendant la partie expérimentale reprend ce principe. Cependant, des adaptions seront également examinées en fonction du problème étudié.