III.3.2.Méthodes connexionnistes

Pour compléter ces études, nous proposons d’employer le réseau TRN décrit dans le chapitre Un (section III.3). Dans ce chapitre, trois méthodes ont été testées avec le TRN.

La première méthode est appliquée à chaque pas de la simulation aux états des couches State et StateD du réseau TRN. Elle est dénommé « Une Trame ». Effectivement, l’analyse ne prend en compte que le vecteur issu de ces états à un instant t. Ces vecteurs sont ensuite utilisés comme un encodage de la séquence traitée par le TRN. L’apprentissage s’effectue à partir d’un prototype moyen de ces vecteurs (cf. chapitre Un section III.3.1). Les évènements passés sont donc encodés dans la couche de contexte StateD uniquement.

La seconde méthode Accumulation emploie la totalité des vecteurs formés entre 0 et l’instant courant t. A chaque pas de la simulation, un compteur est incrémenté pour chaque langue par la distance entre le vecteur obtenu à l’instant t pour le passage à identifier et les prototypes de chaque langue à cet instant t (cf. Figure 3.4). Pour éviter que les valeurs des compteurs ne deviennent trop importantes, leur valeur minimale est retranchée à chacun d’eux. Le compteur ayant la plus petite valeur indique alors quelle est la langue reconnue. Cette méthode revient à tenir compte de matrices de taille t, au lieu de vecteurs pour décrire le signal. Un prototype correspond donc à la moyenne des matrices de chaque passage de la base d’apprentissage d’une langue. Cette méthode sera dénommée Accumulation et sera comparée à la méthode précédente (dénommée Une Trame).

La troisième méthode est une validation croisée employée pour augmenter le nombre de données disponibles en apprentissage. Un seul locuteur est testé lors de la validation, les autres forment la base d’apprentissage. Cette technique est très coûteuse pour effectuer une sélection du meilleur réseau lors de l’apprentissage. Elle sera alors réalisée avec le réseau TRN, qui a donné les meilleures performances en validation, lorsque l’apprentissage est réalisé avec la première moitié du corpus MULTEXT.

Ce matériel et ces méthodes ont constitué la base des expériences suivantes, réalisées dans le cadre de l’IAL.

Figure 3.4 Le réseau TRN et la méthode d’accumulation.
Figure 3.4 Le réseau TRN et la méthode d’accumulation.