IV.3.2.Utilisation conjointe du réseau (TRN) et du cochléogramme

Quel peut être l’impact du TRN sur le cochléogramme ?

Les deux premières secondes du signal de parole vont être éliminées afin de supprimer les indices (comme le bruit de fond), qui ne pourront être utiles dans une application réelle.

Notre objectif est maintenant d'examiner la capacité du TRN pour traiter les entrées calculées par le cochléogramme. Cette expérience a deux points à démontrer : 1) le TRN encode le signal spatio-temporel de parole dans une représentation spatiale de sorte qu'elle permette une identification comparable à une méthode sans fondement biologique (Accumulation); 2) cette représentation a pu être réinjectée dans cette même méthode pour augmenter les performances.

Nous devons évaluer la distance d'un échantillon donné d’une langue à chacun des prototypes, générés pour chaque langue apprise. Deux méthodes (appelées Une Trame et Accumulation) ont été examinées pour dissocier l'information comprise dans une seule trame, de celle contenue dans l’ensemble des trames décrivant le signal de parole.

Dans la première méthode (Une Trame), nous considérerons seulement une unique trame, pour représenter le signal de parole à un instant t. Ainsi le contexte ne peut pas être codé, lorsque le TRN n’est pas employé.

Dans une deuxième méthode, la distance de chaque trame individuelle sera additionnée pour tenir compte de tous les événements précédents entre 0 et l’instant t (Accumulation, présentée dans le paragraphe IV.2.3). Pendant la phase d’apprentissage un prototype sera établi, soit à partir d’une seule trame dans le cas de la méthode Une Trame, soit à partir d’une matrice (Accumulation). Les résultats sont ceux obtenus pendant la phase de validation pour le réseau TRN, sélectionné dans une population de 50 réseaux lors de l’apprentissage.

Les résultats sont présentés dans la Figure 3.12. Une analyse de variance des taux d’identification de chaque langue a été conduite entre les trois facteurs : Durée (1s ; 5s ; 10s), Méthode (Simple ; Accumulation), codage (avec ou sans TRN). Il n'y avait aucun effet principal significatif, seule l’interaction entre la durée et les deux autres facteurs (méthode et codage) est significative. Ceci suggère que les deux méthodes d’évaluation et le codage s’exécutent différemment pour au moins une durée.

Un premier test post hoc LSD conduit sur la durée et la méthode a montré que la méthode Accumulation diffère de manière significative de la méthode Une Trame ( P < 0,01 ) pour toutes les durées. Un deuxième test post hoc LSD conclut que les facteurs Durée et Codage montrent une différence significative entre l'absence et la présence du TRN pour 5s et 10s ( P < 0,01 ), et non pour 1s (P = 0,32). Les deux analyses précédentes ont prouvé qu'il n’y avait aucune différence entre 5s et 10s (resp. P = 0,69 ; P = 0.73). En outre il n'y avait aucune différence significative entre le TRN et la méthode d'Accumulation appliquée aux entrées du TRN pour 5s (P = 0,71) ou de 10s (P = 0,68).

Ainsi les événements passés sont encodés par le TRN. Pour 10s, le mélange des deux méthodes temporelles (Accumulation et TRN) diffère du traitement avec uniquement le TRN (P = 0,02) ou uniquement la méthode Accumulation (P = 0,04), mais pas pour une durée de 5s (P = 0,11 ; P = 0.06). Ceci suggère que l'adjonction d'une mémoire, apportée par la méthode Accumulation est efficace pour des durées supérieures à 5s. Il n'y avait aucune différence significative entre 5s et de 10s pour le réseau le plus efficace, cependant les résultats ont progressé de 62,8 % à 64,9 %.

Figure 3.12 Performances d’identification des cinq langues européennes du corpus MULTEXT. Quatre méthodes sont présentées : avec ou sans le réseau récurrent (resp. TRN ou input), ainsi qu’avec ou sans la méthode d’accumulation (resp. simple ou cumul).
Figure 3.12 Performances d’identification des cinq langues européennes du corpus MULTEXT. Quatre méthodes sont présentées : avec ou sans le réseau récurrent (resp. TRN ou input), ainsi qu’avec ou sans la méthode d’accumulation (resp. simple ou cumul).