II.3.3.Réseau Récurrent Simple (SRN, Reali, Christiansen et Monaghan, 2003)

Christiansen et Dale (2001) ont montré les capacités du réseau SRN, proposé par Elman (1990), pour l’apprentissage des catégories lexicales sur un mini-langage abstrait. Le réseau SRN apprend la catégorie lexicale suivant l’entrée courante. Les informations passées sont encodées lors de l’apprentissage.

Ces résultats ont été étendus par Reali et coll. (2003) sur un corpus de parole adressé à l’enfant (Berstein-Ratner, 1984). Le vocabulaire est très réduit, et contient seulement
15 catégories lexicales. Il ne s’agit pas d’assigner un mot donné à une catégorie lexicale, mais plutôt d’apprendre l’organisation des catégories syntaxiques. Cette simulation est éloignée de la réalité, car un enfant ne peut pas disposer des catégories lexicales, au mieux il peut les déduire à partir de ces connaissances et du signal de parole.

Le SRN est donc appliqué au traitement de 16 indices phonologiques, mis à jour par Monaghan, Chater et Christiansen (2003). Dans une première étape, les noms et les verbes sont identifiés à l’aide d’une analyse discriminante. Le nombre de syllabes est l’indice donnant les meilleures performances (57.4 %). En utilisant tous les indices, les verbes et les noms sont identifiés avec un taux de 76 %. Dans une seconde étape, le réseau SRN a été entraîné sur les représentations phonétiques des mots. L’analyse discriminante des unités cachées du réseau permet un taux d’identification des noms et des verbes de 86 %. Les auteurs en concluent en outre que le réseau a su utiliser les informations distributionnelles en plus des informations phonétiques pour effectuer cette disctinction.

Dans toutes les études présentées ici, un certain nombre d’indices spécifiques ont été extraits à partir du discours avec l'aide supplémentaire d'un expert humain. Les enfants sont censés avoir une représentation des mots ou des morphèmes individuels. Ici nous étudierons si un système s’appuyant sur des données neuro-réalistes (TRN) peut automatiquement extraire de tels indices à partir du signal de parole lui-même. La section suivante présente les méthodes et le matériel employés pour répondre à ces contraintes.