V.1.2.Segmentation

Le dernier point que cette étude met en exergue est la segmentation de la parole en mot. Apparemment, l’identification lexicale ne peut se faire si les frontières des mots (ou des groupes de mots) ne sont pas indiquées. Deux alternatives se posent donc : soit nous essayons de résoudre le problème de l’amorçage syntaxique sans recourir à une segmentation ; soit nous étudions conjointement les mécanismes de segmentation et ceux de l’identification lexicale (d’autant plus que la prosodie est utile pour les deux tâches).

Pour répondre à notre première hypothèse, la présence d’un pic de F0 est fortement liée à la présence d’un mot de contenu, mais plusieurs pics peuvent appartenir au même mot. Un pic de F0 est donc le plus souvent associé à une syllabe plutôt qu’à un mot. Comme aucun indice ne marque chaque mot de contenu ou chaque mot de fonction, nous n’avons pu trouver de méthode de segmentation des mots eux-même. Comme alternative, nous proposons que cet indice soit susceptible d’indiquer la venue d’un mot de fonction en Français (Malfrère et coll., 1998). Nous avons alors étudié un prototype de F0 pour chaque voyelle, pour distinguer les voyelles en fin de groupe de mots de contenu et précédant un mot de fonction. Un score de 6 % supérieur au hasard est obtenu. Les indices prosodiques (F0 et durée des voyelles) peuvent être pris en compte pour traiter le problème de l’identification lexicale et une partie de segmentation. Notons qu’il nous faut dans ce cas, une segmentation en voyelle (Blanc et Dominey, 2004).

En outre, l’utilisation du TRN ne requiert pas d’indiquer le début d’un mot, seule la fin du mot est prise en compte par le TRN. L’information nécessaire au TRN est donc moindre par rapport aux études précédentes (Shi et coll., 1998 ; Durieux et Gillis, 2000 ; Monaghan et coll., 2003). Cette particularité est due à l'emploi du réseau TRN et d’une représentation subphonémique (une trame toutes les 5ms). Effectivement, Reali et coll. (2003) ont appuyé leur recherche sur une réseau récurrent SRN, mais les mots sont présentés un à un au réseau, ce qui implique que les deux frontières des mots soient connues.

En conclusion, il apparaît important que ce travail soit poursuivi conjointement avec une segmentation en mots pour relever de l’acquisition du langage. Cette remarque pourrait faire l’objet de recherches futures.