IV.1.4.2.Discussion

Comme nous le pensions le signal formé par les valeurs brutes de F0 ne peut permettre de répondre à la tâche. Il faut au minimum lisser et interpoler les données pour pouvoir trouver les pics de F0. En employant une fenêtre plus large, l’identification lexicale est réalisée avec les meilleures performances. Cependant, il est probable que cette amélioration soit due aux indices de durées des mots. Effectivement avec des échantillons aussi espacés, certains mots de fonction ne sont pas représentés par des valeurs de F0, il devient alors impossible de former un pic sur certains mots de fonction.

En outre, la représentation donnée par MOMEL a été appréciée comme proche de la perception, puisque ces mêmes pics ont été jugés perceptibles sur le corpus MULTEXT (Campione et Veronis, 1998). Nous avons également tenté de nous passer de la frontière de début des groupes de mots. Cependant, les performances sont plutôt décevantes, il semblerait que la position du pic soit trop imprévisible, pour garder une fenêtre de taille fixe à partir de la fin d’un groupe de mots.

En moyenne les pics sont espacés de 71.5 ms pour la partie Française du corpus LSCP. A partir de cette valeur nous répartissons les pics au hasard (suivant une loi normale centrée sur l’espace moyen entre deux pics et pour écart-type, l’écart-type de ces espaces). Nous comptons ainsi vérifier quelle peut être l’influence de la durée des mots pour l’identification lexicale fondée sur la présence de pics de F0. Effectivement, les mots de fonction sont très courts, il y a donc statistiquement peu de chance qu’un pic de F0 soit sur un mot de fonction. Avec une répartition aléatoire des pics, 80 % des mots de fonction sont encore identifiés correctement, et 60 % des mots de contenus sont encore identifiés. Le score d’identification est alors de 70 %, ce qui reste inférieur aux performances données par les vrais pics de F0. Malgré tout la durée des mots de fonction (qui marque pour une grande part leur minimalité) est un facteur qui a une grande influence sur l’identification lexicale.

Nous devons noter qu’il conviendrait de traiter à part les fins de phrases, caractérisées par une descente de l’intonation ; ainsi que les continuations majeures qui peuvent avoir lieu sur des mots de fonction, et former dans ce cas un pic de F0 sur ces mots de fonction.