IV.1.3.1.Prototype de F0 pour un groupe de mots

Le graphe suivant donne une illustration du parcours moyen de la F0 pour les deux catégories grammaticales au cours du temps (Figure 5.4). Le premier point soulevé par ce graphe est la prise en compte de la durée. Les mots de contenu sont plus longs que les mots de fonction, et leur voisement également. En voulant caractériser l’évolution de F0, il semble impossible de ne pas tenir compte des frontières de mots.

Ce graphe (Figure 5.4) suggère que l’évolution de la F0 est différente suivant les types des mots. Le trajet pris par la F0 est beaucoup plus court pour les mots de fonction, et est donc moins sinueux que pour les mots de contenu.

Figure 5.4 Décours temporels moyen pour la F0 (plus ou moins l’écart type pour les courbes fines) en fonction des groupes de mots de fonction (en rouges) et de contenu (en bleu).
Figure 5.4 Décours temporels moyen pour la F0 (plus ou moins l’écart type pour les courbes fines) en fonction des groupes de mots de fonction (en rouges) et de contenu (en bleu).

Notre objectif est donc de pouvoir décrire l’évolution de la F0 au cours du temps à l’aide d’un nombre réduit de paramètres. Les premiers paramètres étudiés pour l’établissement d’un prototype moyen de F0 pour chacune des deux catégories sont énumérés dan le tableau 5.2.

Tableau 5.2 Performances d’identification par réseau probabiliste pour divers paramètres.
Durée des groupes de mots 84,5 %
Première valeur de F0 66 %
Dernière valeur de F0 80,6 %
Variation de F0 (première moins dernière valeur) 72,6 %
Maximum de F0 62,1 %
Position du maximum de F0 85,4 %

L’étude des indices semble une fois de plus donner raison à l’hypothèse d’intégration de dimensions différentes. Effectivement, la durée précédant le maximum de F0 permet les meilleures performances d’identification, or cet indice fait appel à la fois à la durée (le rythme) et à la fréquence fondamentale (l’intonation). L’impact de la valeur maximale peut être améliorée (70,4 %) si la valeur moyenne de F0 est également prise en considération (maximum moins la valeur moyenne sur le segment).

Figure 5.5 Représentation des prototypes de F0
Figure 5.5 Représentation des prototypes de F0 pour les groupes fonction (pic à gauche) et contenu (pic à droite).

Empiriquement, nous avons testé plusieurs configuration des indices précédents pour obtenir les meilleures performances. La combinaison des variations, de la durée, de la valeur finale, ainsi que de la position du maximum permet d’atteindre 91 % de réponses correctes. Ces mêmes indices testés avec une carte de Kohonen permettent de retrouver des performances voisines (2500 cycles, 88.3 % pour 5 x 5 unités).

Ces expériences prouvent qu’il est possible d’identifier les mots de fonction et de contenu à partir d’un certain nombre d’indices, caractérisant l’intonation et la durée. En outre, l’intégration d’indices de plusieurs dimensions (durée et intonation) améliore les performances. Cependant, l’identification est effectuée en connaissant les frontières de début et de fin de groupes de mots. Est-il possible de ne tenir compte que de la dernière voyelle d’un groupe de mot ?