IV.1.4.3.Translation des pics de F0

La position des pics est liée à l’estimation de la fréquence fondamentale. Il peut arriver que les pics soit alors mal positionnés, en particulier qu’un pic tombe sur un mot de fonction, alors qu’il se trouve à la limite entre deux groupes de mots différents. Pour ce faire, nous avons translaté les valeurs de F0 (obtenues après l’algorithme MOMEL) d’un certain nombre d’échantillon (jusqu’à 100 ms de décalage). Il s’avère qu’un décalage de 100 ms permet d’accroître les performances. Cependant, il est également possible que le pic tombe intentionnellement “entre” deux types de mots différents. Dans ces cas, le pic n’indique pas la nature d’un mot, mais un changement de nature. Toutefois, l’impact reste important (+10 % de mots reconnus).

Ce décalage des pics de F0 a été déjà été signalé dans la littérature dans l’alignement des pics de F0 par rapport à des segments comme des syllabes (Silverman et Pierrehumbert, 1990 ; Prieto, van Santen et Hirschberg, 1995 ; Arvaniti, Ladd et Mennen, 1998 ; Ladd, Mennen et Schepman, 2000 ; Xu, 2001). Il semble que pour notre étude le décalage des pics sur les syllabes puisse se répercuter sur l’identification des catégories lexicales.

Figure 5.9 Effet de la translation des pics sur l’identification lexicale.
Figure 5.9 Effet de la translation des pics sur l’identification lexicale.
Figure 5.9 Effet de la translation des pics sur l’identification lexicale.