IV.1.4.4.Extension à d’autres corpora et aux mots

L’identification des mots de fonction et de contenu du corpus LSCP à partir des pics de F0 donne les performances, résumées dans le tableau 5.6. Un tirage aléatoire entre les deux catégories conduirait à un score d’identification de 50.6 %.

L’intérêt de la représentation MOMEL est accru par la possibilité d’utiliser le corpus MULTEXT, qui a permis de juger la validité de cette représentation. En outre, ce corpus est segmenté en mots, ce qui nous autorisera à comparer les performances entre les groupes de mots et les mots, pour une autre langue que le Français.

Tableau 5.4 Pourcentage de pics et de vallées dans des mots de contenu.
Tableau 5.4 Pourcentage de pics et de vallées dans des mots de contenu.

Ce tableau 5.4 reflète déjà une différence entre l’Anglais et le Français. Dans le cas du Français, un plus grand nombre de pics sont présents, alors que moins de vallées apparaissent dans les mots de contenu, laissant présager que celles-ci seront sur les mots de fonction.

Tableau 5.5 Performances de la détection des pics pour le corpus MULTEXT
Tableau 5.5 Performances de la détection des pics pour le corpus MULTEXT pour des groupes de mots et les mots eux-même avec l’algorithme MOMEL.
Tableau 5.6 Performances de la détection des pics pour le corpus LSCP
Tableau 5.6 Performances de la détection des pics pour le corpus LSCP pour de groupes de mots et les mots eux-même avec l’algorithme MOMEL.

Au premier abord, les performances obtenues sur le Français avoisinent celles du corpus précédent, et le passage aux mots dégrade peu les performances. Les résultats sont différents pour le corpus LSCP. Les performances diminuent nettement pour les mots. Cela est peut-être du à un mauvais repérage des pics par l’algorithme MOMEL sur le corpus LSCP. Lorsque les pics sont décalés de 10 pas, nous obtenons un taux de réussite de 75 % pour les mots. Toutefois les performances pour l’Anglais suivent la même diminution pour le corpus MULTEXT.

Nous appliquons alors les méthodes d’interpolation et de lissage fournies dans PRAAT aux valeurs brutes de F0 obtenus avec une fenêtre d’analyse de 10ms. Les performances de l’identification des mots pour le corpus LSCP sont pour l’Anglais 76,6 % et pour le Français 86,3 %. Ceci indique que les pics de F0 donnés par ces méthodes sont utiles pour l’identification des mots de fonction et de contenu. Les performance sont caractéristiques des différences observées entre l’Anglais et le Français. Cependant, l’application de ces méthodes ne garantit pas que les pics de F0 détectés seraient perceptibles par l’oreille humaine.

Pour le corpus MULTEXT Anglais, une perte de 6 % (2 % en Français) est observée entre les mots et les groupes. Cette différence illustrent le fait qu’un même indice peut avoir un impact différent pour l’identification lexicale, comme cela a déjà été souligné par Shi et coll. (1998) et Morgan et coll. (1996). En outre, la détection des pics est indépendante du locuteur, puisque celle-ci ne dépend pas de la fréquence moyenne, mais est déterminée par le contexte.

Nous n’avons tenu compte pour l’instant que de la fréquence fondamentale et de la durée. Des dimensions acoustiques supplémentaires, telles qu’intensité et formants peuvent-elles être employées pour distinguer mots de fonction et mots de contenu ?