IV.1.5.2.Identification des mots de fonction et de contenu

Le tableau 5.7 suivant indique les performances obtenues pour une analyse discriminante (logiciel SPSS) pour accomplir la tâche d’identification lexicale à partir de la durée des segments étudiés (mots ou groupes) et des prototypes prosodiques.

Tableau 5.7 Performances de l’analyse discriminante des prototypes prosodiques. La différence entre les lignes durée et durée & 120 indices est indiquée dans la dernière ligne.
Tableau 5.7 Performances de l’analyse discriminante des prototypes prosodiques. La différence entre les lignes durée et durée & 120 indices est indiquée dans la dernière ligne.

Ce tableau 5.7 fait apparaître une différence entre l’Anglais et le Français comparable à celle qui ressortait avec l’étude des pics de F0. L’information prosodique n’améliore les performances que pour le Français et ceux principalement pour les groupes de mots. En outre, il apparaît que la durée des segments permet une identification comparable entre les langues ( > 80 %), lorsqu’il s’agit des mots. Ceci confirme le caractère minimal des mots de fonction pour l’Anglais et le Français. Toutefois, il apparaît que les mots de fonction sont un peu plus souvent regroupés en Français qu’en Anglais. Les performances diminuent moins en Anglais, lorsque les groupes sont considérés.

Le corpus MULTEXT permet de valider l’identification des mots de contenu et de fonction sur plusieurs locuteurs. Dans ce cas, chaque locuteur est testé indépendamment des autres. L’apprentissage se fait sur la moitié d’un corpus pour un seul locuteur. Les performances sont voisines pour chaque locuteur. Les différences qui apparaissent peuvent être dues à la structure syntaxique des énoncés, (4 passages pour 10 locuteurs) ou à l’interprétation prosodique des locuteurs. Des analyses ultérieures pourraient comparer les mêmes énoncés prononcés par deux locuteurs différents.