IV.1.1.Indices vocaliques

Pour ces premiers investigations, seuls les groupes de mots consécutifs de même nature lexicale ont été étudiés. Nous retiendrons que deux types d’indices définis sur les voyelles (la durée et la fréquence fondamentale), avant d’étudier leur combinaison.

IV.1.1.1.Durée

Shi et coll. (1998) ont mis en avant l’importance de la durée des voyelles pour discriminer les mots de fonctions des mots de contenu. Morgan et coll. (1996) ont trouvé que la durée moyenne des voyelles contenues dans un mot permet un taux de 64 % d’identification pour l’Anglais.

Les durées que nous avons observées correspondent à des durées données dans d’autres études (Dodane et coll., en préparation). Nos premiers résultats montrent que les voyelles des mots de fonctions sont également prononcées plus rapidement par rapport aux mots de contenu, même si les données ne sont pas normalisées. Ces résultats rejoingnent l’hypothèse selon laquelle les mots de fonction sont minimaux (Morgan et coll., 1996). Le ratio des durées des consonnes par la durée des voyelles ne diffère pas significativement.

Tableau 5.1 Valeurs moyennes de la durée des phonèmes, en ms.
Tableau 5.1 Valeurs moyennes de la durée des phonèmes, en ms.

La durée moyenne des voyelles sur un groupe de mots est prise comme prototype de chacune des deux classes. Le taux d’identification pour un corpus de validation (composé de la moitié des groupes de mots du corpus total) est de 71.5 %. Une carte de Kohonen à 2 dimensions (5 x 5) atteint une performance de 74.9 % après 150 cycles d’apprentissage.

Les performances sont supérieures à celles rapportées par Morgan et coll. (1996) pour l’Anglais (64 %). Toutefois, il ne s’agit pas des mots eux-même dans notre cas, et il est probable que la nature de la langue et des passages étudiés influence aussi les résultats.

L’algorithme de segmentation automatique en consonnes / voyelles développé par Pellegrino (1998) a été appliqué sur l’ensemble du corpus MULTEXT. Une analyse discriminante permet d’effectuer la tâche d’identification lexicale à partir de la durée des voyelles segmentées automatiquement (Anglais : 73.2 % ; Français 73.2 %). Ces observations sont valides si chaque groupe est considéré dans son entier. Est-il possible de ne plus utiliser qu’une seule voyelle ?

Figure 5.2 Durée moyenne de la dernière voyelle de chaque groupe.
Figure 5.2 Durée moyenne de la dernière voyelle de chaque groupe.

Lorsque seule la dernière voyelle est prise en compte, la différence de durée entre les groupes de fonction et les groupes de contenu est significative (ANOVA : p < 0.001). Le taux de reconnaissance à partir de cette valeur moyenne est de 71 % pour la validation, 72 % avec un réseau probabiliste. L’utilisation d’une carte de Kohonen valide l’hypothèse d’un apprentissage non supervisé (10 neurones et 2500 cycles : 69,6 %).

Ces résultats montrent qu’il est possible de n’utiliser que la dernière frontière d’un groupe de mots sans que les performances d’identification soient trop atténuées.

Les observations précédentes indiquent que la dernière voyelle des groupes de mots semble un indice fiable pour l’identification en Français. Est-il possible de tenir compte de l’information apportée par la F0 ?