IV.2.2.Désambiguïsation de structures syntaxiques

Les indices prosodiques participent à la désambiguïsation syntaxique. Veilleux, Ostendorf et Wightman (1992) ont introduit un système de désambiguïsation entre deux découpages syntaxiques pour une même phrase. Cet article utilise deux composantes : une détection des ruptures et un algorithme calculant les relations entre ces ruptures et la syntaxe. Ces deux algorithmes sont implémentés par des arbres de décisions binaires. Ces relations entre syntaxe et prosodie sont apprises à partir d’une transcription écrite des énoncés. La détection automatique des pauses assigne un indice de ruptures à la fin des mots, en fonction des indices précédents et d’information acoustiques telles que la durée, ou l’estimation de la présence de tons. Elle s’effectue à partir du signal, annoté par des phonèmes. Les marqueurs indiquant la fin des mots sont trouvés automatiquement. Un arbre de décision classe les mots qui sont encodés par des vecteurs décrivant leur fin à partir des paramètres suivants : durée normalisée de la rime de la dernière syllabe, différence des durées entre l’attaque et la rime de la dernière syllabe, durée absolue de la pause, probabilité d’un ton de frontière, mesure locale du changement de vitesse du locuteur, et un marqueur indiquant la présence d’un accent lexical.

Ce système donne donc une séquence différente d’indices de ruptures (un nombre entier compris entre 0 pour les groupes clitiques à 6 pour une pause entre deux phrases) pour les deux interprétations parlées possibles d’une même phrase écrite. Les êtres humains obtiennent les meilleures performances lors de la discrimination de deux phrases parlées. Toutefois, les résultats de leur algorithme restent comparables aux performances humaines lorsque les indices de ruptures sont annotés manuellement. Effectivement, la détection automatique des ruptures diminue le score du système global. Les auteurs suggèrent d’améliorer cette composante en tenant compte d’autres indices prosodiques tels que la proéminence.