Interaction entre débit et structure rythmique de l’énoncé

Étant donné que le débit semble affecter des unités telles que la syllabe, mais aussi les segments et les mots, ce phénomène est considéré comme très important dans la structuration prosodique de l’énoncé. Malgré cela, seuls quelques travaux ont été consacrés aux effets du débit de parole sur l’organisation prosodique (Duez, 1987 ; Fougeron et Jun, 1998 ; Zellner, 1998 ; Pasdeloup, 2005). Au niveau de la prosodie de l’énoncé, Vaissière (1997) a noté qu’à débit lent, la division en mots prosodiques est bien marquée, on ‘détache les mots’. En revanche, quand le débit s'accélère, les excursions de Fo, témoins des constituants prosodiques inférieurs, tendent à s'estomper progressivement et on avale ses mot’ ’. L’auteur a également constaté que le locuteur tend à équilibrer le nombre de syllabes à chaque niveau.

Par ailleurs, la question du débit a essentiellement été étudiée dans son interaction avec le rythme (Pellegrino et al. 2004 ; Dellwo et Wagner, 2003 ; Dellwo et al. 2005 ; Steiner, 2004 ; Zellner 2003). Les deux phénomènes sont liés puisqu’ils génèrent des problèmes de définitions similaires et agissent sur la structure temporelle de la parole. Ramus (2002) et Zellner (2003) suggèrent que toutes les études concernant le rythme devraient tenir compte des effets du débit : “‘ Since rhythm is, at least in part, a matter of duration, and durations are affected by speech rate, all students of speech rhythm must be concerned by effects due to speech rate. ’"(Ramus 2002, p. 3)

Pasdeloup (2004) a observé un effet très significatif du débit de parole sur la durée des syllabes indépendamment de leur accentuation : les durées syllabiques à débit normal sont significativement différentes des durées syllabiques observées à débit rapide. Elle conclut que ‘le rythme n’est pas élastique’. Si le rythme l’était, on augmenterait d’un même facteur la durée des syllabes inaccentuées et celle des syllabes accentuées. Or, les résultats ont montré que quand le débit de parole change, la durée syllabique ne varie pas dans les mêmes proportions selon que la syllabe est accentuée ou inaccentuée. La structuration temporelle d’un énoncé produit à débit lent ne correspond pas au ralentissement linéaire du même énoncé produit à débit rapide (et inversement).

On a également observé que le ralentissement du débit de parole se traduit par un renforcement des contrastes temporels, une augmentation du nombre et de la durée des pauses, un affaiblissement des contrastes mélodiques ainsi qu’une augmentation du nombre de schwas à l’intérieur et en fin de groupes rythmiques. A l’inverse, l’accélération du débit de parole à l’inverse se traduit par un affaiblissement des contrastes temporels et une très forte diminution du nombre et de la durée des pauses (Zellner, 1998). Cette dernière stratégie a pour effet l’augmentation du nombre total de syllabes et la production de suites de syllabes du type consonne-voyelle.

Dans une étude dédiée à l’identification automatique, Rouas et al. (2004) proposent d’étudier le débit en termes de phonèmes et de syllabes par seconde dans une perspective multilingue afin d’évaluer un algorithme de segmentation automatique et de détection automatique des voyelles comme estimateur de débit.Rouas et al. (2004) posent l’hypothèse que le niveau de corrélation est probablement plus élevé pour les langues ayant une structure syllabique simple en CV que pour les langues qui autorisent une plus grande complexité syllabique en termes de nombre de segments consonantiques consécutifs. Or leurs résultats montrent que dans les langues accentuelles comme l’anglais, pour lesquelles une grande variabilité de la complexité syllabique est attestée (Dauer 1983, 1987 ; Ramus et al 1999), les débits de parole, phonémique et syllabique, sont extrêmement corrélés (r =0,94), tout comme dans des langues ayant des structures syllabiques plus simples (espagnol ou mandarin). Les auteurs concluent que la vitesse d’élocution dépend non seulement du locuteur mais également de la langue.

Benali (2004) a souligné la pertinence du débit dans l’identification de deux parlers algériens : l’algérois et l’oranais. Ses résultats ont montré que le paramètre sur lequel les auditeurs se concentrent le plus pour discriminer l’algérois de l’oranais est essentiellement le débit. Il conclut que ce dernier est le paramètre dominant dans cette expérience d’identification.

Ramus (2002) a affirmé qu’à travers les langues, il existe une variation de débit : il y a des langues parlées ‘plus rapidement’ que d’autres (i.e. français parisien vs. français suisse et italien vs. allemand). Il souligne également les problèmes liés à l’étude du débit comme paramètre de discrimination entre les langues tels que la détermination d’une unité de mesure qui soit valable pour mesurer le débit dans une perspective translinguistique : ‘ “it might even be that the appropriate unit is not the same in all languages. ’ ‘ What about feet for English, syllables for French, and morae for Japanese? Obviously, this approach would lead to the observation that Japanese is much faster than English, since Japanese morae are much shorter than English syllables. But even the "one unit for all" approach has this problem. Since Japanese syllables are simpler than English ones, one would also expect that Japanese speakers are able to produce more syllables per second than English speakers ’.” (p. 6).

En résumé, la littérature sur les variations du débit de parole est abondante. Les études phonétiques ont montré l’impact de ce phénomène à tous les niveaux de la structure temporelle de la parole. Les effets ont été relevés en particulier au niveau du groupe prosodique, au niveau de la syllabe, au niveau segmental et articulatoire. Zellner (1998) qui a vérifié ces observations en synthèse de la parole en français conclut qu’ : « ‘ une caractérisation de la vitesse de parole à l’aide d’un unique paramètre quantitatif n’est donc pas satisfaisante. ( ) La modélisation du débit ne saurait se résumer à l’établissement du ’ ‘ nombre d’unités de parole par unités de temps. Des modifications d’ordre qualitatif interviennent aussi dans la chaîne parlée ’. » (p. 34).

En tout état de cause, quelle que soit la perspective (typologie ou identification) il semble évident que le débit de parole calculé en termes de phonèmes par seconde et/ou de syllabes par seconde apporte des informations complémentaires sur la structure rythmique et l’organisation phonotactique des langues. Rouas et al. (2004) ainsi que Ramus (2002) considèrent que l’étude de grands corpus va conduire à une meilleure compréhension de la contribution respective de chaque paramètre dans la structure rythmique de la parole. C’est dans ce cadre que nous exposerons dans les sections suivantes comment la question du rythme a été abordée dans les études en identification.