Impact du débit sur les différentes unités de la parole

La littérature rapporte des effets de la variabilité de débit à tous les niveaux de la chaîne parlée : du segment à l’énoncé, en passant par la syllabe, le mot et le groupe syntagmatique. Le débit est ainsi considéré comme ‘‘ le paramètre qui permet de saisir la dynamique de la parole ’ ‘ ’ (Zellner, 1998, p. 24). Etant donné la complexité de cette notion, la problématique principale de l’étude du débit concerne d’une part, sa variabilité qui résulte d’interactions complexes puisqu’il dépend du locuteur, de la langue, et peut varier pendant la durée du discours, et d’autre part, le choix de l’unité pertinente qui permet de le mesurer.

Une grande partie des travaux sur le débit a porté sur la variabilité au niveau segmentale (Lehiste, 1970 ; Lindblom, 1963, 1990 etc.).Outre le fait que la durée des sons varie pour chaque langue (voire pour chaque dialecte), la durée de chaque segment est également conditionnée par le débit. Les travaux qui ont étudié l’impact du débit sur le contenu segmental sont multiples. Dans le domaine de la synthèse de la parole ou dans celui de l’identification, la recherche d’une mesure ‘fiable’ du débit est toujours d’actualité.

Certaines études ont confirmé que la variation du débit affecte en premier lieu les segments vocaliques de la parole, mais d’autres études comme celles de J. Miller (1981) ont montré que les segments consonantiques sont également affectés par ces variations auxquelles l'auditeur est sensible. D’ailleurs J. Miller (1981) a introduit la notion de ‘poids relatif’. Selon selon le débit d'articulation, certains traits acoustiques seront plus ou moins distinctifs (comme par exemple le trait de voisement). Une modification du débit implique donc un ensemble complexe de modifications des traits acoustiques qui servent à établir les distinctions phonétiques.

Néanmoins, la plupart des études ont montré que la durée des voyelles est plus sensible à la variation du débit que celle des consonnes. Lindblom (1963) observe que les voyelles inaccentuées du suédois se centralisent lorsque le débit augmente. Par ailleurs, l’allongement et la compression de la durée ne sont pas homogènes sur toutes les composantes de la syllabe car la dynamique temporelle se propage de manière non linéaire (Gay, 1981; Vaxelaire, 1995).

Des études empiriques comme celle de Pols et van Son, (1993), ont montré que le débit rapide favorise la réduction des voyelles ainsi que des phénomènes d'élision du schwa et de fusion vocalique pour le français (Lacheret–Dujour, 1990, 1991). Les auteurs ont comparé des voyelles accentuées produites à débit rapide à des voyelles non accentuées produites à débit lent. Ils ont montré que la non-accentuation et les différences de débit favorisent davantage le phénomène de réduction.

L'augmentation du débit de parole a aussi un effet sur les timbres vocaliques. Selon Gay (1981), cet effet de l'augmentation du débit sur la structure spectrale des voyelles peut se manifester, par une ‘non-atteinte’ des cibles formantiques, à moins que l’on demande esplicitement aux locuteurs de maintenir à la fois les syllabes accentuées et l'identité vocalique, les locuteurs peuvent alors atteindre les cibles formantiques malgré les changements de débit (Gay, 1981).

Dans le cas de l’arabe, les travaux traitant du débit en arabe dialectal sont rares et jusqu’alors assez dispersés. Par ailleurs, ces quelques études ne concernent souvent qu’un nombre assez restreint d’entités phonémiques (le plus souvent les voyelles). Il convient à ce propos de noter que dans l’ensemble des études s’intéressant spécifiquement à la durée vocalique, la question de débit en corrélation avec la syllabe a été rarement abordée.

Les études de l’arabe ont surtout souligné le rôle important que joue le débit sur la qualité et/ou la quantité vocaliques (e.g. Ghazali, 1979; Alioua, 1991-1992; Jomaa 1987; Ghazali et Braham, 1992). Étant donné que l’arabe manifeste une opposition quantitative dans son système vocalique, le but de ces études était de savoir si les variations des durées vocaliques se maintiennent ou non lorsque le locuteur doit adapter sa production à des variations de débit d’élocution. Ainsi, l’objectif principal des études de débit en arabe — exceptée celle de Braham (1997) qui a étendu son analyse aux consonnes — était de soumettre expérimentalement ce contraste phonologique de quantité aux variations adaptatives de contraintes de débit et de tester si les voyelles brèves étaient de qualité acoustique différentes de celles des voyelles longues.

Dans une autre étude, Ghazali et Braham (1992) ont observé le comportement de la quantité vocalique des voyelles /a/ et /u/ selon la nature de la structure syllabique dans lequel elles se réalisent (i.e. syllabe fermée vs. syllabe ouverte 42 ). Les trois sujets tunisiens ont produit des séquences dissyllabes dont la première syllabes est accentuée dans deux conditions de vitesse d’élocution : ‘rapide’ vs. ‘normal’ et selon deux styles de prononciation : ‘ordinaire’ vs. ‘pédagogique’. Les résultats obtenus à l’issue de cette étude montrent d’une part que la variable ‘vitesse d’élocution’ n’a pas d’effet significatif sur la durée intrinsèque des voyelles brèves étudiées ; en effet, à débit rapide elle conserve respectivement 88% et 84% de leur durée. Les longues en revanche connaissent une compression temporelle plus importante et leur durée, en débit rapide, ne représentent plus que 74 % et 77 % respectivement.

Les variations de vitesse d’élocution (i.e. le débit) et le nombre de syllabes dans le mot et/ou la longueur de la phrase entraînent des différences au niveau de la durée des segments. Il a ainsi été montré que la durée des segments vocaliques (et consonantiques) est inversement proportionnelle au nombre de syllabes présentes dans l’item (Benkirane, 1981 et 1982), et que plus le débit est rapide et/ou plus la phrase est longue, plus la durée des segments diminue.

L’effet de débit peut se manifester au niveau syllabique ; le débit a un impact sur la variabilité du nombre de syllabes prononcées, sur les variations de durée syllabique et sur la structure intrasyllabique. Par ailleurs, parmi toutes les mesures possibles du débit, le nombre de syllabes par seconde semble être la mesure la plus largement admise et utilisée (Duez, 1987; Bartkova, 1991 ; Pfitzinger 1998 ; Rouas, 2005).

Selon le débit de parole, la syllabe peut subir des changements au niveau de sa structure interne du point de vue de l’articulation des segments. Vaxelaire (1994) a comparé, avec la technique de la cinéradiographie, les comportements articulatoires sur des groupes consonantiques courants en français. Ses résultats ont montré que le débit rapide nécessite une réorganisation articulatoire : les articulateurs font preuve d'adaptation à la vitesse du geste en modifiant leurs mouvements. Notons en particulier les suppressions segmentales dans les groupes consonantiques et l’insertion ou la suppression du schwa ou d’autres vocoïdes (épenthèse ou syncope).

En débit accéléré le locuteur a tendance à fusionner voire à éliminer certains sons du mot (Lacheret-Dujour, 1990, 1991). Par exemple, la suppression de groupes consonantiques au profit d’une consonne simple (règle → règ(le); table tab(le)), a pour effet de raccourcir le nombre de constituants syllabiques. Étant donné que la durée de la syllabe est fortement liée au nombre de segments qui la constituent, moins la syllabe comporte de segments, plus courte est sa durée (Zellner, 1998).

En perception, J. Miller (1981) a montré que la durée de la syllabe joue un rôle important dans la perception des traits phonétiques et le traitement des durées des transitions, même lorsqu'il s'agit de la transition du segment initial dans la syllabe. Par exemple la perception du son [w] dans une syllabe longue [wa] dépend de la transition qui devra être plus longue que dans une syllabe plus courte [ba]. Ainsi, la durée de transition nécessaire pour identifier [wa] en débit rapide peut être la même que celle nécessaire pour identifier [ba] en débit lent.

L'étude de l'incidence des variations de la vitesse d'articulation sur la durée des syllabes accentuées et inaccentuées montre que le débit d'articulation est soumis à des limites (Duez, 1987). Ainsi, à débit lent, la moyenne se situe autour de 4 syllabes/seconde ; à débit rapide, la limite moyenne se situe autour de 6 ou 7 syllabes/seconde (Zellner, 1998). Les limites à la compression et à la dilatation affectent plus les syllabes accentuées et leurs éléments constitutifs (Duez 1987). Il a été montré que la durée des syllabes accentuées est modifiée plus souvent et de façon plus importante que ne l’est celle des syllabes inaccentuées lesquelles restent stables et pouvent servir de point de référence pour le calcul de l'ensemble des durées. Il a également été montré que plus la complexité de la structure syllabique augmente, plus la durée de la syllabe inaccentuée a tendance à demeurer stable. Ces résultats obtenus par Duez (1987) ont été confirmés par Barbosa (1994).

D’autres hypothèses ont avancé que le débit perçu résulte d’une combinaison des débits au niveau de la syllabe et du segment. Pfitzinger (1998) a montré que ni le débit du segment seul ni celui de la syllabe ne représentent de manière suffisante le débit de parole. En combinant les deux débits, ses résultats montrent par contre une corrélation très forte avec le débit de parole (r= 0,88). Toutefois, d’autres travaux sur l’allemand ont aussi montré que les débits calculés en termes de syllabes ou de phonèmes sont significativement corrélés (r= 0,6).

Le débit d’un même sujet peut aussi varier considérablement au cours d'un même énoncé. Dans leur étude, J. Miller et al. (1984) ont montré que la variation peut atteindre un taux de 31%, et la différence moyenne entre les syllabes les plus rapides et les syllabes les plus lentes est égale à 323 ms. Ils ont noté que les changements de vitesse d'articulation ne sont pas progressifs mais brusques et qu’ils peuvent varier d’un locuteur à un autre, d’une situation de communication à une autre et/ou d’une langue à l’autre.

Notes
42.

L’objet de l’étude était de vérifier l’hypothèse selon laquelle une voyelle est plus brève en syllabe fermée qu’en syllabe ouverte (‘closed syllable vowel shortening rule’ (Maddieson, 1986). Les types d’oppositions utilisées sont CaCCaCa-CaCaCa, CuCCiCa-CuCiCa et CaaCaC-CaaCCaC, ainsi les cycles testés pour les voyelles sont : VC, VCC, VVC, VVCC.