4. L’identification des pauses

La perception auditive des pauses (surtout vides) ne coïncide pas nécessairement avec leur identification au moyen d’analyses acoustiques (Drommel 1980: 228-229). Dans la pratique, bien que les pauses soient toujours des phénomènes acoustiques, elles sont parfois imperceptibles. R.H. Drommel distingue entre, d’une part, les pauses intrasegmentales et, d’autre part, les pauses intersegmentales. Les premières, qui sont très brèves, constituent une phase de la réalisation de certains phonèmes, dont les consonnes occlusives. La pause intrasegmentale, créée par l’occlusion du canal buccal, est inaudible, en ce sens qu’elle ne dure qu’une fraction de seconde ; il ne s’agit donc pas d’une pause « auditive » (« auditory pause »). En revanche, le degré d’audibilité d’une pause en position intersegmentale (c’est à dire, entre deux segments distincts de la chaîne parlée) est fonction de sa durée et du contexte. Selon Drommel, toutes les pauses sont donc acoustiques ; là où les pauses intrasegmentales ne sont pas audibles, les pauses intersegmentales peuvent l’être. Généralement, elles sont considérées comme telles si un certain pourcentage d’un groupe d’auditeurs-évaluateurs les perçoit (voir section 1 du présent chapitre). Par contre, l’identification des pauses acoustiques est basée sur une mesure objective.

L’analyse instrumentale du signal acoustique, tout en permettant le chronométrage des pauses à travers la visualisation d’un « oscillogramme », ne résoud pas entièrement ces problèmes de découpage de la chaîne parlée. En tout état de cause, indépendamment de ces limites, le choix de l’appareillage pour l’identification des pauses est fonction du degré de précision prévu. Les études phonétiques, dont l’unité de mesure est souvent la milliseconde, nécessitent une instrumentation de haute précision. L’appareillage nécessaire n’est généralement disponible que dans des laboratoires de phonétique, ou sous forme de logiciel « professionnel ». Il existe également des logiciels « non professionnels », qui mesurent des signaux acoustiques jusqu’au centième de seconde (voir ch 6, section 4.2).

L’étude acoustique des pauses inaudibles n’a guère d’intérêt en dehors d’une analyse phonétique très détaillée. En fait, les études du discours basées sur l’analyse acoustique ne considèrent généralement que les pauses situées entre des durées minimum et maximum. Le seuil en-dessous duquel les pauses vides peuvent être considérées comme intrasegmentales, comme dans la réalisation des consonnes occlusives, se situe généralement autour de 0,25 sec. (Towell, Hawkins et Bazergui 1996: 91). En ce qui concerne la durée maximum, la « crise de production » est en principe d’autant moins bien gérée qu’elle est longue. Toutefois, une durée de plusieurs secondes n’est pas en principe entièrement attribuable à des processus langagiers (Towell, Hawkins et Bazergui 1996: 91 ; Onnis 1999: 55-56). Pour cette raison, les recherches sur les pauses situent généralement autour de 3 secondes la durée maximum des pauses vides pertinentes à l’analyse des hésitations.

Les pauses sont dans certains cas difficiles à percevoir, ou à distinguer d’autres « variables temporelles ». La raison de cette difficulté est que la compréhension du langage se construit, dans une certaine mesure, à partir des attentes créées par le contexte, c’est à dire en « descendant » (« top down »), (Flores D’Arcais 1978 ; Chaudron & Richards 1986 ; Flowerdew 1994 ; Kurz 1996: 77-83).

L’effet de la compréhension « top-down » sur la perception des pauses se manifeste de différentes façons. Premièrement, D.S. Boomer & A.T. Dittmann (1962) constatent que la durée minimum, à partir de laquelle les pauses vides sont audibles, est fonction de leur position. Les auteurs observent que les pauses situées aux jonctions syntaxiques sont perceptibles à partir d’une durée de 0,5 - 1 seconde ; à l’intérieur d’un syntagme, le seuil d’audibilité est inférieur (autour de 0,2 sec.). Deuxièmement, l’attente d’une pause dans le contexte de la division grammaticale et conceptuelle entre deux propositions peut tromper l’auditeur. Parfois, il perçoit un silence là où il n’y en a pas (Baars 1980: 334). Troisièmement, une pause brève, mise en relief par une position insolite, peut sembler à l’auditeur relativement longue (Deese 1980: 69-84).

Bien que les pauses vides soient en principe moins perceptibles que les pauses pleines, il suffit un exemple simple pour illustrer la difficulté de séparer ces dernières d’un contexte sonore. Soit un son vocalique qui se prolonge et devient, sans solution de continuité, une pause pleine: « mais eh ça ce n’est pas un problème ». Dans un tel contexte, la difficulté consiste à démarquer exactement l’allongement vocalique (« drawl ») de « mais », par rapport à la pause suivante. De même, il est difficile de segmenter un voisement continu qui consiste en une pause pleine située entre deux voyelles (« mais eh un problème comme celui-ci »).

Les pauses vides également peuvent avoir des limites floues, qui rendent difficile leur démarcation précise dans des études phonétiques à grande échelle. Par exemple, la phase occlusive des consonnes comme « p » ne se sépare pas de façon nette par rapport à un silence précédent (« [pause] par exemple ». Il en va de même pour des pauses vides qui suivent des fricatives, par exemple dans un segment comme « des vis [pause] ». Dans ces cas-ci, la fin du sifflement qui caractérise la fricative est difficile à situer de façon précise.

La difficulté de démarcation des pauses vides n’est importante que dans le contexte d’une étude phonétique de haute précision. En revanche, la distinction parfois floue entre une pause pleine et un « drawl » pose des problèmes même dans une analyse relativement grossière (par ex., compte des pauses, sans chronométrage).