2.1.Introduction

Dans ce second chapitre, nous explorons l’intelligibilité de la parole dans des conditions d’écoute difficile, notamment lors de modifications temporelles du signal de parole. Comme nous l’avons vu dans le Chapitre 1, le signal acoustique de la parole peut subir de nombreuses distorsions aussi bien par des facteurs extrinsèques lors de sa propagation dans le milieu environnant que par des facteurs intrinsèques au locuteur ou à l’auditeur. Le signal de parole comporte deux dimensions caractéristiques : la dimension spectrale et la dimension temporelle. La dynamique temporelle apparaît primordiale dans l’intégrité du signal de parole et par conséquent dans son identification et sa compréhension. Les modifications naturelles de débit du locuteur conduisent à une distorsion de la dimension temporelle du signal de parole. Lors d’une accélération de débit par exemple, des études en production ont mis en évidence des effets de coarticulation importants (e. g. Liberman, Cooper, Shankweiler, & Studdert-Kennedy, 1967). Comme nous l’avons vu dans le Chapitre 1, ce phénomène de coarticulation correspond à une réduction temporelle de certains traits acoustiques aux dépends d’autres traits. Les gestes articulatoires vont se réaliser en même temps et les informations vont se superposer. Un effet majeur de ce phénomène est d’améliorer la perception du signal de parole lors de conditions de débit rapide, en mettant l’accent sur certains traits primordiaux, comme c’est le cas pour les consonnes par rapport aux voyelles. Parmi les indices acoustiques qui composent le signal de parole, deux indices ont été largement étudiés pour leur rôle dans l’identification de la parole : le VOT et les Transitions Formantiques, plus particulièrement celle du second formant (TF2). La variation de durée des indices acoustiques est un point essentiel dans l’extraction et l’intégration temporelle du signal. En effet, la durée des indices peut être un des facteurs de discrimination des phonèmes. Un phonème est constitué de différents traits pertinents discriminants qui lui permettent d’être catégorisé. Nous nous intéresserons essentiellement à 4 des 6 consonnes occlusives orales [b d p t] du français. Le voisement permet de distinguer les occlusives non voisées [p t] des occlusives voisées [b d], alors que la transition du second formant permet d’identifier les occlusives selon leur lieu d’articulation : bilabial [b p] et alvéolaire [d t]. Dans le Chapitre 1, nous avons décrit les différences spectro-temporelles du signal acoustique des occlusives et des voyelles. Les occlusives sont constituées d’indices acoustiques courts et transitoires, ce qui devrait les rendre plus sensibles aux compressions temporelles que les voyelles qui ont une partie stable importante. Les caractéristiques acoustiques des phonèmes seront les principales informations disponibles, avec les informations syllabiques, pour l’identification des stimuli qui seront des pseudo-mots, donc dépourvus de représentations lexicales.