1.5.3.La perception de la parole dans le bruit

Dans un environnement bruyant, il est possible pour un être humain de parvenir à entendre une voix parmi de nombreuses voix, donc de suivre une conversation : c’est l’effet cocktail party (Cherry, 1953). L'effet cocktail party correspond à la possibilité de détecter un flux de parole parmi plusieurs flux simultanés. Dans une scène auditive contenant plusieurs sources sonores, nous sommes capables de sélectionner un signal sonore qui nous intéresse. Il existe un effet de l’attention sur la perception de la parole. Dans la modalité visuelle, Posner (1995) a montré un effet similaire. Cette ségrégation de flux auditifs ou d’objets auditifs, selon Bregman (1990), s’effectue à l’aide de règles de rapprochement de certaines sources sonores selon certaines conditions (fréquence, durée, amplitude, proximité). Bregman (1990) considère que la constitution des flux s’effectuerait à deux niveaux. Un bas niveau correspondant aux propriétés intrinsèques des sons (fréquence, durée, amplitude) permettant selon les lois de la Gestalt de rapprocher des sources sonores (Ellis, 1974). Un plus haut niveau, spécifique au type d’information (parole ou musique) correspondant au schéma descendant et à l’influence des connaissances.

La perception de la parole dans le bruit consiste à séparer le signal acoustique pertinent du bruit. Notre système auditif sous le contrôle cérébral applique des stratégies de ségrégation qui utilisent des règles précises pour distinguer les différents flux de la scène auditive. La dégradation du signal acoustique sur la dimension temporelle est tout à fait différente. Le signal de parole n’est pas masqué, il est intrinsèquement modifié. La dynamique temporelle peut être totalement bouleversée, comme par exemple dans les expériences de parole inversée.