Introduction Générale

La perception de la parole est un phénomène complexe qui nécessite des étapes particulières de réception, d’intégration et d’analyse du signal acoustique. La reconnaissance des mots parlés nécessite plusieurs étapes : la première étape consiste à segmenter le signal acoustique et à catégoriser les sons de la parole. Une représentation phonémique des sons de la parole est ainsi établie. Le problème majeur dans l’établissement de ces correspondances entre l’entrée auditive et les représentations phonémiques réside dans la variabilité du signal acoustique. Cette variabilité peut être soit de nature intrinsèque, soit de nature extrinsèque. Par exemple, des modulations du signal peuvent provenir lors d’un changement de débit du locuteur impliquant des phénomènes de coarticulation et d’assimilation. Le signal de parole peut également être affecté par le bruit environnant. Ces différentes sources de variabilité peuvent donc engendrer une baisse d’intelligibilité et de compréhension de la parole. Cependant, malgré cette variabilité importante, nous sommes capables de maintenir une bonne intelligibilité du signal de parole. Même si le signal acoustique de la parole est dégradé, le signal reste intelligible pour l’auditeur. Nous avons donc la capacité de normaliser les multiples formes que peuvent prendre un même message. Cette normalisation dépend du degré de détérioration du signal et de la nature des indices acoustiques altérés.

Le but de ce travail est donc d’examiner l’intelligibilité de la parole dans des conditions d’écoute dégradée. Ces conditions correspondent à une réalité écologique dans la vie de tous les jours. En effet, la communication se fait rarement dans le silence total ou à débit constant. Dans cette thèse, nous nous focalisons sur les modifications de la dynamique temporelle de la parole. Lorsque la parole est compressée temporellement, l’organisation temporelle du signal de parole va être modifiée, ce qui va ralentir ou empêcher l’extraction des indices acoustiques et donc la mise en correspondance avec les représentations cognitives phonémiques. Il apparaît, cependant, que nous sommes capables de percevoir et comprendre un message de parole prononcé très rapidement. Mais dans le cas de pathologie présentant un trouble de perception de la parole, comme la dyslexie, nous nous poserons la question de l’origine cognitive de ce trouble.

Nous cherchons donc à décrire les mécanismes de substitution ou de normalisation qui permettent une bonne intelligibilité du signal de parole dégradé. Ces mécanismes peuvent s’appuyer sur des connaissances lexicales ce qui correspond à des effets top-down mais ils peuvent également utiliser les informations du signal lui-même afin de remplacer l’information perdue. L’un des différents niveaux de représentation du signal acoustique correspond aux traits acoustico-phonétiques qui sont spécifiques de la parole. Ces traits peuvent être redondants et certains sont plus importants que d’autres dans l’identification du signal de parole. L’intérêt d’étudier la représentation du signal de parole à ce niveau précisément est que nous pouvons faire la correspondance entre les caractéristiques acoustiques et articulatoires de la parole.

Nous allons nous intéresser particulièrement à la dimension temporelle de deux traits acoustico-phonétiques contenus dans le signal de parole : le voisement et les transitions des formants. Les mesures acoustiques des indices manipulés correspondent à deux traits distinctifs qui permettent d’identifier le signal de parole. Nous explorons le poids relatif des indices acoustiques dans la perception de la parole et leur résistance à la manipulation temporelle chez des adultes normo-lecteurs. Chez le normo-lecteur, nous explorons les mécanismes et les informations nécessaires qui permettent de maintenir une bonne intelligibilité du signal de parole dans des conditions temporelles rapides. Plus nous connaîtrons nos capacités de réparation du signal dégradé et notamment les indices importants dans cette identification, plus nous pourrons envisager d’améliorer la compréhension de personnes ayant des troubles auditifs. Les troubles de perception de la parole sont présents également dans d’autres pathologies, comme la dyslexie. La sensibilité perceptive vis-à-vis de ces deux indices acoustiques sera donc également étudiée chez des dyslexiques adultes. Ces expériences visent à mieux cibler les difficultés perceptives des dyslexiques lors de la perception de la parole et donc d’agir précisément sur leurs points faibles par des méthodes d’entraînement adaptées.

Les objectifs principaux de cette thèse sont donc, premièrement, d’examiner le traitement du signal de parole lorsque la dynamique temporelle est compressée, nous observerons les effets sur l’intelligibilité de la parole dans le but de mettre en évidence des mécanismes de substitution. Et deuxièmement, nous nous focaliserons sur la description de la nature et du rôle relatif de traits acoustiques indispensables à une bonne intelligibilité de la parole. L’altération temporelle des indices acoustiques permettra de mettre en évidence les traits pertinents et donc le poids de chaque indice dans l’intelligibilité du signal. L’étude chez les sujets normo-lecteurs sera suivie d’une étude comparative avec un groupe de dyslexiques adultes. Puis, d’une étude plus approfondie du fonctionnement du système auditif descendant des dyslexiques adultes afin d’expliquer leur déficit de traitement auditif temporel de la parole.

Dans le Chapitre 1, les principales notions théoriques nécessaires à une bonne analyse des expériences faites dans cette thèse, seront abordées. Tout d’abord, je présenterai les problèmes liés à la perception de la parole, notamment, ceux liés à la variabilité du signal de parole. Le signal acoustique ne présente pas ou peu d’invariants, il est donc difficile de l’identifier facilement. La segmentation du signal de parole est un problème mais des indices existent pour faciliter la coupure entre les mots. La notion de perception catégorielle sera également abordée. Ces différentes notions entrent en jeu lors de l’évaluation de l’intelligibilité du signal de parole. Puis, je ferai un bref rappel sur la production des sons de parole de la langue française, en particulier les consonnes occlusives qui seront l’objet de nos stimuli. Je m’arrêterai également sur les unités distinctives du signal : les phonèmes. Plus particulièrement, je m’attarderai sur la notion de trait distinctif et notamment, sur deux traits phonétiques spécifiques : le voisement et le lieu d’articulation. Ces deux traits acoustiques seront les principaux protagonistes de nos expériences. Ensuite, je présenterai les différents modèles psycholinguistiques de reconnaissance des mots parlés. Puis, un large aperçu des études portant sur la compression temporelle de la parole sera développé. Pour clore ce chapitre théorique, je présenterai, les différents niveaux de traitement de l’information sonore. Le système auditif périphérique et central ainsi que les aires cérébrales impliquées dans le traitement de la perception de la parole. Lors de cette ascension vers les aires cérébrales, un codage temporel et fréquentiel du signal est effectué. La dimension temporelle est alors traitée séparément de la dimension fréquentielle. La dimension temporelle est primordiale pour une bonne intelligibilité de la parole. Dans mes expériences, j’utiliserai de la parole naturelle compressée temporellement, par synthèse. Ce premier chapitre expose les différents thèmes traités dans cette thèse. Les quatre chapitres suivants comporteront tous une partie expérimentale.

Dans le Chapitre 2, j’examinerai les effets de la compression temporelle d’indices acoustiques sur l’intelligibilité de la parole. Quatre expériences seront présentées : une première portant uniquement sur la réduction de la durée du voisement (Expérience 1), une seconde portant seulement sur la compression de la durée des transitions formantiques (Expérience 2), une troisième dans laquelle les durées des deux indices acoustiques sont réduits en même temps (Expérience 3) et une quatrième où le signal entier est compressé de manière homogène (Expérience 4). Je montre que la modification temporelle a un effet sur l’intelligibilité de la parole et que les deux indices acoustiques sont traités différemment. L’intelligibilité du signal de parole varie selon le degré de compression et selon la nature du trait phonétique manipulé. Des phénomènes de substitution ou de remplacement de l’information manquante sont mis en évidence. Une analyse acoustique est également présentée sur les durées des deux indices acoustiques ainsi que sur la pente des transitions. Des corrélations entre les performances d’identification auditive des stimuli et la durée des indices acoustiques ont été obtenues. Il semblerait que la durée du voisement soit un indice temporel pertinent dans l’intelligibilité de la parole alors que ce n’est pas tant la durée des transitions qui est importante mais les changements fréquentiels rapides (i.e. la pente).

Dans le Chapitre 3, j’approfondis les résultats obtenus dans le Chapitre 2 dans l’Expérience 3. Une forte variabilité interindividuelle a en effet été mise en évidence, correspondant à une très bonne identification de la parole par une partie des participants alors que d’autres présentaient plus de difficultés. Par conséquent, dans ce chapitre, je me suis arrêtée sur les raisons possibles de cette variabilité interindividuelle. Au préalable, une partie théorique expose nos axes de recherche sur, premièrement une auditive et, deuxièmement, une hypothèse phonologique pouvant expliquer cette variabilité entre les individus. Nous évaluerons donc l’audition et les capacités en lecture de nos participants. De plus, pour présenter le lien entre la perception de la parole et la lecture, nous décrirons des modèles de reconnaissance de mots en lecture qui laissent une place importante à la phonologie. Dans la partie expérimentale, j’ai tout d’abord exploré le domaine auditif mais sans montrer de différences significatives entre les participants donc l’hypothèse d’un corrélat auditif n’a pas été validée. Par contre, j’ai mis en évidence une corrélation entre les performances d’identification auditive de la parole compressée (Expérience 3) et les capacités de lecture des participants. Les participants avec de mauvais taux d’identification de la parole compressée étaient de mauvais lecteurs, en comparaison à l’autre groupe qui avaient de bonnes performances d’identification et qui étaient de très bons lecteurs. La différence entre les deux groupes porte notamment sur l’étape de conversion des graphèmes en phonèmes qui parait déficientes chez les mauvais lecteurs et donc chez les mauvais participants à l’Expérience 3. Ce chapitre m’a conduit directement au parallèle avec la dyslexie.

Le Chapitre 4 découle donc directement des chapitres précédents. Tout d’abord, une partie théorique est développée dans le but de fournir une définition et une description de la dyslexie développementale. Je discute également des différentes théories actuelles sur les mécanismes cognitifs responsables de la dyslexie développementale. Dans cette étude, je fais l’hypothèse d’un déficit de traitement auditif temporel du signal de la parole chez les dyslexiques adultes. Comme pour le Chapitre 1, les Expériences 1 et 2 sont reprises avec des participants dyslexiques adultes. Leurs résultats d’identification de la parole compressée sont comparés à un groupe contrôle d’adultes experts en lecture. Les dyslexiques présentent un déficit de traitement auditif temporel des indices acoustiques, dans la condition de parole naturelle et encore plus lorsque la durée des indices diminuent. Ils sont plus sensibles au contraste voisé/non voisé (Expérience 1) qu’à celui bilabiale/alvéolaire (Expérience 2). Ils présentent un traitement différentiel des deux traits phonétiques. Les dyslexiques sont plus sensibles à la réduction de durée du voisement qu’à la réduction temporelle de la durée des transitions. Cependant, ils sont très sensibles aux changements fréquentiels rapides de ces transitions (i.e. la pente). Un déficit de traitement auditif temporel du signal de parole est alors montré chez les dyslexiques adultes.

Dans le Chapitre 5, dans le but d’appuyer les précédents résultats d’un déficit auditif de traitement temporel chez les dyslexiques adultes, j’ai exploré le système auditif de ces participants à la recherche d’une anatomie et/ou d’un fonctionnement différents du système auditif pouvant expliquer leur déficit de traitement temporel du signal de parole. Une partie théorique ouvre le chapitre sur les voies auditives descendantes et plus précisément, sur le système efférent olivocochléaire médian (SEOCM). Des études portant sur la perception de la parole dans le bruit ont déjà mis en évidence l’implication du SEOCM dans cette perception. La question qui est donc posée ici est de savoir si le SEOCM est également impliqué dans la perception de la parole compressée et si un déficit de traitement auditif temporel de la parole est corrélé à un SEOCM défaillant. Je présente ensuite la méthode d’enregistrement des otoémissions acoustiques et de l’évaluation du SEOCM. Puis, je m’arrête sur la notion de latéralisation cérébrale et sur les phénomènes de changement d’asymétrie centrale auditive. Ces deux points seront explorés chez nos dyslexiques adultes comparés à un groupe contrôle. Le résultat le plus marquant est que notre groupe de dyslexiques adultes se divisent en deux sous-groupes avec une asymétrie centrale auditive inversée. La moitié présente une asymétrie à droite et l’autre moitié à gauche. Des corrélations entre les différentes mesures auditives, les mesures psychométriques et les performances d’identification auditive aux Expériences 1 et 2, montrent que les deux sous-groupes ont un SEOCM défaillant lié à un déficit de traitement temporel ou fréquentiel du signal de parole. Deux voies compensatoires semblent se profiler chez nos dyslexiques adultes.

Dans le Chapitre 1 suivant, comme je l’ai annoncé précédemment, les principaux concepts théoriques vont vous être présentés, des problèmes de variabilité et de la notion de traits distinctifs au traitement temporel du signal de parole par le système auditif en passant par la production des sons de parole et la compression temporelle de la parole.