3.5. Que représentent le « what » et le « where » au niveau du système auditif ?

La notion de « what » et « where » fut en premier lieu appliquée au système visuel. En effet, depuis maintenant plus de vingt ans, deux schémas de traitement ont été décrits au niveau du système visuel : la voie dorsale et la voie ventrale (Ettlinger, 1990). Ces deux voies sont responsable de l’identification d’un objet : le « what » et de sa localisation : le « where », cette séparation en deux voies ne se limitant pas à la rétine, mais se prolongeant jusqu’au cortex visuel. Une dichotomie fonctionnelle similaire fut proposée pour le système auditif (Rauschecker, 1998), avec des axes de recherche similaires, à savoir la localisation ou la composition d’un « objet » auditif (Romanski et al, 1999 ; Kaas & Hackett, 1999).

Bien que les voies du « what » et du « where » soient toutes deux impliquées dans la perception de la parole, il existe une certaine tendance à reléguer la perception de la localisation d’un objet au niveau de la voie du « where », tandis que l’identité de l’objet auditif est attribuée au « what ». Belin et Zatorre (2000) ont proposé un rôle de la voie du « where » dans la localisation ou les mouvements dans l’espace ainsi que sur une variation spectrale : le « where » en fréquence. Ils dessinèrent un parallèle entre les mouvements de la lumière à travers le champ visuel et le mouvement des stimulations acoustiques à travers la carte fréquentielle de la membrane basilaire dans la cochlée. Cela pose les fondations de la distinction voyelle, consonne et phonème composant le message.

La littérature sur la perception de la parole, nous propose elle aussi une dichotomie quant aux caractéristiques acoustiques de la parole. Le modèle source versus filtre décrit la vibration des cordes vocales comme la source tandis que le tractus vocal, la cavité orale, la langue, les lèvres et les joues seraient à l’origine du filtre (Fant, 1960). De manière schématique, les voyelles et les consonnes, c'est-à-dire le contenu linguistique, dépendrait de la formes du filtre reposeraient sur celui-ci, tandis que les informations non linguistiques (telles que le ton de la voix, sexe du locuteur, état émotionnel…), reposeraient sur les caractéristiques de la source.

Le filtre serait assimilé à la voie du « where », tandis que la source dépendrait de la voie du « what ».

L’étude des PEASP a permis de mettre en évidence l’encodage de la source (F0) et du filtre (onset, onde O, et transition formantique), caractéristiques contenues dans le signal de parole, proposant ainsi l’idée que les voies de traitement du “what” et du “where” (Belin & Zatorre, 2000; Kaas & Hackett, 1999; Romanski et al., 1999) pourraient avoir une origine sous corticale, au niveau du tronc cérébral (Kraus & Nicol, 2005) (Fig 13).

D’un point de vue clinique, il a été montré que la représentation du filtre au niveau du tronc cérébral puisse être altérée chez certaines personnes présentant des troubles d’apprentissage, tels que la dyslexie (Hornickel et al, 2009; Banai et al, 2009; Banai et al, 2007; Cunningham et al, 2001; King et al, 2002; Wible et al, 2004). A contrario, une atteinte préférentielle de la voie du traitement du « what » est retrouvée chez les enfants présentant des troubles d’ordre autistique (Russo et al, 2008).

Figure 13: Tirée de Kraus et al, 2005. Représentation schématique du tronc cérébral sous la forme d’un médiateur entre propriétés acoustiques du signal et traitement cortical.
Figure 13: Tirée de Kraus et al, 2005. Représentation schématique du tronc cérébral sous la forme d’un médiateur entre propriétés acoustiques du signal et traitement cortical.

En bas : un locuteur encode ses pensées en sons audibles par l’utilisation de son tractus vocal qui va filtrer le son émis par la vibration des cordes vocales (la source).
Au milieu : le son est transformé en signal électrique au niveau de la cochlée du sujet écoutant le message, le nerf auditif transmet le signal au tronc cérébral où les composants de la source et du filtre du signal sont préservés. Cette préservation étant quantifiable dans les différentes réponses des PEASP. La source correspond aux mesures de F0, tandis que le filtre est représenté par l’onset, l’offset et F1. La source est résistante au bruit et au taux de stimulation et n’est pas perturbée chez les sujets présentant des troubles de l’apprentissage, tandis que le filtre y est vulnérable.
En haut: séparation des composants de la parole dans le tronc cérébral, comme précurseurs des voies what et where corticale.