Le modèle de l’attention dynamique et les oscillateurs attentionnels

La prise en compte de la dimension temporelle et son intégration avec la dimension de hauteur pour expliquer les attentes perceptives est au cœur des travaux de Jones sur l’attention dynamique (1976, 1987; Jones & Boltz, 1989). Pour Jones, la perception de l’organisation temporelle est basée sur la variation de l’énergie attentionnelle des auditeurs. Les relations rythmiques et métriques entraînent une variation de l’attention allouée aux événements sonores, ce qui aboutit à la création de cycles attentionnels synchronisés avec la structure de la pièce de musique. La variation de l’énergie attentionnelle se ferait de manière cyclique, avec des pics d’énergie synchronisés sur les moments les plus saillants (dans la dimension de temps et dans la dimension de hauteur) de la pièce de musique. Jones a développé pour décrire ces moments le concept d’accent joint (joint accent structure, Jones, 1987 ; Jones & Boltz, 1989). Ce concept combine la dimension de hauteur et la dimension temporelle : les structures de hauteur et de temps créent différents types d’accents (par exemple : des accents liés au contour mélodique, à la hiérarchie tonale, au rythme, à la métrique), et la combinaison de ces accents crée un accent particulièrement fort, qui correspond à un pic d’énergie attentionnelle. La distribution de ces accents guide l’allocation de l’énergie attentionnelle, et par conséquent les attentes des auditeurs.

La théorie de Jones a été étendue aux pièces musicales à structure rythmique complexe par Large, mais en focalisant sur la dimension temporelle seulement (Large & Jones, 1999 ; Large & Palmer, 2002). Large décrit le suivi d’une structure rythmique complexe à l’aide d’oscillations attentionnelles non-linéaires qui se synchronisent aux périodicités des événements à différentes échelles de temps (Figure 1.2.11). La chronologie des attentes temporelles des auditeurs s’explique alors par l’existence d’oscillateurs attentionnels synchronisés sur différentes échelles de temps, dont les pics d’activité correspondraient à des maxima de ressources attentionnelles disponibles et donc à des laps de temps où les auditeurs seraient le plus à même de traiter un événement. La synchronisation des oscillateurs attentionnels sur la structure temporelle entendue permettrait à l’auditeur de diriger son attention dans le temps, et donc de développer des attentes temporelles (Large & Jones, 1999).

Figure 1.2.11. Attention dynamique et oscillateurs attentionnels. Les deux premières mesures de la séquence de la Figure 1.2.2 sont représentées au-dessus d’une courbe d’oscillations attentionnelles synchronisées sur les trois niveaux métriques de la séquence.
Figure 1.2.11. Attention dynamique et oscillateurs attentionnels. Les deux premières mesures de la séquence de la Figure 1.2.2 sont représentées au-dessus d’une courbe d’oscillations attentionnelles synchronisées sur les trois niveaux métriques de la séquence.

De nombreuses études expérimentales ont étudié l’influence conjointe de la dimension de hauteur et de la dimension temporelle sur la perception. Par exemple, Boltz (1989b) a manipulé les accents temporels et les accents liés à la hiérarchie tonale dans des mélodies dont les participants devaient juger le degré d’achèvement. Les mélodies finissaient sur une note plus ou moins importante dans la hiérarchie tonale : la tonique (le 1er degré, le plus important), la médiante (le 3ème degré, moins important), ou la note sensible (le 7ème degré, le moins important). Les accents temporels étaient manipulés de telle sorte qu’ils tombaient soit sur la dernière note de la mélodie, soit avant, soit après. Les résultats montrent un effet de la manipulation de la hiérarchie tonale : les mélodies étaient jugées d’autant plus achevées que leur note de fin était plus importante dans la hiérarchie tonale. Un effet de la manipulation temporelle était également observé : les mélodies étaient jugées plus achevées quand l’accent temporel tombait sur la dernière note que quand il tombait trop tard ou trop tôt (et elles étaient jugées plus achevées quand l’accent tombait trop tard que trop tôt). Enfin, une interaction entre les manipulations temporelles et de hauteur était observée : l’effet de la manipulation temporelle était plus grand sur les notes les moins importantes dans la hiérarchie tonale. La violation de l’accent joint (joint accent structure) entraînait des jugements d’achèvements plus bas que les violations séparées des accents de hauteur et de temps. Ceci plaide en faveur d’une interaction au niveau perceptif des dimensions de hauteur et de temps, et souligne l’importance d’intégrer les deux dimensions dans l’étude des attentes des auditeurs. Une interaction entre dimensions de hauteur et de temps a également été observée dans une tâche de mémoire (Boltz, 1991). Dans cette étude, des participants musiciens mémorisaient plus facilement des chansons traditionnelles non familières lorsque les notes de l’accord de tonique (i.e., le 1er, le 3ème, et le 5ème degré de la gamme) marquaient la fin des phrases mélodiques, mais seulement lorsque la présence de ces notes était soulignée par un patron concordant d’accents temporels. Ce résultat suggère que la convergence des accents de hauteur et de temps facilite la structuration perceptive et la mémorisation des mélodies.

Une influence conjointe des régularités de hauteur et de temps a aussi été observée avec des séquences d’accords. Schmuckler et Boltz (1994, Expérience 1) ont manipulé ces deux dimensions dans une étude où les participants écoutaient des mélodies jouées avec un accompagnement harmonique (une séquence de 4 accords) et devaient juger le degré de correspondance entre le dernier accord et ce à quoi ils s’attendaient compte tenu des trois accords précédents. Le dernier accord était tonalement relié, peu relié ou pas du tout relié au contexte. La périodicité temporelle des trois premiers accords était manipulée : ces accords étaient joués à intervalles réguliers ou non. Le moment d’apparition du dernier accord était également manipulé : soit son apparition était prédictible, dans le cas où les trois premiers accords étaient réguliers, car elle respectait cette régularité, soit son apparition était trop tôt ou trop tard par rapport à ce que la régularité des trois premiers accords (dans la condition où ils étaient réguliers) permettait de prédire. L’accord cible était jugé comme correspondant mieux aux attentes des participants lorsqu’il était tonalement relié que lorsqu’il l’était peu ou pas du tout, et quand il apparaissait au moment attendu que lorsqu’il apparaissait trop tôt ou trop tard. Toutefois, d’après les auteurs, le résultat le plus important est qu’une interaction était observée entre la manipulation de la fonction tonale (accord relié, peu relié, non relié), de la régularité des séquences (accords réguliers, irréguliers), et du moment d’apparition de l’accord cible (à temps, plus tôt, plus tard). Quand les accords du contexte étaient joués régulièrement, les jugements de concordance des accords cibles tonalement reliés variaient avec le moment d’apparition des cibles : les cibles apparaissant trop tôt étaient jugées moins appropriées que les cibles apparaissant à temps ou trop tard. Cet effet était spécifique aux cibles tonalement reliées et n’était pas observé pour les cibles peu reliées ou non reliées. À l’inverse, quand les accords du contexte n’étaient pas joués régulièrement, les jugements de concordance n’étaient pas influencés par le moment d’apparition de l’accord cible. Ce résultat souligne que la formation d’attentes est influencée à la fois par la tonalité et par la dimension temporelle. Les régularités temporelles des séquences entraînent le développement d’attentes qui, lorsqu’elles sont confirmées (i.e., lorsque l’accord attendu apparaît au bon moment), renforcent le caractère approprié de l’accord s’il est tonalement attendu. Cependant, le même accord peut aussi paraître moins approprié s’il apparaît plus tôt que ce que prédisent les attentes temporelles des auditeurs. Ces résultats sont cohérents avec les notions d’attention dynamique et d’oscillateurs attentionnels : les régularités temporelles entraîneraient un pic de ressources attentionnelles disponibles au moment attendu d’apparition de l’accord cible, de sorte que les participants seraient plus sensibles aux relations tonales à ce moment attendu que si cette attente temporelle est violée.

Toutes ces études suggèrent que les traitements de la hauteur et du temps sont interactifs. Pourtant, un nombre important d’études plaident plutôt pour une indépendance de ces traitements (Palmer & Krumhansl, 1987a et b ; Peretz & Kolinsky, 1993 ; Hyde & Peretz, 2004). Les travaux de thèse de Géraldine Lebrun-Guillaud (2006) suggèrent que l’interaction ou l’indépendance des dimensions de hauteur et de temps dépend du niveau de traitement considéré. Tillmann et Lebrun-Guillaud (2006) ont étudié le traitement des dimensions de hauteur et de temps dans des séquences d’accords avec deux types de tâches ; une tâche d’amorçage harmonique où les participants devaient juger le timbre du dernier accord des séquences (traitement local), et une tâche de jugement d’achèvement où les participants jugeaient la séquence dans sa globalité (traitement global). Leurs résultats montrent une indépendance des dimensions de hauteur et de temps pour la tâche d’amorçage, et une interaction pour la tâche de jugements d’achèvement. Leur interprétation est que les dimensions de hauteur et de temps seraient indépendantes aux niveaux de traitements les plus bas, et interagiraient à des stades de traitement demandant plus d’intégration des informations sensorielles (donc plutôt au niveau d’un traitement global que d’un traitement local). Deux autres études des mêmes auteurs, utilisant une tâche de mémoire (Lebrun-Guillaud & Tillmann, sous presse) et une tâche de détection d’irrégularité temporelle (Lebrun-Guillaud & Tillmann, 2007), corroborent l’hypothèse d’un traitement interactif de la hauteur et du temps dans le cadre d’un jugement global, faisant appel à des traitements intégratifs.

La théorie de l’attention dynamique de Jones et les études qu’elle a inspirées soulignent la nécessité d’intégrer les dimensions de hauteur et de temps pour l’étude des connaissances implicites des auditeurs et de leurs conséquences perceptives. La plupart des approches théoriques passées en revue dans cette partie 1.2 se sont cependant focalisés sur la dimension de hauteur, qui reste la dimension principale du système tonal (bâti sur la notion de tonalité). La plupart des études expérimentales partagent ce « biais » d’intérêt pour la dimension de hauteur, et le présent travail de thèse n’échappe pas à la règle puisqu’il ne traite que des attentes perceptives liées à la tonalité.

Ce travail de thèse se concentre sur les attentes cognitives liées aux connaissances tonales des auditeurs. Les études réalisées pendant cette thèse approfondissent deux problématiques, qui seront présentées dans la partie suivante (1.3). La première est la question de savoir si les attentes tonales sont d’origine cognitive (i.e., attentes descendantes, liées aux connaissances implicites) ou sensorielle (i.e., attentes ascendantes, liées aux propriétés acoustiques des stimuli). Cette problématique sera présentée au 1.3.1, et le Chapitre 2 apportera de nouveaux résultats expérimentaux qui plaident pour une origine cognitive des attentes tonales. La deuxième problématique concerne la nature des traitements cognitifs influencés par les attentes tonales. Cette problématique sera présentée au 1.3.2, et le Chapitre 3 montrera que les attentes tonales influencent le traitement précoce de la hauteur des notes.