II.1.1.Les marques du rythme

Conformément à la théorie de l’analyse des scènes auditives, le groupement auditif précède généralement l’extraction ou le calcul des propriétés ou attributs perceptifs. Ainsi, un brusque changement dans l’intensité d’un son permet de déduire l’adjonction d’un second son. Au contraire, si l’augmentation d’intensité se fait continûment, l’oreille humaine ne perçoit qu’une seule source sonore qui varie 32 .

Le rythme pourrait être marqué par les différences de certains paramètres acoustiques, comme la F0, ou l’amplitude. Le système auditif traite une transformation soudaine des propriétés acoustiques comme le début d’un nouveau signal. Quelques règles ont été décrites par A.S. Bregman (1994) pour expliquer la détection des événements sonores dans un flot continu, événements dont la succession donnerait naissance au rythme.

Régularité 1 : il est extrêmement rare que des sons n’ayant aucun rapport entre eux démarrent et s’arrêtent exactement au même moment.

Régularité 2 : Progression de la transformation 33  :

  • Les propriétés d’un son isolé tendent à se modifier de façon continue et lentement.
  • Les propriétés d’une séquence de sons issues de la même source tendent à se modifier lentement.

Régularité 3 : Lorsqu’un corps sonore vibre à une période répétée, ses vibrations donnent naissance à un pattern acoustique dont les fréquences des composants sont des multiples d’une même fréquence fondamentale. Effectivement, l’identité des sons est mieux perçue lorsque leurs harmoniques correspondent à deux fréquences fondamentales distinctes.

Régularité 4 : La plupart des modifications qui surviennent dans un signal acoustique affecteront tous les composants du son résultant de manière identique et simultanée.

Lorsque deux événements sonores sont perçus comme distincts, le système de traitement auditif crée l’illusion d’une pause sonore. L’expérience réalisée par Thorpe et Trehub (1989) en est une bonne illustration. Des motifs sont structurés de telle sorte que les trois premiers sons sont identiques. Les trois sons suivants possèdent soit une fréquence fondamentale, soit une structure spectrale (onde en scie ou sinusoïdale) soit une intensité différente (structure XXXOOO). Une pause peut-être insérée soit entre le troisième et quatrième son (XXX_OOO), soit entre le cinquième et sixième (XXXO_OO). Dans ce dernier cas, la pause insérée entre en conflit avec les autres indices qui permettent de découper le signal en deux flux distincts, ce qui entraîne dans ce cas un changement à l’intérieur d’un groupe. Les nourrissons détectent les modifications temporelles survenant dans un groupe mais pas celles entre les groupes, ce qui indique qu’ils regroupent le motif original de sons. Tout se passe donc comme si la perception du changement était équivalente à l’insertion d’une pause. Le motif désorganisant le motif standard (de 3-3 vers 4-2) est remarqué, contrairement au changement conservant cette structure (3-3 dans les deux cas). Les adultes perçoivent également la durée d’un silence situé entre deux groupes. Cette illusion de pause entre les groupes sonores est analogue à l’illusion de pauses entre les mots. Plus la discontinuité est grande, moins la détection des pauses entre les groupes est précise.

Chacune de ses règles fait appel à un certain nombre de paramètres acoustiques, dont les variations influent sur la perception du stimulus sonore. Ainsi, van Noorden (1975) examine la ségrégation des trilles. Les sujets doivent suivre le rythme de sons alternativement grave ou aigu (trille). Il étudie l’attention partagée entre les deux fréquences différentes et l’attention sélective au son grave uniquement. Les auditeurs ont des difficultés pour entendre un trille cohérent, lorsque la cadence et la séparation fréquentielle augmentent. En revanche, l’écoute des sons graves est possible pour de très petites différences fréquentielles. La différenciation entre deux événements sonores dépend au moins de la fréquence absolue de chacun des tons, et de l’intervalle fréquentiel entre les deux tons. Pour l’instant, il semble difficile de dire si ces règles et leurs seuils de distinction pour les paramètres associés sont innés ou issus d’une habituation à l’environnement.

Notes
32.

L’œuvre musicale de Rimsky-Korsakov intitulée le vol du bourdon permet d’illustrer la nature de ce processus : les notes s’y suivent à une vitesse si rapide qu’elles forment un flux sonore unique et ne peuvent pas être entendues séparément.

33.

Par exemple la séquence de sons aigus (A) et graves (G) … A A G A G G A G A A G G A G … formera les 2 flux suivants : … A A _ A _ _ A _ A A _ _ A _ … et … _ _ G _ G G _ G _ _ G G _ G … Les tirets symbolisent la présence de silences dans chacun des flux.