II.2.1.Les marques du rythme

Plusieurs unités de la parole peuvent être candidates pour marquer la pulsation de la parole : les voyelles, la syllabe ou les accents. La durée de ces évènements peut aussi être considérée pour caractériser le rythme de la parole.

II.2.1.1.Les voyelles au cœur de la syllabe

Pour la parole comme pour la musique, le rythme peut être induit par la perception d’évènements réguliers. Le mouvement quasi-périodique de la mâchoire a donné très tôt un rôle prépondérant à la syllabe dans l’organisation rythmique de la parole (Fraisse, 1974). Mehler, Dupoux, Nazzi et Dehaene-Lambertz (1996) ont avancé l’idée que la perception des nourrissons est focalisée sur la voyelle 35 . Cette conception est soutenue par des remarques sur les propriétés acoustiques du signal de parole. Ainsi, la voyelle contient plus d’énergie, et possède une zone stable liée à son voisement. Les nouveau-nés se montrent plus attentifs aux voyelles qu’aux consonnes (Bertoncini et coll., 1988). Ils représenteraient la parole sous la forme d’une succession de voyelles, entrecoupés de bruits non analysés, les consonnes 36 .

Marcus (1975) propose un modèle de perception qui tient compte de cette périodicité. Les auditeurs sont capables d’ajuster l’intervalle de temps entre deux occurrences syllabiques (Voyelle vs Consonne-Voyelle) pour percevoir cette alternance comme isochrone. Il définit alors le centre de perception (ou Perceptual center) comme un point de repère psychoacoustique de la perception de la parole 37 (Morlec, 1997). Est-il possible de retrouver les voyelles (ou leur représentation partielle) à partir du signal de parole ?

Galvès, Garcia, Duarte et Galves (2003) suggèrent que les nourrissons utilisent des catégories grossières représentant les consonnes et les voyelles 38 . Ils introduisent donc une fonction de sonorité, qui reconnaît les motifs réguliers du signal acoustique à partir de l’entropie locale. Pellegrino (1998) définit également la voyelle à partir des basses fréquences. Le signal est d’abord prédécoupé en segments définis par des ruptures dans le signal 39 . Les voyelles sont alors identifiées à partir de l’énergie contenue dans les basses fréquences d’un spectrogramme.

En outre, la syllabe ne semble pas être le seul élément pouvant marquer un retour périodique dans la parole. Ainsi, le japonais voit son rythme lié à la mora (unité située entre la syllabe et le morphème ; Ladefoged, 1975).

Notes
35.

Modèle TIGRE : Time-Intensity Grid Representation.

36.

Cette hypothèse est à la base du travail effectué par F. Ramus dans sa thèse (1998).

37.

Ces repères se situent autour de l’établissement de la voyelle.

38.

Effectivement, le filtrage passe-bas simulant la prosodie, ne permet pas de retrouver très précisément les voyelles.

39.

Algorithme de divergence forward-backward (André-Obrecht, 1988).