Rythme et théories phonologiques

Rappelons que la phonologie métrique s’organise autour d’une idée centrale selon laquelle la structure phonologique d’un énoncé ne se limite pas à une suite linéaire d’éléments enchaînés, mais relève d’une organisation hiérarchique. Par exemple, l’accent n’est plus considéré comme un trait distinctif (comme c’est le cas dans la phonologie générative classique), mais comme le produit d’un réseau de relations hiérarchiques fondées sur la syllabe (Liberman et Prince, 1977).

D’après la phonologie plurilinéaire, chaque unité prosodique exhibe des caractéristiques rythmiques que ce soit au niveau de la syllabe, du mot, du syntagme ou de la phrase. Par exemple, d'un point de vue prosodique, nous avons vu dans le chapitre précédent que le mot est constitué d'un ensemble de pieds. Les mots sont ensuite groupés en syntagmes phonologiques (Selkirk, 1984), syntagmes qui ne sont pas nécessairement en concordance avec les syntagmes syntaxiques. Ensuite, les syntagmes phonologiques sont groupés en syntagmes intonatifs, qui se combinent eux mêmes pour former une phrase. Selon ces principes, les partisans de la théorie plurilinéaire proposent diverses hiérarchies pour exprimer au mieux les structures prosodiques vs. rythmiques.

Les phénomènes de hiérarchisation accentuelle sont alors interprétables comme le reflet d’une structuration rythmique sous-jacente qui organise les unités linguistiques, telles que les syllabes, les mots, les syntagmes, etc. Ainsi, le rythme est marqué par la hiérarchisation de différentes composantes prosodiques dont les deux facteurs principaux sont l’accentuation et la syllabe.

Rappelons que la phonologie plurilinéaire utilise deux types de formalisation pour représenter l’organisation prosodique en général et par la suite celle du rythme : l’arbre métrique et la grille métrique (e.g. Figure 14). Le modèle de l’arbre métrique consiste à représenter sous une forme arborescente, comparable à celle utilisée pour la syntaxe, la structure hiérarchique des niveaux relatifs de proéminence : ‘weak’ et ‘strong’ (fort F et faible f). Selkirk (1984) a proposé quant à elle le modèle de la grille métrique représentant les niveaux de proéminence par des colonnes d’astérisques (ou de x) permettant ainsi d’assigner des positions fortes et faibles aux syllabes. La plupart des linguistes se basent sur ces deux formalisations pour décrire le rythme mais les approches dans la représentation des différents niveaux de l’hiérarchisation prosodiques (syllabe, accent, pieds, mot prosodique, syntagme, etc.).

Figure 14. Exemple de représentation rythmique de l’énoncé : « Frédéric # il a trouvé scandaleux # que son frère # ait dilapidé l’héritage de ses parents ## » : a) sous la forme d’un arbre métrique (partie supérieure), b) sous la forme d’une grille métrique étiquetée (partie inférieure). S = Syllabe, f = battement faible, F = battement fort, P = pied, M = mesure, HM = hyper-mesure (empruntée à Di Cristo, 2003)

Di Cristo (2003) considère que la phonologie métrique ne fait pas de distinction tranchée entre métrique et rythme, car elle emprunte certains concepts conventionnels de la métrique poétique et musicale pour les appliquer à la description phonologique du rythme linguistique. La notion de l’eurythmie’ ou de l’euphonie rythmique (Hayes, 1984 ; Prince, 1983 ; Selkirk, 1984), est en effet, l’un des principaux concepts de la théorie. Ce concept est basé sur un phénomène d’alternance : les battements forts et faibles doivent alterner à tous les niveaux de la structure rythmique de façon à éviter la succession de deux battements fort ‘clashes’ ou une suite de battements faibles ‘lapses’ (Nespor et Vogel 1986).

Le rythme est restitué de façon partielle par les différents modèles phonologiques. Les modèles existant à ce jour proposent une multitude de facteurs marquant la structuration rythmique, mais l’attention qui leur ait accordé est très variable. Certains linguistes considèrent qu’un seul facteur comme la différence de durée, de hauteur, d’intensité, ou d’accent, permet de fonder le rythme de la parole. D’autres pensent que la rythmicité est l’interaction entre plusieurs facteurs, en supposant parfois que des éléments syntaxiques et sémantiques participent également à la structure rythmique du discours.

L’une des principales critiques que l’on peut faire à ces modèles réside dans leur capacité limitée à décrire le rythme de la parole en tant qu’organisation temporelle ; autrement dit, leur négligence plus ou moins marquée du facteur de durée. Zellner (1996, 1998, 2001) affirme que la plupart des modèles prosodiques actuels (citant par exemple pour le français : Beaugendre, 1994; Di Cristo et Hirst, 1994; Jun et Fougeron, 1995; Mertens, 1990) ne fournissent pas de véritables représentations de la structure temporelle de la parole. Par voie de conséquence, ils réduisent la structure temporelle de la parole à son organisation accentuelle.

Zellner (2001) considère que ces modèles sont figés et rigides puisqu’ils ne tiennent pas compte du facteur de la variabilité du débit et des pauses. Par exemple, les modèles actuels mettent en avant que les frontières prosodiques mineures sont réalisées par un allongement systématique de la syllabe finale et ce, quel que soit le débit. Or, les analyses empiriques de Zellner (1998) ont montré que cet allongement est variable selon que le débit est lent ou rapide. L’auteur suggère donc qu’un modèle prosodique devrait pouvoir rendre compte des différentes stratégies de marquage temporel des frontières prosodiques des groupes mineurs ou majeurs en fonction du débit.

Par ailleurs, Tajima (1998) critique l’imprécision de la phonologie métrique qui fait abstraction de la temporalité :

‘« metrical theory has reduced time to nothing more than linear precedence of discrete grid columns, making an implicit claim that serial order of relatively strong and weak elements is all that matters in linguistic rhythm» (p.11)’

Cette imprécision se manifeste particulièrement dans les études phonétiques, notamment lors de l’interprétation des contrastes : fort-faible. La notion de ‘saillance’ qui définit le rythme manque de clarté et n’a pas de manifestation précise sur le signal de la parole « ‘ Overall, it appears that phonetic studies have generally not found a straightforward relationship between observable parameters of speech signal and the impressionistic of rhythm that are encoded in metrical representations and traditional poetry » ’(Tajima 1998, p. 11).

Zellner (2001) considère que la phonologie métrique avec sa représentation binaire (fort/faible) du rythme ne rend pas suffisamment compte des différents aspects de ce ’ ‘ phénomène complexe (notamment sa structure dynamique) en donnant une vision assez restreinte de la rythmicité d’une langue. Elle argumente que la relation de proéminence n’est pas le seul déterminant de la rythmicité linguistique en donnant l’exemple des synthétiseurs de parole qui paraissent souvent peu naturels ou mécaniques du fait d’un nombre excessif d’éléments tonaux saillants, et d’un manque de variation temporelle et dynamique.

Ainsi, plusieurs auteurs ont critiqué les modèles de la représentation phonologique du rythme, notamment leur manque de clarté et leur omission du paramètre de la temporalité, considéré comme essentiel pour l’organisation rythmique. L’échec de l’isochronie, comme théorie basée sur les prédictions phonologiques, a également incité plusieurs linguistes à se focaliser sur la recherche des paramètres phonétiques représentant mieux le phénomène de temporalité sur le signal de la parole.

La question de la temporalité nous conduit à l’hypothèse de l’horloge interne, qui définit le rythme par rapport à la perception humaine de la temporalité ; il sera donc utile dans la section qui suit d’examiner cette notion dans les domaines de la biologie et de la psychologie. Nous essaierons à travers ce bref aperçu de la littérature de répondre aux questions suivantes : d’où vient qu’un phénomène perçu est considéré comme long ou court, lent ou rapide et à quelle échelle de temps se réfère-t-on?