Conclusion Générale et Perspectives

Ce travail est une contribution à l’étude de la variation rythmique dans les parlers arabes. Notre hypothèse repose sur le fait que le rythme est un indice prosodique fiable pour la discrimination des variétés dialectales arabes compte tenu de leurs propriétés phonologiques différentes.

Nous avons consacré la première partie de ce travail à une revue de la littérature de l’histoire des parlers arabes, de la diversité des formes dialectales depuis l’époque ancienne et des principales classifications élaborées par la dialectologie traditionnelle. Nous avons montré que les indices de classification considérés sont, dans la plupart des cas, des traits distinctifs de type phonético-phonologique. Les différentes classifications et les études inter-dialectales nous amènent à identifier certains indices comme partiellement pertinents pour grouper les dialectes en zones géographiques selon des critères linguistiques. Parmi les indices, la distribution des voyelles dans l’espace acoustique ainsi que la réalisation de l’opposition de durée vocalique représentent des critères fiables de discrimination des parlers arabes et permettent une classification géographique. Par ailleurs, la littérature fait aussi apparaître que l’étude du système vocalique au niveau quantitatif (i.e. durée des voyelles) est liée à certaines propriétés prosodiques, telles que la structure syllabique et l’accent. Ces propriétés, selon la littérature caractérisent chacun des parlers arabes mais ne sont pas traitées dans des études inter-dialectales.

Pour évaluer la pertinence des deux composantes prosodiques qui sont la syllabe et l’accent, nous avons commencé dans un cadre théorique général à présenter les travaux portant sur leur rôle dans les langues en général et en arabe en particulier. Cette revue nous a permis de souligner la pertinence de ces deux paramètres dans l’organisation prosodique et rythmique. Par ailleurs, nous avons vu que dans les approches phonologiques, le rythme implique plusieurs niveaux d’analyse (i.e. more, syllabe, accent, pieds, mot prosodique, syntagme intonatif, etc.). Les phénomènes de hiérarchisation sont alors interprétables comme le reflet d’une structuration rythmique sous-jacente qui organise les unités linguistiques. Néanmoins, nous avons montré que cette représentation s’adapte difficilement aux études comparatives entre les langues puisque celles-ci ne présentent pas de la même manière les niveaux hiérarchiques. De même, la structure temporelle qui est congruente à la structure accentuelle n’est pas présentée explicitement dans les modèles phonologiques. Par exemple, nous avons vu que l’accent en arabe ne joue pas le même rôle qu’en anglais (ces deux langues sont pourtant traditionnellement considérées comme accentuelles) car d’un point de vue phonologique, l’accent en arabe n’a pas la valeur distinctive qui lui est attribuée en anglais, de même au niveau phonético-acoutique, il n’est pas déterminé selon la même hiérarchie des paramètres physiques (intensité, durée, F0).

Cette conception est confirmée dans le chapitre 3 portant sur la notion du rythme et sur sa fonction typologique. Dans cette partie, nous avons pu mettre en évidence l’impact du rythme sur la production et la perception de la parole dans les approches phonétiques, phonologiques et psycho-linguistiques. Les approches phonologiques, notamment la phonologie métrique, tend à imposer une certaine régularité à la notion de rythmicité que les études empiriques n’ont pas confirmée. Nous avons passé en revue l’historique des typologies rythmiques, dont la plus célèbre est celle de l’isochronie selon laquelle l’arabe et ses variétés dialectales sont classés dans une catégorie accentuelle discrète : ‘stress-timed language’.

La typologie rythmique avancée par l'hypothèse de l'isochronie, classant les langues dans des catégories absolues : langues syllabiques vs. accentuelles vs. moraïques, a été remise en question par l’absence de vérification empirique.

L'approche alternative réside en une théorie d’ordre plus phonético-phonologique du rythme, qui considère que l’étude du rythme de la parole ne consiste pas à décrire une régularité d’accent comme le suggère la théorie de l’isochronie, mais à décrire une structure temporelle qui intègre différents événements prosodiques contribuant à ce rythme. Le rythme ainsi résulte de la structure des syllabes qui composent la parole, et des phénomènes phonologiques qui influent sur cette structure.

Aussi avons-nous opté pour une approche du rythme élaborée par Dasher et Bolinger (1982) et Dauer (1983, 1987) qui ont mis en évidence les propriétés phonologiques typiquement associées aux différents types de rythme, dont les principales sont : la structure syllabique et la réduction vocalique auxquelles s’ajoute le rôle joué par l’accent.

Au niveau méthodologique, nous avons choisi d’appliquer deux modèles empiriques qui inspirés de cette approche : le modèle de Ramus (1999) et celui de Grabe (2000, 2002). Le premier a montré qu'il était possible de rendre compte empiriquement des classes de rythme, en mesurant les proportions des intervalles vocaliques et consonantiques par le biais d’une segmentation en consonnes et voyelles (i.e. ΔC/%V). Le modèle de Grabe (2000, 2002) considère les voyelles comme éléments caractérisant le rythme et propose des mesures de variabilités d’intervalles vocaliques et inter-vocaliques (i.e. rPVIV, rPVIC, nPVIV). Par ailleurs, nous avons également passé en revue un grand nombre de travaux récents utilisant les paramètres proposés dans les deux modèles pour comparer le rythme des langues ou des variétés de langues. Cette revue nous a permis de conclure qu’en fonction des langues étudiées, certains paramètres s’avèrent plus pertinents que d’autres pour distinguer les langues et/ou variétés de langues les unes par rapport aux autres.

Bien que les deux modèles aient le même objectif : la mise en place de corrélats acoustiques pour quantifier le rythme de la parole, nous avons exposé les études critiques révélant les faiblesses respectives de chacun de ces deux modèles, notamment pour ce qui touche à l’effet du débit et à la façon de classer les langues (i.e. en termes de catégories rythmiques vs. continuum).

Les différentes analyses acoustiques et statistiques que nous avons présentées dans la partie expérimentale nous ont permis de caractériser la distribution des parlers arabes selon des schémas rythmiques distincts regroupant 3 zones dialectales : Maghreb, Moyen-Orient et une zone intermédiaire représentant la Tunisie et l’Égypte. Par ailleurs, la distribution a montré que les parlers arabes ne se regroupent pas en une seule catégorie rythmique mais reflètent plutôt l’image d’un continuum dialectal le long duquel nous pouvons distinguer des sous-groupes correspondant aux 3 zones susmentionnées. Ce continuum qui s’étend d’Est en Ouest est conforme à la distribution géographique de ces dialectes.

Selon le modèle de Ramus (1999), nos résultats ont également montré que les deux paramètres liés à la structure syllabique sont fortement corrélés. Les différences de durée vocalique et de complexité syllabique semblent être les facteurs principaux responsables des différences dans la structure rythmique des parlers arabes. D’un point de vue typologique, ces résultats incitent à considérer qu’un large éventail du rythme rend plausible la présence d’un continuum rythmique où tous ces dialectes sont accentuels (stress-timed) mais à des degrés différents. Ces résultats corroborent ceux de Ramus (1999) par rapport à la corrélation négative entre les deux paramètres (ΔC et %V) et sont également compatibles avec la notion de continuum avancée par Dauer (1983, 1987).

Nos résultats sont également interprétables du point de vue phonologique : ils soutiennent certaines descriptions phonologiques des parlers arabes qui avancent que le processus d’élision vocalique semble responsable de la formation des agglomérats consonantiques complexes dans certains parlers comme le marocain et l’algérien, alors que les autres dialectes se caractérisent par la présence moins importante de groupements consonantiques. Le phénomène de réduction est aussi une propriété phonologique, qui, associée à la complexité syllabique, justifie notre perception d’un rythme plus saccadé pour les parlers maghrébins (i.e. marocain et algérien). Cette impression auditive de rythmes différents est selon nous liée à la tendance, dans tous les dialectes arabes, des syllabes lourdes à attirer l'accent. Puisque le poids syllabique varie graduellement dans ces dialectes, nous pourrions avoir l'impression de différentes sous-classes du rythme.

Les phénomènes de la durée vocalique et de la complexité syllabique semblent être les facteurs principaux de la discrimination entre le rytme du français et celui l’anglais. Nos résultats ont montré que l’anglais est proche des parlers du Maghreb tandis que les dialectes orientaux sont plutôt proches du français : langue qui se caractérise par une syllabation simple et une prédominance de syllabes ouvertes. On observe néanmoins, pour les parlers arabes une amplitude de variation plus importante que le couple français-anglais et que la distribution dans certains dialectes (i.e. moyen-orientaux) est différente de l’anglais. Nous constatons ainsi que la représentation des données quantitatives du rythme doit être intrinsèquement appréhendée comme multidimensionnelle.

La variabilité vocalique fait partie des caractéristiques rythmiques des langues accentuelles dont l’arabe fait partie. Au niveau phonologique, ce phénomène a été défini comme un indice de discrimination entre les dialectes arabes. Les paramètres liés à la variabilité vocalique (ΔV) ont permis de dégager d’autres groupements dialectaux : les parlers maghrébins avec l’égyptien d’un coté et les parlers jordaniens et libanais de l’autre. Cette répartition montre un comportement hybride pour les dialectes tunisiens et égyptiens (i.e. proches du Maghreb pour ΔV et proches du Moyen-orient pour ΔC). Ces résultats corroborent ceux de la littérature phonétique et phonologique des parlers en corrélant cette variable au phénomène de l’opposition quantitative des voyelles. Ce phénomène n’est pas réalisé uniformément dans les dialectes arabes modernes et la littérature suggère que le contraste voyelle longue/voyelle brève diminue en allant de l’Est vers l’Ouest de l’aire arabophone.

Afin de vérifier nos résultats nous avons utilisé la technique de PVI (i.e. brute rPVIV et normalisé nPVIV) proposée par Grabe (2000, 2002) pour l’évaluation du phénomène de la variabilité vocalique et de son impact sur le rythme des dialectes arabes. Par le biais de cette méthode, nous avons montré l’importance de la variabilité vocalique pour la discrimination inter-dialectale. En effet, les parlers arabes se regroupent en 3 sous-classes rythmiques représentant les trois zones géographiques : Maghreb, Moyen-Orient et la zone intermédiaire regroupant la Tunisie et l’Égypte. Ces résultats corroborent ceux mis en évidence par le modèle de Ramus et confirment l’idée selon laquelle la variabilité vocalique corrélée à la complexité de la structure syllabique pourrait aussi caractériser le rythme des parlers arabes.

Pour ce qui concerne la normalisation, la distribution des langues sur l’axe nPVIV est maintenue et semble correspondre à ce qui est attesté dans la littérature. Toutefois, nous avons constaté l’effet inverse pour les parlers arabes. En nous basant sur les mesures normalisées des intervalles vocaliques, nos résultats sont moins clairs que ceux obtenus avec le système de Ramus et les données brutes du PVI. Les groupes de dialectes ne sont pas aussi bien séparés les uns des autres. Ce résultat nous a conduit à poser l’hypothèse selon laquelle les dialectes arabes présenteraient des variation dont les effets occultés par la normalisation. Nous avons ainsi essayé d’évaluer dans quelle mesure cette neutralisation des différences entre les parlers arabes était due à un effet de débit. Nos résultats n’ont révélé aucune différence significative de débit entre les dialectes. Ainsi, nous avons constaté que la normalisation appliquée en nPVIV a un impact sur les différences entre les parlers arabes qui tiennent réellement à des caractéristiques linguistiques pertinentes.

Nous pouvons ainsi avancer l’idée que cela est peut être dû à un manque de robustesse vis-à-vis de la variabilité des paramètres employés pour normaliser le débit : ceux-ci semblent écraser des informations importantes par rapport à la variabilité des durées vocaliques. Les différentes analyses acoustiques et statistiques effectuées au cours du quatrième chapitre nous ont permis de caractériser la distribution des parlers arabes selon des schémas rythmiques qui diffèrent en fonction des paramètres utilisés. Parmi ces paramètres, les variables qui nous ont paru comme particulièrement discriminantes sont celles liées à la structure syllabique. Nous avons montré que la corrélation entre complexité syllabique et réduction vocalique permet une distinction pertinente entre 3 groupes dialectaux correspondant aux zones géographiques. Pour évaluer le pouvoir discriminant de ces deux propriétés, nous avons posé l’hypothèse selon laquelle la fréquence d’occurrence des différentes structures syllabiques, notamment en ce qui concerne la complexité relative des attaques et des codas, peut renseigner davantage sur la complexité rapportée par les paramètres du rythme.

Cette nouvelle hypothèse est en accord avec l’approche du rythme avancée par Dauer (1983, 1987) pour qui plus une langue a des syllabes complexes, plus elle serait de type ‘accentuel’, et plus elle a de syllabes simples, plus elle serait de type ‘syllabique’ ou ‘moraïque’. Afin de vérifier cette hypothèse, nous avons travaillé la question à partir d’un autre corpus composé de parole spontanée dans différents dialectes.

Les résultats de cette étude nous ont montré que la répartition des types de syllabes complexes est très différente d'un dialecte à l'autre : la proportion de syllabes simples et de voyelles longues (CV, CVC, CVV, CVVC ...) est plus élevée dans le parler libanais. L’arabe marocain quant à lui penche plutôt vers des proportions élevées de syllabes complexes (CCVC, CCVCC, .. etc) et de voyelles brèves alors que le tunisien présente des proportions intermédiaires par rapport aux deux autres dialectes. Ainsi, les tendances des structures syllabiques observées pourraient être utiles dans la caractérisation des différents dialectes arabes et constituer un indice de discrimination dialectale. Par le biais de cette étude préliminaire, nous avons confirmé la robustesse des paramètres que nous avons utilisés pour le rythme ; la variabilité des structures syllabiques et les valeurs de ΔC corroborent et les valeurs intermédiaires du parler tunisien confirment les phénomènes observés dans nos résultats sur le rythme.

En conclusion, les modèles utilisés dans ce travail cherchent dans le signal de parole des indices des propriétés phonologiques donnant naissance au rythme. L’analyse des parlers arabes a confirmé que ces propriétés pouvaient être mises à jour par le biais d'une segmentation en consonnes/voyelles de la parole, et de statistiques sur les durées des intervalles vocaliques et consonantiques. Notre travail soutient ainsi l’approche avancée par plusieurs linguistes selon laquelle le rythme est déterminé par trois variables qui reflètent la complexité des groupes de consonnes et des noyaux vocaliques dans la langue. De plus, nous avons montré que les langues et les dialectes ne se regroupent pas en classes rythmiques distinctes mais se répartissent en fonction de leurs propriétés phonologiques le long de ce qu’il convient d’appeler un continuum rythmique..

Cette validation expérimentale des classes de rythme n'est bien sûr pas suffisante dans la mesure où elle ne traite que de l’aspect temporel, mais ces résultats nous semblent prometteurs et permettent d’ouvrir de nouvelles perspectives. En effet, ce travail pourrait être approfondi en intégrant d’autres niveaux d’analyse dans la hiérarchie prosodique tels que le groupe clitique et l’intonation dans un cadre d’une comparaison inter-dialectes. En effet, la prise en compte de cet aspect rythmique qui semble à priori discriminant permettra de concevoir une typologie des parlers en intégrant plusieurs critères.

Une autre perspective capitale pour la validation de nos résultats est d’intégrer cet aspect du rythme dans un modèle perceptif. Nous rappelons à ce propos que le modèle de Ramus est à la base un modèle de perception du rythme testant l’hypothèse selon laquelle le cerveau segmente la parole en intervalles vocaliques et consonantiques et perçoit le rythme à travers la durée et l’alternance entre les segments.

Ramus a montré que les nouveaux-nés ainsi que les adultes utilisent la perception des propriétés rythmiques de la parole pour discriminer des langues entre elles. Cette aptitude qui repose sur la capacité de l’être humain (voire des singes tamarins dans les expériences de Ramus) à percevoir les propriétés rythmiques à partir de la structure syllabique des langues, pourrait être vérifiée au niveau dialectal. Une manière d'évaluer la cohérence de nos résultats serait de tester la perception de la variation rythmique des parlers arabes chez des sujets arabophones et non arabophones. Une tâche expérimentale basée sur de la parole re-synthétisée pour identifier les dialectes et évaluer la robustesse des indices prosodiques seraît à envisager. La resynthèse de parole permettrait de contrôler les propriétés prosodiques de la parole, afin de produire des stimuli dont toutes les propriétés sauf le rythme seraient éliminées. Nous rappelons à ce propos que le rôle de l’information suprasegmentale est primordial et que l’identification perceptive est possible grâce à des informations suprasegmentales même si l’auditeur ne dispose pas de données segmentales.

Une autre observation que ces résultats nous permettent de formuler concerne le fait que les indices rythmiques peuvent être discriminants pour le développement d’un modèle d’identification automatique. Par ailleurs, l’un des aspects connexe de notre recherche se trouve dans la possibilité d’élaborer un système de modélisation rythmique qui évalue la typologie des langues évoquées ci-dessus. Nous évoquons dans ce cadre-là une étude préliminaire (Barkat et al. 2004) qui se situe dans le cadre des travaux en Identification des Langues (IAL) entrepris au laboratoire Dynamique Du Langage. Ces recherches portent principalement sur l'apport des connaissances linguistiques à l'identification automatique des dialectes arabes.

A partir des hypothèses formulées sur l'existence de deux zones dialectales relativement homogènes (Maghreb MA et Moyen-Orient MO) à l'interface desquelles se trouve une zone intermédiaire (Tunisie et Égypte ZI), trois groupes ont été formés avec les locuteurs (soit 16 locuteurs pour MA, 11 pour ZI et 12 pour MO). Dans un premier temps, seuls les groupes MA et MO ont été considérés. La détection automatique de segments vocaliques a été appliquée et complétée par une représentation en termes de pseudo-syllabe que nous avons décrite plus haut. Des modèles de mélanges de lois gaussiennes (32 composantes) ont été appris dans chacun des deux espaces de paramètres, l’un segmental (vocalique) et l’autre rythmique (peudo-syllabe) et donnent respectivement 82 % et 73 % de classification correcte. La fusion statistique des deux décisions donne quant à elle 86±13 % d’identification correcte (respectivement 13 locuteurs sur 16 pour MA et 11 sur 12 pour MO). Cette expérience, bien qu'elle ne permette pas d'évaluer la dépendance des modèles vis à vis du texte (vu la faible quantité des données disponibles les mêmes types de texte apparaissant en apprentissage et en test), conforte l’hypothèse que les informations vocaliques et rythmiques sont toutes deux porteuses d'informations quant à la zone dialectale des locuteurs.

À travers cette étude préliminaire, nous montrons comment l’ingénierie des langues peut tirer avantage d’une approche pluridisciplinaire en linguistique mais également en sciences cognitives, en traitement du signal et en informatique. À partir d’expériences en perception nous avons repéré un faisceau de critères linguistiques fiables, permettant la discrimination des parlers arabes. Parmi ceux-ci nous avons constaté le rôle primordial des particularités vocaliques et des schémas rythmiques. Des analyses acoustiques nous ont permis de vérifier la pertinence de ces informations et de renforcer l’hypothèse selon laquelle ces indices représentent des critères fiables de discrimination des parlers arabes par zones géographiques principales. Cette fiabilité se vérifie lorsque, modélisés dans un système d’identification automatique, ces unités s’avèrent relativement robustes dans le cadre d’expériences en identification automatique.