1.6 comparer les indices de classification typologique avec les indices discriminants

A l’issue de ce premier chapitre qui nous a permis de passer en revue la genèse, les classifications et les particularités de la structure phonologique et phonétique des cinq langues néo-latines étudiées, nous pouvons d’ores et déjà considérer la meilleure approche typologique qui les ordonne selon les traits segmentaux les plus pertinents. Les approches typologiques fondées sur l’étude de la phonologie des LR (Ternes, 1985, Madonia, 1979, Guiter, 1985) ont abouti à la mise en évidence d’un prototype des LR aussi bien au niveau vocalique que consonantique.

Le résultat a pu être comparé avec celui obtenu au travers des études des autres niveaux linguistiques, tel le système nominal adopté comme unité de mesure par Coseriu (1988), les indices morpho-syntaxiques utilisés par Greenberg (1963) ou encore par le biais des techniques de la linguistique historique qui ont tiré profit de l’étude des changements dans les différentes régions de la Romania européenne. Néanmoins, ces approches ont abouti à des classifications dépendantes du niveau d’analyse et, de ce fait, contradictoires.

Si l’on considère uniquement les approches classificatrices s’appuyant sur les niveaux segmental et supra-segmental qui nous intéressent plus particulièrement, le regroupement le plus pertinent semble être celui qui dépend des particularités vocaliques. A l’instar de Ternes (1985), le développement d’un nombre de segments spécifiques en roumain (la série centrale), en français (les voyelles de l’axe antérieur arrondi et les voyelles nasales) et en portugais (les voyelles nasales) permet d’opposer ces trois langues à celles qui présentent un vocalisme quasi-prototypique, l’espagnol et l’italien.

Ainsi, si nous considérons le nombre de degrés d’aperture, nous pouvons partager les langues néo-latines en deux autres groupes, l’espagnol et le roumain étant les langues à trois degrés d’aperture, tandis que le français, l’italien, et le portugais formeraient un groupe à part en raison de l’articulation du système d’après quatre degrés d’aperture. Notons toutefois que l’italien est susceptible d’appartenir au premier groupe, les dernières études sur la fonctionnalité de l’opposition d’aperture pour les voyelles moyennes témoignant d’une certaine évolution.

Si nous considérons les voyelles nasales, le français et le portugais s’opposent aux autres langues romanes, qui n’ont pas développé de segments vocaliques à statut phonémique de ce type. Enfin, la présence de la série antérieure arrondie en français étaye cette opposition entre les langues à vocalisme complexe (roumain, français, portugais) et celles à vocalisme simple (espagnol, italien).

Le consonantisme impose comme critère privilégié de regroupement des LR le traitement pan-roman de la sonorité des segments consonantiques notamment en position intervocalique. Il recouvre ainsi le classement géographique et permet d’isoler les langues ibériques, i.e., l’espagnol et le portugais, des autres LR.

Bien que le regroupement linguistique obtenu grâce à ces démarches descriptives soit loin d’être unique, nous estimons qu’il n’est pas pour autant aléatoire. En réunissant tous les critères segmentaux précédents, il nous semble plus pragmatique de les ramener à un critère avantageux qui serait celui de [+/- complexité vocalique], qu’il s’agisse d’une complexité en termes de présence ou absence de la nasalité ou bien en termes du nombre de degrés d’aperture. L’analyse des niveaux segmental et supra-segmental à laquelle nous avons consacré la quatrième partie de ce chapitre nous a permis de mieux circonscrire et valider ce critère de complexité. En effet, il nous a permis d’isoler notamment dans notre analyse segmentale, d’une part, les langues au vocalisme simple (l’espagnol et l’italien) des langues au vocalisme complexe (le roumain, le portugais et le français).

Comme nous l’avons précisé lors de l’introduction de ce travail, notre objectif est de mettre en évidence des indices linguistiques pertinents pour l’identification des LR grâce à une approche en identification perceptive des langues. Nous consacrerons donc les chapitres trois et quatre de cette thèse à l’étude des indices discriminants notamment de nature linguistique employés par la auditeurs de différents environnements linguistiques pour différencier les cinq LR.

Nous ferons en sorte que ces indices soient comparés avec ceux qui permettent de diviser ces langues. Nous pourrons voir de cette manière si une correspondance existe entre les particularités structurelles segmentales et supra-segmentales des LR et le reflet de ces langues dans la conscience des auditeurs naïfs.

La partie suivante de cette thèse sera consacrée à l’état de l’art dans le domaine de l’IAL, ainsi qu’à l’évaluation des dernières réalisations aussi bien en identification automatique que perceptive des langues.

Cette partie nous permettra de comprendre les besoins réels à la fois en termes de modélisation linguistique et de valorisation des stratégies perceptives des humains en vue de leur exploitation dans un système automatique.