Introduction générale

A l’heure où l’on parle de plus en plus de communication internationale et de mondialisation, cette situation, bien loin de mettre en exergue une utilisation exclusive de la langue anglaise, nécessite une prise en compte efficace de la diversité des langues parlées par les usagers au sein des systèmes de communication automatique. L’espace européen, tant économique que culturel, fournit ainsi un exemple très représentatif de ces nouvelles exigences et des thèmes de recherche qui en découlent. Parmi ceux-ci, l’identification automatique des langues (IAL) à partir de la parole se révèle ainsi en pleine expansion. Cette discipline, qui se situe à l’interface de l’ingénierie de la parole et de la linguistique, constitue le cadre de notre thèse. Ce travail est né de la volonté de répondre à plusieurs questions, axées autour des interactions entre linguistes et ingénieurs, et pouvant permettre d’améliorer les systèmes d’IAL ; il est axé sur l’étude des processus d’identification perceptive des langues romanes. Ce paradigme vise à faire émerger une hiérarchie d’indices discriminants potentiellement intéressants en vue d’une modélisation dans des systèmes automatiques. Notre choix s’est porté sur la famille des langues romanes pour plusieurs raisons, qui tiennent en partie de la longue tradition descriptive dont ces langues ont bénéficié et de l’intérêt résultant de l’étude d’une même famille linguistique.

Nous consacrerons une première partie de ce travail au bilan des travaux réalisés depuis plus de deux siècles au sujet des langues romanes. En effet, l’étude des langues néo-latines se trouve à l’origine de la linguistique diachronique et de la méthode comparative historique. Par conséquent, nous nous sommes intéressés non seulement aux travaux consacrés à l’histoire de ces langues, mais également à leurs classifications et à la description des principales particularités segmentales et supra-segmentales de cinq langues romanes sur lesquelles a porté notre choix (espagnol, français, italien, portugais, roumain). Bien évidemment, l’étude de l’histoire des langues ne représente pas a priori une source d’amélioration pour l’IAL. Cependant, nous pensons que ce type d’études permet de mieux évaluer et comprendre les phénomènes linguistiques voués à plus de variabilité dans un système linguistique.

Nous avons prêté un intérêt particulier aux classifications typologiques, dans la mesure où ce type de classifications repose sur des critères linguistiques qui permettent d’étudier les rapports structurels existant entre les langues analysées. Nous avons ensuite mis en relation les principales conclusions des approches taxinomiques avec les spécificités segmentales et prosodiques des cinq langues. La prise en compte de ces deux niveaux linguistiques (segmental et supra-segmental) est nécessaire étant donné leur importance dans une tâche expérimentale d’identification des langues par des sujets humains.

Cette première étape de notre travail est suivie par une section consacrée à l’évaluation des acquis aussi bien en identification automatique qu’en identification perceptive des langues. Ce bilan est indispensable dans la perspective de la compréhension des besoins actuels des systèmes automatiques. Par ailleurs, il permet de mettre en perspective les démarches de l’IAL et de la perception humaine qui donne à l’Homme le statut de meilleur ’système’ d’identification des langues. Nous passons en revue les principales approches en identification perceptive des langues, tout en prêtant une attention particulière aux stratégies d’identification que les humains mettent en oeuvre dans une tâche expérimentale de ce type. Nous pouvons ainsi constater que ces approches permettent de signaler des indices discriminants de nature linguistique potentiellement adéquats à une modélisation automatique. Toutefois, les travaux entrepris dans ce domaine présentent encore des lacunes méthodologiques concernant plus particulièrement la diversité des langues, les caractéristiques en termes de vécu linguistique des sujets, la construction des protocoles expérimentaux et la modélisation du traitement cognitif pour les sujets qui effectuent une expérience d’identification linguistique. Les parties suivantes tentent de combler certaines des lacunes méthodologiques signalées.

La troisième partie est consacrée à la discrimination perceptive des langues romanes par quatre populations de sujets dont deux de langue maternelle romane (Français et Roumains) et deux de langue maternelle non-romane (Japonais et Américains). Le protocole expérimental consiste en la présentation d’une série de stimuli en parole naturelle. Chaque stimulus est constitué de deux extraits en langues romanes que les sujets doivent identifier comme issus de la même langue ou de deux langues différentes. L’expérience perceptive menée auprès de ces quatre groupes différents de sujets nous permet de constater qu’ils développent des stratégies perceptives complexes qui peuvent être linguistiques et/ou non-linguistiques. Ces stratégies sont fonction des acquis linguistiques antérieurs des auditeurs. Ainsi, le comportement perceptif des Français et des Roumains est conditionné par la présence de la langue maternelle et de plusieurs langues familières parmi les langues de l’expérience. En revanche, les Japonais et les Américains sont susceptibles d’être guidés plutôt par les particularités structurelles des langues testées.

Cependant, les résultats de ce chapitre soulèvent des questions importantes en ce qui concerne la façon dont les sujets de différentes origines ont appréhendé la tâche expérimentale. Plus particulièrement, les expériences menées dans cette section ne nous permettent pas de savoir dans quelle mesure la macro-discrimination linguistique que nous avons obtenue est le résultat d’un jugement implicite sur les similarités sonores entre les langues romanes. De plus, la présence de stratégies de discrimination non-linguistiques (i.e., liées à la langue maternelle et à la familiarité) exerce un effet de masquage sur les stratégies linguistiques qui sont les plus intéressantes pour l’identification automatique. Ainsi, nous avons estimé qu’il était nécessaire de concevoir une tâche expérimentale supplémentaire qui rende explicite ce jugement de similarité.

La quatrième partie de cette thèse tente de répondre à ces questions et de valider la macro-discrimination linguistique. À cette fin, un protocole expérimental de jugement de similarité a été mis en place. Deux populations de sujets, des Français et des Américains, ont été sélectionnées en fonction du critère [+/- langue maternelle romane]. Chaque groupe de sujets effectue une expérience portant sur l’évaluation de la proximité sonore des extraits en parole naturelle en cinq langues romanes. L’évaluation est donnée selon une échelle de similarité. En comparant les résultats de la première expérience (de discrimination) et ceux de cette deuxième expérience (de jugement de similarité) nous pouvons vérifier que les stratégies mises en oeuvre par les deux populations (française et américaine) sont similaires pour les deux tâches. Ainsi, le jugement implicite sur la proximité sonore des langues romanes, fait dans la tâche de discrimination, est validé par un jugement explicite, fait grâce à l’expérience d’évaluation de la similarité entre les langues mentionnées. En outre, les deux populations, française et américaine, semblent être sensibles aux mêmes indices linguistiques permettant de rapprocher les langues romanes du point de vue perceptif.

La cinquième et dernière partie est consacrée au bilan des travaux présentés dans les chapitres antérieurs, ainsi qu’à la proposition d’un modèle perceptif relatif à l’activité d’identification des langues. Cette partie s’achève par une présentation des perspectives de notre recherche.

Notre bilan concerne notamment les résultats obtenus dans les deux parties expérimentales. Ensuite, l’étude des modélisations en perception de la parole naturelle nous permet de proposer un modèle du processus cognitif correspondant à l’identification perceptive des langues. En effet, l’identification perceptive des langues n’a pas bénéficié de telles modélisations. Cependant, l’utilité d’un tel modèle nous semble incontestable, car il permettrait de mettre en évidence une hiérarchie des niveaux de traitement de l’information acoustique fournie par un échantillon de parole pour aboutir à une décision concernant sa langue d’origine. Par ailleurs, le modèle pourrait contribuer à une meilleure compréhension des facteurs non-linguistiques qui influencent la construction des stratégies perceptives, ainsi qu’à une amélioration des méthodes expérimentales employées pour découvrir des indices discriminants de nature proprement linguistique. Nous proposons donc un modèle de l’identification perceptive des langues comme contribution à la réflexion théorique sur le mécanisme qui est associé à cette activité.

Enfin, des perspectives pour les travaux ultérieurs sont également envisagées. Nous pensons plus particulièrement à la vérification du poids de l’information segmentale (vocalique et consonantique) dans la discrimination des langues romanes par l’intermédiaire d’une expérience utilisant des stimuli en parole synthétique ; à la mise en place de protocoles expérimentaux destinés à approfondir la notion de distance linguistique ; et à la prise en compte d’objectifs plus généraux concernant la modélisation automatique des indices discriminants et l’étude du rapport entre la production et la perception de la parole.