4 de l’évaluation de la similarité des langues romanes

4.1 Introduction

La partie expérimentale présentée dans le chapitre précédent nous a permis d’avancer une hypothèse sur le rôle de la complexité des systèmes vocaliques dans la discrimination des langues romanes. La série de tests consacrés à la discrimination des cinq langues analysées a montré que les stratégies perceptives des auditeurs dépendent de leurs langues maternelles, de la familiarité avec les langues et des indices linguistiques de nature notamment segmentale. La recherche qui a porté sur la discrimination linguistique nous a permis d’aboutir à la division des langues romanes en deux groupes majeurs, qui réunissent, d’une part, l’espagnol et l’italien, et, de l’autre, le roumain, le portugais et le français. Par la suite, nous avons posé l’hypothèse que cette distribution peut être mise en relation avec la classification typologique liée à la complexité des systèmes vocaliques. Ainsi, nous avons avancé l’idée que le principal indice discriminant pourrait être lié aux informations segmentales de nature vocalique. Bien évidemment, il s’agit d’une macro-discrimination, puisque les regroupements des langues permettent, du moins, d’opérer un premier partage des langues néo-latines d’après l’indice le plus robuste.

Toutefois, arrivés à ce point de notre recherche, nous nous sommes interrogés si ce regroupement implicite des langues en deux classes pouvait être confirmé par des jugements sur la similarité sonore des langues romanes. En d’autres termes, il nous semble pertinent, pour une meilleure description des stratégies de discrimination linguistiques des auditeurs, de comprendre la démarche de catégorisation qui est responsable des regroupements obtenus et de rendre ces regroupements explicites.

Nous consacrons donc ce chapitre à la description d’un paradigme expérimental qui nous permettra d’évaluer si la macro-discrimination obtenue dans le chapitre précédent est due à des proximités sonores entre les langues romanes. À cette fin, nous allons demander aux sujets non pas pour d’identifier les langues mais, au contraire, de les regrouper selon les ressemblances sonores qui existent entre elles. Nous allons faire appel à deux groupes de sujets, à savoir un groupe francophone et un groupe anglophone. Nous comparerons les résultats de cette expérience avec ceux issus de l’expérience décrite dans le chapitre précédent, ce qui nous permettra de comprendre la relation entre la tâche de discrimination et celle des jugements des similitudes inter-linguistiques.

A l’issu de cette expérience, nous espérons pouvoir répondre aux deux questions suivantes :

  1. Est-ce que la parenté des langues romanes, impliquant des traits linguistiques communs pour les cinq langues, représente un facteur important qui complexifie la tâche d’identification linguistique au point de ne permettre qu’une macro-discrimination des membres de la famille ?

  2. Est-ce que cette macro-discrimination est en fonction des proximités sonores perçues entre les langues romanes par les auditeurs ?

  3. Cette macro-discrimination aurait-elle un caractère indépendant des acquis linguistiques des auditeurs ?

La démarche expérimentale présentée ici a pour but de mettre en évidence la façon dont les auditeurs naïfs évaluent les proximités sonores entre les langues romanes. Ainsi, nous laissons délibérément aux sujets la possibilité de ’faire des confusions’ entre les cinq langues romanes et, de cette manière, de mettre à profit les connaissances acquises sur les langues romanes avant l’expérience ou lors du court apprentissage qui a précédé le test.

Le paradigme expérimental choisi, de type ’jugement de similarité’, propose aux sujets de décider de la proximité sonore des langues romanes (i.e., du poids des traits partagés par deux langues et qui peuvent engendrer des confusions en les écoutant). Il suppose que les langues présentées lors du test montrent des degrés de ressemblance sonore différents qui peuvent être captés intuitivement par les auditeurs. Ensuite, les degrés de similarité ainsi perçus peuvent être notés sur une échelle de similarité, qui va du niveau le plus bas, de différence certaine des langues, à l’extrême supérieure, de l’identité, et en passant par un nombre d’états intermédiaires.

Le paradigme de jugement de similarité est peu utilisé dans les études portant sur l’identification perceptive des langues. À notre connaissance, trois études seulement consacrées à l’identification perceptive des langues l’ont utilisée : Maidment (1983), Stockmal, Muljani & Bond (1996) et Stockmal & Bond (1999). Sur ces trois études, les deux dernières ont mis à profit les résultats que cette technique permet d’obtenir.

La première étude qui fait appel au jugement de similarité est celle de Maidment (1983). L’auteur se propose de mesurer le poids de l’information prosodique dans la discrimination de deux langues, le français et l’anglais. Plusieurs facteurs sont ainsi analysés : l’aisance du traitement prosodique quand les stimuli sont en parole naturelle ; le rôle de l’entraînement et de l’évaluation par les auditeurs de leurs propres stratégies perceptives ; enfin, le rôle des acquis antérieurs, donc du critère [+/- naïf], des sujets participants au test. Maidment fait appel dans ce but à des stimuli naturels et à des stimuli enregistrés avec un laryngographe. Les stimuli sont par la suite présentés à deux groupes de sujets, francophones et ’naïfs’. Les sujets ont dû se servir d’une échelle de valeur, qui va de 1 à 4, pour noter le degré de similarité des stimuli qu’ils entendent.

L’échelle de similarité permet aux auditeurs de catégoriser les stimuli d’après leur origine (i.e., en français ou en anglais) et de marquer le degré de certitude de leurs jugements en assignant à chaque stimulus l’un des points suivants :

1 = Sûrement du français

2 = Probablement du français

3 = Probablement de l’anglais

4 = Sûrement de l’anglais

Le traitement statistique effectué par la suite met en évidence un index de discriminabilité des stimuli, qui a la valeur zéro lorsque les sujets répondent au hasard. Par ce calcul, l’index de discriminabilité du français était de 0.91, celui de l’anglais était de 0.87, tandis que l’indice global atteignait 0.89. Enfin, un score de 74,68 % de réussite prouve que le français peut être différencié aisément de l’anglais, et cela aussi bien par des sujets non-avertis que par des francophones.

Bien que l’expérience de Maidment (1983) se limite à l’étude de la capacité des auditeurs de discriminer les deux langues et ne met pas en évidence la nature exacte de l’information prosodique qui est responsable de cette discrimination, ce travail mérite d’être cité pour avoir été le premier à exploiter la méthode de l’échelle de similarité. Cette méthode permet aux auditeurs de mesurer l’écart entre la qualité du stimulus entendu et l’image qu’ils se forgent du français et de l’anglais, respectivement. Toutefois, nous pensons qu’une analyse post-test des stimuli catégorisés comme ’sûrement de la langue x’ aurait probablement permis d’identifier quelques traits supra-segmentaux distinctifs de chacune des deux langues.

Plus tard, Stockmal, Muljani & Bond (1996) mettent en oeuvre un protocole expérimental qui se propose de faire la part du rôle des informations phonologiques de celui des informations liées aux spécificités des voix des locuteurs dans la tâche d’identification perceptive de six langues. Ils font appel à un corpus composé d’extraits en arabe, en chinois, en indonésien, en japonais, en russe et en espagnol et à deux populations de sujets américains monolingues. Deux paradigmes expérimentaux sont utilisés. Dans un premier temps, il s’agit d’une tâche de discrimination, suivie, dans un deuxième temps par un paradigme de jugement de similarité sur une échelle de 1 à 7. Les stimuli proposés sont les mêmes dans les deux paradigmes et consistent en des extraits en parole naturelle de 5 secondes présentés en paires et séparés par une pause de 0,5 seconde. Les résultats sont traités dans les deux cas par une analyse multidimensionnelle. Les quinze sujets de la première expérience et les trente sujets de la seconde fournissent des résultats similaires, qui vont dans le sens d’une division ternaire des langues. Le premier groupe de langues est formé par l’espagnol, séparé du second qui réunit le chinois et le japonais, tandis que le troisième met ensemble l’arabe, l’indonésien et le russe. Les deux premiers facteurs de l’analyse multidimensionnelle mènent à la conclusion portant sur le rôle de l’information phonologique intrinsèque aux langues et sur celui de la voix des locuteurs qui a contribué a l’identification de certaines langues.

Cette expérience met en évidence des résultats intéressants concernant particulièrement la cohérence des regroupements linguistiques qui s’avèrent indépendants de la nature des tâches expérimentales. Elle montre aussi la pertinence d’une tâche de catégorisation perceptive pour identifier des indices linguistiques permettant d’établir des regroupements de langues. Toutefois, le corpus linguistique aléatoirement construit (les auteurs ne motivent pas le choix des six langues mentionnées) et l’absence d’un bilan préalable des particularités segmentales et supra-segmentales de ces langues ne permettent pas d’avancer dans l’interprétation des facteurs que la MDS fait ressortir. Aussi les auteurs se contentent-ils d’associer le premier facteur aux informations phonologiques portées par les langues sans préciser de quel genre d’information il s’agit. Par ailleurs, la familiarité des auditeurs avec les langues testées n’est pas considérée, malgré les connaissances préalables que les Américains ont a priori de l’espagnol, comme nous avons pu le montrer par l’expérience décrite dans le Chapitre 3. À notre avis, la première dimension aurait aussi bien pu correspondre à la familiarité des auditeurs avec les langues qu’au facteur phonologique, car l’espagnol (et éventuellement, le chinois et le japonais), semblent jouir d’un statut privilégié dans la hiérarchie des connaissances linguistiques antérieures des participants de l’expérience. Enfin, l’expérience est effectuée par un seul type de population, ce qui empêche toute généralisation des indices discriminants.

La seconde expérience utilisant le jugement de similarité est celle de Stockmal & Bond (1999). Les auteurs se proposent de mesurer la similarité perceptive des langues d’une part, selon leur appartenance à un même type rythmique, et, d’autres part, selon leur appartenance à une même zone géographique. À ce but, ils réalisent deux expériences perceptives. Comme précédemment, l’échelle utilisée a sept points qui vont de 1 à 7. Dans les deux cas, la langue cible est le coréen. Dans la première expérience ils demandent aux sujets de comparer la langue cible et quatre autres langues du même type rythmique, à savoir, le japonais, le lituanien, l’ombawa et le tagalog. Dans la seconde expérience, la langue cible est comparée avec des langues de la même zone géographique, à savoir japonais, tagalog, indonésien et chinois. Les résultats sont relativement contradictoires, car la MDS appliquée aux résultats de la première expérience révèle le rôle de la proximité géographique dans le regroupement des langues, suivi par celui des informations phonotactiques. En revanche, la seconde expérience met en évidence l’importance de la voix des locuteurs et le rôle éventuel de l’information segmentale vocalique ou des variations de la fréquence fondamentale.

Cette deuxième étude nous semble plus intéressante, dans la mesure où le choix linguistique est mieux contrôlé : les deux critères de sélection sont géographique et typologique. De plus, les résultats obtenus nous fournissent une base comparative, puisque nos expériences précédentes portent aussi sur le rôle potentiel des indices de classification typologique dans le regroupement perceptif des langues. Toutefois, la généralisation des résultats de Stockmal & Bond (1999) est difficile, puisque ces auteurs font appel à un seul type de population (i.e., les sujets américains). De plus, le fait que l’un des facteurs soit expliqué par les voix des locuteurs montre que cet aspect n’a pas été suffisamment contrôlé. Enfin, les auteurs ont limité leur description phonologique des langues étudiées aux traits prosodiques. De ce fait, la tâche de l’interprétation des facteurs issus de la MDS est difficile, et la première dimension se voit associer à une information non-linguistique. Nous pensons qu’une meilleure prise en compte des particularités notamment segmentales de ces langues aurait pu contribuer à une interprétation plus adéquate des résultats.

En conclusion, les deux études antérieures montrent que cette méthode permet, d’abord, de mieux décrire les stratégies perceptives mises en oeuvre par des auditeurs naïfs pour identifier ou discriminer des langues inconnues. La méthode est d’autant plus utile lorsque ces résultats sont comparés avec ceux d’une tâche d’identification ou de discrimination linguistique. En outre, elle met en évidence les facteurs qui n’ont pas été suffisamment contrôlés lors de la réalisation de l’expérience, tels que la variation des voix des locuteurs ou le choix fortuit des langues du corpus.

L’expérience auprès de deux populations (français et américaine) que nous rapportons dans ce chapitre tente de mieux maîtriser les facteurs qui ne sont pas proprement linguistiques et de fournir une base de comparaison avec les résultats de Stockmal, Muljani & Bond (1996) et de Stockmal & Bond (1999). Pour cela, nous avons fait appel à nouveau aux cinq langues de la famille romane, dont le corpus a déjà été mis au point lors de la série expérimentale antérieure et à deux groupes de sujets (Français et Américains), choisis d’après le critère [+/- langue maternelle romane].