4.4.1.2 Les paires de langues de type AB

L’évaluation des items de type AB concerne la similarité perceptive des langues romanes. Le tableau ci-dessous met en évidence les niveaux de similarité respectifs établis par les sujets français pour les différentes langues romanes. Chaque item représente la moyenne des valeurs de stimuli, deux de type AB et deux de type BA, que le test a proposé aux sujets (voir méthodologie générale dans le Chapitre 3, section 4.2.).

Les scores ainsi obtenus sont différents de la moyenne, exception faite des trois items suivants : Portugais/Espagnol, Roumain/Italien et Espagnol/Roumain. Dans ces cas, les Français ont accordé souvent le score 3, ce qui signifie que probablement ces langues ont été relativement similaires, mais que le degré de similarité n’a pas été facile à établir. Cela est mis en évidence par le fait que les Français ne peuvent situer ces stimuli ni du côté inférieur de l’échelle (comme les stimuli où il y avait du français), ni du côté supérieur de l’échelle (comme les stimuli Espagnol/Italien et Portugais/Roumain).

[Note: FIG39]

La première observation que suggèrent les résultats ci-dessus est que, visiblement, la langue maternelle est très différente des autres langues romanes. Les scores accordés aux stimuli incluant le français sont donc tous inférieurs à 3. En d’autres termes, le rôle de la langue maternelle est aussi important dans cette tâche expérimentale que dans la tâche de discrimination des langues. Par conséquent, les paires de langues comportant le français ont reçu un taux de similarité significativement inférieur aux autres taux et systématiquement en dessous de la moitié (le point 3) de l’échelle.

Le portugais est significativement moins proche du français que le portugais de l’italien (t=5.082, p<0.0001), l’espagnol de l’italien (t=13.449, p<0.0001), l’espagnol du roumain (t=7.750, p<0.0001), le roumain de l’italien (t=6.281, p<0.0001), le portugais de l’espagnol (t=8.529, p<0.0001) et, enfin, le portugais du roumain (t=7.708, p<0.0001). Malgré cela, le portugais est significativement plus proche du français que ne l’est le roumain (t=2.668, p=0.0152), qui par ailleurs semble être la langue qui ressemble le moins à la langue maternelle de ce groupe de sujets. En revanche, l’italien est significativement plus proche du français que ne l’est le portugais (t=2.706, p=0.0140).

Les différences les plus importantes en termes de degrés de similarité se manifestent entre le roumain et le français, d’un côté, et toutes les autres paires de langues, de l’autre, exception faite de la paire Espagnol/Français. Les différences suivantes sont donc statistiquement significatives : Roumain/Français vs. Espagnol/Italien (t=14.162 ; p<0.0001), vs. Espagnol/Roumain (t=8.872, p<0.0001), vs. Roumain/Italien (t=7.754, p<0.0001), vs. Portugais/Espagnol (t=9.568, p<0.0001), vs. Portugais/Roumain (t=8.810, p<0.0001) et, enfin, vs. Italien/Français (t=3.938, p=0.0009). Par ailleurs, la dernière comparaison met en évidence le fait que pour la population française la langue romane la plus proche de sa langue maternelle soit l’italien.

Enfin, de la même façon, le français est significativement moins ressemblant à l’espagnol que : le portugais à l’italien (t=3.717, p=0.0015), l’espagnol à l’italien (t=11.506, p<0.0001), l’espagnol au roumain (t=6.194, p<0.0001), le roumain à l’italien (t=4.131, p=0.0009), le portugais à l’espagnol (t=5.983, p<0.0001), le portugais au roumain (t=6.663, p<0.0001) et, enfin, l’italien au français (t=2.371, p=0.0184).

Enfin, l’italien a été jugé comme la langue la plus proche du français. Toutefois ce degré de proximité est moins important si on le compare aux autres taux de similarité pour les paires qui comprennent deux langues romanes non-maternelles. Ainsi, l’italien et le français se ressemblent moins que le portugais et l’italien (t=3.183, p=0.0049), l’espagnol et l’italien (t=10.364, p<0.0001), l’espagnol et le roumain (t=5.248, p<0.0001), le portugais et l’espagnol (t=5.390, p<0.0001) et finalement, le portugais et le roumain (t=5.757, p<0.0001). Le français est donc distinct des autres idiomes pour les sujets qui le parlent comme langue maternelle.

Les différences d’évaluation entre le français et les autres langues romanes nous permettent d’établir une hiérarchie des distances que les sujets français conçoivent entre leur langue maternelle et les quatre idiomes néo-latins. Il s’agirait donc, par ordre de proximité, de la série suivante :

Français → Italien → Espagnol → Portugais → Roumain

Cette hiérarchie suggère que la distance entre les langues n’est pas a priori liée aux informations segmentales de nature vocalique car les sujets ont évalué l’italien et l’espagnol comme des langues proches de leur langue maternelle. Elle ne pourrait pas non plus être liée à l’information supra-segmentale, car l’italien a été jugé par la plupart des sujets ayant effectué la tâche de discrimination comme une langue individualisée par sa prosodie. Nous pensons qu’il s’agit plutôt du rôle des niveaux linguistiques supérieurs, dont celui lexical, car l’italien et l’espagnol sont les deux langues où les sujets français ont pu repérer des parties de mots ou des mots et les comparer probablement avec des lexèmes de leur langue maternelle. En revanche, le roumain et le portugais ne sont pas des langues suffisamment connues pour permettre un découpage plus fin du signal.

Parmi les paires de type AB où le français n’est pas présent, les stimuli Espagnol/Italien (avec la moyenne de 3,9) et Portugais/Roumain (avec la moyenne de 3,5) se détachent clairement par leur taux de similarité importants.

L’espagnol et l’italien sont pour les Français les deux langues romanes qui se ressemblent le plus. La différence de taux de similarité par rapport à toute autre paire linguistique est statistiquement significative  : Portugais/Italien (t=6.278, p<0.0001), Espagnol/Roumain (t=4.629, p=0.0002), Roumain/Italien (t=5.338, p<0.0001), Portugais/Espagnol (t=4.390, p=0.0003) et même Portugais/Roumain (t=2.234, p=0.0384). Ce résultat nous étaye les observations faites dans le chapitre précédent en ce qui concerne la similarité potentielle entre l’italien et l’espagnol. En effet, nous avons vu antérieurement que ces deux langues ont été confondues par toutes les populations participantes au test de discrimination (i.e., les Français, les Roumains, les Japonais et les Américains). À présent, les résultats obtenus par le jugement de similarité chez les Français confirment la proximité perceptive des ces deux langues. Ce résultat va dans le sens de l’hypothèse que nous avons formulée dans le chapitre précédent, à savoir qu’il y a une correspondance entre la classification typologique(i.e., les systèmes vocaliques) et la classification perceptive des langues romanes (i.e., le jugement de similarité).

Les résultats obtenus pour la paire Portugais/Roumain confirment aussi la ressemblance entre ces deux langues. Elles sont significativement plus similaires entre elles que le portugais et l’italien (t=3.144, p=0.0056), et que le roumain et l’italien (t=2.223, p=0.0420).

En conclusion, l’évaluation de la similarité qui existe entre les langues néo-latines mène à une division des cinq idiomes en trois groupes. Tout d’abord le français s’oppose, en termes de traitement par rapport aux autres langues, à tous les idiomes néo-latins. En effet, il semble que la langue maternelle ne ressemble à aucune autre langue romane, étant donné que tous les stimuli présentant des signaux en français ont été évalués à un degré inférieur à 2,5. D’ailleurs, le seul stimulus qui dépasse le point 2 de l’échelle est Italien/Français (2,05). Les sujets français trouvent à leur langue maternelle une éventuelle similarité sonore avec l’italien, sans que cette similarité soit aussi importante que celle qui existe entre d’autres paires de langues, comme par exemple entre le roumain et le portugais ou encore, entre l’espagnol et l’italien. Nous pourrions donc considérer que le français constitue, à lui seul, un groupe linguistique à l’écart des autres.

Le second groupe est formé par le portugais et le roumain. Le taux de similarité associée à la paire Portugais/Roumain est supérieur à la moitié de l’échelle. Ce résultat permet de comprendre les confusions importantes que cette paire ait suscitées lors du paradigme expérimental de discrimination. Par ailleurs, le degré de similarité qui existe entre les deux langues suggère que dans les expériences de discrimination, le rôle de la familiarité avec les langues peut être relativisé. Le jugement de similarité montre que la confusion ne reposait pas uniquement sur le caractère quasi-inconnu du portugais et du roumain pour les auditeurs français. De plus, les langues de la paire Portugais/Roumain (3,5) ont été jugées comme moins similaires que les langues de la paire Espagnol/Italien (3,9), bien que ces deux derniers idiomes soient bien connus par les auditeurs français. Ce résultat suggère qu’ils ont jugé que la proximité de l’espagnol par rapport à l’italien est plus importante que la proximité entre le portugais et le roumain, selon la représentation perceptive (et non pas la familiarité) des quatre langues comparées. Il semble qu’il existe une similarité sonore réelle entre le portugais et le roumain. On peut supposer que cette similarité est une source de confusions entre les deux langues lors de la tâche de discrimination.

Enfin, le troisième groupe réunit l’espagnol et l’italien. Les résultats montrent que pour les auditeurs français, l’espagnol et l’italien sont les langues romanes qui se ressemblent le plus, les différences statistiquement significatives qui existent entre la paire Espagnol/Italien et toutes les autres paires de type AB en étant la preuve. Une fois de plus, ce résultat confirme l’hypothèse selon laquelle la similarité structurelle (phonologique) entre les langues comparées joue un rôle important dans les tâches de discrimination (rappelons que dans cette tâche l’italien et l’espagnol ont été souvent confondus par toutes les populations). Enfin, ce résultat constitue une preuve supplémentaire en ce qui concerne les niveaux linguistiques ayant fourni le plus d’indices qui permettent cette catégorisation. Bien que les évaluations des sujets sur leurs propres stratégies de discrimination (voir chapitre précédent) montrent que l’italien peut être reconnu grâce aux indices supra-segmentaux, nous pensons que ce sont surtout les indices segmentaux qui permettent de trouver une similarité avec l’espagnol dont les patterns rythmiques sont très différents de ceux de l’italien. Ce fait va dans le sens de notre hypothèse concernant le rôle potentiel de l’information vocalique dans la catégorisation perceptive des langues romanes.

Le paragraphe suivant est consacré à la représentation cartographique des langues en fonction des distances inter-linguistiques mises en évidence par la MDS. Cette analyse statistique nous permettra de mieux saisir les distances perceptives que les sujets français établissent entre les langues d’origine latine.