3.De la discrimination perceptive des langues romanes

3.1 Introduction

Les travaux en identification perceptive des langues romanes sont quasi-inexistants. Très peu d’études perceptives s’y intéressent, même si certains de ces idiomes font partie des corpus largement utilisés en identification automatique des langues. Et, dans ce dernier cas, les langues choisies sont surtout l’espagnol, le français et beaucoup moins souvent ou jamais, l’italien, le portugais ou le roumain.

Parmi les études auxquelles nous avons fait référence dans le chapitre précédent, notons que sur dix expériences basées sur des stimuli en parole naturelle, six seulement prennent en considération au moins une langue romane, et qu’il s’agit le plus souvent de l’espagnol. Pour ce dernier, la variante sélectionnée est l’espagnol nord-américain (mexicain) et/ou sud-américain en raison du fait que les corpus ont été constitués en Amérique du Nord où la population hispanophone issue du continent Sud est fortement représentée. Nous allons donc recenser les études consacrées à l’identification des langues qui incluent dans leurs corpus une ou plusieurs langues romanes. Notons préalablement que le faible nombre de travaux qui remplissent ce critère s’explique par le fait que, dans la constitution des corpus, les particularités structurelles des langues n’ont pas été le premier critère de sélection. Les auteurs ont favorisé d’abord la diversité linguistique, et ensuite, la facilité de constitution de bases de données linguistiques, i.e. les possibilités de pouvoir enregistrer des locuteurs natifs de ces langues.

Comme nous venons de le préciser, l’espagnol est la langue romane la mieux représentée dans ces corpus. L’espagnol se trouve parmi les langues de test dans l’expérience de Lorch & Meara (1989), qui est l’une des premières études consacrées à la discrimination perceptive des langues, et qui fait appel à un corpus comportant également les langues suivantes : l’arabe, le chinois, l’anglais et le japonais. Les taux de discrimination linguistique sont importants, mais la diversité typologique facilite la tâche expérimentale. Les expérimentateurs ne font pas référence aux indices linguistiques potentiellement responsables de l’identification. Il en est de même pour les études de Muthusamy & Cole (1992), Muthusamy, Jain & Cole (1994), Bond & Fokes (1991) et Stockmal, Muljani & Bond (1994).

Ainsi, Muthusamy & Cole (1992) utilisent du français dans un corpus réunissant, en plus, les langues suivantes : anglais, farsi, allemand, coréen, japonais, chinois mandarin, tamil et vietnamien. Quant à Muthusamy, Jain & Cole (1994), ils ont basé leur étude sur le même corpus que dans l’étude précédente, tandis que Bond & Fokes (1991) et Stockmal, Muljani & Bond (1994) ont utilisé un corpus comprenant le chinois, le japonais, l’espagnol, l’anglais et l’arabe. Enfin, le français est la seule langue romane présente dans l’expérience de Bond, Stockmal & Moates (1998) et doit être discriminé de l’arabe, du coréen, du japonais, de l’hébreu, de l’allemand, de l’ombawa, de l’akan, du swahili, du létonien, du russe, de l’ilocano et du tagalog.

Les études ci-dessus mentionnées ne sont pas consacrées à la recherche de traits linguistiques discriminants. Le principal objectif est ici l’analyse des taux de réussite obtenus par les auditeurs.

Seule l’étude de Muthusamy, Jain & Cole (1994) fait référence à des indices ayant aidé les sujets à discriminer la langue romane présente dans le corpus, des autres langues présentées. En outre, c’est la seule étude qui prend en considération deux langues romanes et motive ce choix par l’appartenance de ces idiomes à la même famille linguistique. Les auteurs effectuent une évaluation des stratégies des auditeurs mises en oeuvre durant la tâche d’identification. Muthusamy, Jain & Cole trouvent que les segments de type nasal représentent des indices discriminants du français, mais ils notent également que les participants à l’expérience n’ont rien identifié comme spécifique à l’espagnol, si ce n’est le débit de parole rapide et des sons tels ’eh-s’(?!).

Comme nous venons de le constater, les travaux antérieurs ne s’intéressent guère à l’émergence de traits discriminants par le biais d’une expérience perceptive portant sur l’identification de langues. Les langues ne sont pas triées selon une typologie linguistique, et les indices discriminants ne bénéficient pas d’une prise en compte privilégiée. Par conséquent, nous pourrions nous demander si la diversité typologique ne joue pas un rôle dans l’obtention des scores de discrimination correcte. Toutefois, cette hypothèse est difficile à prouver, étant donné que les conditions d’expérimentation différentes d’un paradigme à l’autre rendent la comparaison pour le moins difficile. Enfin, l’objectif essentiel des travaux que nous avons passés en revue reste l’étude des capacités perceptives des auditeurs, mises en oeuvre lors de ce type de paradigme expérimental, et, seulement en second lieu, l’analyse des traits linguistiques responsables des taux de réussite.

À partir de ces constatations, nous avons mis au point le protocole suivant susceptible de remédier aux manques méthodologiques décrits.