4.2 Méthode et corpus

La série expérimentale suivante s’appuie sur la tâche de jugement de similarité. Nous demandons aux sujets d’évaluer, et non pas de discriminer, les langues romanes. Nous avons utilisé une échelle de similarité de cinq points : le point 1 est associé à la différence maximale entre les deux items (i.e., les deux langues dans un stimulus), tandis que le point 5 correspond au jugement ’très ressemblants’.

La méthode, connue sous le nom d’échelle FSI, a été mise au point par le US Government’s Foreign Service Institute (Lowe, 1976, cité par Disner, 1983 qui utilise l’échelle paire de 0 à 541).

L’avantage de cette méthode, c’est qu’elle peut être appliquée à tous les domaines linguistiques et qu’elle ne demande pas de formation préalable de la part des juges. En effet, on peut solliciter un jugement syntaxique, sémantique ou encore phonologique sur une échelle ayant le même nombre de points. De plus, cette tâche ne demande pas aux sujets d’utiliser leurs connaissances antérieures ou acquises durant l’apprentissage éventuel qui précède le test, mais seulement d’apprécier spontanément les stimuli qui leurs sont présentés et de les classer librement et intuitivement sur les points de l’échelle.

Nous avons repris cette méthode, mais en réduisant l’échelle FSI d’un point et en définissant seulement les deux points extrêmes. Nous avons ainsi laissé la possibilité aux sujets de définir les autres points de l’échelle.

1 = très peu similaire

5 = très similaire

Le corpus utilisé pour le test a été le même que celui employé dans la série d’expériences décrites dans le Chapitre 3. Rappelons donc qu’il s’agit d’une base de données acoustiques élaborée par l’enregistrement de 4 locuteurs pour chacune des langues (deux hommes et deux femmes). Elle a été obtenue à partir d’un livre d’images sans texte dont les locuteurs ont décrit spontanément la trame narrative (Mayer, 1969). À ces données principales, nous avons ajouté pour les besoins du test, un corpus supplémentaire issu de la base de données EuRom4 (1997), conçue pour l’apprentissage des langues romanes et consistant dans la lecture de journaux. Enfin, à cela nous avons rajouté un troisième corpus, obtenu par l’enregistrement d’une histoire personnelle que le sujet fournissait en réponse à la question suivante : ’Comment avez-vous passé votre dernier week end ?’.

Tous les enregistrements ont été digitalisés à 22kHz, 16 bits, en monophonique sous SoundForge©. A partir de ces enregistrements, 10 échantillons de 10 secondes chacun ont été extraits pour être utilisés lors de la phase d’entraînement, et 100 échantillons de 6 secondes chacun ont été destinés à la phase de test. 50 stimuli ont été finalement obtenus par la combinaison des 100 échantillons, deux par deux.

L’expérience a été réalisée à travers une interface programmée à l’aide du logiciel PsyScope (Cohen, McWhinney, Flatt, & Provost, 1993, sur Macintosh). Elle a été encore une fois divisée en deux phases : entraînement et test.

L’entraînement a permis aux sujets de se familiariser avec les langues romanes. Il a consisté à faire écouter aux sujets deux extraits de 10 secondes dans chaque langue, présentés en ordre aléatoire. Le nom de la langue d’origine était indiqué sur l’écran pendant 1500 millisecondes.

Durant le test proprement dit, les sujets devaient associer chaque stimulus à un point sur l’échelle de similarité. Les 50 stimuli proposés étaient d’une durée moyenne de 6 secondes. Les extraits ont été présentés une seule fois, et chaque combinaison Li-Lj, où {i,j}∈[1,...,5]2, a été présentée deux fois. Les deux échantillons dans le stimulus ont été séparés par un bruit de ’cloche’, et après chaque paire de signaux, les sujets ont disposé de 2 secondes pour évaluer le degré de similarité entre les signaux sur l’échelle de 1 à 5 (où 1 = très peu similaire, 5 = très similaire). L’utilisation des points de l’échelle entre les deux extrêmes, ainsi que le choix des critères pour les jugements des similarités respectives, ont été laissés à la charge des sujets. Ils ont reçu l’explication selon laquelle il n’existe pas de bonnes ou de mauvaises réponses et l’évaluation des similarités représente une tâche personnelle. Par ailleurs, c’est la seule information qui a été donnée oralement, toutes les instructions étant fournies à travers l’interface réalisée en PsyScope.

Le délai de 2 secondes expiré, un deuxième bruit, différent du premier (de type ’bip’) annonçait aux sujets qu’une nouvelle paire de langues allait suivre. Les sujets disposaient d’une fiche sur laquelle pour chacune des paires, ils devaient indiquer dans la case appropriée le chiffre correspondant au degré de similarité décidé.

Notes
41.

Disner (1983) utilise cette méthode pour étudier la perception des voyelles d’un certain nombre de langues germaniques produites par des locuteurs bilingues. Ainsi, elle demande à des juges natifs d’une langue x de s’exprimer sur la qualité des prononciations des locuteurs bilingues ayant acquis leurs langues maternelles à des degrés différents de maîtrise. Le jugement utilisé dans ce protocole est le suivant :

Accent étranger message URL SCHEM39.gif Accent natif

où :

0 = prononciation fréquemment inintelligible

1 = accent très lourd ; difficulté de compréhension

2 = accent étranger marqué ; demande une concentration lors de l’écoute

3 = mauvaise prononciation accidentelle

4 = absence de mauvaise prononciation, mais identifiable comme non-natif

5 = prononciation native.