2.4.1. Corpus et protocole expérimental

Nous avons utilisé des échantillons de parole continue extraits d’une narration spontanée initiée par le même support que celui décrit dans l’expérience précédente (« The Frog Story » (Mayer, 1969)) et résultant de l’enregistrement de quatre locuteurs originaires de différents pays représentant les deux principales zones géo-dialectales du domaine arabe (i.e. Maghreb vs. Moyen-Orient). Les origines dialectales représentées dans cette expérience apparaissent dans le tableau 15.

Tableau 15 : Origines dialectales représentées dans les stimuli soumis à discrimination par zone géographique
Zone Ouest Zone Est
Maroc Syrie
Algérie Liban
- Jordanie

Entre quatre et six échantillons de parole par locuteurs ont été extraits de l’ensemble des phrases produites lors de la tâche de narration, ce qui conduit à un total de 24 stimuli dont 12 maghrébins (6 × 2) et 12 orientaux (4 × 3). Ceux-ci ont ensuite été digitalisés à 16 KHz, 16 bits, monophonique grâce au logiciel Sound Forge©, puis réorganisés en ordre aléatoire dans le but d’être présentés à un groupe de 38 sujets ayant pour tâche de discriminer les différents stimuli.

La population de sujets se divise en deux groupes distincts : le premier est composé de 19 locuteurs francophones n’ayant a priori aucune conscience des variétés dialectales arabes. Le second groupe rassemble 19 locuteurs arabophones d’origine maghrébine pour qui la variabilité dialectale arabe représente indéniablement une réalité perceptuelle bien réelle.

Au cours des expériences les 38 sujets avaient pour tâche d’identifier en termes de zones géographiques l’origine dialectale des 24 stimuli. Ils devaient pour cela cocher, pour chaque stimulus et sur une grille de réponse préformatée, l’origine dialectale pressentie pour le stimulus, c’est à dire soit [ + Maghreb] , soit [+ Moyen-Orient]. Au cours de la seconde expérience, les sujets devaient effectuer la même tâche sur la base de stimuli synthétiques ne présentant plus que les informations rythmiques des parlers. Afin de produire des signaux ne possédant plus aucun indice segmental, nous avons extrait des phrases originales, toutes les 20 ms, les valeurs d’amplitude et du fondamental. A partir de ces mesures, nous avons généré sous Matlab© des signaux sinusoïdaux dont la fréquence varie continûment. Quand l’instant d’extraction correspondait à un événement non-voisé (i.e. absence de Fo) la valeur attribuée était égale à 0 et le son résultant correspondait à un silence. De cette manière, les signaux originaux ont été convertis en un bruit  possédant les mêmes caractéristiques d’énergie et de fréquence ainsi que la même organisation temporelle (i.. alternance de bruits périodiques vs. non-périodiques) que les échantillons originaux. Les figures 16(a) et 16(b) présentent un échantillon de signal original et sa résultante synthétisée.

message URL fig16a.gif
Figure 16(a) : Signal original
message URL fig16b.gif
Figure 16(b) : Signal synthétique

Par ailleurs, nous avons mis en place pour les deux conditions (i.e. parole naturelle et parole synthétique) des périodes d’entraînement construites à partir de l’enregistrement de quatre locuteurs supplémentaires.

Pour la condition 1 (i.e. discrimination dialectale en parole naturelle), la période d’entraînement proposait dans un premier temps d’écouter 4 stimuli maghrébins, puis 4 stimuli orientaux. Cette phase de « présentation par bloc » (i.e. parlers maghrébins et/ou orientaux ×4) avait pour objectif de permettre aux sujets (surtout non arabophones) de se familiariser avec chacune des deux variétés dialectales, et le cas échéant, d’extraire certaines caractéristiques propres à chacune d’elle. Dans un second temps, nous avons proposé d’écouter 4 autres stimuli maghrébins et orientaux introduits en alternance (i.e. stimuli maghrébin/stimuli oriental × 4), le but de cette « présentation contrastée » était de permettre aux sujets de repérer certains critères discriminants pouvant favoriser la discrimination des stimuli lors de la phase de test.

La période d’entraînement de la condition 2 (i.e. en parole synthétique) a été élaborée sur le même modèle :

  1. « présentation par bloc » de stimuli synthétiques générés à partir des valeurs d’amplitudes et de Fo extraites des phrases en arabe maghrébin (× 4)

  2. « présentation par bloc » de stimuli synthétiques générés à partir des valeurs d’amplitudes et de Fo extraites des phrases en arabe oriental (× 4)

  3. « présentation alternée » (× 4) des deux types de stimuli synthétiques.

Pendant les périodes d’entraînement, l’origine dialectale de chaque stimulus était clairement annoncée aux sujets avant l’écoute de celui-ci. En revanche, durant le test, chaque stimulus était introduit par un simple numéro d’appel et était suivi de 2 secondes de silence durant lesquelles les sujets devaient effectuer la tâche de discrimination. Les consignes correspondant à chacune des deux conditions rappelaient l’objectif de l’expérience (i.e. identification dialectale par zone géographique) et étaient suivies des périodes d’entraînement et des 24 stimuli à identifier. L’ensemble du matériel expérimental a été gravé sur deux CD audio (un pour chaque condition). Les expériences ont eu lieu à un jour d’intervalle afin d’éviter (1) les phénomènes de routinisation, (2) les aléas expérimentaux liés à la fatigue et/ou à la perte de concentration et (3) de biaiser les résultats du fait d’une écoute trop rapprochée des deux types de stimuli.