II.1.3. Résultats.

A l’issue de l’expérience, les réponses de chaque participant ont été réécoutées individuellement de manière à détecter les erreurs de prononciation, et la qualité des signaux de paroles soigneusement contrôlée au moyen du logiciel Praat 4.1.13 (Boersma & Weenink, 2000). Les temps de réaction associés aux réponses erronées, aux hésitations, aux signaux sonores défaillants ou d’une durée s’écartant de l’intervalle défini par la moyenne +/- 2,5 fois l’écart type ont été exclus de l’analyse. L’application de ces critères a conduit à l’élimination de 6,94% des données.

Les latences de dénominations ont été calculée à partir de chaque réponse numérisée, en appliquant un algorithme similaire à celui de Kello et Kawamoto (1998), développé sous Matlab 5.3. Durant la phase initiale du traitement, le signal numérisé était lissé au moyen d’une courbe reproduisant très approximativement la forme initiale de l’onde sonore enregistrée. Cette courbe grossière était complétée par une seconde courbe, plus fine, respectant davantage l’allure générale du signal acoustique. Les deux courbes étaient basées sur un calcul d’énergie réalisé au moyen d’une fenêtre d’analyse coulissante de 60 ms qui se déplaçait le long du signal. Le début du signal de parole était ensuite évalué en trois temps. Au cours de la première étape, l’algorithme déterminait le pic d’énergie le plus élevé à l’intérieur d’une fenêtre cible et procédait à l’examen de la portion de la courbe la plus approximative en amont de ce pic jusqu’à détection d’un seuil correspondant à la valeur moyenne du signal + 3 écarts-types. Dans la seconde étape, la courbe la plus fine était explorée en avant du seuil identifié jusqu’à détection d’un seuil correspondant à la moyenne + 10 écarts-types. Finalement, l’algorithme repartait en amont de la courbe fine pour trouver un troisième seuil correspondant à la moyenne + 3 écarts-types. Ce dernier seuil était automatiquement repéré comme correspondant au début de la prononciation du mot. La valeur temporelle associée à l’indice était alors extraite et enregistrée dans un fichier à partir duquel l’intervalle séparant cet indice de l’apparition du stimulus à l’écran était calculé. La valeur obtenue représentait le temps nécessaire au participant pour produire le mot cible. Kawamoto, Kello, Jones et Bame (1998) soulignent toutefois que les latences acoustiques telles qu’elles sont mesurées par l’algorithme décrit ci-dessus ne constituent pas une estimation satisfaisante pour les mots débutant par une plosive (/p/, /t/, /k/, /b/, /d/, /g/). De fait, la production de ces consonnes est caractérisée par l’occlusion transitoire du flux d’air laryngé, provoquant l’augmentation de pression précédant le relâchement explosif générant l’énergie acoustique mesurable. L’explosion se produisant au moment où le phonème suivant est rendu disponible, le début de l’énergie acoustique marque dans ces conditions la fin de la plosive plutôt que son début. En l’absence de technique plus robuste, et bien que les variations interindividuelles limitent considérablement la validité de ce procédé (Kessler et al., 2002), les latences de réponse associées à ces items ont initialement été corrigées sommairement en retranchant respectivement 90 et 60 ms aux mesures brutes des occlusives sourdes et sonores, en accord avec les normes de Landercy et Renard 12 (1977).

Notes
12.

Ces mesures sont dérivées des normes élaborées par Landercy et Renard (1977 :125), situant la durée de la tenue des plosives sourdes dans un intervalle compris entre 90 et 120 ms, et celle des plosives sonores dans un intervalle s’étendant de 60 à 90 ms. Les valeurs de 90 et 60 utilisés dans la présente normalisation correspondent à la borne inférieure de chaque intervalle.