Méthode

Stimuli

Nous avons sélectionné 120 noms communs français (cf. annexe 1) dans la base de données Lexique (New, Pallier, Ferrand & Matos, 2001). Tous les mots étaient bisyllabiques et courants dans la langue française. Ils ont été sélectionnés selon deux critères : leur fréquence d’occurrence dans la langue française (que nous nommerons le facteur F) et leur nombre de voisins phonologiques (que nous nommerons le facteur V). Par exemple le mot ballon est un mot très fréquent qui possède beaucoup de voisins phonologiques (vallon, baron, bâton, etc.). La fréquence d’occurrence des mots allait de 0.29 à 5.5 occurrences par million de mots (Moyenne (M) = 2.38, Déviation Standard (DS) = 1.56) pour les mots de faible fréquence, et de 6.16 à 387.03 occurrences par million de mots (M = 45.67, DS = 72.07) pour les mots de forte fréquence. Concernant les voisins phonologiques, le groupe de mots possédant peu de voisins phonologiques avait entre 0 et 6 voisins (M = 3.75, DS = 1.94) et le groupe de mots possédant de nombreux voisins phonologiques avait entre 13 et 34 voisins (M = 18.55, DS = 5.06). Nous avons croisé les deux facteurs F et V pour obtenir quatre groupes Fréquence/Voisins de 30 mots chacun (Tableau 1).

Tableau 1: Tableau récapitulatif des quatre groupes de mots sélectionnés. Pour chaque groupe, le tableau donne un exemple de mot suivi de sa fréquence et entre parenthèses du nombre de voisins phonologiques qu’il possède.
forte fréquence faible fréquence
nombreux voisins Ballon 21(20) Boulon 2,5(20)
peu de voisins Bijou 20,3(2) Grelot 2,8(0)

Les mots ont été enregistrés dans un caisson insonorisé (22 KH, mono, 16 bits) par une locutrice de langue maternelle française âgée de 24 ans, à l’aide d’un programme d’enregistrement rédigé en langage Tcl /Tk élaboré au Laboratoire Dynamique du Langage. Chaque mot enregistré constituait un fichier son indépendant (Windows PCM file).

Nous avons ensuite « étiqueté » les mots en plaçant un marquage à chaque début et chaque fin de mot ainsi qu’à la fin de chaque première syllabe grâce au logiciel d’étiquetage StkCV développé au Laboratoire Dynamique Du Langage par François Pellegrino. De cette façon chaque mot bisyllabique de forme σ1σ2 (où σ représente une syllabe) était étiqueté de la façon suivante : un marquage au début de σ1, un marquage à la fin de σ1 (équivalent au début de σ2) et un marquage à la fin de σ2. Le positionnement des étiquettes était subjectif mais réalisé par une locutrice de langue maternelle française. L’étiquetage effectué, se pliait aux critères de segmentation élaborés en commun par les laboratoires ICP ⁵ de Grenoble, CERFIA ⁶ de Toulouse et l’Institut de Phonétique d’Aix-en-Provence. Ensuite, le milieu temporel de chaque syllabe a été calculé automatiquement par le programme effectuant les inversions (Matlab). Chaque demi-syllabe a été déterminée comme étant la moitié (en termes de durée) de chaque syllabe. Ainsi, chaque mot était séparé en quatre portions d’une demi-syllabe. Les inversions sont un retournement temporel appliqué aux portions de signal acoustique sélectionnées par pas d’une demi-syllabe. Cette procédure ne consiste pas à intervertir les phonèmes entre eux mais aboutit à une profonde modification de leur déroulement temporel puisqu’ils sont joués à l’envers. Pour bien comprendre, voici ce que pourrait donner l’analogie littérale de l’inversion temporelle d’une syllabe du mot // (caddie) : la première syllabe est la syllabe //. L’inversion produirait le stimulus : // et non pas //.

Grâce aux repères que constituent les marquages, cinq types d’inversions de différentes longueurs ont été appliqués aux items à l’aide du logiciel informatique Matlab. Nous avons donc créé les cinq conditions d’inversion suivantes :

- Condition I₀ : aucune inversion (condition contrôle),

- Condition I_0.5: inversion de la première demi-syllabe,

- Condition I₁: inversion de la première syllabe,

- Condition I_1.5: inversion de la première syllabe et demie,

- Condition I₂ : inversion de la totalité de l’item.

Le programme chargé d’effectuer les inversions prévoyait un lissage aux bornes de celles-ci à l’aide d’un filtre passe-bas dans une fenêtre d’une milliseconde, ceci afin d’éviter la formation de « clics » au niveau des sites de jonction.

Les cinq types d’inversions ont été appliqués à chacun des 120 mots. Ainsi chaque mot a été décliné en cinq formes possibles. Nous avons obtenu au total 600 stimuli que nous avons répartis en cinq listes de 120 mots composées chacune d’un nombre équivalent de stimuli de chaque catégorie d’inversion (24 exactement). Nous avons veillé également à ce qu’à l’intérieur d’une même liste, chaque catégorie d’inversion contienne le même nombre de mots issu de chaque groupe Fréquence/Voisins (6 exactement).

Notes

Institut de la Communication Parlée

Laboratoire de Cybernétique des Entreprises, Reconnaissance des Formes, Intelligence Artificielle