3. État des recherches en production de parole

3.1. Arguments expérimentaux

Les études sur l’implication de la syllabe comme unité privilégiée de production sont extrêmement répandues, essentiellement dans les langues romanes et germaniques (e.g., Ferrand, 2000 ; Ferrand & New, 2003 ; Cholin, Schiller & Levelt, 2004 ; Schiller, Meyer & Levelt, 1997), mais aussi sino-tibétaines (e.g., Chen, Dell & Chen, 2002). Les travaux de Ferrand, Seguí et Grainger (1996) en français et de Ferrand, Seguí et Humphreys (1997) en anglais ont, à ce titre, contribué à valider la syllabe comme unité de production à voix haute en utilisant un paradigme d’amorçage visuel masqué de mots bi- et trisyllabiques (pour une synthèse en français, voir Seguí & Ferrand, 2000). En effet, une amorce congruente avec la structure initiale du mot subséquent (e.g., BA pour BA.LADE ou PAR pour PAR.TIR) permettait une prononciation plus rapide du mot que lorsque l’amorce était incongruente avec la structure initiale du mot (e.g., BAL pour BA.LADE ou PA pour PAR.TIR), que les mots soient bisyllabiques (e.g., BALADE) ou trisyllabiques (e.g., PARTISAN). En anglais, en revanche, cet avantage de l’amorçage syllabique masqué ne ressort que lorsque les frontières syllabiques sont non ambiguës. Toutefois, la prévalence des unités syllabiques en production n’est pas un phénomène récurrent dans toutes les études. Schiller (1998 ; 1999 ; 2000)en néerlandais et en anglais ainsi que Brand, Rey et Peereman (2003) ou Perret, Bonin et Méot (2006) en français ne sont ainsi pas parvenus à mettre en évidence le rôle de la syllabe dans la récupération des codes phonologiques pour la sortie articulatoire. Au-delà de remettre en question l’intérêt du paradigme d’amorçage visuel masqué (Schiller, Costa & Colomé, 2002), c’est l’hypothèse du recouvrement qui est défendue, à savoir que les syllabes CVC sont mieux détectées que les syllabes CV à cause d’un plus grand recouvrement perceptif quelle que soit la structure syllabique du mot. Il existerait donc un effet facilitateur de la segmentation, principalement induit par un recouvrement perceptif (i.e., segmental overlap hypothesis, Schiller, 1998 ; 2004 ; Schiller & Costa, 2006) et non par un effet de compatibilité syllabique.

Toutefois, les travaux menés par Peretz, Lussier et Béland (1998) dans une tâche de complétion à voix haute de souches bigrammiques (i.e., CV) ou trigrammiques (i.e., CVC) français présentées visuellement ont mis en évidence un effet contrasté entre sujets français et anglais. Seuls les Français ont recours à des unités de type syllabique en production. L’effet observé était notamment matérialisé par un effet de compatibilité syllabique entre la souche et le mot prononcé subséquemment (i.e., les mots CVC étaient prononcés plus rapidement lorsque la souche était de structure CVC plutôt que CV et inversement réciproque ; pour plus de détails en français, voir Spinelli & Radeau, 2004). De même, Taft et Radeau (1995) ont observé un effet significatif de la syllabe phonologique dans une tâche de prononciation de mots et de pseudomots lorsque les stimuli étaient présentés visuellement. Ces résultats sont directement inspirés des travaux précédents de Taft (1979) qui avait étendu la notion structurale de la syllabe aux traitements visuels en considérant que les mots polysyllabiques pouvaient être définis selon leur BOSS (i.e. Basic Orthographic Syllabic Structure) qui respecte le Principe d’Attaque Maximale (i.e., Spencer, 1996). Le BOSS postule une syllabe orthographique incluant toutes les consonnes suivant la voyelle et servant à apporter le maximum d’informations sur la première syllabe (e.g., ren dans renard). Le BOSS émergerait d’une analyse purement orthographique qui ignorerait la structure phonologique de la syllabe. En s’appuyant sur cette notion, Taft et Radeau (1995) ont exploré le rôle du BOB (i.e., Body of the BOSS ; e.g., en dans ren) déjà étudié en anglais (Taft, 1992).

Parallèlement, les études menées sur le rôle de la syllabe en production de parole ont fait émerger l’idée selon laquelle les syllabes fréquentes et légales faciliteraient, d’une part, la prononciation (e.g., Carreiras, Ferrand, Grainger & Perea, 2005a ont montré que l’effet d’amorçage syllabique n’est effectif qu’avec la syllabe initiale en français; Carreiras & Perea, 2004a ; Perea & Carreiras, 1998) et seraient même, d’autre part, représentées dans un syllabaire mental (i.e., mental syllabary, Cholin, Levelt & Schiller, 2006 ; Levelt & Wheeeldon, 1994), indépendant du lexique mental. Ce syllabaire mental serait le lieu de stockage restreint de codes articulatoires précompilés uniquement pour les syllabes fréquentes. Ce syllabaire mental jouerait le rôle d’un répertoire moteur facilitant l’accès à un stock raisonnable de syllabes plutôt que d’en établir la construction on-line. L’avantage d’un tel lexique est double : une réduction des coûts de traitements cognitifs et un stockage clé en main d’unités préencodées aux niveaux phonologique et articulatoire.