2.1.1. Rôle de la syllabe dans l’acquisition du langage

La syllabe pourrait-elle jouer un rôle dans la mécanique perceptive spécifique au traitement de la parole dès les premiers mois chez le nourrisson ? La perception et la production sont sans doute deux processus très intimement liés, cependant le nourrisson doit d’abord repérer et sélectionner les aspects spécifiques de sa langue maternelle afin de pouvoir les produire. D’un point de vue perceptif, l’hypothèse du « prosodic bootstrapping » (Gleitman, & Wanner, 1982 ; Morgan & Demuth, 1996 ; Pinker, 1984) a été avancée, montrant que le nouveau-né est sensible à l’empreinte vocale de sa mère, (Mehler, Bertoncini, Barrière, & Jassik-Gershenfeld, 1978 ; Mills, & Meluish, 1974), à sa langue maternelle comparée à une langue étrangère (Dehaene-Lambertz, Houston, 1998 ; Mehler, Jusczyk, Lambertz, Halsted, Bertoncini, & Amiel-Tison, 1988 ; Moon, Cooper, & Fifer, 1993; Nazzi, Bertoncini, & Mehler, 1998), comme à de courts passages entendus in utero (DeCasper, Lecanuet, Busnel, Granier-Deferre, & Maugeais, 1994 ; Spence, & DeCasper, 1987). Le rythme semble être également un indice pertinent, puisque le nouveau-né de quelques jours peut différencier deux langues étrangères sur la base de leur rythme respectif (Bertoncini, Floccia, Nazzi, Mehler, 1995 ; Floccia, Nazzi, & Bertoncini, 2000 ; Nazzi et al. 1998 ; pour une critique sur le rythme voir Bosch, & Sebastián-Gallés, 1997). La prosodie, et plus particulièrement le rythme, tient donc une place essentielle dans l’acquisition du langage de manière générale (Nazzi, Iakimova, Bertoncini, Frédonie, & Alcantara, 2006 ; Ramus, et al. 1999), bien que ce ne soit pas le seul mécanisme à l’œuvre dans l’acquisition du langage.

L’idée que le nouveau-né serait très sensible aux caractéristiques prosodiques de sa langue maternelle a conduit Mehler, à l’appui de son étude séminale de 1981, sur le rôle de la syllabe dans la reconnaissance des mots parlés en français chez l’adulte, à s’intéresser à la manière dont le nouveau-né français apprend à segmenter la chaîne de parole (Mehler, et al. 1990). Si l’adulte français segmente la parole selon l’unité syllabique (Mehler et al. 1981 ; Mehler et al. 1990 ; Segui et al. 1990), et si la stratégie de segmentation est inhérente aux caractéristiques rythmiques de la langue maternelle (Christophe, Guasti, & Nespor, Dupoux, & van Ooyen, 1997; Cutler, et al. 1983, 1986; Cutler, & Otake, 1994; Otake, Hatano, & Yoneyama, 1996; Otake, Hatano, Cutler, & Mehler, 1993), alors le nouveau-né français devrait être également sensible à l’unité syllabique, puisque la langue française est dite à rythme syllabique. Les premières recherches de Mehler sur le nourrisson français allaient dans le sens de cette hypothèse. En effet, selon les travaux de Bertoncini et Mehler (1981), et Bertoncini, Bijeljac-Babic, Jusczyk, Kennedy et Mehler (1988), les nouveaux-nés français sont capables de différencier des séquences telles que /pat/ de /tap/ mais non /pst/ de /tsp/, illégales d’un point de vue syllabique, puisqu’elles ne présentent pas l’alternance voyelle-consonne prototypique de la syllabe. En revanche, le fait d’encadrer les deux séquences précédentes par une voyelle, soit /upstu/ et /utpsu/ respectivement, permet de nouveau aux bébés de différencier ces deux séquences. Les nouveaux-nés français s’appuieraient donc sur la syllabe en tant qu’unité de base de traitement du langage.

Des bébés français de quatre jours ont également fait l’objet de recherches concernant leur capacité de segmentation de la chaîne parlée (Bijeljac-Babic, Bertoncini, & Mehler, 1993). Utilisant le paradigme de succion non nutritive, Bijeljac-Babic et al. (1993) ont présenté à des nouveaux-nés de quatre jours des items composés de deux, trois ou quatre syllabes de structure CV, la syllabe CV étant la structure syllabique la plus typique. Si les nouveaux-nés sont sensibles à la syllabe, alors un changement dans l’amplitude de succion devrait être observé en fonction du nombre de syllabes par item. Cette hypothèse a été vérifiée, les auteurs ont effectivement observé un taux de succion plus élevé lors de la présentation d’items de patrons métriques différents. Afin d’éliminer un biais imputable à la durée des items, Bijeljac-Babic et al. (1993), ont réduit ou augmenté artificiellement la durée de chaque stimulus dans le but d’obtenir une durée équivalente pour tous les items. Les résultats ont montré que même dans cette situation les nouveaux-nés français ont discriminé les stimuli bi- des trisyllabiques. La discrimination ne s’opère donc pas sur la durée totale des stimuli. Toutefois, cette discrimination pourrait dépendre du nombre de phonèmes par stimuli. Une nouvelle expérimentation a été menée afin de tester l’impact du nombre de phonèmes par bisyllabes. Les résultats ont montré que les enfants ne font pas la différence entre des bisyllabes de quatre ou six phonèmes, amenant à conclure que la discrimination ne dépend pas du nombre de phonèmes, mais de la structure même des items, ou autrement dit du nombre de leurs syllabes.

Ces résultats permettent d’envisager qu’en français du moins, la syllabe pourrait constituer une unité de traitement de la parole probable.