3.1.2. La référence et les premiers mots : mettre en relation forme linguistique et sens

Les mots sont d’abord appréhendés comme des formes sonores, que l’enfant sait reconnaître et mémoriser dès 7 mois (Jusczyk & Aslin 1995) avant de s’intéresser à leur dimension référentielle. Avec la compréhension assez précoce de certains mots ou énoncés en contexte, l’association son/sens (ou signifiant/signifié) commence à se mettre en place, mais elle est d’abord étroitement liée à une situation, à la présence de certains objets ou événements. La question de l’accès au sens, qui est au cœur de notre compréhension de l’acquisition lexicale, se prête difficilement à des réponses qui lèvent entièrement le mystère. On le voit bien à travers la parabole de Quine (1960) qui nous interroge sur notre compréhension d’une langue qui nous serait totalement étrangère : supposons qu’un locuteur s’exclame « gavagai » en voyant passer un lapin, on pourrait formuler l’hypothèse raisonnable qu’il désigne le lapin, mais il se peut aussi qu’il parle de la couleur, de la forme, ou de l’activité de l’animal. Il en va de même pour le traitement que font les enfants des formes sonores perçues : tout au plus pouvons-nous postuler l’existence de quelques grands principes opératoires pour mettre en correspondance le son et le sens –désignation du tout plutôt que de parties ou propriétés, les mots différents ont des significations différentes (Markman, 1989, 1992).

Les compte-rendus parentaux (Fenson, L., et al. 1993, Kern 2006 pour l’adaptation française) donnent des indications riches et assez fiables sur l’ensemble du développement communicatif de l’enfant de 8 à 30 mois, et permettent notamment d’évaluer la compréhension précoce d’items lexicaux. Sur un échantillon de 1211 sujets francophones répartis en 621 filles et 590 garçons, Hilaire, Kern et al. (2001) ont dégagé trois groupes appariés en fonction du nombre de mots compris : sur les 414 items proposés, les 8-9 mois qui comprennent en moyenne moins de 50 mots, les 10-11 et 12 mois qui en comprennent entre 50 et 100 mots, et enfin, les 13 moiset plus dont les scores sont entre 100 et 200 mots. Mais ces mots qu’ils connaissent, les enfants ne les produisent pas tout de suite : les auteurs s’accordent sur un décalage de 4 à 5 mois (Benedict, 1979 ; Menyuk, 1994) qui montre que le passage de l’un à l’autre n’a rien d’évident.

Sur le plan biomécanique, la boucle audio-phonatoire désigne le passage de la perception à la production des sons perçus. Ainsi les phénomènes de réduplication (sorte d’écho du discours adressé) s’apparentent à un entraînement phonologique, mais ils ne semblent pas constituer une étape nécessaire dans cette boucle, puisqu’on ne les retrouve pas chez tous les enfants. Ce serait plutôt un style d’acquisition, comme le suggère de Boysson-Bardies (1996).

Du point de vue de l’activité de l’enfant, on observe qu’il produit d’abord des formes stables en relation avec des situations, puis qu’il devient capable de généraliser ces usages et de les détacher de ces situations particulières -avec, souvent, des phénomènes de « sur généralisation » qui consistent par exemple à nommer « chien » tous les animaux. Les enfants associeraient donc les premières formes produites à des événements ou situations globales, à partir desquelles ils détacheraient progressivement des représentations (Nelson, 1985 ; Barrett, 1986), et cet ancrage situationnel va bien dans le sens d’un lien entre premières productions langagières et mouvement, conceptualisé comme événement (cf. supra, 2.2.2).

Mais qu’est-ce qui permet à l’enfant d’apprendre que les mots font référence à des choses, des personnes ou des événements ? Il faut d’abord que les objets puissent être localisés et reconnus comme séparés : l’enfant qui sait désigner sait agir sur les objets à distance. En désignant un objet, il l’isole symboliquement des autres, en même temps qu’il lie des représentations nouvelles à celles qu’il a gardées en mémoire. Il y a cependant bien plus que cela dans les premières désignations, qui s’opèrent chez presque tous les enfants grâce à un geste de pointage. Le pointage marque probablement l’étape la plus fondamentale : celle qui consiste à signifier quelque chose pour quelqu’un d’autre, à attirer l’attention de l’autre sur un objet d’attention commune. Ce partage d’attention, ou triangulation, se met en place très tôt. Mais c’est seulement vers un an, lorsque l’enfant pointe pour désigner ou demander quelque chose, qu’il initie le partage et montre par là qu’il intègre à ses représentations la perspective de l’autre. C’est ce que Tomasello appelle la « révolution socio-cognitive » des 9 mois (1995 : 175) : les premières désignations et demandes gestuelles sont la trace de ce que l’enfant comprend et perçoit son entourage comme autant d'agents doués d’intentionnalité. Bien plus, en pointant l’enfant met en place un « lieu commun de discours et d’échange » (Brigaudiot & Danon-Boileau, 2002) un véritable thème conversationnel. En ce sens, le pointage est un geste spécifiquement humain, et de par les opérations cognitives et symboliques qu’il suppose, il articule déjà geste et langage. Tomasello suggère d’ailleurs que le langage ne soit pas autre chose qu’une forme particulière de cette aptitude au partage d’attention :

‘« Language is nothing more than another type –albeit a very special type- of joint attentional skill; people use language to influence and manipulate one another’s attention. » (2003 : 21)’

Et des études récentes montrent que pour bien comprendre le fonctionnement de ce geste, qui peut-être tantôt déclaratif, tantôt impératif, il faut en intégrer la dimension multimodale (Leroy, Mathiot & Morgenstern, 2009) : en effet, le geste comprend aussi la direction du regard en fonction des configurations toujours particulières de l’environnement, et il intègre parfois des productions vocales aux courbes prosodiques variables.