4.2.2. Extraction et apprentissage statistique

L’une des questions qui se pose lorsque l’on travaille sur l’acquisition précoce du langage à partir de corpus d’oral spontané, où l’on voit d’abord l’adulte s’adresser à un enfant qui ne parle pas ou peu, est celle de savoir comment l’enfant extrait les unités signifiantes d’un flux sonore presque continu. Faut-il que l’enfant soit équipé de règles, comme le suggèrent les tenants de l'innéisme, ou se contente-t-il d’extraire, à partir de mécanismes cognitifs généraux, des régularités présentes dans l’input ?

Dans une expérience testant des enfants de huit mois sur l’écoute de chaînes de pseudo syllabes de deux minutes, composées de suites de trois mots inventés de trois syllabes (du type « bidakupadotigolabubidakutupiropadoti ») et dépourvues d’indications phonologiques ou prosodiques sur les frontières des mots, J. Saffran et ses collaborateurs ont montré que les tout jeunes enfants étaient doués d’une capacité à repérer des séquences à partir de leurs propriétés statistiques (Saffran, Newport & Aslin, 1996). En effet, lorsqu’on leur faisait ensuite entendre simultanément deux nouvelles chaînes : l’une contenant les pseudo-mots de la première écoute, l’autre les syllabes, mais dans un ordre différent ; les enfants prêtaient immanquablement attention au flux de parole contenant les pseudo-mots déjà entendus. Ils s’appuieraient donc sur des propriétés statistiques de la langue (les probabilités de transition d’une syllabe à l’autre) pour en induire la structure. De plus, ce mécanisme se perfectionnerait peu à peu pour permettre à l’enfant de prendre en compte des séquences de plus en plus complexes (Hauser, Newport & Aslin, 2001).

Dire que l’enfant utilise les propriétés statistiques de la langue pour détecter des régularités qui lui permettront peu à peu d’en acquérir les structures, revient aussi à faire reposer, au moins en partie, l'acquisition du langage sur des mécanismes cognitifs généraux¹³, non spécifiques à l’être humain (Toro & Trobalon, 2005) : toutes choses qui semblent aller contre l’idée d’une compétence linguistique spécifique innée.

Cependant, le débat sur l’innéisme se rejoue presque à l’identique autour de cette question. En effet, pour les tenants de la grammaire universelle, l’apprentissage statistique serait impossible sans connaissances préalables de la structure phonologique (Gambell & Young, 2004) : il s’agirait donc d’un artefact, ou du moins faudrait-il admettre que l’apprentissage statistique ne joue pas un rôle causal dans la segmentation des mots.

En revanche, pour les constructionnistes, comme pour l’ensemble des théories développementales, cet apprentissage statistique révèle l’existence d’aptitudes cognitives de première importance pour l’acquisition du langage. Celles-ci seraient même nécessaires à l’acquisition grammaticale d’une langue (Tomasello, 2003 : 29 et sq.) car l’enfant détecte non seulement la répétition d’une même forme phonologique, mais aussi des patrons qui caractérisent l’usage de cette forme en contexte.

En définitive, l’hypothèse d’un apprentissage statistique, qui peut être formulée différemment en fonction de son rôle supposé dans l’acquisition du langage, a révélé une qualité de l’input jusqu’alors inexplorée : ses propriétés statistiques. Bien plus, elle a permis de mettre en évidence un mode de traitement du langage basé sur des mécanismes cognitifs généraux. A l’appui de l’implication de tels mécanismes dans l’acquisition du langage, on peut dire que même les théories générativistes qui essayent de prouver que l’apprentissage est basé sur des règles (« rule-based approach » des chomskyens) à partir de tâches d’apprentissage de grammaires artificielles (par exemple Cleeremans & McClelland, 1991 ; Kinder & Assmann, 2000) permettent de mettre en évidence l’existence de mécanismes cognitifs généraux, probablement ancrés dans la perception : en lien avec l’apprentissage statistique, Mehler et al. (2008) proposent par exemple que la détection des relations d’identité et des éléments saillants joue un rôle crucial.

Plus que pour confirmer l’une ou l’autre conception du langage, ce type d’hypothèses intéresse notre réflexion pour au moins deux raisons. D’abord parce qu’elles permettent de penser l’acquisition du langage en tenant compte de la spécificité du langage oral (Parisse 2003). En effet, les propriétés des productions orales, ainsi que les caractéristiques particulières du langage de l’enfant comme de celui qui lui est adressé, nous éloignent des grammaires traditionnellement basées sur l’écrit (Auroux, 1994). Elles nous orientent plutôt vers un examen minutieux de ces productions, qui tienne compte notamment de ses propriétés statistiques. Mais l’idée d’un apprentissage statistique a aussi et surtout retenu notre attention parce qu’il permet de mieux comprendre le caractère central de la cognition spatiale dans l’extraction ou la construction d’invariants. Gibson l’a bien expliqué : c’est précisément parce qu’ils sont confrontés à un monde en mouvement, qui semble soumis à des changements perpétuels, que les nouveaux nés cherchent des régularités qui leurs permettent de faire des inférences (Gibson 1986: 303). Or l’apprentissage statistique, en révélant une aptitude précoce à repérer des relations d’identité et des éléments saillants au sein d’une chaîne sonore toujours changeante, suggère aussi l’existence d’un lien de premier ordre entre mouvement perçu et construction du langage. Ce présupposé est au cœur d’une approche écologique de la perception, que l’on postule l’existence de structures innées, ou une simple prédisposition, mais il nous semble que les développements les plus importants des hypothèses de Saffran et de ses collaborateurs n’ont pu se faire qu’au prix d’une réduction des présupposés innéistes.

C’est pour cette raison que nous avons accordé une attention particulière à un type de grammaires basées sur l’usage, qui a proposé de rechercher de telles régularités jusque dans la syntaxe : la grammaire de constructions. Dès 1975, MacWhinney avait proposé que des patterns basés sur la récurrence de séries d’items constituent le socle de l’acquisition morphosyntaxique (MacWhinney, 1975 ; cf. Mac Whinney, 2008), mais c’est véritablement la grammaire de constructions qui a permis de systématiser ces observations (Thompson & Newport, 2007).

Notes

13.

Mécanismes qui seraient également impliqués dans la détection visuelle de régularités, par exemple.