De l’action à la parole 

Si, comme le suggèrent Rizzolatti et Arbib (1998), le système des neurones miroir permet de combler le « fossé » séparant la reconnaissance des actions et la communication intentionnelle, la question qui se pose dès lors est de déterminer quels gestes étaient utilisés dans le but de communiquer chez les primates : étaient-ce les gestes manuels ou orofaciaux ?

Les auteurs postulent que, bien que les primates utilisent majoritairement les gestes orofaciaux pour communiquer d’individu à individu, l’émergence du langage humain ne résulterait pas d’une évolution directe de ces gestes, suivie d’une étape d’introduction d’un système de vocalisations. Au contraire, ils proposent un rôle crucial d’un système de communication brachio-manuelle venu compléter, à une étape clé de l’évolution, le système orofacial. L’un des avantages de la communication gestuelle manuelle aurait été d’introduire un troisième élément dans la communication, initialement limitée à deux protagonistes par les gestes orofaciaux. L’auteur d’un message aurait par exemple pu indiquer au destinataire la présence d’un troisième interlocuteur ou d’un objet, et même décrire certaines de leurs caractéristiques. Mais l’association des gestes manuels aux gestes orofaciaux aurait également permis aux vocalisations d’acquérir une plus grande importance, et notamment un aspect référentiel « ouvert » en opposition au système « fermé » (i.e. limité) des gestes orofaciaux. En effet, alors que les sons liés aux gestes orofaciaux n’auraient que peu de valeur communicative, associés aux gestes manuels, ils permettraient de fournir un supplément d’information (e.g. « être apeuré » pour les sons associés aux gestes orofaciaux vs. « être plus apeuré » pour les sons associés aux gestes manuels). Un objet ou évènement décrit avec des gestes manuels (e.g. grand objet associé à des gestes manuels amples) aurait alors pu s’accompagner de vocalisations spécifiques (e.g. voyelle « a »). En outre, si ces vocalisations avaient toujours été associées aux mêmes évènements extérieurs (e.g. grand objet associé à une grande ouverture de la bouche et à la voyelle « a », vs. petit objet, faible ouverture de la bouche et voyelle « i »), un vocabulaire primitif de sons possédant un sens précis aurait pu se développer. Ce changement de statut de la vocalisation se serait alors accompagné de modifications et d’adaptations de son contrôle au niveau cérébral. Dans le système de communication orofaciale, l’ajout de sons véhiculait essentiellement des émotions et états émotionnels, renforçant simplement le sens convié par les expressions et gestes faciaux. A ce stade, la vocalisation était donc sous contrôle des centres primitifs émotionnels localisés dans les régions médianes du cerveau (i.e. cortex cingulaire). Mais la donne aurait radicalement changé avec l’introduction des gestes manuels : les sons auraient acquis une valeur descriptive, devant rester en tout point identiques dans des situations similaires mais aussi dans le but d’être éventuellement imités par autrui. Les centres émotionnels ne pouvant prendre en charge ces nouvelles propriétés des sons, des aires corticales plus sophistiquées auraient alors pris le contrôle des vocalisations. Selon Rizzolatti et Arbib (1998), ce rôle aurait été joué par l’aire de Broca, dérivée d’une aire précurseur de type F5, possédant des propriétés miroir et contrôlant les mouvements oropharyngés. En résumé, au cours de l’évolution, la nécessité d’émettre des sons plus complexes dans le but de communiquer avec autrui, ainsi qu’un « terrain cortical » favorable, auraient constitué les éléments clés de la transition de la communication brachio-manuelle à la communication orale. Les gestes manuels auraient ensuite perdu progressivement de leur importance au profit de la vocalisation, acquérant quant à elle une autonomie croissante. La relation entre gestes et production orale se serait enfin totalement inversée, les gestes ne constituant plus que des « compléments » de la communication orale.

Le scénario d’évolution proposé par Rizzolatti et Arbib (1998) est donc proche de celui de Corballis (1999, 2002), tous deux considérant que les aires de protolangage des hominidés contrôlaient la communication brachio-manuelle et orofaciale, mais pas la parole. La longue période séparant l’émergence de ces aires et le développement de la parole aurait coïncidé avec la capacité croissante de communiquer avec des gestes manuels et avec l’association progressive de ces gestes aux vocalisations.

Si l’ « hypothèse du système miroir » formulée par Rizzolatti et Arbib (1998) fait état de l’évolution du langage humain à partir des gestes manuels, elle ne mentionne pas, ou très peu, un processus pourtant primordial chez l’homme : l’imitation. L’imitation, définie comme la capacité d’un individu à apprendre à exécuter une action à partir de son observation (Thorndyke, 1898), exerce en effet un rôle central dans le comportement humain, tant dans l’apprentissage moteur que dans la mise en place de la communication et des habiletés sociales (Jeannerod, 1994 ; Piaget, 1962 ; Tomasello et al., 1993b). Selon Donald (1991), la capacité mimétique, extension naturelle de la reconnaissance d’actions, est un phénomène central de la culture humaine (e.g. danses, rituels tribaux), et son évolution constituerait un précurseur nécessaire à l’émergence du langage. L’imitation de gestes faciaux et manuels a d’ailleurs été rapportée chez des nourrissons de quelques jours, voire de quelques heures (Meltzoff & Moore, 1977 ; voir aussi Ferrari et al., 2006 et Myowa et al., 2004 chez les singes). Attendu que ce processus nécessite, outre un apprentissage, une transformation de l’action codée visuellement en un pattern moteur identique chez l’observateur, le système miroir, dont c’est la fonction première, pourrait en être le fondement chez l’homme (Arbib et al., 2000 ; Arbib, 2002, 2004 ; Iacoboni, 2005 ; Jeannerod, 1994 ; Rizzolatti & Fadiga, 2004). Arbib (2002, 2004) a alors repris et développé l’hypothèse de Rizzolatti et Arbib (1998), en soulignant le rôle crucial de l’imitation dans le développement du langage humain : autrement dit, la capacité d’imiter des actions complexes, propre à l’homme, constituerait « l’innovation clé » ayant permis l’apparition du langage articulé. Il formule particulièrement l’hypothèse selon laquelle un système miroir d’imitation simple chez les primates non humains, puis complexe chez l’homme, ait évolué à partir du système miroir de reconnaissance des actions. Ce système basé sur l’imitation aurait alors jeté les bases de la communication manuelle, précurseur du langage. Un scénario d’évolution en 7 étapes a été proposé (Arbib, 2002) :

  • les trois premières étapes caractériseraient les primates non humains :
    • préhension.
    • système miroir de préhension (i.e. appariement entre exécution et observation des actions).
    • système miroir d’imitation simple (i.e. copie de séquences courtes d’actions ; présent chez l’ancêtre commun du chimpanzé et de l’homme).
  • les trois étapes suivantes distingueraient les Hominidés des primates non humains :
    • système miroir d’imitation complexe (i.e. capacité à reconnaître les actions d’autrui comme un ensemble d’actes familiers et à les copier).
    • système de communication manuelle ou « protosigne », conduisant à la formation d’un répertoire « ouvert » en opposition au système « fermé » des vocalisations des primates. Ce protosigne reposerait sur la capacité à mimer des actions et à créer des gestes conventionnels permettant de désambiguïser ces pantomimes.
    • protolangage, résultant de la capacité des mécanismes de contrôle du protosigne à contrôler l’appareil vocal avec une plus grande flexibilité.
  • enfin, la dernière étape, à savoir le langage au sens où nous l’entendons généralement, n’impliquerait aucune évolution biologique particulière mais résulterait d’une évolution culturelle survenue chez l’Homo sapiens sapiens.

En conclusion, ces modèles apportent un renouveau à l’hypothèse d’une origine motrice du langage, en suggérant que le système miroir, impliqué dans la reconnaissance des actions chez les primates non humains, constitue le substrat neurophysiologique à partir duquel le langage humain aurait évolué. L’imitation jouerait notamment un rôle capital dans le développement de cette faculté. Ce scénario d’évolution semble le plus probable à l’heure actuelle, les neurones miroir constituant « le lien manquant permettant d’unir motricité manuelle et contrôle de la parole » (Arbib, 2002). L’hypothèse des neurones miroir s’accorde également avec la théorie de la perception motrice du langage, en « fournissant, pour la première fois, l’exemple d’un lien physiologique entre perception et production » (Studdert-Kennedy, 2000). Autrement dit, les neurones miroir apporteraient les « premières preuves neurologiques concrètes » de l’existence d’habiletés cruciales à l’émergence du langage humain. Si l’idée du système miroir comme fondement du langage est attrayante, elle requiert toutefois une preuve plus probante : l’existence d’un tel système chez l’homme.