2. Les données

Avons-nous donc choisi des données ? Oui, dans la mesure où la quantité (ou fréquence des enregistrements, qui peut être mensuelle, bimensuelle, hebdomadaire) et la qualité des enregistrements (vidéo et son d’assez bonne qualité : nous avons dans la mesure du possible exclu les données où la vidéo ne permettait pas véritablement d’observer les interactions, la dimension multimodale de l’échange) étaient suffisantes : nous n’avions au départ pas d’autre exigence que celle de pouvoir observer le développement langagier de plusieurs enfants, dans deux langues différentes. En lien avec le sujet qui nous occupe, il nous a semblé important de travailler avec des enregistrements vidéo, pour pouvoir observer ce que font les enfants en situation. Nous reviendrons sur ce point qui nous semble important, même si d’autres travaux antérieurs sur l’expression du mouvement n’ont pas systématiquement lié les productions verbales analysées à leurs contextes de production. Pour toutes ces raisons, les corpus de Lyon et de Providence correspondent bien aux besoins de notre étude : ils sont tous deux constitués d’enregistrements vidéo au moins bimensuels, et ont été constitués selon des procédures comparables, ce qui en fait une excellente fenêtre d’observation comparée. Nous avons, enfin, choisi des enfants au sein des corpus, ou plutôt : nous avons éliminé certains suivis longitudinaux, comme il s’avérait que les données étaient plus difficiles à analyser, pour des raisons objectives, techniques ou parfois personnelles (peut-être certains styles d’interactions nous étaient-ils plus familiers, plus compréhensibles). Ainsi au sein du corpus de Providence, nous avons d’emblée éliminé Ethan qui présentait un syndrome d’Asperger (diagnostiqué lorsque l’enfant a eu cinq ans), mais aussi Alex, dont le développement langagier était beaucoup plus lent que celui des autres enfants (les inventaires du développement communicationnel le situent dans le 15ème centile à 2 ans). D’autre part, la langue des parents d’Alex et de Violet, caractéristique du sud de la Nouvelle-Angleterre, diffère légèrement de l’américain standard (Song, Sundara & Demuth, 2009). Mais au-delà de ces facteurs objectifs, nous avons aussi eu de plus grandes difficultés à travailler sur Lily ou sur Violet, qui étaient très souvent hors champ, et dont les mères semblaient moins à l’aise avec la caméra. Dans le corpus de Lyon, les inventaires montrent que Nathan reste largement au-dessous du dixième centile jusqu’à trente mois, et notre choix de Marie et de Théotime a ensuite été en partie influencé par une étude précédente (Chenu & Jisa, 2006) qui montrait à la fois des rythmes développementaux comparables et des trajectoires différentes chez ces deux enfants.

Certaines analyses du chapitre suivant ont été faites sur davantage d’enfants, mais pour les analyses plus détaillées, nous en avons retenu deux dans chaque corpus, de sexes différents, en nous assurant de la relative homogénéité des données (ci-dessous). Il s’est donc plutôt agi de faire un choix parmi les données, choix qui, à aucun moment, n’a été fonction de notre sujet. C’est bien plutôt notre analyse de l’expression du mouvement qui a été constamment façonnée par la nature et le contenu des données.

Nous souscrivons donc pleinement à l’analyse que faisait H.Sachs de sa pratique, qui n’est pas sans rappeler le « hypotheses non fingo » de Newton : ce sont plutôt les données qui imposent les questions de recherche et hypothèses que l’on peut formuler. Nous montrons cependant dans ce qui suit que les transcriptions et l’ensemble des analyses préliminaires ne sont jamais neutres, c’est pourquoi il importe de bien en définir et d’en circonscrire l’impact.