L’avantage des productions naturelles tient au fait qu’elles obligent le chercheur à confronter sa technique d’analyse au réel observé tel qu’il se présente, plutôt que de construire des exemples fictifs ou de choisir des échantillons partiels qui donnent raison au modèle théorique privilégié (Dumas & Hmed, 2003 : 301). C’est la raison pour laquelle cinq corpus de données authentiques, recueillis dans une librairie-papeterie-presse, un tabac-presse, une banque, un bureau de poste et un service de l’état civil d’une mairie, servent de base à cette étude comparative de corpus – « corpus » étant entendu comme un ensemble fini d’énoncés réels. L’enregistrement des données se donne comme but explicite de préserver les traits caractéristiques de l’interaction afin de pouvoir les soumettre à analyse. La technique retenue pour procéder à ces enregistrements doit être choisie méthodiquement car les données ainsi recueillies sont configurées par la technologie à laquelle recourt le chercheur (Mondada, 1998 : 61). Les participants peuvent être plus ou moins perturbés par la présence d’une caméra ou d’un micro imposant, car comme le note très justement Aston,
‘speakers who are aware of being recorded tend to modify their speech styles (1988a : 5). ’Les interactions naturelles qui composent les corpus ont donc été recueillies sur des bandes audio, et à micro caché 46 .
Un corpus vidéo a été enregistré, en caméra cachée, à la librairie-papeterie-presse en avril 2002. Certains passages du corpus vidéo seront parfois utilisés pour illustrer des propos qui ne peuvent l’être par les transcriptions des bandes audio. L’autorisation des cliagers a été sollicitée après coup. Il sera néanmoins utile parfois, pour illustrer certains propos, d’avoir recours à des enregistrements pour lesquels l’autorisation des cliagers n’a pu être obtenue. Dans ce cas, les visages des cliagers seront masqués.