1. 2. Les données « naturelles » et autres types de données. Leur transcription

C. Kerbrat-Orecchioni remarque que les données analysées doivent être abondantes et pour la plupart « naturelles »; toutes les généralisations doivent être fondées sur l’examen scrupuleux et détaillé d’« épisodes réels d’interactions »; les constructions théoriques doivent être mises au service exclusif des données empiriques, et non l’inverse. Par données (ou « corpus ») elle entend tout échantillon de discours-en-interaction supposé représentatif du/des phénomène(s) à étudier. Les données « naturelles » existent en l’état indépendamment de leur exploitation pour la recherche. La meilleure façon de les « fixer » en vue de l’analyse est évidemment l’enregistrement (audio ou vidéo). Les données « élicitées » sont au contraire provoquées par le chercheur; par exemple, les récits produits en situation d’entretien et qui sont fournis en réponse à une question de l’informateur. Sans être « naturelles », les données ainsi obtenues peuvent être dites « authentiques ». La méthode est utilisée surtout pour comparer dans différentes langues et cultures la formulation de certains actes de langage (requête, excuse, remerciement ou compliment). La validité des résultats obtenus est relative, car la contextualisation reste sommaire, ce qui entraîne une sur-représentation des formulations les plus stéréotypées.

Dans le cas des données « naturelles », aussi bien que dans le cas des données « élicitées », on a affaire, selon C. Kerbrat-Orecchioni, à des productions réalisées dans des situations plus ou moins naturelles ou artificielles, mais par des personnes réelles. La dernière catégorie de données comprend d’une part les exemples inventés par le chercheur, c’est-à-dire puisés dans sa compétence acquise en tant que praticien de la langue, et d’autre part, les exemples empruntés à des œuvres de fiction, écrites ou orales (roman, théâtre, cinéma, sketches, etc.). On peut y assimiler la technique des jeux de rôle, à laquelle on recourt surtout lorsqu’il est trop difficile d’obtenir des données authentiques, par exemple pour analyser le fonctionnement des entretiens d’embauche. Ces différentes catégories de données ne s’opposent pas de manière radicale. La méthode choisie doit être adaptée aux objectifs.

C. Kerbrat-Orecchioni détermine ainsi que la première tâche à accomplir par le chercheur en ADI consiste à réaliser la collecte des données pertinentes pour son objet de recherche. Ces données peuvent être récupérées ou produites par soi-même, avec ou sans présence de l’analyste, lequel peut être ou non un observateur participant, passif ou actif, etc. Comme il s’agit généralement de données orales, il faut ensuite les transcrire.

Les techniques de transcription varient, mais toutes recourent aux conventions orthographiques en usage, avec tout au plus quelques aménagements, le remplacement de la ponctuation par des symboles mieux adaptés à la représentation des pauses et de la prosodie, et éventuellement des indications sur certains éléments non verbaux. Le degré de précision de la transcription dépend des objectifs de l’analyse.

C. Kerbrat-Orecchioni observe que même la transcription la plus soignée n’offre jamais qu’une « interprétation » et une « reconstitution » des paroles prononcées. Le corpus sur lequel on travaille est en fait un objet double, puisqu’il est construit à la fois de l’enregistrement, qui est déjà une image appauvrie de l’interaction elle-même (surtout s’il n’est qu’audio), et auquel il faut toujours revenir; et de la transcription, sur laquelle il est plus facile de travailler, mais qui n’est jamais qu’un artefact, un simple outil pour l’analyste.