2.4.3 - Les méthodes de traitement des données qui seront utilisées

Passons maintenant aux méthodes de traitement qui sont utilisées dans cette thèse. La méthode statistique ne s’impose pas et ce pour trois raisons : premièrement, même si les corpus SILFIDE et GALLICA sont importants, rien ne peut permettre de dire qu’ils couvrent TOUS les emplois d’un terme donné (c’est d’ailleurs un reproche que l’on peut faire à tous les corpus et ce n’est donc pas une caractéristique propre aux corpus utilisés par SILFIDE ou GALLICA).

Deuxièmement, nous n’avons pas un nombre suffisant d’informateurs sur les langues autres que le français ou l’anglais pour pouvoir nous appuyer de façon fiable sur des résultats statistiques ; troisièmement, ce n’est pas la fréquence d’un phénomène qui est pertinente dans le cadre de notre problématique, mais le simple fait de son existence.

Nous utilisons donc, outre le recueil et l’analyse du corpus, des méthodes linguistiques classiques et éprouvées, comme la variation. Nous nous appuyons également sur les travaux existants, tant en linguistique qu’en psychologie de la perception, pour analyser les données linguistiques fournies par les corpus et par les questionnaires.