8.2 Méthode

8.2.1 Comptage

Nous avons choisi de retenir comme marques de la personne les pronoms de première deuxième et troisième personne. Cette prise en compte concerne à la fois les formes clitiques et non clitiques. Les formes rencontrées dans le corpus ont été les suivantes : je, me tu, te, il, elle, on, se, nous, vous, elles, ils auxquels nous avons ajouté moi et toi. La forme on regroupe à la fois les occurrences on et l’on et la forme il ne recouvre pas les formes impersonnelles. Nous avons également inclus les pronoms anaphoriques personnels, démonstratifs et adverbiaux : celle, celles, celui, ceux, la, le, les, leurs, lui, leur, y, en. La forme le rassemble toutes ses variations. Nous reviendrons plus loin sur le statut particulier de y. Enfin, nous avons retenu les adjectifs possessifs atones : mon, ma, mes, tes, son, sa, ses, nos, notre, vos et les pronoms possessifs : mienne, nôtre.

Le corpus a été séparé en fichiers distincts, huit pour chaque sujet, correspondant à chacune des huit catégories. Ce séquençage nous a permis de conserver les plans d’analyse selon la consigne et la catégorie, utilisés aux deux premières étapes de notre analyse (chapitres 6 et 7). Chaque fichier a fait l’objet d’un traitement automatique par le logiciel CONC 1,80b3, qui à partir d’un classement alphabétique, contextuel et par nombre d’occurrences, a permis à la fois le comptage des occurrences des marques de la personnes et la prise en compte du contexte dans lequel elles apparaissaient. Ainsi, avons-nous relevé 1515 occurrences de marques de la personnes dans le ’corpus-témoins’ et 4536 dans le ’corpus-patients’. Toutes les occurrences de marques de la personne ont été retenues, même celles qui constituaient des hapax.

La répartition de ces occurrences est la suivante :

Tableau 40 : Marques de la personne relevées dans le corpusNb. D’occ. = Nombre d’occurrences ; % = pourcentage par rapport au nombre d’occurrences dans chaque corpus.
Formes Témoins Patients
Nb. d’occ. % Nb. d’occ. %
celle 1 0,07 1 0,02
celles 1 0,07 1 0,02
celui 1 0,07 4 0,09
ceux 2 0,13 0 0,00
elle 26 1,72 109 2,40
elles 3 0,20 9 0,20
en 81 5,35 382 8,42
il 50 3,30 145 3,20
ils 23 1,52 70 1,54
je 873 57,62 2154 47,49
la 17 1,12 94 2,07
le 51 3,37 166 3,66
les 10 0,66 44 0,97
leur 0 0,00 14 0,31
leurs 0 0,00 1 0,02
lui 2 0,13 11 0,24
ma 2 0,13 15 0,33
me 45 2,97 186 4,10
mes 1 0,07 11 0,24
mienne 0 0,00 1 0,02
moi 100 6,60 263 5,80
mon 8 0,53 25 0,55
nos 1 0,07 4 0,09
notre 0 0,00 2 0,04
nôtre 0 0,00 1 0,02
nous 8 0,53 14 0,31
on 142 9,37 603 13,29
sa 1 0,07 5 0,11
se 38 2,51 108 2,38
ses 0 0,00 5 0,11
son 2 0,13 6 0,13
te 0 0,00 2 0,04
tes 0 0,00 2 0,04
toi 0 0,00 2 0,04
tu 0 0,00 7 0,15
vos 0 0,00 2 0,04
vous 9 0,59 27 0,60
y 17 1,12 40 0,88
Total : 1515 100 4536 100

On remarque que les formes les plus employées dans le discours des deux groupes sont la forme je (57,62 % pour les ’témoins’ et 47,49 % pour les ’patients’), suivie de on (9,37 % pour les ’témoins’ et 13,29 % pour les ’patients’). Ensuite l’ordre diffère quelque peu : moi (6,6 %) et en (5,35 %) pour les ’témoins’ en (8,42 %) et moi (5,8 %), pour les patients ; le (3,37 %), il (3,3 %), me (2,97 %) pour les ’témoins’, me (4,1 %), le (3,66 %), il (3,2 %) pour les ’patients’. Les autres formes représentent chacune moins de 3 % du total des formes produites.