3.4.1. Présentation quantitative des types de lignes des corpus

Les corpus recueillis sont de tailles différentes ainsi que nous l'avons exposé à la section 3.2. Dans le tableau (3-4), nous présentons les informations quantitatives disponibles pour nos corpus quant aux différents types de lignes. La colonne LS "lignes système" comptabilise le nombre de lignes qui apparaissent en contrepartie des événements causés par les utilisateurs ainsi que cela a été détaillé à la section précédente. Les colonnes "lignes de message" (LM) et "lignes d'action" (LA) selon la distinction faite à ladite section ont été totalisées dans la colonne "interventions humaines" (IH). La dernière colonne représente le nombre de lignes total pour le corpus tous types confondus (TLC). Nous présentons dans les deux dernières lignes du tableau les totaux sur l'ensemble des corpus ainsi que les moyennes qui permettent de se faire une idée globale de leur volume.

Tableau (3-4) – Types de lignes : données quantitatives pour l'ensemble des corpus
 Corpus LS LM LA Totaux
IH
Totaux TLC
P1 447 121 1 122 569
F1 1206 342 11 353 1559
P2 276 451 22 473 749
F2 918 289 4 293 1211
P3 696 821 67 888 1584
F3 2501 1040 87 1127 3628
P4 534 344 22 366 900
F4 1849 668 34 702 2551
F5 2563 706 27 733 3296
P5 630 223 5 228 858
F6 2640 798 25 823 3463
P6 1696 853 20 873 2569
F7 6412 2572 77 2649 9061
P7 1204 576 12 588 1792
P8 494 368 10 378 872
P9 686 417 12 429 1115
F8 2630 1150 23 1173 3803
 totaux 27382 11739 459 12198 39580
 moyennes 1610,706 690,529 27,000 717,529 2328,235

On notera la part importante des lignes système comparativement aux lignes de messages et lignes d'actions, ainsi que le synthétise la Figure (3-1).

Figure (3-1) – Répartition des lignes par type sur l'ensemble du corpus
Figure (3-1) – Répartition des lignes par type sur l'ensemble du corpus

Cependant, si on détaille les données et compare les résultats pour chacun des canaux étudiés, on peut noter une différence de contenu.

Figure (3-2) – Répartition des lignes par type – Corpus F
Figure (3-2) – Répartition des lignes par type – Corpus F

En effet, pour le Corpus F, ainsi qu'on peut le constater sur la Figure (3-2), les lignes système sont en proportion très majoritaire. 26,48% seulement des lignes sont d'intervention linguistique humaine. Le Corpus P contient proportionnellement plus de lignes appartenant à l'activité de conversation, ainsi que le représente la figure (3-3).

Figure (3-3) – Répartition des lignes par type – Corpus P
Figure (3-3) – Répartition des lignes par type – Corpus P

Cette différence ne peut s'expliquer a priori et requiert qu'on mène l'analyse plus profondément. Ainsi, l'examen des mêmes propriétés sur chacune des sessions révèle des variations ainsi que le montre le tableau, présenté ci-dessous, détaillant les proportions pour chaque corpus.

Tableau (3-5) – Types de lignes : données proportionnelles pour l'ensemble des corpus
  lignes système
(%)
lignes de message
(%)
lignes d'action
(%)
P1 78,56 21,27 0,18
F1 77,36 21,94 0,71
P2 36,85 60,21 2,94
F2 75,81 23,86 0,33
P3 43,94 51,83 4,23
F3 68,94 28,67 2,40
P4 59,33 38,22 2,44
F4 72,48 26,19 1,33
F5 77,76 21,42 0,82
P5 73,43 25,99 0,58
F6 76,23 23,04 0,72
P6 66,02 33,20 0,78
F7 70,76 28,39 0,85
P7 67,19 32,14 0,67
P8 56,65 42,20 1,15
P9 61,52 37,40 1,08
F8 69,16 30,24 0,60

On remarque, il est vrai, une certaine constance à travers l'ensemble des corpus en ce qui concerne les traits de répartition des types de lignes. Cependant, on notera que certains des corpus manifestent des résultats inverses à la tendance générale (P3 et P2), comportant un nombre de lignes de messages et d'actions supérieur au nombre de lignes systèmes. L'influence de ces corpus sur les résultats du canal P n'explique qu'en partie la différence notée. Au sujet de cette dernière, à ce stade de l'examen des données, on est seulement en mesure de faire des hypothèses sur ses causes. On peut en effet supposer qu'un type de comportement générant des lignes systèmes, plus fréquent dans un canal que dans l'autre, génère ces résultats, ou bien que l'ensemble des comportements générant des lignes systèmes est en cause, ou encore qu'il s'agit d'une différence liée au type d'interaction verbale.