V-1-4 - L’indépendance entre les modalités des propriétés de description des unités documentaires

La finalité de l’analyse précédente est double :

Les études ci-dessus montrent qu’il existe effectivement des dépendances entre les propriétés Forme discursive et Type d’UD d’une part, et Style et Type d’UD d’autre part. Ceci semble aller à l’encontre de notre hypothèse d’indépendance. Temporisons nos conclusions et précisons que les dépendances observées ne sont pas globales à toutes les modalités de chaque propriété mais seulement à quelque unes d’entre elles. Rappelons ce que nous avons observé au chapitre III14. La base est essentiellement constituée d’unités documentaires extraites de revues de presse fondamentale ou professionnelle, dont les auteurs sont souvent des universitaires spécialistes dans le domaine des sciences de l’information. Ce type d’écrits scientifiques ne nous est pas inconnu car il a été largement analysé dans la thèse de Ben Abdallah [BENA97]. Or, les dépendances entre modalités correspondent précisément à des régularités de rédaction qui sont facilement explicables. Avec le calcul du , nous avons vu que la dépendance entre certaines modalités des propriétés Forme discursive et Type d’UD était liée à la fonction informationnelle des parties de discours. La conclusion et la discussion par exemple, seront souvent écrites dans une forme discursive argumentative car leur rôle est précisément de convaincre le lecteur. L’AFC nous a de plus permis de voir émerger les trois fonctions informationnelles principales d’un discours scientifiques: la présentation générale du sujet, la description de l’étude réalisée, et l’argumentation de l’auteur. Cette dernière sert à valider le travail de recherche par l’acception du lecteur. La dépendance entre certaines modalités des propriétés Style et Type d’UD est lié à la nature de l’information présentée. Il est par exemple évident que des résultats numériques seront présentés sous forme « données numériques » ou éventuellement « littéraires + données numériques » si l’auteur prend le soin d’y adjoindre des explications ou analyses complémentaires.

La base de données analysée ne présente pas d’autres dépendances que celles que l’on peut observer dans toute production d’écrits scientifiques et techniques. Nous pouvons donc en conclure que notre manière de caractériser les parties de discours, même si elle est manuelle et donc liée à la subjectivité de la personne qui effectue le traitement, n’introduit pas de biais.

De plus, si nous considérons que la caractérisation des unités dans le système se fait dans un but d’usage pour le lecteur, nous voyons que nous ne sommes plus en contradiction avec l’hypothèse de Profil-Doc. Il existe en effet des dépendances entre les propriétés qui s’expliquent parfaitement, comme nous l’avons fait ci-dessus, dans un univers de production d’information. Il n’est pas évident qu’elles influent directement et d’une manière représentative si l’on se place du coté du lecteur, dans un univers de récolte d’information. Les habitudes de lecture observées - permettant de spécifier les critères de filtrage - sont en effet dissociées des habitudes d’écriture. De plus, les dépendances observées portent sur les trois propriétés propres à l’unités documentaire, or nous filtrons l’information aussi sur les 11 propriétés propres au document. Les critères de tri portent en effet sur la description du document et de l’unité documentaire. Il n’est dans ces conditions pas certain que les dépendances des propriétés de l’unité documentaire, noyées dans d’autres critères de tri, aient une influence marquante. Nous pourrons affiner ces résultats en augmentant le nombre d’unités documentaires de la base.