Le but de cette proposition est de construire un SRI capable d’offrir aux usagers une façon plus agréable et conviviale de faire une recherche d’information, et aussi de donner des réponses plus précises à leurs demandes d’information.
En ce qui concerne la Procédure de Traitement d’Information (PTI), on a montré les problèmes entraînés par l’utilisation de mots comme descripteurs et les causes de ces problèmes. Ainsi suivant l’indication faite dans la conclusion du premier chapitre et tenant compte des raisons qui amenaient le groupe SYDO à proposer les syntagmes nominaux, ainsi que les concepts qui y sont liés, nous adopterons cette approche pour la proposition du nouveau SRI.
Mais, dans quelle mesure l’utilisation des syntagmes nominaux comme descripteurs peut-elle apporter la solution désirée ou supprimer les problèmes présentés par les SRI traditionnels ?
Tout d’abord, selon ce qu’on a montré dans le chapitre précédant et au début de celui-ci et conformément à ce que Michel LE GUERN et Richard BOUCHÉ ont affirmé dans leurs travaux, au sein du groupe SYDO, on est convaincu que le descripteur doit être un signe doté de valeur référentielle. Les syntagmes nominaux ne sont pas des signes sans référence. Bien au contraire des mots isolés, ils sont composés de mots dans un ordre donné et souvent avec des liaisons syntaxiques. Ces mots qui composent le syntagme nominal ne sont plus seulement des ensembles de prédicats ou de propriétés. Dans le syntagme nominal, chaque mot a son rôle bien défini, avec une signification plus spécifique. M. LE GUERN ainsi que Richard BOUCHÉ ont défini le syntagme nominal comme étant la plus petite unité du discours porteuse d’une valeur référentielle. On peut donc dire, que le syntagme nominal est la plus petite unité d’information dans un texte.
Cette opposition entre les mots en tant qu’unité du lexique, hors discours, et les mots qui font partie du discours, de manière générale et du syntagme nominal de façon plus spécifique, est bien caractérisée par Michel LE GUERN. D’abord le mot, en tant que mot de la langue, qu’unité du lexique, est au niveau N. Avant qu’il fasse partie du syntagme nominal le mot passe par un niveau intermédiaire (N’) où il prend ses valeurs sur l’univers du discours. La distinction entre ces deux niveaux c’est qu’au niveau N, le mot n’a qu’un ensemble de propriétés, il ne désigne aucun objet quel qu’il soit. Il n’y a donc aucune référence à un objet du monde réel. Tandis que lorsqu’il est au niveau N’, il désigne un objet ou au moins il fait référence à une classe d’objets.
Michel LE GUERN dit que le syntagme nominal est la mise en œuvre de deux organisations logiques différentes. Au niveau N, on a l’intervention de la logique intensionnelle. La logique intensionnelle est une ‘ « logique sans référentiel et sans classe, constituée de relations et de propriétés envisagées indépendamment de quelque objet que ce soit » ’ 45 . Tandis qu’au niveau N’, il relève de la logique extensionnelle, car il prend ses valeurs sur un univers du discours. Là on peut envisager une classe d’objets. ‘ « Le passage du niveau N au niveau N’ correspond à la prise en compte d’un univers donné, au surgissement de la référence, à la possibilité de déterminer des classes, au moins virtuelles ; c’est le basculement de la logique intensionnelle à la logique extensionnelle ; c’est la mise en relation des mots et des choses.» ’ 46 . On appelle ce qui appartient au niveau N des prédicats libres et ce qui appartient au niveau N’ des prédicats liés. Le niveau N’’ correspond à la fermeture logique du syntagme nominal étant donné l’ajout d’élément déterminant, c’est la complète référence à un objet donné.
Dans la figure 2.1, nous essayons de montrer la distinction entre l’intervention de la logique intensionnelle et celle de la logique extensionnelle dans la construction d’un syntagme nominal. Dans cette figure on voit de manière résumée la construction d’un syntagme nominal. C’est la manière dont l’auteur décrit un objet ou un fait. Lorsqu’il prend les mots et les rassemble dans une phrase, ces mots prennent des sens spécifiques. Les mots en tant qu’unités du lexique sont des ensembles de propriétés, ils ont une panoplie de significations possibles, ce qui donne du choix. Ils relèvent d’une logique intensionnelle. Lorsqu’ils prennent une signification précise dans l’univers du discours, ils relèvent d’une logique extensionnelle.
La logique intensionnelle est caractérisée par des éléments libres, généraux, qui peuvent désigner une ou plusieurs choses selon leurs propriétés. Tandis que la logique extensionnelle fait juste le contraire, elle caractérise les éléments qui ont des sens spécifiques, ils désignent une classe d’objets.
Il est clair maintenant que la procédure d’indexation automatique traditionnelle, lorsqu’elle extrait les mots pour construire le fichier INDICES, fait la démarche inverse de celle de l’auteur. C’est-à-dire qu’on part d’un état où on avait l’intervention de la logique extensionnelle vers un autre état où on revient à avoir l’intervention de la logique intensionnelle. En d’autres mots, la liste perd le contexte ou le sens spécifique existant dans le document donné par son auteur au moment de son écriture. Ainsi, l’indexation traditionnelle c’est le basculement de la logique extensionnelle vers la logique intensionnelle. Or le rôle de l’indexation n’est pas cela : elle devrait être une procédure de repérage de pistes capables de caractériser les documents pour la recherche d’information. Pourtant, la procédure d’indexation par mots n’extrait pas des pistes pour retrouver les documents puisque les mots extraits perdent leur valeur référentielle au moment de leur détachement du texte. Les pistes, résultat de la procédure de l’indexation en tant que valeur référentielle devraient être fidèles à leur origine pour qu’on puisse retrouver les documents à posteriori.
Ainsi, les syntagmes nominaux peuvent jouer le rôle de descripteurs dans un SRI car ils constituent des unités d’information, ils font référence à des objets de la réalité extralinguistique de l’auteur, ils gardent les sens originaux que l’auteur leur a donnés lors de l’écriture du document. De plus, les syntagmes nominaux enlèvent les ambiguïtés qu’on a lors de l’utilisation de mots comme descripteurs. Or, on a encore l’ambiguïté due au domaine de la connaissance puisqu’on peut trouver le même syntagme nominal dans des domaines différents. Mais ce genre de problème peut être résolu au fur et à mesure qu’on fait la séparation des documents, en créant des bases de données spécialisées par domaines bien précis.
Michel LE GUERN. « Un analyseur morpho-syntaxique pour l’indexation automatique ». Le Français Moderne. Juin, 1991, t. LIX, n°. 1, p. 28.
Ibidem p. 28.