3.3.2 Constitution du vocabulaire non terminal N (les prédicats nominaux)

Après la réduction des adjectifs nous avons travaillé dans la réduction des N. Avant de discuté ce genre de réduction, il faut rappeler la composition d’un N : N N0

  1. N  N + <,> + N | N + C + N où C e | ou Exemple : a análise, interpretação, avaliação e comunicação da informação pelos meios convenientes (L’analyse, l’interprétation, l’évaluation et la communication de l’information par les moyens appropriés) La description de ce SN est : D’ + N + <,> + N + <,> + N + C + N + P + D’ + N + P + D’ + N + A Appliquant N  N + <,> + N, la description peut être réécrite comme : D’ + N + <,> + N + C + N + P + D’ + N + P + D’ + N + A Appliquant encore la même règle, nous obtiendrons la description suivante : D’ + N + C + N + P + D’ + N + P + D’ + N + A Enfin, appliquant la règle N  N + C + N, nous arrivons à la description suivante : D’ + N + P + D’ + N + P + D’ + N + A Après quelques essais sur le corpus de SN, nous avons appris que le bon ordre était d’abord la réduction des A, puis des N et c’est seulement après cela que nous pouvons faire d’autres réductions comme l’utilisation des règles des syntagmes prépositionnels et d’expansions prépositionnelles. Autres exemples de suite coordonnés de N :

En ce qui concerne les suites coordonnées, soit d’adjectifs, soit de noms, il nous semble important non seulement de prendre le SN complet, avec les suites coordonnées, mais de faire un pré-traitement de manière à prendre les syntagmes nominaux formés à partir de chaque nom ou adjectif de la suite coordonnée. Dans la mesure où la proposition de cette recherche est de construire un Système de Recherche d’Information Assisté par Ordinateur, où nous allons privilégier l’interaction homme-machine, il faut présenter tous les syntagmes nominaux possibles ; même qu’on propose parfois de faux syntagmes nominaux, l’utilisateur saura distinguer les bons SN. Il nous semble que cette solution est préférable car elle évite l’alourdissement du système à cause des algorithmes de levée d’ambiguïté. Sachant, encore, au préalable, qu’assez souvent nous aurons du mal à trouver la bonne solution ou les bons syntagmes nominaux.

Il est vrai que les travaux menés par Omar LAROUK dans sa recherche des suites coordonnées pourraient aider à résoudre les problèmes de coordination de noms, adjectifs et même de syntagmes nominaux. Mais, nous avons décidé d’adopter une solution plus simple en prenant en compte les caractéristiques de notre proposition de système de recherche d’information.

Sur la coordination de deux N, comme nous l’avons déjà signalé, il a fallu veiller à la procédure de remplacement d’une telle suite. L’exemple suivant peut montrer un des problèmes rencontrés dans cette procédure :

A relação entre biblioteconomia e ciência da informação
(Le rapport entre la bibliothéconomie et la science de l’information.)
On réécrit ce syntagme nominal sous la forme suivante :
D’ + N + P + N + C + N + P + D’ + N

Nous sommes tentés de faire, d’emblée, deux sortes de réduction D’ + N pour N’’ étant donné que N est un cas particulier de N’ et dans la mesure où D’ + N’ décrit un syntagme nominal, nous pourrions donc le remplacer par N’’. L’autre réduction était N + C + N, car la coordination de deux nominaux a comme résultat un nominal (N). Pourtant, cette deuxième règle ne peut pas être appliquée d’emblée puisque nous ne pourrions pas réduire simplement Bibliothéconomie et science. Le mot science a un complément nominal (information) qu’il faut prendre en compte. Il faut donc réduire l’expression ciência da informação (science de l’information) avant la résolution de la coordination des nominaux N + C + N. Ainsi, nous arrivons à :

Nous rencontrons là un autre problème, en fait ce qui était une coordination entre deux N, était en réalité la coordination entre un N et un N’. Une fois encore, cette constatation nous a forcé à augmenter le soin dans la procédure de réduction des règles. Mais ici, la question qu’on se pose est de savoir si l’on peut coordonner deux éléments de niveaux différents.

Omar LAROUK 146 reprend une définition de G. ANTOINE, qui à son tour a repris la définition de BOËSE qui dit que ‘ « La coordination renferme une série de termes situés sur le même plan » ’.

Une autre définition par la coordination a été donnée par G. ANTOINE : ‘ « On a une coordination lorsqu'il y a mise en ordre de deux termes (membres) ou davantage équilibrés ou harmonisés dans un ensemble créant entre eux une unité relative » 147 .

Maurice GREVISSE (1986, p. 382) définit : ‘ « La coordination est la relation, explicite ou implicite, qui unit des éléments de même statut : — soit des phrases, soit, à l'intérieur d'une phrase, des termes qui ont la même fonction par rapport au même mot » 148 .

Ces interprétations nous ont amenés à la réflexion suivante : est-ce que le terme « science de l’information » est-il une expression figée comme la rose des vents ?

M. LE GUERN rappelle que dans le terme la rose des vents, malgré l’existence d’un article après la préposition, on ne retrouve plus le syntagme « les vents ». Selon lui, ‘ « la lexicalisation de l’expression fait que l’article les (des = de + les) ne porte plus ici le présupposé d’existence. » 149 . Selon lui, le résultat de cette lexicalisation fait que l’objet désigné par le syntagme figée n’a rien à voir avec les mots qui le composent. Dans ce cas, le syntagme nominal désigne un objet qui n'a rien à voir ni avec la rose ni avec le vent. En ce sens, nous ne pouvons pas faire la même analogie avec le terme « science de l’information », car dans ce terme existe le rapport avec la science et avec l’information.

Émile BENVENISTE appelle ce genre d’expression comme des synapses. Lesquelles selon lui, elles sont caractérisées par : ‘ « 1° la nature syntaxique (non morphologique) de la liaison entre les membres ; 2° l’emploi de joncteurs à cet effet, notamment ‘de’ et ‘à’ ; 3° l’ordre déterminé + déterminant des membres ; 4° leur forme lexicale pleine, et le choix libre de tout substantif ou adjectif ; 5° l’absence d’article devant le déterminant ; 6° la possibilité d’expansion pour l’un ou l’autre membre ; 7° le caractère unique et constant du signifié. » 150 .

Nous voyons que le terme « science de l’information » ne peut pas être considéré comme une expression figée ou une synapse car il y a un article devant le mot déterminant (information). Il ne présente pas la septième caractéristique citée plus haut, comme l'avait déjà signalé M. LE GUERN.

D’autre part, nous pouvons supposer que le terme « bibliothéconomie » ait un statut de N’ car il s’agit d’un nom abstrait ; de plus il est aussi le nom d’un domaine de connaissance. Et, selon ce que nous avons vu dans le chapitre 7, les noms propres et les noms abstraits ont le même comportement, ils désignent un objet précis dans le discours, donc ils n’exigent pas l’article. Il nous semble donc raisonnable de prendre le terme bibliothéconomie comme un syntagme nominal avec déterminant zéro. Et, en tenant en compte les règles d’utilisation des articles dans la langue portugaise, en cas de coordination des éléments de même nature, nous pouvons aussi considérer le terme « science de l’information » aussi comme un syntagme nominal avec déterminant zéro. Ainsi, il ne s’agit pas ici d’une coordination de deux prédicats libres, mais de deux syntagmes nominaux, ce qui donne la description suivante :

Cet exemple nous a montré le soin à apporter à l’application des règles de réduction qui ne peut se réduire de manière automatique à une simple opération couper-coller. De plus, cette analyse renforce l’importance de caractériser les noms abstraits comme tels. C’est-à-dire que nous justifions par-là l’importance de la variable VN laquelle indique si un FNOM est un nom concret ou abstrait.

Ayant montré le problème principal de la méthodologie adoptée dans cette recherche, il faut ajouter que les règles ne sont pas appliquées une seule fois sur le corpus de SN, mais plusieurs fois, car après l’application successive de ces règles, de semblables descriptions peuvent réapparaître.

À ce moment là, certaines descriptions ou même partie de descriptions pouvaient être regroupées comme des syntagmes nominaux puisqu’il y avait des descriptions sous la forme :

D’ + N et D’ + N’

Etant donné que N est un cas particulier de N’ nous les avons, dans ce cas, remplacés par N’ et ensuite nous avons appliqué, sur tout le corpus de SN, la règle générale :

N’’
 D’ + N’
Notes
146.

Omar LAROUK. Extraction de connaissances à partir de documents textuels : traitement automatique de la coordination (connecteurs et ponctuation). Thèse de doctorat. Lyon : Université Claude Bernard – Lyon I, 1993. p. 56.

147.

Citation extrait de la thèse d’Omar LAROUK, p. 57

148.

Maurice GREVISSE. Le Bon Usage. 12ème édition. Editions DUCULOT, 1986. p. 382.

149.

Michel LE GUERN. « Un analyseur morpho-syntaxique pour l’indexation automatique ». IN. : Le français Moderne. p. 31.

150.

Émile BENVENISTE. Problèmes de linguistique générale, 2. Collection Tel. Paris : Editions Gallimard, 1974, p. 172-173.