3.1.4 Particules préverbales

Catégorie représentée par le caractère Y. Font partie de cette catégorie toutes les unités qui peuvent se placer dans uns des quatre contextes suivants :

X __ [não] V X (dans le cas de pronoms personnels dans le rôle de sujet de la phrase : eu, tu ele, ela, nós, vós, eles elas ) ;
X [não] __ V X (dans le cas de pronoms personnels qui jouent le rôle d’objet direct de la phrase : o, a, os, as. Et les pronoms obliquos clitique jouent le rôle d’objet indirect : me, te, nos, vous, lhe, lhes) Exemple : Eu o vi. (Je l’ai vu)
X V-__ X (dans le cas de pronoms personnels qui jouent le rôle d’objet direct : o, a, os, as, lhe, lhes) Exemple : Quero vê-lo (je veux le voir)
X V-__- (terminaison do futuro do pretérito) Exemple : vendê-lo-ia (Je le vendrais )

Tout d’abord, le X représente un terme quelconque, il peut même ne pas exister. En ce qui concerne le contexte (c), quand la forme verbale finit en -r, -s, -z on supprime ce dernier caractère et le pronom clitique assume la forme lo, la, los, las respectivement à (o, a, os, as). Ces mêmes pronoms pourront prendre la forme no, na, nos, nas respectivement lorsque des formes verbales se terminent par une double voyelle nasale comme ão, õe, em, am (ão).

Exemples :

fazer (faire) => fazê- lo (le faire);

encontramo- lo em casa (nous le rencontrons chez nous.)

Põe-na (met la)

Tem-nos (il nos tient)

Le contexte (d) est moins courant, il apparaît davantage dans les textes littéraires, et dans les poèmes, mais peu semble-t-il dans les textes techniques. Cependant, il faut le prévoir.

En ce qui concerne les pronoms de la forme la, lo, las, los, na, no, nas, nos, même s’il s’agit d’une forme qu’équivalent à a, o, as, os il ne nous semble pas nécessaire de faire un pré-traitement car ce n’est pas une contraction, mais une ajoute de caractère. Nous allons garder chacune de ces formes dans la base de données LEXIQUE.

Les unités o, a, os, as sont homonymes des articles o, a, os, as. Il faut créer une valeur pour inclure dans la variable RG pour indiquer que ces formes sont de la catégorie Y lorsqu’elles précédent une forme verbale finie.

RG =: { VSV, NSP, PRE, NSD, ANA, PPN, TOD, PVF } où

PVF = indique que la forme qui précède un verbe fini est une unité de la catégorie Y. Cependant, si l’unité prise est la première unité de la phrase et précède un verbe, alors là nous avons plutôt un D qu’un Y.

Il faut tenir compte aussi d’une autre particule. Il s’agit de la particule « se ». Cette particule aussi classé comme un pronom, peut jouer le rôle d’objet direct, d’objet indirect ou de sujet. De même que les autres éléments de cette catégorie cette particule est toujours à côté du verbe, soit avant, soit après. Il est donc aussi une particule préverbale.

Ainsi, sont dans la catégorie Y les formes suivantes :

Y : {eu | tu | ele | ela | nós | vós | eles | elas | o | a | os | as | no | na | nos | nas | lo | la | las | los | lhe | lhes | se }

Il est facile de voir que les éléments de cette catégorie sont des éléments anaphoriques. C’est-à-dire, ils ont une source d’anaphore. Or, la résolution de la source de ces éléments n’est pas importante pour l’extraction des syntagmes nominaux, dans le contexte de l’indexation automatique car ils ne vont pas générer des nouvelles formes de SN, mais simplement répéter leur forme originale. Cela a été déjà sûrement indexé. Ainsi, pour la recherche d’information la résolution de ce problème n’aide pas beaucoup à améliorer la précision d’un résultat d’une demande d’information. Cependant, il fallait les résoudre dans le cas des études de cooccurrence des syntagmes nominaux, dans les cas de l’analyse de contenu puisque le comptage ou non d’occurrences de SN peuvent avoir une influence importante dans le résultat de l’analyse.

Le problème des anaphores est connu, nous n’allons cependant pas nous y approfondir.