5 Centres des syntagmes nominaux et ses flexions

Dans la première version du système de recherche d'information on a laissé les centres des syntagmes nominaux tels qu’ils sont apparus dans les syntagmes et dans le corpus. On s’est aperçu, en exploitant le système, que les résultats étaient faibles lorsqu'on essayait de chercher des syntagmes nominaux dont le centre était informação. Le système trouvait a informação, a informação científica, a informação técnica, etc. Or, le système ne trouvait pas des syntagmes comme : as informações, as informações científicas, as informações industriais, as informações organizacionais, as informações técnicas, etc. On avait encore de taux de silence !

Pour résoudre ce problème nous avions considéré deux solutions possibles : 1) la mise en œuvre des opérateurs de troncature ; et 2) le traitement des flexions, en nombre et en genre, des centres de syntagmes nominaux en créant une table de mots qui soit équivalente aux centres des syntagmes nominaux.

La solution de mise en œuvre des opérateurs de troncature n’est pas bonne car on il existe des mots dont la flexion n’est pas faite à la fin. Cette solution ne peut donc résoudre que partialement le problème. C’est pourquoi nous avons choisi la deuxième solution.

Quoi qu’il en soit, dans un système d’information, nous trouvons important de conserver les deux solutions, puisqu’elles rendront le système plus souple et les résultats auront moins de silence ; dans cette étape de la recherche d'information, l'augmentation du « bruit » (proportion de références ou documents non-pertinents trouvés à l’aide d’une recherche d’information) est plus intéressante et souhaitable qu'un taux élevé de silence. Cela se justifie parce que l'usager, à ce moment de la recherche, est en train de choisir les syntagmes qui appartiennent encore au premier niveau et cela suppose un plus grand choix. On voit ici l’importance de l’interaction entre le système de recherche d’information et l’utilisateur.

Après l’implémentation de la solution choisie et l’exploitation de la maquette en vérifiant la navigation dans l’arborescence des syntagmes nominaux, nous avons observé l’apparition de plusieurs syntagmes nominaux de même signification mais ayant une composition différente ou une flexion en nombre. Exemple : à partir d’une demande utilisant le mot informação en tant que centre de syntagme nominal, on trouve des syntagmes nominaux comme a informação, as informações, informações parmi d’autres syntagmes nominaux associés à ce centre de syntagme nominal. Si l’on veut connaître tous les syntagmes nominaux de deuxième niveau associés au syntagme nominal a informação, il faut chercher aussi les syntagmes nominaux associés à as informações et informações aussi, étant donné qu’ils font référence au même sujet. Cependant la maquette n’offrait pas cette possibilité.

Une solution possible, serait de développer une simulation de l’opérateur booléen « ou », étant donné que l’interface développé est orientée par menus.