Lorsqu'une recherche d'information était faite dans la première maquette, cherchant toujours l'information à partir des centres des syntagmes nominaux. Or, nous avons constaté qu’ils ne sont pas suffisant pour trouver l’information, car on risque d’avoir quelque taux de silence (nombre de références ou documents pertinents manqués à la suite d’une recherche d’information, alors qu’ils existent dans la base de données). Usuellement cela arrive avec les syntagmes nominaux composés d’une expansion prépositionnelle, comme par exemple : Os sistemas de informação.
Le centre du syntagme nominal est : sistemas. Or, bien que le mot informação, dans ce cas, ne soit pas le centre du syntagme, il est quand même important dans la recherche d'information. Lorsqu'on fait la recherche à partir du centre du syntagme nominal informação, on ne trouve pas les documents indexés par le syntagme nominal os sistemas de informação. Cela produit des taux de silence. Pour résoudre ce problème on propose la création d’une figure de « centre complémentaire des syntagmes nominaux ». Ce sont des mots qui ont une importance égale aux centres des syntagmes nominaux.
Du point de vue linguistique ces types de syntagmes nominaux (les systèmes d’information, le stockage d’information) sont réécrit comme étant.
Etant donné qu’il s’agit de trois N, tous des prédicats libres et que ce mot est aussi un mot composé, il nous semble raisonnable de prendre aussi les deux autres N comme une sorte de centres de syntagme nominal (dans le cas Systèmes d’information, le centre du syntagme est systèmes et les mots information et systèmes d’information jouent aussi le rôle de centre du syntagme nominal). Ce qu’on nomme centres complémentaires de syntagme nominal de premier niveau.
Du point de vue de la maquette, il faut créer une structure capable de permettre la recherche non seulement à partir des centres de syntagmes nominaux, mais aussi à partir des centres complémentaires des syntagmes nominaux. Pour cela, il y a deux solutions possibles : a) créer une table de mots complémentaires composés de mots qui ne sont pas des centres de syntagmes nominaux, mais qui sont quand même très importants pour la recherche ; b) inclure ces mots dans la TABLE CENTRE DU SYNTAGME.
La solution 'a' est plus intéressant du fait que la TABLE CENTRE DU SYNTAGME resterait intègre. Or, ce type de solution est cependant le moins performant car le système doit faire la recherche dans deux tables au lieu de la faire dans une seule.
La solution 'b' qui est moins intéressante du point de vue de la structure de données, montre qu’on pourra avoir des mots dans la TABLE CENTRE DU SYNTAGME qui ne sont pas vraiment des centres des syntagmes nominaux. Par contre, du point de vue de la performance du système de recherche d'information, c'est la solution la plus indiquée, car le système ne fera alors la recherche que dans une seule table.