Cette étape de l’étude a été la plus importante et aussi la plus longue à travailler car il a fallu analyser et procéder à des changements dans les descriptions de SN. L’établissement d’une méthodologie de travail a été très important dans la procédure d’analyse et d’application de règles de réduction. Il a fallu même tester l’application de règles de réduction plusieurs fois sur tout le corpus. Ceci provient de mauvaises décisions prise initialement, comme celle de supposer que tous les mots composés seraient mis dans le lexique. Ainsi le travail a dû être remis plusieurs fois sur l’ouvrage. Au bout du compte, il nous semble que nous sommes arrivés à un bon modèle. La grammaire que nous avons construite peut reconnaître au moins 90% de SN. Nous pensons même qu’avec cette grammaire, nous pouvons arriver à reconnaître un pourcentage de SN plus élevé, puisque nous sommes arrivés à cette valeur, en comptant seulement les descriptions qu’ont une fréquence supérieure à 2. Or, nous avons parmi les descriptions dont la fréquence est inférieure à 2 des descriptions qui peuvent être reconnues par la grammaire que nous venons de construire. Malgré l’existence prédominante, parmi ces descriptions, éléments qui appartiennent à la catégorie Q e V, et aussi d’autres problèmes que nous avons déjà signalés, certaines descriptions ne se compte pas avec ces derniers éléments (Q et V). Ce sont les descriptions des SN de plus haut niveau.
En tenant compte du but de ce travail, il nous semble que le pourcentage de reconnaissance de 90% des SN est satisfaisant. Pour résoudre un peu moins de 10% des descriptions du corpus de SN, l’effort serait tellement important qu’il paraît difficile de l’entreprendre actuellement. En outre, dans les SN qui ne sont pas reconnus par notre grammaire, leur importance, pour l’indexation automatique et la recherche d’information, n’est pas certaine.
Ont-ils un statut de descripteur ? C’est ce qu’il faut savoir avant de chercher à établir une grammaire spécifique qui privilégie les pronoms relatifs, les conjonctions de subordination, les verbes.
La seule mesure que nous avons pour le moment, est que ces SN ne représentent qu’environ 10% de tous les SN extraits du corpus d’articles. Et de plus, une grande partie des configurations de ces SN n’a qu’une fréquence égale à 1. Bien que nous ne puissions pas donner une réponse définitive et sûre, avec ces arguments seulement, il nous semble que ces nombres montrent surtout la faible occurrence de ces SN par rapport aux SN qui peuvent être reconnus par la notre grammaire.
‘
La vie est l'art de tirer des conclusions suffisantes de prémisses insuffisantes
’.
(Life is the art of drawing sufficient conclusions from insufficient premises.)
Butler (Samuel),[1835 - 1902], Notebooks.