Il s’agit essentiellement d’une méthodologie expérimentale, qui a consisté à repérer les SN extraits du corpus dans le cadre de notre cours de DEA et en le décrivant selon la notation d’une grammaire hors contexte. Au tout début de cette tâche, ayant découvert quelques faux SN, nous avons fait une révision de tous les 6010 SN sans doublons, 28 faux SN ont été enlevés. Nous avons donc travaillé avec un corpus de 5.982 SN. Les symboles utilisés pour en faire la description sont ceux des catégories conçues dans le chapitre 9. Nous sommes ainsi partis des vocabulaires terminaux, représentés là par les SN, eux-mêmes, vers la grammaire hors contexte au moyen de la classification des mots. En fait les catégories ont fonctionné comme étant le basculement des vocabulaires terminaux vers les vocabulaires non terminaux.
L’idée initiale a été de trouver les règles les plus stables c’est-à-dire les plus fréquentes, à partir des descriptions de SN. Pour trouver ces règles il a fallu réaliser une procédure de réduction ou de regroupement des composants des descriptions. Cette procédure a été réalisée par le biais de règles de réduction qui regroupent les composants dans les descriptions. La méthodologie peut ainsi être représentée par le schéma de la figure 10.1