2.2 Préparation des fichiers des articles

Pour le traitement des articles, nous avons choisi le logiciel Word version 6.0a. La préparation des articles a consisté à énumérer chaque paragraphe dans chaque article du corpus. Cette procédure a été nécessaire afin d’identifier chaque syntagme nominal ; cette identification des syntagmes nominaux permettra à son tour de retrouver les articles d’où ils ont été extraits. Ainsi, les syntagmes nominaux ont été identifiés par le numéro d'article et le numéro d'ordre du paragraphe d’où ils ont été extraits.

Exemple : a informação; 1; 4
qui veut dire que le syntagme a informação a été extrait de l’article nº 1, paragraphe nº 4

M. LE GUERN considère que l'identification des syntagmes nominaux devrait être réalisée par le numéro de l'article et par le numéro de la ligne. Certes, cette procédure est plus précise. Or, pour cette expérimentation, la numérotation adoptée, bien que moins précise, n'a guère compromis les résultats car les articles n’étant pas longs, des paragraphes entiers étaient presque toujours visibles sur l’écran. Pour une application professionnelle cependant, l'adoption d'une technique précise de manière à identifier les syntagmes nominaux est souhaitable, soit au moyen de la numérotation des lignes, soit d’une autre façon qui puisse les distinguer lorsque les articles sont présentés à l'écran.