I.1.1.L'information distributionnelle

Les mots appartiennent à une même catégorie syntaxique, dans la mesure où deux mots de ce groupe sont interchangeables. Leurs caractéristiques sémantiques et phonologiques seront différentes, mais pas leurs propriétés syntaxiques. Ainsi, le mot justice est un nom, car il peut être remplacé par les mots chien ou métallurgie, sans que le contexte grammatical soit faux. En Anglais, les noms sont souvent précédés par ‘the’, et d’autres articles. En outre, chaque catégorie est définie à partir des autres catégories.

Maratsos et Chalkley (1980) ont imaginé un réseau de corrélation entre les mots, les morphèmes et le sens (Finch et Chater, 1992 ; Mintz, Newport et Bever, 1995). Par exemple, Mintz et coll. (1995) ont montré que la similarité entre les contextes peut être utilisée pour regrouper les mots, et que les groupes ainsi formés correspondent aux classes grammaticales. Une fenêtre utilisant les deux mots situés juste avant et après le mot à classer permet d’identifier les noms et les verbes. Ces travaux ont été complétés par Redington, Chater et Pinson (1998), où ils montrent que cette méthode est efficace pour les noms et les verbes, mais moins performante pour les mots de fonction.