Chapitre 7
Matériel lexical

Nous avons vu au chapitre 5 l'écart à la norme que présentent nos corpus afin que le lecteur puisse aborder le chapitre 6, qui tente de mettre en lumière les caractéristiques de nos corpus au plan de l'interaction. Ce chapitre se donne pour objectif l'étude globale des moyens lexicaux mis en œuvre dans les IRC.

Ainsi que le relèvent de nombreux linguistes, le travail sur corpus et plus particulièrement sur des corpus autres que des corpus écrits normés questionne la théorie linguistique à plus d'un titre. Willems (1998:79-87) fait remarquer que la prise en compte des données orales met en question les concepts grammaticaux de base notamment de phrase et de subordination, et les concepts théoriques de norme et de compétence. Au sujet des données d'observation et d'introspection rencontrées en analyse linguistique Willems (1998:81) note également que "leur interrelation n'est par ailleurs pas évidente et [qu'] on pourrait argumenter que les opérations cognitives en jeu dans les jugements d'intuition sont d'un tout autre ordre que celles mises en œuvre lors de la production langagière."

Après un bref questionnement théorique, ce chapitre présentera les principes de la lemmatisation qui ont été mis en œuvre sur le corpus, et les différents choix qu'il a fallu faire. Nous examinons ensuite les propriétés générales du matériel lexical, en utilisant les outils de mesures communément employés (densité et diversité lexicale). Nous considérons ensuite les spécificités du lexique et de quelques phénomènes morphologiques.