1.2. LEMMATISATION DU CORPUS

Dans un second temps, les restitutions ont été lemmatisées. Muller (1992) explique qu'un dictionnaire consiste en un inventaire plus ou moins complet des lexèmes d'une langue. Cependant, étant donné que tout lexème varie selon le contexte, le lexicologue se doit de noter qu'une seule des graphies possibles, graphie choisie conventionnellement et que Muller (1992) appelle "lemme". En français, cette unité correspond à l'infinitif pour les verbes, le singulier pour les noms et le masculin singulier pour les adjectifs, etc. Cette transformation n'est intéressante que pour celui ayant décidé de ne pas se préoccuper de la morphologie, la lemmatisation privant les mots de toute marque flexionnelle. Dans notre cas, cela était donc possible étant donné que l'analyse à venir se consacre au lexique exclusivement. L'exemple [V.I.1] illustre ces modifications :

[V.I.1] PIE 8G9E2 (23)

Version standardisée non lemmatisée Version standardisée lemmatisée
1. Le petit trappeur canadien sortit de son enclos
2. il avait vu un petit lapin
3. et le petit trappeur lui dit
4. part
5. sinon tu vas avoir des ennuis
6. et le petit trappeur entendit des bruits
7. et il avait la petite indienne
8. lui dit
9. tu peux me faire un oreiller en renard
1. le petit trappeur canadien sortir de son enclos
2. il voir un petit lapin
3. et le petit trappeur lui dire

4. partir
5. sinon tu avoir de le ennui
6. et le petit trappeur entendre de le bruit
7. et il avoir le petit indienne
8. lui dire
9. tu pouvoir me faire un oreiller en renard