Le calcul de la diversité lexicale renseigne sur le degré de répétitivité du vocabulaire d'un texte, c'est-à-dire qu'il mesure le nombre de mots différents qui composent ce texte. Muller (1992) définit ce calcul par les termes "richesse lexicale" mais cette appellation étant ambiguë, nous lui préférons ceux de "diversité lexicale". Muller (1992), lui même, est conscient que l'expression qu'il emploie doit être débarrassée de ses connotations plus ou moins élogieuses et il demande au lecteur de le traiter comme un terme technique purement descriptif, "richesse" n'ayant rien à voir avec "rareté" ou "banalité" des lexèmes utilisés. Il explique d'ailleurs, qu'appliqué à un texte, le terme de richesse lexicale est donc défini par le nombre des vocables et rien de plus. Cette objectivité permet donc de voir le texte comme un ensemble clos et achevé, formé de N mots, et dont on mesure la richesse par le nombre des V vocables qui y figurent, "‘sans référence extérieure et sans hypothèse sur le lexique dont ce vocabulaire est un échantillon’" (Muller, 1992 : 116).
Richards (1987) définit cette mesure par les termes de "type token ratio", le "type" correspondant au vocable, le "token" aux occurrences de ce vocable et donc au mot et le "ratio" étant le rapport de l'un sur l'autre. Pour illustrer ce calcul, imaginons deux cas simples : supposons, dans un premier temps, un texte de 50 mots, chacun de ces mots étant différent de tous les autres, on diviserait 50 V/50 N et on obtiendrait une diversité lexicale égale à 1. Dans ce cas, Richards (1987) parle de "type token ratio idéal"40. Dans un second temps, posons que ce même texte composé de 50 mots présente maintenant 50 fois le même vocable, on aurait 1 V/50 N, ce qui nous donnerait un indice de diversité lexicale équivalent à 0,0241.
Cette situation est quasi impossible en raison de la répétitivité des items grammaticaux au moins. De plus, nous ne pourrions parler de "texte", le principe de "continuité-répétition" introduit dans la troisième partie, n'étant pas satisfait.
Ce second cas est encore moins envisageable que le premier. Ici, nous serions devant, non pas un texte, mais une copie du même mot et ce serait alors le principe de "progression textuelle" qui serait affecté.