II-3-2 - Définition de la mesure de proximité ordonnée.

Nous noterons D un indice de proximité utilisée en documentation.

Les indices de proximité usuellement employés en documentation sont symétriques, et la proximité d’un ensemble avec lui-même est nulle. Ils vérifient généralement d’autres propriétés. Nous allons les énoncer sous la forme de l’hypothèse 2 suivante :

message URL FIG037.gif

Les trois indices 

message URL FIG038.gif

présentés en début de chapitre, vérifient bien ces cinq propriétés.

Supposons à présent que la chaîne réponse se présente sous forme de classes et que l’hypothèse 1 soit vérifiée. Tout élément C de R q est donc une suite finie ordonnée de sous ensembles C i de C q contenant des documents réponses, les C i étant deux à deux disjoints :

Soit C R q et C’ R q, deux réponses telles que :

message URL FIG039.gif

Le calcul de la proximité entre deux chaînes réponse sera plus représentatif s’il prend en compte le rang de la classe dans laquelle se trouvent les documents. Notons π (C i ,C’ j) un indice de proximité entre deux classes. Supposons que ce soit un indice qui vérifie l’hypothèse 2, et qui de plus prenne en compte les rangs i et j des classes comparées. En toute logique, plus les classes comparées sont proches en rang les unes des autres, et plus la proximité ✓π (C i ,C’ j) doit être grande. De plus, plus les indices i et j sont grands et moins cette proximité doit être grande. En effet, la proximité doit être plus grande lorsqu’on compare les premières classes. Nous pouvons construire une mesure de proximité entre deux réponses C et C’ de R q telle que le calcul de π (C i ,C’ j ), pour chaque classe C i et C’ j respectivement de C et C’, soit pris en compte.

message URL FIG040.gif

Dans le théorème suivant, nous proposons une mesure générale de proximité ordonnée.