II-5-2 - Définition de la mesure de proximité référentielle ordonnée.

Soit une question q. Soit un ensemble référence G 0 de R q construit comme indiqué ci-dessus. G 0 est fixé en fonction de la question q et du corpus de documents de la base. Nous appellerons indices de proximité référentielle par rapport à un ensemble G 0, nous les noterons D*, les indices classiques en documentation, calculant la proximité d’un ensemble par rapport à un ensemble de référence G 0.

Les indices de proximité référentielle en documentation vérifient généralement les quatre propriétés suivantes. Nous allons les énoncer sous la forme de l’hypothèse 3 :

message URL FIG168.gif

Nous pouvons remarquer que, par rapport à l’hypothèse 2, la propriété de symétrie n’est plus vérifiée. L’ensemble G 0 étant fixé, par définition de D*, nous ne pouvons considérer D*(G 0 ,A).

Si U est la réponse du système suite à la question de l’utilisateur, comme au début du chapitre II nous pouvons construire U 1 et U 0 tels que :

U 0 = U G 0 et U 1 = U G 1

Nous aurons alors et .

Nous pouvons écrire les indices de rappel et de précision sous la forme :

message URL FIG170.gif

Les indices de rappel et de précision présentés ci-dessus vérifient bien ces quatre propriétés.

Supposons à présent que la chaîne réponse se présente sous forme de classes respectant l’hypothèse 1. Tout élément C de R q est donc une suite finie ordonnée de sous ensembles C i de C q contenant des documents réponses, les C i étant deux à deux disjoints :

Soit C R q une réponse telle que :

message URL FIG171.gif

Comme nous l’avons déjà dit dans le paragraphe II-3, le calcul de la proximité entre la chaîne réponse C et l’ensemble de référence G 0 sera plus représentatif s’il prend en compte le rang de la classe dans laquelle se trouvent les documents. Notons π (C i , G 0j) un indice de proximité référentielle entre deux classes. Supposons que ce soit un indice vérifiant l’hypothèse 3, et qui de plus prenne en compte les rangs i et j des classes comparées. En toute logique, plus les classes comparées sont proches en rang l’une de l’autre, et plus la proximité ✓✓π (C i , G 0j) doit être grande. Plus les indices i et j sont grands et moins cette proximité doit être grande. En effet, la proximité doit être plus grande lorsqu’on compare les premières classes. Nous pouvons construire une mesure de proximité référentielle par rapport à G 0 de toute réponse C (CR q) telle que le calcul de π (C i , G 0j ), pour chaque classe C i et G 0j respectivement de C et G 0, soit pris en compte.

message URL FIG173.gif