5.2.3.6 Evaluation de la ressemblance entre ensembles de données

La similarité qui permet de mesurer le degré d’appariement entre deux ensembles de données consiste en la recherche de correspondances entre les descripteurs ou au calcul du degré d’appariement des descripteurs.

La mesure de la distance (euclidienne par exemple) entre les critères de comparaison de deux ensembles de données X et Y permet d’évaluer le degré de ressemblance de la description de X par rapport à celle de Y.

Une normalisation permet d’obtenir des valeurs comprises entre [0,1] comme suit :

Pour y = (y0,…,yn) on a l’expression normalisée Y = (Y0,…,Yn) avec

La mesure de similarité prend sa valeur dans l’intervalle continu [0,1], la valeur 1 signifiant la parfaite inclusion de la première description dans la seconde. L’algorithme des k plus proches voisins présenté ci-dessus utilise cette notion de distance.