5.2.4.1 Processus du raisonnement à partir de cas

Le raisonnement à base de cas est donc une approche de résolution de problèmes qui utilise des résultats basés sur des expériences passées pour résoudre des nouveaux problèmes.

Par application à la sélection de la méthode d’analyse de données en FVD, l’ensemble d’expériences réalisées soit sur les données soit sur les algorithmes dont les critères sont présentés dans le tableau 5.2 forme la base de cas. Pour effectuer le choix de l’algorithme le plus approprié pour un problème en entrée de l’environnement, l’idée ici est de retrouver des cas similaires dans la base de cas et les adapter au cas considéré. A cet effet, il est nécessaire que la base de cas soit construite soigneusement (représentation des cas, indexation, spécification intelligente des similarités entre les cas, facilité d’adaptation des cas et d’enrichissement de la base) et qu’il existe un moteur de recherche rapide et intelligent.

Notre formalisation du principe de cette approche telle qu’utilisée en prédiction d’algorithmes de classification supervisée de données est la suivante :

chaque ensemble de données (D _j ) de la base de cas est pourvu d’un ensemble de valeurs V_j = a_1j, a_2j, …, a_nj,
le problème à résoudre par l’utilisateur relatif à l’ensemble de données X a un ensemble p = b ₁ , b _2, …, b _n de critères,
la meilleure solution s est un ensemble de données de D respectant la condition suivante : SIM(p, s) = argmax(SIM(X, D _j )).
Pour aboutir à notre contribution, nous avons procédé en deux étapes. Dans un premier temps, nous avons implémenté et exécuté l’une des meilleures approches proposées pour la prédiction des performances des algorithmes d’analyse automatique de données [Brazdil et al., 2003]. Ensuite, nous avons recherché des moyens pour l’optimisation de cette solution. Enfin, l’un de ces moyens a été modélisé et implémenté. Ce moyen corrige les différents inconvénients des approches existantes décrites dans le paragraphe ci-dessous.