5.2.4.2 Inconvénients du raisonnement à partir de cas

Pertinence de la base de cas et apprentissage par adaptation : la base de cas traitée est pourvu d’un nombre limité de cas à l’initialisation du système par exemple. Dans les systèmes de prédiction à base de cas, quelque soit les ensembles de données D j de D traités, il existe toujours un ensemble de données s répondant à la condition s = argmax(SIM(p,D j )). La solution est injectée dans la base de cas, pourtant, elle est erronée pour la simple raison que la similarité entre le cas à traiter et son plus proche voisin dans la base de cas n’est pas forte. Le nouveau problème est ainsi résolu par adaptation aux connaissances acquises quelque soit la similarité de ce problème avec ces cas déjà traités. On constate que cette adaptation de cas traités à un nouveau problème entraîne une propagation de l’erreur de prédiction. La base sur laquelle s’appuient les travaux de prédiction contient alors des connaissances erronées. En effet, le choix de l’algorithme à exécuter est basé sur la performance du (des) problème(s) le(s) plus similaire(s) (maximum de similarité) au problème à résoudre. La similarité est une fonction qui prend ses valeurs dans l’intervalle [0, 1]. Des expérimentations nous ont permis de réaliser qu’il était possible d’obtenir comme taux de similarité maximale (entre le cas à traiter et les cas traités) 0.5 et que ce résultat aboutit à une proposition de solution à l’utilisateur pas tout à fait correcte. Plus précisément, le nombre de critères de comparaison des données étant élevé (une trentaine), seules les valeurs de similarité très proches de 1 sont réellement significatives d’après ces expérimentations. Pour remédier à cette situation, des expérimentations ont permis de fixer un seuil de similarité (seuil de rejet) en deçà duquel on ne considère plus que les problèmes sont similaires.

Evolution de l’environnement de fouille de données : on assiste de plus en plus au développement de techniques performantes et innovantes de fouille. Le raisonnement à partir de cas a cependant été utilisé pour la prédiction d’algorithmes dans des environnements de type statique avec une seule phase de collecte de données (connaissances). Il est donc nécessaire de prévoir l’ajout de nouvelles techniques dans un environnement de fouille et de prendre des dispositions en vue de prédictions. A notre connaissance, il n’existe pas de module du système de RàPC capable de prendre la décision de lancer par exemple des processus (programmes d’analyse des données) en vue de l’acquisition et la gestion de connaissances parallèlement à l’exécution du système de RàPC. Pourtant, les systèmes de fouille de données peuvent être évolutif en ce sens que de nouveaux algorithmes ou de nouveaux ensembles de données doivent pouvoir être traités. Ce traitement implique la nécessité d’une phase d’acquisition de connaissances en ce qui concerne les critères de comparaison de l’ensemble de données ou du nouvel algorithme. Le RàPC repose donc sur le principe de la réutilisation des solutions et d’apprentissage à partir de ces cas traités. Ainsi pour un nouveau problème, la solution est obtenue par adaptation des cas de la base déjà traités au nouveau cas, des approximations successives sont opérées, étant donné qu’il n’existe pas à priori une entité pouvant être chargée de l’acquisition et de la gestion instantanée des connaissances expérimentales dans le modèle de base du RàPC. Pour pallier à cette situation nous avons opté pour un système multi agents (SMA) et nous avons pourvu l’un des agents du SMA d’une base de cas (connaissances) maintenable. Cet agent est chargé de l’acquisition des connaissances durant l’exécution du programme de support à la décision. En effet, un système à base de connaissances stocke des questions et éventuellement leurs réponses au fur et à mesure qu’il les découvre. Le comportement d’un système à base de connaissances peut être modifié significativement sans qu’il y ait besoin de le recompiler. Cette modification peut se faire de façon déclarative, c'est-à-dire en ajoutant un élément de connaissance qui a un sens indépendamment du programme. La particularité de notre système est que les connaissances seront interprétées non pas par des humains mais par la machine (un agent logiciel) qui s’en servira pour lancer l’exécution d’autres processus ou pour incrémenter sa base de connaissances.

L’approche ainsi proposée permet une intégration de nouvelles connaissances en ligne, une activation de la maintenance de cas traités suivant les valeurs obtenues par calcul de degrés d’appariement entre cas à traiter et cas résolus comme le montrent les modèles présentés dans les sections 5.2.5 et 5.2.6.