3.5.1.2 Exemple concret de mise en œuvre du guidage en FVD

Les progrès réalisés dans le domaine de l’ECD ont permis d’intégrer plusieurs méthodes d’analyse de données dans un même environnement. Le processus de FVD prévoit qu’après la sélection des données à traiter, l’utilisateur choisisse une méthode d’analyse des données. Le choix de la méthode d’analyse des données à exécuter n’est pas aisé. La figure 3.6 présente un exemple concret du choix de la méthode d’analyse des données dans l’environnement WEKA [Witten et Eibe, 2005], un logiciel libre de l’université de Waikato qui contient une collection d’algorithmes d’apprentissage machine, de fouille de données et de FVD. Dans ce logiciel, comme l’indique la figure, il existe des modules de prétraitement des données, de classification, de clustering, de découverte de règles d’association, de sélection d’attributs et de visualisation.

La première étape de traitement avec WEKA consiste au prétraitement des données, ensuite l’utilisateur choisit un module parmi les modules disponibles (classification, clustering, découverte de règles d’association, etc.) après ce choix, l’utilisateur choisit une méthode parmi celles disponibles dans le module choisit. Si par exemple le module choisi par l’utilisateur est Classifier et le sous module Rules (figure 3.6), sans connaissance préalable relative aux performances des 10 algorithmes de ce module, il aura à les exécuter tous avant de choisir le plus approprié ou en choisira un sous ensemble de manière aléatoire. Comme dans la plupart d’outils de fouille, aucune aide n’est mise à la disposition des utilisateurs afin qu’ils puissent opérer convenablement ce choix.

Une mise en œuvre du guidage serait d’aider les utilisateurs à opérer ce choix (chapitre 5).

Figure 3.6 WEKA
Figure 3.6 WEKA