1.3.3Techniques matricielles et construction interactive d’un modèle des données

1.3.3.1 CIAD (Construction Interactive d’Arbre de Décision)

CIAD est un outil permettant la construction interactive d’arbres de décision. Cette technique utilise des matrices de scatter plot comme technique de visualisation et permet pour des ensembles de données avec un nombre de dimensions (n inférieur à 20) une projection de n*(n-1)/2 matrices. Pour n>20, une représentation par défaut de l’ensemble de données est fournie avec une combinaison de 20 attributs au maximum. La première étape de traitement consiste à représenter graphiquement l’ensemble de données à traiter. La figure 1.22 représente une vue de l’ensemble de données segmentation de l’UCI [Blake et Merz, 1998] avec CIAD.

Figure 1.22 Représentation de l’ensemble de données segment avec CIAD
Figure 1.22 Représentation de l’ensemble de données segment avec CIAD

La couleur représente la classe. Les coupes effectuées pour la construction du modèle de données sont de type oblique en 2 dimensions donc sur deux variables. Ces différentes coupes sont effectuées grâce aux capacités humaines en reconnaissance de formes. Les étapes successives de ce traitement sont illustrées par la figure 1.23.

Figure 1.23 Construction interactive du modèle de données avec CIAD
Figure 1.23 Construction interactive du modèle de données avec CIAD

Les 4 premières coupes représentent les classes 2, 7, 6, 3. Ces classes représentent 57% des individus de l’ensemble de données. CIAD peut être exécuté en modes 100% interactif, mixte ou alors 100 % automatique. Par rapport aux méthodes automatiques, CIAD permet d’obtenir une précision équivalente avec des tailles d’arbres inférieures.