1.3.2.3Perception-Based Classification (PBC)

PBC est un algorithme interactif de construction d’arbres de décision qui utilise le principe de la pixellisation. La phase initiale de PBC permet de représenter graphiquement l’ensemble de données d’apprentissage (segments de cercle ou barres rectangulaires) et d’initialiser un arbre de décision au nœud racine, correspondant à l’ensemble de données d’apprentissage.

De façon concrète, la représentation graphique d’un ensemble de données aboutira à la figure 1.20 par exemple.

Figure 1.20 Exemple de représentation d’un ensemble de données
Figure 1.20 Exemple de représentation d’un ensemble de données

La visualisation permet de sélectionner de façon interactive des données et de procéder à des coupes. A partir de la représentation de la figure 1.21, pour la construction d’un arbre de décision par exemple, on peut procéder à des coupes interactives : binaires ou n aires mono variées. L’idée ici est de concevoir de façon interactive un modèle des données. A cet effet, on utilise la stratégie suivante : recherche de la meilleure partition pure, s’il n’en existe pas : recherche de la plus grande partition dominante, s’il n’en existe pas : recherche de l’ensemble de partitions dominantes.

Figure 1.21 Représentation du processus de coupes successives
Figure 1.21 Représentation du processus de coupes successives

L’algorithme de construction interactive d’arbres de décision (CIAD) [Poulet, 2002b] et le module UserClassifier [Ware et al, 2001] de WEKA utilisent le même principe de construction d’arbres de décision mais sont basés sur des représentations matricielles. Les sections détaillent ces deux approches.