Les premiers travaux introduisant le terme de FVD datent de la fin des années 1990 [Keim et Kriegel, 1996], [Brunk et al., 1997], [Cox et al, 1997] et [Inselberg, 1998]. Dans un premier temps, toute l’attention a été portée vers le développement de techniques performantes et innovantes d’accès, de représentation graphique et de traitement des données. La masse de données disponible dans le monde ne cesse d’augmenter. La FVD utilise la visualisation comme canal de communication pour la découverte de corrélations dans les données. L’espace disponible sur un écran pour la représentation de ces données est limitée. Une première préoccupation concerne l’amélioration des techniques existantes de stockage, d’accès et de représentation graphique des données. Dans cet ordre d’idées, [Keim, 1996] a utilisé des techniques orientées pixel pour la représentation des données multidimensionnelles (VisDB). L’outil segments de cercle de [Ankerst et al., 1999] utilise aussi le même principe. Un autre aspect abordé dans ce domaine a conduit à une modélisation de la tâche de FVD [Ankerst, 2000]. Le modèle de tâche de FVD présenté par Ankerst possède 3 variantes (figure 1.17) suivant le mode d’utilisation des représentations graphiques. Pour chacune de ces variantes, on dénote des phases de visualisation des données, d’application de méthodes d’analyse de données avant d’aboutir à la connaissance (modèle des données). En effet, lorsqu’on se sert de la visualisation comme support en fouille de données, après la sélection des données à exploiter (première étape des 3 variantes), une alternative se présente : soit l’utilisateur sélectionne et exécute un algorithme automatique de fouille de données, soit il procède à une visualisation (exploration) de l’ensemble de données. La visualisation peut être suivie de l’application d’une méthode automatique (ou interactive) de construction du modèle des données. L’étape suivante consiste en la visualisation des résultats. On assiste enfin à une évaluation puis à une exploitation de ces résultats considérés comme des connaissances nouvelles. Plus explicitement, les variantes de la figure 1.17 (modèle de tâche de Ankerst) correspondent à :
Nos travaux s’appliquent soit à toutes les variantes du modèle de Ankerst, soit à certaines de ces variantes. Pour chacune de nos contributions, nous préciserons la (les) variante(s) du modèle concernée(s).
Pour les deux premières variantes du modèle de Ankerst, la plupart de techniques de représentations graphiques utilisées ont été présentées en début de ce chapitre. Nous allons à présent dresser un état de l’art des différentes techniques de visualisation qui permettent de découvrir des corrélations dans les données de façon interactive (variante 3 du modèle de Ankerst), de construire un modèle de données et de représenter les résultats issus de la construction du modèle des données.