5.1.1 Analogies entre conception en général et conception du modèle des données

La conception selon l’AFNOR est une activité créatrice, qui partant de besoins exprimés et des connaissances existantes aboutit à la définition d’un produit satisfaisant ces besoins et industriellement réalisables. Dans un sens beaucoup plus général, selon le grand dictionnaire terminologique de la langue française, la conception est une façon de voir ou de comprendre. En fouille de données en général, le modèle des données est une façon de voir ou de comprendre les données. La conception est caractérisée par un état initial flou, le concepteur a du mal à appréhender les besoins réels des utilisateurs. En cet autre point, il existe une analogie avec la conception du modèle des données. Le point de départ de la FVD est flou, l’analyste des données ne sait pas exactement ce qu’il cherche dans l’ensemble volumineux des données. Puis, il découvre de nouvelles corrélations dans ces données. Il s’agit d’informations inconnues avant et potentiellement utiles. Des opérations de transformation servent de support à cet effet. A chaque opération de transformation est attachée un point de vue qui conduit l’analyste des données à ne conserver que les éléments qui sont en relation avec le point de vue. En effet, le modèle des données à concevoir est complété et affiné au fur et à mesure. En ce sens, la FVD rejoint aussi la définition de la conception selon l’AFNOR.

Les différentes pièces du modèle des données construit interagissent. Les décisions de conception ne sont pas indépendantes les unes des autres, ce qui fait référence à la conception en architecture. Les différentes phases de ce processus de conception sont marquées par l’élaboration d’un dossier et une étape de validation. Ce dossier sert aux étapes suivantes. En FVD (3e variante du modèle de Ankerst par exemple), il n’existe pas un ordre préétabli pour le choix des variables à utiliser pour les coupes servant à la création d’un modèle des données. Il n’y a donc pas de chemin pré-établi vers la solution.

Une des difficultés relative à l’activité de conception et qu’on retrouve en fouille visuelle des données réside dans le fait qu’il n’existe pas une seule « bonne » solution. Tout comme dans les autres activités de conception, l’évaluation de la solution en FVD (modèle de données) est une tâche difficile car il s’avère irréalisable de générer toutes les solutions possibles. Par contre, il existe des spécificités de la conception en fouille visuelle de données. L’activité de conception dite « moderne » est collective. En FVD, le modèle des données est conçu la plupart de temps par un seul analyste des données.

A ce niveau, on pourrait se poser la question de savoir pourquoi assister l’activité de conception en FVD ? La suite de cette section apportera des éléments de réponse à cette question.