1.3 Contributions

L’objectif général de cette thèse est de proposer une approche qui met a la disposition des analystes des moyens pour intégrer leurs connaissances dans l’entrepôt de données, a des fins d’analyses spécifiques futures. Compte tenu de l’émergence de nouveaux besoins d’analyse, la conception et la construction d’un entrepôt de données dont le schéma est fixe ne satisfait plus les attentes des décideurs. En effet, la construction des axes d’analyse doit évoluer en même temps que les besoins. Précisons que par axes d’analyse, nous entendons, dans l’ensemble de ce mémoire, les possibilités d’analyses. Ainsi, notre première contribution dans le cadre de la personnalisation des analyses consiste en la définition d’un modèle formel d’entrepôt de données évolutif base sur des règles de type «si- alors», que nous appelons règles d’agrégation. Nous l’avons nommé modèle R-DW pour «Rule-based Data Warehouse». Il est compose d’une partie «fixe» et d’une partie «évolutive». La partie fixe est constituée de la table des faits et des tables de dimension qui lui sont directement reliées. La partie évolutive est composée de l’ensemble des hiérarchies, définies lors de la conception du schéma de l’entrepôt, qui peuvent subir des mises a jour. En effet, des niveaux de hiérarchie peuvent être supprimes, d’autres peuvent être crées par l’application des règles d’agrégation. Ainsi, le modèle d’entrepôt de données que nous proposons a un schéma flexible qui permet de prendre en compte l’évolution des besoins d’analyse. Pour assurer la généricité de notre proposition, nous définissons un méta-modèle qui permet de décrire tout entrepôt de données évolutif. Par ailleurs, afin d’impliquer l’utilisateur dans le processus d’évolution de schéma de l’entrepôt de données, nous proposons une démarche basée sur une architecture globale qui nous permet de modéliser le processus de personnalisation. Notons que le terme «utilisateur» désigne a la fois l’utilisateur final mais aussi l’administrateur. Par exemple, lors de la modification de la structure interne de l’entreprise, l’administrateur peut faire évoluer le schéma de l’entrepôt en exprimant des connaissances pour l’ensemble des utilisateurs finaux. Ainsi, notre deuxième contribution est la proposition d’une architecture globale qui vise a soutenir notre modèle d’entrepôt évolutif. Cette architecture globale comprend quatre modules : – un module d’acquisition des connaissances utilisateurs sous forme de règles d’agrégation ; – un module d’intégration des règles d’agrégation dans l’entrepôt de données ; – un module d’évolution de schéma de l’entrepôt qui permet la mise a jour des hiérarchies de dimension – un module d’analyse permettant a l’utilisateur d’avoir de nouvelles analyses OLAP basées sur le nouveau schéma. Notre troisième contribution consiste a mettre en œuvre notre démarche. En effet, nous proposons un modèle d’exécution avec l’approche relationnelle (ROLAP : Relational OLAP), qui gère l’ensemble des processus lies a l’architecture globale. Ce modèle d’exécution est constitue des étapes suivantes. Premièrement, les règles d’agrégation sont représentées dans une table relationnelle, que nous appelons table de mapping. Deuxièmement, le contenu de cette table est contrôle pour vérifier la cohérence des règles d’agrégation. Troisièmement, si les règles d’agrégation sont cohérentes, le nouveau niveau de granularité est crée ; il prend la forme d’une table relationnelle liée a une ou plusieurs autres tables selon que le niveau a été ajoute en fin de hiérarchie ou inséré entre deux niveaux existants de la hiérarchie. Par ailleurs, nous nous sommes intéressés a l’évaluation de la performance de notre modèle d’entrepôt de données évolutif. Or, l’évaluation de la performance dans les entrepôts de données est généralement basée sur une charge (ensemble de requêtes utilisateurs). Lorsqu’un changement se produit au niveau du schéma de l’entrepôt de données (suppression d’un niveau de hiérarchie par exemple), la charge doit etre mise a jour. Ainsi notre quatrième contribution réside dans la proposition d’une méthode de mise à jour incrémentale de la charge. Pour valider nos différentes contributions, nous avons développé une plateforme appelée WEDriK1 (data Warehouse Evolution Driven by Knowledge). Cette plate- forme se base d’une part sur un entrepôt de données évolutif stocke dans le SGBD relationnel Oracle et d’autre part sur une interface Web qui permet l’interaction avec les utilisateurs. Les problèmes poses dans ce mémoire sont directement issus de la réalité de l’en- treprise LCL avec laquelle nous avons collabore. LCL a constitue un véritable terrain d’application pour mettre en œuvre nos solutions de personnalisation. De plus, nous nous sommes également intéressés a la personnalisation dans sa définition plus classique, dans le cadre de la gestion des interfaces et de la recherche d’information, au travers du travail d’ingénierie que nous avons réalisé pour cette entreprise durant le développement de la plateforme dédiée a la gestion des demandes de marketing local MARKLOC, que nous présentons également dans ce mémoire.