Techniques de fouille de données pour l'optimisation automatique des performances des entrepôts de données.

Métadonnées du document

Identifiant du document lyon2.2005.aouiche_k

Code de l'institution lyon2

Année 2005

Auteurs AOUICHE Kamel

Titre Techniques de fouille de données pour l'optimisation automatique des performances des entrepôts de données.

Membres du jury ZIGHED Abdelkader --- BALTHASAR Lukas --- BELLAHSENE Zohra --- BENSLIMANE Djamal --- DARMONT Jérôme --- DOMINIQUE Laurent

Directeurs de thèses ZIGHED Abdelkader

Diplome Doctorat Nouveau Régime

Etablissement Université Lumière Lyon 2

Ecole Doctorale Sciences Cognitives

Factulté Faculté des Sciences Economiques et de Gestion

Discipline Informatique

Date de soutenance 2005-12-08

Type de document Thèse de Doctorat Nouveau Régime

Résumés

fr Avec le développement des bases de données en général et des entrepôts de données en particulier, il est devenu très important de réduire les tâches d'administration des systèmes de gestion de base de données. Les systèmes auto-administratifs ont pour objectif de s'administrer et de s'adapter eux-mêmes, automatiquement, sans perte ou même avec un gain de performance. L'idée d'utiliser des techniques de fouille de données pour extraire des connaissances utiles à partir des données stockées pour leur administration est une approche très prometteuse, notamment dans le domaine des entrepôts de données, où les requêtes sont très hétérogènes et ne peuvent pas être interprétées facilement. L'objectif de cette thèse est d'étudier les techniques d'auto-administration des entrepôts de données, principalement des techniques d'optimisation des performances, comme l'indexation et la matérialisation de vues, et de rechercher une manière d'extraire des données elles-mêmes des connaissances utilisables pour appliquer ces techniques. Nous avons réalisé un outil qui recommande une configuration d'index et de vues matérialisées permettant d'optimiser le temps d'accès aux données. Notre outil effectue une recherche de motifs fréquents fermés sur une charge donnée et une classification non supervisée des requêtes de la charge pour construire cette configuration d'index et de vues. Nous avons également couplé la sélection d'index et de vues matérialisées afin de partager efficacement l'espace de disque alloué pour stocker ces structures. Enfin, nous avons appliqué les principes développés dans le cadre relationnel aux entrepôts de données XML. Nous avons proposé une structure d'index précalculant les jointures entre les faits et les dimensions XML et adapté notre stratégie de sélection de vues pour matérialiser des vues XML.

en With the development of databases in general and data warehouses in particular, it becomes very important to reduce the function of administration. The aim of auto-administrative systems is administrate and adapt themselves automatically, without loss or even with a gain in performance. The idea of using data mining techniques to extract useful knowledge for administration from the data themselves has been in the air for some years. However, no research has ever been achieved. As for as we know, it nevertheless remains a very promising approach, notably in the field of the data warehousing, where the queries are very heterogeneous and cannot be interpreted easily. The aim of this thesis is to study auto-administration techniques in databases and data warehouses, mainly performance optimization techniques such as indexing and view materialization, and to look for a way of extracting from stored data themselves useful knowledge to apply these techniques. We have designed a tool that finds an index and view configuration allowing to optimize data access time. Our tool searches frequent itemsets in a given workload and clusters the query workload to compute this index and view configuration. Finally, we have extended the performance optimization to XML data warehouses. In this area, we proposed an indexing technique that precomputes joins between XML facts and dimensions and adapted our materialized view selection strategy for XML materialized views.

Mots-clés

fr	bases de données; entrepôts de données; entrepôts de données XML; indexation; matérialisation de vues; fouille de données; recherche de motifs fréquents; classification non supervisée; modèles de coût; performance
en	databases; data warehouses; XML data warehouses; indexing; view materialization; data mining; frequent itemset mining; clustering; cost models; performance

Editeur CyberDocs

Format text/xml

Langue fr

Copyright Copyright AOUICHE Kamel et Université Lumière - Lyon 2 - 2005.Ce document est protégé en vertu de la loi du droit d'auteur.

Diffusion [internet]

Identifier http://theses.univ-lyon2.fr/documents/lyon2/2005/aouiche_k

Extent 11733

Menu

Métadonnées du document