Les portails Lyon 2 : Intranet - Portail Etudiant - www
Un environnement informatique pour l’interrogation et l’accès intelligent aux bases de données... par HACID Hakim - 2008 - Université Lumière Lyon 2

Métadonnées du document

Identifiant du document lyon2.2008.hacid_h
Code de l'institution lyon2
Année 2008
Auteurs HACID Hakim
Titre Un environnement informatique pour l’interrogation et l’accès intelligent aux bases de données complexes
Titre autres langues
en An Environment for Intelligent Access and Interrogation of Complex Databases
Membres du jury ZIGHED Abdelkader Jamel --- BRIAND Henri --- VENTURINI Gilles --- BENATALLAH Boualem --- GANASCIA Jean Gabriel --- SAITTA Lorenza
Directeurs de thèses ZIGHED Abdelkader Jamel
Diplome Doctorat Nouveau Régime
Etablissement Université Lumière Lyon 2
Ecole Doctorale IIS (Informatique et information pour la société)
Factulté Faculté des Sciences économiques et de Gestion
Discipline Informatique
Date de soutenance 2008-02-04
Type de document Thèse de Doctorat Nouveau Régime
Résumés
fr Les avancées observées dans les technologies de l’information ont un impact direct sur les développements et les changements dans tous les secteurs de l’activité humaine. Ces avancées rendent facile l’utilisation des outils d’acquisition, de transmission, de stockage et de traitement de l’information non seulement à un public professionnel (professionnels des technologies de l’information) mais aussi au grand public (novices de l’informatique). Ainsi l’une des conséquences directes de cette situation est la disponibilité de données avec une grande masse et une grande diversité.De nos jours, l’industrie informatique offre des solutions techniquement satisfaisantes et économiquement supportables pour assurer une conservation et un partage de l’information. La baisse des coûts de stockage et de transmission des données va encore amplifier le volume des données disponibles en ligne. La combinaison de ces différents facteurs a donné naissance au concept des données complexes.Le défi de la prochaine décennie est la valorisation des données complexes collectées. Accéder aux connaissances cachées dans ce colossal amas de données hétérogènes, distribuées et peu structurées constitue un enjeu à la fois scientifique et technologique majeur. Si la technologie de l’extraction des connaissances à partir des données est relativement mûre pour exploiter les bases de données classiques où les données sont sous forme tabulaire (attribut-valeur), elle reste malheureusement démunie face aux structures de données complexes.La problématique de l’accès aux connaissances cachées dans des données complexes n’est pas propre à un domaine particulier. L’environnement, la santé, l’industrie ou l’économie regorgent de problèmes similaires. Notre projet, financé par la région Rhône-Alpes dans le cadre de l’initiative EMERGENCE 2004, se situe donc dans le domaine de l’extraction des connaissances à partir des données complexes et vise plus particulièrement la mise au point d’un Système Intelligent pour la Recherche d’Information à l’Usage de la Santé (SIRIUS). Etant donné que les données médicales ne sont qu’un cas particulier des données multimédias, nous proposons dans cette thèse un cadre général de manipulation de ces dernières pour des fins d’interrogation et de catégorisation. Nous proposons ainsi une structure d’indexation de données multidimensionnelles basée sur les graphes. Cette structure est appliquée à l’indexation d’images pour des fins d’interrogation et d’annotation, à l’indexation de documents textuels pour des fins de catégorisation. Enfin nous proposons un cadre pour l’interrogation de données hétérogènes (composées de textes et d’images) en utilisant les propositions précédentes.
en Advances in information technologies have a direct impact on the developments and changes in all the sectors of human activity. These advances make it easy the exploitation of information acquisition, transmission, storage and processing tools not only to a professional public (professional of information technology), but also to a more general public. Thus one of the direct consequences of this situation is the availability of large and very diverse databases.Nowadays, industry offers technically satisfactory and economically acceptable solutions to ensure information storage and sharing. The decrease of data storage and transmission costs will further expand the volume of the available data online. The combination of these factors raised the concept of complex data.The challenge of the next decade is the effective exploitation of the collected complex data. Access to the hidden knowledge in this huge repository of heterogeneous, distributed and poorly structured data is a challenge from both scientific and technological sides. If the KDD technology is relatively robust for exploiting traditional databases where data is in tabular form (attribute-value), it unfortunately remains inappropriate in the context of complex data.The issue of accessing hidden knowledge in complex data is not a particularity of one area. The environment, health, industry or economy deal with similar problems. Our project, funded by Région Rhone-Alpes in the EMERGENCE 2004 initiative, falls within the area of extracting knowledge from complex data, and specifically aims at developing an Intelligent System for Information Retrieval for Health Usage (SIRIUS). Given that the medical data are just a special case of multimedia data, we propose a general framework for manipulating them for interrogation and categorization purposes. We propose a graph-based structure for multidimensional data indexing. This structure is applied for indexing images for interrogation and annotation purposes, and textual document indexing for categorization purpose. Finally, we propose a framework for heterogeneous data interrogation using the previous proposed techniques.
Mots-clés
fr bases de données complexes ; recherche d’information; data mining; indexation; graphes; bases de données hétérogènes
en complex databases; information retrieval; data mining; graphs; heterogeneous databases
Editeur CyberDocs
Format text/xml
Langue fr
Copyright Copyright HACID Hakim et Université Lumière - Lyon 2 - 2008.Ce document est protégé en vertu de la loi du droit d'auteur.
Diffusion [intranet]
Identifier http://theses.univ-lyon2.fr/documents/lyon2/2008/hacid_h
Extent 13216