Les portails Lyon 2 : Intranet - Portail Etudiant - www
Contribution méthodologique à la fouille de données complexes par CLECH Jérémie - 2004 - Université Lumière Lyon 2

Métadonnées du document

Identifiant du document lyon2.2004.clech_j
Code de l'institution lyon2
Année 2004
Auteurs CLECH Jérémie
Titre Contribution méthodologique à la fouille de données complexes
Titre autres langues
en Methodological contribution to complex data mining
Membres du jury ZIGHED ABDELKADER --- LEBART Ludovic --- MARTEAU Pierre François --- KODRATOFF Yves --- HACID Saïd --- BRIAND HENRI
Directeurs de thèses ZIGHED ABDELKADER
Diplome Doctorat Nouveau Régime
Etablissement Université Lumière Lyon 2
Ecole Doctorale Humanités
Factulté Faculté des Sciences Economiques et de Gestion
Discipline Informatique
Date de soutenance 2004-03-02
Type de document Thèse de Doctorat Nouveau Régime
Résumés
fr Au cours de cette thèse, nous abordons la problématique de l’extraction de connaissances à partir de données complexes. Notre motivation est issue de l’accroissement du besoin de traiter de telles données, du principalement à l’explosion des technologies de l’information véhiculant une forte diffusion de documents complexes. La fouille de données complexes se propose de fournir un modèle d’analyse permettant d’intégrer de larges variétés de données, structurées ou non locales ou distantes. Le point de vue retenu est de dire que face à une tâche d’extraction des connaissances, l’utilisateur doit être libéré des contraintes liées à l’organisation, le codage, le format, la représentation des données. Il doit accéder au contenu.Nous reprenons les étapes du processus d’extraction de connaissances afin de traiter dans un cadre général ces données fortement hétérogènes. L’aboutissement du processus étant l’exploitation de ces données, nous proposons ici un environnement d’exploration visuelle reposant à la fois sur une représentation globale du corpus, sur une contextualisation d’un individu particulier et sur la visualisation à proprement parlée des documents. En outre, nous adaptons l’architecture des systèmes de recherche d’information à ce type de données. Nous avons proposé un système de recherche basé sur l’exploitation de la contextualisation d’un document et un autre basé sur un processus de fouille de données dans le but de prendre en compte la perception de l’utilisateur vis à vis de la requête posée en fonction de son jugement face aux documents retournés par le système. Enfin, nous décrivons des applications concrètes liées à l’exploitation de données complexes.
en During this work, we introduce the knowledge discovery from complex data. Our motivation comes from the increase of such data treatment needs. The major reason of this increase is probably due to the large development of the information technologies which support the complex document expansion. The complex data mining goal is to define a global framework which is able to treat a widely variety of documents, structured or not structured. Our point of view is that the user has not to support the data setting but has to be face up to the content of the documents.Each step of the KDD process is reconsidered through this general framework. Since the data exploitation is one of the goals of the process, we characterize and implement a visual exploration platform based on a global representation of the corpus, on a document contextualisation and on the document content visualisation. Moreover, we adapt the architecture of the information retrieval systems to those complex data. Hence, we suggest a system based on the contextualisation principle and another one based on the machine learning methods. This last system will enable to take into account the perception of the user on his request from his feedback on the documents returned by the system. Finally, we describe some concrete applications which concern such data.
Mots-clés
fr Fouille de données complexes ; extraction de caractéristiques ; sélection de variables ; k plus proches voisins ; graphe de voisinage ; arbres additifs ; représentation des proximités ; visualisation ; recherche d’information.
en Complex data mining ; feature extraction ; feature selection ; k nearest neighbours ; neighbourhood graph ; additive tree ; proximity representation ; visualisation ; information retrieval.
Editeur CyberDocs
Format text/xml
Langue fr
Copyright Copyright CLECH Jérémie et Université Lumière - Lyon 2 - 2004.Ce document est protégé en vertu de la loi du droit d'auteur.
Diffusion [internet]
Identifier http://theses.univ-lyon2.fr/documents/lyon2/2004/clech_j
Extent 27300