Les portails Lyon 2 : Intranet - Portail Etudiant - www
Approche Méthodologique de Sélection et Construction de Variables pour l’Amélioration du Proces... par LEGRAND Gaëlle - 2004 - Université Lumière Lyon 2

Métadonnées du document

Identifiant du document lyon2.2004.legrand_g
Code de l'institution lyon2
Année 2004
Auteurs LEGRAND Gaëlle
Titre Approche Méthodologique de Sélection et Construction de Variables pour l’Amélioration du Processus d’Extraction des Connaissances à partir de Grandes Bases de Données
Titre autres langues
en Methodological approach feature selection and construction for the improvment of knowledge discovery process from great data bases
Membres du jury ZIGHED Abdelkader --- NICOLOYANNIS Nicolas --- RITSCHARD Gilbert --- VENTURINI Gilles --- BENNANI Younes --- LECHEVALLIER Yves
Directeurs de thèses NICOLOYANNIS Nicolas
Diplome Doctorat Nouveau Régime
Etablissement Université Lumière Lyon 2
Ecole Doctorale Informatique et information pour la sociéte (INSA, ECL, LYON 1, LYON2)
Factulté Faculté des Sciences Economiques et de Gestion
Discipline Informatique
Date de soutenance 2004-12-20
Type de document Thèse de Doctorat Nouveau Régime
Résumés
fr De nos jours, du fait de la présence de grandes bases de données, l'amélioration de la qualité de représentation des données est au centre des préoccupations. Deux types de transformation de variables permettent d'extraire la connaissance pertinente à partir des données.La sélection de variables est un processus qui choisit un sous-ensemble optimal de variables en fonction d'un critère particulier et qui réduit l'espace des variables en supprimant les variables non pertinentes. Cette transformation permet la réduction de l’espace de représentation, l'élimination du bruit et l'élimination de la redondance. Nous proposons une méthode de sélection de variables hybride entre approche enveloppe et approche filtre qui utilise une méthode d’agrégation de préférences. La méthode d’agrégation nous permet d’obtenir une liste triée par ordre d’importance de sous-ensemble de variables grâce à l’agrégation d’un ensemble de critère myope.La construction de variables est un processus qui découvre les informations manquantes dans une relation entre variables et qui augmente l'espace des variables en créant des variables supplémentaires. Lors du processus de construction de variables, un ensemble d'opérateurs est appliqué à un ensemble de variables existantes, débouchant sur la construction d'une ou plusieurs nouvelles variables. Nous proposons de construire de nouvelles variables grâce à la découverte de la structure sous-jacente des données, c’est à dire en travaillant sur les modalités des variables. En effet, Il nous paraît plus pertinent de se concentrer sur les relations existants entre modalités de variables plutôt que sur les relations entre variables elles même.
en Nowadays, because of the presence of great data bases, the improvement of the data representation quality is very important. Two types of feature transformation make it possible to extract relevant knowledge starting from data.The feature selection is a process which chooses an optimal feature subset according to a particular criterion and which reduces the feature space by removing nonrelevant feature. This transformation allows the reduction of representation space, the elimination of noise and the elimination of redundancy. We propose a method of feature selection between wrapper and filter approach which uses a method of preferences aggregation. The method of aggregation enables us to obtain a feature subset list sorted by order of relevance thanks to the aggregation of results of a set of short-sighted criterion.The feature construction is a process which discovers missing information in a relation between feature and which increases the feature space by creating additional feature. At the time of the process of feature construction, a set of operators is applied to an existing feature set, leading to the construction of one or more new feature. We propose to build new feature thanks to the discovery of the subjacent structure of data. Indeed, It appears more relevant to us to concentrate on the relations existing between modalities of feature rather than on the relations between feature themselves.
Mots-clés
fr Sélection de variables; Construction de variables; Agrégation des préférences; Pré-traitement;Variables pertinentes
en Feature selection; Feature construction; Preferences aggregation; Preprocessing; Relevant feature.
Editeur CyberDocs
Format text/xml
Langue fr
Copyright Copyright LEGRAND Gaëlle et Université Lumière - Lyon 2 - 2004.Ce document est protégé en vertu de la loi du droit d'auteur.
Diffusion [internet]
Identifier http://theses.univ-lyon2.fr/documents/lyon2/2004/legrand_g
Extent 64234