Apprentissage non supervisé et extraction de connaissances à partir de données

Métadonnées du document

Identifiant du document lyon2.2003.jouve_pe

Code de l'institution lyon2

Année 2003

Auteurs JOUVE Pierre-Emmanuel

Titre Apprentissage non supervisé et extraction de connaissances à partir de données

Titre autres langues

en	Clustering and knowledge discovery in databases

Membres du jury NICOLOYANNIS Nicolas --- RITSCHARD GILBERT --- LAMURE Michel --- RASSON Jean-Paul --- VENTURINI Gilles --- HACID Mohand-Said

Directeurs de thèses NICOLOYANNIS Nicolas

Diplome Doctorat Nouveau Régime

Etablissement Université Lumière Lyon 2

Factulté Faculté des Sciences Economiques et de Gestion

Discipline Informatique

Date de soutenance 2003-12-10

Type de document Thèse de Doctorat Nouveau Régime

Résumés

fr Les travaux constituant cette dissertation concernent la classification non supervisée. Cette problématique, commune à de multiples domaines (et ainsi connue sous diverses acception : apprentissage/classification non supervisé(e) en reconnaissance de formes, taxonomie en sciences de la vie, typologie en sciences humaines), est ici envisagée selon la perspective Ingénierie des Connaissances et plus spécifiquement dans le cadre de son intégration au sein du processus d'Extraction de Connaissances à partir de Données (ECD).D'une part, nos travaux participent à l'amélioration du processus de classification non supervisée, et ce, selon divers axes propres ou non à l'ECD (coût calculatoire et utilisabilité des méthodes, formes et distribution des données traitées, forme des connaissances extraites, sélection de variables pour l'apprentissage non supervisé) mais aussi à l'évaluation de la qualité d'un processus de classification non supervisée (estimation de la validité des résultats issus du processus). D'autre part ces travaux visent à illustrer le lien très étroit unissant apprentissage non supervisé et apprentissage supervisé et à montrer l'intérêt d'une interaction entre ces deux types de processus. Concrètement, ces divers problèmes sont abordés et présentés au travers d'une nouvelle méthode de classification non supervisée, de deux nouveaux indices et d'une méthodologie dédiés à l'évaluation/Comparaison de la validité de classification non supervisée, de méthodes de sélection de variables pour l'apprentissage non supervisé et l'apprentissage supervisé, de plusieurs méthodes pour l'agrégation de classification non supervisée.

en This dissertation deals with clustering. This problem, which is common to many fields (and thus may be found under different names such as: unsupervised learning in pattern recognition, taxonomy in life sciences, typology in human sciences), is considered here through Knowledge Engineering perspective. More specifically, we consider clustering as an integrated step of a Knowledge Discovery in Databases (KDD) process. One the one hand, our work contributes to clustering process enhancement according to several axis (computational cost and usability of clustering algorithms, type and distribution of treated data, materialization of extracted knowledge, feature selection for clustering) but also contributes to Clustering Quality Checking (Clustering Validity Checking). On the other hand, our work aims at illustrating the link between supervised and unsupervised learning and showing that the interaction between these two kind of learning is largely profitable. These problems are treated through the presentation of a new clustering method, as well as two new indices and a methodology dedicated to clustering validity comparison/assesment, two new methods for feature selection (in supervised learning and clustering contexts), and finally several methods for clustering combinations.

Mots-clés

fr	ECD ; apprentissage non supervisé/supervisé/semi-supervisé; séléction de variables ; agrégation de modèles

Editeur CyberDocs

Format text/xml

Langue fr

Copyright Copyright JOUVE Pierre-Emmanuel et Université Lumière - Lyon 2 - 2003.Ce document est protégé en vertu de la loi du droit d'auteur.

Diffusion [internet]

Identifier http://theses.univ-lyon2.fr/documents/lyon2/2003/jouve_pe

Extent 38400

Menu

Métadonnées du document