Les portails Lyon 2 :
Intranet
-
Portail Etudiant
-
www
Evaluation qualitative et guidage des utilisateurs en fouille visuelle de données.
par FANGSEU BADJIO Edwige P.
-
2005
-
Université Lumière Lyon 2
Menu
Présentation générale
Consulter le document
Versions imprimables
Contact
Table des matières
Illustrations
Tableaux
Page de titre
Dédicace
Remerciements
Résumé
Abstract
Introduction
Cadre de nos travaux : l’extraction de connaissances dans les données
Motivations
Contributions
Partie 1 : Etat de l’art
Chapitre 1 : Visualisation et fouille visuelle de données
1.1 Introduction
1.1.1 Objectifs, types et propriétés de représentations graphiques
1.1.2 Tâches principales de visualisation
1.2 Classification des techniques d’exploration de données
1.2.1 Les techniques de base
1.2.2 Les techniques géométriques
1.2.2.1Matrices
1.2.2.2Coordonnées parallèles
1.2.2.3Conclusion
1.2.3 Les techniques symboliques
1.2.3.1 Faces de Chernoff
1.2.3.2 Stick figure
1.2.3.3 Conclusion
1.2.4 Autres techniques
1.2.4.1Techniques liées aux graphes : Fish Eye
1.2.4.2Techniques hiérarchique -3D : Cone Tree
1.2.4.3Pixellisation [Keim, 1996]
1.2.4.4Data cube
1.3Fouille visuelle de données
1.3.1 Etat de l’art du domaine de la fouille visuelle de données
1.3.2 Techniques orientées pixel et construction d’un modèle de données
1.3.2.1 Segments de cercle
1.3.2.2 Barres rectangulaires
1.3.2.3Perception-Based Classification (PBC)
1.3.3Techniques matricielles et construction interactive d’un modèle des données
1.3.3.1 CIAD (Construction Interactive d’Arbre de Décision)
1.3.3.2 UserClassifier de WEKA
1.4Conclusion
Chapitre 2 : La qualité des logiciels
2.1 Introduction
2.2 Problématique
2.3 Définition de la qualité du logiciel
2.3.1 La qualité externe du logiciel
2.3.2 La qualité interne du logiciel
2.3.3 Conclusion
2.4 Description détaillée des facteurs de qualité du logiciel
2.4.1 Utilité
2.4.2 Utilisabilité
2.4.3 Maintenabilité
2.4.4 Portabilité
2.4.5 Conclusion
2.5 Conséquences de la non qualité des logiciels
2.6 La qualité des logiciels selon divers domaines de recherche
2.6.1 Qualité du logiciel et génie logiciel
2.6.2 Qualité du logiciel et interaction homme machine
2.6.3 Qualité du logiciel et ergonomie des logiciels
2.7 Evaluation de la qualité des logiciels
2.7.1 Evaluation du point de vue des utilisateurs finaux
2.7.2 Evaluation ergonomique des interfaces
2.7.2.1 Cognitive walkthrough
2.7.2.2 L’évaluation coopérative
2.7.2.3 L’évaluation avec des lignes directrices « guidelines »
2.7.3 Evaluation heuristique
2.7.4 Evaluation par des critères ergonomiques de Bastien et Scapin
2.7.5 Conclusion
2.8 La qualité des logiciels de fouille visuelle de données
2.8.1 La qualité des modèles de données : estimation de l’erreur
2.8.2 Etude de la qualité externe des logiciels de fouille visuelle de données
2.9 Etude qualitative et détection de défaillances dans les logiciels de FVD
2.9.1 Processus de détection des défaillances
2.9.2 Synthèse : détection des défaillances en FVD
2.10 Conclusion
Partie 2 : Contributions en analyse qualitative pour la FVD
Publications
Chapitre 3 : Méthode d’inspection experte en FVD
3.1 Introduction
3.2 Etat de l’art : fondements théoriques en analyse de la situation de travail
3.3 Evaluation de logiciels à l’aide de directives
3.4 Analyse de la situation de travail en FVD
3.4.1 Modèle utilisateur de FVD
3.4.1.1 Acquisition du modèle utilisateur de FVD
3.4.1.2 Maintenance du modèle utilisateur de FVD
3.4.1.3 Discussion
3.4.2 Modèle de tâche de FVD
3.5 Inspection experte : directives pour la FVD
3.5.1 Guidage
3.5.1.1 Définition
3.5.1.2 Exemple concret de mise en œuvre du guidage en FVD
3.5.2 Gestion des erreurs
3.5.2.1 Définition
3.5.2.2 Mise en œuvre
3.5.3 Adaptabilité
3.5.3.1 Définition
3.5.3.2 Mise en œuvre
3.5.4 Réutilisation des données d’apprentissage
3.5.4.1 Définition
3.5.4.2 Mise en œuvre
3.5.5 Multiplicité du rendu
3.5.5.1 Définition
3.5.5.2 Mise en œuvre
3.5.6 Aide en ligne
3.5.6.1 Définition
3.5.6.2 Mise en œuvre
3.5.7 Feedback
3.5.7.1 Définition
3.5.7.2 Mise en œuvre
3.5.8 Plasticité
3.5.8.1 Définition
3.5.8.2 Mise en œuvre
3.5.9 Curabilité
3.5.9.1 Définition
3.5.9.2 Mise en œuvre
3.5.10 Conclusion
3.6 Conclusion
Chapitre 4 : Métriques et mesures de qualité en FVD
4.1 Introduction
4.1.1 Cadre formel : modèle GQM (Goal/Question/Metrics )
4.1.2 Processus de spécification des métriques
4.2 Définition de mesures : application du cadre formel GQM
4.2.1 Objectifs de qualité
4.2.2 Questions à répondre pour améliorer la qualité des outils de FVD : Q de GQM
4.2.3 Ensemble de mesures : M de GQM (niveau 1)
4.2.4 Ensemble de mesures : M de GQM (niveau 2)
4.2.4.1 Thème Utilisateur
4.2.4.2 Thème Utilisabilité
4.2.4.3 Thème Modèle de Présentation de l’Interface (MPI)
4.2.4.4 Thème Qualité Technique
4.2.4.5 Thème Scénario
4.2.4.6 Thème Visualisation
4.2.5 Discussion : comparaison des métriques d’analyse des logiciels de FVD avec les autres méthodes d’analyse
4.3 Diagnostic des systèmes de FVD : questionnaire destiné aux utilisateurs
4.3.1 Questions pour le thème Utilisateur
4.3.2 Questions pour le thème Utilisabilité
4.3.3 Questions pour le thème MPI
4.3.4 Questions pour le thème Qualité technique
4.3.5 Questions pour le thème Scénario
4.3.6 Questions pour le thème Visualisation
4.4 Problèmes de qualité susceptibles d’être répertoriés
4.5 Etude de cas : application du questionnaire d’évaluation
4.5.1 Liste des tâches
4.5.2 Cadre de l’étude
4.5.3 Résultats
4.6 Conclusion et travaux futurs
Partie 3 : Contributions à l’amélioration de la qualité des outils de FVD
Publications
Chapitre 5 : Support à la sélection du meilleur algorithme pour la FVD
5.1 Introduction
5.1.1 Analogies entre conception en général et conception du modèle des données
5.1.2 Nécessité d’assistance en conception du modèle des données
5.2 Assistance à la conception du modèle de données : retrouver les meilleurs algorithmes de classification supervisée
5.2.1 Cadre de l’étude : la fouille visuelle de données
5.2.2 Etat de l’art : synthèse des travaux en prédiction de performances d’algorithmes de classification
5.2. 3 Support par des expérimentations au choix de la méthode d’analyse : description du problème
5.2.3.1 Les ensembles de données à traiter
5.2.3.2 Analyse des variables
5.2.3.3 Analyse des variables quantitatives
5.2.3.4 Analyse des variables qualitatives
5.2.3.5 Eléments de décision pour la comparaison des ensembles de données
5.2.3.6 Evaluation de la ressemblance entre ensembles de données
5.2.3.7 Algorithme des k plus proches voisins (kppv)
5.2.4 Le raisonnement à partir de cas (RàPC)
5.2.4.1 Processus du raisonnement à partir de cas
5.2.4.2 Inconvénients du raisonnement à partir de cas
5.2.5Traitement de l’ évolutivité de l’environnement de fouille
5.2.6 Ajout d’un nouvel ensemble de données
5.3 Evaluation d’une approche usuelle des prédictions de performances : algorithme des k-ppv
5.3.1 Méthode d’évaluation : apprentissage suivi de vérification
5.3.1.1 Premier test
5.3.1.2 Second test
5.3.1.3 Conclusion
5.3.1.4 Troisième test
5.3.2 Synthèse
5.4 Solution proposée
5.4.1 Modélisation du système multi-agent
5.4.1.1 Trace de scénario de la session d’analyse de données
5.4.1.2 Prise de décision (Agent Facilitateur)
5.4.1.3 Critères d’évaluation pour la prise de décision (C)
5.4.1.4 Evaluation de l’impact des critères
5.4.2 Etude de cas
5.5 Conclusion
Chapitre 6 : Support au prétraitement des données en FVD
6.1 Introduction
6.2 Etat de l’art et problématique
6.2.1 Sélection d’attributs significatifs
6.2.1.1 Procédure de génération des sous-ensembles d’attributs
6.2.1.2 Fonction d’évaluation
6.2.1.3 Critère d’arrêt
6.2.2 Problèmes en sélection d’attributs significatifs pour la FVD
6.3 Théorie du consensus : état de l’art
6.4 Algorithme de sélection d’attributs basé sur la théorie du consensus (CTBFS)
6.5 Affectation visuelle de poids pour la prise de décision collective
6.6 Réduction du nombre d’observations
6.7 Expérimentations
6.7.1 Sélection d’attributs
6.7.1.1 Premier test
6.7.1.2 Deuxième test
6.8 Conclusion
Conclusion et perspectives
Références