Les portails Lyon 2 : Intranet - Portail Etudiant - www
Modeling and mining of web discussions par STAVRIANOU Anna - 2010 - Université Lumière Lyon 2

Métadonnées du document

Identifiant du document lyon2.2010.stavrianou_a
Code de l'institution lyon2
Année 2010
Auteurs STAVRIANOU Anna
Titre Modeling and mining of web discussions
Titre autres langues
en Modélisation et fouille de discussions de Web
Membres du jury TRAUSAN-MATU STEFAN --- PONCELET PASCAL --- GANASCIA JEAN-GABRIEL --- VELCIN JULIEN --- EL-BEZE MARC --- CHAUCHAT JEAN-HUGUES
Directeurs de thèses VELCIN JULIEN --- CHAUCHAT JEAN-HUGUES
Diplome Doctorat Nouveau Régime
Etablissement Université Lumière Lyon 2
Ecole Doctorale Informatique et mathématiques
Factulté Faculté des Sciences Economiques et de Gestion
Discipline Informatique
Date de soutenance 2010-02-01
Type de document Thèse de Doctorat Nouveau Régime
Résumés
en The development of Web 2.0 has resulted in the generation of a vast amount of online discussions. Mining and extracting quality knowledge from online discussions is significant for the industrial and marketing sector, as well as for e-commerce applications. Discussions of this kind encapsulate people's interests and beliefs and hence, there is a great interest in acquiring and developing online discussion analysis tools. The objective of this thesis is to define a model which represents online discussions and facilitates their analysis. We propose a graph-oriented model. The vertices of the graph represent postings. Each posting encapsulates information such as the content of the message, the author who has written it, the opinion polarity of the message and the time that the message was posted. The edges among the postings point out a "reply-to" relation. In other words they show which posting replies to what as it is given by the structure of the online discussion.The proposed model is accompanied by a number of measures which facilitate the discussion mining and the extraction of knowledge from it. Defined measures consist in measures that are underlined by the structure of the discussion and the way the postings are linked to each other. There are opinion-oriented measures which deal with the opinion evolution within a discussion. Time-oriented measures exploit the presence of the temporal dimension within a model, while topic-oriented measures can be used in order to measure the presence of topics within a discussion. The user's presence inside the online discussions can be exploited either by social network techniques or through the new model which encapsulates knowledge about the author of each posting.The representation of an online discussion in the proposed way allows a user to "zoom" inside the discussion. A recommendation of messages is proposed to the user to enable a more efficient participation inside the discussion.Additionally, a prototype system has been implemented which allows the user to mine online discussions by selecting a subset of postings and browse through them efficiently.
fr Le développement du Web 2.0 a donné lieu à la production d'une grande quantité de discussions en ligne. La fouille et l'extraction de données de qualité de ces discussions en ligne sont importantes dans de nombreux domaines (industrie, marketing) et particulièrement pour toutes les applications de commerce électronique. Les discussions de ce type contiennent des opinions et des croyances de personnes et cela explique l'intérêt de développer des outils d'analyse efficaces pour ces discussions.L'objectif de cette thèse est de définir un modèle qui représente les discussions en ligne et facilite leur analyse. Nous proposons un modèle basé sur des graphes. Les sommets du graphe représentent les objets de type message. Chaque objet de type message contient des informations comme son contenu, son auteur, l'orientation de l'opinion qui y été exprimée et la date où il a été posté. Les liens parmi les objets message montrent une relation de type "répondre à". En d'autres termes, ils montrent quels objets répondent à quoi, conséquence directe de la structure de la discussion en ligne.Avec ce nouveau modèle, nous proposons un certain nombre de mesures qui guident la fouille au sein de la discussion et permettent d'extraire des informations pertinentes. Les mesures sont définies par la structure de la discussion et la façon dont les objets messages sont liés entre eux. Il existe des mesures centrées sur l'analyse de l'opinion qui traitent de l'évolution de l'opinion au sein de la discussion. Nous définissons également des mesures centrées sur le temps, qui exploitent la dimension temporelle du modèle, alors que les mesures centrées sur le sujet peuvent être utilisées pour mesurer la présence de sujets dans une discussion. La représentation d'une discussion en ligne de la manière proposée permet à un utilisateur de "zoomer" dans une discussion. Une liste de messages clés est recommandée à l'utilisateur pour permettre une participation plus efficace au sein de la discussion. De plus, un système prototype a été implémenté pour permettre à l'utilisateur de fouiller les discussions en ligne en sélectionnant un sous ensemble d'objets de type message et naviguer à travers ceux-ci de manière efficace.
Mots-clés
en online discussions ; opinion mining ; text mining ; social networks ; recommender systems ; modelling ; forums
fr discussions en ligne ; opinion mining ; fouille de données d'opinion ; textmining ; fouille de texte ; réseaux sociaux ; systèmes de recommandation ; modélisation ; forum
Editeur CyberDocs
Format text/xml
Langue en
Copyright Sous contrat Creative Commons : Paternité-Pas d'Utilisation Commerciale-Pas de Modification 2.0 France (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) - STAVRIANOU Anna - Université Lyon 2 - 2010
Diffusion [internet]
Identifier http://theses.univ-lyon2.fr/documents/lyon2/2010/stavrianou_a
Extent 21730