Les portails Lyon 2 : Intranet - Portail Etudiant - www
Proposition d'un Système de Recherche d'Information assisté par ordinateur : par KURAMOTO Hélio - 1999 - Université Lumière Lyon 2

Métadonnées du document

Identifiant du document lyon2.1999.hkuramoto
Code de l'institution lyon2
Année 1999
Auteurs KURAMOTO Hélio
Titre Proposition d'un Système de Recherche d'Information assisté par ordinateur : — Application à la langue portugaise
Titre autres langues
en Proposition of a Computer Aided Informations retrieval Systems — With application in portuguese language
Membres du jury LE GUERN Michel
Directeurs de thèses LE GUERN Michel
Diplome Doctorat Nouveau Régime
Etablissement Université Lumière Lyon 2
Discipline Sciences de l'information et de la communication
Date de soutenance 1999-04-01
Type de document Thèse de Doctorat Nouveau Régime
Résumés
fr Nous proposons un modèle d'un système d'indexation et de recherche d'information afin de faire face aux difficultés rencontrées par les usagers lors de l'utilisation de tels systèmes. Nous en distinguons deux types de problèmes : la faible précision des résultats d'une recherche d'information et le manque de convivialité des interfaces de recherche d'information. Nous limitons notre champ d'étude aux systèmes de recherche d'information (SRI) qui portent sur des bases de données textes pleins (full text). Suite à l'étude de ces difficultés nous sommes parvenus à une conclusion identique à celle proposé par le groupe SYDO : l'utilisation des syntagmes nominaux (SN) comme descripteur, en opposition à l'utilisation des mots couramment adoptés par les SRI classiques. Il s'agissait alors d'examiner la faisabilité de cette proposition. Nous avons donc développé une maquette d'un SRI ainsi qu'une base de données construite à partir d'un corpus d'articles scientifiques en langue portugaise. Ensuite, nous avons exploité cette maquette à l'aide d'un thesaurus, cela nous a permis de mieux connaître le comportement des SN à l'intérieur d'une structure arborescente, ainsi que de l'interface de recherche d'information. Pour conclure, nous avons établi un modèle de reconnaissance et d'extraction des SN en textes en langue portugaise. Plus que simplement arriver à la conclusion pour la faisabilité de notre proposition, la démarche adoptée nous a montré que les connaissances obtenues dans la pratique d'extraction et d'indexation des SN, ainsi que dans le développement de la maquette ont été importants pour l'établissement du modèle de reconnaissance et d'extraction des SN.
en " In this research paper, we propose a model to address problems typically faced by users of information indexing and retrieval systems. Two of the main issues are pointed out : low accuracy of information retrieval results ; and difficulties typically encountered by novice users of the information retrieval system interface. Our research is limited to information retrieval systems (IRS) applied to full text databases. Through discussion of these problems we arrive at a solution that had been formerly proposed by the SYDO group : the use of nominal phrases (or Nominal Group) as descriptors instead of words which are generally used by the traditional IRS. In order to verify the feasibility of this proposition, we have developed a prototype of an IRS with a full text database. For this database, we chose a sample of scientific articles in the Portuguese language. Subsequently, we tested this prototype using a thesaurus, thereby enabling us to gain a more robust knowledge of : the behavior of nominal phrases in a tree structure ; and the functionality of the information retrieval interface. Our final step was to develop a model of recognition and excerpt of nominal phrases in Portuguese texts. In addition to the practical considerations of testing the feasibility of our proposition and developing a prototype, our work demonstrates that the knowledge obtained by the practice of excerpts and indexing of nominal phrases is important in establishing recognition and excerpts of nominal phrase models. "
Mots-clés
fr système de recherche d'informations; interface; indexation automatique; reconnaissance de syntagmes nominaux; extraction; traitement automatique du langage naturel
en system of search for information; interface; automatic indexing; recognition of noun phrases; extraction; automatic treatment of the natural language
Editeur CyberDocs
Format text/xml
Langue fr
Copyright Copyright KURAMOTO Hélio et Université Lumière - Lyon 2 - 1999.Ce document est protégé en vertu de la loi du droit d'auteur.
Diffusion [internet]
Identifier http://theses.univ-lyon2.fr/documents/lyon2/1999/hkuramoto
Extent 1062912