Proposition d'un Système de Recherche d'Information assisté par ordinateur :

Métadonnées du document

Identifiant du document lyon2.1999.hkuramoto

Code de l'institution lyon2

Année 1999

Auteurs KURAMOTO Hélio

Titre Proposition d'un Système de Recherche d'Information assisté par ordinateur : — Application à la langue portugaise

Titre autres langues

en	Proposition of a Computer Aided Informations retrieval Systems — With application in portuguese language

Membres du jury LE GUERN Michel

Directeurs de thèses LE GUERN Michel

Diplome Doctorat Nouveau Régime

Etablissement Université Lumière Lyon 2

Discipline Sciences de l'information et de la communication

Date de soutenance 1999-04-01

Type de document Thèse de Doctorat Nouveau Régime

Résumés

fr Nous proposons un modèle d'un système d'indexation et de recherche d'information afin de faire face aux difficultés rencontrées par les usagers lors de l'utilisation de tels systèmes. Nous en distinguons deux types de problèmes : la faible précision des résultats d'une recherche d'information et le manque de convivialité des interfaces de recherche d'information. Nous limitons notre champ d'étude aux systèmes de recherche d'information (SRI) qui portent sur des bases de données textes pleins (full text). Suite à l'étude de ces difficultés nous sommes parvenus à une conclusion identique à celle proposé par le groupe SYDO : l'utilisation des syntagmes nominaux (SN) comme descripteur, en opposition à l'utilisation des mots couramment adoptés par les SRI classiques. Il s'agissait alors d'examiner la faisabilité de cette proposition. Nous avons donc développé une maquette d'un SRI ainsi qu'une base de données construite à partir d'un corpus d'articles scientifiques en langue portugaise. Ensuite, nous avons exploité cette maquette à l'aide d'un thesaurus, cela nous a permis de mieux connaître le comportement des SN à l'intérieur d'une structure arborescente, ainsi que de l'interface de recherche d'information. Pour conclure, nous avons établi un modèle de reconnaissance et d'extraction des SN en textes en langue portugaise. Plus que simplement arriver à la conclusion pour la faisabilité de notre proposition, la démarche adoptée nous a montré que les connaissances obtenues dans la pratique d'extraction et d'indexation des SN, ainsi que dans le développement de la maquette ont été importants pour l'établissement du modèle de reconnaissance et d'extraction des SN.

en " In this research paper, we propose a model to address problems typically faced by users of information indexing and retrieval systems. Two of the main issues are pointed out : low accuracy of information retrieval results ; and difficulties typically encountered by novice users of the information retrieval system interface. Our research is limited to information retrieval systems (IRS) applied to full text databases. Through discussion of these problems we arrive at a solution that had been formerly proposed by the SYDO group : the use of nominal phrases (or Nominal Group) as descriptors instead of words which are generally used by the traditional IRS. In order to verify the feasibility of this proposition, we have developed a prototype of an IRS with a full text database. For this database, we chose a sample of scientific articles in the Portuguese language. Subsequently, we tested this prototype using a thesaurus, thereby enabling us to gain a more robust knowledge of : the behavior of nominal phrases in a tree structure ; and the functionality of the information retrieval interface. Our final step was to develop a model of recognition and excerpt of nominal phrases in Portuguese texts. In addition to the practical considerations of testing the feasibility of our proposition and developing a prototype, our work demonstrates that the knowledge obtained by the practice of excerpts and indexing of nominal phrases is important in establishing recognition and excerpts of nominal phrase models. "

Mots-clés

fr	système de recherche d'informations; interface; indexation automatique; reconnaissance de syntagmes nominaux; extraction; traitement automatique du langage naturel
en	system of search for information; interface; automatic indexing; recognition of noun phrases; extraction; automatic treatment of the natural language

Editeur CyberDocs

Format text/xml

Langue fr

Copyright Copyright KURAMOTO Hélio et Université Lumière - Lyon 2 - 1999.Ce document est protégé en vertu de la loi du droit d'auteur.

Diffusion [internet]

Identifier http://theses.univ-lyon2.fr/documents/lyon2/1999/hkuramoto

Extent 1062912

Menu

Métadonnées du document