Identifiant du document |
lyon2.1999.hkuramoto |
Code de l'institution |
lyon2 |
Année |
1999 |
Auteurs |
KURAMOTO Hélio |
Titre |
Proposition d'un Système de Recherche d'Information assisté par ordinateur : — Application à la langue portugaise |
Titre autres langues |
en |
Proposition of a Computer Aided Informations retrieval Systems — With application in portuguese language |
|
Membres du jury |
LE GUERN Michel |
Directeurs de thèses |
LE GUERN Michel |
Diplome |
Doctorat Nouveau Régime |
Etablissement |
Université Lumière Lyon 2 |
Discipline |
Sciences de l'information et de la communication |
Date de soutenance |
1999-04-01 |
Type de document |
Thèse de Doctorat Nouveau Régime |
Résumés |
fr |
Nous proposons un modèle d'un système d'indexation et de recherche d'information afin de faire face aux difficultés rencontrées par les usagers lors de l'utilisation de tels systèmes. Nous en distinguons deux types de problèmes : la faible précision des résultats d'une recherche d'information et le manque de convivialité des interfaces de recherche d'information. Nous limitons notre champ d'étude aux systèmes de recherche d'information (SRI) qui portent sur des bases de données textes pleins (full text). Suite à l'étude de ces difficultés nous sommes parvenus à une conclusion identique à celle proposé par le groupe SYDO : l'utilisation des syntagmes nominaux (SN) comme descripteur, en opposition à l'utilisation des mots couramment adoptés par les SRI classiques. Il s'agissait alors d'examiner la faisabilité de cette proposition. Nous avons donc développé une maquette d'un SRI ainsi qu'une base de données construite à partir d'un corpus d'articles scientifiques en langue portugaise. Ensuite, nous avons exploité cette maquette à l'aide d'un thesaurus, cela nous a permis de mieux connaître le comportement des SN à l'intérieur d'une structure arborescente, ainsi que de l'interface de recherche d'information. Pour conclure, nous avons établi un modèle de reconnaissance et d'extraction des SN en textes en langue portugaise. Plus que simplement arriver à la conclusion pour la faisabilité de notre proposition, la démarche adoptée nous a montré que les connaissances obtenues dans la pratique d'extraction et d'indexation des SN, ainsi que dans le développement de la maquette ont été importants pour l'établissement du modèle de reconnaissance et d'extraction des SN. |
en |
" In this research paper, we propose a model to address problems typically faced by users of information indexing and retrieval systems. Two of the main issues are pointed out : low accuracy of information retrieval results ; and difficulties typically encountered by novice users of the information retrieval system interface. Our research is limited to information retrieval systems (IRS) applied to full text databases. Through discussion of these problems we arrive at a solution that had been formerly proposed by the SYDO group : the use of nominal phrases (or Nominal Group) as descriptors instead of words which are generally used by the traditional IRS. In order to verify the feasibility of this proposition, we have developed a prototype of an IRS with a full text database. For this database, we chose a sample of scientific articles in the Portuguese language. Subsequently, we tested this prototype using a thesaurus, thereby enabling us to gain a more robust knowledge of : the behavior of nominal phrases in a tree structure ; and the functionality of the information retrieval interface. Our final step was to develop a model of recognition and excerpt of nominal phrases in Portuguese texts. In addition to the practical considerations of testing the feasibility of our proposition and developing a prototype, our work demonstrates that the knowledge obtained by the practice of excerpts and indexing of nominal phrases is important in establishing recognition and excerpts of nominal phrase models. " |
|
Mots-clés |
fr |
système de recherche d'informations; interface; indexation automatique; reconnaissance de syntagmes nominaux; extraction; traitement automatique du langage naturel |
en |
system of search for information; interface; automatic indexing; recognition of noun phrases; extraction; automatic treatment of the natural language |
|
Editeur |
CyberDocs |
Format |
text/xml |
Langue |
fr |
Copyright |
Copyright KURAMOTO Hélio et Université Lumière - Lyon 2 - 1999.Ce document est protégé en vertu de la loi du droit d'auteur. |
Diffusion |
[internet] |
Identifier |
http://theses.univ-lyon2.fr/documents/lyon2/1999/hkuramoto |
Extent |
1062912 |