Les portails Lyon 2 : Intranet - Portail Etudiant - www
La conception et la réalisation d'un système d'analyse morpho-syntaxique robuste pour l'arabe : ut... par OUERSIGHNI Riadh - 2002 - Université Lumière Lyon 2

Métadonnées du document

Identifiant du document lyon2.2002.ouersighni_r
Code de l'institution lyon2
Année 2002
Auteurs OUERSIGHNI Riadh
Titre La conception et la réalisation d'un système d'analyse morpho-syntaxique robuste pour l'arabe : utilisation pour la détection et le diagnostic des fautes d'accord
Titre autres langues
en The conception and the realisation of a robust morpho-syntactic analyser for arabic and an agreement error checker system.
Membres du jury HASSOUN MOHAMED --- DICHY JOSEPH --- DESCLES Jean-pierre --- METZGER Jean-paul --- DITTERS Everhard
Directeurs de thèses HASSOUN MOHAMED
Diplome Doctorat Nouveau Régime
Etablissement Université Lumière Lyon 2
Ecole Doctorale Education, Cognition, Langages, Interactions, Psychologie
Factulté Institut de la Communication
Discipline Sciences de l'information et de la communication
Date de soutenance 2002-01-17
Type de document Thèse de Doctorat Nouveau Régime
Résumés
fr Cette thèse s'inscrit dans le cadre du traitement automatique du langage naturel (TALN). Elle concerne la conception et la réalisation effective d'un noyau d système d'analyse morpho-syntaxique robuste de l'arabe de grandeur réelle, qui puisse être utilisé dans les applications à grande échelle. Baptisé AraParse (Arabic Parser). AraParse est basé sur des ressources linguistiques (lexiques et grammaires) à large couverture et permet de traiter de l'arabe voyellé, non-voyellé ou partiellement voyellé.La thèse présente tout d'abord les problèmes posés par l'analyse morphologique, l'analyse syntaxique et l'intégration de ces deux types d'analyse dans un système opérationnel. Le système réalisé, baptisé AraParse, conçu suivant une architecture modulaire, permet un traitement des textes arabes voyellés, non voyellés et partiellement voyellés et utilise des ressources linguistiques (lexiques et grammaires) à large couverture.Nous aborderons ensuite le problème de la robustesse du système. la robustesse caractérise la capacité de l'analyseur à produire un résultat satisfaisant même devant une situation inattendue. Nous avons adopté une démarche tolérante basée sur la distinction entre le noyau et la périphérie de la grammaire. Le noyau décrit des propriétés essentielles de la langue. La périphérie englobe l'ensemble des phénomènes extra-linguistiques.Notre objectif est aussi de concevoir un système qui peut être réutilisé dans d'autre application. La vérification grammaticale en est une. Le système AraCheck, directement déduit de AraParse permet la détection et le diagnostic des fautes d'accord en arabe. Il est basé sur une approche tolérante par une analyse complète en un seul passage, par relâchement de contrainte au niveau des règles de contrôle de la grammaire.
en This dissertation contributes to the Natural Language Processing domain. The contribution is primary focused on the conception and the realisation of the AraParse system, a morpho-syntactic analyzer of written unvowelled, vowelled Modern Standard Arabic texts. "AraPars" is characterized by the large coverage of its linguistic resources, which are:- The lexicon generated from the DIINAR.1 Modern Standard Arabic data-base, including morphological derivation, suffixation and prefixation processes. The generated lexicon is estimated at 6 million minimal existing flexional forms.- The formal grammar written in AGFL (Affix Grammar over Finite Lattice) formalism covers a great deal of Arabic syntactic phenomena.After having given an overview of the problems encountered in the syntactic and morphological analysis such as ambiguity, anaphora, ellipsis, coordination, robustness of the system, etc?, as well as problems specific for Arabic.Next, we will tackle the robustness problem of the system. Robustness is defining relations between elements, which are not linguistically defined. The relaxed approach used is a technique to assign word classes to words that are not specified within the lexicon and to assign structures to sequences that are not described within the grammar. We adopt an approach based on the distinction between the core and the peripheral of grammar. That part of the grammar that will perform the robust parsing.Then we will present the AraCheck system (Arabic Checker), error agreement checker based also on a relaxed strategy.
Mots-clés
fr Analyse morpho-syntaxique ; arabe ; robustesse ; grammaire formelle ; détection ; diagnostic ; faute d'accord ; vérification grammaticale
Editeur CyberDocs
Format text/xml
Langue fr
Copyright Copyright OUERSIGHNI Riadh et Université Lumière - Lyon 2 - 2002.Ce document est protégé en vertu de la loi du droit d'auteur.
Diffusion [intranet]
Identifier http://theses.univ-lyon2.fr/documents/lyon2/2002/ouersighni_r
Extent 208546