Les portails Lyon 2 : Intranet - Portail Etudiant - www
Détermination d'indices acoustiques robustes pour l'identification automatique des parlers arabes. par Barkat, Mélissa - 2000 - Université Lumière Lyon 2

Métadonnées du document

Identifiant du document lyon2.2000.barkat_m
Code de l'institution lyon2
Année 2000
Auteurs Barkat, Mélissa
Titre Détermination d'indices acoustiques robustes pour l'identification automatique des parlers arabes.
Membres du jury Jean-Marie Hombert --- Ian Maddieson --- Salem Ghazalli --- Didier Demolin --- François Pellegrino
Directeurs de thèses Hombert, Jean-Marie
Diplome Doctorat Nouveau Régime
Etablissement Université Lumière Lyon 2
Factulté Faculté des Lettres, des Sciences du Langage et Arts
Discipline Sciences du Langage
Date de soutenance 2000-04-28
Type de document Thèse de Doctorat Nouveau Régime
Résumés
fr Ce travail de thèse a pour objectif la recherche d'indices acoustiques robustes en vue de l'identification automatique des parlers arabes par zones géographiques. Cette problématique est née de la volonté d'intégrer les recherches en dialectologie arabe au champ nouveau et prometteur de l'identification automatique des langues. Par le biais d'expériences perceptuelles, nous avons déterminé un faisceau d'indices discriminants permettant la distinction des parlers maghrébins vs. orientaux. Parmi l'ensemble des traits dégagés, deux sont apparus comme étant a priori pertinents pour notre propos du fait de leur réalisation exclusive sur l'une ou l'autre des deux aires dialectales concernées. Il s'agit de la distribution des segments vocaliques et de la réalisation de l'opposition de durée vocalique. Différentes analyses acoustiques nous ont permis de caractériser la distribution des voyelles dans l'espace acoustique et d'établir une opposition pertinente entre les parlers maghrébins privilégiant la génération de voyelles centrales et les parlers orientaux préférant les positions périphériques. Du point de vue de la durée des segments vocaliques, notre étude révèle que l'opposition de durée est réalisée, en parole spontanée, dans des rapports comparables pour les parlers appartenant à une même zone géographique. En revanche, d'une zone dialectale à l'autre, les rapports mis en œuvre sont significativement différents, la tendance étant que les rapports voyelle longue/voyelle brève croissent d'Ouest en Est. La co-occurrence de ces deux critères de discrimination sur chacune des deux aires dialectales étudiées, nous a permis de les considérer comme potentiellement pertinents pour la discrimination automatique des parlers arabes par zone géographique. Nous avons ainsi mis en place des expériences d'identification automatique en utilisant un modèle de reconnaissance basé sur la détection automatique des voyelles et la modélisation statistique des systèmes vocaliques. Les résultats obtenus à l'issue de ces expériences valident la robustesse et la pertinence des deux critères de discrimination définis dans ce travail. En effet, nous montrons qu'il est possible de discriminer les parlers maghrébins des parlers orientaux sur la base des caractéristiques spectrales et quantitatives des segments vocaliques détectés automatiquement et nous obtenons entre 70 % et 90 % d'identification correcte en fonction du nombre de paramètres de modélisation retenus.
en This work aims at determining some reliable acoustic cues for the Automatic Identification of Arabic dialects by geographical zone. It represents an attempt to integrate Arabic dialectology into the recent and promising field of Automatic Language Identification. We used perceptual experiments to determine a set of efficient acoustic cues for the discrimination of Western vs. Eastern Arabic dialects. Among the entire set of discriminating criteria that emerged from our perceptual studies, two were, a priori, relevant for our ultimate goal, since they occur exclusively in one area or the other. Specifically, these two criteria are vocalic distribution and the realization of distinctive vowel length contrast in spontaneous speech. Our acoustic studies reveal, on the one hand, that Western dialects develop central vocalic positions whereas their Eastern counterparts tend to prefer peripheral ones. On the other hand, we show that the ratios long vowel/short vowel are comparable for dialects in the same area. On the contrary, there are significant differences between Western and Eastern dialects, the latter attesting a higher long/short ratio. In order to evaluate the robustness of the two criteria we studied for Automatic Language Identification, we performed a set of experiments using a model based on an automatic vowel detection algorithm and statistical vowel system modeling. Results show that Western and Middle-Eastern dialects may be discriminated using spectral features combined with vowel duration cues since the rate of correct identification ranges from 70 % to 90 % depending on the number of cues retained.
Mots-clés
fr dialectologie perceptuelle
en Perceptual Dialectology, Arabic Dialects, Automatic language Identification, Acoustic Phonetics, Vocalic Distribution, Segmental Duration
Editeur ERAD - Cellule Edition Electronique
Format text/html
Langue fr
Copyright Copyright Mélissa Barkat et Université Lumière, Lyon 2 - 2000. Ce document est protégé en vertu de la loi du droit d'auteur.
Diffusion Diffusion tout public
Identifier http://theses.univ-lyon2.fr/documents/lyon2/2000/barkat_m