4.5.2.1.2. Corpus de test

Pour la phase de test, nous avons utilisé les réalisations dialectales de dix autres locuteurs originaires de différents pays du Maghreb et du Moyen-Orient. Les parlers maghrébins sont représentés par des parlers marocains et algériens (i.e. locuteurs originaires de Touggourt et Jijel pour l’Algérie et Rabat, Tétouan et Casablanca pour le Maroc). La zone orientale apparaît dans les corpus de test à travers des réalisations en arabe égyptien (locuteur de Assouan), syrien (locuteur originaire de Homs), palestinien (Hébron et Haïfa) et enfin, jordanien (locuteurs de Irbid) (Tableau 56).

Tableau 56 : Variétés dialectales représentées dans le corpus de test
Locuteur Pays Ville d’origine
B0011 Algérie Touggourt
B0013 Algérie Jijel
B0022 Maroc Tétouan
B0024 Maroc Rabat
B0002 Maroc Casablanca
B0001 Egypte Assouan
B0006 Palestine Hébron
B0023 Syrie Homs
B0025 Palestine Haifa
B0031 Jordanie Irbid

Afin de compenser le manque de données, les expériences d’identification automatique ont été effectuées sur la base des quatre répétitions de chacun des dix locuteurs (i.e. 4 répétitions × 10 locuteurs = 40 tests).

Cependant, pour mesurer l’effet de la durée des énoncés sur les taux d’identification atteints, nous avons, dans un premier temps, pris une décision à la fin de chaque répétition du texte entier soit toutes les trente secondes. Les scores obtenus à l’issu de cette première condition expérimentale concernent donc quarante tests. Toutefois, le fait d’utiliser plusieurs répétitions d’un même locuteur a pour conséquence que les quatre tests ne peuvent être considérés comme indépendants.

Dans un second temps, nous avons considéré les quatre répétitions de chaque locuteur comme un bloc unique à la fin duquel la décision d’identification dialectale était prise (c’est-à-dire après 4 × 30 secondes de parole continue, soit environ toutes les deux minutes). Les taux obtenus à l’issue de cette seconde expérience correspondent ainsi aux scores atteints pour dix tests (i.e. 1 décision par locuteur).

Lors de l’utilisation de 40 tests, deux conditions expérimentales ont été testées. La première a consisté à déterminer le pouvoir discriminant de la dispersion vocalique seule. Dans ce premier temps, le modèle d’apprentissage est élaboré à partir des caractéristiques formantiques seules (i.e. 8 MFCC). Dans un second temps, le modèle est appris à partir de l’utilisation conjointe des caractéristiques formantiques et de l’information de durée (i.e. 8 MFCC + D). Notre hypothèse consiste à supposer que l’utilisation conjointe de ces deux critères discriminants, dont les caractéristiques — pour chaque zone dialectale — ont été mises en valeur au chapitre 3, conduit à améliorer les taux de reconnaissance de manière significative.