Ils se dégage des études en typologie linguistique que les systèmes vocaliques des langues présentent un important pouvoir discriminant tout en offrant les avantages d’une représentation homogène (Vallée, 1994). La représentation acoustique des voyelles présente, comme nous le savons, un isomorphisme remarquable fondé essentiellement sur une représentation articulatoire en deux dimensions (i.e. avant ~ arrière vs ouvert ~ fermé).
Cette relative simplicité de forme ne se retrouve pas dans le cas des segments consonantiques pour lesquelles on atteste des divergences importantes tant au niveau du lieu que du mode d’articulation. Ces différences formelles s’observent d’ailleurs sur la structure acoustique des consonnes (par exemple, bruit d’explosion d’une occlusive vs bruit de friction d’une fricative), et ont été largement décrites dans la littérature (Maddieson, 1995). Notons que dans le cas précis de l’arabe, cette difficulté se trouve renforcée par l’existence de phonèmes consonantiques complexes caractérisés par une double articulation67.
Autant de paramètres qui ont mené l’auteur à restreindre son modèle à la modélisation des systèmes vocaliques. Ceci nous permettra d’évaluer les traits discriminants mis en évidence au cours des chapitres précédents concernant la dispersion et la quantité des segments vocaliques. En effet, le système présenté dans son travail et utilisé dans cette thèse dans le cadre de nos applications pour la discrimination des dialectes arabes, est fondamentalement basé sur la localisation automatique des segments vocaliques dans le signal et sur leur modélisation acoustique.
Dans les paragraphes suivants, nous présentons brièvement le cadre statistique sur lequel se base ce modèle. Nous n’entendons pas décrire de manière détaillée l’éventail des algorithmes utilisés en amont, et renvoyons le lecteur désireux d’obtenir de plus amples informations à ce propos à l’ouvrage de référence qui lui est consacré (Pellegrino, 1998).