4.5.1.2. La modélisation des systèmes vocaliques

Les méthodes de modélisation sont nombreuses. Dans le cadre du modèle développé par Pellegrino, l’approche retenue est de type statistique. Elle est principalement basée sur la modélisation des observations vocaliques par mélange de lois gaussiennes (Reynolds, 1995). Cette étape vise à trouver une partition optimale en classes représentatives de l’ensemble d’apprentissage. Dans le cas d’une approche non-supervisée (i.e. détection automatique des segments vocaliques), aucune correspondance n’est possible a priori entre le nombre de voyelles observées et le nombre de classes vocaliques. Cette dernière situation correspond à notre cas puisque les modèles d’apprentissage sont obtenus sans utiliser aucun étiquetage manuel des données. Dans nos expériences, nous avons fait varier le nombre de classes entre 5, 10, 15, et 20. Les résultats d’identification présentés ci-après correspondent aux taux d’identification correcte obtenus avec 20 classes gaussiennes.