III.3.Méthodes de traitement

Pour étudier l’Identification Automatique de Langues, nous avons eu recours à deux types de méthodes : statistiques et connexionistes.

III.3.1.Méthodes statistiques

L’objectif des méthodes suivantes est de proposer une premier traitement du rythme par des moyens statistiques. Dans un premier temps, nous proposerons d’étudier le comportement du pourcentage vocalique au cours du temps. A un temps t donné, celui-ci correspond à la proportion d’intervalles vocaliques (toute séquence ininterrompue de voyelles ; Ramus, 1999) au sein d’un segment temporelle [0, t]. Il s’agit de la durée totale des intervalles vocaliques, contenus dans le segment [0, t] divisée par le temps t. Ensuite, un classifieur à moyenne gaussienne sera aussi employé, pour identifier les langues à partir de la durée des consonnes et des voyelles, et pour obtenir une base des performances, par une méthode de classification, faisant référence en statistique. La variable étudiée sera le pourcentage vocalique. Un passage de parole sera représenté par une séquence contenant n pourcentages vocaliques, correspondant aux n premiers phonèmes. Un descriptif plus approfondi de cette technique sera présenté dans la seule section expérimentale où elle est employée (IV.1.2).