IV.1.2.2.Algorithme

La première étape consiste à établir un modèle gaussien (moyenne et matrice de covariance) pour chaque langue en accumulant les caractéristiques rythmiques traduites par le pourcentage vocalique au cours du temps. Il en ressort ainsi un gabarit pour chaque langue testée. Ces valeurs étant obtenues, chaque séquence exprimée est comparée avec ces deux références, par l’utilisation de la courbe de Gauss, pour chacune des langues. Au bout du compte, la probabilité la plus élevée est celle de la langue reconnue.

Algorithme 3.1 Classification par moyenne gaussienne.
Algorithme 3.1 Classification par moyenne gaussienne.

La fonction position_max renvoielaposition de la valeur maximale seulement dans le cas où celle-ci est unique. La fonction zéros initialise une matrice à 0. Ensuite, les vecteurs MOYENNE et ECART_TYPE contiennent respectivement la moyenne et l’écart-type des valeurs prises pour la durée d’énonciation des phonèmes. La matrice CONFUSION indique comment les langues sont reconnues, et quelles langues prêtent à confusion. Enfin, la fonction pb calcule la valeur suivante de la probabilité gaussienne :

Avec :

  • X le vecteur induit par une phrase correspondant aux valeurs du pourcentage vocalique ;
  • C la matrice de covariance de l’ensemble des valeurs pour une langue donnée ;
  • M le vecteur moyenne de l’ensemble des valeurs pour une langue donnée ;
  • n la dimensiondu vecteur M.