II.1.Les bases techniques d’un système d’IAL

II.1.1.La jeunesse de l’IAL

Les premières publications 60 ayant trait à l’IAL ont vu le jour dans les années 70-80, pour la recherche militaire (Dutat, 2000). Ces publications fournissent très peu de renseignements sur le corpus employé et n’apportent pas d’indications particulières comme les conditions d’enregistrement, le nombre de locuteurs, leur sexe, etc.

Beaucoup d’idées avaient été examinées, mais elles ont eu peu d’impact sur les recherches actuelles. Les premières études étaient basées sur les différences spectrales entre les langues. Le spectre pouvait être représenté de plusieurs manières : par des motifs (features vectors), à partir des formants, ou encore par l’utilisation des coefficients sceptraux (Zissman et Berkling, 2001). La similarité spectrale est ensuite déterminée par une distance euclidienne, ou de Mahalanobis, ou par le biais de l’algorithme de regroupement des k-moyens. Elle est calculée entre le vecteur de test et tous ceux de la base d’apprentissage, la distance minimum indique la langue identifiée. Cette solution a été remplacée par une mixture gaussienne dans les travaux les plus récents 61 . Sur quelle structure est fondé un système d’IAL ?

Notes
60.

14 publications auraient vu le jour avant 1993 essentiellement dans des congrès et colloques comme Eurospeech, ICASSP, SRS (Muthusamy et coll.,  1993).

61.

D’autres techniques d’apprentissage comme les systèmes experts, les algorithmes de regroupement (clustering), les classifieurs quadratiques ont été testées (Zissman, 2001 ; Muthusamy et coll., 1993).