5.4.5 quelle modélisation pour la complexité linguistique ?

Les projets de recherche que nous avons présentés ci-dessus ont une portée essentiellement linguistique. Toutefois, ce type démarche sera pleinement fructifié si la mise en forme des résultats est adéquate pour l’identification automatique des langues. C’est précisément ce que nous proposons dans ce cinquième axe de recherche. Nous avons pu voir dans le Chapitre 2 que la comparaison entre les performances des systèmes automatiques et des humains, notamment pour ce qui est de l’identification automatique des langues, n’est pas de date récente. Cependant, une véritable valorisation des résultats obtenus en identification perceptive des langues au profit des systèmes automatiques ne reste qu’un objectif partiellement atteint. Par conséquent, il nous semble important de trouver la meilleure formalisation des résultats purement linguistiques afin de contribuer à l’amélioration des performances automatiques. À titre d’exemple, il nous semble important de modéliser la notion de ’distance linguistique’ que nous avons avancée dans cette thèse, afin de la rendre accessible aux besoins concrets d’un système d’identification automatique des langues romanes. Jusqu’à présent, la thématique de notre travail nous a permis de la circonscrire et d’en prouver la validité perceptive. Une deuxième partie du chemin serait donc d’y associer le formalisme pertinent pour sa valorisation automatique.

La complexité respective des langues romanes offre un exemple de faits linguistiques dont la description plus approfondie pourra améliorer les performances des systèmes automatiques. L’analyse de ces faits soumis à des changements linguistiques en cours, tels les mutations subies par le vocalisme italien, la réorganisation des oppositions en français ou encore, le développement de la labialisation allophonique en roumain, nous semble particulièrement significative. Ainsi, une analyse acoustique et une formalisation adéquate permettront une délimitation des faits décrits d’une manière accessible pour un système automatique, tandis qu’une expertise perceptive pourrait illustrer le poids effectif de ces changements dans les langues et la façon dont les auditeurs traitent et gèrent ces phénomènes. En outre, l’analyse des stratégies individuelles en production et perception pourrait s’avérer une source d’amélioration des performances dans le domaine de l’identification automatique du locuteur.