Le spectrogramme

Dès les années 60 le spectrographe a permis aux scientifiques de visualiser les productions sonores de manière précise. Grâce à eux, un certain nombre d’observations nouvelles ont pu être produites dès les années 60, notamment sur les modulations intermédiaires entre les hauteurs fréquentielles des voyelles des langues non tonales. Cependant un certain nombre de précautions d’observation avec des spectrogrammes sont nécessaires, elles sont liées à la théorie mathématique sur laquelle ils reposent pour représenter le signal :

‘« La représentation visuelle sous la forme de sonagramme rend certainement de grands services, il visualise le signal et lui donne une forme préhensible. Toutefois, malgré les artifices des possibilités de filtrage (filtre étroit ou à large bande ) il faut admettre une fois pour toutes, que l'image obtenue a des limites dans sa définition acoustique, et qu'il ne faut pas attacher une extrême rigueur à la précision obtenue; enfin et surtout on doit avoir conscience que cet appareil est susceptible d'introduire des artéfacts » (Busnel 1970, p.50-51).’

En effet, l’analyse de Fourier aide à résoudre des problèmes linéaires 4 . Les problèmes non linéaires sont difficiles à résoudre car une infime variation d’un paramètre peut bouleverser les conséquences sur le signal. Or de nombreux aspects de la production et de la perception des langues sont non linéaires. D’autre part, l’interprétation physique est difficile car les éléments d’analyse de Fourier sont des sinus et des cosinus qui oscillent éternellement. Une transformée de Fourier cache l’information sur le temps, elle n’est pas perdue mais elle est ensevelie sous les phases. L’analyse de Fourier à fenêtres permet de régler partiellement ce problème car il faut alors choisir la précision en terme de temps ou de fréquence, ce qui oblige à faire des compromis entre la précision spectrale et la précision temporelle. Une transformation à fenêtre étroite est précise en terme de temps mais n’est pas précise en terme de fréquences, surtout pour les plus grandes. Pourtant, comme le dit Gabor « nos expériences quotidiennes –notamment nos sensations auditives –imposent une description en termes de temps et de fréquences »(Gabor cité par Hubbard, 1996). Haggard rappelle que le découpage en temps et fréquence est motivé par une simplification explicative: "We must remember ... that the contrast between time- and frequency-based structures is more a dichotomy of our explanatory framework than a dichotomy in the reality we seek to describe. Auditory events are spectrotemporal ..." (Haggard, 1985, p. 215).

Au cours du traitement des données, nous avons eu besoin de caractériser le signal sifflé de manière fiable afin de pouvoir faire des calculs sur ses différentes dimensions: fréquence, amplitude, et durée. Nous avons remarqué que même s’il est possible de mesurer la fréquence à un instant donné par analyse spectrale à partir d’un oscillogramme, il est très difficile de suivre l’évolution précise en fréquence en fonction du temps. C’est pourquoi, nous avons cherché à développer des outils adaptés pour des mesures spectrotemporelles plus fiables que le spectrogramme.

Notes
4.

C’est à dire pour lesquels l’effet est proportionnel à la cause