VI. Communications à des congrès nationaux avec actes

Jeanvoine A, Richard C., Moulin A., Berger-Vachon C, Thai-Van H. (2010) Détection automatique d’indices pertinents dans les réponses électrophysiologiques de type PEA recueillis en réponse à un son de parole. 10ème Congrès Français d'Acoustique, Lyon, Avril 2010.

Jeanvoine, A., Richard, C. Moulin, A. Perrin, E., Laboissière R., Thai-Van, H. Berger-vachon, C. (2010) Détection automatique des indices caractéristiques d’un Potentiel Evoqué Auditif en réponse à  un son de parole (PEASP) par l’utilisation de la méthode de détection de forme. Handicap 2010 (IFRATH, juin 2010, Paris).

Détection automatique des indices caractéristiques d’un Potentiel Evoqués Auditif en réponse à un son de parole par une utilisation de la méthode de détection de forme

A. Jeanvoine1, 2, C. Richard1, 3, A. Moulin1, 2, E. Perrin2, 4, R. Laboissière2, 5, Thai-Van1, 2, C. Berger-vachon1, 2

1 : Laboratoire Neurosciences Sensorielles, Comportement et Cognition, UMR 5020, H.E.H., 5 place d’Arsonval,

69437 Lyon cedex 03

2 : Université Claude Bernard Lyon1, 43 Bd du 11 Novembre 1918, 69100 Villeurbanne

3 : Service d’ORL et de chirurgie cervico-faciale, CHU de Saint Etienne, Hôpital Nord, 42055 Saint Etienne cedex 02

4 : CREATIS-LRMN, CNRS INSA UCBL UMR 5220 INSERM U630, bâtiment 308, CPE Lyon, 43 Bd du 11 Novembre 1918, 69622 Villeurbanne cedex

5 : INSERM U864, Espace et Action, 16 Avenue Doyen Lépine, 69676 Bron cedex

arnaudjeanvoine@yahoo.fr

Résumé : - Un Potentiel Evoqué Auditif en réponse à un son de parole (PEASP) est formé de deux parties distinctes : la réponse impulsionnelle (ou Onset Response, OR) et la réponse soutenue en fréquence (ou Frequency Following Response, FFR). Dans l’état actuel des connaissances, nous ne pouvons pas caractériser précisément les paramètres pertinents du PEASP (amplitudes, durées et latences). L’analyse actuelle étant effectuée visuellement, et donc observateur-dépendante, l’objectif de ce travail est la mise au point d’une méthode de détection automatisée des différentes caractéristiques de la réponse PEASP, avec une application clinique future. - La mise au point d’une méthode automatisée nécessite tout d’abord la création d’un modèle mimant les caractéristiques des différentes parties du PEASP. Ainsi l’OR est caractérisée par une variation bipolaire rapide et est modélisée au moyen de trois fonctions linéaires différentes. La FFR est modélisée par un ensemble de sinusoïdes, correspondant aux fréquences fondamentale et harmoniques. - La comparaison de ce modèle type avec la réponse, sur une fenêtre glissant sur l’ensemble de la réponse, permet de déterminer les points de plus forte corrélation entre le modèle et la réponse, identifiant par là même, les indices au sein de la réponse, de manière objective.

I. Introduction

Les potentiels évoqués auditifs précoces, en réponse à des stimuli acoustiques de type clics, constituent une technique électrophysiologique d’exploration des voies auditives centrales, bien codifiée, et couramment employée en pratique clinique. L’utilisation récente de son de parole de type « consonne + voyelle » a l’avantage d’être plus écologiquement valide, et d’explorer, de manière plus fine, la perception de sons de parole le long des voies auditives. En revanche, les potentiels évoqués auditifs obtenus en réponse à ces sons de parole (PEASP), n’ont pas encore fait l’objet d’une validation et codifications objectives, préalables à toute utilisation clinique. Les réponses de type PEASP sont recueillies au niveau de 3 électrodes de surfaces placées sur le scalp du sujet, en réponse à la syllabe « /BA/ ». La forme typique du PEASP se compose de deux parties (fig. 1) : une réponse impulsionnelle, ou Onset Response (OR), qui est similaire à l’onde V des PEAP évoqués par clics et une réponse soutenue en fréquence ou Frequency Following Response (FFR) qui suit la périodicité de la voyelle du stimulus [1][2][3]. La latence, durée et amplitude de la FFR, reflètent certains aspects du traitement des sons de parole au niveau du tronc cérébral, et en particulier, le degré de synchronisation des voies auditives sur la périodicité du stimulus (pour une revue des applications cliniques [4][5][6]. Le but de ce travail est de caractériser, de manière objective, les paramètres des réponses de type PEASP, afin de déterminer les indices qui seront pertinents pour une utilisation clinique future.

Figure 1 : Potentiel Evoqué Auditif en réponse à un son de parole.
Figure 1 : Potentiel Evoqué Auditif en réponse à un son de parole.

I. Matériel ET Methode

A. Méthode de recueil de PEASP

Le PEASP est une réponse électrophysiologique en réponse à un stimulus  /BA/, présenté binauralement. Le matériel de recueil se compose de (fig. 2) [7][8]:

Une chaîne de stimulation composée d’un ordinateur portable et d’une carte son externe, dont l’un des canaux est, après amplification, connecté aux écouteurs de type insert, insérés au niveau du conduit auditif externe du sujet, un autre canal étant connecté au trigger.

Une chaine de recueil, composée de 3 électrodes de surface, positionnées sur le scalp du sujet, au niveau du vertex (électrode « + »), du front (masse), et de chaque mastoïde (électrode « - ») (fig. 2). La mesure du signal, de l’ordre du micro-volt, s’effectue par la différence de potentiel entre l’électrode « + » et l’électrode « - », par rapport à la masse commune de la tête. Le signal des électrodes est amplifié (boite tétière) avant d’être recueilli par un appareil couramment utilisé pour le recueil des PEAP : le Centor USB, qui assure le moyennage des réponses, synchronisées sur le stimulus.

Du fait de la longueur du stimulus (>50 ms), de son occurrence simultanée au recueil, et de sa similitude avec la réponse de type PEAPSP, (fig. 1), le recueil nécessite une isolation dans une cage de Faraday stricte reliée à la masse, ainsi que l’utilisation d’écouteurs de type d’inserts plutôt que de type casque (Akhoun et coll.), permettant d’isoler le plus possible les électrodes de la transduction electro-acoustique des écouteurs. Un moyennage de plus de 2000 traces en polarité alternée est habituellement nécessaire, avec une intensité de stimulation variant de 50 à 80 dB HL selon les équipes (richard et al.). La fréquence d’échantillonnage est celle maximale admise par le Centor USB (13,3 kHz).

Malgré ces précautions, il est parfois difficile d’obtenir des enregistrements peu bruités, surtout en milieu hospitalier, où les sources électromagnétiques interférentes peuvent être nombreuses, d’où l’intérêt de développer des méthodes permettant d’extraire et de quantifier les réponses de manière plus objective, que la méthode visuelle actuellement employée.

B. Caractéristiques du PEAPSP

Le PEAP se compose de l’OR, qui est une réponse impulsionnelle ressemblant fortement à l’onde V de PEAP classiques, et qui est suivie de la réponse fréquentielle soutenue (FFR). Cette réponse de type FFR est d’énergie quasi-constante, et présente la même enveloppe que celle du stimulus, avec un décalage. La figure 1 montre les traces temporelles du stimulus /BA/, de son enveloppe, de cette même enveloppe décalée de 7 ms, et de la réponse de type PEAPSP. Ce décalage, ou latence de la FFR, est obtenu en corrélant l’enveloppe inversée du stimulus, obtenue après un filtrage passe-bas au dessous de 500 Hz d’ordre un, avec la réponse du type FFR [9][10][11].

La transformée de Fourier du signal sur la partie FFR (fig. 2), montre des pics correspondant à la fréquence du fondamental (F0), ainsi que des premières harmoniques (2F0), de manière similaire au spectre de la voyelle. L’amplitude de ces pics donne une image de la qualité de synchronisation des voies auditives périphériques, sur la périodicité du stimulus et pourrait donc refléter la qualité du traitement des signaux de parole au niveau du tronc cérébral [12]. Identifier, de manière objective, la latence et la durée de la FFR, permettrait donc une meilleure objectivation de la qualité de cette synchronisation, calculée sur la durée de la FFR uniquement.

Figure 2 : Chaine de recueil du PEASP
Figure 2 : Chaine de recueil du PEASP
Figure 3 : Spectre de la réponse et du stimulus /ba/.
Figure 3 : Spectre de la réponse et du stimulus /ba/.

C. Modélisation d’un PEASPtype.

Pour identifier les paramètres (OR et FFR) au sein de la réponse recueillie, nous avons créé un modèle imitant ces indices. La comparaison de ce modèle type avec la réponse, sur une fenêtre glissant sur l’ensemble de la réponse, permet de déterminer les points de plus forte corrélation entre le modèle et la réponse, identifiant par là même, les indices au sein de la réponse, de manière objective.

L’OR a été modélisée par la concaténation, dans le temps, de 3 fonctions linéaires correspondants aux temps de montée, descente et montée respectivement, sur une durée très courte (1 ms). La fig. 4 présente le modèle de l’OR, superposé sur une OR réelle moyennée sur 15 sujets. (La durée de l’OR étant très réduite par rapport à la fréquence d’échantillonnage, avec un rapport signal sur bruit de l’ordre de 6 dB, la méthode de la dérivée n’est pas pertinente pour isoler cette OR.)

Figure 4 : Modèle de l’OR (gauche) et modèle + réelle (droite)
Figure 4 : Modèle de l’OR (gauche) et modèle + réelle (droite)

La FFR est une onde stationnaire qui suit la périodicité de la voyelle. Nous l’avons donc modélisée par un ensemble d’une ou plusieurs sinusoïdes, dont l’une correspond au pic fréquentiel de plus haute amplitude retrouvé sur la réponse de type FFR, par une transformée de Fourier. La fréquence de ce pic correspond à la fréquence fondamentale de la voyelle (F0, fig. 2). Il est possible d’ajouter des harmoniques d’ordre n, avec une amplitude A/2n, A étant l’amplitude de F0, avec n généralement inférieur à 3, étant donné que la réponse est filtrée passe-bas en dessous de 500 Hz. Dans l’exemple présenté fig. 2, F0=206 Hz, 2*F0=412 Hz. La FFR modélisée correspondante est présentée fig. 5. Le nombre de périodes est un compromis entre une durée longue (7-8 cycles), avec une sensibilité moindre au bruit, au détriment de la précision temporelle, et une durée courte (2 cycles), permettant une plus grande précision temporelle, mais au détriment d’une plus grande sensibilité au bruit. Le modèle sinusoïdal de la FFR est pondéré par une fenêtre de hanning, pour éviter, lors de la corrélation, les effets de bord.

Figure 5 : Modèle sinusoïdal de FFR, à gauche avec une seule harmonique et à droite avec quatre harmoniques, correspondant à la FFR présentée fig. 1 et 3.
Figure 5 : Modèle sinusoïdal de FFR, à gauche avec une seule harmonique et à droite avec quatre harmoniques, correspondant à la FFR présentée fig. 1 et 3.

D. Méthode de détection

Le principe de la détection de forme est la même que celui utilisé dans la méthode des ondelettes, c'est-à-dire qu’une corrélation est calculée entre le modèle créé, et le signal recueilli, sur une fenêtre glissante. Le signal est, au préalable, filtré par un banc de filtres passe-bandes de type Butterworth d’ordre un et de largeur de bande de trois fois la plus petite fréquence que l’on peut mesurer sur le recueil du signal (fréquence d’échantillonnage/nombre de points du recueil). Ceci nous permet d’obtenir une force de corrélation entre le modèle et le signal, de manière indépendante pour chaque bande fréquentielle du signal, et de le visualiser sous forme d’un diagramme temps/fréquence.

III. Résultats et discussions

La modélisation présentée a été effectuée sur la réponse PEASP moyenne obtenue chez 15 sujets normo-entendants, en réponse à un stimulus /BA/ de 45 dB HL d’intensité, et de 100 ms de long, avec un moyennage de 2400 réponses et une fréquence d’échantillonnage de 13,3 kHz, sur une fenêtre de recueil de 150 ms. Le PEASP recueilli est présenté fig. 1 et 3. La précision fréquentielle des recueils est de 6 Hz, et les calculs de corrélations ont été effectués sur 18 Hz, du fait du nombre limité de points.

La fig. 6 montre le résultat sur un modèle de l’OR. L’OR est difficile à distinguer, dans la réponse, du fait de sa brièveté (et donc un nombre de points très faible). En revanche, le fait qu’il s’agisse de la première onde à localiser, et qu’elle soit de grande énergie, permet de la repérer sous forme d’une ligne de corrélation présente sur l’ensemble des fréquences du signal.

Figure 6 : Détection de l’OR
Figure 6 : Détection de l’OR

La figure 7 montre le résultat, en utilisant un modèle sinusoidal de FFR, composé de F0 et de deux harmoniques, sur une durée de 7 cycles (fig. 7 haut), et sur une durée de 2 cycles (fig. 7 bas). Les 2 modèles permettent d’identifier le début de la FFR, par une augmentation du nombre de fréquences montrant de fortes corrélations entre modèle et signal. En revanche, la durée de la FFR est surtout visible sur le modèle à 7 cycles, montrant des corrélations constantes sur une même bande de fréquence, avant de se réduire à la fréquence du fondamental.

Il est donc possible, à partir d’un modèle simple, de déterminer objectivement les latences de l’OR et de la FFR d’un PEASP, ainsi que la durée de la FFR, et par conséquent son amplitude. Ce travail, effectué sur des données moyennées, et donc, avec un bon rapport signal/bruit, demande à être élargi à des données plus artéfactées. Cependant, en utilisant différents niveaux de seuil de corrélation, nous pensons qu’il est possible de s’adapter à différents rapports signal/bruit lors du recueil de PEASP, et donc, d’obtenir des paramètres objectifs sur des données recueillies individuellement pour chaque sujet.

Figure 7 : Détection de la FFR avec 7 oscillations pour le graphique haut et 2 oscillations pour le graphique du bas
Figure 7 : Détection de la FFR avec 7 oscillations pour le graphique haut et 2 oscillations pour le graphique du bas

IV. CONCLUSION

Les PEASP représentent une technique d’avenir d’exploration du codage des signaux de parole par les voies auditives du tronc cérébral. La modélisation mathématique permet d’objectiver les paramètres des réponses, pertinents pour le neurophysiologiste. A plus long terme, ceci permettra au clinicien, de comparer des données individuelles à des valeurs normatives, de manière observateur-indépendante.

V. Bibliographie

[1] C.L. Faingold, D.M. Caspary. «Frequency-following responses in primary auditory and reticular formation structures». Electroencephalogr Clinical Neurophysiol, 1979; 47: 12_20

[2] J.W. Hall. «Auditory brainstem frequency following responses to waveform envelope periodicity». Science, 1979; 205: 1297_1299

[3] N. Russo, T.G. Nicol, G. Musacchia, N. Kraus. «Brainstem responses to speech syllables». Clinical Neurophysiol, 2004; 115: 2021_2030

[4] C. Richard, A. Moulin, A. Jeanvoine, I. Akhoun, E. Veuillet, L. Collet, H. Thai-Van. «Exploration électrophysiologique des voies auditives sous-corticales chez l’Humain : du clic au son de parole». (communication personelle). Neurophysiologie Clinique

[5] K.L. Johnson, T.G. Nicol, N. Kraus. «Brain stem response to speech: a biological marker of auditory processing». Ear Hear, 2005; 26: 424_434.

[6] E. Skoe, N. Kraus. «Auditory brain stem response to complex sound : a tutorial». Ear Hear, 2010; 31: 1_23

[7] I. Akhoun, A. Moulin, A. Jeanvoine, M. Ménard, F. Buret, C. Vollaire, R. Scorretti, E. Veuillet, C. Berger-Vachon, L. Collet, H. Thai-Van. «Speech auditory brainstem response (speech ABR) characteristics depending on recording conditions, and hearing status an experimental parametric study», Journal of Neuroscience Methods, 2008; 175: 196_205.

[8] J.T. Marsh, F.G. Worden, J.C. Smith. «Auditory frequency-following response: neural or artefact?». Science, 1970; 169: 1222_1223

[9] I. Akhoun , S. Gallégo, A. Moulin, M. Ménard, E. Veuillet, C. Berger-Vachon, L. Collet, H. Thai-Van. «The temporal relationship between speech auditory brainstem responses and the acoustic pattern of the phoneme /ba/ in normal-hearing adults». Clinical Neurophysiol, 2008; 119: 922_933.

[10] S.J. Aiken, T.W. Picton. «Envelope following responses to natural vowels». Audiol Neurotol, 2006; 11: 213_232

[11] D. A. Abrams, T. Nicol, S.G. Zecker, N. Kraus. «Auditory Brainstem Timing Predicts Cerebral Asymmetry for Speech». Journal of Neuroscience, 2006; 26(43): 11131_11137

[12] J. Hornikel, E. Skoe, N. Kraus. «Subcortical laterality of speech», Audiol Neurotol, 2009; 14: 198_207.

Détection Automatique d’Indices Pertinents dans les Réponses Electrophysiologiques de Type Potentiels Evoqués Auditifs recueillis en réponse à un son de parole (Speech ABR).

10ème Congrès Français d’Acoustique

Lyon, 12-16 Avril 2010

A. Jeanvoinea, C. Richarda,b, A. Moulina, C. Berger-Vachona, et H. Thai-vana

a : Laboratoire Neurosciences Sensorielles, Comportement et Cognition, CNRS UMR 5020, HEH, 5 place d’Arsonval, 69437, Lyon cedex 03

b : Service d’ORL et de chirurgie servico-faciale, CHU de Saint Etienne, Hopital Nord, 42055 Saint Etienne cedex 02

arnaudjeanvoine@yahoo.fr

Le Speech ABR est la réponse du tronc cérébral à un son de parole /ba/. Elle est composée de deux indices pertinents qui sont : l’Onset Response (OR) et la Frequency Following Response (FFR). L’OR est caractérisée par une impulsion de haute énergie similaire à une « Onde V » dans un Potentiel Evoqué Auditif Précoce évoqué en réponse à un clic. La FFR est une onde stationnaire qui suit la périodicité de la voyelle /a/ jusqu’à 500 Hz. Nous avons utilisé plusieurs méthodes mathématiques qui permettent de détecter ces indices pertinents de manière objective, afin de pouvoir caractériser la variabilité inter-individuelle de l’aspect des Speech ABR.

1 Introduction

Les potentiels évoqués auditifs précoces, en réponse à des stimuli acoustiques de type clics, constituent une technique électrophysiologique d’exploration des voies auditives centrales, bien codifiée, et couramment employée en pratique clinique. L’utilisation récente de son de parole de type « consonne + voyelle » a l’avantage d’être plus écologiquement valide, et d’explorer, de manière plus fine, la perception de sons de parole le long des voies auditives. En revanche, les potentiels évoqués auditifs obtenus en réponse à ces sons de parole (PEASP ou Speech ABR), n’ont pas encore fait l’objet d’une validation et codifications objectives, préalables à toute utilisation clinique.

Les réponses de type Speech ABR sont recueillies au niveau de 3 électrodes de surfaces placées sur le scalp du sujet, en réponse à la syllabe « /BA/ ». La forme typique du Speech ABR se compose de deux parties (figure 1a) : une réponse impulsionnelle, ou Onset Response (OR), qui est similaire à l’onde V des PEAP évoqués par clics et une réponse soutenue en fréquence ou Frequency Following Response (FFR) qui suit la périodicité de la voyelle du stimulus [1]. Les latences, durée et amplitude de la FFR, reflètent certains aspects du traitement des sons de parole au niveau du tronc cérébral, et en particulier, le degré de synchronisation des voies auditives sur la périodicité du stimulus [2].

Figure 1a : Potentiel Evoqué Auditif en réponse à un son de parole (domaine temporel).
Figure 1a : Potentiel Evoqué Auditif en réponse à un son de parole (domaine temporel).
Figure 1b : Potentiel Evoqué Auditif en réponse à un son de parole (domaine fréquentiel).
Figure 1b : Potentiel Evoqué Auditif en réponse à un son de parole (domaine fréquentiel).

La réponse qui est recueillie sur les électrodes cutanées est une réponse qui est similaire à l’enveloppe inversée du stimulus filtrée passe bas avec une fréquence de coupure de 500 Hz et décalée d’une dizaine de millisecondes (figure 1a). De plus la réponse suit exactement le contenu fréquentiel de la voyelle /a/ jusqu’à 500 Hz [1].

Actuellement la méthode employée pour la localisation temporelle des deux indices qui sont l’OR et la FFR est une méthode visuelle. Il peut avoir dans ce cas un biais observateur dépendant, en particulier dans les cas où le signal est bruité.

Le but de ce travail est de caractériser, de manière objective, les paramètres des réponses de type Speech ABR, afin de déterminer les indices qui seront pertinents pour une utilisation clinique future.

2 Matériel et méthodes

2.1 Méthode de recueil du Speech ABR

Le Speech ABR est une réponse électrophysiologique en réponse à un stimulus de parole /ba/, présenté binauralement. Le matériel de recueil se compose de (figure 2) :

Figure 2 : Chaîne de stimulation et de recueil d’un Speech ABR
Figure 2 : Chaîne de stimulation et de recueil d’un Speech ABR

Malgré ces précautions, il est parfois difficile d’obtenir des enregistrements peu bruités, surtout en milieu hospitalier, où les sources électromagnétiques interférentes peuvent être nombreuses, d’où l’intérêt de développer des méthodes permettant d’extraire et de quantifier les réponses de manière plus objective, que la méthode visuelle actuellement employée.

2.2 Caractéristiques du Speech ABR

Le premier indice pertinent du Speech ABR est une réponse impulsionnelle ressemblant fortement à « l’onde V » des Potentiels Evoqués Auditifs Précoces classiques (ou OR). Elle est facilement décelable car l’amplitude est largement supérieure à celle du bruit moyen de la trace. Elle est suivie de la réponse soutenue en fréquence (FFR) [5]. La figure 1a montre les traces temporelles du stimulus /ba/, de son enveloppe [7], de cette même enveloppe décalée de 7 ms, et de la réponse électrophysiologique du stimulus [1,5]. Ce décalage d’une dizaine de milliseconde (dépendant du sujet) donne la latence de la FFR, elle est obtenue en corrélant l’enveloppe inversée du stimulus [1], obtenue après un filtrage passe-bas avec une fréquence de coupure de 500 Hz d’ordre un, avec la réponse de type FFR [8,9,10]. Les caractéristiques des indices sont répertoriées dans le tableau 1.

La transformée de Fourier du signal sur la partie FFR (figure 1b), montre des pics correspondant à la fréquence du fondamental (F0), ainsi que la première harmonique (2xF0), de manière similaire au spectre de la voyelle. Il n’y a plus d’informations au delà de 500 Hz.

Tableau 1 : Récapitulatif des caractéristiques des indices pertinents.
Tableau 1 : Récapitulatif des caractéristiques des indices pertinents.

2.3 Utilisation de méthodes mathématiques pour la détection des indices pertinents

Le premier travail est de séparer l’OR de la FFR dans le domaine fréquentiel, par un filtrage. L’OR est plutôt caractérisée par des hautes fréquences et la FFR par des basses fréquences (tableau 1). La séparation fréquentielle se fait par un filtre passe bas de type Butterworth ordre un, avec une fréquence de coupure de 300 Hz pour la FFR et l’utilisation d’un filtre passe bande de type Butterworth ordre un avec une bande passante de 300 Hz à 550 Hz pour l’OR. Tout le signal est préalablement filtré à 50 Hz pour s’affranchir des composantes très basses fréquences ainsi que celle du réseau électrique.

Figure 3 : Séparation de l’OR de la FFR fréquentiellement, la trace temporelle en bas montre les différences temporelles pour l’OR et la FFR.
Figure 3 : Séparation de l’OR de la FFR fréquentiellement, la trace temporelle en bas montre les différences temporelles pour l’OR et la FFR.

2.3.1 Méthode de détection de l’OR

Le calcul du bruit du signal se fait sur les dix premières millisecondes car le sitmulus n’est pas entendu par la personne pendant cette période de la trace par la méthode du RMS. Si le rapport signal sur bruit de la trace est de 0 dB, alors la réponse mesurée est discutable.

Pour l’OR la trace utilisée sera celle des hautes fréquences (figure 3). La méthode utilisée pour la détection de l’OR permet de rester dans le domaine temporel.

La dérivée permet, à chaque instant de la trace, de connaître le coefficient directeur de l’information temporelle haute fréquence, un coefficient directeur grand montre une impulsion et donc une montée d’énergie très courte. Il suffit de prendre l’instant où le coefficient directeur est le plus grand négativement car la pente recherchée est décroissante. La partie correspondante est alors isolée par un encadrement de 10 ms centré sur le coefficient directeur trouvé.

L’énergie est ensuite calculée autour de ce point, et qui correspond à l’intégrale du signal. L’isolation de cette partie permet de déterminer la position précise de l’indice de long du signal recueilli.

2.3.2 Méthode de détection de la FFR

La trace utilisée sera celle des basses fréquences (figure 3). De la même façon que pour la détection de l’OR, le traitement se fait dans le domaine temporel. Il faut trouver cette fois-ci une énergie constante pendant plusieurs périodes d’oscillation. Le calcul de l’énergie se fait en prenant l’intégrale de la trace basse fréquence. Le signal est ensuite isolé lorsque l’énergie est constante et située au dessus du bruit de fond de la trace. De plus le calcul de la dérivée donne une meilleure précision sur les oscillations car l’amplitude de celle-ci est plus constante et la fréquence fondamentale est multipliée par deux, ce qui donne deux fois plus d’informations pour la même durée.

3 Résultats

3.1 Détection de l’OR

Figure 4 : Détection de l’OR (en gras sur la courbe du bas)
Figure 4 : Détection de l’OR (en gras sur la courbe du bas)

Sur la trace originale, l’OR est le premier indice qui intervient dans la réponse, elle est toujours située avant la FFR. C’est pourquoi dans le calcul de l’énergie il peut y avoir ambiguïté car on remarque plusieurs impulsions (figure 4), surtout si le signal est bruité (rapport signal sur bruit proche de 0).

Une fois l’OR trouvée, les informations suivantes sont alors connues : la latence et l’amplitude, ainsi que sa durée. La latence varie selon l’intensité et le type des sons de parole utilisés (Kraus revue).

3.2 Détection de la FFR

Figure 5 : Détection de la FFR (en gras sur la courbe du bas)
Figure 5 : Détection de la FFR (en gras sur la courbe du bas)

En ce qui concerne la FFR, il est beaucoup plus facile de l’isoler même en présence de bruit car l’oscillation et l’énergie sont plus importantes pendant un certain temps qui correspond à la durée de la FFR. On remarque que, sur la courbé dérivée, les amplitudes des oscillations sont constantes et qu’elles oscillent au double de la trace basse fréquence, par conséquent, dès que l’oscillation est supérieure au bruit moyen de la trace, il est possible d’effectuer un encadrement de la partie correspondant à la FFR.

Dès que la FFR est trouvée, comme pour l’OR, l’amplitude, la latence et la durée de celle-ci peuvent être obtenues facilement, et sont des préalables à l’analyse de la FFR par FFT.

4 Discussion

Il est très facile de déceler les indices dans une réponse qui n’est pas artéfactée. Cependant, lorsque la trace est bruitée, il est très difficile de déceler l’impulsion de l’OR car les changements brusques de la courbe induisent d’énormes coefficients directeurs qui peuvent être assimilés à la pente de l’OR lors des différents calculs. De plus le rayonnement du réseau électrique ainsi que ses harmoniques peuvent contaminer de façon importante le recueil du signal, en particulier si l’isolation des électrodes n’est pas correcte. La réponse électrophysiologique peut être alors fortement perturbée et induire sur la réponse une périodicité qui n’est pas la réponse à la voyelle /a/. En revanche si le signal recueilli est de bonne qualité avec un rapport signal sur bruit de l’ordre de 6 dB, alors les indices sont facilement décelable dans le Speech ABR par une méthode automatique.

5 Conclusion

Les résultats montrent que l’on peut trouver dans une réponse de type Speech ABR, les deux indices qui la caractérisent, autrement que par une méthode visuelle qui était beaucoup moins précise. La précision temporelle maintenant atteinte est de l’ordre de la milliseconde, du fait de la faible fréquence d’échantillonnage.

Le Speech ABR représente une technique d’avenir d’exploration du codage neuronal des signaux de parole dans le tronc cérébral. La technique mathématique présentée ici permet d’objectiver les deux paramètres de la réponse électrophysiologique. A plus long terme, ceci permettra au clinicien, de comparer des données individuelles à des valeurs normatives, de manière observateur-indépendante.

Références

[1] I. Akhoun , S. Gallégo, A. Moulin, M. Ménard, E. Veuillet, C. Berger-Vachon, L. Collet, H. Thai-Van. "The temporal relationship between speech auditory brainstem responses and the acoustic pattern of the phoneme /ba/ in normal-hearing adults", Clinical Neurophysiol, 2008; 119: 922_933.

[2] K.L. Johnson, T.G. Nicol, N. Kraus. "Brain stem response to speech: a biological marker of auditory processing". Ear Hear, 2005; 26: 424_434.

[3] I. Akhoun, A. Moulin, A. Jeanvoine, M. Ménard, F. Buret, C. Vollaire, R. Scorretti, E. Veuillet, C. Berger-Vachon, L. Collet, H. Thai-Van. "Speech auditory brainstem response (speech ABR) characteristics depending on recording conditions, and hearing status an experimental parametric study", Journal of Neuroscience Methods, 2008; 175: 196_205.

[4] J.T. Marsh, F.G. Worden, J.C. Smith. "Auditory frequency-following response: neural or artefact?", Science, 1970; 169: 1222_1223

[5] E. Skoe, N. Kraus. "Auditory brain stem response to complex sound : a tutorial". Ear Hear, 2010; 31: 1-23

[6] C. Richard, A. Moulin, A. Jeanvoine, I. Akhoun, E. Veuillet, L. Collet, H. Thai-Van. "Exploration électrophysiologique des voies auditives sous-corticales chez l’Humain : du clic au son de parole". (communication personnelle). Neurophysiologie Clinique

[7] J.W. Hall. "Auditory brainstem frequency following responses to waveform envelope periodicity". Science, 1979; 205: 1297_1299

[8] N. Russo, T.G. Nicol, G. Musacchia, N. Kraus. "Brainstem responses to speech syllables". Clinical Neurophysiol, 2004; 115: 2021_2030

[9] S.J. Aiken, T.W. Picton. "Envelope following responses to natural vowels". Audiol Neurotol, 2006; 11: 213_232

[10] Aiken SJ, Picton TW. "Envelope and spectral frequency-following responses to vowel sounds". Hear Res 2008;245:35-47.