Revisión teórica

El promedio del espectro del habla. Fundamentos y aplicaciones clínicas.

Jonathan Delgado Hernández1 y Franz Zenker2

1. Fundación Canaria para la Prevención de la Sordera. Santa Cruz de Tenerife. España.

2. Clínica Barajas. Santa Cruz de Tenerife España.

Resumen

Una de las metas a lograr en el campo clínico de la audioprótesis es alcanzar un nivel de escucha del habla cómodo e inteligible. Para lograr este objetivo se han creado señales de referencia basadas en el promedio del espectro del habla con las que poder evaluar la ganancia del los audífonos. El sexo, la edad, la localización del micrófono o la lengua son variables que influyen en el registro de esta medida. En este artículo revisamos la influencia de estos factores y presentamos las posibles aplicaciones audiológicas y audioprotésicas de este tipo de señales.

Palabras Claves: promedio del espectro del habla, LTASS, ICRA, adaptación protésica

Introducción

El promedio del espectro del habla o Long Term Average Speech Spectrum (LTASS) es una medida de la intensidad del habla expresada en función de la frecuencia. La representación de esta medida tiene diferentes aplicaciones tanto acústicas como audiológicas. En el ámbito de la audiología, el LTASS, es utilizado como referencia en la determinación de la prescripción y evaluación de la ganancia de los audífonos. Varios autores han establecido los valores del LTASS en función de distintos procedimientos y muestras de sujetos (1,2,3,4,5,6,7,8,9,10). En la figura 1 podemos observar la representación gráfica del promedio del espectro del habla obtenido a partir de los estudios de pioneros de Cornelisse (1), Byrne y Dillon (2) y Cox y Moore (3).

A partir de estos estudios podemos establecer varias características comunes del LTASS. En primer lugar, podemos observar una variación en la intensidad de 25 dB a lo largo del espectro de frecuencias con el grueso del total de la energía de la señal por debajo de 1 KHz. La segunda característica común es el descenso gradual que se produce en la intensidad del espectro para las frecuencias superiores a 500 Hz. La tercera, hace referencia a una clara distinción entre hombres y mujeres en la región de las bajas frecuencias del espectro. Esta diferencia es atribuible a la amplitud de la frecuencia fundamental (fo) entre las voces masculinas y femeninas. El primer armónico para los varones se encuentra entre los 100 Hz y 150 Hz. Las voces femeninas poseen este primer armónico entre los 200 y 300 Hz.

Variables inherentes al hablante o a la metodología del registro, tales como edad, sexo, lengua o localización del micrófono resultan determinantes en el registro final del LTASS (3,4,5). Existen diferencias significativas en función del sexo del hablante (1). La intensidad promediada total para hombres adultos es del orden de 2.3 dB mayor que la intensidad promediada en el grupo de mujeres adultas (1,3,5,6). La edad ha sido estudiada en diversas investigaciones en las que se ha podido observar que las diferencias entre grupos de edades distintas son muy pequeñas, del orden de los 0.1 dB (1,5).

Una variable crítica en el registro del LTASS es la localización del micrófono (7). Se han hallado diferencias significativas entre la posición del micrófono enfrente, a un lado o detrás del hablante (7). Cornelisse (1) observó una disminución en intensidad de las altas frecuencias cuando el LTASS era obtenido con el micrófono colocado en el oído frente a los registros obtenidos con el micrófono a 30 cm enfrente del hablante. También se observó que la intensidad del espectro del habla en bajas frecuencias medido en el oído es mayor que en la posición de referencia.

La mayoría de los estudios sobre el LTASS en audiología han sido llevados acabo con hablantes ingleses (1,3,4,5,6,8,9,10) y solo un pocos estudios han comparado distintas lenguas (2). Bryne (2) estudió la influencia de la lengua sobre el espectro del habla comparando el LTASS obtenido a partir de diferentes lenguas y dialectos. Las lenguas estudiadas fueron el inglés (australiano, neozelandés, británico y americano), sueco, danés, alemán, ruso, japonés, mandarín, vietnamita y francés canadiense. No halló diferencias significativas entre las distintas lengua estudiadas. Por otro lado, algunos estudios sí han encontrado diferencias (11,12) entre las distintas lenguas. Por ejemplo, Tarnoczy y Fant (11) estudiaron las diferencias en el espectro del habla del sueco, húngaro y alemán encontrando diferencias significativas entre estas lenguas en las frecuencias de 700 Hz a 1500 Hz para los hombres y de los 1000 Hz a los 2000 Hz para las mujeres. A diferencia de los estudios de Byrne (2) la muestra utilizada por Tarncozy y Fant fue menor de 20 sujetos. Pavlovic (12), donde se utilizó una muestra de dos hablantes para cada lengua, comparó los espectros del habla del francés, inglés, italiano y danés y no encontraró diferencias significativas. Esta discrepancia en la literatura debe ser interpretada con cautela ya que los estudios contaban con serias limitaciones en los diseños experimentales lo cual no nos permiten atribuir las diferencias a factores estrictamente lingüísticos. Por otro lado, las lenguas románicas como el francés, español o italiano no han sido estudiadas y las diferencias con las lenguas anglosajonas no han sido aun establecidas.

Figura 1: Promedio del espectro del habla obtenido a partir de los estudios de Cornelisse et al. (1), Byrne y Dillon (2) y Cox y Moore(3).

Aplicaciones audiológicas del LTASS

Una de las principales metas a lograr en la adaptación protésica es proporcionar un nivel de escucha del habla cómodo e inteligible (13). Con la tecnología digital utilizada actualmente se hace difícil examinar la respuesta en frecuencia de estos aparatos en el audioanalizador ya que los tonos continuos utilizados en estos exámenes son suprimidos por los programa de reducción de ruido. Resulta evidente que la representación del espectro del habla usada para calcular la ganancia del audífono debe reflejar exactamente las características acústicas de la señal del habla que recibe el micrófono del audífono (14). Métodos de prescripción de la ganancia como el DSL [i/o] (15) utilizan sus propias señales de referencia basadas en el promedio del espectro del habla a partir de los estudios de Cornnelisse (1). Algunos equipos de análisis de audífonos ya integran en sus protocolos señales del LTASS para valorar la ganancia de inserción del audífono (17). De especial interés para el audioprotesista resulta la señal ICRA (17) ya que está han sido elaboradas a partir del Articulation Index (18) y pueden ser utilizadas con audífonos digitales.

International Collegium Of Rehabilitative Audiology (ICRA)

El ICRA está compuesto por una serie de señales creadas por el International Collegium of Rehabilitative Audiology, por el grupo de trabajo Hearing Aid Clinical Test Environment Standardisation (17). El objetivo de este grupo fue reunir un conjunto de señales para su uso en la evaluación de audífonos y en especial para la obtención de señales capaces de examinar las características no lineales de los instrumentos con compresión. Para la composición de las señales se tomaron características espectrales y tempora les similares a las que podemos encontrar en señales de habla real.

En la elaboración del ICRA se tomaron dos criterios fundamentales. Por un lado, la señal creada debía tener características espectrales similares al habla con varios grados de esfuerzo vocal. En segundo lugar las señales creadas debían poseer características temporales similares a las del habla proveniente de uno o más hablantes. Finalmente, el ICRA se llevó acabo tomando como variables independientes el sexo, el esfuerzo vocal y el número de hablantes (17).

Desde un punto de vista audiológico, la aplicación de las señales ICRA sobre medidas en oído real (19) posee un gran interés. El ICRA se puede usar para analizar el efecto del procesamiento de la señal del audífono. También se puede utilizar para valoraciones psicofísicas, los ruidos específicos pueden ser usados para evaluar el reconocimiento del habla en ruido con y sin compresión y con o sin reducción de ruido.

Conclusiones

Aunque se han realizado muchos estudios sobre el espectro del habla, aun quedan muchos aspectos por investigar que influyen en el uso clínico de esta medida. Se ha comprobado que la localización del micrófono influye en el resultado final del espectro del habla. Sin embargo, las señales usadas para evaluar la ganancia de los audífonos han sido creadas a partir de espectros del habla obtenidos únicamente con el micrófono en una posición (17).

La revisión de la literatura nos muestra como no existen suficientes estudios como para llegar a la conclusión de que no hay diferencias significativas entre las diferentes lenguas. Las lenguas románicas han sido escasamente estudiadas, un ejemplo es que no se ha llevado ningún estudio en español. Además de que el grueso de los estudios se han realizado en lenguas anglosajonas, la mayoría de las investigaciones se han hecho con pocos sujetos por lo que la variabilidad entre los sujetos puede afectar a los resultados de la medida.

La utilización de señales creadas a partir del espectro del habla, con las que poder evaluar la ganancia de los audífonos tiene una utilidad clínica importante en el ámbito de la audioprótesis, ya que el objetivo principal de toda adaptación protésica es lograr un nivel de escucha del habla óptimo e inteligible. Para lograr este objetivo se hace necesario un mayor estudio del espectro del habla con el fin de que esta medida sea lo más fiable posible a la realidad controlando, para ello, todas las variables comentadas anteriormente.

Bibliografía

1. Cornelisse, LE, Gagné, JS, y Seewald, RC. (1991). Ear level recordings of the long-term average spectrum of speech. Ear Hear. 12, 47-54. https://doi.org/10.1097/00003446-199102000-00006

2. Byrne D, Dillon H, Tran K. (1994). An interna-tional comparison of long-term average speech spectra. J Acoust Soc Am: 96:2108-2120. https://doi.org/10.1121/1.410152

3. Cox, RM, y Moore, JN. (1988). Composite speech spectrum for hearing aid gain pre-scriptions. J. Speech Hear. Res.31, 102-107. https://doi.org/10.1044/jshr.3101.102

4. Byrne, D. (1977). The speech spectrum-Some aspects of its significance for hearing aid seleccion and evaluation. Br. J. Audiol. 11, 40-46. https://doi.org/10.3109/03005367709078831

5. Pearsons, KS, Bennett, RL, y Fidell, S (1997). Speech levels in varius noise Envi-ronment. EPA Rep. Nº. 600/1-77-025 Environmental Protection Agency, Washington DC.

6. Dunn, HK, y White, SD. (1940). Statiscal measurements on conversational speech. J. Acoust. Soc. Am. 11, 278-289. https://doi.org/10.1121/1.1916034

7. Dunn, H. K., Farnsworth, D. W. (1939). Exploration of pressure field around the human head during speech. J. Acoust. Soc. Am. 10, 184-199. https://doi.org/10.1121/1.1915975

8. Benson, R. W., y Hirsh , I. J. (1953). Some variables in audio spectrometry. J. Acoust. Soc. Am. 25, 499-505. https://doi.org/10.1121/1.1907070

9. Niemoller, AF., McCornick, I., y Miller, J D. (1974). On the spectrum of spoken Eng-lish. J. Acoust. Soc. Am. 55,461. https://doi.org/10.1121/1.3437924

10. Byrne, D., y Dilon, H. (1986). The National Acoustic Laboratories’(NAL) new procedure for selecting the gain of frecuency response of hearing aid. Ear Hear. 7, 257-265. https://doi.org/10.1097/00003446-198608000-00007

11. Tarnoczy, T., y Fant, G. (1954). Some re-marks on the average speech spectrum. Q.P.S.R. Rep. Nº 4, pp. 13-14, Speech Transmission Laboratory, Stockholm.

12. Pavlovic, CV., Rossi, M., y Espesser, R. (1991). Perceived spectral energy distribu-tions for EUROMO speech and for some synthetic speech. Proccedings of the XII In-ternational Congress on Phonetic Sciences. 5/5, 418-421.

13. Zenker, F. (2002). La prescripción de la ga-nancia en la adaptación audioprotésica. [en-línea]. Auditio: Revista electrónica de audio-logía. vol. 1(3), pp. 45-52. DOILATER

14. Zenker F. y Barajas J. (1999). Adaptación de audífonos en función del promedio del espectro de la palabra hablada. Estudio de un caso único. En: Logopedia escolar y clí-nica. Últimos avances en Evaluación e Intervención. Editor: José Domingo Martín Espino, Madrid, Editorial CEPE, pp. 329-336.

15. Seewald, R., Cornelisse, L., Ramji, K., Siclair, S., Moodie. K., Jamieson, D. (1995). DSL TM for windows: A sofware sys-tem implementation of the desired sensation level (DSL) method for fitting linear gain ans wide-dynamic-range compression hearing in-struments. User’s manual. University of Western Ontario.

16. Fry, GJ. (2002). El examen del audífono digital. [en linea]. Auditio: Revista electrónica de audiología. 1(2), pp. 25-29. DOILATER

17. Dreschler, WA., Verschuure, H., Ludvigs-en, C., Westermann, S. (2001). ICRA Nois-es: Artificial noise signals with speech-like spectral and temporal propieties for hearing instrument assessment. Audiology. 40: 148-157. https://doi.org/10.3109/00206090109073110

18. ANSI (1969). ANSI S3.5-1969, American Na-tional Standard Methods for Calculation of the Articulation Index (American National Stand-ards Institute, New York).

19. Zenker F. (2001). Medidas en oído real me-diante sonda microfónica. Definición y apli-caciones. [en linea]. Auditio: Revista electrónica de audiología. vol. 1(1), pp. 10-15. DOILATER

Recibido el 8 de Mayo del 2002.

Aceptado el 23 de Mayo del 2002.

Publicado (on-line) 1 de Septiembre del 2002.

http://www.auditio.com/revista

Contacto con los autores: Jonatahan Delgado Hernández. Fundación Canaria para la Prevención de la Sordera. Teléfono: +34 922 275 4 88 E-mail: jonathan@hormail.com

Para citar este artículo:

Delgado J. y Zenker F. El promedio del espectro del habla. Fundamentos y aplicaciones clínicas [en-linea]. Auditio: Revista electrónica de audiología. 1 Octubre 2002, vol. 1(3), pp. 41-44.

<https://doi.org/10.51445/sja.auditio.vol1.2002.0017>

Enlace al artículo:

https://doi.org/10.51445/sja.auditio.vol1.2002.0017

Historial:

Publicado (on-line): 01-10-2002