Se realiza un estudio sobre el tono (percepción acústica) de la voz en la anorexia nerviosa restrictiva (ANR). El objetivo es valorar la alteración en la voz de las pacientes con ANR cuando el trastorno se inicia en la pubertad. La muestra total son 148 sujetos distribuidos en dos grupos: grupo control (n=102) y ANR (n=46). Se determinó la frecuencia fundamental de la voz (F0) utilizando dos fonemas (“a” e “i”) mediante un micrófono Plantronic 300 y grabador digital. Se analiza la voz con el programa Praat. Se presentan los primeros datos para la lengua española de los valores normales de la F0 de voz en población femenina sana de 9 a 17 años. Posteriormente se muestran los datos comparativos con el grupo de pacientes con ANR.
This article is about the tone of voice (acoustic perception) in patients with restrictive anorexia nervosa (AN-R). Our goal was to study whether or not there is an alteration of the tone in restrictive anorexia nervosa when the disease has started in the puberty. The total sample consisted of 148 subjects divided in two groups: control (n=102) and AN-R (n=46). The voice's fundamental frequencies (F0) were determined based on the repetition of two phonemes (“a” and “i”) and measured by a microphone Plantonic 300 and a digital recorder. We analyzed the voice's F0 using Praat software. We present the first data for the normal range of the F0 in Spanish healthy women from 9 to 17 years old who were Spanish native speakers. Finally, we show a comparison of data between AN-R patients and control group.
En la consulta diaria con pacientes diagnosticadas de anorexia nerviosa restrictiva (ANR) llama la atención que un número elevado de ellas manifiesta la inseguridad que les genera y transmite su voz, porque “parece la de una chica de menor edad”. Realmente, escuchando el tono de voz de esas pacientes sí notamos diferencias entre su voz y la de otras jóvenes de su edad sin ANR.
Ante este hecho iniciamos una revisión de la bibliografía internacional que recogiera datos sobre la voz en pacientes con trastorno de la conducta alimentaria (TCA), sin encontrar publicaciones al respecto. De este modo nos embarcamos en el estudio que nos ocupa sobre la percepción que tienen las pacientes y la realidad de su voz.
La voz aguda transmite distancia y frialdad y se percibe como menos segura y creíble que la voz más grave y la imagen que percibimos de una persona con un tono modulado hacia los agudos nos parece menos atractiva y más inmadura, similar al tono propio de edades infantiles (Rodero, 2002). El tipo de voz da mayor o menor credibilidad y efectos persuasivos a lo que decimos o queremos comunicar (Conde, 2005).
Las pacientes con TCA presentan dificultades en las relaciones sociales (Fernández,Turón, Vidal, Vallejo y Pifarré, 1996; Toro y Vilardell, 1987) y ansiedad social (Cash, Thériault y Annis, 2004; Levinson y Rodebaugh, 2012; Wonderlich-Tierney y Vander Wal, 2010). El 24.3% de las pacientes con TCA llegan a presentar fobia social (Eber, Vera, Mirabel-Sarron y Guelfi, 2003), siendo las manifestaciones fundamentales de la misma el temor a las situaciones sociales que impliquen comer o beber en público, que el propio cuerpo sea sometido a escrutinio por otros, miedo a hablar, a sonrojarse y a todo lo que suponga exponerse a los demás por la baja autoestima que presentan, rechazo a su figura y menosprecio de sí misma (Behar, 2010). Para algunos autores, las “disfonías funcionales” (aquellas que no tienen una causa orgánica) serían secundarias a un miedo obsesivo a presentar una voz inaceptable ante los demás (Behar, 2010; Hurtado, González, de la Iglesia y Barandiarán, 2006). Sin entrar en interpretaciones, sabemos que el tono de voz influye en la impresión que nos produce el hablante, que nos permite el enjuiciamiento de las voces agudas, medias o graves y que dicha evaluación está relacionada directamente con la credibilidad que obtenemos del tono de voz escuchado (Soto, 2008). Nuestra capacidad para influir en los demás depende de la palabra, el tono de voz (que representa el 38%) y el lenguaje corporal (que supone el 55%). Así, con un mismo contenido en la información, dependiendo del uso que hagamos del tono de voz y del lenguaje corporal, podemos llegar a tener una probabilidad de convencer al interlocutor del 93% (Ribeiro y Bastanzo, 1994). De todo ello se desprende que la voz forma parte de nuestra identidad y la percepción que tenemos de nosotros mismos, por lo que una percepción negativa de la voz conlleva, necesariamente, una mayor insatisfacción personal y menor autoestima, a la vez que facilita el mayor aislamiento personal, lo que en las pacientes con TCA (ANR) supone un problema añadido a la ya baja autoestima característica de esta patología (Asuero, Avargues, Martin y Borda, 2012; Behar, Gramegna y Arancibia, 2014; Cervera et al., 2003; Dunkley y Grilo, 2007; Sassaroli y Ruggiero, 2005).
El objetivo de este estudio es analizar las alteraciones o variaciones en la voz de las pacientes con ANR cuando se inicia el trastorno en la pubertad, ya que en la práctica clínica observamos que su tono de voz es más agudo que el que corresponde a la edad cronológica de las mismas.
MétodoMuestraSe trata de una muestra, formada por 148 participantes mujeres –dado que la prevalencia en mujeres de esta patología es mayor que en varones a nivel mundial (Smink, Van Hoeken y Hoek, 2012) y en concreto en la Comunidad Autónoma de Madrid (Peláez-Fernández, Labrador y Raich, 2007; Peláez-Fernández, Raich y Labrador, 2010), donde se desarrolla este estudio– de edades comprendidas entre 9 y 17 años y clasificadas en dos grupos: 1) grupo control y 2) pacientes con diagnóstico de ANR.
Los criterios de inclusión en la muestra fueron los siguientes:
- 1.
Grupo control: sujetos sin patología conocida que procedían de dos colegios públicos y un colegio concertado de Madrid.
- 2.
Pacientes con ANR en tratamiento ambulatorio (consultas externas) o ingresadas en el Hospital Niño Jesús de Madrid (HNJ) en el momento de la toma de muestra, que cumplían los criterios diagnósticos del DSM-V (DSM-5, 2013), en las que el inicio de la ANR fue antes de la pubertad o durante ésta y sin patología previa en el tracto anatómico vocal en el habla o en la audición.
El procedimiento para la obtención de los datos fue el mismo en el grupo control y en el grupo con ANR. En ambos la voz se midió de forma individual en una sala sin ruido ambiente.
La muestra de pacientes con ANR se obtuvo tras la solicitud formal al comité ético del HNJ, que cual autorizó la realización de este estudio.
El procedimiento se resume en los siguientes pasos:
- 1)
A los padres o tutores y a aquellas pacientes mayores de 12 años se les solicitó la firma del consentimiento informado explicado.
- 2)
A continuación las participantes respondieron a las siguientes cuestiones: a) afiliación, b) fecha de nacimiento, c) edad actual, d) edad de inicio de la menarquia, e) si hubo ausencia o alteración de la misma desde la menarquia, f) inicio del trastorno, g) cómo les parecía que tenían la voz y h) si su voz era similar a la de otras chicas de su misma edad
- 3)
Registro acústico de la voz. Para realizar el estudio de la voz de las pacientes con ANR y de los sujetos del grupo control medimos la frecuencia fundamental (F0). El tono de voz (percepción acústica de la voz) viene dado por la emisión del sonido que resulta de la frecuencia con que vibran las cuerdas vocales. Si las cuerdas vibran un número elevado de veces, la voz que se emite es más aguda. Si por el contrario vibran a menor frecuencia, la voz es más grave. La frecuencia, a su vez, es el número de vibraciones por segundo o ciclos vibratorios por segundo y su unidad de medida es el hercio (Hz). La F0 depende de la anatomía de las cuerdas vocales (longitud, masa y elasticidad) y de la posición de la laringe. Por ello, debido a la estructura anatómica en edades infantiles y antes de la muda vocal en la pubertad, la voz es aguda. (Jackson-Menaldi, 1992).
Medimos la F0 de la emisión de dos fonemas porque cada fonema tiene una estructura o perfil de formante que le caracteriza. Hay 4 formantes para cada fonema y los 2 primeros definen el gesto de la vocal (que se caracteriza por un registro fonológico determinado). Cada formante es un grupo de armónicos que tienen una ganancia de energía que coincide con la frecuencia de resonancia de los resonadores. Utilizamos el fonema “a” (F0_a) y el “i” (F0_i) ya que son los dos fonemas que emitimos con la lengua en posiciones extremas: la “a” con la posición más baja y la “i” con la posición más alta. Para los demás fonemas posicionamos la lengua de forma intermedia (Miyara, 1999). Utilizamos en este estudio la emisión de estos dos fonemas para dar veracidad a los registros.
Las grabaciones se realizaron con un micrófono Plantronics 300 unidireccional de sobremesa y un grabador digital.
Para la grabación, la paciente/sujeto control se sentaba cómoda con el micrófono a la altura de la boca a una distancia de 20cm. Se indicaba que pronunciase la letra “a” y después la letra “i” de forma sostenida durante 3 segundos sin que el evaluador le diera ningún modelo vocal para evitar imitación del tono. La fonación la realizaba y la grababa dos veces para cada letra. En los análisis se utiliza la media de las dos medidas para cada vocal.
4) En el análisis acústico de los registros vocales hemos estudiado la frecuencia fundamental, pitch o F0 de los formantes vocálicos para las letras “a” e “i”. Las muestras de voz se analizaron mediante el programa Praat (Boersma y Weenink, 2013), un software libre para el análisis fonético científico del habla.
Los análisis se realizaron utilizando el programa estadístico SPSS versión 15.0. En primer lugar se calcularon las correlaciones de Pearson entre variables y se comprobaron los supuestos de normalidad (prueba de Kolmogorov-Smirnov) y homogeneidad de varianzas (prueba de Levene). A la vista del incumplimiento de los supuestos de normalidad y homogeneidad de varianzas se aplicaron pruebas no paramétricas de diferencias de medias: prueba U de Mann-Whitney para muestras independientes (diferencias entre grupo control y patológico) y test de Wilcoxon para muestras relacionadas (medias de F0_a y F0_i). En todos los casos se presentan los tamaños del efecto, r de Rosenthal (1991). Finalmente se procedió a realizar una regresión logística para predecir la pertenencia al grupo ANR o al grupo control a partir de las frecuencias fundamentales de las pacientes. A la hora de valorar el ajuste del modelo de regresión se tuvieron en cuenta los estadísticos de Wald, chi cuadrado y la prueba de Hosmer y Lemeshow.
ResultadosLa muestra final estuvo compuesta por 102 sujetos en el grupo control (Mcontrol_edad=14.430, DTcontrol_edad=1.968, rango 9-17 años) y 46 en el ANR (MANR_edad=14.739, DTANR_edad=1.731, rango 9-17 años). El 65.2% de las pacientes con ANR estaban en revisión en consultas ambulatorias de la Unidad de TCA del HNJ y las restantes estaban ingresadas en dicho hospital. El 89.1% de las pacientes con ANR y el 93.1% de las integrantes del grupo control habían tenido la menarquia en el momento del estudio. No existieron diferencias significativas en la edad de comienzo de la menarquia ni en los años que llevaban con esta (U=1644, z=-1.425, p=.154 y U=1887, z=-.195, p=.846).
Los descriptivos por grupos de edad de la frecuencia fundamental de la voz en los sujetos control quedan reflejados en la tabla 1.
Frecuencia fundamental de la voz por grupos de edad en el grupo control
Media F0_a | M | SD | ET de la media | Límite inf. IC 95% | Límite sup. IC 95% |
---|---|---|---|---|---|
9-11 | 240.710 | 27.951 | 6.100 | 227.986 | 253.433 |
12-13 | 236.327 | 12.218 | 3.389 | 228.944 | 243.710 |
14 | 230.423 | 14.134 | 3.161 | 223.807 | 237.038 |
15 | 222.650 | 16.062 | 3.896 | 214.392 | 230.908 |
16 | 215.408 | 6.094 | 1.363 | 212.555 | 218.260 |
17 | 201.361 | 11.969 | 3.199 | 194.450 | 208.271 |
Media F0_i | |||||
9-11 | 248.657 | 27.974 | 6.104 | 235.923 | 261.391 |
12-13 | 239.519 | 11.211 | 3.109 | 232.745 | 246.294 |
14 | 237.200 | 20.569 | 4.599 | 227.573 | 246.827 |
15 | 224.774 | 12.809 | 3.107 | 218.188 | 231.359 |
16 | 219.783 | 8.576 | 1.918 | 215.769 | 223.796 |
17 | 208.443 | 10.968 | 2.931 | 202.110 | 214.776 |
Nota. N9-11=21, N12-13=13, N14=20, N15=17, N16=20, N17=14.
El cálculo de las correlaciones entre variables para cada uno de los grupos indicó que la relación entre F0_a y F0_i fue directa y significativa en ambos grupos. Sin embargo en el caso del grupo control ambas variables mantuvieron una correlación mucho mayor. Mientras que en el caso del grupo control existieron correlaciones negativas entre cada una de las frecuencias fundamentales (F0_a y F0_i) con la edad y el tiempo transcurrido desde la menarquia, en el caso del grupo ANR estas variables no estuvieron significativamente relacionadas, lo cual indicaría que mientras que en el grupo control las niñas más pequeñas tenían voces más agudas y la voz se iba tornando grave con la edad, en el caso de las niñas con ANR el cambio en la voz (de aguda a grave) no se produce con normalidad hasta tal punto que el cambio de las frecuencias fundamentales no está relacionado con la edad ni con el tiempo transcurrido desde la entrada en la pubertad. Los resultados se presentan en las tablas 2 y 3.
Correlaciones de Pearson entre variables para el grupo ANR
F0_a | F0_i | Comienzo menarquia | Años con menstruación | |
---|---|---|---|---|
F0_i | .504*** | |||
Comienzo menarquia | -.230 | -.147 | ||
Años con menstruación | .161 | .185 | -.588*** | |
Edad | .082 | .074 | .154 | .709*** |
Nota. N=46 exceptuando el caso de las variables relacionadas con la menarquia ya que sólo 41 niñas la habían tenido. F0_i=media del formante i; F0_a=media del formante a; comienzo menarquia=edad de comienzo de la menarquia; años con menstruación=tiempo que lleva con la menarquia.
Correlaciones de Pearson entre variables para el grupo control
F0_a | F0_i | Comienzo menarquia | Años con menstruación | |
---|---|---|---|---|
F0_i | .859*** | |||
Comienzo menarquia | .257* | .230* | ||
Años con menstruación | - .714*** | -.681*** | -.271** | |
Edad | -.663*** | -.659*** | .313** | .830*** |
Nota. N=101 exceptuando el caso de las variables relacionadas con la menarquia ya que sólo 94 niñas la habían tenido. F0_i=media del formante i; F0_a=media del formante a; comienzo menarquia=edad de comienzo de la menarquia; años con menstruación=tiempo que lleva con la menarquia.
En la figura 1 se presenta el diagrama de dispersión para la F0_a y la F0_i. Se aprecia cómo los sujetos del grupo control se encuentran más concentrados y se ajustan mejor a la línea recta, que representaría una correlación lineal perfecta, que los sujetos del grupo ANR.
Diferencias de medias en las frecuencias fundamentalesEn el caso de las pacientes con ANR la prueba de Kolmogorov-Smirnov llevó a mantener la hipótesis de normalidad de la distribución de la F0 “a” (zKsANR=.797, p>.05), pero no de la F0 “i” (zKsANR=1.444, p<.05). Sin embargo, en el caso del grupo control dicha hipótesis se mantuvo para ambas frecuencias fundamentales: F0 “a” (zKsControl=.590, p>.05) y F0 “i” (zKsControl=.940, p>.05). La prueba de Levene permitió mantener el supuesto de igualdad de las varianzas error para los dos grupos (F=.990 para la F0 “a”, F=1.088 para la F0 “i”, ambas p>.05).
Tanto en el caso de la F0 “a” (MANR=238.209, MRangoANR=100.11) como en el caso de la F0 “i” (MANR=236.085, MRangoANR=95.86) las pacientes con ANR presentaron una media superior (voz más aguda) que las mujeres del grupo control (MControl=221.212, MRangoControl=62.11, para la F0 “a”, MControl=226.432, MRangoControl=64.04 para la F0 “i” respectivamente). La prueba U de Mann-Whitney permitió afirmar que la voz de las pacientes con anorexia nerviosa es significativamente más aguda que las del grupo control, tanto para la F0 “a” (U=1122, zU=-5.017, r=-.414, p<.001) como para la F0 “i” (U=1317.5, zU=-4.201, r=-.346, p<.001) (figura 2).
En el caso del grupo ANR no existieron diferencias significativas (prueba de signos de Wilcoxon) entre la media de la F0 “a” y la de la F0 “i” (z=-1.686, p>.05) mientras que en el caso del grupo control sí existieron diferencias significativas entre las dos frecuencias fundamentales (z=-6.531, p<.001).
Diferencias en los formantes en relación con la menarquia y el inicio del trastornoDe las 46 pacientes con ANR, 25 iniciaron el trastorno previo a la menarquia, 16 de forma simultánea o posterior y cinco sin inicio de menarquia en el momento del estudio. En relación con este hecho, existieron diferencias significativas tanto para la F0 “a” (U=77.5, z=-3.073, p<.05) como para la F0 “i” (U=55.5, z=-3.688, p<.001) entre las que presentaron el trastorno antes de la menarquia, con voces más agudas (MF0_a=242.836, MRangoF0_a=24.90, MF0_i=241.138, MRangoF0_i=25.78), y las que lo presentaron de forma simultánea o posterior, con voces más graves (MF0_a=231.313, MRangoF0_a=13.17, MF0_i=226.707, MRangoF0_i=11.70). Los tamaños del efecto, r de Rosenthal (1991) fueron r=-.486 para la F0 “a” y r=-.583 para la F0 “i”.
Por otro lado, las pacientes que presentaron el trastorno previo a la menarquia tuvieron voces significativamente más agudas que el grupo control (U=425, z=-5.123, p<.001, r=-.456, para la F0 “a”; U=507, z=-4.622, p<.001, r=-.429, para la F0 “i”), mientras que no existieron diferencias significativas entre las que presentaron el trastorno con posterioridad o simultáneamente a la menarquia y las integrantes del grupo control (tabla 4 y figura 3).
Diferencias de medias (prueba U de Mann Whitney)
Trastorno previo a menarquia (n=15) | Trastorno posterior a menarquia (n=25) | Control (n=101) | |
---|---|---|---|
F0_a | 242.836 (18.771) a | 231.313 (23.572) b | 221.212 (16.039) b |
F0_i | 241.138 (38.808) a | 226.707 (12.205) b | 226.402 (17.174) b |
Nota. F0_a=frecuencia fundamental del formante a; F0_i=frecuencia fundamental del formante i. Los valores con sub-índices distintos indican diferencias significativas a un nivel de .05.
En la valoración subjetiva de la voz hemos encontramos un porcentaje muy elevado de pacientes con ANR que nota su voz más aguda que las de sus compañeras de su misma edad y sin patología conocida. Esa voz atiplada ellas la definen como voz infantil, “pituda”, “de gato”, “chillona”, etc.
El 69.6% de las pacientes con ANR indicó que su voz era más aguda de lo normal (figura 4) y el 8.7% indicó que su voz era más grave de lo normal. En este caso no se realizó comparación con el grupo control porque todas las integrantes de este grupo indicaron que percibían su voz como normal (con las diferencias normales propias de la percepción que tenemos todos de nuestra voz cuando la escuchamos grabada).
Predicción de la ANR a partir de las frecuencias fundamentalesInicialmente ajustamos un modelo de regresión logística para predecir la pertenencia al grupo control o al grupo ANR a partir de las variables edad, media de la F0_a y media de la F0_i para las 147 chicas participantes en el estudio. A pesar de cumplirse todos los supuestos exigidos en este procedimiento, el mejor ajuste no proporcionó más de un 50% de sensibilidad (v.gr., casos de ANR correctamente clasificados como ANR). Debido a que las frecuencias fundamentales están relacionadas con la edad y al escaso tamaño de muestra patológica en el caso de las niñas más pequeñas decidió ajustarse un modelo para las niñas mayores de 15 años, ya que en este caso la muestra era de mayor tamaño (n=81) y permitía una mejor comparación entre los grupos control y ANR. Para el modelo con los sujetos mayores de 15 años y los dos tipos de frecuencias fundamentales, la tolerancia arrojó valores superiores a .30 y el VIF inferiores a 4, por tanto adecuados en ambos casos (ver por ejemplo, Menard, 1995; Myers, 1990). El supuesto de linearidad del logit se aceptó para las dos frecuencias fundamentales. Sin embargo, el 81% de la varianza para la F0_a media y el 97% de la varianza para la F0_i media estuvieron asociados al tercer autovalor. Ello unido a la existencia de correlaciones elevadas entre las puntuaciones medias de ambas frecuencias fundamentales invitaba a ser cauto a la hora de evaluar el funcionamiento de un modelo en el que se incluyesen ambas variables como predictores. Inicialmente se evaluó el modelo de regresión logística con la constante, la F0_a media y la F0_i media. A pesar de que el modelo tuvo un ajuste bueno, la Media F0_i presentó un estadístico de Wald no significativo. Por ello se repitió el análisis manteniendo sólo la F0_a y la constante en el modelo obteniéndose un ajuste satisfactorio, χ2=39.267, p < .001; prueba de Hosmer y Lemeshow, χ2(8)=23.602, p=.003. El valor de -2 log de la verosimilitud para el modelo base (con sólo la constante) fue de 104.446, reduciéndose en el modelo final a -2LL=65.179. Los coeficientes en el modelo final fueron b0=28.910 y b1=-.127. La R2 de Nagelkerke arrojó un valor de .530, indicando que el 53% de la variación en la variable dependiente fue explicada por la F0_a media.
En el modelo final para la media F0_a se encontraron los siguientes valores: beta media F0_a=-.127, error estándar=.029; WaldmediaF0_a(1)=18.774, p<.001, Exp(B)mediaF0_a=.881. Para la constante los valores fueron: beta constante=28.910, error estándar=6.548, Wald(1)=19.492, p<.001. El intervalo de confianza al 95% estuvo comprendido entre los valores .832 y .933.
El porcentaje total de casos correctamente clasificados fue del 87.7%. El punto de corte se ajustó en .55 de forma que el 75% de las pacientes con ANR fueron clasificadas correctamente mientras que en el caso del grupo control el porcentaje de clasificaciones correctas fue del 94.3% (figura 5).
DiscusiónLos estudios previos sobre registro de la frecuencia fundamental de los preadolescentes-adolescentes tanto en población normal como en patológica son prácticamente inexistentes. Los encontrados dividen los resultados por intervalos de edad no siempre justificados por el desarrollo evolutivo de los niños. Hemos encontrado un estudio de voz realizado en chicos de ambos sexos sanos de todas las edades comprendidas entre los 9 y 18 años pero no nos es útil como referencia debido a que no es actual (Wilson, 1979) y está realizado con muestra norteamericana, por lo que no se puede comparar con nuestra muestra de habla española porque los formantes son específicos para cada idioma.
El único estudio encontrado en el que se ha realizado las mediciones de la voz para el español como lengua materna y en el que se miden las frecuencias fundamentales es colombiano (Aponte, 2003) y registra la evolución de la voz desde el nacimiento hasta la senectud en una muestra transversal. Esta autora dividió el ciclo vital en cinco etapas evolutivas: 1) infantil (de 0 a 9 años, 2) pre-adolescencia (de 10 a 17 años), 3) adulto (de 18 a 49 años), 4) presenil o climaterio (de 50 a 77 años) y 5) senil (de 77 años en adelante). Sin embargo, en este estudio no se hace referencia a la edad y los ciclos abarcan periodos muy amplios, desde nuestro criterio, en especial en el grupo preadolescente (10 a 17), donde existe la primera muda vocal debido a la maduración puberal. Otra carencia que encontramos es que sólo habla de la F0 y no especifica qué formante ha utilizado en los registros. También Hurtado et al. (2006) informan que la voz de la mujer adolescente (10 a 17 años) registra una F0 alrededor de 220-225Hz, pero tampoco especifica el formante, por lo que no nos era útil para poder establecer comparativa con nuestras pacientes de ANR.
Teniendo en cuenta la falta de datos en la literatura sobre el tono de voz en mujeres en edad puberal sin patología realizamos mediciones en un grupo de mujeres sanas de edades entre los 9 y los 17 años obteniendo los resultados referidos en la tabla 1. Como era de esperar, la voz va adquiriendo un tono cada vez más grave, pasando en las mujeres de 9-11 años de una media para F0_a de 240.7Hz a una de 201.3 a los 17 años y de una media para F0_i de 248.6Hz a una de 208.4Hz respectivamente. Otros autores ya indican el hecho de que la voz se va haciendo más grave pero sin datos objetivos por edades y formantes (Aponte, 2003; Cielo et al., 2009; Dalleas, 1987; Fradejas, 2011; Hurtado et al., 2006; Muñoz, 2001).
Nuestros resultados confirman lo que habíamos observado en la práctica clínica: que el tono de voz de las pacientes diagnosticadas de ANR es más agudo que el que corresponde a la edad cronológica de las mismas, no sólo basándonos en datos observables sino también en la percepción subjetiva que las pacientes tienen de su propia voz. Nos parece que ese hecho es un hallazgo, ya que no hemos encontrado en la literatura ningún estudio que dé cuenta de esta observación.
En el caso del grupo con patología no se encontró una relación significativa entre las frecuencias fundamentales y la edad en la que había aparecido la menarquia. Sin embargo, en el grupo control existió una correlación lineal negativa, es decir, a mayor edad de aparición de la menarquia mayor frecuencia fundamental (voz más aguda). Por otro lado, a mayor número de años con menstruación menores fueron las frecuencias fundamentales (voz más grave). En el grupo de pacientes con ANR, sin embargo, no se encontró relación entre la edad de aparición de la menarquia o el número de años con la menstruación y las frecuencias fundamentales, influyendo la patología en la estabilización normal del tono de voz. Estos datos nos llevan a pensar que en el caso de la ANR se altera el cambio evolutivo normal de la voz quedándose como una secuela permanente.
Está descrito que la baja autoestima es una variable frecuente entre las pacientes con ANR (Asuero et al., 2012; Behar et al., 2014; Cervera et al., 2003; Dunkley y Grilo, 2007; Sassaroli y Ruggiero, 2005) y que la voz aguda se percibe como menos segura y creíble (Rodero, 2002). En el presente estudio hemos evidenciado que las pacientes con ANR describen su voz como más aguda (figura 4) y la califican con adjetivos de desagrado en las entrevistas clínicas. Por todo ello, creemos que se abre un atractivo campo de investigación para incluir la rehabilitación de la voz dentro del tratamiento multidisciplinar que se lleva a cabo con estas pacientes.
En este estudio preliminar sólo ha sido posible calcular el valor predictivo de padecer ANR partiendo de las frecuencias fundamentales para las pacientes de entre 15 y 17 años. Sin embargo, teniendo en cuenta que en este grupo se ha obtenido una especificidad del 94.3% y una sensibilidad del 75% (siendo los casos correctamente clasificados del 87.7%) en futuros estudios con un mayor tamaño de muestra sería interesante estudiar el valor predictivo de las frecuencias fundamentales por grupos de edad, centrándose en obtener la máxima sensibilidad (aún a costa de perder en especificidad, que correspondería a una evaluación más detallada). Esperamos que pueda desarrollarse una medida de screening de fácil implementación en clínica (v.gr., micrófono y software gratuito) que se convierta en una herramienta útil para la detección precoz de la ANR que, como sabemos, está infra-diagnosticada (Guía práctica clínica sobre el trastorno de la Conducta Alimentaria; Ministerio de Sanidad, 2009). De esta forma, creemos que la medida de las frecuencias fundamentales de la voz en salud primaria facilitaría la detección de los trastornos de la conducta alimentaria (TCA) para que posteriormente el paciente fuese derivado a consulta especializada de psicología o psiquiatría para su evaluación en profundidad.
Limitaciones del estudioNuestro estudio ha pretendido en primer lugar establecer la frecuencia fundamental de voz normal en las diferentes edades peripuberales (9 a 17 años) y en segundo lugar explorar si, como observamos, la voz de las pacientes con ANR era más aguda, lo que se demuestra con los datos presentados. No obstante existen algunas limitaciones que queremos señalar: 1) es necesario incrementar el número de sujetos en posteriores estudios con la finalidad de poder generalizar nuestros datos con más seguridad y 2) sólo nos hemos referido a la voz en ANR, sin valorar en este primer estudio otros TCA, por lo que esa línea de investigación queda abierta a estudios posteriores.
Extended SummaryHere, a study about the voice in patients with restrictive anorexia nervosa (AN-R) is presented. The objective of this study was to assess the voice alterations in patients with restrictive anorexia nervosa when the disease started at puberty.
MethodThe control group consisted of subjects without known pathology, from 9 to 17 years old (n=102). The experimental group consisted of AN-R inpatients of a public hospital or being treated in ambulatory care who satisfied the diagnostic requirements for the DSM-V and who had started the disease before or during the puberty and do not have have any pathology of the oral anatomical track, in the speech, or hearing.
ProcedureThe procedure for data collection was identical for control and pathological groups. It was authorized by the ethic committee of the Niño Jesús Hospital in Madrid. The procedure follows the following steps:
1. Informed consent from parents or legal tutors, and from the patients older than 12 years old.
2. Application of a questionnaire to collect the following data: personal data, year of first menarche, whether or not she has suffered menstruation alterations since the appearance of menarche, date of the diagnosis with AN-R disorder, and questions about the subjective perception of own voice.
3. Acoustic measurement of voice: measurement of the F0 considering the phonemes “a” (F0_a) and “i” (F0_i), which are known to be influenced by vocal track's anatomy, by a Pantronic 300 unidirectional and a digital recorder.
4. Voice analyses by the free Praat software, which is a specialized program for the phonetic analysis of speech (Boersma y Weenink, 2013).
To analyze data we used SPSS 15.0. First, we calculated Pearson correlations between variables and checked the assumptions of normality (i.e., Kolmogorov-Smirnov's test) and homogeneity of variances (i.e., Levene's test). Due to the violation of both assumptions, we applied non-parametric tests for mean differences: Mann-Whitney's U tests for independent samples (i.e., differences between control and AN-R groups) and Wilcoxon's tests for related means (i.e., means from F0_a and F0_i). In all cases we show the effect sizes using Rosenthal's (1991)r. Finally, we calculated a logistic regression to predict the membership to the AN-R group from the voice's fundamental frequencies (F0). We took into account the following statistics to interpret the adjustment of the model: Wald's, chi-square, and Hosmer and Lemeshow's test.
Concluding Remarks- 1)
We present for the first time the range of normal values for fundamental frequencies in women, from 9 to 17 years old, whose mother tongue was Spanish and have not been diagnosed with any voice-related pathology.
- 2)
The voice of patients with restrictive anorexia nervosa was significantly shriller than the one of the control group.
- 3)
Regarding AN-R's group we did not find a significant relationship between F0 and the year of appearance of the menarche. Nevertheless, the control group had a negative linear correlation between those variables, meaning that the older the girl when she had the menarche, the shriller her voice. On the other hand, in contrast with the control group, for the AN-R group we did not find any significant relationship between the voice's F0 and the age of menarche, nor between the voice's F0 and the number of years since menarche. Thus, this pathology appears to alter the stabilization of the voice tone.
- 4)
It is known that patients who suffer from AN-R usually have a low self-esteem (Asuero, Avargues, Martin y Borda, 2012; Behar, Gramegna y Arancibia, 2014; Cervera et al., 2003; Dunkley y Grilo, 2007; Sassaroli y Ruggiero, 2005), and that shrill voice is perceived usually as less secure and credible than normal voice (Rodero, 2002). In this study we have reported that AN-R patients described their voice as shrill more often than the control group (Figure 4). Also, AN-R patients usually described their voice using negative adjectives and disliking. Thus, we believe that our findings open a field of research that could lead to the inclusion of voice rehabilitation into the multidisciplinary treatment that is being used for AN-R.
- 5)
In this pilot study, we could only calculate the predictive value of having AN-R starting from the fundamental frequencies for the age group ranging 15-17 years old. Nevertheless, given that in this age group we obtained a specificity of 94.3% and a sensibility of the 75% (with a 87.7% of cases correctly classified), in future studies using a bigger sample size we propose to analyze the predictive value for fundamental frequencies by age groups, focusing on obtaining the maximum sensibility (even assuming a loss in specificity). We expect it will be possible the development of a screening procedure easy to implement in clinical practice (i.e., microphone and free software) that will become a useful tool that will allow us to detect AN-R, which as we know is usually sub-diagnosed (Guía práctica clínica sobre el Trastorno de la Conducta Alimentaria; Ministerio de Sanidad, 2009). Thus, we believe the measurement of fundamental frequencies in primary healthcare would simplify the detection of behavioral eating disorders, and the referral to a specialist on Psychology or Psychiatry for an in-depth evaluation.
Los autores de este trabajo declaran que no tienen ningún conflicto de intereses.