El objetivo de este estudio es validar la versión en castellano del ADHD-RS-IV (ADHD-RS-IV.es) en una muestra española.
MétodosA partir de una muestra total de 652 niños y adolescentes (rango edad: 6-17 años; media [DE]=11,14 [3,27] años), se incluyó a 518 pacientes con TDAH (criterios DSM-IV-TR) y a 134 controles sanos. Para la evaluación de la estructura factorial, la validez y la fiabilidad de la escala se realizó un análisis factorial confirmatorio (CFA) mediante structural equation modeling en una matriz de correlaciones policóricas, y usando el método de máxima verosimilitud para la estimación. Se calcularon la validez discriminante y su valor predictivo mediante curvas receiver operating characteristics.
ResultadosLa escala en castellano mostró una consistencia interna elevada, tanto para la escala total como para sus subescalas. El coeficiente alfa de Cronbach era 0,94 para la escala total y ≥ 0,90 para las subescalas. Los valores alfa ordinales eran 0,95 para la escala total y ≥ 0,90 para las subescalas. El análisis CFA mostró un modelo de 2 factores (inatención e hiperactividad/impulsividad) intercorrelacionados. La escala ofrece buen poder discriminante (AUC=0,97).
ConclusionesLa versión española del ADHD-RS-IV (ADHD-RS-IV.es) mostró una estructura bifactorial consistente con los modelos del DSM-IV-TR y DSM-5, y con el modelo propuesto por el autor de la escala original. Además, posee un alto poder discriminante, lo que lo convierte en un instrumento válido y fiable para medir la presencia y severidad de síntomas de TDAH en la población española.
The purpose of this study is to validate a Spanish-language version of the 18-item ADHD Rating Scale-IV (ADHD-RS-IV.es) in a Spanish sample.
MethodsFrom a total sample of 652 children and adolescents aged 6 to 17 years (mean age was 11.14±3.27), we included 518 who met the DSM-IV-TR criteria for ADHD and 134 healthy controls. To evaluate the factorial structure, validity, and reliability of the scale, we performed a confirmatory factor analysis (CFA) using structural equation modelling on a polychoric correlation matrix and maximum likelihood estimation. The scale's discriminant validity and predictive value were estimated using ROC (receiver operating characteristics) curve analysis.
ResultsBoth the full scale and the subscales of the Spanish-language version of the ADHD-RS-IV showed good internal consistency. Cronbach's alpha was 0.94 for the full scale and ≥ 0.90 for the subscales, and ordinal alpha was 0.95 and ≥ 0.90, respectively. CFA showed that a two-factor model (inattention and hyperactivity/impulsivity) provided the best fit for the data. ADHD-RS-IV.es offered good discriminant ability to distinguish between patients with ADHD and controls (AUC=0.97).
ConclusionsThe two-factor structure of the Spanish-language version of the ADHD-RS-IV (ADHD-RS-IV.es) is consistent with those of the DSM-IV-TR and DSM-5 as well as with the model proposed by the author of the original scale. Furthermore, it has good discriminant ability. ADHD-RS-IV.es is therefore a valid and reliable tool for determining presence and severity of ADHD symptoms in the Spanish population.
El trastorno por déficit de atención e hiperactividad (TDAH) es un trastorno del neurodesarrollo que se caracteriza por la presencia de síntomas de inatención (IA) y/o hiperactividad-impulsividad (HI), persistentes y no correspondientes al nivel de neurodesarrollo normal del niño o adolescente1. Estas 2 dimensiones (IA e HI) son resultado del estudio factorial de los 18 criterios diagnósticos del TDAH del DSM-IV-TR2 y DSM-51. La evaluación completa de los síntomas de TDAH debe incluir una entrevista clínica con padres y paciente, e información sobre datos que recojan el impacto que los síntomas tienen en el funcionamiento global del niño, tanto en casa como en el colegio3–8.
Hay varios cuestionarios siguiendo los criterios y la estructura factorial del DSM-IV-TR2 para facilitar la recogida de la gravedad y la frecuencia de síntomas de TDAH por parte de profesores y padres. Estos incluyen la ADHD-Rating Scale IV9, la ADHD Symptoms Rating Scale10, la Conners Rating Scale11 y la SNAP-IV Rating Scale12, entre otras. Para abordar los cambios aparecidos en el DSM-51, DuPaul y su equipo desarrollaron recientemente la ADHD Rating Scale-53, avalando su validez y replicando la estructura bifactorial de los síntomas diana del TDAH, recogida tanto en el DSM-IV-TR2 como el DSM-51. Tanto la utilidad clínica, como las consistentes propiedades psicométricas de la escala ADHD-RS-IV13 han sido replicadas en distintos estudios norteamericanos14, multinacionales15 y europeos16.
En España, Servera y Cardó publicaron en 2007 un estudio describiendo los datos normalizados del ADHD-RS-IV basados en una muestra de niños en edad escolar (6-12 años)17. Sin embargo, hasta donde sabemos, esta escala no ha sido validada en español. Los objetivos de este estudio son, primero, describir la frecuencia de síntomas de TDAH tanto en una muestra de niños controles sanos sin TDAH, como en una muestra de pacientes con TDAH; y segundo, validar la versión en castellano de la escala de 18 ítems ADHD Rating Scale-IV (ADHD-RS-IV.es).
Sujetos, material y métodosSujetosRealizamos un estudio naturalístico observacional de 652 participantes de edades entre los 6 y los 17 años de edad. El estudio se llevó a cabo a partir de 2 muestras separadas. Se incluyó en el estudio a 518 pacientes (no previamente tratados) de edades entre los 6 y 17 años en el momento del diagnóstico de TDAH (cualquier subtipo). Los sujetos fueron seleccionados a partir de los pacientes con diagnóstico de TDAH que habían acudido a la Unidad de Psiquiatría Infantil y Adolescente de la Clínica Universidad de Navarra entre enero del 2000 y abril del 2015. También se incluyó a 134 niños y adolescentes sin diagnóstico ni sospecha de TDAH, de edades entre los 6 y los 16 años. Los sujetos fueron seleccionados a partir de los pacientes que acudieron a lo largo del año 2014 al departamento de Pediatría de la Clínica Universidad de Navarra para consultas de niño sano.
Evaluación clínica de la muestra de pacientes con trastorno por déficit de atención e hiperactividadPara la evaluación clínica y diagnóstica de TDAH se utilizaron los criterios diagnósticos del DSM-IV-TR2 mediante una plantilla de la entrevista semiestructurada Kiddie-Schedule for Affective Disorders and Schizophrenia-Present and Lifetime Version (KSADS-PL)18,19, realizada por psiquiatras especialistas en Psiquiatría del Niño y del Adolescente con experiencia (CAS, ADS, PdC). Como parte de la rutina diagnóstica, se recogieron, además, los cuestionarios completados por los padres del ADHD-RS-IV.es. Se excluyó a pacientes con TDAH que tuvieran un cociente intelectual igual o menor de 80 y/o con diagnóstico de trastorno del espectro autista. No se excluyó a los pacientes que presentaran comorbilidad con otros trastornos, como por ejemplo trastorno negativista desafiante, trastornos depresivos y/o trastornos de ansiedad.
Attention-Deficit/Hyperactivity Disorder Rating Scale (padres)El ADHD-RS-IV9 es una escala de 18 ítems correspondientes para cada uno de los 18 síntomas que figuran en el diagnóstico DSM-IV-TR2 de TDAH, similares a los del actual DSM-51. Se trata de una escala tipo Likert en la que cada ítem se califica de 0 a 3 puntos (nunca/rara vez, algunas veces, con frecuencia, con mucha frecuencia) cada uno. La puntuación total se calcula como la suma de las puntuaciones obtenidas en cada uno de los 18 ítems. Además de la puntuación total, se subdividen 2 puntuaciones atendiendo a la suma de síntomas de IA e HI. La versión en castellano del ADHD-RS-IV.es (véase la tabla 1) usada en este estudio fue traducida al castellano de España por el último autor (CAS) en el año 1999. Dicha traducción fue revisada por un traductor independiente y la versión ha sido actualizada y adaptada sobre la base de las sugerencias y dificultades y dudas al cumplimentarlo por parte de padres, profesores y otros profesionales.
La versión en español del ADHD-RS-IV usada en el presente estudio
Nunca o rara vez | Algunas veces | Con frecuencia | Con mucha frecuencia | |
---|---|---|---|---|
IA1 No presta atención a las cosas o comete errores por descuido | ||||
IA2 Tiene dificultad en mantener la atención en actividades o juegos | ||||
IA3 No parece escuchar lo que se le está diciendo | ||||
IA4 Tiene dificultad en completar/terminar tareas o no sigue instrucciones | ||||
IA5 Tiene dificultad en organizarse (actividades, etc. | ||||
IA6 Evita actividades que requieren mucho esfuerzo mental (deberes, etc.) | ||||
IA7 Pierde cosas necesarias para actividades o deberes | ||||
IA8 Se distrae fácilmente por estímulos externos (por el ambiente…) | ||||
IA9 Es olvidadizo de actividades diarias | ||||
HA1 Mueve manos y pies o se mueve en su asiento | ||||
HA2 Se levanta en clase o en otras situaciones cuando no debe | ||||
HA3 Corre o se sube a sitios/cosas cuando se le dice que no lo haga | ||||
HA4 Tiene dificultad para jugar en silencio | ||||
HA5 Actúa como si estuviera activado por un motor. «No se le gastan las pilas» | ||||
HA6 Habla excesivamente | ||||
HA7 Responde abruptamente/impulsivamente antes de terminar la pregunta | ||||
HA8 Tiene dificultad en esperar su turno en actividades de grupo | ||||
HA9 Interrumpe a la gente o se mete en conversaciones o juegos |
Al tratarse de una escala Likert (0-3), el sistema de puntuación es el siguiente: «nunca o rara vez»: 0 puntos; «algunas veces»: 1 punto; «con frecuencia»: 2 puntos; «con mucha frecuencia»: 3 puntos.
HA1-HA9: ítems correspondientes a los 9 síntomas de hiperactividad/impulsividad; IA1-IA9: ítems correspondientes a los 9 síntomas de inatención.
Todos los padres de los participantes (pacientes y controles sanos) completaron la escala ADHD-RS-IV.es, como parte del proceso diagnóstico en el caso de los pacientes, y de manera voluntaria y sin retribución alguna en el caso de los controles sanos. Los cuestionarios fueron administrados por miembros del equipo de la Unidad de Psiquiatría Infantil y Adolescente, así como del Departamento de Pediatría de la Clínica Universidad de Navarra.
Análisis estadísticoSe realizaron análisis estadísticos descriptivos con medidas de tendencia central y dispersión (media y desviación estándar [DE] para variables cuantitativas y proporciones e intervalos de confianza para las categóricas). Para la comparación de medias, se utilizó el test de la t de Student. Estos análisis se realizaron con el programa SPSS. Los subtipos DSM-IV-TR2 (combinado, predominio inatento o predominio hiperactivo/impulsivo) fueron analizados conjuntamente, sin diferenciar entre ellos. Se realizó el análisis de ítems, determinando las medias y desviaciones típicas de la muestra total como dividida por grupos (pacientes TDAH/controles sanos). También se determinó el coeficiente alfa de Cronbach y el alfa ordinal —según el método descrito por Zumbo et al. (2007) con la eliminación de un elemento20.
Se realizó un análisis factorial confirmatorio (CFA) con STATA mediante structural equation modeling (SEM) en una matriz de correlaciones policóricas —así se recomienda cuando se trata de ítems con respuestas tipo Likert menores de 7 puntos20— y usando el método de máxima verosimilitud. Como base para la comparación, se probó la adecuación de varios modelos: un modelo bifactorial, así como un modelo jerárquico para evaluar la posibilidad de un modelo bifactorial que incluyera un general factor ADHD, del que partieran los 2 factores (IA e HI), encontrado en un estudio previo21. Como medidas de bondad de ajuste incremental, además del test de la chi al cuadrado, se utilizaron el índice de Tucker-Lewis (Tucker-Lewis index [TLI]), y el índice de ajuste comparativo (Comparative fit index [CFI])22,23. Se empleó el error cuadrático medio de aproximación (Root-mean-square error of aproximation [RMSEA])24 como medida de ajuste parsimonioso. Los valores inferiores a 2 en el cociente de la chi al cuadrado con los grados de libertad25, iguales o superiores a 0,90 en el CFI y el TLI son indicadores de buen ajuste26,27, e iguales o inferiores a 0,06 en el RMSEA28.
Para determinar la fiabilidad de la escala se utilizó un comando programado en STATA, llamado ordalpha, basado parcialmente en el código de Joseph Coveney (2012) modificado29, para obtener los coeficientes alfa ordinales de la escala total y sus subescalas. Estos cálculos se realizaron debido a que dichos coeficientes son preferidos en escalas tipo Likert por ser considerados mejores estimadores del grado de concordancia20. No obstante, para facilitar la comparación con los resultados de otros estudios publicados en la literatura, con el programa SPSS se calcularon además los coeficientes alfa de Cronbach30 de las 2 subescalas y la escala total empleando toda la muestra. Además, para analizar la consistencia interna se utilizó también el índice de correlación media ínter-ítem, basado en una matriz de correlaciones de Pearson y en una matriz de correlaciones policóricas. Este índice es aconsejable como indicador de la homogeneidad de los ítems, especialmente en casos de escalas tipo Likert con un número situado entre 30 y 40 ítems. El índice de correlación media interítem (r) nos indica si los ítems son representativos de un único componente, recomendándose valores situados entre 0,15 y 0,5031.
Por último, se calculó la validez discriminante de la escala y su valor predictivo mediante curvas receiver operating characteristics (ROC). La validez discriminante es un indicador de la capacidad que tiene una escala para distinguir los diferentes subgrupos que pretende diferenciar. Se calculó el intervalo de confianza (IC) del 95% para la sensibilidad y la especificidad usando el método de Wilson32 programado en una macro de SPSS. El punto de corte óptimo se estableció en el índice de Youden máximo (J), es decir, el punto de máximo alejamiento de la curva ROC respecto a la diagonal (J=sensibilidad+especificidad – 1) utilizando siempre valores p de 2 colas.
Para los análisis estadísticos realizados en este estudio de validación se emplearon los programas SPSS v. 15 y STATA v.12.1.
ResultadosSeiscientos cincuenta y dos niños y adolescentes participaron en el estudio; 518 pacientes (muestra clínica) diagnosticados por primera vez de TDAH (79,73% varones; edad [DE]=11,40 [3,30] años) y 134 controles sanos (muestra no clínica) (47% varones; edad [DE] = 10,15 [2,97] años) fueron incluidos en el estudio.
Comparativa entre pacientes/controles sanos de los síntomas diana del trastorno por déficit de atención e hiperactividadLas puntuaciones obtenidas por el grupo clínico fueron significativamente mayores que las obtenidas por el grupo no clínico (p<0,001). Estas diferencias se hallaron en cada uno de los ítems de IA e HI por separado, así como en la puntuación total (tabla 2) (fig. 1).
Comparación de las puntuaciones en cada síntoma de TDAH (ADHD-RS-IV.es) en nuestra muestra de niños y adolescentes con (n=518) y sin (n=134) TDAH
Ítem | Puntuación en controlesM (DE) | Puntuación en pacientes TDAHM (DE) | p |
---|---|---|---|
Subescala IA | |||
Ítem 1 (IA 1): no presta atención/errores por descuido | 0,63 (0,65) | 2,07 (0,77) | < 0,001 |
Ítem 2 (IA2): dificultad en mantener atención en actividades o juegos | 0,24 (0,52) | 1,52 (0,96) | < 0,001 |
Ítem 3 (IA3): no parece escuchar lo que se le está diciendo | 0,51 (0,59) | 1,89 (0,88) | < 0,001 |
Ítem 4 (IA4): dificultad en completar/terminar tareas o no sigue instrucciones | 0,30 (0,53) | 2,12 (0,84) | < 0,001 |
Ítem 5 (IA5): dificultad en organizarse (actividades, etc.) | 0,46 (0,60) | 2,17 (0,93) | < 0,001 |
Ítem 6 (IA6): evita actividades que requieren mucho esfuerzo menta | 0,43 (0,62) | 2,27 (0,96) | < 0,001 |
Ítem 7 (IA7): pierde cosas necesarias para actividades o deberes | 0,39 (0,60) | 1,60 (1,05) | < 0,001 |
Ítem 8 (IA8): se distrae fácilmente por estímulos externos | 0,73 (0,66) | 2,41 (0,71) | < 0,001 |
Ítem 9 (IA9): es olvidadizo de actividades diarias | 0,45 (0,60) | 1,82 (0,94) | < 0,001 |
Puntuación subescala inatención (puntuación IA) | 4,13 (3,57) | 17,85 (5,48) | < 0,001 |
Subescala HI | |||
Ítem 10 (HA1): mueve manos y pies o se mueve en su asiento | 0,54 (0,75) | 1,79 (1,05) | < 0,001 |
Ítem 11 (HA2): se levanta en clase o en otras situaciones cuando no debe | 0,24 (0,49) | 1,41 (1,08) | < 0,001 |
Ítem 12 (HA3): corre o se sube a sitios/cosas cuando se le dice que no lo haga | 0,37 (0,57) | 1,16 (1,1) | < 0,001 |
Ítem 13 (HA4): tiene dificultad para jugar en silencio | 0,22 (0,50) | 0,98 (1,07) | < 0,001 |
Ítem 14 (HA5): actúa como si estuviera activado por un motor | 0,37 (0,60) | 1,26 (1,14) | < 0,001 |
Ítem 15 (HA6): habla excesivamente | 0,62 (0,86) | 1,30 (1,07) | < 0,001 |
Ítem 16 (HA7): responde abruptamente antes de terminar la pregunta | 0,42 (0,63) | 1,52 (1,05) | < 0,001 |
Ítem 17 (HA8): dificultad en esperar su turno en actividades de grupo | 0,28 (0,53) | 1,23 (1,05) | < 0,001 |
Ítem 18 (HA9): interrumpe a la gente o se mete en conversaciones o juegos | 0,43 (0,58) | 1,48 (1,08) | < 0,001 |
Puntuación subescala hiperactividad/impulsividad (puntuación HI) | 3,43 (3,41) | 12,11 (7,083) | < 0,001 |
HI: hiperactividad/impulsividad; IA: inatención.
El análisis mediante curva ROC muestra que la escala ADHD-RS-IV.es tiene una sensibilidad del 91,9% y una especificidad del 90,3% para diferenciar el grupo clínico del no clínico (fig. 2). En base al índice J, el punto de corte óptimo que definiría, de manera teórica y sobre la base de nuestros datos, con mayor exactitud el diagnóstico, son 17 puntos para la muestra general (17 puntos para chicos y 15 puntos para chicas; 19 puntos para niños y 16 para adolescentes [fig. 3] [tabla 2]).
Análisis factorial confirmatorioLa muestra de pacientes con TDAH y sin TDAH fue analizada conjuntamente, independientemente del subtipo DSM-IV-TR2, ya que no existe razón probada en la literatura que justifique su análisis por separado28. El modelo bifactorial (IA, HI) demostró un ajuste aceptable (CFI=0,92, TLI=0,91, RMSEA=0,07). El CFA mostró también que todos los ítems cargaban de manera significativamente (r>0,30 con p<0,001) en los factores clínicamente correspondientes. Se confirma también la elevada correlación (r=0,62) entre ambos factores (IA, HI), IC del 95% (0,57-0,68). La fiabilidad analizada mediante los coeficientes alfa ordinal y de Cronbach fueron elevados tanto para la escala total (0,93 y 0,95, respectivamente), como para la subescala de IA (0,93 y 0,95) y de HI (0,91 y 0,94) por separado.
El diagrama SEM completo se presenta en la figura 4.
Diagrama SEM que muestra un modelo bifactorial, así como los valores de las correlaciones existentes entre las 2 subescalas entre las 2 dimensiones (subescalas) del ADHD-RS-IV.es.
En este diagrama, cada círculo corresponde con una dimensión, y cada rectángulo con un ítem (criterio diagnóstico). En este diagrama observamos cómo cada círculo está unido a los ítems que definen una misma dimensión y no están ligados a la otra (coeficiente de correlación media ítem-subescala). La ausencia de flecha que uniera un ítem con una dimensión significaría que la carga del factor con cualquiera de las dimensiones sería 0. La correlación entre las dimensiones y/o ítems están representadas con flechas de doble dirección (coeficiente de correlación interítem/intersubescala).
a Coeficiente de correlación media ítem-subescala (error aleatorio).
b Coeficiente de correlación intersubescala.
c Coeficiente de correlación interítem.
Este estudio evalúa la validez de la escala ADHD-RS-IV.es, y analiza las propiedades psicométricas de la escala en una muestra clínica y no clínica española. Teniendo en cuenta las características de nuestra muestra, no hay ningún estudio publicado hasta la fecha que haya realizado la validación de la escala ADHD-RS-IV en español en una muestra clínica y no clínica.
Tanto la homogeneidad como el tamaño muestral son aspectos que merecen consideración en el estudio de validación de una escala. A este respecto, no existe un acuerdo unánime sobre el número de sujetos mínimo que se han de incluir. El tamaño muestral que hemos utilizado en nuestro estudio satisface los criterios generalizados, ya que, en cuanto al valor absoluto, nuestra cifra de 652 sujetos cumpliría las indicaciones de Goldberg y Digman (1994), que recomiendan la inclusión de entre 500 y 1.000 participantes33. Con respecto al número de sujetos reclutados por cada ítem del cuestionario, en nuestro caso la ratio es de 36:1, cumpliendo las recomendaciones más exigentes34. Mediante el análisis descriptivo de los ítems, podemos contrastar su capacidad de poner de manifiesto las diferencias existentes entre el grupo clínico y no clínico. En nuestro estudio encontramos diferencias estadísticamente significativas (p<0,001) en cada uno de los 18 ítems de la escala, así como en las puntuaciones de las subescalas (IA e HI) y en la puntuación total entre la muestra clínica y la no clínica. Esto demuestra que la escala ADHD-RS-IV.es, en nuestra muestra, ha tenido la capacidad de discriminar la presencia de diagnóstico. La media de puntuación total en nuestra muestra clínica fue de 29,96, ligeramente menor que la obtenida en otras muestras clínicas utilizadas en los estudios de validación europeos16 (35,8) y multinacionales15 (41,2). Esto subraya la importancia de obtener datos normativos de dicha escala en cada país.
El poder de discriminación de un ítem se puede estimar analizando el coeficiente de correlación ítem-total corregido (r) entre la puntuación del ítem y la obtenida en la escala total, así como entre la puntuación del ítem y la subescala correspondiente. Los valores iguales o superiores a 0,25-0,30 se consideran adecuados35. Tal y como se observa en la figura 2, todos los coeficientes (cargas factoriales) se encuentran por encima del rango 0,25-0,30, demostrando que los ítems son representativos de un único factor y dando cuenta de la robustez de la escala. La presencia de correlación elevada (r > 0,40) entre ítems o factores implica que ambos están midiendo aspectos muy similares. En nuestro modelo encontramos que entre ambos factores existe una correlación moderadamente elevada (r=0,62), demostrando que ambos factores definen conjuntamente una misma entidad diagnóstica. Además, se observan correlaciones positivas elevadas entre distintos pares de ítems: IA7 («pierde cosas») y IA9 («es olvidadizo»), r=0,39; HA8 («dificultad para guardar turno») y HA9 («interrumpe a otros»), r=0,41. La presencia de estos índices podría indicar que la eliminación de uno de ellos podría mejorar la fiabilidad de la escala. Sin embargo, en este caso, tras la realización del análisis eliminando los ítems, la calidad del ajuste no mejora, por lo que el modelo no se modifica.
Con respecto a la estructura factorial de la escala ADHD-RS-IV.es, los resultados obtenidos en el análisis factorial exploratorio y confirmatorio demuestran que el modelo bifactorial es el que mejor se ajusta a la estructura de la escala (CFI=0,92, TLI=0,91, RMSEA=0,07, chi al cuadrado = 4,04), con valores de CFI y TLI>0,90, que indican buena bondad de ajuste, aunque algunos autores23 señalan que deberían considerarse valores más cercanos a 0,95. Un valor RMSEA menor de 0,06 indica buen ajuste y valores entre 0,06 y 0,08 indican un ajuste moderado23. En nuestro análisis podemos comprobar que el valor de la chi al cuadrado entre los grados de libertad es mayor de 2, superior al valor recomendado25. Sin embargo, usando el método de máxima verosimilitud, este valor puede verse alterado en muestras grandes, por lo que no puede utilizarse como único indicador de ajuste en los análisis con SEM, pero sí es conveniente incluirlo en los análisis confirmatorios dado que otros índices se basan en este33. De este modo, y a pesar del elevado valor de la chi al cuadrado de nuestro modelo, los excelentes valores del resto de las medidas de bondad de ajuste (CFI, TLI y RMSEA) respaldan sin lugar a dudas la replicación de la estructura factorial de la escala original9. A pesar de esto, también se sometió a contraste el modelo jerárquico, que mostró un adecuado ajuste, contrariamente a lo encontrado en un estudio previo por Ullebø et al. en 2012 en el que observaron que la escala se ajustaba a un modelo bifactorial a partir de un General factor ADHD21.
La fiabilidad de un instrumento nos indica la precisión con la que mide aquello que pretende medir, estimándose mediante el alfa de Cronbach30 y, con más precisión en el caso de escalas Likert, mediante el alfa ordinal29. Cuanto mayor es el valor alfa, mayor será la consistencia interna de la escala29. En nuestro estudio, los valores (Cronbach's/ordinal) podrían considerarse excelentes tanto para la escala total (0,94/0,95) como para las 2 subescalas de la IA (0,937/0,95) y la HI (0,91/0,94), siendo similares a los demostrados en estudios de validación previos14–16(tabla 3).
Puntos de corte óptimos y percentiles correspondientes con los datos normativos de la muestra/submuestras
Valor punto de corte | Datos normativos | Punto de corte de la muestra totala y percentiles correspondientes a los datos normativos de la muestra total | Punto de corte de las submuestrasb y percentiles correspondientes a los datos normativos de las distintas submuestras | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Sensibilidad (%) | Especificidad (%) | AUC | IC del 95% | n | M (DE) | p90 | p93 | p95 | p98 | ||||
Muestra total | 17a | 91,9 | 90,3 | 0,969 | 0,96 - 0,98 | 134 | 7,57 (5,83) | 15,5 | 16,55 | 18 | 23,90 | 17 (p93-p95) | |
Chicas | 15b | 92,4 | 83,1 | 0,961 | 0,94 - 0,98 | 71 | 7,42 (5,67) | 16 | 16,96 | 18 | 21,68 | 15 (p85-p90) | |
17a | 87,4 | 88,7 | 17 (p93-p95) | ||||||||||
Chicos | 17b | 93,1 | 92,1 | 0,969 | 0,95 - 0,99 | 63 | 7,73 (6,04) | 15 | 16,52 | 17,8 | 27,44 | 17 (p93-p95) | |
17a | 93,1 | 92,1 | 17 (p93-p95) | ||||||||||
Niños | 19b | 90,8 | 92,5 | 0,973 | 0,96 - 0,99 | 84 | 9,25 (6,05) | 17 | 18 | 19,5 | 26,6 | 19 (p93-p95) | |
17a | 95,5 | 86 | 17 (p90-p93) | ||||||||||
Adolescentes | 16b | 91,2 | 95,1 | 0,986 | 0,97 - 0,99 | 50 | 4,74 (4,14) | 11 | 12,43 | 13,9 | 15 | 16 (>p98) | |
17a | 87,8 | 100 | 17 (>p98) |
AUC: área debajo de la curva (area under the curve); IC del 95%: intervalo de confianza del 95%; M (DE): media (desviación estándar).
Por otra parte, estimamos la capacidad discriminante de la escala mediante el análisis de curvas ROC, que permiten estimar la sensibilidad y la especificidad para los distintos puntos de corte de la escala y dan una idea global de la capacidad de discriminación de la escala: «el área bajo la curva ROC estima la capacidad que tiene una prueba para distinguir o discriminar entre enfermos y no enfermos; cuanto mayor sea el área bajo la curva, más capacidad tendrá la prueba para discriminar entre unos y otros»36. El punto de corte óptimo se estableció en 17 puntos para la escala total, con una elevada sensibilidad (92%) y especificidad (99%), mostrando un elevado valor del área bajo la curva (AUC=0,97). Esto demuestra que la escala ADHD-RS-IV.es muestra un buen poder discriminante. Estos valores también se encontraron en los subanálisis realizados atendiendo a género y edad (tabla 4). Este punto de corte (17), obtenido tanto para la muestra total como para las submuestras, corresponde al percentil entre 93 y 95 de los datos normativos extraídos de nuestra pequeña muestra control (tabla 4). En otras palabras, usando este punto de corte, el 93% de la muestra total (clínica y no clínica), cumpliría criterios de TDAH. Al realizar los análisis por subgrupos (varones/mujeres; niños/adolescentes) se encontraron percentiles similares. Además, calculamos los puntos de corte óptimos para cada submuestra (tabla 2), obteniendo un punto de corte menor en el caso de las chicas (15) y mayor en el caso de los chicos (19).
Comparación de nuestros resultados con otros estudios
Consistencia interna (coeficientes alfa de Cronbach) | |||
---|---|---|---|
IA | HI | Total | |
DuPaul et al., 1998 | 0,93 | 0,91 | |
Zhang et al., 2005 | 0,724 | 0,825 | 0,795 |
Döpfner et al., 2006 | 0,81 | 0,87 | 0,88 |
Vallejo et al. | 0,937 | 0,91 | 0,94 |
HI: subescala de hiperactividad/impulsividad de la escala ADHD-RS-IV.es; IA: subescala de inatención de la escala ADHD-RS-IV.es.
En este estudio cabe señalar algunas limitaciones importantes para interpretar y generalizar sus resultados. En primer lugar, no diferenciamos si el informante era el padre o la madre, tal y como sí recogen algunos estudios previos. En segundo lugar, dado que únicamente fueron los padres quienes cumplimentaron la escala, los datos obtenidos en este estudio no podrían extrapolarse a la interpretación de dicha escala en profesores. Por último, dada la falta de datos normativos de la escala ADHD-RS-IV.es en la población infantil y adolescente17, lo evaluamos en una pequeña muestra control de 134 sujetos sanos. Por esta razón, serían necesarios estudios que incluyan muestras más amplias de controles sanos serían necesarias para comprobar estos datos normativos preliminares. Aunque nuestro estudio indica que las puntuaciones de la escala ADHD-RS-IV.es completadas por los padres son capaces de discriminar el grupo clínico del no clínico, cabe recordar que el diagnóstico nunca debe realizarse sobre la base de ningún cuestionario, sino que debe basarse siempre en la entrevista clínica con entrevistas a los padres y al paciente, cuestionarios, información de los profesores y exploraciones complementarias.
A pesar de estas limitaciones, concluimos que la escala ADHD-RS-IV.es presenta una alta fiabilidad y validez, equiparables a la escala original, presenta la misma estructura factorial que la original y propuesta en DSM-IV-TR2 y DSM-51, y muestra propiedades psicométricas clínicamente aceptables, convirtiéndola en un instrumento válido y fiable para evaluar la intensidad y frecuencia de los síntomas de TDAH en población clínica.
Conflicto de interesesMaría Vallejo-Valdivielso ha recibido financiación departamental para estudios de investigación (no personal), de la Fundación Caja Navarra (CAN), de la Sociedad Vasco-Navarra de Psiquiatría (SVNP), del Gobierno de Navarra y de la Sociedad Española de Psiquiatría Infantil y Adolescente (AEPNYA). También ha recibido financiación para distintos cursos de formación continuada por parte de Shire, Janssen y Lundbeck.
César A. Soutullo ha recibido financiación departamental para estudios de investigación (no personal) de la Fundación Caja Navarra (CAN), Eli Lilly, Lundbeck, Shire y TEVA. Ha servido en consejos asesores de: Fundación Alicia Koplowitz, Editorial Médica Panamericana, Eli Lilly, European Network on Hyperkinetic Disorder (EUNETHYDIS), Instituto de Salud Carlos III (FIS), NeuroTech Solutions Ltd, Ministerio de Sanidad (Guías de Práctica Clínica en TDAH y Depresión), Rubiò y Shire. Ha impartido ponencias en cursos de formación médica continuada (no sobre un fármaco) para Eli Lilly, Shire, Universidad Internacional Menéndez Pelayo y la Universidad Internacional de La Rioja (UNIR). Ha recibido además derechos autor por parte de: DOYMA, Editorial Médica Panamericana, EUNSA y Mayo Ediciones.
Pilar de Castro-Manglano ha recibido financiación departamental para estudios de investigación (no personal) de la Fundación Caja Navarra (CAN), Eli Lilly, Lundbeck y Shire. Ha servido en consejos asesores de: Fundación Alicia Koplowitz, Editorial Médica Panamericana y Eli Lilly. Ha impartido ponencias en cursos de formación médica continuada (no sobre un fármaco) para Shire.
Juan J. Marín-Méndez ha recibido financiación departamental para estudios de investigación (no personal) de la Fundación Caja Navarra (CAN), del Instituto Carlos III, del Gobierno de Navarra, de la Fundación QPEA y de Shire. También ha recibido financiación para distintos cursos de formación continuada por parte de Shire, Eli Lilly, Rovi, Roche y Pfizer.
Azucena Díez-Suárez ha recibido financiación departamental para estudios de investigación (no personal) de la Fundación Caja Navarra (CAN), Otsuka Pharmaceutics, Lundbeck y Shire. Ha servido en consejos asesores de: Fundación Alicia Koplowitz, Editorial Médica Panamericana y Eli Lilly. Ha impartido ponencias en cursos de formación médica continuada (no sobre un fármaco) para Shire.
Este trabajo no ha sido presentado en la Reunión Anual de la SEN. Sin embargo, algunos resultados preliminares han sido presentados como comunicación tipo póster en las siguientes reuniones científicas: 60.° Congreso AEPNYA-AACAP (San Sebastián, España, junio del 2016); 29th ECNP Congress of Applied and Translational Neuroscience (Viena, Austria, septiembre del 2016); 4th Eunethydis International Conference (Berlín, Alemania, octubre del 2016), y en el AACAP's 63rd Annual Meeting (Nueva York, EE. UU., octubre del 2016).