Validación de dos versiones cortas de la escala para depresión del Centro de Estudios Epidemiológicos en adolescentes colombianos

Rueda-Jaimes, German Eduardo; Camacho López, Paul Anthony; Rangel-Martínez-Villalba, Andrés Mauricio

doi:10.1016/j.aprim.2008.09.005

Información del artículo

Resumen

Texto completo

Bibliografía

Descargar PDF

Estadísticas

Figuras (2)

Tablas (4)

Tabla 1. Diferencias entre los adolescentes escolarizados con o sin trastorno depresivo mayor (TDM)

Tabla 2. Índices de validez de criterio de las dos versiones de la escala CES-D en adolescentes

Tabla 3. Matriz de factores con rotación promax de la versión breve y la ultracorta de la escala CES-D en adolescentes colombianos

Mostrar másMostrar menos

Resumen

Objetivo

Establecer la validez y la fiabilidad de dos versiones cortas de la escala para depresión del Centro de Estudios Epidemiológicos (CES-D) en adolescentes escolarizados colombianos.

Diseño

Estudio de validación.

Emplazamiento

Colegios de secundaria de Bucaramanga, Colombia.

Participantes

Se seleccionó, en tres etapas, a 474 estudiantes, 68 no aceptaron, 8 fueron excluidos y 8 no completaron el proceso.

Mediciones principales

Aplicación de manera independiente de la escala CES-D y la Entrevista Clínica Estructurada para los Trastornos del Eje I del DSM-IV (SCID-I), versión clínica. Se reaplicó la escala CES-D entre 3 y 28 días después. Se eliminaron los componentes con menor correlación lineal de Pearson con respecto a la puntuación total de la escala. Para la versión ultracorta de 3 componentes y la breve de 10 se calculó el índice alfa de Cronbach, el análisis de los factores, la curva ROC, la sensibilidad, la especificidad y el coeficiente de Lin.

Resultados

Para la escala breve el alfa de Cronbach fue 0,86 y el coeficientes de Lin, 0,77. El área bajo la curva ROC, 0,83; con sensibilidad del 77,8% y especificidad del 74,1%. Dos factores explicaron el 55,8% de la variancia. Para la escala ultracorta el alfa de Cronbach fue 0,76 y el coeficiente de Lin, 0,74. El área bajo la curva ROC fue 0,80, con una sensibilidad del 75,56% y una especificidad del 70,67%. Un factor explicó el 68,19% de la variancia.

Conclusiones

La escala breve y la ultracorta del CES-D son tan útiles como la original para el cribado del trastorno depresivo mayor en adolescentes, aunque la ultracorta no preserva la estructura factorial de la original.

Palabras clave:

Validez de las pruebas

Trastorno depresivo mayor

Adolescente

Escalas de valoración psiquiátrica

Cribado

Abstract

Objective

To establish the validity and reliability of a Brief and Ultra-short Center for Epidemiological Studies Depression (CES-D) Scale in adolescents.

Design

Validation study.

Setting

Secondary schools in Bucaramanga, Colombia.

Participants

A total of 474 students were selected through a three stage process; 68 did not agree to participate, 8 were excluded and 8 did not complete the process.

Main measurements

Adolescent students were evaluated with CES-D and the clinical interview for Diagnostic and Statistical Manual of Mental Disorders, Fourth Edition. The CES-D scale was re-applied 3 to 28 days after the first application. The ten items and the three items with the highest correlation with total score were selected to construct a Brief scale and Ultra-short scale, respectively. Construct validity, criterion validity, test-retest reliability and internal consistency were analyzed.

Results

For the Brief CES-D Scale the Cronbach's alpha was 0.86 and Lin's coefficient was 0.77. The area under ROC curve was 0.83, with a sensitivity of 77.8%; specificity 74.1%. Two main factors were identified to explain the 55.81% variance. For the Ultra-short Scale the Cronbach's alpha was 0.76 and Lin's coefficient was 0.74. The area under ROC curve was 0.80, with a sensitivity of 75.56%; specificity 70.67%. One main factor was identified to explain the 68.19% of variance.

Conclusions

The Brief and Ultra-Short CES-D Scale are as useful as the original scale for the screening of MDD in adolescents; Ultra-short CES-D Scale does not preserve the original factorial structure.

Keywords:

Validity

Depressive disorder

Adolescent

Psychiatric status rating scales

Screening

Texto completo

Introducción

El trastorno depresivo mayor (TDM) en adolescentes causa malestar clínico y en las relaciones, ausentismo escolar y bajo rendimiento1; aumenta el riesgo de abuso de sustancias, conductas antisociales, conductas riesgosas sexuales y en la alimentación, intentos suicidas y suicidios2–4. La prevalencia del TDM en adolescentes puede variar del 0,7 al 11%5–8.

El diagnóstico del TDM implica la realización de una entrevista por un profesional entrenado. Hay varias escalas para cribado que aumentan la probabilidad de realizar un diagnóstico temprano y pueden ser utilizadas en investigación con propiedades psicométricas similares entre sí9,10. La escala de la depresión del Centro de Estudios Epidemiológicos (CES-D) se ha utilizado para detección de síntomas depresivos en adolescentes, a pesar de diseñarse inicialmente para adultos, posee propiedades psicométricas similares a las escalas utilizadas en menores y tiene la ventaja que puede usarse sin restricción10,11. Se han propuesto versiones abreviadas con el objeto de reducir los problemas de fatiga y pérdida de atención que pueden ser mayores en este grupo de edad y naturalmente reduciría el tiempo de respuesta12,13. No obstante, las escalas breves tienen limitaciones psicométricas. Primero, es poco factible que abarquen con suficiencia un constructo complejo como el concepto de TDM14. Segundo, la fiabilidad podría reducirse si se compara con escalas más extensas15.

El objetivo de este estudio es establecer la validez y la fiabilidad de dos versiones cortas de la escala CES-D en adolescentes escolarizados colombianos.

Material y métodos

El estudio fue aprobado por el Comité de Ética en Investigación de la Facultad de Medicina de la Universidad Autónoma de Bucaramanga. Se solicitó el consentimiento informado por escrito de los padres y del estudiante.

Instrumento

La escala CES-D es un instrumento tipo Likert de 0–3 puntos en la semana previa y está compuesta de 20 ítems autoadministrados. Cada pregunta cuantifica la frecuencia y la intensidad de los síntomas depresivos16. La versión utilizada se tradujo por el método back-translation y está descrito en otra publicación17.

Tamaño de muestra

La población objeto fueron los 68.000 adolescentes matriculados durante 2005 en colegios de secundaria de Bucaramanga, Colombia. El tamaño de la muestra se estimó bajo el supuesto de una prevalencia de TDM del 10%, sensibilidad del 80% y especificidad del 80%18. Para ello era necesaria una muestra de 370 estudiantes y se hizo un ajuste del 20% por posibles pérdidas.

Procedimiento

El muestreo fue multietápico: en la primera etapa se aleatorizaron los colegios según el nivel económico; posteriormente, se realizó un muestreo aleatorio por conglomerados (salones de clase por colegio); por último, un muestreo por cuotas seleccionando a los adolescentes de 13 a 17 años de cada salón de clase seleccionado19.

Los estudiantes contestaron la escala y datos sociodemográficos en el salón de clase a manera de autoinforme. Luego se los invitó a asistir a una evaluación clínica por parte de un psiquiatra, quien aplicó la entrevista clínica estructurada para los trastornos del eje I del DSM-IV, versión clínica20. El entrevistador y el estudiante estaban enmascarados respecto al resultado de la escala CES-D. En la sala de espera para la entrevista clínica se aplicó nuevamente la escala para evaluar su reproducibilidad. La reaplicación se realizó entre 3 y 28 días. En caso de diagnosticarse algún trastorno mental se refería al adolescente al profesional idóneo.

Construcción de las versiones de la escala

Para escoger los componentes que formarían las nuevas versiones se fueron eliminando aquellos que tuviesen la menor correlación lineal de Pearson con respecto a la puntuación total de la escala. Esta medida muestra una relación importante con la «comunalidad» y el coeficiente de cada componente de una solución de factores; generalmente, los componentes que exhiben una baja correlación de Pearson presentan una pobre «comunalidad» y aportan muy poco a los factores21. La curva de las características de receptor operador (ROC) de cada versión se comparaba con la curva de la versión original mediante el método de Sidak22; si no era estadísticamente distinta, se procedía a eliminar el siguiente componente hasta que la diferencia fue significativa (p<0,05), lo cual se presentó con dos componentes, se adoptó así la versión ultracorta de tres componentes; además de la versión breve de diez componentes por las posibles desventajas anotadas en las versiones excesivamente cortas14,15.

Validación de las versiones

Para las dos versiones elegidas se determinó la consistencia interna mediante el coeficiente alfa de Cronbach. Para validar el constructo se inició con la aplicación de la prueba de la esfericidad de Bartlett para establecer las características de la matriz de los coeficientes. Para estimar la correlación de los componentes con el constructo explorado se realizó la prueba de adecuación de la muestra de Kayser-Meyer-Olkin. Se verificó un análisis de factores por el método de componentes principales y rotación Promax23. Se definieron como factores principales los que mostraron valores propios mayores de 1. La reproducibilidad de la prueba-reprueba se evaluó con el coeficiente de correlación de Lin.

Esquema general del estudio. Estudio de validación del cuestionario.

Se escogió el mejor punto de corte en las dos versiones con la curva ROC. Para este punto se calculó sensibilidad, especificidad, valores predictivos y razones de probabilidad, e intervalos de confianza (IC) del 95%. Los datos se procesaron en el paquete estadístico STATA 9.0.

Resultados

En el esquema general del estudio se detalla el flujograma de los participantes. Completaron la evaluación 217 (55,6%) mujeres y 173 (44,4%) varones. Las mujeres tenían mayor edad que los varones (15 años; IC del 95%, 14,9–15,2 frente a 14,5 años; IC del 95%, 14,3–14,7; p<0,001). El nivel socioeconómico informado era bajo en 133 (34,3%) estudiantes, medio en 227 (58,8%) y alto en 27 (6,9%). Un total de 45 estudiantes fueron diagnosticados de TDM durante la entrevista clínica (prevalencia del 11,5%; IC del 95%, 8,5–15,1). El TDM fue más frecuente en las mujeres, de los cursos superiores y con mayor edad (tabla 1).

Tabla 1.

Diferencias entre los adolescentes escolarizados con o sin trastorno depresivo mayor (TDM)

Variables	Sin TDM (n=345)	Con TDM (n=45)	p
Edad, media	14,7±1,2	15,4±1,3	0,001a
Varones	162 (47%)	11 (24,4%)	0,004b
Estrato socioeconómico			0,228c
Bajo	120 (34,8%)	13 (28,9%)
Medio	197 (57,1%)	31 (68,8%)
Alto	26 (7,6%)	1 (21,2%)
Colegio público	307 (90%)	44 (97,7%)	0,064c
Nivel educativo			0,004b
Básica secundaria	183 (53%)	13 (28,9%)
Media vocacional	162 (47%)	32 (71,1%)

a

Prueba de Mann-Whitney.

b

Prueba de la χ2.

c

Prueba exacta de Fisher.

En la tabla 2 se observan los índices de validez de criterio de las dos escalas con el punto de corte de 11 para la breve y 4 para la ultracorta; en la figura 1 se comparan la curvas ROC de las dos versiones con la original.

Tabla 2.

Índices de validez de criterio de las dos versiones de la escala CES-D en adolescentes

	Versión breve (10 ítems)		Versión ultracorta (3 ítems)
Índice	Valor	IC del 95%	Valor	IC del 95%
Eficiencia	74,6%	69,8%–78,8%	71,3%	66,4%–75,7%
Sensibilidad	78,8%	62,5%–88,3%	75,6%	60,1%–86,6%
Especificidad	74,1%	69,1%–78,6%	70,7%	65,5%–75,4%
VPP	28,5%	20,9%–37,4%	25,4%	18,4%–33,8%
VPN	96,2%	92,8%–98,1%	95,6%	92,1%–97,7%
RPP	3,01	2,37–3,81	2,58	2,04–3,26
RPN	0,30	0,17–0,52	0,35	0,21–0,58

IC: intervalo de confianza; RPN: razón de probabilidad negativa; RPP: razón de probabilidad positiva; VPN: valor predictivo negativo; VPP: valor predictivo positivo.

Figura 1.

Área bajo la curva ROC de la escala CES-D y las dos versiones validadas en adolescentes escolarizados.

(0.16MB).

La consistencia interna de la versión breve fue 0,86 y de la ultracorta, 0,76. La prueba de esfericidad de Bartlett fue significativa para la versión breve (χ2, 1.300,57; gl=45; p<0,001) y ultracorta (χ2, 300,40; gl=3; p<0,001). La prueba de adecuación de la muestra de Kaiser-Meyer-Olkin fue excelente en la versión breve (0,904) y buena en la ultracorta (0,688). Dos factores componen la versión breve y explican el 55,8% de la variancia. Para la versión ultracorta se identificó un factor que explica el 68,2% de la variancia. La solución y la matriz de factores se presentan en la tabla 3.

Tabla 3.

Matriz de factores con rotación promax de la versión breve y la ultracorta de la escala CES-D en adolescentes colombianos

Pregunta	Factores CES-D breve		Factor CES-D ultracorta
	Afecto depresivo	Afecto positivo	Afecto depresivo
3. Triste a pesar	0,66	0,122	NA
6. Depresión	0,658	0,187	0,844
9. Fracaso	0,653	0,066	NA
10. Nervios	0,765	0,3	NA
12. Felicidad	0,005	0,866	NA
14. Soledad	0,691	0,06	0,788
16. Disfrute	0,05	0,811	NA
17. Llanto	0,736	0,004	NA
18. Tristeza	0,671	0,181	0,844
20. No continúo	0,648	0,021	NA
Valor propio	4,536	1,049	2,045
Variancia (%)	45,35	10,46	68,19

El coeficiente de correlación de Lin fue 0,77 (IC del 95%, 0,73–0,81) para la versión breve y 0,74 (0,69–0,78) para la ultracorta.

Discusión

En este estudio se muestra que una versión breve en español de la escala CES-D tiene una adecuada validez de criterio, una excelente consistencia interna y una buena reproducibilidad para la detección del TDM en una muestra representativa de adolescentes escolarizados colombianos. La versión ultracorta conserva adecuada validez de criterio, buena consistencia interna y reproducibilidad, pero no preserva el constructo teórico de la CES-D original.

Las dos versiones abreviadas conservan los índices de validez de criterio de la versión original en adolescentes colombianos24. Desafortunadamente, ninguna versión presenta una sensibilidad mayor del 90%, ideal para escalas de cribado. Esto podría explicarse por la alta puntuación de síntomas transitorios, anímicos e interpersonales en adolescentes sin TDM, posiblemente similar a la puntuación de adolescentes con esta afección de grado leve25. Sin embargo, el cuestionario es útil en la medida que el análisis de la curva ROC es bueno, ya que áreas bajo esta curva por arriba de 0,75 indican que la capacidad diagnóstica de una prueba es apropiada26.

La sensibilidad de la CES-D en otros estudios poblacionales fue mejor o similar (del 60 al 90%) a la hallada en las dos versiones, al igual que la especificidad (del 73 al 94%). El valor predictivo positivo fue superior en esta muestra, lo cual se explica por la mayor prevalencia del TDM en los adolescentes estudiados17,27–30.

Se estima que el coeficiente alfa de Cronbach31 es bueno cuando se encuentra entre 0,70 y 0,90. En la versión breve estuvo por encima de 0,80, lo que indica una consistencia interna excelente, como la informada en otras poblaciones tanto de adultos como de adolescentes17,27–30,32. Sin embargo, en la versión ultracorta este coeficiente estuvo entre 0,7 y 0,8 que, aunque es bueno, indica una pérdida de fiabilidad.

La reproducibilidad prueba-reprueba fue buena para ambas versiones. Sin embargo, la aplicación de los 20 ítems en un solo momento limita la interpretación de esta medida, pues cada respuesta pudo estar sesgada por las respuestas anteriores.

La estructura factorial de la escala CES-D descrita inicialmente está compuesta por cuatro factores: afecto depresivo, afecto positivo, somático y relaciones interpersonales16. Sin embargo, esta estructura factorial no se mantiene en todas las poblaciones, pues en algunas desaparece el factor de relaciones interpersonales y en otra se fusionan el dominio de afecto depresivo y el somático12,17,33–35. La versión breve presenta un factor mixto de síntomas depresivos y somáticos y otro compuesto de dos ítems de los cuatro del componente afecto positivo original. De esta forma reproduce la estructura factorial hallada en algunas poblaciones con la versión original. La versión ultracorta tiene un solo factor con tres componentes del dominio afecto depresivo original, lo cual no preserva la estructura factorial de la CES-D original.

El personal sanitario de atención primaria es clave para establecer de forma precoz el estado mental de los adolescentes. La escasa disponibilidad de tiempo hace necesario investigar sobre métodos de cribado breves, como las versiones presentadas. Hay que recordar que tanto estas como otras escalas no deben ser consideradas nunca como pruebas diagnósticas, sino como métodos de cribado rápido y una ayuda para la clasificación de pacientes susceptibles de ser evaluados por un profesional de salud mental.

En conclusión, la escala breve y la ultracorta del CES-D son tan útiles como la original, aunque la ultracorta no preserva la estructura factorial de la original.

Lo conocido sobre el tema

•
El trastorno depresivo mayor es frecuente en adolescentes pero de difícil detección.
•
La escala CES-D se utiliza en adultos y adolescentes para el cribado del trastorno depresivo mayor.
•
Las escalas breves facilitan la concentración y reducen el tiempo de respuesta.

Qué aporta este estudio

•
Las versiones breve y ultracorta de la escala CES-D son tan útiles como la original en adolescentes escolarizados.
•
Se recomienda la utilización de la versión breve de la escala CES-D pues tiene similares propiedades psicométricas que la original.

Financiación

Trabajo financiado por el Centro de Investigaciones Biomédicas.

Bibliografía

[1]

D.M. Fergusson, L.J. Woodward.

Mental health, educational, and social role outcomes of adolescents with depression.

Arch Gen Psychiatry, 59 (2002), pp. 225-231

Indexada en:

Síguenos:

Suscribirse:

Suscríbase a la newsletter