Establecer la validez y la fiabilidad de dos versiones cortas de la escala para depresión del Centro de Estudios Epidemiológicos (CES-D) en adolescentes escolarizados colombianos.
DiseñoEstudio de validación.
EmplazamientoColegios de secundaria de Bucaramanga, Colombia.
ParticipantesSe seleccionó, en tres etapas, a 474 estudiantes, 68 no aceptaron, 8 fueron excluidos y 8 no completaron el proceso.
Mediciones principalesAplicación de manera independiente de la escala CES-D y la Entrevista Clínica Estructurada para los Trastornos del Eje I del DSM-IV (SCID-I), versión clínica. Se reaplicó la escala CES-D entre 3 y 28 días después. Se eliminaron los componentes con menor correlación lineal de Pearson con respecto a la puntuación total de la escala. Para la versión ultracorta de 3 componentes y la breve de 10 se calculó el índice alfa de Cronbach, el análisis de los factores, la curva ROC, la sensibilidad, la especificidad y el coeficiente de Lin.
ResultadosPara la escala breve el alfa de Cronbach fue 0,86 y el coeficientes de Lin, 0,77. El área bajo la curva ROC, 0,83; con sensibilidad del 77,8% y especificidad del 74,1%. Dos factores explicaron el 55,8% de la variancia. Para la escala ultracorta el alfa de Cronbach fue 0,76 y el coeficiente de Lin, 0,74. El área bajo la curva ROC fue 0,80, con una sensibilidad del 75,56% y una especificidad del 70,67%. Un factor explicó el 68,19% de la variancia.
ConclusionesLa escala breve y la ultracorta del CES-D son tan útiles como la original para el cribado del trastorno depresivo mayor en adolescentes, aunque la ultracorta no preserva la estructura factorial de la original.
To establish the validity and reliability of a Brief and Ultra-short Center for Epidemiological Studies Depression (CES-D) Scale in adolescents.
DesignValidation study.
SettingSecondary schools in Bucaramanga, Colombia.
ParticipantsA total of 474 students were selected through a three stage process; 68 did not agree to participate, 8 were excluded and 8 did not complete the process.
Main measurementsAdolescent students were evaluated with CES-D and the clinical interview for Diagnostic and Statistical Manual of Mental Disorders, Fourth Edition. The CES-D scale was re-applied 3 to 28 days after the first application. The ten items and the three items with the highest correlation with total score were selected to construct a Brief scale and Ultra-short scale, respectively. Construct validity, criterion validity, test-retest reliability and internal consistency were analyzed.
ResultsFor the Brief CES-D Scale the Cronbach's alpha was 0.86 and Lin's coefficient was 0.77. The area under ROC curve was 0.83, with a sensitivity of 77.8%; specificity 74.1%. Two main factors were identified to explain the 55.81% variance. For the Ultra-short Scale the Cronbach's alpha was 0.76 and Lin's coefficient was 0.74. The area under ROC curve was 0.80, with a sensitivity of 75.56%; specificity 70.67%. One main factor was identified to explain the 68.19% of variance.
ConclusionsThe Brief and Ultra-Short CES-D Scale are as useful as the original scale for the screening of MDD in adolescents; Ultra-short CES-D Scale does not preserve the original factorial structure.
El trastorno depresivo mayor (TDM) en adolescentes causa malestar clínico y en las relaciones, ausentismo escolar y bajo rendimiento1; aumenta el riesgo de abuso de sustancias, conductas antisociales, conductas riesgosas sexuales y en la alimentación, intentos suicidas y suicidios2–4. La prevalencia del TDM en adolescentes puede variar del 0,7 al 11%5–8.
El diagnóstico del TDM implica la realización de una entrevista por un profesional entrenado. Hay varias escalas para cribado que aumentan la probabilidad de realizar un diagnóstico temprano y pueden ser utilizadas en investigación con propiedades psicométricas similares entre sí9,10. La escala de la depresión del Centro de Estudios Epidemiológicos (CES-D) se ha utilizado para detección de síntomas depresivos en adolescentes, a pesar de diseñarse inicialmente para adultos, posee propiedades psicométricas similares a las escalas utilizadas en menores y tiene la ventaja que puede usarse sin restricción10,11. Se han propuesto versiones abreviadas con el objeto de reducir los problemas de fatiga y pérdida de atención que pueden ser mayores en este grupo de edad y naturalmente reduciría el tiempo de respuesta12,13. No obstante, las escalas breves tienen limitaciones psicométricas. Primero, es poco factible que abarquen con suficiencia un constructo complejo como el concepto de TDM14. Segundo, la fiabilidad podría reducirse si se compara con escalas más extensas15.
El objetivo de este estudio es establecer la validez y la fiabilidad de dos versiones cortas de la escala CES-D en adolescentes escolarizados colombianos.
Material y métodosEl estudio fue aprobado por el Comité de Ética en Investigación de la Facultad de Medicina de la Universidad Autónoma de Bucaramanga. Se solicitó el consentimiento informado por escrito de los padres y del estudiante.
InstrumentoLa escala CES-D es un instrumento tipo Likert de 0–3 puntos en la semana previa y está compuesta de 20 ítems autoadministrados. Cada pregunta cuantifica la frecuencia y la intensidad de los síntomas depresivos16. La versión utilizada se tradujo por el método back-translation y está descrito en otra publicación17.
Tamaño de muestraLa población objeto fueron los 68.000 adolescentes matriculados durante 2005 en colegios de secundaria de Bucaramanga, Colombia. El tamaño de la muestra se estimó bajo el supuesto de una prevalencia de TDM del 10%, sensibilidad del 80% y especificidad del 80%18. Para ello era necesaria una muestra de 370 estudiantes y se hizo un ajuste del 20% por posibles pérdidas.
ProcedimientoEl muestreo fue multietápico: en la primera etapa se aleatorizaron los colegios según el nivel económico; posteriormente, se realizó un muestreo aleatorio por conglomerados (salones de clase por colegio); por último, un muestreo por cuotas seleccionando a los adolescentes de 13 a 17 años de cada salón de clase seleccionado19.
Los estudiantes contestaron la escala y datos sociodemográficos en el salón de clase a manera de autoinforme. Luego se los invitó a asistir a una evaluación clínica por parte de un psiquiatra, quien aplicó la entrevista clínica estructurada para los trastornos del eje I del DSM-IV, versión clínica20. El entrevistador y el estudiante estaban enmascarados respecto al resultado de la escala CES-D. En la sala de espera para la entrevista clínica se aplicó nuevamente la escala para evaluar su reproducibilidad. La reaplicación se realizó entre 3 y 28 días. En caso de diagnosticarse algún trastorno mental se refería al adolescente al profesional idóneo.
Construcción de las versiones de la escalaPara escoger los componentes que formarían las nuevas versiones se fueron eliminando aquellos que tuviesen la menor correlación lineal de Pearson con respecto a la puntuación total de la escala. Esta medida muestra una relación importante con la «comunalidad» y el coeficiente de cada componente de una solución de factores; generalmente, los componentes que exhiben una baja correlación de Pearson presentan una pobre «comunalidad» y aportan muy poco a los factores21. La curva de las características de receptor operador (ROC) de cada versión se comparaba con la curva de la versión original mediante el método de Sidak22; si no era estadísticamente distinta, se procedía a eliminar el siguiente componente hasta que la diferencia fue significativa (p<0,05), lo cual se presentó con dos componentes, se adoptó así la versión ultracorta de tres componentes; además de la versión breve de diez componentes por las posibles desventajas anotadas en las versiones excesivamente cortas14,15.
Validación de las versionesPara las dos versiones elegidas se determinó la consistencia interna mediante el coeficiente alfa de Cronbach. Para validar el constructo se inició con la aplicación de la prueba de la esfericidad de Bartlett para establecer las características de la matriz de los coeficientes. Para estimar la correlación de los componentes con el constructo explorado se realizó la prueba de adecuación de la muestra de Kayser-Meyer-Olkin. Se verificó un análisis de factores por el método de componentes principales y rotación Promax23. Se definieron como factores principales los que mostraron valores propios mayores de 1. La reproducibilidad de la prueba-reprueba se evaluó con el coeficiente de correlación de Lin.
Esquema general del estudio. Estudio de validación del cuestionario.Se escogió el mejor punto de corte en las dos versiones con la curva ROC. Para este punto se calculó sensibilidad, especificidad, valores predictivos y razones de probabilidad, e intervalos de confianza (IC) del 95%. Los datos se procesaron en el paquete estadístico STATA 9.0.
ResultadosEn el esquema general del estudio se detalla el flujograma de los participantes. Completaron la evaluación 217 (55,6%) mujeres y 173 (44,4%) varones. Las mujeres tenían mayor edad que los varones (15 años; IC del 95%, 14,9–15,2 frente a 14,5 años; IC del 95%, 14,3–14,7; p<0,001). El nivel socioeconómico informado era bajo en 133 (34,3%) estudiantes, medio en 227 (58,8%) y alto en 27 (6,9%). Un total de 45 estudiantes fueron diagnosticados de TDM durante la entrevista clínica (prevalencia del 11,5%; IC del 95%, 8,5–15,1). El TDM fue más frecuente en las mujeres, de los cursos superiores y con mayor edad (tabla 1).
Diferencias entre los adolescentes escolarizados con o sin trastorno depresivo mayor (TDM)
Variables | Sin TDM (n=345) | Con TDM (n=45) | p |
Edad, media | 14,7±1,2 | 15,4±1,3 | 0,001a |
Varones | 162 (47%) | 11 (24,4%) | 0,004b |
Estrato socioeconómico | 0,228c | ||
Bajo | 120 (34,8%) | 13 (28,9%) | |
Medio | 197 (57,1%) | 31 (68,8%) | |
Alto | 26 (7,6%) | 1 (21,2%) | |
Colegio público | 307 (90%) | 44 (97,7%) | 0,064c |
Nivel educativo | 0,004b | ||
Básica secundaria | 183 (53%) | 13 (28,9%) | |
Media vocacional | 162 (47%) | 32 (71,1%) |
En la tabla 2 se observan los índices de validez de criterio de las dos escalas con el punto de corte de 11 para la breve y 4 para la ultracorta; en la figura 1 se comparan la curvas ROC de las dos versiones con la original.
Índices de validez de criterio de las dos versiones de la escala CES-D en adolescentes
Versión breve (10 ítems) | Versión ultracorta (3 ítems) | |||
Índice | Valor | IC del 95% | Valor | IC del 95% |
Eficiencia | 74,6% | 69,8%–78,8% | 71,3% | 66,4%–75,7% |
Sensibilidad | 78,8% | 62,5%–88,3% | 75,6% | 60,1%–86,6% |
Especificidad | 74,1% | 69,1%–78,6% | 70,7% | 65,5%–75,4% |
VPP | 28,5% | 20,9%–37,4% | 25,4% | 18,4%–33,8% |
VPN | 96,2% | 92,8%–98,1% | 95,6% | 92,1%–97,7% |
RPP | 3,01 | 2,37–3,81 | 2,58 | 2,04–3,26 |
RPN | 0,30 | 0,17–0,52 | 0,35 | 0,21–0,58 |
IC: intervalo de confianza; RPN: razón de probabilidad negativa; RPP: razón de probabilidad positiva; VPN: valor predictivo negativo; VPP: valor predictivo positivo.
La consistencia interna de la versión breve fue 0,86 y de la ultracorta, 0,76. La prueba de esfericidad de Bartlett fue significativa para la versión breve (χ2, 1.300,57; gl=45; p<0,001) y ultracorta (χ2, 300,40; gl=3; p<0,001). La prueba de adecuación de la muestra de Kaiser-Meyer-Olkin fue excelente en la versión breve (0,904) y buena en la ultracorta (0,688). Dos factores componen la versión breve y explican el 55,8% de la variancia. Para la versión ultracorta se identificó un factor que explica el 68,2% de la variancia. La solución y la matriz de factores se presentan en la tabla 3.
Matriz de factores con rotación promax de la versión breve y la ultracorta de la escala CES-D en adolescentes colombianos
Pregunta | Factores CES-D breve | Factor CES-D ultracorta | |
Afecto depresivo | Afecto positivo | Afecto depresivo | |
3. Triste a pesar | 0,66 | 0,122 | NA |
6. Depresión | 0,658 | 0,187 | 0,844 |
9. Fracaso | 0,653 | 0,066 | NA |
10. Nervios | 0,765 | 0,3 | NA |
12. Felicidad | 0,005 | 0,866 | NA |
14. Soledad | 0,691 | 0,06 | 0,788 |
16. Disfrute | 0,05 | 0,811 | NA |
17. Llanto | 0,736 | 0,004 | NA |
18. Tristeza | 0,671 | 0,181 | 0,844 |
20. No continúo | 0,648 | 0,021 | NA |
Valor propio | 4,536 | 1,049 | 2,045 |
Variancia (%) | 45,35 | 10,46 | 68,19 |
El coeficiente de correlación de Lin fue 0,77 (IC del 95%, 0,73–0,81) para la versión breve y 0,74 (0,69–0,78) para la ultracorta.
DiscusiónEn este estudio se muestra que una versión breve en español de la escala CES-D tiene una adecuada validez de criterio, una excelente consistencia interna y una buena reproducibilidad para la detección del TDM en una muestra representativa de adolescentes escolarizados colombianos. La versión ultracorta conserva adecuada validez de criterio, buena consistencia interna y reproducibilidad, pero no preserva el constructo teórico de la CES-D original.
Las dos versiones abreviadas conservan los índices de validez de criterio de la versión original en adolescentes colombianos24. Desafortunadamente, ninguna versión presenta una sensibilidad mayor del 90%, ideal para escalas de cribado. Esto podría explicarse por la alta puntuación de síntomas transitorios, anímicos e interpersonales en adolescentes sin TDM, posiblemente similar a la puntuación de adolescentes con esta afección de grado leve25. Sin embargo, el cuestionario es útil en la medida que el análisis de la curva ROC es bueno, ya que áreas bajo esta curva por arriba de 0,75 indican que la capacidad diagnóstica de una prueba es apropiada26.
La sensibilidad de la CES-D en otros estudios poblacionales fue mejor o similar (del 60 al 90%) a la hallada en las dos versiones, al igual que la especificidad (del 73 al 94%). El valor predictivo positivo fue superior en esta muestra, lo cual se explica por la mayor prevalencia del TDM en los adolescentes estudiados17,27–30.
Se estima que el coeficiente alfa de Cronbach31 es bueno cuando se encuentra entre 0,70 y 0,90. En la versión breve estuvo por encima de 0,80, lo que indica una consistencia interna excelente, como la informada en otras poblaciones tanto de adultos como de adolescentes17,27–30,32. Sin embargo, en la versión ultracorta este coeficiente estuvo entre 0,7 y 0,8 que, aunque es bueno, indica una pérdida de fiabilidad.
La reproducibilidad prueba-reprueba fue buena para ambas versiones. Sin embargo, la aplicación de los 20 ítems en un solo momento limita la interpretación de esta medida, pues cada respuesta pudo estar sesgada por las respuestas anteriores.
La estructura factorial de la escala CES-D descrita inicialmente está compuesta por cuatro factores: afecto depresivo, afecto positivo, somático y relaciones interpersonales16. Sin embargo, esta estructura factorial no se mantiene en todas las poblaciones, pues en algunas desaparece el factor de relaciones interpersonales y en otra se fusionan el dominio de afecto depresivo y el somático12,17,33–35. La versión breve presenta un factor mixto de síntomas depresivos y somáticos y otro compuesto de dos ítems de los cuatro del componente afecto positivo original. De esta forma reproduce la estructura factorial hallada en algunas poblaciones con la versión original. La versión ultracorta tiene un solo factor con tres componentes del dominio afecto depresivo original, lo cual no preserva la estructura factorial de la CES-D original.
El personal sanitario de atención primaria es clave para establecer de forma precoz el estado mental de los adolescentes. La escasa disponibilidad de tiempo hace necesario investigar sobre métodos de cribado breves, como las versiones presentadas. Hay que recordar que tanto estas como otras escalas no deben ser consideradas nunca como pruebas diagnósticas, sino como métodos de cribado rápido y una ayuda para la clasificación de pacientes susceptibles de ser evaluados por un profesional de salud mental.
En conclusión, la escala breve y la ultracorta del CES-D son tan útiles como la original, aunque la ultracorta no preserva la estructura factorial de la original.
- •
El trastorno depresivo mayor es frecuente en adolescentes pero de difícil detección.
- •
La escala CES-D se utiliza en adultos y adolescentes para el cribado del trastorno depresivo mayor.
- •
Las escalas breves facilitan la concentración y reducen el tiempo de respuesta.
- •
Las versiones breve y ultracorta de la escala CES-D son tan útiles como la original en adolescentes escolarizados.
- •
Se recomienda la utilización de la versión breve de la escala CES-D pues tiene similares propiedades psicométricas que la original.
Trabajo financiado por el Centro de Investigaciones Biomédicas.