5-question versions): GDS-1: S: 71.1% (61.7-80.4), E: 74.1% (67.3-80.9), AUC: 0.726 (0.659-0.793), CC: 0.679 (0.673-0.684). GDS-4: S: 73.3% (64.2-82.4), E: 77.7% (71.2-84.2), AUC: 0.821 (0.765-0.876), CC: 0.803 (0.754-0.852). GDS-5: S: 81.1% (73.1-89.1), E: 73.2% (66.3-80.1), AUC: 0.833 (0.789-0.887), CC: 0.866 (0.824-0.908). Conclusions. The sensitivity and specificity results are similar to results of other ultra-short GDS studies. The high reliability of these ultra-short versions leads us to recommend that new studies be run to enable these versions to be consolidated as a valid and very rapid option for diagnosing depression among the elderly.
Introducción
Se ha establecido que los trastornos depresivos afectan a cerca del 10% de los ancianos que viven en la comunidad y al 15-35% de los que viven en residencias, por lo que constituye un importante problema de salud1-4. Aunque hay múltiples instrumentos de evaluación de los trastornos mentales5 que pueden facilitar la identificación de casos o probables casos de depresión, la mayoría de las escalas y recomendaciones de entrevista para el estudio de la depresión5-8 no deberían ser aplicadas en los ancianos porque no están adaptadas para ellos, lo que puede favorecer que se detecte un excesivo número de falsos positivos1,2.
La Geriatric Depression Scale de Yesavage (GDS)9,10 es la escala recomendada por la Sociedad Española de Medicina Familiar y Comunitaria11 para su utilización en la población mayor. Inicialmente se diseñó una escala autoaplicable de 30 preguntas con respuestas dicotómicas (sí/no), con una elevada sensibilidad (S) y especificidad (E) (S del 84% y E del 95%)9,10,12,13 y una buena correlación con otras escalas clásicas utilizadas para el cribado de la depresión14. Se han realizado distintas validaciones al castellano de esta escala15,16.
Sheikh y Yesavage17 propusieron una versión abreviada de la GDS formada por 15 preguntas (10 positivas y 5 negativas) que sólo requiere 5-7 min para ser completada, con el objeto de reducir los problemas de fatiga y pérdida de atención que se suelen presentar en este grupo de edad, y más en los casos con algún grado de alteración cognitiva. Aunque algunos autores han encontrado una correlación positiva, pero insuficiente, entre la versión corta y la larga (r = 0,66)18, en otros trabajos, la correlación encontrada fue > 0,80 y con datos de sensibilidad y especificidad equiparables entre las 2 versiones19. Recientemente se ha publicado la validación de esta versión al castellano20.
Varios autores han propuesto escalas aún más cortas, basadas en la GDS abreviada21-27, que cuentan con 10, 5, 4 o incluso con tan sólo 1 pregunta. De cualquier forma, la mayoría de los autores establece que, pese a las buenas perspectivas de estas versiones, se precisan estudios más amplios para poder recomendar el uso generalizado de estas escalas «ultracortas».
En nuestro medio no se ha realizado ningún estudio de validación de escalas ultracortas basadas en la GDS. Este trabajo tiene como objetivo realizar una aproximación a la validez que podrían presentar en nuestro medio distintas versiones ultracortas de la GDS, para el cribado de depresión en población > 65 años.
Participantes y métodos
Participantes
Se ha trabajado con datos de la población seleccionada en el trabajo de validación de la GDS-1520, donde se captó a 280 sujetos > 65 años que acudieron a las consultas del Centro de Salud de Azahara (Córdoba), tuvieran o no un diagnóstico previo de depresión, para alcanzar un número de 250 personas incluidas (intervalo de confianza [IC] del 95%, * = 0,05, prevalencia estimada de depresión del 10% y sensibilidad estimada del cuestionario de un 80%). A todos los candidatos se les informó sobre el objetivo del estudio para que decidieran si deseaban participar en él. Se excluyó a los pacientes con alguna alteración psiquiátrica grave no depresiva y a las personas con déficit motores y/o sensoriales severos que impidiesen la evaluación prevista.
Métodos
El médico o la enfermera rellenaron el GDS de 15 preguntas, objeto de la validación inicial, de todos los pacientes.
Posteriormente, a ciegas y con independencia de la puntuación obtenida en el GDS-15, se realizó un examen clínico y neuropsicológico protocolizado a todos los sujetos del estudio para establecer el diagnóstico de depresión, el cual constituyó el patrón de referencia. Esta evaluación fue realizada por 2 psiquiatras y 3 médicos de familia previamente entrenados; los médicos de familia fueron supervisados por los 2 psiquiatras. Antes del inicio del estudio se realizaron sesiones conjuntas con los médicos evaluadores, en las que se analizó a distintos pacientes con el fin de homogeneizar los criterios diagnósticos. Posteriormente, se realizaron 20 grabaciones en vídeo de entrevistas reales para medir la concordancia interobservador de los 5 médicos evaluadores, que alcanzó un índice kappa ponderado de 0,83. Este estudio constaba de los siguientes apartados:
Para la valoración de la depresión: cuestionario semiestructurado para detectar síntomas depresivos y la escala de Montgomery-Asberg28.
Para la valoración del estado cognitivo: estudio neuropsicológico basado en el protocolo para el diagnóstico de demencia de la Sociedad Española de Neurología29 y los cuestionarios de Pfeiffer30 en su versión española (SPMSQ-VE)31, el Mini-examen cognoscitivo de Lobo (MEC)32,33 y el test del informador en su versión española (IQCODE-VE)34.
Para la valoración de las actividades de la vida diaria, básicas e instrumentales, se utilizaron las preguntas correspondientes de la escala OARS-MFAQ (Older Americans Resources and Services Multidimensional Functional Assessment Questionnaire) en su versión española35.
Con toda esta información se establecieron los diagnósticos de depresión, demencia, ausencia de sintomatología psicopatológica o duda diagnóstica siguiendo los criterios de la Clasificación Internacional de Enfermedades (CIE-10)36. Una vez iniciada la recogida de datos, cuando hubo alguna duda sobre la presencia o no de depresión, el caso fue discutido entre el grupo evaluador, estableciéndose posteriormente el diagnóstico final.
Se consideró como «caso» a cualquier sujeto con diagnóstico clínico de depresión según los criterios de la CIE-10, con independencia del tipo y el grado de severidad de ésta.
Se procedió a realizar la adaptación transcultural y la validación del GDS-15, siguiendo los pasos clásicamente establecidos37-39, tras haber publicado los resultados con anterioridad20 (versión validada: anexo 1).
Para analizar la fiabilidad interobservador, 2 observadores distintos, de forma independiente y en el mismo momento, evaluaron a 30 sujetos con el GDS-VE. Para establecer la fiabilidad intraobservador, 50 sujetos fueron citados a los 7-10 días de la primera evaluación para aplicarles de nuevo el cuestionario, lo que fue realizado por el mismo profesional.
Se han realizado distintas agrupaciones de preguntas según la mayor capacidad diagnóstica de cada una de ellas, obtenida mediante la curva ROC y la bibliografía disponible sobre versiones ultracortas del GDS.
Con posterioridad se ha calculado la fiabilidad y validez de cada versión ultracorta tomando como referencia el patrón propuesto (diagnóstico establecido según los criterios de la CIE-10 anteriormente comentado), y se han seleccionado las versiones con mejores resultados de fiabilidad y validez.
Análisis de datos
Se realizó un análisis descriptivo de las características sociodemográficas y de los diagnósticos mediante la determinación de las medidas de tendencia central y distribución de frecuencias, y se calcularon los IC para un 95% de seguridad. La asociación entre variables cualitativas se obtuvo mediante el test de la *2.
Mediante el cálculo del índice kappa ponderado de Cohen (debido a que la puntuación del cuestionario no seguía una distribución normal) se evaluó la fiabilidad interobservador e intraobservador. Para valorar la fiabilidad de los cuestionarios se analizó la consistencia interna a través del estadístico de Kuder-Richarson-20 (KR-20).
Se examinó la validez convergente mediante la valoración de la correlación entre cada una de las versiones ultracortas y la GDS-15 mediante el cálculo del coeficiente de correlación de Spearman.
Para establecer la validez de criterio (grado en que los resultados de cada una de las versiones se correlaciona con el diagnóstico de depresión según los criterios de la CIE-10) se calcularon la sensibilidad, la especificidad y las razones de máxima verosimilitud para los resultados positivo y negativo, o razones de probabilidad positiva (RPP) y negativa (RPN), así como el porcentaje de casos mal clasificados (falsos positivos o negativos). La capacidad discriminativa de cada versión, para diferenciar a los sujetos sanos de los que tenían depresión, se analizó mediante el cálculo del área bajo la curva ROC (receiver operating characteristic) que, igualmente, permitió establecer el punto de corte más favorable en cada escala.
Resultados
Se captó a 280 sujetos, de los cuales 249 finalizaron el estudio. Las pérdidas fueron, en 23 casos, por rechazo a acudir a la segunda parte del estudio, en 5 por presentar demencia grave y en otros 3 por diversas causas (dificultades de comprensión, fallecimiento e ingreso en una residencia). La media de edad ± desviación estándar (DE) fue de 74,3 ± 6,5 años (rango, 65-100) y el 67,5% eran mujeres. El 44,2% estaba casado y el 37,8% era viudo; el 72,7% residía en su propio domicilio. El 65% era analfabeto o tan sólo sabía leer y escribir (tabla 1). En 90 casos (36,1%) se estableció el diagnóstico de depresión tras la entrevista psiquiátrica.
En la tabla 2 se muestra la capacidad discriminativa individual de cada una de las preguntas del GDS-15. Se ha podido observar que las preguntas 3 y 4 son las que obtienen una mayor área bajo la curva (0,726 y 0,697, respectivamente) y las que tienen un área menor son las preguntas 9 y 11. Como se ha comentado en el apartado anterior, según estos resultados y la bibliografía disponible, se seleccionaron grupos de preguntas de las que, finalmente, se analizan 3 versiones ultracortas del GDS, al haber obtenido los mejores datos de validez:
GDS-1, que corresponde a la pregunta número 3.
GDS-4, que corresponde a las preguntas 3, 4, 5 y 8.
GDS-5, que corresponde a las preguntas 3, 4, 5, 8 y 13.
En cuanto a la fiabilidad intraobservador, el índice kappa obtenido con el GDS-5 fue de 0,828 (desviación típica [DT] = 0,082), para el GDS-4 de 0,863 (DT = 0,076) y para el GDS-1 de 0,904 (DT = 0,066). La fiabilidad interobservador fue para el GDS-5 de 0,680 (DT = 0,146), para el GDS-4 de 0,751 (DT = 0,135) y para el GDS-1 de 0,731 (DT = 0,145).
En las figuras 1-3 se pueden observar las curvas ROC obtenidas para cada una de las versiones. Tanto en la versión GDS-4 como en la GDS-5, el punto de corte con mayor área bajo la curva se sitúa en 2 o más puntos.
Como se puede observar en la tabla 3, no hubo diferencias en los resultados de sensibilidad ni especificidad de las versiones analizadas.
Discusión
La enfermedad depresiva en el paciente anciano presenta una prevalencia e incidencia elevadas y representa una importante carga de malestar para el paciente, la familia y las instituciones donde reside. Las características con las que se presenta la enfermedad en este grupo de edad hacen que sea poco diagnosticada y tratada40. En estudios longitudinales se ha comprobado que la presencia de síntomas depresivos en los ancianos se asocia con incrementos en el número de visitas al médico, el uso de fármacos, la utilización de servicios de urgencias y los costes globales como pacientes ambulatorios41,42.
El personal sanitario de atención primaria es un elemento clave para establecer de forma precoz el estado mental de las personas mayores, tanto desde el punto de vista afectivo como cognitivo43. La escasa disponibilidad de tiempo en las consultas hace necesario investigar sobre métodos de cribado breves y sencillos, como los cuestionarios ultracortos que se analizan. Hay que recordar que tanto éstos como otros cuestionarios no deben ser considerados nunca como pruebas diagnósticas, sino como métodos de cribado rápido y, en todo caso, como una ayuda para la clasificación de pacientes susceptibles de ser evaluados con criterios más fiables.
Con respecto a los sujetos incluidos, el elevado porcentaje de personas analfabetas o sin ningún nivel de escolarización, que alcanzó el 65%, no difiere mucho de los datos del nivel de escolarización de la población mayor de nuestro entorno44-46. Este dato fue el que nos inclinó a no utilizar la escala de forma autoaplicada, asumiendo las ventajas e inconvenientes que esto puede tener47. El hecho de realizar las preguntas a los sujetos puede introducir un sesgo de interpretación y variación/explicación del enunciado en caso de dudas, pero en más de la mitad de los casos no había alternativas, dado el nivel cultural comentado.
La GDS es probablemente el cuestionario para el cribado de la depresión en personas mayores más utilizado en el ámbito internacional. Tras la publicación de la versión inicial de 30 preguntas se publicó la versión corta de 15. Con posterioridad se han publicado versiones ultracortas con resultados muy variables de validez, probablemente debido a la utilización de una metodología diferente y distintos patrones de referencia (tabla 4).
Hoyl et al22 han validado una versión de 5 preguntas (sólo 2 de ellas coinciden con las preguntas incluidas en alguna de las versiones aquí analizadas) y han obtenido una sensibilidad del 97% y una especificidad del 85%, superior en ambos casos a las encontradas en este trabajo. En nuestro estudio, esta misma combinación de preguntas obtuvo unos escasos resultados de fiabilidad. Otros autores23,24,26,27 con versiones de 4 preguntas obtienen sensibilidades que oscilan entre el 89 y el 69%, y especificidades ente el 65 y el 90%, similares a las de la GDS-4 de este estudio.
La pregunta número 3 (¿siente que su vida está vacía?) que conforma la versión GDS-1 ha sido anteriormente propuesta como pregunta única para detectar de forma simple síntomas de depresión23, obteniendo datos de validez (sensibilidad del 59% y especificidad del 75%) algo peores a los de este estudio.
En el futuro, las escalas ultracortas pueden ser unas herramientas útiles para su utilización habitual en las consultas médicas y de enfermería en atención primaria para la detección de posibles trastornos depresivos en la población anciana. De cualquier forma, se necesitarán estudios más precisos y específicos de validación que establezcan de forma más fidedigna la capacidad psicométrica de estas versiones ultracortas.
Agradecimientos
Personal de enfermería: M.ª Mar Ortiz, R. Sierra, D. Álvarez,
I. Enciso y M. Pérez-Barrios.
Personal médico: J. Espejo, M. Muñoz, A. Yun, M.J. Fernández, N. Lora.
A todos los profesionales del Centro de Salud de Azahara y a los pacientes que aceptaron participar en este estudio.