La prueba del reloj (PR) es una prueba de evaluación de cribado para deterioro cognitivo ampliamente difundida en la práctica clínica. Existen varios métodos de puntuación. En nuestro medio utilizamos el desarrollado por Cacho et al en 1999. El objetivo del trabajo es evaluar la reproducibilidad interevaluadores y la consistencia interna de la PR a la orden de pacientes que son derivados para evaluación de deterioro cognitivo utilizando el método de puntuación de Cacho, y analizar variables predictivas del resultado.
Material y métodosDos evaluadores entrenados ciegos entre sí y de otras evaluaciones y diagnósticos efectuados, valoraron los dibujos de reloj de 985 pacientes mediante el método de Cacho. Con los resultados y los datos de las historias clínicas se confeccionó una base de datos. Se utilizó el coeficiente kappa ponderado para evaluar la reproducibilidad interevaluadores y alfa de Cronbach para la consistencia interna. Se analizó la relación entre la puntuación del reloj con el sexo, la edad y los años de educación.
ResultadosLa mediana del resultado de la PR de ambos evaluadores fue de 7. Se obtuvo un coeficiente kappa ponderado elevado (0,87 [95% IC 0,80-0,93]). La consistencia interna resultó regular en las pruebas realizadas por ambos observadores. La edad y la educación tendrían una correlación estadísticamente significativa pero de regular y escasa magnitud, negativa y positiva respectivamente.
ConclusionesLa reproducibilidad interevaluador fue similar a la de otros métodos de puntuación de la PR. La consistencia interna es menor que la observada por el autor original. La edad y los años de educación se correlacionan con los resultados de la prueba.
Clock drawing test (CDT) is a screening test for cognitive impairment widely used in clinical practice. There are several scoring methods. We use the one developed by Cacho et al in 1999. The objective was to evaluate the reproducibility and internal consistency of the CDT of patients referred for evaluation of cognitive impairment using the score method and to analyze predictors variables of the result.
MethodsTwo trained raters blind to each other and other assessments and diagnostics, valued clock drawings of 985 patients by Cacho's method. With the results and data from hospital records a database was made. We used the weighted kappa coefficient to evaluate inter-rater reproducibility and Cronbach's alpha for internal consistency. We analyzed the relationship between the CDT results with gender, age and education.
ResultsThe median result of CDT of both evaluators was 7. We obtained a high weighted kappa coefficient (0.87 [95% CI 0.80 to 0.93]). Internal consistency was regular for both observers. Age and education have a statistically significant correlation but regular and small in magnitude, negative and positive respectively.
ConclusionsThe reproducibility was similar to other scoring method. The internal consistency is lower than that observed by the original author. Age and years of education are correlated with test results.
La prueba del reloj (PR) es ampliamente usada en la clínica diaria como técnica de cribado para evaluar el déficit cognitivo conjuntamente con otros test como la mini prueba del estado mental (MMSE) de Folstein o la escala de Blessed de concentración, atención y memoria1,2. La MMSE está ampliamente difundida pero es un test verbal y evalúa fundamentalmente la memoria. Se sabe también que la MMSE puede ser deficiente para detectar deterioro cognitivo leve (DCL) o disfunción ejecutiva, por lo que sería insuficiente como única técnica de cribado1–4.
La PR es un método rápido, de fácil aplicación en la práctica clínica incluso por parte de médicos en el primer nivel. Permite evaluar la memoria, la comprensión verbal, las facultades visuoespaciales, la planificación, el pensamiento abstracto y la concentración1–3.
Se han desarrollado varios métodos de puntuación en diferentes países y con diferentes pacientes; como por ejemplo: Mendez5, Sunderland1,6, Roleau1,7, etc., pudiéndose evaluar a la copia y a la orden.
En nuestro medio utilizamos el desarrollado por Cacho et al en 19998. Se desarrolló a partir de los criterios de Sunderland6 con la normas de la escala revisada por Roleau7 en 1992. En el estudio de Cacho se seleccionaron pacientes con diagnóstico clínico de enfermedad de Alzheimer mediante DSM-IV y NINCDS-ADRDA estadificados como demencia leve acorde a la escala CDR, apareados con sujetos normales.
La PR a la orden se puntúa en una escala del 0 al 10 puntos, evaluándose el dibujo de la esfera (0–2 puntos), las agujas (0–4 puntos) y los números (0–4 puntos). Para un punto de corte 6 mostró un 92,8% de sensibilidad y un 93,4% de especificidad8.
En el trabajo original no se evalúa la reproducibilidad entre observadores sino que se realiza un análisis de varianza de medidas repetidas destinada a probar hipótesis alternativas de diferencia entre observadores. Se sabe que este método, útil para rechazar hipótesis de nula diferencia, no es útil para probar la ausencia de ella, pues basta una muestra pequeña para obtener un resultado estadísticamente no significativo (error beta). Para probar la reproducibilidad entre observadores deben utilizarse pruebas como la de kappa o el coeficiente de correlación intraclase9.
El objetivo primario del trabajo es obtener la reproducibilidad entre las puntuaciones de reloj de pacientes que fueron derivados para evaluación de deterioro cognitivo, calificados por el método de Cacho, por dos evaluadores independientes ciegos entre sí y respecto a otras evaluaciones y diagnósticos de dichos pacientes.
Por otro lado, como en la evaluación de la consistencia interna mediante la técnica alfa de Cronbach el autor expresa que lo realiza estudiando “la correlación de cada ítem con la suma de los mismos”, considerando más adecuado que la correlación interna debe efectuarse correlacionando los distintos ítems entre sí (y no con el total), consideramos como objetivo secundario la evaluación de este aspecto con nuestros datos.
El objetivo terciario es evaluar si variables como la edad, el sexo y los años de educación se correlacionan con la puntuación de la PR.
Material y métodosEl estudio se llevó a cabo en el SATE (Servicio de Atención a la Tercera Edad) del Hospital Privado de Comunidad, centro que se dedica a la evaluación, la contención y el tratamiento de pacientes con trastornos de memoria y en el que se trabaja con médicos geriatras, residentes de neurología, fonoaudiólogos, terapistas ocupacionales y kinesiólogos. Los pacientes son derivados por médicos de cabecera, médicos clínicos o neurólogos para su evaluación. Los pacientes realizan una evaluación clínica, neurológica y neuropsicológica de cuyo consenso se obtiene una estadificación y el diagnóstico final.
Retrospectivamente se tomaron 985 evaluaciones de pacientes realizadas en los últimos 10 años. Personal administrativo realizó fotocopias de los dibujos de la PR a la orden de las respectivas historias (fig. 1), colocándole sólo el número de historia. Un grupo de investigadores recopiló de las historias clínicas los datos correspondientes a la edad en el momento de la evaluación, el sexo, los años de educación y las puntuaciones de escala de deterioro global (GDS), el índice clínico de demencia (CDR) y la MMSE, y la estadificación final, volcándolos en una base de datos.
Dos evaluadores (E1 y E2, con entrenamiento previo), ciegos entre sí y de los restantes resultados, re-puntuaron por el método de Cacho los relojes fotocopiados de las historias clínicas. Una vez finalizado el proceso, se volcó la información en la base de datos mencionada. Se realizó estadística descriptiva. Se obtuvo el coeficiente kappa ponderado a partir de los valores totales de cada prueba para analizar la concordancia entre los dos observadores. Se analizó la consistencia interna mediante el coeficiente alfa de Cronbach para cada evaluador por separado, correlacionando los tres ítems (esfera, agujas y números). Se analizó también la consistencia interna de la prueba en ambos evaluadores por separado con el subgrupo de pacientes con CDR=1 (a efectos de comparar los resultados con los publicados por Cacho).
Se obtuvo el promedio de los totales de ambos observadores. Se compararon los totales de las pruebas de ambos sexos mediante la prueba U de Mann–Whitney. Se correlacionaron los totales promediados de ambos evaluadores con las edades y con los años de educación mediante la prueba de Spearman. Se realizó un análisis multivariable mediante regresión lineal múltiple, considerando variables independientes la edad y los años de educación y el total promediado de la PR como dependiente (se incluyeron sólo estas dos variables, pues ambas tenían una p<0,20 en el bivariable).
Finalmente se correlacionó (Spearman) el promedio de las puntuaciones del reloj de ambos evaluadores con los resultados del CDR, la GDS y la MMSE y con la estadificación final. Para esto último se asignó un valor a cada uno de los diferentes estadios en orden creciente (a mayor severidad, mayor número). A pesar que originalmente los evaluadores que realizaron estas últimas pruebas no estaban cegados del resultado de la PR original, lo que puede constituir un sesgo, decidimos incluir estos datos en este trabajo debido a que no encontramos publicada en la bibliografía trabajos sobre correlación de dichas pruebas con PR puntuadas mediante el método de Cacho.
Se consideró estadísticamente significativa una p2α<0,05. Se utilizó el programa estadístico StatsDirect (versión 2.7.2).
ResultadosLos datos de los 985 pacientes se presentan en tabla 1.
Datos del total de pacientes
Número de relojes 985 (947 pacientes) | ||
Sexo | 68% | Mujeres |
Edad | 77a | (88–71)b |
Educación (años) | 7a | (12–5)b |
GDS | 3a | (4–3)b |
CDR | 0,5a | (1–0,5)b |
MMSE | 24a | (27–20)b |
Reloj evaluador 1 | 7a | (8–5)b |
Reloj evaluador 2 | 7a | (8–4,5)b |
Diagnósticos | n | Puntuación |
Normales | 10 | 8,3a (10–6,5)b |
Normales-DCAE | 4 | 8a (9–7,6)b |
DCAE | 40 | 8,6a (9,75-7)b |
DCAE-DCL | 32 | 8a (9,1-7)b |
DCL | 348 | 7,75a (8,75-6,25)b |
DCL-DML | 101 | 7,5a (8–5,5)b |
DCL-DL | 11 | 8a (8–7,5)b |
DML | 231 | 5,75 (7,5-3,75)b |
DML-DL | 17 | 5a (4,5-3,75)b |
DL | 149 | 6,5a (8,25-4,5)b |
DL-DM | 2 | 5,5a (9,5-1,5)b |
DM | 8 | 2,75a (4,25-2)b |
Sin diagnóstico | 32 | 5,5a (7,65-3)b |
CDR: índice clínico de demencia; DCAE: declinación cognitiva asociada a la edad: DCL: deterioro cognitivo leve; DL: demencia leve; DM: demencia moderada-severa; DML: demencia muy leve; GDS: escala de deterioro global; MMSE: mini prueba del estado mental.
La concordancia más allá del azar entre los dos evaluadores resultó elevada (>0,80). La consistencia interna de las evaluaciones fue regular en ambos evaluadores, con una mínima diferencia entre ambos (0,57 y 0,49, respectivamente) (tabla 2).
La consistencia interna de los pacientes del subgrupo con CDR=1 (217 pacientes) fue de 0,49 y 0,61 en cada evaluador (límite inferior del intervalo de confianza del 95% de 0,39 y 0,53, respectivamente).
No se encontraron diferencias estadísticamente significativa entre ambos sexos (p2α=0,41).
La edad y los años de educación tuvieron una correlación estadísticamente significativa (p2α<0,001) pero de regular y escasa magnitud, negativa y positiva respectivamente (Rho = −0,3 y 0,22) (tabla 3).
La PR promediada entre los dos observadores tuvo una moderada correlación positiva con la MMSE de Folstein. La correlación con la estadificación CDR y GDS fue negativa, de baja y moderada magnitud, respectivamente. Finalmente, también se observó moderada correlación negativa con la estadificación final (tabla 4).
Correlación de Spearman entre resultados de reloj: test de evaluación de demencia y estadificación final
MMSE | 0,53 (95% IC 0,48 a 0,57)a |
CDR | −0,36 (95% IC −0,41 a −0,3)a |
GDS | -0,4 (95% IC −0,49 a −0,39)a |
Estadificación final | -0,49 (95% IC −0,5 a −0,44)a |
CDR: índice clínico de demencia; GDS: escala de deterioro global; MMSE: mini prueba del estado mental.
En los últimos años hemos asistido a un auge en la utilización de la PR en la práctica clínica diaria. En el trabajo original de Cacho et al8 se estudiaron 56 pacientes con diagnóstico de enfermedad de Alzheimer. En nuestro trabajo se tomaron las evaluaciones de pacientes derivados por deterioro cognitivo independientemente de la etiología, con el fin de evaluar la PR en este tipo de población. En el trabajo original se evaluó la concordancia entre tres evaluadores mediante un análisis de varianza9. En nuestro análisis obtuvimos un coeficiente kappa ponderado elevado.
En un trabajo realizado en 2010 por Nair et al10, en donde se analizó la reproducibilidad interevaluadores utilizando un método cualitativo, obtuvieron un coeficiente kappa de 0,85. En un estudio de 2008 a cargo de Hubbard et al11 se evaluó la reproducibilidad mediante coeficiente de correlación intraclase por diferentes métodos de puntuación, obteniéndose los siguientes resultados: Freund 0,801; Mendez 0,951,5; Cahn 0,911,12. En otro estudio de 2010 realizado por Aprahamian et al13 se obtuvo un coeficiente de correlación intraclase de 0,86 para el método de Shulman1,14 y de 0,90 para el método de Sunderland1,6. En nuestro estudio el coeficiente kappa fue de 0,87, resultado consistente con una reproducibilidad similar al de otros métodos de puntuación de reloj.
Las consistencias internas que obtuvimos resultaron más bajas que las del trabajo original, aun analizando a pacientes con el mismo grado de demencia. Entendemos que ello se debe a una diferencia de metodología. En el estudio original se encontró un coeficiente alfa de entre 0,71 y 0,93 entre los diferentes ítems de la PR a la orden. En el estudio realizado por Lin et al15 se obtuvo un coeficiente alfa de 0,93.
En cuanto a variables predictivas como la edad y el nivel de educación, los trabajos publicados muestran resultados contradictorios1,8,16. En nuestro análisis el sexo no fue una variable predictiva estadísticamente significativa. La edad y los años de educación fueron variables predictivas estadísticamente significativas pero de regular y escasa magnitud, respectivamente.
Comparado con el CDR y la GDS, la PR mostró baja y moderada correlación negativa. En un estudio llevado a cabo en 2002 por Powlishta et al17, la PR evaluada por diferentes métodos (que no incluía a Cacho) mostró un correlación con el CDR entre −0,69 y −0,74 entre pacientes con enfermedad de Alzheimer, mostrando además un pobre rendimiento en pacientes con demencia muy leve. Una revisión de 2010 a cargo de Ehreke et al18 señala que la PR no es una herramienta útil en el cribado de pacientes con DCL. En nuestro trabajo hay una gran cantidad de pacientes con demencia muy leve (DML) y DCL, lo que explicaría la baja correlación entre la PR y el CDR1,17–22. Los estudios de Shulman et al1,14 (1993) y Sunderland et al1,6 (1989) muestran un regular nivel de correlación entre la PR y la GDS. La ausencia de cegamiento en el momento de la evaluación con la MMSE y la estadificación con CDR y GDS con la PR nos impide afirmar que los análisis realizados carecen de sesgo.
Si bien el método de Cacho es un método de puntuación validado en español y de fácil aplicación es nuestro medio, con una alta reproducibilidad, nos preocupa la regular consistencia interna observada por nosotros.