La demencia es una enfermedad crónica degenerativa de alto impacto para las familias y los sistemas de salud. Los instrumentos de medición del deterioro cognitivo que se utilizan actualmente tienen características psicométricas diferentes en cuanto a tiempo de aplicación, punto de corte, confiabilidad y validez. El objetivo de la presente revisión fue describir las características de las escalas Mini Cog, Prueba del reloj y Mini- Mental para tamizaje de deterioro cognitivo validadas al idioma español.
DesarrolloLa búsqueda bibliográfica se realizó en 3 etapas mediante la base de datos Medline a partir del año 1953. Se realizó una selección de publicaciones validadas al español que incluyeran la confiabilidad, validez, sensibilidad y especificidad de las escalas.
ConclusionesLas 3 herramientas de tamizaje descritas en este artículo proporcionan un apoyo para el personal de salud. La detección oportuna es crucial para el pronóstico de las personas que viven con deterioro cognitivo leve o demencia.
Dementia is a chronic, degenerative disease with a strong impact on families and health systems. The instruments currently in use for measuring cognitive impairment have different psychometric characteristics in terms of application time, cut-off point, reliability, and validity. The objective of this review is to describe the characteristics of the validated, Spanish-language versions of the Mini-Cog, Clock-Drawing Test, and Mini–Mental State Examination scales for cognitive impairment screening.
DevelopmentWe performed a three-stage literature search of articles published on Medline since 1953. We selected articles on validated, Spanish-language versions of the scales that included data on reliability, validity, sensitivity, and specificity.
ConclusionsThe 3 screening tools assessed in this article provide support for primary care professionals. Timely identification of mild cognitive impairment and dementia is crucial for the prognosis of these patients.
Con el incremento en la proporción de personas adultas mayores que se prevé para el 2050, la demanda de los servicios de salud aumentará, particularmente en el primer nivel de atención. El personal de salud en este nivel es el primer contacto con las personas mayores con afectaciones en el cerebro como el deterioro cognitivo leve (ICM) y la demencia. Actualmente en México la prevalencia de deterioro cognitivo leve y demencia es de 7,3% y 7,9% respectivamente, y es dependiente de la edad1. Tal impacto mundial ha provocado la creación de organismos internacionales que en conjunto, con el apoyo de la Organización Mundial de la Salud, han impulsado en algunos países como México el desarrollo de estrategias nacionales y la puesta en marcha de acciones específicas, como la detección temprana del Alzheimer y otras demencias.
El deterioro cognitivo leve es considerado un estado intermedio entre una función cognitiva normal y la demencia leve2, a nivel biológico los 5 o 10 años anteriores al diagnóstico de deterioro cognitivo leve representan una oportunidad importante para retardar o detener la progresión de la enfermedad3, es decir, antes de que se produzcan los mecanismos que conducen a la muerte neuronal, cuyo reflejo es la gravedad de los síntomas cognitivos en la demencia, y que difícilmente son identificados por el mismo paciente o su cuidador, por ser confundidos como signos propios de la edad4.
En la actualidad el diagnóstico presuntivo y oportuno que preserva la función cognitiva e independencia del anciano5 se realiza mediante el empleo de pruebas neuropsicológicas que permiten detectar cambios en la cognición de las personas adultas mayores. La evidencia actual sobre el tamizaje de deterioro cognitivo muestra que los instrumentos de medición que se utilizan en habla hispana tienen características diferentes en cuanto a tiempo de aplicación, punto de corte, confiabilidad y validez. Sin embargo, no todos estos elementos han sido revisados críticamente. En este trabajo se describen las características de las escalas Mini examen cognoscitivo (Mini Cog), Prueba del reloj y Mini-Mental State Examination (MMSE) para tamizaje de deterioro cognitivo validadas al idioma español.
DesarrolloLa búsqueda bibliográfica se realizó en 3 etapas mediante la base de datos Medline a partir del año 1953 utilizando las siguientes palabras clave, para la primera etapa: validation, cognitive impairment, dementia, screening de las cuales se encontraron: 649 validadas en diferentes países, principalmente de Asia, Europa y América; se encontraron más de 8 escalas que evaluaban cognición en varios tipos de demencias. Posteriormente, se eligieron escalas de interés para este trabajo, seleccionando 262 estudios sobre MMSE, 30 estudios de Mini Cog y 46 sobre la Prueba del reloj. En la tercera etapa se eligieron publicaciones validadas al español que incluyeran elementos propios de un reporte de validación: confiabilidad, validez, sensibilidad y especificidad seleccionando 9 publicaciones de MMSE, 5 publicaciones de la Prueba del reloj y 4 publicaciones de Mini Cog (fig. 1). Fueron elegidas por haber sido validadas en varios países de habla hispana, por su facilidad y rapidez de aplicación en el primer nivel de atención.
Mini-Mental State ExaminationEl MMSE fue desarrollado en 1975 por Folstein6, y originalmente fue creado para monitorizar cuantitativamente el cambio en el estado mental de pacientes hospitalizados. Junto con sus diferentes modificaciones7 es el instrumento de tamizaje cognitivo más utilizado a nivel clínico y epidemiológico, por el tiempo y la facilidad de su aplicación. Ha sido ampliamente utilizado y recomendado para apoyar al diagnóstico de enfermedades como el Alzheimer, el Parkinson y otros tipos de demencia8.
La escala contiene 11 reactivos que suman un total de 30 puntos. En la estandarización original del instrumento se sugiere un punto de corte de 24; sin embargo, se ha debatido ampliamente que el punto de corte se ve afectado por la edad, nivel socioeconómico, el grupo étnico y el nivel educativo (tabla 1). En estudios mexicanos el grupo de Ostrosky-Solís et al.9 (en el año 2000) aplicaron la prueba del MMSE en español a 430 individuos con rangos de edad de 16-50, 51-65 y 66-89, y a un grupo de 40 pacientes con demencia, encontrado variaciones en la sensibilidad y especificidad en relación con el nivel educativo (tabla 1). Analizando las puntuaciones totales encontraron que el desempeño de los individuos sin escolaridad fue tan bajo como el de los participantes con demencia severa, mientras que la puntuación para aquellos con 1 a 4 años de escolaridad fue similar a la de los participantes con demencia leve. Su conclusión fue que la variación del punto de corte no es suficiente para obtener índices de sensibilidad y especificidad adecuados. Sugiriendo que la aplicación del MMSE es útil para confirmar la presencia de alteraciones cognitivas graves en los participantes con más de 5 años de escolaridad9.
Estudios de validación de la escala Mini Mental State Examination
Autor | País | Año | Punto de corte | Sensibilidad | Especificidad | Otros parámetros |
---|---|---|---|---|---|---|
Ostrosky-Solís et al.9 | México | 2000 | Grupo de edad de 66-89 años0 años de escolaridad (16,38)1-4 años de escolaridad (21,59)5-9 años de escolaridad (25,52)≥10 años de escolaridad (26,34) | 0-4 años de escolaridad (0,73)5-9 años de escolaridad (0,86)≥10 años de escolaridad (0,71) | 0-4 años de escolaridad (0,5)5-9 años de escolaridad (0,86)≥10 años de escolaridad (0,87) | - |
Rosselli et al.13 | Colombia | 2000 | Grupo de edad de 65–69 años0-3 años de escolaridadHombres (23,1±4,5)Mujeres (22,3±5,2)4≤años de escolaridadHombres (25,6±4,5)Mujeres (24,2±4,6)Grupo de edad de 70-74 años0-3 años de escolaridadHombres (23,2±4,3)Mujeres (21,9±5,1)4≤años de escolaridadHombres (25,3±3,8)Mujeres (24,4±4,9)Grupo de edad de >75 años0-3 años de escolaridadHombres (21,9±6,2)Mujeres (20,9±5,7)4≤años de escolaridadHombres (24,8±6,6)Mujeres (23,6±4,6) | 92,3% | 53,7% | - |
Blesa et al.15 | España | 2001 | 24/25 | 87,32(IC 95%: 83,8-90,9) | 89,19(IC 95%:83,4-95,0) | - |
Vinyoles et al.16 | España | 2002 | 23/24 | Coeficiente de correlación intraclase (0,864).El índice Kappa para una puntuación de 24, para ambas pruebas MMSE y MEC fue de 0,468. Este incremento a 0,788 considerando una puntuación de 20 y 23 para MEC y MMSE respectivamente |
Autor | País | Año | Punto de corte | Sensibilidad | Especificidad | Otros parámetros |
---|---|---|---|---|---|---|
Quiroga P et al.14 | Chile | 2004 | 21/22 | 93,6% (IC 95%: 70,6-99,7%)Combinación con PFAQ*94,4% (IC 95%: 58,9-80,3%) | 46,1% (IC 95%: 34,7-57,8%)Combinación con PFAQ*83,3% (IC 95%: 72,3-90,7%) | - |
Reyes et al.10 | México | 2004 | 23/24 | 0,97 | 0,88 | - |
Espino et al.18 | Estados Unidos | 2004 | Americanos Europeos (27,7±2,4 a 28,5±1,9) Americanos mexicanos entrevistados en inglés (25,6±3,2 a 27,2±2,9)Americanos mexicanos entrevistados en español(22,5±4,5 a 25,5±3,5) | - | - | - |
Borson et al.19 | Estados Unidos | 2005 | - | - | - | - |
Mokri et al.12 | México | 2013 | Grupo de edad de 70-79 años0 años de escolaridadHombres (24)Mujeres (23)1-5 años de escolaridadHombres (28)Mujeres (25)6 o + años de escolaridadHombres (29)Mujeres (28)Grupo de edad de ≥80 años0 años de escolaridadHombres (23)Mujeres (21)1-5 años de escolaridadHombres (23)Mujeres (24)6 o + años de escolaridadHombres (27)Mujeres (27) |
MEC: Mini-examen cognoscitivo; MMSE: Mini-mental state examination; PFAQ: Prueba de actividades funcionales de Pfeffer.
Posteriormente, Reyes et al.10, en 2004, validaron una versión modificada del MMSE en español para la identificación de deterioro cognitivo, considerando un total de 203 adultos mayores del Instituto Mexicano del Seguro Social, encontrando un punto de corte de 23/24, con una sensibilidad del 0,97 y una especificidad del 0,88. Concluyeron que las variables que explicaron el 60,6% de la varianza fueron: orientación espacial, orientación en el tiempo, lenguaje y cálculo y nomenclatura de objetos10.
En otro reporte, realizado por el grupo de Franco-Marina et al. en 2010, encontraron que al ajustar la puntuación para el nivel educativo en una población mexicana envejecida las puntuaciones de MMSE siguen teniendo efectos de techo y suelo. Cuando se utiliza una prueba MMSE ajustada a la educación para detectar el deterioro cognitivo pueden requerirse pruebas adicionales para descartar la posibilidad de un deterioro cognitivo leve11.
En 2013 Mokri et al. realizaron un estudio con la finalidad de normalizar 3 pruebas neuropsicológicas en español, las cuales son MMSE, The Free and Cued Selective Reminding Test y The Isaacs Set Test, estas en 1.047 adultos mayores mexicanos de la cohorte Coyoacán, revelando que los puntos de corte más bajos fueron obtenidos por el grupo analfabeto, tanto de hombres (punto de corte=24) como de mujeres (punto de corte=23), disminuyendo aún más en las mujeres analfabetas de más de 80 años (punto de corte=21). Los puntos de corte más altos fueron obtenidos por el grupo con más de 6 años de escolaridad en hombres (punto de corte=29) y mujeres (punto de corte=28), disminuyendo este en el grupo de más de 80 años (punto de corte=27). Concluyendo que los puntos de corte para MMSE varían dependiendo de la edad, del género y de la escolaridad12.
En el contexto de otros estudios de habla hispana, en Colombia Rosselli et al., en el año 2000, aplicaron una versión en español del MMSE en una población con una alta tasa de analfabetismo derivada del Estudio Neuroepidemiológico Colombiano (Epineuro). Los valores de sensibilidad y especificidad fueron 92,3% y 53,7% respectivamente. Sus resultados corroboran que el nivel educativo tiene una influencia muy significativa en las puntuaciones obtenidas en el MMSE, incluso más importante que la edad del sujeto. La correlación entre la puntuación total y la escolaridad fue casi 3 veces superior (0,34) a la correlación observada con la edad (–0,13). Ellos concluyeron que esta prueba es adecuada como un instrumento fácil, de aplicación corta, en sujetos con niveles altos de escolaridad y en casos de defectos cognitivos importantes, pero es inapropiada para la evaluación de sujetos con niveles educativos limitados o deterioro cognoscitivo leve13.
Mientras que en Chile, en 2004, la validación de la prueba de tamizaje para el diagnóstico de demencia realizada por Quiroga et al. consistió en la aplicación de las pruebas del MMSE y la Prueba de actividades funcionales de Pfeffer (PFAQ) a 100 adultos mayores, encontrando mayor sensibilidad y especificidad mediante la combinación de las pruebas (94,4% y 83,3%), que solo la aplicación del MMSE (93,6% y 46,1%), concluyendo que la combinación de las pruebas del MMSE y PFAQ tienen mayor sensibilidad y especificidad para la detección de demencias en Chile y que el desempeño solo en la administración del MMSE en población sin demencia se ve afectado por el nivel educativo14.
El estudio de adaptación del MMSE al idioma español realizado por Blesa en 2001, en España, consideró una muestra de 111 pacientes con demencia Alzheimer, 86 con deterioro cognitivo leve y 253 controles, encontrando el mejor punto de corte en 24/25 con una sensibilidad de 87,32 y especificidad de 89,19, siendo muy importante considerar la edad y el nivel de escolaridad de los pacientes15.
Un año más tarde, en Barcelona, el grupo de Vinyoles comparó las pruebas del MMSE y Mini-examen cognoscitivo para estimar el déficit cognitivo en una muestra de 3.167 adultos mayores de 65 años. Sus resultados mostraron una correlación intraclase de 0,864, y el índice kappa de 0,788 para ambas pruebas, considerando una puntuación de 20 y 23 para el Mini Cog y MMSE respectivamente, indicando que esto no puede ser utilizado en sujetos mayores de 80 años y/o con una escolaridad baja16.
En cuanto a estudios realizados en Norteamérica, la comparación entre la prueba de Mini Cog y el MMSE, realizada por Borson en el año 2000, como ya se mencionó anteriormente, reveló que la prueba de Mini Cog ha mostrado mayor exactitud (83%) en comparación con el MMSE (81%), incluso en personas con escolaridad muy baja, y es más fácil de administrar en personas que no hablan inglés17.
Aunado a esto, derivado del estudio longitudinal de envejecimiento San Antonio, Espino et al., en 2001, indicaron puntos de corte del MMSE en 3 grupos étnico-lingüísticos con diferente escolaridad, revelando que las puntuaciones y sus desviaciones estándar para los americanos europeos fueron de 27,7±2,4 a 28,5±1,9, para los americanos mexicanos entrevistados en inglés de 25,6±3,2 a 27,2±2,9 y para los americanos mexicanos entrevistados en español de 22,5±4,5 a 25,5±3,5. Los resultados en los puntos de corte sugieren que el personal de salud en Norteamérica debe estar alerta ante posibles falsos positivos en ancianos altamente educados que hablan inglés18.
Mini-examen cognoscitivoLa tabla 2 muestra los diferentes estudios de validación de la escala Mini Cog. Se trata de una prueba de tamizaje de demencia, con un tiempo corto de aplicación (menos de 5min), que consta de 2 secciones: la primera tiene 3 reactivos donde se recuerdan 3 palabras no relacionadas entre sí, y la segunda es una prueba de reloj. La prueba de Mini Cog fue introducida en Estados Unidos por Borson en el año 2000, a partir de 249 adultos mayores lingüísticamente heterogéneos; la prueba de Mini Cog mostró mayor sensibilidad y especificidad (99% y 93%, respectivamente) para discriminar a pacientes con demencia moderada que el MMSE (91% y 92%, respectivamente)17. Asimismo, la prueba de Mini Cog ha mostrado mayor precisión (83%) en comparación con el MMSE (81%), incluso en personas con escolaridad muy baja, y ha resultado ser una prueba de fácil aplicación en aquellas personas que no hablan inglés19. Por su parte, Kaufer et al., en 2008, reportaron una alta sensibilidad de esta prueba para demencia, pero una baja sensibilidad para el tamizaje de deterioro cognitivo leve (Mild Cognitive Impairment), con valores de sensibilidad y especificidad de 0,50 y 0,73, respectivamente (tabla 2)20.
Estudios de validación de la escala Mini examen cognoscitivo
Autor | País | Año | Número de preguntas y bloques | Duración | Punto de corte | Sensibilidad | Especificidad | Confiabilidad |
---|---|---|---|---|---|---|---|---|
Borson et al.17 | Estados Unidos | 2000 | 3 reactivos de renombrar y el dibujo del reloj | 3,2±2min | 99% Mini cog91% MMSE92% CASI | 93% Mini cog92% MMSE96% CASI | ||
Borson et al.19 | Estados Unidos | 2005 | 83% Mini-Cog81% MMSE | |||||
Kaufer et al.20 | Estados Unidos | 2008 | 3 reactivos de memoria y un dibujo de reloj | 0-1 | 0,87 (demencia)0,50 (MCI) | 0,54 (demencia)0,73 (MCI) | 70,6 (demencia)61,7 (MCI) | |
Steenland et al.21 | Estados Unidos | 2008 | 3 reactivos y el dibujo del reloj | de 3 a 5min | NormalFAQ 0-2; MC 4-6MCIFAQ 0-2; MC 0-3FAQ 3-9; MC 0-6FAQ 10-12;MC 3-6 FAQ≥13; MC=6DemenciaFAQ 10-12; MC 0-2FAQ≥13; MC 0-5 | Mini cog and FAQ 83%MMSE and FAQ, 85% | ||
Dechent30 | Chile | 2013 | 82% Mini Cog 82% MIS | 69% Mini Cog 75% MIS |
CASI: Cognitive Abilities Screening Instrument; FAQ: Functional Activities Questionnaire; MCI: Mild Cognitive Impairment; MIS: Memory Impairment Screen; MMSE: Mini-Mental State Examination.
Además, la combinación de la prueba del Mini Cog con la escala funcional FAQ discrimina con un 83% de precisión a los sujetos con demencia o deterioro cognitivo, en comparación con el 85% del MMSE y FAQ, siendo que la prueba de Mini Cog requiere solo entre la mitad y un tercio del tiempo en su aplicación21.
Prueba del relojEn la tabla 3 se muestran los estudios de validación de la Prueba del reloj, la cual se introdujo en 1953. Es una prueba de fácil aplicación en la que se exige al sujeto recuperar de la memoria la imagen visuoespacial apropiada. La calificación de la prueba discrimina los casos de demencia frente a sujetos sin demencia. Tuokko et al., en 1992, aplicaron la Prueba del reloj a la orden en su estudio y establecieron una escala de 31 puntos, en la cual el punto de corte fue de 2 errores (es decir, la identificación de errores en 2 o más componentes del reloj), obteniendo con ello una especificidad del 92% y una sensibilidad del 86% para discriminar entre personas sanas y personas con enfermedad de Alzheimer22.
Estudios de validación de la escala Prueba del reloj
Autor | País | Año | Número de preguntas y bloques | Duración | Punto de corte | Sensibilidad | Especificidad | Confiabilidad |
---|---|---|---|---|---|---|---|---|
Tuokko et al.22 | Canadá | 1992 | Prueba del reloj a la orden | Sin límite de tiempo | ≤2 | 86% | 92% | |
Cahn D, et al.23 | Estados Unidos | 1996 | Prueba del reloj a la orden | Sin límite de tiempo | Valoración cuantitativa≤7Valoración cualitativa≤1Global≤6 | Valoración cuantitativa 88%Valoración cualitativa 81%Global 83% | Valoración cuantitativa 63%Valoración cualitativa 68%Global 72% | 0,99 |
Libon et al.24 | Estados Unidos | 1996 | Prueba del reloj a la ordenPrueba del reloj a la copia | Sin límite de tiempo | ≤6 | |||
Cacho et al.25 | España | 1999 | Dos fases: Prueba del reloj a la orden y Prueba del reloj a la copia | Sin límite de tiempo | TRO=≤6TRC=≤8TRO+TRC=≤15 | TRO 92,8%TRC 73,1%TRO+TRC 94,9% | TRO 93,5%TRC 90,6%TRO+TRC 90,6% | 1,9092 |
TRC: Prueba del reloj a la copia; TRO: Prueba del reloj a la orden.
Por su parte, Cahn et al., en 1996, realizaron un estudio para examinar la precisión diagnóstica de la Prueba del reloj en población general en Estados Unidos su desempeño en la detección de sujetos en riesgo de demencia en ausencia de deterioro funcional evidente. Estableciendo un punto de corte de≤7, se obtuvo una sensibilidad del 88% y una especificidad de 63% para la valoración cuantitativa, en tanto que para la valoración cualitativa, en un punto de corte de ≤1, se obtuvo una sensibilidad de 81% y una especificidad de 68%. La evaluación global, con un punto de corte de ≤6, revela una sensibilidad de 83% y una especificidad de 72% para la detección23.
En 1996 Libon et al. desarrollaron una escala de calificación para tabular errores, con motivo de investigar los déficits neuropsicológicos subyacentes que pueden ser responsables de que pacientes con demencia vascular tengan peor rendimiento en la condición de la Prueba del reloj a la copia en comparación con pacientes con Alzheimer. En este estudio se aplicaron las 2 modalidades de la Prueba del reloj, teniendo en cuenta 2 sistemas de puntuación. El primero de ellos considera 10 puntos que van desde 1 (peor rendimiento) a 10 (mejor rendimiento). La segunda escala representa la sumatoria de todos los errores detectados en el dibujo y/o en el emplazamiento del reloj, las manecillas y los números. Para esta última escala se toman en cuenta 10 tipos de errores y cada uno recibe una puntuación de 1 punto (si está presente) o de 0 (si está ausente). Los autores concluyen que la adaptación realizada al sistema de calificación y el análisis de los tipos de error son medidas útiles para cuantificar el rendimiento en la prueba de pacientes con enfermedad de Alzheimer y demencia vascular, además de diferenciar ambos perfiles clínicos, en particular cuando la localización predominante de alteraciones cerebrovasculares implica regiones subcorticales del cerebro24.
ConclusionesEn la presente revisión se describieron las principales características de 3 escalas para tamizaje MMSE, Mini Cog y Prueba del reloj, las cuales han sido validadas al idioma español y se emplean mundialmente para la detección del deterioro cognitivo y demencia; estas pruebas tienen algunas ventajas y limitación en relación con sus cualidades psicométricas y aplicación.
Cronológicamente la prueba del reloj fue la primera en validarse al idioma español en los años 90, seguido del MMSE y el Mini Cog en 2000. La Prueba del reloj se ha validado al español en Canadá, Norteamérica y España, el MMSE en México, Colombia, España, Chile y Norteamérica, mientras que el Mini Cog en Norteamérica y Chile.
El MMSE es el test de tamizaje de deterioro cognitivo más popular, validado en una mayor cantidad de estudios de investigación; sin embargo, sus principales limitaciones incluyen el nivel cultural del paciente, la falta de estandarización, variables socioeducativas y el tiempo de aplicación, que dificulta su uso por los médicos del primer nivel de atención26,27.
Los resultados del Mini Cog, si bien refieren mayor sensibilidad, especificidad y precisión que el MMSE, con un menor tiempo de aplicación, también presentan cierta limitación condicionada por el bajo nivel educativo de los pacientes28,29.
Existen un sinnúmero de instrumentos para la detección y tamizaje de personas con deterioro cognitivo o demencia. En esta revisión se enfatiza el uso de 3 herramientas de tamizaje en habla hispana que proporcionan un apoyo para el personal de salud, resulta necesario un instrumento confiable y práctico para su uso en el primer nivel de atención, donde la detección oportuna es crucial para el pronóstico de los pacientes con deterioro cognitivo leve y aquellos pacientes con demencia.
La selección de las herramientas de tamizaje y la capacitación del personal de salud de primer nivel representa un reto para la salud pública.
Conflicto de interesesNinguno de los autores tiene algún conflicto de intereses.
Agradecemos al personal de apoyo en investigación del Instituto Nacional de Geriatría, Ciudad de México.