Objetivos: La identificación precoz de los sujetos con deterioro cognitivo leve (DCL) puede potenciar la eficacia de las estrategias terapéuticas. Se ha propuesto el DCL temprano (DCLte) como una categoría que identifica sujetos con DCL en fase inicial. El reconocimiento de este grupo es complejo en la práctica clínica. Los métodos de data mining y aprendizaje automático (AA) tienen la capacidad de modelar y extraer conocimiento de datos multidimensionales y pueden ser de ayuda al diagnóstico clínico. Hemos explorado la capacidad de estos métodos para identificar sujetos con DCL frente a controles normales (CN), y sujetos con DCLte frente a DCL tardío (DCLta) y CN utilizando datos de test cognitivos de uso común. También se ha evaluado si incluir una medida morfométrica, como el volumen del hipocampo (VH), contribuye a la precisión diagnóstica.
Método: Sujetos con criterios de DCLte, DCLta y CN del repositorio Alzheimer's Disease Neuroimaging Initiative (ADNI). Como variables se incluyeron el Montreal Cognitive Assesment (MoCA), el Cuestionario de Actividad Funcional de Pfeffer (FAQ) y el inventario neuropsiquiátrico (NPI), el VH, obtenido mediante imagen por resonancia magnética (IRM), la edad y los años de educación. Seleccionados 462 sujetos: 166 CN y 296 DCL (159 DCLte y 137 DCLta). Mediante Waikato Environment for Knowledge Analysis (WEKA), plataforma de data mining, se analizaron distintos esquemas de AA, usando validación cruzada y balanceo de datos. La eficacia de la solución óptima fue evaluada con el área bajo la curva ROC (AUC).
Resultados: Los mejores resultados han sido con mezcla de clasificadores. El mejor para el problema biclase, CN-DCL, fue un Random Committee, con AUC=0,906 sin incluir VH, y AUC=0,910 al incluirlo. Con las tres categorías, CN-DCLte-DCLta, fue un Bagging de Logistics, con AUC=0,779 sin utilizar VH, y AUC=0,79 en caso contrario.
Conclusiones: Los sistemas de ayuda al diagnóstico basados en AA son eficaces para la identificación de sujetos con DCL a partir de los datos de las escalas clínicas. El reconocimiento del DCLte es un problema complejo que posiblemente precise de escalas cognitivas más sensibles. La adición de la medida del hipocampo no mejora sustancialmente el rendimiento diagnóstico, por lo que posiblemente la IRM no sea una prueba apropiada en un entorno clínico generalista.