Conocer la fiabilidad interobservador de los 4 índices de comorbilidad más utilizados en ancianos: índice de Charlson (ICh), Cumulative Illness Rating Scale for Geriatrics (CIRS-G), índice de Kaplan-Feinstein (IKF), e índice de coexistencia de enfermedad (ICED).
Material y métodosCuatro médicos, previamente entrenados, revisaron de forma independiente 40 historias clínicas de pacientes mayores de 75 años, ingresados por patología médica aguda, realizando los 4 índices y cronometrando el tiempo. Se analizó el coeficiente de correlación intraclase (CCI) para los índices cuantitativos (ICh y CIRS-G) y el coeficiente Kappa para índices cualitativos (IKF e ICED), las concordancias <0,4 se consideraron deficientes; 0,4-0,75 aceptable, y >0,75 excelente.
ResultadosLos pacientes de las historias evaluadas tenían una edad media de 85,93 (±5,35) años, siendo el 72,5% mujeres. El CCI global de los 4 evaluadores para el ICh fue 0,78 (IC del 95%:0,67-0,86) y para el CIRS-G (score):0,66 (IC del 95%:0,53-0,78). Los valores del coeficiente Kappa para el IKF oscilaron entre 0,51-0,76 y para el ICED entre 0,44-0,66. El tiempo de aplicación fue menor para el ICh (mediana de 39 segundos [30-45]) e IKF (42 segundos [35-52]) y mayor para el CIRS-G (score) (128 segundos [110-160]) e ICED (102 segundos [80-124]).
ConclusionesDe los 4 índices valorados, el ICh y el índice CIRS-G (score), son los que presentan una mejor fiabilidad interobservador. El ICh y el IKF, presentan menor tiempo de aplicación.
To report on the interrater reliability of four common comorbidity indexes used in the hospitalised elderly: Charlson Index (CI), Geriatric Cumulative Illness Rating Scale (CIRS-G), Index of Co-existent Disease (CoD) and Kaplan-Feinstein Index (KFI).
MethodFour trained observers, independently reviewed the same 40 medical charts of hospitalised geriatric patients. Scores for the four indexes were calculated, along with the intraclass correlations coefficient (ICC) (quantitative index: CI and CIRS-G) and Kappa coefficient (qualitative index: CoD and KFI). The agreement <0.4 was considered deficient, 0-4-0.75 acceptable and >0.75 excellent.
ResultsA total of 40 patients (29 women) of 85.93 (±5.35) years were analysed. Intraclass correlations coefficient: CI: 0.78 (95% CI: 0.67-0.86); CIRS-G (score): 0.66 (95% CI: 0.53-0.78). Kappa coefficient: KFI: 0.51 to 0.76; CoD: 0.44-0.66. The application time was lower for the Charlson index (median of 39seconds [30-45]) and the KFI (42seconds [35-52]) and higher for CIRS-G (score) (128seconds [110-160]) and CoD (102seconds [80-124]).
ConclusionsOf the four comorbidity indexes used in a hospitalised elderly population, the CI, and CIRS-G (score), are those that have better interrater reliability. The Charlson index and KFI show a lower application time than the CIRS-G (score).
La comorbilidad es un problema frecuente que contribuye a la complejidad de los pacientes ancianos. Se ha descrito que el 24% de los mayores de 65 años y el 31,4% de los mayores de 85 padecen cuatro o más patologías crónicas1,2.
Se entiende por comorbilidad «cualquier entidad adicional que ha existido o puede ocurrir, durante el curso clínico de un paciente con una enfermedad guía»2,3. Su importancia radica en que puede retrasar e influir en el diagnóstico clínico, en las decisiones de tratamiento, asociarse a complicaciones, afectar la recuperación funcional, empeorar la calidad de vida, incrementar el uso de recursos sanitarios, alterar la supervivencia y actuar como variable moduladora relevante de resultados en los estudios clínicos en ancianos1–4.
Los índices de comorbilidad buscan reducir las enfermedades de una persona y su severidad a una puntuación que permita la comparación con otras personas. Ante la existencia de diferentes métodos para valorar la comorbilidad, revisiones previas han encontrado 12 índices válidos, de los cuales teniendo en cuenta una serie de criterios (validez concurrente, predictiva y de constructo, fiabilidad inter e intraobservador, estrategias analíticas, métodos de obtención de datos, frecuencia de estudios publicados, etc.), han seleccionado 4 índices como los más apropiados para la evaluación de la comorbilidad en pacientes ancianos: índice de Charlson (ICh), Cumulative Illness Rating Scale-Geriatrics (CIRS-G), Index of CoExistent Disease (ICED) y el índice de Kaplan-Feinstein (IKF)1–4.
La reproducibilidad de dichos índices no ha sido evaluada en nuestro medio y específicamente en pacientes ancianos mayores de 75 años. Dada su importancia clínica, decidimos realizar este estudio con el objetivo de conocer la fiabilidad interobservador de los 4 índices de comorbilidad más utilizados.
Material y métodosInicialmente se obtuvieron los manuales originales en formato electrónico de los índices de ICh, CIRS-G, y el IKF, siendo el manual del ICED proporcionado directamente por los autores. Posteriormente, tanto los índices como sus manuales de aplicación fueron traducidos por dos investigadores y las discrepancias resueltas por consenso. Dado que los índices a evaluar consistían en una lista de patologías médicas, no se consideró necesario realizar una posterior retrotraducción.
Las características de los índices utilizados fueron:
- -
Índice de Charlson es el más conocido, evalúa 16 enfermedades que están explícitamente definidas y puntúa mediante una variable continua desde 0 a 315.
- -
El CIRS-G contempla 14 grupos de enfermedades o categorías, evaluando su severidad de 0 a 4, dando una puntuación final (score) que es la suma de dichas puntuaciones (entre 0-56). Se considera baja comorbilidad valores «0-2», media: «3-8», alta >86. Otras formas de expresar su puntuación que no se han utilizado en el presente estudio (índice de severidad, el número de categorías de severidad 3 y 4).
- -
El ICED es el único que valora el estado funcional. Consta de dos secciones: 14 ítems para la sección de enfermedades, con una puntuación de severidad de 0 a 4, y 12 ítems para la sección de compromiso físico (estado funcional), con una puntuación de severidad de 0 a 2. La puntuación final agrupa las puntuaciones de ambas secciones y oscila entre 0-37.
- -
El índice de Kaplan-Feinstein consta de 12 ítems por sistemas de enfermedades explícitamente definidas, con una severidad de 0 a 3 para cada sistema. La puntuación final es una variable ordinal de 4 categorías (de categoría 0 a categoría 3), en donde si están presentes múltiples enfermedades, la enfermedad con el más alto rango define la categoría, excepto si dos o más enfermedades están en grado 2 de severidad en donde la categoría final es 38.
Para la formación de los 4 investigadores (un médico especialista en Geriatría y tres médicos residentes de Geriatría de tercer y cuarto año) se elaboró una guía resumen de cada índice y se discutió las puntuaciones en dos sesiones, con la aplicación posterior de dichos índices en 5 historias clínicas de pacientes ancianos ingresados por patología médica aguda.
Para este estudio se seleccionaron 40 historias de pacientes mayores de 75 años, ingresados consecutivamente en la unidad de agudos del servicio de Geriatría del Hospital Central de la Cruz Roja de Madrid, durante el mes de mayo de 2009; mediante un muestreo por conveniencia, el tamaño de la muestra se estableció en base al estudio realizado por Hall SF, et al.9. Estas historias fueron revisadas de forma independiente y simultánea por cada investigador extrayendo los datos necesarios para completar los ítems de cada índice de comorbilidad, cronometrando el tiempo utilizado en cada índice, el análisis estadístico lo realizó otro investigador independiente.
Análisis estadísticoLa fiabilidad interobservador se analizó con el coeficiente de correlación intraclase (CCI) para los índices cuantitativos (ICh y CIRS-G) y el coeficiente Kappa para índices cualitativos (IK-F e ICED). Siendo ambos coeficientes directamente comparables. Se consideró <0,4 como concordancia deficiente, 0-4-0,75 concordancia aceptable y >0,75 concordancia excelente10. El tiempo de aplicación fue medido en forma de mediana y rango interquartílico. Para el análisis estadístico se utilizó el paquete estadístico SPSS versión 15.
ResultadosDe los 40 pacientes estudiados 29 (72,5%) eran mujeres, edad media de 85,93 (±5,35) años (rango de 75 a 98 años), con una situación funcional basal previa al ingreso medida por el índice de Barthel de 61,81±36,34 y mental medida por la escala de incapacidad psíquica de Cruz Roja de 1,34±1,67. El principal motivo de ingreso fue infección (51%) seguido de insuficiencia cardiaca (22,4%).
El grado de concordancia entre observadores y el tiempo promedio de los evaluadores empleados en la aplicación de los índices se muestra en la tabla 1. El índice de Charlson muestra una concordancia excelente seguido del CIRS-G (score) con concordancia aceptable. En relación con el tiempo de aplicación de los 4 índices fue sensiblemente menor fue para el ICh y el K-F.
Fiabilidad interobservador de los índices de comorbilidad y tiempo de los evaluadores en segundos empleado en la aplicación de los índices
CCI (IC del 95%) | Tiempo (s)a | |
Índice de Charlson | 0,78 (0,67-0,86) | 39 s (30-45) |
Índice de CIRS-G (score) | 0,66 (0,53-0,78) | 128 s (110-160) |
Kappa | ||
Índice de Kaplan-Feinstein | 0,51-0,76 | 42 s (35-52) |
Índice de coexistencia de enfermedad (ICED) | 0,44-0,66 | 102 s (80-124) |
CCI: coeficiente de correlación intraclase; CIRS-G (score): Cumulative Illness Rating Scale for Geriatrics; DE: desviación estándar; IC: intervalo de confianza; s: segundos.
La distribución de puntuaciones de los diferentes evaluadores, para los 4 índices de comorbilidad estudiados, se presenta en la figura 1.
DiscusiónLa muestra del presente estudio es una población eminentemente geriátrica, constituida por pacientes muy ancianos ingresados por patología médica aguda (rango de edad de 75-98 años), con presencia de dependencia funcional moderada y frecuente deterioro cognitivo.
Los niveles de fiabilidad obtenidos para los 4 índices de comorbilidad fueron excelente para el ICh y aceptable para CIRS-G (score), IKF e ICED, muy similares a los presentados por Hall SF, et al.9, pero ligeramente inferiores a los encontrados en otros estudios6,12–14. Debido a la falta de uniformidad en los reportes de los estudios de fiabilidad es difícil establecer comparaciones9,11; sin embargo, creemos que las diferencias encontradas podrían explicarse por 4 razones:
En primer lugar los pacientes de la muestra estudiada son sensiblemente más envejecidos (media de 86 años) que los del trabajo de Extermann M (media de 75 años)12, y otros estudios de edad media inferior6,13,14.
En segundo lugar, tenían mayor carga de enfermedad ya que puntuaban cero según el ICh solo el 2,4%, respecto al 50% en el estudio de Hall SF, et al.9 y 64% en el de Extermann M12, lo cual aumenta la probabilidad de discrepancias entre los observadores, sobre todo para los índices CIRS-G, ICED, IK-F. En cambio, el ICh al puntuar enfermedades específicas y definidas mediante criterios explícitos, se vería menos afectado.
En tercer lugar, los pacientes de nuestra muestra presentaban mayor deterioro funcional (índice de Barthel 61,81±36,34). La mayoría de los estudios no presentan la situación funcional, encontramos en el estudio de Salvi F et al.13 (índice de Barthel 87,1± 21,5). Esto afectaría sobre todo al CIRS-G, IK-F e ICED, que incluyen variables funcionales, donde un buen nivel funcional mostraría menos errores entre los diferentes observadores.
Finalmente, a diferencia de los demás estudios que utilizaron informes de alta o bases de datos de pacientes ambulatorios6,9,12 o ingresados6,13,14, en el presente estudio se utilizó la historia clínica completa la cual, al tener mayor cantidad de información y un perfil más complejo, si bien contribuiría a la mayor riqueza de los datos sobre todo en el CIRS-G e ICED, podría ser un factor de variabilidad entre observadores.
Respecto a las diferencias entre las puntuaciones de los índices de comorbilidad estudiados, tal como se ilustra en la figura 1, el CIRS-G, al ser más específico de la población anciana, con afecciones geriátricas evaluadas según diferentes grados de severidad, hace puntuar a casi todos los sujetos, mientras que el ICh tiende a establecer puntuaciones menores, aunque menos sesgado a la izquierda que en otros estudios con pacientes más jóvenes6,12–14. De igual forma, con el ICED y el IKF que puntúan deterioro funcional, dada la alta prevalencia de discapacidad, aparece un sesgo hacía la derecha, es decir hacia su máxima puntuación (categoría de valor 3).
En relación con el tiempo de aplicación, no hemos encontrado estudios comparativos. Los promedios obtenidos muestran diferencias importantes entre uno y otro índice, ocupando la aplicación del ICh e IKF tres veces menos tiempo que el CIRS-G (score) e ICED.
En conclusión, de los 4 índices de comorbilidad más usados en pacientes muy ancianos hospitalizados por patología médica aguda, encontramos una excelente concordancia interobservador para el índice de Charlson y aceptable para el CIRS-G (score), ICED y Kaplan-Feinstein, siendo los índices de Charlson y de Kaplan-Feinstein los que requieren un menor tiempo de aplicación. Por lo que podrían ser utilizados, según los objetivos del clínico y/o investigador, siendo necesario realizar estudios comparativos para valorar la capacidad predictiva de dichos índices.