Hemos leído con atención el artículo de González González et al., «Concordancia y utilidad de un sistema de estratificación para la toma de decisiones clínicas», y queremos realizar algunos comentarios sobre el mismo1.
Los autores estudian la concordancia entre el sistema de clasificación de pacientes mediante grupos de morbilidad ajustada (GMA), y el criterio clínico de los profesionales que han de aplicar la estrategia de atención a pacientes con enfermedades crónicas. También evalúan la validez y eficacia del nivel de riesgo según los GMA, como sistema de ayuda a la decisión clínica, considerando como gold standard el nivel de intervención establecido por el médico de familia2.
Los autores han optado por realizar un muestreo estratificado no proporcional. A la vista de los resultados, que muestran una distribución claramente diferente por estrato de intervención, cabe preguntarse cómo y en qué sentido está influyendo esta diferente distribución en el nivel de concordancia medido durante el estudio.
Los autores excluyen 111 pacientes porque los profesionales estiman que la enfermedad crónica no es relevante. Consideramos un error esta exclusión, dado que precisamente se pretende contrastar la clasificación de los pacientes según nivel de riesgo de los GMA con el nivel de intervención propuesto por los médicos. La «no intervención» debería considerarse como un estrato más de la clasificación efectuada por el médico, de manera que los niveles de intervención serían 4 (no intervención, bajo, medio, alto). De este modo el mayor grado de desacuerdo no sería el 2,63% referido en el artículo, sino el 13,4% (130 de 831 pacientes), y la concordancia se ve claramente afectada.
Los autores señalan que en el momento de analizar las HC, y antes de tomar su decisión los profesionales conocían el estado propuesto por los GMA. En los resultados se señala que los profesionales lo consideraron útil en el 76% de las ocasiones.
Al estudiar concordancia entre criterio clínico y clasificación asignada por el agrupador ¿no se está introduciendo un sesgo de observador al asignar el nivel de intervención a priori? Probablemente hubiera sido más válido solicitar el nivel de intervención y, posteriormente, dar a conocer la propuesta aportada por el agrupador, y preguntar en ese momento sobre la concordancia, sobre todo, teniendo en cuenta los resultados de la tabla 3 que comentan los autores1. Por otro lado, respecto a esta misma tabla y la figura 2, desconocemos porqué se establece como probabilidad pre-prueba (prevalencia) el 13% de nivel de intervención alto, ya que los profesionales proponen un nivel de intervención más elevado, entre el 22,5-16,3%, según consideremos la población escogida o la población completa para el cálculo. Si se quiere que el agrupador se acerque al gold standard, se deberían considerar algunos de los niveles anteriores o justificar al menos el elegido. Este razonamiento es válido para cualquiera de los niveles de intervención que se consideren, según su prevalencia3.
Antes de poder valorar finalmente la utilidad real de los GMA como sistema de ayuda a la toma de decisiones clínicas, sería conveniente valorar la influencia en la concordancia de los aspectos comentados anteriormente, e intentar superar las limitaciones sobre la validez que ya señalan los autores, así como su aplicabilidad en otros contextos asistenciales. En este sentido conviene tener en cuenta la literatura sobre variaciones de la práctica clínica al diseñar estudios que pretendan responder adecuadamente a las preguntas planteadas en el objetivo del artículo4–6.