Introducción
La artrosis es la enfermedad reumática más frecuente y una de las enfermedades crónicas que producen mayor grado de incapacidad funcional1-4. En mujeres mayores de 65 años puede ser la enfermedad crónica más frecuente4; aun así, se espera que la prevalencia de la enfermedad aumente debido al envejecimiento progresivo de la población. En décadas pasadas ha habido gran variabilidad en las medidas utilizadas en los ensayos clínicos para la valoración de la eficacia de los fármacos antirreumáticos, no sólo en la selección de las variables sino también en el tipo de escalas e instrumentos utilizados para su medición5. En la conferencia OMERACT III (Outcome Measures in Rheumatology, 1997) se propuso un núcleo mínimo de medidas que debería ser incluido, junto con otras a juicio del investigador, en todos los ensayos clínicos de artrosis: dolor, función física, valoración global por parte del paciente y, en estudios de al menos un año de duración, valoración radiográfica6. Otras medidas recomendadas son: calidad de vida y valoración global por el médico.
Sin embargo, hasta ahora no se ha dispuesto de ninguna definición de mejoría o de respuesta al tratamiento para artrosis similar a los criterios ACR20, ACR50 o ACR70 definidos para artritis reumatoide y basados en el núcleo de medidas propuestas en OMERACT7. Recientemente el comité para ensayos clínicos de la Osteoarthritis Research Society International (OARSI) ha propuesto una serie de criterios para la definición de respuesta en el contexto de ensayos clínicos de artrosis, los llamados OARSI Response Criteria Initiative (RCI)8. Según estos criterios de respuesta, un paciente con artrosis de rodilla y en tratamiento con un AINE es clasificado como respondedor cuando se observa ≥ 45% de mejoría en dolor (siempre y cuando se alcance mejoría ≥ 20 unidades normalizadas [UN] en la escala de dolor) o cuando se cumplen dos de las tres siguientes condiciones: a) mejoría del dolor ≥ 15% (≥ 10 UN); b) mejoría de la función física ≥ 30% (≥ 15 UN); c) mejoría de la valoración global por parte del paciente ≥ 35% (≥ 10 UN).
El objetivo de este estudio fue evaluar la validez de los criterios OARSI-RCI, utilizando como patrón el grado de mejoría expresado por el paciente al final del período de tratamiento. Otro objetivo fue evaluar el impacto de la utilización de tres medidas diferentes de dolor en la definición de los criterios de mejoría.
Material y métodos
Participantes y diseño del estudio
Se seleccionó a 73 pacientes con diagnóstico de artrosis de rodilla, según los criterios del American College of Rheumatology (ACR)9, sintomáticos en el momento del cribado, para participar en un ensayo clínico multicéntrico, doble ciego, aleatorizado, de 6 semanas de duración, para la comparación de la seguridad y eficacia de 2 AINE (ketoprofeno frente a dexketoprofeno). Los datos utilizados para este análisis corresponden a los pacientes seleccionados en el Hospital Universitario Virgen Macarena de Sevilla. Las características de los pacientes se exponen en la tabla 1. El estudio fue aprobado por el comité ético de investigación del hospital.
Criterios de inclusión
Los pacientes debían tener una edad comprendida entre los 35 y 75 años; dolor en una rodilla de al menos 40 en una escala visual analógica (EVA) de 0 a 100; una puntuación de 4 a 15 en el índice de Lequesne (siendo 24 el máximo posible para dicho instrumento)10; evidencia radiográfica de artrosis de rodilla definida como al menos grado 2 según la clasificación de Kellgren y Lawrence11; dolor persistente en rodilla durante un período de reposo de la toma de AINE de dos semanas de duración y comprensión, capacidad y disposición para cumplimentar los cuestionarios. Además de cumplir los criterios de inclusión y exclusión que se citan más abajo, los participantes dieron su consentimiento por escrito, u oral con testigo, para participar en el estudio.
Criterios de exclusión
Fueron excluidos los pacientes que presentaron alguna de las siguientes características: artropatías inflamatorias, metabólicas o neuropáticas; necesidad de bastones o muletas para caminar; enfermedad vascular o neurológica grave que afectara a las extremidades inferiores; diagnóstico de fibromialgia; enfermedades concomitantes graves que pudieran interferir con la evaluación clínica del paciente; historia reciente de trastornos psiquiátricos, y cualquier antecedente que contraindicara la toma de AINE, como hipersensibilidad, enfermedad digestiva potencialmente hemorrágica, úlcera gástrica o duodenal activa, anemia importante, elevación de las enzimas hepáticas de más del doble de la normalidad, bronquitis asmática, hipertensión arterial (HTA) no controlada o insuficiencia renal grave.
Medidas
Se realizó una evaluación clínica basal y al finalizar el período de tratamiento (6 semanas). Fueron determinadas las siguientes medidas de desenlace: las subescalas de dolor, rigidez y dificultad del índice WOMAC (Western Ontario and McMaster Universities Osteoarthritis Index12) en formato de escala visual analógica (EVA) de 0 a 100, todas ellas referidas a las 72 h previas a la evaluación; el índice de Lequesne10 (escalas de dolor, rigidez y dificultad); dolor de rodilla en EVA de 0 a 100; valoración global del paciente y del médico en EVA de 0 a 100 y, finalmente, el grado de mejoría percibido por el paciente al final del período de tratamiento evaluado mediante una escala categórica (tipo Likert) compuesta por 7 puntos nominados con los adjetivos «mucho peor», «peor», «un poco peor», «igual», «un poco mejor», «mejor», «mucho mejor». Se pidió al paciente que identificara la rodilla más sintomática en el momento basal y que refiriera a esa rodilla sus evaluaciones posteriores.
Análisis
Tras un proceso de preselección, se realizó una visita de cribado, una basal, una intermedia de seguridad y una final tras las 6 semanas de tratamiento. A efectos de este análisis se consideraron las valoraciones clínicas obtenidas en el momento basal y después del período de tratamiento (6 semanas). Como requisito indispensable para la definición de los criterios de mejoría, se realizó un procedimiento de normalización de todas las puntuaciones de modo que todas se expresaran en una escala de 0 a 100. Como se indicó más arriba, los criterios OARSI definen la mejoría en función de los cambios relativo (porcentaje de mejoría con respecto a evaluación basal) y absoluto (mejoría en unidades absolutas sobre una escala de 0 a 100). Cada paciente del estudio fue clasificado como respondedor o no respondedor en función de la definición de mejoría. Los criterios OARSI-RCI fueron definidos independientemente con cada una de las medidas de dolor citadas más arriba. La validez (de criterio) de los criterios OARSI-RCI se evaluó estimando su sensibilidad (SE) y su especificidad (ES) en comparación con el grado de mejoría percibido por el paciente (MPP) expresado en la escala tipo Likert. Finalmente, se estimó la SE y ES de los criterios para cada una de las medidas de dolor (dolor en EVA, escala de dolor del índice WOMAC, y escala de dolor del índice de Lequesne).
Resultados
Se seleccionó a 73 pacientes (8 varones y 65 mujeres) con una edad media de 57,3 años (intervalo, 35-73) y una duración media de la artrosis de 74 meses desde el momento del diagnóstico. Las características clínicas basales de los participantes se exponen en la tabla 1. Sesenta y tres pacientes completaron la visita final tras el período de seguimiento de seis semanas. De los pacientes que abandonaron, 7 pacientes lo hicieron debido a efectos secundarios del AINE, en todos los casos de tipo gastrointestinal, y 3 por pérdida en el seguimiento tras la visita inicial o la visita de seguridad. Se utilizó el test de rangos de Wilcoxon para la comparación de los valores medios observados en el momento basal y a las 6 semanas. Al final del tratamiento se observó una mejoría estadísticamente significativa en todas las subescalas de dolor, rigidez y dificultad del índice WOMAC, dolor de rodilla en EVA y valoraciones globales de médico y paciente en EVA (tabla 2). A las 6 semanas, 20 (31,7%) participantes consideraron que estaban «un poco mejor», 12 (19%) que estaban «mejor» y 6 (9,5%) «mucho mejor»; de modo que, 38 ( 60,3%) participantes percibieron algún grado de mejoría con el tratamiento.
Cuando se utilizaron los criterios OARSI-RCI para definir mejoría, las cifras porcentuales correspondientes a pacientes que «respondieron» fueron las siguientes: 17 (27,9%) pacientes cumplieron el primer criterio (≥ 45% mejoría en dolor) y 29 (47,5%) cumplieron el primero o dos de los tres alternativos. La SE y ES difirieron dependiendo del criterio de mejoría aplicado (primer criterio OARSI frente a la serie completa), del grado de mejoría percibido por el paciente (MMP) y del tipo de medida utilizada para medir el dolor: EVA de 0 a 100, escala de dolor del índice WOMAC o escala de dolor del índice de Lequesne.
De este modo, en pacientes que habían evaluado la mejoría como «un poco mejor», la SE y ES del primer criterio OARSI de respuesta (disminución en dolor ≥ 45%) fueron de 0,37 y 0,87, respectivamente, cuando se usó como medida de dolor la EVA de 0 a 100 mm; en pacientes con nivel de MPP de «mejor» los valores fueron: SE = 0,50 y ES = 0,81, y en el grupo «mucho mejor» fueron: SE = 1,0 y ES = 0,80.
Cuando se consideró la definición completa de respuesta (tanto el primer criterio como los alternativos), los valores de SE y ES fueron los siguientes: cuando MPP fue definido como al menos «un poco mejor», SE = 0,60 y ES = 0,74; cuando fue definido como al menos «mejor», SE = 0,61 y ES = 0,58, y cuando MPP fue definido como «mucho mejor», SE = 0,83 y ES = 0,56,
Cuando se cambió la medida de dolor utilizada para la definición de mejoría (EVA de 0 a 100 frente a subescala de dolor del índice WOMAC o del índice de Lequesne) la SE y ES de los criterios también se modificaron (tablas 3 y 4). La SE y ES fueron muy similares entre sí cuando se usaron las subescalas de dolor de los índices WOMAC y de Lequesne; sin embargo la ES fue ligeramente inferior cuando se utilizó la EVA de dolor.
Discusión
Que sepamos, éste es el primer estudio relacionado con enfermedades reumáticas en el que se compara la validez de unos criterios de respuesta a tratamiento con la percepción de mejoría por parte del paciente. En esta muestra, y en comparación con el grado de mejoría percibido por el paciente, los criterios de respuesta OARSI-RCI mostraron valores de moderados a elevados de sensibilidad y especificidad para detectar diferentes grados de mejoría en pacientes con artrosis de rodilla. Por otra parte, los valores obtenidos de sensibilidad y especificidad fueron, en general, consistentes independientemente del tipo de medida de dolor empleada para la definición de los criterios.
En general, la sensibilidad de los criterios fue aceptable para detectar grados de mejoría más elevados pero relativamente baja para clasificar como respondedores a los pacientes con niveles inferiores de mejoría. Esto podría ser indicativo de que los criterios son relativamente exigentes, si bien la valoración de mejoría por parte del paciente, usada aquí como patrón, no debe ser considerada infalible. Otra lectura posible de estos resultados es que los criterios no abarcan todos los aspectos involucrados en la percepción de bienestar del paciente, que sí estaría mejor reflejada en sus valoraciones propias de mejoría. Lo que sugiere que los criterios podrían beneficiarse de la incorporación de una medida de percepción de mejoría como la que se ha descrito en este estudio. En detrimento de la validez de una medida de este tipo se puede argumentar que tal valoración puede verse afectada por un sesgo de aquiescencia por parte del paciente, pero es razonable pensar que el potencial sesgo introducido sería de tipo no diferencial (entre los grupos en estudio) y que por tanto no afectaría a los resultados obtenidos.
En conclusión, se ha demostrado la validez de los criterios OARSI-RCI para la valoración de mejoría en pacientes con artrosis de rodilla en tratamiento con AINE, y la consistencia de los criterios independientemente del tipo de medida de dolor utilizada. Son necesarios estudios adicionales para analizar el valor de la incorporación de medidas directas de mejoría en la definición de los criterios.