Objective. To determine if the methods of reporting results of clinical trials affects the physician views on prescribing.
Design. Analysis of responses, from a convenience sample of primary care physicians, of one teaching exercise on prescribing intention which showed 5 different methods of reporting results: relative risk reduction (RRR), absolute risk reduction, the percent of event free patients, the number needed to treat (NNT) and RRR and mortality.
Setting. Curses of clinical management in Valencia and Barcelona.
Results. The willingness to prescribe was significantly influenced by the way in which data were presented, being major when they were showed as RRR and minor when mortality was added.
Conclusions. The method of reporting trial results has an important influence on the prescribing intention. The reporting of clinical trial results, and their abstracts or citations, should be include the NNT and negative results, for avoiding a subjective bias of treatment effect magnification.
Introducción
Pese a que las evidencias sobre la influencia de la investigación en los servicios sanitarios1,2 y en la práctica clínica3-4 son contradictorias, el movimiento «medicina basada en la evidencia» (MBE) está experimentando un notable crecimiento5. La MBE considera el ensayo clínico con asignación aleatoria de pacientes (ECA) el estándar para valorar la eficacia de las tecnologías sanitarias y la literatura MBE tiende a exhortar a los clínicos para que en la medida que lo permita la evidencia disponible basen sus decisiones sobre la eficacia demostrada por las diversas opciones diagnósticas o terapéuticas6-10.
Diversos trabajos han mostrado que la forma de presentar los resultados de los ensayos clínicos influye notoriamente en la propensión de los clínicos a prescribir fármacos o a utilizar programas preventivos o rehabilitadores11-17, así como en las decisiones de los pacientes18. La presentación usual de los efectos del tratamiento como reducción porcentual del riesgo relativo (RRR), aunque es técnicamente intachable, tiende a magnificar el efecto de la intervención, al describir del mismo modo situaciones muy dispares6,7,19,20. Así, cuando un ensayo clínico presenta la eficacia del cribado de cáncer de mama en mujeres de 50-64 años en forma de reducción relativa del 34% en la mortalidad específica a los 7 años de seguimiento21, el lector tiene que interpretar la relevancia clínica de este resultado en función de la prevalencia del cáncer de mama en su población y de la mortalidad absoluta. Por ejemplo, una RRR del 34% se obtendría por igual con una reducción absoluta de la mortalidad por cáncer de mama a los 7 años del 18 al 12%, que con la reducción de mortalidad mostrada en la realidad por este ensayo clínico (del 0,18 al 0,12%), cuando su significación clínica es bien diferente.
Las formas alternativas de presentación de resultados de los ECA, u otros tipos de estudio, son6,19,20,22: a) la reducción absoluta del riesgo (RAR), también denominada reducción de riesgo atribuible (de 0,18 a 0,12%, en el ejemplo anterior); b) el incremento en el porcentaje de pacientes libres (PPL) del episodio adverso que se utiliza como medida de la efectividad del tratamiento (del 99,82 al 99,88% en el ejemplo), y c) el número necesario de pacientes a tratar (NNT) para evitar el episodio adverso correspondiente (en el ejemplo anterior se requeriría el cribado de 1.571 mujeres para evitar una muerte). El cálculo y significado de estas medidas ha sido descrito en diversas publicaciones6,7,20,22 y es realizable sencillamente mediante algunos nomogramas6,23. Diversos autores han resaltado la necesidad de, como mínimo, acompañar la presentación de resultados de los ECA en forma de RRR con alguna de las medidas citadas, singularmente del NNT. Esto sería especialmente necesario cuando la incidencia del episodio adverso es baja, como suele ocurrir con los tratamientos preventivos en atención primaria.
El objetivo de este estudio es valorar si la forma de presentación de los resultados de los ensayos clínicos tiene influencia en la intención de prescribir fármacos, de los médicos de atención primaria de nuestro entorno.
Material y método
Durante el último trimestre de 1997 los autores participaron como docentes en diversos cursos de investigación en servicios de salud y gestión clínica dirigidos a atención primaria, en Valencia y Barcelona. Los asistentes realizaron, como parte de los ejercicios de los cursos, un cuestionario que preguntaba sobre su intención de utilizar 5 fármacos hipolipemiantes, supuestamente diferentes, en función de los resultados de sus respectivos ensayos clínicos.
De los 57 cuestionarios obtenidos (todos los de los alumnos presentes cuando se realizó el ejercicio), se han utilizado para el análisis los 44 correspondientes a médicos de atención primaria, aunque estuvieran desempeñando puestos de coordinador, gestión de área u otros no estrictamente clínicos. Se trata, pues, de una muestra de conveniencia, no representativa de los médicos de atención primaria. En el ejercicio se recogía, a pie de página, información sobre datos demográficos, puesto de trabajo actual y formación previa en epidemiología, aunque, dado el contexto en que se realizaba el ejercicio, no se insistió en su cumplimentación.
El cuestionario utilizado (anexo 1) es una adaptación de los empleados por Bobbio et al15 y Bucher et al16 en estudios similares realizados en Italia y Suiza. Ambos trabajos utilizaron datos del Helsinki Heart Study24, un ECA en el que 2.051 varones de 40-55 años fueron tratados durante 5 años con gemfibrozilo y 2.030 recibieron un placebo. Al completar el período de seguimiento, en el grupo tratado se habían producido 56 (2,73%) episodios cardíacos adversos (14 infartos de miocardio mortales y 42 no mortales) y 45 (2,19%) muertes por todas las causas; en el grupo control se produjeron 84 (4,14%) episodios cardíacos adversos (19 infartos mortales y 65 no mortales) y 42 fallecimientos (2,07%).
Los resultados se presentaron, siempre respecto a la presencia de episodios cardíacos adversos, como RRR (4,14-2,73/ 4,14*100 =34%), RAR (4,14-2,73 =1,41%), PPL (100-2,73=97,3% para el grupo tratado; 100-4,14=95,9%, para el grupo placebo), NNT (1/[4,14-2,73] *100=71) y, finalmente, combinando la presentación en forma de RRR con información de mortalidad, expresada en forma de incremento relativo de mortalidad (2,19-2,07/2,07*100=6% mayor en el grupo tratado). Tales resultados se presentaron a los asistentes a los cursos como provenientes de 5 diferentes ensayos clínicos con 5 hipolipemiantes distintos, solicitándoles que expresaran su intención de usar el respectivo fármaco en una escala de 0 (intención de no prescribir el fármaco) a 100 (intención segura de prescribir el fármaco).
Las respuestas se analizaron mediante el cálculo de la puntuación media para la intención de tratar con cada supuesto fármaco, con su respectivo intervalo de confianza, así como el cálculo de la mediana y la amplitud intercuartil. En 3 de los 5 casos la distribución de las puntuaciones era significativamente diferente de una distribución normal, conforme a los resultados de la prueba de Kolmogorov-Smirnov, por lo que se emplearon también pruebas no paramétricas.
Resultados
Para los que cumplimentaron los datos demográficos, de puesto de trabajo y formación previa, la edad media fue de 39,2 años (36 respuestas de 44), un 59% eran varones (32 respuestas), el 46% habían obtenido la especialidad vía MIR (26 respuestas) y un 50% habían realizado algún curso previo de epidemiología (40 respuestas). La mediana de la duración de estos cursos fue de 75 horas (12 respuestas).
La disponibilidad de los asistentes a los cursos a prescribir el fármaco varió ostensible y significativamente (p<0,001 en la prueba de rangos de Friedman) en función de la forma de presentación de los resultados (tabla 1, figs. 1 y 2). La presentación de los resultados como RRR obtuvo la mayor propensión a utilizar el correspondiente fármaco, pero quedaba en último lugar cuando se acompañaba de los resultados de mortalidad. La presentación como NNT, como RAR y PPL quedaron en situaciones intermedias. Aunque las dos últimas mostraron diferencias significativas con la RRR, éstas no existieron con el NNT (p>0,05 en la prueba de Wilcoxon).
Hay que señalar la amplia variabilidad de las puntuaciones, que en la práctica totalidad de los casos recorren toda la gama posible de valores. La prueba de Mann-Withwey no mostró diferencias entre las puntuaciones según sexo, formación MIR o entre quienes habían realizado o no cursos previos de epidemiología. Sólo 2 participantes señalaron que los datos del cuestionario podían corresponder al mismo ECA.
Discusión
Los resultados de este estudio son, en términos generales, coincidentes con otros similares realizados en otros países11-17 y, aun con la limitación de no representatividad de la muestra, orientan hacia que también en nuestro medio la intención de prescribir puede verse afectada por la forma de presentar los resultados de los ensayos clínicos, con una tendencia a la magnificación del efecto cuando éstos se presentan en forma de RRR. La implicación práctica de este resultado es que las publicaciones de ECA y demás estudios de eficacia o efectividad deberían incluir rutinariamente el NNT como forma de presentación de resultados, así como los datos suficientemente desagregados para que el lector pueda reconstruir cualquiera de las medidas. Esto sería especialmente importante en los resúmenes, sobre todo cuando se incorporan a sistemas informatizados de cada vez más fácil acceso, y que pueden ser mas leídos por clínicos en busca de información que los trabajos originales. Obviamente, esto no quiere decir que pueda prescindirse de la presentación del RRR, medida esencial para valorar el impacto del tratamiento en la población local, en función de una posible diferencia en la prevalencia de enfermedad respecto a la población del ensayo.
Cabe destacar que la presentación con el NNT ofreció puntuaciones más elevadas en este análisis (de hecho, no mostró diferencias significativas con el RRR) que en los trabajos en Suiza e Italia. Sin embargo, estos resultados se deben a un pequeño grupo de asistentes a los cursos que, probablemente a resultas del énfasis actual en la difusión de esta medida6-8,19,20,22-26, le otorgaron la máxima puntuación en intención de tratar, y sugiere la existencia de un efecto de «medida de moda». Aunque este trabajo no permite valorar hasta qué punto este efecto se traslada a la práctica, los clínicos deberían ser cautos a la hora de enjuiciar un estudio como bien realizado, simplemente porque incluye el NNT.
Un segundo resultado de interés es la variación en la intención de tratar cuando se ofrece información sobre los resultados negativos, como la mortalidad. Bobbio et al15 relatan que, mientras que en la publicación original del Helsinki Heart Study27 se presentaban todos los datos, en la reseña de la edición italiana de una prestigiosa revista internacional sólo se indicaba la reducción en infartos sin comentar las diferencias en mortalidad, desfavorables al grupo tratado. En este mismo sentido, en un trabajo pionero sobre el efecto de la forma de presentación de los resultados de los ECA, Naylor et al13 recogieron 6 formas en que habían sido presentados los resultados del Helsinky Heart Study en publicaciones en revistas científicas que lo reseñaban (tabla 2) y cuya lectura es sumamente ilustrativa del posible impacto de las formas de presentación de los resultados. En todo caso, el hecho de que la inclusión de la información sobre efectos negativos del tratamiento redujera drásticamente la intención de usar el fármaco, orienta hacia la necesidad de que las publicaciones de ECA (incluyendo sus reseñas en forma de editoriales, revisiones y otros, así como los resúmenes) recojan todos los resultados del estudio, y no sólo los favorables al tratamiento.
Del mismo modo, sería importante que los clínicos se plantearan si disponen de la información suficiente, tanto respecto a medidas de efecto como a resultados negativos, para interpretar correctamente la eficacia de un fármaco (o una prueba diagnóstica, o de cribado, u otras) cuando se plantean su utilización a partir de informaciones provenientes de fuentes comerciales.
Obviamente, la toma de decisiones clínicas es mucho más compleja de lo que recoge el cuestionario elaborado. Los médicos deben integrar diversas informaciones antes de trasladar a un paciente individual los resultados (de grupo) derivados de un ensayo clínico28, y ello sin contar otras influencias como el coste de los fármacos. Sin embargo, una presentación de los datos que dependa menos de la percepción subjetiva de los riesgos, probablemente contribuirá a mejorar este proceso.
Buena parte de los trabajos realizados sobre el efecto de presentación de los resultados se ha realizado utilizando ejemplos relativos a fármacos hipolipemiantes12,13,15,16. La utilidad de tales fármacos en prevención primaria es controvertida29-32, existiendo actualmente una ácida polémica respecto a su uso, al menos en determinados subgrupos de pacientes, incluido nuestro país33,34. Pese a ello, la prescripción de estos fármacos crece en muchos países desarrollados, situándose por lo general dentro de los 5-10 primeros lugares en ventas35. Aunque este trabajo no intenta abordar la polémica sobre el uso de hipolipemiantes en prevención primaria, sí ejemplifica que la decisión de los clínicos de utilizar un determinado tratamiento no depende sólo de la existencia de evidencias, sino también de la forma en que éstas se presentan. En este terreno, ofrecer la información de los ensayos clínicos de forma que se reduzcan sus inconsistencias, así como mejorar la formación de los clínicos en la evaluación de la literatura médica y de la información sobre la eficacia de los tratamientos, puede ser una estrategia valiosa para mejorar la calidad de la prescripción.