Introducción
En parte, la discusión acerca de la demostración de los efectos clínicos de la homeopatía es una metadiscusión sobre las pruebas disponibles. Diversos metaanálisis de ensayos aleatorizados, controlados, publicados en 1991, 1997 y 2000, indican un efecto específico de esta disciplina 1-3. Los meta-análisis de estudios, tanto acerca de homeopatía como de medicina convencional han sido motivo de críticas 4-6. Algunos autores sugieren que no hay diferencias entre los requisitos necesarios de las pruebas para la homeopatía y los de la medicina convencional 1,7. No obstante, la inverosimilitud del mecanismo de acción de la primera parece haber dado lugar a una amalgama de sesgos. Sterne et al 8 concluyeron que en el metaanálisis de Linde se pasó por alto el papel de la baja calidad en los estudios a pequeña escala. En un comentario sobre el análisis de la homeopatía, efectuado por Shang et al, publicado en agosto de 2005, y que hacía referencia a la hipótesis de los "estudios de baja calidad, a pequeña escala", el editor de The Lancet advirtió que "los médicos han de ser enérgicos y sinceros con sus pacientes acerca de la falta de beneficios de la homeopatía" 9. Vandenbroucke 10 llegó a la conclusión que este metaanálisis demostraba una mayor sensibilidad de un sesgo potencial de los ensayos sobre homeopatía que sobre medicina alopática.
En el Cochrane Handbook for Systematic Reviews se destaca: "Sólo pueden extraerse conclusiones fiables de los análisis preespecificados antes de examinar los resultados de los ensayos" 11. Esta preespecificación es más difícil porque la mayor parte de ensayos sobre homeopatía se ha analizado en metaanálisis previos. En el Cochrane Handbook se recomienda adicionalmente: "Sólo debe considerarse un metaanálisis cuando un grupo de ensayos sea lo bastante homogéneo por lo que respecta a participantes, intervenciones y resultados (variables) para proporcionar un sumario significativo". Por consiguiente, la combinación de las variables es cuestionable si la homeopatía es eficaz para algunos procesos y no para otros 12. Egger et al 13 mencionaron: "Si han de efectuarse análisis de subgrupo, han de ser lo más completos posible y deben incluir subgrupos y variables definidos en general a través de todos los ensayos de subgrupo". El metaanálisis es un procedimiento subjetivo, y Boden 14 advierte que puede convertirse fácilmente en un arma más que un instrumento.
En la introducción del artículo de Shang et al, las hipótesis predefinidas mencionadas fueron: "El sesgo en la conducción y publicación de los ensayos es una posible explicación de los hallazgos positivos de los ensayos controlados con placebo, tanto sobre homeopatía como sobre alopatía (medicina convencional)", y: "Estos sesgos tienen más probabilidades de afectar a los estudios a pequeña escala que a aquellos a gran escala; cuanto más pequeño es un estudio, mayor debe ser el efecto del tratamiento para que los resultados sean estadísticamente significativos, mientras que es más probable que los estudios a gran escala sean de calidad metodológica elevada y se publiquen aun cuando sus resultados sean negativos".
El análisis de Shang et al suscitó críticas porque los autores no incluyeron datos esenciales que respaldaran sus conclusiones 15-17. Al cabo de 4 meses, se revelaron los datos omitidos (www.ispm.ch). Dichos datos eran: a) ensayos excluidos; b) ensayos considerados de mayor calidad, y c) los ensayos (8 sobre homeopatía y 6 sobre medicina convencional) que dieron lugar a la conclusión final.
Preguntas
En diversas ocasiones se ha vuelto a analizar más o menos la misma serie de ensayos sobre homeopatía. La contradicción entre la conclusión de Linde, basada en 89 ensayos, y la de Shang et al, basada en 110, parece extraña. El análisis de Shang et al se presentó como un análisis comparativo que emparejaba 110 ensayos sobre homeopatía con 110 sobre medicina convencional por indicaciones. La conclusión se basó en 8 del primer grupo y en 6 del segundo.
Los datos pospublicación nos permitieron reconstruir el análisis, a pesar de que se presentaron en forma de gráficos y no como números brutos. En un artículo reciente, publicado por los autores del presente estudio, "Las conclusiones sobre la eficacia de la homeopatía dependen en gran medida del grupo de ensayos analizados", se reanalizan los datos de los artículos originales, se efectúan análisis de sensibilidad y se estima la influencia de la heterogeneidad 18. Su grado sustancial sugiere que este factor no se consideró en absoluto. No se encontró una explicación razonable para la elección del valor de corte de los "ensayos a mayor escala".
Después de estas conclusiones básicas, persisten diversas preguntas:
— ¿Cuál fue el resultado (variable) de las hipótesis preespecificadas?
— ¿Fueron ambos métodos comparables?
— ¿Estuvo justificada la selección de un subgrupo?
— ¿Cuál es la influencia de los tratamientos ineficaces?
— ¿Estuvo justificada la conclusión final?
— ¿Se omitieron datos esenciales del artículo original?
Métodos
Se analizaron los datos revelados más tarde y se investigó qué hipótesis se probaron. En la página web del Institute of Social and Preventive Medicine (ISPM) se presentaban gráficos, pero no datos acerca de la magnitud del efecto y los intervalos de confianza (IC). Se reconstruyeron las odds ratios (OR) y los IC de los 21 estudios de mayor calidad sobre homeopatía a partir de los artículos originales. Los datos se procesaron y analizaron con métodos idénticos o equivalentes a los del análisis de Shang et al. Se verificaron los resultados con los datos de estos autores y, acto seguido, nos concentramos en estos 21 estudios de mayor calidad porque la conclusión se basó en los de mayor calidad, a mayor escala. Para estos ensayos, se efectuó un metaanálisis de efectos aleatorios y se estimó la OR combinada. Para algunos de los ensayos excluidos por Shang et al, pero considerados de calidad apropiada por Linde et al, se estimaron las OR y los IC. Efectuamos metaanálisis para otros grupos elegibles de ensayos. Se examinó la comparabilidad y emparejamiento de los ensayos. Este análisis se comparó con las publicaciones citadas en la bibliografía para verificar la predefinición de las hipótesis. Se evaluó la influencia de algunas elecciones subjetivas, como la calidad y los valores de corte para el tamaño de la muestra y se efectuaron análisis de sensibilidad para verificar la influencia de las diferentes indicaciones. Se utilizó el programa SAS/Stat® versión 9.1.
Resultados
Shang et al presentaron su estudio y conclusiones como una comparación de los efectos de la homeopatía y la medicina convencional. Para reconstruir su investigación, se tuvieron que formular diversas hipótesis no predefinidas por Shang et al para llegar a sus conclusiones. En este proceso se perdió la comparabilidad de los grupos de ensayos sobre ambas disciplinas.
Hipótesis predefinidas
Shang et al falsificaron la primera hipótesis predefinida (que la calidad de la homeopatía es peor que la de la medicina convencional). Los tamaños medianos de la muestra fueron los mismos: 65,5 en homeopatía y 65 en medicina convencional. Los efectos de ambas fueron similares: el 95 % de las OR variaron desde 0,12 hasta 1,65 para la primera y desde 0,13 hasta 1,52 para la segunda. De acuerdo con Shang et al, "la mayoría de OR indicaron un efecto beneficioso de la intervención". En el grupo de homeopatía (incluidos los ensayos no publicados), 21 (19 %) eran de mayor calidad y en el grupo de medicina convencional el número fue de 9 (8 %). En los estudios sobre homeopatía la calidad global fue mejor que en el grupo de medicina convencional (p = 0,03).
Calidad en los estudios de pequeño tamaño
Para su segunda hipótesis predefinida, Shang et al hicieron referencia a Sterne et al 8 cuando afirmaron que el sesgo de calidad está influido principalmente por la de los estudios a pequeña escala. En su opinión, los efectos del tratamiento podrían ser mayores en los ensayos de alta calidad, a pequeña escala, debido a una mejor selección de pacientes. Por otra parte, si la calidad es baja, los efectos se sobrestiman. En ambos casos, se observa una asimetría del gráfico en embudo, pero, en el primero, no indica un sesgo y, si los ensayos de mayor tamaño con una peor selección de pacientes no indican un efecto, la conclusión de que el efecto del tratamiento es un placebo no está justificada.
Los datos pospublicación mostraron qué estudios se consideraron de mayor calidad. Se eligió n< 100 como valor de corte para los de menor tamaño. Shang et al eligieron n < 98 para los estudios sobre homeopatía y n< 146 para los de medicina convencional (ver más adelante). De los 83 ensayos, hubo 14 de mayor calidad (16,9 %) sobre homeopatía con n < 100. De los 78 ensayos, hubo 2 estudios de mayor calidad (2,6 %) sobre medicina convencional con un tamaño de la muestra < 100 19,20. Por consiguiente, la hipótesis de que los estudios de pequeño tamaño, de baja calidad, son responsables de los hallazgos positivos en homeopatía es, en gran parte, una falsificación (p = 0,003, prueba de la probabilidad exacta de Fisher). Hay una diferencia estadísticamente significativa de la calidad de los estudios de menor tamaño que favorece la homeopatía.
Puesto que la calidad de los estudios sobre ambas medicinas no fue comparable, tampoco fue válida la comparación de los efectos de ambos métodos. La hipótesis subyacente del análisis de Shang et al fue que los resultados no pueden compararse si la calidad es diferente. Puesto que se puso tanto énfasis en la relación entre la calidad y el resultado, proseguimos con nuestras observaciones concernientes a dicha relación, aunque no se compararon los efectos de ambas disciplinas.
Comparabilidad
La comparación de ambos métodos adoleció de imperfecciones debido al sesgo de publicación. Los 110 ensayos sobre homeopatía estuvieron emparejados por indicación con los 110 sobre medicina convencional. Sin embargo, todos estos últimos se publicaron como artículos en revistas mientras que 16 (15 %) de aquellos sobre homeopatía no se publicaron. De acuerdo con Shang et al, la probabilidad de publicar resultados sobre medicina convencional es mayor si son significativos (OR combinada = 2,4; IC del 95 %, 1,4-4,0) 21. Por lo tanto, en la comparación de los efectos, la homeopatía está en desventaja por la inclusión selectiva de los ensayos no publicados, pero esto también afecta a la comparación de la calidad. Shang et al describieron (en los datos pospublicación) que ninguno de los 16 ensayos no publicados sobre homeopatía era de mayor calidad. Entre los publicados, la proporción de ensayos de mayor calidad fue del 22 % (21 de 94), en lugar del 19 %, descrito en el artículo original.
No se investigó adicionalmente un posible sesgo de selección mediante la exclusión de ensayos, pero nos sorprendió la exclusión del ensayo de Wiesenauer sobre poliartritis crónica 22. Éste fue un ensayo a mayor escala (n = 176), de buena calidad, de acuerdo con Linde, con resultados positivos 2.
Este ensayo habría contribuido positivamente al resultado de los ensayos de mayor calidad, a mayor escala. Shang et al lo excluyeron porque no pudo encontrar un ensayo para emparejarlo.
Los subgrupos se seleccionaron en función de la calidad. Esta selección influyó adicionalmente en el emparejamiento por indicación y, por lo tanto, en la comparabilidad. El grupo homeopatía contenía 21 estudios "de mayor calidad" y el convencional, 9. En este punto sólo 4 estudios sobre homeopatía se emparejaron por indicación con aquellos sobre medicina convencional (19 %). Desde este punto en adelante, el estudio de Shang et al consistió en 2 metaanálisis no comparables de los efectos, uno sobre homeopatía y el otro sobre medicina convencional.
No es posible seguir evaluando las diferencias en el efecto entre métodos si se altera el emparejamiento. Esto puede demostrarse mediante la comparación de los resultados para el dolor muscular. Los datos pospublicación demuestran que ninguna de las 2 disciplinas es eficaz para esta indicación (fig. 1). Sin embargo, los estudios sobre homeopatía son de "mayor calidad", mientras que aquéllos sobre medicina convencional no lo son. Esta diferencia fue de importancia fundamental en el subgrupo que dio lugar a la conclusión final.
Figura 1 Comparación de los efectos de la homeopatía y la medicina convencional sobre el "dolor muscular". No se consideran los otros ensayos del grupo "síntomas osteomusculares". Los 4 estudios concernientes a dolor muscular para ambas disciplinas están indicados por los nombres de los autores. N: tamaño del ensayo. Fuente: www.ispm.ch.
La indicación de "dolor muscular" tiene la mayor influencia en los resultados para los estudios sobre homeopatía y en la comparación entre estudios sobre ambas disciplinas, porque 4 estudios sobre homeopatía se clasificaron como de mayor calidad frente a ninguno para los de sobre medicina convencional. Uno de los ensayos sobre homeopatía también fue a gran escala y, por lo tanto, mayor en el gráfico en embudo. Este ensayo inclina este gráfico a la derecha (hacia una OR = 1,0), mientras que los ensayos de menor tamaño para esta indicación lo inclinaron a la izquierda, porque el punto fundamental se sitúa sobre estos ensayos. Hay una influencia potente del azar en este número limitado de indicaciones.
No consideramos la pertinencia clínica, pero uno podría sorprenderse por la inclusión de tratamientos que posiblemente no se usan debido a efectos adversos graves. En la discusión Shang et al se menciona que una limitación de su estudio fue que no prestaron atención a los efectos adversos. Valoraron los estudios de mayor tamaño como un parámetro de calidad y extrapolaron los efectos a los de mayor tamaño. Esta extrapolación es cuestionable si estos estudios incluyen tratamientos que no están disponibles debido a efectos adversos de gravedad. En un ensayo de mayor tamaño y de mayor calidad sobre pérdida de peso la homeopatía careció de efecto 23. El estudio emparejado sobre medicina convencional demostró un efecto positivo considerable de la dexfenfluramina 24, pero la Food and Drug Administration (FDA) retiró este fármaco del mercado en 1997 debido a graves complicaciones cardíacas 25. En otros 2 estudios de mayor tamaño, el anticonceptivo deladumona (testosterona más estradiol) para inhibir la lactación y el piroxicam para lesiones de tejidos blandos adolecieron del mismo problema 26,27. La FDA también retiró estos 2 fármacos debido a efectos adversos 28,29. Es posible que también sea difícil comparar otros tratamientos debido a la tolerabilidad/toxicidad, como el tamoxifeno para el síndrome de tensión premenstrual 30.
Posible sesgo en la selección de subgrupos
La conclusión de Shang et al se basó en la comparación de los ensayos "de mayor tamaño y de mayor calidad". En este caso, las posibles limitaciones son la falta de comparabilidad, heterogeneidad y los criterios subjetivos de la calidad y tamaño de la muestra.
La subjetividad de la interpretación de la calidad se demuestra por las diferencias entre los autores de los meta-análisis. Shang et al no clasificaron como de buena calidad los estudios mencionados más adelante, aunque en el meta-análisis de Linde et al 2 se citaron entre los 10 de mayor calidad: De Lange¿de Klerk 31, Reilly et al 32, Hofmeyr et al 33, Reilly et al 34 (tabla 1).
Si se añaden estos 4 estudios, la OR combinada de Shang et al de 25 ensayos llega a ser de 0,74 (IC del 95 %, 0,59¿0,94). ¿Por qué no deberíamos valorar estos estudios como de mayor calidad? Schulz et al 35 demostraron que la ocultación inadecuada de la asignación al tratamiento es el factor más importante de influencia en la calidad, asociado con una exageración del efecto del 41 % (IC del 95 %, 27¿52 %). Los otros factores de calidad tienen menos influencia; generación de una secuencia 15 % (IC del 95 %, 12¿19 %), doble enmascaramiento 17 % (IC del 95 %, 4¿29 %). La puntuación de Jadad para la calidad utilizada por Linde et al no considera la ocultación de la asignación. Estos 4 ensayos en el meta-análisis de este autor obtuvieron puntuaciones de Jadad máximas, y que sepamos, también incluyeron una ocultación adecuada de la asignación. No se puede estimar la influencia del efecto de las elecciones relativas a la calidad, porque, después del estudio de Linde et al, se publicaron nuevos ensayos, y algunos de los de menor calidad del metaanálisis de Linde et al se consideraron de mayor calidad. Sin embargo, en combinación con una definición poco clara del tamaño de una muestra "a mayor escala", esta subjetividad en la definición de la calidad abre una diversidad de posibles subgrupos que podrían considerarse ensayos "a mayor escala, de mayor calidad".
Odds ratiocombinada de todos los estudios de mayor calidad
Se reconstruyeron las OR y los IC de los 21 estudios de mayor calidad seleccionados por Shang et al 36-55.
Mediante un análisis de efectos aleatorios para los 21 estudios de mayor calidad sobre homeopatía, la OR combinada es de 0,76 (IC del 95 %, 0,59¿0,99), lo que no es compatible con la hipótesis de un efecto placebo 18.
Valor de corte para el tamaño de la muestra
En el análisis de Shang et al no se mencionaron o explicaron los valores de corte para el tamaño de la muestra. ¿Por qué se compararon 8 ensayos sobre homeopatía con 6 sobre medicina convencional? ¿Fue esta elección predefinida o post hoc? Los datos pospublicación demostraron que los valores de corte para los estudios de mayor tamaño, de mayor calidad, difirieron entre ambos grupos. En el grupo sobre homeopatía el valor de corte fue n = 98, incluidos los 8 ensayos (el 38 % de los de mayor calidad). Para los estudios de mayor tamaño sobre medicina convencional, el valor de corte en este análisis fue n = 146, incluidos 6 (66 %) de los de mayor calidad. Estos valores de corte son considerablemente mayores que el tamaño mediano de la muestra. Hubo 31 ensayos sobre homeopatía de mayor tamaño que el valor de corte establecido para estos estudios y 24 sobre medicina convencional de mayor tamaño que el valor de corte establecido. No se nos ocurre ningún criterio que pueda ser común a ambos valores, lo que sugiere que esta elección fue post hoc.
Efecto de los ensayos de mayor tamaño, de mayor calidad
Shang et al decidieron que, partiendo de este subgrupo, los efectos de la homeopatía son una respuesta placebo. En la tabla 2 se citan los estudios que constituyen las pruebas para la conclusión de los autores.
Las 2 series de ensayos no son comparables y son heterogéneas con una OR combinada = 0,88 (IC del 95 %, 0,65¿1,19) para la homeopatía. Sólo 2 estudios sobre homeopatía 38,40 pudieron emparejarse con los de medicina convencional 56-58. El grupo de estudios sobre homeopatía consistió en 8 ensayos sobre 8 indicaciones diferentes. Egger et al 59 advirtieron: "Con frecuencia, las opiniones divergirán acerca del método correcto para emprender un metaanálisis particular. Por esta razón, siempre debe examinarse hasta qué punto los hallazgos son robustos para las diferentes asunciones en un análisis de sensibilidad exhaustivo" . Nuestro análisis de sensibilidad demostró que, si de los 8 ensayos de mayor tamaño y mayor calidad sobre homeopatía se omite el ensayo de Vickers en el dolor muscular, la OR global se reduce desde 0,88 hasta 0,80, aunque sigue siendo no significativa (IC del 95 %, 0,61¿1,05).
Tratamiento poco corriente e ineficaz
El análisis de sensibilidad de los estudios de mayor calidad reveló una indicación con 4 estudios: la administración del remedio homeopático arnica para el dolor muscular después de carreras de larga distancia 37,49,50,52. El efecto combinado de estos estudios favoreció a placebo, OR = 1,30 (IC del 95 %, 0,96¿1,76). Puesto que el tratamiento de individuos sanos es excepcional en el ejercicio de la homeopatía, este resultado se caracteriza por una validez externa reducida para evaluar su efecto como método. Se omite el hecho de que la medicina convencional tampoco sea eficaz para esta indicación (fig. 1) debido a la interrupción del emparejamiento en esta indicación.
Conclusión final
La conclusión final de que los efectos de la homeopatía son una respuesta placebo (y la medicina convencional no lo es) adoleció de diversas limitaciones basadas en:
— Los ensayos sobre homeopatía y medicina convencional no fueron comparables.
— La heterogeneidad no permite extraer conclusiones sobre el efecto.
— Se omitió el análisis de sensibilidad.
— El valor de corte para los ensayos de mayor tamaño fue decisivo.
¿Hasta qué punto fueron esenciales los datos omitidos?
En la tabla 3 se resumen las conclusiones que sólo pudieron extraerse de los datos pospublicación. Estos datos proporcionaron todas las respuestas a las preguntas mencionadas previamente, excepto una: el hecho que la calidad global fue mejor en los ensayos sobre homeopatía.
Otro resultado posible
Con frecuencia, en los metaanálisis han de efectuarse elecciones subjetivas. Se evaluó la influencia de algunas de estas elecciones en este caso: la indicación "dolor muscular", el valor de corte y la interpretación de la calidad. No se consideró la exclusión de los ensayos, el sesgo de publicación, sesgo de calidad u otros posibles sesgos. En la tabla 4 y la figura 2 se muestra la influencia de los valores de corte tras la exclusión de los ensayos sobre dolor muscular. En la tabla 4 se proporcionan algunas OR combinadas y los IC para los "ensayos a mayor escala", con y sin los ensayos de Linde desechados por Shang et al. Si se elige un tamaño mediano global (n = 65) como corte, se elimina la mitad de todos los ensayos. Parece un valor de corte razonable para los estudios de mayor tamaño.
Figura 2 Indica que los 20 posibles valores de corte excepto 3 dan lugar a un efecto significativo si se consideran todos los ensayos de mayor calidad. Las excepciones son n = 144 (que incluyó 6 ensayos), n = 122 (7 ensayos) y n = 98 (10 ensayos). Si el punto de corte es inferior, n = 98, los resultados combinados de los estudios de mayor calidad son estadísticamente significativos.
La figura 2 muestra la OR combinada¿acumulada (incluidos los ensayos de Linde omitidos por Shang et al) si se aumenta paso a paso el número de estudios incluidos de mayor calidad, empezando con los 2 de mayor tamaño.
La adición de los 4 "ensayos de Linde" no cambia los efectos, pero cambia el valor de corte más desfavorable desde el ensayo 7 al 10. Desechar la indicación de "dolor muscular" reduce la OR combinada desde 0,88 a 0,80. Típicamente, las revisiones Cochrane se basan en 8-10 estudios 60 y son homogéneas por lo que respecta a la indicación. Linde llegó a la conclusión de que no estaban disponibles pruebas suficientes para una enfermedad o dolencia individual 2. Sin embargo, los 110 ensayos de Shang et al incluyeron 8 sobre homeopatía para la infección aguda de las vías respiratorias superiores, sin pruebas de un sesgo de calidad y con una magnitud considerable del efecto (OR = 0,36, IC del 95 %, 0,26-0,50). Para el dolor muscular después de correr una maratón, el remedio homeopático arnica es claramente ineficaz.
Discusión
Se encontraron indicaciones de que la hipótesis de Shang et al y, por lo tanto, su conclusión fueron sensibles a las elecciones subjetivas y a la influencia de una indicación, y que los subgrupos en los que se basaron las conclusiones no eran comparables. Los datos omitidos fueron de importancia decisiva, y su investigación socava gravemente la conclusión de que los efectos de la homeopatía son una respuesta placebo.
Calculamos una serie de posibles OR combinadas para el efecto de la homeopatía como método, con la exclusión de la indicación para la que no es eficaz, para mostrar la posición aislada de la hipótesis de Shang et al. Con la consideración de todas las OR combinadas, se detecta un efecto, pero, en algunos casos, el IC incluye 1,0, en función de la definición de "ensayo de mayor tamaño". La calidad de la serie en conjunto (p = 0,03) y la de los estudios de pequeño tamaño (p = 0,003, prueba exacta de Fisher) son mejores en homeopatía que en medicina convencional. La hipótesis placebo también se falsifica si sólo se consideran los estudios de mayor calidad. La comparación de ambas disciplinas se vio limitada por la inclusión de ensayos no publicados en el grupo exclusivo sobre homeopatía y, posiblemente, por la exclusión de ensayos. La conclusión de Shang et al se basa en un subgrupo de 8 ensayos en 8 indicaciones diferentes y no en un análisis comparativo. Nuestro análisis de sensibilidad mostró que una indicación y un valor de corte específico desempeñaron un papel decisivo en la conclusión final. La adición de los mejores ensayos de Linde no alteró los resultados globales de Shang et al, pero aumentó el número de ensayos de mayor calidad (de mayor tamaño) y el efecto de los 8 mayores, de mayor calidad, llegó a ser significativo (OR = 0,73; IC del 95 %, 0,59¿0,91).
Los efectos ligeros pueden ser clínicamente pertinentes. En un metaanálisis sobre tratamiento con estatinas e incidencia de ictus hemorrágico, Vergouwen et al 61 encontraron un efecto de la OR = 0,88. Es la misma OR que la del subgrupo final de Shang. En el caso de las estatinas, el IC del 95 % está por debajo de 1,0 porque el tamaño de la muestra combinada es extenso. Un tamaño insuficiente de la muestra y la heterogeneidad podrían fácilmente dar lugar a un error de tipo II (falso negativo) si la OR = 0,88.
Shang et al compararon la homeopatía y la medicina convencional por lo que respecta a la calidad y el efecto, pero, originalmente, emparejaron los ensayos por indicación. La calidad y el efecto están interrelacionados; los ensayos de mejor calidad muestran menos efecto. Por consiguiente, cuando la calidad no se empareja, la comparación de los efectos es cuestionable. Acto seguido, seleccionaron subgrupos emparejados para la calidad, pero esto interrumpió el emparejamiento por indicación. Al final, la conclusión sobre el efecto de la homeopatía se basó en un metaanálisis de una selección de ensayos. La eliminación de ensayos para algunas indicaciones, porque no son comparables, podría causar un sesgo de selección. Esta selección, podría haber tenido más influencia en la conclusión final (positiva o negativa) de lo que pudo detectar nuestro nuevo análisis de los 21 ensayos. El emparejamiento insuficiente por indicación en los subgrupos finales de los 8 ensayos sobre homeopatía y los 6 sobre medicina convencional no permitió una comparación de los efectos. Asumimos el emparejamiento por indicación cuando probamos la hipótesis del sesgo de calidad en los ensayos a menor escala. Los subgrupos de estos ensayos: 78 (homeopatía) y 83 (medicina convencional) están en buena parte (82 %), pero no por completo, emparejados por indicación.
Shang et al decidieron no tener en cuenta la toxicidad/ tolerabilidad. Esto redujo la pertinencia de la comparación de los efectos de ambas disciplinas. En este análisis algunos tratamientos de medicina convencional no están disponibles debido a efectos adversos graves.
También se efectuó un análisis de metarregresión de los 21 ensayos de buena calidad y se encontró una asimetría del gráfico en embudo. Si se extrapolan las OR por metarregresión, no se detectan diferencias entre la homeopatía y placebo con un número extremo de las muestras. Se considera que esto no es pertinente para esta discusión. Sterne et al 8 indicaron que la asimetría en los ensayos de buena calidad no se debe al sesgo, sino a los efectos más potentes de los ensayos de menor tamaño. Esto podría interpretarse como la prueba de que la asimetría en la serie de 110 ensayos sobre homeopatía no se debe al sesgo. Sin embargo, a partir de la estadística matemática, es bien conocido que estas metarregresiones son imprecisas, en particular cuando el número de observaciones es reducido. La asimetría de los ensayos sobre homeopatía y medicina convencional no puede compararse, porque hay una diferencia significativa en el número de ensayos más pequeños, de buena calidad, entre ambas disciplinas. El tamaño diferente en los ensayos emparejados también desempeña un papel en la asimetría del gráfico en embudo: ambas medicinas son ineficaces para el dolor muscular, pero la homeopatía es mayor en el gráfico en embudo porque los ensayos son de mayor tamaño. La influencia de esta indicación en la asimetría es opuesta para ambas disciplinas. También se podría cuestionar el papel de los fármacos con efectos potentes pero con efectos adversos graves en la asimetría. En 3 ensayos sobre tratamientos de medicina convencional que se han retirado del mercado debido a efectos adversos graves, se detectaron amplias magnitudes del efecto y pequeños errores estándar y, por lo tanto, tuvieron una influencia positiva considerable en la asimetría y el efecto extrapolado del gráfico en embudo de los ensayos sobre medicina convencional. La diferencia en el sesgo de publicación también tiene una influencia en la posición del gráfico en embudo.
No se investigó la influencia de las elecciones subjetivas en la OR de los ensayos sobre medicina convencional. Creemos que hay objeciones metodológicas que impiden una comparación de los efectos en este análisis. Además, la pertinencia clínica de una comparación de esta índole es reducida. La homeopatía se usa, sobre todo, después del fracaso de la medicina convencional, de modo que la indicación para su uso es diferente. Esta disciplina se valora en alto grado por su tolerabilidad/falta de toxicidad. La congruencia científica del análisis comparativo de Shang et al reside en la comparación de la calidad. La calidad de los ensayos fue un aspecto importante en la discusión sobre las pruebas y la inverosimilitud.
El hecho de que el efecto combinado de la homeopatía con exclusión de la indicación "dolor muscular" sea positivo no significa que sea eficaz para todas las demás indicaciones. Si se excluyen los ensayos sobre gripe o los ensayos de Jacob sobre diarrea, los resultados dejan de ser estadísticamente significativos. Puesto que nuestro nuevo análisis es post hoc, no se pueden extraer conclusiones acerca de la eficacia.
En este análisis no se considera la pertinencia clínica de los ensayos, pero los médicos deben interesarse en el hallazgo de Shang et al de que 8 ensayos demostraron un efecto sustancial de la homeopatía en las infecciones agudas de las vías respiratorias superiores (OR = 0,36; IC del 95 %, 0,26-0,50), sin indicaciones de sesgo.
Conclusión
Una revisión de los datos proporcionados después de la publicación del análisis de Shang et al no respaldó la conclusión de que la homeopatía sea un efecto placebo. Los autores entremezclaron la comparación de la calidad y la de los efectos, y, por lo tanto, se perdió el emparejamiento. La comparación de los efectos también fue imperfecta debido a las elecciones subjetivas y a la heterogeneidad. El resultado en el subgrupo a partir del que se extrajo la conclusión estuvo influido adicionalmente por la elección del valor de corte para los ensayos "de mayor tamaño". Si nos limitamos a las hipótesis predefinidas y a la parte de este análisis que es compatible con un diseño comparativo, la única conclusión legítima es que la calidad de los ensayos sobre homeopatía es mejor que la de aquéllos sobre medicina convencional, para todos (p = 0,03), al igual que para los de menor tamaño con n< 100 (p = 0,003).
Agradecimientos
Agradecemos la ayuda estadística proporcionada por Rainer Lüdtke.
*Publicado en: Homeopathy. 2008;97:169-77 (doi: 10.1016/j.homp.2008.09.008). *Autor para correspondencia.
Correo electrónico:lexrtn@concepts.nl (A.L.B. Rutten).
Recibido el 11 de enero de 2008; aceptado el 11 de septiembre de 2008