Aunque el número de publicaciones que presentan investigaciones científicas es cada vez más elevado, todavía existen ciertas dificultades para la traslación de sus resultados a la práctica clínica, de manera que esta no siempre refleja adecuadamente los conocimientos existentes. Este hecho se debe, al menos parcialmente, a que los estudios se diseñan teniendo en cuenta básicamente su validez interna, pero no suelen prestar la suficiente atención a la validez externa 1.
La validez interna se refiere al grado en que los resultados de un estudio son válidos (libres de error) para la población que ha sido estudiada 2. El ensayo clínico aleatorio (ECA) es el método más fiable para determinar la eficacia de un tratamiento, o en general de cualquier intervención sanitaria, debido a que es el diseño que tiene mayor validez interna, de manera que si se ha diseñado y ejecutado de forma adecuada, minimiza el riesgo de cualquier tipo de error y proporciona las evidencias de mayor calidad. Los aspectos relacionados con la validez interna de un ECA son ampliamente conocidos, de manera que su valoración por los profesionales es relativamente sencilla.
Sin embargo, a la hora de trasladar esta evidencia a la práctica clínica, el aspecto clave es determinar hasta qué punto podemos confiar en que, lo que es cierto para los pacientes que han participado en un estudio, también puede serlo para otros sujetos. Por lo tanto, cuando se trata de trasladar la evidencia disponible a la práctica clínica, lo importante es la validez externa, es decir, si es razonable suponer que, cuando se aplique la intervención a un grupo definido de pacientes en un entorno clínico determinado, se obtendrá el mismo resultado que el observado en el estudio. Obviamente, el estudio debe tener validez interna, ya que si no es cierto para los sujetos estudiados difícilmente lo será para otros.
Si bien el concepto de validez externa es fácil de entender en términos generales, en realidad es difícil de valorar y cuantificar en la práctica. Mientras que los determinantes de la validez interna son bastante intuitivos y conocidos, los de la validez externa dependen de la condición clínica concreta y de su manejo en la práctica clínica, y requieren más juicio clínico que análisis estadístico 3. En realidad, en el concepto genérico de validez externa se incluyen aspectos diferentes, como la generalizabilidad o la aplicabilidad 4.
La generalizabilidad se refiere al grado de confianza que se tiene de que los resultados obtenidos en la muestra estudiada pueden extrapolarse a la población de la que procede esta muestra. La valoración de esta característica se relaciona con la teoría estadística del muestreo, y tiene que ver fundamentalmente con el tamaño de la muestra y su representatividad en relación a la población de referencia. Este elemento es muy importante en los estudios transversales, ya que su objetivo es precisamente estimar un parámetro de esta población de referencia a partir del estudio de una muestra representativa de la misma. Sin embargo, en un ECA es más difícil de valorar, ya que habitualmente no se estudia una muestra seleccionada aleatoriamente de una población, sino que se incluyen consecutivamente sujetos atendidos en determinados centros y por determinados profesionales, que cumplen determinados criterios de selección y que además aceptan voluntariamente participar en el ensayo. Un análisis de ECA publicados en los campos de la cardiología, la oncología y la salud mental, concluye que en la mayoría de casos las muestras estudiadas no eran representativas de la población real que se atiende en la práctica, sino que habían sido seleccionadas por criterios muy restrictivos, excluyendo con frecuencia, por ejemplo, a los pacientes de mayor edad y con comorbilidades 5.
Por otro lado, que los resultados de un ECA sean generalizables no quiere decir necesariamente que sean aplicables. La aplicabilidad se refiere más al grado de confianza que se tiene de que las inferencias obtenidas a partir de los participantes en un estudio pueden utilizarse para la atención de pacientes de otras poblaciones en otros contextos. La valoración de la aplicabilidad se lleva a cabo determinando el grado de similitud entre dichas poblaciones y contextos, en términos de los factores que pueden afectar al pronóstico y los resultados.
Uno de los principales problemas actuales es que las publicaciones no suelen incluir la información necesaria para valorar estos aspectos. En un análisis de 134 ECA en los que había participado atención primaria, Braend y cols encontraron que la mayoría de artículos no incluían información sobre aspectos como el emplazamiento del estudio, el número de pacientes candidatos antes de la inclusión, la comorbilidad o la medicación concomitante, por lo que era difícil evaluar la validez externa de los resultados 6. Existen algunas iniciativas interesantes para intentar mejorar esta situación, como la propuesta de ampliar la figura CONSORT, incluyendo información sobre participación y representatividad, no sólo de los pacientes, sino también de los centros y de los profesionales, o sobre la sostenibilidad de la intervención una vez finalizada la financiación del estudio 7.
Este problema no es exclusivo de los ECA, sino que las revisiones sistemáticas (RS), que son precisamente la base para la elaboración de recomendaciones terapéuticas, también se centran en la validez interna de los estudios que incluyen, fundamentalmente ECA, y suelen proporcionar poca información sobre la validez externa, a menudo limitándose al número y tipo de centros en que se han llevado a cabo. Missiou constató la escasa discusión de la aplicabilidad en el ámbito de la atención primaria de las revisiones Cochrane, a pesar de que incluían específicamente ECA realizados en este ámbito asistencial 8.
Los grupos de trabajo e instituciones que realizan RS y elaboran recomendaciones y guías de práctica clínica (GPC) deberían valorar todo el conjunto de evidencias disponible para determinar hasta qué punto se puede esperar que los resultados observados se traducirán en efectos similares cuando se apliquen en la práctica clínica y en contextos reales. Por ejemplo, Fortin y Smith recomiendan considerar un amplio rango de diseños de investigación, y no sólo ECA, a la hora de valorar la evidencia sobre los efectos de las intervenciones en pacientes con condiciones crónicas múltiples 9.
Actualmente hay una evidente disparidad entre la información proporcionada por los ECA y las RS y la que realmente necesitan los clínicos, lo que podría explicar, al menos parcialmente, la falta de adherencia a las recomendaciones terapéuticas o la infrautilización en la práctica habitual de tratamientos que se han mostrado eficaces en ECA 3. Sería conveniente elaborar unas recomendaciones sobre qué información deberían incluir los artículos acerca de la validez externa para garantizar que las RS puedan considerarla 10.
Sería conveniente, por tanto, que los investigadores diseñaran estudios teniendo en cuenta también los aspectos relacionados con la validez externa de los resultados que esperan obtener, de los que dependerá en buena medida su aplicabilidad y utilidad en la práctica. En relación con las publicaciones, los autores, editores y revisores deberían prestar más atención a que los artículos incluyan la información necesaria para que los lectores puedan valorar la aplicabilidad de los resultados a sus propios pacientes y entorno. Y también que, al realizar RS y elaborar GPC, se valore, además de la validez interna de los estudios, toda la información útil para evaluar también la validez externa, a menudo procedente de estudios observacionales, y considerar en sus conclusiones y recomendaciones la aplicabilidad de los resultados.