Hemos leído con interés el trabajo de Calicó et al1. Por un lado, felicitarlos por investigar sobre pruebas diagnósticas (PD), ya que son estudios poco populares pero importantes para hacer tratamientos efectivos2. Por otro lado, estos estudios deben seguir una metodología básica3 que facilite su validez externa e interna, además de contribuir a evitar la introducción en la clínica de PD incorrectamente evaluadas, lo que podría suponer la toma de decisiones erróneas con consecuencias adversas4.
Los autores consideran que la estimación puntual de parámetros (sin intervalos de confianza [IC] del 95%) es válida, lo que no es correcto, ya que todas las determinaciones puntuales están sujetas a error aleatorizado, cuya magnitud depende del tamaño muestral y la dispersión de observaciones individuales, por tanto, con PD no es válido no calcular IC del 95% y sustituirlos por el valor de p3,5. Además, basan sus conclusiones sobre validez y utilidad de las pruebas que evalúan en los valores de sensibilidad y en los valores predictivos (VVPP) lo que tampoco es correcto, ya que aunque la sensibilidad y la especificidad definen completamente la validez de las pruebas, independientemente de la prevalencia (Pv) en la población a la que se aplica carecen de utilidad práctica clínica, ya que proporcionan información acerca de la probabilidad de tener un resultado positivo o negativo en función de la verdadera condición del enfermo con respecto a la enfermedad. Sin embargo, cuando realizamos alguna prueba, carecemos de esta información a priori. Por el contrario, los VV. PP. sí están influidos por la Pv, de manera que si la tasa de enfermedad es baja, un resultado negativo descartará la enfermedad con mayor seguridad, y el valor predictivo negativo será mayor. Por el contrario, un resultado positivo no permitirá confirmar el diagnóstico, y resultará un bajo valor predictivo positivo3. De todo esto se deduce que los VV. PP., al ser dependientes de la Pv en cada lugar, tampoco pueden utilizarse como índices para comparar 2 métodos diagnósticos diferentes ni tampoco para extrapolar resultados de otros estudios al nuestro2,3,5. Por tanto, debemos calcular el coeficiente de probabilidad positivo y el coeficiente de probabilidad negativo (CPN), que son clínicamente útiles y, al no depender de la Pv en cada lugar, permiten comparar estudios diferentes2,3,5. Conceptualmente, miden la probabilidad de un resultado concreto (positivo o negativo) según la presencia o la ausencia de enfermedad3. Si los calculamos en este estudio (tabla 1), además del resto de parámetros con sus IC del 95%, vemos que el coeficiente de probabilidad positivo de la inmunofluorescencia directa y del enzimoinmunoanálisis es elevado (ambas pruebas sirven para diagnosticar la infección), pero como sus IC del 95% se solapan, no podemos decir qué prueba es mejor. En cuanto al CPN, tanto la inmunofluorescencia directa como el enzimoinmunoanálisis presentan cierta tendencia a descartar la infección, sin poder concluir que una sea mejor que la otra al solaparse sus IC del 95% (una prueba se considera útil si su CPN es menor de 0,1).
Valores de las pruebas diagnósticas estudiadas
Parámetros | IFD, estimación puntual (IC del 95%) | EIA, estimación puntual (IC del 95%) |
Sensibilidad | 66,67% (42,81–90,52) | 93,33% (80,71–100) |
Especificidad | 98,36% (95,17–100) | 96,72% (92,25–100) |
Valor predictivo positivo | 90,01% (73,92–100%) | 87,50% (71,29–100) |
Valor predictivo negativo | 92,31% (85,83–98,79) | 98,33% (95,09–100) |
Coeficiente de probabilidad positivo | 40,67 (5,63–293,52) | 28,47 (7,24–111,99) |
Coeficiente de probabilidad negativo | 0,34 (0,12–0,39) | 0,07 (0,01–0,46) |
EIA: enzimoinmunoanálisis; IC: intervalo de confianza; IFD: inmunofluorescencia directa.
Tanto autores como correctores debemos ser conscientes de todos estos detalles con el fin de mejorar, entre todos, el nivel científico y la utilidad de las PD. Así, Gómez Sáez et al4 en un magnífico estudio han puesto de manifiesto la escasa calidad metodológica de los trabajos sobre estudios diagnósticos que se publican en España, en concreto entre 2004 y 2007; de los 18 artículos sobre diagnóstico publicados en Enfermedades Infecciosas y Microbiología Clínica, menos del 6% cumple los requisitos mínimos para un estudio de estas características (descripción de medidas de validez con sus IC del 95%).