Sr. Editor:
Agradezco los comentarios de los autores1 en relación con el artículo recientemente publicado sobre test de diagnóstico de Legionella mediante detección de antígenos solubles en orina2.
Las evaluaciones de pruebas diagnósticas tienen dificultades en su diseño. En el trabajo citado2, la más importante ha sido la selección y la clasificación de las muestras. Toda investigación sobre pruebas diagnósticas precisa un referente teórico frente al que compararse, lo que se conoce como gold standard. En el caso de la infección por Legionella, como sucede en muchas otras enfermedades infecciosas, es complicado establecer el gold standard que determina la infección reciente. Si bien las diferentes aproximaciones diagnósticas de laboratorio (cultivo bacteriano, detección directa por inmunofluorescencia y de ácidos nucleicos en muestra respiratoria o de antígenos solubles en muestra de orina así como la detección de respuesta serológica específica por inmunofluorescencia o ELISA) tienen una excelente especificidad, la sensibilidad es muy variable y puede oscilar desde el 20% en el caso del aislamiento hasta más del 95% en el caso de la antigenuria3,4. Así pues, las dificultades para establecer el gold standard han sido la causa de un aspecto crítico del trabajo citado: las muestras, coleccionadas durante algunos años y conservadas por congelación, se han clasificado por un criterio mixto que combina la mayoría de resultados obtenidos con los métodos evaluados junto con aproximaciones serológicas o aspectos epidemiológicos2.
Los autores critican aspectos metodológicos sobre el estudio de las pruebas diagnósticas comparadas1, arguyendo que se obvia información sobre cuestiones importantes, basándose en que para el correcto análisis de una prueba diagnóstica se deben calcular sensibilidad, especificidad, valores predictivos positivo y negativo y coeficientes de probabilidad positivo y negativo, y que sólo se han calculado sensibilidad y especificidad. Sin embargo, es bien reconocido que “los índices más característicos de un test son su sensibilidad y especificidad” (sic)5, lo que indica, respectivamente, la probabilidad de que si hay enfermedad la prueba sea positiva, y la probabilidad de que si no hay enfermedad sea negativa. La inclusión propuesta de los intervalos de confianza de ambos valores, calculados por autores1 desde la tabla de contingencia original, enriquecen de forma ostensible los resultados que mencionan. Sin embargo, teniendo en cuenta que los valores predictivos dependen de la prevalencia real de la enfermedad en un entorno determinado y cuál ha sido el criterio de selección (son muestras de colección), su cálculo resulta absolutamente improcedente. Por último, los coeficientes de probabilidad positivo y negativo, que expresan un resumen unificado de sensibilidad y especificidad, no aportan sino confusión en la interpretación de los resultados, ya que el problema surge cuando después de realizar el análisis exhaustivo propuesto y de considerar los parámetros indicados se obtienen conclusiones contradictorias: es difícil asumir que un ensayo con una sensibilidad del 70,59%, muy inferior a la de otros ensayos, se considere, después de calcular el coeficiente de probabilidad positivo, una buena prueba para confirmar el diagnóstico, tal y como indican los autores1 en sus conclusiones. En este sentido, hay que hacer notar que los resultados de las pruebas de segunda intención que se aplican en el diagnóstico etiológico de las enfermedades infecciosas y que suelen calificarse como confirmatorias forman parte del diagnóstico, y deben ofrecer una adecuada combinación entre sensibilidad y especificidad. Así, las conclusiones de una evaluación de este tipo de pruebas no deben señalar por separado lo que es mejor para confirmar la infección y lo que es mejor para descartarla, y los análisis que conduzcan a conclusiones de este tipo carecen de interés práctico. Por todo esto, y de acuerdo con la cita literal de más arriba5, los índices que se deben aplicar necesariamente en estudios de las características del nuestro son la sensibilidad y la especificidad. Se puede constatar que gran número de publicaciones que comparan o evalúan ensayos para la detección de antígenos solubles tienen un tratamiento estadístico similar al presentado4,6,7,8,9,10.