La elección de qué prueba solicitar a un paciente así como su interpretación es un escenario diario con el cual el especialista debe enfrentarse y el endoscopista no es ajeno a ello. Es común que cuando se habla de una prueba diagnóstica (laboratorio o imagen) se escuche el comentario de parámetros como sensibilidad, especificidad y valores predictivos. Los parámetros mencionados reflejan las características de una prueba diagnóstica y sirven para decidir en qué momento debemos utilizarlas (sensibilidad y especificidad de una prueba) o qué significado tiene un resultado de una prueba en un paciente en particular.
El objetivo del estudio es ofrecer los conceptos estadísticos básicos para comprensión y aplicación de pruebas diagnósticas.
Choosing a test on a patient and its interpretation is a daily occurrence that the specialist is faced with, and the endoscopist is no stranger to this. It is common when talking of a diagnostic test (laboratory or imaging) to hear the mention of parameters such as sensitivity, specificity and predictive values. The parameters mentioned (sensitivity, specificity) establish the characteristics of a diagnostic test and are useful to decide when we should use them or the meaning that a test result has in a particular patient.
The aim of the study is to present the basic statistical concepts for the understanding and application of diagnostic tests.
El correcto abordaje diagnóstico de un importante número de enfermedades es logrado día a día por medio de pruebas diagnósticas, pruebas cuya utilidad radica en la posibilidad de detectar a pacientes que poseen determinada enfermedad o excluir a aquellos sin dicha condición. La elección de qué prueba solicitar a un paciente así como su interpretación es un escenario diario con el cual el especialista debe enfrentarse. Es común que cuando se habla de una prueba diagnóstica (laboratorio o imagen) se escuche el comentario de parámetros tales como sensibilidad, especificidad y valores predictivos (valor predictivo positivo [VPP] y valor predictivo negativo [VPN]. Los endoscopistas debemos estar familiarizados con dichos términos para poder decidir de manera adecuada qué estudio solicitar a cada paciente y, una vez que tengamos el resultado del mismo, podamos entender su significado.
Existe otro término al momento de determinar qué prueba diagnóstica elegir, el cual es «el estándar de oro» (gold standard), el cual representa la prueba que por definición se encuentra libre de errores, es decir aquella con el 100% de sensibilidad y especificidad, el cual se considera el método de referencia ideal para la valoración de nuevas pruebas.
Los parámetros mencionados reflejan las características de una prueba diagnóstica y nos sirven para decidir en qué momento debemos utilizarlas (sensibilidad y especificidad de una prueba). Por otro lado, una vez que ya tenemos el resultado de una prueba diagnóstica de un paciente en particular debemos saber cómo se traduce en dicho paciente.
SensibilidadSe define como la probabilidad de que una prueba sea positiva dado que el paciente tiene la enfermedad.
De acuerdo a una tabla de 2×2 (fig. 1) podemos expresar que:
Ejemplo 1: Paciente de 46 años de edad con sobrepeso que ingresa con un cuadro de dolor abdominal tipo cólico en hipocondrio derecho, asociado a náuseas y vómito, ictericia, con alanino aminotrasferasa de 78mg/dl, aspartato aminotrasferasa 90mg/dl, fosfatasa alcalina 310mg/dl. Se sospecha de coledocolitiasis.
Usted tiene las siguientes opciones para el abordaje de su paciente:
- •
Ultrasonido endoscópico (USE): sensibilidad del 88% y especificidad del 96%
- •
Resonancia magnética: sensibilidad del 81% y especificidad del 92%.
La pregunta es: ¿Qué prueba diagnóstica emplearía?
Retomando la definición de sensibilidad1 y de acuerdo al caso clínico los métodos diagnósticos disponibles tienen diferentes valores de sensibilidad (81 y 88%). De una manera sencilla podemos decir que de cada 100 individuos con la enfermedad (coledocolitiasis) la resonancia magnética identificaría a 81 de ellos y el USE a 88. Por supuesto que el médico debe considerar estos números fríos (81 y 88) con cuidado y de acuerdo al escenario completo: costos, riesgos del procedimiento, riesgos de perder el diagnóstico en un paciente, tiempo, etc. En el ejemplo que se manejó existe una diferencia entre los métodos del 7% (7 pacientes en este caso) que pudieran perderse en el caso de elegir uno de los métodos. Considerando la enfermedad en evaluación, los costos y riesgos el clínico debe decidir cuál es la mejor opción (no es lo mismo perder 7 pacientes con probable pancreatitis aguda por coledocolitiasis que perder 7 pacientes con gastropatía nodular o dispepsia funcional).
Ejemplo 2: Paciente con sospecha de pancreatitis crónica. Se solicita una prueba diagnóstica «prueba de estimulación de secretina» con sensibilidad del 90%2.
En este ejemplo, de la prueba de estimulación de secretina (sensibilidad del 90%2), con una población ficticia de 100 personas con «pancreatitis crónica», se espera que 90/100 pacientes tendrán su prueba positiva (fig. 1)3.
Ejemplo 3: En una población de 1,000 pacientes, 50% (n=500) de ellos están diagnosticados con tumor neuroendocrino y el 50% restante no tiene la enfermedad. Se les realizó una biopsia por aspiración con aguja fina guiada por USE, de los cuales reportan resultados positivos 460 pacientes.
El caso clínico permite cuestionarnos diversos aspectos;
- 1.
¿Cuál es la sensibilidad de la prueba?
- 2.
¿Qué factores pueden influir en la sensibilidad de una prueba diagnóstica?
Para ello conocemos el 100% (n=1,000 pacientes) de la población, en la cual la enfermedad referida tiene una prevalencia del 50% (500/1,000), de los cuales reportaron positivo a la prueba diagnóstica 460 pacientes. Calculando la sensibilidad de acuerdo a la fórmula (a/a+c) por una regla de 3, multiplicando los pacientes con prueba positiva por 100 y dividir el resultado entre la población total conocida con la enfermedad (500), se tiene una sensibilidad del 92% lo que daría respuesta a la primera pregunta. Si cambiáramos la prevalencia a un 60% (n=600) de la enfermedad, con el mismo número de resultados positivos (460 pacientes), la sensibilidad de la prueba sería diferente (76.6%).
La utilidad de una prueba con alta sensibilidad es mayor cuando el resultado de la prueba es negativo. Cuanto mayor sensibilidad tenga una prueba, también es mayor el número de pacientes con resultados falsos positivos (prueba con resultado positivo en un paciente que NO tiene la enfermedad) sin embargo, debido a esa alta sensibilidad es muy difícil que un paciente que SÍ tenga la enfermedad tenga una prueba negativa. Para explicarlo citemos otro ejemplo,
Ejemplo 4: Si para identificar la presencia de Helicobacter pylori tenemos una prueba diagnóstica con el 100% de sensibilidad y el 62% de especificidad, la pregunta sería que en caso de un resultado positivo: ¿tiene en realidad infección por Helicobacter pylori? La respuesta es que pudiera ser que sí… pero es posible que se tratara de un resultado «falso positivo».
Pruebas «muy sensibles» es común que detecten como positivos a pacientes que no tienen la enfermedad. Sin embargo, su «alta sensibilidad» hace muy improbable que si la prueba fuera negativa el paciente tuviera la enfermedad.
EspecificidadSe define como la probabilidad de tener un resultado negativo en la prueba dado que no se tiene la enfermedad4.
De acuerdo a una tabla de 2×2 (fig. 1) podemos expresar que:
Retomemos el ejemplo 1. La resonancia magnética para el abordaje de la coledocolitiasis tiene una especificidad del 92%, quiere decir que cada 100 individuos sin la enfermedad saldrán negativos a esta prueba 92 de ellos, mientras que el USE (especificidad del 96%) tendrá un resultado negativo en 96/100 pacientes sin la enfermedad.
Para el ejemplo 2, la prueba de estimulación de secretina para pancreatitis crónica tiene una especificidad del 94% por lo que en una población de 100 personas sin pancreatitis, la prueba sería negativa en 94 de 100 pacientes (fig. 2). En el caso del USE tiene una especificidad del 99.4% en el que prácticamente todos los pacientes sin tumoración neuroendocrina saldrían negativos a la prueba.
Estas pruebas diagnósticas no están exentas de arrojar en algunas situaciones resultados erróneos. En algunas ocasiones pueden tener resultados falsos positivos o falsos negativos. Se considera un resultado falso positivo de la prueba cuando la misma es positiva en un paciente que no tiene la enfermedad. Un resultado falso negativo se define como aquel en que la prueba es negativa cuando el paciente sí tiene la enfermedad.
Falso negativo y falso positivoEntre las principales limitaciones de la sensibilidad y especificidad está su falta de predicción individual en cada paciente. La sensibilidad y especificidad de la prueba son parámetros que son útiles al clínico para decidir qué prueba utilizar en un paciente en particular. Es decir, existen enfermedades en las cuales necesitas que la prueba tenga una alta sensibilidad (aunque también el número de falsos positivos sea alto) para no perder ningún paciente por un falso negativo de la prueba.
Ejemplo 5: Podemos mencionar la prueba inmunológica para detectar sangre oculta en heces. Es preferible detectar a todos los pacientes con cáncer colorrectal, aunque en el camino incluyamos alguno que finalmente se comprueba que no tiene la enfermedad (falso positivo de la prueba). Dentro de los pacientes con resultados positivos (y que inicialmente incluiríamos en el grupo de pacientes con probable cáncer colorrectal) pudieran encontrarse pacientes con hemorroides, colitis ulcerosa crónica inespecífica o cualquiera que ocasione sangrado (aunque no necesariamente cáncer). Por otro lado, en algunas ocasiones se prefiere utilizar una prueba con alta especificidad con la intención de que en caso de que la prueba sea positiva tengamos una alta certeza de que el paciente sí tiene la enfermedad.
Como se comentó, la sensibilidad de una prueba nos sirve a los clínicos para decidir qué estudio realizaremos en un paciente particular, pero la siguiente pregunta que le viene al médico es: Mi paciente tiene una prueba positiva, ¿Qué probabilidad tiene de SÍ tener la enfermedad, dado que la prueba es positiva?,
Y en la otra circunstancia, mi paciente tiene la prueba negativa ¿Cuál es la probabilidad de que el paciente NO tenga la enfermedad dado que la prueba es negativa?
Para responder lo anterior necesitamos conocer los valores predictivos.
Valores predictivosValor predictivo positivoEs la probabilidad de SÍ tener la enfermedad dado que la prueba es positiva5.
De acuerdo a una tabla de 2×2 (fig. 1) podemos expresar que:VPP=a/a+b(verdaderos positivos/verdaderos positivos+falsos positivos)
Para lograr obtener este valor se divide el número total de pacientes a los que se les realizó la prueba y que efectivamente tiene la enfermedad, entre el total de pacientes que obtuvieron resultados positivos a dicho estudio.
Retomando el ejemplo 2: Realizamos la prueba de estimulación de secretina en nuestra población ficticia de 100 personas, en la cual se obtienen 45 resultados que concuerdan con la presencia de la enfermedad, sin embargo 3 pacientes que no poseen la enfermedad obtuvieron una prueba positiva, con estos datos podemos calcular el VPP, dividimos los pacientes positivos que realmente están enfermos (44) entre el total de pacientes positivos en la prueba (47); 44/47=0.93, lo que se traduce que, en esta población, una persona con la prueba positiva tiene el 93% de probabilidad de tener pancreatitis crónica (fig. 3).
Valor predictivo negativoEs la probabilidad de NO tener la enfermedad dado que la prueba es negativa1,4,6.
De acuerdo a una tabla de 2×2 (fig. 1) podemos expresar que:VPN=d/c+d(verdaderos negativo/verdaderos negativos+falsos negativos)
Explicándolo con el ejemplo 2 de la pancreatitis crónica; de nuestros 100 pacientes con características clínicas similares, 47 pacientes arrojan resultados negativos, que corresponden a no tener la enfermedad, sin embargo 5 pacientes con la enfermedad poseen un resultado negativo en la prueba. Ahora para obtener el VPN dividimos el total de pacientes sin enfermedad con resultados negativos (47) entre el total de pruebas negativas (52), 47/52=0.90 o 90%, lo que explica que aquellos pacientes con prueba negativa tendrían el 90% de probabilidad de no tener dicha enfermedad (fig. 4).
Un punto a considerar es que los valores predictivos (VPP, VPN) de una prueba diagnóstica se ven sesgados por la prevalencia de la enfermedad en la población. Imaginemos que una enfermedad «X» tiene una prevalencia del 99% en una población determinada; esto llevaría a que cualquier prueba positiva fuera casi siempre correcta, lo cual elevaría de manera ficticia el VPP de una prueba. A su vez si la prevalencia de dicha enfermedad es baja provoca un incremento del VPN y un decremento del VPP.
Para dejar claros los términos y cómo calcular cada uno de los valores usemos el siguiente ejercicio.
EjercicioObtener la sensibilidad, especificidad, VPP y VPN.
Iniciaremos por nombrar cada una de las celdas de 2×2 (fig. 1)
- •
Celda «a» (cuadro superior izquierdo), que corresponderá a los verdaderos positivos.
- •
Celda «b» (cuadro superior derecho) falsos positivos.
- •
Celda «c» (cuadro inferior izquierdo) falsos negativos y
- •
Celda «d» (cuadro inferior derecho) verdaderos negativos.
Posteriormente ya identificadas las celdas sabemos que nuestra población es de 100 pacientes por lo que este número se coloca en la esquina inferior derecha.
Ahora bien, tenemos que despejar cada una de las siguientes variables.
Tendremos que otorgar valores para establecer las variables mencionadas, por lo que en la celda «a» tendremos 86 pacientes con enfermedad y prueba positiva, a la celda «b» corresponderán 5 pacientes con prueba positiva pero enfermedad ausente, 2 pacientes en celda «c» donde la enfermedad se establece pero con prueba negativa y 11 pacientes en celda «d» que refieren a pacientes sanos con prueba negativa.
- a)
Sensibilidad:Fórmula a/(a+c), valores propuestos 86/(86+2), 86/88=?Sensibilidad: 97.7%
- b)
Especificidad:Fórmula d/(b+d), valores propuestos 11/(11+5), 11/16=?Especificidad: 68%
- c)
Valor predictivo positivo:Fórmula: a/(a+b), valores propuestos 86/(86+5), 82/91=?VPP: 94%
- d)
Valor predictivo negativo.Fórmula: d/(c+d), valores propuestos 11/(11+2), 11/13=?VPN: 84%
El resultado del ejercicio nos habla de una prueba diagnóstica que podría ser utilizada para detección de un padecimiento «grave», entendiendo que el oportuno diagnóstico involucrará un mejor panorama para el paciente, esto por la alta sensibilidad de la prueba (97.7%) y significativo VPP (94%).
Ahora bien, la relación que existe entre sensibilidad y especificidad al momento de decidir la mejor prueba diagnóstica, dependerá totalmente del escenario de nuestros pacientes; si deseamos detectar el mayor número de enfermos, optaremos por una prueba de alta sensibilidad, por lo cual serán escasos aquellos pacientes con la enfermedad que no logren ser detectados (pero se incrementarán los «falsos positivos»); por otro lado, si deseamos concretar el diagnóstico, se elegirá un prueba con mayor especificidad, el cual expresará en su mayoría aquellos que no padecen dicha enfermedad.
ConclusiónEl comprender los parámetros para medir la utilidad de una prueba diagnóstica es básico para determinar en qué momento pedirla de acuerdo a la enfermedad que se busque (sensibilidad y especificidad) en un determinado paciente. El saber aplicar o «traducir» un resultado positivo o negativo (valores predictivos) de una prueba permite tomar decisiones adecuadas en nuestros pacientes.
Responsabilidades éticasProtección de personas y animalesLos autores declaran que para esta investigación no se han realizado experimentos en seres humanos ni en animales.
Confidencialidad de los datosLos autores declaran que en este artículo no aparecen datos de pacientes.
Derecho a la privacidad y consentimiento informadoLos autores declaran que en este artículo no aparecen datos de pacientes.
FinanciamientoLos autores no recibieron patrocinio para llevar a cabo este artículo.
Conflictos de interesesTodos los autores declaran no tener conflictos de intereses.