Evaluar y comparar la precisión diagnóstica de las Simple rules, el sistema de regresión logística LR2 de IOTA y la valoración subjetiva aplicados por residentes de ginecología en la clasificación de benignidad o malignidad de lesiones anexiales.
Material y métodosFueron evaluadas las imágenes ecográficas de 94 lesiones anexiales por 3residentes de ginecología con un año de experiencia y con un entrenamiento teórico y práctico previo similar. La benignidad o malignidad fue determinada mediante 3métodos: valoración subjetiva, Simple rules y modelo LR2. El grado de precisión en la clasificación de las lesiones se valoró mediante la sensibilidad, la especificidad, el valor predictivo positivo y negativo y la likelihood ratio positiva y negativa. Fue aportado también un diagnóstico de presunción histológica por cada ecografista.
ResultadosDe las 94 lesiones, 73 resultaron benignas y 21 malignas. Los resultados estadísticos fueron los siguientes: Simple rules, sensibilidad 84,2% y especificidad 79,7%; LR2, sensibilidad 71,4% y especificidad 74%; valoración subjetiva, sensibilidad 65% y especificidad 76,1%.
ConclusionesLos sistemas ecográficos de clasificación objetiva de lesiones anexiales han mostrado en la bibliografía mejores resultados diagnósticos que la valoración subjetiva aplicados por ecografistas no expertos. Las Simple rules y el LR2 se han descrito como 2de los más precisos y de más sencilla aplicación, por lo que podrían incorporarse en la evaluación ecográfica de masas anexiales por residentes de ginecología. En nuestro estudio observamos esta tendencia de una mayor precisión diagnóstica de estos sistemas predictivos respecto a la valoración subjetiva por residentes de ginecología, aunque sin que resultara estadísticamente significativa.
To evaluate and compare the diagnostic accuracy of the Simple Rules, the second logistic regression system of IOTA (LR2) and the subjective assessment used by gynaecology residents in the classification of benign or malignant adnexal lesions.
Material and methodsThe ultrasound images of 94 adnexal lesions were evaluated by 3gynaecology junior doctors with one year of experience and with similar theoretical and practical training. The benignity or malignancy was determined by 3methods: subjective assessment, Simple Rules, and model LR2. The assessment of the degree of accuracy in the classification of the lesions was made by determining sensitivity, specificity, positive and negative predictive value, and positive and negative likelihood ratio. A diagnosis of histological presumption was also provided by each ultrasound operator.
ResultsOf the 94 lesions, 73 were benign and 21 malignant. The statistical results were the following: Simple rules sensitivity 84.2% and specificity 79.7%; LR2 sensitivity 71.4% and specificity 74%; subjective assessment 65% sensitivity and specificity 76.1%.
ConclusionThe ultrasound systems for objective classification of adnexal lesions have shown better diagnostic results in the literature than subjective assessment applied by non-expert sonographers. The Simple Rules and the LR2 have been described as 2of the most precise and simplest to apply, so they could be incorporated into the ultrasound evaluation of adnexal masses by gynaecology junior doctors. In this study, this trend of greater diagnostic accuracy was observed in these predictive systems regarding subjective assessment by gynaecology junior doctors, although without being statistically significant.
El diagnóstico temprano del cáncer de ovario resulta fundamental para su pronóstico. Cuando es diagnosticado en estadio I la supervivencia a los 10 años alcanza el 73%, mientras que desciende al 45%, al 21% y a menos del 5% si el diagnóstico se realiza en estadios II, III y IV, respectivamente1. Sin embargo, solo un 30% de los casos son diagnosticados en estadio I o II, lo que se debe en gran medida a que no existen programas efectivos de cribado y a que las pacientes muestran síntomas iniciales inespecíficos presentes en otras muchas enfermedades, lo que dificulta su detección precoz2.
La evaluación ecográfica continúa siendo la mejor herramienta diagnóstica para establecer una sospecha de benignidad o malignidad de una lesión anexial1. Su precisión diagnóstica en manos de un ecografista experto es alta, con sensibilidad y especificidad que pueden alcanzar el 88-98% y el 89-96%, respectivamente3. No obstante, en muchos centros la valoración ecográfica de las lesiones anexiales la hacen ecografistas con menos experiencia, que tienen una precisión diagnóstica inferior4. Para mejorar estos resultados y aproximarlos a los de los expertos, se han propuesto múltiples modelos predictivos objetivos que pretenden generar reglas que, utilizadas por ecografistas menos experimentados, aumenten la precisión en la clasificación de las masas anexiales5.
Dos de estos sistemas diagnósticos son el sistema de regresión logística LR2 y las Simple rules, propuestos por el International Ovarian Tumour Analysis (IOTA) Group y con un amplio uso en la práctica clínica6,7. El primero consiste en el cálculo matemático del riesgo de malignidad mediante una fórmula de regresión logística en la que se introduce el valor de 6variables predictoras: edad, ascitis, flujo sanguíneo en papilas, diámetro máximo del componente sólido, paredes internas irregulares y presencia de sombras acústicas, considerando un punto de corte de probabilidad del 10% para clasificar la lesión como benigna o maligna6. Las Simple rules valoran la presencia o ausencia de 5características ecográficas de benignidad y 5de malignidad. Los parámetros de benignidad son: quiste unilocular, presencia de componente sólido con diámetro mayor inferior a 7mm, presencia de sombras acústicas, tumor multilocular liso con diámetro inferior a 100mm y ausencia de flujo vascular (score de color 1). Los asociados a malignidad son: tumor sólido irregular, presencia de ascitis, al menos 4 estructuras papilares, tumor sólido irregular y multilocular con diámetro igual o mayor a 100mm y flujo vascular muy intenso (score de color 4). Si se encuentra presente alguna característica de benignidad y ninguna de malignidad la lesión es clasificada como benigna, y viceversa; la lesión no puede ser clasificada si no presenta ninguna de las 10características o si las presenta tanto de benignidad como de malignidad7.
Estos modelos han mostrado buenos resultados en cuanto a precisión diagnóstica, con sensibilidad en todos los trabajos por encima del 90%. No obstante, en la mayoría de los estudios en los que se han validado, la valoración ecográfica la han hecho ecografistas expertos, por lo que no se conoce adecuadamente cuál sería su rendimiento diagnóstico en manos no expertas8.
En este estudio pretendemos evaluar y comparar la precisión diagnóstica de estos 2modelos predictivos, las Simple rules y el sistema de regresión logística LR2 de IOTA, y de la valoración ecográfica subjetiva al clasificar la benignidad o malignidad de lesiones anexiales cuando son aplicados por residentes de ginecología.
Material y métodosDesarrollamos un estudio analítico observacional retrospectivo en un hospital terciario universitario en el que fueron analizadas imágenes ecográficas de lesiones anexiales intervenidas quirúrgicamente entre junio de 2015 y mayo de 2018. Las pacientes habían dado su consentimiento informado para la utilización de sus imágenes en estudios de investigación en el momento de la ecografía inicial. En todos los casos fueron ocultados los datos identificativos de las pacientes durante su valoración por los investigadores participantes.
Los criterios de inclusión fueron pacientes mayores de 18 años con al menos una lesión anexial, de la que hubieran sido almacenadas al menos 5imágenes ecográficas (en escala de grises y doppler color), intervenidas quirúrgicamente en el periodo seleccionado y de las que se contara con diagnóstico anatomopatológico.
Las imágenes fueron evaluadas por 3residentes de ginecología con un año de experiencia y una formación previa teórica y práctica similar. La evaluación consistió en determinar la benignidad o malignidad de cada una de las lesiones mediante su valoración subjetiva, la aplicación de las Simple rules y el cálculo del riesgo de malignidad mediante el modelo de regresión logística LR2. Cada uno de estos sistemas fue empleado por uno de los 3ecografistas, contando con la edad de la paciente como único dato adicional. El tiempo máximo disponible para la evaluación de cada paciente fue de 10minutos.
Cada uno de los evaluadores también aportó un diagnóstico de presunción histológica de todos los casos, de acuerdo con la clasificación histológica de las lesiones anexiales de la Organización Mundial de la Salud. El estándar de referencia fue el estudio anatomopatológico de la lesión extirpada o biopsiada quirúrgicamente.
La valoración de cada uno de los evaluadores fue incluida en una base de datos diseñada para este estudio en el programa Microsoft Excel 2010®. El estudio estadístico para determinar el grado de precisión de la clasificación de benignidad y malignidad de las lesiones incluyó la determinación de sensibilidad, especificidad, valor predictivo positivo y negativo y las razones de verosimilitud (likelihood ratios) positiva y negativa. Se calcularon intervalos de confianza al 95% para todas las medidas de bondad de la clasificación. Para las medidas de sensibilidad, especificidad y valores predictivos positivo y negativo se calcularon intervalos exactos basados en la distribución binomial. Para los cocientes de verosimilitud positivo y negativo, los intervalos de confianza se calcularon por bootstrap. Por último, se utilizó el test de McNemar para estudiar la posible concordancia entre cada par de reglas de clasificación. Para los cálculos estadísticos se empleó el programa SPSS versión 20 (IBM Corp, Los Ángeles, CA, EE. UU.).
ResultadosFueron incluidas 94 pacientes con lesiones anexiales que cumplían los criterios de inclusión. La media de edad de las pacientes incluidas fue de 45 años (rango 18-87 años). Eran premenopáusicas 60 pacientes (63,8%) y 34 (36,2%) eran posmenopáusicas.
Resultaron beningnas 73 lesiones(77,7%) y 21 (22,3%), malignas. Los diagnósticos anatomopatológicos más frecuentes entre las lesiones benignas fueron el endometrioma (36,9%) y el cistoadenoma seroso (21,9%), mientras que el carcinoma seroso (28,5%), el mucinoso (9,5%) y el endometrioide (9,5%) lo fueron entre las malignas. En la tabla 1 se recogen todos los diagnósticos anatomopatológicos de las lesiones evaluadas.
Diagnóstico histológico de las lesiones analizadas
Benignas | N = 73 | % |
---|---|---|
Endometrioma | 27 | 37 |
Cistoadenoma seroso | 16 | 21,9 |
Teratoma maduro quístico (quiste dermoide) | 10 | 13,7 |
Cistoadenoma mucinoso | 6 | 8,2 |
Cistoadenofibroma | 4 | 5,5 |
Fibroma/fibrotecoma | 4 | 5,5 |
Hidrosálpinx | 3 | 4,1 |
Quiste endometriósico atípico sin malignidad | 1 | 1,4 |
Tumor de Brenner | 1 | 1,4 |
Absceso tuboovárico | 1 | 1,4 |
Malignas | N = 21 | % |
---|---|---|
Carcinoma mucinoso | 2 | 9,5 |
Carcinoma endometrioide | 2 | 9,5 |
Carcinoma de células claras | 1 | 4,8 |
Tumor de células de la granulosa de tipo adulto | 1 | 4,8 |
Tumor fibroso solitario del omento | 1 | 4,8 |
Carcinosarcoma. Tumor mulleriano mixto/tumor mesodérmico mixto maligno | 1 | 4,8 |
Tumor de intestino delgado: GIST | 1 | 4,8 |
Metástasis de cáncer de mama | 1 | 4,8 |
Carcinoma mucinoso borderline | 1 | 4,8 |
Cistoadenoma seroso borderline | 1 | 4,8 |
Tumor seroso borderline de tipo quístico papilar | 1 | 4,8 |
Tumor mucinoso quístico borderline de tipo intestinal | 1 | 4,8 |
Hemangiopericitoma presacro | 1 | 4,8 |
Las Simple rules pudieron ser aplicadas en 88 (93,6%) lesiones, y en 6 el diagnóstico fue no concluyente (6,4%). La valoración subjetiva proporcionó el diagnóstico en 91 (96,8%) lesiones, mientras 3 (3,2%) fueron catalogadas con diagnóstico no concluyente. El sistema LR2 fue aplicado en todas las lesiones.
Las Simple rules mostraron una sensibilidad del 84,2% (IC 95%: 60,4-96,6) y una especificidad del 79,7% (IC 95%: 68,3-88,4). El sistema LR2 presentó una sensibilidad del 71,4% (IC 95%: 47,8-88,7) y una especificidad del 74% (IC 95%: 62,4-83,5). La valoración subjetiva mostró una sensibilidad del 65% (IC 95%: 40,8-84,6) y una especificidad del 76,1% (IC 95%: 64,5-85,4). En la tabla 2 se muestran los resultados completos de los 3métodos diagnósticos utilizados, incluyendo el valor predictivo positivo y negativo y la likelihood ratio positiva y negativa para cada uno de ellos.
Rendimiento diagnóstico de los 3 sistemas de clasificación
S (%) | E (%) | VPP (%) | VPN (%) | LR+ | LR− | |
---|---|---|---|---|---|---|
Simple rules | 84,2(60,4-96,6) | 79,7(68,3-88,4) | 53,3(34,3-71,7) | 94,8(85,6-98,9) | 4,15(2,60-7,65) | 0,2(0,00-0,44) |
LR2 | 71,4(47,8-88,7) | 74(62,4-83,5) | 44,1(27,2-62,1) | 90(79,5-96,2) | 2,75(1,74-4,58) | 0,39(0,13-0,68) |
Valoración subjetiva | 65(40,8-84,6) | 76,1(64,5-85,4) | 43,3(25,5-62,6) | 88,5(77,8-95,3) | 2,72(1,58-4,88) | 0,46(0,19-0,77) |
Los valores entre paréntesis son el IC del 95%.
E: especificidad; LR+: likelihood ratio (razón de verosimilitud) positiva; LR−: likelihood ratio (razón de verosimilitud) negativa; S: sensibilidad; VPN: Valor predictivo negativo; VPP: valor predictivo positivo.
La comparación de la precisión diagnóstica entre los 3sistemas de clasificación no mostró diferencias estadísticamente significativas al aplicar el test de McNemar (p < 0,05): p = 0,345 para LR vs. Simple rules; p = 0,524 para valoración subjetiva vs. Simple rules; p = 1,000 para valoración subjetiva vs. LR2.
En cuanto a la precisión de los diagnósticos de presunción histológica, la máxima sensibilidad para las lesiones benignas más frecuentes fue del 50% para el endometrioma, del 68,8% para el cistoadenoma seroso y del 40% para el quiste dermoide. La precisión para el resto de los tipos histológicos de lesiones benignas no fue superior al 33% en ninguno de los casos. Para las lesiones malignas, la máxima sensibilidad del diagnóstico de presunción histológica fue del 57,1% para el carcinoma seroso y del 50% para el mucinoso. En la tabla 3 se refleja la precisión diagnóstica en el diagnóstico específico de presunción histológica para cada uno de los 3ecografistas de las lesiones en las que pudo calcularse sensibilidad y especificidad.
Sensibilidad y especificidad en el diagnóstico de presunción histológico de las lesiones más prevalentes por cada uno de los3 ecografistas
SR | LR2 | VS | ||||
S | E | S | E | S | E | |
Benignas | ||||||
Endometrioma | 42,9 | 89,4 | 50 | 92,4 | 35,7 | 86,4 |
Cistoadenoma seroso | 68,8 | 91 | 50 | 82,1 | 41,2 | 90,9 |
Quiste dermoide | 10 | 96,4 | 30 | 95,2 | 40 | 76,2 |
Cistoadenoma mucinoso | 16,7 | 88,6 | 16,7 | 96,6 | 20 | 95,5 |
Malignas | ||||||
Carcinoma seroso | 37,5 | 96,5 | 25 | 86 | 57,1 | 79,1 |
Carcinoma mucinoso | 25 | 88,9 | 25 | 88,9 | 50 | 94,4 |
E: especificidad; LR2: sistema de regresión logística de IOTA; S: sensibilidad; SR: Simple rules; VS: valoración subjetiva.
La ecografía transvaginal realizada por un ecografista experto es la manera más precisa de caracterizar una lesión ovárica como benigna o maligna, lo que resulta fundamental para el correcto manejo terapéutico de la paciente9-11. Sin embargo, en múltiples centros no se dispone de un especialista en ecografía ginecológica y son los residentes de ginecología los que hacen la primera valoración ecográfica de la paciente y, por tanto, la orientación terapéutica inicial. Por ello, la utilización de modelos predictivos objetivos de aplicación sencilla puede resultar de utilidad para mejorar los resultados de estos ginecólogos. En los últimos años se han propuesto múltiples de estos modelos predictivos objetivos con el propósito de proporcionar patrones de interpretación que ayuden a ecografistas menos experimentados a clasificar las masas anexiales con un nivel de precisión aceptable5.
Aunque el objetivo de estos sistemas de diagnóstico es su utilización por ecografistas no expertos, la mayor parte de los trabajos desarrollados hasta el momento para su validación han sido efectuados por especialistas en ecografía ginecológica, lo que puede haber influido en una sobrevaloración de los resultados. En nuestro estudio hemos pretendido aproximarnos a la realidad clínica de muchos centros, valorando el rendimiento diagnóstico de 2de estos sistemas al ser aplicados por residentes de ginecología. Además, se ha pretendido comparar este resultado con el de la valoración subjetiva de las lesiones anexiales por un ecografista con la misma experiencia, para corroborar el mejor rendimiento y la conveniencia de la aplicación de los sistemas predictivos sobre la valoración subjetiva por residentes de ginecología.
En nuestro trabajo seleccionamos los modelos Simple rules y LR2 de IOTA por ser 2de los más utilizados en la práctica clínica habitual, por su fácil aplicación y por presentar buen rendimiento diagnóstico en los estudios de validación previos6,7. Incluso han sido propuestos en algunos trabajos como los de elección para la valoración preoperatoria de las lesiones anexiales12.
En nuestros resultados observamos un mejor rendimiento diagnóstico de los 2sistemas predictivos objetivos respecto a la valoración subjetiva de las mismas masas anexiales, con una sensibilidad de 84,2; 71,4 y 65% y valor predictivo positivo de 53,3; 44,1% y 43,3% para las Simple rules, el sistema LR2 y la valoración subjetiva, respectivamente. A pesar de estos resultados favorables de los sistemas predictivos objetivos, los nuestros no mostraron una diferencia estadísticamente significativa entre ellos, lo que es probable que se debiera al pequeño tamaño muestral analizado.
De los 2modelos objetivos valorados, la aplicación de las Simple rules fue lo que mostró un mejor rendimiento diagnóstico, con una sensibilidad del 84,2%, un valor predictivo positivo del 53,3% y una likelihood ratio positiva de 4,15. Esto implica que su empleo por residentes de ginecología podría mostrar una precisión diagnóstica aceptable en la clasificación de benignidad y malignidad de las lesiones anexiales. En nuestro trabajo observamos que solo un 6,4% de las masas anexiales no pudieron ser clasificadas con las Simple rules, proporción significativamente inferior a la reportada en la bibliografía (20-30%)7. Esto pudo deberse al hecho de que esta valoración la hizo un residente con solo un año de experiencia ecográfica, lo que pudo conllevar una mayor audacia a la hora de aplicar las reglas ecográficas. Por su parte, la evaluación subjetiva inexperta presenta una baja precisión diagnóstica, con una sensibilidad del 65% y, por tanto, con un elevado número de lesiones malignas diagnosticadas como benignas, con lo que esto conlleva respecto al manejo terapéutico de lesiones malignas diagnosticadas erróneamente. Por tanto, emplear modelos predictivos objetivos, en especial las Simple rules, debería ser rutinario en la valoración de las lesiones anexiales hecha por los de residentes de ginecología o ecografistas con poca experiencia.
Hasta el momento hay pocos estudios similares al nuestro. El más destacable es el desarrollado en 2005 por Lee et al., en el que se valoró en 137 lesiones anexiales el rendimiento de su evaluación ecográfica por residentes de ginecología no experimentados utilizando los sistemas de puntuación de DePriest y Lerner, basados en características morfológicas de las masas anexiales4,13,14. Las conclusiones fueron similares a las nuestras: los ecografistas con escasa habilidad para una valoración subjetiva de las masas anexiales pueden obtener una alta precisión diagnóstica al utilizar sistemas de evaluación objetivos4.
Aunque el objetivo principal de nuestro estudio fue analizar el rendimiento diagnóstico de residentes de ginecología mediante sistemas predictivos o valoración subjetiva, también evaluamos la precisión diagnóstica de este tipo de ecografistas en el diagnóstico de sospecha histológica de las lesiones utilizando el pattern recognition (valoración subjetiva). En trabajos anteriores, esta precisión del diagnóstico histológico ha sido valorada por ecografistas expertos. En algunos de estos estudios, los tipos de lesiones más fácilmente reconocibles fueron quistes dermoides, hidrosálpinx, endometriomas y quistes serosos, con sensibilidad del 86; 82-86; 77-88 y 54-82%, respectivamente, y especificidad de 98-99; 98-99; 97-98 y 94%, respectivamente15,16. En nuestro estudio, las lesiones mejor identificables de forma subjetiva fueron las mismas que en estos trabajos, aunque la precisión diagnóstica fue significativamente menor (sensibilidad máxima del 40; 33; 50 y 69% para quiste dermoide, hidrosálpinx, endometrioma y quiste seroso, respectivamente). Esto, de forma similar a los resultados de clasificación de benignidad y malignidad, muestra la alta dependencia de la experiencia y la habilidad del ecografista a la hora de la valoración subjetiva de las masas anexiales.
Como principal limitación de nuestro estudio debemos señalar su ejecución retrospectiva, valorando imágenes ecográficas archivadas y no a las propias pacientes, como se hace en la práctica clínica habitual. Este hecho pudo conllevar un peor resultado de la valoración subjetiva que el que probablemente se daría en la realidad porque la valoración ecográfica subjetiva no solo supone la evaluación morfológica de imágenes ecográficas, sino que tienen en cuenta características clínicas y epidemiológicas de las pacientes que no pudieron considerarse con la mera visualización de imágenes archivadas7. Además, para contar con un patrón de referencia diagnóstico de certeza solo se incluyeron lesiones con diagnóstico histológico tras tratamiento quirúrgico, lo que también podría suponer un sesgo de selección, al dejar de valorar a pacientes en las que se optó por un manejo conservador, con seguimiento clínico y ecográfico. Es probable que las lesiones intervenidas con cirugía sean más complejas desde una perspectiva ecográfica y más sospechosas de malignidad o con síntomas clínicos, por lo que esto pudo subestimar el número de masas anexiales benignas. Por último, también se debe tener en cuenta que el pequeño tamaño muestral de nuestro estudio conllevó que determinados tipos de tumores anexiales infrecuentes no fueran diagnosticados o tuvieran una baja prevalencia en nuestro grupo, lo que dificultó extraer conclusiones significativas a partir de ellos. Probablemente, con un mayor tamaño muestral, la tendencia observada respecto a la mayor precisión diagnóstica de los modelos predictivos se traduciría en una diferencia estadísticamente significativa entre ellos.
Consideramos que nuestros resultados apoyan, por una parte, la necesidad de hacer mayor hincapié en la formación en el reconocimiento subjetivo de las características ecográficas diferenciadoras de las lesiones benignas y malignas y de sus diferentes tipos histológicos y, por otra, la conveniencia de que los residentes de ginecología empleen modelos predictivos objetivos en la valoración inicial de las lesiones anexiales. Somos conscientes de las limitaciones metodológicas de nuestro trabajo, por lo que estos resultados deberían corroborarse en estudios diseñados prospectivamente, con un mayor tamaño muestral y con la inclusión de pacientes con lesiones en las que estuviera indicado el manejo expectante con seguimiento clínico y ecográfico.
Responsabilidades éticasProtección de personas y animales. Los autores declaran que para esta investigación no se han realizado experimentos en seres humanos ni en animales.
Confidencialidad de los datos. Los autores declaran que han seguido los protocolos de su centro de trabajo sobre la publicación de datos de pacientes.
Derecho a la privacidad y consentimiento informado. Los autores han obtenido el consentimiento informado de los pacientes o sujetos referidos en el artículo.
FinanciaciónNo se recibió patrocinio de ningún tipo para llevar a cabo este artículo.
Conflicto de interesesLos autores firmantes de este artículo declaran no presentar ningún tipo de conflicto de intereses económico, profesional ni personal que pueda ser relevante para su publicación.