Quisiera agradecer los comentarios realizados por la editorial por el Dr. Cortina y la carta al editor del Dr. Fernández-Tarrio sobre nuestro artículo EuroSCORE II: ¿funciona en nuestro medio?(Cir Cardiovasc 2013; 20:59-64). Sin duda son dos aportaciones que enriquecen el debate abierto sobre el tema1,2.
Es claro que existe abierta una controversia sobre la validez externa del EuroSCORE II3–10, sobre todo en determinadas patologías (valvulares aórticos, cirugía de la aorta) o en pacientes de alto riesgo, donde existen varias publicaciones que cuestionan dicha validez4–8. También es cierto que otras publicaciones muestran una buena calibración y apuntan a una mejora respecto al EuroSCORE clásico9,10, pero el debate está abierto y el tiempo nos enseñará si esta nueva escala mejora los resultados de la anterior. De los 7 estudios publicados hasta la fecha 2 muestran una buena calibración global9,10, 3 una calibración adecuada en su conjunto y/o una pobre calibración en determinados grupos patológicos o en pacientes de alto riesgo4,7,8 y 2 una mala calibración global5,6.
Numerosos grupos quirúrgicos han detectado una infraestimación del riesgo de esta nueva escala, y este hallazgo podría estar motivado por deficiencias metodológicas en el diseño del estudio, alguna de las cuales apuntábamos en nuestro artículo. Entre ellas cabe destacar la ausencia de una auditoria sobre la recogida de los datos y un pobre seguimiento: llama la atención que no se aportó información sobre los “casos perdidos” o que la mortalidad observada fue computada únicamente con la mortalidad intrahospitalaria y que la mortalidad observada a los 90 días solo fue recogida en un 40% de los casos, hechos que sin duda cuestionan la validez de la recogida de los datos. Otros aspectos metodológicos como la ausencia de variables de interacción o el elevado número de pacientes coronarios hacen de nuevo que su diseño sea cuestionable o difícilmente aplicable en determinadas poblaciones. Los comentarios de la editorial del Dr Seargent en el número donde fue publicado el EuroSCORE II(3) apuntaban en esta dirección y cuestionaba de forma muy crítica el diseño de este estudio y a su vez reclamaban ciertos estadísticos que habría aportado más información, como la sensibilidad, la especificidad, los valores predictivos positivos y negativos, así como el coeficiente R2 o la puntuación de Brier.
Las limitaciones de nuestro artículo fueron apuntadas al final del mismo, como las características ambispectivas o el hecho de que se tratase de un estudio desarrollado en una única institución. Sin embargo, no creemos que sea cuestionable la calidad en la recogida de datos, así como el cálculo del EuroSCORE II, ya que el proceso de la recogida de datos, desarrollado de forma prospectiva, tuvo dos controles de calidad y el cálculo del mismo fue realizado por dos expertos en metodología. Por otra parte, nuestros resultados coinciden con al menos dos estudios, por lo que creemos honestamente que cuestionar su validez supone también poner en tela de juicio estos artículos que obtienen hallazgos similares.
Que la mortalidad observada difiera de la estimada por ESII en nuestra serie tiene muchas más explicaciones más allá de la “aceptabilidad” o no de sus resultados… explicaciones que no se encuadran en los supuestos planteados por el Dr. Cortina en su editorial, como el hecho tan evidente de que la muestra en la que nosotros aplicamos ES II es muy distinta a la muestra en la que se estimó el valor de los parámetros de dicha escala, que las dos muestras no eran contemporáneas, que una incluía la mortalidad perioperatoria y otra sólo la hospitalaria, etc… La intención de nuestro trabajo no fue la de valorar si nuestra mortalidad era “aceptable” o no según ESII, si no comprobar si ES II era o no “aceptablemente” aplicable en nuestro medio. Antes de medir los resultados, hemos de comprobar que la regla que los mide funciona. El registro de nuestra actividad quirúrgica es prospectivo y la extracción de los datos para la estimación de ES II se hizo en base a las definiciones propuestas por Nashef et al. Un 11.8% de cirugía no electiva en nuestra serie frente a un 23.3% en el artículo de Nashef puede tener su origen, no la óptima gestión de la programación quirúrgica, si no entre otras causas, a la baja prevalencia de pacientes coronarios de nuestra muestra, muchos de los cuales se intervienen de forma preferente o urgente. La discordancia entre ES I y ES II es un hallazgo que va en paralelo con otras características de nuestra muestra: 1) en primer lugar, y como bien afirma, la mortalidad estimada por ES I fue muy alta, lo cual sitúa nuestra muestra en un extremo poblacional, donde no son infrecuentes estos comportamientos dispares de dos escalas que miden el mismo evento; 2) nuestra cohorte de pacientes incluye mucha patología valvular y poca coronaria. Precisamente, ES II ha rebajado la mortalidad estimada en patología valvular mucho más que en patología coronaria, lo que podría explicar aún más esta disparidad. Así, es difícil extraer conclusiones de las comparaciones con otras series distintas a las de nuestro medio. Esperamos que otros grupos en nuestro país se “animen” a publicar sus series para así mejor contextualizar la nuestra.
Nos gustaría puntualizar algunos de los comentarios del Dr. Fernández-Tarrio sobre nuestro artículo. El Dr. Fernández-Tarrio afirma que las distribuciones de ES y ES II de nuestro trabajo son no normales. Ante todo, queremos recordar que en nuestro artículo se llevaron a cabo tests de normalidad para todas las variables cuantitativas. Independientemente de los resultados de dichos tests, se analizaron los coeficientes de asimetría y apuntamiento para cada variable cuantitativa, de suerte que ninguno tenía un valor absoluto superior a dos veces su error estándar. En base a estos tres hechos: resultado de test de Kolomogorov-Smirnov, y distribución de los coeficientes de asimetría y apuntamiento, demostramos la normalidad de la distribución de EuroSCORE logístico y ES II, y decidimos expresar los resultados como media e IC 95%.
Finalmente, quisiéramos felicitarle por sus excelentes resultados personales, pero nos gustaría también puntualizar que la experiencia personal sobre un total de pacientes 276 (la mayoría de bajo o mediano riesgo) no debiera ser un argumento comparativo frente a una serie de 4166 pacientes (con un EuroSCORE II más alto) de un grupo quirúrgico consolidado.