Las escalas de riesgo son una compleja herramienta estadística que nos permite estimar el riesgo de un paciente que va a ser sometido a una intervención. En cirugía cardiaca la variable estimada es la mortalidad hospitalaria y su utilidad radica en poder compararla con la mortalidad real obtenida. Para realizar dicha comparación necesitamos resumir la mortalidad estimada de la población a estudio mediante un estadístico de tendencia central que sea representativo de la muestra, siendo habitualmente utilizada en nuestro medio la media aritmética. La media aritmética se ve influenciada negativamente por los valores extremos siendo conceptualmente más correcta la utilización de la mediana de las mortalidades estimadas.
Risk scales are complex statistical tools that enable the preoperative risk of a patient referred for a surgery to be estimated. In cardiac surgery the calculated variable is the expected hospital mortality and its usefulness lies in comparing it to the obtained hospital mortality. To make this comparison the expected mortality of the study population needs to be summarised by a statistic that represents the sample, with the mean commonly being used. The mean is negatively influenced by the extreme values, thus the median should conceptually be more reliable to use for the expected mortalities.
Las escalas de riesgo1–3 son una herramienta estadística compleja desarrolladas a partir de una amplia población de pacientes sobre la que se obtienen un grupo de variables independientes preoperatorias, que mediante métodos de regresión logística se les calcula el peso de cada variable frente a una variable resultado que en el caso de la cirugía cardiaca es la mortalidad.
Todo modelo es cierto para la población desde la que ha sido generado, pero la cuestión surge en la extrapolación de sus resultados a otras poblaciones, lo que se define como la validez externa, la cual se confirma mediante estudios de discriminación y de calibración4,5.
La discriminación nos muestra la capacidad de nuestro modelo de diferenciar a los individuos de alto riesgo frente a los de bajo riesgo, y se cuantifica mediante el estadístico C o lo que es lo mismo, el área bajo la curva ROC.
La calibración compara mortalidad estimada con la observada utilizando test de Chi-cuadrado o similares. Con el tiempo, todos los modelos de riesgo pierden calibración con una clara sobrestimación del riesgo6 y ello, además de una realidad es una finalidad misma del modelo ya que reafirma el beneficio de los nuevos tratamientos utilizados. De todas formas, muchos trabajos concluyen que EuroSCORE logístico sobreestima la mortalidad real en base a un defecto de diseño del estudio al utilizar un estadístico de tendencia central erróneo como veremos más adelante.
Cuando comparamos resultados reales con resultados estimados, necesitamos 2 parámetros: el primero sería el porcentaje de mortalidad real de nuestra población de sencillo cálculo, y el segundo sería un estadístico de tendencia central (habitualmente media o mediana)7 que represente al conjunto de mortalidades estimadas de la población a estudio. Como resultado de dicha comparación solamente hay 3 escenarios posibles: que nuestros resultados sean mejores, iguales o peores. Los 2 primeros escenarios son zonas de tranquilidad, mientras que el tercer escenario nos exige realizar un análisis crítico de por qué se ha dado esa situación.
En muchas publicaciones nacionales e internacionales el estadístico utilizado para dicha comparación es la media aritmética8, mientras que por el contrario debería utilizarse la mediana7,9.
La media aritmética se ve afectada por los valores extremos7. La mortalidad estimada teóricamente oscila entre el 0 y el 100% con una gran mayoría de pacientes entre 1-5%, una minoría entre 0-1% y un número variable entre 5-100%, por lo que cuando presentamos la media como estadístico de tendencia central de la mortalidad estimada, presenta una clara desviación hacia la derecha, con un número absoluto mayor del que realmente representaría a nuestra muestra. A pesar de ello, es el estadístico que se refleja en un gran número de publicaciones al representar la mortalidad estimada y ello se debe por un lado a un error involuntario de concepto, por otro lado a una mala traducción de trabajos anglosajones en los que se traduce de forma errónea «Median» como «Media aritmética», cuando su traducción es «Mediana» (ya que media aritmética es «Mean» o «Average») y una tercera posibilidad sea la búsqueda voluntaria de obtener un estadístico con un valor absoluto algo más alto, lo que nos da un mayor margen al comparar nuestros resultados o al promocionar los beneficios de un tipo de tratamiento o intervención. Por cualquiera de estos motivos, la comparación de mortalidad real con la media aritmética de las mortalidades estimadas no refleja de forma fiel la precisión de nuestra actividad.
La mediana por el contrario, no se ve afectada por los valores extremos por lo que en una serie con un volumen adecuado sería el estadístico de tendencia central más representativo para reflejar la mortalidad estimada de la muestra7. Al contrario que la media, nos daría un valor absoluto algo más bajo lo que situaría el umbral de mortalidad estimada en un nivel más exigente.
A modo de ejemplo presento mi serie personal de pacientes intervenidos bajo CEC desde 2003 hasta 2013 con la mortalidad estimada mediante EuroSCORE logístico (fig. 1) expresado como media aritmética y como mediana, en donde se ve como el valor de la media aritmética está claramente desplazado por los valores extremos con respecto a la mediana en torno a 1,5-2 puntos porcentuales.
Como conclusión, subrayar que la comparación de nuestros resultados con los estándares aceptados es una piedra angular en el control de calidad de nuestra actividad actual. El análisis constructivo de dichos resultados es lo que permitirá el planteamiento de nuevas técnicas orientadas a mejorar los resultados presentes y, por lo tanto, a prestar una mejor asistencia a nuestros pacientes.
Responsabilidades éticasProtección de personas y animalesLos autores declaran que para esta investigación no se han realizado experimentos.
Confidencialidad de los datosLos autores declaran que en este artículo no aparecen datos de pacientes.
Derecho a la privacidad y consentimiento informadoLos autores declaran que en este artículo no aparecen datos de pacientes.
Conflicto de interesesLos autores declaran no tener ningún conflicto de intereses.