La calcificación de la aorta abdominal se asocia a un incremento en el riesgo de morbilidad cardiovascular, y disponer de un método de cuantificación de la misma es clínicamente trascendente. La escala de 24 puntos (AAC-24) es el método estándar para su evaluación en la radiología simple lateral de columna lumbar. El objetivo del estudio ha sido conocer el nivel de acuerdo intra e interobservador que aporta esta escala, teniendo en cuenta la heterogeneidad de la distribución de las calcificaciones en el diseño del análisis estadístico.
Material y métodosSe analizó la concordancia intraobservador (sobre radiografías de 81 pacientes, con una separación de 4 años) y la concordancia interobservador (sobre radiografías de 100 pacientes, con tres evaluadores), utilizando simultáneamente la correlación intraclase y el método gráfico de Bland-Altman.
ResultadosEl coeficiente de correlación intraclase fue de 0,93 (intervalo de confianza al 95% [IC95%]: 0,6-0,9) y 0,91 (IC95%: 0,8-0,9), intra e interobservador, respectivamente, con un incremento del coeficiente en el tercil de mayor discrepancia. La diferencia de medias osciló entre 0,3 y–1,2 puntos. La amplitud entre los límites de acuerdo, entre 4,7 y 9,4 puntos. Se observó un aumento significativo de las diferencias en relación con el aumento progresivo de la calcificación.
ConclusionesLa valoración de la calcificación de la aorta abdominal en radiología simple lateral de columna lumbar mediante la escala AAC-24 es un método fiable y reproducible, observándose un mayor grado de concordancia intra e interobservador en las fases iniciales de la calcificación
Calcification of the abdominal aorta is associated with increased cardiovascular morbidity, so a reliable method to quantify it is clinically transcendent. The 24-point scale (AAC-24) is the standard method for assessing abdominal aortic calcification on lateral plain films of the lumbar spine. The aim of this study was to determine the intraobserver and interobserver agreements for the AAC-24, taking into account the heterogeneity of the distribution of the calcifications in the design of the statistical analysis.
Material and methodsWe analyzed the intraobserver agreement (in plain films from 81 patients, with a four-year separation between observations) and the interobserver agreement (in plain films from 100 patients, with three observers), using both intraclass correlation and Bland-Altman plots.
ResultsThe intraobserver intraclass correlation coefficient was 0.93 (95% confidence interval [CI95%]: 0.6-0.9), and the interobserver intraclass correlation coefficient was 0.91 (CI95%: 0.8-0.9) with an increase in the coefficient in the tercile with the greatest discrepancy. The difference in means ranged from 0.3 to 1.2 points, and the distance between the limits of agreement ranged from 4.7 to 9.4 points. These differences increased significantly as the calcification progressed.
ConclusionsUsing the AAC-24 on lateral plain films of the lumbar spine is a reliable and reproducible method of assessing calcification of the abdominal aorta; both intraobserver and interobserver agreement are higher during the initial phases of calcification
La presencia de calcificaciones en la aorta se ha relacionado con un incremento del riesgo de morbimortalidad cardiovascular1–4. Concretamente, la calcificación de la aorta abdominal se ha asociado de forma consistente con un aumento del riesgo de infarto de miocardio5, de insuficiencia cardíaca6, de enfermedad arterial periférica7 y de accidente cerebrovascular8, lo que la convierte en una variable de indudable interés clínico.
La tomografía computarizada (TC), que permite una cuantificación volumétrica de los depósitos de calcio, constituye el patrón de referencia en la detección y evaluación del grado de calcificación aórtica abdominal9,10. Sin embargo, la radiología simple lateral de columna lumbar se ha mostrado útil en el diagnóstico de las calcificaciones aórticas7, es una técnica mucho más barata que la TC, conlleva una menor exposición a la radiación y ha demostrado una buena correlación con la presencia y con la magnitud de la calcificación en las arterias coronarias cuando se valoran mediante TC11,12. La escala semicuantitativa AAC-24 (Abdominal Aortic Calcification), una escala de 24 puntos desarrollada por Kauppila et al.13 y utilizada por el grupo del Estudio de Framingham4,6, es el método de evaluación habitual en la valoración de las placas calcificadas de la aorta abdominal obtenidas mediante radiología simple o densitometría lateral de columna14,15. En comparación con la escala AAC-24, el índice MACD (Morphological Atherosclerotic Calcification Distribution) de Nielsen et al.16, basado en la morfología de las calcificaciones, parece identificar mejor el riesgo de mortalidad de origen cardiovascular17. Por otro lado, la escala AAC-24ha sido asimismo comparada con la escala de 8 puntos (AAC-8), desarrollada por Schousboe et al.15. Si bien presenta una buena correlación con aquella18, un estudio previo dirigido a conocer el grado de acuerdo con ambas escalas ha mostrado que la concordancia con la escala AAC-8, a pesar de ser buena, no alcanzó el alto nivel que se objetivó con la AAC-2419.
Según todos los trabajos publicados, el grado de acuerdo con la escala AAC-24 es casi perfecto. Es habitual observar unas cifras de concordancia superiores a 0,90, tanto intraobservador (entre 0,93 y 0,9813,20) como interobservador (entre 0,90 y 0,9613,21). No obstante, todos estos análisis se realizaron empleando el coeficiente de correlación intraclases (CCI) como único estadístico, y cabe recordar que una de las limitaciones de este coeficiente es su fuerte dependencia de la variabilidad de los datos. Es decir, se eleva de forma notable con la presencia de valores extremos y, en general, ante distribuciones heterogéneas, independientemente del grado de concordancia obtenido22,23.
Teniendo en cuenta las distribuciones heterogéneas y asimétricas de las calcificaciones de la aorta abdominal observadas en grandes estudios poblacionales4,24, cabe preguntarse si los valores elevados del CCI publicados podrían estar sesgados por la heterogeneidad de la distribución de la variable, lo que podría limitar la fiabilidad de las mediciones con la escala AAC-24.
A la luz de estas consideraciones, el objetivo principal de nuestro estudio ha sido conocer en detalle el grado de fiabilidad, en concreto el acuerdo intra e interobservador, en la evaluación de las calcificaciones de la aorta abdominal mediante la escala AAC-24. Un objetivo adicional ha sido conocer la distribución de las diferencias entre las mediciones de los observadores.
Material y métodosPoblación y muestraEl diseño general corresponde a un estudio descriptivo transversal anidado en un estudio de cohortes. Nuestra investigación ha aprovechado el dispositivo implementado por un estudio prospectivo de base poblacional, la Cohorte Camargo25, tanto en los participantes como en las radiografías seleccionadas. Los sujetos estudiados son, por tanto, al igual que en la cohorte, varones de 50 o más años de edad y mujeres posmenopáusicas. Brevemente, la Cohorte Camargo se inició en 2006 con el objetivo de conocer la incidencia y la prevalencia de enfermedades metabólicas óseas en la población general, y sus participantes residen en el Valle de Camargo, Cantabria. La población, semiurbana y adscrita a dos centros de salud, está compuesta por 31 000 habitantes. A todos los pacientes se les pasó un cuestionario específico sobre metabolismo óseo y enfermedades generales, que incluyó factores de riesgo de osteoporosis y fracturas, un estudio de laboratorio general y de metabolismo óseo, una densitometría central, un estudio ultrasonográfico del calcáneo y una radiología simple lateral de columna torácica y lumbar, obtenidas mediante procedimiento convencional en el Servicio de Radiología del Hospital Universitario Marqués de Valdecilla. Todos los participantes dieron su consentimiento informado por escrito y el estudio fue aprobado por el Comité de Ética en Investigación Clínica de Cantabria.
Se han seguido los criterios de Walter y Eliasziw para el cálculo de tamaños muestrales en estudios de fiabilidad26. Así, para el análisis de la concordancia intraobservador, se estimó que serían necesarios 80 individuos para detectar un CCI de 0,70, con una potencia deseada de al menos un 98%. En la concordancia interobservador, la muestra requerida era de 100 sujetos, para detectar un CCI de 0,40, con una potencia deseada de al menos un 92%. En ambos casos se estableció la significación en el nivel del 95%. Una vez obtenidos los dos tamaños muestrales necesarios, se realizaron sendos muestreos de tipo sistemático con arranque aleatorio, a partir de los registros de los participantes de la Cohorte Camargo.
Técnica de estudio y evaluación de variablesDe acuerdo con la escala AAC-24, en las radiografías laterales de columna lumbar se dividieron las paredes anterior y posterior de la aorta en cuatro segmentos, correspondientes al área que se encuentra por delante de las vértebras L1 a L4. Los tramos evaluados fueron los comprendidos entre una línea imaginaria paralela a la superficie de los cuerpos vertebrales y entre ambos. Según esta escala, la calcificación aórtica se puntuó como 0 (no calcificación), 1 (calcificación en un tercio o menos de la pared aórtica), 2 (calcificación en más de un tercio pero en dos tercios o menos de la pared aórtica) o 3 (calcificación en más de dos tercios de la pared aórtica). Se consideró que existía calcificación aórtica cuando se apreciaron imágenes de densidad cálcica en una zona paralela y anterior a la columna lumbar, que podían mostrarse como un punteado blanco difuso, como una imagen lineal de calcificación de la pared anterior y/o posterior de la aorta o bien como una imagen circunferencial, homogénea o no, de densidad cálcica. Tras la suma de ambas paredes, la puntuación total se situó entre 0 y 24 (fig. 1). En la fase inicial del estudio, los evaluadores recibieron un entrenamiento específico para la utilización de la escala AAC-24 y aplicación del atlas radiográfico de Kiel et al.27, bajo la supervisión de uno de los autores (RLA), radiólogo con 18 años de experiencia clínica. Con este fin, todos ellos evaluaron 10 radiografías con diferentes grados de calcificación aórtica, que posteriormente fueron descartadas para el análisis.
Radiografía simple lateral de columna lumbar con imágenes de calcificaciones en la aorta abdominal de un participante en el estudio. Las puntuaciones parciales en la escala AAC-24 (pared anterior + pared posterior) fueron: Nivel L1=1 (1+0), nivel L2=0, nivel L3=4 (3+1), nivel L4=2 (0+2), lo que supone una puntuación total de 7.
El análisis de la concordancia intraobservador se ha realizado con una separación de 4 años entre ambas mediciones. Uno de los autores (EPR), investigador asimismo de la Cohorte Camargo, evaluó la escala AAC-24 sobre 81 radiografías laterales de columna lumbar. La primera evaluación se realizó en 2010 [Obs2010] y la segunda en 2014 [Obs2014], utilizando las mismas radiografías y desconociendo las puntuaciones de la evaluación inicial. Para analizar la concordancia interobservador, tres de los autores (GAS [Obs1], PGV [Obs2] y EPR [Obs3], médicos especialistas en medicina familiar y comunitaria con 12, 35 y 22 años de experiencia clínica, respectivamente) evaluaron de forma consecutiva e independiente la escala AAC-24 en las radiografías laterales de columna lumbar de 100 pacientes. Los observadores no tuvieron acceso en ningún momento a la información clínica de los sujetos evaluados. Los aspectos demográficos y características clínicas de los participantes en el estudio se presentan en la tabla 1.
Características clínicas de las muestras seleccionadas para evaluar la concordancia intraobservador e interobservador
Muestra 1: concordancia intraobservador (N=81) | Muestra 2: concordancia interobservador (N=100) | |
---|---|---|
Mujeres; N (%) | 62 (76) | 74 (74) |
Varones; N (%) | 19 (23) | 26 (26) |
Edad (años)* | 65,2 (9) | 63,6 (9) |
TAS (mmHg)* | 136 (16) | 135 (15) |
TAD (mmHg)* | 79 (9) | 80 (8) |
Índice de masa corporal* | 28,7 (3) | 28,6 (3) |
Glucemia venosa basal (mg/dl)* | 98 (20) | 101 (26) |
Colesterol total (mg/dl)* | 209 (48) | 211 (39) |
Colesterol HDL (mg/dl)* | 52 (16) | 53 (14) |
Colesterol LDL (mg/dl)* | 135 (43) | 135 (33) |
TSH plasmática (mU/l)* | 1,6 (1) | 1,5 (1) |
Proteína C reactiva (mg/dl)* | 0,4 (0,5) | 0,5 (0,8) |
Colesterol HDL: colesterol unido a lipoproteínas de alta densidad; colesterol LDL: colesterol unido a lipoproteínas de baja densidad; TAD: tensión arterial diastólica; TAS: tensión arterial sistólica; TSH: tirotropina.
Las series individuales han sido caracterizadas mediante la mediana y el rango intercuartílico, la media y la desviación estándar (DE), y los coeficientes de asimetría y de curtosis. Se analizaron cuatro distribuciones, denominadas arbitrariamente A1, B1, B2 y B3, que correspondían a los pares de observaciones Obs2010/Obs2014, Obs1/Obs2, Obs1/Obs3 y Obs2/Obs3, respectivamente. Asimismo, se han obtenido los terciles de una hipotética distribución que promediaba las series Obs1, Obs2 y Obs3. La comprobación del supuesto de normalidad se realizó mediante el test de Kolmogorov-Smirnov, y se procedió a una transformación logarítmica tras verificar que las distribuciones iniciales se alejaban de la normalidad. Se ha calculado el nivel de concordancia intra e interobservador utilizando un método analítico, el CCI en su variante (2,1)28,29 y un método gráfico, el método de Bland-Altman30,31. De acuerdo con esta metodología, se analizó gráficamente la diferencia entre cada par de mediciones frente a su media. Asimismo se obtuvieron el error sistemático, los límites de acuerdo al 95% y el coeficiente de repetibilidad (CDR)23,32.
Por último, con el fin de caracterizar estadísticamente la variabilidad observada en los gráficos de Bland-Altman, se realizó asimismo un análisis de heterocedasticidad.
Los tamaños muestrales fueron calculados con el software PASS 2008® (NCSS, Utah, EE.UU.), los gráficos de Bland-Altman, con MedCalc®8 (MedCalc Software, Ostend, Belgium), y el resto de cálculos con el paquete estadístico SPSS®15 (SPSS Inc., Chicago, Illinois, EE.UU.). Se ha considerado significativo un valor de p<0,05.
ResultadosEl grado de calcificación observado fue mayor en la pared posterior de la aorta y en los niveles distales, L3 y L4 (tabla 2). Las medianas oscilaron entre los 4 y los 6 puntos, y las medias, entre 4,5 y 6,7. Respecto al grado de dispersión, las distribuciones mostraron unos valores del rango intercuartílico entre 5 y 6,7, y de la DE, entre 3,9 y 5. Las series fueron asimétricas, con signo positivo, presentando una cola dispersa de puntuaciones a la derecha de la media, en relación con valores medios y altos de la escala. Por otro lado, en referencia al grado de apuntamiento o curtosis, las distribuciones eran de signo negativo, platicúrticas, con una mayor acumulación de casos en las colas respecto a la distribución normal. Los terciles se correspondieron con los siguientes tramos de la escala: 0-2,65 puntos (tercil 1), 2,66-6,55 puntos (tercil 2), y 6,56-24 puntos (tercil 3).
Parámetros de tendencia central, dispersión y distribución en las 5 series iniciales
Escala AAC-24 | Obs2010 | Obs2014 | Obs1 | Obs2 | Obs3 |
---|---|---|---|---|---|
N=81 | N=100 | ||||
Resultados parciales | |||||
Pared anterior* | 2 [3] | 2 [4] | 2 [3] | 2 [4] | 2 [4] |
Pared posterior* | 4 [3] | 3 [4] | 2 [3] | 2 [4] | 3 [4] |
Nivel L1* | 0 [1] | 0 [1] | 0 [1] | 0 [1] | 0 [1] |
Nivel L2* | 1 [2] | 0 [1] | 0 [1] | 0,5 [2] | 0 [1] |
Nivel L3* | 2 [2] | 2 [4] | 1,5 [2] | 2 [3] | 2 [4] |
Nivel L4* | 3 [2] | 2 [3] | 1 [3] | 2 [4] | 2 [2] |
Resultado total | |||||
Mediana [RIC] | 6 [6] | 5 [5,6] | 4 [5] | 5 [6,7] | 4,5 [6] |
Media (DE) | 6,7 (4,4) | 5,6 (4,4) | 4,5 (3,9) | 5,7 (5) | 5,4 (4,3) |
Coeficiente de asimetría | 0,4 | 0,6 | 0,8 | 0,7 | 0,6 |
Coeficiente de curtosis | –0,5 | –0,6 | –0,2 | –0,4 | –0,3 |
Significación del test K-S de normalidad** | 0,07 | 0,03 | 0,02 | 0,07 | 0,02 |
DE: desviación estándar; RIC: rango intercuartílico.
En los cuatro pares de observaciones, la mediana de las diferencias entre las puntuaciones (fig. 2) fue idéntica, con un valor de 1. La distribución con mayor rango de diferencias fue B1 (hasta 9 puntos), mientras que B2 y B3 (hasta 6) y A1 (hasta 4 puntos) presentaron una menor variabilidad.
En el análisis de la concordancia intraobservador (tabla 3), el valor del CCI fue 0,93 (IC95%: 0,6-0,9). La nube de puntos en el gráfico de Bland-Altman presentaba una distribución uniforme (fig. 3), sin ninguna tendencia reconocible. En concordancia con ello, el análisis de heterocedasticidad no pudo demostrar una diferencia significativa entre los rangos promedio de los terciles de la escala AAC-24 (tabla 4).
Estadísticos de concordancia: coeficiente de correlación intraclase y método de Bland-Altman
Escala AAC-24 | Intraobservador (N=81) | Interobservador (N=100) | ||
---|---|---|---|---|
Serie A1 | Serie B1 | Serie B2 | Serie B3 | |
Coeficiente de correlación intraclase (IC al 95%) | ||||
Escala global | 0,93 (0,6-0,9) | 0,88 (0,8-0,9) | 0,90 (0,8-0,9) | 0,93 (0,9-0,95) |
Tercil 1 | 0,78 (0,3-0,9) | 0,81 (0,6-0,9) | 0,58 (0,3-0,8) | 0,81 (0,6-0,9) |
Tercil 2 | 0,64 (–0,1-0,8) | 0,20 (–0,1-0,5) | 0,28 (–0,1-0,5) | 0,46 (0,1-0,7) |
Tercil 3 | 0,79 (0,4-0,9) | 0,28 (–0,1-0,6) | 0,46 (0,1-0,7) | 0,63 (0,4-0,8) |
Método Bland-Altman | ||||
Error sistemático* | 1,0 | –1,2 | –0,8 | 0,3 |
Límites de acuerdo al 95% | –1,3, 3,4 | –5,9, 3,5 | –4,6, 2,9 | –3,5, 4,2 |
Amplitud | 4,7 | 9,4 | 7,5 | 7,7 |
coeficiente de repetibilidad | 2,4 | 4,7 | 3,7 | 3,9 |
IC: intervalo de confianza.
Terciles de la escala AAC-24: tercil 1 (0-2,65 puntos); tercil 2 (2,66-6,55 puntos); tercil 3 (6,56-24 puntos).
Serie A1: observaciones realizadas en 2010 y en 2014.
Serie B1: Obs1 y Obs2.
Serie B2: Obs1 y Obs3.
Serie B3: Obs2 y Obs3.
Análisis de heterocedasticidad
Rangos promedio* | p | |||
---|---|---|---|---|
Tercil 1 | Tercil 2 | Tercil 3 | ||
Análisis intraobservador | ||||
Serie A1 | 33,4 | 43,6 | 44,4 | 0,16 |
Análisis interobservador | ||||
Serie B1 | 21,8 | 52,9 | 72,1 | <0,0001 |
Serie B2 | 22,6 | 53,1 | 71,3 | <0,0001 |
Serie B3 | 25,1 | 56,7 | 65,8 | <0,0001 |
Terciles de la escala AAC-24: tercil 1 (0-2,65 puntos); tercil 2 (2,66-6,55 puntos); tercil 3 (6,56-24 puntos).
Serie A1: observaciones realizadas en 2010 y en 2014.
Serie B1: Obs1 y Obs2.
Serie B2: Obs1 y Obs3.
Serie B3: Obs2 y Obs3.
Respecto al grado de acuerdo interobservador, el CCI para los tres observadores fue de 0,91 (0,8-0,9). En el análisis por parejas de observadores, la concordancia más alta correspondió a B3, con un CCI de 0,93 (0,90-0,95). Los gráficos de Bland-Altman mostraron un progresivo incremento de las diferencias en las puntuaciones, más evidente cuanto más aumentaba la media de la puntuación en el eje de abscisas (fig. 4). Este incremento en el error interobservador, y por tanto en la variabilidad de la distribución, se correspondía con los tramos superiores de la escala AAC-24 y fue confirmado en el análisis de heterocedasticidad, el cual mostró una significativa desigualdad de las varianzas entre los terciles (tabla 4). En relación con ello, la amplitud de los límites de acuerdo fue mayor que la observada en el análisis intraobservador, y en el caso concreto de B1, exactamente el doble que la amplitud de los límites de acuerdo de A1 (9,4 y 4,7, respectivamente). El error sistemático más elevado, con un valor de–1,2 puntos, se observó en B1, mientras que el valor más bajo correspondió a B3.
Por último, hemos evaluado el comportamiento del CCI en los diferentes terciles de la escala AAC-24. Los valores que el CCI adoptaba en el último tercil de las cuatro distribuciones–el tramo de mayor variabilidad en las puntuaciones–, eran superiores a los valores correspondientes al segundo tercil. Además, hemos observado un incremento notable del CCI al considerar la serie completa respecto a los valores que adoptaba en los terciles. A modo de ejemplo, en la serie B2 se observaron unos valores de CCI de 0,58 (primer tercil), 0,28 (segundo tercil) y 0,46 (último tercil), mientras que se obtuvo un valor de 0,90 sobre la serie completa (tabla 3).
DiscusiónEn el presente estudio, y de forma concordante con lo publicado4,24, la escala AAC-24 mostró una distribución asimétrica y heterogénea, con un predominio notable de los valores bajos de la escala y colas muy alargadas hacia los valores superiores. El mayor grado de calcificación observado en los niveles L3-L4 respecto a los niveles L1-L2 se había descrito anteriormente13,21, y posiblemente guarda relación con el desarrollo de la calcificación, que comenzaría más distalmente y avanzaría hacia zonas más proximales de la aorta abdominal21. Asimismo, hemos observado una mayor presencia de placas calcificadas en la pared posterior respecto a la pared anterior de la aorta abdominal, también documentada con anterioridad20.
Una cuestión aún no aclarada convenientemente es la relación concreta entre la puntuación de la escala y la gradación del riesgo cardiovascular. Se ha publicado recientemente que el contenido cálcico de la placa puede ser proporcional al riesgo de rotura solo hasta un cierto límite, a partir del cual la placa se hace más estable, y que un cierto número de pequeñas calcificaciones puede indicar un mayor riesgo de rotura que unas calcificaciones grandes y estables en la misma zona14. Sin embargo, el punto de corte de 5 en la escala AAC-24 se considera como el «nivel significativo de carga aterosclerótica»33. De hecho, Wilson et al.4 observaron que una puntuación ≥5 se asociaba a un riesgo relativo ajustado de 1,91 (1,5-2,5) de enfermedad coronaria, mientras que el riesgo de enfermedad cardiovascular fue de 1,70 (1,4-2,1), y el de mortalidad cardiovascular de 2,26 (1,6-3,1). Este valor ≥5 puntos en la escala AAC-24 se ha asociado asimismo a un mayor grado de calcificación en las arterias coronarias, con una odds ratio de 6,42 (2,3-18)34. Por su parte, Lewitzky et al.7 comprobaron que una puntuación ≥4 en la escala AAC-24 se asocia a un riesgo relativo ajustado de 1,68 (1,1-2,5) de claudicación intermitente y de 1,73 (1,1-2,6) de ictus isquémico.
Dado que estos puntos de corte, según lo publicado, tienen trascendencia clínica, se hace necesario asegurar la fiabilidad en las mediciones al utilizar la AAC-24. En este sentido, los autores que desarrollaron esta escala, al analizar 100 radiografías de participantes en el estudio de Framingham, comunicaron unos valores del CCI interobservador, para la puntuación total, de 0,93 en las radiografías iniciales y de 0,96 en las de seguimiento (0,98 y 0,96, respectivamente, en el análisis intraobservador)13. Schousboe et al.15 observaron un CCI interobservador de 0,92 y Toussaint et al.20 reportaron un CCI intraobservador de 0,92 para la puntuación de la pared anterior, 0,91 para la puntuación de la pared posterior y 0,93 para la puntuación global. Por último, Honkanen et al.21 encontraron una correlación interobservador de 0,90.
Nuestros resultados son muy similares a lo publicado, 0,93 y 0,91, en la concordancia intra e interobservador, respectivamente. Sin embargo, hay que considerar que el CCI se ha incrementado, en las cuatro distribuciones y de forma notable, en relación directa con la variabilidad de los datos. Por ello, cabe especular que los valores elevados del CCI descritos en los estudios previos13,15,20,21 y que fueron obtenidos sobre muestras con distribuciones muy heterogéneas de la calcificación aórtica podrían deberse al mismo efecto. En relación con este artefacto estadístico, algunos autores han señalado que unos valores del CCI superiores incluso a 0,75, nivel tradicionalmente considerado como indicador de una buena concordancia, pueden ser inaceptables en dependencia de ciertos objetivos de investigación35.
El método de Bland-Altman ha permitido obtener una información de gran interés, como es el aumento de la variabilidad en relación con el incremento de las puntuaciones en la escala. Por otro lado, la principal limitación de este método es que la estimación del grado de acuerdo es subjetiva: la aceptación o el rechazo de un determinado grado de concordancia entre dos observadores depende de la comparación de los límites de acuerdo con la práctica clínica30. Aunque no hemos encontrado ninguna referencia publicada sobre la utilización conjunta de la AAC-24 y el método Bland-Altman con objeto de comparar nuestros resultados, interpretamos como un nivel elevado de concordancia el observado en las distribuciones A1, B2 y B3, y por el contrario, como menor concordancia la observada en B1, dado que ha presentado el mayor error sistemático y la mayor amplitud de los límites de acuerdo.
Hemos analizado los 7 casos de mayor diferencia en las puntuaciones, que corresponden a los puntos que quedan fuera de los límites de acuerdo. Así como las imágenes lineales de calcio en las paredes aórticas no han supuesto discrepancias relevantes, la principal fuente de variabilidad en la puntuación han sido las imágenes de calcificación circunferencial (fig. 5), lo que indica la conveniencia de dedicar una especial atención a esta imagen en la fase de aprendizaje previa al uso de la escala.
La principal fortaleza de nuestro estudio es haber efectuado un análisis exhaustivo, en nuestro conocimiento no realizado previamente, sobre el grado de acuerdo en la evaluación radiológica de la calcificación aórtica abdominal, mediante la escala de 24 puntos y en condiciones reales de práctica clínica. Para ello han participado varios observadores y se han utilizado dos estadísticos de concordancia. En este aspecto, entendemos que el CCI y el método de Bland-Altman aportan una información complementaria: así como el primero es una medida global de concordancia, el segundo informa sobre la distribución de las diferencias entre las dos mediciones.
Una limitación del estudio es que la evaluación se ha realizado sobre radiografías convencionales. Aunque la calidad técnica de estas ha sido adecuada, cabe suponer la existencia de un posible sesgo de clasificación, en la medida en que la calidad inferior de alguna película ha podido influir en las puntuaciones de los observadores. La radiografía digitalizada, con las ventajas que aporta (alta calidad de las imágenes, buena resolución, posibilidad de manipulación en el monitor) hubiera minimizado dicho posible sesgo.
En conclusión, la evaluación de la calcificación aórtica abdominal mediante la escala AAC-24 es, en términos generales, fiable y reproducible, tanto por un observador como por diferentes observadores. Aunque permite un elevado grado de concordancia, hay que considerar que este es diferente en ambos extremos de la escala; es decir, la fiabilidad es mayor en las fases iniciales de la calcificación de la aorta abdominal y es menos fiable al aumentar el grado de calcificación. La utilización de la escala AAC-24 debe ir precedida de un entrenamiento específico, con una especial atención al patrón radiológico de calcificación circunferencial, presentación que ha supuesto la principal fuente de variabilidad en las puntuaciones de nuestro estudio.
Autorías- 1.
Responsable de la integridad del estudio: EPR y JMO.
- 2.
Concepción del estudio: EPR, GAS y JMO.
- 3.
Diseño del estudio: EPR, GAS, JLH y RLA.
- 4.
Obtención de los datos: GAS, PGV y RLA.
- 5.
Análisis e interpretación de los datos: EPR, JLH, RLA y JMO.
- 6.
Tratamiento estadístico: EPR y JLH.
- 7.
Búsqueda bibliográfica: GAS, PGV y RLA.
- 8.
Redacción del trabajo: EPR, GAS y PGV.
- 9.
Revisión crítica del manuscrito con aportaciones intelectualmente relevantes: JLH, RLA y JMO.
- 10.
Aprobación de la versión final: EPR, GAS, PGV, JLH, RLA y JMO.
Los autores declaran que para esta investigación no se han realizado experimentos en seres humanos ni en animales.
Confidencialidad de los datosLos autores declaran que en este artículo no aparecen datos de pacientes.
Derecho a la privacidad y consentimiento informadoLos autores declaran que en este artículo no aparecen datos de pacientes. Gracias.
Conflicto de interesesLos autores declaran no tener ningún conflicto de intereses.
FinanciaciónEl estudio ha sido financiado con ayuda del Instituto de Salud Carlos III, Ministerio de Ciencia e Innovación (FIS PI 11/01092).