INTRODUCCION
La translucencia nucal (TN), medida alrededor de las semanas 11-13, es el marcador más potente del síndrome de Down y de otras aneuploidías1.
La TN no está aumentada en todos los casos de síndrome de Down; además, hay fetos, la mayoría normales, con la TN aumentada. El cribado exclusivo con la TN renunciaría a detectar aproximadamente un 25% de los fetos afectados, por lo que es aconsejable asociar otros marcadores de aneuploidías1.
La edad materna es el factor que mejor define los riesgos basales (pretest) de las trisomías 21, 18 y 13, lo que provoca que el significado de un valor de la TN varíe según la edad materna; además, como los riesgos derivados de estos 2 factores son independientes, permite combinarlos.
Cuando se inicia un programa de cribado de aneuploidías se dispone de los datos de la bibliografía, pero se carece de valores y referencias propias, lo que obliga a utilizar alguno de los modelos publicados. En esta situación, nosotros2 optamos por la ecuación de Cuckle3 para establecer el riesgo debido a la edad de la madre, y por los modelos de Nicolaides4 para calcular los valores de referencia de la mediana de la TN, según la longitud céfalo-nalga (LCN), y sus parámetros en la distribución de los logaritmos de los múltiplos de la mediana (MoM) en la población normal y en la población de fetos con síndrome de Down. Asumíamos así que estos modelos debían de funcionar bien en nuestro medio.
El programa informático, tras introducir las medidas de LCN y TN, y la fecha de nacimiento de la gestante, obtenía los resultados de los riesgos debidos a la edad materna y la resultante de multiplicar éste por la razón de probabilidad correspondiente al valor del MoM de la TN. Pero la validez del cálculo no sólo depende de la adecuación de los modelos, sino también de la precisión de las medidas. La medición de la LCN y la TN es fácil, pero la sencillez no es suficiente garantía de precisión.
Las consecuencias clínicas y las connotaciones éticas de un programa de cribado de aneuploidías son trascendentales, por lo que es necesario realizar un seguimiento de la calidad de estos programas, pero no sólo sobre sus parámetros de eficacia sino también sobre la precisión de las medidas ecográficas5,6.
La eficacia de la TN para el cribado del síndrome de Down no ha sido brillante en todos los estudios. En algunos7,8 los resultados no auguraban un buen futuro a esta medida; sin embargo, su valor ha ido emergiendo, con el ordenamiento de la metodología de la exploración ecográfica, y gracias a los estudios sobre la precisión de las medidas9-12.
En este trabajo vamos a analizar la preparación realizada para iniciar un programa de cribado y la precisión alcanzada por 6 observadores en sus 100 primeras exploraciones, valorando después, durante los primeros 2 años de ejecución, de enero de 2001 a diciembre de 2002, el comportamiento de las comprobaciones realizadas por los 3 observadores implicados especialmente en su ejecución.
MATERIAL Y MÉTODOS
Todos los observadores que realizaron las mediciones de la LCN y la TN eran especialistas en obstetricia y ginecología, con experiencia en la realización de ecografías, tanto vaginales como abdominales, en gestaciones normales y patológicas, así como en pacientes ginecológicas.
El inicio del programa supuso una reflexión previa, a partir de la bibliografía, con un consenso en los procedimientos y en la metodología de ejecución de las exploraciones, incluidas las mediciones de la LCN y de la TN, tal como se expresaron con anterioridad2. También hubo una fase de entrenamiento práctico, no controlado, entre enero y junio del año 2000. Durante la fase de seguimiento de los 3 observadores, se trató de profundizar en este consenso mediante el trabajo diario conjunto entre ellos en forma de pareja rotatoria.
Todas las gestantes del Área Sanitaria 8 de Valencia fueron invitadas a participar en el estudio, entregándoles la información necesaria para obtener su consentimiento informado por escrito. La selección y las citas para la exploración se realizaban en los centros de especialidades, y se derivaban a la Unidad de Diagnóstico Prenatal del Hospital General Universitario de Valencia, cuando se estimaba, por la fecha de la última regla, que alcanzaban la semana 12. El programa de cribado fue aprobado por el comité de investigación clínica y ética del hospital y fue posible iniciarlo y continuarlo gracias a una ayuda del FIS.
Todas las observaciones se realizaron mediante un ecógrafo general Electric Logic Pro 400. La exploración se precedía de la anotación de los datos de identificación de la paciente, incluida la fecha de nacimiento y la de la última regla. La exploración ecográfica inicial era abdominal, pero se utilizó la vía vaginal si las imágenes no eran adecuadas, y en todos los casos se consiguieron las medidas de la LCN y TN. Sólo se aceptaban fetos con LCN entre 40 y 80 mm.
Los datos se suministraban a una base FileMaker Pro®, que tenía programadas las ecuaciones para calcular los riesgos de síndrome de Down debidos a la edad materna3, obteniendo después, a partir de la LCN, la edad gestacional5 y la mediana de la TN esperada4. El programa calculaba a continuación los MoM de la TN y sus logaritmos, aplicándose los parámetros de la distribución de éstos en la población normal y en la de síndromes de Down propuestos por Nicolaides4 para calcular los cocientes de probabilidad, con lo que, finalmente, se consiguió obtener el riesgo personalizado de síndrome de Down.
De junio de 2000 hasta final de 2002 se realizaron 4.368 exploraciones. Se han utilizado las 100 primeras de 6 observadores, de los que se presentan los estadísticos descriptivos y el análisis de la varianza, de las medidas de la LCN, la TN, los MoM de la TN y de los logaritmos decimales de los MoM de la TN.
El programa fue mantenido, especialmente, por 3 observadores, de los que se hace un seguimiento semestral de sus exploraciones, desde enero de 2001 a diciembre de 2002, sobre 3.601 exploraciones.
En los últimos 18 meses, los observadores tenían la máxima estabilidad en sus mediciones, realizándose un análisis de la varianza de la edad de las gestantes y de los valores que acabamos de referir, para analizar la influencia de la LCN, segmentada en 4 grupos (40-50, 50-60, 60-70 y 70-81 mm) en la medida de la TN, sobre 2.736 exploraciones.
Ningún observador conocía la existencia de un seguimiento de control de calidad hasta que finalizó la fase de estudio en junio de 2004. Los análisis estadísticos se han realizado con el programa de SPSS 12.
RESULTADOS
En la tabla 1 se muestran los estadísticos de las primeras 100 exploraciones realizadas por 6 observadores y los análisis de la varianza correspondientes. En la tabla 2 A y B se exponen los resultados de los análisis post hoc en las variables que mostraron, con análisis de la varianza, diferencias significativas.
En las tablas 3-5 se muestra la evolución de los observadores A, B y C, en los 4 semestres sucesivos de los años 2001 y 2002. No se incluye el detalle de la edad de las gestantes porque no presentó diferencias significativas. Los análisis post hoc de la LCN demostraron para el observador A que, en el último semestre, esta medida es diferente a todos los otros semestres, algo que ocurre sólo entre los últimos 2 semestres en los observadores B y C. En la TN los observadores A y B presentan diferencias sólo entre los primeros 2 semestres, mientras que el C no muestra ninguna diferencia. En los MoM de la TN el observador A muestra diferencias entre el primer semestre con el segundo y el cuarto, en el observador B sólo entre el primero y el segundo, sin observarse diferencias en el observador C. En los logaritmos MoM de la TN, el observador A muestra diferencias entre el primer semestre y los otros tres, también entre el tercer y cuarto semestre; el observador B sólo presenta diferencias entre el primer y segundo semestre, mientras que el observador C muestra diferencias entre el último semestre con el primero y el segundo.
Las figuras 1-3 son la representación gráfica de las mediciones de la LCN, la TN y los MoM de la TN de los 3 observadores, donde se observa cómo evolucionan estas variables en cada semestre.
Figura 1.Valor medio de la longitud céfalo-nalga.
Figura 2.Valor medio de la translucencia nucal.
Figura 3.Valor medio de los múltiplos de la mediana de la translucencia nucal.
En la tabla 6 se analizan las diferencias entre los 3 observadores con las exploraciones que realizaron entre julio de 2001 y diciembre de 2002. El análisis de la varianza muestra que, salvo en la edad de las gestantes, tanto en la LCN, la TN, los MoM de la TN y los logaritmos de los MoM de la TN, hay diferencias muy significativas, y los análisis post hoc mostraban que todas se debían a que el observador C presenta una desviación en sus mediciones de la LCN y la TN.
En las tablas 7 y 8 se muestra el comportamiento de las mediciones de TN y de los logaritmos de los MoM de TN según las LCN agrupadas en 4 intervalos, y se pone de manifiesto que los 3 observadores sobrestiman la TN de los fetos más pequeños, mientras infraestiman la de los fetos mayores. Este efecto queda gráficamente ilustrado en la figura 4.
Figura 4.Percentil 50 de los múltiplos de la mediana de la translucencia nucal.
DISCUSION
Un programa de cribado de aneuploidías precisa un control de calidad, tanto de su eficacia como de los parámetros que utiliza, ya sean determinaciones de laboratorio y/o mediciones ecográficas9-12. La sencillez de las principales medidas ecográficas que se utilizan en el cribado del síndrome de Down, en el primer trimestre, LCN y TN, no evita que pueda haber desviaciones según las características de la población13, pero algunas también se deben al observador, el instrumental o las circunstancias ambientales14.
Se necesita un entrenamiento preliminar, que se suele plantear sobre la técnica de obtención de las imágenes, con su evaluación, y la del procedimiento de medida6. La valoración independiente de imágenes registradas realiza sólo un control transitorio o intermitente, y el observador evaluado conoce la situación, lo que le condiciona una actitud de alerta, que plantea dudas sobre el mantenimiento posterior de sus estándares en la práctica cotidiana14.
El estudio de los valores medios y de la distribución de los percentiles de los MoM de la TN, o de sus logaritmos, facilita una evaluación continuada, ya que sus valores centrales, cuando se han realizado unas 50 exploraciones deben aproximarse, respectivamente, a 1 o 011. Este tipo de control no permite determinar la precisión en un caso concreto, pero se incorpora con facilidad a la práctica diaria, facilitando el seguimiento, y se relaciona bien con la precisión en los casos individuales11,12.
El comienzo de nuestro programa estuvo precedido de la discusión de la metodología acerca de las exploraciones ecográficas y la obtención de las medidas, LCN y TN2, mientras se preparaba una memoria de investigación que permitió conseguir los fondos necesarios para mejorar las características de nuestro ecógrafo y facilitar su ejecución. Hubo una fase de entrenamiento libre, no controlado y, posteriormente, cuando se inició el estudio, se organizaban las sesiones exploratorias con la concurrencia alternativa y rotatoria de 2 exploradores, para facilitar la mutua observación y la discusión de la metodología de trabajo. Finalizada esta fase, cuyos resultados son este estudio, en enero de 2003, se procedió a la representación visual de las desviaciones de las medidas de la TN de cada uno de los observadores, por grupos de LCN, respecto a los valores de TN definidas por el modelo de referencia4.
La primera consecuencia es que, con nuestro entrenamiento inicial, más informal que los de mayor difusión9, con las primeras 100 mediciones se definen 3 tipos de observadores: los que alcanzan casi de inmediato una buena precisión, y sus MoM se desvían menos del 5%, los que presentan una aproximación aceptable, desviándose menos del 10%, mientras que algunos obtienen desviaciones mayores del 10%.
La segunda es que con la experiencia y el trabajo conjunto se consigue mejorar la precisión, lo que permite que los 3 observadores obtengan desviaciones menores del 10%, incluso en dos, tras unas 300 observaciones, la desviación es menor del 5%. No obstante, no son necesarias tantas observaciones para conseguir una buena precisión, pues nuestro observador G ya presentaba desviaciones menores del 5%, con sólo 25 observaciones, y sigue manteniendo su precisión.
La tercera es que se produce una sobrestimación del valor de la TN de los fetos con menor LCN, mientras se infraestima la de los fetos más grandes, lo cual provoca unas desviaciones en los MoM de la TN que generarán más cribados positivos en los fetos más pequeños.
La sencillez de la exploración y la difusión publicitaria de programas de valoración del riesgo permite que se realicen en la actualidad, de forma organizada o esporádica, muchas exploraciones de cribado por observadores casuales, a los que hay que concienciar de que la percepción de sencillez y la buena predisposición no son suficiente garantía de calidad, y conviene someterse a una evaluación continuada, pues los hábitos exploratorios defectuosos, la relajación en la práctica clínica o las condiciones de trabajo inadecuadas, por la presión asistencial, el déficit de personal o de instrumental, lleva a la obtención de resultados poco adecuados, si se les somete a un riguroso análisis.
El primer estudio6 sobre la repetibilidad de las mediciones de la TN, con observadores bien entrenados, mostraba unas variabilidades intraobservador e interobservador que en el 95% de los casos presentaban valores de 0,54 y 0,62 mm, unos límites grandes si consideramos que la mediana de los valores de la TN en esta fase de aplicación clínica oscilan entre 1,1 y 1,9 mm, un espacio de sólo 0,8 mm, apenas algo más que la repetibilidad, lo que suponía unas desviaciones de un 20%.
Siguiendo la evaluación inicial de 50 imágenes propuesta por la FMF9, se ha realizado revisiones intermitentes de imágenes fotográficas, valorándolas mediante determinadas puntuaciones (una mayor puntuación significa una mejor metodología y una mayor precisión), que incluyen conceptos como los siguientes: a) corrección del corte sagital del feto; b) ampliación de la imagen; c) ubicación de calípers; d) seguimiento de la piel hasta la espalda fetal; e) demostración del amnios, y f) posición neutra de la cabeza, donde una mayor puntuación significa una mejor metodología y una mayor precisión10,11. Las imágenes inaceptables desaparecen cuando los observadores saben que están siendo evaluados11.
La preocupación sobre la calidad de estas mediciones ha llevado a valorar otros sistemas, como la distribución de los MoM de la TN11,12, y se ha hallado una gran concordancia entre las puntuaciones más altas y los valores medios de los MoM próximos a la unidad; aun así, el seguimiento temporal muestra una variación mayor de ± 0,111.
Un problema es la sobrestimación de la TN en los fetos más pequeños y la infraestimación en los más grandes, que es un efecto debido en parte a la instrumentación que marca el mantenimiento de pequeños defectos en la metodología de las mediciones, ya que las desviaciones son de distinta magnitud entre observadores. En nuestra experiencia la mejor precisión se produce con LCN entre 50 y 70 mm, y se han realizado recomendaciones sobre el momento más oportuno de realizar el cribado15-17 en concordancia con este hecho.
Un aspecto menos debatido es la variabilidad en las mediciones de la LCN, donde se han descrito errores aleatorios de ± 1,2 mm, y sistemáticos con una sobrestimación del 3,7% (en nuestras aplicaciones supondría unos 2 mm), junto a otro error de 1 mm por la amplitud del haz de ultrasonidos5. Estos errores no se han evitado con una tecnología más moderna18,19. Cabe esperar, pues, que en las mediciones de la LCN se produzcan unos errores de ± 4 mm, lo que se plasmaría en variaciones de aproximadamente 0,1 mm en la TN esperada, cerca de un 10% de su valor.
Los resultados del período de julio de 2001 a diciembre de 2002, cuando los observadores habían conseguido ya una estabilidad en sus mediciones, muestran que el reclutamiento externo provocaba una asignación aleatoria de las pacientes, avalada por la falta de diferencias en su edad, y también permite observar diferencias en los valores de las medidas y de los cálculos derivados, originadas por la forma de medir del observador C, que sobrevalora la LCN en unos 2 mm e infravalora la TN en 0,1 mm, lo que provoca una infraestimación del 10% en los MoM de la TN.
¿Son importantes estos problemas en la aplicación de un programa de cribado basado en la TN? Según nuestra experiencia no son lo suficientemente graves para renunciar a implementarlo, pues la tasa de detección de aneuploidías durante el período estudiado ha sido del 100%, aunque la variabilidad en las mediciones se ha plasmado en una tasa de resultados positivos (riesgo > 1/200) que apenas alcanzaba un 2% para el observador C, mientras que era del 4% en los observadores A y B, por lo que hay que detectar estos problemas y tratar de corregirlos12.
¿Está justificado ajustar unas referencias particulares, institucionales o personales, para disminuir la variabilidad? Unas referencias particulares sólo se justifican cuando hay diferencias en las características de la población13, pues las debidas a los equipos de ecografía actuales serían imperceptibles. En nuestra población el modelo de Nicolaides es adecuado4, ya que las pequeñas diferencias que observamos están causadas por desviaciones metodológicas, que deben corregirse, y no maquillarlas mediante ajustes con referencias individuales20.
Esta investigación se realizó con la ayuda del FIS 00/1057.
Correspondencia:
Dr. J.J. Santonja Lucas.
Departamento de Pediatría, Obstetricia y Ginecología. Facultad de Medicina.
Avda. de Blasco Ibáñez, 17. 46010 Valencia. España.
Correo electrónico: Jose.Santonja@uv.es
Fecha de recepción: 12/7/05.
Aceptado para su publicación: 11/11/05.