Introducción
En los últimos años, los sistemas de captura electrónica de datos (CED) se han popularizado en el ámbito de los ensayos clínicos (EC) porque prometen mejorar la calidad de los datos y reducir sustancialmente los costes1. Sin embargo, la industria farmacéutica y la de dispositivos han intentado evitar modificar sus procesos internos para adaptarse al uso de la CED, porque considera que el riesgo asociado es alto2.
Históricamente, se han desarrollado distintos tipos de CED que han sido bautizados con distintos nombres y etiquetas, lo que conlleva una cierta confusión terminológica. En este artículo, el término CED se refiere al proceso de registro de datos en el lugar (y tiempo) en que se originan, mediante un sistema informático que ha sido específicamente diseñado para ese propósito. La investigación clínica no ha sido el primer ámbito de investigación que ha utilizado la CED. Los primeros intentos de CED en el terreno de la investigación se produjeron en el campo de las encuestas sociológicas, en la modalidad de encuestas telefónicas. Se trataba inicialmente de un software manejado por el encuestador, que le permitía registrar los datos y las respuestas del sujeto encuestado al mismo tiempo que mantenía la conversación telefónica. Este procedimiento, que se denominó computer assisted telephone interviewing (CATI), se utilizó por primera vez en 1971, en los Estados Unidos3. Uno de los primeros sistemas de CED aplicado a la investigación clínica fue un estudio de histocompatibilidad en trasplantes de riñón promovido por el National Health Institute (de Estados Unidos) en 19734. Un PC en Dallas y otro en Houston se conectaron, por vía telefónica, a un ordenador central sito en el Research Triangle Park para rellenar los datos del estudio en un cuaderno de recogida de datos electrónico (eCRD). Los otros 25 centros participantes en el estudio utilizaron un cuestionario de recogida de datos en papel (CRD). Una de las primeras experiencias españolas con la CED en el ámbito de la investigación clínica fue un estudio multicéntrico en 1995, en el que se usaron pen-computers como sistema de entrada remota de datos (ERD)5.
A pesar de que hace tiempo que la tecnología de la CED está disponible para ser utilizada en investigación clínica, no ha sido considerada seriamente por la industria hasta que el abaratamiento de los equipos informáticos, el desarrollo, la difusión y la fácil disponibilidad de Internet han hecho interesantes los sistemas de CED en términos de coste-efectividad6. También es cierto que la ausencia de normativa en la utilización de la CED no ha fomentado su uso. Hasta la fecha, solamente la FDA ha especificado un marco concreto para la utilización de la CED7. Como contrapartida, la progresiva seguridad de Internet a la hora de codificar y «encriptar» los datos que se envían permite alcanzar grados de protección similares a los de las bases de datos mantenidas en redes internas8, de forma que se garantizan razonablemente los requisitos de confidencialidad, protección y seguridad de los datos. La rápida evolución de la tecnología también ha permitido mejorar la velocidad de transmisión de datos. La experiencia en el uso de la CED ha permitido mejorar el interfaz entre el sistema y los usuarios, le ha dado más funcionalidades y a la vez lo ha simplificado9. Estos hechos, así como la progresiva familiarización con las herramientas informáticas por parte de los profesionales sanitarios, ha incrementado de manera muy notable la aceptación de la CED entre éstos.
Papel frente a captura electrónica de datos
Las diferencias principales entre un CRD y un eCRD (tabla 1) tienen mucho que ver con el soporte utilizado (escribir en un papel frente a escribir en un ordenador), pero sobre todo afecta a los procesos que se llevan a cabo en toda investigación clínica (tabla 2). En comparación con el papel, la CED facilita los procesos de entrada, manejo y análisis de los datos, requiere mucho menos espacio de almacenamiento (el formato electrónico permite almacenar todo un estudio en un CD), presenta todas las potencialidades de una herramienta dinámica y sobrepasa las funcionalidades del CRD. Por ejemplo, en la investigación realizada con dispositivos médicos (como, marcapasos) el eCRD permite combinar las funcionalidades propias del CRD (captura de datos clínicos facilitados por el médico investigador) con la captura directa de datos (CDD) a partir del dispositivo.
Cuando el sistema de registro de datos es un sistema informático, dicho sistema debe estar listo y validado en el momento de la inclusión del primer paciente. Aunque las funcionalidades del sistema pueden variar, debe incluir al menos 2 elementos:
La base de datos (BD) del estudio (para alojar los datos).
El eCRD, es decir, la interfaz (pantallas) que permitirá al usuario alimentar la BD (introducir los datos).
Y es muy deseable que incluya además:
Controles sobre los datos (plan de validación).
Alarmas o solicitudes de aclaración al usuario en caso de que los datos introducidos sean incompletos, inconsistentes o problemáticos (queries).
En consecuencia, ciertas tareas que, cuando se trabaja en papel, pueden realizarse mientras se selecciona a los pacientes (definición y programación de la BD y del plan de validación de datos, así como validación de ambas cosas), deben adelantarse y finalizarse antes de iniciar la selección.
La planificación de un EC en el que se pretende utilizar un sistema de CED debe hacerse con un margen de tiempo mayor que cuando se trabaja con un CRD, porque todas las tareas implícitas de preparación del sistema de CED son complejas y requieren tiempo (tabla 2). En contrapartida, cuando se haya finalizado el seguimiento del último paciente, no hay que grabar los datos (porque ya están en soporte electrónico) y no se debe ejecutar el plan de validación, ni emitir queries (porque la calidad de los datos se ha controlado desde el momento en que se han introducido). Esto debería permitir la consecución de una BD «limpia» más rápida que cuando se trabaja en papel (unos 6 días desde la disponibilidad del último dato10), y ésta es una de las ventajas potenciales más destacables de la CED (tabla 2).
Control sobre la calidad de los datos
La utilización de un sistema de CED incide positivamente en la calidad de la investigación clínica, porque mejora la calidad de los datos. La calidad de los datos es inversamente proporcional al número de errores y omisiones, ya que podríamos tener una BD libre de errores, pero con tal cantidad de omisiones que comprometiera los resultados del estudio. También es importante tener en cuenta el impacto de un error u omisión concretos: no es lo mismo un error en la variable principal del estudio que en una variable secundaria. Otro aspecto muy importante a considerar en términos de calidad es la veracidad de los datos, aunque de ahora en adelante renunciaremos a tratar este aspecto, que compete a la verificación de los datos fuente (tarea de seguimiento) y no se ve afectado, en principio, por el soporte utilizado durante la recogida de datos. Por otra parte, como la detección de omisiones es conceptualmente trivial, nos centraremos en la detección y tratamiento de posibles errores.
La detección de errores sólo se puede basar en información redundante11. En un sentido amplio, se puede considerar información completamente redundante (cuando disponemos de una segunda representación del valor de una misma variable) e información parcialmente redundante (cuando se dispone de información adicional sobre una variable, como ciertos límites admisibles o una variable relacionada). En el caso de contar con información totalmente redundante, la localización de errores proviene de la detección de discrepancias entre la primera y la segunda representación de la variable (por ejemplo, el dato en CRD y el dato en historia clínica). Cuando tenemos información parcialmente redundante sobre una variable, se puede detectar un valor que esté fuera de intervalo (se sospechará de una Hb de 19 mg/dl, porque está muy por encima del límite superior de normalidad, si consideramos que el rango de normalidad es de 11-13 mg/dl), o detectar un valor que sea inconsistente con el valor de otra variable relacionada (un peso de 45 kg y una talla de 195 cm). Es muy importante no olvidar que, en ausencia de información sobre los datos (intervalos de normalidad, valores de datos relacionados, etc.), sólo podrían detectarse errores de transcripción por comparación con la fuente original (historia clínica).
La CED elimina uno de los procesos de transcripción de datos que resulta necesario cuando se trabaja en papel: la grabación de datos. Esta tarea, que no es particularmente problemática ni demasiado costosa, representa, sin embargo, una oportunidad para introducir errores en los datos (errores de grabación). En la CED, al eliminarse este paso, se elimina también una oportunidad de introducir errores. Sin embargo, la grabación de datos a partir de un CRD en papel no es la única transcripción que tiene lugar. El investigador realiza habitualmente 2 transcripciones: escribe lo que constata durante la visita en la historia clínica (primera transcripción) y posteriormente desde la historia clínica al CRD (segunda transcripción). Estos 2 procesos de transcripción siguen existiendo cuando se utiliza un sistema de CED (o al menos el primero, cuando se utiliza el CED durante la visita).
Al contrario que los CRD, los eCRD pueden tener reglas de validación incorporadas que eviten o hagan más improbables los errores y las omisiones en el momento en que el investigador facilita los datos. Ésta es una de las virtudes fundamentales de la CED, ya que asegura la calidad de los datos registrados en la BD del estudio en mayor medida de lo que se consigue cuando se trabaja en papel.
Cuando se trabaja con un CRD, cualquier tarea de verificación sistemática (informatizada) de la exhaustividad y consistencia de los datos debe realizarse con posterioridad al momento en que éstos han sido registrados por el investigador. En ocasiones, esto representa una limitación definitiva. Por ejemplo, si una cuestión del CRD es «Pregunte al paciente acerca de su estado general actual» y el investigador la ha omitido involuntariamente, no habrá ninguna oportunidad de recuperar este dato por mucho que se emita un query al cabo de semanas o meses, porque ni el propio paciente recordaría cuál era su estado en el momento en que se solicitaba. Otras veces, el dato que se reclama en un query es recuperable, pero a costa de cierta inversión de tiempo por parte del gestor de datos (que debe detectar el problema y emitir el query), del monitor (que debe visitar de nuevo el centro) y del investigador (que debe recuperar la historia y bucear en ella).
La CED ofrece la posibilidad de que el eCRD sea dinámico (es decir, que puede «reaccionar» ante la entrada de un dato), lo que posibilita un control más eficiente de los datos registrados. Por ejemplo, se puede programar el CRD electrónico de forma que cuando se introduzca un valor atípico (¡habrá que definir qué es atípico!) el usuario reciba un aviso, como por ejemplo: «Valor atípico. Por favor, confirme o rectifique». Si se trata de un error de tecleo, el investigador no tendrá ningún problema para rectificarlo. Si lo confirma, esto ya equivale a un query emitido e inmediatamente solucionado.
En algunos casos, el propio diseño de las pantallas de entrada de datos de una CED elimina por completo la posibilidad de cometer cierto tipo de inconsistencias. Un ejemplo muy evidente son las preguntas condicionadas. Por ejemplo, los campos destinados a registrar ausencia de embarazo, lactancia o presencia de anticoncepción pueden estar condicionados a una respuesta previa (sexo = mujer), de forma que es imposible llenar esos campos cuando no procede (sexo = hombre). En tal caso, el propio diseño de las pantallas de entrada de datos impide completamente que se produzcan inconsistencias del tipo «hombre y embarazo». El simple condicionamiento de preguntas, puede ahorrar un número de queries muy considerable.
En general, la probabilidad de recuperar un dato o de verificar su corrección es inversamente proporcional al tiempo transcurrido desde que se generó el dato hasta que se solicitó la aclaración (query). Por ello, un eCRD dinámico, que pueda reaccionar de inmediato solicitando las aclaraciones necesarias en el mismo momento en que se introduce un dato conflictivo, es más eficiente para conseguir datos completos y de calidad que el proceso tradicional basado en papel.
Control sobre la ejecución del ensayo clínico
El carácter dinámico del eCRD permite que éste pueda reaccionar ante determinados incumplimientos del protocolo. Por ejemplo, se puede controlar el incumplimiento de criterios de inclusión, la cadencia de las visitas o la exclusión de pacientes. También se pueden incluir recordatorios sobre aspectos importantes, como la notificación de acontecimientos adversos, graves o inesperados.
Cuando el diseño del EC requiere la implantación de procesos de aleatorización, la incorporación de este proceso al eCRD evita equivocaciones y demoras, y reduce la proporción de casos inválidos.
La posibilidad de que la aplicación de la CED incorpore algoritmos o cálculos puede ser también de utilidad para evitar ciertas desviaciones del protocolo. Por ejemplo, en hipertensión suele exigirse que el paciente presente determinados valores de presión arterial (PA) como criterio de inclusión. Estos criterios deben verificarse sobre la media de 3 determinaciones de la PA. En otras indicaciones, se exige que el paciente tenga determinados valores de índice de masa corporal (IMC = peso en kg/talla en m2) para su inclusión en el ensayo. No es infrecuente que el investigador cometa errores de cálculo, lo que a veces provoca inclusiones indebidas. Un eCRD puede calcular automáticamente la media de 3 determinaciones de PA, o el IMC (a partir del peso y la talla) sin equivocarse. En los EC con escalonamiento de dosis, la decisión de mantener, incrementar o disminuir la dosis suele derivarse de un algoritmo más o menos complejo. Cuando este algoritmo debe implementarse sin ayuda, el investigador puede hacerlo, por error, incorrectamente. En el caso de un eCRD, el algoritmo puede programarse y validarse, lo que evitará errores en su implementación.
En los EC con dispositivos médicos, el envío de la información almacenada en éstos a través del eCRD (en vez de enviar un disquete por correo) o la posibilidad de adjuntar ficheros (por ejemplo, electrocardiograma de superficie) permiten un mejor control del paciente y facilitan el análisis de su estado, así se consigue una mayor rapidez de respuesta en el caso de detectar ficheros corruptos o ante la necesidad de introducir modificaciones en la programación del dispositivo.
El diseño de un estudio puede llegar a estar condicionado, en parte, por la tecnología disponible para llevarlo a cabo. Con la CED se pueden plantear protocolos en los que los pacientes pueden pasar por diversas fases dependiendo de su estado y diseñar un eCRD específico para cada una de las fases según un esquema tan complejo que sería prácticamente inviable o muy arriesgado con un CRD.
El control de la implementación del protocolo puede reducir muy significativamente el número de pacientes inválidos en un EC y éste es un hecho trascendente, puesto que la proporción de casos inválidos es un criterio habitual e importante para juzgar la calidad de un EC12.
Facilitación de la monitorización
Cuando se trabaja en papel, el monitor debe revisar los CRD durante las visitas de monitorización. Esta revisión pretende verificar si se han cometido errores de cumplimentación o de transcripción de datos. Además de ser una tarea muy difícil (un error en una fecha puede pasar inadvertido entre decenas de páginas), también requiere mucho tiempo. Cuando se utiliza una CED, el monitor puede tener acceso a la BD y revisar los datos desde su despacho. Además, es posible que el software de la CED incluya un módulo de monitorización que facilite la revisión de los datos (p. ej.: detección de omisiones, de valores atípicos, de incumplimientos del protocolo, etc.) de modo que permita realizar ciertas tareas de monitorización de forma remota13. En consecuencia, durante la visita de monitorización, siempre necesaria, el monitor podrá concentrarse en la resolución de problemas de datos detectados previamente, así como a otras tareas que no pueden realizarse de forma remota (p. ej.: verificación de la documentación fuente, etc.).
Por último, la CED permite también generar informes de monitorización automáticos o semiautomáticos. Por ejemplo, es muy sencillo obtener automáticamente documentos con actualizaciones a tiempo real del ritmo de selección y de la progresión del estudio, los incumplimientos del protocolo, los acontecimientos adversos, la calidad de la alimentación de los datos (omisiones y queries pendientes de resolución) y, en general, cualquier información que pueda derivarse de los datos contenidos en la BD del estudio. No sólo el monitor puede beneficiarse de estas facilidades, otros protagonistas del EC, como el investigador, pueden acceder también a ellas, y es posible crear distintos perfiles de usuario con distintos derechos de acceso a la información.
Dos formas básicas de organizar una captura electrónica de datos
La CED es la herramienta que permite recolectar los datos en un único repositorio (BD) sin que medien procesos de transcripción. Básicamente, hay 2 posibles formas de organizar un sistema de CED:
Sistemas con BD múltiples o distribuidas (BDD) o sistemas offline.
Sistemas con BD única o centralizada (BDC) o sistemas online.
Sistemas con BDD
En un sistema con BDD, cada investigador (y también cada monitor) dispone de un ordenador (una PDA, un PC portátil, etc.) en el que se ha instalado el sistema de CED. Cada investigador introduce los datos en su unidad portátil, con independencia del resto de los investigadores y sin necesidad de estar conectado a una red (offline).
Como se trata de un sistema local (instalado en el ordenador del usuario) y no depende de la conexión a una red, es muy rápido y cómodo. Tampoco suelen existir limitaciones de memoria ni de velocidad, con lo que es posible incluir funciones para el tratamiento de grandes volúmenes de datos, como, por ejemplo, codificadores de textos médicos mediante diccionarios estándar (ICD-9, MedDRA, etc).
Evidentemente, este sistema necesita un proceso ulterior de acumulación de todos los datos en una BDC. Para ello, cada usuario debe realizar envíos periódicos de los datos a la BD central (a través de Internet, por conexión telefónica, etc.).
Por su parte, los monitores se conectan también a la BD central para descargar nuevos datos en su unidad portátil y poder supervisar así el progreso del estudio y revisar los datos.
La existencia de múltiples BD y la necesidad de reconciliarlas constantemente (en cada conexión) supone problemas técnicos y de proceso. Por ejemplo, los monitores accederán a la información con demora: sólo accederán a la información que existía en la BD del investigador cuando éste realizó el último envío de datos, pero si lo hizo 10 días atrás y desde entonces ha incluido nuevos pacientes o nuevos datos, éstos no estarán aún en la BD central.
La demora puede ser variable, pero en cualquier caso depende de la frecuencia con que los investigadores realicen envíos a la BD central, operación que está totalmente bajo su control. Si, como es deseable, el sistema permite al monitor solicitar aclaraciones sobre los datos revisados (queries manuales), éstas tendrán que viajar desde la unidad portátil del monitor a la BD central y descargarse en la unidad del investigador cuando éste se conecte a la BD central. La respuesta que ofrezca el investigador tendrá que viajar en sentido inverso. Todo este proceso, necesario para emitir y resolver queries, puede ser muy poco ágil si el investigador o el monitor se conectan con poca frecuencia a la BD central.
Sistemas con BDC
Los sistemas con BDC se caracterizan porque existe una única BD a la que acceden los distintos usuarios (investigadores, monitores, codificadores, etc.) para trabajar (online). Este acceso se realiza a través de una página web diseñada específicamente para ese propósito14.
Al tratarse de un único sistema, la validación es más sencilla que en los sistemas con BDD. Del mismo modo, la resolución de problemas cuando el sistema está en uso se simplifica, porque no hay que implementar los cambios en varios ordenadores.
El único inconveniente potencial de los sistemas con BDC es que se trabaja a través de Internet y todavía existen centros que no disponen de un acceso adecuado. Esto genera dificultades, ya que ningún investigador soportará un eCRD que requiera más de unos segundos para cada cambio de pantalla. No obstante, se trata de un problema que indudablemente desaparecerá en el futuro, a medida que se vayan modernizando las infraestructuras.
Aspectos a tener en cuenta cuando se utiliza la captura electrónica de datos
Cuando se plantea hacer una CED es preciso tener en cuenta que los investigadores, los monitores y, en general, los profesionales involucrados en un EC están habituados a trabajar en documentación escrita en papel. La migración desde el papel hacia aplicaciones informáticas necesita un esfuerzo de cambio que puede afectar a la forma en que se debe organizar el trabajo15. Por ejemplo, si la aplicación de CED incorpora un sistema de gestión de queries, el investigador deberá usarlo activamente, en lugar de esperar a que el monitor le traiga las solicitudes de aclaraciones tradicionalmente impresas en papel (data clarification forms o query forms). Por su parte, los monitores están acostumbrados a revisar el CRD durante las visitas de monitorización. Disponer de un sistema que les permite revisar los datos desde su despacho cuando preparan una visita de monitorización supone un cambio de hábito.
Así pues, uno de los factores para el éxito de la CED es la formación en todo el ámbito de la cadena de utilización15. El promotor es quien determina cómo se realizan los estudios y la tecnología que se va a utilizar16 y, por tanto, debe conocer las posibilidades que ofrecen los sistemas de CED. Los monitores, los investigadores y el personal relacionado deben conocer las herramientas proporcionadas por el CED para sacarles el máximo partido y procurar que su labor sea más fácil y efectiva. Algunos investigadores pueden ser reacios a utilizar la CED y preferir un CRD clásico, que nunca pide aclaraciones sobre los datos introducidos ni restringe en modo alguno la escritura. Además, es más rápido escribir en papel que en una página web. Sin embargo, la mayor calidad de los datos, la reducción del tiempo necesario para obtenerlos y de los costes hacen de la CED una alternativa muy recomendable. Otras ventajas que también ayudan a compensar esa posible resistencia son la disponibilidad de información actualizada sobre el estudio en tiempo real y las ayudas para gestionar el seguimiento de los pacientes (agenda o planificador de visitas).
También es muy importante tener en cuenta la posible distorsión de la relación que se establece entre el médico investigador y el paciente durante la visita médica, si el primero utiliza el sistema de CED en tiempo real (durante la propia visita). A este respecto, la necesidad de teclear mientras se realiza la anamnesis puede ser mal percibida por el paciente, pero el uso de pantallas táctiles y de lápiz digitalizador puede mejorar esta percepción5.
Si no se ha utilizado nunca la CED, es deseable contar con un grado de estandarización previo suficientemente elevado, seleccionar el estudio para una primera experiencia con cierta cautela y no plantearse el uso de la CED a la ligera17. No hay ninguna opción que sea óptima para todo tipo de estudios18.
Conclusiones
La CED mejora la calidad de la investigación clínica; fundamentalmente aportando una mejor calidad en la recolección de los datos, pero también proporcionando recursos para controlar la ejecución de los EC y facilitando las tareas de monitorización. Su principal dificultad es la mayor complejidad de preparación y la necesaria adaptación de los profesionales involucrados en el EC (particularmente de los investigadores y los monitores) a un sistema de trabajo distinto.
En consecuencia, el investigador no es libre de escribir lo que quiera, sino que se ve obligado a prestar más atención que la exigida por un CRD. Naturalmente, ésta es una virtud fundamental de la herramienta, pero no deja de representar una limitación para el usuario que puede generar resistencia o rechazo. No obstante, es muy significativo que la mayoría de los investigadores y monitores que han utilizado eCRD prefiere no volver a los CRD, a pesar de las dificultades técnicas19.
Entre los distintos tipos de CED, el modelo online con una única base de datos centralizada es el que tiene un mayor potencial en la mejora de la calidad de los datos y el que ofrece un abanico de posibilidades más amplio para controlar la implantación del protocolo y la ejecución del estudio en general. La menor funcionalidad de este modelo de CED podría solventarse con la reducción de precios de los nuevos dispositivos móviles, que integran PDA y telefonía móvil GPRS y, sobre todo, por la aparición de tarifas planas para GPRS (y las tecnologías que la sustituyan).
En el futuro cabe esperar que la mayor parte de la investigación clínica se lleve a cabo con sistemas de captura de datos electrónica y que el papel quede reservado para casos muy concretos.