Evaluar la factibilidad, la fiabilidad, la validez y la sensibilidad a los cambios del Cuestionario sobre Alteraciones de Reflujo (RDQ) y de la Escala de Impacto de la Enfermedad por Reflujo Gastroesofágico (GIS).
Material y métodosEstudio observacional, prospectivo y multicéntrico, realizado en centros de atención primaria, en dos visitas (basal y a los 16 días), en una muestra de pacientes con diagnóstico o sospecha de enfermedad por reflujo gastroesofágico (ERGE) que requerían una intervención terapéutica (grupo de sensibilidad al cambio, n=230) y otra de pacientes con ERGE clínicamente estables (grupo para fiabilidad, n=51).
ResultadosEn el RDQ y la GIS, tanto globalmente como por dimensiones, el coeficiente alfa de Cronbach fue al menos de 0,70. Todos los dominios del RDQ y su puntuación total, así como la puntuación total y la dimensión de impacto del GIS, presentaron una correlación fuerte entre la evaluación basal y la realizada a los 16 días en pacientes presumiblemente estables. El RDQ y la GIS mostraron correlaciones muy fuertes de sus puntuaciones totales con las del Cuestionario de Calidad de Vida en Reflujo y Dispepsia (QOLRAD) (−0,73 y 0,80, respectivamente), una escala específica de calidad de vida para el reflujo y la dispepsia, y fuertes con la Escala de Evaluación de Síntomas Gastrointestinales (GSRS) (0,54 con el RDQ y −0,55 con la GIS), una escala general de síntomas gastrointestinales. Tanto el RDQ como la GIS mostraron cambios significativos con un tamaño del efecto grande en las respuestas de mejoría.
ConclusiónEl RDQ y la GIS presentan unas muy buenas propiedades psicométricas para su utilización en atención primaria.
To assess the feasibility, reliability, validity and sensitivity of changes in the Reflux Disease Questionnaire (RDQ) and the Gastrointestinal Impact Scale (GIS).
Material and methodsAn observational, prospective, multicenter study was conducted in primary care centers on two visits (baseline and 16 days later) in a sample of patients with a diagnosis of gastroesophageal reflux disease (GERD) or suspicion of GERD requiring a therapeutic intervention (sensitivity to change group, n=230) and in another sample of patients with clinically controlled GERD (reliability group, n=51).
ResultsThe RDQ questionnaire and GIS scale, both overall and for each domain, showed a Cronbach's alpha of greater than or equal to 0.70. All RDQ domains and the total score, as well as the total GIS score and impact dimension, showed a high correlation between the baseline evaluation and that performed 16 days later in stable patients. The RDQ and GIS showed very high correlations between the total scores and those of the quality of life in reflux and dyspepsia (QOLRAD) (−0.73 and 0.80, respectively), a reflux- and dyspepsia-specific quality of life scale, and a high correlation with the gastrointestinal symptoms rating scale (GSRS) (0.54 and −0.55, respectively), a general scale of gastrointestinal symptoms. Both the RDQ questionnaire and the GIS scale showed significant changes with a high effect size on improvement responses.
ConclusionsThe RDQ and GIS questionnaires show very good psychometric properties, making them suitable for use in primary care.
La enfermedad por reflujo gastroesofágico (ERGE) es una afección crónica, frecuente y con una gran repercusión sociosanitaria e individual. La pirosis, el síntoma cardinal de la ERGE, tiene una prevalencia en la población general del 10–48%1. La prevalencia de ERGE en nuestro medio, definida como la presencia de pirosis durante 2 ó más días a la semana, es del 15,6%2. Sin embargo, en otros estudios, que definen la enfermedad como la presencia de pirosis o regurgitación ácida de cualquier intensidad o frecuencia, se ha comunicado una mayor prevalencia anual de ERGE en España, del 31,6%3. La presencia de síntomas de ERGE se asocia a una disminución de la calidad de vida4–7 y de la productividad6,8,9, y a un elevado consumo de recursos sanitarios en forma de consultas médicas, estudios de diagnóstico por la imagen y endoscopias9. Cuanto más graves son los síntomas de la ERGE menor es la calidad de vida y la productividad, y mayor es la utilización de recursos sanitarios10.
Por lo general, los casos de pacientes que presentan síntomas típicos de ERGE (esto es, pirosis o regurgitación) pueden diagnosticarse a partir de la anamnesis, y generalmente no requiere otras investigaciones11. Sin embargo, también son frecuentes en la ERGE la aparición de síntomas atípicos o extraesofágicos, como la tos crónica, el asma, el dolor de garganta recurrente, la laringitis recurrente, la sensación de globo faríngeo y el dolor torácico, entre otros12. Una proporción elevada de pacientes que presentan síntomas extraesofágicos no presenta los síntomas típicos de pirosis y regurgitación, lo que inicialmente dificulta el diagnóstico12. Por otra parte, la utilización de cuestionarios, incluso en pacientes que presentan pirosis, puede ayudar a la identificación de este problema, en especial en el ámbito de la atención primaria13–15. Se ha señalado que un cuestionario bien diseñado sería una forma fiable de explotar el valor diagnóstico de los síntomas y serviría de complemento a otras medidas educacionales, lo cual ayudaría a los médicos a tomar mayor conciencia de la utilidad de evaluar el patrón de síntomas del tracto digestivo superior para el reconocimiento de los pacientes con ERGE15. En el tratamiento de la ERGE, además de valorar la intensidad, la frecuencia y la duración de los síntomas, es importante evaluar el impacto que tiene la sintomatología en la calidad de vida del paciente, ya que esta valoración conjunta puede condicionar las decisiones terapéuticas11.
Los objetivos de este estudio fueron evaluar las propiedades psicométricas de la versión española del Cuestionario sobre Alteraciones de Reflujo (RDQ) y las de la Escala de Impacto de la Enfermedad por Reflujo Gastroesofágico (GIS), un instrumento que no sólo valora los síntomas típicos y atípicos de la ERGE sino también su impacto sobre el trabajo o las actividades de la vida diaria16.
Pacientes y métodosDiseño del estudio y poblaciónEstudio observacional, prospectivo y multicéntrico, realizado en centros de atención primaria en todo el territorio español, que tenía como objetivos evaluar la factibilidad, la fiabilidad, la validez y la sensibilidad a los cambios del RDQ y la GIS.
El estudio fue evaluado y posteriormente aprobado por el Comité Ético de Investigación Clínica (CEIC) del Hospital Clínico San Carlos.
Para llevar a cabo el estudio de validación se reclutaron dos muestras, una de pacientes con ERGE de nuevo diagnóstico que requerían una intervención terapéutica de reconocida eficacia, o pacientes ya diagnosticados en los que se requerían iniciar o cambiar una intervención terapéutica (grupo para sensibilidad al cambio), y una muestra de pacientes con ERGE ya diagnosticados y de más larga evolución en los que no era previsible un cambio en su estado de salud ni en su tratamiento en los 30 días siguientes a su inclusión en el estudio (grupo para fiabilidad). Los pacientes de uno y otro grupo, además, debían tener 18 o más años, ser capaces de entender y responder a los cuestionarios, y haber dado su consentimiento informado por escrito para participar en el estudio. Fueron excluidos los pacientes que presentaban un diagnóstico de ulcus péptico, intestino irritable u otra enfermedad que pudiera explicar los síntomas, los que tenían un cáncer gástrico o habían sido sometidos a cirugía gástrica, las mujeres embarazadas o con propósito de gestación, los pacientes que tenían alguna otra enfermedad que a juicio del investigador podía interferir con los resultados del estudio, o los que estaban participando en un ensayo clínico.
Para medir la fiabilidad test-retest de los cuestionarios, se estimó que para detectar un coeficiente de correlación intraclase (CCI) entre las dos administraciones de los cuestionarios superior o igual a 0,7, para poder considerar el instrumento fiable, asumiendo un coeficiente mínimo de 0,5, con un nivel de significación de 0,05 y un poder estadístico de 0,80, eran necesario incluir a 63 pacientes. Para evaluar la sensibilidad al cambio, se estimó que para detectar un tamaño de efecto con una desviación estándar (DE) de 0,2, un nivel de significación de 0,05 y un poder estadístico de 0,80, se requería una muestra de 196 pacientes. Asumiendo aproximadamente un 20% de pérdidas de seguimiento, el número mínimo de pacientes que debía evaluarse era de 300, de los cuales 60 formarían parte del grupo de fiabilidad y 240 del grupo de sensibilidad al cambio, tamaños que permitirían evaluar la fiabilidad test-retest y la sensibilidad al cambio, respectivamente.
Cada investigador tuvo 60 días para incluir a 5 pacientes consecutivos, uno de ellos para el grupo de fiabilidad y otros 4 para el grupo de sensibilidad al cambio. El paciente debía acudir a un total de 2 visitas: basal y a los 16±2 días de la primera.
Procedimientos del estudio e instrumentos de evaluaciónDespués de comprobar el cumplimiento de los criterios de selección en todos los pacientes durante la visita basal, se recogieron datos sociodemográficos, datos clínicos de la ERGE y se administraron los siguientes instrumentos: el RDQ, la GIS, la Escala de Evaluación de Síntomas Gastrointestinales (GSRS), el Cuestionario de Calidad de Vida en Reflujo y Dispepsia (QOLRAD) y las láminas COOP/WONCA. A los 16±2 días, en la segunda visita, se utilizaban los mismos cuestionarios que en la visita basal y se administraba también el Cuestionario de Efecto Global del Tratamiento (EGT).
El RDQ17 es una herramienta autoadministrada, de 12 ítems, diseñada para evaluar la frecuencia y la gravedad de la pirosis, la regurgitación ácida y el dolor epigástrico, con el referente temporal de la semana previa. El cuestionario utiliza una escala Likert de 6 puntos para evaluar la frecuencia (de «nunca» a «diario») y la gravedad (de «no tuve» a «grave»). En su versión original, el RDQ ha demostrado poseer unas buenas propiedades de fiabilidad y validez17 y ha sido validado en otras lenguas18. Los autores de la validación original identificaron 3 factores: «regurgitación», formado por los 4 ítems que miden gravedad y frecuencia del sabor ácido, y del movimiento de materia desde el estómago; «pirosis», formado por los 4 ítems que valoran gravedad y frecuencia de la sensación de ardor o dolor detrás del esternón, y «dispepsia», que la componen los 4 ítems restantes de gravedad y frecuencia del ardor o dolor en la parte superior del estómago17. Algunos autores16 sugieren que combinando los ítems de las dimensiones de pirosis y regurgitación podría obtenerse una 4 dimensión de «ERGE».
La GIS consta de 9 preguntas que hacen referencia a la frecuencia durante la última semana (de «a diario» a «nunca» en una escala de tipo Likert de 4 puntos) de 5 posibles síntomas (típicos y atípicos) de la ERGE, del impacto sobre el sueño, la ingesta de comidas o bebidas, el trabajo o las actividades de la vida diaria, y sobre la necesidad de utilizar medicamentos adicionales a los prescritos por su médico16. El período de recuerdo es la semana anterior. Un análisis factorial de la escala identificó 3 dimensiones «quemazón y dolor», «otros síntomas relacionados con la acidez» e «impacto de los síntomas», todos ellos relacionados con el impacto16. La puntuación de la escala GIS varía de 1 a 4; cuanto más alta es la puntuación, mejor es el estado del paciente. La escala ha demostrado que presenta una adecuada consistencia interna y unas adecuadas propiedades psicométricas, incluida la de sensibilidad al cambio16.
La GSRS es un instrumento de evaluación específico de 15 ítems, combinados en 5 grupos sintomáticos: reflujo, dolor abdominal, indigestión, diarrea y estreñimiento. La GSRS tiene una escala Likert de 7 puntos, donde 1 representa la ausencia de síntomas («ninguna molestia») y 7 los síntomas más molestos («molestias fuertes»). La fiabilidad y la validez de la GSRS están bien documentadas19 y hay valores normativos para la población general20. La escala ha sido adaptada a distintos idiomas, incluido el español21, en cuya versión, y a excepción de la fiabilidad test-retest del dominio «reflujo», mostró unas buenas propiedades psicométricas.
El QOLRAD contiene 25 ítems, en los que se le pregunta al paciente por el efecto de los síntomas gastrointestinales en 5 dimensiones: bienestar emocional, sueño, vitalidad, comidas y bebidas, y funcionamiento físico/social22. Los pacientes comunican la frecuencia de estos efectos durante la semana previa utilizando una escala Likert de 7 puntos, que varía desde «todo el tiempo»/«muchísimo» a «nunca»/«nada»; las puntuaciones bajas indican una importante alteración del funcionamiento diario. La fiabilidad y la validez del QOLRAD se han estudiado con profusión, y recientemente se ha publicado la validación de la versión española, que muestra una fiabilidad y una validez satisfactorias21.
Las láminas COOP/WONCA son un instrumento genérico de evaluación de la calidad de vida relacionada con la salud que cubre las dimensiones función física, sentimientos, actividades cotidianas, sociales, dolor, estado de salud y calidad de vida. Cada ítem está representado por una lámina o viñeta, que se refiere al estado funcional del paciente en las 2 últimas semanas, y cada ítem cubre una dimensión de la calidad de vida. Las láminas o viñetas han de administrarse siempre en el mismo orden: capacidad física, sentimientos, actividades diarias, actividades sociales, cambio de salud, salud global, dolor, apoyo social y calidad de vida. Hay 5 posibles categorías de respuesta para cada ítem, que están ilustradas por un dibujo que representa el nivel de bienestar o función. La puntación para cada dimensión va del 1 al 5. Las puntuaciones más altas indican una peor capacidad funcional en la dimensión evaluada. Siempre que sea posible es preferible la autoadministración del instrumento. Se ha demostrado ampliamente su validez y su fiabilidad internacional, y contamos con una adaptación transcultural al español muy bien estudiada23,24 que la convierten en uno de los instrumentos de aplicación en atención primaria mejor validados.
El paciente evalúa en la segunda visita el cambio en su sintomatología con un cuestionario de 3 ítems, el EGT25,26. En la primera pregunta se demanda a los pacientes que indiquen si los síntomas de la ERGE han empeorado o mejorado desde la última visita. Si los pacientes indican que han mejorado, se les pide que reflejen la importancia del cambio en una escala Likert de 1 a 7 puntos. Si refieren haber empeorado, también se les pide que lo señalen en una escala de −1 a −7 puntos. Una puntuación entre −1 y 1 se considera que no ha reflejado cambios en los síntomas gastrointestinales. El EGT se ha empleado en diferentes estudios y áreas terapéuticas4,25,27.
Análisis estadísticoSe realizó un análisis descriptivo de los datos correspondientes a la visita basal estratificando a los pacientes por grupos de estudio: grupo para fiabilidad y grupo para sensibilidad al cambio. Las variables cuantitativas fueron descritas con su media y DE, y las variables categóricas mediante su distribución de frecuencias absoluta y relativa.
Para realizar las comparaciones pertinentes entre los 2 grupos se utilizó la prueba de la χ2 o su equivalente, el test exacto de Fisher, al tratar variables categóricas, y la prueba de la t de Student o su equivalente no paramétrico, la U de Mann-Whitney, en caso de analizar variables de tipo continuo.
Para el análisis de la factibilidad se calculó el porcentaje de respuestas perdidas para cada uno de los ítems y para cada una de las escalas que debían validarse. La fiabilidad interna se calculó mediante el coeficiente alfa de Cronbach. La fiabilidad test-retest se analizó en el grupo para fiabilidad mediante el cálculo del CCI.
La validez convergente se analizó a partir de las correlaciones entre la GIS y el RDQ y las escalas GSRS y QOLRAD, mediante el coeficiente de correlación de Pearson o el coeficiente de correlación de Spearman. Para la validez discriminante se compararon las puntuaciones totales de la GIS y el RDQ según la frecuencia (esto es, pacientes con síntomas semanales en comparación con pacientes con síntomas con una frecuencia inferior a la semanal) y la gravedad de los síntomas (esto es, pacientes sin síntomas en comparación con pacientes con al menos un síntoma moderado o grave).
La sensibilidad al cambio se analizó exclusivamente en el subgrupo del mismo nombre, esto es, en los pacientes con ERGE de nuevo diagnóstico que requerían una intervención terapéutica de reconocida eficacia, o pacientes ya diagnosticados en los que se requerían iniciar o cambiar una intervención terapéutica. Se calcularon las diferencias observadas entre las administraciones inicial y final del cuestionario mediante la prueba de la t de Student para datos apareados, o mediante la prueba de Wilcoxon para datos no paramétricos. Se calcularon las diferencias observadas entre las administraciones inicial y final del cuestionario mediante la prueba de la t de Student para datos apareados o mediante la prueba de Wilcoxon para datos no paramétricos, valorando adicionalmente el denominado tamaño del efecto. Éste se obtuvo mediante la diferencia entre las medias de una determinada medida antes y después del tratamiento dividida por la DE de la misma medida antes del tratamiento28. Para la interpretación del tamaño del efecto se siguió el criterio bastante establecido de considerar un valor de 0,20 como pequeño tamaño, uno de 0,50 como moderado y uno de 0,80 como grande28.
ResultadosDisposición de pacientes y características demográficas y clínicasSe incluyeron en el estudio un total de 314 pacientes, de los cuales se excluyeron para el análisis 33 pacientes por alguno de los siguientes motivos (respuesta múltiple):
- •
Menor de 16 años o fecha nula (n=9).
- •
No tenían completas las escalas GIS y RDQ en la primera visita (n=5).
- •
No tenían completas las escalas GIS y RDQ en la segunda visita (n=15).
- •
No cumplían criterios de inclusión/exclusión (n=1).
- •
No tenían completa la evaluación del médico o los datos clínicos basales (n=22).
Por tanto, el total de pacientes analizados fue de 281, lo que supone el 89,5% sobre el total de pacientes incluidos, 230 en el subgrupo de sensibilidad y 51 en el subgrupo de fiabilidad. No había diferencias respecto a las características sociodemográficas entre ambos subgrupos (tabla 1); sin embargo, si había diferencias significativas respecto a las características clínicas. Los pacientes del subgrupo de sensibilidad al cambio presentaban más síntomas y con más frecuencia que los pacientes del grupo de fiabilidad, y en el momento de ser incluidos en el estudio recibían tratamiento con fármacos de elección (esto es, inhibidores de la bomba de protones) en una menor proporción (tabla 1).
Características demográficas y clínicas
Característica | Subgrupo sensibilidad | Subgrupo fiabilidad | p |
Edad (años), media (DE) | 55,1 (14,9) | 57,9 (12,4) | 0,217 |
Sexo, mujeres, n/N (%) | 121/228 (53,1) | 24/51 (47,1) | 0,437 |
Situación laboral, n/N (%) | 0,591 | ||
Empleo remunerado | 121/226 (53,5) | 23/50 (46) | |
Desempleado | 7/226 (3,1) | 1/50 (2) | |
Jubilado | 40/226 (17,7) | 15/50 (30,0) | |
Ama de casa | 54/226 (23,9) | 11/50 (22,0) | |
Estudiante | 2/226 (0,9) | 0/50 (0) | |
De baja médica | 1/226 (0,4) | 0/50 (0) | |
Juvilado y ama de casa | 1/226 (0,4) | 0/50 (0) | |
Años desde el diagnóstico, media (DE) | 4,4 (8,1) | 6,9 (8,2) | 0,054 |
Síntomas de ERGE, presencia, n/N (%) | |||
Pirosis | 211/225 (93,8) | 41/51 (80,4) | <0,0001 |
Regurgitación | 205/224 (91,5) | 36/51 (70,6) | <0,0001 |
Tos | 112/222 (50,4) | 15/50 (30) | 0,065 |
Dolor torácico | 103/222 (46,4) | 9/49 (18,4) | 0,004 |
Trastorno del sueño | 140/219 (63,9) | 23/50 (46) | 0,089 |
Disfonía | 55/221 (24,9) | 7/50 (14) | 0,377 |
Frecuencia de síntomas, semanal, n/N (%) | 160/218 (73,4) | 14/51 (27,5) | < 0,0001 |
Tratamiento actual para la ERGE, n/N (%) | |||
IBP en dosis estándar | 49/230 (21,3) | 37/51 (72,6) | <0,0001 |
IBP a mitad de la dosis estándar | 20/230 (8,7) | 5/51 (9,8) | 0,787 |
IBP en dosis elevada | 11/230 (4,8) | 4/51 (7,8) | 0,487 |
Antiácidos | 66/230 (28,7) | 9/51 (17,7) | 0,107 |
Procinéticos | 14/230 (6,1) | 9/51 (17,7) | 0,006 |
Antagonistas H2 | 16/230 (7) | 3/51 (5,9) | 1 |
DE: desviación estándar; ERGE: enfermedad por reflujo gastroesofágico; IBP: inhibidor de la bomba de protones; n: número de casos; N: número de pacientes evaluables.
En ninguno de los 12 ítems del RDQ, en las dos visitas, el número de pacientes con datos perdidos alcanzó el 1%. Tan sólo un paciente en la segunda visita contestó a menos del 80% de las preguntas del cuestionario. Del mismo modo, la proporción de pacientes que dejaron de contestar algún ítem de la escala GIS fue muy baja, y los ítems con mayor número de falta de respuesta fueron los de «sensación de quemazón», «regurgitaciones» y «dolor o quemazón en la parte alta del estómago», con 3 casos (1%) sin respuesta cada uno.
FiabilidadEl RDQ presentó un coeficiente alfa de Cronbach de 0,82 y el de sus dimensiones fue superior a 0,70 en todas ellas (tabla 2). Respecto a la escala GIS, el alfa de Cronbach, tanto globalmente como en cada una de sus tres dimensiones, fue al menos de 0,70 (tabla 2). La evaluación de la fiabilidad test-retest se calculó mediante los CCI que, en el caso del cuestionario RDQ, fueron superiores a 0,60 para el global y las 4 dimensiones; aunque al menos moderados, éstos resultaron más bajos para la GIS, sobre todo en las dimensiones de «quemazón y dolor» y «otros síntomas relacionados con la acidez» (tabla 2). Cuando se analizó la fiabilidad test-retest utilizando la muestra de pacientes que según el resultado del EGT en la visita de seguimiento a los 16 días se encontraban más o menos igual, los CCI eran más fuertes tanto para el global del RDQ (0,76) como para sus dimensiones (0,67–0,75), y también para el global de la GIS (0,76) y sus dimensiones (0,56–0,80).
Fiabilidad interna y test-retest del Cuestionario sobre Alteraciones de Reflujo (RDQ) y de la Escala de Impacto de la ERGE (GIS)
Instrumento/dominios | Alfa de Cronbach | Coeficiente de correlación intraclase |
RDQ | ||
Global | 0,82 | 0,66 |
Ardor de estómago | 0,79 | 0,62 |
Regurgitación | 0,77 | 0,6 |
ERGE (ardor y regurgitación) | 0,79 | 0,62 |
Dispepsia | 0,84 | 0,7 |
GIS | ||
Global | 0,76 | 0,54 |
Quemazón y dolor | 0,71 | 0,45 |
Otros síntomas relacionados con acidez | 0,69 | 0,49 |
Impacto de los síntomas | 0,74 | 0,53 |
ERGE: enfermedad por reflujo gastroesofágico.
Globalmente el RDQ mostró una asociación muy fuerte con el QOLRAD y, aunque menor, la correlación por dimensiones del RDQ con las dimensiones del QOLRAD fue por lo general fuerte, con CCI superiores a 0,50; las correlaciones más fuertes se dieron entre la dimensión de ERGE del RDQ con las 5 dimensiones del QOLRAD (tabla 3). Con respecto a la escala GSRS, la correlación de la puntuación total con la del RDQ fue menor pero fuerte (tabla 3). En términos generales, las correlaciones del RDQ fueron fuertes con las dimensiones de dolor abdominal y, sobre todo, con la dimensión de ERGE de la escala GSRS; fueron moderadas con la de indigestión, y pequeñas con las dimensiones de diarrea y estreñimiento (tabla 3).
Correlación (coeficiente de correlación de Spearman) entre el Cuestionario sobre Alteraciones de Reflujo (RDQ) y el Cuestionario de Calidad de Vida en Reflujo y Dispepsia (QOLRAD) y la Escala de Valoración de Síntomas Gastrointestinales (GSRS)
RDQ Total | RDQ Ardor de estómago | RDQ regurgitación | RDQ ERGE | RDQ Dispepsia | |
QOLRAD | −0,73 | ||||
Total | p<0,0001 | ||||
QOLRAD | −0,59 | −0,51 | −0,65 | −0,61 | |
Bienestar emocional | p<0,0001 | p<0,0001 | p<0,0001 | p<0,0001 | |
QOLRAD | −0,57 | −0,44 | −0,59 | −0,56 | |
Alteración de sueño | p<0,0001 | p<0,0001 | p<0,0001 | p<0,0001 | |
QOLRAD | −0,58 | −0,52 | −0,64 | −0,61 | |
Vitalidad | p<0,0001 | p<0,0001 | p<0,0001 | p<0,0001 | |
QOLRAD | −0,58 | −0,57 | −0,68 | −0,65 | |
Comida/bebida | p<0,0001 | p<0,0001 | p<0,0001 | p<0,0001 | |
QOLRAD | −0,57 | −0,54 | −0,66 | −0,59 | |
Función físico/social | p<0,0001 | p<0,0001 | p<0,0001 | p<0,0001 | |
GSRS | 0,54 | ||||
Total | p<0,0001 | ||||
GSRS | 0,52 | 0,49 | 0,60 | 0,65 | |
Dolor abdominal | p<0,0001 | p<0,0001 | p<0,0001 | p<0,0001 | |
GSRS | 0,61 | 0,65 | 0,74 | 0,66 | |
Reflujo | p<0,0001 | p<0,0001 | p<0,0001 | p<0,0001 | |
GSRS | −0,08 | 0,19 | 0,06 | 0,05 | |
Diarrea | p=0,2096 | p=0,0015 | p=0,2973 | p=0,4387 | |
GSRS | 0,28 | 0,33 | 0,37 | 0,40 | |
Indigestión | p<0,0001 | p<0,0001 | p<0,0001 | p<0,0001 | |
GSRS | 0,10 | 0,16 | 0,16 | 0,16 | |
Estreñimiento | p=0,0877 | p=0,0065 | p=0,0061 | p=0,0062 |
La escala GIS, por su parte, mostró una excelente correlación con el QOLRAD para su puntuación global. Las correlaciones por dimensiones fueron muy fuertes para la dimensión de impacto de los síntomas de la GIS con el resto de dimensiones del QOLRAD, y fuertes para las otras dos dimensiones de la GIS con las del QOLRAD (tabla 4). Igual que lo comentado para el RDQ, la correlación entre las puntuaciones totales de la GIS y de la GSRS fue menor que con el QOLRAD, pero fuerte (tabla 4). El comportamiento por dimensiones de la GIS con respecto a la GSRS fue superponible a lo comentado para el RDQ: una correlación fuerte con la dimensión de dolor abdominal y de reflujo de la GSRS, moderada con la de indigestión, y pequeña con la de diarrea y estreñimiento (tabla 4).
Correlación (coeficiente de correlación de Spearman) entre la Escala de Impacto de la Enfermedad por Reflujo Gastroesofágico (GIS) y el Cuestionario de Calidad de Vida en Reflujo y Dispepsia (QOLRAD) y la Escala de Valoración de Síntomas Gastrointestinales (GSRS)
GIS Total | GIS Quemazón y dolor | GIS Otros síntomas relacionados con acidez | GIS Impacto de los síntomas | |
QOLRAD | 0,80 | |||
Total | p<0,0001 | |||
QOLRAD | 0,57 | 0,48 | 0,74 | |
Bienestar emocional | p<0,0001 | p<0,0001 | p<0,0001 | |
QOLRAD | 0,51 | 0,44 | 0,76 | |
Alteración de sueño | p<0,0001 | p<0,0001 | p<0,0001 | |
QOLRAD | 0,59 | 0,48 | 0,73 | |
Vitalidad | p<0,0001 | p<0,0001 | p<0,0001 | |
QOLRAD | 0,58 | 0,53 | 0,73 | |
Comida/bebida | p<0,0001 | p<0,0001 | p<0,0001 | |
QOLRAD | 0,53 | 0,51 | 0,71 | |
Función físico/social | p<0,0001 | p<0,0001 | p<0,0001 | |
GSRS | −0,55 | |||
Total | p<0,0001 | |||
GSRS | −,53 | -0,40 | −0,61 | |
Dolor abdominal | p<0,0001 | p<0,0001 | p<0,0001 | |
GSRS | −0,57 | −0,50 | −0,59 | |
Reflujo | p<0,0001 | p<0,0001 | p<0,0001 | |
GSRS | 0,02 | −0,18 | −0,15 | |
Diarrea | p=0,7865 | p=0,0029 | p=0,0119 | |
GSRS | −0,29 | −0,29 | −0,37 | |
Indigestión | p<0,0001 | p<0,0001 | p<0,0001 | |
GSRS | −0,08 | −0,20 | −0,26 | |
Estreñimiento | p=0,1919 | p=0,000 | p<0,0001 |
Tanto el RDQ como la GIS fueron capaces de discriminar entre pacientes sin síntomas y pacientes con al menos un síntoma moderado o grave, y entre pacientes con síntomas semanales (⩾1 vez/semana) y los pacientes con síntomas con una frecuencia inferior a la semanal (< 1 vez/semana) (tabla 5).
Valoración de la validez discriminante del Cuestionario sobre Alteraciones de Reflujo (RDQ) y la Escala de Impacto de la Enfermedad por Reflujo Gastroesofágico (GIS)
RDQ | GIS | |
Media (DE) | Media (DE) | |
Gravedad de la ERGE | ||
Sin ningún síntoma | 1,9 (0,7) | 3,5 (0,5) |
Al menos un síntoma moderado o grave | 3,3 (1,0) | 2,8 (0,5) |
p | ⩽ 0,0001 | ⩽ 0,0001 |
Frecuencia de síntomas de la ERGE | ||
Semanal (⩾1vez/semana) | 3,4 (1,0) | 2,8 (0,5) |
Superior a semanal (<1vez/semana) | 2,6 (1,2) | 3,2 (0,6) |
p | ⩽0,0001 | ⩽0,0001 |
DE: desviación estándar.
La sensibilidad al cambio se evaluó valorando los cambios en las puntuaciones totales de los dos instrumentos de medida, RDQ y GIS, en el subgrupo de sensibilidad de acuerdo a la mejoría según el EGT del médico, el EGT del paciente, y la mejoría de acuerdo a las láminas COOP/WONCA (tabla 6). Tanto el RDQ como la GIS mostraron cambios significativos con un tamaño del efecto grande en las respuestas de mejoría, con independencia de cuál fuera el criterio de los 3 utilizados. Del mismo modo, ambos instrumentos mostraron un tamaño del efecto pequeño en los pacientes que estaban «más o menos igual» después de la intervención y según cualquiera de los tres criterios. Sin embargo, el tamaño del efecto de los cambios en ambos instrumentos fue pequeño en los pacientes que empeoraban, especialmente en la evaluación realizada por el EGT del médico; sólo se observó un cambio significativo y un tamaño del efecto grande en la GIS en pacientes que empeoraban según las láminas COOP/WONCA.
Valoración de la sensibilidad al cambio del Cuestionario sobre Alteraciones de Reflujo (RDQ) y la Escala de Impacto de la Enfermedad por Reflujo Gastroesofágico (GIS)
RDQ | |||||
Visita 1 | Visita 2 | Tamaño del efecto | |||
N | Media (DE) | Media (DE) | p | ||
RDQ EGT del médico | |||||
Peor | 4 | 2,31 (1,58) | 2,79 (1,01) | –0,30 | 0,2507 |
Más o menos igual | 31 | 3,09 (1,18) | 2,73 (1,11) | 0,29 | 0,0447 |
Mejor | 194 | 3,37 (0,97) | 1,79 (0,67) | 1,63 | <0,0001 |
EGT del paciente | |||||
Peor | 4 | 2,06 (1,23) | 3,02 (1,33) | –0,78 | 0,0120 |
Más o menos igual | 34 | 2,92 (1,10) | 2,67 (1,01) | 0,09 | 0,0448 |
Mejor | 188 | 3,41 (0,97) | 1,77 (0,66) | 1,70 | <0,0001 |
COOP/WONCA | |||||
Mucho mejor | 101 | 3,60 (0,96) | 1,61 (0,61) | 2,07 | <0,0001 |
Un poco mejor | 88 | 3,18 (0,96) | 2,02 (0,77) | 1,21 | <0,0001 |
Más o menos igual | 32 | 2,84 (1,16) | 2,42 (0,97) | 0,35 | 0,0366 |
Un poco peor | 7 | 3,00 (0,74) | 3,31 (0,79) | −0,42 | 0,3100 |
GIS | |||||
EGT del médico | |||||
Peor | 4 | 2,56 (1,19) | 2,29 (0,77) | 0,23 | 0,8750 |
Más o menos igual | 30 | 3,02 (0,54) | 3,26 (0,47) | −0,71 | 0,0012 |
Mejor | 190 | 2,79 (0,52) | 3,56 (0,47) | −1,48 | <0,0001 |
EGT del paciente | |||||
Peor | 4 | 2,53 (1,18) | 2,25 (0,73) | 0,24 | 0,7500 |
Más o menos igual | 34 | 3,03 (0,51) | 3,20 (0,47) | −0,06 | 0,0050 |
Mejor | 184 | 2,78 (0,52) | 3,57 (0,46) | −1,52 | <0,0001 |
COOP/WONCA | |||||
Mucho mejor | 99 | 2,71 (0,52) | 3,65 (0,41) | −1,80 | <0,0001 |
Un poco mejor | 86 | 2,85 (0,52) | 3,45 (0,52) | −1,15 | <0,0001 |
Más o menos igual | 31 | 3,07 (0,64) | 3,25 (0,62) | −0,06 | 0,0284 |
Un poco peor | 7 | 2,63 (0,21) | 2,83 (0,33) | −0,95 | 0,0105 |
DE: desviación estándar; EGT: Cuestionario de Efecto Global del Tratamiento.
El cuestionario RDQ y la escala GIS presentaron una consistencia interna adecuada, ya que tanto globalmente como por dimensiones el coeficiente alfa de Cronbach fue superior a 0,70. Los resultados del RDQ con un alfa de Cronbach para el global del cuestionario de 0,82, y de 0,79–0,84 para sus 4 dimensiones (incluida la de ERGE), son muy similares a los de la versión alemana del cuestionario, que mostró un alfa de Cronbach de 0,84–0,86 en las 3 dimensiones originales8. Respecto a la escala GIS, los resultados de fiabilidad interna son también muy similares a los de la validación original16, en la que también la dimensión de «impacto de los síntomas» fue la que presentó un alfa de Cronbach más elevado (0,74 y 0,77 en nuestro estudio y en el de la validación original, respectivamente). Estos resultados de fiabilidad interna son buenos para la utilización de estos instrumentos en la investigación y la práctica clínica, aunque hubiera sido deseable una mayor fiabilidad (esto es, un alfa de Cronbach de al menos 0,90) para su utilización en la práctica clínica29. No obstante, también es cierto que los cuestionarios de síntomas digestivos no suelen presentar resultados de fiabilidad tan elevados. Así, por ejemplo, en un estudio que evaluó las propiedades psicométricas de la GSRS en 6 países, el alfa de Cronbach para sus distintas dimensiones varió entre 0,45 y 0,82 para sus 5 dimensiones en España, y el de la dimensión de reflujo entre 0,49 y 0,84 para los 6 países (0,67 en España)30.
La fiabilidad test-retest fue buena con ambos cuestionarios. Todos los dominios del RDQ, así como su puntuación total, presentaron una correlación fuerte entre la evaluación basal y la realizada a los 16 días en pacientes presumiblemente estables. Respecto a la GIS, la correlación fue fuerte para el global del cuestionario y la dimensión de impacto de los síntomas, y moderada para las otras dos. Estos resultados fueron bastante mejores para ambos instrumentos cuando la fiabilidad test-retest se analizó en la muestra de paciente que se mostraban estables («más o menos igual»), según el EGT en la vista de seguimiento. Los resultados de la GIS, según este último criterio, fueron similares a los de la validación original utilizando el mismo criterio16.
Ambos instrumentos, RDQ y GIS, presentan una excelente validez concurrente con correlaciones muy fuertes de sus puntuaciones totales con las del QOLRAD (−0,73 y 0,80 para el RDQ y la GIS, respectivamente), una escala específica de calidad de vida para el reflujo y la dispepsia, y correlaciones menores pero fuertes con la GSRS (0,54 con el RDQ y −0,55 con la GIS), una escala general de síntomas gastrointestinales. Más aún, por dimensiones, prácticamente todas las del RDQ presentaban correlaciones fuertes con las distintas dimensiones del QOLRAD. Del mismo modo, con excepción de la dimensión «otros síntomas relacionados con la acidez», que presentó correlaciones moderadas con las dimensiones «bienestar emocional», «alteraciones del sueño» y «vitalidad», el resto de dimensiones presentó correlaciones fuertes o muy fuertes con las distintas dimensiones del QOLRAD. Hay que resaltar que los mejores resultados de correlación con el QOLRAD los mostró la dimensión de «impacto de los síntomas» de la GIS, lo que refuerza la idea de que esta escala, y en especial esta dimensión, son capaces de evaluar el impacto de los síntomas de ERGE en la vida del paciente; dicho de otro modo, evalúa el mismo constructo que el QOLRAD. Estos resultados de la GIS en relación con el QOLRAD son enteramente superponibles a los obtenidos en la validación original de la escala16. La buena correlación tanto del RDQ como de la GIS con las dimensiones de «dolor abdominal» y «reflujo» de la GSRS, los síntomas más relacionados con la ERGE en ese cuestionario, refuerza los resultados de validez convergente de ambos instrumentos. La validez discriminante fue también buena con ambos instrumentos, capaces de discriminar entre pacientes con ERGE según la gravedad o la frecuencia de los síntomas; además, la débil correlación de todas las dimensiones de ambos instrumentos con las dimensiones de «diarrea» y «estreñimiento» de la GSRS refuerza esta buena validez discriminante.
Tanto el RDQ como la GIS demostraron una buena sensibilidad a los cambios. Si tomamos como referencia la mejoría de la calidad de vida de acuerdo a las láminas COOP/WONCA, el tamaño del efecto de los cambios tanto en la puntuación total del RDQ como de la GIS es pequeño para los pacientes que se mantuvieron «más o menos igual», grande para los que se encuentran «un poco mejor» y aún mayor para los que se encuentran «mucho mejor». Sin embargo, los resultados para los cambios negativos (esto es, empeoramiento) son inconsistentes, probablemente debido al escaso número de pacientes que empeoraban tras la intervención y la gran dispersión de los datos de estos pacientes en la visita basal. Tanto el RDQ, en su validación original17 y la validación de la versión alemana18, como la GIS en su validación original16 se han mostrado sensibles a los cambios.
Globalmente, los resultados de nuestro estudio señalan que tanto el RDQ como la GIS presentan unas muy buenas propiedades psicométricas de factibilidad, consistencia interna, validez convergente y discriminante, y de sensibilidad a los cambios, que los convierten en dos herramientas muy útiles en atención primaria para evaluar, tanto en la investigación como en la práctica clínica, la sintomatología de la ERGE y el impacto de estos síntomas en la vida del paciente, y para evaluar el resultado de las intervenciones terapéuticas. Tal vez, de forma global, pudiera resultar más útil en la práctica clínica, en especial en atención primaria, el cuestionario GIS, ya que evalúa tanto la sintomatología como el impacto sobre el paciente, en un formato autoadministrado y muy breve, y con unas buenas propiedades psicométricas. Como información adicional, sería interesante estudiar ambos cuestionarios en poblaciones más amplias y tras intervenciones terapéuticas que permitieran evaluar si es sensible a los cambios bidireccionales. Además, para su utilización como instrumento de investigación, sería de gran interés estudiar la fiabilidad interobservador.
Los autores desearían expresar su más sincero agradecimiento al Dr. Luis Lizán, de la Universidad Jaime I de Castellón, por su contribución en el diseño del estudio.
Financiación
Este estudio fue financiado por AstraZeneca España.