Los médicos residentes están continuamente expuestos a la fatiga, que puede ocasionarles problemas laborales, académicos y personales, por consiguiente, es importante contar con instrumentos confiables y válidos para medirla. Una de las escalas más utilizadas es la Escala de gravedad de fatiga, sin embargo, hay versiones con una y distinto número de reactivos en distintas poblaciones. Por lo que el propósito de este trabajo fue traducir, adaptar de manera culturalmente relevante y comparar las versiones con distinto número de reactivos de la escala, para identificar la más adecuada en médicos residentes mexicanos. Se trabajó con tres grupos diferentes de participantes; el primero para la traducción y adaptación conformado por siete jueces expertos en el idioma, el segundo para la validación psicométrica con 100 médicos residentes y, el tercero, para el análisis factorial confirmatorio y prueba de invarianza por tipo de programa (especialidad y alta especialidad) con 182 médicos residentes. Se probó la distribución, discriminación, confiabilidad y estructura de la escala, en un análisis exploratorio y confirmatorio, quedando una escala final de 6 reactivos con buen ajuste (X2[9] = 9,39, p = 0,40; CFI = 0,99; RMSEA = 0,02), con una confiabilidad = 0,91 e invarianza factorial estricta por tipo de programa de residencia.
Resident physicians are continually exposed to fatigue, which can lead to work, academic and personal problems, so it is important to have reliable and valid instruments to measure it. One of the most used is Fatigue Severity Scale, but, there are versions with different number of items in different populations. Therefore, the purpose of this work was to translate, adapt culturally relevant and compare versions with different numbers of items, to identify the most appropriate in Mexican resident physicians. With three different groups of participants; first one for translation by seven expert judges in the language, second for psychometric validation with 100 resident physicians, and third for confirmatory factor analysis and invariance test by type of program (specialty and high specialty) with 182 resident physicians. Distribution, discrimination, reliability and factor structure of the scale were tested in an exploratory and confirmatory analysis, leaving a final scale of 6 items with good fit (X2[9] = 9,39, p = 0,40; CFI = 0,99; RMSEA = 0,02), with a reliability = 0,91 and strict factorial invariance by type of residence program.
La residencia médica ha sido identificada como un periodo en el que se viven altas demandas de tiempo, cargas de trabajo y responsabilidades en la formación de médicos y cirujanos1, por lo que se han investigado las consecuencias de estas demandas en la salud física, salud psicológica, bienestar general, rendimiento académico y laboral y relaciones interpersonales de sus estudiantes1–3.
Una de las consecuencias que han sido identificadas previamente en la literatura es la experiencia de fatiga4, que es la sensación de cansancio físico y falta de energía, diferente de la debilidad física, que ocurre como consecuencia de la realización de esfuerzos físicos y mentales5,6 y su incidencia en esta población es alta y supera la de la población general7,8.
La fatiga que sufren los médicos residentes puede generarles problemas de tres tipos: los laborales por errores médicos2; personales como abuso de sustancias, daño en las relaciones sociales, trastornos de la salud mental y accidentes automovilísticos9–12 y, problemas en el rendimiento académico con deterioro de memoria, habilidades de resolución de problemas y motricidad fina, así como la reducción de la calidad de la enseñanza a los alumnos de menor grado13,14.
Por lo que resulta necesario hacer investigaciones a profundidad sobre la fatiga y sus consecuencias en los médicos residentes, con esta finalidad es necesario contar con formas confiables y válidas para evaluar la fatiga. Tradicionalmente, la fatiga es evaluada de dos maneras distintas, la primera con métodos objetivos en los que se utilizan aparatos para realizar distintas pruebas al organismo15, la segunda con métodos subjetivos para realizar la medición de fatiga, en la que se considera a los instrumentos psicométricos.
Dado que los métodos objetivos son más complejos y costosos para su aplicación, es más común utilizar los métodos subjetivos5,16, sin embargo, su desarrollo es difícil debido a la variabilidad en la experiencia de las molestias reportadas5,16,17. Existe un amplio número de instrumentos psicométricos diseñados para medir la fatiga, pero, solo se han estudiado las propiedades psicométricas de algunos de ellos18.
Los instrumentos diseñados para medir fatiga pueden clasificarse de acuerdo con sus dimensiones en dos tipos, los unidimensionales y los multidimensionales. Las escalas unidimensionales se centran en la gravedad de la fatiga. Las escalas multidimensionales de fatiga buscan explorar de manera amplia las afecciones causadas por la fatiga en el funcionamiento cognitivo, conductual y social de la persona, lo que se conoce como tipos de fatiga18.
Algunos de los instrumentos que existen para medir fatiga para los que se han estudiado sus características psicométricas se presentan a continuación en la tabla 1.
Instrumentos psicométricos de fatiga con dimensiones, número de reactivos y consistencia interna
Nombre | Medición: dimensiones, reactivos y confiabilidad |
Escala de fatiga analógica-visual VAS-F19 | Dos dimensiones energía y fatiga con 18 reactivos en escala analógica visual y consistencia interna de entre 0,91-0,96 |
Escala de fatiga FS20 | Dos dimensiones fatiga física y fatiga mental con 11 reactivos tipo Likert con cuatro opciones de respuesta y una consistencia interna entre 0,88 y 0,90 |
Escala de impacto de la fatiga FIS21 | Tres dimensiones fatiga física, fatiga mental y fatiga psicosocial con 40 reactivos tipo Likert con cinco opciones de respuesta de 0 no hay problema a 4 problema extremo, con consistencia interna entre 0,88 y 0,98 y evidencias de validez convergente con diferentes subescalas de un inventario de salud física SF-36 |
Inventario de síntomas de fatiga FSI22 | Tres dimensiones intensidad, duración e impacto en la calidad de vida, 13 reactivos tipo Likert de 11 puntos, con consistencia interna entre 0,93 y 0,95, convergente con la escala de síntomas POMS |
Inventario de fatiga multidimensional MFI-2023 | Cinco dimensiones fatiga general, fatiga física, la actividad reducida, reducción de la motivación y la fatiga mental, con 20 reactivos tipo Likert con cinco opciones de respuesta, consistencia interna 0,53-0,93, evidencia de validez convergente con la escala VA de fatiga |
Escala de fatiga en cáncer de Schwartz SCFS24 | Cuatro dimensiones física, emocional, cognitiva, y temporal, con 28 reactivos tipo Likert con cinco opciones de respuesta, con consistencia interna de 0,97 |
Fuente: elaboración propia.
Además de los instrumentos presentados en la tabla una de las escalas más utilizadas es la Escala de severidad de la fatiga (FSS)25 la cual mide gravedad de fatiga de manera unidimensional con nueve reactivos tipo Likert con siete opciones de respuesta en términos de acuerdo y desacuerdo.
Esta escala se ha utilizado y validado psicométricamente en pacientes con distintos tipos de enfermedades crónicas entre las que se encuentran esclerosis múltiple, eventos vasculares cerebrales, lupus, hepatitis C y VIH, además de población general26 también se ha adaptado a diversos idiomas en varios países del mundo entre los que se encuentran Noruega27, Turquía28, Italia29 y Colombia30y en todos los casos demuestra tener adecuadas propiedades psicométricas en términos de discriminación, confiabilidad y validez18.
La principal ventaja de esta escala es su extensión breve, que en el contexto de los médicos residentes es especialmente valiosa, porque no constituye una interrupción larga a su trabajo; la versión original cuenta con nueve reactivos en los que se evalúa si la fatiga afecta la motivación, el ejercicio y funcionamiento físico, las actividades de la vida cotidiana y la vida social; hay versiones con siete reactivos desarrolladas en pacientes con VIH y esclerosis múltiple angloparlantes en las que no incluyen los problemas en la motivación ni el ejercicio físico26,31, también existe una versión con ocho reactivos realizada en pacientes de esclerosis múltiple italoparlantes que no incluye los problemas a la motivación29.
Por lo que el primer objetivo del presente estudio es traducir y adaptar de manera culturalmente relevante la FSS y validarla psicométricamente en médicos residentes mexicanos, el segundo objetivo es comprobar cuál es la estructura factorial más adecuada para los médicos residentes con análisis factorial confirmatorio y el tercero es realizar una prueba de invarianza por niveles de residencia para garantizar que la prueba no tiene funcionamiento diferencial por grado y si es así comparar las medias de la variable latente fatiga, debido a que en la literatura se reporta que los estudiantes en los primeros niveles de residencia sufren más fatiga que en otros32.
Material y métodoPara cumplir con los objetivos se realizaron tareas en tres fases consecutivas: traducción y adaptación culturalmente relevante, validación psicométrica y análisis factorial confirmatorio con prueba de invarianza por tipo de programa de residencia, las cuales se reportan a continuación.
Se trabajó con tres grupos diferentes de participantes, uno para cada fase del estudio. El primero para la traducción y adaptación culturalmente relevante estuvo conformado por siete jueces, con edades entre los 28 y 60 años de edad, todos psicólogos con experiencia en medición y manejo de idiomas inglés y español.
El segundo grupo para la validación psicométrica conformado por 100 médicos residentes, todos de hospitales públicos, 74 mujeres y 26 hombres, con edades entre los 25 y 37 años y una edad promedio de 29,48 años y una desviación estándar de 2,41, 76 de programas de especialidad médica (primeros tres niveles) y 24 de programas de alta o subespecialidad (niveles entre 4 y 6). Para determinar el tamaño de la muestra se decidió exceder en 10 veces con participantes el número de reactivos de acuerdo con la propuesta de Nunnally y Bernstein33.
Los médicos que participaron en esta fase del estudio provenían de hospitales en tres regiones del país en las que se seleccionó aleatoriamente un estado, para el norte se tuvo el estado de Sinaloa, para el centro la Ciudad de México y para el sur Michoacán en proporciones iguales.
Se trabajó con médicos de cuatro programas de especialidad para tener representación de cada uno de los bloques en los que se clasifican las especialidades en México, del bloque quirúrgico se trabajó con 19 estudiantes de Ginecología y Obstetricia, del bloque clínico 19 estudiantes de Medicina de Urgencias, del bloque Salud Pública y Atención Primaria 20 estudiantes de Medicina Familiar y del bloque Especialidades Auxiliares y de Diagnóstico 18 estudiantes de Medicina Física y Rehabilitación.
En cuanto a los médicos de programas de subespecialidad se trabajó con 10 estudiantes de Cardiología, 5 estudiantes de Oncología en la Ginecología, 4 estudiantes de Neonatología y 5 estudiantes de Biología de la Reproducción Humana.
Los programas en los que se realizó el estudio se seleccionaron de forma no probabilística intencional de acuerdo con el permiso otorgado por las autoridades de los hospitales en los que se realizó el estudio y la participación de los estudiantes fue voluntaria, como criterio de exclusión se consideró que los estudiantes tuvieran algún diagnóstico de enfermedades agudas o crónicas al momento de la aplicación del instrumento.
El tercero para el análisis factorial confirmatorio y la prueba de invarianza conformado por 182 médicos residentes, 100 mujeres y 82 hombres, con edades entre los 25 y 42 años y una edad promedio de 29,46 años y una desviación estándar de 2,42, 101 de programas de especialidad médica (primeros tres niveles) y 81 de programas de alta o subespecialidad (niveles entre 4 y 6). El tamaño de la muestra para esta fase del estudio se consideró con base en un análisis de potencia estadística calculado para GFI34 en el que se consideró tener nueve reactivos, 45 grados de libertad, un alpha de 0,05 y una potencia deseada de 0,80 que daba como resultado 157 participantes, también se cuidó exceder en 20 veces con participantes el número de reactivos de acuerdo con la propuesta Jackson35.
Los participantes también provenían de las mismas tres regiones del país en las que se seleccionó aleatoriamente un estado, para el norte se tuvo el estado de Sinaloa con 40 médicos, para el centro la Ciudad de México con 100 médicos y para el sur Michoacán con 42 médicos.
En esta fase se contó también con médicos de cuatro programas de especialidad para volver a tener representación de cada uno de los bloques, del bloque quirúrgico se trabajó con 24 estudiantes de Cirugía General, del bloque clínico 25 estudiantes de Medicina Interna, del bloque Salud Pública y Atención Primaria 36 estudiantes de Medicina Familiar y del bloque Especialidades Auxiliares y de Diagnóstico 16 estudiantes de Medicina Física y Rehabilitación.
En cuanto a los médicos de programas de subespecialidad se trabajó con estudiantes de: Algología 7, Cardiología 9, Cardioneumología 3, Cirugía Bariátrica 4, Cirugía laparoscópica 4, Diabetes y Metabolismo 6, Gerontología Médica 4, Insuficiencia Cardiaca 6, Medicina del Dolor 5, Medicina Genómica 4, Medicina Materno-Fetal 7, Neonatología 4, Neuroftalmología 3, Neuropsiquiatría 4, Oncología Pediátrica 4, Paidopsiquiatría 2 y Trastornos del Sueño 5.
De nuevo en esta fase los programas en los que se realizó el estudio se seleccionaron de forma no probabilística intencional, de acuerdo con el permiso otorgado por las autoridades de los hospitales en los que se realizó el estudio y la participación de los estudiantes fue voluntaria, como criterio de exclusión se consideró que los estudiantes tuvieran algún diagnóstico de enfermedades agudas o crónicas al momento de la aplicación del instrumento.
Para la primera fase se usó la versión traducida de la escala y se colocó en un formato para la evaluación de expertos que incluía la opción de aceptación o modificaciones a la misma.
Para la segunda fase se usó la versión traducida y adaptada producto de la fase anterior, la cual tiene nueve afirmaciones con siete opciones de respuesta de tipo Likert pictórico36 rotuladas con de acuerdo y en desacuerdo en los extremos.
Para la tercera fase se usó la versión validada producto de la fase anterior, la cual tiene nueve afirmaciones con siete opciones de respuesta de tipo Likert pictórico36 rotuladas con de acuerdo y en desacuerdo en los extremos y una consistencia interna con el coeficiente Alpha de Cronbach 0,94.
También se aplicó la Escala de impacto de fatiga validada en población mexicana37. Con una consistencia interna con el coeficiente alpha de Cronbach 0,93.
En la primera fase se revisó la traducción y adaptación del instrumento, con esta finalidad dos traductores independientes tradujeron los reactivos de la escala, posteriormente se integró la primera versión que se revisó con la opinión experta de siete jueces entrenados en psicometría e idioma inglés, que compararon esta versión con la original y con la definición de fatiga de la misma y determinaron si lo que se había traducido literalmente del inglés al español en cada reactivo era lo que se deseaba medir. Se buscó que para cada reactivo hubiera al menos un 80% de acuerdo acerca de la redacción junto con una confiabilidad interjueces alpha de Krippendorff de 0,8838. Posteriormente se retradujo al idioma inglés y se evaluó su equivalencia con la original.
En la segunda fase de validación psicométrica se contactó a los participantes en los hospitales con previa autorización de los responsables de su programa de especialidad, se les dio una explicación detallada del estudio, tiempos y procedimiento, posteriormente si accedían a participar se les pidió que firmaran el formulario de consentimiento informado y se les dio el instrumento para que lo contestaran. Una vez obtenidos los datos se siguió el procedimiento para validación psicométrica culturalmente relevante propuesto por Reyes-Lagunes y García y Barragán39, que incluye análisis de distribución, discriminación, direccionalidad, confiabilidad y estructura factorial de los reactivos de la escala.
Para la tercera fase del análisis factorial confirmatorio y prueba de invarianza, de nuevo, se contactó a los participantes en los hospitales con previa autorización de los responsables de su programa de especialidad, se les dio una explicación detallada del estudio, se les pidió que firmaran el formulario de consentimiento informado y se les dio el instrumento para que lo contestaran, es importante mencionar que en esta fase la batería incluía los dos instrumentos usados en el estudio para que pudieran responderse de forma simultánea. Una vez obtenidos los datos se analizó cuál era la estructura factorial más adecuada y se hizo una prueba de invarianza por tipo de programa de residencia siguiendo el procedimiento propuesto por Milsap y Olivera-Aguilar40, que consiste en evaluar cuatro modelos anidados cada uno más restrictivo que el anterior. En un primer paso se prueba el ajuste de la configuración cuidando que la estructura factorial sea la misma para los grupos, posteriormente se tiene la invarianza métrica o débil en la que las cargas factoriales se restringen a igualdad, se sigue con invarianza fuerte en el que las cargas factoriales y los interceptos se restringen a igualdad y finalmente en invarianza estricta las cargas factoriales, los interceptos y las varianzas únicas de los reactivos se restringen a igualdad y se compara el ajuste de los modelos. Si no hay diferencias significativas en la chi cuadrada ni cambios mayores a 0,01 en el CFI, se considera que existe invarianza41. Se busca tener invarianza estricta debido a que de esta manera se puede considerar que los cambios solo se deben a la variable latente y no a sesgo en la medición42.
ResultadosAdaptación culturalmente relevanteLos reactivos con un 80% de acuerdo acerca de la redacción y una confiabilidad interjueces alpha de Krippendorff de 0,88 se presentan en la tabla 2.
Reactivos aprobados por los jueces
Reactivo |
1. Cuando estoy fatigado disminuye mi motivación |
2. El ejercicio aumenta mi fatiga |
3. Me fatigo fácilmente |
4. Mi funcionamiento físico se entorpece con la fatiga |
5. La fatiga me causa problemas frecuentemente |
6. La fatiga no me permite tener un funcionamiento físico consistente |
7. La fatiga me impide llevar acabo ciertas tareas y responsabilidades |
8. La fatiga es uno de los tres síntomas que menos me permiten hacer cosas |
9. La fatiga me estorba en mi trabajo, con mi familia o con mi vida social |
Se hizo un análisis de frecuencias de cada uno de los reactivos, se encontró que todas las opciones de respuesta tuvieron frecuencia, posteriormente se calcularon el sesgo, la curtosis y la prueba Z de Kolmogorov-Smirnov y los resultados muestran que todos tenían una distribución sesgada. Lo que se consideró para los siguientes análisis (tabla 3).
Análisis de distribución de los reactivos de la Escala de severidad de fatiga FSS adaptada
Reactivo | Análisis de distribución frecuencia de los reactivos | Prueba de normalidad | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Frecuencia en porcentaje por opción de respuesta | Z | p con corrección de Lilliefors | |||||||||
En desacuerdo | De acuerdo | Asimetría | Curtosis | ||||||||
FSS1 | 2 | 2 | 4 | 5 | 74 | 6 | 7 | −1,28 | 4,80 | 0,40 | p < 0,001 |
FSS2 | 5 | 3 | 3 | 78 | 4 | 4 | 3 | −0,32 | 3,92 | 0,40 | p < 0,001 |
FSS3 | 5 | 1 | 7 | 73 | 8 | 3 | 4 | −0,14 | 4,08 | 0,37 | p < 0,001 |
FSS4 | 4 | 3 | 6 | 75 | 6 | 3 | 3 | −0,19 | 4,14 | 0,38 | p < 0,001 |
FSS5 | 5 | 3 | 73 | 7 | 6 | 4 | 2 | 1,28 | 3,34 | 0,41 | p < 0,001 |
FSS6 | 4 | 4 | 5 | 75 | 7 | 4 | 1 | −0,74 | 3,96 | 0,40 | p < 0,001 |
FSS7 | 4 | 3 | 63 | 19 | 6 | 3 | 2 | 1,07 | 3,06 | 0,34 | p < 0,001 |
FSS8 | 3 | 4 | 58 | 23 | 8 | 3 | 1 | 0,81 | 2,24 | 0,31 | p < 0,001 |
FSS9 | 3 | 3 | 7 | 74 | 6 | 3 | 4 | 0,20 | 4,00 | 0,38 | p < 0,001 |
Posteriormente se probó el poder discriminativo de los reactivos, es decir, su capacidad para detectar diferencias en las cantidades del atributo que se está midiendo, lo que de acuerdo con Magnusson43 puede hacerse al probar que existe una relación sistemática entre las puntuaciones del reactivo y el total de la prueba. Para esto se hicieron dos análisis, en primer lugar, una comparación de grupos extremos con respecto al total de la prueba (puntuaciones inferiores al primer cuartil y puntuaciones superiores al tercer cuartil) con la prueba U de Mann Whitney, la misma que se seleccionó debido a que es adecuada a la distribución de los reactivos por ser no paramétrica, y se conservaron todos los reactivos por discriminar significativamente.
El segundo análisis fue una correlación entre el total de la prueba y cada uno de los reactivos, también se hizo una versión corregida de la misma en la cual el total de la prueba no incluía al reactivo, solo se conservaron aquellos con correlaciones superiores a 0,30 en ambos análisis, que en este caso fueron todos (tabla 4).
Análisis de discriminación de los reactivos de FSS versión adaptada
Reactivo | Análisis de discriminación | ||||
---|---|---|---|---|---|
Comparación de grupos extremos | Correlación reactivo total | Correlación reactivo total sin el reactivo | |||
U Mann Whitney | gl | p | |||
FSS1 | 35,00 | 43 | p < 0,001 | 0,76** | 0,69** |
FSS2 | 80,00 | 43 | p < 0,001 | 0,70** | 0,61** |
FSS3 | 12,00 | 43 | p < 0,001 | 0,94** | 0,92** |
FSS4 | 2,50 | 43 | p < 0,001 | 0,93** | 0,91** |
FSS5 | 72,00 | 43 | p < 0,001 | 0,85** | 0,80** |
FSS6 | 22,50 | 43 | p < 0,001 | 0,84** | 0,79** |
FSS7 | 28,50 | 43 | p < 0,001 | 0,83** | 0,77** |
FSS8 | 51,00 | 43 | p < 0,001 | 0,79** | 0,73** |
FSS9 | 12,00 | 43 | p < 0,001 | 0,79** | 0,73** |
Posteriormente para conocer la estructura de la escala se hizo un análisis factorial exploratorio de ejes principales con rotación oblicua, adecuado para identificar las variables latentes que subyacen a los reactivos44,45, se eligió este método de extracción debido a que no se basa en el supuesto de normalidad, y el tipo de rotación debido a que este es más preciso y provee más información que la rotación ortogonal. Se encontró una solución unidimensional con los nueve reactivos que explica el 65% de la varianza (tabla 5).
Para verificar la pertinencia del análisis se calculó la medida de adecuación muestral Kaiser, Meyer, Olkin (KMO= 0,81) y la prueba de esfericidad de Barttlet (X2(36)= 948,78, p < 0,001) y, se llegó a la conclusión de que la matriz de correlaciones de la que parte fue adecuada. Posteriormente, se calculó la confiabilidad total de la escala alpha de Cronbach y se obtuvo un valor adecuado de consistencia interna (α = 0,94).
Análisis factorial confirmatorio y prueba de invarianzaPosteriormente se hizo un análisis factorial confirmatorio de máxima verosimilitud robusta, método seleccionado por la falta de normalidad en los datos12, probando tres modelos comparativos, todos con una dimensión, pero con diferente número de reactivos, uno con los 9, otro con 8 reactivos y uno con 7. La identificación de los modelos se hizo fijando la carga factorial del primer reactivo a uno para definir la métrica de la variable latente46 con el software R y el paquete lavaan47.
Para evaluar el ajuste de los modelos se utilizaron los siguientes índices de bondad de ajuste: chi cuadrada normada, dividida por los grados de libertad (debería ser menor a 3,00 con una probabilidad no significativa; entre menor cociente mejor ajuste). Índice de bondad de ajuste Lisrel GFI, índice de ajuste comparativo de Bentler CFI (para que exista un buen ajuste, los valores de GFI y CFI deben ser ≥ 0,95). Y raíz cuadrada media del error de aproximación RMSEA y SRMR (los valores de RMSEA y SRMR deben ser ≤0,08, para indicar un buen ajuste).
Los resultados de los tres modelos mostraron falta de ajuste global para explicar los datos, por lo que se analizaron las faltas de ajuste local mediante el uso de índices de modificación y se encontraron asociados con los reactivos 1,3 y 4, entonces se tomó la decisión de modificar el modelo eliminando estos reactivos, ya que alcanzar ajuste mediante la inclusión de los mismos puede reflejar más la idiosincrasia de la muestra que la relación entre variables48. El modelo modificado con una dimensión y seis reactivos cuenta con adecuado ajuste, en todos los índices, a continuación, se presentan los índices de ajuste para los cuatro modelos evaluados (tabla 6).
Índices de ajuste para el análisis factorial confirmatorio de los modelos
Modelo | X2 | p | X2/gl | CFI | GFI | RMSEA | IC 90% | SRMR |
---|---|---|---|---|---|---|---|---|
9 reactivos | X2(27) = 100,05 | p < 0,001** | 3,70 | 0,90 | 0,87 | 0,14 | (0,11-0,18) | 0,06 |
8 reactivos | X2(20) = 68,82 | p < 0,001** | 3,44 | 0,92 | 0,89 | 0,11 | (0,09-0,14) | 0,05 |
7 reactivos | X2(14) = 44,72 | p < 0,001** | 3,19 | 0,94 | 0,92 | 0,14 | (0,09-0,18) | 0,03 |
6 reactivos | X2(9) = 9,39 | p = 0,40 | 1,04 | 0,99 | 0,98 | 0,02 | (0,00-0,10) | 0,01 |
A continuación, se presentan las cargas factoriales estandarizadas de la escala en las cuatro soluciones en la tabla 7.
Cargas factoriales estandarizadas para los cuatro modelos
Reactivo | Modelo 9 reactivos | Modelo 8 reactivos | Modelo 7 reactivos | Modelo 6 reactivos | ||||
---|---|---|---|---|---|---|---|---|
Factor único | Error estándar | Factor único | Error estándar | Factor único | Error estándar | Factor único | Error estándar | |
FSS1 | 0,60 | 0,05 | - | - | - | - | - | - |
FSS2 | 0,59 | 0,06 | 0,58 | 0,07 | - | - | 0,53 | 0,07 |
FSS3 | 0,79 | 0,04 | 0,78 | 0,04 | 0,77 | 0,04 | - | - |
FSS4 | 0,76 | 0,05 | 0,75 | 0,06 | 0,74 | 0,06 | - | - |
FSS5 | 0,84 | 0,02 | 0,85 | 0,03 | 0,86 | 0,03 | 0,85 | 0,03 |
FSS6 | 0,89 | 0,02 | 0,90 | 0,03 | 0,90 | 0,03 | 0,88 | 0,03 |
FSS7 | 0,88 | 0,02 | 0,89 | 0,02 | 0,89 | 0,02 | 0,91 | 0,02 |
FSS8 | 0,80 | 0,03 | 0,81 | 0,03 | 0,81 | 0,03 | 0,82 | 0,03 |
FSS9 | 0,84 | 0,02 | 0,85 | 0,03 | 0,85 | 0,03 | 0,87 | 0,03 |
A | 0,93 | 0,93 | 0,93 | 0,91 |
Para determinar si hay funcionamiento diferencial de los reactivos por tipo de programa de residencia se hizo una prueba de invarianza factorial de medición y se alcanza invarianza factorial estricta ya que no hay diferencias significativas en el ajuste de los modelos anidados (tabla 8).
Después de probar la invarianza factorial se compararon las medias de la variables latentes y se encontró que no hay diferencias estadísticamente significativas (Z= −0,32, p = 0,09).
Como evidencia de validez concurrente se calculó la correlación con la puntuación total de la Escala de impacto de fatiga y se encontró significativa media (r = 0,50, p < 0,001).
DiscusiónLos primeros tres objetivos del presente trabajo eran traducir, adaptar y validar psicométricamente la FSS en una población de médicos residentes mexicanos. Para ello, se buscó tener una traducción adecuada al lenguaje sin sacrificar la evaluación de los constructos que la escala original propone. La versión final cuenta con 6 reactivos, una confiabilidad alpha de Cronbach = 0,91 y todos los reactivos se encuentran relacionados significativamente. Lo que muestra que se trata de la medición de un mismo constructo.
Mediante la validación psicométrica, a través del análisis factorial exploratorio de ejes principales, se encontró que la estructura que emerge libremente de la población tiene una dimensión con nueve reactivos como en la estructura de la escala original (Krupp y LaRocca25, 1989) con una adecuada consistencia interna. Sin embargo, en el análisis factorial confirmatorio se encontró que los reactivos 1, 3 y 4 no fueron adecuados.
La falta de ajuste con los reactivos 3 y 4 que indican que problemas en el funcionamiento físico pueden explicarse por dos posibles razones, la primera es que son reactivos que surgieron en poblaciones afectadas por enfermedades crónicas, lo que no corresponde con el estado de salud de los médicos residentes, la segunda es que contestar afirmativamente a estos reactivos puede implicar una disminución de la capacidad de trabajo (por ejemplo, la destreza motriz de un cirujano) y en México eso no es aceptado porque el trabajo se ve como algo positivo al ser un deber que permite contribuir con la resolución de necesidades de la familia y los amigos49.
De manera congruente se puede explicar que el reactivo 2 que habla de ejercicio físico que no había funcionado en las versiones validadas en poblaciones afectadas por enfermedades crónicas de Johansson et al.31 (2014) y Lerdal et al.26 funciona en los médicos que cuentan con un estado de salud y capacidad de actividad física distinta.
La falta de ajuste en el reactivo 1 que habla sobre problemas en la motivación corresponde con lo encontrado por Johansson et al.31 y Lerdal et al.26, lo que puede deberse a que la motivación puede ser un constructo mucho más amplio que el hecho de tener energía para realizar una actividad, ya que, de acuerdo con Santrock50 la motivación es el conjunto de razones por las que las personas se comportan de las forma en que lo hacen.
La extensión de la escala la convierte en una versión corta que incluye solo a los reactivos con las mejores propiedades psicométricas para la población meta, el haber obtenido una versión corta es una ventaja ya que es más práctica para aplicar a los médicos residentes que se encuentran inmersos en grandes cargas de trabajo y no disponen de mucho tiempo para contestar instrumentos1.
Es importante destacar que en el presente trabajo se obtuvo una nueva versión de la FSS, por lo que los resultados obtenidos en ella no son comparables con los resultados obtenidos de otras versiones de la misma escala, ya que al cambiar el número de reactivos, la definición del constructo cambia y se basa en los resultados obtenidos por población de médicos residentes mexicanos, también se recomienda realizar estudios que aporten otras evidencias de validez para la escala, como aquellos realizados con algún criterio externo.
Una evidencia de validez concurrente es la correlación media con la Escala de impacto de fatiga.
En cuanto al cuarto objetivo se pudo observar que existe invarianza factorial estricta para comparar a los alumnos de programas de especialidad con los de alta o subespecialidad, lo que significa que no existe sesgo que favorezca a ningún grupo y las diferencias se deberían a fatiga, sin embargo, se encontró que no hay diferencias, lo que va en contra de los resultados de Papp et al.32, lo que sugiere que las diferencias pueden estar más en las causas de la fatiga y no en su efecto en el organismo.
LimitacionesEs importante resaltar que en este estudio no se utilizaron pruebas físicas para medir la fatiga y se consideraron solo medidas de autorreporte por lo que es conveniente hacer estudios que las incluyan, ya que a pesar de que el tratamiento estadístico riguroso de los datos ayuda a controlar el error en las mediciones, se ha observado que en el caso de autorreporte de salud las personas pueden exagerar o subestimar los síntomas por tener percepciones alteradas debido a su propio estado.
En el presente estudió se presentó evidencia sobre la confiabilidad de la escala por medio de su consistencia interna con el coeficiente alpha de Cronbach, sin embargo, en futuras investigaciones sería conveniente probar la estabilidad temporal de la prueba en el mismo individuo mediante su reproducibilidad test-retest.
También se sugiere considerar en futuros estudios si los médicos tienen consumo de sustancias tóxicas recientes o continuadas, realizar un cribado psiquiátrico para conocer efectos de la comorbilidad, acompañar el estudio con datos sobre la cantidad y calidad del sueño reciente, y registrar el momento en el que se realiza el estudio especialmente en relación con las horas trabajadas, ya que todo esto puede influir en los resultados sobre la fatiga y en el presente estudio, solo se tomó como criterio de exclusión que los participantes no tuvieran algún diagnóstico de enfermedades crónicas o agudas.
Otro aspecto que considerar es que los médicos residentes mexicanos que participaron en este estudio lo hicieron de manera voluntaria, y provienen de gran diversidad de especialidades, pero no de todos los programas que se ofrecen en el país, por lo que resulta conveniente realizar más investigaciones a futuro en las que se trate de hacer procesos de selección aleatoria para evitar sesgos de autoselección y por políticas institucionales antes de generalizar los resultados obtenidos.
Si la escala quisiera usarse en otros contextos resulta conveniente hacer estudios sobre sus propiedades psicométricas, aun en la misma cultura si se va a trabajar con médicos con algún diagnóstico clínico, ya que para poblaciones con enfermedades parece que la estructura de reactivos puede ser distinta considerando las diferentes versiones validadas que existen en ellas y los reactivos eliminados de la que aquí se presenta.
Se debe destacar que la prueba de invarianza demuestra que la escala es una medida insesgada por nivel de especialidad, y por consiguiente es adecuado usarla para comparar la fatiga entre médicos de especialidad y médicos de alta o subespecialidad, sin embargo, si va a usarse para otras variables atributivas deben hacerse estudios que demuestren que funciona de la misma manera para todos los grupos.
ConclusiónLos resultados encontrados muestran que la FSS tiene propiedades psicométricas que la hacen una medida confiable y válida para el propósito de evaluar fatiga en población de médicos residentes y puede ser usada en investigaciones o evaluación que contribuyan a mejorar los efectos de la residencia sobre su salud física, salud psicológica, bienestar general, rendimiento académico y laboral y relaciones interpersonales.
FinanciaciónFinanciado por el programa de Becas CONACYT.
Conflicto de interesesLos autores declaran no tener ningún conflicto de intereses.
Una versión preliminar de la escala se presentó en el XVI Congreso Mexicano de Psicología Social pero fue con una muestra de población general y no hay conflicto de intereses.