La evaluación de escalas de medición es un proceso continuo que exige revisiones y adaptaciones según las características de los participantes. La Escala para Homofobia de siete ítems (EHF-7) ha mostrado aceptable desempeño general en estudiantes de Medicina de dos universidades en Colombia. No obstante, el desempeño de algunos ítems fue deficiente y se podría eliminar algunos con el mejoramiento en el comportamiento de los ítems conservados.
ObjetivoRevisar el funcionamiento psicométrico y afinar el contenido de EHF-7 en estudiantes de Medicina de dos universidades colombianas.
MétodosParticiparon 667 estudiantes de 18-34 (media, 20,9±2,7) años, de los que el 60,6% eran mujeres. Se calcularon el alfa de Cronbach (α) y el omega de McDonald (Ω) como indicadores de confiabilidad, y para afinar la escala, se llevaron a cabo análisis de factores exploratorios (AFE) y confirmatorios (AFC).
ResultadosEHF-7 mostró α=0,793 y Ω=,796, además de un factor principal que explicó el 45,2% de la varianza total. Los AFE y AFC indican eliminar tres ítems. La versión de cuatro ítems (EHF-4) alcanzó α=0,770 y Ω=0,775, con un único factor que dio cuenta del 59,7% de la varianza total, con AFC que mostró mejores indicadores (χ2=3,622; gl=1; p=0,057; RMSEA=0,063; IC90%, 0,000-0,130; CFI=0,998; TLI=0,991).
ConclusionesEHF-4 presenta alta consistencia interna y una dimensión que explica más del 50% de la varianza total. Es preciso realizar investigaciones que confirmen estas observaciones aún preliminares.
The process of evaluating measurement scales is an ongoing procedure that requires revisions and adaptations according to the characteristics of the participants. The Homophobia Scale of seven items (EHF-7) has showed acceptable performance in medical students attending to two universities in Colombia. However, performance of some items was poor and could be removed, with an improvement in the psychometric findings of items retained.
ObjectiveTo review the psychometric functioning and refine the content of EHF-7 among medical students from two Colombian universities.
MethodsA group of 667 students from the first to tenth semester participated in the research. Theirs ages were between 18 and 34 (mean, 20.9±2.7) years-old, and 60.6% were females. Cronbach alpha (α) and omega of McDonald (Ω) were calculated as indicators of reliability and to refine the scale, an exploratory (EFA) and confirmatory factor analysis (CFA) was performed.
ResultsEHF-7 showed α=.793 and Ω=.796 and a main factor that explained 45.2% of the total variance. EFA and CFA suggested the suppression of three items. The four-item version (EHF-4) reached an α=.770 and Ω=.775, with a single factor that accounted for 59.7% of the total variance. CFA showed better indexes (χ2=3.622; df=1; P=.057; Root-mean-square error of approximation (RMSEA)=.063, 90% CI, .000-.130; Comparative Fit Indices (CFI)=.998; Tucker-Lewis Index (TLI)=.991).
ConclusionsEHF-4 shows high internal consistency and a single dimension that explains more than 50% of the total variance. Further studies are needed to confirm these observations, that can be taken as preliminary.
En Colombia, la creciente visibilidad de grupos no heterosexuales y la necesidad de conocimiento acerca de las actitudes de los distintos colectivos hacia estas personas hacen preciso contar con instrumentos de medición que cuantifiquen de manera válida y confiable los diferentes tipos de prejuicios por las implicaciones en la salud física y mental de las personas que se perciben estigmatizadas y discriminadas1,2.
La Escala para Homofobia (EHF-7) es un cuestionario tipo Likert de siete ítems para cuantificar uno de estos prejuicios, la actitud negativa ante personas homosexuales3. La EHF-7 es uno de los instrumentos para cuantificar la actitud ante la homosexualidad; uno de los principales atributos de esta escala es el reducido número de incisos3. No obstante, muestra buen desempeño psicométrico, con alta consistencia interna y adecuados tipos de validez4,5. Posiblemente, la brevedad para completar la totalidad de EHF-7 explica el uso frecuente en investigaciones con la participación de estudiantes de educación superior en todo el mundo6–8.
En tres artículos previos se ha presentado el desempeño de la EHF-7 en estudiantes de Medicina en Colombia. En el primer estudio publicado participaron 199 estudiantes de Medicina, de primero a quinto semestre de una universidad de Bogotá, Colombia, y se informó que la escala presentaba alta consistencia interna (α=0,78 y Ω=0,79), adecuada validez convergente (r=0,84 con la escala de actitud ante gais y lesbianas [ATLG]), aceptable validez divergente (r=–0,06 con el Índice de Bienestar General [WHO-5]), pobre validez nomológica (r=0,19 con la escala breve de Francis para religiosidad [Francis-5]) y un único dominio o factor que daba cuenta del 44,7% de la varianza9.
En el segundo trabajo publicado se contó con la participación de 124estudiantes, en este caso de sexto a décimo semestre de la misma universidad en Bogotá, y se halló adecuada consistencia interna (α=0,81 y Ω=0,82), alta validez convergente (r=0,82 con ATLG), óptima validez divergente (r=–0,03 con WHO-5), deficiente validez nomológica (r=0,19 con Francis-5; sin diferencias significativas en las puntuaciones entre varones y mujeres, cuando se espera mayor en el grupo masculino) y se retuvo un solo factor que explicaba el 49,2% de la varianza total observada10.
Finalmente, en el tercer estudio tomaron parte 366 estudiantes de primero a noveno semestre de una universidad en Bucaramanga, y se documentó aceptable consistencia interna (α=0,78 y Ω=0,79), buena validez convergente (r=0,82 con ATLG), óptima validez divergente (r=0,03 con WHO-5), inconsistente validez nomológica (r=0,16 con Francis-5, inferior a lo esperado, y con diferencias significativas entre varones y mujeres, mayor en el grupo masculino, como es lo habitual con la mayoría de los prejuicios) y se conservó un único dominio que explicaba el 43,8% de la varianza. Asimismo, en esta investigación se hizo una prueba de validación adicional, con base en la teoría de respuesta al ítem, se informó el funcionamiento diferencial por ítem (FDI) por sexo, y no se encontraron diferencias significativas entre varones y mujeres en ninguno de los siete ítems de la escala11.
El análisis factorial consuetudinariamente se relaciona con la validez de constructo de una escala12. No obstante, debe tenerse presente que todas las formas de validez conocidas y calculadas contribuyen en su conjunto a la validez del constructo, la utilidad práctica y objetiva de un concepto teórico12,13. Las investigaciones antes revisadas mostraron que la solución factorial estuvo cercano al deseado 50% solo en uno de los análisis. De la misma forma, se observó que los ítems 2, 4 y 6 mostraban un desempeño individual deficiente, con correlaciones corregidas de Pearson y comunalidades bajas9–11.
Dado que el análisis factorial es la estrategia más apropiada para la revisión y el refinamiento de las escalas de medición, en el presente estudio se llevó a cabo un análisis para observar el desempeño de la EHF-7 y refinar la escala tras eliminar los ítems con desempeño deficiente en los estudios precedentes12. Se partió del principio de que la validación de instrumentos de medición es un proceso continuo que requiere revisión y adaptación permanente con el uso adecuado de distintas pruebas estadísticas12,13. Además, en este análisis secundario se llevó a cabo AFC, omitido en los artículos precedentes, para respaldar la interpretación de los hallazgos.
El objetivo del presente análisis es revisar el funcionamiento psicométrico y afinar el contenido de la EHF-7 en estudiantes de Medicina de dos universidades colombianas.
Material y métodosSe realizó un estudio analítico observacional de validación en el contexto de una investigación más amplia que exploró el desempeño psicométrico de varias escalas en estudiantes de Medicina. Para este estudio se siguieron las normas para la investigación en salud en Colombia; un comité de ética institucional revisó y aprobó el proyecto de investigación y se obtuvo el consentimiento de los participantes en la investigación una vez informados sobre los objetivos y el respeto de la privacidad y confidencialidad de los datos suministrados14.
En este estudio participaron en total 667 estudiantes de Medicina, de primero a décimo semestre, de dos universidades, una en Bogotá y otra en Bucaramanga. La edad de la población que participó estaba entre los 18 y los 34 (media, 20,9±2,7) años. En relación con el sexo, el 60,6% eran mujeres. Este grupo representa el 96,8% de las muestras participantes en los tres estudios anotados previamente, dado que se omitió a 22 participantes (3,2%) que no completaron la escala breve de Zung para ansiedad (EBZA) que se incluye en el presente análisis y mostró mejor consistencia interna que la WHO-5, tomada en los otros análisis para la validez divergente9–11.
Los participantes llenaron el cuestionario en el aula de clase y en presencia de un asistente de investigación, que presentó los objetivos del estudio, solicitó la participación voluntaria y dio instrucciones sobre el modo de completar el cuestionario de investigación. Este documento no solicitó el nombre de la persona, para que completarlo de manera anónima facilitara la respuesta más sincera posible. Este cuestionario solicitó información demográfica básica e incluyó EBZA15, la escala para actitud ante varones gais (ATG)16, y EHF-73.
La EBZA es un cuestionario breve autoaplicable que se compone de cinco preguntas que investigan síntomas como nerviosismo, temor sin razón aparente, dolores musculares, fatiga fácil y sensación de mareo en el periodo que abarca los últimos 30 días. La escala brinda cuatro opciones de respuesta que van desde nunca hasta siempre. La respuesta de la persona participante se califica de 1 a 4, con una gama de posibles puntuaciones totales entre 0 y 20; la mayor puntuación indica más y mayores síntomas de ansiedad que pueden tener importancia clínica. Esta escala se ha usado en diferentes investigaciones en Colombia y muestra alta consistencia interna15.
ATG es una escala de diez puntos que explora la actitud hacia los varones homosexuales en relación con diferentes tópicos como la adopción, el matrimonio, el trabajo y otras impresiones generales. El instrumento consta de un patrón de respuesta tipo Likert (politómico) con cinco opciones de respuesta desde «muy en desacuerdo» hasta «muy de acuerdo». A cada respuesta se da una puntuación de 0 a 4, un espectro posible entre 0 y 40. A mayor puntuación, la actitud hacia los varones gais es más desfavorable, con mayor prejuicio u homofobia16. La escala muestra buen desempeño psicométrico en la versión en español9,17,18.
Se calcularon los alfa de Cronbach (α)19 y omega de McDonald (Ω)20 como indicadores de confiabilidad. Para conocer la validez convergente y divergente se calculó la correlación de Pearson (r)21. Para la validez convergente se correlacionaron las puntuaciones totales en ATG y EHF-4, y para la validez divergente, entre EBZA y EHF-4.
Para la estimación o comprobación de la validez nomológica de la EHF-4, se compararon las medias±desviación estándar de las puntuaciones de varones y mujeres mediante la prueba de la t de Student (se esperaban puntuaciones significativamente mayores en los varones que en las mujeres).
Por último, para corroborar la dimensionalidad de la EHF-4 y la EHF-7, se llevó a cabo un análisis de factores por el método de máxima verosimilitud, se observaron las comuninalidades y se calcularon el coeficiente de Kayser-Meier-Olkin (KMO)22 y la prueba de esfericidad de la muestra de Bartlett23. Para el coeficiente KMO se esperó un valor > 0,600 y para la prueba de Bartlett, probabilidad < 0,0524.
El análisis factorial confirmatorio (AFC) se realizó para confirmar la estructura de factores previamente determinada en el AFE. Para evaluar el ajuste de los modelos en EHF-7 y EHF-4, se determinaron la prueba de la χ2, con los respectivos grados de libertad (gl) y valor de probabilidad (p), la raíz del cuadrada media del error de aproximación (RMSEA), con intervalo de confianza del 90% (IC90%) como se acostumbra, el índice comparativo de ajuste (CFI) y el índice de Tucker-Lewis (TLI). Para χ2 se espera que el valor de probabilidad sea > 5%; para RMSEA, < 0,06, y para CFI y TLI, valores > 0,89. La mayor parte de este análisis se realizó con el paquete estadístico SPSS 16.025, mientras que el AFC se completó con el programa Mplus 7.2126.
ResultadosLa EHF-7 mostró α=0,793 y Ω=0,796, y un factor principal explicó el 45,2% de la varianza total. En AFC se observaron χ2=139,756; gl=13; p<0,01; RMSEA=0,121; IC90%, 0,103-0,139; CFI=0,953; TLI=0,923).
Dados que esos hallazgos indicaban la eliminación de tres ítems, se probó el desempeño de una versión de cuatro ítems (EHF-4). La EHF-4 presentó α=0,770 y Ω=0,775, con un único factor que daba cuenta del 59,7% de la varianza total (χ2=3,622; gl=1; p=0,057; RMSEA=0,063; IC90%, 0,000-0,130; CFI=0,998; TLI=0,991). Los detalles sobre comunalidades y coeficientes de los ítems en el análisis de factores se muestran en la tabla 1.
Comunalidades y coeficientes de los ítems en el AFC
Ítems | EHF-7 (KMO=0,827) | EHF-4 (KMO=0,768) | ||
---|---|---|---|---|
Comunalidad | Coeficiente | Comunalidad | Coeficiente | |
1. Incomoda | 0,379 | 0,615 | 0,398 | 0,631 |
2. Honestos | 0,152 | 0,390 | ||
3. Corrompen | 0,424 | 0,651 | 0,436 | 0,660 |
4. Derecho | 0,343 | 0,586 | ||
5. Pecado | 0,458 | 0,676 | 0,507 | 0,709 |
6. Contribución | 0,275 | 0,524 | ||
7. Ilegal | 0,523 | 0,723 | 0,518 | 0,720 |
Valor propio | 3,164 | 2,388 | ||
Varianza total (%) | 45,2 | 59,9 |
Bartlett: EHF-7=1.187,525; gl=21; p<0,001; EHF-4=679,448; gl=6; p<0,001.
Para la validez nomológica de la EHF-4, se compararon media±desviación estándar de las puntuaciones de varones y mujeres (10,1±3,7 frente a 9,3±3,6). La diferencia fue estadísticamente significativa (prueba de Levene para homogeneidad de la varianza, F=0,004; p=0,949; t=2,499; gl=665; p=0,013, dos colas).
La validez convergente de la EHF-4 con ATG (α=0,821) mostró alta correlación (r=0,778; p<0,001). La validez divergente con EBZA (α=0,789) mostró una correlación muy pobre (r=–0,047; p=0,223).
DiscusiónLa presente investigación muestra que la EHF-7 y la EHF-4 son escalas con alta confiabilidad y adecuada validez; no obstante, la versión más corta explica mayor porcentaje de la varianza total, con mejores indicadores en el AFC.
La validación de instrumentos es una actividad necesaria para mejorar las mediciones de constructos, tanto en el contexto clínico como en trabajos de investigación12,27,28. Actualmente, la tendencia es la revisión permanente de las escalas ya disponibles, con la evaluación detenida del desempeño de ítems individuales y la eliminación de aquellos con pobres indicadores, para así reducir el número de ítems de las escalas sin pérdida en la confiabilidad, la validez y la utilidad práctica12,13,27,29,30.
Los instrumentos breves en los estudios clínicos y epidemiológicos tienen varias ventajas. La primera, desde la perspectiva psicométrica, es recoger o conservar los aspectos esenciales o estructurales del constructo que habitualmente se reúnen en el factor o la dimensión que explica el principal o mayor porcentaje de la varianza total24,31. La segunda, con el uso de estas versiones más breves se reduce la posibilidad de tener una sobrestimación de la confiabilidad, consistencia interna, por efecto del número de puntos en la escala, puesto que este tipo de coeficientes son sensibles al número de ítems. A mayor cantidad de ítems se observa mayor consistencia interna aun con una reducción significativa de la correlaciones entre los ítems, lo que es en buena medida un indicador de que los diferentes puntos se aproximan o intentan cuantificar el mismo constructo32,33. Y la tercera y última ventaja es más operativa. Un instrumento de medición debe ser práctico tanto para la aplicación como para la calificación e interpretación de las puntuaciones. Las escalas breves reducen la inversión de tiempo en el diligenciamiento, menos posibilidad de cansancio o aburrimiento que dan los cuestionarios extensos, lo que puede garantizar aún más las mayores validez y confiabilidad de la medición27.
Es necesario contar con instrumentos como la EHF-4, con buen desempeño psicométrico en estudiantes de Medicina, dada la alta frecuencia de prejuicio sexual en este grupo de personas34. Esto permitirá la realización de investigaciones que faciliten conocer la magnitud de la situación y tomar las medidas precisas y oportunas que reduzcan el impacto negativo de los prejuicios sexuales durante el proceso de formación y la práctica médica profesional35.
Se concluye que en estudiantes de Medicina de dos ciudades colombianas, la EHF-4ha presentado alta consistencia interna, buena validez convergente, adecuada validez divergente, excelente validez nomológica y una dimensión que explica más del 50% de la varianza total, con mejores indicadores en el ajuste del AFC que la EHF-7. Es preciso continuar las investigaciones que muestren el desempeño psicométrico de la EHF-4 y confirmen estas observaciones iniciales que se pueden tomar como preliminares.
Responsabilidades éticasProtección de personas y animalesLos autores declaran que los procedimientos seguidos se conformaron a las normas éticas del comité de experimentación humana responsable y de acuerdo con la Asociación Médica Mundial y la Declaración de Helsinki.
Confidencialidad de los datosLos autores declaran que han seguido los protocolos de su centro de trabajo sobre la publicación de datos de pacientes.
Derecho a la privacidad y consentimiento informadoLos autores han obtenido el consentimiento informado de los pacientes y/o sujetos referidos en el artículo. Este documento obra en poder del autor de correspondencia.
Conflicto de interesesLos autores declaran no tener ningún conflicto de intereses.
Al Dr. Miguel Ángel Simancas-Pallares, profesor de la Facultad de Odontología, Universidad de Cartagena, Colombia, por la amable colaboración en la realización del AFC, y al Instituto de Investigación del Comportamiento Humano (Human Behavioral Research Institute), Bogotá, Colombia, que financió este proyecto.