Validar la escala de Autoestigma por Búsqueda de Ayuda (ABA), conocida en inglés como Self-Stigma of Seeking Help (SSOSH), en una población de estudiantes de una facultad de Medicina para su uso en Colombia.
MétodoSe incluyó a 384 estudiantes de Medicina de la ciudad de Medellín. Se realizaron 2 traducciones directas, 2 en sentido inverso y 1 prueba piloto. Luego se evaluó la consistencia interna, la reproducibilidad prueba-reprueba y la validez del constructo estructural, convergente, divergente y discriminativa.
ResultadosSe obtuvo una versión en español de fácil comprensión y diligenciamiento. La consistencia interna de la escala fue adecuada (alfa de Cronbach=0,80; IC95%, 0,77-0,83) al igual que la reproducibilidad prueba-reprueba (CCI=0,77; IC95%, 0,63-0,86). El análisis factorial confirmatorio mostró un buen ajuste con la estructura unidimensional (RMSEA=0,073; IC90%, 0,056-0,089; CFI=0,968; TLI=0,977; WRMR=0,844). La validez convergente se mantuvo con la correlación con las escalas de estigma público (ρ=0,39) y de actitudes hacia la búsqueda de ayuda (ρ=–0,50) y la validez divergente con la escala de deseabilidad social (ρ=–0,05). Al examinar la validez discriminativa, se encontraron diferencias significativas entre las puntuaciones de quienes estarían dispuestos a buscar ayuda profesional en caso de tener un problema de salud mental y quienes probablemente no lo harían (diferencia de medias, 4,9; IC95%, 2,99-6,83).
ConclusionesLa versión colombiana de la ABA es válida, confiable y útil para la medición del autoestigma asociado con la búsqueda de ayuda profesional en población universitaria del área de la salud de Colombia. Se debe investigar sus propiedades psicométricas en poblaciones de otros programas y no universitarias.
Validate the Self Stigma Of Seeking Help (SSOSH) scale in a population of students of a medical school for its use in Colombia.
MethodsWe included 384 medical students from the city of Medellín. Initially, two direct translations were made, two back translation and one pilot test. The internal consistency, test-retest repeatability and structural, convergent, divergent and discriminative construct validity were then evaluated.
ResultsA easy-to-understand and to fill out Spanish version was obtained. The internal consistency of the scale was adequate (Cronbach's alpha=.80; 95%CI, .77-.83) as well as the test-retest repeatability (CCI=.77; 95%CI, .63-.86). The Confirmatory Factor Analysis showed a good fit with the one-dimensional structure (RMSEA=.073; IC90%, .056-.089; CFI=.968; TLI=.977; WRMR=.844). The convergent validity was supported by the correlation with the Public Stigma scales (ρ=.39) and Attitudes towards Seeking Help (ρ= –0.50) and the divergent validity with the Social Desirability scale (ρ=–0,05). When examining the discriminative validity, differences were found between the scores of those who would be willing to seek professional help when having a mental health problem and those who probably would not (Difference of means=4.9; 95%CI, 2.99-6.83).
ConclusionsThe Colombian version of the SSOSH is valid, reliable and useful for the measurement of the Self-stigma associated with seeking professional help in the university population of the Colombian health sector. Its psychometric properties must be investigated in populations of other programs and outside universities.
El estigma se define como una característica desacreditadora que se produce cuando los atributos de alguien son incongruentes con nuestro estereotipo, haciéndolo parecer distinto e inferior1,2. Si el estigma se relaciona con creencias negativas acerca de tener trastornos mentales (TM) y buscar ayuda profesional, puede tener 2 formas: el estigma público, que es propio de grupos sociales, y el autoestigma, que es la interiorización de estas creencias y prejuicios por quien padece el trastorno3. El autoestigma por búsqueda de ayuda es la percepción de sí mismo que afecta a la autoestima y la autoeficacia si se solicita atención en salud mental4. Este tipo de estigma hace que no se busque tratamiento o se postergue, lo que produce efectos negativos en el pronóstico de los TM5,6. En Colombia, solo el 38% de los afectados por TM solicita atención en salud y el resto no lo hace debido principalmente a barreras actitudinales, entre ellas el autoestigma7–9.
Los problemas de salud mental son frecuentes en poblaciones de estudiantes universitarios en las cuales el autoestigma puede actuar como una barrera de acceso a los servicios de salud mental que se les ofrecen10–13. En unos estudios se ha señalado su rol como predictor de las actitudes hacia el tratamiento psicológico y su relación con una menor probabilidad de búsqueda de servicios4,13,14. En particular, en estudiantes de Medicina se han reportado una alta prevalencia de depresión y ansiedad y la exposición a fuentes de estrés como la adquisición de habilidades clínicas, las expectativas sociales, el sufrimiento y la muerte de pacientes, entre otras15–18. En un trabajo sobre el uso de servicios de salud mental, el 33,7% de los estudiantes de Medicina reportaron no buscar ayuda psicológica debido al posible impacto que este hecho tendría en su carrera profesional19. El 25,3% de los estudiantes asociaban el uso de servicios psicológicos con debilidad y un porcentaje similar mostró preocupación por lo que sus compañeros pudieran pensar de ellos19.
Es importante tener en cuenta este constructo y su relación con el comportamiento de búsqueda de ayuda en el diseño y la evaluación de programas de salud mental y bienestar, porque permitiría contar con un modelo más completo que aumentaría las posibilidades de éxito de las intervenciones para reducir la duración de los TM no tratados, lo cual tendría gran valor para la salud pública, ya que una atención oportuna mejora el pronóstico20. Por consiguiente, en Colombia se requiere un instrumento para medir el autoestigma relacionado con la búsqueda de ayuda profesional, ya que su investigación proporcionaría información nueva y relevante para la comprensión de las razones y actitudes por las cuales las personas autolimitan la búsqueda de ayuda y se privan de los efectos positivos de la atención en salud mental disponible. Además, se requiere la medición para la identificación de las manifestaciones del autoestigma, su distribución en la población y sus efectos en la calidad de vida de las personas.
La mayoría de los instrumentos de medición de estigma asociado con la búsqueda de ayuda disponibles se desarrollaron y validaron en muestras de estudiantes universitarios y se centran en la medición del estigma público, y no en el autoestigma21–26. La única escala de autoestigma relacionado con la búsqueda de ayuda que se identificó fue la desarrollada por Vogel en 2006: Autoestigma por búsqueda de ayuda (ABA), que es el nombre en español de la Self-Stigma of Seeking Help (SSOSH)4. Es una escala autoaplicable compuesta por 10 ítems que miden las preocupaciones sobre la pérdida de autoestima que una persona sentiría si decidiera buscar ayuda de un profesional en salud mental. La ABA fue construida bajo los supuestos de la Teoría Clásica del Test (TCT) y un modelo Reflexivo, ha sido traducida, validada y utilizada en varios países y, aunque en España existe una versión en castellano, esta carece de evidencia publicada de evaluación de propiedades psicométricas27.
Para que clínicos e investigadores puedan emplear la escala ABA en Colombia, es necesario realizar un proceso de adaptación y una evaluación de sus propiedades psicométricas para asegurar su validez, su confiabilidad y su utilidad28. El presente estudio tiene como objetivo traducir al español, adaptar a la cultura colombiana la escala ABA y evaluar las propiedades psicométricas de la nueva versión en una muestra estudiantes universitarios de una facultad de Medicina.
MétodosEl estudio tuvo 2 fases: a) traducción y adaptación, y b) evaluación de propiedades psicométricas. Se contó con la aprobación del Comité de Ética de la Facultad de Medicina de la Universidad de Antioquia.
Traducción y adaptaciónEl Dr. David L. Vogel, autor del SSOSH, dio su aval para la validación del instrumento en Colombia. Posteriormente, se conformó un Comité de Revisión de la Escala (CRE) integrado por un sociólogo, una psicóloga con experiencia en servicios de bienestar universitarios y tres médicos psiquiatras.
Dos traductores oficiales colombianos tradujeron independientemente el instrumento del inglés al español. Estos traductores hablaban español como lengua materna y uno de ellos era psicólogo. Luego el CRE realizó una síntesis en español de las traducciones directas. Después se realizaron dos traducciones en sentido inverso de esta síntesis, los traductores (distintos a los iniciales) no conocían las versiones originales de la escala en inglés. Finalmente, el CRE evaluó las dos traducciones y construyó una versión preliminar.
Una vez se terminó con el proceso de traducción, se llevó a cabo una prueba piloto en una muestra por conveniencia de 20 estudiantes de pregrado de la Facultad de Medicina. Se examinó la comprensibilidad y la interpretación de los ítems y categorías de respuesta con el fin de encontrar posibles confusiones u observaciones de la población blanco. Los ítems que mostraron algún tipo de dificultad fueron revisados y modificados nuevamente por el CRE hasta conformar la versión final.
Evaluación de propiedades psicométricasParticipantesParticiparon estudiantes de los programas de Medicina, Instrumentación Quirúrgica y Tecnología en Atención Prehospitalaria de la Facultad de Medicina de la Universidad de Antioquia (Medellín, Colombia). Los criterios de inclusión fueron ser mayor de 18 años, estar activo en el sistema académico y aceptar la participación.
Cada propiedad psicométrica requirió un cálculo de tamaño de muestra específico. Para consistencia interna se calculó un tamaño de muestra de 320 sujetos utilizando los criterios de estimación de tamaño de muestra propuestos por Streiner29. Se asumió un error de tipo I de 0,05, un valor del coeficiente de correlación alfa de Cronbach esperado de 0,7, una precisión del intervalo de confianza de 0,1 y una escala compuesta por 10 ítems. Este tamaño de muestra se utilizó también para la descripción de ítems y para la validez de constructo estructural teniendo en cuenta lo recomendado para análisis factorial confirmatorio30. Para la reproducibilidad prueba-reprueba, se calculó un tamaño de muestra de 50 empleando la fórmula de Giraudeau y Mary propuesta por de Vet28, con un error de tipo I de 0,05, una potencia de 0,80, un coeficiente de correlación intraclase (CCI) de 0,8 y una amplitud del intervalo de confianza de 0,1. Para la validez convergente y divergente, el tamaño de muestra se calculó usando la fórmula para correlación con un error de tipo I de 0,05, una potencia de 0,80, un coeficiente de correlación de Spearman de 0,5 en la hipótesis alterna y 0,1 en la hipótesis nula para un total de 65 y se aumentó un 10% por posibles eventualidades. La muestra fue de 72 sujetos. Para la validez discriminativa, el cálculo del tamaño de muestra se hizo con las recomendaciones de Machin et al.31, con la función para comparación de medias independientes con varianzas desconocidas pero iguales, empleando una diferencia de medias estandarizada esperada de 0,5, que sería un tamaño de efecto moderado según los criterios de Cohen32, un error de tipo I de 0,05 y una potencia de 0,80 para un total de 62, y al adicionar un 10% por posibles eventualidades, se obtuvo un tamaño de muestra de 69 participantes por grupo.
ProcedimientosLos datos de contacto de los estudiantes de pregrado de la Facultad de Medicina fueron suministrados por la oficina de Bienestar de la Universidad de Antioquia. Se envió una invitación formal por correo electrónico a todos los estudiantes activos en el segundo semestre de 2018 para que participaran voluntariamente en la investigación. El correo electrónico contenía, además de la invitación, un enlace a una página web que contenía el consentimiento informado y la política de protección de datos. Si el estudiante escogía la opción de participar voluntariamente en la investigación, accedía a los instrumentos del estudio para diligenciarlos. Los datos de todos los participantes se emplearon en la descripción de ítems y la evaluación de la consistencia interna y la validez de constructo estructural.
Se tomó una muestra aleatoria de 72 participantes para la evaluación de validez del constructo convergente y divergente. Estos diligenciaron además las escalas de estigma por recibir ayuda psicológica (ERAP), de actitudes hacia buscar ayuda profesional (S-ATSPPH-S) y de deseabilidad social (EDSCM).
Para la evaluación de la reproducibilidad prueba-reprueba, se seleccionó aleatoriamente una muestra de 50 sujetos, que realizaron una segunda aplicación de la ABA 15 días después, tiempo en el que no es probable que ocurran cambios significativos en el autoestigma y se evita el sesgo de memoria de los participantes.
Para la evaluación de la validez discriminativa, el formulario incluyó una pregunta dicotómica sobre la disposición a buscar ayuda psicológica en caso de sufrir problemas emocionales o psicológicos. Se seleccionó una muestra aleatoria de 69 participantes entre los que respondieron afirmativamente a la pregunta y 69 entre los que respondieron negativamente.
InstrumentosEscala de autoestigma por búsqueda de ayuda (ABA). Consta de 10 ítems consistentes en afirmaciones a las que se responde según el grado de acuerdo usando 5 opciones de respuesta tipo Likert: 1, muy en desacuerdo; 2, en desacuerdo; 3, ni de acuerdo ni en desacuerdo; 4, de acuerdo; 5, muy de acuerdo. La puntuación total se basa en la suma de las puntuaciones parciales de cada ítem y tiene un intervalo de 10 a 50 puntos. Puntuaciones altas indican mayor autoestigma. La escala ha exhibido una buena consistencia interna (alfa de Cronbach, 0,86-0,89) y una buena reproducibilidad prueba-reprueba (CCI=0,72). Mediante análisis factorial confirmatorio, los autores establecieron que el constructo de la escala estaba compuesto por un factor. Tiene validez de constructo sustentada en las correlaciones con las escalas de riesgos anticipados (DES), de estigma público (SSRPH), de actitudes hacia la búsqueda de ayuda (ATSPPH-S), de autoocultamiento (SCS), de deseabilidad social (MCSDS), de autoestima de Rossemberg (RSES) y de la lista de verificación de síntomas de Hopkins-21 (HSCL-21). Además, las puntuaciones de la ABA son significativamente diferentes entre quienes buscan servicios psicológicos y quienes no4.
Escala de estigma por recibir ayuda psicológica (ERAP). Versión en español de la escala Stigma Scale for Receiving Psychological Help (SSRPH). Consta de 5 ítems y tiene 4 categorías de respuesta: 0, muy en desacuerdo; 1, en desacuerdo; 2, de acuerdo, y 3, muy de acuerdo. Las puntuaciones altas indican mayor percepción del estigma público. Se ha reportado una adecuada consistencia interna (alfa de Cronbach, 0,72-0,76)4,25,33. El instrumento fue traducido y adaptado para Colombia por nuestro grupo de investigación y mostró un alfa de Cronbach de 0,72 (trabajo no publicado aún).
Escala corta de actitudes hacia buscar ayuda profesional (S-ATSPPH-S). Traducción al español de la escala de Attitudes Toward Seeking Professional Psychological Help (ATSPPH-S). Se compone de 10 ítems y 4 opciones de respuesta tipo Likert: 3, estoy en desacuerdo; 2, probablemente estoy de acuerdo; 1, probablemente no estoy de acuerdo, y 0, estoy en desacuerdo. Las puntuaciones más altas reflejan actitudes más positivas hacia la búsqueda de ayuda profesional. Fue validada en una población de hispanohablantes de Estados Unidos y tiene buena consistencia interna (alfa de Cronbach, 0,80-0,84)4,21,34.
Escala de deseabilidad social de Crowne y Marlowe (EDSCM). Traducción al español de la Marlowe-Crowne Social Desirability Scale (MCSDS). Mide el interés en la aprobación social del encuestado y consta de 33 ítems a los que se responde como verdadero o falso. Una puntuación alta indica interés en la aprobación social. Fue validada en Argentina y mostró una adecuada consistencia interna (alfa de Cronbach, 0,75-0,84)5.
Análisis estadísticoLas características sociodemográficas de la muestra se describen como frecuencias absolutas y relativas para las variables categóricas y como media± desviación estándar y mediana [intervalo intercuartílico] para las variables cuantitativas. Se determinó el porcentaje de puntuaciones perdidas y la distribución en la población de las categorías de respuesta. Se consideró efecto piso y efecto techo si más del 15% de los participantes alcanzaban la mínima o la máxima puntuación posible28.
Para la validez de constructo estructural, se evaluó el modelo de un único factor propuesto por los autores del instrumento original y por Acun, mediante análisis factorial confirmatorio (AFC) con el programa Mplus usando el método de estimación de mínimos cuadrados ponderados en diagonal (WLSMV), que es el recomendado para variables ordinales4,35–37. Se emplearon los siguientes estadísticos de bondad de ajuste: χ2 del ajuste general del modelo, RMSEA (Root Mean Square Error of Approximation), CFI (Comparative Fit Index), TLI (Tucker-Lewis Index) y WRMR (Weighted Root Mean Square Residual). El modelo se consideró aceptable si la χ2 tenía p> 0,05, RMSEA< 0,08, CFI y TLI ≥ 0,95 y WRMR< 0,9038.
La consistencia interna se evaluó mediante alfa de Cronbach con su respectivo intervalo de confianza del 95% (IC95%) para toda la escala y se consideró adecuado si tomaba valores entre 0,7 y 0,939.
Para la reproducibilidad prueba se estimó CCI con su IC95% y se consideró aceptable si era> 0,7. Además, se calculó el error estándar de medición y los límites de acuerdo de Bland y Altman28,40.
La validez de constructo se examinó calculando el coeficiente de correlación de Spearman (ρ). La convergente con la correlación entre las puntuaciones de la escala ABA y los de la S-ATSPPH-S (se esperaba ρ <–0,5) y la ERAP (se esperaba ρ> 0,4). La divergente, entre las puntuaciones de la ABA y la EDSCM (se esperaba ρ entre –0,2 y 0,2). Los puntos de corte para las hipótesis se establecieron teniendo en cuenta el estudio Vogel4.
Para la validez discriminativa, se compararon los grupos dispuestos y no dispuestos a pedir ayuda psicológica en caso de tener algún problema de salud mental, empleando la prueba de la t de Student de muestras independientes, ya que la prueba de Shapiro-Wilk mostró que la distribución de los datos fue normal (p=0,202). Se esperaba encontrar diferencias estadísticamente significativas entre las puntuaciones de los grupos comparados con p=0,05 y un tamaño de efecto moderado (d de Cohen=0,5)32.
Los análisis estadísticos se realizaron con el programa SPSS® de IBM versión 23, excepto el análisis de validez estructural.
ResultadosAdaptación lingüística y cultural de la escala SSOSHEl CRE decidió que el título de la escala sería «Escala de autoestigma por búsqueda de ayuda», ya que en los antecedentes es más frecuente encontrar el constructo denotado de esta forma27. Además, se estableció que la sigla ABA debía acompañar el título de la versión en español porque las siglas SSOSH tendrían una lectura e identificación más difícil.
El único ítem que suscitó discusión en el CRE fue el primero que estaba originalmente en inglés: «I would feel inadequate if I went to a therapist for psychological help». Se adaptó como «Me sentiría incompetente si fuera donde un terapeuta para obtener ayuda psicológica». Se tuvo en cuenta que «incompetent» en inglés es un sinónimo de la palabra «inadequate» y que la traducción «Me sentiría inadecuado» tendría poca comprensión en el español colombiano y no reflejaría bien el significado del ítem.
Prueba pilotoParticiparon 20 estudiantes, en su mayoría varones (65%), con una edad promedio de 26,5±2,9 años. Pertenecían a los programas de Medicina (60%), Instrumentación quirúrgica (35%) y Atención prehospitalaria (5%). Diligenciar la escala les tomó en promedio 4 min. Los participantes manifestaron falta de claridad en las instrucciones, específicamente en la frase «Por favor utilice la escala de 5 puntos para calificar el grado con el que cada ítem describe cómo usted podría reaccionar en dicha situación». Por lo que se cambió a: «Por favor señale el grado con el que cada ítem describe cómo usted podría reaccionar en dicha situación». Una vez hechos los ajustes, se obtuvo la versión final de la escala adaptada en español.
Evaluación de propiedades psicométricasParticipantesAunque la muestra calculada para la consistencia interna y la validez del constructo estructural fue de 320 estudiantes, fue posible incluir a 384: el 35,7% varones y el 64,3% mujeres, con edades entre 18 y 49 años —mediana, 21 [23-20] años—, la mayoría solteros (97,9%) y del programa académico de Medicina (89,8%) (tabla 1).
Características sociodemográficas de la muestra (n=384)
Variable | n | % |
---|---|---|
Sexo | ||
Varones | 137 | 35,7 |
Mujeres | 247 | 64,3 |
Estado civil | ||
Soltero | 376 | 97,9 |
Casado | 2 | 0,5 |
Unión Libre | 6 | 1,6 |
Programa académico | ||
Medicina | 345 | 89,8 |
Instrumentación quirúrgica | 26 | 6,8 |
Atención prehospitalaria | 13 | 3,4 |
Semestre académico | ||
≤ 5. | 143 | 37,2 |
6.o-10. | 160 | 41,7 |
11.o-13. | 79 | 20,6 |
La proporción de estudiantes que accedieron a participar en el estudio fue equivalente al 18,3%. Quienes no participaron eran el 50,5% varones, con edades entre 16 y 62 años —mediana, 22 [24-20] años—. El 45,4% estaba en los primeros 5 semestres; el 29,9%, entre el 6.o y el 10.o semestre, y el 24,7%, entre el 10.o y el 13.er semestre. Su distribución en los programas académicos fue: Medicina, 80,3%; Instrumentación quirúrgica, 14% y Atención prehospitalaria, 5,7%. Se encontraron diferencias entre los estudiantes que accedieron a participar en el presente estudio y los que no en cuanto a sexo (χ2=27,5; gl=1; p <0,001), programa académico (χ2=20,8; gl=2; p <0,001), semestre académico (χ2=20,6; gl=2; p <0,001) y edad (U de Mann-Whitney, p=0,046).
Descripción de los ítemsLos ítems con algún porcentaje de puntuaciones pérdidas fueron el ítem 3 (0,3%) y el ítem 7 (0,3%). Se usaron todas las opciones de respuesta y no se detectó homogeneidad en la distribución porcentual de la población en las categorías de respuestas en ninguno de los ítems (tabla 2). En cuanto a la distribución de las puntuaciones de la escala en la muestra, el 1,3% de los participantes obtuvieron la puntuación mínima y ningún participante obtuvo el máximo. La mediana de las puntuaciones totales fue de 22 [25-18] puntos. La puntuación mínima obtenida fue 10 y la máxima, 40.
Puntuaciones perdidas y distribución en la población de las categorías de respuesta por cada ítem (n=384)
Ítem | Contenido del ítem | Puntuación perdida (%) | Distribución de la población que responde (%) sobre las opciones de respuesta | ||||
---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | |||
1 | Me sentiría incompetente si fuera donde un terapeuta para obtener ayuda psicológica | 0,0 | 35,9 | 45,8 | 9,9 | 7,0 | 1,3 |
2 | La confianza en mí mismo NO se vería amenazada si llegara a buscar ayuda profesional | 0,0 | 3,9 | 16,4 | 13,5 | 36,5 | 29,7 |
3 | Buscar ayuda psicológica me haría sentir menos inteligente | 0,3 | 56,8 | 32,0 | 4,9 | 4,7 | 1,3 |
4 | Mi autoestima aumentaría si hablara con un terapeuta | 0,0 | 2,9 | 9,6 | 47,9 | 31,0 | 8,6 |
5 | La manera en que me percibo a mí mismo NO cambiaría solamente por decidir consultar a un terapeuta | 0,0 | 2,3 | 17,2 | 19,3 | 41,1 | 20,1 |
6 | Me haría sentir inferior pedir ayuda a un terapeuta | 0,0 | 48,2 | 38,3 | 6,3 | 6,5 | 0,8 |
7 | Me sentiría bien conmigo mismo si decidiera buscar ayuda profesional | 0,3 | 0,8 | 7,6 | 28,6 | 46,6 | 16,1 |
8 | Si fuera a un terapeuta, me sentiría menos satisfecho conmigo mismo | 0,0 | 32,0 | 50,5 | 9,6 | 7,0 | 0,8 |
9 | La confianza en mí mismo permanecería igual si yo buscara ayuda profesional para un problema que no pudiera resolver | 0,0 | 0,5 | 18,0 | 16,7 | 46,4 | 18,5 |
10 | Me sentiría peor conmigo mismo si no pudiera resolver mis propios problemas | 0,0 | 13,0 | 31,8 | 15,9 | 30,7 | 8,6 |
1: muy en desacuerdo; 2: en desacuerdo; 3: ni de acuerdo ni en desacuerdo; 4: de acuerdo; 5: muy de acuerdo.
La consistencia interna fue adecuada, con un alfa de Cronbach de 0,80 (IC95%, 0,77-0,83). Todas las correlaciones ítem-total estuvieron por encima de 0,3, excepto el ítem 4, cuya correlación fue de 0,2. Con respecto a la reproducibilidad prueba reprueba, el CCI fue de 0,77 (IC95%, 0,63-0,86) y el error estándar de medición fue de 2,7 puntos. La media de las diferencias de puntuaciones entre mediciones fue –0,2 puntos y los límites de acuerdo de Bland y Altman estuvieron entre –7,959 y 7,559 puntos (fig. 1).
Validez de constructoPara la evaluación de validez estructural, se excluyeron los casos con valores perdidos (0,5%). Inicialmente se evaluó la bondad de ajuste de 5 modelos unidimensionales. El primero fue el propuesto por Vogel et al.4 y el segundo fue el propuesto por Acun37, en el que se incluyeron las covariaciones entre los ítems 4 y 7. Ya que el primer modelo no mostró un ajuste adecuado, se revisaron los índices de modificación y se probaron 3 modelos adicionales que incluyeron las covariaciones de los ítems 5 y 8 (modelo 3), 5 y 8, y 1 y 8 (modelo 4) y 5 y 8, 1 y 8, y 6 y 10 (modelo 5) (tabla 3). Finalmente, el modelo 5 mostró el mejor ajuste: χ2=96,627; p <0,0001; RMSEA=0,073 (IC90%, 0,056-0,089); CFI=0,968; TLI=0,977 y WRMR=0,844 (fig. 2).
Indicadores de bondad de ajuste de análisis factorial confirmatorio
Modelo | χ2 | df | CFI | TLI | RMSEA | IC90% | WRMR |
---|---|---|---|---|---|---|---|
Un factor | 218,16* | 35 | 0,935 | 0,917 | 0,117 | 0,102- 0,132 | 1,317 |
Un factor, covariaciones entre los ítems 4 y 7 | 199,071* | 34 | 0,942 | 0,923 | 0,112 | 0,098-0,128 | 1,26 |
Un factor, covariaciones entre los ítems 5 y 8 | 139,167* | 34 | 0,963 | 0,951 | 0,090 | 0,075-0,106 | 1,033 |
Un factor, covariaciones entre los ítems 5 y 8, y 1 y 8 | 114,945* | 33 | 0,971 | 0,960 | 0,080 | 0,065-0,097 | 0,927 |
Un factor, covariaciones entre los ítems 5 y 8, 1 y 8, y 6 y 10 | 96,627* | 32 | 0,977 | 0,968 | 0,073 | 0,056-0,089 | 0,844 |
CFI: Comparative Fit Index; RMSEA: Root Mean Square Error of Approximation; TLI: Tucker-Lewis Index; WRMR: Weighted Root Mean Square Residual.
La escala mostró validez convergenteporque sus puntuaciones se correlacionaron positivamente con la ERAP (ρ=0,39; p <0,001) y negativamente con la S-ATSPPH-S (ρ=–0,50; p <0,001). Además, se encontró que las puntuaciones de la escala ABA tenían una correlación baja y no significativa con la EDSCM (ρ=–0,05; p=0,323), lo cual fue evidencia de validez divergente.
En cuanto a la validez discriminativa, se observaron diferencias en las medias de las puntuaciones de la ABA entre aquellos con y sin una disposición positiva hacia la búsqueda de ayuda (t de Student=5,067; p <0,001). El grupo con una disposición positiva tuvo una media de 20,7±5,4 puntos, mientras en aquellos con una disposición negativa fue de 25,6±5,9 (diferencia de medias, 4,9; IC95%, 2,99-6,83; d=0,86; IC95%, 0,51-1,21) (fig. 3).
DiscusiónEste estudio evaluó la validez y la confiabilidad de la escala ABA para su uso en Colombia. La escala ABA mide el impacto psicológico de interiorizar un estigma asociado con la búsqueda de tratamiento profesional en salud mental en poblaciones de universitarios. Es una escala corta y de rápido diligenciamiento que, al estar validada, contribuirá a la investigación y la generación de intervenciones basadas en la evidencia41.
En general, los resultados de la evaluación de propiedades psicométricas fueron satisfactorios. La descripción de las puntuaciones en los ítems mostró un porcentaje de pérdidas <3% en todos los ítems, lo que es aceptable e indica que fueron comprensibles y pertinentes para casi toda la muestra. La distribución de las puntuaciones en las categorías de respuesta mostró que todas las opciones de respuesta fueron informativas y tenían cualidades discriminativas. Además, no se encontró presencia de efecto piso o techo en la distribución de las puntuaciones.
La consistencia interna de la escala ABA indica un alto grado de interrelación entre los ítems y la homogeneidad de la medida. El alfa de Cronbach encontrado fue cercano al reportado por los estudios previos4,33,36,42,43. No obstante, difiere del alfa de Cronbach de 0,71 reportado por Acun37. Esto se debe, probablemente, a la utilización de un número menor de ítems por parte de este autor, lo cual se sabe que puede disminuir el valor del alfa de Cronbach28. En este caso, Acun utilizó solo 9 de los 10 ítems definitivos de la SSOSH en inglés, argumentando una baja carga factorial del ítem 10.
Los resultados del análisis de reproducibilidad prueba-reprueba indican que las puntuaciones de la escala en la muestra son estables a través del tiempo. Podemos confiar que el 77% de la varianza total entre las mediciones corresponde a verdaderas diferencias de las puntaciones obtenidas de los participantes, y la variabilidad restante puede atribuirse a errores de medición. El CCI calculado fue similar al encontrado en el estudio de validación de la escala en Estados Unidos (0,72)4. Por otra parte, un error estándar de medición de 2,7 puntos es aceptable, mostrando un grado de precisión muy favorable si se compara con el intervalo de puntuaciones que va de 10 a 50 puntos. En los límites de acuerdo de Blant y Altman no se evidenciaron errores sistemáticos de medición entre las aplicaciones, lo cual aporta mayor evidencia sobre la confiabilidad de las puntuaciones.
El AFC permitió establecer que los datos recolectados en la muestra empírica en Colombia se ajustan bien al modelo teórico unidimensional propuesto por los desarrolladores de la escala. A diferencia de los trabajos previos que realizaron un AFC con el método de máxima verosimilitud4,36, el presente estudio utilizó el método de mínimos cuadrados ponderados en diagonal (WLSMV) para la estimación de los estadísticos de bondad de ajuste por considerarlo más robusto y apropiado para la escala ABA, que tiene ítems con un nivel medición ordinal35. Por otra parte, los índices de modificación del AFC condujeron al examen del Modelo 5, el cual presentó el mejor ajuste mostrando una covariación entre los ítems 5 y 8, 1 y 8, y 6 y 10. Estas covarianzas se pueden deber a la similitud en la redacción de los contenidos de los ítems. Se debe agregar que nuestro resultado contrasta con lo hallado en un estudio de validación de la escala en Turquía, donde observaron que el modelo fue de 2 dimensiones44; sin embargo, no fue la misma escala porque emplearon la versión de 23 ítems que provienen del estudio de construcción de la escala original.
Con respecto a la validez de constructo convergente, se esperaba que quienes son más susceptibles a las percepciones de estigma público por recibir ayuda psicológica tendieran a una mayor interiorización del estigma45,46. La correlación moderada positiva con una escala de estigma público está a favor de la validez de la ABA. En el estudio de validación de la escala en Estados Unidos, también se reportó una correlación moderada y positiva entre estos 2 constructos en 2 muestras diferentes (ρ=0,48 y ρ=0,46)4. También está a favor de la validez, la correlación moderada y negativa de la ABA con la medida de actitudes hacia la búsqueda de ayuda; es decir, a mayor experimentación de autoestigma, se producirían actitudes más negativas hacia la búsqueda de ayuda en salud mental. Este hallazgo es coherente con la teoría existente que señala que la búsqueda de tratamiento psicológico requiere que los individuos sientan simpatía por sí mismos y se sientan merecedores de recibir ayuda47. La interiorización del estigma deteriora la autoestima del individuo, lo cual repercute en una menor simpatía por sí mismo y en actitudes más negativas sobre la búsqueda de ayuda33. Esto es afín con la validación original de la escala, en la que se observaron correlaciones moderadas y negativas entre la ABA y la ATSPPH-S en 2 muestras (ρ=–0,53 y ρ=–0,63)4.
La falta de asociación significativa con la medida de deseabilidad social apoya la noción de que la escala de autoestigma asociado con la búsqueda de ayuda mide la interiorización del estigma de búsqueda de ayuda psicológica, y no la conveniencia social de las reacciones del individuo hacia posibles escenarios de padecimientos de problemas en salud mental y comportamiento de búsqueda de ayuda. En el estudio, la medida de autoestigma no se correlacionó con la escala de deseabilidad social, lo cual respalda la validez de constructo tipo divergente de la escala. La validación de la escala original reportó una correlación negativa no significativa de –0,13 entre estas 2 medidas4.
Las diferencias encontradas con un alto tamaño de efecto entre quienes manifiestan positivamente la intención de buscar ayuda en caso de padecer un problema de salud mental y quienes no respalda la validez discriminativa de las puntuaciones de la escala, es decir, la capacidad de distinción a través de las puntuaciones entre grupos relevantes con respecto al constructo. Quienes tenían una disposición negativa hacia la búsqueda de ayuda obtuvieron las puntuaciones más altas en la medida de autoestigma. Sin embargo, estos resultados deben interpretarse con prudencia, ya que lo más probable es que en el momento de la evaluación la mayoría de los participantes no tuvieran problemas significativos de salud mental. Por lo tanto, la disposición hacia la búsqueda de ayuda reportada podría no ser un predictor confiable de que realmente se consulte a un profesional en el momento de necesitarlo.
Algunas de las limitaciones del presente estudio tienen que ver con la autoselección de los participantes de la muestra, ya que la variabilidad de la muestra podría ser diferente que en la población objetivo y esto afectaría a la confiabilidad observada29.
Otra limitación es que las escalas S-ATSPPH-S y EDSCM, utilizadas para la evaluación de validez convergente y divergente, no están validadas en Colombia. Sin embargo, se emplearon las versiones en español de estos instrumentos, que fueron validadas en poblaciones hispanohablantes de estudiantes universitarios de Estados Unidos y Argentina, donde mostraron adecuadas propiedades psicométricas34,48. La decisión de utilizar los instrumentos mencionados se debe a la necesidad de obtener información nueva acerca de la consistencia entre las puntuaciones de la escala ABA y el modelo conceptual del constructo. Si bien esta información no se obtuvo en condiciones ideales, es un punto de partida para posteriores refinamientos de la evidencia aportada teniendo en cuenta el carácter continuo de los procesos de validación.
Es importante tener en cuenta que esta validación de la ABA se hizo en estudiantes de programas de ciencias de la salud y podría pensarse que las propiedades psicométricas no se puedan generalizar a otras poblaciones de universitarios. Esto se ha considerado porque se puede suponer que tendrían mayor homogeneidad en el constructo autoestigma por búsqueda de ayuda al estar sensibilizados a los problemas de salud mental y por esto tener menor tendencia a estigmatizar tanto el padecimiento como la búsqueda de tratamiento. Sin embargo, también podría esperarse lo contrario: personas que están siendo entrenadas para ayudar a otros pueden autoestigmatizarse si buscan atención porque creen, por ejemplo, que deberían ser capaces de resolver sus problemas por sí mismos, que se pondría en duda su idoneidad, etc.17,49. Además, hay evidencia de que los estudiantes de medicina con TM tienen un poco acceso a los servicios de salud mental que se ofrecen en universidades y que aproximadamente un tercio no busca ayuda por creer que significaría debilidad y les preocupa el impacto que este hecho tendría en su carrera profesional19. Por lo tanto, no tenemos certeza de que esta sea una población cuya homogeneidad sea tan alta que se alteren significativamente las propiedades psicométricas. También, la generalización de la medida para otras poblaciones no universitarias es una limitación, pues se desconocen las propiedades psicométricas de las puntuaciones de la escala en poblaciones con diferentes nivel educativo, ingreso o gravedad del problema de salud mental.
Es necesario que futuras investigaciones realicen el proceso de evaluación de sensibilidad al cambio por las puntuaciones de la medida. También se debería examinar la capacidad discriminativa de la escala entre grupos que efectivamente han buscado ayuda profesional en el pasado y quienes no, mejor aún, a través de un seguimiento prospectivo sobre este comportamiento. Además, en un futuro se harán estudios evaluando diferencias en el funcionamiento de los ítems y otras propiedades psicométricas entre poblaciones provenientes de distintas facultades y programas universitarios.
ConclusionesLa escala ABA es una medida útil, válida y confiable para investigar el autoestigma por búsqueda de ayuda en poblaciones universitarias del área de la salud en Colombia. Aunque se requiere mayor conocimiento de su sensibilidad al cambio y sus propiedades psicométricas en contextos diferentes, puede utilizarse para la medición de este constructo como paso inicial del estudio de la búsqueda y el acceso a los servicios de salud mental en universitarios.
Conflicto de interesesLos autores no declaran tener conflictos de intereses con el tema de investigación.
A la Oficina de Bienestar Universitario de la Facultad de Medicina de la Universidad de Antioquia, como también a los estudiantes de pregrado que participaron en el presente estudio.
Este artículo hace parte de la tesis académica para obtener el título de Magister en Salud Mental por parte de la Universidad Antioquia.