La validación de versiones breves de instrumentos de evaluación en salud mental, implica nuevos retos respecto al proceso de su elaboración y obtención de evidencias de validez. Las versiones breves son importantes aliados para la práctica profesional cuando los recursos y el tiempo para evaluar con un test completo son limitados1, porque prescinden de ítems redundantes, reducen la fatiga, frustración y aburrimiento de responder repetidamente ítems muy parecidos2. En ese sentido, consideramos valioso el estudio de García-Portilla et al.3, porque la evaluación de la capacidad funcional a través de la versión breve del UPSA abre las posibilidades de incorporarlo en la evaluación de programas de intervención. No obstante, creemos que la obtención de evidencias de validez fue realizada omitiendo aspectos metodológicos importantes, lo que pondría en cuestionamiento los cálculos realizados considerando los puntajes de la versión breve y las conclusiones de los autores.
En el estudio, para la obtención de evidencias de validez de constructo se correlacionó la versión completa del UPSA con su versión breve (Sp-UPSA y Sp-UPSA-Brief, respectivamente), lo cual tiene coherencia ya que se espera una elevada correlación entre ellas al cuantificar un mismo constructo, pero la Sp-UPSA-Brief tiene ítems en común con Sp-UPSA que incrementan espuriamente la correlación. Para atenuar este efecto, existe un procedimiento que permite realizar una corrección por errores correlacionados a fin de lograr una estimación más precisa de tal asociación4,5. Dicho procedimiento se refleja en la siguiente expresión matemática:
Donde, rtb′ es la correlación corregida entre la versión completa y breve; rtb, la correlación original entre la versión completa y breve; rxx, la confiabilidad por consistencia interna de la versión breve; σb, la desviación estándar (DE) de la versión breve; y σt, es la DE de la versión completa. Sin embargo, en el manuscrito no figura la DE de la puntuación total de la versión completa, necesaria para dicho procedimiento. Por este motivo, se calculó la media y DE del puntaje total usando los datos reportados en la validación de la versión completa realizada por García-Portilla et al.6, lo cual pudo ser realizado debido a que utilizaron la misma muestra para ambos estudios. Específicamente, se consideró una media total (sumatoria de la medias de cada subescala por separado) y a partir de los coeficientes de variación se calculó una DE total de 18,10; 12,78 y 5,90 para los grupos de Pacientes con esquizofrenia, Pacientes con trastorno bipolar y Controles sanos, respectivamente. Los resultados hallados para los 3 grupos se sintetizan en la tabla 1.
Correlación entre versión completa y breve del Sp-UPSA
Pacientes con esquizofrenia (n=139) | Pacientes con trastorno bipolar (n=57) | Controles sanos (n=31) | |
---|---|---|---|
σt | 18,10 | 12,78 | 5,90 |
σb | 21,89 | 18,41 | 8,13 |
rxx | 0,78 | 0,64 | 0,44 |
Correlaciones no corregidas | |||
rtb (IC 95%) | 0,93 (0,903-0,950) | 0,92 (0,867-0,952) | 0,90 (0,801-0,951) |
Porcentaje de varianza compartida | 86,5 | 84,6 | 81 |
Correlaciones corregidas | |||
rtb′ (IC 95%) | 0,664 (0,559-0,748) | 0,401 (0,157-0,599) | 0,128 (−0,237-0,461) |
Porcentaje de varianza compartida | 44,1 | 16,11 | 0,016 |
Porcentaje de cambio rtb/rtb′ | 28,61 | 56,37 | 85,74 |
Los hallazgos indican que al corregir por espuriedad las correlaciones iniciales, se debería reinterpretar los estadísticos y modificar las conclusiones, pues ocurrieron cambios en la magnitud de las correlaciones y en la significación estadística, agregando además que el porcentaje de cambio observado en las correlaciones fue elevado. Cabe mencionar que los coeficientes de confiabilidad α están por debajo del mínimo aceptado como adecuado (>0,70)7, lo cual pudo afectar los cálculos considerando el monto de error de medición existente en sus puntajes.
Por todo ello, los resultados reportados por García-Portilla et al. con respecto a la validez de constructo del Sp-UPSA-Brief resultan cuestionables debido a la falta de equivalencia empírica entre la versión completa y la versión breve, además, el elevado error de medición que presentan sus puntajes8. A esto se suma que ambas versiones del Sp-UPSA se usan principalmente en el ámbito clínico, y por ello pueden considerarse como «test de alto riesgo» debido a que proporciona mediciones con consecuencias directas importantes para los examinados, los programas o las instituciones implicadas en la evaluación9. Del mismo modo, se cuestionaría también el uso del instrumento, incluso para fines de investigación.
Finalmente, queda claro que se debería atenuar el impacto de los ítems comunes cuando se investiga la equivalencia entre versiones breves y completas de un instrumento de evaluación, ya que de ese modo se cumple el primer paso para validar un instrumento breve antes de correlaciones con otros criterios relevantes, y se utilice para dar conclusiones robustas respecto al constructo evaluado.