Recientemente, Caqueo-Urízar et al.1 expusieron sus hallazgos sobre la experiencia de sobrecarga entre 2 grupos culturalmente diferentes (aymaras vs no aymaras), valorados por un eficaz instrumento de evaluación de esta experiencia psicológica2. Sus resultados indicaron diferencias entre los grupos comparados que convergieron con la literatura respecto a la influencia de la experiencia de sobrecarga en grupos con menor influencia de la cultura occidental y pobre nivel educativo. Pero sus análisis enfatizaron únicamente métodos estadísticos que contrastaron la hipótesis nula de igualdad de medias, concluyendo que algunos aspectos de la sobrecarga fueron valorados como estadísticamente significativos. Lo que no tuvieron en cuenta es la magnitud de las diferencias3 para la interpretación de sus resultados cuantitativos. Afortunadamente, Caqueo-Urízar et al. reportaron los estadísticos necesarios para obtener directamente las estimaciones de magnitud de las diferencias (media y la desviación estándar de cada grupo). Con esta información elaboramos la tabla 1, donde aparecen 2 indicadores de magnitud de las diferencias: la diferencia estandarizada d (Cohen, 1988), junto a sus intervalos de confianza y la corrección por el sesgo de muestras pequeñas3, y Common Language (CL)3, que informa el grado de solapamiento entre 2 distribuciones. La previa asunción para interpretar apropiadamente estos indicadores es que las puntuaciones tienen distribución normal.
Estimaciones de magnitud del efecto para el estudio de Caqueo-Urízar et al.
Puntuaciones Zarit | d Cohen | CL | ||
d | d corregido | IC 95% | ||
Sobrecarga | 0,609 | 0,598 | –0,06-1,26 | 65,4% |
Rechazo | 0,612 | 0,601 | –0,06-1,26 | 69,9% |
Incompetencia | 0,792 | 0,778 | 0,11-1,45 | 70,7% |
Total | 0,743 | 0,730 | 0,06-1,39 | 68,9% |
CL: estimador Common Language.
Desde esta perspectiva, se observan interpretaciones no sugeridas directamente por los estadísticos de prueba de hipótesis usados en el estudio. Primero, aun cuando se observaron diferencias que no son estadísticamente significativas (p>0,05), todas las diferencias estandarizadas pueden considerarse moderadas, según las sugerencias habituales (≤0,19: trivial; entre 0,20 y 0,49: pequeño; entre 0,50 y 0,79: moderado, ≥0,80: grande3). Segundo, la variación de las diferencias es bastante amplia (usando el intervalo de confianza), sugiriendo que se pueden encontrar entre los grupos diferencias estandarizadas desde d=0,0 o menos (efecto trivial) hasta diferencias muy grandes (alrededor de d=1,35), al menos para las subescalas Sobrecarga y Rechazo. Tercero, en todas las puntuaciones, el porcentaje estimado de hallar sujetos aymaras experimentando más sobrecarga en comparación con sujetos no aymaras varía entre 65% (CL en la puntuación Sobrecarga) y 70% (CL en la puntuación Incompetencia).
Las diferencias no significativas y la magnitud de las diferencias estandarizadas pueden ser en parte un artefacto estadístico del sesgo ocurrido por pequeño tamaño muestral usado en el estudio3, y esto debe balancear las conclusiones que Caqueo-Urízar et al. hicieron sobre los resultados estadísticamente no significativos.
Analizar los resultados de Caqueo-Urízar desde las estimaciones de magnitud de las diferencias pone en relevancia que la hipótesis nula de igualdad de medias no es información cuantitativa suficiente aun cuando los resultados no muestren significación estadística3. Esta metodología de obtener la cuantificación de las diferencias ayudaría a la mejor comprensión de los resultados cuando se comparan grupos.