En la metodología cuantitativa aplicada a ciencias de la salud, las limitaciones inherentes a la prueba de significación de la hipótesis nula (NHST, por sus siglas en inglés) han llevado a generar propuestas alternativas ante tal situación. Uno de dichos avances son las medidas de magnitud del efecto (effect size, ES)1–3.
Concretamente, las ES cuantifican la presencia del fenómeno analizado. Por ejemplo, en el caso de la diferencia de medias entre grupos independientes usualmente evaluada con la t de Student, la d de Cohen (ES) cuantifica el tamaño de la diferencia (p. e., pequeña, mediana o grande)3; asimismo, la r de Pearson analizada como ES indica la fuerza de asociación. Por el contrario, con la NHST ambos procedimientos informarían solo si la diferencia de medias o la correlación son estadísticamente diferentes de cero, pero sin cuantificar su magnitud. En consecuencia, su elección, reporte e interpretación varía según el diseño de investigación empleado.
Esta aparente complejidad para seleccionar la ES idónea aunada a la cantidad de textos técnicos ajenos al investigador no familiarizado con terminología estadística y lo práctico que resulta el uso del NSHT (si el valor de p es menor que el error tipo I, se rechaza la hipótesis nula) debido a su cálculo automático por diversos paquetes estadísticos han repercutido en que las medidas de ES sean ignoradas y escasamente reportadas. Esta situación podría impactar de forma negativa en la interpretación de los resultados, incluso si las demás fases de la investigación fueron llevadas a cabo con prolijidad.
En tal sentido, el objetivo del presente texto es poner a disposición del usuario no especializado (lectores de artículos científicos, profesionales, investigadores aplicados y estudiantes) una guía breve que ayude a elegir la ES según el diseño de investigación empleado, además de proveer un módulo de cálculo en MS Excel® para cada ES solicitándolo sin costo vía correo electrónico. Los módulos calculan automáticamente la ES con solo brindar la información necesaria. Es decir, si se desea la d de Cohen, basta con colocar la media, desviación estándar y tamaño muestral por grupo. En cada una de las tablas (tablas 1–3) se indica qué información se requiere para cada ES (excepto para r, rs, β y R2, que son ES en sí mismas), así como se ofrecen referencias a algunos estudios que han empleado dicha ES.
ES para estudios comparativos
Se desea comparar… | ES | Información necesaria para su cálculo en el módulo | Está vinculado al procedimiento estadístico… | Puntos de corte sugeridos | |
---|---|---|---|---|---|
2 grupos | Proporciones10,11 | h | Proporciones | - | .20: pequeña, .50: mediana, .80: grande1 |
Probabilidad de ocurrencia de un evento12 | OR | Frecuencias | - | .1.68: pequeña, 3.47: moderada, .6.71: grande19 2.0: mínima necesaria, 3.0: moderada, 4.0: fuerte20 | |
Puntuaciones13,14 | d | M, DE y n | t de Student | .41: mínima necesaria, .1.15: moderada, 2.70: fuerte20 .20: pequeña, .50: mediana, .80: grande21 | |
rbis | Z, N | U de Mann-Whitney T de Wilcoxon | . 10: pequeña, .30: mediana, .50: grande22 | ||
Correlaciones15 | q | r | Coeficiente de correlación de Pearson | .10: pequeña, .30: mediana, .50: grande21 | |
>2 grupos | Puntuaciones globales16,17 | ω2 | M, DE y n | ANOVA | .01: pequeña, .06: mediana, .14: grande21 |
η2H | H y N | H de Kruskal-Wallis | .04: mínima necesaria, .25: moderada, .64: fuerte20 | ||
Análisis post-hoc16,18 | ω2comp | M, DE y n | ANOVA de una vía | .01: pequeña, .06: mediana, .14: grande21 .04: mínima necesaria, .25: moderada, .64: fuerte20 | |
rbisa | Z, N | U de Mann-Whitney T de Wilcoxon | . 10: pequeña, .30: mediana, .50: grande22 |
Nota: OR: Odds ratio; M: Media; DE: Desviación estándar; n: tamaño muestral por grupo; N: tamaño muestral total; rbis: correlación biserial; Z: estadístico estandarizado de la U de Mann-Whitney y T de Wilcoxon; r: Coeficiente de correlación de Pearson; H: H de Kruskal-Wallis; a: El único análisis post-hoc disponible para la H de Kruskal-Wallis se basa en diferencias críticas23, pero no es posible obtener una ES, por lo que se opta por la rbis.
ES para estudios con base en relaciones
Nivel de medición de las variables | ES | Información necesaria para su cálculo en el módulo | Puntos de corte sugeridos |
---|---|---|---|
CxCa | R24 | - | .10: pequeña, .30: mediana, .50: grande21 |
rs25 | - | .20: mínima necesaria, .50: moderada, .80: fuerte20 | |
OxO OxNo NoxNo | V26 | χ2, glmenor, N | glmenor=1 .10: pequeña, .30: mediana, .50: grande21 glmenor=2 .07: pequeña, .21: mediana, .35: grande21 glmenor=3 .06: pequeña, .17: mediana, .29: grande21 glmenor=4 .05: pequeña, .15: mediana, .25: grande21 |
Nota:C: Cuantitativa; O: Ordinal; No: Nominal;
ES para estudios con base en análisis de regresión
ES | Información necesaria para su cálculo en el módulo | Puntos de corte sugeridos | |
---|---|---|---|
Predictores27 | β | - | <.20: débil, entre .20 y .50: moderado, >.50: fuerte29 .20: mínima necesaria, .50: moderada, .80: fuerte20 |
f2 | R2 incluyendo el predictor y R2 sin incluir el predictor | .02: pequeña, .15: mediana, .35: grande21 | |
Modelo28 | R2 | - | .01: pequeña, .10: mediana, .25: grande21 .04: mínima necesaria, .25: moderada, .64: fuerte20 |
Nota: β: Coeficiente beta estandarizado; R2: varianza de la variable dependiente explicada por los predictores (se sugiere utilizar el estadístico ajustado).
Para comenzar, en cuanto a los estudios comparativos, se presentan las ES más frecuentes, así como los puntos de corte (PDC) para valorarlas (tabla 1). Respecto a los estudios que tienen como base la relación entre variables (p. e., correlaciones), se muestran los estadísticos según el nivel de medición y su respectiva ES y PDC (tabla 2). Finalmente, se exponen las medidas de ES vinculadas al análisis de regresión de uso más frecuente (tabla 3). Es necesario indicar que, con relación a rs, se proponen los mismos PDC de r debido a que hace poco se halló que las magnitudes de ambos coeficientes no difieren sustancialmente a través de diferentes condiciones4.
Para concluir, esta guía rápida no pretende sustituir el razonamiento tras la toma de decisiones, ya que existen muchos otros elementos que anteceden a lo presentado (p. e., la elección del diseño); por el contrario, se alienta al lector a un análisis exhaustivo de cada procedimiento presentado. Asimismo, los PDC presentados son referenciales5 y pueden diferir de aquellos obtenidos en otros estudios, pero que se encuentran circunscritos a un ámbito particular6. Con todo, resulta de suma utilidad contar con un documento didáctico que sintetice algunas recomendaciones para la elección de la ES con base en el diseño de investigación y, de este modo, implementarlo en algunos estudios publicados recientemente en Educación Médica7-9.
Conflicto de interesesEl autor declara no tener ningún conflicto de intereses.