adaptar, validar y evaluar la invarianza factorial de una escala para evaluar la calidad de los cursos virtuales (CCV) desarrollados para estudiantes de ciencias de la salud (ECS).
Métodosestudio transversal desarrollado con encuestas virtuales a ECS para evaluar la CCV del año académico 2020, así como características sociodemográficas y educativas. La validez, basada en el contenido, se estimó con la VAiken. La validez basada en la estructura interna se evaluó con los índices de bondad de ajuste (IBA) en el análisis factorial confirmatorio (AFC), considerando adecuado el índice de ajuste comparativo (CFI) y el índice de Tucker-Lewis (TLI) mayor a 0,90; así como valores de la raíz residual estandarizada cuadrática media (SRMR) y el error cuadrático medio de aproximación (RMSEA) menores a 0,08. La invarianza factorial se consideró adecuada cuando la ΔCFI≤0,010 y la ΔRMSEA≤0,015 entre modelos en distintos niveles. La confiabilidad se evaluó con el índice alfa y omega.
Resultadosde los 629 ECS incluidos, el 62,96% eran mujeres, el 49,76% estudiaba medicina humana y 316 otras áreas de la salud. La VAiken fue de 0,86 en el instrumento. El AFC mostró IBA adecuados (CFI = 0,956; TLI = 0,950; RMSEA = 0,073 y SRMR = 0,044). Se estimo la ΔCFI (≤0,002) y la ΔRMSEA (≤0,004) entre los modelos para las características evaluadas (sexo, lugar de residencia, carrera de estudio, etapa de formación y tipo de gestión universitaria). Los índices de confiabilidad fueron mayores a 0,85 en los dominios.
Conclusiónla escala de 30 ítems y 6 dominios para evaluar la CCV desarrollados para ECS en Perú mostró adecuadas evidencias de validez y confiabilidad. Además, demostró una adecuada invarianza factorial en diferentes contextos sociodemográficos y educativos de los ECS.
To adapt, validate and evaluate the factorial invariance of a scale that assess the quality of virtual courses (QVC) among health sciences students (HSS).
MethodsCross-sectional study developed with virtual surveys to HSS to assess the QVC of the 2020 academic year, as well as sociodemographic and educational characteristics. Content-based validity was estimated with VAiken. Validity based on internal structure was assessed with the Goodness of Fit Indices (GFI) in the Confirmatory Factor Analysis (CFA), considering adequate the comparative fit index (CFI) and the Tucker-Lewis index (TLI) greater than 0.90, as well as values of the standardized root mean square residual (SRMR) and root mean square error of approximation (RMSEA) less than 0.08. Factor invariance was considered adequate when the ΔCFI≤0.010 and the ΔRMSEA≤0.015 between models at different levels. Reliability was assessed with the alpha and omega index.
ResultsOf the 629 HSS included, 62.96% were women, 49.76% studied human medicine and 316 other health areas. The VAiken was 0.86 on the instrument. The CFA showed adequate GFI (CFI = 0.956, TLI = 0.950, RMSEA = 0.073 and SRMR = 0.044). The ΔCFI (≤0.002) and ΔRMSEA (≤0.004) between models were estimated for the characteristics evaluated (sex, place of residence, study career, stage of training and type of university management). Reliability indices were greater than 0.85 in the domains.
ConclusionThe 30-item scale and six domains to assess QVC developed for HSS in Peru showed adequate evidence of validity and reliability. In addition, it showed adequate factorial invariance in different sociodemographic and educational contexts of HSS.
Los cursos virtuales se integraron gradualmente en la educación universitaria, pero la pandemia por la COVID-19 aceleró la migración completa hacia entornos digitales1,2. Aunque la recepción inicial fue positiva en los estudiantes, muchos cursos virtuales carecían de un adecuado diseño o directrices específicas para abordar las necesidades educativas3, lo que afectó a los estudiantes de ciencias de la salud por la interrupción de su formación en centros de salud, laboratorios y comunidades, con repercusiones en sus conocimientos y habilidades ante una formación exclusivamente virtual4.
En Perú, la pandemia evidenció la necesidad de mejorar la formación de los profesionales de la salud5. Para continuar con la formación de profesionales, las facultades de ciencias de la salud se adaptaron a entornos digitales, aunque solo el 27% de las universidades peruanas tenían autorización para ofrecer programas semipresenciales antes de la pandemia, lo que limitó la experiencia en el desarrollo de cursos virtuales6,7. Además, las desigualdades en el acceso a Internet, la falta de recursos tecnológicos y el desconocimiento de plataformas virtuales dificultaron la implementación8.
Aunque existen recomendaciones para el desarrollo de cursos virtuales9, muchas facultades de ciencias de la salud no han evaluado los cursos virtuales implementados10. Por ello, el objetivo de esta investigación fue adaptar culturalmente y abordar la validez e invarianza factorial de una escala que permite evaluar la calidad de los cursos virtuales desarrollados para estudiantes de ciencias de la salud en Perú durante la pandemia de COVID-19.
Materiales y métodosDiseño de investigaciónEstudio transversal enfocado en la adaptación y validación de una escala creada para evaluar la calidad de cursos virtuales en la Universidad Nacional de Educación a Distancia (UNED) en España11, con el propósito de aplicarla a estudiantes de ciencias de la salud en Perú, uno de los países más afectados por la COVID-19 en el mundo, que tiene a Lima como la capital del país, donde se aglomeran la mayoría de las facultades de ciencias de la salud12. El estudio se dividió en 3 fases para abordar la adaptación del instrumento, validación de la escala y evaluación de la invarianza factorial.
Población de estudioSe aplicó una encuesta virtual a estudiantes universitarios peruanos con 18 o más años en diferentes profesiones de la salud (enfermería, farmacia y bioquímica, medicina humana, nutrición, obstetricia, odontología, psicología y tecnología médica). La encuesta evaluó la percepción de la calidad de los cursos virtuales del año académico 2020, desarrollados íntegramente con entornos virtuales debido a la pandemia. Además, se excluyeron estudiantes de ciencias de la salud que desarrollaron estos cursos sin aulas virtuales, aquellos que no completaron toda la encuesta o no se matricularon en todos los ciclos y cursos correspondientes al año académico evaluado.
Adaptación del instrumentoEl proceso de adaptación al contexto peruano se realizó mediante la metodología Delphi, con un comité de 5 investigadores: 2 con experiencia en validación, 2 en educación médica y uno en docencia en escuelas de medicina. Los ítems de la versión adaptada fueron revisados en 2 rondas para evaluar su validez de contenido en 6 dominios: calidad general, metodología didáctica, diseño y navegación en la plataforma virtual, recursos multimedia y materiales académicos. La validez basada en el contenido se estimó con la V de Aiken, considerando adecuado un valor superior a 0,7013.
Prueba pilotoDespués de la evaluación del contenido, se obtuvo una versión adaptada del instrumento y se realizaron pruebas piloto con estudiantes de Medicina Humana para evaluar la claridad de las preguntas y su aplicabilidad. Además, se incluyeron preguntas sobre características específicas de los estudiantes. Con base en los comentarios recibidos, se revisaron los ítems que culminó en una versión de 32 ítems, agregando los ítems 1 y 9.
Recolección de datosLos datos se recopilaron con una encuesta virtual (https://is.gd/Calidad20) utilizando el software Research Electronic Data Capture (o REDCap), desde julio hasta diciembre de 2021, a través de redes sociales (Facebook, WhatsApp, Twitter e Instagram). Así se utilizó la escala para evaluar la calidad de los cursos virtuales que medía el grado de acuerdo del participante con los enunciados, utilizando un formato de respuesta en escala de Likert entre 1 (totalmente en desacuerdo), 2 (en desacuerdo), 3 (ni de acuerdo o en desacuerdo), 4 (de acuerdo) y 5 (totalmente de acuerdo).
Análisis estadísticoEl análisis estadístico se realizó en R Studio versión 4.2.2 con los paquetes «tableone», «psych», «lavaan», «semTools» y «semPlot». De esta forma, en el análisis descriptivo, se utilizaron medidas de tendencia central (media) y dispersión (desviación estándar) para las variables numéricas, además de medidas de resumen (frecuencia y porcentaje) para las variables categóricas. Se evaluó si el número de encuestados era suficiente con la estimación del error estándar relativo (ESR), considerado adecuada la cantidad de encuestados cuando el ESR era menor a 20%14. La adecuación de la muestra para el análisis factorial se evaluó con índices de Kaiser-Meyer-Olkin mayores a 0,7015.
La validez basada en la estructura interna se evaluó con el análisis factorial confirmatorio (AFC) utilizando el estimador de mínimos cuadrados ponderados con la media y varianza ajustada (WLSM en inglés). Los modelos se evaluaron con índices de bondad de ajuste (IBA) como el chi-cuadrado (χ2) con sus grados de libertad (GL), el índice de ajuste comparativo (CFI), el índice de Tucker-Lewis (TLI), la raíz residual estandarizada cuadrática media (SRMR) y el error cuadrático medio de aproximación (RMSEA). Se consideró un buen ajuste con CFI y TLI mayor a 0,90, además del RMSEA y SRMR menor a 0,0816,17.
La invarianza factorial se evaluó siguiendo el enfoque de Svetina et al.18, utilizando la estimación de máxima verosimilitud para escalas ordinales. El análisis se estructuró en 3 niveles de modelos: el modelo base o configuracional (M1), que establece la estructura factorial inicial; el modelo métrico (M2), que evalúa la equivalencia de las cargas factoriales; y el modelo escalar (M3), que analiza la equivalencia de las cargas factoriales e interceptos. La invarianza factorial se consideró adecuada con ΔCFI menor a 0,010 y ΔRMSEA menor a 0,01519.
La evaluación de la confiabilidad de la escala basada en la consistencia interna se realizó con el índice alfa (α) y omega (Ω) para evaluar la confiabilidad compuesta, considerándolo adecuado los valores mayores a 0,7020,21.
Aspectos éticosLa investigación recibió aprobación de un comité de ética en Perú antes de las pruebas piloto y la recolección de datos realizadas de manera virtual. Los datos recolectados fueron analizados sin información que permita identificar a los estudiantes de ciencias de la salud participantes de esta investigación.
ResultadosPrimera fase: adaptación de la escala y validez basada en el contenidoEn la primera fase de la investigación, tras la evaluación inicial por los 5 miembros del comité de investigadores de la primera versión adaptada de la escala, se identificó un valor promedio de V de Aiken de 0,85 (95%IC: 0,80 a 0,96). Sin embargo, después de la primera prueba piloto se modificó la escala a una segunda versión con 36 ítems, que se aplicó 4 semanas después en una segunda prueba piloto. Debido a los comentarios y sugerencias, se redujo la versión a 32 ítems (fig. 1). Esta versión fue revisada nuevamente por el comité de investigadores para evaluar la validez basada en el contenido, identificando un valor promedio de V de Aiken de 0,86 (95%IC: 0,72 a 0,92).
Segunda fase: aplicación de la escala a estudiantes de MedicinaSe utilizó la tercera versión de la escala con 32 ítems y, de las 337 respuestas obtenidas, se incluyó solo a 297 estudiantes de Medicina Humana. Debido a que algunos no eran estudiantes de Medicina Humana (n = 6), estudiaban en escuelas profesionales sin aulas virtuales (n = 9), no respondieron a todas las preguntas (n = 25) y no se matricularon en todos los ciclos o cursos correspondientes (n = 40).
De los 297 estudiantes de Medicina Humana, más de la mitad eran mujeres (53,20%), con una edad promedio de 22,50 años (DE = 3,44). En cuanto a la distribución por año académico, el 24,58% eran de tercero (n = 73), el 22,55% de cuarto (n = 64), el 19,53% de quinto (n = 58), el 15,82% de segundo (n = 47), el 15,49% de primero (n = 46) y el 3,03% de sexto (n = 9). La mayoría de los estudiantes de Medicina eran de universidades públicas (69,02%), frente a 92 estudiantes de universidades privadas. Por otro lado, solo el 27,95% vivía en Lima (n = 93).
Segunda fase: validez basada en la estructura interna y confiabilidad de la escala en estudiantes de MedicinaEn el análisis estadístico descriptivo de los ítems de la escala aplicada a estudiantes de Medicina Humana, de un total de 160 puntos, el promedio del puntaje obtenido fue de 101,00 (DE = 18,90). En cuanto a la distribución de la respuesta en la escala de Likert, en cada ítem la mayoría expresó estar de acuerdo o totalmente de acuerdo (tabla 1).
Distribución de la respuesta en los ítems de la escala que evalúa la calidad de los cursos virtuales desarrollados para estudiantes peruanos de ciencias de la salud durante la pandemia por la COVID-19
Nro. | Enunciado completo de cada ítem en la escala | Estudiantes peruanos de Medicina Humana (n = 297) | Estudiantes peruanos de ciencias de la salud (n = 629) | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
TD(%) | ED(%) | N(%) | DA(%) | TA(%) | TD(%) | ED(%) | N(%) | DA(%) | TA(%) | ||
Los cursos virtuales… | |||||||||||
1 | …contaban con un programa o sílabo antes de comenzar | 2,02 | 7,41 | 10,77 | 37,71 | 42,09 | – | – | – | – | – |
2 | …tenían una calidad proporcional a la inversión | 7,74 | 15,49 | 39,73 | 33,00 | 4,04 | 6,20 | 16,22 | 42,45 | 30,52 | 4,61 |
3 | …tenían actividades variadas e interesantes | 6,40 | 20,20 | 46,80 | 23,91 | 2,69 | 5,09 | 23,21 | 37,52 | 30,84 | 3,34 |
4 | …promovieron la comprensión y el razonamiento de los temas | 4,04 | 16,16 | 35,35 | 40,07 | 4,38 | 3,82 | 13,51 | 33,70 | 44,52 | 4,45 |
5 | …eran organizados en el desarrollo de sus contenidos (desarrollando una introducción, los objetivos y los diferentes temas de cada capítulo) | 4,71 | 12,79 | 30,98 | 43,77 | 7,74 | 4,13 | 11,76 | 28,30 | 47,22 | 8,59 |
6 | …tenían contenidos exhaustivos y suficientes para el aprendizaje de los temas | 3,37 | 17,17 | 39,73 | 35,69 | 4,04 | 3,66 | 14,94 | 36,09 | 40,38 | 4,93 |
7 | …abordaron los contenidos de forma clara | 3,03 | 11,78 | 39,06 | 39,73 | 6,40 | 2,70 | 10,97 | 36,09 | 45,47 | 4,77 |
Los docentes en los cursos virtuales… | |||||||||||
8 | …utilizaron una metodología de enseñanza que motivaba a reflexionar y/o preguntar sobre los temas | 4,04 | 19,87 | 36,36 | 36,70 | 3,03 | 3,82 | 17,65 | 36,09 | 38,95 | 3,50 |
9 | …encargaban una cantidad razonable de tareas | 14,81 | 26,60 | 23,91 | 29,63 | 5,05 | – | – | – | – | – |
10 | …desarrollaban evaluaciones adecuadas para el contenido desarrollado | 4,71 | 15,82 | 26,60 | 48,48 | 4,38 | 4,45 | 14,47 | 26,87 | 49,28 | 4,93 |
11 | …brindaban una adecuada retroalimentación para las tareas o evaluaciones desarrolladas | 10,44 | 20,88 | 36,03 | 30,64 | 2,02 | 7,95 | 20,35 | 33,55 | 34,66 | 3,50 |
Los medios digitales usados para los cursos… | |||||||||||
12 | …facilitaron el proceso de enseñanza-aprendizaje (permitieron organizar grupos de trabajo, crear foros, brindar retroalimentación y otros) | 2,69 | 11,78 | 33,33 | 45,45 | 6,73 | 2,86 | 11,13 | 27,34 | 50,72 | 7,95 |
13 | …permitieron desarrollar ideas o interpretaciones novedosas que favorecieron la discusión sobre los temas | 4,04 | 18,18 | 36,70 | 36,03 | 5,05 | 4,45 | 13,99 | 33,70 | 42,29 | 5,56 |
El aula virtual… | |||||||||||
14 | …tenía un formato agradable y equilibrado (adecuado tamaño de texto y calidad de imágenes). | 4,04 | 12,46 | 27,27 | 47,81 | 8,42 | 4,61 | 10,49 | 25,76 | 49,76 | 9,38 |
15 | …tenía una organización adecuada (jerarquización de tópicos e índice de contenidos) | 3,03 | 12,12 | 24,58 | 51,85 | 8,42 | 3,18 | 11,29 | 22,26 | 54,37 | 8,90 |
16 | …tenía encabezados, títulos y botones con buen diseño y funcionalidad. | 2,36 | 12,79 | 24,24 | 50,17 | 10,44 | 2,86 | 10,33 | 21,78 | 54,21 | 10,81 |
17 | …tenía páginas con una adecuada extensión (textos breves, hipervínculos, acceso rápido a menú principal o similar) | 3,03 | 14,48 | 27,95 | 48,15 | 6,40 | 2,86 | 12,40 | 26,71 | 50,40 | 7,63 |
Las herramientas en el aula virtual… | |||||||||||
18 | …tenía páginas con una adecuada extensión (textos breves, hipervínculos, acceso rápido a menú principal o similar) | 2,02 | 14,48 | 30,64 | 48,48 | 4,38 | 2,54 | 11,92 | 26,55 | 52,94 | 6,04 |
19 | …permitieron una buena navegación entre los contenidos | 2,36 | 12,12 | 33,33 | 45,12 | 7,07 | 2,38 | 10,33 | 28,14 | 51,51 | 7,63 |
20 | …facilitaron la interacción entre usuarios (estudiantes y/o docentes) | 2,69 | 20,20 | 32,32 | 40,74 | 4,04 | 3,34 | 16,85 | 29,57 | 44,20 | 6,04 |
21 | …ayudaron a estudiar mejor los contenidos desarrollados en el curso | 2,02 | 18,86 | 43,10 | 32,32 | 3,70 | 2,70 | 13,20 | 36,41 | 41,65 | 6,04 |
22 | …ayudaron en la evaluación de los cursos (permitió desarrollar exámenes, visualizar las calificaciones o similar) | 3,37 | 11,78 | 27,95 | 46,80 | 10,10 | 3,82 | 10,17 | 24,48 | 51,99 | 9,54 |
Los recursos multimedia (videos, simuladores y otros) usados en los cursos… | |||||||||||
23 | …se caracterizaron por un diseño de calidad integrado a la estructura del aula virtual | 6,06 | 20,54 | 34,34 | 35,35 | 3,70 | 4,29 | 17,49 | 33,70 | 40,22 | 4,29 |
24 | …contaban con descripción general, transcripción y etiquetas del contenido | 6,73 | 24,92 | 32,32 | 33,33 | 2,69 | 5,41 | 22,10 | 31,00 | 37,84 | 3,66 |
25 | …eran variados e integrados a los temas desarrollados | 6,06 | 19,53 | 34,01 | 37,71 | 2,69 | 4,29 | 15,10 | 31,96 | 43,72 | 4,93 |
26 | …fueron de utilidad para las tareas asignadas | 6,06 | 17,51 | 31,31 | 41,08 | 4,04 | 4,77 | 13,04 | 29,25 | 47,06 | 5,88 |
Las videoconferencias… | |||||||||||
27 | …se programaban con suficiente anticipación | 2,69 | 15,49 | 20,20 | 49,83 | 11,78 | 2,70 | 11,29 | 18,28 | 53,90 | 13,83 |
28 | …se publicaban en el aula virtual para ser revisados posteriormente | 7,74 | 20,20 | 21,21 | 39,06 | 11,78 | 5,56 | 15,10 | 21,46 | 45,15 | 12,72 |
29 | …se realizaban a un ritmo adecuado | 5,72 | 18,18 | 30,64 | 38,05 | 7,41 | 4,29 | 13,20 | 27,50 | 46,26 | 8,74 |
Los materiales académicos (libros, artículos o similares) usados en los cursos… | |||||||||||
30 | …tenían contenidos comprensibles | 2,69 | 7,74 | 25,25 | 59,93 | 4,38 | 2,38 | 6,36 | 22,73 | 62,48 | 6,04 |
31 | …contenían información actualizada | 2,02 | 11,78 | 27,27 | 49,83 | 9,09 | 2,07 | 9,70 | 24,64 | 53,58 | 10,02 |
32 | …se adecuaban a los objetivos de aprendizaje | 1,68 | 7,74 | 25,59 | 56,57 | 8,42 | 2,07 | 7,15 | 22,89 | 58,98 | 8,90 |
Nro.: número de ítem, TD: totalmente en desacuerdo, ED: en desacuerdo, N: ni de acuerdo o en desacuerdo, DA: de acuerdo, TA: totalmente de acuerdo.
En el AFC, se comparó los IBA de 3 posibles estructuras factoriales, según el artículo original, la versión con los 32 ítems y una versión con 30 ítems (tabla 2). De esta forma, se identificó un adecuado ajuste en el modelo de 30 ítems y 6 dominios (χ2 = 657,66; GL = 390; CFI = 0,99; TLI = 0,99; RMSEA = 0,05 y SRMR = 0,05). Asimismo, la correlación entre los dominios de este modelo de 30 ítems estuvo en el rango de 0,62 y 0,90, siendo este último valor, la correlación entre los dominios de calidad general y metodología didáctica. Mientras que en las cargas factoriales los valores estuvieron entre 0,55 y 0,93, con errores de varianza entre 0,14 y 0,68 (anexo 1).
Comparación de diferentes modelos de la escala que evalúa la calidad de los cursos virtuales durante la pandemia por la COVID-19
Modelo | Nro. de factores | Detalle de la correspondencia entre ítems y dominios propuestos | χ2 (GL) | CFI | TLI | RMSEA | SRMR |
---|---|---|---|---|---|---|---|
Basado en versión original de Santoveña S.a | 3 |
| 1518.275 (402)⁎ | 0,909 | 0,901 | 0,100 | 0,071 |
Basado en modelo de AFE con todos los ítemsb | 5 |
| 726.275(395)⁎ | 0,954 | 0,949 | 0,072 | 0,051 |
Estructura actual para AFC | 6 |
| 657.659 (390)⁎ | 0,997 | 0,996 | 0,048 | 0,048 |
AFC: Análisis Factorial Confirmatorio; AFE: Análisis Factorial Exploratorio; CFI: Índice de Ajuste Comparativo; GL: Grados de Libertad; Nro.: número; RMSEA: Error Cuadrático Medio de Aproximación; SRMR: Raíz Residual Cuadrática Media Estandarizada; TLI: Índice de Tucker-Lewis; χ2: Chi-cuadrado.
En la evaluación de la confiabilidad del modelo de 30 ítems, se identificó un índice alfa y omega de 0,96, siendo que la confiabilidad de los 6 dominios de la escala tenía índices alfa mayores a 0,85 (0,87; 0,87; 0,90; 0,88; 0,91 y 0,86, respectivamente para cada dominio de la escala), y tenía índices omega mayores a 0,85 (0,88; 0,87; 0,90; 0,88; 0,91 y 0,86, respectivamente para cada dominio de la escala).
Además, se estimaron valores del ESR para los 32 ítems entre 1,30 y 2,03%, mientras que para el puntaje total fue 1,18%. El valor del índice de Kaiser-Meyer-Olkin o KMO global fue de 0,95 y el rango de valores para los ítems fue similar (0,92 a 0,97).
Tercera fase: aplicación de la escala a estudiantes de ciencias de la saludLuego de la validación de la escala con 30 ítems, se realizó la evaluación en estudiantes peruanos de ciencias de la salud, y de las 957 respuestas obtenidas hasta esta fase del estudio, se incluyó solo a 629 estudiantes, debido a que algunos no eran estudiantes de ciencias de la salud (n = 18), estudiaban en escuelas profesionales sin aulas virtuales (n = 49), no respondieron a todas las preguntas (n = 99) y no se matricularon en todos los ciclos o cursos correspondientes (n = 162).
De los 629 estudiantes de ciencias de la salud, el 62,96% eran mujeres con una edad promedio de 22,44 años (DE = 3,52). La mitad de los estudiantes encuestados eran de Medicina Humana (49,76%) (fig. 1). En cuanto a la etapa de formación, el 61,69% se encontraba en la etapa de formación avanzada (tercer año en adelante). El 79,33% eran de universidades públicas y el 55,33% eran de Lima (tabla 3).
Validez basada en la estructura interna de la escala que evalúa la calidad de los cursos virtuales desarrollados para estudiantes peruanos de ciencias de la salud durante la pandemia por la COVID-19 según características sociodemográficas y educativas
Modelos | Índices de bondad de ajuste | ||||
---|---|---|---|---|---|
χ2 (GL)⁎ | CFI | TLI | RMSEA | SRMR | |
¿Qué carrera estudia? | |||||
Medicina humana (n = 313) | 965.492 (390) | 0,959 | 0,954 | 0,069 | 0,047 |
Otras carreras (n = 316) | 1113.128 (390) | 0,955 | 0,950 | 0,077 | 0,056 |
¿Lugar de residencia? | |||||
Lima (n = 348) | 1085.092 (390) | 0,954 | 0,949 | 0,072 | 0,051 |
Otras regiones (n = 281) | 952.822 (390) | 0,961 | 0,957 | 0,072 | 0,049 |
¿Etapa de formación? | |||||
Entre primer o segundo año (n = 388) | 916.094 (390) | 0,956 | 0,951 | 0,075 | 0,059 |
Desde tercer año (n = 241) | 1179.169 (390) | 0,956 | 0,951 | 0,072 | 0,047 |
¿Sexo del encuestado? | |||||
Mujeres (n = 396) | 1134.926 (390) | 0,965 | 0,961 | 0,070 | 0,046 |
Hombres (n = 233) | 841.385 (390) | 0,952 | 0,946 | 0,071 | 0,057 |
¿Tipo de gestión universitaria? | |||||
Gestión pública (n = 499) | 1365.550 (390) | 0,960 | 0,955 | 0,071 | 0,046 |
Gestión privada (n = 130) | 692.079 (390) | 0,948 | 0,942 | 0,077 | 0,067 |
CFI: Índice de Ajuste Comparativo; GL: Grados de Libertad; RMSEA: Error Cuadrático Medio de Aproximación; SRMR: Raíz Residual Cuadrática Media Estandarizada; TLI: Índice de Tucker-Lewis; χ2: Chi-cuadrado.
En el análisis estadístico descriptivo de los ítems de la escala aplicada a los estudiantes peruanos de ciencias de la salud, de un total de 150 puntos el promedio del puntaje obtenido fue de 104,00 (DE = 19,60). En cuanto a la distribución de la respuesta en la escala de Likert, en cada ítem la mayoría expresó estar de acuerdo o totalmente de acuerdo (tabla 1).
En el AFC del modelo con 30 ítems aplicado a los estudiantes de ciencias de la salud, se identificaron cargas factoriales entre 0,60 y 0,92 y covarianzas entre 0,66 y 0,88 (fig. 2), teniendo adecuados IBA (χ2 = 1690,33; DF = 390; CFI = 0,956; TLI = 0,950; RMSEA = 0,073 y SRMR = 0,044). Además, al estratificar a los participantes según las características evaluadas para la invarianza (sexo, lugar de residencia, carrera de estudio, etapa de formación y tipo de gestión universitaria), se identificó un adecuado ajuste para cada escenario evaluado (tabla 3).
Modelo factorial de la escala para evaluar la calidad de los cursos virtuales desarrollados para los estudiantes peruanos de ciencias de la salud durante la pandemia por la COVID-19.
CG: Calidad General; DP: Diseño de la Plataforma Virtual; MA: Materiales Académicos; MD: Metodología Didáctica; NP: Navegación en la Plataforma Virtual; RM: Recursos Multimedia.
En la evaluación de la confiabilidad se identificó un valor del índice alfa y omega de 0,96; que se mantuvo igual al evaluar la confiabilidad según la carrera estudiada, el lugar de residencia, la etapa de formación y el tipo de gestión universitaria. Sin embargo, los índicesfueron mayores en estudiantes mujeres (α = 0,97 y Ω = 0,97), en comparación con estudiantes hombres (α = 0,95 y Ω = 0,96).
Tercera fase: invarianza factorial de la escala en estudiantes de ciencias de la saludEn la evaluación de la invarianza factorial, se identificaron adecuados valores de ΔCFI (≤0,002) y ΔRMSEA (≤0,004), que disminuyeron entre los modelos restrictivos probados para todas las características evaluadas. Aunque en características como el lugar de residencia y la etapa de formación se encontraron valores más altos de ΔCFI y ΔRMSEA, en comparación con características como la carrera de estudio, el tipo de gestión universitaria y el sexo del encuestado (tabla 4).
Invarianza factorial de la escala que evalúa la percepción de la calidad de los cursos virtuales desarrollados para estudiantes peruanos de ciencias de la salud durante la pandemia por la COVID-19
Modelo | Índices de bondad de ajuste | ||||||
---|---|---|---|---|---|---|---|
χ2 (GL)⁎ | CFI | ΔCFI | TLI | RMSEA | ΔRMSEA | SRMR | |
Invarianza factorial según la carrera que estudia | |||||||
M1 | 2086.206 (780) | 0,956 | 0,951 | 0,073 | 0,051 | ||
M2 | 2150.860 (840) | 0,957 | 0,001 | 0,955 | 0,070 | 0,003 | 0,051 |
M3 | 2136.348 (864) | 0,958 | 0,001 | 0,958 | 0,068 | 0,002 | 0,052 |
Invarianza factorial según el lugar de residencia | |||||||
M1 | 2039.623 (780) | 0,957 | 0,952 | 0,072 | 0,050 | ||
M2 | 2062.524 (840) | 0,959 | 0,002 | 0,957 | 0,068 | 0,004 | 0,050 |
M3 | 2053.728 (864) | 0,960 | 0,001 | 0,959 | 0,066 | 0,002 | 0,050 |
Invarianza factorial según la etapa de formación | |||||||
M1 | 2064.238 (780) | 0,957 | 0,952 | 0,072 | 0,052 | ||
M2 | 2070.098 (840) | 0,959 | 0,002 | 0,958 | 0,068 | 0,004 | 0,052 |
M3 | 2062.069 (864) | 0,960 | 0,001 | 0,960 | 0,067 | 0,001 | 0,052 |
Invarianza factorial según el sexo del encuestado | |||||||
M1 | 1945.018 (780) | 0,957 | 0,952 | 0,072 | 0,052 | ||
M2 | 1956.475 (840) | 0,959 | 0,002 | 0,958 | 0,068 | 0,004 | 0,052 |
M3 | 1929.069 (864) | 0,960 | 0,001 | 0,960 | 0,067 | 0,001 | 0,052 |
Invarianza factorial según el tipo de gestión universitaria | |||||||
M1 | 1903.870 (780) | 0,962 | 0,958 | 0,068 | 0,050 | ||
M2 | 1877.215 (840) | 0,965 | 0,003 | 0,964 | 0,063 | 0,005 | 0,050 |
M3 | 1861.627 (864) | 0,967 | 0,002 | 0,966 | 0,061 | 0,002 | 0,051 |
CFI: Índice Comparativo de Ajuste; GL: Grados de Libertad; M1: Modelo Configuracional; M2: Modelo Métrico; M3: Modelo Escalar; ΔCFI: Diferencia entre los Índices Comparativos de Ajuste; TLI: Índice de Tucker-Lewis; RMSEA: Error Cuadrático Medio de Aproximación; ΔRMSEA: Diferencia entre el Error Cuadrático Medio de Aproximación; SRMR: Raíz Residual Cuadrática Media Estandarizada; χ2: Chi-cuadrado.
Esta investigación adaptó y validó una escala para evaluar la calidad de los cursos virtuales dirigidos a estudiantes de ciencias de la salud en Perú durante el primer año de la pandemia de COVID-19. Las versión adaptada y validada en el contexto peruano presenta mayor validez y confiabilidad que otros instrumentos23–26. Esto se debe a que muchos estudios solo reportan la confiabilidad de las preguntas sin detallar el proceso de validación del contenido o el constructo evaluado23–27.
La adaptación mediante la metodología Delphi garantizó una adecuada contextualización. La validez basada en el contenido aseguró la claridad, representatividad y relevancia de cada ítem13. El análisis factorial confirmó la correspondencia entre los ítems y los dominios propuestos. Los IBA demostraron que la estructura teórica de ítems y dominios se ajusta a la realidad. Así la escala para evaluar la calidad cuenta con más evidencias de validez y confiabilidad que otros instrumentos28.
La estructura de dominios e ítems de esta escala difiere de modelos anteriores con mejores IBA que avalan la versión de esta investigación11,22. No obstante, aunque los 2 primeros dominios de la escala están correlacionados, los índices de ajuste sugieren que no deben combinarse, debido a que el primer dominio evalúa la calidad general de los cursos virtuales9,10, mientras que el segundo analiza la metodología didáctica de los cursos virtuales23,24.
Esta investigación también demostró la invarianza factorial de la escala, lo que confirma su aplicabilidad en diferentes condiciones (profesión, lugar de residencia, etapa de formación, sexo y tipo de gestión universitaria). A diferencia de otros instrumentos que evalúan cursos virtuales en estudiantes de ciencias de la salud, esta investigación demostró que el constructo fue interpretado de manera homogénea por todos los encuestados, independientemente de las condiciones sociodemográficas y educativas evaluadas8,18.
Evaluar la calidad de los cursos virtuales es un desafío por su naturaleza subjetiva9–11, pero la escala en esta investigación ofrece una forma de evaluación más precisa. Esto permite abordar mejor la perspectiva de los estudiantes como usuarios del servicio educativo29. De esta forma, con la recolección de estas perspectivas en confidencialidad, anonimato y con instrumentos validados, la optimización de estos cursos permitirá determinar ámbitos específicos de mejora.
La escala considera el diseño y la navegabilidad de la plataforma virtual para los cursos, pero algunas facultades no emplearon aulas virtuales8. La evidencia de la interacción con estas plataformas y su impacto en el aprendizaje demuestra la importancia de las aulas virtuales21. Sin embargo, esto supuso una limitación para la aplicación de la escala, más cuando el uso de recursos multimedia y materiales académicos ya eran empleados desde antes de la pandemia por la COVID-1926.
La escala descrita en esta investigación facilita la evaluación de la calidad de los cursos virtuales implementados progresivamente en facultades de ciencias de la salud8,26. La posibilidad de implementarlo en cursos específicos con modificaciones ayudaría en evaluaciones específicas. Esto para reconocer áreas de mejora a través de indicadores específicos. Además, puede integrarse a cursos con actividades virtuales y presenciales, contribuyendo a una estrategia de mejora continua30.
Esta investigación presentó limitaciones, principalmente por el sesgo de selección al difundir la encuesta por redes sociales, lo que restringió la muestra a estudiantes con acceso a Internet, sin representar adecuadamente a la población de las facultades de ciencias de la salud en Perú. También hubo sesgos de medición por la autoaplicación de la encuesta y un posible sesgo de recuerdo, ya que algunos participantes fueron encuestados mucho después del año académico 2020. Además, combinar ciertas profesiones en una sola categoría pudo afectar la coherencia de la invarianza entre grupos. Por ello, futuras investigaciones podrían evaluar la escala en una muestra más representativa y explorar otros aspectos del desarrollo de los cursos virtuales no incluidos en el instrumento.
En conclusión, la escala de 30 ítems y 6 dominios para evaluar la calidad de los cursos virtuales dirigidos a estudiantes de ciencias de la salud en Perú evidenció adecuada validez y confiabilidad. Además, la invarianza factorial permite su aplicación en estudiantes con diversas características sociodemográficas (sexo y lugar de residencia) y educativas (carrera, etapa de formación y tipo de gestión universitaria), facilitando una evaluación precisa y promoviendo la mejora continua de dichos cursos.
Responsabilidades éticasLa investigación fue aprobada por un comité de ética en Perú. Así se encuesto a los participantes empezando con el consentimiento informado (https://is.gd/Calidad20).
FinanciamientoLos autores declaran que no han recibido ayudas específicas del sector público y privado para la realización de este trabajo.
Conflicto de interesesLos autores declaran no tener ningún conflicto de intereses.
Información adicionalUn informe preliminar de los resultados de esta investigación fue publicado como un preprint en la plataforma medrixv: https://www.medrxiv.org/content/10.1101/2022.01.08.22268928v1