ISSN: 2530-0164

Indexed in:

Index Medicus/MEDLINE, Excerpta Medica/EMBASE, SCOPUS, Science Citation Index Expanded, Journal Citation Reports/Science Edition, IBECS

Subscribe:

Impact factor

The Impact Factor measures the average number of citations received in a particular year by papers published in the journal during the two preceding years.

© Clarivate Analytics, Journal Citation Reports 2022

Impact factor 2023

1.8

Citescore

CiteScore measures average citations received per document published.

Citescore 2023

2.1

SJR

SRJ is a prestige metric based on the idea that not all citations are the same. SJR uses a similar algorithm as the Google page rank; it provides a quantitative and qualitative measure of the journal's impact.

SJR 2023

0.355

SNIP

SNIP measures contextual citation impact by wighting citations based on the total number of citations in a subject field.

SNIP 2023

0.474

View more metrics

Journal Information

Congress

Congress content

Congress

65 Congreso Nacional de la Sociedad Española de Endocrinología y Nutrición

Oviedo, 16 - 18 October 2024

List of sessions

Descargar el PDF completo del suplemento

65 Congreso Nacional de la Sociedad Española de Endocrinología y Nutrición

List of sessions

Descargar el PDF completo del suplemento

Communication

Previous communication

Next communication

23. MISCELÁNEA

Full Text

Download PDF

417 - EVALUACIÓN DEL RENDIMIENTO DE CHATGPT-4 EN LA RESOLUCIÓN Y RAZONAMIENTO CLÍNICO DE PREGUNTAS DE ENDOCRINOLOGÍA Y NUTRICIÓN DEL EXAMEN MIR Y EIR 2024

L. Arsís García¹, I. Modrego Pardo² y C. Marco Alacid¹

¹Endocrinología y Nutrición, Hospital Verge dels Lliris, Alcoy. ²Hospital Marina Baixa, Villajoyosa.

Introducción: El desarrollo de la inteligencia artificial (IA) y el uso de ChatGPT se postula como una herramienta útil en la educación sanitaria e investigación científica. El objetivo del estudio fue evaluar la eficacia de ChatGPT-4 para responder preguntas de endocrinología y nutrición (EyN) de los exámenes MIR (médico interno residente) y EIR (enfermero interno residente) de 2024 y su capacidad para justificar su respuesta.

Métodos: Se incluyeron 14 preguntas correspondientes a EyN del examen MIR y 23 del EIR. Se evaluó el nivel de acierto de ChatGPT-4 y 3 evaluadores determinaron su razonamiento clínico. Se estudió la presencia de diferencias en cuanto a la dificultad propuesta por la IA frente a los evaluadores y se analizó si el formato de pregunta podía influir en el grado de acierto de la IA.

Resultados: ChatGPT-4 alcanzó un nivel de acierto en el MIR del 100% y en el EIR del 60,9%. El 42,9% de las respuestas del MIR se clasificaron por parte de los evaluadores como 'Razonamiento aceptable aunque incompleto' y un 57,1% como 'Razonamiento completamente correcto' y en el EIR un 60,9% como 'Razonamiento completamente correcto' y un 39,1% como 'Incorrecto o pobre'. No se encontró correlación entre el grado de dificultad de las preguntas MIR o EIR según ChatGPT y el evaluador MIR (correlación 0,357; p > 0,05) o EIR (correlación -0,028; p > 0,05) y tampoco la presencia de concordancia (Kappa 0,31; p > 0,05). No se objetivó que el tipo de pregunta, ni la habilidad evaluada, la disciplina, el abordaje o si la pregunta era formulada en negativo podía predecir el acierto o fallo de la pregunta (p > 0,05).

Conclusiones: ChatGPT-4 demostró ser una herramienta eficaz para responder preguntas de EyN correspondientes al examen MIR y, en menor medida, del EIR, con un adecuado razonamiento clínico. El rendimiento de la IA fue homogéneo independientemente del formato de pregunta o nivel de dificultad, aunque aún pueden existir errores en la interpretación por parte de la IA.