banner
Hogar / Blog / ¿Pueden los sistemas de apoyo a las decisiones clínicas ser un activo en la educación médica? Un enfoque experimental
Blog

¿Pueden los sistemas de apoyo a las decisiones clínicas ser un activo en la educación médica? Un enfoque experimental

Aug 06, 2023Aug 06, 2023

BMC Medical Education volumen 23, número de artículo: 570 (2023) Citar este artículo

319 Accesos

Detalles de métricas

La precisión diagnóstica es uno de los principales pilares de una toma de decisiones médicas adecuada y exitosa. Recientemente se han utilizado sistemas de apoyo a la decisión clínica (CDSS) para facilitar las consideraciones diagnósticas del médico. Sin embargo, hasta la fecha, se sabe poco sobre los beneficios potenciales de CDSS para los estudiantes de medicina en un entorno educativo. El propósito de nuestro estudio fue explorar la utilidad de los CDSS para que los estudiantes de medicina evalúen su desempeño diagnóstico y la influencia de dicho software en la confianza de los estudiantes en sus propias habilidades diagnósticas.

Basándose en casos en papel, los estudiantes tuvieron que diagnosticar dos pacientes diferentes utilizando un CDSS y métodos convencionales como, por ejemplo, libros de texto, respectivamente. Ambos pacientes tenían una enfermedad común, en un entorno la presentación clínica fue típica (amigdalitis), en el otro entorno (embolia pulmonar), sin embargo, el paciente se presentó de forma atípica. Utilizamos un ensayo controlado aleatorio por grupos de 2x2x2 entre y dentro de sujetos para evaluar la precisión diagnóstica en estudiantes de medicina, también cambiando el orden de los recursos utilizados (CDSS primero o segundo).

Los estudiantes de medicina de 4º y 5º año obtuvieron igualmente buenos resultados utilizando métodos convencionales o el CDSS en los dos casos (t(164) = 1,30; p = 0,197). La precisión diagnóstica y la confianza en el diagnóstico correcto fueron mayores en la condición de presentación típica que en la condición de presentación atípica (t(85) = 19,97; p < 0,0001 y t(150) = 7,67; p < 0,0001). Estos resultados refutan Nuestra principal hipótesis es que los estudiantes diagnostican con mayor precisión cuando utilizan métodos convencionales en comparación con el CDSS.

Los estudiantes de medicina de 4º y 5º año obtuvieron igualmente buenos resultados en el diagnóstico de dos casos de enfermedades comunes con presentaciones clínicas típicas o atípicas utilizando métodos convencionales o un CDSS. Los estudiantes dominaron el diagnóstico de una enfermedad común con una presentación típica, pero subestimaron su propio conocimiento fáctico en este escenario. Además, los estudiantes eran conscientes de sus propias limitaciones diagnósticas cuando se les presentó un caso desafiante con una presentación atípica para el cual el uso de un CDSS aparentemente no proporcionó información adicional.

Informes de revisión por pares

La precisión diagnóstica es uno de los principales pilares de una toma de decisiones médicas adecuada y exitosa [1, 2]. Los estudiantes de medicina ya se están familiarizando gradualmente con la habilidad crucial de hacer su propio diagnóstico [3, 4] y evaluarlo críticamente [5, 6]. Los enfoques didácticos que enseñan a los estudiantes cómo llegar a conclusiones diagnósticas ciertamente han diferido dependiendo de factores como el tiempo, el país y la institución médica [7, 8]. Además, las innovaciones tecnológicas también han contribuido a cambiar los procedimientos en la enseñanza de cómo realizar un diagnóstico adecuado [9]. Un ejemplo de asistencia tecnológica serían los sistemas digitalizados de apoyo a las decisiones clínicas (CDSS), que ahora son ampliamente utilizados tanto por los médicos [10] como por los pacientes [11]. En este estudio se explorará más a fondo la utilidad potencial de CDSS en la enseñanza de procesos de diagnóstico para estudiantes de medicina.

Los CDSS son software destinados a ofrecer apoyo impersonal en la toma de decisiones médicas para facilitar los procesos de diagnóstico [12]. Ya en la década de 1950 se desarrollaron prototipos de los CDSS actuales [13, 14]. Con el tiempo, estos software se han vuelto gradualmente más refinados, en particular con el avance de las tecnologías digitales y mediante el uso de inteligencia artificial basada en enormes muestras de datos [15, 16] en lugar de algoritmos de diagnóstico reduccionistas únicamente. Hoy en día, la aparición de los teléfonos inteligentes [17] ha hecho que los CDSS sean fácilmente accesibles para el público en general en forma de verificadores de síntomas [18]. Dada la amplia difusión de dichos CDSS, su rendimiento y su utilidad potencial en la práctica médica en general ya se han estudiado ampliamente [19, 20]. Además, Berner et. Alabama. encontró una precisión del 52% al 71% al comparar el rendimiento de cuatro CDSS en más de 100 casos desafiantes, lo que significa que estos sistemas proporcionaron un diagnóstico correcto entre una selección de diagnósticos posibles predefinidos [21]. Con el tiempo, la precisión de los CDSS aumentó, como lo demostraron Graber y Mathew, quienes informaron una precisión del 98% medida al nombrar el diagnóstico correcto en los primeros 30 diagnósticos posibles en más de 50 casos desafiantes diferentes [22]. Pero parece haber una discrepancia en cuanto a la presentación poco común de enfermedades. Por ejemplo, Hill et al. encontraron que los verificadores de síntomas enumeraron el diagnóstico correcto primero para las presentaciones comunes en el 42% en contraste con solo el 4% para las presentaciones poco comunes [23]. Es de destacar que la precisión de los verificadores de síntomas parece haberse estancado durante la última década [24].

Dado que los CDSS digitalizados parecen ser de gran relevancia en un futuro cercano, nos hemos estado preguntando si el uso de CDSS también sería una ventaja para los estudiantes de medicina cuando desarrollan sus habilidades de toma de decisiones diagnósticas y el proceso relacionado con la toma de decisiones diagnósticas. Como tal, los CDSS debían considerarse una herramienta educativa que ofrecía a los estudiantes de medicina vías adicionales para la toma de decisiones médicas [25]. Sin embargo, hasta la fecha, la evidencia sobre si este software eventualmente cumplirá tales promesas ha sido escasa, si no contradictoria [26, 27].

Hasta donde sabemos, nuestro estudio es el primero en explorar la utilidad de los CDSS en la educación médica con respecto a la influencia de un CDSS en la precisión diagnóstica de los estudiantes y su confianza en sus propios diagnósticos como resultados de su proceso de toma de decisiones. La mayoría de los estudios que utilizan dispositivos de apoyo para la toma de decisiones médicas se centran casi exclusivamente en enfermedades raras o casos desafiantes, si no inusuales, [21]. Por el contrario, optamos por enfermedades comunes, una que se presenta con signos y síntomas típicos y la otra con una presentación atípica. Nuestro objetivo fue contrastar adecuadamente los resultados y poder compararlos. Como teníamos la intención de explorar la utilidad potencial de los CDSS en un entorno educativo, necesitábamos enfermedades con las que los estudiantes estén familiarizados y que reflejaran el nivel de su conocimiento. Optamos por el enfoque común y generalmente aceptado de utilizar viñetas de casos clínicos para evaluar la precisión y la confianza de los estudiantes [28, 29].

Esperábamos que los estudiantes resolvieran el caso con la presentación típica de una enfermedad común con mayor precisión diagnóstica que el caso con la presentación atípica, independientemente de si utilizaron métodos convencionales como se definió anteriormente o un CDSS. Nuestra hipótesis principal fue que los diagnósticos que utilizaban métodos convencionales eran, en promedio, más precisos que los diagnósticos con un CDSS, ya que los estudiantes aún no estaban familiarizados con los CDSS y su enfoque para utilizar este software de manera adecuada. Además, planteamos la hipótesis de que los estudiantes tendrían una mayor confianza en su propia precisión diagnóstica al confiar en CDSS, ya que carecen de experiencia personal en la toma de decisiones médicas en esta fase inicial de su carrera como futuros médicos.

El estudio se registró previamente en el Open Science Framework [30]. El comité de ética de Charité aprobó el estudio.

Estudiamos a estudiantes de medicina de 4to y 5to año de carrera (semestres 7 al 10). Los estudios de medicina en nuestra universidad duran un total de seis años, siendo el último año un año de prácticas. Dado que tenemos un plan de estudios integrado, no existe una separación estricta entre estudios preclínicos y clínicos. Solo incluimos a estudiantes más avanzados, ya que la tarea de llegar a conclusiones diagnósticas sería demasiado desafiante para los estudiantes al comienzo de sus estudios. Como tal, creamos una muestra relativamente homogénea de estudiantes. La evaluación se realizó en el marco de tutorías de enseñanza entre pares que tienen una duración de tres horas. Se ofrece a los estudiantes una amplia variedad de cursos optativos entre los que pueden elegir activamente según sus propios intereses. Al final de nuestro curso, los estudiantes recibieron cuatro puntos de crédito tutorial, de los cuales deben acumular 60 durante los primeros cinco años de sus estudios. Los puntos de crédito no tienen ningún efecto en las calificaciones de los estudiantes. Cada tutoría se limitó a 20 participantes para proporcionar una supervisión adecuada y garantizar la participación activa de los participantes desde abril de 2020 hasta noviembre de 2020. Sin embargo, los estudiantes que no cumplían con nuestros criterios de inclusión para el estudio no fueron excluidos de la tutoría en sí. En todas nuestras clases, los mismos dos instructores, una estudiante de 4º año de sus estudios de medicina y una instructora experimentada, llevaron a cabo el tutorial en formato digital a través de Microsoft Teams, ya que las regulaciones relacionadas con la pandemia de CoViD-19 no permitían una entorno físico. Las tutorías en nuestra universidad siempre están a cargo de estudiantes-maestros. En el caso de nuestro estudio, agregamos un instructor experimentado para explicar todos los aspectos relacionados con el estudio con el fin de separar la enseñanza objetiva por parte del estudiante compañero-maestro de los detalles técnicos del estudio. Se pidió a los estudiantes que dejaran sus cámaras encendidas para garantizar el ambiente del aula y la supervisión. Al comienzo de una clase, los instructores presentaron a los estudiantes participantes el uso del CDSS para garantizar una aplicación funcional. Una vez que todos los participantes se familiarizaron con el CDSS, se entregó uno de los casos en papel junto con un cuestionario utilizando el software Unipark®. Proporcionamos una hoja de información para los estudiantes antes de su participación y les dimos tiempo para preguntas. En esa hoja, informamos a los estudiantes que su participación era voluntaria y que finalizar prematuramente el estudio no crearía resultados negativos, es decir, los estudiantes aún recibirían sus puntos de crédito por la tutoría. También informamos a los estudiantes que sus datos se recopilarían sin posibilidad de identificar a las personas posteriormente y que se pueden publicar de forma anónima.

Treinta y cuatro estudiantes de medicina (73% mujeres) de edad M = 25,29 años (DE = 4,15 años) en el semestre M = 8,31 (DE = 1,82) participaron en una ejecución piloto del estudio. La utilidad potencial del CDSS en general no fue discutida con los estudiantes antes del estudio. Los estudiantes tuvieron 60 minutos dentro de la tutoría para resolver su respectivo caso en ambas condiciones. El caso y el orden se seleccionaron aleatoriamente antes de cada fecha de tutoría. La participación en el estudio en sí fue voluntaria y no tuvo ningún efecto en la recepción de puntos de crédito, siempre que se proporcionara participación activa durante el resto del curso. No proporcionamos diagnósticos finales durante los cursos para no sesgar los resultados en fechas posteriores del tutorial. Después de la ejecución piloto, adaptamos el cuestionario para incluir la descripción del caso repetidamente en las dos condiciones intra-sujeto y especificamos algunas formulaciones en las instrucciones. La respuesta después de la prueba piloto fue que 60 minutos fueron suficientes para resolver la tarea en cuestión. El proceso en sí siguió siendo el mismo para el estudio principal.

El estudio se organizó como un ensayo de control aleatorio por grupos de 2x2x2 entre y dentro de los sujetos. Los estudiantes participantes se agruparon en grupos, y estos grupos fueron asignados aleatoriamente a una de cuatro condiciones según el caso y el orden. Los dos casos presentados entre los factores fueron una enfermedad común en presentación típica (amigdalitis con dolor de garganta y amígdalas rojas inflamadas cubiertas por un exudado blanco = caso 1 [el caso fue adaptado de una muestra de aprendizaje basada en casos de nuestra universidad]) y un enfermedad común en presentación atípica [31] (embolia pulmonar que se presenta con dolor abdominal superior = caso 2 [32]). Además de los síntomas cardinales, en ambos casos se presentó una breve historia clínica así como los hallazgos diagnósticos esenciales al momento de la consulta. Cada participante tuvo que resolver su caso respectivo dos veces: una con la ayuda de un CDSS y otra utilizando métodos convencionales (dentro del factor). Los estudiantes ignoraban por completo el grado de dificultad y si los pacientes del caso en papel presentaban una constelación típica o no. Se especificaron los métodos convencionales que se pueden utilizar (libros de texto, literatura de investigación, investigación en Internet y recursos similares), pero no se detallaron explícitamente en términos de, por ejemplo, el orden en el que se utilizarán estos materiales, lo que permitirá a los estudiantes utilizar cualquier enfoque con el que estén familiarizados. en el marco de un tutorial para resolver la tarea. Los métodos convencionales excluyeron explícitamente el uso del CDSS. El orden (primero CDSS, segundo métodos convencionales o primero métodos convencionales, segundo CDSS) fue el segundo entre factores. La Figura 1 muestra las diferentes condiciones y órdenes de nuestro diseño y los grupos resultantes para cada caso y orden de métodos utilizados.

Diseño del experimento y posterior agrupación. Los grupos A, B, C y D presentan las cuatro condiciones basadas en el caso entre factores (presentación típica versus presentación atípica) y el orden entre factores (CDSS primero o método convencional primero). Los grupos A y B resolvieron el caso 1 en el orden opuesto de la tarea y los grupos C y D resolvieron el caso 2 correspondientemente.

Calculamos el tamaño de muestra requerido para nuestro estudio usando G*Power 3.1 [33] con base en los siguientes criterios: d = 0.50, α = 0.05, 1-β = 0.80 llegando a un tamaño de muestra requerido de n = 34 por grupo, N = 136 en total. Anticipando una tasa de abandono del 20%, nuestro objetivo fue reclutar a 164 participantes. Utilizamos los dos tutoriales piloto para evaluar la diferencia de medias del efecto dentro de los sujetos (CDSS frente a métodos convencionales).

Como CDSS, los participantes utilizaron el verificador de síntomas Ada® versiones 3.3.0 hasta 3.7.0 de Ada Health GmbH. Elegimos la aplicación gratuita Ada®, que está fácilmente disponible en las respectivas tiendas de aplicaciones para teléfonos inteligentes con Android e iOS. Además, el enfoque basado en preguntas de Ada® imita hasta cierto punto la anamnesis médica convencional de signos y síntomas. Luego de brindar información básica de salud, el usuario ingresa las principales quejas. Luego, Ada® formula una serie de preguntas de seguimiento a través de un motor de razonamiento que basa sus preguntas, diagnósticos y recomendaciones en estimaciones de probabilidad y su base de datos de conocimientos médicos [34]. Para este estudio, los estudiantes ingresaron en la solicitud la información basada en la viñeta del caso asignado.

El cuestionario contenía 63 ítems. Después de dar su consentimiento informado, se indicó a los estudiantes que utilizaran primero el CDSS (grupos A y C) o, alternativamente, los métodos convencionales (grupos B y D) para hacer un diagnóstico basado en el caso en papel. Posteriormente, los participantes proporcionaron hasta tres diagnósticos, cada uno acompañado de una indicación de qué tan seguros se sentían los estudiantes en vista de sus propios diagnósticos (0-100% para la resolución de casos convencional o “_ de 10” a “_ de 1000” pacientes según en la salida CDSS). La misma descripción del caso se proporcionó por segunda vez con la instrucción de utilizar métodos convencionales (grupos A y C) o el CDSS (grupos B y D), es decir, aquellos métodos no utilizados en la primera ejecución. De nuevo, los participantes podrían indicar hasta tres diagnósticos junto con la correspondiente valoración de confianza en sus propios diagnósticos. Cuando los estudiantes tuvieron que utilizar métodos convencionales, tuvieron que indicar qué recursos frecuentaban. La información sociodemográfica concluyó el cuestionario en línea con preguntas sobre edad, sexo, semestre de estudio y experiencia médica previa, así como una pregunta para solicitar comentarios adicionales.

Tres consultores externos en medicina general, medicina interna y otorrinolaringología evaluaron la precisión de los diagnósticos sugeridos por los estudiantes. A cada experto se le dieron todos los diagnósticos para ambos casos (N = 46 para el caso 1 y N = 98 para el caso 2), las descripciones de los casos y diez diagnósticos adicionales elegidos al azar de la CIE-10 para cada caso. Este último procedimiento aseguró que la evaluación de la precisión tanto en la presentación típica como en la atípica fuera absoluta en lugar de relativa y calibrada de manera similar. Cada diagnóstico se evaluó en una escala de 1 (incorrecto) a 5 (correcto) utilizando el sistema de órganos y el mecanismo de la enfermedad como puntos de referencia y se modeló a partir de estudios similares al nuestro [35, 36]. Si ambos eran correctos, el diagnóstico recibía 5 puntos; si ambos eran incorrectos, el diagnóstico recibía 1 punto; si uno era correcto y el otro incorrecto, el diagnóstico recibía 3 puntos. Las puntuaciones 2 y 4 prestan atención a zonas grises comunes en la práctica médica, por lo que decidimos involucrar a los tres expertos externos. Utilizando la puntuación media de los tres expertos se identificaron las puntuaciones finales para cada diagnóstico. En el análisis se incluyó el diagnóstico con la puntuación más alta para cada participante en cada condición.

Tomamos las siguientes medidas para mitigar los posibles efectos de los factores de confusión que podrían haber influido en nuestro estudio: empleamos la asignación aleatoria de estudiantes a casos y orden, teniendo en cuenta la posibilidad de un sesgo de selección como algunos estudiantes de nuestra facultad pueden haber tenido ya antes. exposición a sistemas tecnológicos avanzados y eran más competentes técnicamente que otros y por lo tanto estaban más interesados ​​en el tema del tutorial y en nuestro estudio. Sin embargo, creemos que la competencia técnica no ayuda a proporcionar diagnósticos más precisos. Aunque las versiones posteriores del CDSS pueden haber producido resultados potencialmente mejorados, no se observaron diferencias significativas en la precisión diagnóstica entre las diferentes versiones del CDSS. Los estudiantes que participaron en una fecha posterior podrían haber tenido conocimiento de los casos debido a sus interacciones con estudiantes que participaron en el estudio en una fecha anterior. Es importante señalar que instruimos explícitamente a todos los estudiantes que no discutieran el estudio con otros estudiantes interesados ​​y nunca revelamos ningún diagnóstico durante las tutorías. Finalmente, es posible que los estudiantes que se encontraban en las últimas etapas de sus estudios de medicina tuvieran un mayor nivel de competencia en comparación con los estudiantes en etapas anteriores. Sin embargo, nuestros hallazgos no indicaron ningún efecto significativo.

Identificamos el porcentaje de datos faltantes en el conjunto de datos y calculamos la prueba de falta completamente al azar (MCAR) de Little para verificar si los datos faltantes se distribuyeron aleatoriamente entre las variables. Utilizamos pruebas t con muestras independientes para las diferencias de género con respecto a todos los resultados para verificar posibles impactos de género en nuestros análisis. Para probar la hipótesis principal, calculamos una prueba t con muestras pareadas entre la condición CDSS y la condición convencional. Luego buscamos efectos de caso (dificultad) y orden (CDSS/convencional primero) utilizando un análisis de varianza mixto (ANOVA). Para confiar en los diagnósticos entre casos, calculamos una prueba t para muestras independientes entre el caso 1 y el caso 2. Para confiar en los diagnósticos según el orden, calculamos una prueba t para muestras pareadas comparando los grupos A y B con los grupos C. y D. Para los efectos del caso y el orden sobre la confianza en los diagnósticos, utilizamos un ANOVA univariado. Utilizamos SPSS 27.0 con sus respectivos cálculos del tamaño del efecto y eliminación por pares para todos los análisis. Utilizamos la estadística descriptiva de medias y desviaciones estándar para ilustrar nuestros resultados en tablas y figuras.

En el estudio participaron 213 estudiantes de medicina de la Charité – Universitätsmedizin Berlin. Excluimos a 47 estudiantes por no cumplir con los criterios de inclusión en cuanto a su año de estudio, ni haber participado anteriormente en la tutoría, ni por estar afiliados a Ada Health GmbH. Los restantes N = 166 estudiantes (57% mujeres) de edad M = 25,31 años (SD = 4,49 años) se incluyeron en el análisis. La Tabla 1 muestra la distribución entre los cuatro grupos.

La aleatorización proporcionó una distribución igual en cuanto a edad y semestre, pero una distribución desigual de género en los cuatro grupos. En consecuencia, analizamos las diferencias de género en nuestros resultados. La Tabla 2 proporciona resultados para tres pruebas t. Hombres y mujeres no difirieron significativamente en cuanto a su precisión con el CDSS o con los métodos convencionales. Tampoco difirieron significativamente en la confianza en su diagnóstico. Por lo tanto, no consideramos que la distribución desigual del género influya en los resultados de nuestro estudio con respecto a la precisión y la confianza en los diagnósticos.

El conjunto de datos final contenía un 3% de datos faltantes. La prueba MCAR de Little proporcionó resultados significativos (χ2 = 2408,58, gl = 2221, p = 0,003), lo que significa que no faltaron datos completamente al azar. En consecuencia, verificamos todas las variables con datos faltantes para detectar cualquier patrón de falta, e identificamos el patrón de que los valores de precisión y confianza del segundo y tercer diagnóstico CDSS siempre faltaban en los pares respectivos. Juntas, estas variables representaron más del 50% de los datos faltantes. Por lo tanto, excluimos las variables de nuestro análisis de datos faltantes para identificar patrones más allá de esta covariación técnica. Después de excluir las variables, la prueba MCAR de Little proporcionó resultados no significativos (χ2 = 1159,57, gl = 1095, p = 0,086). Por lo tanto, asumimos que los datos de nuestro conjunto de datos faltaban completamente al azar.

Las fuentes de información más comunes en los grupos convencionales fueron los sitios web (69%) y los libros de texto analógicos (9%). El sitio web más visitado fue Amboss, una ayuda alemana similar a un libro de texto digitalizado utilizada por estudiantes de medicina principalmente para prepararse para los exámenes de licencia a nivel nacional que cubren todos los campos de la medicina (79%), seguido por el wiki médico alemán DocCheck Flexikon (19%) y Wikipedia. (4%). Veinte participantes (12%) informaron haber resuelto el caso por sí mismos sin ayuda adicional.

La Figura 2 muestra los resultados de nuestra hipótesis principal sobre la precisión diagnóstica. Los diagnósticos para los recursos convencionales fueron similares al uso de CDSS entre casos. Los diagnósticos para el caso 1 fueron significativamente más precisos que los del caso 2 utilizando tanto los métodos convencionales como el CDSS. Para el caso 1, 81 de 83 estudiantes obtuvieron una precisión de 5 y los otros dos estudiantes obtuvieron una precisión de 4 puntos. Para el caso 2, un estudiante de 82 fue recompensado con una puntuación de 5 y 29 fueron recompensados ​​con una puntuación de 4.

Precisión de los diagnósticos. Las barras muestran las precisiones diagnósticas medias para ambos métodos (convencional y CDSS) en todos los casos (lado izquierdo) y dentro de los casos (lado derecho). No existe una diferencia estadísticamente significativa en la precisión entre y dentro de los casos para el diagnóstico convencional en comparación con el CDSS. Los estudiantes proporcionaron diagnósticos más precisos en el caso 1 en comparación con el caso 2 utilizando cualquiera de los métodos. ****, p < 0,0001 (significativo), ns, no significativo. El número de estudiantes individuales en cada cohorte se proporciona en cada barra. Los bigotes indican desviaciones estándar que representan el 68% de los valores alrededor de la media.

La Tabla 3 muestra los resultados mixtos de ANOVA para la precisión diagnóstica, la condición convencional/CDSS dentro de los sujetos y las dos condiciones entre sujetos, caso y orden, como variables independientes. Sólo el caso de condición entre sujetos tuvo un efecto significativo en la precisión del diagnóstico.

Las versiones posteriores 6.0 y 7.0 del CDSS no produjeron diagnósticos más precisos en ANOVA que las versiones anteriores 4.0 y 5.0 para el caso 1 (F(3,72) = 0,74, p = 0,53, n4,0 = 24, n5,0 = 24 , n6.0 = 17, n7.0 = 11) o caso 2 (F(3,65) = 1.66, p = 0.19, n4.0 = 9, n5.0 = 13, n6.0 = 24, n7. 0 = 23), ni los estudiantes de los semestres superiores 9 o 10 obtuvieron mejores resultados en ANOVA en el caso 1 (F(3,79) = 0,47, p = 0,71, n7 = 15, n8 = 20, n9 = 31, n10 = 17 ) o caso 2 (F(3,78) = 0,77, p = 0,51, n7 = 25, n8 = 13, n9 = 29, n10 = 15) que sus compañeros de estudios menos experimentados en el semestre 7 u 8.

La Figura 3 muestra los resultados de nuestra hipótesis principal y segunda para la confianza en el resultado secundario. La confianza de los estudiantes en su propio diagnóstico fue mayor en el caso 1. No se encontró ningún efecto sobre la confianza en relación con el orden en que se realizaron los diagnósticos.

Confianza de los estudiantes en sus propios diagnósticos. Las barras muestran la confianza de los estudiantes en sus propios diagnósticos (condición convencional) entre casos (lado izquierdo) y con respecto al orden de los métodos entre factores (lado derecho). La confianza de los estudiantes en sus propios diagnósticos fue significativamente mayor en el caso 1 en comparación con el caso 2. Al comparar el orden en que se realizó el diagnóstico, no se encontró ningún efecto significativo. ****, p < 0,0001 (significativo), ns, no significativo. El número de estudiantes individuales en cada cohorte se proporciona en cada barra. Los bigotes indican desviaciones estándar que representan el 68% de los valores alrededor de la media.

La Figura 4 y la Tabla 4 resaltan algunos efectos de interacción con respecto al resultado de la confianza del estudiante en su propio diagnóstico con las dos condiciones entre sujetos, caso y orden, como variables independientes. Sin embargo, el efecto en ambos casos no fue significativo.

Comparación de la confianza de los estudiantes en sus propios diagnósticos dentro de los casos. Las barras muestran la confianza de los estudiantes en sus propios diagnósticos para el caso 1 (lado izquierdo) y el caso 2 (lado derecho). Los grupos difieren en el orden de los métodos (convencional versus CDSS). No hubo ningún efecto significativo del orden del método en ninguna condición de caso. ns, no significativo. El número de estudiantes individuales en cada cohorte se proporciona en cada barra. Los bigotes indican desviaciones estándar que representan el 68% de los valores alrededor de la media.

Los estudiantes de semestres superiores no confiaron más en sus diagnósticos que los estudiantes de semestres inferiores en los ANOVA para el caso 1 (F(3,79) = 2,59, p = 0,06, n7 = 15, n8 = 20, n9 = 31, n10 = 17) o caso 2 (F(3,76) = 0,83, p = 0,48, n7 = 24, n8 = 13, n9 = 28, n10 = 15).

Nuestro objetivo fue evaluar la precisión diagnóstica de los estudiantes y la confianza en sus diagnósticos utilizando métodos convencionales y un CDSS en dos escenarios clínicos con diferentes grados de dificultad. Cuando se trataba de una enfermedad común que se presentaba con signos y síntomas típicos, los estudiantes alcanzaron un nivel muy alto de precisión diagnóstica cercana al 100%. En el caso de una enfermedad común que se presentaba de forma atípica, la precisión de los estudiantes disminuía sustancialmente. En ambos escenarios, no encontramos diferencias significativas en la precisión cuando los estudiantes utilizaron métodos convencionales o confiaron en los resultados del CDSS. Este resultado nos lleva a refutar nuestra hipótesis original de que los estudiantes llegarían a diagnósticos más precisos cuando utilizaran métodos convencionales en comparación con el uso de un CDSS.

Obviamente, entre los dos casos hubo una diferencia relevante en la confianza de los estudiantes en sus propios diagnósticos: en el caso típico, los estudiantes mostraron una mayor confianza en sus diagnósticos, mientras que en el caso atípico la confianza fue mucho menor. Pero, en marcado contraste con la altísima precisión con la que resolvieron el caso típico, los estudiantes tenían mucha menos confianza en su propio diagnóstico. Por el contrario, en el caso de la presentación atípica, las calificaciones promedio de precisión fueron paralelas a las calificaciones promedio de confianza. Además, también observamos otra influencia leve, aunque no estadísticamente significativa, en la confianza de los estudiantes en sus diagnósticos: esta última fue menor cuando utilizaron primero el CDSS para el caso típico y mayor cuando utilizaron primero el CDSS en el caso atípico. .

Nuestros hallazgos sugieren que la precisión diagnóstica de los estudiantes en enfermedades comunes está fuertemente influenciada por la presencia de signos y síntomas típicos y menos canalizada por el apoyo tecnológico. La precisión observada en el caso típico indica que los estudiantes tienen la capacidad de diagnosticar correctamente una presentación similar a un libro de texto con la que están familiarizados. En cambio, su rendimiento diagnóstico disminuye ante una presentación atípica, incluso de una enfermedad común. Esta observación resalta los desafíos que enfrentan los estudiantes al reconocer manifestaciones poco comunes de enfermedades comunes.

Podemos demostrar que el CDSS no proporcionó una ayuda particular para mejorar la capacidad de los estudiantes para llegar a conclusiones diagnósticas precisas. Sin embargo, el CDSS puede desempeñar un papel notable en la mejora de la confianza de los estudiantes, especialmente cuando se enfrentan a casos más complejos. En estos escenarios, el CDSS puede actuar casi como una segunda opinión y como una fuente de tranquilidad que brinda a los estudiantes una mayor confianza en su propio proceso de toma de decisiones diagnósticas. En este sentido, el uso del CDSS puede ofrecer un valioso apoyo psicológico como herramienta para aumentar la confianza y la capacidad de toma de decisiones de los estudiantes. Por lo tanto, sería útil en el futuro explorar más los impactos psicológicos y educativos del CDSS en diferentes escenarios de diagnóstico y con tamaños de muestra más grandes. Además, nuestro estudio proporciona de manera ejemplar cómo una configuración experimental podría funcionar para evaluar otras dimensiones de la precisión diagnóstica de los estudiantes, es decir, enfermedades raras o diagnósticos en campos morfológicos como la radiología o la patología.

Hasta ahora, el foco de la investigación en torno a los dispositivos de apoyo para la toma de decisiones médicas se ha centrado casi exclusivamente en enfermedades raras o constelaciones clínicas desafiantes e inusuales [21]. Debido a esta perspectiva bastante estrecha, elegimos enfermedades comunes con diferentes presentaciones para reflejar mejor el nivel de conocimiento de los estudiantes y sus contextos educativos, ya que los estudiantes tenían que llegar a sus propias conclusiones diagnósticas en lugar de seleccionar un diagnóstico de un conjunto de diagnósticos prefabricados como Este es el caso, por ejemplo, de las preguntas de opción múltiple utilizadas habitualmente en la educación médica [37]. Creemos que nuestro enfoque permitió una investigación más exhaustiva del impacto de los CDSS en el contexto de escenarios clínicos más comunes en la educación médica, ya que los estudiantes sólo están en el proceso de aprender a clasificar, evaluar, ponderar, interpretar y finalmente sintetizar subjetivos. quejas y signos clínicos objetivos como demostró Bowen [5].

Además, consideramos que es una fortaleza particular de nuestro estudio que no medimos la precisión diagnóstica de una manera dicotómica que solo diferencia entre correcto o incorrecto. Para refinar nuestros resultados, desarrollamos una escala que va del 1 al 5 basada en Ramnarayan et al. [35] y Bond et al. [36] que tiene en cuenta parámetros como los sistemas de órganos afectados y los mecanismos de la enfermedad. La práctica clínica implica generalmente muchos más matices entre un diagnóstico totalmente correcto y uno totalmente incorrecto. Además, un espectro graduado de respuestas parcialmente correctas refleja mucho mejor los diversos aspectos que los estudiantes necesitan sintetizar en su razonamiento diagnóstico. Como tal, el camino para convertirse en un diagnosticador se refleja mucho mejor en la escala que utilizamos que en una alternativa exclusivamente correcta-incorrecta. Obviamente, para otros fines de investigación dicha escala puede modificarse de diferentes maneras según las eventuales preguntas de investigación en juego. Esta escala también puede utilizarse como herramienta para calificar el progreso potencial en la curva de aprendizaje de un individuo. Sin duda, se justifican más estudios para probar también la validez de nuestro enfoque.

Una limitación metodológica importante de nuestro estudio se relaciona con el hecho de que a los estudiantes simplemente se les indicó que no usaran el CDSS cuando se les pidió que usaran métodos convencionales. Como resultado, la mayoría de los estudiantes utilizaron una variedad de servicios en línea como Amboss o DocCheck Flexikon, y solo una minoría volvió a los libros de texto y directrices impresos, otros estudiantes no buscaron ninguna ayuda adicional. Por lo tanto, la condición convencional consiste en una gama más amplia y mucho más heterogénea de recursos, en su mayoría digitalizados, con los que los estudiantes de medicina están completamente familiarizados. Por lo tanto, los estudiantes podrían haber recuperado información muy diferente para llegar a una conclusión diagnóstica, mientras que el uso del CDSS representa un camino uniforme.

En resumen, el uso de un CDSS no mejoró significativamente la precisión diagnóstica. Sin embargo, el uso de dicho software puede desempeñar un papel interesante y también relevante a la hora de mejorar la confianza de los estudiantes cuando se les presentan constelaciones clínicas desafiantes. También observamos que los estudiantes tienden a subestimar su propio conocimiento en casos típicos y fáciles, mientras que son mucho más conscientes de sus limitaciones en casos atípicos y desafiantes. Nuestros resultados también resaltan la importancia de considerar parámetros tanto objetivos como subjetivos al evaluar la efectividad del CDSS. Utilizando CDSS en la educación médica, los instructores podrían eventualmente optimizar la integración de esta tecnología en la formación de futuros médicos.

El conjunto de datos que respalda las conclusiones de este artículo está disponible en Open Science Framework, [https://osf.io/aegcp/files/osfstorage].

Sistema de apoyo a la decisión clínica.

Poco falta completamente en una prueba aleatoria.

Análisis de variación

Comité del Instituto de Medicina (EE.UU.) sobre la calidad de la atención sanitaria en Estados Unidos. En: Kohn LT, Corrigan JM, Donaldson MS, editores. Err es humano: construir un sistema de salud más seguro. Washington (DC): Prensa de las Academias Nacionales (EE.UU.); 2000.

Balogh EP, Miller BT, Ball JR, Comité sobre errores de diagnóstico en la atención sanitaria; Junta de Servicios de Atención Médica; Instituto de Medicina. Mejora del diagnóstico en la atención sanitaria. Washington (DC): Prensa de las Academias Nacionales (EE.UU.); 2015.

Brush JE Jr, Lee M, Sherbino J, Taylor-Fishwick JC, Norman G. Efecto de la enseñanza de métodos bayesianos mediante el aprendizaje por conceptos frente al aprendizaje por ejemplo en la capacidad de los estudiantes de medicina para estimar la probabilidad de un diagnóstico: un ensayo clínico aleatorizado. Abierto de red JAMA. 2019;2(12):e1918023.

Artículo de Google Scholar

Chamberland M, Setrakian J, St-Onge C, Bergeron L, Mamede S, Schmidt HG. ¿Proporcionar el diagnóstico correcto como retroalimentación después de la autoexplicación mejora el rendimiento diagnóstico de los estudiantes de medicina? BMC Educación Médica. 2019;19(1):194.

Artículo de Google Scholar

Bowen JL. Estrategias educativas para promover el razonamiento diagnóstico clínico. N Inglés J Med. 2006;355(21):2217–25.

Artículo de Google Scholar

Braun LT, Zottmann JM, Adolf C, Lottspeich C, Then C, Wirth S, et al. Los andamios de representación mejoran la eficiencia diagnóstica en estudiantes de medicina. Educación Médica. 2017;51(11):1118–26.

Artículo de Google Scholar

Eva KW. Lo que todo profesor necesita saber sobre el razonamiento clínico. Educación Médica. 2005;39(1):98–106.

Artículo de Google Scholar

Braun LT, Borrmann KF, Lottspeich C, Heinrich DA, Kiesewetter J, Fischer MR, et al. Adivinar correctamente: si los estudiantes de medicina dan razones incorrectas para sus diagnósticos correctos y cómo. GMS J Med Educación. 2019;36(6):Doc85.

Google Académico

Han R, Yu W, Chen H, Chen Y. Uso del sistema de etiquetas de lectura de inteligencia artificial en la capacitación de calificación de retinopatía diabética de residentes junior de oftalmología y estudiantes de medicina. BMC Educación Médica. 2022;22(1):258.

Artículo de Google Scholar

Kwan JL, Lo L, Ferguson J, Goldberg H, Díaz-Martínez JP, Tomlinson G, et al. Sistemas informatizados de apoyo a la decisión clínica y mejoras absolutas en la atención: metaanálisis de ensayos clínicos controlados. BMJ. 2020;370:m3216.

Artículo de Google Scholar

Chambers D, Cantrell AJ, Johnson M, Preston L, Baxter SK, Booth A, et al. Comprobadores de síntomas digitales y en línea y servicios de evaluación/clasificación de la salud para problemas de salud urgentes: revisión sistemática. Abierto BMJ. 2019;9(8):e027743.

Artículo de Google Scholar

Middleton B, Sittig DF, Wright A. Apoyo a la decisión clínica: una retrospectiva de 25 años y una visión de 25 años. Informe médico anual. 2016;Suplemento 1(Suplemento 1):S103–16.

Google Académico

Nash FA. Diagnóstico diferencial, un aparato para ayudar a las facultades lógicas. Lanceta. 1954;266(6817):874–5.

Artículo de Google Scholar

de Dombal FT. Diagnóstico asistido por ordenador del dolor abdominal agudo. La experiencia británica. Rev Epidemiol Sante Publique. 1984;32(1):50–6.

Google Académico

de Dombal FT. Soporte de decisiones asistido por ordenador en medicina clínica. Int J Biomed Computación. 1989;24(1):9–16.

Artículo de Google Scholar

Semigran HL, Linder JA, Gidengil C, Mehrotra A. Evaluación de verificadores de síntomas para autodiagnóstico y clasificación: estudio de auditoría. BMJ. 2015;351:h3480.

Artículo de Google Scholar

Sandholzer M, Rurik I, Deutsch T, Frese T. Expectativas de los estudiantes de medicina hacia la implementación de un libro de texto de medicina familiar como una aplicación integral en Alemania. J Sistema Médico. 2014;38(10):125.

Artículo de Google Scholar

Nateqi J, Lin S, Krobath H, Gruarin S, Lutz T, Dvorak T, et al. Del síntoma al diagnóstico: reevaluación de los verificadores de síntomas: ¿Son finalmente los verificadores de síntomas suficientes y precisos para su uso? Una actualización desde la perspectiva ORL. HNO. 2019;67(5):334–42.

Artículo de Google Scholar

Berner ES, Maisiak RS, Cobbs CG, Taunton OD. Efectos de un sistema de apoyo a las decisiones sobre el desempeño diagnóstico de los médicos. J Am Med Informar Assoc. 1999;6(5):420–7.

Artículo de Google Scholar

Riches N, Panagioti M, Alam R, Cheraghi-Sohi S, Campbell S, Esmail A, et al. La eficacia de los generadores de diagnóstico diferencial electrónico (DDX): una revisión sistemática y un metanálisis. Más uno. 2016;11(3):e0148991.

Artículo de Google Scholar

Berner ES, Webster GD, Shugerman AA, Jackson JR, Algina J, Baker AL, et al. Funcionamiento de cuatro sistemas de diagnóstico por ordenador. N Inglés J Med. 1994;330(25):1792–6.

Artículo de Google Scholar

Graber ML, Mathew A. Rendimiento de un sistema de apoyo al diagnóstico clínico basado en web para internistas. J Gen Intern Med. 2008;23(Suplemento 1):37–40.

Artículo de Google Scholar

Hill MG, Sim M, Mills B. La calidad del diagnóstico y el asesoramiento de clasificación proporcionados por aplicaciones y verificadores de síntomas gratuitos en línea en Australia. Med J Aust. 2020;212(11):514–9.

Artículo de Google Scholar

Schmieding ML, Kopka M, Schmidt K, Schulz-Niethammer S, Balzer F, Feufel MA. Precisión de clasificación de las aplicaciones de verificación de síntomas: evaluación de seguimiento de 5 años. J Med Internet Res. 2022;24(5):e31810.

Artículo de Google Scholar

Martínez-Franco AI, Sánchez-Mendiola M, Mazón-Ramírez JJ, Hernández-Torres I, Rivero-López C, Spicer T, et al. Precisión diagnóstica en residentes de medicina familiar que utilizan un sistema de apoyo a la decisión clínica (DXplain): un ensayo controlado aleatorio. Diagnóstico (Berl). 2018;5(2):71–6.

Artículo de Google Scholar

Graber ML, Tompkins D, Holanda JJ. Recursos que utilizan los estudiantes de medicina para derivar un diagnóstico diferencial. Enseñanza médica. 2009;31(6):522–7.

Artículo de Google Scholar

Kämmer JE, Schauber SK, Hautz SC, Stroben F, Hautz WE. Las listas de verificación de diagnóstico diferencial reducen el error de diagnóstico de manera diferencial: un experimento aleatorio. Educación Médica. 2021;55(10):1172–82. https://doi.org/10.1111/medu.14596.

Artículo de Google Scholar

Diekhoff T, Kainberger F, Oleaga L, Dewey M, Zimmermann E. Eficacia de la herramienta de apoyo a la decisión clínica ESR eGUIDE para enseñar a los estudiantes de medicina la selección adecuada de pruebas de imagen: evaluación cruzada aleatoria. Eur Radiol. 2020;30(10):5684–9.

Artículo de Google Scholar

Shah C, Davtyan K, Nasrallah I, Bryan RN, Mohan S. Plataforma de simulación y soporte de decisiones clínicas impulsada por inteligencia artificial para la educación de aprendices en radiología. Imágenes de dígitos J. 2023;36(1):11–6.

Artículo de Google Scholar

¿Cómo se desempeñan los estudiantes de medicina cuando tienen que diagnosticar enfermedades comunes utilizando un sistema de apoyo a las decisiones médicas? 2020 Disponible en: https://osf.io/5ujy4

Goldrich M, Shah A, et al. Presentaciones atípicas de la enfermedad. En: Walter LC, Chang A, Chen P, Harper GM, Rivera J, Conant R, et al., editores. Diagnóstico y Tratamiento Actual Geriatría, 3er. Nueva York, Nueva York: McGraw-Hill Education; 2021.

Google Académico

Majidi A, Mahmoodi S, Baratloo A, Mirbaha S. Presentación atípica de embolia pulmonar masiva, reporte de un caso. Emerg (Teherán). 2014;2(1):46–7.

Google Académico

Faul F, Erdfelder E, Buchner A, Lang AG. Análisis de poder estadístico utilizando G* Power 3.1: Pruebas para análisis de correlación y regresión. Métodos de resolución de comportamiento. 2009;41:1149–60.

Artículo de Google Scholar

Miller S, Gilbert S, Virani V, Wicks P. Utilización y percepción de los pacientes de una tecnología de asesoramiento y evaluación de síntomas basada en inteligencia artificial en una sala de espera de atención primaria británica: estudio piloto exploratorio. Factores de zumbido JMIR. 2020;7(3):e19713.

Artículo de Google Scholar

Ramnarayan P, Kapoor RR, Coren M, Nanduri V, Tomlinson AL, Taylor PM, et al. Medición del impacto del apoyo a las decisiones diagnósticas en la calidad de la toma de decisiones clínicas: desarrollo de una puntuación compuesta confiable y válida. J Am Med Informar Assoc. 2003;10(6):563–72.

Artículo de Google Scholar

Bond WF, Schwartz LM, Weaver KR, Levick D, Giuliano M, Graber ML. Generadores de diagnóstico diferencial: una evaluación de los programas informáticos disponibles actualmente. J Gen Intern Med. 2012;27(2):213–9.

Artículo de Google Scholar

Epstein RM. Evaluación en educación médica. N Inglés J Med. 2007;356(4):387–96.

Artículo de Google Scholar

Descargar referencias

El estudio se llevó a cabo en colaboración con la Asociación Nacional de Médicos de Seguros de Enfermedad (KBV). Los autores desean agradecer a Maike Buchmann y Dorothea Penders (Charité Lernzentrum) por la posibilidad de ofrecer el tutorial en línea como parte del programa de enseñanza entre pares para estudiantes en Charité; las evaluadoras expertas Katharina Stölzel, Sabine Gehrke-Beck y Anna Schappert por la calificación de los diagnósticos, Miriam Sieg por la consulta biométrica y Marie Lencer por la asistencia técnica. Por último, nos gustaría agradecer a los revisores por sus valiosos comentarios.

Financiamiento de Acceso Abierto habilitado y organizado por Projekt DEAL.

Jan C. Zoellick y Pascal Grosse contribuyeron igualmente a este trabajo.

Charité – Universitätsmedizin Berlin, miembro corporativo de Freie Universität Berlin y Humboldt-Universität zu Berlin, Berlín, Alemania

Sean D. Kafke, Adelheid Kuhlmey, Johanna Schuster, Stefan Blüher, Constanze Czimmeck, Jan C. Zoellick y Pascal Grosse

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

Todos los autores (SK, AK, JS, SB, CC, JZ y PG) conceptualizaron y diseñaron el estudio. SK y CC recopilaron los datos. SK y JZ analizaron los datos. SK, JZ y PG redactaron la primera versión del manuscrito. Todos los autores (SK, AK, JS, SB, CC, JZ y PG) contribuyeron a la revisión crítica del manuscrito y aprobaron la versión final para su publicación.

Correspondencia a Sean D. Kafke.

El estudio fue aprobado por la comisión de ética de Charité (votación EA1/237/19 del 5 de junio de 2020). Todos los participantes dieron su consentimiento informado para participar. Todos los métodos se llevaron a cabo de acuerdo con las directrices y regulaciones pertinentes.

No aplica.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/. La exención de dedicación de dominio público de Creative Commons (http://creativecommons.org/publicdomain/zero/1.0/) se aplica a los datos disponibles en este artículo, a menos que se indique lo contrario en una línea de crédito a los datos.

Reimpresiones y permisos

Kafke, SD, Kuhlmey, A., Schuster, J. et al. ¿Pueden los sistemas de apoyo a las decisiones clínicas ser un activo en la educación médica? Un enfoque experimental. BMC Med Educ 23, 570 (2023). https://doi.org/10.1186/s12909-023-04568-8

Descargar cita

Recibido: 31 de mayo de 2023

Aceptado: 04 de agosto de 2023

Publicado: 11 de agosto de 2023

DOI: https://doi.org/10.1186/s12909-023-04568-8

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt