banner
Hogar / Blog / Inteligencia artificial en histopatología del cáncer de ovario: una revisión sistemática
Blog

Inteligencia artificial en histopatología del cáncer de ovario: una revisión sistemática

Aug 07, 2023Aug 07, 2023

npj Precision Oncology volumen 7, número de artículo: 83 (2023) Citar este artículo

Detalles de métricas

Este estudio evalúa la calidad de las investigaciones publicadas que utilizan inteligencia artificial (IA) para el diagnóstico o pronóstico del cáncer de ovario utilizando datos histopatológicos. Se realizó una búsqueda sistemática en PubMed, Scopus, Web of Science, Cochrane CENTRAL y WHO-ICTRP hasta el 19 de mayo de 2023. Los criterios de inclusión requerían que se utilizara IA para inferencias de pronóstico o diagnóstico en imágenes histopatológicas del cáncer de ovario humano. El riesgo de sesgo se evaluó mediante PROBAST. Se tabuló la información sobre cada modelo y se informaron estadísticas resumidas. El estudio se registró en PROSPERO (CRD42022334730) y se siguieron las pautas de presentación de informes PRISMA 2020. Las búsquedas identificaron 1573 registros, de los cuales 45 fueron elegibles para su inclusión. Estos estudios contenían 80 modelos de interés, incluidos 37 modelos de diagnóstico, 22 modelos de pronóstico y otros 21 modelos de relevancia diagnóstica. Las tareas comunes incluyeron predicción de la respuesta al tratamiento (11/80), clasificación del estado de malignidad (10/80), cuantificación de tinciones (9/80) y subtipificación histológica (7/80). Los modelos se desarrollaron utilizando entre 1 y 1375 portaobjetos de histopatología de entre 1 y 776 pacientes con cáncer de ovario. En todos los estudios se encontró un riesgo de sesgo alto o incierto, con mayor frecuencia debido a un análisis limitado y a un informe incompleto sobre el reclutamiento de participantes. Se han realizado investigaciones limitadas sobre la aplicación de IA a imágenes histopatológicas con fines de diagnóstico o pronóstico en cáncer de ovario, y se ha demostrado que ninguno de los modelos está listo para su implementación en el mundo real. Los aspectos clave para acelerar la traducción clínica incluyen informes transparentes y completos de la procedencia de los datos y enfoques de modelado, y una evaluación cuantitativa mejorada mediante validación cruzada y validaciones externas. Este trabajo fue financiado por el Consejo de Investigación en Ingeniería y Ciencias Físicas.

El cáncer de ovario es la octava neoplasia maligna más común en mujeres en todo el mundo1. Es notoriamente difícil de detectar y diagnosticar, con un cribado ineficaz2 y síntomas inespecíficos similares a los provocados por la menopausia3. La enfermedad, que abarca tumores malignos primarios de los ovarios, las trompas de Falopio y el peritoneo, a menudo ha comenzado a extenderse dentro del abdomen en el momento del diagnóstico (FIGO4 Etapa 3). Esta típica etapa tardía en el momento del diagnóstico hace que el cáncer de ovario sea una enfermedad particularmente mortal: los 314.000 nuevos casos diagnosticados cada año se traducen en 207.000 muertes por año en todo el mundo1.

La mayoría de los cánceres de ovario son carcinomas (cánceres de origen epitelial) que se dividen predominantemente en cinco subtipos histológicos: seroso de alto grado, seroso de bajo grado, de células claras, endometrioide y mucinoso. Los cánceres de ovario no epiteliales son mucho menos comunes e incluyen tumores de células germinales, estroma del cordón sexual y mesenquimales. Los subtipos de cáncer de ovario difieren morfológica y pronósticamente y tienen distintas opciones de tratamiento5. El carcinoma seroso de alto grado es la forma más común de cáncer de ovario y representa aproximadamente el 70% de todos los casos6.

La histopatología, el examen de muestras de tejido a nivel celular, es el estándar de oro para el diagnóstico del cáncer de ovario. Los patólogos suelen interpretar el tejido teñido con hematoxilina y eosina (H&E), aunque la interpretación puede ser un proceso subjetivo que requiere mucho tiempo, y algunas tareas tienen un alto nivel de variación entre observadores7,8,9. En la evaluación de casos difíciles, los patólogos generales pueden buscar ayuda de expertos en patología ginecológica de subespecialidad y/o utilizar pruebas auxiliares, como la inmunohistoquímica (IHC). Las derivaciones y las pruebas auxiliares pueden ser esenciales para la precisión del proceso de diagnóstico, pero tienen el costo de hacerlo más largo y costoso. En todo el mundo, los patólogos tienen una demanda mucho mayor que la oferta, con disparidades significativas en el número de patólogos entre países10 y con países mejor abastecidos que aún no pueden satisfacer la demanda11.

Tradicionalmente, los patólogos han analizado los portaobjetos de vidrio utilizando un microscopio óptico. Sin embargo, cada vez es más común la implementación de un flujo de trabajo digital, en el que los patólogos revisan imágenes escaneadas de portaobjetos completos (WSI) utilizando una computadora. Si bien la adopción de la patología digital probablemente se haya visto impulsada por los beneficios de eficiencia12, ha creado una oportunidad para el desarrollo de herramientas automatizadas para ayudar a los patólogos. Estas herramientas suelen tener como objetivo mejorar la precisión, eficiencia, objetividad y coherencia del diagnóstico. Estas herramientas podrían ayudar a aliviar la escasez de patólogos en la fuerza laboral mundial, aumentando el rendimiento del diagnóstico y reduciendo la demanda de derivaciones y pruebas auxiliares. Ésta es un área de investigación cada vez más activa13 y, para algunas neoplasias malignas, estos sistemas están empezando a alcanzar utilidad clínica14.

En este estudio, revisamos sistemáticamente toda la literatura en la que se aplicaron técnicas de inteligencia artificial (IA) (que comprenden tanto el aprendizaje automático tradicional (ML) como los métodos de aprendizaje profundo) a imágenes de patología digital para el diagnóstico o pronóstico del cáncer de ovario. Esto incluyó investigaciones que se centraron en un único factor de diagnóstico, como el subtipo histológico, y estudios que realizaron tareas de diagnóstico asistidas por computadora, como la segmentación de tumores. La revisión caracteriza el estado del campo, describe qué tareas de diagnóstico y pronóstico se han abordado y evalúa factores relevantes para la utilidad clínica de estos métodos, como los riesgos de sesgo. A pesar de que el cáncer de ovario es una enfermedad particularmente difícil de detectar y diagnosticar, y de la escasez de patólogos disponibles, los modelos de IA aún no se han implementado en la práctica clínica para esta enfermedad. Esta revisión tiene como objetivo proporcionar conocimientos y recomendaciones basadas en la literatura publicada para mejorar la utilidad clínica de investigaciones futuras, incluida la reducción de los riesgos de sesgo, la mejora de la reproducibilidad y el aumento de la generalización.

Como se muestra en la Fig. 1, las búsquedas bibliográficas arrojaron un total de 1573 registros, de los cuales 557 eran duplicados. Se excluyeron novecientos treinta registros durante la selección de títulos y resúmenes, y 41 se excluyeron basándose en la selección completa del artículo, incluidos 3 registros para los cuales no se pudieron obtener los artículos completos. Los 45 estudios restantes se incluyeron en la revisión, de los cuales 11 fueron artículos de congresos y 34 artículos de revistas. Todos los estudios aceptados se identificaron originalmente mediante búsquedas en bases de datos de investigación, y ningún registro de ensayos cumplió con los criterios de inclusión. Si bien las búsquedas arrojaron literatura desde 1949, todas las investigaciones que cumplieron con los criterios de inclusión se publicaron desde 2010, y más del 70% de la literatura incluida se publicó desde 2020. Las características de los estudios se muestran en la Tabla 1. Los 45 artículos aceptados contenían 80 modelos de interés, cuyo detalle se muestra en la Tabla 2.

Diagrama de flujo PRISMA 2020 del proceso de identificación y selección de estudios para la revisión sistemática. Los registros se examinaron únicamente según los títulos y resúmenes, y los informes se evaluaron según el contenido del texto completo. CENTRAL Registro Central de Ensayos Controlados. Plataforma de registro internacional de ensayos clínicos de la Organización Mundial de la Salud OMS-ICTRP.

Los resultados de las evaluaciones PROBAST se muestran en la Tabla 3. Si bien algunos estudios contenían múltiples modelos de interés, ninguno de ellos contenía modelos con diferentes puntuaciones de riesgo de sesgo para cualquier sección de la evaluación PROBAST, por lo que se presenta un análisis de riesgo de sesgo por artículo. . Todos los modelos mostraron un riesgo general de sesgo alto (37/45) o un riesgo general de sesgo poco claro (8/45). Cada modelo de alto riesgo tenía una puntuación de alto riesgo en la sección de análisis (37/45), y varios también tenían alto riesgo para los participantes (6/45), los predictores (11/45) o los resultados (13/45). . Menos de la mitad de los estudios lograron un riesgo bajo de sesgo en cualquier dominio (21/45), y la mayoría de los riesgos bajos se encontraron en las secciones de resultados (16/45) y predictores (9/45). Casi todos los artículos tenían un riesgo de sesgo poco claro en al menos un dominio, más comúnmente los dominios de participantes (36/45) y predictores (25/45). Los resúmenes cualitativos se presentan en la Fig. 2.

Resultados de riesgo de sesgo de PROBAST resumidos para los 45 artículos incluidos en esta revisión.

El número de participantes en los conjuntos de datos internos varió en órdenes de magnitud: cada estudio incluyó entre 1 y 776 pacientes con cáncer de ovario y un estudio incluyó a más de 10 000 pacientes en total en un rango de 32 neoplasias malignas15. La mayoría de las investigaciones sólo utilizaron datos de los cinco subtipos más comunes de carcinoma de ovario, aunque un estudio reciente incluyó el uso de tumores del estroma del cordón sexual16. Sólo un estudio incluyó explícitamente alguna recopilación de datos prospectivos, y esto fue solo para un pequeño subconjunto que no se utilizó para la validación externa17.

Como se muestra en la figura 3, el número de portaobjetos de patología utilizados fue a menudo mucho mayor que el número de pacientes incluidos; tres estudios utilizaron más de 1000 portaobjetos de pacientes con cáncer de ovario18,19,20. En la mayoría de los estudios, las muestras de desarrollo del modelo fueron WSI que contenían tejido resecado o biopsiado (34/45), y otros utilizaron imágenes centrales de microarrays de tejido individuales (TMA) (5/45) o imágenes de patología digital precortadas (3/45). . La mayoría de los estudios utilizaron tejido teñido con H&E (33/45) y otros utilizaron una variedad de tinciones IHC (11/45), y no hubo dos artículos que informaran el uso de las mismas tinciones IHC. Algunos estudios incluyeron enfoques multimodales, utilizando datos de genómica 17,21,22,23,24, proteómica21,24, transcriptómica24 y radiómica17 junto con datos histopatológicos.

Histogramas que muestran el número de a pacientes con cáncer de ovario y b portaobjetos de histopatología del cáncer de ovario utilizados en el desarrollo del modelo. Muchos de estos valores son inciertos debido a que los informes están incompletos, como se refleja en la Tabla 2.

La fuente de datos más utilizada fue The Cancer Genome Atlas (TCGA) (18/45), un proyecto del cual están disponibles públicamente más de 30.000 imágenes de patología digital de 33 neoplasias malignas. El subconjunto de cáncer de ovario, TCGA-OV25, contiene 1481 WSI de 590 casos de carcinoma seroso de ovario (en su mayoría, pero no exclusivamente, de alto grado), con los datos genómicos, transcriptómicos y clínicos correspondientes. Esto incluye portaobjetos de ocho centros de datos en los Estados Unidos, y la mayoría de los portaobjetos contienen secciones de tejido congelado (1374/1481) en lugar de secciones fijadas con formalina e incluidas en parafina (FFPE). Otras fuentes de datos recurrentes fueron el repositorio del Programa de Investigación del Cáncer de Ovario (OVCARE) de la Universidad de Columbia Británica26,27,28, el estudio transcanadiense29,30 y los registros clínicos de la Clínica Mayo31,32, el Hospital General Tri-Service33,34,35 y Centro Oncológico Memorial Sloan Kettering17,36. Todos los demás investigadores utilizaron una fuente de datos única (12/45) o no informaron la procedencia de sus datos (8/45). TCGA-OV, OVCARE y el estudio Transcanadian son conjuntos de datos multicéntricos. Aparte de estos, pocos estudios informaron el uso de datos multicéntricos17,24,28,37,38,39. Sólo dos estudios informaron el uso de múltiples escáneres de diapositivas, con cada diapositiva escaneada en uno de los dos escáneres disponibles27,28. Los países de donde se obtuvieron los datos incluyeron Canadá, China, Finlandia, Francia, Alemania, Italia, Japón, Países Bajos, Corea del Sur, Taiwán, Reino Unido y Estados Unidos de América.

Hubo un total de 80 modelos de interés en los 45 artículos incluidos, y cada artículo contenía entre 1 y 6 de esos modelos. Había 37 modelos de diagnóstico, 22 modelos de pronóstico y otros 21 modelos que predecían información diagnóstica relevante. Los resultados del modelo de diagnóstico incluyeron la clasificación del estado de malignidad (10/37), el subtipo histológico (7/37), el tipo de cáncer primario (5/37), el estado de mutación genética (4/37), el nivel de reacción del estroma del tumor (3/37). ), grado (2/37), subtipo transcriptómico (2/37), estadio (1/37), estado de inestabilidad de microsatélites (1/37), estado de transición epitelial-mesenquimal (1/37) y estado de deficiencia de recombinación homóloga ( 1/37). Los modelos de pronóstico incluyeron la predicción de la respuesta al tratamiento (11/23), la supervivencia general (6/23), la supervivencia libre de progresión (3/23) y la recurrencia (2/23). Los otros modelos realizaron tareas que podrían usarse para ayudar a los patólogos a analizar imágenes patológicas, incluida la medición de la cantidad/intensidad de la tinción, la generación de máscaras de segmentación y la clasificación de tipos de tejidos/células.

Se utilizaron una variedad de modelos, siendo los tipos más comunes la red neuronal convolucional (CNN) (41/80), la máquina de vectores de soporte (SVM) (10/80) y el bosque aleatorio (6/80). Las arquitecturas de CNN incluyeron GoogLeNet40, VGG1619,32, VGG1926,28, InceptionV333,34,35,38, ResNet1817,27,28,39,41,42, ResNet3443, ResNet5016,44,45, ResNet18236 y MaskRCNN32. Las nuevas CNN normalmente utilizaban múltiples bloques estandarizados que involucraban capas convolucionales, de normalización, activación y/o agrupación22,46,47, y dos estudios también incluían módulos de atención20,35. Un estudio generó su nueva arquitectura mediante el uso de un enfoque de optimización de topología en un VGG1623 estándar.

La mayoría de los investigadores dividen sus imágenes originales en parches para procesarlos por separado, con tamaños de parche que van desde 60 × 60 a 2048 × 2048 píxeles, siendo los más comunes 512 × 512 píxeles (19/56) y 256 × 256 píxeles (12/56). . Se empleó una variedad de técnicas de extracción de características, incluidas características hechas a mano/predefinidas (23/80) y características que el modelo aprendió automáticamente (51/80). Las características hechas a mano incluían una gran cantidad de características morfológicas texturales, cromáticas y celulares y nucleares. Las características creadas a mano se usaban comúnmente como entradas para los métodos de aprendizaje automático clásicos, como SVM y modelos forestales aleatorios. Las características aprendidas normalmente se extraían mediante una CNN, que a menudo también se utilizaba para la clasificación.

A pesar del uso común de parches, la mayoría de los modelos hicieron predicciones a nivel WSI (29/80), nivel central TMA (18/80) o nivel de paciente (6/80), lo que requirió agregación de información a nivel de parche. Se utilizaron dos enfoques de agregación distintos, uno que agrega antes del modelado y otro que agrega después del modelado. El primer enfoque requiere la generación de características a nivel de diapositiva antes del modelado, el segundo requiere la agregación de resultados del modelo a nivel de parche para hacer predicciones a nivel de diapositiva. Las características a nivel de diapositiva se generaron mediante suma16, promedio21,24,36, promedio ponderado basado en la atención20,41,42,44,45, concatenación15,30, así como enfoques de incrustación más complejos utilizando codificación vectorial de Fisher29 y agrupación de k-medias48. Los resultados del modelo a nivel de parche se agregaron para generar predicciones a nivel de diapositiva tomando el máximo22,35, la mediana43 o el promedio23, usando estrategias de votación27,34 o usando un clasificador de bosque aleatorio28. Todos estos enfoques son ejemplos de aprendizaje de instancias múltiples (MIL), aunque se informaron pocos modelos de interés utilizando esta terminología22,41,42,44.

La mayoría de los estudios incluyeron la segmentación en algún momento, y muchos de ellos analizaron la segmentación del tumor/tinción como resultado del modelo32,36,37,47,49,50,51,52,53,54. Algunos otros estudios utilizaron la segmentación para determinar regiones de interés para un modelado adicional, ya sea simplemente separando el tejido del fondo15,18,44,45 o usando la segmentación del tumor para seleccionar las regiones de tejido más relevantes33,34,35,55,56. Un estudio también utilizó la segmentación para detectar células individuales para su clasificación57. Algunos estudios también utilizaron la segmentación para determinar características artesanales relacionadas con la cantidad y morfología de diferentes tejidos, células y núcleos17,18,21,24,30,31.

Si bien los enfoques basados ​​en la atención se han aplicado a otras neoplasias malignas durante varios años58,59, solo se observaron en los estudios más recientes sobre cáncer de ovario20,28,33,34,35,41,42,44,45, y ninguno de los métodos incluía la autoatención, un método cada vez más popular para otras neoplasias malignas60. La mayoría de los modelos eran deterministas, aunque también se utilizaron árboles de Markov ocultos51, árboles impulsores probabilísticos52 y modelos de mezcla gaussiana61. Aparte del uso común de imágenes de baja resolución para detectar y eliminar áreas sin tejido, las imágenes generalmente se analizaban con una resolución única, y solo seis artículos incluían técnicas de aumento múltiple en sus modelos de interés. Cuatro de estas características combinadas de diferentes resoluciones para el modelado29,30,36,48, y las otras dos utilizaron diferentes aumentos para seleccionar regiones de tejido informativas y para el modelado33,34. De los artículos para los que se pudo determinar, las ampliaciones de modelado más comunes fueron ×20 (35/41) y ×40 (7/41). Pocos modelos integraron datos de histopatología con otras modalidades (6/80). Los enfoques multimodales incluyeron la concatenación de características unimodales extraídas por separado antes del modelado21,23,24, la fusión de predicciones unimodales de modelos separados17 y un enfoque profesor-alumno donde se utilizaron múltiples modalidades en el entrenamiento del modelo pero solo datos histopatológicos. se utilizó para la predicción22.

Los análisis fueron limitados, con menos de la mitad de los resultados del modelo evaluados con validación cruzada (39/80) y muy pocos validados externamente utilizando datos independientes sobre cáncer de ovario (7/80), a pesar de los pequeños tamaños de cohortes internas. Los métodos de validación cruzada incluyeron k-fold (22/39) con 3 a 10 pliegues, Monte Carlo (12/39) con 3 a 15 repeticiones y validaciones cruzadas sin incluir a un paciente (5/39). Algunos otros artículos incluyeron validación cruzada en el conjunto de entrenamiento para seleccionar hiperparámetros, pero utilizaron solo un pequeño conjunto de pruebas invisible de la misma fuente de datos para la evaluación. Todos los modelos validados externamente se entrenaron con WSI, con validaciones realizadas en núcleos de TMA (2/7) o WSI de fuentes de datos independientes (5/7), y dos de ellos utilizaron explícitamente diferentes escáneres para digitalizar datos internos y externos27,28. Algunos métodos informados fueron validados externamente con datos de neoplasias malignas no ováricas, pero ninguno de ellos incluyó datos de cáncer de ovario de ninguna manera, por lo que no se incluyeron en la revisión. Sin embargo, hubo un método que se entrenó únicamente con datos de tumores gastrointestinales y se validó externamente con datos de tumores de ovario16.

La mayoría de los modelos de clasificación se evaluaron utilizando precisión, precisión equilibrada y/o área bajo la curva característica operativa del receptor (AUC), con una excepción en la que solo se informó un valor p que midió la asociación entre las características histológicas y los subtipos transcriptómicos según un Kruskal- Prueba de Wallis19. Algunos modelos también se evaluaron utilizando la puntuación F1, que decidimos no tabular (en la Fig. 3) ya que las otras métricas se informaron de manera más consistente. El rendimiento del modelo de supervivencia generalmente se informó utilizando el AUC, con otras métricas que incluyen el valor p, la precisión, los índices de riesgo y el índice C, que es similar al AUC pero puede explicar la censura. Casi todos los modelos de segmentación se evaluaron de manera diferente entre sí, y diferentes estudios informaron AUC, precisión, coeficiente Dice, intersección sobre unión, sensibilidad, especificidad y evaluaciones cualitativas. Todos los modelos de regresión se evaluaron utilizando el coeficiente de determinación (estadístico R2). Para algunos modelos, el rendimiento se desglosó por paciente39,61, por subtipo16 o por clase15,24,32,57, sin una medida agregada y holística del rendimiento del modelo.

La variabilidad del rendimiento del modelo no se informó con frecuencia (33/94), y cuando se informó, a menudo fue incompleta. Esto incluyó casos en los que no estaba claro qué representaban los intervalos (intervalo de confianza del 95%, una desviación estándar, variación, etc.), o no estaba claro cuáles eran los límites exactos del intervalo debido a que los resultados se representaron pero no se indicaron explícitamente. En toda la revisión, solo hubo tres ejemplos en los que se informó variabilidad durante la validación externa27,38,39, y solo uno de los cuales informó claramente tanto los límites como el tipo de intervalo38. Ningún estudio realizó ninguna forma bayesiana de cuantificación de la incertidumbre. Los resultados informados se muestran en la Tabla 2, aunque las comparaciones directas entre el desempeño de diferentes modelos deben tratarse con precaución debido a la diversidad de datos y métodos de validación utilizados para evaluar diferentes modelos, la falta de medidas de variabilidad, los riesgos consistentemente altos de sesgo, y la heterogeneidad en las métricas informadas.

Se encontró que la gran mayoría de las investigaciones publicadas sobre IA con fines de diagnóstico o pronóstico en histopatología del cáncer de ovario tenían un alto riesgo de sesgo debido a problemas dentro de los análisis realizados. Los investigadores a menudo utilizaron una cantidad limitada de datos y realizaron análisis en una única división de datos de prueba de tren sin utilizar ningún método para tener en cuenta el sobreajuste y el optimismo del modelo (validación cruzada, arranque, validación externa). Estas limitaciones son comunes en la investigación de IA ginecológica que utiliza otros tipos de datos, y revisiones recientes señalan una utilidad clínica deficiente causada por estudios predominantemente retrospectivos que utilizan datos limitados62,63 y metodologías limitadas con validación débil, lo que corre el riesgo de sobreestimar el rendimiento del modelo64,65.

Los análisis más sólidos incluyeron un estudio en el que se evaluaron varias métricas relevantes utilizando 10 repeticiones de la validación cruzada de Monte Carlo en un conjunto de 406 WSI, con desviaciones estándar informadas para cada métrica26. Otros ejemplos positivos incluyeron el uso de validación cruzada interna y validación externa para el mismo resultado, lo que proporcionó un análisis más riguroso28,34,39. Si bien las validaciones externas fueron poco comunes, las que se realizaron ofrecieron una visión real de la generalización del modelo, con una clara reducción en el rendimiento en todos los conjuntos de validación externa excepto uno28. El único estudio que demostró una alta generalización incluyó el conjunto de capacitación más amplio de todos los enfoques validados externamente, incluyó un etiquetado de datos más extenso que muchos estudios similares e implementó una combinación de tres enfoques de normalización de color, lo que indica que estos factores pueden beneficiar la generalización.

Los estudios frecuentemente tenían un riesgo incierto de sesgo dentro de los dominios de participantes y predictores de PROBAST debido a informes incompletos. La información que con frecuencia faltaba incluía dónde se reclutó a los pacientes, cuántos pacientes se incluyeron, cuántas muestras/imágenes se utilizaron, si se excluyó algún paciente/imágenes y los métodos mediante los cuales se procesó y digitalizó el tejido. Los informes a menudo eran deficientes en relación con los conjuntos de datos de acceso abierto. Se encontró que solo tres artículos tenían bajo riesgo de sesgo para los participantes, y estos incluían estrategias de reclutamiento de pacientes y criterios de selección claros y razonables, que pueden verse como ejemplos positivos para otros investigadores37,43,56. La información sobre los predictores (imágenes histopatológicas y características derivadas de las mismas) en general se informó mejor, pero a menudo aún se omitieron detalles clave, lo que significó que no estaba claro si todas las muestras de tejido se procesaron de manera similar para evitar riesgos de sesgo debido a la heterogeneidad visual. Se encontró que cuando se informaron las características de los pacientes, a menudo mostraban un alto riesgo de sesgo. Muchos estudios incluyeron cantidades muy pequeñas de pacientes con diferencias específicas con respecto a la mayoría (por ejemplo, menos de 20 pacientes con un subtipo de cáncer diferente al de la mayoría), lo que genera un riesgo de correlaciones espurias y resultados que no son generalizables a la población en general.

Los informes fueron particularmente escasos en los estudios que utilizaron datos de acceso abierto, lo que posiblemente indica que los investigadores centrados en la IA no se estaban tomando el tiempo suficiente para comprender estos conjuntos de datos y garantizar que su investigación fuera clínicamente relevante. Por ejemplo, muchos de los investigadores que utilizaron datos de TCGA incluyeron secciones de tejido congeladas sin comentar si esto era apropiado, a pesar de que los patólogos no las consideran de calidad diagnóstica óptima. Un artículo manejó los datos TCGA de manera más apropiada, con una explicación clara de los aspectos positivos y negativos del conjunto de datos, y modelos completamente separados para FFPE y portaobjetos de tejido congelado15.

Compartir código puede ayudar a mitigar los efectos de los informes incompletos y mejorar drásticamente la reproducibilidad, pero sólo 19 de los 45 artículos hicieron esto, y algunos de ellos parecían estar incompletos o inaccesibles. Los mejores repositorios de código incluían documentación detallada para ayudar a la reproducibilidad, incluida información de configuración del entorno16,19, descripciones generales de las funciones incluidas17,36,42 y ejemplos de código utilizados para generar resultados informados57.

Se encontró que dos artículos tenían discrepancias importantes entre los datos informados y el diseño del estudio, lo que indica riesgos de sesgo mucho mayores que los observados en cualquier otra investigación46,54. En un artículo46, se informó que los datos TCGA-OV se utilizaron para subtipificar con 5 clases, a pesar de que este conjunto de datos solo incluía carcinomas serosos de alto grado y de bajo grado. En el otro artículo54, se informó que los datos de TCGA-OV se utilizaron para la clasificación a nivel de portaobjetos en clases de cáncer de ovario y cáncer no ovárico utilizando tejido teñido con PAS, a pesar de que TCGA-OV solo contenía portaobjetos de cáncer de ovario teñidos con H&E.

Si bien el protocolo de revisión fue diseñado para reducir los sesgos y maximizar la cantidad de investigación relevante incluida, hubo algunas limitaciones. Esta revisión se limita a la literatura publicada en inglés; sin embargo, la investigación sobre IA puede publicarse en otros idiomas o estar disponible como preimpresiones sin publicación en revistas revisadas por pares, lo que hace que esta revisión esté incompleta. Si bien la mayor parte del proceso de revisión fue completado por varios investigadores independientes, la detección de duplicados fue realizada por un solo investigador, lo que aumenta la posibilidad de errores en este paso del proceso de revisión, lo que resulta en exclusiones incorrectas. Debido al importante lapso de tiempo entre las búsquedas bibliográficas inicial y final (aproximadamente 12 meses), es posible que haya habido inconsistencias en las interpretaciones, tanto para la extracción de datos como para las evaluaciones del riesgo de sesgo. Finalmente, esta revisión se centró únicamente en imágenes de microscopía óptica de muestras de histopatología humana relacionadas con el cáncer de ovario, por lo que es posible que haya pasado por alto literatura útil fuera de este dominio.

El campo de la IA en el diagnóstico histopatológico del cáncer de ovario está creciendo rápidamente y desde principios de 2020 se han publicado más investigaciones que en todos los años anteriores combinados. La primera investigación, publicada entre 2010 y 2013, utilizó funciones hechas a mano para entrenar métodos de aprendizaje automático clásicos, como las SVM. Estos modelos se utilizaron para la segmentación49,50,51,53, la clasificación de malignidad18,52, la clasificación21 y la predicción de la supervivencia general21. La mayoría de estos primeros estudios se centraron en tejido teñido con IHC (5/7), que se utilizaría con mucha menos frecuencia en investigaciones posteriores (6/38).

El campo estuvo relativamente inactivo en los años siguientes, con solo 6 artículos publicados entre 2014 y 2019, la mitad de los cuales tenían el mismo autor principal29,30,48. Estos modelos todavía usaban clasificadores de ML tradicionales, aunque algunos usaban características aprendidas en lugar de las características tradicionales hechas a mano. Los modelos desarrollados se utilizaron para la subtipificación histológica29,30,48 y la clasificación celular/tejida40,57,66.

Desde 2020, se ha publicado un volumen mucho mayor de investigaciones, la mayoría de las cuales han involucrado el uso de redes neuronales profundas para la extracción y clasificación automática de características, y una minoría utiliza el modelo tradicional de aprendizaje automático17,24,31,61,67. Investigaciones recientes han investigado una gama más amplia de resultados de diagnóstico, incluida la clasificación del tipo de cáncer primario15,54, el estado de mutación24,36,44, el estado de deficiencia de recombinación homóloga42, el nivel de reacción tumor-estroma32, los subtipos transcriptómicos19,24, la inestabilidad de microsatélites24 y la estado de transición mesenquimatosa41. En la literatura más reciente también se han predicho tres resultados pronósticos adicionales: supervivencia libre de progresión17,43,56, recaída43,44 y respuesta al tratamiento19,22,33,34,35.

A pesar del progreso en algunos resultados específicos, no hubo una tendencia general obvia en los tamaños de los conjuntos de datos utilizados a lo largo del tiempo, ya sea en términos de número de diapositivas o de participantes. De manera similar, no hubo evidencia de que las investigaciones recientes incluyeran validaciones internas más rigurosas, aunque las validaciones externas han ido aumentando en frecuencia; ninguna investigación antes de 2021 incluyó ninguna validación externa con datos de cáncer de ovario, pero siete estudios publicados más recientemente sí lo hicieron16,24,27,28 ,34,38,39. Si bien estas validaciones externas generalmente se limitaron a pequeñas cantidades de datos, la inclusión de cualquier validación externa demuestra el progreso de investigaciones anteriores. Dichas validaciones son esenciales para la utilidad clínica de estos modelos, ya que la implementación en el mundo real requerirá solidez ante diferentes fuentes de heterogeneidad visual, con variaciones que se producen entre diferentes centros de datos y dentro de los centros de datos a lo largo del tiempo. A medida que este campo continúa madurando, esperamos ver que más estudios realicen validaciones exhaustivas con conjuntos de datos independientes más grandes y de alta calidad, incluidos protocolos claramente informados para el reclutamiento y selección de pacientes, la creación de diapositivas de patología y la digitalización. Esto ayudará a reducir los sesgos, la reproducibilidad limitada y la generalización limitada identificados en la mayoría de las investigaciones existentes en este dominio.

Una gran proporción de los trabajos publicados no proporcionó suficiente información clínica y patológica para evaluar el riesgo de sesgo. Es importante que los investigadores de IA informen exhaustivamente la procedencia de los datos para comprender el grado de heterogeneidad en el conjunto de datos y si esto se ha tenido en cuenta adecuadamente en el diseño del estudio. Los métodos de modelado y análisis también deben informarse exhaustivamente para mejorar la confiabilidad y la reproducibilidad. Los investigadores pueden encontrar útil consultar listas de verificación de informes, como la presentación de informes transparentes de un modelo de predicción multivariable para pronóstico o diagnóstico individual (TRIPOD)68, para asegurarse de que han comprendido e informado todos los detalles relevantes de sus estudios. En muchos estudios, no está claro cómo encajaría la IA en el flujo de trabajo clínico, o si existen limitaciones en cómo se podrían aplicar estos métodos. Los investigadores de IA deben asegurarse de comprender el contexto clínico de sus datos y los modelos potenciales antes de emprender una investigación para reducir el sesgo y aumentar la utilidad. Idealmente, esto implicará interacciones periódicas con médicos expertos, incluidos histopatólogos y oncólogos.

Para mejorar aún más la reproducibilidad, recomendamos que los investigadores pongan a disposición el código y los datos siempre que sea posible. Es relativamente fácil publicar código y generar documentación para mejorar la usabilidad, y existen pocos inconvenientes al hacerlo al publicar investigaciones. Hacer que los datos estén disponibles suele ser más difícil debido a los requisitos de seguridad de los datos y los posibles costos de almacenamiento, pero puede proporcionar beneficios más allá de la investigación primaria de los autores originales. La investigación de patología digital en el cáncer de ovario está actualmente limitada por la falta de datos de acceso abierto, lo que lleva a una dependencia excesiva de TCGA y hace que muchos investigadores recopilen minuciosamente conjuntos de datos similares pero distintos. Estos conjuntos de datos a menudo contienen poca de la heterogeneidad que se observa en los datos multicéntricos y de múltiples escáneres, lo que dificulta a los investigadores entrenar modelos sólidos o evaluar la generalización. Cuando se incluyen datos heterogéneos, a menudo incluyen pequeñas cantidades de datos que son diferentes a la mayoría, lo que introduce riesgos de sesgo y confusión en lugar de ayudar a superar estos problemas. Los estudios basados ​​en TCGA son propensos a esto, con diferencias significativas entre las diapositivas TCGA procedentes de diferentes centros de datos69, pero muchos de estos centros sólo proporcionan pequeñas cantidades de datos. Muchos investigadores dependen de datos de acceso abierto, pero existe una grave escasez de datos histopatológicos del cáncer de ovario de acceso abierto adecuados. Hacer que dichos datos estén disponibles, con protocolos detallados que describen la creación de datos, permite a los investigadores realizar análisis más exhaustivos y mejorar significativamente la generalización del modelo y la implementabilidad clínica.

Para que la IA logre utilidad clínica, es esencial que se realicen validaciones más sólidas, especialmente considerando las limitaciones de los conjuntos de datos disponibles. Recomendamos que los investigadores siempre realicen análisis exhaustivos, utilizando validación cruzada, arranque y/o validaciones externas para garantizar que los resultados sean sólidos y reflejen verdaderamente la capacidad de su(s) modelo(s) para generalizar a datos no vistos, y no simplemente causados. por casualidad. Esto debería incluir informar la variabilidad de los resultados (normalmente en un intervalo de confianza del 95%), especialmente cuando se comparan múltiples modelos para ayudar a distinguir si un modelo es realmente mejor que otro o si la diferencia se debe al azar. Las pruebas estadísticas también pueden resultar beneficiosas para estas evaluaciones. Otra opción para capturar la variabilidad es la cuantificación de la incertidumbre bayesiana, que se puede utilizar para separar la incertidumbre aleatoria (inherente) y epistémica (modelado).

La literatura actual en este campo se puede caracterizar en gran medida como prototipos de modelos con datos retrospectivos homogéneos. Los investigadores rara vez consideran la realidad de la interacción hombre-máquina, tal vez creyendo que estos modelos son un reemplazo directo para los patólogos. Sin embargo, estos modelos realizan tareas limitadas dentro del proceso de patología y no tienen en cuenta el contexto clínico más allá de sus limitados conjuntos de datos de entrenamiento y tareas aisladas. Creemos que estos modelos serían más beneficiosos (y más realistas de implementar) como herramientas de asistencia para los patólogos, proporcionando opiniones secundarias o información auxiliar novedosa. Si bien la investigación actual generalmente se centra en evaluar la precisión del modelo sin la participación de ningún patólogo, se podrían emplear diferentes diseños de estudio para evaluar mejor la utilidad en el mundo real de estos modelos como herramientas de asistencia. Por ejemplo, los estudios de usabilidad podrían investigar qué modelos son más accesibles y más informativos para los patólogos en la práctica, y los estudios prospectivos podrían cuantificar cualquier beneficio para la eficiencia del diagnóstico y los resultados de los pacientes, e investigar la solidez de los modelos en la práctica. Comprender los efectos de la IA en la eficiencia del diagnóstico es particularmente importante dada la oferta limitada de patólogos en todo el mundo. Como tal, este tipo de investigación beneficiará significativamente la traducción clínica.

Para mejorar la utilidad clínica, los investigadores deben comprender sus datos y garantizar que la investigación planificada sea clínicamente relevante antes de cualquier modelado, idealmente involucrando a los médicos durante todo el proyecto. También deberían considerar diferentes diseños de estudio, incluidos estudios de usabilidad y/o estudios prospectivos. Al evaluar modelos, los investigadores deben realizar análisis exhaustivos mediante validación cruzada, validación externa y/o arranque. Al informar sobre investigaciones, los investigadores deben informar claramente el contexto de cualquier dato histopatológico, incluido cómo se reclutó/seleccionó a los pacientes y cómo se procesaron las muestras de tejido para generar imágenes patológicas digitales. Por último, los investigadores deberían hacer que todo el código sea de acceso abierto y que los datos estén disponibles siempre que sea posible.

Se realizaron búsquedas en tres bases de datos de investigación, PubMed, Scopus y Web of Science, y en dos registros de ensayos, el Registro Cochrane Central de Ensayos Controlados (CENTRAL) y la Plataforma Internacional de Registros de Ensayos Clínicos de la Organización Mundial de la Salud (OMS-ICTRP). Las bases de datos de investigación solo incluyen revistas y actas de congresos que hayan sido sometidas a revisión por pares, lo que garantiza la integridad de las investigaciones incluidas. Las búsquedas iniciales se realizaron el 25/04/2022 y se repitieron por última vez el 19/05/2023. La estrategia de búsqueda se compuso de tres aspectos distintos: inteligencia artificial, cáncer de ovario e histopatología. Para cada aspecto, se combinaron múltiples términos relevantes usando el operador OR (por ejemplo, “inteligencia artificial” O ​​“aprendizaje automático”), y luego se combinaron usando el operador AND para garantizar que la investigación recuperada cumpliera con los tres aspectos. Se utilizó el conjunto más amplio posible de campos de búsqueda para cada motor de búsqueda, excepto para Scopus, donde se impusieron restricciones para evitar la búsqueda dentro de la lista de citas de cada artículo, que no es un campo disponible en los otros motores de búsqueda. Los términos “ML” e “AI” se restringieron a campos específicos debido a la diversidad de sus posibles significados. Para garantizar la búsqueda bibliográfica más rigurosa posible, no se impusieron restricciones en la fecha de publicación ni en el tipo de artículo durante la búsqueda.

Muchos enfoques de IA se basan en modelos estadísticos, como la regresión logística, que pueden desdibujar las líneas entre disciplinas. Al realizar búsquedas, se adoptó una metodología previamente informada70 mediante la cual los enfoques típicos de IA se buscaban por nombre (por ejemplo, redes neuronales) y otros métodos se buscaban según si los autores describían su trabajo como inteligencia artificial. Los detalles completos de la implementación de la búsqueda para cada base de datos se proporcionan en la Nota complementaria 1. El protocolo de revisión se registró en PROSPERO antes de que se examinaran los resultados de la búsqueda para su inclusión (CRD42022334730).

Un investigador (JB) eliminó manualmente los artículos duplicados con la ayuda del software de referencia EndNote X9. Luego, dos investigadores (JB, KA) seleccionaron de forma independiente los artículos para su inclusión en dos etapas, la primera basada en el título y el resumen, la segunda basada en el texto completo. Los desacuerdos fueron discutidos y arbitrados por un tercer investigador (NR o NMO). Los ensayos en WHO-ICTRP no tienen resúmenes asociados, por lo que para estos estudios, solo los títulos estaban disponibles para la selección inicial.

Los criterios de inclusión requerían que la investigación evaluara el uso de al menos un enfoque de IA para hacer inferencias de diagnóstico o pronóstico sobre imágenes de histopatología humana de casos sospechosos o confirmados de cáncer de ovario. Solo se incluyeron estudios en los que los métodos de IA se aplicaron directamente a las imágenes de patología digital o a características que se extrajeron automáticamente de las imágenes. Se incluyeron tareas fundamentales, como la segmentación y el recuento de células, ya que los patólogos podrían utilizarlas para el diagnóstico asistido por ordenador. Solo se consideraron imágenes de microscopía óptica convencional, excluyéndose otras modalidades de imágenes, como la fluorescencia y las imágenes hiperespectrales. Se excluyeron las publicaciones que no incluían investigación primaria (como los artículos de revisión). Se excluyeron los artículos en idiomas distintos del inglés y las investigaciones en las que no se podía acceder a una versión completa del manuscrito.

Un modelo en un estudio incluido se consideró un modelo de interés si cumplía con los mismos criterios de inclusión. Cuando se compararon varios modelos con el mismo resultado, se tomó como modelo de interés el modelo recientemente propuesto, y se tomó el modelo de mejor rendimiento durante la validación si esto no estaba claro. Si se evaluaron múltiples resultados de modelos en el mismo estudio, se tomó un modelo de interés para cada resultado del modelo, independientemente de cualquier similitud en los enfoques de modelado. El mismo resultado del modelo en diferentes niveles de precisión (p. ej., a nivel de parche, a nivel de portaobjetos, a nivel de paciente) no se consideró como resultados de modelo diferentes. No era necesario que los modelos fueran completamente independientes; por ejemplo, el resultado de un modelo de interés podría haberse utilizado como insumo de otro modelo de interés con la condición de que el rendimiento del modelo se evaluara por separado para cada modelo.

El riesgo de sesgo se evaluó para los modelos de interés utilizando el modelo de predicción Risk Of Bias ASsessment Tool (PROBAST)71, donde el riesgo de sesgo es la posibilidad de que los resultados informados estén distorsionados por limitaciones dentro del diseño, la realización y el análisis del estudio. Incluye 20 preguntas guía que se clasifican en cuatro dominios (participantes, predictores, resultados y análisis), que se resumen como de alto o bajo riesgo, o poco claros en el caso de que no haya información suficiente para realizar una evaluación integral. y ninguna información disponible indica un alto riesgo de sesgo. Como tal, un riesgo de sesgo poco claro no indica fallas metodológicas, sino informes incompletos.

El dominio de participantes cubre el reclutamiento y selección de participantes para garantizar que la población del estudio sea consistente y representativa de la población objetivo. Los detalles relevantes incluyen la estrategia de reclutamiento de participantes (cuándo y dónde se reclutaron los participantes), los criterios de inclusión y cuántos participantes se reclutaron.

El dominio de predictores cubre la definición y medición consistentes de predictores, que en este campo generalmente se refiere a la generación de imágenes de patología digital. Esto incluye métodos para fijar, teñir, escanear y procesar digitalmente el tejido antes de modelarlo.

El dominio de resultados cubre la definición apropiada y la determinación consistente de etiquetas de verdad sobre el terreno. Esto incluye los criterios utilizados para determinar el diagnóstico/pronóstico, la experiencia de cualquier persona que determine estas etiquetas y si las etiquetas se determinan independientemente de los resultados del modelo.

El dominio de análisis cubre consideraciones estadísticas en la evaluación del desempeño del modelo para garantizar resultados válidos y no excesivamente optimistas. Esto incluye muchos factores, como el número de participantes en el conjunto de pruebas con cada resultado, los enfoques de validación utilizados (validación cruzada, validación externa, arranque, etc.), las métricas utilizadas para evaluar el desempeño y los métodos utilizados para superar los obstáculos. efectos de la censura, riesgos competitivos/factores de confusión y datos faltantes. Los riesgos causados ​​por algunos de estos factores están interrelacionados; por ejemplo, el riesgo de sesgo por el uso de un conjunto de datos pequeño se mitiga en cierta medida mediante la validación cruzada, que aumenta el tamaño efectivo del conjunto de pruebas y puede usarse para evaluar la variabilidad, lo que reduce el optimismo. en los resultados. Además, el riesgo causado por el uso de un conjunto de datos pequeño depende del tipo de resultado que se predice; por ejemplo, se requieren más datos para un análisis sólido de la clasificación de cinco clases que para la clasificación binaria. También debe haber datos suficientes dentro de todos los subgrupos de pacientes relevantes; por ejemplo, si se incluyen múltiples subtipos de cáncer de ovario, no debe haber un subtipo que solo esté representado por unos pocos pacientes. Debido a estos factores interrelacionados, no existen criterios estrictos para determinar el tamaño apropiado de un conjunto de datos, aunque es probable que menos de 50 muestras por clase o menos de 100 muestras en total se consideren de alto riesgo, y es probable que más de 1000 muestras en total considerarse de bajo riesgo.

A menudo surgen riesgos de sesgo debido a metodologías inconsistentes. La inconsistencia en los dominios de participantes y predictores puede causar heterogeneidad en las propiedades visuales de las diapositivas de patología digital, lo que puede conducir a correlaciones falsas, ya sea por azar o por diferencias sistemáticas entre subgrupos en el conjunto de datos. Los datos variados pueden ser beneficiosos durante el entrenamiento para mejorar la generalización del modelo cuando se utilizan conjuntos de datos grandes, aunque esto debe controlarse estrechamente para evitar la introducción de confusión sistemática. La determinación inconsistente del resultado puede significar que los resultados de un estudio no sean confiables debido a correlaciones falsas en las etiquetas de verdad fundamentales, o que no sean válidos debido a una determinación incorrecta de las etiquetas.

Si bien PROBAST proporciona un marco para evaluar los riesgos de sesgo, existe cierto nivel de subjetividad en la interpretación de las preguntas de señalización. Como tal, cada modelo fue analizado por tres investigadores independientes (cualquiera de JB, KA, NR, KZ, NMO), con al menos un informático y un médico involucrados en la evaluación del riesgo de sesgo para cada modelo. La aplicabilidad del análisis de investigación PROBAST no se implementó porque no es adecuado para una gama tan diversa de posibles preguntas de investigación.

La extracción de datos fue realizada de forma independiente por dos investigadores (JB, KA) utilizando un formulario que contenía 81 campos dentro de las categorías Descripción general, Datos, Métodos, Resultados y Varios. Varios de estos campos se agregaron o aclararon durante la extracción de datos con el acuerdo de ambos investigadores y se aplicaron retroactivamente a toda la literatura aceptada. El formulario de extracción de datos final está disponible en www.github.com/scjjb/OvCaReview y se resume en la Tabla complementaria 1.

Se buscó información de artículos de texto completo, así como de referencias y materiales complementarios cuando correspondiera. Sólo se hicieron inferencias cuando ambos investigadores estaban seguros de que se proporcionaba la información correcta, y los desacuerdos se resolvieron mediante discusión. Los campos que no se pudieron completar con seguridad se etiquetaron como poco claros.

Todos los datos extraídos se resumieron en dos tablas, una para las características a nivel de estudio y otra a nivel de modelo. En estas tablas sólo se incluyeron modelos de interés. El término resultado del modelo se refiere al resultado del modelo, ya sea un resultado clínico (diagnóstico/pronóstico) o un resultado relevante para el diagnóstico que podría usarse para el diagnóstico asistido por computadora, como la segmentación de tumores. La síntesis de datos no incluyó ningún metanálisis debido a la diversidad de métodos incluidos y resultados del modelo. Se siguieron las pautas PRISMA 2020 para informar revisiones sistemáticas, con listas de verificación proporcionadas en las Tablas complementarias 2 y 3.

Los autores declaran que los datos principales que respaldan los hallazgos de este estudio están disponibles en el artículo y en sus archivos de información complementaria. Los datos adicionales están disponibles del autor correspondiente previa solicitud.

Sung, H. y col. Estadísticas mundiales sobre el cáncer 2020: estimaciones de Globocan de incidencia y mortalidad en todo el mundo para 36 cánceres en 185 países. CA Cáncer J. Clin. 71, 209–249 (2021).

Artículo PubMed Google Scholar

Menon, U. et al. Detección poblacional de cáncer de ovario y mortalidad después de un seguimiento a largo plazo en el Ensayo colaborativo de detección de cáncer de ovario del Reino Unido (UKCTOCS): un ensayo controlado aleatorio. Lanceta 397, 2182–2193 (2021).

Artículo PubMed PubMed Central Google Scholar

Ebell, MH, Culp, MB y Radke, TJ Una revisión sistemática de los síntomas para el diagnóstico del cáncer de ovario. Soy. J. Anterior. Medicina. 50, 384–394 (2016).

Artículo PubMed Google Scholar

Berek, JS, Renz, M., Kehoe, S., Kumar, L. y Friedlander, M. Cáncer de ovario, trompas de Falopio y peritoneo: actualización de 2021. En t. J. Gynecol. Obstet. 155, 61–85 (2021).

Artículo de Google Scholar

Köbel, M. y col. Los subtipos de carcinoma de ovario son enfermedades diferentes: implicaciones para los estudios de biomarcadores. PLoS Med. 5, e232 (2008).

Artículo PubMed PubMed Central Google Scholar

Prat, J. Clasificación por etapas del cáncer de ovario, trompas de Falopio y peritoneo. En t. J. Gynecol. Obstet. 124, 1–5 (2014).

Artículo de Google Scholar

Matsuno, RK y cols. Acuerdo para el grado tumoral del carcinoma de ovario: análisis de los tejidos de archivo del depósito de tejido residual de vigilancia, epidemiología y resultados finales. Control de causas del cáncer 24, 749–757 (2013).

Artículo PubMed PubMed Central Google Scholar

Köbel, M. y col. La determinación del histotipo del carcinoma de ovario es altamente reproducible y se mejora mediante el uso de inmunohistoquímica. Histopatología 64, 1004–1013 (2014).

Artículo PubMed Google Scholar

Barnard, ME y cols. Concordancia entre patólogos y reportes de patología para las características del tumor de ovario en los estudios de salud del enfermero. Ginecol. Oncol. 150, 521–526 (2018).

Artículo PubMed PubMed Central Google Scholar

Wilson, ML y cols. Acceso a servicios de patología y medicina de laboratorio: una brecha crucial. Lanceta 391, 1927-1938 (2018).

Artículo PubMed Google Scholar

Real Colegio de Patólogos. Satisfacer la demanda de patología: censo de población activa en histopatología. https://www.rcpath.org/static/952a934d-2ec3-48c9-a8e6e00fcdca700f/Meeting-Pathology-Demand-Histopathology-Workforce-Census-2018.pdf (2018).

Baidoshvili, A. y col. Evaluación de los beneficios de la implementación de patología digital: ahorro de tiempo en la logística del laboratorio. Histopatología 73, 784–794 (2018).

Artículo PubMed Google Scholar

Stenzinger, A. y col. Inteligencia artificial y patología: de los principios a la práctica y aplicaciones futuras en histomorfología y perfiles moleculares. Semín. Biol del cáncer. 84, 129-143 (2022).

Artículo CAS PubMed Google Scholar

Raciti, P. y col. La validación clínica del diagnóstico patológico aumentado por inteligencia artificial demuestra avances significativos en la precisión diagnóstica en la detección del cáncer de próstata. Arco. Patol. Laboratorio. Medicina. https://doi.org/10.5858/arpa.2022-0066-OA (2022).

Kalra, S. y col. Consenso diagnóstico de cáncer mediante la búsqueda de imágenes histopatológicas de archivo mediante inteligencia artificial. npj Dígito. Medicina. 3, 31 (2020).

Artículo PubMed PubMed Central Google Scholar

Meng, Z. y col. Un sistema basado en aprendizaje profundo capacitado para la detección de tumores del estroma gastrointestinal puede identificar múltiples tipos de tumores de tejidos blandos. Soy. J. Pathol. 193, 899–912 (2023).

Artículo PubMed Google Scholar

Boehm, KM y cols. La integración de datos multimodal mediante aprendizaje automático mejora la estratificación del riesgo de cáncer de ovario seroso de alto grado. Nat. Cáncer 3, 723–733 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Kothari, S., Phan, JH, Osunkoya, AO y Wang, MD Interpretación biológica de patrones morfológicos en imágenes histopatológicas de portaobjetos completos. En Actas de la Conferencia ACM sobre Bioinformática, Biología Computacional y Biomedicina 218–225 (ACM, 2012).

Yu, KH y cols. Descifrando la histopatología del carcinoma de ovario seroso y la respuesta del platino mediante redes neuronales convolucionales. BMC Med. 18, 1-14 (2020).

Artículo de Google Scholar

Liu, T., Su, R., Sun, C., Li, X. y Wei, L. EOCSA: Predicción del pronóstico del cáncer de ovario epitelial con imágenes histopatológicas de portaobjetos completos. Sistema experto. Aplica. 206, 117643 (2022).

Artículo de Google Scholar

Poruthoor, A., Phan, JH, Kothari, S. y Wang, MD Exploración de métodos de integración de datos de imágenes genómicas, proteómicas e histopatológicas para la predicción clínica. En 2013 Cumbre IEEE China y Conferencia Internacional sobre Procesamiento de Señales e Información 259–263 (IEEE, 2013).

Yaar, A., Asif, A., Raza, SEA, Rajpoot, N. y Minhas, F. Transferencia de conocimientos entre dominios para la predicción de la quimiosensibilidad en pacientes con cáncer de ovario. En Actas de la Conferencia IEEE/CVF sobre talleres de visión por computadora y reconocimiento de patrones 928–929 (IEEE, 2020).

Ghoniem, RM, Algarni, AD, Refky, B. & Ewees, AA Modelo de aprendizaje profundo evolutivo multimodal para el diagnóstico de cáncer de ovario. Simetría 13, 643 (2021).

Artículo de Google Scholar

Zeng, H., Chen, L., Zhang, M., Luo, Y. & Ma, X. La integración de imágenes histopatológicas y análisis ómicos multidimensionales predice las características moleculares y el pronóstico en el cáncer de ovario seroso de alto grado. Ginecol. Oncol. 163, 171–180 (2021).

Artículo CAS PubMed Google Scholar

Holback, C. y col. Colección de cáncer de ovario del atlas del genoma del cáncer (TCGA-OV) (versión 4) [conjunto de datos]. El archivo de imágenes del cáncer. https://wiki.cancerimagingarchive.net/pages/viewpage.action?pageId=7569497 (2016).

Levine, AB y cols. Síntesis de imágenes de patología del cáncer de calidad diagnóstica mediante redes generativas adversarias. J. Pathol. 252, 178–188 (2020).

Artículo CAS PubMed Google Scholar

Boschman, J. y col. La utilidad de la normalización del color para el diagnóstico basado en IA de imágenes patológicas teñidas con hematoxilina y eosina. J. Pathol. 256, 15-24 (2022).

Artículo CAS PubMed Google Scholar

Farahani, H. y col. Diagnóstico de histotipos basado en aprendizaje profundo de imágenes de patología de portaobjetos completos de carcinoma de ovario. Modificación. Patol. 35, 1983-1990 (2022).

Artículo CAS PubMed Google Scholar

BenTaieb, A., Li-Chang, H., Huntsman, D. y Hamarneh, G. Diagnóstico automático de carcinomas de ovario mediante una representación escasa de tejido multiresolución. En Computación de imágenes médicas e intervención asistida por computadora – MICCAI 2015: 18.a Conferencia Internacional, Munich, Alemania, 5 al 9 de octubre de 2015, Actas, Parte I 18 629–636 (Springer, 2015).

BenTaieb, A., Nosrati, MS, Li-Chang, H., Huntsman, D. y Hamarneh, G. Clasificación automática de subtipos de carcinoma de ovario de inspiración clínica. J. Pathol. Informática 7, 28 (2016).

Artículo de Google Scholar

Jiang, J. y col. Estudio basado en patología digital de las características morfológicas a nivel de células y tejidos en tumores de ovario serosos límite y cáncer de ovario seroso de alto grado. J. Pathol. Informática 12, 24 (2021).

Artículo de Google Scholar

Jiang, J. y col. La evaluación computacional de la reacción del estroma tumoral condujo a nuevos descubrimientos de fibrosis asociada al pronóstico y de firmas moleculares en el carcinoma de ovario seroso de alto grado. Frente. Medicina. 9, 994467 (2022).

Artículo de Google Scholar

Wang, C.-W. et al. Un método de aprendizaje profundo débilmente supervisado para guiar el tratamiento del cáncer de ovario e identificar un biomarcador eficaz. Cánceres 14, 1651 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Wang, C.-W. et al. Aprendizaje profundo débilmente supervisado para la predicción de la eficacia del tratamiento en el cáncer de ovario a partir de imágenes histopatológicas. Computadora. Medicina. Gráficos de imágenes 99, 102093 (2022).

Artículo de Google Scholar

Wang, C.-W. et al. Conjunto interpretable de aprendizaje profundo basado en la atención para el tratamiento personalizado del cáncer de ovario sin anotaciones manuales. Computadora. Medicina. Gráficos de imágenes 107, 102233 (2023).

Artículo de Google Scholar

Ho, DJ y col. Segmentación del cáncer de ovario basada en el aprendizaje interactivo profundo de imágenes de diapositivas completas teñidas con h&e para estudiar los patrones morfológicos de la mutación brca. J. Pathol. Informática 14, 100160 (2023).

Artículo de Google Scholar

Paijens, ST y cols. Cuantificación pronóstica basada en imágenes de subconjuntos de células t cd8cd103 en pacientes con cáncer de ovario seroso de alto grado. Oncoinmunología 10, 1935104 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Shin, SJ y cols. Estrategia de transferencia de estilo para desarrollar una aplicación de aprendizaje profundo generalizable en patología digital. Computadora. Métodos Programas Biomédicos. 198, 105815 (2021).

Artículo PubMed Google Scholar

Mayer, RS y cols. Cómo aprender con errores intencionales: conjuntos ruidosos para superar la mala calidad del tejido para el aprendizaje profundo en patología computacional. Frente. Medicina. 9, 959068 (2022).

Artículo de Google Scholar

Du, Y. et al. Clasificación del epitelio y estroma tumoral mediante la explotación de características de imagen aprendidas por redes neuronales convolucionales profundas. Ana. Biomédica. Ing. 46, 1988-1999 (2018).

Artículo PubMed PubMed Central Google Scholar

Hu, Y. et al. Predecir rasgos moleculares a partir de la morfología de los tejidos mediante el aprendizaje autointeractivo de múltiples instancias. En Computación de imágenes médicas e intervención asistida por computadora – MICCAI 2022: 25.a conferencia internacional, Singapur, 18 al 22 de septiembre de 2022, Actas, Parte II 130-139 (Springer, 2022).

Lazard, T. y col. El aprendizaje profundo identifica patrones morfológicos de deficiencia de recombinación homóloga en cánceres de mama luminales a partir de imágenes de diapositivas completas. Representante celular Med. 3, 100872 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Yokomizo, R. et al. Clase de vidrio O3c: un marco de aprendizaje automático para la predicción pronóstica del carcinoma de células claras de ovario. Bioinformática Biol. Perspectivas 16, 11779322221134312 (2022).

Artículo de Google Scholar

Nerón, C. et al. Aprendizaje profundo para predecir la mutación de brca y la supervivencia a partir de diapositivas digitales H&E de cáncer de ovario epitelial. En t. J. Mol. Ciencia. 23, 11326 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Wu, M. y col. Exploración de indicadores pronósticos en las imágenes patológicas del cáncer de ovario basados ​​en una red profunda de supervivencia. Frente. Gineta. 13, 1069673 (2023).

Artículo PubMed PubMed Central Google Scholar

Kasture, KR, Choudhari, D. & Matte, PN Predicción y clasificación del cáncer de ovario mediante una red neuronal convolucional profunda mejorada. En t. J. Ing. Tecnología de tendencias. 70, 310–318 (2022).

Artículo de Google Scholar

Kowalski, PA, Błoniarz, J. y Chmura, Ł. Redes neuronales convolucionales en la detección del cáncer de ovario. En Inteligencia computacional y matemáticas para abordar problemas complejos 2 55–64 (Springer, 2022).

BenTaieb, A., Li-Chang, H., Huntsman, D. y Hamarneh, G. Un modelo latente estructurado para la subtipificación del carcinoma de ovario a partir de portaobjetos de histopatología. Medicina. Imagen Anal. 39, 194-205 (2017).

Artículo PubMed Google Scholar

Dong, J., Li, J., Lu, J. & Fu, A. Segmentación automática para imágenes inmunohistoquímicas de cáncer de ovario según el criterio de croma. En 2010, 2ª Conferencia Internacional sobre Control Informático Avanzado, vol. 2 147–150 (IEEE, 2010).

Dong, J., Li, J., Fu, A. y Lv, H. Segmentación automática para imágenes inmunohistoquímicas de cáncer de ovario basadas en el espacio de color YUV. En 2010, Conferencia Internacional sobre Ingeniería Biomédica e Informática 1–4 (IEEE, 2010).

Signolle, N., Revenu, M., Plancoulaine, B. y Herlin, P. Segmentación de textura multiescala basada en ondas: aplicación a la caracterización del compartimento estromal en portaobjetos virtuales. Proceso de señal. 90, 2412–2422 (2010).

Artículo de Google Scholar

Janowczyk, A., Chandran, S., Feldman, M. y Madabhushi, A. Escala morfológica local: aplicación a la segmentación de linfocitos infiltrantes de tumores en tmas de cáncer de ovario. En Medical Imaging 2011: Procesamiento de imágenes, vol. 7962 827–840 (SPIE, 2011).

Janowczyk, A. y col. Segmentación de biomarcadores de alto rendimiento en micromatrices de tejido de cáncer de ovario mediante cortes jerárquicos normalizados. Traducción IEEE. Biomédica. Ing. 59, 1250-1252 (2012).

Ramasamy, S. & Kaliyaperumal, V. Un enfoque de selección de canales hibridados con una red neuronal convolucional profunda para una predicción eficaz del cáncer de ovario en imágenes teñidas con ácido periódico de Schiff. Computación de concurrencia. Practica. Exp. 35, e7568 (2023).

Artículo de Google Scholar

Gentles, L. et al. Integración de algoritmos de análisis automatizados asistidos por computadora en el desarrollo y validación de biomarcadores inmunohistoquímicos en cáncer de ovario. J.Clin. Patol. 74, 469–474 (2021).

Artículo CAS PubMed Google Scholar

Laury, AR, Blom, S., Ropponen, T., Virtanen, A. y Carpén, OM El análisis de imágenes basado en inteligencia artificial puede predecir el resultado en el carcinoma seroso de alto grado mediante histología únicamente. Ciencia. Rep. 11, 19165 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Heindl, A. y col. La divergencia de nicho microambiental da forma a la plasticidad morfológica del cáncer de ovario desregulado por BRCA1. Nat. Comunitario. 9, 3917 (2018).

Artículo PubMed PubMed Central Google Scholar

Ilse, M., Tomczak, J. & Welling, M. Aprendizaje profundo de múltiples instancias basado en la atención. En Conferencia internacional sobre aprendizaje automático 2127–2136 (PMLR, 2018).

Lu, MI y col. Patología computacional con eficiencia de datos y débilmente supervisada en imágenes de diapositivas completas. Nat. Biomédica. Ing. 5, 555–570 (2021).

Artículo PubMed PubMed Central Google Scholar

Él, K. et al. Transformadores en el análisis de imágenes médicas: una revisión. Intel. Medicina. 3, 59–78 (2022).

Elie, N. y col. Impacto de los métodos automatizados para la evaluación cuantitativa de la inmunotinción: hacia la patología digital. Frente. Oncol. 12, 931035 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Shrestha, P. y col. Una revisión sistemática sobre el uso de la inteligencia artificial en imágenes ginecológicas: antecedentes, estado del arte y direcciones futuras. Ginecol. Oncol. 166, 596–605 (2022).

Zhou, J., Cao, W., Wang, L., Pan, Z. & Fu, Y. Aplicación de la inteligencia artificial en el diagnóstico y predicción pronóstica del cáncer de ovario. Computadora. Biol. Medicina. 146, 105608 (2022).

Artículo PubMed Google Scholar

Fiste, O., Liontos, M., Zagouri, F., Stamatakos, G. y Dimopoulos, MA Aplicaciones de aprendizaje automático en cáncer ginecológico: una revisión crítica. Crítico. Rev. Oncol. Hematol. 179, 103808 (2022).

Xu, H.-L. et al. Rendimiento de la inteligencia artificial en la identificación del cáncer de ovario basada en imágenes: una revisión sistemática y un metanálisis. EClinicalMedicine 53, 101662 (2022).

Artículo PubMed PubMed Central Google Scholar

Lorsakul, A. et al. Análisis automatizado de diapositivas completas de imágenes ihc de campo claro múltiple para células cancerosas y fibroblastos asociados a carcinoma. En Imágenes Médicas 2017: Patología Digital, vol. 10140 41–46 (SPIE, 2017).

Salguero, J. et al. Selección de muestras de entrenamiento para la clasificación del cáncer de ovario mediante un enfoque de agrupación semisupervisado. En Imágenes médicas 2022: patología digital y computacional, vol. 12039 20–24 (SPIE, 2022).

Collins, GS, Reitsma, JB, Altman, DG & Moons, KG Informes transparentes de un modelo de predicción multivariable para pronóstico o diagnóstico individual (trípode): la declaración del trípode. Ana. Interno. Medicina. 162, 55–63 (2015).

Artículo PubMed Google Scholar

Dehkharghanian, T. y col. Datos sesgados, IA sesgada: las redes profundas predicen el sitio de adquisición de imágenes TCGA. Diagnóstico. Patol. 18, 1-12 (2023).

Artículo de Google Scholar

Dhiman, P. y col. Realización metodológica de modelos de predicción de pronóstico desarrollados mediante aprendizaje automático en oncología: una revisión sistemática. BMC Med. Res. Método. 22, 101 (2022).

Artículo PubMed PubMed Central Google Scholar

Wolff, RF y cols. Probast: una herramienta para evaluar el riesgo de sesgo y la aplicabilidad de los estudios de modelos de predicción. Ana. Interno. Medicina. 170, 51–58 (2019).

Artículo PubMed Google Scholar

Köbel, M. y col. El diagnóstico del tipo de célula del carcinoma de ovario es altamente reproducible: un estudio transcanadiense. Soy. J. Cirugía. Patol. 34, 984–993 (2010).

Artículo PubMed Google Scholar

Descargar referencias

No hubo financiación directa para esta investigación. JB cuenta con el apoyo del Consejo de Investigación en Ingeniería y Ciencias Físicas de UKRI (EPSRC) [EP/S024336/1]. KA y PA cuentan con el apoyo de Tony Bramall Charitable Trust. AS cuenta con el apoyo de Innovate UK a través del Consorcio Nacional de Imágenes Médicas Inteligentes (NCIMI) [104688], Cancer Research UK [C19942/A28832] y Leeds Hospitals Charity [9R01/1403]. Los financiadores no tuvieron ningún papel a la hora de influir en el contenido de esta investigación. A efectos de acceso abierto, el autor ha aplicado una licencia Creative Commons Attribution (CC BY) a cualquier versión del manuscrito aceptado por el autor que surja de este envío.

Estos autores supervisaron conjuntamente este trabajo: Nicolas M. Orsi, Nishant Ravikumar.

Centro de Tecnologías de Simulación e Imágenes Computacionales en Biomedicina (CISTIB), Facultad de Computación, Universidad de Leeds, Leeds, Reino Unido

Jack Breen y Nishant Ravikumar

Instituto de Investigación Médica de Leeds en St James's, Facultad de Medicina, Universidad de Leeds, Leeds, Reino Unido

Katie Allen, práctica avanzada, Andrew Scarsbrook y Nicholas M. Orsi

Centro Oncológico de Leeds, Hospital Universitario de St James, Leeds, Reino Unido

Kieran Zucker y Geoff Hall

Departamento de Radiología, Hospital Universitario de St James, Leeds, Reino Unido

Pratik Adusumilli y Andrew Scarsbrook

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

JB creó el protocolo del estudio con comentarios y contribuciones de todos los demás autores. JB, KA, KZ, NMO y NR realizaron evaluaciones del riesgo de sesgo. JB y KA realizaron la extracción de datos. JB analizó los datos extraídos y escribió el manuscrito, con comentarios y contribuciones de todos los demás autores.

Correspondencia a Jack Breen.

GH recibe financiación para investigación de IQVIA. NMO recibe financiación para investigación de 4D Path. Los demás autores no declaran tener intereses en conflicto.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Breen, J., Allen, K., Zucker, K. et al. Inteligencia artificial en histopatología del cáncer de ovario: una revisión sistemática. npj Precis. Una vez. 7, 83 (2023). https://doi.org/10.1038/s41698-023-00432-6

Descargar cita

Recibido: 31 de marzo de 2023

Aceptado: 01 de agosto de 2023

Publicado: 31 de agosto de 2023

DOI: https://doi.org/10.1038/s41698-023-00432-6

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt