Uso del aprendizaje automático para identificar cánceres no diagnosticables

Compartir

por Bendta Schroeder, Instituto de Tecnología de Massachusetts

Enrico Moiso et al, Developmental Deconvolution for Classification of Cancer Origin, Cancer Discovery (2022). DOI: 10.1158/2159-8290.CD-21-1443

Recopilado por Carlos Cabrera Lozada. Miembro Correspondiente Nacional, ANM puesto 16 . ORCID: 0000-0002-3133-5183. 03/09/2022

Uso del aprendizaje automático para identificar cánceres no diagnosticables
«Las herramientas de aprendizaje automático como esta podrían capacitar a los oncólogos para elegir tratamientos más efectivos y brindar más orientación a sus pacientes», dice el investigador clínico del Instituto Koch, Salil Garg. Crédito: Instituto de Tecnología de Massachusetts

El primer paso para elegir el tratamiento adecuado para un paciente con cáncer es identificar su tipo específico de cáncer, incluida la determinación del sitio primario: el órgano o la parte del cuerpo donde comienza el cáncer.

En casos raros, el origen de un cáncer no se puede determinar, incluso con pruebas exhaustivas. Aunque estos cánceres de origen primario desconocido tienden a ser agresivos, los oncólogos deben tratarlos con terapias no dirigidas, que con frecuencia tienen toxicidades severas y resultan en bajas tasas de supervivencia.

Un nuevo enfoque de aprendizaje profundo desarrollado por investigadores del Instituto Koch para la Investigación Integrativa del Cáncer en el MIT y el Hospital General de Massachusetts (MGH) puede ayudar a clasificar los cánceres de origen primario desconocido al observar más de cerca los programas de expresión génica relacionados con el desarrollo y la diferenciación celular temprana.

«A veces puedes aplicar todas las herramientas que los patólogos tienen para ofrecer, y todavía te quedas sin una respuesta», dice Salil Garg, investigador clínico de Charles W. (1955) y Jennifer C. Johnson en el Instituto Koch y patólogo en MGH. «Las herramientas de aprendizaje automático como esta podrían capacitar a los oncólogos para elegir tratamientos más efectivos y brindar más orientación a sus pacientes».

Garg es el autor principal de un nuevo estudio, que aparece en la edición del 30 de agosto de la revista Cancer Discovery. La herramienta de inteligencia artificial es capaz de identificar tipos de cáncer con un alto grado de sensibilidad y precisión. Garg es el autor principal del estudio, y el postdoc del MIT Enrico Moiso es el autor principal.

Aprendizaje automático en desarrollo

Analizar las diferencias en la expresión génica entre diferentes tipos de tumores de origen primario desconocido es un problema ideal para que el aprendizaje automático lo resuelva. Las células cancerosas se ven y se comportan de manera muy diferente a las células normales, en parte debido a las extensas alteraciones en la forma en que se expresan sus genes. Gracias a los avances en el perfil de células individuales y los esfuerzos para catalogar diferentes patrones de expresión celular en atlas celulares, hay abundantes datos, aunque, para los ojos humanos, abrumadores, que contienen pistas sobre cómo y de dónde se originaron los diferentes tipos de cáncer.

Sin embargo, construir un modelo de aprendizaje automático que aproveche las diferencias entre las células sanas y normales, y entre los diferentes tipos de cáncer, en una herramienta de diagnóstico es un acto de equilibrio. Si un modelo es demasiado complejo y tiene en cuenta demasiadas características de la expresión génica del cáncer, el modelo puede parecer que aprende los datos de entrenamiento perfectamente, pero falla cuando encuentra nuevos datos. Sin embargo, al simplificar el modelo al reducir el número de características, el modelo puede pasar por alto los tipos de información que conducirían a clasificaciones precisas de los tipos de cáncer.

Con el fin de lograr un equilibrio entre la reducción del número de características y la extracción de la información más relevante, el equipo centró el modelo en los signos de vías de desarrollo alteradas en las células cancerosas. A medida que un embrión se desarrolla y las células indiferenciadas se especializan en varios órganos, una multitud de vías dirige cómo las células se dividen, crecen, cambian de forma y migran. A medida que el tumor se desarrolla, las células cancerosas pierden muchos de los rasgos especializados de una célula madura. Al mismo tiempo, comienzan a parecerse a las células embrionarias de alguna manera, ya que adquieren la capacidad de proliferar, transformarse y hacer metástasis en nuevos tejidos. Se sabe que muchos de los programas de expresión génica que impulsan la embriogénesis están reactivados o desregulados en las células cancerosas.

Los investigadores compararon dos atlas de células grandes, identificando correlaciones entre el tumor y las células embrionarias: el Atlas del Genoma del Cáncer (TCGA), que contiene datos de expresión génica para 33 tipos de tumores, y el Atlas de Células de Organogénesis del Ratón (MOCA), que perfila 56 trayectorias separadas de células embrionarias a medida que se desarrollan y diferencian.

«Las herramientas de resolución de una sola célula han cambiado drásticamente la forma en que estudiamos la biología del cáncer, pero cómo hacemos que esta revolución tenga un impacto en los pacientes es otra pregunta», explica Moiso. «Con la aparición de atlas celulares del desarrollo, especialmente aquellos que se centran en las fases tempranas de la organogénesis, como MOCA, podemos expandir nuestras herramientas más allá de la información histológica y genómica y abrir las puertas a nuevas formas de perfilar e identificar tumores y desarrollar nuevos tratamientos».

El mapa resultante de correlaciones entre los patrones de expresión génica del desarrollo en células tumorales y embrionarias se transformó en un modelo de aprendizaje automático. Los investigadores desglosaron la expresión génica de muestras tumorales de la TCGA en componentes individuales que corresponden a un punto específico de tiempo en una trayectoria de desarrollo, y asignaron a cada uno de estos componentes un valor matemático. Luego, los investigadores construyeron un modelo de aprendizaje automático, llamado Perceptrón Multicapa del Desarrollo (D-MLP), que puntúa un tumor por sus componentes de desarrollo y luego predice su origen.

Clasificación de tumores

Después del entrenamiento, el D-MLP se aplicó a 52 nuevas muestras de cánceres particularmente desafiantes de primaria desconocida que no pudieron diagnosticarse utilizando las herramientas disponibles. Estos casos representaron los más desafiantes vistos en MGH durante un período de cuatro años a partir de 2017. Emocionantemente, el modelo clasificó los tumores en cuatro categorías y produjo predicciones y otra información que podría guiar el diagnóstico y el tratamiento de estos pacientes.

Por ejemplo, una muestra provino de una paciente con antecedentes de cáncer de mama que mostró signos de un cáncer agresivo en los espacios de líquido alrededor del abdomen. Los oncólogos inicialmente no pudieron encontrar una masa tumoral y no pudieron clasificar las células cancerosas utilizando las herramientas que tenían en ese momento. Sin embargo, el D-MLP predijo fuertemente el cáncer de ovario. Seis meses después de que la paciente se presentara por primera vez, finalmente se encontró una masa en el ovario que resultó ser el origen del tumor.

Además, las comparaciones sistemáticas del estudio entre las células tumorales y embrionarias revelaron información prometedora, y a veces sorprendente, sobre los perfiles de expresión génica de tipos de tumores específicos. Por ejemplo, en las primeras etapas del desarrollo embrionario, se forma un tubo intestinal rudimentario, con los pulmones y otros órganos cercanos que surgen del intestino anterior, y gran parte del tracto digestivo que se forma a partir del intestino medio y posterior. El estudio mostró que las células tumorales derivadas del pulmón mostraron fuertes similitudes no solo con el intestino anterior como era de esperar, sino con las trayectorias de desarrollo derivadas de la mitad y el intestino posterior. Hallazgos como estos sugieren que las diferencias en los programas de desarrollo podrían algún día explotarse de la misma manera que las mutaciones genéticas se usan comúnmente para diseñar tratamientos personalizados o dirigidos contra el cáncer.

Si bien el estudio presenta un enfoque poderoso para clasificar los tumores, tiene algunas limitaciones. En trabajos futuros, los investigadores planean aumentar el poder predictivo de su modelo mediante la incorporación de otros tipos de datos, en particular la información obtenida de la radiología, la microscopía y otros tipos de imágenes tumorales.

«La expresión génica del desarrollo representa solo una pequeña porción de todos los factores que podrían usarse para diagnosticar y tratar cánceres», dice Garg. «Integrar la radiología, la patología y la información de expresión génica juntos es el verdadero siguiente paso en la medicina personalizada para pacientes con cáncer».

Deja un comentario

Academia Nacional de Medicina