Aplicaciones de Machine Learning al Estudio de la Metástasis Cerebral

Marc-Saturdays
Saturdays.AI
Published in
5 min readJun 29, 2024

En la reciente cumbre de Saturdays.AI en Asturias, el grupo 2 hizo la presentación de un proyecto innovador que aplica técnicas de machine learning al estudio de la metástasis cerebral. Este proyecto, desarrollado por un grupo talentoso de personas, busca predecir el tiempo de supervivencia de los pacientes y anticipar las recaídas de la enfermedad, proporcionando herramientas valiosas para mejorar la calidad de vida de los afectados. Aquí, comparto un resumen detallado de este fascinante proyecto y su relevancia en el campo de la medicina moderna.

¿Quiénes son los autores del proyecto?

El equipo detrás de este proyecto está compuesto por cinco entusiastas de la inteligencia artificial y la medicina:

  • Adrián Aguado García
  • Arturo Linares Muñiz
  • Mateo Rodríguez Suárez
  • Olumayowa Onabanjo
  • Raquel Martínez Martínez

Este equipo ha trabajado arduamente para combinar sus conocimientos en machine learning y oncología para abordar uno de los problemas más desafiantes en el tratamiento del cáncer.

¿Qué es la metástasis cerebral?

La metástasis cerebral ocurre cuando las células cancerosas de otras partes del cuerpo migran al cerebro. Este tipo de cáncer es particularmente agresivo y difícil de tratar, ya que implica la invasión de células malignas en el tejido cerebral. La detección temprana y los tratamientos avanzados son cruciales para mejorar la calidad de vida de los pacientes. Sin embargo, conocer el tiempo de supervivencia y predecir recaídas son aspectos que pueden marcar una gran diferencia en la planificación del tratamiento y el apoyo emocional a los pacientes y sus familias.

Metástasis cerebral

Objetivos del proyecto

El proyecto tiene dos objetivos principales:

  1. Predecir el tiempo de supervivencia: Utilizando datos clínicos y medidas morfológicas, el equipo ha desarrollado modelos que pueden estimar con precisión cuánto tiempo le queda a un paciente.
  2. Predecir recaídas: Identificar cuándo es probable que un paciente experimente una recaída, lo que puede ayudar a los médicos a planificar intervenciones más eficaces y personalizadas.

El “Dataset” utilizado

El equipo trabajó con el MOLAB Brain Metastasis Dataset, un conjunto de datos que incluye resonancias magnéticas, datos clínicos y medidas morfológicas de 75 pacientes. Este dataset es fundamental para el entrenamiento de los modelos de machine learning debido a su riqueza y detalle.

Resonancia magnética a lo largo del tiempo.

Datos clínicos:

Los datos clínicos incluyen variables como la edad, el sexo, el tipo de tumor primario, los tratamientos recibidos, y el seguimiento de resonancias magnéticas a lo largo del tiempo. Estos datos permiten crear un perfil detallado de cada paciente, esencial para el análisis predictivo.

Medidas morfológicas:

Las medidas morfológicas abarcan las dimensiones y características de los tumores, como el volumen total, el espesor de las secciones y el espacio entre cortes. Estos datos son cruciales para entender cómo evoluciona el tumor y cómo puede afectar al paciente.

Estrategia y metodología

La preparación y análisis de datos fue un proceso meticuloso que incluyó la limpieza de datos, la resolución de celdas vacías y problemas de formato. El equipo utilizó una variedad de diagramas y gráficos para entender las relaciones entre las variables y determinar las mejores técnicas de machine learning a aplicar.

Distribución de datos clínicos (edad, tumor primario, tiempo de supervivencia y causa de muerte)

Enfoque de predicción:

La selección del enfoque de predicción fue un desafío para el equipo del proyecto, dado el pequeño tamaño del dataset y la variabilidad de los tumores. El equipo optó por enfoques tanto binarios como multiclase para comparar el rendimiento del modelo.

Evolución temporal del volumen total del tumor visto por tumor y por paciente.

Modelos utilizados:

El equipo del proyecto probó varios métodos de machine learning, incluyendo:

  • Árboles de decisión
  • Regresión logística
  • Redes neuronales
  • Bosques aleatorios
  • XGBoost
Mapa conceptual de métodos de ML que muestra modelos seleccionados de los principales grupos de ML (Classical, Reinforcement, Neural Networks/Deep Learning & Ensemble methods), resaltando los utilizados en el proyecto.

Cada uno de estos modelos tiene sus propias fortalezas y debilidades, y el equipo evaluó su desempeño en función de la precisión y la capacidad de generalización.

Resultados

Objetivo 1: Predecir el tiempo de supervivencia

Utilizando el modelo de XGBoost, el equipo logró una precisión de hasta el 75% en la predicción del tiempo de supervivencia de los pacientes. Otros modelos, como la regresión logística y los árboles de decisión, también mostraron buenos resultados, aunque con menor precisión.

Objetivo 2: Predecir la recaída de la lesión

Los resultados para la predicción de recaídas fueron más variados debido a la alta variabilidad en el crecimiento tumoral. Sin embargo, los árboles de decisión y XGBoost mostraron el mejor rendimiento entre los modelos probados, con una precisión que osciló entre el 47% y el 59%.

Transparencia y ética

Uno de los aspectos más destacados del proyecto es su enfoque en la transparencia. El equipo utilizó valores SHAP (SHapely Additive exPlanations) para explicar el impacto de cada variable en los resultados del modelo, haciendo que las predicciones sean más comprensibles y confiables tanto para los médicos como para los pacientes.

Futuras líneas de investigación

El equipo identificó varias áreas para futuras investigaciones, incluyendo:

  • Predicción de la causa de muerte.
  • Ajuste del umbral de crecimiento tumoral para definir recaídas.
  • Incremento del tamaño del dataset mediante el uso de redes generativas adversariales.
  • Explorar nuevas divisiones de datos para mejorar la precisión del modelo.

Conclusiones

El proyecto demostró ser prometedor en la predicción del tiempo de supervivencia, aunque la predicción de recaídas aún requiere mejoras y más datos. A pesar de las limitaciones del tamaño del dataset, los resultados obtenidos son un buen punto de partida para futuros estudios y aplicaciones en la medicina.

La aplicación de machine learning en la medicina, y específicamente en el estudio de la metástasis cerebral, abre nuevas posibilidades para mejorar el tratamiento y la calidad de vida de los pacientes. Este proyecto no solo muestra el potencial de la inteligencia artificial en la predicción médica, sino que también resalta la importancia de la colaboración interdisciplinaria y la transparencia en la investigación científica.

Recursos

Para aquellos interesados en profundizar más en este proyecto, aquí están algunos recursos útiles:

--

--