Tecnología chilena para combatir la obesidad

Jocelyn Dunstan, investigadora del Centro de Modelamiento Matemático de la Universidad de Chile (CMM), ha logrado pronosticar la tasa de sobrepeso de distintos países utilizando Inteligencia Artificial. Este avance permitiría ahorrar costos en encuestas y mediciones, así como entregar información actualizada para el desarrollo de políticas públicas más efectivas.

Cristóbal Undurraga
Option.blog
4 min readAug 8, 2019

--

Jocelyn Dunstan. Foto CMM

Durante los últimos treinta años se han triplicado los índices de obesidad en el mundo. Para enfrentar esta epidemia con políticas públicas, los gobiernos deben realizar encuestas de salud y alimentación, que tienen altos costos y que, debido a su complejidad, se realizan con intervalos muy largos de tiempo entre una y otra.

En Chile, por ejemplo, la información se recoge cada seis años, lo que evidentemente tiene un impacto en la posibilidad de desarrollar planes de salud que realmente impacten a los chilenos. La última Encuesta Nacional de Salud 2016–2017 tuvo un costo de casi $1.500 millones para el Estado chileno y arrojó que el 74,2% de la población chilena tiene exceso de peso y el 31,2% acumula grasa de forma excesiva en su cuerpo, es decir, es obesa.

Además del alto costo y la complejidad que tienen este tipo de mediciones, existe lo que Jocelyn Dunstan, investigadora del Centro de Modelamiento Matemático y académica de la Facultad de Medicina de la Universidad de Chile, describió en una entrevista con emol como el sesgo de autorreporte.

“Predecir obesidad a partir del consumo de alimentos es difícil, pues existe lo que se llama el sesgo de autorreporte. Si uno le pregunta a la gente qué comió ayer se puede olvidar de las cosas, y por un deseo de aceptación social podría no nombrarte cuánta comida procesada comió el día anterior”.

Machine Learning al rescate

Frente a este difícil escenario, Jocelyn Dunstan, junto a su equipo de investigadores chilenos y norteamericanos de la Universidad John Hopkins, buscaron soluciones en la Inteligencia Artificial para formular alternativas que den cuenta de cómo afecta el sobrepeso a la población. Para esto, se plantearon la siguiente pregunta, ¿podemos predecir la prevalencia de obesidad basándonos solamente en la venta de alimentos?

La respuesta fue positiva. El equipo realizó el análisis utilizando Machine Learning, formularon tres algoritmos con dos ingredientes: el primero, la tasa de obesidad de 79 países y el segundo, bases de datos con las ventas de 52 categorías de productos en esos mismos países.

“Yo simplemente puse todas las categorías de alimentos que tenía, que eran 52, todos los países y traté de hacer el ejercicio de que el computador mirando los datos pudiese decirme: Ya, dada estas ventas de alimentos… este es el porcentaje de obesidad que debe haber en este país”, aclara Dunstan.

Los resultados lograron predecir los índices de obesidad con una margen de error muy bajo y con costos mucho menores que las encuestas nacionales, permitiendo llevar una cuenta actualizada del estado de esta enfermedad en los distintos países, además de identificar ciertas categorías de alimentos que son más relevantes a la hora de predecirla, como las masas y harinas, quesos y bebidas carbonatadas. De hecho, cuando se aplica el algoritmo sobre los datos de compra de estas tres categorías, se consiguió reducir ligeramente el margen de error.

Este hallazgo permitió al equipo trabajar con una base de datos reducida, realizando un proceso de síntesis conocido como reducción de dimensionalidad, que consiste en disminuir el número de variables para quedarse con las que mejor explican la variabiliad de los datos.

“La base de datos es chica, pero de buena calidad. Así, uno puede estrujarla y obtener datos mucho más seguido que con una encuesta. Porque aquí no estamos hablando de big data. Para nada. Más bien yo hablaría de small data”, señala Jocelyn.

Uno de los grandes beneficios de la metodología utilizada por Dunstan y sus compañeros es la obtención de resultados replicables y fácilmente reutilizables, de hecho, todo el código desarrollado en el entrenamiento de las máquinas está publicado para que investigadores de todo el mundo tengan acceso a el. Además, significa un gran avance para los usos de Machine Learning en el ámbito de la salud pública, donde a diferencia de otras áreas como la ingeniería, las matemáticas o la física, no está tan extendido.

--

--