Annexe 3 : Epidemium, les résultats du Challenge4Cancer

Barbara Govin - CC BY NC ND

Challenge4Cancer (C4C) :

Un grand appel à projets, du 5 novembre 2015 au 5 mai 2016,
sous forme de coopétition, qui était structuré autour de quatre grandes thématiques, centrées sur l’épidémiologie du cancer et de la science des données, dans lesquelles des équipes pouvaient se constituer et développer un projet :

  1. Comprendre la répartition du cancer dans le temps et dans l’espace.
  2. Facteurs de risques et facteurs protecteurs du cancer.
  3. Méta-épidémiologie : comprendre le cancer à partir de la littérature scientifique et médicale.
  4. Changements environnementaux et cancer.

Ces thématiques étant complexes et la forme des projets n’étant pas présupposée, les équipes étaient encouragées à développer une certaine forme de transdisciplinarité en employant des compétences allant de la data science au domaine de la santé, en passant par les sciences sociales ou encore le design.


La Feuille de route


Les projets du Challenge4Cancer

Thématique 1 : Comprendre la répartition du cancer dans le temps et dans l’espace

> Viz4Cancer : site web de visualisation interactive des différents jeux de données disponibles (page Wiki)

// Objectif du projet : Représenter graphiquement l’évolution de différents types de cancers en France et la variation de plusieurs facteur socio-environnementaux.

// Outils : API Web de traitement de données ; visualisation graphique. dynamique.

// Qu’est-ce que cela va changer ? Permettre aux équipes pluridisciplinaires de disposer d’un langage de visualisation commun, disponible sur ce site.

> CancerViz : accélérer la phase d’analyse exploratoire de données (page Wiki)

// Objectif du projet : Proposer un outil de data visualisation qui facilite la phase d’acquisition des données et permette d’initier des premières analyses exploratoires.

// Outils : Une technology full-stackbasée sur des technologies open source de traitement, analyse et front-end.

// Qu’est-ce que cela va changer ? Un outil de visualisation interactive multicritères accessible sur ce site.

Thématique 2 : Facteurs de risque et facteurs de protection du cancer

> Baseline : modéliser l’incidence et la mortalité du cancer selon un grand nombre de facteurs (page Wiki)

// Objectif du projet : La prévention des cancers, en cherchant les secrets qui résident dans les différentes conditions de vie dans le monde.

// Outils : Techniques (Data Science Studio, MySQL et SQLite…) ; collaboratifs (hackathons de modélisation).

// Qu’est-ce que cela va changer ? Mieux comprendre les facteurs de risques du cancer au regard des conditions de vie pour mieux les éviter demain.

> Approches prédictives et risque de cancer : mesurer l’influence des facteurs environnementaux sur les risques de cancer

// Objectif du projet : Analyser l’impact des facteurs environnementaux cancérogènes sur l’incidence des cancers ; construire un indicateur d’exposition d’une population de référence à certains facteurs.

// Outils : Codes Python et R.

// Qu’est-ce que cela va changer ? Mise en œuvre d’algorithmes de prédiction de l’incidence du cancer.

Thématique 3 : Méta-épidemiologie : comprendre le cancer à partir de la littérature scientifique médicale

> OncoBase : produire de l’information de qualité sur le cancer pouvant servir de socle commun aux analyses statistiques (page Wiki)

// Objectif du projet : Uniformiser les données hétérogènes disponibles grâce à l’automatisation de la collecte, l’agrégation, l’homogénéisation et l’unification des données.

// Outils : Programmes d’analyse des données ; parallélisation et agrégation.

// Qu’est-ce que cela va changer ? Des bases de données issues de la littérature scientifique de qualité plus homogène permettent d’éviter les conclusions erronées et d’améliorer la recherche.

> BD4Cancer : combiner analyses big data et approches BioNLP pour la pharmacovigilance et la pharmacogénomique (page Wiki)

// Objectif du projet : Identifier les effets indésirables des médicaments anti-cancer ; extraire des connaissances à partir de la littérature biomédicale et des essais cliniques pour prédire de nouvelles interactions médicamenteuses.

// Outils : Environnement d’analyse big data ; algorithmes de machine learning et librairies NLP ; librairies Javascript, …

// Qu’est-ce que cela va changer ? Un système de pharmacovigilance en temps réel et la prédiction de nouvelles interactions médicamenteuses.

Thématique 4 : Changements environnementaux et cancer

> ELSE — Evolutive Life Selection Experience : un jeu éducatif autour d’un personnage né en 2000 qui voit ses risques de cancer fluctuer en fonction des choix qu’il prend (page Wiki)

// Objectif du projet : Sensibiliser aux facteurs de risque liés aux cancers grâce à un outil ludique.

// Outils : Analyse big data ; interface graphique.

// Qu’est-ce que cela va changer ? Une application pédagogique mise en ligne et disponible pour tous sur ce site.

> Venn : avoir une vision globale de la recherche en oncologie environnementale

// Objectif du projet : À partir des abstracts sur les publications scientifiques de la plateforme Pubmed, extraire et analyser les liens entre cancer et facteurs environnementaux.

// Outils : Outil de recherche intelligent ; machine learning ; logiciel de fouille du texte biomédical.

// Qu’est-ce que cela va changer ? Webapp interactive de visualisation des mots-clefs par topic, disponible sur ce site.

Retrouvez la version web du Livre blanc.

Rejoignez la communauté Meetup, Twitter & Facebook.