Les Modèles d’épidémies sur base de données mobiles | MU 12.11.2015

Avec Nicolas de Cordes, vice-président marketing anticipation du Groupe Orange, et Stefania Rubrichi, biomedical engineer & data scientist

Epidemium
Epidemium
Jan 20, 2017 · 10 min read

Trois questions à…

What are the potential uses of Mobile meta data for development?

NC&SR : Orange will present a sample of results of the 2 challenges they ran in Ivory coast in 2012–13 and Senegal in 2014–15. Examples taken from national statistics, transportation, urban planning, food security will be illustrated demonstrating the very powerful new insights this material provide. It will also present some key challenges, in ethics and privacy, facing organizations willing to share data for research.

How can mobile phone data be used for epidemiology?

NC&SR : It is widely acknowledged that social and behavioral factors are important determinants of health and disease. Particularly, mobility and social structures play a central role in epidemics spread. For many infectious disease, transmission takes place when people are co-located, thus spreading is driven by individuals’ movement.

What are the difficulties using these data ?

NC&SR : One of the main difficulties relates to the real-time availability and access to both mobility and disease information, in order to deal with behavioral change in the population. Behavioral changes, in fact, may produce a high impact on disease containment and mitigation. Orange will present some results form the analysis of the importance and relevant effects of behavioral changes and will propose some possible future directions.


Compte rendu

Présentation des travaux sur les usages des données des réseaux mobiles qui sont extraites, packagées et traitées pour tenter de parvenir à des conclusions vertueuses. C’est une opération complexe et difficile. Volonté de mettre en avant les réalisations en cette matière et l’intérêt d’une telle action.

Introduction

Il y a de nombreuses questions sur les données et leurs liens avec les objectifs de développement. Il est nécessaire de mesurer ces objectifs, donc de se demander comment les mesurer. Il est possible d’utiliser les statistiques nationales ou bien de nouvelles méthodes, des moyens plus rapides. Il y a tellement d’éléments à mesurer que les sondages ou les études de marché, par exemple, ne sont plus suffisants. Le big data devient alors un des moyens pour mesurer les objectifs de développement.

Exemples du traitement des données et d’application

  • Exemple 1 : recherche sur l’indice de pauvreté.

Problèmes rencontrés

Ouvrir les données pour une entreprise privée, c’est difficile : il y a des données sensibles, les données sont potentiellement sources de richesse, etc. De plus, l’exploitation des données soulève de nombreuses questions éthiques, de gouvernance, de sécurité, etc. Néanmoins, il est nécessaire de trouver une solution car les bénéfices liés à cette ouverture prudente peuvent être importants. Comment solutionner ces problèmes ? Comment packager les données ? Comment créer un accès sécurisé aux données ? Comment fournir ces données aux clients mêmes qui les génèrent ? Que peut-on inventer pour que la société puisse bénéficier de ces données, de ce nouvel outil d’observation de la société ?


Échange avec le public

Illustration : Barbara Govin

Public : Avez-vous confronté votre modèle à certaines épidémies en Afrique ?

NC&SR : Nous sommes en cours, mais il existe des études qui ont validé ce type de modèle. La mise en place de ces études pose de nombreuses questions. Par exemple, il est difficile d’isoler des populations à risque en cas de crise, c’est une décision lourde à prendre par les autorités nationales. Donc il est indispensable, au préalable d’être sûr que ces modèles sont valides. Quand ils seront stabilisés, il faudra discuter des processus de gouvernance, d’éthique car leur application soulève des risques.

Public : Ces techniques pourraient-elles être appliquées à d’autres maladies, qui ne seraient pas des épidémies, comme le cancer ?

NC&SR : Ces types de modèles sont utilisés initialement dans le cas des épidémies où la transmission des maladies est due au contact. Par conséquent, ils ne sont pas forcément applicables au cancer. C’est une piste à creuser, par exemple l’analyse de mobilité dans des zones chargées de pollution (fumées, etc.) pourrait être un indicateur intéressant. Il faudrait pour ce faire avoir des observations sur de longues périodes de temps, ce qui à ce stade est très difficile.

Public : Comment penser leur application ? Comment penser cette mesure des épidémies ?

NC&SR : Les individus ont souvent peur d’être tracés par leur smartphone. Néanmoins ils pensent aussi que ces données pourraient être bénéfiques avec par exemples la mesure de l’activité physique. Les données peuvent traduire un comportement culturel, potentiellement lié à une dimension ethnique, ce qui peut en faire une information sensible. De ce fait et pour d’autres raisons, traiter les data issues de la téléphonie mobile à des niveaux individuels, ou de tout petits groupes, demande le consentement des consommateurs et une attention particulière.

Public : Dans ces pays, Orange comme opérateur ne représente qu’un certain pourcentage de la population et non sa globalité. Par conséquent, n’y a-t-il pas un biais dans ces études ? L’État a-t-il tenté de rassembler des données d’autres opérateurs ?

NC&SR : Dans beaucoup de nos pays, Orange est soit leader soit second ; la couverture n’est pas totale mais assez complète en géographie et en couverture de population, pour l’analyse de données. Comme montré précédemment il est possible, par exemple par les types d’appel, de voir les classes de la population : on constate la pauvreté car les appels sont très courts, payés à la seconde ou car un même téléphone est partagé par plusieurs personnes. Ces informations concernent un région, et avec notre positionnement grand public, et les tarifs à bas coûts que nous offrons en Afrique, nous avons une part de marché qui représente raisonnablement bien la population qui peut s’offrir des services de téléphonie…mais pas les plus pauvres malheureusement. De plus, pour compenser l’absence de couverture totale, il est possible dans certains pays de corriger l’échantillon et d’inférer. Possible de simuler la globalité du réseau. Enfin, il est très peu probable que tous les opérateurs partageront en une database toutes leurs données car cela représenterait un risque trop important, autant pour les clients que pour des raisons commerciales.

Public : Comment faire si un individu malade se déplace sans appeler et donc sans émettre de données ?

NC&SR : Quand on n’appelle pas, il y a d’autres méthodes que la capture de CRA (Compte rendu d’appel) quand on bouge, les antennes capturent suivent la position des téléphonne pour pouvoir faire aboutir les appels s’il y en a un qui arrive pour un correspondant. La collaboration entre les antennes pour s’informer des position des téléphones génèrent une très grande quantité de données (l’antenne qui capte le signal le plus proche prenant le relais sur la précédente) trop importante que pour être conservée. Des technologies existent pour exploiter ces signaux, et sont utilisée dans un produit commercial d’Orange (Flux Vision) avec une anonymisation et agrégation d’échantillons en temps réel.

Public : Comment met-on en application ce type d’études ?

NC&SR : Lorsque l’on réalise ce type d’études, cela génère beaucoup d’attente, d’espérance. Les gouvernements sont intéressés mais ils n’ont souvent pas les moyens de les transformer directement en réalité. Il est donc difficile de pérenniser ces initiatives. Nous devons réfléchir à comment passer de ces recherches à quelque chose à industrialiser. À ce stade de l’industrie, il y a un manque d’argent, de compétences, d’habitude de travail, etc. De plus, le temps pose problème car ces études sont longues à mettre en place et leurs résultats demandent du temps. Il y a deux étapes : voir si un projet est faisable et l’implémenter.

Public : Est-il difficile de convaincre les gouvernements africains ? Qu’en est-il de la politique de l’open data en Afrique ?

NC&SR : Il est nécessaire de trouver et de parler aux bonnes personnes mais ce n’est parfois pas suffisant. La question du budget se pose toujours.

Public : Comment collecter les données ?

NC&SR : Il y a un mécanisme permanent pour récolter ces informations. La fonction première des données téléphoniques est de contrôler, de calculer combien de temps et où les personnes téléphonent afin de faire la facture. La loi du pays parfois demande de garder les numéros. Si la loi ne le contraint pas alors ces derniers sont supprimés. Parfois la loi d’un pays demande de supprimer complètement ou de les anonymiser.

Public : Quel est l’état de l’open data en Afrique ?

NC&SR : Une bonne source d’information est l’initiative Open Government Partnership. Il y a des gouvernements progressistes comme au Kenya. Il est bien entendu très rare de voir de la private open data ; c’est souvent de l’open gouvernement data our de l’Open Academic.

Public : Orange dispose des discussions des individus. Serait-il possible, dans l’avenir, d’analyser des mots clefs, de faire une analyse sémantique avec le niveau d’anonymisation nécessaire et donc d’enrichir les données ?

NC&SR : Non, c’est tout à fait inenvisageable chez Orange. Mais j’ai entendu que d’autre opérateurs le faisaient. effectivement, ce type d’information serait utile pour étudier la dynamique d’une maladie. Néanmoins, chez Orange, la culture de la compagnie empêcherait de travailler sur les sms. Il serait peut-être possible de penser une formule : sms gratuit en échange de la possibilité de les étudier ? Si on veut étudier les sms, il est nécessaire d’être très clair vis-à-vis des utilisateurs et de demander leur consentement explicite. Néanmoins, en Italie, Stefania Rubrichi a pu travailler sur des sms anonymisés.

EPIDEMIUM

Inclusive and community-based open science program dedicated to cancer research through data challenges

Epidemium

Written by

Epidemium

Exploring New Paths to Cancer Research with Epidemium: a data challenge oriented and community-based open science program #Open #Data #Science

EPIDEMIUM

EPIDEMIUM

Inclusive and community-based open science program dedicated to cancer research through data challenges