ARSCO : Analyse des Réseaux Sociaux pour renforcer la lutte contre le COvid-19 en Côte d’Ivoire

Julien Capgras
data354
Published in
4 min readNov 16, 2021

Le projet est né d’une question toute simple : “Comment mesurer l’impact des mesures anti-covid en Côte d’Ivoire ?”.

La Côte d’Ivoire est un pays où des actions telles qu’un confinement peuvent avoir un fort impact sur la population. Il est donc important de pouvoir mesurer et quantifier les retombées et les conséquences de ces mesures.

Les réseaux sociaux, qui disposent d’une grande base d’utilisateurs en Côte d’Ivoire, nous ont paru pouvoir être un bon proxy du “ressenti” à chaud de la population. En effet ces données peuvent contenir de nombreuses informations, que ce soit sur la volumétrie (observation de pics dans les 24h qui suivent une annonce politique), l’analyse de sentiment (quelle est la perception exprimée dans le tweet ou le commentaire ? Est-elle positive, neutre, négative ?), la fréquence des mots clés utilisés (exemple de la tendance sur le mot clé “vaccin” ou sur les noms des fabricants de vaccins).

Facebook et Twitter sont les principaux réseaux sociaux utilisés par la population en Côte d’Ivoire. L’accès aux données Facebook étant très compliqué à avoir (demande d’autorisation d’utilisation des API auprès de Meta, la maison mère de Facebook), nous avons essentiellement utilisés les données de Twitter qui sont, par définition, publiques.

Instagram et TikTok n’ont pas été utilisés, d’une part car ce sont des réseaux sociaux utilisant peu de textes et d’autre part car ils ne sont pas représentatifs de la population ivoirienne.

Une démarche data-ops

Pour réaliser le projet, une équipe pluridisciplinaire a été mise en place. Elle était composée d’un architecte data / chef de projet, un data engineer, un data scientist, un data analyst et un linguiste. Cela a permis d’apporter toutes les compétences pour mettre en place une architecture “data-ops”.

La première étape a été de réaliser un pipeline automatisé de collecte des données (les tweets en l’occurence) et ce de la manière la plus ciblée, sur la Côte d’Ivoire et le pays environnants. Ces données sont automatiquement anonymisées, retraitées pour être RGPD-compliant puis stockées dans un datalake sur le cloud Azure. Nous avons fait le choix d’utiliser le cloud pour bénéficier des facilités qu’ils offrent et également pour renforcer les compétences de l’équipe sur l’utilisation de services cloud.

Une fois un volume suffisant de données collectées, deux tâches ont été développées en parallèle. La première a été de concevoir des dashboards sur PowerBI pour permettre aux utilisateurs d’avoir une vue d’ensemble des données : volumétrie, fréquence des mots clés, des pays, etc. La deuxième tâche, plus longue, a consisté à appliquer du machine learning sur ces données, notamment de l’analyse de sentiment. Le data scientist de l’équipe a benchmarké divers algorithmes afin de construire un modèle pertinent. Le fonctionnement intégré de l’équipe a permis de très rapidement intégrer ce modèle dans le pipeline de traitement des données afin de visualiser les résultats dans le PowerBI.

Tableau de bord général de l’application

Des enquêtes sur le terrain pour compléter les réseaux sociaux

L’analyse des données collectées sur les réseaux sociaux a été accompagnée d’enquêtes sur le terrain. Ces enquêtes ont été fondamentales pour mieux percevoir l’impact auprès d’une partie de la population qui n’a pas accès aux réseaux sociaux soit par manque d’accès à ces supports soit par une méconnaissance de la langue française. Les entretiens ont été menés en baoulé et dioula, deux langues parmi les plus parlées en Côte d’Ivoire. Cela a permis d’une part de mieux comprendre comment les citoyens évoquent le covid et les termes associés dans ces langues qui, très souvent, n’ont pas de terme précis pour traduire une grande partie de cette nouvelle terminologie. L’analyse des résultats met en avant des enseignements intéressants tel que le fait que le covid soit associé à des termes liés au paludisme. Cela permet de fournir des débuts de pistes sur la compréhension par ces populations du covid et comment mieux répondre à leurs attentes.

Suivi COVID pour le CICG

Des utilisateurs qui en redemandent…

Les instances gouvernementales telles que le CICG (Centre d’Information et de Communication Gouvernementale) ont, dès les premières utilisations de la plateforme, vite saisi l’intérêt de s’approprier l’outil et de le généraliser à d’autres thématiques. L’outil est en train d’évoluer afin de permettre au CICG de capturer les tendances sur des sujets d’actualité ou des projets de fonds comme l’hôtellerie étant donné la priorité accordée par l’Etat au développement du tourisme, ou bien les infrastructures.

Ce travail a bénéficié du financement et du soutien de « #Data4COVID19 Africa Challenge », l’un des nombreux projets de l’initiative « COVID-19 — Health in Common » lancée par la France via l’Agence Française de Développement (AFD) en réponse à la crise mondiale de santé publique causée par la pandémie de COVID-19. Le défi a été conçu et mis en œuvre en collaboration avec Expertise France et The GovLab. Il visait à soutenir les projets qui utilisent des données traditionnelles et non-traditionnelles de manière innovante pour aborder le COVID-19 et ses conséquences. Les opinions exprimées ainsi que les idées et les résultats énumérés dans ce document n’engagent que les auteurs des défis et ne représentent pas nécessairement une position de l’AFD, Expertise France, ou de The GovLab qui ne seront pas responsables de l’utilisation faite des informations présentées. Plus d’informations sur le défi sont disponibles sur : https://datachallenge.africa/

--

--

Julien Capgras
data354
Writer for

Passionate about Africa and travels there a lot to exchange with people and to share insights with local ecosystems.