Les patients d’aujourd’hui sont les thérapies de demain – Pourquoi nous investissons dans Owkin

Bruno Raillard
Frst
Published in
5 min readJan 16, 2018

(English version here)

Nous annonçons aujourd’hui leader un investissement de 11M$ dans Owkin, qui applique le transfer learning et le federated learning aux données médicales pour accélérer la découverte et le développement de nouvelles thérapies.

Avec déjà plusieurs partenariats solides avec des centres hospitaliers et des laboratoires pharmaceutiques de premier plan et une belle 10e place au Data Science Bowl 2017 sur Kaggle, Owkin s’est hissée en moins d’un an parmi les acteurs les plus innovants de l’intelligence artificielle appliquée aux données de santé.

Le business model historique de l’industrie pharmaceutique n’est plus rentable

Historiquement, le business model de l’industrie pharmaceutique reposait sur une activité de R&D intense (~160Bn$ de dépenses/an, 22% du CA des laboratoires) pour assurer les revenus futurs.

Ce modèle est fortement remis en cause depuis plusieurs années sous plusieurs effets qui se conjuguent : difficulté croissante à trouver de véritables innovations, essor des génériques et biosimilaires, et pression croissante sur les prix de la part des autorités de régulation.

Cela a pour conséquence une décroissance tendancielle du ROI des nouvelles molécules:

ROI de la R&D, basé sur les prévisions de revenus (1)

Le coût de R&D d’une nouvelle molécule est de 3Bn$ et dure 13 ans en moyenne, avec des méthodes paradoxalement encore très manuelles et itératives. Ce coût élevé est également une barrière à l’exploration de nouveaux territoires (maladies orphelines, thérapies ciblées, traitements personnalisés…) où le nombre de patients cibles est plus restreint, rendant l’équation financière peu attractive voire impossible en l’état actuel de la R&D.

R&D pipeline : taux de succès p(TS) & coût par étape (2)

L’amélioration de la productivité de la R&D est donc le challenge clé de l’industrie, en jouant sur les axes suivants :

  • Prioriser des molécules à plus forte valeur (i.e. offrant un bénéfice plus fort aux patients/à la société)
  • Augmenter la probabilité de succès d’un essai clinique (i.e. fiabiliser le process de développement)
  • Optimiser les coûts de la R&D (coûts médicaux comme frais généraux associés)
  • Réduire le cycle de développement

Les volumes de données sont gigantesques, mais jalousement gardés

La progression récente des technologies de machine learning (notamment NLP et deep learning) peut permettre d’apporter de la productivité à de nombreuses étapes de la chaîne de R&D des médicaments, pour la rendre plus « data-driven », et pour parvenir à simuler/prédire sur ordinateur les effets d’une molécule plutôt que de systématiquement la tester en laboratoire ou lors d’essais cliniques.

Mais cela se confronte à un écueil majeur : la sensibilité extrème de tous les acteurs à la protection de leurs données (y compris par la règlementation), pour des raisons évidentes de confidentialité notamment pour ce qui concerne les données patients. En témoigne l’émoi qu’a logiquement déclenché l’accord entre DeepMind et le NHS au UK.

Pourtant, correctement traitées, ces données recèlent des richesses infinies d’information qui pourraient permettre de catégoriser plus finement les patients pour mieux les diagnostiquer, d’identifier de nouveaux traitements, d’étudier le comportement des médicaments après leur mise sur le marché (Docétaxel anyone ?)…

Les algorithmes passent, la data reste

Thomas et Gilles, les fondateurs d’Owkin, ont rapidement constitué une équipe de recherche de premier plan pour s’attaquer à ce challenge et apporter une réponse éthique et innovante.

Le résultat, c’est Socrates – une plateforme dédiée aux chercheurs en laboratoire et en centres hospitaliers, leur permettant d’utiliser une librairie d’algorithmes pré-entraînés pour exploiter leurs propres données (imagerie médicale, prélèvements sanguins, données patients, notes non structurées, génomique, épigénétique, …) afin d’identifier de nouveaux biomarqueurs — c’est-à-dire des manifestations biologiques permettant d’identifier la présence d’une maladie (diagnostic), de prédire sa virulence ou les risques de rechute (pronostic), ou encore de prédire la réponse d’un patient à un traitement (prédiction).

La particularité de Socrates est qu’il utilise le tranfer learning et le federated learning, deux disciplines à la pointe du machine learning. Le transfer learning permet à un algorithme d’améliorer son apprentissage sur un dataset grâce à son exposition préalable à un autre dataset ; le federated learning permet de réaliser un apprentissage sur des données distribuées sans avoir besoin de les localiser au même endroit.

De ce fait, Socrates capitalise sur le savoir accumulé dans d’autres contextes pour délivrer une analyse extrêmement précise, même sur des petits datasets.

Et surtout, cela permet également à Socrates de mutualiser l’apprentissage entre tous les utilisateurs de la plateforme, sans que les données ne soient jamais dévoilées ni déplacées des serveurs sécurisés de chaque hôpital/laboratoire ; assurant ainsi un niveau inégalé de confidentialité et de sécurité aux utilisateurs, pleinement adapté aux contraintes extrêmement fortes du secteur.

Parvenir à exploiter les gigantesques réserves de données de santé existantes dans le respect des règles de confidentialité est la clé pour révolutionner le modèle historique de la R&D pharmaceutique et permettre la mise au point de thérapies ciblées.

C’est le projet d’Owkin et de son équipe pluri-disciplinaire de chercheurs en AI, ingénieurs et médecins.

En regardant plus loin, leur approche permettra de faire émerger un modèle innovant de partage de la valeur extraite des données en rémunérant les établissements apporteurs de données proportionnellement à la “contributivité” de leurs datasets à l’amélioration des algorithmes ; leur offrant par là-même un canal additionnel de revenus et réduisant le coût de la santé pour le contribuable et le patient.

Sources

(1) Etude Deloitte, 2016

(2) Paul, Mytelka et al,How to improve R&D productivity:the pharmaceutical industry’s grand challenge — Nature Mars 2010; Etude PWC — Pharma 2020 Marketing the future

--

--