Plonge dans le Machine Learning et la Data Science

Younès Rharbaoui
Join Lion
Published in
6 min readApr 9, 2019

Lion lance une formation pour t’apprendre à écrire ton premier algo de Machine Learning, et bien plus encore ;)

Data scientist is the sexiest job of the 21st century” titrait il y a quelques temps la fameuse Harvard Business Review. Mais derrière les articles racoleurs et les buzzwords, qu’est-ce qui se cache vraiment dans l’univers de la Data Science ?

Pour t’aider à découvrir ces métiers, Lion sa Track Data Science

👉 6 sessions et 1 journée d’ateliers chez Lion.

Le data scientist joue des rôles multiples dans l’entreprise. Il sait coder, mener des analyses statistiques, et traduire en problèmes mathématiques les demandes des équipes produit ou marketing.

C’est également un raffineur : il doit travailler et nettoyer les données pour les rendre exploitables et en tirer le plus d’informations.

Enfin, le data scientist est un voyant moderne : il utilise les données à sa disposition et des techniques d’analyse prédictive et d’intelligence artificielle pour anticiper les comportements des clients.

Pour découvrir ce métier passionnant, Lion te propose d’écrire tes premiers algorithme de Machine Learning et de découvrir les subtilités du job d’un Data Scientist !

POURQUOI FAIRE CETTE FORMATION ? 🤔

  • Pour découvrir les métiers de la Data Science et comprendre les fondements de l’Intelligence Artificielle 🧠
  • Pour apprendre à programmer en Python 🐍
  • Pour manipuler des données volumineuses et apprendre à les analyser 🧬
  • Pour voir que les statistiques ne sont pas qu’un mauvais souvenir de lycée 🤓
  • Pour savoir appliquer un modèle de Machine Learning 👌

POUR QUI EST CETTE FORMATION ? 👋

Tu es un novice dans le monde de la Data Science. Tu veux découvrir les principes de base de l’IA et du Machine Learning. Tu as une compréhension grossière du développement et/ou quelques notions de code (même minimes, peu importe le langage). Tu veux devenir Data Scientist, mais tu n’as ni expertise, ni réseau.

NB : il n’est pas nécessaire pour se sentir à l’aise pendant la formation de savoir coder ou d’être bon en statistiques, mais il ne faut pas être dérouté par des notions logiques et/ou mathématiques de base.

COMMENT ÇA SE PASSE ? 🦁

Lion te fait découvrir la Data Science !

Concrètement, tu auras 3 sessions pour t’initier au code en Python, à la manipulation de datasets volumineux et construire ton premier algorithme, encadré par des pros du Machine Learning et de la Data Science.

Ensuite, tu pourras plonger pendant 2 soirées dans les détails du Deep Learning et enfin te confronter à des cas business concrets qui t’attendent si tu deviens Data Scientist en startup.

Pour faire de cette formation une réussite, Lion allie la force de son réseau à celui d’Henri Qiu, un expert du sujet, puisqu’il a travaillé comme Data Scientist chez AXA Global Direct et en tant qu’analyste quantitatif pour l’Inspection Générale du groupe Crédit Agricole. Il est diplômé de l’Ensae, de l’université Paris-Saclay, d’HEC Paris … mais surtout, c’est un alumni Lion 🦁

En parallèle de la formation, tu choisiras avec un partenaire un problème sur lequel vous voulez travailler et que vous finaliserez le dernier jour afin de présenter vos conclusions.

LE PROGRAMME 🗓

Pas de secrets, pour découvrir un sujet aussi vaste que la Data Science en quelques soirées, il faut un programme intense ! Lion t’a concocté un programme aux petits oignons pour que tu sois capable, quel que soit ton niveau initial, d’écrire tes premiers algorithmes de Machine Learning et d’appliquer les principes de Data Science à des cas pratiques 🦁

SESSION 1— La data, à ta portée 👌

La première session tient lieu d’introduction et d’onboarding. Tu verras que tu as toutes les cartes en main pour devenir un bon Data Scientist. Il s’agira de s’échauffer sur les langages de Data Science, de revoir des concepts basiques de statistiques grâce au code et de construire un premier modèle prédictif.

À la fin de cette session, tu auras :

  • Une connaissance des bases de programmation avec Python et des principales librairies (numpy, pandas)
  • Une compréhension du principe d’une base de données relationnelles (requêtes SQL, jointures)
  • Construit un modèle prédictif simple

SESSION 2— Construction de modèles prédictifs 🤖

Cette session te permettra de comprendre la théorie derrière les modèles prédictifs, de saisir la nuance entre les problèmes de classification (c’est-à-dire un modèle de prédiction d’une variable qualitative) et de régression (modèle de prédiction d’une variable quantitative) et de les appliquer à des cas réels.

Tu pourras aussi déterminer les métriques de performance d’un modèle, préparer les données en amont, apprendre comment choisir les bonnes variables pour construire un modèle et interpréter des résultats.

À la fin de cette session, tu sauras :

  • Distinguer les deux familles “classiques” de l’apprentissage statistique supervisé
  • Comprendre le workflow de la construction d’un modèle
  • Préparer les données en amont de la modélisation (étude de corrélation, détection de valeurs aberrantes…)
  • Interpréter le résultat d’un modèle prédictif

SESSION 3 — Un peu plus près des datas ✨

Jusqu’à présent, tu auras été confronté à des modèles simples, avec des jeux de données prêts à l’usage. La réalité est très différente, et cette soirée va t’y préparer.

Cette session te permettra de comprendre les modèles et les données dans leur variété respectives (textuelles, quantitatives, etc.), et d’explorer les données grâce aux techniques de data mining.

À la fin de cette session, tu sauras :

  • Travailler avec des méthodes avancées d’apprentissage statistique supervisé
  • Comprendre la variété des données et comment les traiter
  • Implémenter un algorithme de clustering pour différencier des classes au sein des données

SESSIONS 4 & 5— Deep Learning I & II 🧠

Le Deep Learning est une sous-catégorie du Machine Learning basée sur des algorithmes dont la conception est inspirée de la structure et du fonctionnement du cerveau humain, appelés Artificial Neural Networks.

Pendant ces deux sessions, tu pourras découvrir les bases du Deep Learning, implémenter des modèles grâce aux réseaux de neurones et comprendre les architectures classiques du Deep Learning.

À la fin de ces sessions, tu sauras :

  • Utiliser un framework de Deep Learning
  • Comprendre comment un réseau de neurones apprend
  • Distinguer les architectures classiques (réseaux convolutifs, réseaux récurrents)

SESSION 6— Ce qui t’attend en startup 🚀

Les modèles théoriques, c’est super pour apprendre ! En revanche, la réalité des cas que l’on a l’occasion de voir en startup sont souvent différents.

Le but de cette session est de te plonger dans le concret ! Tu auras un aperçu des problèmes de Machine Learning moins classiques qui sont le pain quotidien des Data Scientists en startup

À la fin de cette session, tu sauras :

  • Construire un algorithme de recommandation (type Spotify)
  • Te frotter à des problèmes d’A/B Testing à partir de données simulées (et corrigés en direct avec les données observées)

JOUR 7— Challenge final 🏆

Cette journée te permettra de revoir les acquis de la prédiction et de les approfondir, ainsi que de valider ta maîtrise du principe de déploiement d’un algorithme.

Par équipes de 2, vous finaliserez les problèmes choisis et ferez la présentation du problème traité, des datasets utilisés, du modèle choisi et enfin des indicateurs de performance.

🔥 LES PLUS 🔥

  • Accès au Slack de Lion et sa communauté de plus de 1500 employés, tous acteurs du changement de leur entreprise
  • Un channel Slack fermé et dédié à la Data Science pour que tu puisses échanger avec les autres participants et chaque intervenant rencontré lors de la formation
  • Des ressources utiles pour toute ta carrière en Data Science : une liste des meilleurs outils et liens pour approfondir ta connaissance dans le domaine
  • Les notes de synthèse de chaque cours

Tu as des questions sur notre programme ? On répond déjà à la première 😉

Pour le reste contacte-moi => younes@joinlion.co ! ;)

--

--