Machine Learning : par où commencer ?

Lara Ramirez
42 Artificial Intelligence

--

C’est un des sujets brûlants de la tech, le Machine Learning devient de plus en plus incontournable, dans tous les domaines imaginables. Pour autant, la discipline reste très opaque quand on ne la pratique pas, ce qui peut être déroutant voire intimidant.

La bonne nouvelle ? Ce qu’il y a sous le capot de cette techno impressionnante n’est pas trop complexe; un peu de temps et de travail vous ouvrira rapidement les portes d’un précieux sésame. Le plus compliqué est presque de s’y mettre, car buzz oblige il y en a un peu partout dans tous les sens, au point de déclencher facilement le fameux “je verrais ça plus tard”.

Du coup, on a décidé de vous concocter une petite sélection de nos outils préférés pour apprivoiser la bête, sélection qui n’engage que nous mais qui évitera de vous noyer sous 40,000 options.

Comprendre les grands principes

Avant de plonger dans le détail, il vaut mieux avoir une vue d’ensemble de ce que sont le Machine Learning et le Deep Learning, d’en comprendre les grands principes techniques. Vous aurez alors en tête une intuition précieuse pour vous y retrouver dans ce que vous allez faire par la suite.

Voici deux vidéos complémentaires qui vont donneront un bon tour d’horizon simplifié et illustré. La première est en français et propose une bonne introduction générale. La seconde est en anglais et va plus dans le détail concret des principes et opérations mathématiques sous-jacentes à tout ça.

Bases théoriques et pratique concrète

Un bon MOOC (Massive Open Online Course - un cours en ligne en somme) est sans doute le meilleur moyen de se lancer facilement et sérieusement. Il permet d’être accompagné pas à pas de la théorie à l’intégration en code, en rentrant en profondeur dans toutes les étapes. À noter que certains MOOCs peuvent aussi vraiment peser sur le CV.

Beaucoup s’accordent à dire que celui d’Andrew Ng (un grand nom de Stanford et un des fondateurs de Coursera) est le meilleur pour acquérir les bases. Il dure 11 semaines et peut se faire en version gratuite (sans certification) ou payante (environs $50/mois, avec des aides financières facilement négociables, et certificat à la clé). Chaque semaine comporte des vidéos de théorie, un quizz et un exercice de programmation. Il faut compter l’équivalent d’une petite journée de boulot par semaine. Le cursus commence à des dates prédéfinies et le rythme est cadencé (= il faut rendre des exercices chaque semaine).

Malheureusement ce MOOC n’est pas encore disponible avec des sous-titres en français, mais il vaut vraiment la peine de faire l’effort d’apprentissage d’un vocabulaire basique, même si votre anglais est moyen. Ça vous servira beaucoup aussi pour la suite.

Vous vous heurterez aussi peut-être à des notions pour lesquelles il faudra vous remettre à niveau, mais ne vous découragez pas, il n’y a rien de profondément avancé qui devrait vous bloquer et on choppe beaucoup des principes à la volée, à force de les voir illustrés clairement. Si vous êtes vraiment paumés, à tout moment vous pouvez faire un tour des bases de calcul et d’algèbre linéaire, qui sont l’endosquelette du Machine Learning.

Consolider, se spécialiser

Une fois les bases acquises, vous allez pouvoir commencer à vous amuser.

Montez votre propre projet from scratch pour consolider tout ce que à quoi vous avez touché (et pouvoir mettre un projet de ML sur votre GitHub, ça fera son petit effet). Il y a maintenant beaucoup de datasets disponible en open source, sur des plateformes comme Kaggle notamment. Mais collecter vos propres données est un bon exercice si vous avez le temps et le courage de le faire.

Participez à des concours pour vous exercer sur différentes problématiques (et si vous êtes un prodige du ML, vous faire remarquer). Kaggle est aussi un très bon endroit pour ça.

Lancez-vous sur des MOOCs de spécialisation, en ciblant les domaines qui vous excitent le plus. Pensez d’abord au Deep Learning, le sous-domaine de Machine Learning qui fait le plus parler de lui en ce moment.

Là encore, on retrouve Andrew Ng qui est spécialiste en la matière. Il explique très bien toutes les composantes logiques et mathématiques dans une toute nouvelle spécialisation faite en partenariat avec NVIDIA et composée de 5 micro-cursus. Il faut compter 3 à 6h par semaine, et environs 16 semaines en tout. Vous pouvez avoir un certificat par micro-cursus, à condition de faire la version payante (comme le ML plus haut, on est à environs $50/mois, avec des aides financières facilement négociables).

Sinon, Udacity propose un ‘nano-diplôme’ très réputé dans l’industrie. On est sur du sérieux, tant en terme de contenu qu’en terme de temps et de prix. Il faut compter 4 mois à hauteur de 12h de boulot par semaine environs, le tout pour… 599€ (sans accès gratuit non-diplômant). Un certain investissement donc, qui peut valoir le coup si vous avez besoin de pression pour vous motiver à garder le rythme. Le compléter vous débloque l’accès à des spécialisations avancées dans la robotique, les voitures autonomes, etc. Ces programmes sont parmi les formations les plus reconnues hors école-université, c’est une option sérieuse si vous souhaitez vous professionnaliser rapidement dans le secteur.

Dans tous les cas, expérimentez ! Sur les différents frameworks, avec différents langages, différentes applications, différentes architectures, algorithmes, optimisations… C’est un vaste terrain de jeux, qui réunit tant certains des plus grands chercheurs que des lambdas dans leur chambre, avec les technos les plus avancées partagées librement.

Vous pouvez d’ailleurs facilement vous frotter aux avancées officielles dans le domaine de la recherche. Un très bon exercice par exemple, quoiqu’assez avancé, est de récupérer un papier de recherche à sa sortie pour en reproduire l’implémentation :

En plus soft, vous avez les actus IA de Wired qui vous rapporteront en détail les avancées clés :

Et on vous recommande aussi vivement de suivre le très apprécié Siraj, un petit OVNI dans le monde de l’IA qui vous parle des meilleurs sujets et actus dans un style bien à lui :

Go !

Vous êtes parés. Les 3 MOOCs qui sont mentionnés dans cet article commencent justement cette semaine… Il ne vous manque plus qu’à réserver une demi-journée et [CLIQUEZ].

--

--

Lara Ramirez
42 Artificial Intelligence

Science and creativity lover pursuing stimulating things. Neurosciences / Physique Quantique / Philosophie