Photo by Alex Mustaros on Unsplash

[Ed] Chương trình thạc sỹ Data Science tại Trường X-Paris, France [Part 1]

Trung-Duy Ng

--

Đây là bài viết đầu trong chuỗi series review các chương trình dạy Data Science ở Châu Âu mà mình ấp ủ khá lâu rồi. Trường đầu tiên mình chọn để viết bài chính là trường École Polytechnique (aka Trường X) nổi tiếng chỉ có nhất chứ không có nhì tại Pháp, thật ra thì chương trình Data Science này đào tạo chung cho các trường nằm trong khối Paris-Saclay nha. Bạn cứ tưởng tưởng trường X là Ironman thì Paris-Saclay là biệt đội Avengers vậy đó, nói chung các trường nằm trong khối liên hiệp này vô cùng “khủng bố” nhé.

Đây là Link chương trình: datascience-x-master-paris-saclay.fr

Overview

Đây là chương trình Master M2 của Pháp nên thời gian học chỉ là 1 năm cộng với thời gian thực tập ít nhất 14 tuần để đủ điều kiện tốt nghiệp. Mình khá thích chương trình này vì đây là một trong số ít các chương trình dạy “đủ đô” về toán (ờ đương nhiên, Pháp mà) so với các trường khác ở Châu Âu (trừ Đức), nên những bạn nào đặc biệt thích toán có thể theo chương trình này.

Cá nhân mình nghĩ có nhiều trường ở EU dạy Data Science cho kịp theo xu thế và hốt bạc từ học sinh, họ dạy các môn về toán khá hời hợt

OK, cùng bắt đầu review các môn học nào, mình chia ra theo term nhé là gồm học kì mùa thu(autumn term) và mùa xuân(spring term)

Autumn Term (September — December)

Các môn học trong học kì mùa Thu
  • Ban đầu vào học thì trường sẽ cho bạn “nhập trại” ngay với khóa BigData Camp. Nói chung vừa vào thì phải chỉnh đốn, quán triệt tư tưởng là đúng rồi. Thật ra khóa này mang tính introduction là chính, nhưng hay cái là sẽ có team project thi thố với nhau như Kaggle, rất thích hợp để bạn làm quen bạn mới (sau này bọn nó làm Google, Facebook biết đâu sẽ “độ” bạn theo)
  • Introduction to Bayesian Learning: Thật là tuyệt vời, trường nào có dạy môn Bayesian là mình ưng rồi đó. Cứ nghe mình, Bayesian là cả một nghệ thuật mở mà nó mang tầm hiểu biết về triết học và thế giới quan đó các bạn, dân Stats chính tông đều thờ ông Bayes này nha.

Học Bayesian xong rồi bạn sẽ thấy Deep Learning mông lung như một trò đùa =))

  • Reinforcement Learning: OMG, lại một cực phẩm nữa nè. Mấy bạn có biết đa số các trường dạy lôm côm về Data Science ở Châu Âu họ không dám dạy môn này không? Chỉ có những trường khủng và có Profs uy tín mới dạy được thôi nhé
  • Optimization for Data Science: Bánh mì phải có patê, ML phải có Optim(ization) ăn kèm. Nhiều trường dạy qua loa cho có, nhưng đây là môn cực kì quan trọng và luôn là nhánh nghiên cứu chính cùa ML từ bao đời nay rồi. Giờ nhiều người bô ba với nhau deploy/train DeepL model(YOLO, Darknet …) này nọ mà hỏi tới convex optim hay linear progamming thì tắt đài (như thằng đang viết bài chẳng hạn. Ờ thật ra mình còn không biết deploy NN model nữa cơ, vậy là tệ hơn cả tệ). Coi nào các bạn, đừng làm “fake” data scientist chứ, nhất mông lên và học Optim thôi.
  • Graphical Models & Hidden Markov chain models and sequential Monte Carlo methods: Để ông kể các cháu nghe ngày xưa có 1 triều đại vô cùng thịnh vượng, phát triển có tên là Graphical Models, nhưng từ khi giặc Deep Learning xâm chiếm và tàn phá thì triều đại sau đó …. À, không có sau đó đâu :) Nói chung mình cảm thấy rất bức xúc vì Graphical Models bị underrated trong những năm trước khi mọi người đang “phê” Deep Learning, nhưng gần đây mình rất vui vì có nhiều hướng research đang kết hợp Graphical Models và Deep Learning (GANs, DeepBayesNet …). Nếu bạn là fan cuồng của Bayesian, MonteCarlo-MarkovChain thì bạn không nên bỏ qua môn học này.
  • Non-parametric estimation & Convex analysis, monotone operators and optimization: 2 môn này vô cùng Advanced và bạn cần nắm vững Fundamentals of Optimization trước. Thật sự nó không ảnh hưởng lắm đến công việc làm Data Scientist của bạn sau này, nhưng nếu bạn đam mê toán và muốn trở thành 1 Statistician/Algorithmic Data Scientist bá đạo thì bạn không thể bỏ qua 2 môn này.

Mình nghĩ data scientists hơn nhau ở chỗ ai làm Optimization và diễn giải kết quả tốt hơn, chứ không phải pull models/code từ Github rồi deploy thì tự nhận mình là Expert

  • Big Data Analytics Frameworks: Nếu chỉ học toán không thì làm sao mà healthy với balance được, nên họ mới bổ sung 1 course về engineering này cho bạn nè. Cách mạng công nghiệp 4.0 rồi, nó không phải cách mạng trên Excel hay PowerPoint đâu, nó đang diễn ra trên trển (Cloud) ấy. Hãy tận dụng môn này để có kiến thức về Cloud Computing nhé.
  • Visualization and Visual Analytics for Data Science: Bạn có biết rằng Visualization là cả một ngành khoa học về nhận thức và hành vi (Cognitive and Behavioral Science)của con người không? Làm sao để diễn giải kết quả Models của bạn mà đến cả 1 ôngbán rau ngoài chợ cũng biết (thật ra ông bán rau có bằng Thạc Sĩ nhé). Ok, my metaphor is so dumb, but you get the point :)

Ok, để giữ bài viết cô đọng thì mình xin review các môn học của học kì mùa xuân ở Part 2 nhé. Để cập nhật bài viết mới nhất của mình thì các ghé qua FB page: Trung-Duy Ng nhé. Trong thời gian chờ đợi thì các bạn có thể join vào nhóm Vietnamese AI/Data Engineers and Scientists in Europe để thảo luận về cuộc sống, học tập, việc làm của những kỹ sư, nhà khoa học Việt Nam tại Châu Âu.

Disclaimer: Bài viết phản ánh ý kiến và trải nghiệm cá nhân, mọi người nên cân nhắc khi làm theo lời khuyên của người viết và bạn phải chịu trách nhiệm cho quyết định của mình. Bài viết sẽ có mang tính chất cà khịa ở một số khía cạnh với mục đích giải trí (thật ra câu view là chính), nhưng hoàn toàn không nhắm đến 1 cá nhân, tổ chức hay quốc gia nào. Again, mình không chịu trách nhiệm cho sự liên tưởng của các bạn.

--

--