Data Science Learning Path

AC
Data Folks Indonesia
3 min readJul 9, 2019
Photo by Taylor Barber on Unsplash

Project, Project, and Project. Tulisan yang ditempel di depan meja belajar. Project menjadi bagian yang paling penting ketika belajar sesuatu, termasuk belajar data science.

Learning path! itulah salah satu yang saya cari ketika mau belajar data science. Mau belajar dari mana? lulusan informatika yang konsentrasinya web programming tapi skripsinya data mining. karena lulusan informatika, seharusnya tidak sulit mencari informasi. Mulailah saya mencari buku-buku yang berhubungan dengan data science / machine learning / data mining.

Programming

biasanya ketika orang-orang belajar data science, langsung lompat ke algoritmanya… tapi karena saya banyak baca baca blog dan isi kepala ini juga menuntut untuk belajar terstruktur, jadi yang pertama saya cari adalah “what programming language that often used in machine learning” atau “what is the popular language programming for machine learning” di google search, dan jangan sekali kali pakai kata “best”, Trust me!.

Search result tersebut saya rangkum mengeluarkan 2 hasil, antara R programming atau Python. Sebetulnya ada banyak programming language untuk ini seperti scala, java, dan C. Tapi yang banyak orang pakai dan banyak juga tutorialnya itu ya R dan Python.

Lalu, bahasa mana yang dipelajari? waktu saya baru belajar, saya belajar dua-duanya. Pertama saya belajar R programming di Coursera, saya baru bisa R programming ini setelah dua kali mengulang coursenya. Lalu saya belajar Python, kapok belajar online course, saya mending beli bukunya saja. Tidak usah pusing pusing buku mana yang harus dibeli, ambil saja mana yang terlihat meyakinkan di toko buku, langsung beli.

Namanya juga belajar, tidak mungkin hanya sekali, saya belajar R dan Python juga di DataCamp. DataCamp ini cukup enak buat yang baru belajar, interaktif dan intuitif… lebih tepatnya gampang sih, jadi senang aja gitu hahaha.

Database

Database ini jadi matakuliah wajib di anak Informatika, jadi belajarnya tidak dari awal-awal banget. Bedanya Database untuk software dan data analysis terletak penggunaan sytaxnya. kalau sistem itu lebih fokus ke command select, insert, update, delete sedangkan untuk data analysis lebih banyak select querynya.

Belajar database ini penting banget untuk handle data-data yang cukup besar dan data storagenya tidak di flat file macam format csv atau xlsx. belajar query database ini juga menolong kamu untuk tidak bertindak konyol pake query select * from nama_table.

Saya belajar sql for data analysis di mode, mulai dari join table hingga subqueries. Tutorial di Mode cukup membantu dan sangat jelas kok. tinggal sering sering exercise saja untuk mengingat syntax-syntaxnya.

Algorithms

Masuk kebagian yang paling banyak orang cari. Saya belajar algoritma machine learning dari buku, salah satunya Data Science from Scratch, Real World Machine Learning dan ya, kebanyakan saya baca buku yang practical + code. Jadi waktu belajar tidak bingung bagaimana mengimplementasikannya. Algo-algo machine learning ini juga sudah tersedia dan stabil, saya bisa pakai scikit-learn. Selain itu untuk algoritma deep learning saya belajar dari buku Deep Learning with Python by Fracois Chollet dan online course deeplearning.ai yang specializationnya. Bukunya gampang banget diikutin, dan belajarnya juga high level. Jika sudah paham pakainya, baru belajar basicnya. Kebalik memang, tapi ini apporach yang paling enak buat belajar yang banyak rumus matematikanya.

Visualization

Terakhir, Saya belajar visualiasi dari Tableau. Ini random banget, tinggal load datanya, masukin fieldnya, klik chartnya yang mana, jadi! Tapi bosen dong cuma chart-chart biasa aja. Saya ambil audit online course Data Visualization with Tableau di coursera. Karena bikin model, ga mungkin dong tiap kali mau visualisasi selalu buka Tableau, akhirnya saya lebih sering pake matplotlib atau seaborn untuk quick visualization, hanya sekedar bikin line plot, bar chart, heat map, dll. Jadi lebih cepet liat hasilnya.

Penutup

Sungguh, belajar data science itu seperti tidak ada habisnya, karena tiap kali menekuni suatu bidang pasti ada turunannya lagi. Mulai dari Machine learning turun ke Supervised, Semi Supervised dan Unsupervised Learning, Lalu dari Data Mining jadi ada Text Mining. Lalu akhirnya gimana? Setelah mengetahui high-levelnya, pilihlah spesialisasi dimana, entah itu computer vision, NLP atau speech recognition, atau bisa juga customer behavior macam bikin recommendation engine, atau financial modeling. Intinya jangan berhenti belajar!

Jika menurutmu tulisan ini bermanfaat mohon untuk clap nya ya :D

--

--