Data Science Academy Camp 2: Memanfaatkan Kekuatan Data dengan Machine Learning

Muhammad Iqbal
COMPFEST
Published in
6 min readAug 22, 2023

COMPFEST 15, Depok — Camp 2 Data Science Academy (DSA) telah dilaksanakan pada tanggal 14 hingga 19 Agustus 2023. Camp kali ini berlangsung selama empat hari dan dilaksanakan secara daring melalui platform Zoom. Peserta dari Data Science Academy merupakan 10 tim terbaik yang telah diseleksi sebelumnya oleh COMPFEST. Pada camp ini, para peserta mempelajari seputar pembelajaran mesin dalam data science yang dibawakan oleh para pembicara yang kompeten dibidangnya. Penasaran dengan keseruannya? Yuk, simak di bawah ini!

Day 1— Introduction to Machine Learning

Pada hari pertama Camp 2 Data Science Academy, materi yang diberikan bertema “Introduction to Machine Learning”, yang membahas tentang data, fondasi machine learning, dan feature engineering. Materi dibawakan oleh Andi Sulasikin, selaku senior data scientist di Jakarta Smart City.

Pak Andi menjelaskan bahwa data meningkat secara eksponensial dari tahun ke tahun. Hal ini disebabkan perkembangan teknologi informasi yang semakin pesat. Data yang terkumpul saat ini perlu diorganisir sehingga menjadi informasi. Informasi ini kemudian diolah menjadi knowledge sehingga dapat diaplikasikan untuk menyelesaikan masalah atau proses bisnis.

Menurut Pak Andi, artificial intelligence tidak berguna tanpa data. Cara sebuah mesin belajar mirip dengan manusia. Jika manusia belajar dari pengalaman, mesin juga belajar dari pengalaman alias data. Materi selanjutnya adalah machine learning. Ada satu hal yang Pak Andi tekankan, yaitu bahwa tidak semua masalah harus diselesaikan menggunakan machine learning dan tidak semua masalah bisa diselesaikan dengan traditional programming. Kita harus mengetahui kapan kita perlu menggunakan machine learning dan kapan cukup menggunakan traditional programming. Pak Andi kemudian menjelaskan tipe machine learning, yaitu supervised learning, unsupervised, dan reinforcement learning.

Materi selanjutnya adalah feature engineering, proses feature engineering terletak sebelum modelling dan setelah preparasi data. Pak Andi kemudian menjelaskan metode-metode feature engineering seperti scalling, log transformation, one-hot encoding, outlier handling, dan imputation. Materi kemudian ditutup dengan sesi Q&A antara peserta dengan Kak Andi dan juga terdapat kuis yang dipandu oleh MC.

Day 2 — Supervised learning

Pada hari kedua camp 2 Data Science Academy, materi yang diberikan bertema “Supervised Learning”, yang membahas tentang teknik-teknik dalam supervised learning seperti linear regression, logistic regression, dan random forest. Materi dibawakan oleh Muhammad Angga Muttaqin selaku co-founder dan CEO di Indonesia AI.

Kak Angga membahas tentang perbedaan artificial intelligence, machine learning, dan deep learning. Kak Angga menjelaskan bahwa hubungannya merupakan hubungan umum ke spesifik. Topik yang dibawakan pada sesi kali ini adalah salah satu tipe machine learning, yaitu supervised learning. Selanjutnya, Kak Angga memasuki materi linear dan logistic regression yang merupakan model pada supervised learning.

Linear dan logistic regression, menurut Kak Angga, merupakan “hello world” -nya data science. Model ini sudah tidak digunakan lagi dalam dunia nyata, tetapi merupakan hal yang esensial untuk diketahui bagi semua data scientist. Perbedaan dari keduanya, linear regression untuk data yang continue sedangkan logistic regression untuk data yang diskrit, seperti ya atau tidak. Selanjutnya, Kak Angga membahas model yang digunakan dalam dunia nyata dan dapat digunakan untuk regresi dan klasifikasi yaitu model random forest. Kak Angga juga membahas kaitan entropy dengan random forest.

Setelah selesai sesi materi, dilanjutkan sesi hands-on. Sesi hands-on memberikan pemahaman yang lebih baik kepada peserta dengan mempraktikkan materi yang sudah dibahas. Acara kemudian ditutup dengan sesi Q&A dan kuis yang tidak kalah menarik.

Day 3— Unsupervised Learning

Pada hari ketiga, materi dibawakan oleh Siti Aminah selaku dosen Fakultas Ilmu Komputer dan peneliti di Universitas Indonesia. Pada pertemuan kali ini, Bu Siti membawakan materi “Unsupervised Learning” yang membahas tentang clustering, k-means clustering, hierarchical clustering, dan hyperparameter tuning.

Unsupervised learning adalah salah satu jenis pembelajaran mesin di mana data tidak memiliki label atau target yang jelas. Fokus utama unsupervised learning adalah mengidentifikasi pola atau struktur yang ada dalam data tanpa petunjuk dari label. Menurut Bu Siti, terkadang data yang kita punya tidak memiliki label dan memberikannya label mahal dan sulit dilakukan, unsupervised learning hadir sebagai solusi dari masalah ini.

Teknik dalam unsupervised learning adalah clustering. Tidak seperti klasifikasi pada supervised learning di mana label target sudah diketahui, dalam clustering kita belum tahu berapa banyak atau jenis kelompok yang ada dalam data. Tujuan utama dari clustering adalah menemukan pola pada data agar data tersebut bisa dikelompokkan. Menurut Bu Siti, evaluasi clustering lebih sulit daripada evaluasi klasifikasi karena hasilnya bisa bervariasi dan tergantung pada tujuan pengelompokan. Hasil clustering bisa subjektif karena berbagai sudut pandang bisa menghasilkan hasil yang berbeda.

Partitional clustering membagi dataset menjadi kelompok yang tidak tumpang tindih, sedangkan hierarchical clustering membentuk hierarki kelompok dengan sub-kelompok yang besar. Salah satu teknik partitional clustering adalah K-means clustering. K-means memiliki keterbatasan yaitu rentan terhadap inisialisasi centroid yang buruk dan sensitif terhadap outlier. Selain itu ada juga teknik hierarchical clustering. Hierarchical clustering cocok untuk data yang memiliki struktur hirarkis atau berjenjang. Sama seperti hari sebelumnya, setelah sesi pemaparan materi terdapat sesi Q&A yang dilanjutkan dengan sesi hands-on.

Day 4— Deep Learning

Pada pertemuan hari keempat ini, materi dibawakan oleh Mikael Alvian Rizki. Kak Mikael merupakan seorang software engineer yang dulunya merupakan asisten dosen mata kuliah Kecerdasan Artifisial & Sains Data Dasar. Pada pertemuan kali ini, Kak Mikael membahas tentang deep learning, neural network, fungsi aktivasi, epochs dan batches, image classification, dan terakhir ada sesi hands-on menggunakan tensorflow.

Deep learning berurusan dengan data yang lebih abstrak jika dibandingkan dengan machine learning yang berfokus pada data tabular yang sudah didefinisikan. Neural network mengambil inspirasi dari otak manusia, dengan neuron sebagai unit dasarnya. Kak Mikael menganalogikan neural network seperti mata manusia menerima input visual, di dalam neural network, input diterima dan diproses melalui lapisan-lapisan. Lapisan neural network terdiri dari 3 yaitu input layer (menerima input), hidden layer (proses internal), dan output layer (hasil prediksi atau klasifikasi).

Kak Mikael kemudian membahas tentang fungsi aktivasi. Kak Mikael mengibaratkan fungsi aktivasi sebagai saklar yang mematikan ketika hasil negatif dan menghidupkan ketika hasil positif. Selanjutnya Kak Mikael membahas epoch, epoch adalah berapa kali model melihat data dalam pelatihan. Pada deep learning, ini diperlukan untuk membantu model “mempelajari” pola dalam data dan menghindari overfitting. Kak Mikael kemudian membahas mengenai Convolutional Neural Network, Pooling Layer, Flattening, dan Fully Connected Layer.

Setelah sesi pemaparan materi, kegiatan dilanjutkan dengan sesi hands-on menggunakan tensorflow. Pada sesi ini, Kak Mikael mempraktikkan materi yang sudah diterangkan sebelumnya. Setelah hands-on, sesi terakhir diisi dengan study case. Study case dibawakan langsung oleh Kak Mikael. Kak Mikael memberikan arahan pengerjaan study case. Setelah pembagian kelompok oleh panitia, peserta diberi waktu selama 2 jam untuk mengerjakan study case tersebut. Setelah itu, dipilih satu kelompok untuk mempresentasikan hasil kerjanya.

Setelah berakhirnya DSA Camp 2, kami berkesempatan untuk mewawancarai salah satu kelompok Data Science Academy yaitu kelompok Infinity yang beranggotakan Balqis, Adit, dan Amar. “Data Science Academy COMPFEST sangat memuaskan, sangat seru, dan pengalaman baru banget. Apalagi pas bagian sesi study case yang mana kita dipecah belah dari satu tim ke tim-tim lain” ujar Balqis. Mereka berharap program Data Science Academy terus dilanjutkan dan berkembang dari tahun ke tahun. Menurut mereka, sumber untuk belajar data science belum terlalu banyak di Indonesia. Mereka merasa adanya Data Science Academy mempermudah akses kepada khalayak umum untuk mempelajari lebih banyak tentang data science.

Perjalanan para peserta DSA masih akan berlangsung pada camp selanjutnya dan acara Academy COMPFEST 15 lainnya juga akan terus berlanjut untuk beberapa minggu kedepan. Jangan lupa untuk mengunjungi akun media sosial kami, yakni @compfest pada akun Twitter, Instagram, Facebook, LinkedIn, dan situs kami, compfest.id untuk mendapatkan informasi terbaru COMPFEST. Baca artikel mengenai keseruan Academy lainnya melalui laman Medium kami. (Editorial Marketing/Muhammad Iqbal)

--

--