Data Science Academy Camp 1: Awal Perjalanan Data

Visianita Widyaningrum
COMPFEST
Published in
7 min readSep 12, 2021

COMPFEST 13, Jakarta — Camp 1 Data Science Academy telah dilaksanakan pada 16 Agustus 2021 hingga 21 Agustus 2021. Semua sesi pada Camp ini diselenggarakan secara daring melalui platform Zoom. Partisipan dari Data Science Academy merupakan 10 tim terbaik yang telah diseleksi sebelumnya oleh COMPFEST. Pada Camp ini, peserta mempelajari tentang tahap-tahap awal dari data science yang dibawakan oleh para pembicara yang kompeten di bidangnya. Yuk, mari simak keseruannya!

Day 1 Introduction to Data Science Workflow Business

Hari pertama dimulai dengan sambutan dari Raja Aldwyn Sihombing selaku Project Officer COMPFEST 13 dan Radhiansya Zain Antriksa Putra selaku Vice Manager dari Academy COMPFEST 13. Setelah itu, acara dilanjutkan dengan pemberian materi tentang Introduction to Data Science Workflow Business oleh Erza Aminanto selaku Data Scientist Jakarta Smart City.

Sesi ini diawali dengan penjelasan dari definisi data science. Kak Ezra mengatakan bahwa data science merupakan sebuah disiplin ilmu yang merupakan gabungan dari ilmu statistika, informatika, komputasi, komunikasi, manajemen, dan sosiologi yang bertujuan untuk mempelajari sebuah data dan lingkungannya. Proses ini dilakukan untuk mendapatkan sebuah insight dan mendapatkan sebuah keluaran yang dapat digunakan untuk mengambil keputusan. Kak Ezra juga menjelaskan tentang tiga cara bagaimana sebuah data dipandang dalam kegiatan industri — data driven, data informed, and data aware — serta kasus nyata dari terminologi-terminologi tersebut.

Selanjutnya, Kak Ezra menjelaskan tentang data science methodology. Proses ini dimulai dari memahami tujuan bisnis dan melakukan pendekatan analitik, dilanjutkan dengan proses persiapan data; data requirements, data collection, data understanding, dan data preparation. Setelah melewati proses persiapan, barulah data tersebut dapat lanjut ke tahap modelling, yang diikuti dengan tahap evaluasi, deployment, dan feedback. “Tahap-tahap ini tidak berjalan secara linear, artinya kita dapat kembali ke tahap sebelumnya jika dirasa dibutuhkan. Misalnya, jika saat kita ada di tahap data preparation dan merasa data yang dikumpulkan masih belum cukup, kita dapat kembali ke tahap data collection,” ucap Kak Ezra.

Tak hanya itu, Kak Ezra selanjutnya membahas tentang two ways to think about doing data science; Top-Down dan Bottom-Up. Dalam akhir presentasinya, Kak Ezra membahas mengenai skill yang dibutuhkan pada tiap tahap data science methodology. Sesi materi diakhiri dengan sesi tanya jawab antara peserta dan pembicara.

Hari pertama Camp 1 ditutup dengan pembagian mentor, sesi foto, dan salam perpisahan dari pembawa acara. Hari kedua pun tak kalah menyenangkan, simak terus ya!

Day 2 Pre-Processing & Cleansing

Hari kedua diisi dengan pemberian materi dari Evan Budianto sebagai data scientist dari Data Science Indonesia. Pada Camp ini, Kak Evan menjelaskan materi tentang Pre-Processing & Cleansing.

Kak Evan memulai presentasinya dengan bersalam-sapa seraya bertanya-bertanya mengenai background dari peserta Data Science Academy. Kak Evan kemudian membahas tentang definisi Pre-Processing & Cleansing dan mengapa perlu dilakukan proses tersebut. Pre-Processing & Cleansing merupakan sebuah proses mengubah data “mentah” menjadi data yang layak untuk digunakan pada tahap selanjutnya. Proses ini dilakukan untuk meningkatkan performa dari algoritma machine learning. “Lebih penting data yang bagus daripada data yang banyak, walaupun data yang banyak akan mengalahkan data yang sedikit,” ucap Kak Evan. Selanjutnya, Kak Evan juga memaparkan alasan-alasan mengapa proses ini harus dilakukan, yaitu untuk menyesuaikan data type, data requirement, dan data complexity serta memproses data yang mengandung statistical error.

Kak Evan juga menjelaskan mengenai tahapan-tahapan dalam Pre-Processing & Cleansing, yaitu (1)Handling missing values; (2)Feature scaling; (3)Feature Engineering; (4)Feature encoding; dan (5)Dimensionality Reduction.

Selanjutnya, Camp dilanjutkan dengan sesi hands-on. Pada sesi ini, Kak Evan melakukan demonstrasi proses Pre-Processing & Cleansing pada case study nyata. Dengan pengetahuan yang telah didapatkan dari sesi sebelumnya, ia menunjukkan langkah-langkah detail dalam memproses dataset “mentah” menjadi dataset yang dapat untuk digunakan pada proses data analysis.

Day 3 Exploratory Data Analysis

Pada hari ketiga, Kak Irfan Dwiki Bhaswara, Data Scientist Jakarta Smart City, membawakan materi mengenai Exploratory Data Analysis (EDA).

Kak Irfan mengatakan bahwa EDA merupakan investigasi karakteristik dari sebuah dataset dengan mengidentifikasi pola dan menguji sebuah hipotesis awal. Proses ini dilakukan untuk mengidentifikasi fitur penting, menguji kualitas data, serta mengecek apakah data memiliki anomali. Dengan itu, data-driven insights dapat diberikan dan disalurkan kepada business stakeholders.

Selanjutnya, Kak Irfan menjelaskan tentang pentingnya peran graphics untuk visualisasi dalam EDA. Menurutnya, Grafik bukanlah satu-satunya alat dalam EDA, tetapi grafik ini merupakan cara termudah dan tercepat untuk mendapatkan insight dalam konteks pengujian hipotesis awal.

Camp dilanjutkan dengan sesi hands-on. Pada sesi ini, Kak Irfan mempraktekkan langsung proses EDA menggunakan tools dari package python dan Google Data Studio.

Day 4 Exploratory Data Analysis 2.0 & Case Study

Hari terakhir Camp 1 diawali dengan pemberian materi dari Hansen Wiguna sebagai Business Analyst Jakarta Smart City. Pada Camp ini, Kak Hansen menjelaskan materi tentang Exploratory Data Analysis 2.0, lanjutan pembahasan yang lebih mendalam dari hari yang lalu.

Memulai presentasinya, Kak Hansen menjelaskan definisi Exploratory Data Analysis. Kak Hansen mengatakan bahwa Exploratory Data Analysis merupakan sebuah proses menginvestigasi data dengan tujuan untuk mencari pola dan anomali, menguji hipotesis dan asumsi dengan bantuan representasi grafik dan informasi statistik. Seorang data scientist harus memahami konteks data serta mengetahui tipe data, dimensi, dan informasi statistik dari data, sehingga dapat memahami cara terbaik untuk memvisualisasikan dan menampilkan data.

Menurut Kak Hansen, seorang data scientist harus benar-benar memahami datasetnya agar dapat mencari solusi terbaik dari masalah tersebut. Kak Hansen kemudian menjelaskan mengenai analysis questions, yaitu sekumpulan pertanyaan umum, yang dapat ditanyakan kepada diri sendiri untuk membantu seorang data scientist memahami data. Dari pertanyaan-pertanyaan umum tersebut, dapat dipilih pertanyaan manakah yang paling relevan terhadap masalah. Untuk menjawab pertanyaan-pertanyaan tersebut, teknik-teknik EDA dapat digunakan sebagai alat untuk mempermudah prosesnya.

Setelah itu, Kak Hansen membahas teknik-teknik dalam EDA, yaitu graphical techniques dan quantitative techniques. Graphical techniques dapat dilakukan dengan; univariate, multivariate, time series, 1 factor, multi-factor, dan regression, sedangkan quantitative techniques dapat dilakukan dengan interval estimates dan hypothesis tests. Kak Hansen juga menjelaskan mengenai 6 plots, yaitu sebagai tools untuk membantu menguji validitas data. Dengan cara ini, pola pada plot dapat dengan mudah dipahami secara intuitif.

Kak Hansen kemudian menceritakan pengalamannya sebagai Business Analyst di Jakarta Smart City. Dia menunjukkan proses pengolahan data dan produk data pada konteks institusi pemerintahan. “Dunia ini membutuhkan seseorang yang bisa memecahkan masalah. Kalo kamu bisa memecahkan masalah kompleks, kamu akan menjadi orang yang sangat dibutuhkan, terutama di konteks pemerintahan karena problems-nya mencakup kehidupan orang banyak,” ucap Kak Hansen. Sesi materi diakhiri dengan sesi tanya jawab antara peserta dan pembicara. Menutup presentasi, diadakan sesi Hands-On untuk memberikan pemahaman yang lebih baik kepada peserta dengan mempraktekkan materi yang telah dibawakan.

Hari terakhir Camp 1 berlanjut setelah istirahat, Data Science Academy dilanjutkan dengan sesi case study. Peserta dibagi ke dalam 10 kelompok, yang berbeda dengan tim pendaftaran, untuk berdiskusi di masing-masing breakout room selama 150 menit. Dengan pengetahuan yang telah didapatkan dari sesi-sesi sebelumnya, peserta menyelesaikan study case tentang data banjir di Jakarta. Setelah peserta selesai berdiskusi, sesi study case dilanjutkan dengan presentasi hasil diskusi oleh salah satu kelompok. Data Science Academy Camp 1 ditutup dengan sesi foto, dan salam perpisahan dari pembawa acara.

Interview Session!

Setelah rangkaian Camp 1 selesai, kami mendapat kesempatan untuk mewawancarai Kak Hansen Wiguna sebagai Business Analyst di Jakarta Smart City. Kak Hansen membagikan pengalaman menariknya di Jakarta Smart City. Menurutnya, bekerja di bidang data analytics pada institusi pemerintahan sangat menarik karena masalah-masalah yang diselesaikan merupakan masalah di tingkat kota yang jangkauannya mencakup orang banyak. Dengan itu, ia berkesempatan untuk berkolaborasi dengan banyak pihak dan mewakili pemerintah provinsi di berbagai acara di dalam negeri bahkan luar negeri. Kak Hansen juga membagikan kiat-kiat untuk belajar data science hingga bisa menjadi data scientist yang berkompeten. “Kenali potensi diri pada 3 domain data science (bisnis, statistika, dan pemrograman) dan asah terus kemampuan tersebut. Jangan takut belajar karena sekarang menjadi data scientist bisa dari background mana saja, juga sekarang sudah ada banyak sumber belajar, seperti Data Science Academy ini,” ucap Kak Hansen.

Setelah itu, kami juga berkesempatan untuk mewawancarai Kak Bryan, Kak Zulfah, dan Kak Timot dari tim HAKATON!. Mereka menceritakan pengalaman-pengalaman mengesankannya selama mengikuti Data Science Academy. Menurut mereka, case study merupakan salah satunya karena mereka dapat bertemu dan berbincang dengan peserta tim lain yang berbagai background sambil mengasah skillnya dengan mengeksplor dataset yang telah diberikan. Dengan mengikuti Data Science Academy, mereka berharap akan mendapatkan banyak ilmu baru dari projek akhir dan sesi mentoring, serta menambah teman yang memiliki interest yang sama di bidang data science.

Masih banyak keseruan acara lainnya di COMPFEST! Pantau terus informasi mengenai COMPFEST melalui akun media sosial Twitter kami @COMPFEST, Instagram kami @COMPFEST, Facebook kami COMPFEST, LinkedIn kami COMPFEST, dan situs kami compfest.id (Editorial Marketing/Visi).

--

--