AI Project Cycle

Hanin Nafi'ah
4 min readSep 7, 2021

--

Apa itu Project Cycle? sesuai dengan kata “cycle” atau siklus atau bisa diartikan sebagai sebuah proses dalam membuat proyek AI secara utuh.

AI Project Cycle — “Orbit Future Academy”

Problem Scoping

Proses identifikasi atau memetakan batasan masalah yang ingin diselesaikan sehingga tujuan atau target menjadi semakin jelas dan lebih terarah serta akan lebih mudah untuk menemukan solusi. Mengapa penting?

Agar saat proses penelitian atau pengerjaan bisa lebih fokus sesuai tujuan dan rencana awal. Perlu diperhatikan apabila masalah yang diambil terlalu besar, biasanya cenderung sulit untuk dimulai atau diimplementasikan. Namun, apabila terlalu sempit akan sulit mencapai tujuan dan target.

Ada metode 4W untuk mempermudah proses problem scoping, yaitu:

  1. Who : siapa saja yang terlibat dalam masalah tersebut
  2. What : apa masalah dan faktor pendukung masalah
  3. Where : kondisi, suasana atau tempat masalah diamati
  4. Why : alasan mengapa masalah tersebut perlu diselesaikan dan manfaatnya

Data Acquisition

Proses mengumpulkan data-data yang dibutuhkan untuk membuat proyek AI. Hal ini merupakan dasar atau bahan yang selanjutnya diolah untuk dianalisis sesuai masalah dan diamati agar bisa menghasilkan solusi terbaik.

Ada beberapa cara untuk mendapatkan sumber data tersebut, yaitu:

  1. Tools/Alat : Kamera, Microphone dan Sensor
  2. Observasi : Survei, Penelitian
  3. Open Data : BPS, Kaggle, API (REST API, Twitter API, Youtube API)
  4. Web Scraping/Crawling

Web Scraping adalah metode ekstraksi data sebuah website yang kemudian disimpan pada database dalam format (xlsx, csv, json, dsb.). Sedangkan Crawling hanya sebatas menjelajahi data, misalnya implementasi pada Search Engine Optimization (SEO) tujuannya untuk meningkatkan traffic visitor.

Data Exploration

Proses menjelajahi dataset untuk memahami isi, komponen dan karakteristiknya sehingga kita dapat mengetahui pola data tersebut.

Exploratory Data Analysis (EDA) diperkenalkan oleh John Tukey dan mempunyai tujuan untuk mendorong ahli statistik dalam mengeksplorasi data dan merumuskan hipotesis.

John Wilder Tukey (1977). “Exploratory Data Analysis”, Pearson College Division

Beberapa metode yang digunakan dalam eksplorasi data, yaitu:

  1. Summary Descriptive Statistics, rangkuman properti (frekuensi, modus, mean, median, range, variance dan standar deviasi) dalam data.
  2. Visualization, penyajian data dalam bentuk grafis (Bar Chart, Histogram, Box Plot, Scatter Plot, Star Plot, Chernoff Plot, Maps)
  3. Clustering dan Anomaly Detection

Sederhananya menggunakan elemen visual, pembaca akan lebih memahami pola, tren bahkan lebih mudah menemukan outlier pada suatu data.

Mari coba buat proyek Machine Learning sesuai kreativitasmu klik link ^.^

Modelling

Proses pembuatan algoritma dalam bahasa pemrograman sebagai metode pembelajaran mesin (training phase) yang digunakan untuk menemukan pola-pola dalam data sebagai bahan dasar pengetahuan sistem untuk membuat keputusan atau melakukan prediksi.

Berikut ini perbedaan cara kerja Traditional Programming dengan Machine Learning, yaitu:

ml vs traditional paradigm

Traditional Programming : input berupa data dan aturan yang dibuat manual oleh programmer hingga menghasilkan output yang diharapkan. Kelemahannya adalah data menjadi kurang fleksibel dan aturan pada sistem harus selalu menyesuaikan apabila terjadi kebaruan data.

Machine Learning Approach : input berupa data dan jawaban yang akan dipelajari mandiri oleh mesin hingga menemukan pola atau hubungan antar data dan jawaban. Pola tersebut merupakan aturan yang dibentuk otomatis oleh mesin sebagai output. Kemudian hasil output akan digunakan dalam pembuatan keputusan untuk data-data selanjutnya.

Beberapa tipe model yang digunakan oleh sistem pembelajaran mesin (Machine Learning), antara lain:

  1. Supervised Learning → proses pembelajaran mesin yang diberi label, contohnya klasifikasi dan regresi.
  2. Unsupervised Learning → proses pembelajaran mesin berdasarkan kemiripan atau pola tanpa label, contohnya clustering.
  3. Reinforced Learning → proses pembelajaran mesin dengan memberikan punishment dan reward, contohnya AlphaGo.

Pada proses pengembangan Machine Learning, kalian pasti sudah tidak asing dengan istilah Deep Learning merupakan teknologi yang dipakai pada image recognition dan computer vision. Salah satu algoritmanya yaitu Artificial Neural Network (ANN).

Artificial Neural Network (ANN) adalah jaringan syaraf tiruan teknologi AI yang cara kerjanya terinspirasi neuron sistem dasar otak manusia.

Evaluation

Proses pengkajian dan pemilihan model terbaik yang akan digunakan untuk membuat proyek AI. Salah satu metode yang digunakan yaitu Confusion Matrix menggunakan tabel dengan 4 kombinasi berbeda dari nilai prediksi dan nilai aktual.

Confusion Matrix Table

Proses pemilihan model memperhatikan beberapa komponen, antara lain:

  1. Accuracy/Akurasi : persentase nilai prediksi yang benar dari keseluruhan pengamatan. Rumus → (TP+TN)/(TP+FP+TN+FN)
  2. Precision/Presisi : persentase kasus yang diprediksi AI dan memang terjadi berdasarkan realitanya. Rumus → (TP)/(TP+FP)
  3. Recall : mengukur pecahan kasus yang terjadi dan diprediksi tepat oleh AI. Rumus → (TP)/(TP+FN)

Deployment

Proses implementasi AI pada sebuah aplikasi atau sistem sesuai dengan tujuan pembuatan produk sehingga diharapkan dapat memudahkan pekerjaan manusia.

--

--