Pemanfaatan Data Science Untuk UMKM

Ramdhanii Ram
BISA.AI
Published in
5 min readJan 26, 2021
Photo by Tim Mossholder on Unsplash

Saat berbicara seputar UMKM, sebagian dari kita kadang membayangkan UMKM itu bisnis kecil, rumahan, atau toko eceran, dan sebagainya. Memang tidak salah, namun jarang orang-orang membayangkan bahwa UMKM jika dikelola dengan benar dapat mengimplementasikan Data Science sebagai salah satu alat bantu.

Di BISA AI Revisit Webinar #04 ini, artikel bersumber dari salah satu narasumber di webinar dengan judul yang sama yaitu “Pemanfaatan Data Science Untuk UMKM”, yang akan membahas kasus-kasus sederhana dengan sebisa mungkin meminimalisir pembahasan teknis programmingnya.

Sekilas Tentang Data Science

Ilustrasi Data Science dan Artificial Intelligence

Sesuai dengan ilustrasi yang diberikan narasumber, Data Science merupakan salah satu bidang yang terpisah dari Artificial Intelligence namun masih terkait dan menggunakan teknologi AI dalam menyelesaikan masalahnya.

Data Science sebagai ilmu data, membutuhkan data yang tepat untuk mendapatkan hasil yang sesuai tujuan dan maksimal. Data-data berupa teks, foto, video dan lain-lain ini dapat diambil sendiri, atau dari website penyedia data seperti:

Website-website penyedia data dari narasumber

Setelah data terkumpul, maka data perlu diolah dan diprogram sedemikian rupa menggunakan bahasa pemrograman dan alat bantunya seperti:

Contoh Kasus-Kasus Data Science untuk UMKM

  1. Kasus Menghitung Pendapatan dari Struk (Receipt)

Implementasi Data Science sederhana ini memanfaatkan struk yang biasanya dicetak lewat printer atau struk digital berbentuk PDF. Selain menghitung keuntungan, data dari struk ini dapat digunakan juga untuk memprediksi penjualan, hingga menentukan mana barang yang populer atau tidak. Berikut ringkasan langkah-langkah untuk melakukannya:

Pertama, dibutuhkan data-data struk yang sudah terorganisir, misalkan data struk perbulan, kemudian disimpan di satu folder yang sama. Contohnya file-file PDF dari Gobiz di atas dikumpulkan di satu folder Google Drive.

Kemudian menggunakan Python dan library-nya, data-data PDF tersebut dirubah menjadi bentuk gambar. Setelah semuanya diubah, data-data gambar struk tersebut diolah lebih lanjut menggunakan metode Optical Character Recognition (OCR) yang dapat mendeteksi teks pada gambar untuk diubah menjadi bentuk tulisan seperti pada contoh di bawah:

Hasil deteksi OCR untuk salah satu struk dari Gobiz

Dari hasil deteksi tersebut dapat diambil data-data tanggal, pendapatan, dan total penjualan. Setelah itu, agar kumpulan data struk dapat dilihat dengan lebih mudah, data dipetakan (mapping) menjadi seperti berikut:

Dari data berbentuk tabel ini sudah dapat terlihat bagaimana data disortir berdasarkan tanggal. Namun sebelum berlanjut ke tahap akhir yaitu visualisasi untuk melihat pendapatan, data-data harian di atas juga dapat digunakan untuk memprediksi total item yang akan terjual di kemudian hari menggunakan teknik forecasting, lebih lengkapnya narasumber menyarankan menggunakan metode mudah yaitu Moving Average.

Visualisasi Data Total Pendapatan (Kiri) dan Total Item Terjual (Kanan)

Akhirnya data sampai ke tahap akhir, yaitu visualisasi. Data-data pendapatan dan item terjual yang awalnya perhari dapat dikategorikan menjadi data perbulan, hingga akhirnya mendapatkan hasil sebagai berikut:

Hasil kasus menghitung pendapatan dari struk

2. Kasus Mencari Produk Populer dari Sosial Media

Ilustrasi Hasil Urutan Produk Populer dari Twitter

Jika pada kasus pertama, data diolah setelah bisnis berjalan, pada kasus kedua ini data akan diolah untuk keperluan sebelum melakukan bisnis, contohnya di atas mencari resep baru yang pas untuk bisnis minuman antara rasa choco atau cheese.

Data-data didapatkan langsung dari tulisan orang-orang di sosial media Twitter. Untuk mendapatkan data seperti ini, perlu ijin resmi dari Twitter lewat akses Twitter API mereka. Sebagai contoh, setiap tweet yang mengandung kata ‘choco’ atau ‘cheese’ akan menghasilkan data sebagai berikut:

Data mentah tweet berbentuk .json

Data-data di atas masih berbentuk mentah dan belum dilakukan teknik filtering apapun, namun data tweet tersebut tetap dapat diolah supaya lebih mudah terbaca menggunakan teknik Data Science, yang hasilnya:

Hasil tweets setelah diolah

Tweet-tweet di atas dapat berasal dari berbagai negara, yang berarti masih belum cocok digunakan untuk kebutuhan pasar di Indonesia. Namun tentu parameter saat mengambil (crawling) data tweet dapat diatur sedemikian rupa agar sesuai dengan tujuan, misalnya tweet dari daerah kota Jakarta atau Bandung pada periode waktu bulan Januari.

Data tweet yang masih ‘mentah’ di atas pun dapat divisualisasikan seperti pada kasus sebelumnya untuk melihat kata mana yang lebih populer:

Visualisasi data mentah antara Choco dan Cheese

Saat berurusan dengan data teks, metode Text Processing tidak dapat dihindari. Data-data tweet di atas agar lebih mudah diolah harus diproses terlebih dahulu, misalnya merubah kata gaul menjadi baku, menghapus emoji dan simbol, dan masih banyak lagi. Berikut contoh kode text processing yang digunakan:

Kode program untuk memproses data teks

Kemudian akhirnya data-data tersebut dapat dianalisis dari sisi emosi dan sentimennya untuk mengetahui maksud dari tweet-tweet tersebut terhadap suatu topik/produk. Proses ini disebut dengan Sentiment Analysis, yang melibatkan lebih jauh Machine Learning dan Deep Learning.

Ilustrasi singkat proses sentiment analysis

Sampai di sini pembahasan dari narasumber sudah selesai. Untuk belajar lebih jauh mengenai Data Science, Machine Learning dan Text Processing dapat dilihat berbagai webinar di youtube BISA AI dan aplikasi BISA AI Academy untuk belajar secara langsung. Terimakasih!

--

--

Ramdhanii Ram
BISA.AI
Writer for

Work stuffs & making sense interesting thoughts from my brain.