Aplikasi Machine Learning dalam Media Digital

http://respondr.io/

Machine learning adalah salah satu disiplin ilmu yang saat ini banyak digemari oleh kalangan saintek, menurut salah satu orang American Computer Scientist Machine learning adalah

A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E. — Tom Mitchell

Machine learning digunakan untuk memprediksi klasifikasi atau memprediksi pengkelompokan berdasarkan atributnya, saat ini di Indonesia machine learning banyak diterapkan pada industri e-commerce dan fintech. Dalam industri media digital yang memproduksi konten artikel, gambar dan video belum banyak diterapkannya machine learning untuk memproduksi konten, sedangkan machine learning bisa diterapkan keberbagai industri dari e-commerce sampai medical. alasan mengapa media digital menerapkan machine learning adalah untuk memahami kebutuhan pembacanya, industri media sangat bergantu kepada berapa banyak pembaca setiap bulan, indikator ini bisa dilihat dari month active users pada Goolgle Analytics, selain itu juga monthly active users menjadi senjata andalan media untuk mendapatkan native ads dari brand agar mendapatkan revenue yang lebih banyak ketimbang mengandalkan google ads. selain itu indikator monthly active users, indikator lain seperti page views, bounce rate, page per session, session duration turut menjadi perhatian bagi pengelola media digital, dari indikator indikator di atas, machine learning dapat berkontribusi untuk mengoptimalkan angka angka indikator tersebut semakin baik. section yang familiar kita lihat adalah related post, section ini bertujuan agar setelah visitor membaca artikel tersebut, dia akan membaca artikel yang lainnya dengan begitu pageviews akan meningkat, bouce rate menurun, page per session bertambah, dan session duration semakin lama. namun sejauh yang saya ketahui selama saya bekerja di digital media industry, menciptakan related post hanya dari keyword yang sama atau kategori yang sama, tanpa menggunakan learning algorithms yang memumpuni bagaimana visitor behave di website tersebut.

beberapa use cases yang bisa diterapkan dalam digital media sebagai berikut:

Popular Topics

gambar: detik.com

salah satu bagian kolom website yang hampir pasti ada yaitu popular topics, namun popular topics ini sering kali di generalisir untuk semua visitor sehingga konten tersebut kurang relevan bagi visitor yang lain. asumsikan section popular topics tersebut berisi tentang politik dan ekonomi didalam suatu website portal berita, sedangkan setiap kali saya mengujungi portal berita tersebut selalu membuka kolom teknologi, sehingga section yang ada menjadi tidak relevan bagi saya, padahal section tersebut dibuat untuk meng-highlight apa yang sedang populer tapi tidak menangkap apa yang sedang populer di teknologi tanpa harus kita membuka kolom teknologi, dengan menggunakan metode klasifikasi maka kita dapat mengkelompokan vistor apa masuk kekelompok apa.

Related Post

gambar: hipwee.com

bagian kali ini yang tidak kalah penting, selain bertujuan untuk meningkatkan page per session (walaupun ada cara lain menggunakan pagination), realted post ini sering kali direkomendasikan pembaca untuk membaca artikel lainnya, seperti yang saya jelaskan sebelumnya, related post ini mengandalkan keyword yang sama, sehingga tidak menjawab the way user behave, cara yang bisa diterapkan menggunakan machine learning adalah melihat pola dengan metode association rules, metode ini sering juga di sebut sebagai market basket analysis tapi bisa juga diterapkan kepada section related post, sehingga recommendation tersebut bukan dari sisi internal namun berdasarkan pola bagaimana user berinteraksi didalam website.

Content personalization

gambar: wired.com

yang satu ini agak sedikit tricky, beberapa aplikasi mobile seperti Flipboard meminta pengguna untuk mengisi apa yang mereka sukai, namun cara tersebut bisa dibilang efektif namun ada cara proxy tanpa harus pengguna memilih topik apa yang mereka sukai yaitu merekam apa yang pengguna baca selama ini, sehingga nantinya content personalization ini bisa memumpuni kebutuhan penggunanya.

Dynamic Content

seperti namanya, konsep ini seperti dynamic pricing dimana harga dari suatu produk berubah tergantung dengan user behavior based on time, dynamic content adalah rekomendasi yang bergantung pada pola pemakaian user berdasarkan waktu, dynamic content ini bisa mengikuti waktu pada saat pagi atau malam hari saat visitor membaca, jika diperhatikan konsep dynamic content ini sub dari content personaliazation dan tidak overlapping dari konsep sebelumnya.

Curated Content

gambar: medium.com

curated content pada dasarnya seperti editor picks, curated content ditampilkan pada halaman homepage, hal hal yang biasa dianggap trivial bagi sebagian orang namun sangat berdapak signifikan terhadap user experince, menggunakan section curated content ini agar meminimalisir navigasi pada website tersebut, saya pernah mendegar pernyataan “aplikasi dikatakan bagus ketika user minim melakukan tindakan pada diaplikasi tersebut sehingga user kecanduan untuk memakai aplikasi tersebut” konsep ini mendukung untuk terjadinya hal tersebut, semakin user minim navigasi (scroll, open new tab, move to another category) membuat user “betah” untuk membaca terus menerus.

Newsletter Optimization

gambar: email blast datascienceplus.com

hal yang biasa digunakan dalam industri media adalah membuat fitur “subscribe newsletter” walaupun cara ini tidak menambah traffic secara signifikan, namun ampuh membawa user kembali mengunjungi website kita. biasa yang kita lakukan untuk “email blast” memberikan konten konten populer atau eye-catching (bisa juga diartikan sebagai click bait) optimasi ini bisa dilakukan ketika kita memiliki data yang lengkap minta user, sehingga isi email tersebut juga fit in dengan minat user tersebut, selain itu juga perlu diperhatikan bahwa waktu mengirimkan email dan kapan user tersebut link yang diemail tersebut diklik sehingga nantinya ada algoritma user behavior yang memahami kapan mesin tersebut mengirimkan email kepada user.

Content Classification

cara ini dipakai oleh news aggregator untuk mengkelompokan kembali kategori konten yang tepat, karena semua website memiliki kategorinya masing masing sehingga akan lama jika kita harus labeling manual, seperti namanya, menggunakan supervised learning dan algoritma yang sejauh ini memumpuni adalah neural network. selain dipakai oleh news aggregator juga bisa dipakai sebagai monitoring content yang beredar di digital media yang ada, saya mengcrawling 17 media digital yang ada diindonesia dan mengklasifikasikan konten tersebut apakah masuk kategori olahraga, entertainment, intermezo, dll. sehingga dapat memberikan gambar untuk penulis apa yang harus dibuat.

Auto Correction

gambar: medium.com

pertama kali saya coba box search di medium.com dan salah ketik seperti gambar diatas, pikiran pertama saya pasti tidak ada hasil yang muncul, namun kebalikan yang saya duga, hasil seperti yang saya inginkan. dengan adanya auto correction di backend sangat memudahkan user tanpa harus mengedit search box, dan juga hasilnya cukup relevan, berbeda dari media yang lainnya menampilkan isi yang aneh aneh yang imbasnya user close tab. untuk melakukan cara ini bisa menggunakan deep learning dengan algoritma LSTM, salah satu algoritma yang sangat populer belakangan ini.

Conclusion

akhir kata, aplikasi machine learning tidak hanya terbatas pada apa yang saya sebutkan diatas, masih banyak cara untuk media membuat pembaca setianya “betah” dan juga metode metode dan algoritma yang saya sebutkan tidak hanya terbatas pada 1 atau 2 algoritma tapi ada banyak algoritma bergantung pada approach dan data agar menghasilkan akurasi yang tinggi. pada akhirnya machine learning dapat memprediksi dan membaca kebutuhan pembaca di digital media, sehingga media mendapatkan insight apa yang dibutuhkan oleh pembaca.