Startup NLP di Indonesia

Metha Dwi Karina
Data Folks Indonesia
5 min readMar 4, 2019

Di antara kita pasti sudah mencoba, bahkan mungkin terbiasa berinteraksi dengan voice assistant seperti Google Assistant, Alexa, Siri, Bixby, atau Cortana. Salah satu teknologi di balik lahirnya inovasi ini adalah Natural Language Processing (NLP). Perkembangan NLP ini nampaknya masih didominasi oleh perusahaan teknologi multi-nasional seperti Google, Amazon, Apple, Samsung, dan Microsoft, yang tentunya sudah menjajal bahasa Indonesia sebagai salah satu target market mereka. Bayangkan, berapa banyak riset demi riset mereka tempuh hingga NLP dan pendekatan artificial intelligence yang mereka buat, mampu menjawab kebutuhan masyarakat Indonesia.

left to right: Siri, AlexaGoogle Assistant, Cortana, Bixby

Lantas, bagaimana dengan pemain lokal Artificial Intelligence khusus untuk Natural Language Processing di Indonesia? Berikut beberapa daftar AI startup yang tercatat mengembangkan NLP.

Prosa.ai

tampilan depan website prosa.ai

Prosa.ai fokus pada pengembangan teknologi Natural Language Processing dalam Bahasa Indonesia, dimana mereka membagi layanan mereka menjadi dua, layanan teks (Prosa Text) dan layanan suara (Prosa Speech). Berdasarkan informasi pada website mereka, prosa.ai menyediakan layanan text berupa Prosa Text API, yang dapat berguna untuk menciptakan produk baru seperti:

  • Social media & media monitoring service
  • Knowledge and Document Management System
  • Editorial and Publishing Efficiency
  • Create chatbot automatization

Produk Prosa Text dapat berupa syntactic analyzer, word normalizer, named entity extractor, sentiment analyzer, quotation extractor, hate speech detector.

Sementara, prosa.ai mengklaim Prosa Speech mampu menjawab kebutuhan akan:

  • Speech-based Automation for Companies to Smart Houses
  • Analyze Sentiments and Emotions through Media Monitoring Systems
  • Create Voice-Commands for Chatbots

Produk Prosa Speech dapat berupa speech to text, text to speech, speaker recognition, dan paralinguistics analyzer.

Dari urutan produk yang mereka tampilkan di website prosa.ai, tampaknya startup ini belum menjadikan chatbot sebagai prioritas layanan mereka.

Kehadiran prosa.ai mendapat perhatian Kaskus, yang pada bulan Oktober lalu mengumumkan investasi pada prosa.ai.

Media Kernels Indonesia

Media Kernels Indonesia (MKI), dengan nama populer Drone Emprit, adalah social media analysis platform berbasis NLP, beberapa produk yang mereka hasilkan adalah Sentiment Analysis dan Social Network Analysis. MKI memiliki corpus Bahasa Indonesia sendiri, dan menggunakan unsupervised machine learning untuk sentiment analysis yang dikembangkannnya.

Social Network Analysis oleh Drone Emprit © Foto: Ismail Fahmi / Facebook

Menurut Mas Ismail Fahmi, Founder of MKI, Social Network Analysis dipandang penting oleh Drone Emprit karena dalam social media ada relasi yang akan membentuk cluster-cluster sendiri berdasarkan minat yang tidak tergambar hanya melalui analisis volume atau percakapan saja. SNA bisa melihat di cluster mana suatu paparan percakapan terjadi, apakah “tweet war” benar-benar terjadi di “area peperangan” yang sama, atau ternyata sebuah isu atau opini hanya tersebar di satu cluster, dan tidak berpengaruh besar terhadap opini publik. SNA juga dapat memberikan informasi apakah suatu isu atau hashtag trend ternyata disebarkan oleh BOT, berdasarkan pola SNA yang muncul.

Social Network Analysis sudah digunakan oleh korporasi dan kementerian, misalnya dengan Kementerian Komunikasi dan Informasi, untuk mendeteksi hoax, sumber, sebaran serta kelompok yang membicarakannya.

Untuk tahu lebih lanjut tentang Social Media Analytics Drone Emprit, cek DataPods episode #8 dan #9.

Bahasa.ai

Bahasa.ai juga menjadikan conversational AI dengan chatbot sebagai produk utama mereka.

Hokiman Kurniawan, Co-Founder & CEO Bahasa.ai, menyebutkan bahwa Bahasa.ai berkomitmen menerapkan strategi kecerdasan buatan yang memberikan dampak nyata dalam bisnis. Ia sendiri tidak berfokus pada kuantitas implementasi, melainkan target capaian dari penerapannya.

“Mengenai chatbot, kami punya filosofi sendiri dalam membantu klien. Sekarang di market banyak chatbot gimmick, yaitu hanya dibuat supaya klien terlihat keren tanpa punya objektif bisnis tepat. Bahasa.ai menerapkan strategi chatbot yang memberikan impact bisnis. Artinya strategi chatbot ini hasilnya bisa dilihat di laporan keuangan klien. Misalnya salah satu klien kita yang berhasil meningkatkan sales 600–900 juta per bulan berkat strategi chatbot-nya,” terang Hokiman. (Source: dailysocial)

Pada tanggal 23 Agustus 2018, Bahasa.ai mengumumkan telah mendapat pendanaan tahap awal dari East Ventures.

Pesaing lokal lainnya untuk conversational AI adalah Kata.ai, dan BJTech dengan virtual assistant Bang Joni sebagai salah satu produk mereka.

Kata.ai

tampilan depan kata.ai

Sebagai pesaing head-to-head dari Bahasa.ai, Kata.ai memberi solusi berupa conversational AI core product berupa chatbot. Bisa dibilang, startup ini merupakan pemain lokal terbesar di Indonesia ~so far. Mungkin kita familiar dengan chatbot di LINE bernama Veronika dari Telkomsel, Jemma dari Unilever, Shalma dari Alfamart, atau Sabrina dari BRI. Update terakhir, chatbot akan tersedia di whatsapp for business.

Beberapa features yang mereka sediakan:

  • NL Studio: Create your own Natural Language model or use pre-trained model to enhance your chatbot.
  • Bot Studio: Develop chatbot using visual interface or YAML-based Markup Language. You can also embed JavaScript code for more powerful scripting capability.
  • CMS Studio: Build custom CMS for your chatbot to allow easier content updates for non-developers.
  • CRM Integration: Integrate your favorite CRM tools. Now supports Salesforce & Zendesk.
  • API Integration: Flexible third-party API integrations to your chatbot

Mereka juga menyajikan dokumentasi terbuka di website mereka bagi siapapun yang ingin belajar membuat chatbot dengan platform Kata.

Menurut Kemal Kurniawan, Research Analyst Kata.ai korpus bahasa Indonesia yang publicly open masih sangat sedikit, karena itu research scientist Kata.ai berbagi corpus-nya untuk umum di github.

Ia memperkirakan, kedepannya akan semakin banyak yang akan mengembangkan NLP di Indonesia, terbukti dari banyaknya startup yang mulai secara aktif men-submit paper research mereka di data science conference, dan dibukanya R&D center oleh salah satu startup besar di Indonesia. Kata.ai sendiri terus mendorong agar paper hasil research dapat di-submit.

Tertarik untuk terjun di bidang ini? Beberapa free online course seperti edx, coursera atau codeacademy membuka kelas khusus tentang NLP ini. Pembahasan lebih lanjut mengenai NLP di Indonesia juga dibahas oleh Kemal dalam DSI DataPods episode #10.

Thanks for reading! :)

--

--