Stemming Word dalam Carik

Membuat BOT, sepertinya sudah biasa. 
Membuat BOT dengan kemampuan NLP dan AI, sepertinya sudah banyak yang bisa juga.

Sebagian ada yang membuat sendiri engine-nya, sebagian ada yang menggunakan vendor-vendor yang sudah ada. Saya sendiri dulu pernah menggunakan vendor, baik yang free maupun berbayar.

Sejak deploy @Carik beberapa waktu lalu, saya cenderung untuk membuat NLP Engine sendiri. Belum bagus-bagus amat sih, tapi sudah cukup lumayan laahh…

Membuat NLP pun juga tidak jauh dengan teknik Stemming Word. Stemming merupakan bagian yang tidak terpisahkan dalam Information Retrieval (IR). Stemming adalah proses pemetaan dan penguraian bentuk dari suatu kata menjadi bentuk kata dasarnya. Gampangnya, proses mengubah kata berimbuhan menjadi kata dasar. Tidak harus ada dalam NLP, tapi jika ada pun sepertinya akan lebih baik.

Dan kemudian, saya pun membuat engine Stemming Word sendiri. 
Eehh.. bukan.. bukan.. Saya hanya mengkode method Stemming Word ke dalam suatu bahasa pemrograman yang saya sayangi, yaitu “Pascal”.
Methodnya saya gunakan dari “Algoritma Nazief dan Andriani”, dengan sedikit memberikan tambahan kode untuk mengakomodir beberapa kata yang belum terakomodir oleh algoritma Nazief dan Andriani ini.

Tentang bagaimana algoritma Nazief dan Andriani ini, dipersilahkan untuk searching di media yang sudah banyak tersedia di era online ini.

contoh proses stemming

Dari stemming word tools yang saya bangun untuk Carik ini, sudah terkumpul lebih dari 28.000 kata dalam bahasa Indonesia. Sudah terkategorikan pula dalam jenis kelompok kata-nya. Beberapa variasi kata mungkin tidak/belum terdeteksi, belum lagi kata-kata gaul maupun yang tidak gaul.

Ingin tahu kemampuan tools stemming word ini? 
boleh coba dari URL
http://stemming.fastplaz.com

Ingin tahu code stemming word ini?
silahkan download dari url github ini:
https://github.com/luridarmawan/StemmingWord

Ingin tahu kemampuan bot Carik dalam mereprentasi free text
silahkan coba chat langsung dengan Carik
Carik mudah ditemui kok, dia ada di
- Telegram https://t.me/carikbot
- Facebook Messenger https://fb.me/carik.bot
- Line, 
- Skype, dan juga 
- Slack.

Catatan penting, 
tools ini masih jauh dari sempurna, masih banyak hal yang harus dibenahi dan bisa dikembangkan.

Selamat mencoba dan Tetap Semangat!

Carik Bot