Full-text search ภาษาไทย ใน MySQL

สมัยก่อน MySQL หาข้อความภาษาไทยแบบ full-text ไม่ได้ แต่ตอนนี้ (๑๗ มิถุนายน พ.ศ. ๒๕๕๙) ได้แล้วโดยใช้ n-gram

อย่างไรก็ตามการข้อหาโดยใช้การตัดคำให้ถูกต้องยังทำไม่ได้ ตอนนี้อาจารย์ pruet กำลังแก้อยู่ โดยการทำ plugin ให้ mysql มาเรียกใช้ libthai อีกที ติดตามผลงานได้ที่ https://github.com/pruet/mysql-server

ส่วนที่ผมช่วยทำมีนิดเดียวคือ testcase มั่ว ๆ ตามนี้

มันมีประเด็นอยู่เหมือนกันที่คุยกับอจ. pruet ใน IRC เมื่อวาน ประมาณว่าใส่ “-อกุศลวิตก” เข้าไป พอตัดคำแล้วมันจะแปลงเป็น “-อกุศล” “-วิตก” ก็เลยกลายเป็นว่าใน testcase นี้ก็จะไม่มี record ไหนออกมาเลย สำหรับผมแล้วรู้สึกว่ามันขัดความรู้สึกนิด ๆ

ป.ล. คุยกันเพิ่มเติมได้ใน IRC ที่ server: irc.oftc.net, channel: #tlwg