Full-text search ภาษาไทย ใน MySQL
สมัยก่อน MySQL หาข้อความภาษาไทยแบบ full-text ไม่ได้ แต่ตอนนี้ (๑๗ มิถุนายน พ.ศ. ๒๕๕๙) ได้แล้วโดยใช้ n-gram
อย่างไรก็ตามการข้อหาโดยใช้การตัดคำให้ถูกต้องยังทำไม่ได้ ตอนนี้อาจารย์ pruet กำลังแก้อยู่ โดยการทำ plugin ให้ mysql มาเรียกใช้ libthai อีกที ติดตามผลงานได้ที่ https://github.com/pruet/mysql-server
ส่วนที่ผมช่วยทำมีนิดเดียวคือ testcase มั่ว ๆ ตามนี้
มันมีประเด็นอยู่เหมือนกันที่คุยกับอจ. pruet ใน IRC เมื่อวาน ประมาณว่าใส่ “-อกุศลวิตก” เข้าไป พอตัดคำแล้วมันจะแปลงเป็น “-อกุศล” “-วิตก” ก็เลยกลายเป็นว่าใน testcase นี้ก็จะไม่มี record ไหนออกมาเลย สำหรับผมแล้วรู้สึกว่ามันขัดความรู้สึกนิด ๆ
ป.ล. คุยกันเพิ่มเติมได้ใน IRC ที่ server: irc.oftc.net, channel: #tlwg