Sentiment Analysis

Sentiment Analysis
Sentiment Analysis หรือชื่อในภาษาไทย “การวิเคราะห์ความรู้สึก” เป็นการวิเคราะห์อารมณ์และความรู้สึกจากข้อความ เพื่อบ่งบอกความรู้สึกของผู้คนที่มีต่อบางสิ่งบางอย่าง เช่น ความรู้สึกดี (Positive) หรือ ความรู้สึกที่ไม่ดี (Negative)
ตัวอย่างเช่น
เขาเป็นคนดี ช่วยแมวที่กำลังจะตกจากอาคารสูง น่าชื่นชมนะ
อันนี้คือ ความรู้สึกดี (Positive)
เขาทำงานบกพร่องจนทำให้มีคนเดือดร้อน
อันนี้คือ ความรู้สึกที่ไม่ดี (Negative)
ปัจจุบันนี้ได้มีการนำ Sentiment Analysis มาใช้งานในด้านต่าง ๆ เช่น ด้านการตลาด ด้านการสื่อสาร เป็นต้น
ในภาษาPyton เราสามารถ Sentiment Analysis ภาษาไทยได้ด้วยโมดูล NLTK และ PyThaiNLP
หลักการทำงาน คือ เริ่มจากหาตัวอย่างประโยค (Inputs) และเป้าหมาย (Labels) แยกคำจากประโยค (Tokenization) แปลงให้เป็นตัวเลข (Word Representation) แล้วสอน NN (Train) วัดผล (Test/Evaluate) แล้วนำไปใช้ โดยป้อนประโยคเข้าไป แล้วดูว่า โมเดลของเราจะจัดให้เป็น Labels ใด
โดยเราจะยกตัวอย่างดังต่อไปนี้ครับ
ขั้นแรก Load data มาก่อน

ดูสรุปข้อมูล

จะได้กราฟดังนี้

ต่อไปเป็นการทดลองการตัดคำของประโยคตัวอย่าง

ต่อมานะครับ ความยาวของประโยค และคำที่ยาวที่สุด


ต่อไปเป็นการสุ่มเลือกคำของใน Class อื่นๆ



เอาข้อมูล 3 Class มารวมกัน


ก็จะคร่าวๆประมาณนี้ครับ
ขอจบการสรุปแต่เพียงเท่านี้ครับ