Sentiment Analysis

Phisit Srianan
Nov 2 · 2 min read

Sentiment Analysis

Sentiment Analysis หรือชื่อในภาษาไทย “การวิเคราะห์ความรู้สึก” เป็นการวิเคราะห์อารมณ์และความรู้สึกจากข้อความ เพื่อบ่งบอกความรู้สึกของผู้คนที่มีต่อบางสิ่งบางอย่าง เช่น ความรู้สึกดี (Positive) หรือ ความรู้สึกที่ไม่ดี (Negative)

ตัวอย่างเช่น

เขาเป็นคนดี ช่วยแมวที่กำลังจะตกจากอาคารสูง น่าชื่นชมนะ

อันนี้คือ ความรู้สึกดี (Positive)

เขาทำงานบกพร่องจนทำให้มีคนเดือดร้อน

อันนี้คือ ความรู้สึกที่ไม่ดี (Negative)

ปัจจุบันนี้ได้มีการนำ Sentiment Analysis มาใช้งานในด้านต่าง ๆ เช่น ด้านการตลาด ด้านการสื่อสาร เป็นต้น

ในภาษาPyton เราสามารถ Sentiment Analysis ภาษาไทยได้ด้วยโมดูล NLTK และ PyThaiNLP

หลักการทำงาน คือ เริ่มจากหาตัวอย่างประโยค (Inputs) และเป้าหมาย (Labels) แยกคำจากประโยค (Tokenization) แปลงให้เป็นตัวเลข (Word Representation) แล้วสอน NN (Train) วัดผล (Test/Evaluate) แล้วนำไปใช้ โดยป้อนประโยคเข้าไป แล้วดูว่า โมเดลของเราจะจัดให้เป็น Labels ใด

โดยเราจะยกตัวอย่างดังต่อไปนี้ครับ

ขั้นแรก Load data มาก่อน

ดูสรุปข้อมูล

จะได้กราฟดังนี้

ต่อไปเป็นการทดลองการตัดคำของประโยคตัวอย่าง

ต่อมานะครับ ความยาวของประโยค และคำที่ยาวที่สุด

ต่อไปเป็นการสุ่มเลือกคำของใน Class อื่นๆ

เชิงกลางๆ ไม่มีอะไร
เชิงบวก
เชิงลบ จัดหนักเกิ๊น

เอาข้อมูล 3 Class มารวมกัน

ก็จะคร่าวๆประมาณนี้ครับ

ขอจบการสรุปแต่เพียงเท่านี้ครับ

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade