Workshop 14 AI : NLP Part 2 (Ending)
วันนี้เราจะมาอยู่กับ NLP กันต่อ และเป็นครั้งสุดท้ายกันแล้วนะครับ

วันนี้เราจะมาลองจำแนกประเภทของประโยคว่าเป็นประโยคแบบไหน (Negative , Neutral , Positive)

ข้อมูลมีอยู๋ 24063 Records
โดยประโยคที่ยาวสุด อยู่ที 749 ่คำ

ลองดูสรุปเป็น แผนภูมิว่าประโยคส่วนใหญ่มีความยาวประมาณใด

ลองทำ Word2Vec เพื่อแปลงตัวอักษรเป็นตัวเลข
โดยก่อนอื่นเราเริ่มจากตัดคำในประโยคให้แยกเป็นคำๆไปก่อน โดยใช้ Word Tokenize

แปลงเป็นตัวเลข

ลองดูสัก 1 คำ

ลองดูความใกล้เคียงของคำในบริบท ว่าใกล้เคียงกันแค่ไหน

ลองดูคำที่มีบริบทใกล้เคียงกับ “เสียดาย” มากที่สุด

หลังจากเรียนรู้กันคร่าวๆแล้ว ลองมาทำกันจริงดีกว่า
เริ่มจากใช้ 1 hot แปลงข้อความ ผลเฉลย ให้เป็นตัวเลข

ส่วนประโยคเราจะแปลงเป็นตัวเลขโดยใช้ Text to Sequnce

เนื่องจากแต่ละประโยคมีความยาวไม่เท่ากัน เราจะทำการ Padding ให้ยาวเท่ากันก่อน

นิยาม Model ขึ้นมาโดยใช้ Keras

Split Data ออกมาเพื่อใช้สำหรับเทส

ลองเทรนกัน

ลอง Plot ดู

ความแม่นยำที่ได้

และนี่คือทั้งหมดของวันนี้ครับ ขอบคุณครับ
