Workshop 14 AI : NLP Part 2 (Ending)

PTG l Mark
Nov 1 · 2 min read

วันนี้เราจะมาอยู่กับ NLP กันต่อ และเป็นครั้งสุดท้ายกันแล้วนะครับ

วันนี้เราจะมาลองจำแนกประเภทของประโยคว่าเป็นประโยคแบบไหน (Negative , Neutral , Positive)

ข้อมูลมีอยู๋ 24063 Records

โดยประโยคที่ยาวสุด อยู่ที 749 ่คำ

ลองดูสรุปเป็น แผนภูมิว่าประโยคส่วนใหญ่มีความยาวประมาณใด

ลองทำ Word2Vec เพื่อแปลงตัวอักษรเป็นตัวเลข

โดยก่อนอื่นเราเริ่มจากตัดคำในประโยคให้แยกเป็นคำๆไปก่อน โดยใช้ Word Tokenize

แปลงเป็นตัวเลข

ลองดูสัก 1 คำ

ลองดูความใกล้เคียงของคำในบริบท ว่าใกล้เคียงกันแค่ไหน

ลองดูคำที่มีบริบทใกล้เคียงกับ “เสียดาย” มากที่สุด

หลังจากเรียนรู้กันคร่าวๆแล้ว ลองมาทำกันจริงดีกว่า

เริ่มจากใช้ 1 hot แปลงข้อความ ผลเฉลย ให้เป็นตัวเลข

ส่วนประโยคเราจะแปลงเป็นตัวเลขโดยใช้ Text to Sequnce

เนื่องจากแต่ละประโยคมีความยาวไม่เท่ากัน เราจะทำการ Padding ให้ยาวเท่ากันก่อน

นิยาม Model ขึ้นมาโดยใช้ Keras

Split Data ออกมาเพื่อใช้สำหรับเทส

ลองเทรนกัน

ลอง Plot ดู

ความแม่นยำที่ได้

และนี่คือทั้งหมดของวันนี้ครับ ขอบคุณครับ

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade